JP5348754B2 - Search support apparatus and method, and computer program - Google Patents

Search support apparatus and method, and computer program Download PDF

Info

Publication number
JP5348754B2
JP5348754B2 JP2009029158A JP2009029158A JP5348754B2 JP 5348754 B2 JP5348754 B2 JP 5348754B2 JP 2009029158 A JP2009029158 A JP 2009029158A JP 2009029158 A JP2009029158 A JP 2009029158A JP 5348754 B2 JP5348754 B2 JP 5348754B2
Authority
JP
Japan
Prior art keywords
mail
identification information
information
search
thread
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009029158A
Other languages
Japanese (ja)
Other versions
JP2010079872A (en
Inventor
賢一郎 岡本
剛 原田
純生 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone West Corp
Priority to JP2009029158A priority Critical patent/JP5348754B2/en
Publication of JP2010079872A publication Critical patent/JP2010079872A/en
Application granted granted Critical
Publication of JP5348754B2 publication Critical patent/JP5348754B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To retrieve and present a person highly relevant to a search object by using e-mail. <P>SOLUTION: This search support device 1 generates a new thread ID when a message ID of another related e-mail acquired from header information of the e-mail is not registered in a mail table, and acquires a thread ID from the mail table when the message ID is registered. A record with the message ID acquired from the header information, a sender and a recipient, and the thread ID set thereto is added to the mail table, and a keyword obtained by morphologically analyzing the subject of the e-mail is associated with the thread ID and written in a thread table. Upon receiving a search condition, the thread ID of a corresponding keyword is acquired from a keyword table, users set as a sender or a recipient and the number of settings are acquired from the record of the mail table specified by the thread ID, and a user having the larger number of settings is output by thread ID. <P>COPYRIGHT: (C)2010,JPO&amp;INPIT

Description

本発明は、検索支援装置及び方法、ならびに、コンピュータプログラムに関する。   The present invention relates to a search support apparatus and method, and a computer program.

近年の情報化社会においては、蓄積されている膨大な量の情報から、所望の情報を見出すことが困難となっている。会社などの組織内においては、蓄積された情報を有効活用するためには、単に有効な情報を蓄積するだけではなく、その蓄積された情報を体系的に整理することが必要不可欠である。従来は、共有すべき情報を、ファイルサーバ等の情報共有システムの適切と思われるカテゴリに対応したディレクトリに手動で保存することにより情報共有する方法が一般的であった。
一方、特許文献1には、蓄積された情報としての電子メール(以下、単に「メール」と記載)の中から、返信メール(Re:のメール)などの関連する一連のメールを抽出し、一連のメールについての送信経路と、送信者、受信者などの関与者に関する情報を表示するシステムについて記載されている。また、特許文献2には、蓄積されたメールの情報から、送信元、宛先となっている人物の属性を生成するシステムが記載されている。
In the information-oriented society in recent years, it has been difficult to find desired information from a huge amount of accumulated information. In an organization such as a company, in order to effectively use accumulated information, it is indispensable not only to accumulate valid information but also to systematically organize the accumulated information. Conventionally, a method for sharing information by manually storing information to be shared in a directory corresponding to a category considered to be appropriate for an information sharing system such as a file server has been generally used.
On the other hand, in Patent Document 1, a series of related mails such as reply mails (Re: mails) are extracted from stored e-mails (hereinafter simply referred to as “mails”). Is a system that displays a transmission route for e-mails and information on participants such as senders and recipients. Patent Document 2 describes a system that generates attributes of a person who is a transmission source and a destination from stored mail information.

特開2002−14903号公報JP 2002-14903 A 特開2001−175680号公報JP 2001-175680 A

上述したように、情報共有システムの適切と思われるカテゴリに対応したディレクトリに情報を手動で保存することで情報共有する方法では、全ての情報を適切なカテゴリに分類して保存することは困難であり、また、複数のカテゴリに属する場合にうまく分類ができないおそれもある。また、適切なカテゴリに情報が蓄積された場合であっても、時間の経過によって変化する関連人物や関連組織などの情報については反映されない。さらには、蓄積された情報が、知りたいことに関連する情報全てではないことがほとんどである。これらのことは、ある検索対象について知りたいと思っている者にとって、その検索対象に関連する情報をすぐに見つけ出すことのできない原因となっている。そこで、ある検索対象について知りたいと思った場合、その検索対象に最も関連する人物を探し出して問い合わせることが、早く、そして確実に情報を得る方法であるといえる。
しかし、特許文献1、2の技術においては、検索対象について誰が最も関連する人物であるかの情報を検索者に提示するものではない。
As described above, it is difficult to classify and store all information in appropriate categories by manually storing information in a directory corresponding to a category considered appropriate in the information sharing system. There is also a possibility that classification cannot be performed well when belonging to a plurality of categories. Even if information is stored in an appropriate category, information such as related persons and related organizations that change with the passage of time is not reflected. Furthermore, in most cases, the accumulated information is not all information related to what is desired to be known. These are the reasons why a person who wants to know a certain search target cannot quickly find information related to the search target. So, if you want to know about a certain search target, finding the person most relevant to the search target and making an inquiry can be said to be a quick and reliable way to obtain information.
However, in the techniques of Patent Documents 1 and 2, information about who is the most relevant person for the search target is not presented to the searcher.

本発明は、上記問題を解決すべくなされたもので、その目的は、コミュニティ情報としての電子メールを利用して、検索対象について関連性の高い人物を検出し、提示することのできる検索支援装置及び方法、ならびに、コンピュータプログラムを提供することにある。   The present invention has been made to solve the above problems, and a purpose of the present invention is to provide a search support apparatus capable of detecting and presenting a highly relevant person for a search target by using an electronic mail as community information. And a method, and a computer program.

上述した課題を解決するために、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、検索条件の入力を受ける受付手段と、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、を備え、前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援装置である。 In order to solve the above-described problem, the present invention provides a record including at least message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and information on a sender and a receiver. And an analysis result storing means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and a mail storage means for storing the e-mail. Whether or not the message identification information of other related emails is acquired from the information of the email reading unit to be read and the header information of the email read by the email reading unit, and whether the acquired message identification information is registered in the email table E-mail analyzing means for judging If it is determined, the thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the mail table specified by the message identification information of the other related e-mail Thread identification information is acquired from the record of the message, the message identification information acquired from the header information of the read email, the sender and the receiver, and the newly generated thread identification information or the thread identification information acquired from the mail table A keyword that is a result of morphological analysis of information obtained from the read e-mail, and an analysis result output unit that writes to the keyword table in association with the thread identification information; Receiving means for inputting search conditions, and the keyword table The thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired, and for each acquired thread identification information, the sender or the record from the mail table record specified by the thread identification information Search means for acquiring a user set as a receiver, the number of the user set as a sender or receiver, and thread identification information indicating a user whose number acquired by the search means exceeds a predetermined condition Output control means for each output , the mail storage means, the user who is the speaker in the conference as the sender, the participants of the conference as the receiver, the conference name of the conference as the subject, The utterance content of the user who is the speaker is set in the text, and includes information indicating that it was generated based on the conference, and other related As the message identification information of the child mail, an email in which the message identification information of another email in which other utterance contents in the conference are set is stored, and the analysis result output means is based on the conference in the read email If the information indicating that the information is generated is set, the information to be generated based on the conference is further set in the record to be added to the mail table, and the search unit acquires each acquired thread identification For each information, each record set in the mail table specified by the thread identification information is specified, and information indicating that the record is generated based on the conference is set in each specified record. A user who is given a given point to a user who is set as a sender in a record and who is set as a receiver When information lower than the predetermined point is given and information indicating that it was generated based on the conference is not set, it is set as the user and receiver set as the sender in each record A point that is weighted more than the predetermined point is given to the user, and the output control unit outputs, for each thread identification information, information indicating a user whose total of points given by the search unit is greater than a predetermined condition. This is a search support device.

また、本発明は、上述する検索支援装置であって、前記出力制御手段は、前記検索手段により取得した数が所定の条件より多いユーザを、当該ユーザが設定されている数に対応した順序で、スレッド識別情報毎に出力することを特徴とする。   Further, the present invention is the above-described search support apparatus, wherein the output control unit selects a user whose number acquired by the search unit is greater than a predetermined condition in an order corresponding to the number of the set user. And output for each thread identification information.

また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、前記出力制御手段は、前記検索手段により取得したユーザの組をスレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver is acquired from a record in the mail table specified by the thread identification information, and the output control means is acquired by the search means The set of users is output for each thread identification information.

また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、前記出力制御手段は、前記検索手段により取得したユーザの組に基づいて、当該取得したユーザの組に含まれる複数ユーザ間の相関を示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver is acquired from a record in the mail table specified by the thread identification information, and the output control means is acquired by the search means Based on the set of users, information indicating the correlation between a plurality of users included in the acquired set of users is output for each thread identification information.

また、本発明は、上述する検索支援装置であって、前記検索手段は、前記スレッド識別情報で特定される前記メールテーブルのレコードから、さらに、前記ユーザの組が設定されている数を取得し、前記出力制御手段は、さらに、ユーザの組が設定されている数に対応した情報を出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means further acquires the number of sets of the user set from the mail table record specified by the thread identification information. The output control means further outputs information corresponding to a set number of users.

また、本発明は、上述する検索支援装置であって、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与するとともに、同報者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the above-described search support device, wherein the mail table record further includes broadcaster information, and the analysis result output means is acquired from the header information of the read electronic mail. A record in which the information of the broadcaster is further set is added to the mail table, and the search means sends a sender to each record of the mail table specified by the thread identification information for each acquired thread identification information. Giving a predetermined point to a user set as a user and a user set as a recipient, and giving a point weighted to a predetermined weight from the predetermined point to a user set as a broadcaster, The output control unit is configured to display information indicating a user whose total points given by the search unit is greater than a predetermined condition as thread identification information. And outputs each, characterized in that.

また、本発明は、上述する検索支援装置であって、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに受信者として設定されているユーザに所定のポイントを付与するとともに、送信者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means is set as a receiver for each record of the mail table specified by the thread identification information for each acquired thread identification information. A predetermined point is given to a user who is set as a sender, a point weighted with a predetermined weight from the predetermined point is given to a user set as a sender, and the output control means is a total of the points given by the search means Is output for each thread identification information, indicating information indicating that there are more users than the predetermined condition.

また、本発明は、上述する検索支援装置であって、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに設定されている受信者がメーリングリストのアドレスである場合は、送信者として設定されているユーザに所定のポイントを付与し、メーリングリストのアドレスでない場合は、送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザをスレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means is a receiver set in each record of the mail table specified by the thread identification information for each acquired thread identification information. If the address is a mailing list address, a predetermined point is given to the user set as the sender, and if it is not the mailing list address, the user set as the sender and the user set as the receiver are given. Predetermined points are assigned, and the output control means outputs, for each thread identification information, a user whose total number of points given by the search means exceeds a predetermined condition.

また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、検索条件の入力を受ける受付手段と、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、を備え、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援装置である。
また、本発明は、上述する検索支援装置であって、前記分析結果格納手段は、さらに、スレッド識別情報と、当該スレッド識別情報で特定されるスレッドの開始日時の情報を示すスレッドテーブルを記憶し、前記分析結果出力手段は、読み込んだ電子メールのスレッド識別情報を新たに生成したときに、当該スレッド識別情報と、当該電子メールのヘッダの情報から取得した日時の情報を示す開始日時とを対応付けてスレッドテーブルに書き込み、前記検索手段は、さらに、前記キーワードテーブルから取得したスレッド識別情報に対応した開始日時の情報を読み出し、前記出力制御手段は、入力を受けた期間条件に合致する開始日時のスレッド識別情報について前記ユーザまたは前記ユーザの組を出力する、ことを特徴とする。
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and Analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, mail reading means for reading an email from a mail storage means for storing the email, and Mail analysis means for acquiring message identification information of other related electronic mails from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table; If the e-mail analysis means determines that it is not registered, If it is determined that a new email thread identification information is registered and registered, the thread identification information is obtained from the record in the mail table specified by the message identification information of the other related email. And a record in which the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or the thread identification information acquired from the mail table are set in the mail table. And a keyword that is a result of morphological analysis of information obtained from the read e-mail, an analysis result output means that writes the keyword identification information in association with the thread identification information, and a reception that receives input of search conditions Means and the receiving means from the keyword table. The thread identification information of the keyword that matches the search word indicated by the digit search condition is acquired, and for each acquired thread identification information, set as a sender or a receiver from the record of the mail table specified by the thread identification information For each thread identification information, a search means for acquiring the number of users who have been set as a sender or a receiver, and a user whose number acquired by the search means exceeds a predetermined condition Output control means, wherein the record of the mail table further includes information on the broadcaster, and the analysis result output means includes information on the broadcaster obtained from the header information of the read electronic mail. Further, the set record is added to the mail table, and the search means for each acquired thread identification information. A predetermined administrator search corresponding point is given to a user set as a sender and a user set as a receiver in each record of the mail table specified by different information, and set as a broadcaster. A higher administrator search support point than the predetermined administrator search support point, and the output control means displays information indicating a user whose total of the administrator search support points exceeds a predetermined condition as an administrator. The search support apparatus is characterized in that it outputs each thread identification information.
Further, the present invention is the search support apparatus described above, wherein the analysis result storage unit further stores thread identification information and a thread table indicating information on a start date and time of a thread specified by the thread identification information. The analysis result output means associates the thread identification information with the start date and time indicating the date and time information acquired from the header information of the email when the thread identification information of the read email is newly generated. In addition, the search means further reads out information on the start date and time corresponding to the thread identification information acquired from the keyword table, and the output control means reads the start date and time that matches the received period condition The user or the set of users is output for the thread identification information.

また、本発明は、上述する検索支援装置であって、前記メールテーブルのレコードは、さらに、日付の情報を含み、前記分析結果出力手段は、読込んだ電子メールのヘッダ情報から取得した日付の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、前記取得したスレッド識別情報で特定される前記メールテーブルのレコードからさらに日付の情報を取得し、出力制御手段は、前記検索手段により取得した各スレッド識別情報に対応する日付の情報に基づいて、所定の期間毎の電子メール数を示す情報を、各スレッド識別情報毎に出力する、ことを特徴とする。   Further, the present invention is the above-described search support device, wherein the record of the mail table further includes date information, and the analysis result output means stores the date acquired from the header information of the read electronic mail. A record in which information is further set is added to the mail table, the search means further acquires date information from the record in the mail table specified by the acquired thread identification information, and the output control means is the search Based on the date information corresponding to each thread identification information acquired by the means, information indicating the number of e-mails for each predetermined period is output for each thread identification information.

また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、読込んだ前記電子メールから取得した件名、または、件名及び本文の情報を形態素解析した結果をキーワードとして前記キーワードテーブルに書き込むことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the analysis result output means uses the subject obtained from the read e-mail or the result of morphological analysis of the subject and text information as a keyword. Write to table.

また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、形態素解析した結果のうち所定の品詞のものをキーワードとして前記キーワードテーブルに書き込むことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the analysis result output means writes a result of a morphological analysis with a predetermined part of speech as a keyword in the keyword table.

また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、形態素解析した結果のうち、予め決められた不要な文字列を除いたものを、キーワードとして前記キーワードテーブルに書き込むことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the analysis result output means writes a result obtained by removing a predetermined unnecessary character string from the result of morphological analysis as a keyword in the keyword table. It is characterized by that.

また、本発明は、上述する検索支援装置であって、ユーザを特定する情報と、当該ユーザの名前とを対応付けた情報を示す人物テーブルを記憶する人物情報格納手段と、前記メール読込み手段により読込まれた電子メールの本文の情報から、自己紹介に用いられる所定の語句が含まれている行を抽出し、抽出した行を形態素解析して得られた語句のうち固有名詞の語句を選択し、選択した語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込む人物情報生成手段とをさらに備え、前記出力制御手段は、出力対象の前記ユーザを特定する情報、または、出力対象の前記ユーザの組を構成するユーザを特定する情報に対応して前記人物テーブルから読み出されたユーザの名前を出力する、ことを特徴とする。   In addition, the present invention provides the above-described search support device, comprising: a person information storage unit that stores a person table indicating information that associates information for identifying a user and the name of the user; and the mail reading unit. From the information in the body text of the read e-mail, extract the line that contains the predetermined word used for self-introduction, and select the proper noun word from the words obtained by morphological analysis of the extracted line And a person information generating means for associating the selected word and the information for identifying the sender acquired from the read header information of the electronic mail and writing it in the person table, wherein the output control means outputs The name of the user read from the person table corresponding to the information specifying the target user or the information specifying the users constituting the set of users to be output Output, characterized in that.

また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、前記電子メールの本文の情報に設定されている先頭より所定行数までの行から、自己紹介に用いられる所定の語句が含まれている行を抽出することを特徴とする。   Also, the present invention is the search support apparatus described above, wherein the person information generating means is a predetermined number used for self-introduction from a line up to a predetermined number of lines from the head set in the information of the text of the electronic mail. It is characterized in that a line including the word is extracted.

また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、自己紹介に用いられる所定の語句が含まれているとして抽出した行から区切り文字の前または後の語句を抽出して形態素解析を行い、固有名詞として得られた語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込むことを特徴とする。   The present invention is also the search support apparatus described above, wherein the person information generating means extracts a phrase before or after a delimiter from a line extracted as including a predetermined phrase used for self-introduction. Then, morphological analysis is performed, and the phrase obtained as the proper noun is written in the person table in association with the information specifying the sender acquired from the read header information of the electronic mail.

また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、送信者を特定する情報として、読込んだ前記電子メールのヘッダ情報から取得した送信者の電子メールアドレスを前記人物テーブルに書き込むことを特徴とする。   Further, the present invention is the above-described search support device, wherein the person information generating means uses the sender's email address acquired from the header information of the read email as information for identifying the sender. It is characterized by writing in the person table.

また、本発明は、上述する検索支援装置であって、前記検索手段は、前記特定した各レコードに会議の音声に基づいて生成したデータであることを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザのみに前記所定のポイントを付与することを特徴とする。   Further, the present invention is the above-described search support device, wherein the search means includes information indicating that the data generated based on the audio of the conference is set in each of the specified records. The predetermined point is given only to a user set as a sender in each record.

また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組と、当該ユーザの組が設定されている数を取得し、当該レコードに会議に基づき生成されたことを示す情報が設定されている場合は、前記各ユーザの組に、所定のポイントを当該ユーザの組が設定されている数に応じて付与し、当該レコードに会議に基づき生成されたことを示す情報が設定されていない場合は、前記各ユーザの組に、前記所定のポイントより重み付けしたポイントを当該ユーザの組が設定されている数に応じて付与し、前記出力制御手段は、各ユーザの組のポイントに対応した情報を出力する、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver and the number of sets of the set of users are acquired from the mail table record specified by the thread identification information. When the information indicating that the record is generated based on the conference is set in the record, a predetermined point is given to the set of each user according to the number of the set of the user, When information indicating that the record is generated based on the conference is not set, the set of each user is weighted from the predetermined point. The poppy points assigned depending on the number which is set set of the user, the output control means outputs information corresponding to the set point of each user, and wherein the.

また、本発明は、上述する検索支援装置であって、分析結果出力手段は、読込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、読込んだ電子メールから得られる情報を形態素解析した結果をキーワード候補とし、同一のスレッド識別情報に対応した電子メールから当該キーワード候補が所定回数以上得られた場合に、当該キーワード候補と当該スレッド識別情報とを対応づけて前記キーワードテーブルに書き込む、ことを特徴とする。   Further, the present invention is the search support apparatus described above, wherein the analysis result output means starts from the read e-mail when information indicating that the read e-mail is generated based on the conference is set. The result of morphological analysis of the obtained information is used as a keyword candidate, and when the keyword candidate is obtained a predetermined number of times or more from an email corresponding to the same thread identification information, the keyword candidate is associated with the thread identification information. It writes to the said keyword table, It is characterized by the above-mentioned.

また、本発明は、上述する検索支援装置であって、会議名と、会議中の音声の音声データと、会議に参加したユーザを示す参加者とを含む会議データを記憶する音声データ記憶手段と、各ユーザの音声の特徴を示すパラメータである音声特徴情報を記憶する発話者データ記憶手段と、前記音声データ記憶手段から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人のユーザが発言している発話区間に区切った分割音声データを生成する音声データ分割手段と、前記分割音声データと、前記発話者データ記憶手段に記憶されている各ユーザの音声特徴情報とから発話者であるユーザを特定する発話者認識手段と、前記分割音声データから、発話内容をテキスト化したテキストデータを生成する音声テキスト変換手段と、前記発話者認識手段が特定した発話者を送信者に、前記会議データ内の参加者を受信者に、前記会議データ内の会議名を件名に、前記音声テキスト変換手段が生成したテキストデータを本文に設定するとともに、新たに生成したメッセージ識別情報と、会議に基づき生成されたことを示す情報と、関連する他の電子メールのメッセージ識別情報として、同じ音声データから抽出した他の分割音声データに基づいて生成した電子メールのメッセージ識別情報とを設定した電子メールを生成し、前記メール記憶手段へ書き込むメール変換手段と、をさらに備えることを特徴とする。   The present invention is also the search support apparatus described above, wherein the audio data storage means stores conference data including a conference name, audio data of audio during the conference, and participants indicating users who have participated in the conference; Utterer data storage means for storing voice feature information, which is a parameter indicating the voice characteristics of each user, a conference file is read from the voice data storage means, and the voice data in the read conference file is stored as one user. The voice data dividing means for generating the divided voice data divided into the speech sections in which the voice is spoken, the divided voice data, and the voice feature information of each user stored in the speaker data storage means, Utterer recognition means for identifying a certain user, speech text conversion means for generating text data in which the speech content is converted into text from the divided speech data, The text specified by the spoken word recognition means is sent to the sender, the participant in the conference data is the recipient, the name of the meeting in the conference data is the subject, and the text data generated by the speech text conversion means is the body text. To the other divided voice data extracted from the same voice data as newly generated message identification information, information indicating that it was generated based on the meeting, and message identification information of other related emails And a mail conversion unit that generates an e-mail in which the message identification information of the e-mail generated based on the e-mail is set and writes the generated e-mail in the mail storage unit.

また、本発明は、上述する検索支援装置であって、前記会議データは、会議開催日時の情報をさらに含み、前記音声データ分割手段は、前記分割音声データにより示される音声に対応した、前記音声データにより示される音声における冒頭からの経過時間を取得し、前記メール変換手段は、前記会議データ内の会議開催日時に、前記音声データ分割手段が取得した経過時間を加算した日時をさらに設定した電子メールを生成する、ことを特徴とする   Further, the present invention is the search support apparatus described above, wherein the conference data further includes information on a meeting date and time, and the audio data dividing unit corresponds to the audio indicated by the divided audio data. An elapsed time from the beginning of the voice indicated by the data is acquired, and the mail converting means is an electronic device further setting a date and time obtained by adding the elapsed time acquired by the voice data dividing means to the meeting date and time in the meeting data. Generate mail

また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、受付手段が、検索条件の入力を受け、検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援方法である。
また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、受付手段が、検索条件の入力を受け、検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援方法である。
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and A search support apparatus comprising analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and presenting an important person related to desired information to assist the search of the information The mail reading means reads the e-mail from the mail storage means storing the e-mail, and the mail analyzing means uses the e-mail header information read by the mail reading means. To obtain the message identification information of other related e-mails from Is registered in the mail table, and if the analysis result output means determines that it is not registered by the mail analysis means, it newly generates thread identification information of the read electronic mail. If it is determined that the message is registered, the thread identification information is obtained from the record of the mail table specified by the message identification information of the other related email, and is obtained from the header information of the read email. A record in which message identification information, sender and receiver, and newly generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table and obtained from the read e-mail. The keyword, which is the result of morphological analysis of the information, is associated with the thread identification information before Writing to the keyword table, the accepting means receives the input of the search condition, the search means obtains the thread identification information of the keyword that matches the search word indicated by the search condition accepted by the accepting means from the keyword table, For each acquired thread identification information, the number of users set as senders or receivers from the mail table record specified by the thread identification information, and the number of users set as senders or receivers And the output control means outputs a user whose number obtained by the search means is greater than a predetermined condition for each thread identification information , and the mail storage means is a user who is a speaker in a meeting. The sender, the participant of the conference as the receiver, the conference name of the conference as the subject, and the user who is the speaker. The other utterance contents in the conference are set as the message identification information of other related e-mails including information indicating that the utterance contents of the user are set in the text and generated based on the meeting. The e-mail storing the message identification information of the e-mail is stored, and the analysis result output means adds to the e-mail table when information indicating that the read e-mail is generated based on the meeting is set. In the record, the information indicating that it is generated based on the conference is further set, and the search means sets each record set in the mail table specified by the thread identification information for each acquired thread identification information. If the information indicating that the record was generated based on the meeting is set in each specified record, the sender Is given to the user who is set as the recipient, and the user who is set as the recipient is given a point lower than the predetermined point, and information indicating that the user has been generated based on the conference is set. If not, the user who is set as the sender and the user who is set as the receiver in each record is given a point weighted more than the predetermined point, and the output control means is given by the search means The search support method is characterized in that information indicating a user whose total number of points is greater than a predetermined condition is output for each thread identification information .
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and A search support apparatus comprising analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and presenting an important person related to desired information to assist the search of the information The mail reading means reads the e-mail from the mail storage means storing the e-mail, and the mail analyzing means uses the e-mail header information read by the mail reading means. To obtain the message identification information of other related e-mails from Is registered in the mail table, and if the analysis result output means determines that it is not registered by the mail analysis means, it newly generates thread identification information of the read electronic mail. If it is determined that the message is registered, the thread identification information is obtained from the record of the mail table specified by the message identification information of the other related email, and is obtained from the header information of the read email. A record in which message identification information, sender and receiver, and newly generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table and obtained from the read e-mail. The keyword, which is the result of morphological analysis of the information, is associated with the thread identification information before Writing to the keyword table, the accepting means receives the input of the search condition, the search means obtains the thread identification information of the keyword that matches the search word indicated by the search condition accepted by the accepting means from the keyword table, For each acquired thread identification information, the number of users set as senders or receivers from the mail table record specified by the thread identification information, and the number of users set as senders or receivers And the output control means outputs a user whose number obtained by the search means is greater than a predetermined condition for each thread identification information, and the mail table record further includes a broadcaster's record. The analysis result output means includes the information of the broadcaster acquired from the header information of the read e-mail. A record in which information is further set is added to the mail table, and the search means is set as a sender in each record of the mail table specified by the thread identification information for each acquired thread identification information. A predetermined administrator search support point is given to a user set as a user and a recipient, and an administrator search support point higher than the predetermined administrator search support point is set to a user set as a broadcaster In the search support method, the output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search support points is greater than a predetermined condition.

また、本発明は、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手2段、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、検索条件の入力を受ける受付手段、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、として機能させ、前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶しており、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とするコンピュータプログラムである。
また、本発明は、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、検索条件の入力を受ける受付手段、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、として機能させ、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とするコンピュータプログラムである。
In addition, the present invention provides a computer used as a search support apparatus that presents an important person related to desired information and supports the search of the information, message identification information for identifying each electronic mail, and a thread to which the electronic mail belongs Analysis that stores a thread identification information that identifies a message, a mail table that includes at least a record including information on the sender and the receiver, and a keyword table that indicates information that associates the thread identification information of each thread with a keyword. Result storage means, two-stage mail readers for reading e-mails from mail storage means for storing e-mails, and other related e-mail messages from information on headers of e-mails read by the e-mail reading means Acquires identification information, and the acquired message identification information is registered in the mail table. If it is determined by the mail analysis means that determines whether or not it is registered, it is determined that the thread identification information of the read email is newly generated and registered. In this case, the thread identification information is acquired from the record of the mail table specified by the message identification information of the other related electronic mail, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver And a keyword that is a result of morphological analysis of information obtained from the read e-mail while adding a record in which the newly generated thread identification information or thread identification information acquired from the mail table is set to the mail table And the amount to be written to the keyword table in association with the thread identification information From the result output means, the receiving means that receives the input of the search condition, and the keyword table, the thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired, and for each acquired thread identification information Search means for acquiring a user set as a sender or a receiver from the record of the mail table specified by the thread identification information, and a number of the user set as a sender or a receiver, The mail storage means functions as an output control means for outputting, for each thread identification information, a user whose number obtained by the search means is greater than a predetermined condition , and the mail storage means uses the user who is a speaker in the conference as the sender. With the participants as recipients, the meeting name of the conference as the subject, and the utterance content of the user who is the speaker Message identification information of other e-mails set with other utterance contents in the conference as message identification information of other related e-mails The set e-mail is stored, and when the information indicating that the analysis result output means is generated based on the meeting is set in the read e-mail, the record added to the e-mail table includes the meeting The information indicating that the information is generated based on the thread identification information is further set, for each thread identification information obtained, the search means identifies each record set in the mail table identified by the thread identification information, If information indicating that the record was generated based on the conference is set for each identified record, the sender is set for each record. If a user is given a predetermined point and a point lower than the predetermined point is given to a user who is set as a recipient, and information indicating that it has been generated based on a conference is not set, A point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record, and the output control means is the sum of the points given by the search means Is a computer program that outputs information indicating users who have more than a predetermined condition for each thread identification information .
In addition, the present invention provides a computer used as a search support apparatus that presents an important person related to desired information and supports the search of the information, message identification information for identifying each electronic mail, and a thread to which the electronic mail belongs Analysis that stores a thread identification information that identifies a message, a mail table that includes at least a record including information on the sender and the receiver, and a keyword table that indicates information that associates the thread identification information of each thread with a keyword. Result storage means, mail reading means for reading an e-mail from a mail storage means for storing the e-mail, and message identification information of other related e-mails from information on the header of the e-mail read by the mail reading means And the acquired message identification information is registered in the mail table. Mail analysis means for determining whether or not it is registered by the mail analysis means, when it is determined that the thread identification information of the read email is newly generated and registered Obtains the thread identification information from the mail table record specified by the message identification information of the other related electronic mail, and the message identification information obtained from the header information of the read electronic mail, the sender and the receiver Adding a record in which the newly generated thread identification information or the thread identification information acquired from the mail table is set to the mail table, and a keyword that is a result of morphological analysis of information obtained from the read email; , Analysis that writes to the keyword table in association with the thread identification information From the result output means, the receiving means for receiving the input of the search condition, the thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired from the keyword table, and for each acquired thread identification information Search means for acquiring a user set as a sender or a receiver from the record of the mail table specified by the thread identification information, and a number of the user set as a sender or a receiver, The number of users acquired by the search means is functioned as output control means for outputting a user whose number is greater than a predetermined condition for each thread identification information, and the mail table record further includes information on the broadcaster, The output means further sets the broadcaster information acquired from the header information of the read email A record is added to the mail table, and for each acquired thread identification information, the search means, as a user and a receiver set as a sender in each record of the mail table specified by the thread identification information A predetermined administrator search corresponding point is given to the set user, and an administrator search corresponding point higher than the predetermined administrator search corresponding point is given to the user set as a broadcaster, and the output control The means is a computer program that outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of points corresponding to the administrator search exceeds a predetermined condition.

本発明によれば、ある検索対象につての重要人物を提示することができ、また、重要人物間のつながりも把握可能となる。また、例えば、システム開発などの場合、仕様検討段階、プログラム設計段階、テスト段階、導入段階など、開発がすすむにつれて関連する人物や組織が変化していくが、本発明では、特定の時期において重要な人物を提示することや、重要な人物や組織が変化していく流れも把握可能となる。   According to the present invention, it is possible to present an important person for a certain search target, and to grasp the connection between important persons. In addition, for example, in the case of system development, related persons and organizations change as development progresses, such as a specification review stage, a program design stage, a test stage, and an introduction stage. It is possible to grasp the flow of presenting important persons and changing important persons and organizations.

本発明の第1の実施形態による検索支援装置の機能ブロック図である。It is a functional block diagram of the search assistance apparatus by the 1st Embodiment of this invention. 同実施形態によるメールテーブルのデータ構成図である。It is a data block diagram of the mail table by the embodiment. 同実施形態によるスレッドテーブルのデータ構成図である。It is a data block diagram of the thread table by the embodiment. 同実施形態によるキーワードテーブルのデータ構成図である。It is a data block diagram of the keyword table by the embodiment. 同実施形態によるメール収集部の分析処理フローを示す図である。It is a figure which shows the analysis processing flow of the mail collection part by the embodiment. メールヘッダの例である。It is an example of a mail header. 同実施形態によるメールテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the mail table by the embodiment. 同実施形態によるスレッドテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the thread table by the embodiment. 同実施形態によるキーワードテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the keyword table by the embodiment. 同実施形態による検索処理部のスレッド検索処理フローを示す図である。It is a figure which shows the thread | sled search process flow of the search process part by the embodiment. 同実施形態による検索処理部の人物相関テーブル作成処理フローを示す図である。It is a figure which shows the person correlation table creation process flow of the search process part by the embodiment. 同実施形態による検索処理部の重要人物テーブル作成処理フローを示す図である。It is a figure which shows the important person table creation process flow of the search process part by the embodiment. 同実施形態による出力制御部の結果表示処理フローを示す図である。It is a figure which shows the result display processing flow of the output control part by the embodiment. 同実施形態によるメールテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the mail table by the embodiment. 同実施形態によるスレッドテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the thread table by the embodiment. 同実施形態によるキーワードテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the keyword table by the embodiment. 同実施形態による人物相関テーブル及び重要人物テーブルの設定例を示す図である。It is a figure which shows the example of a setting of the person correlation table by the same embodiment, and an important person table. 同実施形態による重要人物の出力イメージを示す図である。It is a figure which shows the output image of the important person by the embodiment. 同実施形態による検索時期指定時の重要人物及び人物相関図の表示イメージを示す図である。It is a figure which shows the display image of the important person at the time of search time designation | designated by the same embodiment, and a person correlation diagram. 同実施形態による検索画面の全体イメージを示す図である。It is a figure which shows the whole image of the search screen by the embodiment. 第2の実施形態によるスレッド出力イメージを示す図である。It is a figure which shows the thread | sled output image by 2nd Embodiment. 同実施形態によるスレッド出力イメージを示す図である。It is a figure which shows the thread | sled output image by the embodiment. 第3の実施形態によるメールテーブルのデータ構成図を示す図である。It is a figure which shows the data block diagram of the mail table by 3rd Embodiment. 同実施形態による人物相関図の表示イメージを示す図である。It is a figure which shows the display image of the person correlation diagram by the embodiment. 第4の実施形態によるメールテーブルのデータ構成図を示す図である。It is a figure which shows the data block diagram of the mail table by 4th Embodiment. 本発明の第6の実施形態による検索支援装置の機能ブロック図である。It is a functional block diagram of the search assistance apparatus by the 6th Embodiment of this invention. 同実施形態による人物テーブルのデータ構成図である。It is a data block diagram of the person table by the embodiment. 同実施形態による人物情報生成部の人物情報生成処理フローを示す図である。It is a figure which shows the person information generation process flow of the person information generation part by the embodiment. メールの例である。It is an example of mail. 同実施形態によるメールテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the mail table by the embodiment. 同実施形態によるスレッドテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the thread table by the embodiment. 同実施形態によるキーワードテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the keyword table by the embodiment. 同実施形態による人物テーブルの設定例を示す図である。It is a figure which shows the example of a setting of the person table by the embodiment. 同実施形態による出力制御部の結果表示処理フローを示す図である。It is a figure which shows the result display processing flow of the output control part by the embodiment. 同実施形態によるメールテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the mail table by the embodiment. 同実施形態によるスレッドテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the thread table by the embodiment. 同実施形態によるキーワードテーブルの設定例を示す図である。It is a figure which shows the example of a setting of the keyword table by the embodiment. 同実施形態による人物テーブルの設定例を示す図である。It is a figure which shows the example of a setting of the person table by the embodiment. 同実施形態による人物相関テーブル及び重要人物テーブルの設定例を示す図である。It is a figure which shows the example of a setting of the person correlation table by the same embodiment, and an important person table. 同実施形態による重要人物の出力イメージを示す図である。It is a figure which shows the output image of the important person by the embodiment. 同実施形態による検索時期指定時の重要人物及び人物相関図の表示イメージを示す図である。It is a figure which shows the display image of the important person at the time of search time designation | designated by the same embodiment, and a person correlation diagram. 同実施形態による人物名表示なしの場合の検索画面の全体イメージを示す図である。It is a figure which shows the whole image of the search screen in case there is no person name display by the embodiment. 同実施形態による人物名表示ありの場合の検索画面の全体イメージを示す図である。It is a figure which shows the whole image of the search screen in the case of person name display with the embodiment. 第7の実施形態による検索支援装置の機能ブロック図である。It is a functional block diagram of the search assistance apparatus by 7th Embodiment. 同実施形態による音声認識部の機能ブロック図である。3 is a functional block diagram of a voice recognition unit according to the embodiment. FIG. 同実施形態による音声認識部のメール形式データ生成処理フローを示す図である。It is a figure which shows the mail format data generation processing flow of the speech recognition part by the embodiment. 同実施形態によるメール収集部の分析処理フローを示す図である。It is a figure which shows the analysis processing flow of the mail collection part by the embodiment. 同実施形態による検索処理部の人物相関テーブル作成処理フローを示す図である。It is a figure which shows the person correlation table creation process flow of the search process part by the embodiment. 同実施形態による検索処理部の重要人物テーブル作成処理フローを示す図である。It is a figure which shows the important person table creation process flow of the search process part by the embodiment.

以下、図面を参照して本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施形態]
図1は、本発明の第1の実施形態による検索支援装置1の機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。
同図において、検索支援装置1は、1台または複数台のサーバ等により構成することができ、メール記憶部10、メール収集部20、分析結果格納部30、検索処理部40、及び、出力制御部50からなる。
[First Embodiment]
FIG. 1 is a functional block diagram of a search support apparatus 1 according to the first embodiment of the present invention, in which only functional blocks related to the present invention are extracted and shown.
In the figure, the search support apparatus 1 can be composed of one or a plurality of servers, etc., and includes a mail storage unit 10, a mail collection unit 20, an analysis result storage unit 30, a search processing unit 40, and output control. Part 50.

メール記憶部10は、例えば、メールサーバなどにより実現することができ、利用者間で送受信される電子メール(以下、単に「メール」とも記載)のデータを記憶する。
メール収集部20は、メール記憶部10から電子メールのデータを読込むメール読込み部21と、メール読込み部21により読み出された電子メールのデータを分析するメール分析部22と、メール分析部22による分析結果を示すデータを分析結果格納部30へ書き込む分析結果出力部23を備える。
分析結果格納部30は、メール分析結果のデータとして、各メールに関する情報を示すメールテーブルと、各スレッドの開始及び終了日時を示すスレッドテーブルと、各スレッドについてのキーワードを示すキーワードテーブルを記憶する。なお、スレッドとは、返信や転送がなされた一連のメールをグループ化したものを示す。
The mail storage unit 10 can be realized by, for example, a mail server and stores data of electronic mail (hereinafter also simply referred to as “mail”) transmitted and received between users.
The mail collection unit 20 includes a mail reading unit 21 that reads e-mail data from the mail storage unit 10, a mail analysis unit 22 that analyzes the e-mail data read by the mail reading unit 21, and a mail analysis unit 22. An analysis result output unit 23 is provided for writing data indicating the analysis result of the above to the analysis result storage unit 30.
The analysis result storage unit 30 stores a mail table indicating information about each mail, a thread table indicating the start and end date and time of each thread, and a keyword table indicating a keyword for each thread as mail analysis result data. A thread indicates a group of a series of emails that have been replied or forwarded.

検索処理部40は、例えば、データベースによりで実現することができ、検索支援装置1の備える入力手段、あるいは、検索支援装置1に接続されるコンピュータ端末(出力制御部50)から検索条件の入力を受けるクエリ受付部41と、クエリ受付部41により受信した検索条件に基づいて、分析結果格納部30に記憶されているメール分析結果のデータを検索する検索部42と、検索部42による検索結果を出力する検索結果出力部43とを備える。
出力制御部50は、例えば、コンピュータ端末で実現することができ、検索処理部40の検索結果出力部43により出力された検索結果を読込む検索結果読込み部51と、検索結果読込み部51が読込んだ検索結果をディスプレイへ表示する結果表示部52とを備える。なお、検索結果をプリンタにより印刷したり、記録媒体へ書き込むことでもよい。
The search processing unit 40 can be realized by a database, for example, and inputs search conditions from an input means provided in the search support device 1 or a computer terminal (output control unit 50) connected to the search support device 1. The received query receiving unit 41, the search unit 42 that searches the mail analysis result data stored in the analysis result storage unit 30 based on the search condition received by the query receiving unit 41, and the search result by the search unit 42 And a search result output unit 43 for outputting.
The output control unit 50 can be realized by, for example, a computer terminal. The search result reading unit 51 that reads the search result output by the search result output unit 43 of the search processing unit 40 and the search result reading unit 51 read the search result. And a result display unit 52 for displaying the search results on the display. The search result may be printed by a printer or written to a recording medium.

次に、分析結果格納部30に格納される各データテーブルについて説明する。
図2は、分析結果格納部30に格納されるメールテーブルの構成を示す図である。同図において、メールテーブルは、メールID、スレッドID、メッセージID、件名、送信者、受信者、日付、及び、本文のデータからなる複数のレコードにより構成される。メールIDは、メールテーブルにおける各レコードを一意に特定する識別情報であり、1行目がメールID=1、2行目がメールID=2、…のように、各レコードに対してメール分析部22により付与される。スレッドIDは、各スレッドを一意に特定する識別情報であり、第1スレッドをスレッドID=1、第2スレッドをスレッドID=2、…のように、各スレッドに対してメール分析部22により付与される。メッセージIDは、各メールを一意に特定する識別情報であり、メールのmessage-IDフィールドに設定されている情報に相当する。また、件名、送信者、受信者、日付、本文はそれぞれ、メールのSubjectフィールド、Fromフィールド、Toフィールド、Dateフィールド、メール本文に設定されている情報に相当する。
Next, each data table stored in the analysis result storage unit 30 will be described.
FIG. 2 is a diagram showing the configuration of the mail table stored in the analysis result storage unit 30. As shown in FIG. In the figure, the mail table is composed of a plurality of records including mail ID, thread ID, message ID, subject, sender, receiver, date, and body data. The mail ID is identification information for uniquely identifying each record in the mail table. The mail analysis unit for each record such that the first line is mail ID = 1, the second line is mail ID = 2,. 22. The thread ID is identification information for uniquely identifying each thread, and is assigned to each thread by the mail analysis unit 22 such that the first thread is thread ID = 1, the second thread is thread ID = 2, and so on. Is done. The message ID is identification information that uniquely identifies each mail, and corresponds to information set in the message-ID field of the mail. The subject, sender, recipient, date, and text correspond to the information set in the email Subject field, From field, To field, Date field, and mail text, respectively.

図3は、分析結果格納部30に格納されるスレッドテーブルの構成を示す図である。同図において、スレッドテーブルは、スレッドID、開始日時、及び、終了日時のデータからなる複数のレコードにより構成される。ここで、開始日時、終了日時は、スレッドIDにより特定されるスレッドに属するメールの中で、最も古い日付の情報が設定されているメールから得られる日付、最も新しい日付の情報が設定されているメールから得られる日付を示す。   FIG. 3 is a diagram illustrating a configuration of a thread table stored in the analysis result storage unit 30. In the figure, the thread table is composed of a plurality of records including thread ID, start date / time, and end date / time data. Here, the start date / time and the end date / time are set to the date obtained from the mail in which the information of the oldest date is set and the information of the latest date among the mails belonging to the thread specified by the thread ID. Indicates the date obtained from the mail.

図4は、分析結果格納部30に格納されるキーワードテーブルの構成を示す図である。同図において、キーワードテーブルは、レコードID、スレッドID、及び、キーワードのデータからなる複数のレコードにより構成される。レコードIDは、キーワードテーブルにおける各レコードを一意に特定する識別情報であり、各レコードに対してメール分析部22により付与される。キーワードIDは、スレッドIDにより特定されるスレッドに属するメールの件名を形態素解析した結果の情報である。   FIG. 4 is a diagram showing the configuration of the keyword table stored in the analysis result storage unit 30. As shown in FIG. In the figure, the keyword table is composed of a plurality of records including a record ID, a thread ID, and keyword data. The record ID is identification information that uniquely identifies each record in the keyword table, and is assigned to each record by the mail analysis unit 22. The keyword ID is information obtained as a result of morphological analysis of the subject of the mail belonging to the thread specified by the thread ID.

次に、検索支援装置1における処理フローを説明する。
図5は、メール収集部20における分析処理フローを示す。
同図において、メール収集部20のメール読込み部21は、まだ本分析処理フローによる分析処理を行っていないメールをメール記憶部10としてのメールサーバから読込む(ステップS110)。メールには、Message-ID、Subject、From、To、CC、Date、References、メール本文等のフィールドが含まれる。なお、Referencesは、返信、転送されたメールのみに含まれるフィールドであり、返信、転送されるたびに、その返信、転送される元となったMessage-IDが追加されるフィールドである。
Next, a processing flow in the search support apparatus 1 will be described.
FIG. 5 shows an analysis processing flow in the mail collection unit 20.
In the figure, the mail reading unit 21 of the mail collection unit 20 reads a mail that has not been analyzed by the present analysis processing flow from the mail server as the mail storage unit 10 (step S110). The mail includes fields such as Message-ID, Subject, From, To, CC, Date, References, and mail text. Note that References is a field that is included only in the mail that has been replied or transferred, and is a field to which the Message-ID that is the reply or transfer source is added each time a reply or transfer is made.

メール分析部22が自然数の新たなメールIDを付与すると、分析結果出力部23は、当該メールIDを設定したレコードを分析結果格納部30に記憶されているメールテーブルに追加する。分析結果出力部23は、追加したレコードのメッセージID、件名、送信者、受信者、日付、及び、本文のデータ項目のそれぞれに、読込んだメールのmessage-ID、Subject、From、To、Date、メール本文のフィールドの設定内容を書き込む(ステップS120)。   When the mail analysis unit 22 assigns a new natural mail ID, the analysis result output unit 23 adds the record in which the mail ID is set to the mail table stored in the analysis result storage unit 30. The analysis result output unit 23 adds the message-ID, Subject, From, To, and Date of the read mail to the message ID, subject, sender, recipient, date, and body data items of the added record. Then, the setting contents of the mail body field are written (step S120).

次に、メール分析部22は、メールテーブルを検索し、読込んだメールのReferenceフィールドに設定されているデータと同じ内容のデータがメッセージIDに設定されているレコードがあるかを判断する(ステップS130)。これにより、読込んだメールが、以前のメールと同じスレッドに属するか否かを確認する。読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードがないと判断した場合(ステップS130:NO)、新規のスレッドであるとして、メール分析部22は新たなスレッドIDを付与する。分析結果出力部23は、新たに付与されたスレッドIDを設定したレコードを分析結果格納部30に記憶されているスレッドテーブルに追加するとともに(ステップS140)、追加したレコードの開始日時及び終了日時のデータ項目に、読込んだメールのDateフィールドに設定されているデータを書き込む(ステップS150)。   Next, the mail analysis unit 22 searches the mail table, and determines whether there is a record in which data having the same contents as the data set in the Reference field of the read mail is set in the message ID (Step S1). S130). Thereby, it is confirmed whether or not the read mail belongs to the same thread as the previous mail. When it is determined that there is no record in which the data having the same content as the Reference field of the read mail is set in the message ID (step S130: NO), the mail analysis unit 22 determines that the new thread is a new thread ID. Is granted. The analysis result output unit 23 adds the record in which the newly assigned thread ID is set to the thread table stored in the analysis result storage unit 30 (step S140), and the start date / time and end date / time of the added record. Data set in the date field of the read mail is written in the data item (step S150).

一方、読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードがあると判断した場合(ステップS130:YES)、既に登録されているスレッドに属する最後のメールの可能性があると判断する。そこで、メール分析部22は、読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードからスレッドIDを読み出し、このスレッドIDによりスレッドテーブルを検索する。そして、検出したレコードの開始日時、終了日時に設定されている日時と、読込んだメールのDateフィールドに設定されている日時とを比較する。読込んだメールのDateフィールドに設定されている日時のほうが開始日時より古い日時である場合は、検出したレコードの開始日時のデータ項目を、読込んだメールのDateフィールドに設定されている日時に書き換える。また、読込んだメールのDateフィールドに設定されている日時のほうが終了日時より新しい日時である場合は、検出したレコードの終了日時のデータ項目を、読込んだメールのDateフィールドに設定されている日時に書き換える(ステップS160)。   On the other hand, if it is determined that there is a record in which the same data as the Reference field of the read mail is set in the message ID (step S130: YES), the possibility of the last mail belonging to the already registered thread Judge that there is. Therefore, the mail analysis unit 22 reads the thread ID from the record in which the data having the same contents as the reference field of the read mail is set in the message ID, and searches the thread table by this thread ID. Then, the date and time set in the start date and time and the end date and time of the detected record are compared with the date and time set in the Date field of the read mail. If the date and time set in the Date field of the read email is older than the start date and time, the data item of the start date and time of the detected record is set to the date and time set in the Date field of the read email rewrite. Also, if the date and time set in the Date field of the read email is newer than the end date and time, the data item of the end date and time of the detected record is set in the Date field of the read email The date is rewritten (step S160).

分析結果出力部23は、ステップS120において追加したメールテーブルのレコードに新たに当該メールのスレッドIDを書き込む(ステップS170)。次に、メール分析部22は、メールのSubjectフィールドの設定内容を形態素解析するとともに、形態素解析された結果であるキーワードそれぞれに新たなレコードIDを付与する。分析結果出力部23は、新たに付与されたレコードIDと、当該メールのスレッドIDと、レコードIDに対応するキーワードからなるレコードを、分析結果格納部30に記憶されているキーワードテーブルに追加する(ステップS180)。メール読込み部21は、メール記憶部10としてのメールサーバに、まだ分析処理を行っていないメールがあるかを判断する(ステップS190)。まだ、分析処理していないメールがある場合には(ステップS190:YES)、ステップS110に戻り、上述した処理を繰り返す。そして、メール記憶部10に分析処理していないメールがなくなった場合(ステップS190:NO)、処理を終了する。   The analysis result output unit 23 newly writes the thread ID of the mail in the mail table record added in step S120 (step S170). Next, the mail analysis unit 22 performs morphological analysis on the setting contents of the subject field of the mail and assigns a new record ID to each keyword that is a result of the morphological analysis. The analysis result output unit 23 adds a record including a newly assigned record ID, a thread ID of the mail, and a keyword corresponding to the record ID to the keyword table stored in the analysis result storage unit 30 ( Step S180). The mail reading unit 21 determines whether there is a mail that has not yet been analyzed in the mail server as the mail storage unit 10 (step S190). If there is an email that has not been analyzed yet (step S190: YES), the process returns to step S110, and the above-described processing is repeated. Then, when there is no mail that has not been analyzed in the mail storage unit 10 (step S190: NO), the process ends.

図5の処理を具体的なデータ例を用いて説明する。
図6はメール記憶部10から読込んだ各メールのメールヘッダの例を、図7は図6で示されるメールヘッダをもつメールから生成されるメールテーブルの例を、図8は図6で示されるメールヘッダをもつメールから生成されるスレッドテーブルの例を、図9は図6で示されるメールヘッダをもつメールから生成されるキーワードテーブルの例を示す。
The process of FIG. 5 will be described using a specific data example.
6 shows an example of the mail header of each mail read from the mail storage unit 10, FIG. 7 shows an example of a mail table generated from the mail having the mail header shown in FIG. 6, and FIG. 9 shows an example of a thread table generated from a mail having a mail header. FIG. 9 shows an example of a keyword table generated from a mail having a mail header shown in FIG.

最初に、メールM1(図6)が読込まれると(図5、ステップS110)、新たに付与されたメールID「1」を設定したレコードがメールテーブル(図7)に追加され、メールM1のmessage-ID「1111@svr.jp」、Subject「開発進捗に関して」、From「userA」、To「userB」、Date「2007/2/3 15:12」、メール本文が当該レコードのメッセージID、件名、送信者、受信者、日付、及び、本文に設定される(図5、ステップS120)。また、メールM1にはReferenceフィールドが含まれていないため、新規のスレッドであると判断される(図5、ステップS130:NO)。そこで、新たなスレッドID「1」を設定したレコードがスレッドテーブル(図8)に追加され(図5、ステップS140)、メールM1のDate「2007/2/3 15:12」が当該レコードの開始日時及び終了日時に設定されるとともに(図5、ステップS150)、メールテーブル(図7)のメールID「1」のレコードに、スレッドID「1」が設定される(図5、ステップS170)。さらに、メールM1のSubjectフィールドの設定内容を形態素解析して「開発」、「進捗」、「関して」が得られると、各形態素解析結果それぞれについて新たに付与されたレコードID「1」、「2」、「3」を設定したレコードがキーワードテーブル(図9)に追加され、この追加されたレコードそれぞれには、スレッドID「1」と、対応する形態素解析結果「開発」、「進捗」、「関して」が設定される(図5、ステップS180)。   First, when the mail M1 (FIG. 6) is read (FIG. 5, step S110), a record in which the newly assigned mail ID “1” is set is added to the mail table (FIG. 7). message-ID "1111@svr.jp", Subject "Regarding development progress", From "userA", To "userB", Date "2007/2/3 15:12", the email body is the message ID of the record, subject , Sender, receiver, date, and text are set (FIG. 5, step S120). Further, since the reference field is not included in the mail M1, it is determined that the mail is a new thread (FIG. 5, step S130: NO). Therefore, a record in which a new thread ID “1” is set is added to the thread table (FIG. 8) (FIG. 5, step S140), and the date “2007/2/3 15:12” of the mail M1 is the start of the record. The date / time and end date / time are set (FIG. 5, step S150), and the thread ID “1” is set in the record of the mail ID “1” in the mail table (FIG. 7) (FIG. 5, step S170). Further, when “development”, “progress”, and “about” are obtained by performing morphological analysis on the setting contents of the subject field of the mail M1, newly assigned record IDs “1”, “ Records set with “2” and “3” are added to the keyword table (FIG. 9). Each of the added records includes a thread ID “1” and a corresponding morphological analysis result “development”, “progress”, “About” is set (FIG. 5, step S180).

次に、メールM2(図6)が読込まれると(図5、ステップS110)、新たに付与されたメールID「2」を設定したレコードがメールテーブル(図7)に追加され、メールM2のmessage-ID「2222@svr.jp」、Subject「Re:開発進捗に関して」、From「userB」、To「userA」、Date「2007/2/4 0:12」、メール本文が当該レコードのメッセージID、件名、送信者、受信者、日付、及び、本文に設定される(図5、ステップS120)。そして、メールM2のReference「1111@svr.jp」がメッセージIDに設定されているレコードがすでにメールテーブルにあるため(メールID「1」のレコード)、既に出現したスレッドであると判断される(図5、ステップS130:NO)。このレコードには、スレッドID「1」が設定されているため、スレッドテーブル(図8)から、当該スレッドIDが設定されているレコードの開始日時「2007/2/3 15:12」、終了日時「2007/2/3 15:12」を読み出し、メールM2のDate「2007/2/4 0:12」と比較する。メールM2のDateのほうが終了日時より新しい日時であるため、終了日時のデータ項目がメールM2のDateの設定内容に書き換えられ(ステップS160)、メールテーブル(図7)のメールID「2」のレコードに、スレッドID「1」が設定される(図5、ステップS170)。さらに、メールM1のSubjectフィールドの設定内容を形態素解析して「開発」、「進捗」、「関して」が得られるが、図9に示すように、キーワードテーブル(図9)には、当該スレッドID「1」に対応してすでにこれらのキーワードが設定されているため、新たなレコード追加は行われない。   Next, when the mail M2 (FIG. 6) is read (FIG. 5, step S110), a record in which the newly assigned mail ID “2” is set is added to the mail table (FIG. 7). message-ID "2222@svr.jp", Subject "Re: Regarding development progress", From "userB", To "userA", Date "2007/2/4 0:12", the mail body is the message ID of the record , Subject, sender, receiver, date, and text are set (FIG. 5, step S120). Since there is already a record in the mail table in which the reference “1111@svr.jp” of the mail M2 is set as the message ID (record with the mail ID “1”), it is determined that the thread has already appeared ( FIG. 5, Step S130: NO). Since the thread ID “1” is set in this record, the start date and time “2007/2/3 15:12” and the end date and time of the record in which the thread ID is set are shown in the thread table (FIG. 8). “2007/2/3 15:12” is read and compared with the date “2007/2/4 0:12” of the mail M2. Since the date of the mail M2 is newer than the end date and time, the data item of the end date and time is rewritten to the setting contents of the date of the mail M2 (step S160), and the record of the mail ID “2” in the mail table (FIG. 7) Is set with the thread ID “1” (FIG. 5, step S170). Furthermore, “development”, “progress”, and “related” are obtained by performing morphological analysis on the setting contents of the Subject field of the mail M1, but as shown in FIG. 9, the keyword table (FIG. 9) includes the relevant thread. Since these keywords are already set corresponding to the ID “1”, no new record is added.

このようにして、図6に示すメールM1〜M8について図5の処理を行った結果が、図7に示すメールテーブル、図8に示すスレッドテーブル、図9に示すキーワードテーブルである。図7に示すように、メールテーブルには、メールM1〜M8それぞれについてレコードが追加され、メールM1、M2、M3に対応したレコードにはスレッドID「1」が、メールM4に対応したレコードにはスレッドID「2」が、メールM5、M6、M7に対応したレコードにはスレッドID「3」が、メールM8に対応したレコードにはスレッドID「4」が設定されている。これは、メールM2のReferences「1111@svr.jp」が、メールM1に対応したレコードのメッセージIDに設定されており、メールM3のReferences「1111@svr.jp」、「2222@svr.jp」が、メールM1、メールM2に対応したレコードのメッセージIDに設定されているため、メールM1、M2、M3に対応したレコードに同じスレッドIDが設定されたものである。同様に、メールM6のReferences「5555@svr.jp」は、メールM5に対応したレコードのメッセージIDに設定されており、メールM7のReferences「5555@svr.jp」、「6666@svr.jp」は、メールM5、メールM6に対応したレコードのメッセージIDに設定されているため、メールM5、M6、M7に対応したレコードには同じスレッドIDが設定される。   The result of performing the processing of FIG. 5 on the mails M1 to M8 shown in FIG. 6 is the mail table shown in FIG. 7, the thread table shown in FIG. 8, and the keyword table shown in FIG. As shown in FIG. 7, records are added to the mail table for each of the mails M1 to M8, the thread ID “1” is assigned to the records corresponding to the mails M1, M2, and M3, and the record corresponding to the mail M4 is assigned to the mail table. A thread ID “3” is set for a record corresponding to the mail M5, M6, and M7, and a thread ID “4” is set for a record corresponding to the mail M8. In this case, References “1111@svr.jp” in the mail M2 is set to the message ID of the record corresponding to the mail M1, and References “1111@svr.jp” and “2222@svr.jp” in the mail M3. However, since the message IDs of the records corresponding to the mails M1 and M2 are set, the same thread ID is set to the records corresponding to the mails M1, M2, and M3. Similarly, References “5555@svr.jp” of the mail M6 is set to the message ID of the record corresponding to the mail M5, and References “5555@svr.jp” and “6666@svr.jp” of the mail M7. Is set to the message ID of the record corresponding to the mail M5 and mail M6, the same thread ID is set to the record corresponding to the mail M5, M6 and M7.

また、図8に示すスレッドテーブルには、スレッドID「1」のレコードに、当該スレッドIDに属する最初のメールM1のDateフィールドの設定内容が開始日時に、当該スレッドIDに属する最後のメールM3のDateフィールドの設定内容が終了日時に設定されている。同様に、スレッドID「3」のレコードに、当該スレッドIDに属する最初のメールM5のDateフィールドの設定内容が開始日時に、当該スレッドIDに属する最後のメールM7のDateフィールドの設定内容が終了日時に設定されている。
また、スレッドID「2」に属するのはメールM4のみであるため、当該スレッドIDのレコードには、メールM4のDateフィールドの設定内容が開始日時及び終了日時に設定されている。同様に、スレッドID「4」のレコードには、メールM8のDateフィールドの設定内容が開始日時及び終了日時に設定されている。
Further, in the thread table shown in FIG. 8, in the record of the thread ID “1”, the setting content of the Date field of the first mail M1 belonging to the thread ID is the start date and time of the last mail M3 belonging to the thread ID. The setting content of the Date field is set to the end date and time. Similarly, in the record of the thread ID “3”, the setting contents of the Date field of the first mail M5 belonging to the thread ID are the start date and time, and the setting contents of the Date field of the last mail M7 belonging to the thread ID are the end date and time. Is set to
Since only the mail M4 belongs to the thread ID “2”, the setting contents of the Date field of the mail M4 are set to the start date and time and the end date and time in the record of the thread ID. Similarly, in the record with the thread ID “4”, the setting contents of the Date field of the mail M8 are set to the start date and time and the end date and time.

また、図9に示すように、キーワードテーブルには、スレッドID「1」に属するメールM1,M2,M3のSubjectの設定内容を形態素解析した結果の「開発」、「進捗」、「関して」がレコードID「1」〜「3」に、スレッドID「2」に属するメールM4のSubjectの設定内容を形態素解析した結果の「懇親会」がレコード「4」に、スレッドID「3」に属するメールM5,M6,M7のSubjectの設定内容を形態素解析した結果の「打合せ」、「件」がレコードID「5」、「6」に、スレッドID「4」に属するメールM8のSubjectの設定内容を形態素解析した結果の「開発」、「会議」がレコードID「7」、「8」に設定されている。   Further, as shown in FIG. 9, the keyword table includes “development”, “progress”, “related” as a result of morphological analysis of the subject setting contents of the mails M1, M2, and M3 belonging to the thread ID “1”. “Social gathering” as a result of morphological analysis of the subject settings of the mail M4 belonging to the thread ID “2” in the record IDs “1” to “3” belongs to the record “4” and the thread ID “3”. Subject settings for email M5, M6, and M7: “Meetings” and “results” as a result of morphological analysis. Subject settings for email M8 belonging to record ID “5” and “6” and thread ID “4” “Development” and “Conference” as a result of the morphological analysis are set to record IDs “7” and “8”.

図10〜図12は、検索処理部40における処理フローを示す。
図10は、検索処理部40におけるスレッド検索処理フローを示す。
検索処理部40のクエリ受付部41は、受信した検索要求から検索ワードを読込む(ステップS210)。検索部42は、分析結果格納部30に記憶されているキーワードテーブルに設定されているスレッドIDのうち、本スレッド検索処理フローによるスレッド検索処理を行っていないスレッドIDを選択して読込む(ステップS220)。そして、その選択したスレッドIDが設定されているキーワードテーブルのレコードの中に、検索ワードに一致するキーワードが設定されているレコードがあるかを判断する(ステップS230)。
10 to 12 show a processing flow in the search processing unit 40.
FIG. 10 shows a thread search processing flow in the search processing unit 40.
The query receiving unit 41 of the search processing unit 40 reads a search word from the received search request (step S210). The search unit 42 selects and reads a thread ID that has not been subjected to the thread search process according to this thread search process flow from among the thread IDs set in the keyword table stored in the analysis result storage unit 30 (Step S42). S220). Then, it is determined whether or not there is a record in which a keyword matching the search word is set among the records in the keyword table in which the selected thread ID is set (step S230).

選択したスレッドIDが設定されているレコードの中に、検索ワードに一致するキーワードが設定されているレコードがある場合(ステップS230:YES)、以下のステップS240〜S250の処理を実行する。すなわち、検索部42は、選択したスレッドIDをキーにして分析結果格納部30に記憶されているスレッドテーブルを検索し、検出したレコードから開始日時を読込むとともに(ステップS240)、選択したスレッドIDと読込んだ開始日時とを対応付けた情報を記憶する(ステップS250)。   If there is a record in which a keyword that matches the search word is set in the record in which the selected thread ID is set (step S230: YES), the following steps S240 to S250 are executed. That is, the search unit 42 searches the thread table stored in the analysis result storage unit 30 using the selected thread ID as a key, reads the start date and time from the detected record (step S240), and the selected thread ID and Information associated with the read start date and time is stored (step S250).

検索部42は、キーワードテーブルに、まだスレッド検索処理を行っていないスレッドIDがある場合は(ステップS260:NO)、ステップS220からの処理を繰り返す。そして、キーワードテーブルに登録されている全てのスレッドIDについて、スレッド検索処理を実行した場合は(ステップS260:YES)、処理を終了する。   If there is a thread ID that has not yet been subjected to thread search processing in the keyword table (step S260: NO), the search unit 42 repeats the processing from step S220. If thread search processing has been executed for all thread IDs registered in the keyword table (step S260: YES), the processing ends.

図11は、検索処理部40における人物相関テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶したスレッドID(以下、処理対象スレッドID)のうち、当該人物相関テーブル作成処理フローによる人物相関テーブル作成処理をまだ行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS310)。
FIG. 11 shows a person correlation table creation process flow in the search processing unit 40.
The search unit 42 of the search processing unit 40 has not yet performed the person correlation table creation process by the person correlation table creation process flow among the thread IDs stored in step S250 of FIG. 10 (hereinafter, the process target thread ID). Select an ID. The search unit 42 searches the mail table, identifies and reads the record in which the selected thread ID is set (step S310).

検索部42は、ステップS310において読込んだレコードから、送信者と受信者に設定されているユーザの組を送受信者の組として抽出し、抽出した送受信者の組それぞれについて、抽出された数をカウントする(ステップS320)。なお、送信者と受信者のユーザが入れ替わっていても、同じ組であるとする。検索部42は、処理対象スレッドIDに、まだ人物相関テーブル作成処理を行っていないスレッドIDがある場合は(ステップS330:NO)、ステップS310からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、人物相関テーブル作成処理を実行した場合(ステップS330:YES)、スレッドID毎に、ステップS320において抽出された送受信者の組と、その組の抽出数に対応したポイントとを示す一覧である人物相関テーブルを生成して記憶する(ステップS340)。つまり、ユーザがメールの送信者、あるいは、受信者となる毎に、当該ユーザに1ポイントが付与されることを示す。   The search unit 42 extracts a set of users set as a sender and a receiver as a set of senders and receivers from the record read in step S310, and calculates the number extracted for each of the extracted sets of senders and receivers. Count (step S320). In addition, even if the sender and the user of the receiver are switched, it is assumed that they are the same set. When the processing target thread ID includes a thread ID that has not yet been subjected to the person correlation table creation process (step S330: NO), the search unit 42 repeats the process from step S310. When the person correlation table creation process is executed for all process target thread IDs (step S330: YES), for each thread ID, the pair of senders and receivers extracted in step S320 and the number of extractions of the pair are supported. A person correlation table, which is a list showing the points, is generated and stored (step S340). That is, each time a user becomes a mail sender or receiver, 1 point is given to the user.

図12は、検索処理部40における重要人物テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶した処理対象スレッドIDのうち、当該重要人物テーブル作成処理フローによるおいてまだ重要人物テーブル作成処理を行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS410)。
FIG. 12 shows an important person table creation processing flow in the search processing unit 40.
The search unit 42 of the search processing unit 40 selects a thread ID that has not yet been subjected to the important person table creation process in the important person table creation process flow from the process target thread IDs stored in step S250 of FIG. . The search unit 42 searches the mail table, identifies and reads the record in which the selected thread ID is set (step S410).

検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者または受信者として設定されている数である登場回数を計測し、記憶する(ステップS420)。検索部42は、処理対象スレッドIDに、まだ重要人物テーブル作成処理を行っていないスレッドIDがある場合は(ステップS430:NO)、ステップS410からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、重要人物テーブル作成処理を実行した場合は(ステップS430:YES)、スレッドID毎に、ステップS420において抽出されたユーザと、その登場回数に対応したポイントとを示す一覧である重要人物テーブルを生成して記憶する(ステップS440)。つまり、ユーザがメールの送信者、あるいは、受信者となる毎に、当該ユーザに1ポイントが付与されることを示す。   The search unit 42 extracts a user set as a sender or a receiver from the read record, and measures the number of appearances that is the number of the extracted user set as a sender or a receiver. (Step S420). If there is a thread ID that has not yet undergone the important person table creation process in the process target thread ID (step S430: NO), the search unit 42 repeats the process from step S410. If the important person table creation process is executed for all process target thread IDs (step S430: YES), for each thread ID, the user extracted in step S420 and the points corresponding to the number of appearances are displayed. An important person table which is a list to be shown is generated and stored (step S440). That is, each time a user becomes a mail sender or receiver, 1 point is given to the user.

図13は、出力制御部50の結果表示処理フローを示す。
同図において、検索結果読込み部51は、検索結果出力部43から出力される各処理対象スレッドIDの開始日時、人物相関テーブル、重要人物テーブル、及び、各処理対象スレッドIDに対応したメールテーブルのレコードから読込んだ件名の一覧を検索結果として読込む(ステップS510)。次に、結果表示部52は、検索結果表示方法の情報を読込む(ステップS520)。これは、クエリ受付部41が受信した検索要求内に設定されているか、予め、出力制御部50の記憶手段に記憶されている情報である。検索結果表示方法の情報に、重要人物表示が必要であることが設定されている場合(ステップS530:YES)、結果表示部52は、各スレッドについて、重要人物テーブルで示されるユーザのうち、ポイント数の多い順番に所定数のユーザを重要人物として抽出する。そして、抽出した各スレッドの重要人物を、その重要人物に対応したポイント数とともに表示する(ステップS540)。このとき、時系列的にスレッドを並べ、各スレッドに対応して登場回数の多い順番に重要人物を表示する。また、さらに、特定のスレッドのみを表示するような指示の入力があった場合は、その指定されたスレッドについての重要人物のみを表示し、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての重要人物を表示する。
FIG. 13 shows a result display processing flow of the output control unit 50.
In the figure, the search result reading unit 51 includes the start date / time of each processing target thread ID output from the search result output unit 43, the person correlation table, the important person table, and the mail table corresponding to each processing target thread ID. A list of subject names read from the record is read as a search result (step S510). Next, the result display unit 52 reads information on the search result display method (step S520). This is information set in the search request received by the query reception unit 41 or stored in advance in the storage unit of the output control unit 50. If it is set in the search result display method information that important person display is required (step S530: YES), the result display unit 52 points out of the users shown in the important person table for each thread. A predetermined number of users are extracted as important persons in descending order. Then, the extracted important person of each thread is displayed together with the number of points corresponding to the important person (step S540). At this time, threads are arranged in time series, and important persons are displayed in the order of the most appearances corresponding to each thread. In addition, when there is an input to display only a specific thread, only the important person for the specified thread is displayed. Display important people for threads whose start date is included in the period.

続いて、検索結果表示方法の情報に、テーマ名の表示が必要であることが設定されている場合(ステップS550:YES)、結果表示部52は、ステップS510において検索結果出力部43から読込んだ件名の一覧を表示する(ステップS560)。このとき、ステップS540において出力した各スレッドの重要人物の表示に対応づけて件名を表示してもよい。また、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての件名を表示する。   Subsequently, when it is set in the search result display method information that the theme name needs to be displayed (step S550: YES), the result display unit 52 reads from the search result output unit 43 in step S510. A list of subject names is displayed (step S560). At this time, the subject may be displayed in association with the display of the important person of each thread output in step S540. When information indicating a period is input, a subject for a thread whose start date and time is included in the period is displayed.

さらに、検索結果表示方法の情報に、重人物の相関関図の表示が必要であることが設定されている場合(ステップS570:YES)、結果表示部52は、各スレッドについて、人物相関テーブルで示される送受信者の組のうち、ポイント数の多い順番に所定数の組を抽出する。そして、各スレッドについて抽出した送受信者の組を、その送受信者の組のポイント数に対応したポイント数とともに表示する(ステップS580)。なお、このとき、複数のユーザ間における送受信の組の相関関係を示すようなマトリックス状に表示する。また、さらに、特定のスレッドのみを表示するような指示の入力があった場合は、その指定されたスレッドについての送受信者の組のみを表示し、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての送受信者の組を表示する。   Furthermore, when it is set in the search result display method information that it is necessary to display the correlation diagram of the heavy person (step S570: YES), the result display unit 52 uses the person correlation table for each thread. A predetermined number of sets are extracted in descending order of the number of points from the set of senders and receivers shown. Then, the sender / receiver pair extracted for each thread is displayed together with the number of points corresponding to the number of points of the sender / receiver pair (step S580). In addition, at this time, it displays in the matrix form which shows the correlation of the group of transmission / reception between several users. In addition, when there is an instruction to display only a specific thread, only the set of senders and receivers for the specified thread is displayed, and information indicating the period is input. , A set of senders and receivers for a thread whose start date and time is included in the period is displayed.

図10〜図13の処理を具体的なデータ例を用いて説明する。
図14はメールテーブルの例を、図15はスレッドテーブルの例を、図16はキーワードテーブルの例を示す図であり、クエリ受付部41が検索キーワード読込む前に設定されているものとする。また、検索キーワードとして「販売」が入力されるとする。このとき作成される人物相関テーブル及び重要人物テーブルを図17に示す。
The processes of FIGS. 10 to 13 will be described using specific data examples.
FIG. 14 shows an example of a mail table, FIG. 15 shows an example of a thread table, and FIG. 16 shows an example of a keyword table, which are set before the query receiving unit 41 reads a search keyword. Further, it is assumed that “sales” is input as a search keyword. FIG. 17 shows the person correlation table and the important person table created at this time.

図10のスレッド検索処理において、検索キーワードが読込まれると(図10、ステップS210)、キーワードテーブル(図16)に設定されているスレッドIDが順に選択される(図10、ステップS220)。スレッドID「116」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「340」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2006/7/1 15:12」が読込まれ、スレッドID「116」と対応付けて記憶される(図10、ステップS240、S250)。   In the thread search process of FIG. 10, when a search keyword is read (FIG. 10, step S210), thread IDs set in the keyword table (FIG. 16) are selected in order (FIG. 10, step S220). When the thread ID “116” is selected, a record (record ID “340”) in which the search word “sales” is set as a keyword is recorded from a record in the keyword table (FIG. 16) in which the thread ID is set. It is detected (FIG. 10, step S230). The start date and time “2006/7/1 15:12” corresponding to the thread ID is read and stored in association with the thread ID “116” (FIG. 10, steps S240 and S250).

次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「372」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2007/1/7 13:10」が読込まれ、スレッドID「120」と対応付けて記憶される(図10、ステップS240、S250)。   Next, when the thread ID “120” is selected, the record (record ID “372”) in which the search word “sales” is set as a keyword from the record of the keyword table (FIG. 16) in which the thread ID is set. ") Is detected (FIG. 10, step S230). Then, the start date and time “2007/1/7 13:10” corresponding to the thread ID is read and stored in association with the thread ID “120” (FIG. 10, steps S240 and S250).

次に、スレッドID「144」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)には、検索ワード「販売」がキーワードとして設定されているレコードがないことが検出される(図10、ステップS230)。
これにより、処理対象スレッドID「116」、「120」と、それぞれの開始日時「2006/7/1 15:12」、「2007/1/7 13:10」が記憶される(図10、ステップS250)。
Next, when the thread ID “144” is selected, it is detected that there is no record in which the search word “sales” is set as a keyword in the keyword table (FIG. 16) in which the thread ID is set. (FIG. 10, step S230).
As a result, the processing target thread IDs “116” and “120” and the start dates and times “2006/7/1 15:12” and “2007/1/7 13:10” are stored (FIG. 10, step). S250).

続いて、人物相関テーブル作成処理(図11)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「500」〜「506」)が特定される(図11、ステップS310)。図17に示すように、この特定されたレコードの送信者と受信者の情報から、「userAとuserB」、「userAとuserC」、「userAとuserD」、「userAとuserE」、「userBとuserE」の組が抽出され、それらの組が抽出された数はそれぞれ「4」、「2」、「2」、「2」、「3」である(図11、ステップS320)。なお、図面では、userA、userB、userC、userD、userEを単にA,B,C,D,Eと表記する場合がある。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「507」〜「511」)を特定する(図11、ステップS310)。図17に示すように、この特定されたレコードの送信者と受信者の情報から、「userAとuserB」、「userAとuserC」、「userAとuserD」、「userAとuserE」の組が抽出され、それらの組が抽出された数はそれぞれ「2」、「2」、「3」、「1」である(図11、ステップS320)。
これにより、各スレッドID毎に、これらの抽出されたユーザの組と、その組の抽出数に対応したポイントとを示す人物相関テーブル(図17)が生成される(図11、ステップS340)。ここでは、抽出数1を1ポイントとしている。
Subsequently, a person correlation table creation process (FIG. 11) is started, and process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 11, step S310). As shown in FIG. 17, from the information of the sender and receiver of the identified record, “userA and userB”, “userA and userC”, “userA and userD”, “userA and userE”, “userB and userE” ”Are extracted, and the numbers of these extracted groups are“ 4 ”,“ 2 ”,“ 2 ”,“ 2 ”, and“ 3 ”, respectively (FIG. 11, step S320). In the drawings, userA, userB, userC, userD, and userE may be simply expressed as A, B, C, D, and E.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 11, step S310). ). As shown in FIG. 17, a set of “userA and userB”, “userA and userC”, “userA and userD”, and “userA and userE” are extracted from the sender and receiver information of the specified record. The numbers from which these sets are extracted are “2”, “2”, “3”, and “1”, respectively (FIG. 11, step S320).
As a result, for each thread ID, a person correlation table (FIG. 17) is generated that shows these extracted user sets and points corresponding to the number of extracted sets (FIG. 11, step S340). Here, the extraction number 1 is 1 point.

続いて、重要人物テーブル作成処理(図12)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「500」〜「506」)が特定される(図12、ステップS410)。図17に示すように、この特定されたレコードの送信者または受信者に設定されているユーザとして、「userA」、「userB」、「userC」、「userD」、「userE」が抽出され、その抽出したユーザの登場回数「10」、「7」、「2」、「2」、「5」が計測される。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「507」〜「511」)が特定される(図12、ステップS420)。図17に示すように、この特定されたレコードの送信者または受信者に設定されているユーザとして、「userA」、「userB」、「userC」、「userD」、「userE」が抽出され、その抽出したユーザの登場回数「8」、「2」、「2」、「3」、「1」が計測される。
これにより、各スレッドID毎に、これらの抽出されたユーザと、その登場回数に対応したポイントとを示す重要人物テーブルが生成される(図12、ステップS440)。なお、ここでは、登場回数1回を1ポイントとしている。
Subsequently, the important person table creation process (FIG. 12) is started, and the process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 12, step S410). As shown in FIG. 17, “userA”, “userB”, “userC”, “userD”, and “userE” are extracted as the users set as the sender or receiver of the specified record, The number of appearances “10”, “7”, “2”, “2”, “5” of the extracted user is measured.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 12, step). S420). As shown in FIG. 17, “userA”, “userB”, “userC”, “userD”, and “userE” are extracted as the users set as the sender or receiver of the specified record, The number of appearances “8”, “2”, “2”, “3”, “1” of the extracted user is measured.
Thereby, an important person table indicating these extracted users and points corresponding to the number of appearances is generated for each thread ID (FIG. 12, step S440). Here, the number of appearances is 1 point.

図18は、図17に示す重要人物テーブルに基づいた重要人物出力イメージであり、時系列にスレッドを並べて表示したイメージを示す。ここでは、重要人物は、ポイント数が高い順に3人としている。なお、所定のポイント数以上などとすることもでき、この条件は予め出力制御部50に記憶されるか、ユーザにより入力される。
図18においては、重要人物テーブル(図17)に含まれるスレッドID「116」、「120」を、これらの開始日時「2006/07/01 15:12」、「2007/07/08 23:11」に対応した時間軸上に、時系列で表示している。そして、スレッドID「116」については、ポイント数が高い順に「userA」、「userB」、「userE」が表示され、スレッドID「120」については、ポイント数が高い順に「userA」、「userD」、「userB」、「userC」が表示されている。なお、「userB」と「userC」はポイント数が同じため、両者を表示しているものである。
FIG. 18 is an important person output image based on the important person table shown in FIG. 17 and shows an image in which threads are arranged in time series. Here, there are three important persons in descending order of the number of points. Note that the number of points may be equal to or greater than a predetermined number, and the condition is stored in advance in the output control unit 50 or input by the user.
In FIG. 18, the thread IDs “116” and “120” included in the important person table (FIG. 17) are assigned the start dates and times “2006/07/01 15:12” and “2007/07/08 23:11”. On the time axis corresponding to “”. For the thread ID “116”, “userA”, “userB”, “userE” are displayed in descending order of the number of points, and for the thread ID “120”, “userA”, “userD” are displayed in descending order of the number of points. , “UserB”, “userC” are displayed. Since “userB” and “userC” have the same number of points, both are displayed.

図19は、図17に示す重要人物テーブルに基づいた、検索時期を指定したときの重要人物及び人物相関図の表示イメージを示す。ここでは、2006年が指定されとする。なお、検索時期の条件は、ユーザにより入力されるものとする。
出力制御部50の結果表示部52は、重要人物テーブル(図17)に含まれるスレッドID「116」、「120」のうち、開始日時が2006年であるスレッドID「116」を選択する。そして、スレッドID「116」については、重要人物として、ポイント数が高い順に「userA」、「userB」、「userE」を、そのポイント数のともに表示する。また、人物相関テーブル(図17)から、当該スレッドIDに対応して、重要人物としてのポイント数が最も高い「userA」が含まれる送受信の組と、そのポイント数を読込む。そして、ポイント数が最も高い「userA」を中心として、送受信の組となる各ユーザ「userB」、「userC」、「userD」、「userE」をその周囲に表示するとともに、「userA」と各ユーザ「userB」、「userC」、「userD」、「userE」との間に、ポイント数を表示するとともに、そのポイント数に対応した太さの線を描画する。なお、表示する送受信の組をポイント数の多い組から所定数としてもよく、所定のポイント数以上の送受信の組を表示するようにしてもよい。
FIG. 19 shows a display image of the important person and the person correlation diagram when the search time is designated based on the important person table shown in FIG. Here, 2006 is designated. The search time condition is input by the user.
The result display unit 52 of the output control unit 50 selects the thread ID “116” whose start date and time is 2006 among the thread IDs “116” and “120” included in the important person table (FIG. 17). For the thread ID “116”, “userA”, “userB”, and “userE” are displayed together with the number of points as the important person in descending order of the number of points. Also, from the person correlation table (FIG. 17), in correspondence with the thread ID, a transmission / reception set including “userA” having the highest number of points as an important person and the number of points are read. The user “userB”, “userC”, “userD”, and “userE” are displayed around the “userA” with the highest number of points, and “userA” and each user. The number of points is displayed between “userB”, “userC”, “userD”, and “userE”, and a line with a thickness corresponding to the number of points is drawn. The transmission / reception group to be displayed may be a predetermined number from a group having a large number of points, or a transmission / reception group having a predetermined number of points or more may be displayed.

図20は、検索画面の全体イメージを示す図である。同図においては、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物、人物相関図、及び、各スレッドに送信者または受信者として登場したユーザの一覧とそのポイント数が表示されている。   FIG. 20 is a diagram showing an overall image of the search screen. In the figure, a field for entering a search word, a thread arranged in chronological order and its important persons, a person correlation diagram, a list of users who appeared as senders or receivers in each thread, and the number of points are displayed. ing.

なお、上記においては、開始日時が検索条件として指定された期間内のスレッドを出力対象としているが、終了日時が検索条件として指定された期間内であるスレッドを出力するようにしてもよく、両者を組み合わせてもよい。終了日時を検索条件する場合は、図10のステップS240において、開始日時の代わりに終了日時を読込み、図13のステップS510において、検索結果読込み部51は、各処理対象スレッドIDの終了日時を読込む。   In the above, the threads within the period for which the start date / time is specified as the search condition are output, but the threads whose end date / time is within the period specified as the search condition may be output. May be combined. When the end date / time is set as the search condition, the end date / time is read instead of the start date / time in step S240 of FIG. 10, and the search result reading unit 51 reads the end date / time of each processing target thread ID in step S510 of FIG. Include.

なお、ユーザを表示するときには、メールの送信者、受信者のフィールドから読込んだユーザの識別情報(メールアドレス等)を表示してもよく、ユーザの識別情報に対応付けて記憶手段に記憶されている氏名や部署等の情報を読込んで表示してもよい。   When displaying the user, the user identification information (email address, etc.) read from the sender and recipient fields of the mail may be displayed and stored in the storage means in association with the user identification information. You may read and display information such as your name and department.

[第2の実施形態]
本発明の第2の実施形態について説明する。上述した第1の実施形態においては、スレッド単位に分割したメールを、その開始日時の時系列にプロットして表示しているが、同じような時期に多数のスレッドが始まる場合や、検索の結果、多数のスレッドが該当したりする場合などがある。このような場合、検索者はどのスレッドが、自分の知りたい内容を扱っているものであるかを選択するのが困難となってしまう。そこで、第2の実施形態においては、検索者が知りたい内容について取り扱っているスレッドを簡易に選択することを支援するために、時間経過に伴うメール量の分布を可視化して表示し、話題の盛り上がり・盛り下がりを考慮したスレッド選択が行えるようにする。これにより、検索者が知りたいと考えている内容について多くのメールがやりとりされているスレッドを選択したり、話題が盛り上がった時期、すなわち、メール量が多い時期に基づいてスレッドを選択したりできるようになる。
[Second Embodiment]
A second embodiment of the present invention will be described. In the first embodiment described above, the mail divided into threads is plotted and displayed in the time series of the start date and time. However, when a large number of threads start at the same time, or the search results There are cases where many threads are applicable. In such a case, it becomes difficult for the searcher to select which thread deals with the content he wants to know. Therefore, in the second embodiment, in order to assist a searcher to easily select a thread that deals with the content that the searcher wants to know, the distribution of the amount of mail over time is visualized and displayed. Enable thread selection that takes into account ups and downs. This allows you to select threads where many emails are being exchanged for the content that the searcher wants to know, or to select threads based on when the buzz was raised, that is, when the amount of email was high It becomes like this.

第2の実施形態の処理について、第1の実施形態との差分を説明する。
図10に示すスレッド検索処理フローのステップS240において、検索処理部40の検索部42は、選択したスレッドIDをキーにして分析結果格納部30に記憶されているメールテーブルを検索し、検出したレコードから日付の情報を読込み、ステップS250において、選択したスレッドIDと読込んだ日時とを対応付けた情報を記憶する。この情報は、図13に示す結果表示処理フローのステップS510において、出力制御部50の検索結果読込み部51に読み込まれる。出力制御部50の結果表示部52は、スレッドID毎に、当該スレッドIDに対応した日付の情報に基づいて所定の単位期間毎(4半期単位、1ヶ月単位など)のメールの件数をカウントし、各スレッドについて当該単位期間毎に、メールの件数に対応した大きさの円を表示したり、メールの件数の推移をグラフ表示したりする。なお、この単位期間は、出力制御部50の図示しない記憶手段に予め記憶されている情報であってもよく、検索処理部40のクエリ受付部41が受信した検索要求内に設定されることでもよい。
The difference between the processing of the second embodiment and the first embodiment will be described.
In step S240 of the thread search processing flow shown in FIG. 10, the search unit 42 of the search processing unit 40 searches the mail table stored in the analysis result storage unit 30 using the selected thread ID as a key, and detects the detected record. In step S250, information that associates the selected thread ID with the read date and time is stored. This information is read by the search result reading unit 51 of the output control unit 50 in step S510 of the result display processing flow shown in FIG. The result display unit 52 of the output control unit 50 counts the number of e-mails for each predetermined unit period (quarterly unit, one month unit, etc.) for each thread ID based on the date information corresponding to the thread ID. For each thread, a circle with a size corresponding to the number of mails is displayed for each unit period, or a transition of the number of mails is displayed in a graph. The unit period may be information stored in advance in a storage unit (not shown) of the output control unit 50, or may be set in a search request received by the query receiving unit 41 of the search processing unit 40. Good.

図21は、円の大きさによりメールの件数を表示した場合のスレッド出力イメージである。同図においては、各スレッドについて、4半期毎に、メールの件数に対応した大きさの円を表示している。これにより、他のスレッドより大きな円が表示されているスレッドがより話題の盛り上がったスレッドであり、また、より大きな円が表示されている時期がより話題の盛り上がった時期であることが視覚的に把握可能となる。なお、ここでは、メールの件数に対応した大きさの円を表示しているが、メールの大きさを表す図形は円以外の図形でもよく、また、メール量が多い場合は赤、少ない場合は青としたグラデーションにより表示するなど、色による表示を行ってもよい。   FIG. 21 is a thread output image when the number of mails is displayed according to the size of the circle. In the figure, for each thread, a circle of a size corresponding to the number of mails is displayed every quarter. As a result, it is visually determined that threads with larger circles displayed than other threads are threads that have become more topical, and that the time when larger circles are displayed is the time when more topics have been raised. It becomes possible to grasp. Here, a circle with a size corresponding to the number of emails is displayed, but the shape of the email may be a shape other than a circle, and red if the amount of email is large, You may display by a color, such as displaying by the gradation which was made into blue.

図22は、グラフによりメールの件数を表示した場合のスレッド出力イメージである。同図においては、各スレッドについて、4半期毎のメールの件数の推移をグラフで表示している。そして、表示されているグラフにおいて、さらに詳細にメールの件数の推移を見たい場合には、その表示箇所をマウスで指定するなどして、詳細表示対象のスレッドと時期の情報を入力する。出力制御部50の結果表示部52は、スレッドに対応した日付の情報を参照し、詳細表示対象のスレッド及び時期について、現在表示されているよりも短い単位期間毎(1日単位、1週間単位など)のメールの件数をカウントして、グラフ表示する。   FIG. 22 is a thread output image when the number of mails is displayed by a graph. In the figure, the transition of the number of mails in each quarter is displayed in a graph for each thread. In the displayed graph, if you want to see the transition of the number of emails in more detail, specify the display location with the mouse and enter the thread and timing information to be displayed in detail. The result display unit 52 of the output control unit 50 refers to the information of the date corresponding to the thread, and for each thread and time of the detailed display target, each unit period shorter than the currently displayed (one day unit, one week unit) Etc.) is counted and displayed in a graph.

[第3の実施形態]
次に、本発明の第3の実施形態について説明する。上述した実施形態では、人物相関テーブル、重要人物テーブルを作成する際に、メールの送信者あるいは受信者となっているユーザに一律で1ポイントを付与している。しかし、例えば、管理者などは情報を共有できるようメールの宛先に同報者(CC)として設定されることが多く、担当者や実施者などは情報を発信することが多いためメールの送信者となることが多い。そこで、管理者、あるいは、担当者や実施者等のどちらをキーパーソンとして抽出するかに応じて、同報者に設定されている場合の付与ポイント数を高くしたり、あるいは、発信者に設定されている場合の付与ポイント数を高くしたりし、加算ポイントを変更する。つまり、同報者に設定されている場合に付与するポイント数に重み付けすることにより、合計ポイント数が高いユーザを、検索したい内容に関する管理者として選択し、提示することが可能となり、また、発信者に設定されている場合に付与するポイント数に重み付けすることにより、合計ポイント数が高いユーザを、検索したい内容に関する担当者や実施者等の情報発信者として選択し、提示することが可能となる。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. In the above-described embodiment, when the person correlation table and the important person table are created, one point is uniformly given to the user who is the sender or receiver of the mail. However, for example, an administrator or the like is often set as a broadcaster (CC) as an e-mail address so that information can be shared. Often. Therefore, depending on whether the administrator or the person in charge or the person to be executed is extracted as the key person, the number of points granted to the broadcaster is increased or set to the sender. Increase the number of points granted and change the points added. In other words, it is possible to select and present a user with a high total number of points as an administrator regarding the content to be searched by weighting the number of points given when set to the broadcaster. By weighting the number of points to be given when set to a person, it is possible to select and present a user with a high total number of points as an information sender such as a person in charge or a practitioner regarding the content to be searched Become.

第3の実施形態の処理について、第1の実施形態及び第2の実施形態との差分を説明する。
図23は、本実施形態によるメールテーブルの構成を示す図である。同図において、メールテーブルは、メールID、スレッドID、メッセージID、件名、送信者、受信者、同報者、日付、及び、本文のデータからなる複数のレコードにより構成され、図2に示すメールテーブルのレコードに、同報者のデータが追加されたものである。同報者は、メールのCCフィールドに設定されている情報に相当する。
そして、図5に示す第1の実施の形態のスレッド検索処理フローのステップS120において、メール収集部20の分析結果出力部23は、メールテーブルに追加されたレコードの同報者のデータ項目に、読込んだメールのCCフィールドの設定内容をさらに書き込む。
Regarding the processing of the third embodiment, the difference between the first embodiment and the second embodiment will be described.
FIG. 23 is a diagram showing the configuration of the mail table according to the present embodiment. In the figure, the mail table is composed of a plurality of records consisting of mail ID, thread ID, message ID, subject, sender, receiver, broadcaster, date, and body data, and the mail shown in FIG. Broadcaster data is added to the table record. The broadcaster corresponds to the information set in the CC field of the mail.
Then, in step S120 of the thread search processing flow of the first embodiment shown in FIG. 5, the analysis result output unit 23 of the mail collection unit 20 includes the data item of the broadcaster in the record added to the mail table. Write the setting contents of the CC field of the read mail.

図11に示す人物相関テーブル作成処理フローのステップS320において、検索処理部40の検索部42は、ステップS310において読込んだ各レコードについて順に以下を行う。すなわち、送信者−受信者として設定されているユーザの組、送信者−同報者として設定されているユーザの組を抽出し、送信者として設定されているユーザ及び受信者として設定されているユーザの管理者検索対応ポイントに1ポイントを加算し、同報者として設定されているユーザの管理者検索対応ポイントに3ポイントを加算する。また、受信者として設定されているユーザの情報発信者検索対応ポイントに3ポイントを加算し、送信者として設定されているユーザ及び同報者として設定されているユーザの情報発信者検索対応ポイントに1ポイントを加算する。   In step S320 of the person correlation table creation processing flow shown in FIG. 11, the search unit 42 of the search processing unit 40 performs the following in order for each record read in step S310. That is, a user set set as a sender-recipient and a user set set as a sender-broadcaster are extracted and set as a user set as a sender and a receiver. One point is added to the user's manager search correspondence point, and three points are added to the user's manager search correspondence point set as a broadcaster. Also, 3 points are added to the information sender search correspondence point of the user set as the receiver, and the information sender search correspondence point of the user set as the sender and the user set as the broadcaster is added. Add 1 point.

上記のようにして、全ての処理対象スレッドIDについて、ユーザの組の抽出と、管理者検索対応ポイント、情報発信者索対応ポイントの付与を実行すると、ステップS340において、検索部42は、スレッドID毎に、送信者−受信者のユーザの組、送信者−同報者のユーザの組と、これらの組に含まれる各ユーザの管理者検索対応ポイント及び情報発信者索対応ポイントとを示す一覧である人物相関テーブルを生成して記憶する。   As described above, when extraction of a set of users and assignment of an administrator search correspondence point and an information sender search correspondence point are executed for all processing target thread IDs, in step S340, the search unit 42 selects a thread ID. A list showing a sender-recipient user pair, a sender-broadcaster user pair, and an administrator search correspondence point and an information sender search correspondence point of each user included in these pairs. A person correlation table is generated and stored.

図13に示す結果表示処理フローのステップS580において、出力制御部50の結果表示部52は、各スレッドについて抽出したユーザの組を表示する。なお、このとき、複数ユーザ間におけるユーザの組の相関関係を示すようなマトリックス状の関連図を表示するとともに、管理者用検索ポイントのポイント数が最も高いユーザ、または、高い順に所定数のユーザを特定する情報、情報発信者索対応ポイントのポイント数が最も高いユーザ、または、高い順に所定数のユーザを特定する情報も表示する。さらに、結果表示部52は、各ユーザの組について、送信者−受信者の関係、あるいは、送信者−同報者の関係のどの形態が多いかの情報も表示する。   In step S580 of the result display processing flow shown in FIG. 13, the result display unit 52 of the output control unit 50 displays the user set extracted for each thread. In addition, at this time, while displaying a matrix-like relation diagram showing the correlation of a set of users among a plurality of users, the user having the highest number of search points for administrators, or a predetermined number of users in descending order Information for identifying the user, the user with the highest number of information sender search corresponding points, or information for identifying a predetermined number of users in the descending order is also displayed. Further, the result display unit 52 displays information about which form of the sender-receiver relationship or the sender-broadcaster relationship is large for each user pair.

図24は、本実施の形態による人物相関図の表示イメージである。ここでは、管理者用検索ポイントのポイント数が最も高いユーザAを赤色で、情報発信者索対応ポイントのポイント数が最も高いユーザBを青色で表示している。なお、ポイント数が高い順に所定数のユーザを表示する場合は、ポイント数が低くなるに従って色がうすくなるようなグラデーションで表示したり、あるいは、管理者用検索ポイント、情報発信者索対応ポイントをユーザに対応づけて表示したりしてもよい。なお、表示色は任意に選択しうる。また、ユーザの組は矢印で示しているが、矢印の始まりのユーザが送信者、矢印の先のユーザが受信者または同報者である。   FIG. 24 is a display image of a person correlation diagram according to the present embodiment. Here, user A having the highest number of administrator search points is displayed in red, and user B having the highest number of information sender search corresponding points is displayed in blue. In addition, when displaying a predetermined number of users in descending order of the number of points, display in a gradation that the color becomes lighter as the number of points decreases, or search points for managers, information sender search corresponding points It may be displayed in association with the user. The display color can be arbitrarily selected. Moreover, although the group of users is indicated by an arrow, the user at the beginning of the arrow is a sender, and the user at the end of the arrow is a receiver or a broadcaster.

なお、図12に示す重要人物テーブル作成処理フローのステップS420において、検索処理部40の検索部42は、送信者、受信者または同報者として設定されているユーザを抽出し、送信者または受信者として設定されていれば1ポイントを、同報者として設定されていれば3ポイントを管理者検索対応ポイントに加算し、さらに、受信者として設定されていれば3ポイントを、送信者または同報者として設定されていれば1ポイントを情報発信者検索対応ポイントに1ポイントを加算するようにしてもよい。そして、図13の結果表示処理フローのステップS540において、出力制御部50の結果表示部52が、各スレッドについて、管理者検索対応ポイントの多い順番に所定数のユーザを管理者として、情報発信者検索対応ポイントの多い順番に所定数のユーザを情報発信ユーザとして表示する。   In step S420 of the important person table creation processing flow shown in FIG. 12, the search unit 42 of the search processing unit 40 extracts users set as a sender, a receiver, or a broadcaster, and transmits the sender or the receiver. If it is set as a receiver, 1 point is added to the administrator search corresponding point if it is set as a broadcaster, and if it is set as a receiver, 3 points are added to the sender or If it is set as a reporter, 1 point may be added to the information sender search corresponding point. Then, in step S540 of the result display processing flow of FIG. 13, the result display unit 52 of the output control unit 50 sets the information sender as a predetermined number of users as managers in the order of descending points corresponding to the manager search for each thread. A predetermined number of users are displayed as information transmission users in order of the number of search corresponding points.

なお、上記においては、管理者用検索、及び、情報発信者検索の両方を行っているが、どちらか一方を行うことでもよい。また、上述した加算ポイントは一例であり、適宜設定しうる。   In the above, both the manager search and the information sender search are performed, but either one may be performed. Moreover, the addition point mentioned above is an example, and can be set suitably.

[第4の実施形態]
メーリングリストを使用してメールを送信する際は、受信者(To)が同一である。そこで、第4の実施形態では、発信者(From)の情報のみに基づいてポイントを加算する。以下に、第3の実施形態との差分を説明する。
[Fourth Embodiment]
When sending mail using a mailing list, the recipient (To) is the same. Therefore, in the fourth embodiment, points are added based only on the sender (From) information. Hereinafter, differences from the third embodiment will be described.

まず、メール収集部20の図示しない記憶部に、メーリングリストに用いられるメーリングアドレス(mlist@xxx.jp、members@xxx.jpなど)の一覧を予め記憶しておく。また、図25に示すように、メールテーブルのレコードには、メーリングリストフラグのデータが追加される。   First, a list of mailing addresses (mlist@xxx.jp, members@xxx.jp, etc.) used for the mailing list is stored in advance in a storage unit (not shown) of the mail collection unit 20. Also, as shown in FIG. 25, mailing list flag data is added to the mail table record.

図5に示すスレッド検索処理フローのステップS120において、メール収集部20の分析結果出力部23は、読込んだメールのToフィールドの設定内容が、記憶部に保持しているメーリングアドレスに含まれているかを判断する。読込んだメールのToフィールドが、メーリングリストアドレスに含まれている場合は、メールテーブルに追加したレコードのメーリングリストフラグに、メーリングリストであることを示す値を書き込む。   In step S120 of the thread search processing flow shown in FIG. 5, the analysis result output unit 23 of the mail collection unit 20 includes the setting contents of the read To field in the mailing address held in the storage unit. Judgment is made. When the To field of the read mail is included in the mailing list address, a value indicating the mailing list is written in the mailing list flag of the record added to the mail table.

図11に示す人物相関テーブル作成処理フローのステップS320において、検索処理部40の検索部42は、ステップS310において読込んだ各レコードについて順に以下を行う。すなわち、送信者−受信者として設定されているユーザの組、送信者−同報者として設定されているユーザの組を抽出し、抽出した元となったレコードのメーリングリストフラグに、メーリングリストであることを示す値が設定されていない場合は、送信者、受信者、同報者として設定されているユーザそれぞれに、第3の実施形態と同様に管理者検索対応ポイント、情報発信者検索対応ポイントを加算し、メーリングリストであることを示す値が設定されている場合は、送信者として設定されているユーザにのみに管理者検索対応ポイント、情報発信者検索対応ポイントを加算する。   In step S320 of the person correlation table creation processing flow shown in FIG. 11, the search unit 42 of the search processing unit 40 performs the following in order for each record read in step S310. That is, a mailing list is extracted in the mailing list flag of the record from which the set of users set as a sender-recipient and the set of users set as a sender-broadcaster are extracted. In the case where the value indicating is not set, the administrator search corresponding point and the information sender search corresponding point are set to each of the sender, the receiver, and the user set as the broadcaster as in the third embodiment. If a value indicating that the mailing list is set is added, the administrator search corresponding point and the information sender search corresponding point are added only to the user set as the sender.

また、図12に示す重要人物テーブル作成処理フローのステップS420において、検索部42は、抽出した元となったレコードのメーリングリストフラグに、メーリングリストであることを示す値が設定されていなければ、送信者、受信者または同報者として設定されているユーザを抽出し、メーリングリストであることを示す値が設定されている場合は、送信者として設定されているユーザのみを抽出して、それぞれのユーザが抽出された数を当該ユーザのポイント数とする。そして、図13の結果表示処理フローのステップS540において、出力制御部50の結果表示部52が、各スレッドについて、ポイントの多い順番に所定数のユーザを重要人物として表示する。   Further, in step S420 of the important person table creation processing flow shown in FIG. 12, the search unit 42, if a value indicating a mailing list is not set in the mailing list flag of the extracted record that is the origin, , Extract users set as recipients or broadcasters, and if a value indicating mailing list is set, only users set as senders are extracted and each user The extracted number is set as the number of points of the user. Then, in step S540 of the result display process flow of FIG. 13, the result display unit 52 of the output control unit 50 displays a predetermined number of users as important persons in the order of increasing points for each thread.

[第5の実施形態]
第5の実施形態について上述した実施形態との差分を説明する。
説明する。上記の実施形態においては、メールの件名(Subjectフィールド)を形態素解析した結果をキーワードテーブルへ保存している。これは、メールの件名と本文の内容とが一致しているという理想的な場合には正しくキーワード抽出が可能であるが、返信をするときに全く別の内容が本文に書かれてしまうこともある。例えば、件名に「商用サービス展開について」が設定されているメールについては、当初は商用サービス展開に関する話題についての本文が記述されていても、返信を繰り返すうちに、次期社内システムに関する話題が中心の本文が記述されるようになる、などである。そこで、本実施の形態では、キーワードを抽出するための形態素解析の対象を、メールの件名(Subjectフィールド)及び本文とする。
[Fifth Embodiment]
The difference between the fifth embodiment and the above-described embodiment will be described.
explain. In the above embodiment, the result of morphological analysis of the mail subject (Subject field) is stored in the keyword table. This is because it is possible to extract keywords correctly in the ideal case where the subject of the email matches the content of the text, but when replying, completely different content may be written in the text. is there. For example, for emails with “Commercial Service Deployment” set in the subject line, the main topic is about the next in-house system as the reply is repeated, even if the text on the topic related to commercial service deployment is initially written. The body will be described. Therefore, in the present embodiment, the subject of morphological analysis for extracting keywords is the subject (subject field) and body of the mail.

具体的には、図5に示す分析処理フローのステップS180において、メール収集部20のメール分析部22は、メールのSubjectフィールド及び本文の設定内容を形態素解析し、その形態素解析された結果をキーワードとする。そして、メール収集部20の分析結果出力部23は、レコードIDと、スレッドIDと、キーワードとからなるレコードを、分析結果格納部30に記憶されているキーワードテーブルに追加する。   Specifically, in step S180 of the analysis processing flow shown in FIG. 5, the mail analysis unit 22 of the mail collection unit 20 performs a morphological analysis on the setting contents of the subject field and body of the mail, and uses the result of the morphological analysis as a keyword. And Then, the analysis result output unit 23 of the mail collection unit 20 adds a record including a record ID, a thread ID, and a keyword to the keyword table stored in the analysis result storage unit 30.

しかし、このように本文についても形態素解析を行ってキーワードとした場合、解析対象が拡大するため、キーワードテーブルに登録されるキーワードの量が増加してしまう。そこで、以下のようなキーワードのフィルタリング処理を行う。すなわち、Subjectフィールドと本文について形態素解析を行った結果から、キーワードとして適切な品詞の文字列、例えば、一般名詞・動詞のみをキーワード候補として残し、さらに、そのキーワード候補として残った中から、キーワードとして不適切な文字列を削除して、最終的に残った文字列をキーワードとして登録する。なお、この削除すべき文字列は、例えば、どのような話題において使われうるような単語『下記』『頂く』『都合』『少し』などであり、例えばメール収集部20に図示しない記憶手段に予め記憶しておく。このようなキーワードのフィルタリング処理を行うことにより、より重要、かつ、特徴的なキーワードのみをキーワードテーブルに格納することができる。   However, when the morphological analysis is performed on the text as keywords as described above, the number of keywords registered in the keyword table increases because the analysis target is expanded. Therefore, the following keyword filtering process is performed. That is, from the result of morphological analysis on the Subject field and the text, leave only the appropriate part-of-speech character string as a keyword, for example, a general noun / verb as a keyword candidate. Delete inappropriate character strings and register the remaining character strings as keywords. The character string to be deleted is, for example, the words “below”, “get”, “convenient”, “a little”, etc. that can be used in any topic. Store in advance. By performing such keyword filtering processing, only more important and characteristic keywords can be stored in the keyword table.

[第6の実施形態]
図26は、本発明の第6の実施形態による検索支援装置1aの機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、図1に示す第1の実施形態による検索支援装置1と同一の部分には同一の符号を付し、その説明を省略する。図26に示す検索支援装置1aが図1に示す第1の実施形態による検索支援装置1と異なる点は、人物情報格納部60をさらに備える点、メール収集部20が人物情報生成部24をさらに備える点、検索処理部40が人物情報読込み部44をさらに備える点である。また、ここでは、出力制御部50が、検索者のコンピュータ端末であるとし、キーボードなどの入力装置から検索ワードの入力を受けるための検索文書受付部53をさらに備えるものとする。
以下、第1の実施形態との差分について説明する。
[Sixth Embodiment]
FIG. 26 is a functional block diagram of the search support apparatus 1a according to the sixth embodiment of the present invention, in which only functional blocks related to the present invention are extracted and shown. In this figure, the same parts as those in the search support apparatus 1 according to the first embodiment shown in FIG. The search support apparatus 1a shown in FIG. 26 is different from the search support apparatus 1 according to the first embodiment shown in FIG. The search processing unit 40 further includes a person information reading unit 44. Here, it is assumed that the output control unit 50 is a searcher's computer terminal, and further includes a search document reception unit 53 for receiving an input of a search word from an input device such as a keyboard.
Hereinafter, differences from the first embodiment will be described.

メール収集部20の人物情報生成部24は、メール読込み部21により読み出された電子メールのデータを分析し、メールアドレスと、当該メールアドレスの人物の名前の対応を抽出して、人物情報格納部60が保持する人物テーブルに書き込む。検索処理部40の人物情報読み込み部44は、人物情報格納部60の保持する人物テーブルから、メールアドレスに対応した名前の情報を読み出す。なお、人物情報格納部60は、データベースサーバなどにより実現することができる。   The person information generation unit 24 of the mail collection unit 20 analyzes the email data read by the mail reading unit 21, extracts the correspondence between the mail address and the person's name at the mail address, and stores the person information. The data is written in the person table held by the unit 60. The person information reading unit 44 of the search processing unit 40 reads the name information corresponding to the mail address from the person table held in the person information storage unit 60. The person information storage unit 60 can be realized by a database server or the like.

次に、本実施形態による検索支援装置1aが保持する各データについて説明する。
本実施形態による分析結果格納部30に格納されるメールテーブル、スレッドテーブル、キーワードテーブルは、図2、図3、図4に示す第1の実施形態のメールテーブル、スレッドテーブル、キーワードテーブルと同様である。なお、本実施形態においては、メールテーブルの各レコードの送信者、受信者のデータ項目に、送信者、受信者の識別情報として、Fromフィールド、Toフィールドに設定されている送信者、受信者のメールアドレスが設定される場合を例に説明する。
Next, each data held by the search support apparatus 1a according to the present embodiment will be described.
The mail table, thread table, and keyword table stored in the analysis result storage unit 30 according to the present embodiment are the same as the mail table, thread table, and keyword table of the first embodiment shown in FIGS. is there. In this embodiment, the sender and receiver data items of each record in the mail table include the sender and recipient identification information as the sender and receiver identification information in the From field and To field. A case where an email address is set will be described as an example.

図27は、人物情報格納部60に格納される人物テーブルの構成を示す図である。同図において、人物テーブルは、メールアドレスと、当該メールアドレスに対応した人物名とのデータからなる複数のレコードにより構成される。人物テーブルのメールアドレスには、メールのFromフィールドに設定されているメールアドレスが格納され、人物テーブルの人物名には、人物情報生成部24によりメールの本文から抽出された人物名が設定される。   FIG. 27 is a diagram illustrating a configuration of a person table stored in the person information storage unit 60. In the figure, the person table is composed of a plurality of records including data of mail addresses and person names corresponding to the mail addresses. The mail address set in the From field of the mail is stored in the mail address of the person table, and the person name extracted from the body of the mail by the person information generating unit 24 is set in the person name of the person table. .

次に、検索支援装置1aにおける処理フローを説明する。
メール収集部20における分析処理フローは、図5に示すメール収集部20における分析処理フローと同様である。
Next, a processing flow in the search support apparatus 1a will be described.
The analysis processing flow in the mail collection unit 20 is the same as the analysis processing flow in the mail collection unit 20 shown in FIG.

図28は、人物情報生成部24の人物情報生成処理フローである。
まず、メール収集部20のメール読込み部21は、まだこの人物情報生成処理フローによる人物情報生成処理を行っていないメールをメール記憶部10としてのメールサーバから読込む(ステップS810)。人物情報生成部24は、ステップS810において読込んだメールのメール本文のフィールドから、先頭より所定行まで、例えば、5行目までの内容を読み出す(ステップS820)。なお、各行は改行の記号により区切られているものとする。人物情報生成部24は、ステップS820において読み出した5行のうち、「〜です」と記述された行を正規表現で検索し、その「です」が含まれる行から、「です」の直前までの文章を抽出する(ステップS830)。このとき、「伊藤です」など、メール内で自己紹介をしている行を抽出し、「お疲れ様です」、「おつかれさまです」などの誤抽出を避けるため、「〜様です」、「〜さまです」の表現が使用される行については抽出しない。また、「〜です」の他にも、「〜と申します」等の自己紹介の表現に用いられる語句をキーワードとして用い、当該キーワードが含まれる行から文章を切り出しても良い。
FIG. 28 is a person information generation process flow of the person information generation unit 24.
First, the mail reading unit 21 of the mail collection unit 20 reads a mail that has not yet been subjected to the personal information generation process according to the personal information generation process flow from the mail server as the mail storage unit 10 (step S810). The person information generation unit 24 reads the content from the head to the predetermined line, for example, the fifth line from the mail body field of the mail read in step S810 (step S820). Each line is separated by a line feed symbol. The person information generation unit 24 searches for a line described as “to is” in the five lines read out in step S820 by using a regular expression, and from the line including “is” to immediately before “is”. A sentence is extracted (step S830). At this time, in order to avoid misextraction such as "Thank you for your work" and "I am delighted", I will extract lines that introduce myself in the email, such as "I am Ito". Do not extract lines that use the expression "is." In addition to “~”, a phrase used for the expression of self-introduction such as “I say ~” may be used as a keyword, and a sentence may be cut out from a line including the keyword.

次に、人物情報生成部24は、空白文字、句読点、記号を区切り文字として、その前、または後に出現する語句を抽出する(ステップS840)。これにより、組織名や挨拶を述べた部分に続いて名前が存在する場合に、不要な部分を除去することができる。例えば、「開発担当 伊藤です」という行の場合、ステップS830において「開発担当 伊藤」が抽出され、スペースを区切り文字として、スペースの後ろの語句「伊藤」を抽出する。「伊藤@開発担当です」という行の場合、ステップS830において「開発担当@伊藤」が抽出され、記号(@)を区切り文字として、その記号の前の語句「伊藤」を抽出する。あるいは、「開発担当、伊藤です」という行の場合、テップS830において「開発担当、伊藤」が抽出され、句読点(、)を区切り文字として、その句読点の後ろの「伊藤」を抽出する。なお、区切り文字がない行については、ステップS830において抽出された文書をそのままを抽出する。   Next, the person information generation unit 24 extracts words that appear before or after the blank character, punctuation mark, and symbol as delimiters (step S840). As a result, when a name is present following the part where the organization name or greeting is stated, an unnecessary part can be removed. For example, in the case of the line “Ide is in charge of development”, “development Ito” is extracted in step S830, and the word “Ito” after the space is extracted with the space as a delimiter. In the case of the line “Ito @ development in charge”, “development in charge @ Ito” is extracted in step S830, and the word “Ito” before the symbol is extracted with the symbol (@) as a delimiter. Alternatively, in the case of the line “I am in charge of development”, “development in charge, Ito” is extracted in step S830, and “Ito” after the punctuation mark is extracted with the punctuation mark (,) as a delimiter. Note that for a line without a delimiter, the document extracted in step S830 is extracted as it is.

続いて、人物情報生成部24は、ステップS840において抽出された文書について形態素解析を行い、固有名詞として品詞分類される語句(A)を選択する(ステップS850)。このように、品詞が固有名詞であるものが人名の候補であるというルール付けを行うことにより、名前以外の言葉であるノイズを除去する。人物情報生成部24は、メールヘッダのFromフィールドから、送信者のメールアドレス(B)を取得すると(ステップS860)、ステップS850において選択した語句(A)と、ステップS860において取得したメールアドレス(B)とを、人物情報生成部24が備える図示しない記憶手段に一時的に記憶する(ステップS870)。   Subsequently, the person information generation unit 24 performs morphological analysis on the document extracted in step S840, and selects a phrase (A) classified as part of speech as a proper noun (step S850). In this way, by making a rule that a part of speech is a proper noun is a candidate for a person name, noise that is a word other than a name is removed. When the person information generation unit 24 acquires the sender's mail address (B) from the From field of the mail header (step S860), the person / phrase (A) selected in step S850 and the mail address (B) acquired in step S860 are obtained. ) Is temporarily stored in a storage unit (not shown) included in the person information generation unit 24 (step S870).

続いて、メール読込み部21が、メール記憶部10としてのメールサーバに、まだ人物情報生成処理を行っていないメールがあるかを判断する(ステップS880)。まだ、人物情報生成処理していないメールがある場合には(ステップS880:YES)、ステップS810に戻り、上述した処理を繰り返す。そして、メール記憶部10に人物情報生成処理していないメールがなくなった場合(ステップS880:NO)、ステップS870において記憶していたメールアドレス(B)と語句(A)との組から人物テーブル登録対象の組を抽出する。具体的には、あるメールアドレス(B)について、同一の語句(A)との組のみが記憶されている場合、そのメールアドレス(B)と語句(A)との組を、人物テーブル登録対象の組として抽出する。一方、同一のメールアドレス(B)について、異なる語句(A)との組み合わせが記憶されている場合、最も出現頻度が高い語句(A)を、当該メールアドレス(B)に対応した送信者の名前を示す語句(A)であると判断し、人物テーブル登録対象の組として抽出する。例えば、メールアドレス「user@srv.jp」と語句「伊藤」との組が3組、メールアドレス「user@srv.jp」と語句「日本」との組が1組、メールアドレス「user@srv.jp」と語句「関西」との組が1組記憶されている場合、最も出現率の高い語句「伊藤」がメールアドレス「user@srv.jp」の送信者の名前を示す語句であると判断し、メールアドレス「user@srv.jp」と語句「伊藤」との組を抽出する。人物情報生成部24は、抽出したメールアドレス(B)と語句(A)の組を設定したレコードを、人物情報格納部60が記憶する人物テーブルに追加する(ステップS890)。   Subsequently, the mail reading unit 21 determines whether there is a mail that has not yet been subjected to the personal information generation process in the mail server as the mail storage unit 10 (step S880). If there is an e-mail that has not yet undergone the personal information generation process (step S880: YES), the process returns to step S810 and the above-described process is repeated. Then, when there is no mail in the mail storage unit 10 that has not undergone personal information generation processing (step S880: NO), the person table registration is performed from the combination of the mail address (B) and the phrase (A) stored in step S870. Extract the target set. Specifically, when only a set of the same word (A) is stored for a certain mail address (B), the set of the mail address (B) and the word (A) is set as a person table registration target. Extract as a pair. On the other hand, when a combination with a different phrase (A) is stored for the same email address (B), the most frequently occurring phrase (A) is the name of the sender corresponding to the email address (B). Is extracted as a person table registration target set. For example, three pairs of email address “user@srv.jp” and the phrase “Ito”, one pair of email address “user@srv.jp” and the phrase “Japan”, and email address “user @ srv” .jp ”and the phrase“ Kansai ”are stored, and the phrase“ Ito ”with the highest appearance rate is a phrase indicating the name of the sender of the email address“ user@srv.jp ” Judgment is made, and a set of the mail address “user@srv.jp” and the phrase “Ito” is extracted. The person information generation unit 24 adds a record in which the set of the extracted mail address (B) and the phrase (A) is set to the person table stored in the person information storage unit 60 (step S890).

本実施の形態による分析処理フロー(図5)及び人物情報生成処理フロー(図28)の処理を具体的なデータ例を用いて説明する。
図29はメール記憶部10から読込んだ各メールの例を、図30は図29で示されるメールから生成されるメールテーブルの例を、図31は図29で示されるメールから生成されるスレッドテーブルの例を、図32は図29で示されるメールから生成されるキーワードテーブルの例を、図33は図29で示されるメールから生成される人物テーブルの例を示す。
The analysis processing flow (FIG. 5) and person information generation processing flow (FIG. 28) according to the present embodiment will be described using specific data examples.
29 shows an example of each mail read from the mail storage unit 10, FIG. 30 shows an example of a mail table generated from the mail shown in FIG. 29, and FIG. 31 shows a thread generated from the mail shown in FIG. FIG. 32 shows an example of a table, FIG. 32 shows an example of a keyword table generated from the mail shown in FIG. 29, and FIG. 33 shows an example of a person table generated from the mail shown in FIG.

最初に、メールM1a(図29)が読込まれた場合のメールテーブル(図30)、スレッドテーブル(図31)、及び、キーワードテーブル(図32)の設定処理は、第1の実施形態のメールM1(図6)からメールテーブル(図7)、スレッドテーブル(図8)、及び、キーワードテーブル(図9)を設定する処理と同様のため省略する。
メールテーブル、スレッドテーブル、及び、キーワードテーブルの設定後、メールM1aの本文に設定されている最初の5行、1行目「別所さま」、2行目「開発部の安部です。」、3行目「お世話になっております。」、4行目「昨日お送りしたファイルの中身に」、5行目「一部誤りがございましたので」が取得される(図28、ステップS820)。そして、「〜です」と記述された行である2行目から、「です」の直前までの文章「開発部の安部」が抽出される(図28、ステップS830)。抽出された文書には区切り文字が含まれていないため、そのまま形態素解析が行なわれ、「開発部」と「安部」が抽出され、そのうち固有名詞である「安部」が人物名の候補として選択される(図28、ステップS840、S850)。そして、メールM1aから取得したFrom「userA@svr.jp」と(図28、ステップS860)、人物名の候補として選択された「安部」とが対応づけられて一時的に記憶される(図28、ステップS870)。
First, the setting process of the mail table (FIG. 30), thread table (FIG. 31), and keyword table (FIG. 32) when the mail M1a (FIG. 29) is read is the same as the mail M1 of the first embodiment. Since the processing is the same as that for setting the mail table (FIG. 7), thread table (FIG. 8), and keyword table (FIG. 9) from FIG.
After setting the mail table, thread table, and keyword table, the first five lines set in the body of the mail M1a, the first line “Bessho”, the second line “Abe of the development department.”, 3 lines The item “Thank you for your attention”, the fourth line “in the contents of the file sent yesterday”, the fifth line “Because there was some error” (FIG. 28, step S820). Then, the sentence “Abe of the development department” immediately before “is” is extracted from the second line, which is a line describing “to be” (FIG. 28, step S830). Since the extracted document does not contain delimiters, morphological analysis is performed as it is, and “development department” and “Abe” are extracted, and the proper noun “Abe” is selected as a candidate for the person name. (FIG. 28, steps S840 and S850). Then, From “userA@svr.jp” acquired from the mail M1a (FIG. 28, step S860) and “Abe” selected as the candidate for the person name are associated with each other and temporarily stored (FIG. 28). Step S870).

続いて、メールM2a(図29)が読込まれた場合のメールテーブル(図30)、スレッドテーブル(図31)、及び、キーワードテーブル(図32)の設定処理は、第1の実施形態のメールM2(図6)からメールテーブル(図7)、スレッドテーブル(図8)、及び、キーワードテーブル(図9)を設定する処理と同様のため省略する。
メールテーブル、スレッドテーブル、及び、キーワードテーブルの設定後、メールM2aの本文に設定されている最初の5行が取得されるが、ここでは、本文は4行までであるため、その4行を取得する(図28、ステップS820)。そして、「〜様です」が含まれる行を除き、「〜です」と記述された1行目から、「です」の直前までの文章「システム部の別所」が抽出される(図28、ステップS830)。抽出された文書には区切り文字が含まれていないため、そのまま形態素解析を行なって「システム部」と「別所」が抽出され、そのうち固有名詞である「別所」が人物名の候補として選択される(図28、ステップS840、S850)。そして、メールM2aから取得したFrom「userB@svr.jp」と(図28、ステップS860)、人物名の候補として選択された「別所」とが対応づけられて一時的に記憶される(図28、ステップS870)。
Subsequently, the setting process of the mail table (FIG. 30), thread table (FIG. 31), and keyword table (FIG. 32) when the mail M2a (FIG. 29) is read is the same as the mail M2 of the first embodiment. Since the processing is the same as that for setting the mail table (FIG. 7), thread table (FIG. 8), and keyword table (FIG. 9) from FIG.
After setting the mail table, thread table, and keyword table, the first 5 lines set in the body of the mail M2a are acquired, but here the body is limited to 4 lines, so that 4 lines are acquired. (FIG. 28, step S820). Then, except for the line that contains "~ sama is", the text "Between the system part" is extracted from the first line described as "~ is" immediately before "is" (Fig. 28, step) S830). Since the extracted document does not contain a delimiter, morphological analysis is performed as it is to extract “system part” and “Bessho”, and the proper noun “Bessho” is selected as a candidate for a person name. (FIG. 28, step S840, S850). Then, From “userB@svr.jp” acquired from the mail M2a (FIG. 28, step S860) and “Bessho” selected as a candidate for the person name are associated with each other and temporarily stored (FIG. 28). Step S870).

このようにして、図29に示すメールM1〜M8について図28の処理を行った結果が、図30に示すメールテーブル、図31に示すスレッドテーブル、図32に示すキーワードテーブルであり、一時記憶に記憶されたメールアドレスと選択した人物名との組から、図28のステップS890の処理を行った結果が図33に示す人物テーブルである。   The result of performing the processing of FIG. 28 on the mails M1 to M8 shown in FIG. 29 is the mail table shown in FIG. 30, the thread table shown in FIG. 31, and the keyword table shown in FIG. The result of performing the process of step S890 of FIG. 28 from the set of the stored mail address and the selected person name is the person table shown in FIG.

次に、検索が要求された場合の処理について示す。
検索処理部40のクエリ受付部41が、結果表示部50が入力を受けた検索ワードを読込んだ以降の処理フローは、第1の実施形態の図10〜図12と同様である。
Next, processing when a search is requested will be described.
The processing flow after the query receiving unit 41 of the search processing unit 40 reads the search word received by the result display unit 50 is the same as in FIGS. 10 to 12 of the first embodiment.

図34は、出力制御部50の結果表示処理フローを示す。同図において、ステップS910〜S980までの処理は、第1の実施形態の図13のステップS510〜S580と同様である。ただし、ステップS940において、結果表示部52は、各スレッドについて、重要人物テーブルで示されるユーザのメールアドレスのうち、ポイント数の多い順番に所定数のユーザのメールアドレスを重要人物のメールアドレスとして抽出する。そして、抽出した各スレッドの重要人物のメールアドレスを、その重要人物のメールアドレスに対応したポイント数とともに表示する。また、ステップS980において、結果表示部52は、各スレッドについて、人物相関テーブルで示される送信者メールアドレスと受信者メールアドレスの組のうち、ポイント数の多い順番に所定数の組を抽出する。そして、各スレッドについて抽出した送信者メールアドレスと受信者メールアドレスの組を、その送信者メールアドレスと受信者メールアドレス送受信者の組のポイント数に対応したポイント数とともに表示する。   FIG. 34 shows a result display processing flow of the output control unit 50. In the figure, the processes from step S910 to S980 are the same as steps S510 to S580 of FIG. 13 of the first embodiment. However, in step S940, the result display unit 52 extracts, for each thread, a predetermined number of user e-mail addresses as important person e-mail addresses in descending order of the number of user e-mail addresses indicated in the important person table. To do. Then, the mail address of the important person of each extracted thread is displayed together with the number of points corresponding to the mail address of the important person. In step S980, the result display unit 52 extracts, for each thread, a predetermined number of pairs in the descending order of the number of points from the set of the sender email address and the recipient email address shown in the person correlation table. Then, the set of the sender mail address and the receiver mail address extracted for each thread is displayed together with the number of points corresponding to the number of points of the pair of the sender mail address and the receiver mail address sender / receiver.

続いて、人物名の表示が必要であることが設定されている場合(ステップS990:YES)、検索結果読込み部51は、ステップS910において検索結果として読込んだ人物相関テーブルの送信者メールアドレス及び受信者メールアドレスの組に設定されているメールアドレス、重要人物テーブルに設定されているユーザのメールアドレス、または、現在画面に表示させているメールアドレスを検索処理部40に出力し、人物名の情報を要求する。   Subsequently, when it is set that display of the person name is necessary (step S990: YES), the search result reading unit 51 and the sender mail address of the person correlation table read as the search result in step S910 and The mail address set in the recipient mail address group, the user mail address set in the important person table, or the mail address currently displayed on the screen is output to the search processing unit 40, and the person name Request information.

検索処理部40の人物情報読込み部44は、人物情報格納部60に記憶されている人物テーブルから、受信したメールアドレスに対応した人物名の情報を読み出すと、当該メールアドレスと人物名とを関連づけて人物名検索結果を検索処理部40に返送する。検索結果読込み部51が、人物情報読込み部44から出力される人物名検索結果を受信すると、結果表示部52は、メールアドレスの表示に対応づけて、人物名検索結果により示される、当該メールアドレスに関連付けられた人物名を表示する(ステップS1000)。   When the person information reading unit 44 of the search processing unit 40 reads information on the person name corresponding to the received mail address from the person table stored in the person information storage unit 60, the person information reading unit 44 associates the mail address with the person name. The person name search result is returned to the search processing unit 40. When the search result reading unit 51 receives the person name search result output from the person information reading unit 44, the result display unit 52 correlates with the display of the mail address, and the mail address indicated by the person name search result. The person name associated with is displayed (step S1000).

なお、ステップS910において、検索結果にあわせて、当該検索結果に含まれる人物相関テーブルの送信者メールアドレス及び受信者メールアドレスの組に設定されているメールアドレス、重要人物テーブルに設定されているユーザのメールアドレスに関連付けられた人物名を示す人物名検索結果を予め、検索結果処理部40から受信しておくことでもよい。   Note that in step S910, in accordance with the search result, the mail address set in the combination of the sender mail address and the receiver mail address of the person correlation table included in the search result, the user set in the important person table A person name search result indicating a person name associated with the e-mail address may be received from the search result processing unit 40 in advance.

上述した検索処理部40の処理、及び、出力制御部50の処理を具体的なデータ例を用いて説明する。
図35はメールテーブルの例を、図36はスレッドテーブルの例を、図37はキーワードテーブルの例を、図38は人物テーブルの例を示す図であり、クエリ受付部41が検索キーワード読込む前に設定されているものとする。また、検索キーワードとして「販売」が入力されるとする。このとき作成される人物相関テーブル及び重要人物テーブルを図39に示す。
The processing of the search processing unit 40 and the processing of the output control unit 50 described above will be described using specific data examples.
35 shows an example of a mail table, FIG. 36 shows an example of a thread table, FIG. 37 shows an example of a keyword table, and FIG. 38 shows an example of a person table, before the query receiving unit 41 reads a search keyword. It is assumed that it is set to. Further, it is assumed that “sales” is input as a search keyword. FIG. 39 shows the person correlation table and the important person table created at this time.

スレッド検索処理において、検索キーワードが読込まれると(図10、ステップS210)、キーワードテーブル(図37)に設定されているスレッドIDが順に選択される(図10、ステップS220)。スレッドID「116」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「340」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2006/7/1 15:12」が読込まれ、スレッドID「116」と対応付けて記憶される(図10、ステップS240、S250)。   In the thread search process, when a search keyword is read (FIG. 10, step S210), thread IDs set in the keyword table (FIG. 37) are sequentially selected (FIG. 10, step S220). When the thread ID “116” is selected, a record (record ID “340”) in which the search word “sales” is set as a keyword from a record in the keyword table (FIG. 37) in which the thread ID is set. It is detected (FIG. 10, step S230). The start date and time “2006/7/1 15:12” corresponding to the thread ID is read and stored in association with the thread ID “116” (FIG. 10, steps S240 and S250).

次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「372」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2007/1/7 13:10」が読込まれ、スレッドID「120」と対応付けて記憶される(図10、ステップS240、S250)。   Next, when the thread ID “120” is selected, a record (record ID “372”) in which the search word “sales” is set as a keyword from a record of the keyword table (FIG. 37) in which the thread ID is set. ") Is detected (FIG. 10, step S230). Then, the start date and time “2007/1/7 13:10” corresponding to the thread ID is read and stored in association with the thread ID “120” (FIG. 10, steps S240 and S250).

次に、スレッドID「144」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)には、検索ワード「販売」がキーワードとして設定されているレコードがないことが検出される(図10、ステップS230)。
これにより、処理対象スレッドID「116」、「120」と、それぞれの開始日時「2006/7/1 15:12」、「2007/1/7 13:10」が記憶される(図10、ステップS250)。
Next, when the thread ID “144” is selected, it is detected that there is no record in which the search word “sales” is set as a keyword in the keyword table (FIG. 37) in which the thread ID is set. (FIG. 10, step S230).
As a result, the processing target thread IDs “116” and “120” and the start dates and times “2006/7/1 15:12” and “2007/1/7 13:10” are stored (FIG. 10, step). S250).

続いて、人物相関テーブル作成処理(図11)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「500」〜「506」)が特定される(図11、ステップS310)。図39に示すように、この特定されたレコードの送信者メールアドレスと受信者メールアドレスの情報から、「userA@svr.jpとuserB@svr.jp」、「userA@svr.jpとuserC@svr.jp」、「userA@svr.jpとuserD@svr.jp」、「userA@svr.jpとuserE@svr.jp」、「userB@svr.jpとuserE@svr.jp」の組が抽出され、それらの組が抽出された数はそれぞれ「4」、「2」、「2」、「2」、「3」である(図11、ステップS320)。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「507」〜「511」)を特定する(図11、ステップS310)。図39に示すように、この特定されたレコードの送信者メールアドレスと受信者メールアドレスの情報から、「userA@svr.jpとuserB@svr.jp」、「userA@svr.jpとuserC@svr.jp」、「userA@svr.jpとuserD@svr.jp」、「userA@svr.jpとuserE@svr.jp」の組が抽出され、それらの組が抽出された数はそれぞれ「2」、「2」、「3」、「1」である(図11、ステップS320)。
これにより、各スレッドID毎に、これらの抽出されたユーザのメールアドレスの組と、その組の抽出数に対応したポイントとを示す人物相関テーブル(図39)が生成される(図11、ステップS340)。ここでは、抽出数1を1ポイントとしている。
Subsequently, a person correlation table creation process (FIG. 11) is started, and process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 11, step S310). As shown in FIG. 39, “userA@svr.jp and userB@svr.jp”, “userA@svr.jp and userC @ svr” are obtained from information of the sender mail address and the receiver mail address of the specified record. .jp "," userA@svr.jp and userD@svr.jp "," userA@svr.jp and userE@svr.jp ", and" userB@svr.jp and userE@svr.jp " The numbers extracted from these sets are “4”, “2”, “2”, “2”, and “3”, respectively (FIG. 11, step S320).
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 11, step S310). ). As shown in FIG. 39, “userA@svr.jp and userB@svr.jp”, “userA@svr.jp and userC @ svr” are obtained from information of the sender mail address and the receiver mail address of the specified record. .jp ”,“ userA@svr.jp and userD@svr.jp ”,“ userA@svr.jp and userE@svr.jp ”are extracted, and the number of these extracted groups is“ 2 ”. , “2”, “3”, “1” (FIG. 11, step S320).
As a result, for each thread ID, a person correlation table (FIG. 39) is generated that shows a set of the extracted mail addresses of the users and points corresponding to the number of extractions of the set (FIG. 11, step). S340). Here, the extraction number 1 is 1 point.

続いて、重要人物テーブル作成処理(図12)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「500」〜「506」)が特定される(図12、ステップS410)。図39に示すように、この特定されたレコードの送信者メールアドレスまたは受信者メールアドレスに設定されているユーザのメールアドレスとして、「userA@svr.jp」、「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」が抽出され、その抽出したユーザのメールアドレスの登場回数「10」、「7」、「2」、「2」、「5」が計測される。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「507」〜「511」)が特定される(図12、ステップS420)。図39に示すように、この特定されたレコードの送信者メールアドレスまたは受信者メールアドレスに設定されているユーザのメールアドレスとして、「userA@svr.jp」、「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」が抽出され、その抽出したユーザのメールアドレスの登場回数「8」、「2」、「2」、「3」、「1」が計測される。
これにより、各スレッドID毎に、これらの抽出されたユーザのメールアドレスと、その登場回数に対応したポイントとを示す重要人物テーブルが生成される(図12、ステップS440)。なお、ここでは、登場回数1回を1ポイントとしている。
Subsequently, the important person table creation process (FIG. 12) is started, and the process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 12, step S410). As shown in FIG. 39, as user email addresses set in the sender email address or recipient email address of this identified record, “userA@svr.jp”, “userB@svr.jp”, “ “userC@svr.jp”, “userD@svr.jp”, “userE@svr.jp” are extracted, and the number of appearances of the extracted user's mail address is “10”, “7”, “2”, “2” ”And“ 5 ”are measured.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 12, step). S420). As shown in FIG. 39, as user email addresses set in the sender email address or recipient email address of this identified record, “userA@svr.jp”, “userB@svr.jp”, “ “userC@svr.jp”, “userD@svr.jp”, “userE@svr.jp” are extracted, and the number of appearances of the extracted user's email address is “8”, “2”, “2”, “3” "," 1 "is measured.
Thereby, for each thread ID, an important person table indicating these extracted user mail addresses and points corresponding to the number of appearances is generated (FIG. 12, step S440). Here, the number of appearances is 1 point.

図40は、図39に示す重要人物テーブルに基づいた重要人物出力イメージであり、時系列にスレッドを並べて表示したイメージを示す。ここでは、重要人物は、ポイント数が高い順に3人としている。なお、所定のポイント数以上などとすることもでき、この条件は予め出力制御部50に記憶されるか、ユーザにより入力される。
図40においては、重要人物テーブル(図39)に含まれるスレッドID「116」、「120」を、これらの開始日時「2006/07/01 15:12」、「2007/07/08 23:11」に対応した時間軸上に、時系列で表示している。そして、スレッドID「116」については、ポイント数が高い順に「userA@svr.jp」、「userB@svr.jp」、「userE@svr.jp」が表示され、スレッドID「120」については、ポイント数が高い順に「userA@svr.jp」、「userD@svr.jp」、「userB@svr.jp」、「userC@svr.jp」が表示されている。なお、「userB@svr.jp」と「userC@svr.jp」はポイント数が同じため、両者を表示しているものである。
FIG. 40 is an important person output image based on the important person table shown in FIG. 39, and shows an image in which threads are displayed in time series. Here, there are three important persons in descending order of the number of points. Note that the number of points may be equal to or greater than a predetermined number, and the condition is stored in advance in the output control unit 50 or input by the user.
In FIG. 40, the thread IDs “116” and “120” included in the important person table (FIG. 39) are assigned the start dates and times “2006/07/01 15:12” and “2007/07/08 23:11”. On the time axis corresponding to “”. For the thread ID “116”, “userA@svr.jp”, “userB@svr.jp”, “userE@svr.jp” are displayed in descending order of the number of points, and for the thread ID “120”, “UserA@svr.jp”, “userD@svr.jp”, “userB@svr.jp”, and “userC@svr.jp” are displayed in descending order of the number of points. Since “userB@svr.jp” and “userC@svr.jp” have the same number of points, both are displayed.

図41は、図39に示す重要人物テーブルに基づいた、検索時期を指定したときの重要人物及び人物相関図の表示イメージを示す。ここでは、2006年が指定されとする。なお、検索時期の条件は、ユーザにより入力されるものとする。
出力制御部50の結果表示部52は、重要人物テーブル(図39)に含まれるスレッドID「116」、「120」のうち、開始日時が2006年であるスレッドID「116」を選択する。そして、スレッドID「116」については、重要人物として、ポイント数が高い順に「userA@svr.jp」、「userB@svr.jp」、「userE@svr.jp」を、そのポイント数とともに表示する。また、人物相関テーブル(図39)から、当該スレッドIDに対応して、重要人物としてのポイント数が最も高い「userA@svr.jp」が含まれる送受信の組と、そのポイント数を読込む。そして、ポイント数が最も高い「userA@svr.jp」を中心として、送受信の組となる各ユーザのメールアドレス「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」をその周囲に表示するとともに、「userA@svr.jp」と各ユーザのメールアドレス「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」との間に、ポイント数を表示し、そのポイント数に対応した太さの線を描画する。なお、表示する送受信者のメールアドレスの組をポイント数の多い組から所定数としてもよく、所定のポイント数以上の送受信の組を表示するようにしてもよい。
FIG. 41 shows a display image of the important person and the person correlation diagram when the search time is designated based on the important person table shown in FIG. Here, 2006 is designated. The search time condition is input by the user.
The result display unit 52 of the output control unit 50 selects the thread ID “116” whose start date and time is 2006 among the thread IDs “116” and “120” included in the important person table (FIG. 39). For the thread ID “116”, “userA@svr.jp”, “userB@svr.jp”, “userE@svr.jp” are displayed together with the number of points as the important person in descending order of the number of points. . Further, from the person correlation table (FIG. 39), the transmission / reception set including “userA@svr.jp” having the highest number of points as an important person and the number of points corresponding to the thread ID are read. And, centering on “userA@svr.jp” with the highest number of points, the email addresses of each user who will be sending and receiving “userB@svr.jp”, “userC@svr.jp”, “userD@svr.jp” ”And“ userE@svr.jp ”are displayed around it, and“ userA@svr.jp ”and the email addresses of each user“ userB@svr.jp ”,“ userC@svr.jp ”,“ userD @ svr ” The number of points is displayed between “.jp” and “userE@svr.jp”, and a line with a thickness corresponding to the number of points is drawn. It should be noted that the set of mail addresses of the sender / receiver to be displayed may be a predetermined number from a group having a large number of points, or a group of transmissions / receptions having a predetermined point number or more may be displayed.

図42は、検索画面の全体イメージを示す図である。同図においては、人物名の表示を指示するためのチェックボックスに、チェックが入っていない。このとき、検索画面には、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物のメールアドレス、人物相関図と人物相関図に含まれる人物のメールアドレス、及び、各スレッドに送信者または受信者として登場したユーザのメールアドレスの一覧とそのポイント数が表示されている。   FIG. 42 shows an overall image of the search screen. In the figure, the check box for instructing the display of the person name is not checked. At this time, the search screen includes a field for entering a search word, a thread arranged in chronological order and the mail address of the important person, the mail address of the person included in the person correlation chart and the person correlation chart, and the transmission to each thread. A list of e-mail addresses of users who have appeared as subscribers or recipients and the number of points are displayed.

図43は、人物名の表示を指示するためのチェックボックスに、チェックが入っているときの検索画面の全体イメージを示す図である。このとき、検索画面には、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物のメールアドレス、人物相関図と人物相関図に含まれる人物のメールアドレス、及び、各スレッドに送信者または受信者として登場したユーザのメールアドレスの一覧とそのポイント数が表示されており、各メールアドレスには、そのメールアドレスに関連付けられた人物名が表示されている。   FIG. 43 is a diagram showing an overall image of the search screen when a check box for instructing display of a person name is checked. At this time, the search screen includes a field for entering a search word, a thread arranged in chronological order and the mail address of the important person, the mail address of the person included in the person correlation chart and the person correlation chart, and the transmission to each thread. A list of e-mail addresses of users who appear as users or recipients and the number of points are displayed, and each e-mail address displays a person name associated with the e-mail address.

なお、本実施の形態に、第2〜第5の実施形態を組み合わせることも可能である。   It should be noted that the second to fifth embodiments can be combined with this embodiment.

[第7の実施形態]
第7の実施形態では、会議における各参加者の発話内容を音声認識によりテキスト化し、メールと同様のデータ形式に成型することにより、上記実施形態と同様の処理を適用して重要人物の検索や人物相関の把握を可能とするものである。以下、第7の実施形態について第1の実施形態との差分について説明する。
[Seventh Embodiment]
In the seventh embodiment, the utterance content of each participant in the conference is converted into text by voice recognition and formed into a data format similar to that of mail, thereby applying the same processing as in the above embodiment to search for important persons. It is possible to grasp the person correlation. Hereinafter, the difference between the seventh embodiment and the first embodiment will be described.

図44は、本発明の第7の実施形態による検索支援装置1bの機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、図1に示す第1の実施形態による検索支援装置1と同一の部分には同一の符号を付し、その説明を省略する。図44に示す検索支援装置1bが図1に示す第1の実施形態による検索支援装置1と異なる点は、音声認識部80がメール記憶部10に接続されており、音声データ記憶部70が音声認識部80に接続されている点である。   FIG. 44 is a functional block diagram of the search support apparatus 1b according to the seventh embodiment of the present invention, in which only functional blocks related to the present invention are extracted and shown. In this figure, the same parts as those in the search support apparatus 1 according to the first embodiment shown in FIG. The search support device 1b shown in FIG. 44 is different from the search support device 1 according to the first embodiment shown in FIG. 1 in that the voice recognition unit 80 is connected to the mail storage unit 10 and the voice data storage unit 70 is a voice. It is connected to the recognition unit 80.

音声データ記憶部70は、例えば、データベースサーバなどで実現することができ、会議名と、会議中の音声を収集してデータ化した音声データと、会議開催日時と、会議の参加者及び司会者のメールアドレスとを設定した会議ファイルを記憶する。なお、1回の会議について1つの会議ファイルが生成されるものとする。   The voice data storage unit 70 can be realized by, for example, a database server or the like. The voice data storage unit 70 is a meeting name, voice data obtained by collecting voices during the meeting, and data, meeting date and time, meeting participants and moderators. Memorize the meeting file set with the e-mail address. It is assumed that one meeting file is generated for one meeting.

図45は、音声認識部80の構成を示すブロック図である。音声認識部80は、例えば、サーバなどのコンピュータ装置で実現することができ、発話者データ記憶部81、音声データ分割部82、発話者認識部83、音声テキスト変換部84、及び、メール変換部85を備える。発話者データ記憶部81は、各人物を特定するユーザ特定情報としてのメールアドレスと、当該人物の音声の特徴を示すパラメータとを対応づけた音声特徴情報を記憶する。   FIG. 45 is a block diagram showing a configuration of the voice recognition unit 80. The voice recognition unit 80 can be realized by a computer device such as a server, for example, and includes a speaker data storage unit 81, a voice data division unit 82, a speaker recognition unit 83, a voice text conversion unit 84, and a mail conversion unit. 85. The speaker data storage unit 81 stores voice feature information in which a mail address as user specifying information for specifying each person is associated with a parameter indicating a voice feature of the person.

音声データ分割部82は、音声データ記憶部70から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人の発話者が発言している発話区間に区切った分割音声データを生成する。発話者認識部83は、分割音声データと、発話者データ記憶部81に記憶されている各話者の音声特徴情報とから発話者を特定し、特定した発話者のメールアドレスを読み出す。音声テキスト変換部84は、分割音声データから、発話内容をテキスト化したテキストデータを生成する。メール変換部85は、発話者のメールアドレス、会議ファイル内の参加者のメールアドレス及び会議時間、発話内容のテキストデータをそれぞれ、Fromフィールド、Toフィールド、Subjectフィールド、メール本文に設定したメールのデータを生成し、メール記憶部10へ書き込む。   The voice data dividing unit 82 reads the conference file from the voice data storage unit 70, and generates divided voice data in which the voice data in the read conference file is divided into speech sections in which one speaker is speaking. The speaker recognition unit 83 specifies a speaker from the divided voice data and the voice feature information of each speaker stored in the speaker data storage unit 81, and reads the mail address of the specified speaker. The voice text conversion unit 84 generates text data in which the utterance content is converted into text from the divided voice data. The e-mail conversion unit 85 sets e-mail data in which the e-mail address of the speaker, the e-mail address of the participant in the conference file, the conference time, and the text data of the utterance content are set in the From field, To field, Subject field, and e-mail body, respectively. Is written into the mail storage unit 10.

次に、本実施形態による検索支援装置1bの処理を説明する。
図46は、本実施形態による音声認識部80におけるメール形式データ生成処理フローを示す。音声認識部80の発話者データ記憶部81には、会議参加者の音声特徴情報が予め登録されているものとする。そして、会議の終了後には、音声データ記憶部70に会議ファイルが登録される。
Next, processing of the search support apparatus 1b according to the present embodiment will be described.
FIG. 46 shows a mail format data generation processing flow in the voice recognition unit 80 according to the present embodiment. It is assumed that the speech feature information of the conference participant is registered in advance in the speaker data storage unit 81 of the speech recognition unit 80. After the conference ends, the conference file is registered in the audio data storage unit 70.

例えば、会議の取りまとめ者が予め会議名、会議の参加者及び司会者のメールアドレスをPC(パーソナルコンピュータ)などに入力しておき、会議の開始時に当該PCに音声収集開始指示を入力し、終了時に音声収集停止指示を入力する。PCは、音声収集開始指示を入力してから音声収集停止指示が入力されるまで、当該PCが備えるマイクによって収集した会議中の音声の音声データを生成する。PCは、音声収集停止指示が入力され、音声データの生成を終了すると、予め入力された会議名、会議の参加者及び司会者のメールアドレスと、生成された音声データと、会議開催日時としての当該音声データの生成日時とを設定した会議ファイルを生成し、音声データ記憶部70に書き込む。なお、このPCが音声データ記憶部70、音声認識部80を実現する装置であってもよい。   For example, the meeting organizer inputs the meeting name, meeting participants and the moderator's e-mail addresses in advance to a PC (personal computer), etc., and inputs the voice collection start instruction to the PC at the start of the meeting. Sometimes input voice collection stop instruction. The PC generates voice data of the voice during the meeting collected by the microphone included in the PC until the voice collection stop instruction is inputted after the voice collection start instruction is inputted. When the voice collection stop instruction is input and the generation of the voice data is finished, the PC finishes generating the conference name, the conference participants and the moderator mail addresses, the generated voice data, and the conference date and time. A conference file in which the generation date and time of the audio data is set is generated and written in the audio data storage unit 70. The PC may be a device that implements the voice data storage unit 70 and the voice recognition unit 80.

音声認識部80の音声データ分割部82は、まだ本メール形式データ生成処理フローによるメール形式データ生成処理を行なっていない会議ファイルを音声データ記憶部70から読み出す(ステップS1110)。なお、ユーザにより処理対象として指定された会議ファイルを読み出すようにしてもよい。音声データ分割部82は、読み出した会議ファイルに設定されている音声データを取得すると、当該音声データを1人の発話者が発言している発話区間に区切った分割音声データを抽出する(ステップS1120)。このとき、最初の分割音声データの抽出であれば、音声データの冒頭から、2回目以降の抽出であれば、直前までに抽出した分割音声データを除いた音声データの冒頭から、分割音声データを抽出する。なお、1つの発話区間は、例えば、無音区間から次の無音区間としたり、1人の発話者が発言している間の区間としたりすることができる。音声データ分割部82は、分割音声データに対応した音声収集開始時点からの経過時間、つまり、分割音声データにより示される発話区間の開始部分が、音声データにより示される会議中音声において冒頭からどれくらいの時間が経過した時点のものであるかを取得する。   The voice data dividing unit 82 of the voice recognition unit 80 reads from the voice data storage unit 70 a conference file that has not yet been subjected to the mail format data generation process according to the mail format data generation process flow (step S1110). Note that a conference file designated as a processing target by the user may be read. When the voice data dividing unit 82 acquires the voice data set in the read conference file, the voice data dividing unit 82 extracts the divided voice data obtained by dividing the voice data into speech sections in which one speaker is speaking (step S1120). ). At this time, if the first divided audio data is extracted, the divided audio data is extracted from the beginning of the audio data excluding the divided audio data extracted immediately before from the beginning of the audio data if extracted for the second time or later. Extract. Note that one utterance section can be, for example, a silent section to the next silent section, or a section while one speaker is speaking. The voice data dividing unit 82 determines the elapsed time from the voice collection start time corresponding to the divided voice data, that is, how much the start part of the utterance section indicated by the divided voice data is from the beginning in the in-conference voice indicated by the voice data. Get whether the time has passed.

次に、発話者認識部83は、既存の話者認識技術を用いて、ステップS1120において抽出された分割音声データにより示される音声が、誰の発言であるかを特定する。例えば、分割音声データにより示される音声(発話)のパターンが、発話者データ記憶部81に記憶されているいずれかのユーザの音声特徴情報、例えば、声紋の特徴を示すデータと一致するかを判断する(ステップS1130)。このとき、ステップS1110において読み出した会議ファイルに登録されているメールアドレスにより特定される音声特徴情報のみを使用してもよい。   Next, the speaker recognizing unit 83 uses an existing speaker recognition technique to identify who speaks the voice indicated by the divided voice data extracted in step S1120. For example, it is determined whether the voice (utterance) pattern indicated by the divided voice data matches the voice feature information of any user stored in the speaker data storage unit 81, for example, data indicating the characteristics of the voiceprint. (Step S1130). At this time, only the audio feature information specified by the mail address registered in the conference file read out in step S1110 may be used.

一致する音声特徴情報がある場合(ステップS1130:YES)、発話者認識部83は、この一致する音声特徴情報に設定されている電子メールアドレスを発話者データ記憶部81から取得し、この取得した発話者のメールアドレスが、会議ファイルに設定されている司会者のメールアドレスと同じであるかを判断する(ステップS1140)。発話者のメールアドレスが司会者のメールアドレスと同じではない場合(ステップS1140:NO)、発話者認識部83は、一致する音声特徴情報から読出した電子メールアドレスを、発話者のメールアドレスとして自身の備える記憶手段に一時的に記憶しておく(ステップS1150)。音声テキスト変換部84は、既存の音声認識技術を用いて、ステップS1120において抽出された分割音声データから発話内容をテキスト化し、テキストデータを生成する(ステップS1160)。   If there is matching voice feature information (step S1130: YES), the speaker recognition unit 83 acquires the e-mail address set in the matching voice feature information from the speaker data storage unit 81, and this acquisition is performed. It is determined whether the e-mail address of the speaker is the same as the e-mail address of the moderator set in the conference file (step S1140). If the speaker's email address is not the same as the presenter's email address (step S1140: NO), the speaker recognition unit 83 uses the email address read from the matching voice feature information as the speaker's email address. Is temporarily stored in the storage means (step S1150). The speech text conversion unit 84 converts the utterance content into text from the divided speech data extracted in step S1120, using existing speech recognition technology, and generates text data (step S1160).

メール変換部85は、発話者のメールアドレス、発話内容のテキストデータ、分割音声データに基づいてメールデータを生成し、メール情報記憶部70に書き込む(ステップS1170)。具体的には、まず、メール変換部85は、ステップS1150において発話者認識部83が記憶していた発話者のメールアドレス、ステップS1110において読み出した会議ファイル内の参加者のメールアドレス、当該会議ファイル内の会議名、ステップS1160において生成した発話内容のテキストデータをそれぞれ、Fromフィールド、Toフィールド、Subjectフィールド、メール本文に設定したメールデータを生成する。なお、Toフィールドには、会議ファイル内の参加者のメールアドレスから発話者のメールアドレスを除いて設定するようにしてもよい。   The mail conversion unit 85 generates mail data based on the speaker's mail address, the text data of the utterance content, and the divided voice data, and writes the mail data in the mail information storage unit 70 (step S1170). Specifically, first, the mail conversion unit 85 includes the speaker's email address stored in the speaker recognition unit 83 in step S1150, the participant's email address in the conference file read out in step S1110, and the conference file. Of the conference name and the text data of the utterance content generated in step S1160 are generated in the From field, To field, Subject field, and mail text respectively. The To field may be set by excluding the speaker's email address from the participant's email address in the conference file.

続いて、メール変換部85は、発話毎、つまり、分割音声データ毎に一意のMessage-IDを生成して、当該メールデータのMessage-IDフィールドに設定する。Message-IDは、「0001@kaigi20081122.svr.jp」のように、会議における発話に基づいて生成されたメールデータであることを示すための特定の文字列、ここでは、「kaigi」を含んだものとする。メール変換部85は、Referencesフィールドに、同じ会議ファイル内の音声データから抽出した他の分割音声データについて既に生成された他のメールデータのMessage-IDを設定する。ここでは、分割音声データを音声データの冒頭から順に抽出しているため、現在処理対象としている分割音声データよりも遡った時点の発話内容が設定されたメールデータのMessage-IDが取得され、設定されることになる。よって、最初に抽出された分割音声データの場合、Referencesフィールドは設定されない。さらに、メール変換部85は、会議ファイルから取得した会議開催日時に、ステップS1120において取得した経過時間を加算した日時を、メールデータのDateフィールドに設定する。   Subsequently, the mail conversion unit 85 generates a unique Message-ID for each utterance, that is, for each divided voice data, and sets it in the Message-ID field of the mail data. Message-ID includes a specific character string to indicate that it is mail data generated based on the utterance at the conference, such as “0001@kaigi20081122.svr.jp”, in this case, “kaigi” Shall. The mail conversion unit 85 sets the Message-ID of other mail data already generated for other divided voice data extracted from the voice data in the same conference file in the References field. Here, since the divided voice data is extracted in order from the beginning of the voice data, the Message-ID of the mail data with the utterance content set at the time point back from the divided voice data currently being processed is acquired and set Will be. Therefore, in the case of the divided audio data extracted first, the References field is not set. Furthermore, the mail conversion unit 85 sets the date and time obtained by adding the elapsed time acquired in step S1120 to the meeting date and time acquired from the conference file in the Date field of the mail data.

音声データ分割部82は、音声データに次の発話区間があるか否かを判断する(ステップS1180)。音声データに次の発話区間がある場合には(ステップS1180:YES)、ステップS1120からの処理を繰り返す。そして、音声データの最後までの分割音声データの抽出を終了した場合には(ステップS1180:NO)、処理を終了する。   The voice data dividing unit 82 determines whether or not there is a next utterance section in the voice data (step S1180). If there is a next utterance section in the voice data (step S1180: YES), the processing from step S1120 is repeated. When the extraction of the divided audio data up to the end of the audio data is completed (step S1180: NO), the process ends.

なお、ステップS1130において、一致する音声特徴情報がないと判断した場合(ステップS1130:YES)、ステップS1180の処理を行う。一致する音声特徴情報がない場合としては、例えば、複数話者の同時発話や、発話者の音声特徴情報が発話者データ記憶部81に未登録である場合などが想定される。
また、ステップS1140において、発話者のメールアドレスが、会議ファイルに登録されている司会者のメールアドレスと同じである場合(ステップS1140:YES)、ステップS1180の処理を行う。これにより、発言は多いが、会議の話題に関する重要人物ではない司会者を、検索時に重要人物として検出されないようにする。なお、司会者についても会議の話題に係る重要人物の検索対象としたい場合には、ステップS1140の処理は行なわない。
If it is determined in step S1130 that there is no matching audio feature information (step S1130: YES), the process of step S1180 is performed. As a case where there is no matching voice feature information, for example, simultaneous speech of a plurality of speakers or a case where the voice feature information of the talker is not registered in the talker data storage unit 81 is assumed.
In step S1140, if the speaker's email address is the same as the moderator's email address registered in the conference file (step S1140: YES), the process of step S1180 is performed. Thus, a moderator who has a lot of remarks but is not an important person related to the topic of the conference is not detected as an important person at the time of search. Note that the process of step S1140 is not performed when it is desired to search for an important person related to the topic of the meeting for the presenter.

図47は、本実施形態によるメール収集部20における分析処理フローを示す。同図において、ステップS1210〜S1270までの処理は、第1の実施形態における図5のステップS110〜S170までの処理と同様である。   FIG. 47 shows an analysis processing flow in the mail collection unit 20 according to the present embodiment. In the figure, the processing from step S1210 to S1270 is the same as the processing from step S110 to S170 in FIG. 5 in the first embodiment.

メール分析部22は、読み込んだメールのMessage-IDフィールドの設定内容に、「kaigi」などの会議に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1280)。会議に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1280:NO)、第1の実施形態における図5のステップS180〜S190と同様の処理を行なう(ステップS1290〜S1300)。ただし、ステップS1290において、メール分析部22は、メールのSubjectフィールド及びメール本文の設定内容を形態素解析し、形態素解析された結果をキーワードとする。   The mail analysis unit 22 determines whether the setting content of the Message-ID field of the read mail includes a character string indicating that the mail is generated based on the conference such as “kaigi” (step S1280). ). When the character string indicating that the mail is generated based on the conference is not included (step S1280: NO), the same processing as steps S180 to S190 of FIG. 5 in the first embodiment is performed (step S1290). ~ S1300). However, in step S1290, the mail analysis unit 22 performs morphological analysis on the setting contents of the mail Subject field and the mail text, and uses the result of the morphological analysis as a keyword.

一方、会議に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1280:YES)、メール分析部22は、メールのSubjectフィールド及び本文の設定内容を形態素解析するとともに、形態素解析された結果をキーワード候補とする(ステップS1310)。メール分析部22は、ステップS1310で抽出されたキーワード候補から1つを選択すると(ステップS1320)、メール分析部22が備える記憶手段に、スレッドID及び選択したキーワード候補に対応して記憶されている出現回数を、1加算した出現回数に更新する(ステップS1330)。なお、スレッドID及び選択したキーワード候補に対応した出現回数が記憶されていない場合は、スレッドID及び選択したキーワード候補に対応づけて、出現回数「1」を書き込む。メール分析部22は、更新された出現回数が、キーワード候補をキーワードとして登録すべき出現回数の閾値(例えば、3回)に達したかを判断する(ステップS1340)。   On the other hand, when the character string indicating that the mail is generated based on the meeting is included (step S1280: YES), the mail analysis unit 22 performs morphological analysis on the setting contents of the subject field and the text of the mail. The result of the morphological analysis is set as a keyword candidate (step S1310). When the mail analysis unit 22 selects one of the keyword candidates extracted in step S1310 (step S1320), the mail analysis unit 22 stores the thread ID and the selected keyword candidate corresponding to the thread ID. The number of appearances is updated to the number of appearances obtained by adding 1 (step S1330). When the thread ID and the number of appearances corresponding to the selected keyword candidate are not stored, the appearance number “1” is written in association with the thread ID and the selected keyword candidate. The mail analysis unit 22 determines whether or not the updated number of appearances has reached a threshold (for example, 3 times) of the number of appearances for which the keyword candidate should be registered as a keyword (step S1340).

ステップS1340において、更新後の出現回数が閾値未満、あるいは、閾値より大きいと判断された場合(ステップS1340:≠)、メール分析部22は、ステップS1310において抽出したキーワード候補のうちまだ選択していないキーワード候補があるかを判断する(ステップS1360)。   If it is determined in step S1340 that the number of appearances after the update is less than the threshold or greater than the threshold (step S1340: ≠), the mail analysis unit 22 has not yet selected the keyword candidates extracted in step S1310. It is determined whether there are keyword candidates (step S1360).

ステップS1340において、更新後の出現回数が閾値に達した場合(ステップS1340:=)、分析結果出力部23は、このキーワード候補をキーワードとし、新たなレコードIDを付与する。分析結果出力部23は、この新たに付与したレコードIDと、スレッドIDと、キーワードとからなるレコードをキーワードテーブルに追加する(ステップS1350)。メール分析部22は、ステップS1310において抽出したキーワード候補のうちまだ選択していないキーワード候補があるかを判断する(ステップS1360)。   In step S1340, when the number of appearances after the update reaches a threshold value (step S1340: =), the analysis result output unit 23 uses this keyword candidate as a keyword and assigns a new record ID. The analysis result output unit 23 adds a record including the newly assigned record ID, thread ID, and keyword to the keyword table (step S1350). The mail analysis unit 22 determines whether there is a keyword candidate that has not yet been selected among the keyword candidates extracted in step S1310 (step S1360).

メール分析部22は、まだ選択していないキーワード候補がある場合(ステップS1360:YES)、ステップS1320からの処理を繰り返す。そして、抽出した全てのキーワード候補を選択した場合には(ステップS1360:NO)、ステップS1300からの処理を行なう。   If there is a keyword candidate that has not yet been selected (step S1360: YES), the mail analysis unit 22 repeats the processing from step S1320. If all the extracted keyword candidates are selected (step S1360: NO), the processing from step S1300 is performed.

会議の場合、発話内容に含まれる単語を全てキーワードとした場合、キーワードが膨大な量となってしまったり、会議の主要な話題には関係しない内容もキーワードとして抽出されてしまったりする場合がある。そこで、上記の処理により、会議中に何度も出現した単語のみをキーワードとして選択する。なお、会議中に1回でも発言があったものをキーワードとする場合には、ステップS1280、S1310〜S1360の処理を行なわなくともよい。
また、キーワードテーブルに登録されるキーワードの量が増加してしまったり、不要なキーワードが登録されてしまったりすることを防ぐため、第5の実施形態を適用して、キーワード及びキーワード候補のフィルタリング処理を行ってもよい。また、Subjectフィールドのみを形態素解析し、キーワード及びキーワード候補を抽出することでもよい。
In the case of a conference, if all the words included in the utterance content are used as keywords, the amount of keywords may be enormous, or content not related to the main topic of the conference may be extracted as keywords. . Therefore, only the word that appears many times during the meeting is selected as a keyword by the above processing. Note that if the keyword is one that has been remarked even once during the meeting, the processing of steps S1280 and S1310 to S1360 need not be performed.
In addition, in order to prevent the amount of keywords registered in the keyword table from increasing or unnecessary keywords from being registered, the fifth embodiment is applied to filter the keywords and keyword candidates. May be performed. Alternatively, only the Subject field may be morphologically analyzed to extract keywords and keyword candidates.

次に、本実施形態による検索処理部40における処理について説明する。本実施形態の検索処理部40のクエリ受付部41が検索要求を受信し、実行するスレッド検索処理フローは、図10に示す第1の実施形態によるスレッド検索処理フローと同様である。   Next, processing in the search processing unit 40 according to the present embodiment will be described. The thread search processing flow executed when the query receiving unit 41 of the search processing unit 40 of the present embodiment receives and executes a search request is the same as the thread search processing flow according to the first embodiment shown in FIG.

図48は、本実施形態による人物相関テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶したスレッドID(以下、処理対象スレッドID)のうち、当該人物相関テーブル作成処理フローによる人物相関テーブル作成処理をまだ行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS1410)。
FIG. 48 shows a person correlation table creation process flow according to this embodiment.
The search unit 42 of the search processing unit 40 has not yet performed the person correlation table creation process by the person correlation table creation process flow among the thread IDs stored in step S250 of FIG. 10 (hereinafter, the process target thread ID). Select an ID. The search unit 42 searches the mail table, identifies and reads the record in which the selected thread ID is set (step S1410).

検索部42は、ステップS1410において読込んだレコードから、送信者と受信者に設定されているユーザの組を送受信者の組として抽出し、抽出した送受信者の組それぞれについて、抽出された数をカウントする(ステップS1420)。なお、送信者と受信者のユーザが入れ替わっていても、同じ組であるとする。検索部42は、ステップS1410において読み込んだレコードのメッセージIDに、「kaigi」などの会議における発話に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1430)。   The search unit 42 extracts a set of users set as a sender and a receiver as a set of senders and receivers from the record read in step S1410, and calculates the number extracted for each of the extracted sets of senders and receivers. Count (step S1420). In addition, even if the sender and the user of the receiver are switched, it is assumed that they are the same set. The search unit 42 determines whether the message ID of the record read in step S1410 includes a character string indicating mail generated based on the utterance in the conference such as “kaigi” (step S1430). .

会議における発話に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1430:NO)、ステップS1420において抽出した送受信者の組それぞれについて、当該送受信者の組が抽出された数をそのままポイントとして付与する(ステップS1440)。一方、会議における発話に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1430:YES)、ステップS1420において抽出した送受信者の組それぞれについて、当該送受信者の組が抽出された数に0.1などの所定の係数a(0<a<1)を乗算した数をポイントとして付与する(ステップS1450)。   When the character string indicating that the mail is generated based on the utterance in the conference is not included (step S1430: NO), the sender / receiver pair is extracted for each sender / receiver pair extracted in step S1420. The number is assigned as a point as it is (step S1440). On the other hand, when the character string which shows that it is the mail produced | generated based on the speech in a meeting is contained (step S1430: YES), the group of the said sender / receiver is set for each sender / receiver group extracted in step S1420. A number obtained by multiplying the extracted number by a predetermined coefficient a such as 0.1 (0 <a <1) is given as a point (step S1450).

検索部42は、処理対象スレッドIDに、まだ人物相関テーブル作成処理を行っていないスレッドIDがあるかを判断する(ステップS1460)。まだ人物相関テーブル作成処理を行っていないスレッドIDがある場合(ステップS1460:NO)、ステップS1410からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、人物相関テーブル作成処理を実行した場合(ステップS1460:YES)、検索部42は、スレッドID毎に、送信者−受信者のユーザの組及び当該組に対応したポイントを示す一覧である人物相関テーブルを生成して記憶する(ステップS1470)。   The search unit 42 determines whether there is a thread ID that has not yet undergone the person correlation table creation process in the process target thread ID (step S1460). If there is a thread ID that has not yet been subjected to the person correlation table creation process (step S1460: NO), the process from step S1410 is repeated. When the person correlation table creation processing is executed for all the processing target thread IDs (step S1460: YES), the search unit 42 corresponds to the sender-recipient user pair and the pair for each thread ID. A person correlation table that is a list showing the points that have been created is generated and stored (step S1470).

図49は、本実施形態による重要人物テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶した処理対象スレッドIDのうち、当該重要人物テーブル作成処理フローによるおいてまだ重要人物テーブル作成処理を行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS1510)。検索部42は、ステップS1510において読み込んだレコードのメッセージIDに、「kaigi」などの会議に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1520)。
FIG. 49 shows an important person table creation processing flow according to this embodiment.
The search unit 42 of the search processing unit 40 selects a thread ID that has not yet been subjected to the important person table creation process in the important person table creation process flow from the process target thread IDs stored in step S250 of FIG. . The search unit 42 searches the mail table, identifies and reads the record in which the selected thread ID is set (step S1510). The search unit 42 determines whether or not the message ID of the record read in step S1510 includes a character string indicating mail generated based on the conference such as “kaigi” (step S1520).

会議に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1520:NO)、検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者または受信者として設定されている数である登場回数を計測し、その計測した数を当該ユーザのポイントとして記憶する(ステップS1530)。   When the character string indicating that the mail is generated based on the conference is not included (step S1520: NO), the search unit 42 is a user set as a sender or a receiver from the read record. The number of appearances, which is the number set as the sender or receiver, is measured, and the measured number is stored as the user's point (step S1530).

一方、会議に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1520:YES)、検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者として設定されている数、及び、受信者として設定されている数をそれぞれ計測する(ステップS1540)。検索部42は、抽出したユーザそれぞれについて、当該ユーザが送信者として設定されている数に所定の係数bを乗算した数と、当該ユーザが受信者として設定されている数に所定の係数cを乗算した数とを合計し、当該ユーザのポイントを算出する。ここで、係数b及び係数cは、0<b<1、0<c<1とし、かつ、b>cとする。また、係数bまたは係数cを、係数aと同一の値とする。検索部42は、抽出した各ユーザのポイントを記憶する(ステップS1550)。   On the other hand, when the character string indicating that the mail is generated based on the meeting is included (step S1520: YES), the search unit 42 is set as the sender or the receiver from the read record. And the number of the extracted users set as the sender and the number set as the receivers are respectively measured (step S1540). For each extracted user, the search unit 42 multiplies the number of the user set as the sender by the predetermined coefficient b and the number of the user set as the receiver by the predetermined coefficient c. The multiplied number is summed to calculate the user's points. Here, the coefficient b and the coefficient c are 0 <b <1, 0 <c <1, and b> c. The coefficient b or the coefficient c is set to the same value as the coefficient a. The search unit 42 stores the extracted points of each user (step S1550).

検索部42は、処理対象スレッドIDに、まだ重要人物テーブル作成処理を行っていないスレッドIDがある場合は(ステップS1560:NO)、ステップS1510からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、重要人物テーブル作成処理を実行した場合は(ステップS1560:YES)、スレッドID毎に、ステップS1530またはS1550において抽出されたユーザと、当該ユーザのポイントとを示す一覧である重要人物テーブルを生成して記憶する(ステップS1570)。   If there is a thread ID that has not yet undergone the important person table creation process in the process target thread ID (step S1560: NO), the search unit 42 repeats the process from step S1510. When the important person table creation process is executed for all process target thread IDs (step S1560: YES), the user extracted in step S1530 or S1550 and the points of the user are indicated for each thread ID. An important person table as a list is generated and stored (step S1570).

続いて実施される本実施形態による結果表示処理は、図13に示す第1の実施形態と同様である。   The subsequent result display processing according to this embodiment is the same as that of the first embodiment shown in FIG.

会議の場合、参加者間で発話者が入れ替わる回数が多いため、1つの会議ファイルから、発話内容を示すメールが大量に生成されてしまう。そこで、通常メール1通を、会議での複数の発言に対応するように重み付けしてポイントを付与している。上記では、会議ファイルから生成されたメールの場合、送受信者の組が抽出された数に係数a=0.1を乗算してポイントとおり、これは、[通常メール1通:会議での1回の発言=10:1]の重みの比としていること、つまり、通常メール1通に、会議での10回の発言に相当する重み付けをしていることを示す。また、係数b>係数cとすることにより、会議において発言した参加者を当該会議の他の参加者より重み付けし、発話者をより重要な人物とみなすことが可能となる。また、係数bまたは係数cを係数aと同値とすることにより、通常メール1通と会議での1回の発言との重みの比を、人物相関テーブルと重要人物テーブルとで同一にしている。係数a,b,cは、上述した条件の範囲で任意に設定することができる。   In the case of a conference, since there are many times that a speaker is switched between participants, a large amount of mail indicating the utterance content is generated from one conference file. Therefore, points are given by weighting one normal mail so as to correspond to a plurality of utterances at the conference. In the above, in the case of an email generated from a conference file, the number of pairs of senders and receivers extracted is multiplied by a coefficient a = 0.1, as pointed. It is shown that the weight ratio is 10: 1], that is, one normal mail is weighted corresponding to 10 utterances in the conference. In addition, by setting coefficient b> coefficient c, it is possible to weight participants who speak in the conference from other participants in the conference and regard the speaker as a more important person. In addition, by setting the coefficient b or the coefficient c to the same value as the coefficient a, the ratio of the weights of one normal mail and one utterance at the meeting is made the same in the person correlation table and the important person table. The coefficients a, b, and c can be arbitrarily set within the range of the above-described conditions.

なお、図49に示す重要人物テーブル作成処理フローのステップS1540において、検索部42は、読込んだレコードから送信者として設定されているユーザを抽出し、その抽出したユーザが送信者として設定されている数と、係数aを乗算した数を当該ユーザのポイントとして算出することでもよい。   In step S1540 of the important person table creation processing flow shown in FIG. 49, the search unit 42 extracts a user set as a sender from the read record, and the extracted user is set as a sender. Alternatively, the number obtained by multiplying the number by the coefficient a may be calculated as the user's point.

なお、上記においては、本実施形態と第1の実施形態の差分を説明したが、第2〜4、6の実施形態と組み合わせることも可能である。   In addition, although the difference between this embodiment and 1st Embodiment was demonstrated in the above, it is also possible to combine with 2nd, 4th, and 6th embodiment.

なお、検索支援装置1、1a、1bは、内部にコンピュータシステムを有している。そして、上述したメール収集部20、検索処理部40、出力制御部50、及び、音声認識部80の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPUや各種メモリ、OSや周辺機器等のハードウェアを含むものである。   The search support apparatuses 1, 1a, 1b have a computer system inside. The operation processes of the mail collection unit 20, the search processing unit 40, the output control unit 50, and the voice recognition unit 80 described above are stored in a computer-readable recording medium in the form of a program. The above processing is performed by reading and executing the computer system. Here, the computer system includes a CPU, various memories, an OS, and hardware such as peripheral devices.

また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

1…検索支援装置
10…メール記憶部
20…メール収集部
21…メール読込み部(メール読込み手段)
22…メール分析部(メール分析手段)
23…分析結果出力部(分析結果出力手段)
24…人物情報生成部
30…分析結果格納部(分析結果格納手段)
40…検索処理部
41…クエリ受付部(受付手段)
42…検索部(検索手段)
43…検索結果出力部
44…人物情報読込み部
50…出力制御部(出力制御手段)
51…検索結果読込み部
52…結果表示部
53…検索文書受付部
60…人物情報格納部(人物情報格納手段)
70…音声データ記憶部(音声データ記憶手段)
80…音声認識部
81…発話者データ記憶部(発話者データ記憶手段)
82…音声データ分割部(音声データ分割手段)
83…発話者認識部(発話者認識手段)
84…音声テキスト変換部(音声テキスト変換手段)
85…メール変換部(メール変換手段)
DESCRIPTION OF SYMBOLS 1 ... Search assistance apparatus 10 ... Mail memory | storage part 20 ... Mail collection part 21 ... Mail reading part (mail reading means)
22 ... Mail analysis section (mail analysis means)
23. Analysis result output section (analysis result output means)
24 ... person information generation unit 30 ... analysis result storage unit (analysis result storage means)
40 ... Search processing unit 41 ... Query receiving unit (receiving unit)
42 ... Search part (search means)
43 ... Search result output unit 44 ... Person information reading unit 50 ... Output control unit (output control means)
51 ... Search result reading unit 52 ... Result display unit 53 ... Search document receiving unit 60 ... Person information storage unit (person information storage means)
70: Audio data storage unit (audio data storage means)
80 ... voice recognition unit 81 ... speaker data storage unit (speaker data storage means)
82: Audio data dividing unit (audio data dividing means)
83 ... Speaker recognition unit (speaker recognition means)
84 ... voice text conversion unit (voice text conversion means)
85 ... Mail conversion part (Mail conversion means)

Claims (27)

各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、
検索条件の入力を受ける受付手段と、
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、
を備え
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする検索支援装置。
Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information associating the keywords with each other,
A mail reading means for reading an e-mail from a mail storage means storing the e-mail;
Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table When,
If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
Accepting means for receiving search conditions,
The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
Equipped with a,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remember emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A search support apparatus characterized by that.
前記出力制御手段は、前記検索手段により取得した数が所定の条件より多いユーザを、当該ユーザが設定されている数に対応した順序で、スレッド識別情報毎に出力する
ことを特徴とする請求項1に記載の検索支援装置。
The output control means outputs users whose number acquired by the search means is larger than a predetermined condition for each thread identification information in an order corresponding to the number set by the user. The search support apparatus according to 1.
前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、
前記出力制御手段は、前記検索手段により取得したユーザの組をスレッド識別情報毎に出力する、
ことを特徴とする請求項1または請求項2に記載の検索支援装置。
The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Obtain a set of users set as sender and receiver from the record in the mail table,
The output control means outputs a set of users acquired by the search means for each thread identification information.
The search support apparatus according to claim 1, wherein the search support apparatus is a search support apparatus.
前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、
前記出力制御手段は、前記検索手段により取得したユーザの組に基づいて、当該取得したユーザの組に含まれる複数ユーザ間の相関を示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1または請求項2に記載の検索支援装置。
The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Obtain a set of users set as sender and receiver from the record in the mail table,
The output control unit outputs, for each thread identification information, information indicating a correlation between a plurality of users included in the acquired user set based on the user set acquired by the search unit.
The search support apparatus according to claim 1, wherein the search support apparatus is a search support apparatus.
前記検索手段は、前記スレッド識別情報で特定される前記メールテーブルのレコードから、さらに、前記ユーザの組が設定されている数を取得し、
前記出力制御手段は、さらに、ユーザの組が設定されている数に対応した情報を出力する、
ことを特徴とする請求項3または請求項4に記載の検索支援装置。
The search means further obtains the number of sets of the user set from the mail table record specified by the thread identification information,
The output control means further outputs information corresponding to the number of sets of users.
The search support apparatus according to claim 3, wherein the search support apparatus is a search support apparatus.
前記メールテーブルのレコードは、さらに、同報者の情報を含み、
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与するとともに、同報者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか項に記載の検索支援装置。
The mail table record further includes broadcaster information;
The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
For each thread identification information acquired, the search means has a predetermined point for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And giving a point weighted by a predetermined weight from the predetermined point to a user set as a broadcaster,
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
Search support device according to any one of claims 1 to 5, characterized in that.
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに受信者として設定されているユーザに所定のポイントを付与するとともに、送信者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか項に記載の検索支援装置。
For each acquired thread identification information, the search means gives a predetermined point to a user set as a receiver in each record of the mail table specified by the thread identification information, and sets as a sender A point given a predetermined weight than the predetermined point is given to the user who has been,
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
Search support device according to any one of claims 1 to 5, characterized in that.
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに設定されている受信者がメーリングリストのアドレスである場合は、送信者として設定されているユーザに所定のポイントを付与し、メーリングリストのアドレスでない場合は、送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザをスレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか項に記載の検索支援装置。
For each acquired thread identification information, the search means is set as a sender when the receiver set in each record of the mail table specified by the thread identification information is an address of a mailing list. Given points to users who are not mailing list addresses, give given points to users set as senders and users set as recipients,
The output control means outputs a user whose total number of points given by the search means is greater than a predetermined condition for each thread identification information.
Search support device according to any one of claims 1 to 5, characterized in that.
前記検索手段は、前記特定した各レコードに会議の音声に基づいて生成したデータであることを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザのみに前記所定のポイントを付与することを特徴とする請求項1から請求項8のいずれか1項に記載の検索支援装置。 When the information indicating that the data is generated based on the audio of the meeting is set in each specified record, the search unit only applies the predetermined information to a user set as a sender in each record. The search support apparatus according to any one of claims 1 to 8, wherein the points are given. 前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組と、当該ユーザの組が設定されている数を取得し、当該レコードに会議に基づき生成されたことを示す情報が設定されている場合は、前記各ユーザの組に、所定のポイントを当該ユーザの組が設定されている数に応じて付与し、当該レコードに会議に基づき生成されたことを示す情報が設定されていない場合は、前記各ユーザの組に、前記所定のポイントより重み付けしたポイントを当該ユーザの組が設定されている数に応じて付与し、
前記出力制御手段は、各ユーザの組のポイントに対応した情報を出力する、
ことを特徴とする請求項1から請求項9のいずれか1項に記載の検索支援装置。
The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Information indicating that a set of users set as a sender and a receiver and the number of sets of the set of users are obtained from the record in the mail table and generated based on a meeting in the record. When set, information indicating that a predetermined point is assigned to each user group according to the number of the user group set and information indicating that the record is generated based on the conference is set in the record. If the user group is not set, the user group is set with points weighted from the predetermined points. Granted according to the number,
The output control means outputs information corresponding to each user set point,
The search support apparatus according to any one of claims 1 to 9, wherein
分析結果出力手段は、読込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、読込んだ電子メールから得られる情報を形態素解析した結果をキーワード候補とし、同一のスレッド識別情報に対応した電子メールから当該キーワード候補が所定回数以上得られた場合に、当該キーワード候補と当該スレッド識別情報とを対応づけて前記キーワードテーブルに書き込む、
ことを特徴とする請求項1から請求項10のいずれか項に記載の検索支援装置。
When the information indicating that the analysis result output means is generated based on the conference is set in the read e-mail, the result obtained by morphological analysis of the information obtained from the read e-mail is set as the keyword candidate, When the keyword candidate is obtained a predetermined number of times or more from the email corresponding to the thread identification information, the keyword candidate is associated with the thread identification information and written to the keyword table.
Search support device according to any one of claims 1 to 10, characterized in that.
会議名と、会議中の音声の音声データと、会議に参加したユーザを示す参加者とを含む会議データを記憶する音声データ記憶手段と、
各ユーザの音声の特徴を示すパラメータである音声特徴情報を記憶する発話者データ記憶手段と、
前記音声データ記憶手段から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人のユーザが発言している発話区間に区切った分割音声データを生成する音声データ分割手段と、
前記分割音声データと、前記発話者データ記憶手段に記憶されている各ユーザの音声特徴情報とから発話者であるユーザを特定する発話者認識手段と、
前記分割音声データから、発話内容をテキスト化したテキストデータを生成する音声テキスト変換手段と、
前記発話者認識手段が特定した発話者を送信者に、前記会議データ内の参加者を受信者に、前記会議データ内の会議名を件名に、前記音声テキスト変換手段が生成したテキストデータを本文に設定するとともに、新たに生成したメッセージ識別情報と、会議に基づき生成されたことを示す情報と、関連する他の電子メールのメッセージ識別情報として、同じ音声データから抽出した他の分割音声データに基づいて生成した電子メールのメッセージ識別情報とを設定した電子メールを生成し、前記メール記憶手段へ書き込むメール変換手段と、
をさらに備えることを特徴とする請求項から請求項11のいずれか項に記載の検索支援装置。
Audio data storage means for storing conference data including conference name, audio data of audio during the conference, and participants indicating users who participated in the conference;
Speaker data storage means for storing voice feature information which is a parameter indicating the voice feature of each user;
A voice data dividing unit that reads a conference file from the voice data storage unit, and generates divided voice data in which the voice data in the read conference file is divided into speech sections in which one user is speaking;
Speaker recognition means for identifying a user who is a speaker from the divided voice data and voice feature information of each user stored in the speaker data storage means;
Voice text conversion means for generating text data obtained by converting the speech content into text from the divided voice data;
The speaker specified by the speaker recognition means is the sender, the participant in the conference data is the receiver, the meeting name in the conference data is the subject, and the text data generated by the speech text conversion means is the body text. To the other divided voice data extracted from the same voice data as newly generated message identification information, information indicating that it was generated based on the meeting, and message identification information of other related emails A mail conversion unit that generates an email in which the message identification information of the email generated based on the email is set, and writes the email in the email storage unit;
Search support device according to any one of claims 1 to 11, characterized by further comprising a.
前記会議データは、会議開催日時の情報をさらに含み、
前記音声データ分割手段は、前記分割音声データにより示される音声に対応した、前記音声データにより示される音声における冒頭からの経過時間を取得し、
前記メール変換手段は、前記会議データ内の会議開催日時に、前記音声データ分割手段が取得した経過時間を加算した日時をさらに設定した電子メールを生成する、
ことを特徴とする請求項12に記載の検索支援装置。
The conference data further includes information on the date and time of the conference.
The audio data dividing means acquires an elapsed time from the beginning of the sound indicated by the audio data corresponding to the audio indicated by the divided audio data,
The mail conversion means generates an e-mail that further sets a date and time obtained by adding an elapsed time acquired by the voice data dividing means to a meeting date and time in the meeting data.
The search support apparatus according to claim 12 , wherein:
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、  Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information associating the keywords with each other,
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、  A mail reading means for reading an e-mail from a mail storage means storing the e-mail;
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、  Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table When,
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、  If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
検索条件の入力を受ける受付手段と、  Accepting means for receiving search conditions,
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、  The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、  Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
を備え、  With
前記メールテーブルのレコードは、さらに、同報者の情報を含み、  The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、  The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、  For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、  The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とする検索支援装置。  A search support apparatus characterized by that.
前記分析結果格納手段は、さらに、スレッド識別情報と、当該スレッド識別情報で特定されるスレッドの開始日時の情報を示すスレッドテーブルを記憶し、
前記分析結果出力手段は、読み込んだ電子メールのスレッド識別情報を新たに生成したときに、当該スレッド識別情報と、当該電子メールのヘッダの情報から取得した日時の情報を示す開始日時とを対応付けてスレッドテーブルに書き込み、
前記検索手段は、さらに、前記キーワードテーブルから取得したスレッド識別情報に対応した開始日時の情報を読み出し、
前記出力制御手段は、入力を受けた期間条件に合致する開始日時のスレッド識別情報について前記ユーザまたは前記ユーザの組を出力する、
ことを特徴とする請求項1から請求項14のいずれか項に記載の検索支援装置。
The analysis result storage means further stores thread identification information and a thread table indicating information on a start date and time of the thread specified by the thread identification information,
The analysis result output means associates the thread identification information with the start date and time indicating the date and time information obtained from the header information of the email when the thread identification information of the read email is newly generated. Write to the thread table
The search means further reads out information of a start date corresponding to the thread identification information acquired from the keyword table,
The output control means outputs the user or the set of users for thread identification information of a start date and time that matches the period condition received.
Search support device according to any one of claims 14 claim 1, wherein the.
前記メールテーブルのレコードは、さらに、日付の情報を含み、
前記分析結果出力手段は、読込んだ電子メールのヘッダ情報から取得した日付の情報をさらに設定したレコードを前記メールテーブルに追加し、
前記検索手段は、前記取得したスレッド識別情報で特定される前記メールテーブルのレコードからさらに日付の情報を取得し、
出力制御手段は、前記検索手段により取得した各スレッド識別情報に対応する日付の情報に基づいて、所定の期間毎の電子メール数を示す情報を、各スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項15のいずれか項に記載の検索支援装置。
The mail table record further includes date information;
The analysis result output means adds a record further setting date information acquired from the header information of the read e-mail to the mail table,
The search means further acquires date information from the record of the mail table specified by the acquired thread identification information,
The output control means outputs, for each thread identification information, information indicating the number of e-mails for each predetermined period based on the date information corresponding to each thread identification information acquired by the search means.
Search support device according to any one of claims 1 to 15, characterized in that.
前記分析結果出力手段は、読込んだ前記電子メールから取得した件名、または、件名及び本文の情報を形態素解析した結果をキーワードとして前記キーワードテーブルに書き込む
ことを特徴とする請求項1から請求項16のいずれか項に記載の検索支援装置。
17. The analysis result output means writes a subject obtained from the read electronic mail or a result of morphological analysis of subject and body information as a keyword in the keyword table. The search support device according to any one of the above.
前記分析結果出力手段は、形態素解析した結果のうち所定の品詞のものをキーワードとして前記キーワードテーブルに書き込む
ことを特徴とする請求項17に記載の検索支援装置。
The search support apparatus according to claim 17, wherein the analysis result output means writes a result of morphological analysis with a predetermined part of speech as a keyword in the keyword table.
前記分析結果出力手段は、形態素解析した結果のうち、予め決められた不要な文字列を除いたものを、キーワードとして前記キーワードテーブルに書き込む
ことを特徴とする請求項17または請求項18に記載の検索支援装置。
The analysis result output means writes a result obtained by removing a predetermined unnecessary character string from the results of morphological analysis as a keyword in the keyword table. Search support device.
ユーザを特定する情報と、当該ユーザの名前とを対応付けた情報を示す人物テーブルを記憶する人物情報格納手段と、
前記メール読込み手段により読込まれた電子メールの本文の情報から、自己紹介に用いられる所定の語句が含まれている行を抽出し、抽出した行を形態素解析して得られた語句のうち固有名詞の語句を選択し、選択した語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込む人物情報生成手段とをさらに備え、
前記出力制御手段は、出力対象の前記ユーザを特定する情報、または、出力対象の前記ユーザの組を構成するユーザを特定する情報に対応して前記人物テーブルから読み出されたユーザの名前を出力する、
ことを特徴とする請求項1から請求項19のいずれか項に記載の検索支援装置。
Person information storage means for storing a person table indicating information that associates information for identifying a user with the name of the user;
From the information in the body of the email read by the mail reading means, extract a line containing a predetermined word used for self-introduction, and a proper noun among words obtained by morphological analysis of the extracted line A personal information generating unit that associates the selected phrase with information identifying the sender acquired from the read header information of the e-mail and writes it in the person table;
The output control means outputs the name of the user read from the person table corresponding to the information specifying the user to be output or the information specifying the users constituting the set of users to be output To
Search support device according to any one of claims 19 claim 1, wherein the.
前記人物情報生成手段は、前記電子メールの本文の情報に設定されている先頭より所定行数までの行から、自己紹介に用いられる所定の語句が含まれている行を抽出する
ことを特徴とする請求項20に記載の検索支援装置。
The person information generating means extracts a line including a predetermined word and phrase used for self-introduction from a line from the beginning to a predetermined number of lines set in the body information of the e-mail. The search support device according to claim 20.
前記人物情報生成手段は、自己紹介に用いられる所定の語句が含まれているとして抽出した行から区切り文字の前または後の語句を抽出して形態素解析を行い、固有名詞として得られた語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込む
ことを特徴とする請求項20または請求項21に記載の検索支援装置。
The person information generating means extracts a phrase before or after a delimiter from a line extracted as including a predetermined phrase used for self-introduction, performs morphological analysis, and obtains a phrase obtained as a proper noun and The search support apparatus according to claim 20 or 21, wherein the information identifying the sender acquired from the read header information of the electronic mail is written in the person table in association with the information.
前記人物情報生成手段は、送信者を特定する情報として、読込んだ前記電子メールのヘッダ情報から取得した送信者の電子メールアドレスを前記人物テーブルに書き込む
ことを特徴とする請求項20から請求項22のいずれか項に記載の検索支援装置。
21. The person information generation means writes the sender's e-mail address acquired from the read header information of the e-mail as information specifying the sender in the person table. search support device according to any one of 22.
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、
メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、
メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、
分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、
受付手段が、検索条件の入力を受け、
検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、
出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする検索支援方法。
Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information that associates the keywords with each other, presenting an important person related to the desired information, and a search support method used in a search support apparatus that supports the search of the information Because
The email reading means reads the email from the email storage means storing the email,
The mail analysis means acquires message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and whether the acquired message identification information is registered in the mail table. Judgment
When the analysis result output means determines that the mail analysis means is not registered, it newly generates thread identification information of the read e-mail, and when it is determined that it is registered, The thread identification information is acquired from the mail table record specified by the message identification information of other related emails, the message identification information acquired from the header information of the read email, the sender and the receiver, and newly A keyword that is a result of morphological analysis of information obtained from the read e-mail, and a record in which the generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table, and the thread Write in the keyword table in association with the identification information,
The receiving means receives the search conditions and
The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and is specified by the thread identification information for each acquired thread identification information. Obtaining a user set as a sender or a receiver from the record in the mail table and the number of the user set as a sender or a receiver,
Output control means, the number acquired by the searching means includes a step of outputting more user than a predetermined condition for each thread identification information,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remember emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A search support method characterized by that.
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、  Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information that associates the keywords with each other, presenting an important person related to the desired information, and a search support method used in a search support apparatus that supports the search of the information Because
メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、  The email reading means reads the email from the email storage means storing the email,
メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、  The mail analysis means acquires message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and whether the acquired message identification information is registered in the mail table. Judgment
分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、  When the analysis result output means determines that the mail analysis means is not registered, it newly generates thread identification information of the read e-mail, and when it is determined that it is registered, The thread identification information is acquired from the mail table record specified by the message identification information of other related emails, the message identification information acquired from the header information of the read email, the sender and the receiver, and newly A keyword that is a result of morphological analysis of information obtained from the read e-mail, and a record in which the generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table, and the thread Write in the keyword table in association with the identification information,
受付手段が、検索条件の入力を受け、  The receiving means receives the search conditions and
検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、  The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and is specified by the thread identification information for each acquired thread identification information. Obtaining a user set as a sender or a receiver from the record in the mail table and the number of the user set as a sender or a receiver,
出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、  The output control means includes a step of outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information,

前記メールテーブルのレコードは、さらに、同報者の情報を含み、  The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、  The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、  For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、  The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とする検索支援方法。A search support method characterized by that.
所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、
検索条件の入力を受ける受付手段、
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、
として機能させ
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶しており、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とするコンピュータプログラム。
A computer used as a search support device that presents an important person related to desired information and supports search of the information,
Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information in which keywords are associated with each other,
Mail reading means for reading e-mail from mail storing means for storing e-mail;
Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table ,
If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
Accepting means for receiving search conditions,
The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for obtaining a user who is set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
To function as,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remembers emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A computer program characterized by the above.
所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、  A computer used as a search support device that presents an important person related to desired information and supports search of the information,
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、  Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information in which keywords are associated with each other,
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、  Mail reading means for reading e-mail from mail storing means for storing e-mail;
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、  Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table ,
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、  If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
検索条件の入力を受ける受付手段、  Accepting means for receiving search conditions,
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、  The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、  Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
として機能させ、  Function as
前記メールテーブルのレコードは、さらに、同報者の情報を含み、  The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、  The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、  For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、  The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とするコンピュータプログラム。  A computer program characterized by the above.
JP2009029158A 2008-02-12 2009-02-10 Search support apparatus and method, and computer program Active JP5348754B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009029158A JP5348754B2 (en) 2008-02-12 2009-02-10 Search support apparatus and method, and computer program

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2008031033 2008-02-12
JP2008031033 2008-02-12
JP2008222065 2008-08-29
JP2008222065 2008-08-29
JP2009029158A JP5348754B2 (en) 2008-02-12 2009-02-10 Search support apparatus and method, and computer program

Publications (2)

Publication Number Publication Date
JP2010079872A JP2010079872A (en) 2010-04-08
JP5348754B2 true JP5348754B2 (en) 2013-11-20

Family

ID=42210192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009029158A Active JP5348754B2 (en) 2008-02-12 2009-02-10 Search support apparatus and method, and computer program

Country Status (1)

Country Link
JP (1) JP5348754B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014069582A1 (en) 2012-11-05 2014-05-08 日本電気株式会社 Related information presentation device, and related information presentation method
JP6021272B2 (en) * 2014-07-08 2016-11-09 京セラドキュメントソリューションズ株式会社 Information processing system and information processing method
JP7028179B2 (en) 2016-09-29 2022-03-02 日本電気株式会社 Information processing equipment, information processing methods and computer programs

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000066970A (en) * 1998-08-19 2000-03-03 Nec Corp Personal relationship information management system, its method and recording medium
JP2000112931A (en) * 1998-10-08 2000-04-21 Toshiba Corp Intelligent conference support system
JP3446886B2 (en) * 1999-12-21 2003-09-16 日本電気株式会社 Personal network data management system and personal network search method
JP2002185530A (en) * 2000-12-11 2002-06-28 Hitachi Ltd Mail participant prediction system
JP2002351888A (en) * 2001-05-25 2002-12-06 Osaka Gas Co Ltd Retrieval method, retrieval system, central unit, and computer program
JP2004046680A (en) * 2002-07-15 2004-02-12 Recruit Co Ltd Method and system for determinining communication pattern
JP4378131B2 (en) * 2003-08-12 2009-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション Information processing apparatus, information processing system, database search method, and program

Also Published As

Publication number Publication date
JP2010079872A (en) 2010-04-08

Similar Documents

Publication Publication Date Title
US8781080B2 (en) Systems and methods for presenting audio messages
US7693267B2 (en) Personalized user specific grammars
JP5671557B2 (en) System including client computing device, method of tagging media objects, and method of searching a digital database including audio tagged media objects
US20080281927A1 (en) Summarization tool and method for a dialogue sequence
KR101513888B1 (en) Apparatus and method for generating multimedia email
US8230034B2 (en) Automatic display of email distribution lists
EP2680165B1 (en) System and method to perform textual queries on voice communications
US20190050406A1 (en) Intelligent query system for attachments
US20200137224A1 (en) Comprehensive log derivation using a cognitive system
JP2012514938A5 (en)
WO2016163028A1 (en) Utterance presentation device, utterance presentation method, and program
CN102984050A (en) Method, client and system for searching voices in instant messaging
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
JP5348754B2 (en) Search support apparatus and method, and computer program
JP5611155B2 (en) Content tagging program, server and terminal
US20230163988A1 (en) Computer-implemented system and method for providing an artificial intelligence powered digital meeting assistant
US10733981B2 (en) Digital messaging system
JPWO2018061824A1 (en) Information processing apparatus, information processing method, and computer program
JP2001014309A (en) Device and method for converting character and recording medium recording program for character conversion
US20050134938A1 (en) Systems and methods for tracking communication
CN113495941A (en) Method and apparatus for retrieving content items
Gruber Communication in the New Media
JPH1146212A (en) Electronic mail distribution system and record medium storing program to activate computer as the system and readable by the computer
JPH10177529A (en) Electronic incoming guidance method and device therefor, and storage medium storing electronic mail incoming guidance program
Hunter et al. Keeping your threads untangled: an intelligent system for semi-automatically organising corporate messages by content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5348754

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250