JP5348754B2 - Search support apparatus and method, and computer program - Google Patents
Search support apparatus and method, and computer program Download PDFInfo
- Publication number
- JP5348754B2 JP5348754B2 JP2009029158A JP2009029158A JP5348754B2 JP 5348754 B2 JP5348754 B2 JP 5348754B2 JP 2009029158 A JP2009029158 A JP 2009029158A JP 2009029158 A JP2009029158 A JP 2009029158A JP 5348754 B2 JP5348754 B2 JP 5348754B2
- Authority
- JP
- Japan
- Prior art keywords
- identification information
- information
- search
- thread
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
Description
本発明は、検索支援装置及び方法、ならびに、コンピュータプログラムに関する。 The present invention relates to a search support apparatus and method, and a computer program.
近年の情報化社会においては、蓄積されている膨大な量の情報から、所望の情報を見出すことが困難となっている。会社などの組織内においては、蓄積された情報を有効活用するためには、単に有効な情報を蓄積するだけではなく、その蓄積された情報を体系的に整理することが必要不可欠である。従来は、共有すべき情報を、ファイルサーバ等の情報共有システムの適切と思われるカテゴリに対応したディレクトリに手動で保存することにより情報共有する方法が一般的であった。
一方、特許文献1には、蓄積された情報としての電子メール(以下、単に「メール」と記載)の中から、返信メール(Re:のメール)などの関連する一連のメールを抽出し、一連のメールについての送信経路と、送信者、受信者などの関与者に関する情報を表示するシステムについて記載されている。また、特許文献2には、蓄積されたメールの情報から、送信元、宛先となっている人物の属性を生成するシステムが記載されている。
In the information-oriented society in recent years, it has been difficult to find desired information from a huge amount of accumulated information. In an organization such as a company, in order to effectively use accumulated information, it is indispensable not only to accumulate valid information but also to systematically organize the accumulated information. Conventionally, a method for sharing information by manually storing information to be shared in a directory corresponding to a category considered to be appropriate for an information sharing system such as a file server has been generally used.
On the other hand, in
上述したように、情報共有システムの適切と思われるカテゴリに対応したディレクトリに情報を手動で保存することで情報共有する方法では、全ての情報を適切なカテゴリに分類して保存することは困難であり、また、複数のカテゴリに属する場合にうまく分類ができないおそれもある。また、適切なカテゴリに情報が蓄積された場合であっても、時間の経過によって変化する関連人物や関連組織などの情報については反映されない。さらには、蓄積された情報が、知りたいことに関連する情報全てではないことがほとんどである。これらのことは、ある検索対象について知りたいと思っている者にとって、その検索対象に関連する情報をすぐに見つけ出すことのできない原因となっている。そこで、ある検索対象について知りたいと思った場合、その検索対象に最も関連する人物を探し出して問い合わせることが、早く、そして確実に情報を得る方法であるといえる。
しかし、特許文献1、2の技術においては、検索対象について誰が最も関連する人物であるかの情報を検索者に提示するものではない。
As described above, it is difficult to classify and store all information in appropriate categories by manually storing information in a directory corresponding to a category considered appropriate in the information sharing system. There is also a possibility that classification cannot be performed well when belonging to a plurality of categories. Even if information is stored in an appropriate category, information such as related persons and related organizations that change with the passage of time is not reflected. Furthermore, in most cases, the accumulated information is not all information related to what is desired to be known. These are the reasons why a person who wants to know a certain search target cannot quickly find information related to the search target. So, if you want to know about a certain search target, finding the person most relevant to the search target and making an inquiry can be said to be a quick and reliable way to obtain information.
However, in the techniques of
本発明は、上記問題を解決すべくなされたもので、その目的は、コミュニティ情報としての電子メールを利用して、検索対象について関連性の高い人物を検出し、提示することのできる検索支援装置及び方法、ならびに、コンピュータプログラムを提供することにある。 The present invention has been made to solve the above problems, and a purpose of the present invention is to provide a search support apparatus capable of detecting and presenting a highly relevant person for a search target by using an electronic mail as community information. And a method, and a computer program.
上述した課題を解決するために、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、検索条件の入力を受ける受付手段と、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、を備え、前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援装置である。 In order to solve the above-described problem, the present invention provides a record including at least message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and information on a sender and a receiver. And an analysis result storing means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and a mail storage means for storing the e-mail. Whether or not the message identification information of other related emails is acquired from the information of the email reading unit to be read and the header information of the email read by the email reading unit, and whether the acquired message identification information is registered in the email table E-mail analyzing means for judging If it is determined, the thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the mail table specified by the message identification information of the other related e-mail Thread identification information is acquired from the record of the message, the message identification information acquired from the header information of the read email, the sender and the receiver, and the newly generated thread identification information or the thread identification information acquired from the mail table A keyword that is a result of morphological analysis of information obtained from the read e-mail, and an analysis result output unit that writes to the keyword table in association with the thread identification information; Receiving means for inputting search conditions, and the keyword table The thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired, and for each acquired thread identification information, the sender or the record from the mail table record specified by the thread identification information Search means for acquiring a user set as a receiver, the number of the user set as a sender or receiver, and thread identification information indicating a user whose number acquired by the search means exceeds a predetermined condition Output control means for each output , the mail storage means, the user who is the speaker in the conference as the sender, the participants of the conference as the receiver, the conference name of the conference as the subject, The utterance content of the user who is the speaker is set in the text, and includes information indicating that it was generated based on the conference, and other related As the message identification information of the child mail, an email in which the message identification information of another email in which other utterance contents in the conference are set is stored, and the analysis result output means is based on the conference in the read email If the information indicating that the information is generated is set, the information to be generated based on the conference is further set in the record to be added to the mail table, and the search unit acquires each acquired thread identification For each information, each record set in the mail table specified by the thread identification information is specified, and information indicating that the record is generated based on the conference is set in each specified record. A user who is given a given point to a user who is set as a sender in a record and who is set as a receiver When information lower than the predetermined point is given and information indicating that it was generated based on the conference is not set, it is set as the user and receiver set as the sender in each record A point that is weighted more than the predetermined point is given to the user, and the output control unit outputs, for each thread identification information, information indicating a user whose total of points given by the search unit is greater than a predetermined condition. This is a search support device.
また、本発明は、上述する検索支援装置であって、前記出力制御手段は、前記検索手段により取得した数が所定の条件より多いユーザを、当該ユーザが設定されている数に対応した順序で、スレッド識別情報毎に出力することを特徴とする。 Further, the present invention is the above-described search support apparatus, wherein the output control unit selects a user whose number acquired by the search unit is greater than a predetermined condition in an order corresponding to the number of the set user. And output for each thread identification information.
また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、前記出力制御手段は、前記検索手段により取得したユーザの組をスレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver is acquired from a record in the mail table specified by the thread identification information, and the output control means is acquired by the search means The set of users is output for each thread identification information.
また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組を取得し、前記出力制御手段は、前記検索手段により取得したユーザの組に基づいて、当該取得したユーザの組に含まれる複数ユーザ間の相関を示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver is acquired from a record in the mail table specified by the thread identification information, and the output control means is acquired by the search means Based on the set of users, information indicating the correlation between a plurality of users included in the acquired set of users is output for each thread identification information.
また、本発明は、上述する検索支援装置であって、前記検索手段は、前記スレッド識別情報で特定される前記メールテーブルのレコードから、さらに、前記ユーザの組が設定されている数を取得し、前記出力制御手段は、さらに、ユーザの組が設定されている数に対応した情報を出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means further acquires the number of sets of the user set from the mail table record specified by the thread identification information. The output control means further outputs information corresponding to a set number of users.
また、本発明は、上述する検索支援装置であって、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与するとともに、同報者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the above-described search support device, wherein the mail table record further includes broadcaster information, and the analysis result output means is acquired from the header information of the read electronic mail. A record in which the information of the broadcaster is further set is added to the mail table, and the search means sends a sender to each record of the mail table specified by the thread identification information for each acquired thread identification information. Giving a predetermined point to a user set as a user and a user set as a recipient, and giving a point weighted to a predetermined weight from the predetermined point to a user set as a broadcaster, The output control unit is configured to display information indicating a user whose total points given by the search unit is greater than a predetermined condition as thread identification information. And outputs each, characterized in that.
また、本発明は、上述する検索支援装置であって、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに受信者として設定されているユーザに所定のポイントを付与するとともに、送信者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means is set as a receiver for each record of the mail table specified by the thread identification information for each acquired thread identification information. A predetermined point is given to a user who is set as a sender, a point weighted with a predetermined weight from the predetermined point is given to a user set as a sender, and the output control means is a total of the points given by the search means Is output for each thread identification information, indicating information indicating that there are more users than the predetermined condition.
また、本発明は、上述する検索支援装置であって、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに設定されている受信者がメーリングリストのアドレスである場合は、送信者として設定されているユーザに所定のポイントを付与し、メーリングリストのアドレスでない場合は、送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザをスレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means is a receiver set in each record of the mail table specified by the thread identification information for each acquired thread identification information. If the address is a mailing list address, a predetermined point is given to the user set as the sender, and if it is not the mailing list address, the user set as the sender and the user set as the receiver are given. Predetermined points are assigned, and the output control means outputs, for each thread identification information, a user whose total number of points given by the search means exceeds a predetermined condition.
また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段と、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、検索条件の入力を受ける受付手段と、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、を備え、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援装置である。
また、本発明は、上述する検索支援装置であって、前記分析結果格納手段は、さらに、スレッド識別情報と、当該スレッド識別情報で特定されるスレッドの開始日時の情報を示すスレッドテーブルを記憶し、前記分析結果出力手段は、読み込んだ電子メールのスレッド識別情報を新たに生成したときに、当該スレッド識別情報と、当該電子メールのヘッダの情報から取得した日時の情報を示す開始日時とを対応付けてスレッドテーブルに書き込み、前記検索手段は、さらに、前記キーワードテーブルから取得したスレッド識別情報に対応した開始日時の情報を読み出し、前記出力制御手段は、入力を受けた期間条件に合致する開始日時のスレッド識別情報について前記ユーザまたは前記ユーザの組を出力する、ことを特徴とする。
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and Analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, mail reading means for reading an email from a mail storage means for storing the email, and Mail analysis means for acquiring message identification information of other related electronic mails from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table; If the e-mail analysis means determines that it is not registered, If it is determined that a new email thread identification information is registered and registered, the thread identification information is obtained from the record in the mail table specified by the message identification information of the other related email. And a record in which the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or the thread identification information acquired from the mail table are set in the mail table. And a keyword that is a result of morphological analysis of information obtained from the read e-mail, an analysis result output means that writes the keyword identification information in association with the thread identification information, and a reception that receives input of search conditions Means and the receiving means from the keyword table. The thread identification information of the keyword that matches the search word indicated by the digit search condition is acquired, and for each acquired thread identification information, set as a sender or a receiver from the record of the mail table specified by the thread identification information For each thread identification information, a search means for acquiring the number of users who have been set as a sender or a receiver, and a user whose number acquired by the search means exceeds a predetermined condition Output control means, wherein the record of the mail table further includes information on the broadcaster, and the analysis result output means includes information on the broadcaster obtained from the header information of the read electronic mail. Further, the set record is added to the mail table, and the search means for each acquired thread identification information. A predetermined administrator search corresponding point is given to a user set as a sender and a user set as a receiver in each record of the mail table specified by different information, and set as a broadcaster. A higher administrator search support point than the predetermined administrator search support point, and the output control means displays information indicating a user whose total of the administrator search support points exceeds a predetermined condition as an administrator. The search support apparatus is characterized in that it outputs each thread identification information.
Further, the present invention is the search support apparatus described above, wherein the analysis result storage unit further stores thread identification information and a thread table indicating information on a start date and time of a thread specified by the thread identification information. The analysis result output means associates the thread identification information with the start date and time indicating the date and time information acquired from the header information of the email when the thread identification information of the read email is newly generated. In addition, the search means further reads out information on the start date and time corresponding to the thread identification information acquired from the keyword table, and the output control means reads the start date and time that matches the received period condition The user or the set of users is output for the thread identification information.
また、本発明は、上述する検索支援装置であって、前記メールテーブルのレコードは、さらに、日付の情報を含み、前記分析結果出力手段は、読込んだ電子メールのヘッダ情報から取得した日付の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、前記取得したスレッド識別情報で特定される前記メールテーブルのレコードからさらに日付の情報を取得し、出力制御手段は、前記検索手段により取得した各スレッド識別情報に対応する日付の情報に基づいて、所定の期間毎の電子メール数を示す情報を、各スレッド識別情報毎に出力する、ことを特徴とする。 Further, the present invention is the above-described search support device, wherein the record of the mail table further includes date information, and the analysis result output means stores the date acquired from the header information of the read electronic mail. A record in which information is further set is added to the mail table, the search means further acquires date information from the record in the mail table specified by the acquired thread identification information, and the output control means is the search Based on the date information corresponding to each thread identification information acquired by the means, information indicating the number of e-mails for each predetermined period is output for each thread identification information.
また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、読込んだ前記電子メールから取得した件名、または、件名及び本文の情報を形態素解析した結果をキーワードとして前記キーワードテーブルに書き込むことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the analysis result output means uses the subject obtained from the read e-mail or the result of morphological analysis of the subject and text information as a keyword. Write to table.
また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、形態素解析した結果のうち所定の品詞のものをキーワードとして前記キーワードテーブルに書き込むことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the analysis result output means writes a result of a morphological analysis with a predetermined part of speech as a keyword in the keyword table.
また、本発明は、上述する検索支援装置であって、前記分析結果出力手段は、形態素解析した結果のうち、予め決められた不要な文字列を除いたものを、キーワードとして前記キーワードテーブルに書き込むことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the analysis result output means writes a result obtained by removing a predetermined unnecessary character string from the result of morphological analysis as a keyword in the keyword table. It is characterized by that.
また、本発明は、上述する検索支援装置であって、ユーザを特定する情報と、当該ユーザの名前とを対応付けた情報を示す人物テーブルを記憶する人物情報格納手段と、前記メール読込み手段により読込まれた電子メールの本文の情報から、自己紹介に用いられる所定の語句が含まれている行を抽出し、抽出した行を形態素解析して得られた語句のうち固有名詞の語句を選択し、選択した語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込む人物情報生成手段とをさらに備え、前記出力制御手段は、出力対象の前記ユーザを特定する情報、または、出力対象の前記ユーザの組を構成するユーザを特定する情報に対応して前記人物テーブルから読み出されたユーザの名前を出力する、ことを特徴とする。 In addition, the present invention provides the above-described search support device, comprising: a person information storage unit that stores a person table indicating information that associates information for identifying a user and the name of the user; and the mail reading unit. From the information in the body text of the read e-mail, extract the line that contains the predetermined word used for self-introduction, and select the proper noun word from the words obtained by morphological analysis of the extracted line And a person information generating means for associating the selected word and the information for identifying the sender acquired from the read header information of the electronic mail and writing it in the person table, wherein the output control means outputs The name of the user read from the person table corresponding to the information specifying the target user or the information specifying the users constituting the set of users to be output Output, characterized in that.
また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、前記電子メールの本文の情報に設定されている先頭より所定行数までの行から、自己紹介に用いられる所定の語句が含まれている行を抽出することを特徴とする。 Also, the present invention is the search support apparatus described above, wherein the person information generating means is a predetermined number used for self-introduction from a line up to a predetermined number of lines from the head set in the information of the text of the electronic mail. It is characterized in that a line including the word is extracted.
また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、自己紹介に用いられる所定の語句が含まれているとして抽出した行から区切り文字の前または後の語句を抽出して形態素解析を行い、固有名詞として得られた語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込むことを特徴とする。 The present invention is also the search support apparatus described above, wherein the person information generating means extracts a phrase before or after a delimiter from a line extracted as including a predetermined phrase used for self-introduction. Then, morphological analysis is performed, and the phrase obtained as the proper noun is written in the person table in association with the information specifying the sender acquired from the read header information of the electronic mail.
また、本発明は、上述する検索支援装置であって、前記人物情報生成手段は、送信者を特定する情報として、読込んだ前記電子メールのヘッダ情報から取得した送信者の電子メールアドレスを前記人物テーブルに書き込むことを特徴とする。 Further, the present invention is the above-described search support device, wherein the person information generating means uses the sender's email address acquired from the header information of the read email as information for identifying the sender. It is characterized by writing in the person table.
また、本発明は、上述する検索支援装置であって、前記検索手段は、前記特定した各レコードに会議の音声に基づいて生成したデータであることを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザのみに前記所定のポイントを付与することを特徴とする。 Further, the present invention is the above-described search support device, wherein the search means includes information indicating that the data generated based on the audio of the conference is set in each of the specified records. The predetermined point is given only to a user set as a sender in each record.
また、本発明は、上述する検索支援装置であって、前記検索手段は、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報について、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者及び受信者として設定されているユーザの組と、当該ユーザの組が設定されている数を取得し、当該レコードに会議に基づき生成されたことを示す情報が設定されている場合は、前記各ユーザの組に、所定のポイントを当該ユーザの組が設定されている数に応じて付与し、当該レコードに会議に基づき生成されたことを示す情報が設定されていない場合は、前記各ユーザの組に、前記所定のポイントより重み付けしたポイントを当該ユーザの組が設定されている数に応じて付与し、前記出力制御手段は、各ユーザの組のポイントに対応した情報を出力する、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the search means acquires, from the keyword table, thread identification information of a keyword that matches a search word indicated by a search condition received by the reception means, For each acquired thread identification information, a set of users set as a sender and a receiver and the number of sets of the set of users are acquired from the mail table record specified by the thread identification information. When the information indicating that the record is generated based on the conference is set in the record, a predetermined point is given to the set of each user according to the number of the set of the user, When information indicating that the record is generated based on the conference is not set, the set of each user is weighted from the predetermined point. The poppy points assigned depending on the number which is set set of the user, the output control means outputs information corresponding to the set point of each user, and wherein the.
また、本発明は、上述する検索支援装置であって、分析結果出力手段は、読込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、読込んだ電子メールから得られる情報を形態素解析した結果をキーワード候補とし、同一のスレッド識別情報に対応した電子メールから当該キーワード候補が所定回数以上得られた場合に、当該キーワード候補と当該スレッド識別情報とを対応づけて前記キーワードテーブルに書き込む、ことを特徴とする。 Further, the present invention is the search support apparatus described above, wherein the analysis result output means starts from the read e-mail when information indicating that the read e-mail is generated based on the conference is set. The result of morphological analysis of the obtained information is used as a keyword candidate, and when the keyword candidate is obtained a predetermined number of times or more from an email corresponding to the same thread identification information, the keyword candidate is associated with the thread identification information. It writes to the said keyword table, It is characterized by the above-mentioned.
また、本発明は、上述する検索支援装置であって、会議名と、会議中の音声の音声データと、会議に参加したユーザを示す参加者とを含む会議データを記憶する音声データ記憶手段と、各ユーザの音声の特徴を示すパラメータである音声特徴情報を記憶する発話者データ記憶手段と、前記音声データ記憶手段から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人のユーザが発言している発話区間に区切った分割音声データを生成する音声データ分割手段と、前記分割音声データと、前記発話者データ記憶手段に記憶されている各ユーザの音声特徴情報とから発話者であるユーザを特定する発話者認識手段と、前記分割音声データから、発話内容をテキスト化したテキストデータを生成する音声テキスト変換手段と、前記発話者認識手段が特定した発話者を送信者に、前記会議データ内の参加者を受信者に、前記会議データ内の会議名を件名に、前記音声テキスト変換手段が生成したテキストデータを本文に設定するとともに、新たに生成したメッセージ識別情報と、会議に基づき生成されたことを示す情報と、関連する他の電子メールのメッセージ識別情報として、同じ音声データから抽出した他の分割音声データに基づいて生成した電子メールのメッセージ識別情報とを設定した電子メールを生成し、前記メール記憶手段へ書き込むメール変換手段と、をさらに備えることを特徴とする。 The present invention is also the search support apparatus described above, wherein the audio data storage means stores conference data including a conference name, audio data of audio during the conference, and participants indicating users who have participated in the conference; Utterer data storage means for storing voice feature information, which is a parameter indicating the voice characteristics of each user, a conference file is read from the voice data storage means, and the voice data in the read conference file is stored as one user. The voice data dividing means for generating the divided voice data divided into the speech sections in which the voice is spoken, the divided voice data, and the voice feature information of each user stored in the speaker data storage means, Utterer recognition means for identifying a certain user, speech text conversion means for generating text data in which the speech content is converted into text from the divided speech data, The text specified by the spoken word recognition means is sent to the sender, the participant in the conference data is the recipient, the name of the meeting in the conference data is the subject, and the text data generated by the speech text conversion means is the body text. To the other divided voice data extracted from the same voice data as newly generated message identification information, information indicating that it was generated based on the meeting, and message identification information of other related emails And a mail conversion unit that generates an e-mail in which the message identification information of the e-mail generated based on the e-mail is set and writes the generated e-mail in the mail storage unit.
また、本発明は、上述する検索支援装置であって、前記会議データは、会議開催日時の情報をさらに含み、前記音声データ分割手段は、前記分割音声データにより示される音声に対応した、前記音声データにより示される音声における冒頭からの経過時間を取得し、前記メール変換手段は、前記会議データ内の会議開催日時に、前記音声データ分割手段が取得した経過時間を加算した日時をさらに設定した電子メールを生成する、ことを特徴とする Further, the present invention is the search support apparatus described above, wherein the conference data further includes information on a meeting date and time, and the audio data dividing unit corresponds to the audio indicated by the divided audio data. An elapsed time from the beginning of the voice indicated by the data is acquired, and the mail converting means is an electronic device further setting a date and time obtained by adding the elapsed time acquired by the voice data dividing means to the meeting date and time in the meeting data. Generate mail
また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、受付手段が、検索条件の入力を受け、検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援方法である。
また、本発明は、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段を備え、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置に用いられる検索支援方法であって、メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、受付手段が、検索条件の入力を受け、検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とする検索支援方法である。
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and A search support apparatus comprising analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and presenting an important person related to desired information to assist the search of the information The mail reading means reads the e-mail from the mail storage means storing the e-mail, and the mail analyzing means uses the e-mail header information read by the mail reading means. To obtain the message identification information of other related e-mails from Is registered in the mail table, and if the analysis result output means determines that it is not registered by the mail analysis means, it newly generates thread identification information of the read electronic mail. If it is determined that the message is registered, the thread identification information is obtained from the record of the mail table specified by the message identification information of the other related email, and is obtained from the header information of the read email. A record in which message identification information, sender and receiver, and newly generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table and obtained from the read e-mail. The keyword, which is the result of morphological analysis of the information, is associated with the thread identification information before Writing to the keyword table, the accepting means receives the input of the search condition, the search means obtains the thread identification information of the keyword that matches the search word indicated by the search condition accepted by the accepting means from the keyword table, For each acquired thread identification information, the number of users set as senders or receivers from the mail table record specified by the thread identification information, and the number of users set as senders or receivers And the output control means outputs a user whose number obtained by the search means is greater than a predetermined condition for each thread identification information , and the mail storage means is a user who is a speaker in a meeting. The sender, the participant of the conference as the receiver, the conference name of the conference as the subject, and the user who is the speaker. The other utterance contents in the conference are set as the message identification information of other related e-mails including information indicating that the utterance contents of the user are set in the text and generated based on the meeting. The e-mail storing the message identification information of the e-mail is stored, and the analysis result output means adds to the e-mail table when information indicating that the read e-mail is generated based on the meeting is set. In the record, the information indicating that it is generated based on the conference is further set, and the search means sets each record set in the mail table specified by the thread identification information for each acquired thread identification information. If the information indicating that the record was generated based on the meeting is set in each specified record, the sender Is given to the user who is set as the recipient, and the user who is set as the recipient is given a point lower than the predetermined point, and information indicating that the user has been generated based on the conference is set. If not, the user who is set as the sender and the user who is set as the receiver in each record is given a point weighted more than the predetermined point, and the output control means is given by the search means The search support method is characterized in that information indicating a user whose total number of points is greater than a predetermined condition is output for each thread identification information .
Further, the present invention is a mail table comprising message identification information for identifying each electronic mail, thread identification information for identifying a thread to which the electronic mail belongs, and a record including at least information on a sender and a receiver, and A search support apparatus comprising analysis result storage means for storing a keyword table indicating information in which thread identification information of each thread is associated with a keyword, and presenting an important person related to desired information to assist the search of the information The mail reading means reads the e-mail from the mail storage means storing the e-mail, and the mail analyzing means uses the e-mail header information read by the mail reading means. To obtain the message identification information of other related e-mails from Is registered in the mail table, and if the analysis result output means determines that it is not registered by the mail analysis means, it newly generates thread identification information of the read electronic mail. If it is determined that the message is registered, the thread identification information is obtained from the record of the mail table specified by the message identification information of the other related email, and is obtained from the header information of the read email. A record in which message identification information, sender and receiver, and newly generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table and obtained from the read e-mail. The keyword, which is the result of morphological analysis of the information, is associated with the thread identification information before Writing to the keyword table, the accepting means receives the input of the search condition, the search means obtains the thread identification information of the keyword that matches the search word indicated by the search condition accepted by the accepting means from the keyword table, For each acquired thread identification information, the number of users set as senders or receivers from the mail table record specified by the thread identification information, and the number of users set as senders or receivers And the output control means outputs a user whose number obtained by the search means is greater than a predetermined condition for each thread identification information, and the mail table record further includes a broadcaster's record. The analysis result output means includes the information of the broadcaster acquired from the header information of the read e-mail. A record in which information is further set is added to the mail table, and the search means is set as a sender in each record of the mail table specified by the thread identification information for each acquired thread identification information. A predetermined administrator search support point is given to a user set as a user and a recipient, and an administrator search support point higher than the predetermined administrator search support point is set to a user set as a broadcaster In the search support method, the output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search support points is greater than a predetermined condition.
また、本発明は、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手2段、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、検索条件の入力を受ける受付手段、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、として機能させ、前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶しており、前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、ことを特徴とするコンピュータプログラムである。
また、本発明は、所望の情報に関する重要人物を提示して、前記情報の検索を支援する検索支援装置として用いられるコンピュータを、各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、検索条件の入力を受ける受付手段、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、として機能させ、前記メールテーブルのレコードは、さらに、同報者の情報を含み、前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、ことを特徴とするコンピュータプログラムである。
In addition, the present invention provides a computer used as a search support apparatus that presents an important person related to desired information and supports the search of the information, message identification information for identifying each electronic mail, and a thread to which the electronic mail belongs Analysis that stores a thread identification information that identifies a message, a mail table that includes at least a record including information on the sender and the receiver, and a keyword table that indicates information that associates the thread identification information of each thread with a keyword. Result storage means, two-stage mail readers for reading e-mails from mail storage means for storing e-mails, and other related e-mail messages from information on headers of e-mails read by the e-mail reading means Acquires identification information, and the acquired message identification information is registered in the mail table. If it is determined by the mail analysis means that determines whether or not it is registered, it is determined that the thread identification information of the read email is newly generated and registered. In this case, the thread identification information is acquired from the record of the mail table specified by the message identification information of the other related electronic mail, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver And a keyword that is a result of morphological analysis of information obtained from the read e-mail while adding a record in which the newly generated thread identification information or thread identification information acquired from the mail table is set to the mail table And the amount to be written to the keyword table in association with the thread identification information From the result output means, the receiving means that receives the input of the search condition, and the keyword table, the thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired, and for each acquired thread identification information Search means for acquiring a user set as a sender or a receiver from the record of the mail table specified by the thread identification information, and a number of the user set as a sender or a receiver, The mail storage means functions as an output control means for outputting, for each thread identification information, a user whose number obtained by the search means is greater than a predetermined condition , and the mail storage means uses the user who is a speaker in the conference as the sender. With the participants as recipients, the meeting name of the conference as the subject, and the utterance content of the user who is the speaker Message identification information of other e-mails set with other utterance contents in the conference as message identification information of other related e-mails The set e-mail is stored, and when the information indicating that the analysis result output means is generated based on the meeting is set in the read e-mail, the record added to the e-mail table includes the meeting The information indicating that the information is generated based on the thread identification information is further set, for each thread identification information obtained, the search means identifies each record set in the mail table identified by the thread identification information, If information indicating that the record was generated based on the conference is set for each identified record, the sender is set for each record. If a user is given a predetermined point and a point lower than the predetermined point is given to a user who is set as a recipient, and information indicating that it has been generated based on a conference is not set, A point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record, and the output control means is the sum of the points given by the search means Is a computer program that outputs information indicating users who have more than a predetermined condition for each thread identification information .
In addition, the present invention provides a computer used as a search support apparatus that presents an important person related to desired information and supports the search of the information, message identification information for identifying each electronic mail, and a thread to which the electronic mail belongs Analysis that stores a thread identification information that identifies a message, a mail table that includes at least a record including information on the sender and the receiver, and a keyword table that indicates information that associates the thread identification information of each thread with a keyword. Result storage means, mail reading means for reading an e-mail from a mail storage means for storing the e-mail, and message identification information of other related e-mails from information on the header of the e-mail read by the mail reading means And the acquired message identification information is registered in the mail table. Mail analysis means for determining whether or not it is registered by the mail analysis means, when it is determined that the thread identification information of the read email is newly generated and registered Obtains the thread identification information from the mail table record specified by the message identification information of the other related electronic mail, and the message identification information obtained from the header information of the read electronic mail, the sender and the receiver Adding a record in which the newly generated thread identification information or the thread identification information acquired from the mail table is set to the mail table, and a keyword that is a result of morphological analysis of information obtained from the read email; , Analysis that writes to the keyword table in association with the thread identification information From the result output means, the receiving means for receiving the input of the search condition, the thread identification information of the keyword that matches the search word indicated by the search condition received by the receiving means is acquired from the keyword table, and for each acquired thread identification information Search means for acquiring a user set as a sender or a receiver from the record of the mail table specified by the thread identification information, and a number of the user set as a sender or a receiver, The number of users acquired by the search means is functioned as output control means for outputting a user whose number is greater than a predetermined condition for each thread identification information, and the mail table record further includes information on the broadcaster, The output means further sets the broadcaster information acquired from the header information of the read email A record is added to the mail table, and for each acquired thread identification information, the search means, as a user and a receiver set as a sender in each record of the mail table specified by the thread identification information A predetermined administrator search corresponding point is given to the set user, and an administrator search corresponding point higher than the predetermined administrator search corresponding point is given to the user set as a broadcaster, and the output control The means is a computer program that outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of points corresponding to the administrator search exceeds a predetermined condition.
本発明によれば、ある検索対象につての重要人物を提示することができ、また、重要人物間のつながりも把握可能となる。また、例えば、システム開発などの場合、仕様検討段階、プログラム設計段階、テスト段階、導入段階など、開発がすすむにつれて関連する人物や組織が変化していくが、本発明では、特定の時期において重要な人物を提示することや、重要な人物や組織が変化していく流れも把握可能となる。 According to the present invention, it is possible to present an important person for a certain search target, and to grasp the connection between important persons. In addition, for example, in the case of system development, related persons and organizations change as development progresses, such as a specification review stage, a program design stage, a test stage, and an introduction stage. It is possible to grasp the flow of presenting important persons and changing important persons and organizations.
以下、図面を参照して本発明の実施形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施形態]
図1は、本発明の第1の実施形態による検索支援装置1の機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。
同図において、検索支援装置1は、1台または複数台のサーバ等により構成することができ、メール記憶部10、メール収集部20、分析結果格納部30、検索処理部40、及び、出力制御部50からなる。
[First Embodiment]
FIG. 1 is a functional block diagram of a
In the figure, the
メール記憶部10は、例えば、メールサーバなどにより実現することができ、利用者間で送受信される電子メール(以下、単に「メール」とも記載)のデータを記憶する。
メール収集部20は、メール記憶部10から電子メールのデータを読込むメール読込み部21と、メール読込み部21により読み出された電子メールのデータを分析するメール分析部22と、メール分析部22による分析結果を示すデータを分析結果格納部30へ書き込む分析結果出力部23を備える。
分析結果格納部30は、メール分析結果のデータとして、各メールに関する情報を示すメールテーブルと、各スレッドの開始及び終了日時を示すスレッドテーブルと、各スレッドについてのキーワードを示すキーワードテーブルを記憶する。なお、スレッドとは、返信や転送がなされた一連のメールをグループ化したものを示す。
The
The
The analysis
検索処理部40は、例えば、データベースによりで実現することができ、検索支援装置1の備える入力手段、あるいは、検索支援装置1に接続されるコンピュータ端末(出力制御部50)から検索条件の入力を受けるクエリ受付部41と、クエリ受付部41により受信した検索条件に基づいて、分析結果格納部30に記憶されているメール分析結果のデータを検索する検索部42と、検索部42による検索結果を出力する検索結果出力部43とを備える。
出力制御部50は、例えば、コンピュータ端末で実現することができ、検索処理部40の検索結果出力部43により出力された検索結果を読込む検索結果読込み部51と、検索結果読込み部51が読込んだ検索結果をディスプレイへ表示する結果表示部52とを備える。なお、検索結果をプリンタにより印刷したり、記録媒体へ書き込むことでもよい。
The
The
次に、分析結果格納部30に格納される各データテーブルについて説明する。
図2は、分析結果格納部30に格納されるメールテーブルの構成を示す図である。同図において、メールテーブルは、メールID、スレッドID、メッセージID、件名、送信者、受信者、日付、及び、本文のデータからなる複数のレコードにより構成される。メールIDは、メールテーブルにおける各レコードを一意に特定する識別情報であり、1行目がメールID=1、2行目がメールID=2、…のように、各レコードに対してメール分析部22により付与される。スレッドIDは、各スレッドを一意に特定する識別情報であり、第1スレッドをスレッドID=1、第2スレッドをスレッドID=2、…のように、各スレッドに対してメール分析部22により付与される。メッセージIDは、各メールを一意に特定する識別情報であり、メールのmessage-IDフィールドに設定されている情報に相当する。また、件名、送信者、受信者、日付、本文はそれぞれ、メールのSubjectフィールド、Fromフィールド、Toフィールド、Dateフィールド、メール本文に設定されている情報に相当する。
Next, each data table stored in the analysis
FIG. 2 is a diagram showing the configuration of the mail table stored in the analysis
図3は、分析結果格納部30に格納されるスレッドテーブルの構成を示す図である。同図において、スレッドテーブルは、スレッドID、開始日時、及び、終了日時のデータからなる複数のレコードにより構成される。ここで、開始日時、終了日時は、スレッドIDにより特定されるスレッドに属するメールの中で、最も古い日付の情報が設定されているメールから得られる日付、最も新しい日付の情報が設定されているメールから得られる日付を示す。
FIG. 3 is a diagram illustrating a configuration of a thread table stored in the analysis
図4は、分析結果格納部30に格納されるキーワードテーブルの構成を示す図である。同図において、キーワードテーブルは、レコードID、スレッドID、及び、キーワードのデータからなる複数のレコードにより構成される。レコードIDは、キーワードテーブルにおける各レコードを一意に特定する識別情報であり、各レコードに対してメール分析部22により付与される。キーワードIDは、スレッドIDにより特定されるスレッドに属するメールの件名を形態素解析した結果の情報である。
FIG. 4 is a diagram showing the configuration of the keyword table stored in the analysis
次に、検索支援装置1における処理フローを説明する。
図5は、メール収集部20における分析処理フローを示す。
同図において、メール収集部20のメール読込み部21は、まだ本分析処理フローによる分析処理を行っていないメールをメール記憶部10としてのメールサーバから読込む(ステップS110)。メールには、Message-ID、Subject、From、To、CC、Date、References、メール本文等のフィールドが含まれる。なお、Referencesは、返信、転送されたメールのみに含まれるフィールドであり、返信、転送されるたびに、その返信、転送される元となったMessage-IDが追加されるフィールドである。
Next, a processing flow in the
FIG. 5 shows an analysis processing flow in the
In the figure, the
メール分析部22が自然数の新たなメールIDを付与すると、分析結果出力部23は、当該メールIDを設定したレコードを分析結果格納部30に記憶されているメールテーブルに追加する。分析結果出力部23は、追加したレコードのメッセージID、件名、送信者、受信者、日付、及び、本文のデータ項目のそれぞれに、読込んだメールのmessage-ID、Subject、From、To、Date、メール本文のフィールドの設定内容を書き込む(ステップS120)。
When the
次に、メール分析部22は、メールテーブルを検索し、読込んだメールのReferenceフィールドに設定されているデータと同じ内容のデータがメッセージIDに設定されているレコードがあるかを判断する(ステップS130)。これにより、読込んだメールが、以前のメールと同じスレッドに属するか否かを確認する。読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードがないと判断した場合(ステップS130:NO)、新規のスレッドであるとして、メール分析部22は新たなスレッドIDを付与する。分析結果出力部23は、新たに付与されたスレッドIDを設定したレコードを分析結果格納部30に記憶されているスレッドテーブルに追加するとともに(ステップS140)、追加したレコードの開始日時及び終了日時のデータ項目に、読込んだメールのDateフィールドに設定されているデータを書き込む(ステップS150)。
Next, the
一方、読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードがあると判断した場合(ステップS130:YES)、既に登録されているスレッドに属する最後のメールの可能性があると判断する。そこで、メール分析部22は、読込んだメールのReferenceフィールドと同じ内容のデータがメッセージIDに設定されているレコードからスレッドIDを読み出し、このスレッドIDによりスレッドテーブルを検索する。そして、検出したレコードの開始日時、終了日時に設定されている日時と、読込んだメールのDateフィールドに設定されている日時とを比較する。読込んだメールのDateフィールドに設定されている日時のほうが開始日時より古い日時である場合は、検出したレコードの開始日時のデータ項目を、読込んだメールのDateフィールドに設定されている日時に書き換える。また、読込んだメールのDateフィールドに設定されている日時のほうが終了日時より新しい日時である場合は、検出したレコードの終了日時のデータ項目を、読込んだメールのDateフィールドに設定されている日時に書き換える(ステップS160)。
On the other hand, if it is determined that there is a record in which the same data as the Reference field of the read mail is set in the message ID (step S130: YES), the possibility of the last mail belonging to the already registered thread Judge that there is. Therefore, the
分析結果出力部23は、ステップS120において追加したメールテーブルのレコードに新たに当該メールのスレッドIDを書き込む(ステップS170)。次に、メール分析部22は、メールのSubjectフィールドの設定内容を形態素解析するとともに、形態素解析された結果であるキーワードそれぞれに新たなレコードIDを付与する。分析結果出力部23は、新たに付与されたレコードIDと、当該メールのスレッドIDと、レコードIDに対応するキーワードからなるレコードを、分析結果格納部30に記憶されているキーワードテーブルに追加する(ステップS180)。メール読込み部21は、メール記憶部10としてのメールサーバに、まだ分析処理を行っていないメールがあるかを判断する(ステップS190)。まだ、分析処理していないメールがある場合には(ステップS190:YES)、ステップS110に戻り、上述した処理を繰り返す。そして、メール記憶部10に分析処理していないメールがなくなった場合(ステップS190:NO)、処理を終了する。
The analysis
図5の処理を具体的なデータ例を用いて説明する。
図6はメール記憶部10から読込んだ各メールのメールヘッダの例を、図7は図6で示されるメールヘッダをもつメールから生成されるメールテーブルの例を、図8は図6で示されるメールヘッダをもつメールから生成されるスレッドテーブルの例を、図9は図6で示されるメールヘッダをもつメールから生成されるキーワードテーブルの例を示す。
The process of FIG. 5 will be described using a specific data example.
6 shows an example of the mail header of each mail read from the
最初に、メールM1(図6)が読込まれると(図5、ステップS110)、新たに付与されたメールID「1」を設定したレコードがメールテーブル(図7)に追加され、メールM1のmessage-ID「1111@svr.jp」、Subject「開発進捗に関して」、From「userA」、To「userB」、Date「2007/2/3 15:12」、メール本文が当該レコードのメッセージID、件名、送信者、受信者、日付、及び、本文に設定される(図5、ステップS120)。また、メールM1にはReferenceフィールドが含まれていないため、新規のスレッドであると判断される(図5、ステップS130:NO)。そこで、新たなスレッドID「1」を設定したレコードがスレッドテーブル(図8)に追加され(図5、ステップS140)、メールM1のDate「2007/2/3 15:12」が当該レコードの開始日時及び終了日時に設定されるとともに(図5、ステップS150)、メールテーブル(図7)のメールID「1」のレコードに、スレッドID「1」が設定される(図5、ステップS170)。さらに、メールM1のSubjectフィールドの設定内容を形態素解析して「開発」、「進捗」、「関して」が得られると、各形態素解析結果それぞれについて新たに付与されたレコードID「1」、「2」、「3」を設定したレコードがキーワードテーブル(図9)に追加され、この追加されたレコードそれぞれには、スレッドID「1」と、対応する形態素解析結果「開発」、「進捗」、「関して」が設定される(図5、ステップS180)。 First, when the mail M1 (FIG. 6) is read (FIG. 5, step S110), a record in which the newly assigned mail ID “1” is set is added to the mail table (FIG. 7). message-ID "1111@svr.jp", Subject "Regarding development progress", From "userA", To "userB", Date "2007/2/3 15:12", the email body is the message ID of the record, subject , Sender, receiver, date, and text are set (FIG. 5, step S120). Further, since the reference field is not included in the mail M1, it is determined that the mail is a new thread (FIG. 5, step S130: NO). Therefore, a record in which a new thread ID “1” is set is added to the thread table (FIG. 8) (FIG. 5, step S140), and the date “2007/2/3 15:12” of the mail M1 is the start of the record. The date / time and end date / time are set (FIG. 5, step S150), and the thread ID “1” is set in the record of the mail ID “1” in the mail table (FIG. 7) (FIG. 5, step S170). Further, when “development”, “progress”, and “about” are obtained by performing morphological analysis on the setting contents of the subject field of the mail M1, newly assigned record IDs “1”, “ Records set with “2” and “3” are added to the keyword table (FIG. 9). Each of the added records includes a thread ID “1” and a corresponding morphological analysis result “development”, “progress”, “About” is set (FIG. 5, step S180).
次に、メールM2(図6)が読込まれると(図5、ステップS110)、新たに付与されたメールID「2」を設定したレコードがメールテーブル(図7)に追加され、メールM2のmessage-ID「2222@svr.jp」、Subject「Re:開発進捗に関して」、From「userB」、To「userA」、Date「2007/2/4 0:12」、メール本文が当該レコードのメッセージID、件名、送信者、受信者、日付、及び、本文に設定される(図5、ステップS120)。そして、メールM2のReference「1111@svr.jp」がメッセージIDに設定されているレコードがすでにメールテーブルにあるため(メールID「1」のレコード)、既に出現したスレッドであると判断される(図5、ステップS130:NO)。このレコードには、スレッドID「1」が設定されているため、スレッドテーブル(図8)から、当該スレッドIDが設定されているレコードの開始日時「2007/2/3 15:12」、終了日時「2007/2/3 15:12」を読み出し、メールM2のDate「2007/2/4 0:12」と比較する。メールM2のDateのほうが終了日時より新しい日時であるため、終了日時のデータ項目がメールM2のDateの設定内容に書き換えられ(ステップS160)、メールテーブル(図7)のメールID「2」のレコードに、スレッドID「1」が設定される(図5、ステップS170)。さらに、メールM1のSubjectフィールドの設定内容を形態素解析して「開発」、「進捗」、「関して」が得られるが、図9に示すように、キーワードテーブル(図9)には、当該スレッドID「1」に対応してすでにこれらのキーワードが設定されているため、新たなレコード追加は行われない。 Next, when the mail M2 (FIG. 6) is read (FIG. 5, step S110), a record in which the newly assigned mail ID “2” is set is added to the mail table (FIG. 7). message-ID "2222@svr.jp", Subject "Re: Regarding development progress", From "userB", To "userA", Date "2007/2/4 0:12", the mail body is the message ID of the record , Subject, sender, receiver, date, and text are set (FIG. 5, step S120). Since there is already a record in the mail table in which the reference “1111@svr.jp” of the mail M2 is set as the message ID (record with the mail ID “1”), it is determined that the thread has already appeared ( FIG. 5, Step S130: NO). Since the thread ID “1” is set in this record, the start date and time “2007/2/3 15:12” and the end date and time of the record in which the thread ID is set are shown in the thread table (FIG. 8). “2007/2/3 15:12” is read and compared with the date “2007/2/4 0:12” of the mail M2. Since the date of the mail M2 is newer than the end date and time, the data item of the end date and time is rewritten to the setting contents of the date of the mail M2 (step S160), and the record of the mail ID “2” in the mail table (FIG. 7) Is set with the thread ID “1” (FIG. 5, step S170). Furthermore, “development”, “progress”, and “related” are obtained by performing morphological analysis on the setting contents of the Subject field of the mail M1, but as shown in FIG. 9, the keyword table (FIG. 9) includes the relevant thread. Since these keywords are already set corresponding to the ID “1”, no new record is added.
このようにして、図6に示すメールM1〜M8について図5の処理を行った結果が、図7に示すメールテーブル、図8に示すスレッドテーブル、図9に示すキーワードテーブルである。図7に示すように、メールテーブルには、メールM1〜M8それぞれについてレコードが追加され、メールM1、M2、M3に対応したレコードにはスレッドID「1」が、メールM4に対応したレコードにはスレッドID「2」が、メールM5、M6、M7に対応したレコードにはスレッドID「3」が、メールM8に対応したレコードにはスレッドID「4」が設定されている。これは、メールM2のReferences「1111@svr.jp」が、メールM1に対応したレコードのメッセージIDに設定されており、メールM3のReferences「1111@svr.jp」、「2222@svr.jp」が、メールM1、メールM2に対応したレコードのメッセージIDに設定されているため、メールM1、M2、M3に対応したレコードに同じスレッドIDが設定されたものである。同様に、メールM6のReferences「5555@svr.jp」は、メールM5に対応したレコードのメッセージIDに設定されており、メールM7のReferences「5555@svr.jp」、「6666@svr.jp」は、メールM5、メールM6に対応したレコードのメッセージIDに設定されているため、メールM5、M6、M7に対応したレコードには同じスレッドIDが設定される。 The result of performing the processing of FIG. 5 on the mails M1 to M8 shown in FIG. 6 is the mail table shown in FIG. 7, the thread table shown in FIG. 8, and the keyword table shown in FIG. As shown in FIG. 7, records are added to the mail table for each of the mails M1 to M8, the thread ID “1” is assigned to the records corresponding to the mails M1, M2, and M3, and the record corresponding to the mail M4 is assigned to the mail table. A thread ID “3” is set for a record corresponding to the mail M5, M6, and M7, and a thread ID “4” is set for a record corresponding to the mail M8. In this case, References “1111@svr.jp” in the mail M2 is set to the message ID of the record corresponding to the mail M1, and References “1111@svr.jp” and “2222@svr.jp” in the mail M3. However, since the message IDs of the records corresponding to the mails M1 and M2 are set, the same thread ID is set to the records corresponding to the mails M1, M2, and M3. Similarly, References “5555@svr.jp” of the mail M6 is set to the message ID of the record corresponding to the mail M5, and References “5555@svr.jp” and “6666@svr.jp” of the mail M7. Is set to the message ID of the record corresponding to the mail M5 and mail M6, the same thread ID is set to the record corresponding to the mail M5, M6 and M7.
また、図8に示すスレッドテーブルには、スレッドID「1」のレコードに、当該スレッドIDに属する最初のメールM1のDateフィールドの設定内容が開始日時に、当該スレッドIDに属する最後のメールM3のDateフィールドの設定内容が終了日時に設定されている。同様に、スレッドID「3」のレコードに、当該スレッドIDに属する最初のメールM5のDateフィールドの設定内容が開始日時に、当該スレッドIDに属する最後のメールM7のDateフィールドの設定内容が終了日時に設定されている。
また、スレッドID「2」に属するのはメールM4のみであるため、当該スレッドIDのレコードには、メールM4のDateフィールドの設定内容が開始日時及び終了日時に設定されている。同様に、スレッドID「4」のレコードには、メールM8のDateフィールドの設定内容が開始日時及び終了日時に設定されている。
Further, in the thread table shown in FIG. 8, in the record of the thread ID “1”, the setting content of the Date field of the first mail M1 belonging to the thread ID is the start date and time of the last mail M3 belonging to the thread ID. The setting content of the Date field is set to the end date and time. Similarly, in the record of the thread ID “3”, the setting contents of the Date field of the first mail M5 belonging to the thread ID are the start date and time, and the setting contents of the Date field of the last mail M7 belonging to the thread ID are the end date and time. Is set to
Since only the mail M4 belongs to the thread ID “2”, the setting contents of the Date field of the mail M4 are set to the start date and time and the end date and time in the record of the thread ID. Similarly, in the record with the thread ID “4”, the setting contents of the Date field of the mail M8 are set to the start date and time and the end date and time.
また、図9に示すように、キーワードテーブルには、スレッドID「1」に属するメールM1,M2,M3のSubjectの設定内容を形態素解析した結果の「開発」、「進捗」、「関して」がレコードID「1」〜「3」に、スレッドID「2」に属するメールM4のSubjectの設定内容を形態素解析した結果の「懇親会」がレコード「4」に、スレッドID「3」に属するメールM5,M6,M7のSubjectの設定内容を形態素解析した結果の「打合せ」、「件」がレコードID「5」、「6」に、スレッドID「4」に属するメールM8のSubjectの設定内容を形態素解析した結果の「開発」、「会議」がレコードID「7」、「8」に設定されている。 Further, as shown in FIG. 9, the keyword table includes “development”, “progress”, “related” as a result of morphological analysis of the subject setting contents of the mails M1, M2, and M3 belonging to the thread ID “1”. “Social gathering” as a result of morphological analysis of the subject settings of the mail M4 belonging to the thread ID “2” in the record IDs “1” to “3” belongs to the record “4” and the thread ID “3”. Subject settings for email M5, M6, and M7: “Meetings” and “results” as a result of morphological analysis. Subject settings for email M8 belonging to record ID “5” and “6” and thread ID “4” “Development” and “Conference” as a result of the morphological analysis are set to record IDs “7” and “8”.
図10〜図12は、検索処理部40における処理フローを示す。
図10は、検索処理部40におけるスレッド検索処理フローを示す。
検索処理部40のクエリ受付部41は、受信した検索要求から検索ワードを読込む(ステップS210)。検索部42は、分析結果格納部30に記憶されているキーワードテーブルに設定されているスレッドIDのうち、本スレッド検索処理フローによるスレッド検索処理を行っていないスレッドIDを選択して読込む(ステップS220)。そして、その選択したスレッドIDが設定されているキーワードテーブルのレコードの中に、検索ワードに一致するキーワードが設定されているレコードがあるかを判断する(ステップS230)。
10 to 12 show a processing flow in the
FIG. 10 shows a thread search processing flow in the
The
選択したスレッドIDが設定されているレコードの中に、検索ワードに一致するキーワードが設定されているレコードがある場合(ステップS230:YES)、以下のステップS240〜S250の処理を実行する。すなわち、検索部42は、選択したスレッドIDをキーにして分析結果格納部30に記憶されているスレッドテーブルを検索し、検出したレコードから開始日時を読込むとともに(ステップS240)、選択したスレッドIDと読込んだ開始日時とを対応付けた情報を記憶する(ステップS250)。
If there is a record in which a keyword that matches the search word is set in the record in which the selected thread ID is set (step S230: YES), the following steps S240 to S250 are executed. That is, the
検索部42は、キーワードテーブルに、まだスレッド検索処理を行っていないスレッドIDがある場合は(ステップS260:NO)、ステップS220からの処理を繰り返す。そして、キーワードテーブルに登録されている全てのスレッドIDについて、スレッド検索処理を実行した場合は(ステップS260:YES)、処理を終了する。
If there is a thread ID that has not yet been subjected to thread search processing in the keyword table (step S260: NO), the
図11は、検索処理部40における人物相関テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶したスレッドID(以下、処理対象スレッドID)のうち、当該人物相関テーブル作成処理フローによる人物相関テーブル作成処理をまだ行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS310)。
FIG. 11 shows a person correlation table creation process flow in the
The
検索部42は、ステップS310において読込んだレコードから、送信者と受信者に設定されているユーザの組を送受信者の組として抽出し、抽出した送受信者の組それぞれについて、抽出された数をカウントする(ステップS320)。なお、送信者と受信者のユーザが入れ替わっていても、同じ組であるとする。検索部42は、処理対象スレッドIDに、まだ人物相関テーブル作成処理を行っていないスレッドIDがある場合は(ステップS330:NO)、ステップS310からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、人物相関テーブル作成処理を実行した場合(ステップS330:YES)、スレッドID毎に、ステップS320において抽出された送受信者の組と、その組の抽出数に対応したポイントとを示す一覧である人物相関テーブルを生成して記憶する(ステップS340)。つまり、ユーザがメールの送信者、あるいは、受信者となる毎に、当該ユーザに1ポイントが付与されることを示す。
The
図12は、検索処理部40における重要人物テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶した処理対象スレッドIDのうち、当該重要人物テーブル作成処理フローによるおいてまだ重要人物テーブル作成処理を行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS410)。
FIG. 12 shows an important person table creation processing flow in the
The
検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者または受信者として設定されている数である登場回数を計測し、記憶する(ステップS420)。検索部42は、処理対象スレッドIDに、まだ重要人物テーブル作成処理を行っていないスレッドIDがある場合は(ステップS430:NO)、ステップS410からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、重要人物テーブル作成処理を実行した場合は(ステップS430:YES)、スレッドID毎に、ステップS420において抽出されたユーザと、その登場回数に対応したポイントとを示す一覧である重要人物テーブルを生成して記憶する(ステップS440)。つまり、ユーザがメールの送信者、あるいは、受信者となる毎に、当該ユーザに1ポイントが付与されることを示す。
The
図13は、出力制御部50の結果表示処理フローを示す。
同図において、検索結果読込み部51は、検索結果出力部43から出力される各処理対象スレッドIDの開始日時、人物相関テーブル、重要人物テーブル、及び、各処理対象スレッドIDに対応したメールテーブルのレコードから読込んだ件名の一覧を検索結果として読込む(ステップS510)。次に、結果表示部52は、検索結果表示方法の情報を読込む(ステップS520)。これは、クエリ受付部41が受信した検索要求内に設定されているか、予め、出力制御部50の記憶手段に記憶されている情報である。検索結果表示方法の情報に、重要人物表示が必要であることが設定されている場合(ステップS530:YES)、結果表示部52は、各スレッドについて、重要人物テーブルで示されるユーザのうち、ポイント数の多い順番に所定数のユーザを重要人物として抽出する。そして、抽出した各スレッドの重要人物を、その重要人物に対応したポイント数とともに表示する(ステップS540)。このとき、時系列的にスレッドを並べ、各スレッドに対応して登場回数の多い順番に重要人物を表示する。また、さらに、特定のスレッドのみを表示するような指示の入力があった場合は、その指定されたスレッドについての重要人物のみを表示し、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての重要人物を表示する。
FIG. 13 shows a result display processing flow of the
In the figure, the search
続いて、検索結果表示方法の情報に、テーマ名の表示が必要であることが設定されている場合(ステップS550:YES)、結果表示部52は、ステップS510において検索結果出力部43から読込んだ件名の一覧を表示する(ステップS560)。このとき、ステップS540において出力した各スレッドの重要人物の表示に対応づけて件名を表示してもよい。また、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての件名を表示する。
Subsequently, when it is set in the search result display method information that the theme name needs to be displayed (step S550: YES), the
さらに、検索結果表示方法の情報に、重人物の相関関図の表示が必要であることが設定されている場合(ステップS570:YES)、結果表示部52は、各スレッドについて、人物相関テーブルで示される送受信者の組のうち、ポイント数の多い順番に所定数の組を抽出する。そして、各スレッドについて抽出した送受信者の組を、その送受信者の組のポイント数に対応したポイント数とともに表示する(ステップS580)。なお、このとき、複数のユーザ間における送受信の組の相関関係を示すようなマトリックス状に表示する。また、さらに、特定のスレッドのみを表示するような指示の入力があった場合は、その指定されたスレッドについての送受信者の組のみを表示し、期間を示す情報の入力があった場合には、その期間に開始日時が含まれるスレッドについての送受信者の組を表示する。
Furthermore, when it is set in the search result display method information that it is necessary to display the correlation diagram of the heavy person (step S570: YES), the
図10〜図13の処理を具体的なデータ例を用いて説明する。
図14はメールテーブルの例を、図15はスレッドテーブルの例を、図16はキーワードテーブルの例を示す図であり、クエリ受付部41が検索キーワード読込む前に設定されているものとする。また、検索キーワードとして「販売」が入力されるとする。このとき作成される人物相関テーブル及び重要人物テーブルを図17に示す。
The processes of FIGS. 10 to 13 will be described using specific data examples.
FIG. 14 shows an example of a mail table, FIG. 15 shows an example of a thread table, and FIG. 16 shows an example of a keyword table, which are set before the
図10のスレッド検索処理において、検索キーワードが読込まれると(図10、ステップS210)、キーワードテーブル(図16)に設定されているスレッドIDが順に選択される(図10、ステップS220)。スレッドID「116」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「340」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2006/7/1 15:12」が読込まれ、スレッドID「116」と対応付けて記憶される(図10、ステップS240、S250)。 In the thread search process of FIG. 10, when a search keyword is read (FIG. 10, step S210), thread IDs set in the keyword table (FIG. 16) are selected in order (FIG. 10, step S220). When the thread ID “116” is selected, a record (record ID “340”) in which the search word “sales” is set as a keyword is recorded from a record in the keyword table (FIG. 16) in which the thread ID is set. It is detected (FIG. 10, step S230). The start date and time “2006/7/1 15:12” corresponding to the thread ID is read and stored in association with the thread ID “116” (FIG. 10, steps S240 and S250).
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「372」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2007/1/7 13:10」が読込まれ、スレッドID「120」と対応付けて記憶される(図10、ステップS240、S250)。 Next, when the thread ID “120” is selected, the record (record ID “372”) in which the search word “sales” is set as a keyword from the record of the keyword table (FIG. 16) in which the thread ID is set. ") Is detected (FIG. 10, step S230). Then, the start date and time “2007/1/7 13:10” corresponding to the thread ID is read and stored in association with the thread ID “120” (FIG. 10, steps S240 and S250).
次に、スレッドID「144」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図16)には、検索ワード「販売」がキーワードとして設定されているレコードがないことが検出される(図10、ステップS230)。
これにより、処理対象スレッドID「116」、「120」と、それぞれの開始日時「2006/7/1 15:12」、「2007/1/7 13:10」が記憶される(図10、ステップS250)。
Next, when the thread ID “144” is selected, it is detected that there is no record in which the search word “sales” is set as a keyword in the keyword table (FIG. 16) in which the thread ID is set. (FIG. 10, step S230).
As a result, the processing target thread IDs “116” and “120” and the start dates and times “2006/7/1 15:12” and “2007/1/7 13:10” are stored (FIG. 10, step). S250).
続いて、人物相関テーブル作成処理(図11)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「500」〜「506」)が特定される(図11、ステップS310)。図17に示すように、この特定されたレコードの送信者と受信者の情報から、「userAとuserB」、「userAとuserC」、「userAとuserD」、「userAとuserE」、「userBとuserE」の組が抽出され、それらの組が抽出された数はそれぞれ「4」、「2」、「2」、「2」、「3」である(図11、ステップS320)。なお、図面では、userA、userB、userC、userD、userEを単にA,B,C,D,Eと表記する場合がある。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「507」〜「511」)を特定する(図11、ステップS310)。図17に示すように、この特定されたレコードの送信者と受信者の情報から、「userAとuserB」、「userAとuserC」、「userAとuserD」、「userAとuserE」の組が抽出され、それらの組が抽出された数はそれぞれ「2」、「2」、「3」、「1」である(図11、ステップS320)。
これにより、各スレッドID毎に、これらの抽出されたユーザの組と、その組の抽出数に対応したポイントとを示す人物相関テーブル(図17)が生成される(図11、ステップS340)。ここでは、抽出数1を1ポイントとしている。
Subsequently, a person correlation table creation process (FIG. 11) is started, and process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 11, step S310). As shown in FIG. 17, from the information of the sender and receiver of the identified record, “userA and userB”, “userA and userC”, “userA and userD”, “userA and userE”, “userB and userE” ”Are extracted, and the numbers of these extracted groups are“ 4 ”,“ 2 ”,“ 2 ”,“ 2 ”, and“ 3 ”, respectively (FIG. 11, step S320). In the drawings, userA, userB, userC, userD, and userE may be simply expressed as A, B, C, D, and E.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 11, step S310). ). As shown in FIG. 17, a set of “userA and userB”, “userA and userC”, “userA and userD”, and “userA and userE” are extracted from the sender and receiver information of the specified record. The numbers from which these sets are extracted are “2”, “2”, “3”, and “1”, respectively (FIG. 11, step S320).
As a result, for each thread ID, a person correlation table (FIG. 17) is generated that shows these extracted user sets and points corresponding to the number of extracted sets (FIG. 11, step S340). Here, the
続いて、重要人物テーブル作成処理(図12)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「500」〜「506」)が特定される(図12、ステップS410)。図17に示すように、この特定されたレコードの送信者または受信者に設定されているユーザとして、「userA」、「userB」、「userC」、「userD」、「userE」が抽出され、その抽出したユーザの登場回数「10」、「7」、「2」、「2」、「5」が計測される。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図14)のレコード(メールID「507」〜「511」)が特定される(図12、ステップS420)。図17に示すように、この特定されたレコードの送信者または受信者に設定されているユーザとして、「userA」、「userB」、「userC」、「userD」、「userE」が抽出され、その抽出したユーザの登場回数「8」、「2」、「2」、「3」、「1」が計測される。
これにより、各スレッドID毎に、これらの抽出されたユーザと、その登場回数に対応したポイントとを示す重要人物テーブルが生成される(図12、ステップS440)。なお、ここでは、登場回数1回を1ポイントとしている。
Subsequently, the important person table creation process (FIG. 12) is started, and the process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 12, step S410). As shown in FIG. 17, “userA”, “userB”, “userC”, “userD”, and “userE” are extracted as the users set as the sender or receiver of the specified record, The number of appearances “10”, “7”, “2”, “2”, “5” of the extracted user is measured.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 14) in which the thread ID is set are specified (FIG. 12, step). S420). As shown in FIG. 17, “userA”, “userB”, “userC”, “userD”, and “userE” are extracted as the users set as the sender or receiver of the specified record, The number of appearances “8”, “2”, “2”, “3”, “1” of the extracted user is measured.
Thereby, an important person table indicating these extracted users and points corresponding to the number of appearances is generated for each thread ID (FIG. 12, step S440). Here, the number of appearances is 1 point.
図18は、図17に示す重要人物テーブルに基づいた重要人物出力イメージであり、時系列にスレッドを並べて表示したイメージを示す。ここでは、重要人物は、ポイント数が高い順に3人としている。なお、所定のポイント数以上などとすることもでき、この条件は予め出力制御部50に記憶されるか、ユーザにより入力される。
図18においては、重要人物テーブル(図17)に含まれるスレッドID「116」、「120」を、これらの開始日時「2006/07/01 15:12」、「2007/07/08 23:11」に対応した時間軸上に、時系列で表示している。そして、スレッドID「116」については、ポイント数が高い順に「userA」、「userB」、「userE」が表示され、スレッドID「120」については、ポイント数が高い順に「userA」、「userD」、「userB」、「userC」が表示されている。なお、「userB」と「userC」はポイント数が同じため、両者を表示しているものである。
FIG. 18 is an important person output image based on the important person table shown in FIG. 17 and shows an image in which threads are arranged in time series. Here, there are three important persons in descending order of the number of points. Note that the number of points may be equal to or greater than a predetermined number, and the condition is stored in advance in the
In FIG. 18, the thread IDs “116” and “120” included in the important person table (FIG. 17) are assigned the start dates and times “2006/07/01 15:12” and “2007/07/08 23:11”. On the time axis corresponding to “”. For the thread ID “116”, “userA”, “userB”, “userE” are displayed in descending order of the number of points, and for the thread ID “120”, “userA”, “userD” are displayed in descending order of the number of points. , “UserB”, “userC” are displayed. Since “userB” and “userC” have the same number of points, both are displayed.
図19は、図17に示す重要人物テーブルに基づいた、検索時期を指定したときの重要人物及び人物相関図の表示イメージを示す。ここでは、2006年が指定されとする。なお、検索時期の条件は、ユーザにより入力されるものとする。
出力制御部50の結果表示部52は、重要人物テーブル(図17)に含まれるスレッドID「116」、「120」のうち、開始日時が2006年であるスレッドID「116」を選択する。そして、スレッドID「116」については、重要人物として、ポイント数が高い順に「userA」、「userB」、「userE」を、そのポイント数のともに表示する。また、人物相関テーブル(図17)から、当該スレッドIDに対応して、重要人物としてのポイント数が最も高い「userA」が含まれる送受信の組と、そのポイント数を読込む。そして、ポイント数が最も高い「userA」を中心として、送受信の組となる各ユーザ「userB」、「userC」、「userD」、「userE」をその周囲に表示するとともに、「userA」と各ユーザ「userB」、「userC」、「userD」、「userE」との間に、ポイント数を表示するとともに、そのポイント数に対応した太さの線を描画する。なお、表示する送受信の組をポイント数の多い組から所定数としてもよく、所定のポイント数以上の送受信の組を表示するようにしてもよい。
FIG. 19 shows a display image of the important person and the person correlation diagram when the search time is designated based on the important person table shown in FIG. Here, 2006 is designated. The search time condition is input by the user.
The
図20は、検索画面の全体イメージを示す図である。同図においては、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物、人物相関図、及び、各スレッドに送信者または受信者として登場したユーザの一覧とそのポイント数が表示されている。 FIG. 20 is a diagram showing an overall image of the search screen. In the figure, a field for entering a search word, a thread arranged in chronological order and its important persons, a person correlation diagram, a list of users who appeared as senders or receivers in each thread, and the number of points are displayed. ing.
なお、上記においては、開始日時が検索条件として指定された期間内のスレッドを出力対象としているが、終了日時が検索条件として指定された期間内であるスレッドを出力するようにしてもよく、両者を組み合わせてもよい。終了日時を検索条件する場合は、図10のステップS240において、開始日時の代わりに終了日時を読込み、図13のステップS510において、検索結果読込み部51は、各処理対象スレッドIDの終了日時を読込む。
In the above, the threads within the period for which the start date / time is specified as the search condition are output, but the threads whose end date / time is within the period specified as the search condition may be output. May be combined. When the end date / time is set as the search condition, the end date / time is read instead of the start date / time in step S240 of FIG. 10, and the search
なお、ユーザを表示するときには、メールの送信者、受信者のフィールドから読込んだユーザの識別情報(メールアドレス等)を表示してもよく、ユーザの識別情報に対応付けて記憶手段に記憶されている氏名や部署等の情報を読込んで表示してもよい。 When displaying the user, the user identification information (email address, etc.) read from the sender and recipient fields of the mail may be displayed and stored in the storage means in association with the user identification information. You may read and display information such as your name and department.
[第2の実施形態]
本発明の第2の実施形態について説明する。上述した第1の実施形態においては、スレッド単位に分割したメールを、その開始日時の時系列にプロットして表示しているが、同じような時期に多数のスレッドが始まる場合や、検索の結果、多数のスレッドが該当したりする場合などがある。このような場合、検索者はどのスレッドが、自分の知りたい内容を扱っているものであるかを選択するのが困難となってしまう。そこで、第2の実施形態においては、検索者が知りたい内容について取り扱っているスレッドを簡易に選択することを支援するために、時間経過に伴うメール量の分布を可視化して表示し、話題の盛り上がり・盛り下がりを考慮したスレッド選択が行えるようにする。これにより、検索者が知りたいと考えている内容について多くのメールがやりとりされているスレッドを選択したり、話題が盛り上がった時期、すなわち、メール量が多い時期に基づいてスレッドを選択したりできるようになる。
[Second Embodiment]
A second embodiment of the present invention will be described. In the first embodiment described above, the mail divided into threads is plotted and displayed in the time series of the start date and time. However, when a large number of threads start at the same time, or the search results There are cases where many threads are applicable. In such a case, it becomes difficult for the searcher to select which thread deals with the content he wants to know. Therefore, in the second embodiment, in order to assist a searcher to easily select a thread that deals with the content that the searcher wants to know, the distribution of the amount of mail over time is visualized and displayed. Enable thread selection that takes into account ups and downs. This allows you to select threads where many emails are being exchanged for the content that the searcher wants to know, or to select threads based on when the buzz was raised, that is, when the amount of email was high It becomes like this.
第2の実施形態の処理について、第1の実施形態との差分を説明する。
図10に示すスレッド検索処理フローのステップS240において、検索処理部40の検索部42は、選択したスレッドIDをキーにして分析結果格納部30に記憶されているメールテーブルを検索し、検出したレコードから日付の情報を読込み、ステップS250において、選択したスレッドIDと読込んだ日時とを対応付けた情報を記憶する。この情報は、図13に示す結果表示処理フローのステップS510において、出力制御部50の検索結果読込み部51に読み込まれる。出力制御部50の結果表示部52は、スレッドID毎に、当該スレッドIDに対応した日付の情報に基づいて所定の単位期間毎(4半期単位、1ヶ月単位など)のメールの件数をカウントし、各スレッドについて当該単位期間毎に、メールの件数に対応した大きさの円を表示したり、メールの件数の推移をグラフ表示したりする。なお、この単位期間は、出力制御部50の図示しない記憶手段に予め記憶されている情報であってもよく、検索処理部40のクエリ受付部41が受信した検索要求内に設定されることでもよい。
The difference between the processing of the second embodiment and the first embodiment will be described.
In step S240 of the thread search processing flow shown in FIG. 10, the
図21は、円の大きさによりメールの件数を表示した場合のスレッド出力イメージである。同図においては、各スレッドについて、4半期毎に、メールの件数に対応した大きさの円を表示している。これにより、他のスレッドより大きな円が表示されているスレッドがより話題の盛り上がったスレッドであり、また、より大きな円が表示されている時期がより話題の盛り上がった時期であることが視覚的に把握可能となる。なお、ここでは、メールの件数に対応した大きさの円を表示しているが、メールの大きさを表す図形は円以外の図形でもよく、また、メール量が多い場合は赤、少ない場合は青としたグラデーションにより表示するなど、色による表示を行ってもよい。 FIG. 21 is a thread output image when the number of mails is displayed according to the size of the circle. In the figure, for each thread, a circle of a size corresponding to the number of mails is displayed every quarter. As a result, it is visually determined that threads with larger circles displayed than other threads are threads that have become more topical, and that the time when larger circles are displayed is the time when more topics have been raised. It becomes possible to grasp. Here, a circle with a size corresponding to the number of emails is displayed, but the shape of the email may be a shape other than a circle, and red if the amount of email is large, You may display by a color, such as displaying by the gradation which was made into blue.
図22は、グラフによりメールの件数を表示した場合のスレッド出力イメージである。同図においては、各スレッドについて、4半期毎のメールの件数の推移をグラフで表示している。そして、表示されているグラフにおいて、さらに詳細にメールの件数の推移を見たい場合には、その表示箇所をマウスで指定するなどして、詳細表示対象のスレッドと時期の情報を入力する。出力制御部50の結果表示部52は、スレッドに対応した日付の情報を参照し、詳細表示対象のスレッド及び時期について、現在表示されているよりも短い単位期間毎(1日単位、1週間単位など)のメールの件数をカウントして、グラフ表示する。
FIG. 22 is a thread output image when the number of mails is displayed by a graph. In the figure, the transition of the number of mails in each quarter is displayed in a graph for each thread. In the displayed graph, if you want to see the transition of the number of emails in more detail, specify the display location with the mouse and enter the thread and timing information to be displayed in detail. The
[第3の実施形態]
次に、本発明の第3の実施形態について説明する。上述した実施形態では、人物相関テーブル、重要人物テーブルを作成する際に、メールの送信者あるいは受信者となっているユーザに一律で1ポイントを付与している。しかし、例えば、管理者などは情報を共有できるようメールの宛先に同報者(CC)として設定されることが多く、担当者や実施者などは情報を発信することが多いためメールの送信者となることが多い。そこで、管理者、あるいは、担当者や実施者等のどちらをキーパーソンとして抽出するかに応じて、同報者に設定されている場合の付与ポイント数を高くしたり、あるいは、発信者に設定されている場合の付与ポイント数を高くしたりし、加算ポイントを変更する。つまり、同報者に設定されている場合に付与するポイント数に重み付けすることにより、合計ポイント数が高いユーザを、検索したい内容に関する管理者として選択し、提示することが可能となり、また、発信者に設定されている場合に付与するポイント数に重み付けすることにより、合計ポイント数が高いユーザを、検索したい内容に関する担当者や実施者等の情報発信者として選択し、提示することが可能となる。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. In the above-described embodiment, when the person correlation table and the important person table are created, one point is uniformly given to the user who is the sender or receiver of the mail. However, for example, an administrator or the like is often set as a broadcaster (CC) as an e-mail address so that information can be shared. Often. Therefore, depending on whether the administrator or the person in charge or the person to be executed is extracted as the key person, the number of points granted to the broadcaster is increased or set to the sender. Increase the number of points granted and change the points added. In other words, it is possible to select and present a user with a high total number of points as an administrator regarding the content to be searched by weighting the number of points given when set to the broadcaster. By weighting the number of points to be given when set to a person, it is possible to select and present a user with a high total number of points as an information sender such as a person in charge or a practitioner regarding the content to be searched Become.
第3の実施形態の処理について、第1の実施形態及び第2の実施形態との差分を説明する。
図23は、本実施形態によるメールテーブルの構成を示す図である。同図において、メールテーブルは、メールID、スレッドID、メッセージID、件名、送信者、受信者、同報者、日付、及び、本文のデータからなる複数のレコードにより構成され、図2に示すメールテーブルのレコードに、同報者のデータが追加されたものである。同報者は、メールのCCフィールドに設定されている情報に相当する。
そして、図5に示す第1の実施の形態のスレッド検索処理フローのステップS120において、メール収集部20の分析結果出力部23は、メールテーブルに追加されたレコードの同報者のデータ項目に、読込んだメールのCCフィールドの設定内容をさらに書き込む。
Regarding the processing of the third embodiment, the difference between the first embodiment and the second embodiment will be described.
FIG. 23 is a diagram showing the configuration of the mail table according to the present embodiment. In the figure, the mail table is composed of a plurality of records consisting of mail ID, thread ID, message ID, subject, sender, receiver, broadcaster, date, and body data, and the mail shown in FIG. Broadcaster data is added to the table record. The broadcaster corresponds to the information set in the CC field of the mail.
Then, in step S120 of the thread search processing flow of the first embodiment shown in FIG. 5, the analysis
図11に示す人物相関テーブル作成処理フローのステップS320において、検索処理部40の検索部42は、ステップS310において読込んだ各レコードについて順に以下を行う。すなわち、送信者−受信者として設定されているユーザの組、送信者−同報者として設定されているユーザの組を抽出し、送信者として設定されているユーザ及び受信者として設定されているユーザの管理者検索対応ポイントに1ポイントを加算し、同報者として設定されているユーザの管理者検索対応ポイントに3ポイントを加算する。また、受信者として設定されているユーザの情報発信者検索対応ポイントに3ポイントを加算し、送信者として設定されているユーザ及び同報者として設定されているユーザの情報発信者検索対応ポイントに1ポイントを加算する。
In step S320 of the person correlation table creation processing flow shown in FIG. 11, the
上記のようにして、全ての処理対象スレッドIDについて、ユーザの組の抽出と、管理者検索対応ポイント、情報発信者索対応ポイントの付与を実行すると、ステップS340において、検索部42は、スレッドID毎に、送信者−受信者のユーザの組、送信者−同報者のユーザの組と、これらの組に含まれる各ユーザの管理者検索対応ポイント及び情報発信者索対応ポイントとを示す一覧である人物相関テーブルを生成して記憶する。
As described above, when extraction of a set of users and assignment of an administrator search correspondence point and an information sender search correspondence point are executed for all processing target thread IDs, in step S340, the
図13に示す結果表示処理フローのステップS580において、出力制御部50の結果表示部52は、各スレッドについて抽出したユーザの組を表示する。なお、このとき、複数ユーザ間におけるユーザの組の相関関係を示すようなマトリックス状の関連図を表示するとともに、管理者用検索ポイントのポイント数が最も高いユーザ、または、高い順に所定数のユーザを特定する情報、情報発信者索対応ポイントのポイント数が最も高いユーザ、または、高い順に所定数のユーザを特定する情報も表示する。さらに、結果表示部52は、各ユーザの組について、送信者−受信者の関係、あるいは、送信者−同報者の関係のどの形態が多いかの情報も表示する。
In step S580 of the result display processing flow shown in FIG. 13, the
図24は、本実施の形態による人物相関図の表示イメージである。ここでは、管理者用検索ポイントのポイント数が最も高いユーザAを赤色で、情報発信者索対応ポイントのポイント数が最も高いユーザBを青色で表示している。なお、ポイント数が高い順に所定数のユーザを表示する場合は、ポイント数が低くなるに従って色がうすくなるようなグラデーションで表示したり、あるいは、管理者用検索ポイント、情報発信者索対応ポイントをユーザに対応づけて表示したりしてもよい。なお、表示色は任意に選択しうる。また、ユーザの組は矢印で示しているが、矢印の始まりのユーザが送信者、矢印の先のユーザが受信者または同報者である。 FIG. 24 is a display image of a person correlation diagram according to the present embodiment. Here, user A having the highest number of administrator search points is displayed in red, and user B having the highest number of information sender search corresponding points is displayed in blue. In addition, when displaying a predetermined number of users in descending order of the number of points, display in a gradation that the color becomes lighter as the number of points decreases, or search points for managers, information sender search corresponding points It may be displayed in association with the user. The display color can be arbitrarily selected. Moreover, although the group of users is indicated by an arrow, the user at the beginning of the arrow is a sender, and the user at the end of the arrow is a receiver or a broadcaster.
なお、図12に示す重要人物テーブル作成処理フローのステップS420において、検索処理部40の検索部42は、送信者、受信者または同報者として設定されているユーザを抽出し、送信者または受信者として設定されていれば1ポイントを、同報者として設定されていれば3ポイントを管理者検索対応ポイントに加算し、さらに、受信者として設定されていれば3ポイントを、送信者または同報者として設定されていれば1ポイントを情報発信者検索対応ポイントに1ポイントを加算するようにしてもよい。そして、図13の結果表示処理フローのステップS540において、出力制御部50の結果表示部52が、各スレッドについて、管理者検索対応ポイントの多い順番に所定数のユーザを管理者として、情報発信者検索対応ポイントの多い順番に所定数のユーザを情報発信ユーザとして表示する。
In step S420 of the important person table creation processing flow shown in FIG. 12, the
なお、上記においては、管理者用検索、及び、情報発信者検索の両方を行っているが、どちらか一方を行うことでもよい。また、上述した加算ポイントは一例であり、適宜設定しうる。 In the above, both the manager search and the information sender search are performed, but either one may be performed. Moreover, the addition point mentioned above is an example, and can be set suitably.
[第4の実施形態]
メーリングリストを使用してメールを送信する際は、受信者(To)が同一である。そこで、第4の実施形態では、発信者(From)の情報のみに基づいてポイントを加算する。以下に、第3の実施形態との差分を説明する。
[Fourth Embodiment]
When sending mail using a mailing list, the recipient (To) is the same. Therefore, in the fourth embodiment, points are added based only on the sender (From) information. Hereinafter, differences from the third embodiment will be described.
まず、メール収集部20の図示しない記憶部に、メーリングリストに用いられるメーリングアドレス(mlist@xxx.jp、members@xxx.jpなど)の一覧を予め記憶しておく。また、図25に示すように、メールテーブルのレコードには、メーリングリストフラグのデータが追加される。
First, a list of mailing addresses (mlist@xxx.jp, members@xxx.jp, etc.) used for the mailing list is stored in advance in a storage unit (not shown) of the
図5に示すスレッド検索処理フローのステップS120において、メール収集部20の分析結果出力部23は、読込んだメールのToフィールドの設定内容が、記憶部に保持しているメーリングアドレスに含まれているかを判断する。読込んだメールのToフィールドが、メーリングリストアドレスに含まれている場合は、メールテーブルに追加したレコードのメーリングリストフラグに、メーリングリストであることを示す値を書き込む。
In step S120 of the thread search processing flow shown in FIG. 5, the analysis
図11に示す人物相関テーブル作成処理フローのステップS320において、検索処理部40の検索部42は、ステップS310において読込んだ各レコードについて順に以下を行う。すなわち、送信者−受信者として設定されているユーザの組、送信者−同報者として設定されているユーザの組を抽出し、抽出した元となったレコードのメーリングリストフラグに、メーリングリストであることを示す値が設定されていない場合は、送信者、受信者、同報者として設定されているユーザそれぞれに、第3の実施形態と同様に管理者検索対応ポイント、情報発信者検索対応ポイントを加算し、メーリングリストであることを示す値が設定されている場合は、送信者として設定されているユーザにのみに管理者検索対応ポイント、情報発信者検索対応ポイントを加算する。
In step S320 of the person correlation table creation processing flow shown in FIG. 11, the
また、図12に示す重要人物テーブル作成処理フローのステップS420において、検索部42は、抽出した元となったレコードのメーリングリストフラグに、メーリングリストであることを示す値が設定されていなければ、送信者、受信者または同報者として設定されているユーザを抽出し、メーリングリストであることを示す値が設定されている場合は、送信者として設定されているユーザのみを抽出して、それぞれのユーザが抽出された数を当該ユーザのポイント数とする。そして、図13の結果表示処理フローのステップS540において、出力制御部50の結果表示部52が、各スレッドについて、ポイントの多い順番に所定数のユーザを重要人物として表示する。
Further, in step S420 of the important person table creation processing flow shown in FIG. 12, the
[第5の実施形態]
第5の実施形態について上述した実施形態との差分を説明する。
説明する。上記の実施形態においては、メールの件名(Subjectフィールド)を形態素解析した結果をキーワードテーブルへ保存している。これは、メールの件名と本文の内容とが一致しているという理想的な場合には正しくキーワード抽出が可能であるが、返信をするときに全く別の内容が本文に書かれてしまうこともある。例えば、件名に「商用サービス展開について」が設定されているメールについては、当初は商用サービス展開に関する話題についての本文が記述されていても、返信を繰り返すうちに、次期社内システムに関する話題が中心の本文が記述されるようになる、などである。そこで、本実施の形態では、キーワードを抽出するための形態素解析の対象を、メールの件名(Subjectフィールド)及び本文とする。
[Fifth Embodiment]
The difference between the fifth embodiment and the above-described embodiment will be described.
explain. In the above embodiment, the result of morphological analysis of the mail subject (Subject field) is stored in the keyword table. This is because it is possible to extract keywords correctly in the ideal case where the subject of the email matches the content of the text, but when replying, completely different content may be written in the text. is there. For example, for emails with “Commercial Service Deployment” set in the subject line, the main topic is about the next in-house system as the reply is repeated, even if the text on the topic related to commercial service deployment is initially written. The body will be described. Therefore, in the present embodiment, the subject of morphological analysis for extracting keywords is the subject (subject field) and body of the mail.
具体的には、図5に示す分析処理フローのステップS180において、メール収集部20のメール分析部22は、メールのSubjectフィールド及び本文の設定内容を形態素解析し、その形態素解析された結果をキーワードとする。そして、メール収集部20の分析結果出力部23は、レコードIDと、スレッドIDと、キーワードとからなるレコードを、分析結果格納部30に記憶されているキーワードテーブルに追加する。
Specifically, in step S180 of the analysis processing flow shown in FIG. 5, the
しかし、このように本文についても形態素解析を行ってキーワードとした場合、解析対象が拡大するため、キーワードテーブルに登録されるキーワードの量が増加してしまう。そこで、以下のようなキーワードのフィルタリング処理を行う。すなわち、Subjectフィールドと本文について形態素解析を行った結果から、キーワードとして適切な品詞の文字列、例えば、一般名詞・動詞のみをキーワード候補として残し、さらに、そのキーワード候補として残った中から、キーワードとして不適切な文字列を削除して、最終的に残った文字列をキーワードとして登録する。なお、この削除すべき文字列は、例えば、どのような話題において使われうるような単語『下記』『頂く』『都合』『少し』などであり、例えばメール収集部20に図示しない記憶手段に予め記憶しておく。このようなキーワードのフィルタリング処理を行うことにより、より重要、かつ、特徴的なキーワードのみをキーワードテーブルに格納することができる。 However, when the morphological analysis is performed on the text as keywords as described above, the number of keywords registered in the keyword table increases because the analysis target is expanded. Therefore, the following keyword filtering process is performed. That is, from the result of morphological analysis on the Subject field and the text, leave only the appropriate part-of-speech character string as a keyword, for example, a general noun / verb as a keyword candidate. Delete inappropriate character strings and register the remaining character strings as keywords. The character string to be deleted is, for example, the words “below”, “get”, “convenient”, “a little”, etc. that can be used in any topic. Store in advance. By performing such keyword filtering processing, only more important and characteristic keywords can be stored in the keyword table.
[第6の実施形態]
図26は、本発明の第6の実施形態による検索支援装置1aの機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、図1に示す第1の実施形態による検索支援装置1と同一の部分には同一の符号を付し、その説明を省略する。図26に示す検索支援装置1aが図1に示す第1の実施形態による検索支援装置1と異なる点は、人物情報格納部60をさらに備える点、メール収集部20が人物情報生成部24をさらに備える点、検索処理部40が人物情報読込み部44をさらに備える点である。また、ここでは、出力制御部50が、検索者のコンピュータ端末であるとし、キーボードなどの入力装置から検索ワードの入力を受けるための検索文書受付部53をさらに備えるものとする。
以下、第1の実施形態との差分について説明する。
[Sixth Embodiment]
FIG. 26 is a functional block diagram of the search support apparatus 1a according to the sixth embodiment of the present invention, in which only functional blocks related to the present invention are extracted and shown. In this figure, the same parts as those in the
Hereinafter, differences from the first embodiment will be described.
メール収集部20の人物情報生成部24は、メール読込み部21により読み出された電子メールのデータを分析し、メールアドレスと、当該メールアドレスの人物の名前の対応を抽出して、人物情報格納部60が保持する人物テーブルに書き込む。検索処理部40の人物情報読み込み部44は、人物情報格納部60の保持する人物テーブルから、メールアドレスに対応した名前の情報を読み出す。なお、人物情報格納部60は、データベースサーバなどにより実現することができる。
The person
次に、本実施形態による検索支援装置1aが保持する各データについて説明する。
本実施形態による分析結果格納部30に格納されるメールテーブル、スレッドテーブル、キーワードテーブルは、図2、図3、図4に示す第1の実施形態のメールテーブル、スレッドテーブル、キーワードテーブルと同様である。なお、本実施形態においては、メールテーブルの各レコードの送信者、受信者のデータ項目に、送信者、受信者の識別情報として、Fromフィールド、Toフィールドに設定されている送信者、受信者のメールアドレスが設定される場合を例に説明する。
Next, each data held by the search support apparatus 1a according to the present embodiment will be described.
The mail table, thread table, and keyword table stored in the analysis
図27は、人物情報格納部60に格納される人物テーブルの構成を示す図である。同図において、人物テーブルは、メールアドレスと、当該メールアドレスに対応した人物名とのデータからなる複数のレコードにより構成される。人物テーブルのメールアドレスには、メールのFromフィールドに設定されているメールアドレスが格納され、人物テーブルの人物名には、人物情報生成部24によりメールの本文から抽出された人物名が設定される。
FIG. 27 is a diagram illustrating a configuration of a person table stored in the person
次に、検索支援装置1aにおける処理フローを説明する。
メール収集部20における分析処理フローは、図5に示すメール収集部20における分析処理フローと同様である。
Next, a processing flow in the search support apparatus 1a will be described.
The analysis processing flow in the
図28は、人物情報生成部24の人物情報生成処理フローである。
まず、メール収集部20のメール読込み部21は、まだこの人物情報生成処理フローによる人物情報生成処理を行っていないメールをメール記憶部10としてのメールサーバから読込む(ステップS810)。人物情報生成部24は、ステップS810において読込んだメールのメール本文のフィールドから、先頭より所定行まで、例えば、5行目までの内容を読み出す(ステップS820)。なお、各行は改行の記号により区切られているものとする。人物情報生成部24は、ステップS820において読み出した5行のうち、「〜です」と記述された行を正規表現で検索し、その「です」が含まれる行から、「です」の直前までの文章を抽出する(ステップS830)。このとき、「伊藤です」など、メール内で自己紹介をしている行を抽出し、「お疲れ様です」、「おつかれさまです」などの誤抽出を避けるため、「〜様です」、「〜さまです」の表現が使用される行については抽出しない。また、「〜です」の他にも、「〜と申します」等の自己紹介の表現に用いられる語句をキーワードとして用い、当該キーワードが含まれる行から文章を切り出しても良い。
FIG. 28 is a person information generation process flow of the person
First, the
次に、人物情報生成部24は、空白文字、句読点、記号を区切り文字として、その前、または後に出現する語句を抽出する(ステップS840)。これにより、組織名や挨拶を述べた部分に続いて名前が存在する場合に、不要な部分を除去することができる。例えば、「開発担当 伊藤です」という行の場合、ステップS830において「開発担当 伊藤」が抽出され、スペースを区切り文字として、スペースの後ろの語句「伊藤」を抽出する。「伊藤@開発担当です」という行の場合、ステップS830において「開発担当@伊藤」が抽出され、記号(@)を区切り文字として、その記号の前の語句「伊藤」を抽出する。あるいは、「開発担当、伊藤です」という行の場合、テップS830において「開発担当、伊藤」が抽出され、句読点(、)を区切り文字として、その句読点の後ろの「伊藤」を抽出する。なお、区切り文字がない行については、ステップS830において抽出された文書をそのままを抽出する。
Next, the person
続いて、人物情報生成部24は、ステップS840において抽出された文書について形態素解析を行い、固有名詞として品詞分類される語句(A)を選択する(ステップS850)。このように、品詞が固有名詞であるものが人名の候補であるというルール付けを行うことにより、名前以外の言葉であるノイズを除去する。人物情報生成部24は、メールヘッダのFromフィールドから、送信者のメールアドレス(B)を取得すると(ステップS860)、ステップS850において選択した語句(A)と、ステップS860において取得したメールアドレス(B)とを、人物情報生成部24が備える図示しない記憶手段に一時的に記憶する(ステップS870)。
Subsequently, the person
続いて、メール読込み部21が、メール記憶部10としてのメールサーバに、まだ人物情報生成処理を行っていないメールがあるかを判断する(ステップS880)。まだ、人物情報生成処理していないメールがある場合には(ステップS880:YES)、ステップS810に戻り、上述した処理を繰り返す。そして、メール記憶部10に人物情報生成処理していないメールがなくなった場合(ステップS880:NO)、ステップS870において記憶していたメールアドレス(B)と語句(A)との組から人物テーブル登録対象の組を抽出する。具体的には、あるメールアドレス(B)について、同一の語句(A)との組のみが記憶されている場合、そのメールアドレス(B)と語句(A)との組を、人物テーブル登録対象の組として抽出する。一方、同一のメールアドレス(B)について、異なる語句(A)との組み合わせが記憶されている場合、最も出現頻度が高い語句(A)を、当該メールアドレス(B)に対応した送信者の名前を示す語句(A)であると判断し、人物テーブル登録対象の組として抽出する。例えば、メールアドレス「user@srv.jp」と語句「伊藤」との組が3組、メールアドレス「user@srv.jp」と語句「日本」との組が1組、メールアドレス「user@srv.jp」と語句「関西」との組が1組記憶されている場合、最も出現率の高い語句「伊藤」がメールアドレス「user@srv.jp」の送信者の名前を示す語句であると判断し、メールアドレス「user@srv.jp」と語句「伊藤」との組を抽出する。人物情報生成部24は、抽出したメールアドレス(B)と語句(A)の組を設定したレコードを、人物情報格納部60が記憶する人物テーブルに追加する(ステップS890)。
Subsequently, the
本実施の形態による分析処理フロー(図5)及び人物情報生成処理フロー(図28)の処理を具体的なデータ例を用いて説明する。
図29はメール記憶部10から読込んだ各メールの例を、図30は図29で示されるメールから生成されるメールテーブルの例を、図31は図29で示されるメールから生成されるスレッドテーブルの例を、図32は図29で示されるメールから生成されるキーワードテーブルの例を、図33は図29で示されるメールから生成される人物テーブルの例を示す。
The analysis processing flow (FIG. 5) and person information generation processing flow (FIG. 28) according to the present embodiment will be described using specific data examples.
29 shows an example of each mail read from the
最初に、メールM1a(図29)が読込まれた場合のメールテーブル(図30)、スレッドテーブル(図31)、及び、キーワードテーブル(図32)の設定処理は、第1の実施形態のメールM1(図6)からメールテーブル(図7)、スレッドテーブル(図8)、及び、キーワードテーブル(図9)を設定する処理と同様のため省略する。
メールテーブル、スレッドテーブル、及び、キーワードテーブルの設定後、メールM1aの本文に設定されている最初の5行、1行目「別所さま」、2行目「開発部の安部です。」、3行目「お世話になっております。」、4行目「昨日お送りしたファイルの中身に」、5行目「一部誤りがございましたので」が取得される(図28、ステップS820)。そして、「〜です」と記述された行である2行目から、「です」の直前までの文章「開発部の安部」が抽出される(図28、ステップS830)。抽出された文書には区切り文字が含まれていないため、そのまま形態素解析が行なわれ、「開発部」と「安部」が抽出され、そのうち固有名詞である「安部」が人物名の候補として選択される(図28、ステップS840、S850)。そして、メールM1aから取得したFrom「userA@svr.jp」と(図28、ステップS860)、人物名の候補として選択された「安部」とが対応づけられて一時的に記憶される(図28、ステップS870)。
First, the setting process of the mail table (FIG. 30), thread table (FIG. 31), and keyword table (FIG. 32) when the mail M1a (FIG. 29) is read is the same as the mail M1 of the first embodiment. Since the processing is the same as that for setting the mail table (FIG. 7), thread table (FIG. 8), and keyword table (FIG. 9) from FIG.
After setting the mail table, thread table, and keyword table, the first five lines set in the body of the mail M1a, the first line “Bessho”, the second line “Abe of the development department.”, 3 lines The item “Thank you for your attention”, the fourth line “in the contents of the file sent yesterday”, the fifth line “Because there was some error” (FIG. 28, step S820). Then, the sentence “Abe of the development department” immediately before “is” is extracted from the second line, which is a line describing “to be” (FIG. 28, step S830). Since the extracted document does not contain delimiters, morphological analysis is performed as it is, and “development department” and “Abe” are extracted, and the proper noun “Abe” is selected as a candidate for the person name. (FIG. 28, steps S840 and S850). Then, From “userA@svr.jp” acquired from the mail M1a (FIG. 28, step S860) and “Abe” selected as the candidate for the person name are associated with each other and temporarily stored (FIG. 28). Step S870).
続いて、メールM2a(図29)が読込まれた場合のメールテーブル(図30)、スレッドテーブル(図31)、及び、キーワードテーブル(図32)の設定処理は、第1の実施形態のメールM2(図6)からメールテーブル(図7)、スレッドテーブル(図8)、及び、キーワードテーブル(図9)を設定する処理と同様のため省略する。
メールテーブル、スレッドテーブル、及び、キーワードテーブルの設定後、メールM2aの本文に設定されている最初の5行が取得されるが、ここでは、本文は4行までであるため、その4行を取得する(図28、ステップS820)。そして、「〜様です」が含まれる行を除き、「〜です」と記述された1行目から、「です」の直前までの文章「システム部の別所」が抽出される(図28、ステップS830)。抽出された文書には区切り文字が含まれていないため、そのまま形態素解析を行なって「システム部」と「別所」が抽出され、そのうち固有名詞である「別所」が人物名の候補として選択される(図28、ステップS840、S850)。そして、メールM2aから取得したFrom「userB@svr.jp」と(図28、ステップS860)、人物名の候補として選択された「別所」とが対応づけられて一時的に記憶される(図28、ステップS870)。
Subsequently, the setting process of the mail table (FIG. 30), thread table (FIG. 31), and keyword table (FIG. 32) when the mail M2a (FIG. 29) is read is the same as the mail M2 of the first embodiment. Since the processing is the same as that for setting the mail table (FIG. 7), thread table (FIG. 8), and keyword table (FIG. 9) from FIG.
After setting the mail table, thread table, and keyword table, the first 5 lines set in the body of the mail M2a are acquired, but here the body is limited to 4 lines, so that 4 lines are acquired. (FIG. 28, step S820). Then, except for the line that contains "~ sama is", the text "Between the system part" is extracted from the first line described as "~ is" immediately before "is" (Fig. 28, step) S830). Since the extracted document does not contain a delimiter, morphological analysis is performed as it is to extract “system part” and “Bessho”, and the proper noun “Bessho” is selected as a candidate for a person name. (FIG. 28, step S840, S850). Then, From “userB@svr.jp” acquired from the mail M2a (FIG. 28, step S860) and “Bessho” selected as a candidate for the person name are associated with each other and temporarily stored (FIG. 28). Step S870).
このようにして、図29に示すメールM1〜M8について図28の処理を行った結果が、図30に示すメールテーブル、図31に示すスレッドテーブル、図32に示すキーワードテーブルであり、一時記憶に記憶されたメールアドレスと選択した人物名との組から、図28のステップS890の処理を行った結果が図33に示す人物テーブルである。 The result of performing the processing of FIG. 28 on the mails M1 to M8 shown in FIG. 29 is the mail table shown in FIG. 30, the thread table shown in FIG. 31, and the keyword table shown in FIG. The result of performing the process of step S890 of FIG. 28 from the set of the stored mail address and the selected person name is the person table shown in FIG.
次に、検索が要求された場合の処理について示す。
検索処理部40のクエリ受付部41が、結果表示部50が入力を受けた検索ワードを読込んだ以降の処理フローは、第1の実施形態の図10〜図12と同様である。
Next, processing when a search is requested will be described.
The processing flow after the
図34は、出力制御部50の結果表示処理フローを示す。同図において、ステップS910〜S980までの処理は、第1の実施形態の図13のステップS510〜S580と同様である。ただし、ステップS940において、結果表示部52は、各スレッドについて、重要人物テーブルで示されるユーザのメールアドレスのうち、ポイント数の多い順番に所定数のユーザのメールアドレスを重要人物のメールアドレスとして抽出する。そして、抽出した各スレッドの重要人物のメールアドレスを、その重要人物のメールアドレスに対応したポイント数とともに表示する。また、ステップS980において、結果表示部52は、各スレッドについて、人物相関テーブルで示される送信者メールアドレスと受信者メールアドレスの組のうち、ポイント数の多い順番に所定数の組を抽出する。そして、各スレッドについて抽出した送信者メールアドレスと受信者メールアドレスの組を、その送信者メールアドレスと受信者メールアドレス送受信者の組のポイント数に対応したポイント数とともに表示する。
FIG. 34 shows a result display processing flow of the
続いて、人物名の表示が必要であることが設定されている場合(ステップS990:YES)、検索結果読込み部51は、ステップS910において検索結果として読込んだ人物相関テーブルの送信者メールアドレス及び受信者メールアドレスの組に設定されているメールアドレス、重要人物テーブルに設定されているユーザのメールアドレス、または、現在画面に表示させているメールアドレスを検索処理部40に出力し、人物名の情報を要求する。
Subsequently, when it is set that display of the person name is necessary (step S990: YES), the search
検索処理部40の人物情報読込み部44は、人物情報格納部60に記憶されている人物テーブルから、受信したメールアドレスに対応した人物名の情報を読み出すと、当該メールアドレスと人物名とを関連づけて人物名検索結果を検索処理部40に返送する。検索結果読込み部51が、人物情報読込み部44から出力される人物名検索結果を受信すると、結果表示部52は、メールアドレスの表示に対応づけて、人物名検索結果により示される、当該メールアドレスに関連付けられた人物名を表示する(ステップS1000)。
When the person
なお、ステップS910において、検索結果にあわせて、当該検索結果に含まれる人物相関テーブルの送信者メールアドレス及び受信者メールアドレスの組に設定されているメールアドレス、重要人物テーブルに設定されているユーザのメールアドレスに関連付けられた人物名を示す人物名検索結果を予め、検索結果処理部40から受信しておくことでもよい。
Note that in step S910, in accordance with the search result, the mail address set in the combination of the sender mail address and the receiver mail address of the person correlation table included in the search result, the user set in the important person table A person name search result indicating a person name associated with the e-mail address may be received from the search
上述した検索処理部40の処理、及び、出力制御部50の処理を具体的なデータ例を用いて説明する。
図35はメールテーブルの例を、図36はスレッドテーブルの例を、図37はキーワードテーブルの例を、図38は人物テーブルの例を示す図であり、クエリ受付部41が検索キーワード読込む前に設定されているものとする。また、検索キーワードとして「販売」が入力されるとする。このとき作成される人物相関テーブル及び重要人物テーブルを図39に示す。
The processing of the
35 shows an example of a mail table, FIG. 36 shows an example of a thread table, FIG. 37 shows an example of a keyword table, and FIG. 38 shows an example of a person table, before the
スレッド検索処理において、検索キーワードが読込まれると(図10、ステップS210)、キーワードテーブル(図37)に設定されているスレッドIDが順に選択される(図10、ステップS220)。スレッドID「116」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「340」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2006/7/1 15:12」が読込まれ、スレッドID「116」と対応付けて記憶される(図10、ステップS240、S250)。 In the thread search process, when a search keyword is read (FIG. 10, step S210), thread IDs set in the keyword table (FIG. 37) are sequentially selected (FIG. 10, step S220). When the thread ID “116” is selected, a record (record ID “340”) in which the search word “sales” is set as a keyword from a record in the keyword table (FIG. 37) in which the thread ID is set. It is detected (FIG. 10, step S230). The start date and time “2006/7/1 15:12” corresponding to the thread ID is read and stored in association with the thread ID “116” (FIG. 10, steps S240 and S250).
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)のレコードから、検索ワード「販売」がキーワードとして設定されているレコード(レコードID「372」)が検出される(図10、ステップS230)。そして、当該スレッドIDに対応した開始日時「2007/1/7 13:10」が読込まれ、スレッドID「120」と対応付けて記憶される(図10、ステップS240、S250)。 Next, when the thread ID “120” is selected, a record (record ID “372”) in which the search word “sales” is set as a keyword from a record of the keyword table (FIG. 37) in which the thread ID is set. ") Is detected (FIG. 10, step S230). Then, the start date and time “2007/1/7 13:10” corresponding to the thread ID is read and stored in association with the thread ID “120” (FIG. 10, steps S240 and S250).
次に、スレッドID「144」が選択された場合、当該スレッドIDが設定されているキーワードテーブル(図37)には、検索ワード「販売」がキーワードとして設定されているレコードがないことが検出される(図10、ステップS230)。
これにより、処理対象スレッドID「116」、「120」と、それぞれの開始日時「2006/7/1 15:12」、「2007/1/7 13:10」が記憶される(図10、ステップS250)。
Next, when the thread ID “144” is selected, it is detected that there is no record in which the search word “sales” is set as a keyword in the keyword table (FIG. 37) in which the thread ID is set. (FIG. 10, step S230).
As a result, the processing target thread IDs “116” and “120” and the start dates and times “2006/7/1 15:12” and “2007/1/7 13:10” are stored (FIG. 10, step). S250).
続いて、人物相関テーブル作成処理(図11)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「500」〜「506」)が特定される(図11、ステップS310)。図39に示すように、この特定されたレコードの送信者メールアドレスと受信者メールアドレスの情報から、「userA@svr.jpとuserB@svr.jp」、「userA@svr.jpとuserC@svr.jp」、「userA@svr.jpとuserD@svr.jp」、「userA@svr.jpとuserE@svr.jp」、「userB@svr.jpとuserE@svr.jp」の組が抽出され、それらの組が抽出された数はそれぞれ「4」、「2」、「2」、「2」、「3」である(図11、ステップS320)。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「507」〜「511」)を特定する(図11、ステップS310)。図39に示すように、この特定されたレコードの送信者メールアドレスと受信者メールアドレスの情報から、「userA@svr.jpとuserB@svr.jp」、「userA@svr.jpとuserC@svr.jp」、「userA@svr.jpとuserD@svr.jp」、「userA@svr.jpとuserE@svr.jp」の組が抽出され、それらの組が抽出された数はそれぞれ「2」、「2」、「3」、「1」である(図11、ステップS320)。
これにより、各スレッドID毎に、これらの抽出されたユーザのメールアドレスの組と、その組の抽出数に対応したポイントとを示す人物相関テーブル(図39)が生成される(図11、ステップS340)。ここでは、抽出数1を1ポイントとしている。
Subsequently, a person correlation table creation process (FIG. 11) is started, and process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 11, step S310). As shown in FIG. 39, “userA@svr.jp and userB@svr.jp”, “userA@svr.jp and userC @ svr” are obtained from information of the sender mail address and the receiver mail address of the specified record. .jp "," userA@svr.jp and userD@svr.jp "," userA@svr.jp and userE@svr.jp ", and" userB@svr.jp and userE@svr.jp " The numbers extracted from these sets are “4”, “2”, “2”, “2”, and “3”, respectively (FIG. 11, step S320).
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 11, step S310). ). As shown in FIG. 39, “userA@svr.jp and userB@svr.jp”, “userA@svr.jp and userC @ svr” are obtained from information of the sender mail address and the receiver mail address of the specified record. .jp ”,“ userA@svr.jp and userD@svr.jp ”,“ userA@svr.jp and userE@svr.jp ”are extracted, and the number of these extracted groups is“ 2 ”. , “2”, “3”, “1” (FIG. 11, step S320).
As a result, for each thread ID, a person correlation table (FIG. 39) is generated that shows a set of the extracted mail addresses of the users and points corresponding to the number of extractions of the set (FIG. 11, step). S340). Here, the
続いて、重要人物テーブル作成処理(図12)が開始され、処理対象スレッドIDが順に選択される。スレッドID「116」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「500」〜「506」)が特定される(図12、ステップS410)。図39に示すように、この特定されたレコードの送信者メールアドレスまたは受信者メールアドレスに設定されているユーザのメールアドレスとして、「userA@svr.jp」、「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」が抽出され、その抽出したユーザのメールアドレスの登場回数「10」、「7」、「2」、「2」、「5」が計測される。
次に、スレッドID「120」が選択された場合、当該スレッドIDが設定されているメールテーブル(図35)のレコード(メールID「507」〜「511」)が特定される(図12、ステップS420)。図39に示すように、この特定されたレコードの送信者メールアドレスまたは受信者メールアドレスに設定されているユーザのメールアドレスとして、「userA@svr.jp」、「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」が抽出され、その抽出したユーザのメールアドレスの登場回数「8」、「2」、「2」、「3」、「1」が計測される。
これにより、各スレッドID毎に、これらの抽出されたユーザのメールアドレスと、その登場回数に対応したポイントとを示す重要人物テーブルが生成される(図12、ステップS440)。なお、ここでは、登場回数1回を1ポイントとしている。
Subsequently, the important person table creation process (FIG. 12) is started, and the process target thread IDs are sequentially selected. When the thread ID “116” is selected, the records (mail IDs “500” to “506”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 12, step S410). As shown in FIG. 39, as user email addresses set in the sender email address or recipient email address of this identified record, “userA@svr.jp”, “userB@svr.jp”, “ “userC@svr.jp”, “userD@svr.jp”, “userE@svr.jp” are extracted, and the number of appearances of the extracted user's mail address is “10”, “7”, “2”, “2” ”And“ 5 ”are measured.
Next, when the thread ID “120” is selected, the records (mail IDs “507” to “511”) of the mail table (FIG. 35) in which the thread ID is set are specified (FIG. 12, step). S420). As shown in FIG. 39, as user email addresses set in the sender email address or recipient email address of this identified record, “userA@svr.jp”, “userB@svr.jp”, “ “userC@svr.jp”, “userD@svr.jp”, “userE@svr.jp” are extracted, and the number of appearances of the extracted user's email address is “8”, “2”, “2”, “3” "," 1 "is measured.
Thereby, for each thread ID, an important person table indicating these extracted user mail addresses and points corresponding to the number of appearances is generated (FIG. 12, step S440). Here, the number of appearances is 1 point.
図40は、図39に示す重要人物テーブルに基づいた重要人物出力イメージであり、時系列にスレッドを並べて表示したイメージを示す。ここでは、重要人物は、ポイント数が高い順に3人としている。なお、所定のポイント数以上などとすることもでき、この条件は予め出力制御部50に記憶されるか、ユーザにより入力される。
図40においては、重要人物テーブル(図39)に含まれるスレッドID「116」、「120」を、これらの開始日時「2006/07/01 15:12」、「2007/07/08 23:11」に対応した時間軸上に、時系列で表示している。そして、スレッドID「116」については、ポイント数が高い順に「userA@svr.jp」、「userB@svr.jp」、「userE@svr.jp」が表示され、スレッドID「120」については、ポイント数が高い順に「userA@svr.jp」、「userD@svr.jp」、「userB@svr.jp」、「userC@svr.jp」が表示されている。なお、「userB@svr.jp」と「userC@svr.jp」はポイント数が同じため、両者を表示しているものである。
FIG. 40 is an important person output image based on the important person table shown in FIG. 39, and shows an image in which threads are displayed in time series. Here, there are three important persons in descending order of the number of points. Note that the number of points may be equal to or greater than a predetermined number, and the condition is stored in advance in the
In FIG. 40, the thread IDs “116” and “120” included in the important person table (FIG. 39) are assigned the start dates and times “2006/07/01 15:12” and “2007/07/08 23:11”. On the time axis corresponding to “”. For the thread ID “116”, “userA@svr.jp”, “userB@svr.jp”, “userE@svr.jp” are displayed in descending order of the number of points, and for the thread ID “120”, “UserA@svr.jp”, “userD@svr.jp”, “userB@svr.jp”, and “userC@svr.jp” are displayed in descending order of the number of points. Since “userB@svr.jp” and “userC@svr.jp” have the same number of points, both are displayed.
図41は、図39に示す重要人物テーブルに基づいた、検索時期を指定したときの重要人物及び人物相関図の表示イメージを示す。ここでは、2006年が指定されとする。なお、検索時期の条件は、ユーザにより入力されるものとする。
出力制御部50の結果表示部52は、重要人物テーブル(図39)に含まれるスレッドID「116」、「120」のうち、開始日時が2006年であるスレッドID「116」を選択する。そして、スレッドID「116」については、重要人物として、ポイント数が高い順に「userA@svr.jp」、「userB@svr.jp」、「userE@svr.jp」を、そのポイント数とともに表示する。また、人物相関テーブル(図39)から、当該スレッドIDに対応して、重要人物としてのポイント数が最も高い「userA@svr.jp」が含まれる送受信の組と、そのポイント数を読込む。そして、ポイント数が最も高い「userA@svr.jp」を中心として、送受信の組となる各ユーザのメールアドレス「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」をその周囲に表示するとともに、「userA@svr.jp」と各ユーザのメールアドレス「userB@svr.jp」、「userC@svr.jp」、「userD@svr.jp」、「userE@svr.jp」との間に、ポイント数を表示し、そのポイント数に対応した太さの線を描画する。なお、表示する送受信者のメールアドレスの組をポイント数の多い組から所定数としてもよく、所定のポイント数以上の送受信の組を表示するようにしてもよい。
FIG. 41 shows a display image of the important person and the person correlation diagram when the search time is designated based on the important person table shown in FIG. Here, 2006 is designated. The search time condition is input by the user.
The
図42は、検索画面の全体イメージを示す図である。同図においては、人物名の表示を指示するためのチェックボックスに、チェックが入っていない。このとき、検索画面には、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物のメールアドレス、人物相関図と人物相関図に含まれる人物のメールアドレス、及び、各スレッドに送信者または受信者として登場したユーザのメールアドレスの一覧とそのポイント数が表示されている。 FIG. 42 shows an overall image of the search screen. In the figure, the check box for instructing the display of the person name is not checked. At this time, the search screen includes a field for entering a search word, a thread arranged in chronological order and the mail address of the important person, the mail address of the person included in the person correlation chart and the person correlation chart, and the transmission to each thread. A list of e-mail addresses of users who have appeared as subscribers or recipients and the number of points are displayed.
図43は、人物名の表示を指示するためのチェックボックスに、チェックが入っているときの検索画面の全体イメージを示す図である。このとき、検索画面には、検索ワードを入力するフィールド、時系列に並べたスレッドとその重要人物のメールアドレス、人物相関図と人物相関図に含まれる人物のメールアドレス、及び、各スレッドに送信者または受信者として登場したユーザのメールアドレスの一覧とそのポイント数が表示されており、各メールアドレスには、そのメールアドレスに関連付けられた人物名が表示されている。 FIG. 43 is a diagram showing an overall image of the search screen when a check box for instructing display of a person name is checked. At this time, the search screen includes a field for entering a search word, a thread arranged in chronological order and the mail address of the important person, the mail address of the person included in the person correlation chart and the person correlation chart, and the transmission to each thread. A list of e-mail addresses of users who appear as users or recipients and the number of points are displayed, and each e-mail address displays a person name associated with the e-mail address.
なお、本実施の形態に、第2〜第5の実施形態を組み合わせることも可能である。 It should be noted that the second to fifth embodiments can be combined with this embodiment.
[第7の実施形態]
第7の実施形態では、会議における各参加者の発話内容を音声認識によりテキスト化し、メールと同様のデータ形式に成型することにより、上記実施形態と同様の処理を適用して重要人物の検索や人物相関の把握を可能とするものである。以下、第7の実施形態について第1の実施形態との差分について説明する。
[Seventh Embodiment]
In the seventh embodiment, the utterance content of each participant in the conference is converted into text by voice recognition and formed into a data format similar to that of mail, thereby applying the same processing as in the above embodiment to search for important persons. It is possible to grasp the person correlation. Hereinafter, the difference between the seventh embodiment and the first embodiment will be described.
図44は、本発明の第7の実施形態による検索支援装置1bの機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、図1に示す第1の実施形態による検索支援装置1と同一の部分には同一の符号を付し、その説明を省略する。図44に示す検索支援装置1bが図1に示す第1の実施形態による検索支援装置1と異なる点は、音声認識部80がメール記憶部10に接続されており、音声データ記憶部70が音声認識部80に接続されている点である。
FIG. 44 is a functional block diagram of the search support apparatus 1b according to the seventh embodiment of the present invention, in which only functional blocks related to the present invention are extracted and shown. In this figure, the same parts as those in the
音声データ記憶部70は、例えば、データベースサーバなどで実現することができ、会議名と、会議中の音声を収集してデータ化した音声データと、会議開催日時と、会議の参加者及び司会者のメールアドレスとを設定した会議ファイルを記憶する。なお、1回の会議について1つの会議ファイルが生成されるものとする。
The voice
図45は、音声認識部80の構成を示すブロック図である。音声認識部80は、例えば、サーバなどのコンピュータ装置で実現することができ、発話者データ記憶部81、音声データ分割部82、発話者認識部83、音声テキスト変換部84、及び、メール変換部85を備える。発話者データ記憶部81は、各人物を特定するユーザ特定情報としてのメールアドレスと、当該人物の音声の特徴を示すパラメータとを対応づけた音声特徴情報を記憶する。
FIG. 45 is a block diagram showing a configuration of the
音声データ分割部82は、音声データ記憶部70から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人の発話者が発言している発話区間に区切った分割音声データを生成する。発話者認識部83は、分割音声データと、発話者データ記憶部81に記憶されている各話者の音声特徴情報とから発話者を特定し、特定した発話者のメールアドレスを読み出す。音声テキスト変換部84は、分割音声データから、発話内容をテキスト化したテキストデータを生成する。メール変換部85は、発話者のメールアドレス、会議ファイル内の参加者のメールアドレス及び会議時間、発話内容のテキストデータをそれぞれ、Fromフィールド、Toフィールド、Subjectフィールド、メール本文に設定したメールのデータを生成し、メール記憶部10へ書き込む。
The voice
次に、本実施形態による検索支援装置1bの処理を説明する。
図46は、本実施形態による音声認識部80におけるメール形式データ生成処理フローを示す。音声認識部80の発話者データ記憶部81には、会議参加者の音声特徴情報が予め登録されているものとする。そして、会議の終了後には、音声データ記憶部70に会議ファイルが登録される。
Next, processing of the search support apparatus 1b according to the present embodiment will be described.
FIG. 46 shows a mail format data generation processing flow in the
例えば、会議の取りまとめ者が予め会議名、会議の参加者及び司会者のメールアドレスをPC(パーソナルコンピュータ)などに入力しておき、会議の開始時に当該PCに音声収集開始指示を入力し、終了時に音声収集停止指示を入力する。PCは、音声収集開始指示を入力してから音声収集停止指示が入力されるまで、当該PCが備えるマイクによって収集した会議中の音声の音声データを生成する。PCは、音声収集停止指示が入力され、音声データの生成を終了すると、予め入力された会議名、会議の参加者及び司会者のメールアドレスと、生成された音声データと、会議開催日時としての当該音声データの生成日時とを設定した会議ファイルを生成し、音声データ記憶部70に書き込む。なお、このPCが音声データ記憶部70、音声認識部80を実現する装置であってもよい。
For example, the meeting organizer inputs the meeting name, meeting participants and the moderator's e-mail addresses in advance to a PC (personal computer), etc., and inputs the voice collection start instruction to the PC at the start of the meeting. Sometimes input voice collection stop instruction. The PC generates voice data of the voice during the meeting collected by the microphone included in the PC until the voice collection stop instruction is inputted after the voice collection start instruction is inputted. When the voice collection stop instruction is input and the generation of the voice data is finished, the PC finishes generating the conference name, the conference participants and the moderator mail addresses, the generated voice data, and the conference date and time. A conference file in which the generation date and time of the audio data is set is generated and written in the audio
音声認識部80の音声データ分割部82は、まだ本メール形式データ生成処理フローによるメール形式データ生成処理を行なっていない会議ファイルを音声データ記憶部70から読み出す(ステップS1110)。なお、ユーザにより処理対象として指定された会議ファイルを読み出すようにしてもよい。音声データ分割部82は、読み出した会議ファイルに設定されている音声データを取得すると、当該音声データを1人の発話者が発言している発話区間に区切った分割音声データを抽出する(ステップS1120)。このとき、最初の分割音声データの抽出であれば、音声データの冒頭から、2回目以降の抽出であれば、直前までに抽出した分割音声データを除いた音声データの冒頭から、分割音声データを抽出する。なお、1つの発話区間は、例えば、無音区間から次の無音区間としたり、1人の発話者が発言している間の区間としたりすることができる。音声データ分割部82は、分割音声データに対応した音声収集開始時点からの経過時間、つまり、分割音声データにより示される発話区間の開始部分が、音声データにより示される会議中音声において冒頭からどれくらいの時間が経過した時点のものであるかを取得する。
The voice
次に、発話者認識部83は、既存の話者認識技術を用いて、ステップS1120において抽出された分割音声データにより示される音声が、誰の発言であるかを特定する。例えば、分割音声データにより示される音声(発話)のパターンが、発話者データ記憶部81に記憶されているいずれかのユーザの音声特徴情報、例えば、声紋の特徴を示すデータと一致するかを判断する(ステップS1130)。このとき、ステップS1110において読み出した会議ファイルに登録されているメールアドレスにより特定される音声特徴情報のみを使用してもよい。
Next, the
一致する音声特徴情報がある場合(ステップS1130:YES)、発話者認識部83は、この一致する音声特徴情報に設定されている電子メールアドレスを発話者データ記憶部81から取得し、この取得した発話者のメールアドレスが、会議ファイルに設定されている司会者のメールアドレスと同じであるかを判断する(ステップS1140)。発話者のメールアドレスが司会者のメールアドレスと同じではない場合(ステップS1140:NO)、発話者認識部83は、一致する音声特徴情報から読出した電子メールアドレスを、発話者のメールアドレスとして自身の備える記憶手段に一時的に記憶しておく(ステップS1150)。音声テキスト変換部84は、既存の音声認識技術を用いて、ステップS1120において抽出された分割音声データから発話内容をテキスト化し、テキストデータを生成する(ステップS1160)。
If there is matching voice feature information (step S1130: YES), the
メール変換部85は、発話者のメールアドレス、発話内容のテキストデータ、分割音声データに基づいてメールデータを生成し、メール情報記憶部70に書き込む(ステップS1170)。具体的には、まず、メール変換部85は、ステップS1150において発話者認識部83が記憶していた発話者のメールアドレス、ステップS1110において読み出した会議ファイル内の参加者のメールアドレス、当該会議ファイル内の会議名、ステップS1160において生成した発話内容のテキストデータをそれぞれ、Fromフィールド、Toフィールド、Subjectフィールド、メール本文に設定したメールデータを生成する。なお、Toフィールドには、会議ファイル内の参加者のメールアドレスから発話者のメールアドレスを除いて設定するようにしてもよい。
The
続いて、メール変換部85は、発話毎、つまり、分割音声データ毎に一意のMessage-IDを生成して、当該メールデータのMessage-IDフィールドに設定する。Message-IDは、「0001@kaigi20081122.svr.jp」のように、会議における発話に基づいて生成されたメールデータであることを示すための特定の文字列、ここでは、「kaigi」を含んだものとする。メール変換部85は、Referencesフィールドに、同じ会議ファイル内の音声データから抽出した他の分割音声データについて既に生成された他のメールデータのMessage-IDを設定する。ここでは、分割音声データを音声データの冒頭から順に抽出しているため、現在処理対象としている分割音声データよりも遡った時点の発話内容が設定されたメールデータのMessage-IDが取得され、設定されることになる。よって、最初に抽出された分割音声データの場合、Referencesフィールドは設定されない。さらに、メール変換部85は、会議ファイルから取得した会議開催日時に、ステップS1120において取得した経過時間を加算した日時を、メールデータのDateフィールドに設定する。
Subsequently, the
音声データ分割部82は、音声データに次の発話区間があるか否かを判断する(ステップS1180)。音声データに次の発話区間がある場合には(ステップS1180:YES)、ステップS1120からの処理を繰り返す。そして、音声データの最後までの分割音声データの抽出を終了した場合には(ステップS1180:NO)、処理を終了する。
The voice
なお、ステップS1130において、一致する音声特徴情報がないと判断した場合(ステップS1130:YES)、ステップS1180の処理を行う。一致する音声特徴情報がない場合としては、例えば、複数話者の同時発話や、発話者の音声特徴情報が発話者データ記憶部81に未登録である場合などが想定される。
また、ステップS1140において、発話者のメールアドレスが、会議ファイルに登録されている司会者のメールアドレスと同じである場合(ステップS1140:YES)、ステップS1180の処理を行う。これにより、発言は多いが、会議の話題に関する重要人物ではない司会者を、検索時に重要人物として検出されないようにする。なお、司会者についても会議の話題に係る重要人物の検索対象としたい場合には、ステップS1140の処理は行なわない。
If it is determined in step S1130 that there is no matching audio feature information (step S1130: YES), the process of step S1180 is performed. As a case where there is no matching voice feature information, for example, simultaneous speech of a plurality of speakers or a case where the voice feature information of the talker is not registered in the talker
In step S1140, if the speaker's email address is the same as the moderator's email address registered in the conference file (step S1140: YES), the process of step S1180 is performed. Thus, a moderator who has a lot of remarks but is not an important person related to the topic of the conference is not detected as an important person at the time of search. Note that the process of step S1140 is not performed when it is desired to search for an important person related to the topic of the meeting for the presenter.
図47は、本実施形態によるメール収集部20における分析処理フローを示す。同図において、ステップS1210〜S1270までの処理は、第1の実施形態における図5のステップS110〜S170までの処理と同様である。
FIG. 47 shows an analysis processing flow in the
メール分析部22は、読み込んだメールのMessage-IDフィールドの設定内容に、「kaigi」などの会議に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1280)。会議に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1280:NO)、第1の実施形態における図5のステップS180〜S190と同様の処理を行なう(ステップS1290〜S1300)。ただし、ステップS1290において、メール分析部22は、メールのSubjectフィールド及びメール本文の設定内容を形態素解析し、形態素解析された結果をキーワードとする。
The
一方、会議に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1280:YES)、メール分析部22は、メールのSubjectフィールド及び本文の設定内容を形態素解析するとともに、形態素解析された結果をキーワード候補とする(ステップS1310)。メール分析部22は、ステップS1310で抽出されたキーワード候補から1つを選択すると(ステップS1320)、メール分析部22が備える記憶手段に、スレッドID及び選択したキーワード候補に対応して記憶されている出現回数を、1加算した出現回数に更新する(ステップS1330)。なお、スレッドID及び選択したキーワード候補に対応した出現回数が記憶されていない場合は、スレッドID及び選択したキーワード候補に対応づけて、出現回数「1」を書き込む。メール分析部22は、更新された出現回数が、キーワード候補をキーワードとして登録すべき出現回数の閾値(例えば、3回)に達したかを判断する(ステップS1340)。
On the other hand, when the character string indicating that the mail is generated based on the meeting is included (step S1280: YES), the
ステップS1340において、更新後の出現回数が閾値未満、あるいは、閾値より大きいと判断された場合(ステップS1340:≠)、メール分析部22は、ステップS1310において抽出したキーワード候補のうちまだ選択していないキーワード候補があるかを判断する(ステップS1360)。
If it is determined in step S1340 that the number of appearances after the update is less than the threshold or greater than the threshold (step S1340: ≠), the
ステップS1340において、更新後の出現回数が閾値に達した場合(ステップS1340:=)、分析結果出力部23は、このキーワード候補をキーワードとし、新たなレコードIDを付与する。分析結果出力部23は、この新たに付与したレコードIDと、スレッドIDと、キーワードとからなるレコードをキーワードテーブルに追加する(ステップS1350)。メール分析部22は、ステップS1310において抽出したキーワード候補のうちまだ選択していないキーワード候補があるかを判断する(ステップS1360)。
In step S1340, when the number of appearances after the update reaches a threshold value (step S1340: =), the analysis
メール分析部22は、まだ選択していないキーワード候補がある場合(ステップS1360:YES)、ステップS1320からの処理を繰り返す。そして、抽出した全てのキーワード候補を選択した場合には(ステップS1360:NO)、ステップS1300からの処理を行なう。
If there is a keyword candidate that has not yet been selected (step S1360: YES), the
会議の場合、発話内容に含まれる単語を全てキーワードとした場合、キーワードが膨大な量となってしまったり、会議の主要な話題には関係しない内容もキーワードとして抽出されてしまったりする場合がある。そこで、上記の処理により、会議中に何度も出現した単語のみをキーワードとして選択する。なお、会議中に1回でも発言があったものをキーワードとする場合には、ステップS1280、S1310〜S1360の処理を行なわなくともよい。
また、キーワードテーブルに登録されるキーワードの量が増加してしまったり、不要なキーワードが登録されてしまったりすることを防ぐため、第5の実施形態を適用して、キーワード及びキーワード候補のフィルタリング処理を行ってもよい。また、Subjectフィールドのみを形態素解析し、キーワード及びキーワード候補を抽出することでもよい。
In the case of a conference, if all the words included in the utterance content are used as keywords, the amount of keywords may be enormous, or content not related to the main topic of the conference may be extracted as keywords. . Therefore, only the word that appears many times during the meeting is selected as a keyword by the above processing. Note that if the keyword is one that has been remarked even once during the meeting, the processing of steps S1280 and S1310 to S1360 need not be performed.
In addition, in order to prevent the amount of keywords registered in the keyword table from increasing or unnecessary keywords from being registered, the fifth embodiment is applied to filter the keywords and keyword candidates. May be performed. Alternatively, only the Subject field may be morphologically analyzed to extract keywords and keyword candidates.
次に、本実施形態による検索処理部40における処理について説明する。本実施形態の検索処理部40のクエリ受付部41が検索要求を受信し、実行するスレッド検索処理フローは、図10に示す第1の実施形態によるスレッド検索処理フローと同様である。
Next, processing in the
図48は、本実施形態による人物相関テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶したスレッドID(以下、処理対象スレッドID)のうち、当該人物相関テーブル作成処理フローによる人物相関テーブル作成処理をまだ行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS1410)。
FIG. 48 shows a person correlation table creation process flow according to this embodiment.
The
検索部42は、ステップS1410において読込んだレコードから、送信者と受信者に設定されているユーザの組を送受信者の組として抽出し、抽出した送受信者の組それぞれについて、抽出された数をカウントする(ステップS1420)。なお、送信者と受信者のユーザが入れ替わっていても、同じ組であるとする。検索部42は、ステップS1410において読み込んだレコードのメッセージIDに、「kaigi」などの会議における発話に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1430)。
The
会議における発話に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1430:NO)、ステップS1420において抽出した送受信者の組それぞれについて、当該送受信者の組が抽出された数をそのままポイントとして付与する(ステップS1440)。一方、会議における発話に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1430:YES)、ステップS1420において抽出した送受信者の組それぞれについて、当該送受信者の組が抽出された数に0.1などの所定の係数a(0<a<1)を乗算した数をポイントとして付与する(ステップS1450)。 When the character string indicating that the mail is generated based on the utterance in the conference is not included (step S1430: NO), the sender / receiver pair is extracted for each sender / receiver pair extracted in step S1420. The number is assigned as a point as it is (step S1440). On the other hand, when the character string which shows that it is the mail produced | generated based on the speech in a meeting is contained (step S1430: YES), the group of the said sender / receiver is set for each sender / receiver group extracted in step S1420. A number obtained by multiplying the extracted number by a predetermined coefficient a such as 0.1 (0 <a <1) is given as a point (step S1450).
検索部42は、処理対象スレッドIDに、まだ人物相関テーブル作成処理を行っていないスレッドIDがあるかを判断する(ステップS1460)。まだ人物相関テーブル作成処理を行っていないスレッドIDがある場合(ステップS1460:NO)、ステップS1410からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、人物相関テーブル作成処理を実行した場合(ステップS1460:YES)、検索部42は、スレッドID毎に、送信者−受信者のユーザの組及び当該組に対応したポイントを示す一覧である人物相関テーブルを生成して記憶する(ステップS1470)。
The
図49は、本実施形態による重要人物テーブル作成処理フローを示す。
検索処理部40の検索部42は、図10のステップS250において記憶した処理対象スレッドIDのうち、当該重要人物テーブル作成処理フローによるおいてまだ重要人物テーブル作成処理を行っていないスレッドIDを選択する。検索部42は、メールテーブルを検索し、選択したスレッドIDが設定されているレコードを特定して読込む(ステップS1510)。検索部42は、ステップS1510において読み込んだレコードのメッセージIDに、「kaigi」などの会議に基づいて生成されたメールであることを示す文字列が含まれているかを判断する(ステップS1520)。
FIG. 49 shows an important person table creation processing flow according to this embodiment.
The
会議に基づいて生成されたメールであることを示す文字列が含まれていない場合(ステップS1520:NO)、検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者または受信者として設定されている数である登場回数を計測し、その計測した数を当該ユーザのポイントとして記憶する(ステップS1530)。
When the character string indicating that the mail is generated based on the conference is not included (step S1520: NO), the
一方、会議に基づいて生成されたメールであることを示す文字列が含まれている場合(ステップS1520:YES)、検索部42は、読込んだレコードから、送信者または受信者として設定されているユーザを抽出し、その抽出したユーザが、送信者として設定されている数、及び、受信者として設定されている数をそれぞれ計測する(ステップS1540)。検索部42は、抽出したユーザそれぞれについて、当該ユーザが送信者として設定されている数に所定の係数bを乗算した数と、当該ユーザが受信者として設定されている数に所定の係数cを乗算した数とを合計し、当該ユーザのポイントを算出する。ここで、係数b及び係数cは、0<b<1、0<c<1とし、かつ、b>cとする。また、係数bまたは係数cを、係数aと同一の値とする。検索部42は、抽出した各ユーザのポイントを記憶する(ステップS1550)。
On the other hand, when the character string indicating that the mail is generated based on the meeting is included (step S1520: YES), the
検索部42は、処理対象スレッドIDに、まだ重要人物テーブル作成処理を行っていないスレッドIDがある場合は(ステップS1560:NO)、ステップS1510からの処理を繰り返す。そして、全ての処理対象スレッドIDについて、重要人物テーブル作成処理を実行した場合は(ステップS1560:YES)、スレッドID毎に、ステップS1530またはS1550において抽出されたユーザと、当該ユーザのポイントとを示す一覧である重要人物テーブルを生成して記憶する(ステップS1570)。
If there is a thread ID that has not yet undergone the important person table creation process in the process target thread ID (step S1560: NO), the
続いて実施される本実施形態による結果表示処理は、図13に示す第1の実施形態と同様である。 The subsequent result display processing according to this embodiment is the same as that of the first embodiment shown in FIG.
会議の場合、参加者間で発話者が入れ替わる回数が多いため、1つの会議ファイルから、発話内容を示すメールが大量に生成されてしまう。そこで、通常メール1通を、会議での複数の発言に対応するように重み付けしてポイントを付与している。上記では、会議ファイルから生成されたメールの場合、送受信者の組が抽出された数に係数a=0.1を乗算してポイントとおり、これは、[通常メール1通:会議での1回の発言=10:1]の重みの比としていること、つまり、通常メール1通に、会議での10回の発言に相当する重み付けをしていることを示す。また、係数b>係数cとすることにより、会議において発言した参加者を当該会議の他の参加者より重み付けし、発話者をより重要な人物とみなすことが可能となる。また、係数bまたは係数cを係数aと同値とすることにより、通常メール1通と会議での1回の発言との重みの比を、人物相関テーブルと重要人物テーブルとで同一にしている。係数a,b,cは、上述した条件の範囲で任意に設定することができる。 In the case of a conference, since there are many times that a speaker is switched between participants, a large amount of mail indicating the utterance content is generated from one conference file. Therefore, points are given by weighting one normal mail so as to correspond to a plurality of utterances at the conference. In the above, in the case of an email generated from a conference file, the number of pairs of senders and receivers extracted is multiplied by a coefficient a = 0.1, as pointed. It is shown that the weight ratio is 10: 1], that is, one normal mail is weighted corresponding to 10 utterances in the conference. In addition, by setting coefficient b> coefficient c, it is possible to weight participants who speak in the conference from other participants in the conference and regard the speaker as a more important person. In addition, by setting the coefficient b or the coefficient c to the same value as the coefficient a, the ratio of the weights of one normal mail and one utterance at the meeting is made the same in the person correlation table and the important person table. The coefficients a, b, and c can be arbitrarily set within the range of the above-described conditions.
なお、図49に示す重要人物テーブル作成処理フローのステップS1540において、検索部42は、読込んだレコードから送信者として設定されているユーザを抽出し、その抽出したユーザが送信者として設定されている数と、係数aを乗算した数を当該ユーザのポイントとして算出することでもよい。
In step S1540 of the important person table creation processing flow shown in FIG. 49, the
なお、上記においては、本実施形態と第1の実施形態の差分を説明したが、第2〜4、6の実施形態と組み合わせることも可能である。 In addition, although the difference between this embodiment and 1st Embodiment was demonstrated in the above, it is also possible to combine with 2nd, 4th, and 6th embodiment.
なお、検索支援装置1、1a、1bは、内部にコンピュータシステムを有している。そして、上述したメール収集部20、検索処理部40、出力制御部50、及び、音声認識部80の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPUや各種メモリ、OSや周辺機器等のハードウェアを含むものである。
The
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
1…検索支援装置
10…メール記憶部
20…メール収集部
21…メール読込み部(メール読込み手段)
22…メール分析部(メール分析手段)
23…分析結果出力部(分析結果出力手段)
24…人物情報生成部
30…分析結果格納部(分析結果格納手段)
40…検索処理部
41…クエリ受付部(受付手段)
42…検索部(検索手段)
43…検索結果出力部
44…人物情報読込み部
50…出力制御部(出力制御手段)
51…検索結果読込み部
52…結果表示部
53…検索文書受付部
60…人物情報格納部(人物情報格納手段)
70…音声データ記憶部(音声データ記憶手段)
80…音声認識部
81…発話者データ記憶部(発話者データ記憶手段)
82…音声データ分割部(音声データ分割手段)
83…発話者認識部(発話者認識手段)
84…音声テキスト変換部(音声テキスト変換手段)
85…メール変換部(メール変換手段)
DESCRIPTION OF
22 ... Mail analysis section (mail analysis means)
23. Analysis result output section (analysis result output means)
24 ... person
40 ...
42 ... Search part (search means)
43 ... Search
51 ... Search
70: Audio data storage unit (audio data storage means)
80 ...
82: Audio data dividing unit (audio data dividing means)
83 ... Speaker recognition unit (speaker recognition means)
84 ... voice text conversion unit (voice text conversion means)
85 ... Mail conversion part (Mail conversion means)
Claims (27)
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、
検索条件の入力を受ける受付手段と、
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、
を備え、
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする検索支援装置。 Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information associating the keywords with each other,
A mail reading means for reading an e-mail from a mail storage means storing the e-mail;
Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table When,
If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
Accepting means for receiving search conditions,
The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
Equipped with a,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remember emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A search support apparatus characterized by that.
ことを特徴とする請求項1に記載の検索支援装置。 The output control means outputs users whose number acquired by the search means is larger than a predetermined condition for each thread identification information in an order corresponding to the number set by the user. The search support apparatus according to 1.
前記出力制御手段は、前記検索手段により取得したユーザの組をスレッド識別情報毎に出力する、
ことを特徴とする請求項1または請求項2に記載の検索支援装置。 The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Obtain a set of users set as sender and receiver from the record in the mail table,
The output control means outputs a set of users acquired by the search means for each thread identification information.
The search support apparatus according to claim 1, wherein the search support apparatus is a search support apparatus.
前記出力制御手段は、前記検索手段により取得したユーザの組に基づいて、当該取得したユーザの組に含まれる複数ユーザ間の相関を示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1または請求項2に記載の検索支援装置。 The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Obtain a set of users set as sender and receiver from the record in the mail table,
The output control unit outputs, for each thread identification information, information indicating a correlation between a plurality of users included in the acquired user set based on the user set acquired by the search unit.
The search support apparatus according to claim 1, wherein the search support apparatus is a search support apparatus.
前記出力制御手段は、さらに、ユーザの組が設定されている数に対応した情報を出力する、
ことを特徴とする請求項3または請求項4に記載の検索支援装置。 The search means further obtains the number of sets of the user set from the mail table record specified by the thread identification information,
The output control means further outputs information corresponding to the number of sets of users.
The search support apparatus according to claim 3, wherein the search support apparatus is a search support apparatus.
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定のポイントを付与するとともに、同報者として設定されているユーザに前記所定のポイントより所定の重み付けをしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の検索支援装置。 The mail table record further includes broadcaster information;
The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
For each thread identification information acquired, the search means has a predetermined point for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And giving a point weighted by a predetermined weight from the predetermined point to a user set as a broadcaster,
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
Search support device according to any one of claims 1 to 5, characterized in that.
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の検索支援装置。 For each acquired thread identification information, the search means gives a predetermined point to a user set as a receiver in each record of the mail table specified by the thread identification information, and sets as a sender A point given a predetermined weight than the predetermined point is given to the user who has been,
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
Search support device according to any one of claims 1 to 5, characterized in that.
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザをスレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の検索支援装置。 For each acquired thread identification information, the search means is set as a sender when the receiver set in each record of the mail table specified by the thread identification information is an address of a mailing list. Given points to users who are not mailing list addresses, give given points to users set as senders and users set as recipients,
The output control means outputs a user whose total number of points given by the search means is greater than a predetermined condition for each thread identification information.
Search support device according to any one of claims 1 to 5, characterized in that.
前記出力制御手段は、各ユーザの組のポイントに対応した情報を出力する、
ことを特徴とする請求項1から請求項9のいずれか1項に記載の検索支援装置。 The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and the acquired thread identification information is identified by the thread identification information. Information indicating that a set of users set as a sender and a receiver and the number of sets of the set of users are obtained from the record in the mail table and generated based on a meeting in the record. When set, information indicating that a predetermined point is assigned to each user group according to the number of the user group set and information indicating that the record is generated based on the conference is set in the record. If the user group is not set, the user group is set with points weighted from the predetermined points. Granted according to the number,
The output control means outputs information corresponding to each user set point,
The search support apparatus according to any one of claims 1 to 9, wherein
ことを特徴とする請求項1から請求項10のいずれか1項に記載の検索支援装置。 When the information indicating that the analysis result output means is generated based on the conference is set in the read e-mail, the result obtained by morphological analysis of the information obtained from the read e-mail is set as the keyword candidate, When the keyword candidate is obtained a predetermined number of times or more from the email corresponding to the thread identification information, the keyword candidate is associated with the thread identification information and written to the keyword table.
Search support device according to any one of claims 1 to 10, characterized in that.
各ユーザの音声の特徴を示すパラメータである音声特徴情報を記憶する発話者データ記憶手段と、
前記音声データ記憶手段から会議ファイルを読み出し、読み出した会議ファイル内の音声データを、1人のユーザが発言している発話区間に区切った分割音声データを生成する音声データ分割手段と、
前記分割音声データと、前記発話者データ記憶手段に記憶されている各ユーザの音声特徴情報とから発話者であるユーザを特定する発話者認識手段と、
前記分割音声データから、発話内容をテキスト化したテキストデータを生成する音声テキスト変換手段と、
前記発話者認識手段が特定した発話者を送信者に、前記会議データ内の参加者を受信者に、前記会議データ内の会議名を件名に、前記音声テキスト変換手段が生成したテキストデータを本文に設定するとともに、新たに生成したメッセージ識別情報と、会議に基づき生成されたことを示す情報と、関連する他の電子メールのメッセージ識別情報として、同じ音声データから抽出した他の分割音声データに基づいて生成した電子メールのメッセージ識別情報とを設定した電子メールを生成し、前記メール記憶手段へ書き込むメール変換手段と、
をさらに備えることを特徴とする請求項1から請求項11のいずれか1項に記載の検索支援装置。 Audio data storage means for storing conference data including conference name, audio data of audio during the conference, and participants indicating users who participated in the conference;
Speaker data storage means for storing voice feature information which is a parameter indicating the voice feature of each user;
A voice data dividing unit that reads a conference file from the voice data storage unit, and generates divided voice data in which the voice data in the read conference file is divided into speech sections in which one user is speaking;
Speaker recognition means for identifying a user who is a speaker from the divided voice data and voice feature information of each user stored in the speaker data storage means;
Voice text conversion means for generating text data obtained by converting the speech content into text from the divided voice data;
The speaker specified by the speaker recognition means is the sender, the participant in the conference data is the receiver, the meeting name in the conference data is the subject, and the text data generated by the speech text conversion means is the body text. To the other divided voice data extracted from the same voice data as newly generated message identification information, information indicating that it was generated based on the meeting, and message identification information of other related emails A mail conversion unit that generates an email in which the message identification information of the email generated based on the email is set, and writes the email in the email storage unit;
Search support device according to any one of claims 1 to 11, characterized by further comprising a.
前記音声データ分割手段は、前記分割音声データにより示される音声に対応した、前記音声データにより示される音声における冒頭からの経過時間を取得し、
前記メール変換手段は、前記会議データ内の会議開催日時に、前記音声データ分割手段が取得した経過時間を加算した日時をさらに設定した電子メールを生成する、
ことを特徴とする請求項12に記載の検索支援装置。 The conference data further includes information on the date and time of the conference.
The audio data dividing means acquires an elapsed time from the beginning of the sound indicated by the audio data corresponding to the audio indicated by the divided audio data,
The mail conversion means generates an e-mail that further sets a date and time obtained by adding an elapsed time acquired by the voice data dividing means to a meeting date and time in the meeting data.
The search support apparatus according to claim 12 , wherein:
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段と、 A mail reading means for reading an e-mail from a mail storage means storing the e-mail;
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段と、 Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table When,
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段と、 If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
検索条件の入力を受ける受付手段と、 Accepting means for receiving search conditions,
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段と、 The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段と、 Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
を備え、 With
前記メールテーブルのレコードは、さらに、同報者の情報を含み、 The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、 The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、 For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、 The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とする検索支援装置。 A search support apparatus characterized by that.
前記分析結果出力手段は、読み込んだ電子メールのスレッド識別情報を新たに生成したときに、当該スレッド識別情報と、当該電子メールのヘッダの情報から取得した日時の情報を示す開始日時とを対応付けてスレッドテーブルに書き込み、
前記検索手段は、さらに、前記キーワードテーブルから取得したスレッド識別情報に対応した開始日時の情報を読み出し、
前記出力制御手段は、入力を受けた期間条件に合致する開始日時のスレッド識別情報について前記ユーザまたは前記ユーザの組を出力する、
ことを特徴とする請求項1から請求項14のいずれか1項に記載の検索支援装置。 The analysis result storage means further stores thread identification information and a thread table indicating information on a start date and time of the thread specified by the thread identification information,
The analysis result output means associates the thread identification information with the start date and time indicating the date and time information obtained from the header information of the email when the thread identification information of the read email is newly generated. Write to the thread table
The search means further reads out information of a start date corresponding to the thread identification information acquired from the keyword table,
The output control means outputs the user or the set of users for thread identification information of a start date and time that matches the period condition received.
Search support device according to any one of claims 14 claim 1, wherein the.
前記分析結果出力手段は、読込んだ電子メールのヘッダ情報から取得した日付の情報をさらに設定したレコードを前記メールテーブルに追加し、
前記検索手段は、前記取得したスレッド識別情報で特定される前記メールテーブルのレコードからさらに日付の情報を取得し、
出力制御手段は、前記検索手段により取得した各スレッド識別情報に対応する日付の情報に基づいて、所定の期間毎の電子メール数を示す情報を、各スレッド識別情報毎に出力する、
ことを特徴とする請求項1から請求項15のいずれか1項に記載の検索支援装置。 The mail table record further includes date information;
The analysis result output means adds a record further setting date information acquired from the header information of the read e-mail to the mail table,
The search means further acquires date information from the record of the mail table specified by the acquired thread identification information,
The output control means outputs, for each thread identification information, information indicating the number of e-mails for each predetermined period based on the date information corresponding to each thread identification information acquired by the search means.
Search support device according to any one of claims 1 to 15, characterized in that.
ことを特徴とする請求項1から請求項16のいずれか1項に記載の検索支援装置。 17. The analysis result output means writes a subject obtained from the read electronic mail or a result of morphological analysis of subject and body information as a keyword in the keyword table. The search support device according to any one of the above.
ことを特徴とする請求項17に記載の検索支援装置。 The search support apparatus according to claim 17, wherein the analysis result output means writes a result of morphological analysis with a predetermined part of speech as a keyword in the keyword table.
ことを特徴とする請求項17または請求項18に記載の検索支援装置。 The analysis result output means writes a result obtained by removing a predetermined unnecessary character string from the results of morphological analysis as a keyword in the keyword table. Search support device.
前記メール読込み手段により読込まれた電子メールの本文の情報から、自己紹介に用いられる所定の語句が含まれている行を抽出し、抽出した行を形態素解析して得られた語句のうち固有名詞の語句を選択し、選択した語句と、読込んだ前記電子メールのヘッダ情報から取得した送信者を特定する情報とを対応づけて前記人物テーブルに書き込む人物情報生成手段とをさらに備え、
前記出力制御手段は、出力対象の前記ユーザを特定する情報、または、出力対象の前記ユーザの組を構成するユーザを特定する情報に対応して前記人物テーブルから読み出されたユーザの名前を出力する、
ことを特徴とする請求項1から請求項19のいずれか1項に記載の検索支援装置。 Person information storage means for storing a person table indicating information that associates information for identifying a user with the name of the user;
From the information in the body of the email read by the mail reading means, extract a line containing a predetermined word used for self-introduction, and a proper noun among words obtained by morphological analysis of the extracted line A personal information generating unit that associates the selected phrase with information identifying the sender acquired from the read header information of the e-mail and writes it in the person table;
The output control means outputs the name of the user read from the person table corresponding to the information specifying the user to be output or the information specifying the users constituting the set of users to be output To
Search support device according to any one of claims 19 claim 1, wherein the.
ことを特徴とする請求項20に記載の検索支援装置。 The person information generating means extracts a line including a predetermined word and phrase used for self-introduction from a line from the beginning to a predetermined number of lines set in the body information of the e-mail. The search support device according to claim 20.
ことを特徴とする請求項20または請求項21に記載の検索支援装置。 The person information generating means extracts a phrase before or after a delimiter from a line extracted as including a predetermined phrase used for self-introduction, performs morphological analysis, and obtains a phrase obtained as a proper noun and The search support apparatus according to claim 20 or 21, wherein the information identifying the sender acquired from the read header information of the electronic mail is written in the person table in association with the information.
ことを特徴とする請求項20から請求項22のいずれか1項に記載の検索支援装置。 21. The person information generation means writes the sender's e-mail address acquired from the read header information of the e-mail as information specifying the sender in the person table. search support device according to any one of 22.
メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、
メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、
分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、
受付手段が、検索条件の入力を受け、
検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、
出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶し、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とする検索支援方法。 Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information that associates the keywords with each other, presenting an important person related to the desired information, and a search support method used in a search support apparatus that supports the search of the information Because
The email reading means reads the email from the email storage means storing the email,
The mail analysis means acquires message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and whether the acquired message identification information is registered in the mail table. Judgment
When the analysis result output means determines that the mail analysis means is not registered, it newly generates thread identification information of the read e-mail, and when it is determined that it is registered, The thread identification information is acquired from the mail table record specified by the message identification information of other related emails, the message identification information acquired from the header information of the read email, the sender and the receiver, and newly A keyword that is a result of morphological analysis of information obtained from the read e-mail, and a record in which the generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table, and the thread Write in the keyword table in association with the identification information,
The receiving means receives the search conditions and
The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and is specified by the thread identification information for each acquired thread identification information. Obtaining a user set as a sender or a receiver from the record in the mail table and the number of the user set as a sender or a receiver,
Output control means, the number acquired by the searching means includes a step of outputting more user than a predetermined condition for each thread identification information,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remember emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A search support method characterized by that.
メール読込み手段が、電子メールを記憶しているメール記憶手段から電子メールを読込み、 The email reading means reads the email from the email storage means storing the email,
メール分析手段が、前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断し、 The mail analysis means acquires message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and whether the acquired message identification information is registered in the mail table. Judgment
分析結果出力手段が、前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込み、 When the analysis result output means determines that the mail analysis means is not registered, it newly generates thread identification information of the read e-mail, and when it is determined that it is registered, The thread identification information is acquired from the mail table record specified by the message identification information of other related emails, the message identification information acquired from the header information of the read email, the sender and the receiver, and newly A keyword that is a result of morphological analysis of information obtained from the read e-mail, and a record in which the generated thread identification information or thread identification information acquired from the mail table is set is added to the mail table, and the thread Write in the keyword table in association with the identification information,
受付手段が、検索条件の入力を受け、 The receiving means receives the search conditions and
検索手段が、前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得し、 The search means acquires thread identification information of a keyword that matches the search word indicated by the search condition received by the reception means from the keyword table, and is specified by the thread identification information for each acquired thread identification information. Obtaining a user set as a sender or a receiver from the record in the mail table and the number of the user set as a sender or a receiver,
出力制御手段が、前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する過程を有し、 The output control means includes a step of outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information,
前記メールテーブルのレコードは、さらに、同報者の情報を含み、 The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、 The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、 For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、 The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とする検索支援方法。A search support method characterized by that.
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、
検索条件の入力を受ける受付手段、
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、
として機能させ、
前記メール記憶手段は、会議における発話者であるユーザを送信者に、当該会議の参加者を受信者に、当該会議の会議名を件名に、前記発話者であるユーザの発話内容を本文に設定し、かつ、会議に基づき生成されたことを示す情報を含み、関連する他の電子メールのメッセージ識別情報として、当該会議における他の発話内容を設定した他の電子メールのメッセージ識別情報を設定した電子メールを記憶しており、
前記分析結果出力手段は、読み込んだ電子メールに会議に基づき生成されたことを示す情報が設定されている場合、前記メールテーブルに追加する前記レコードに、会議に基づき生成されたことを示す当該情報をさらに設定し、
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルに設定される各レコードを特定し、特定した各レコードに会議に基づき生成されたことを示す情報が設定されている場合は、当該各レコードに送信者として設定されているユーザに所定のポイントを付与するとともに受信者として設定されているユーザに当該所定のポイントよりも低いポイントを付与し、会議に基づき生成されたことを示す情報が設定されていない場合は、当該各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに前記所定のポイントよりも重み付けしたポイントを付与し、
前記出力制御手段は、前記検索手段により付与したポイントの合計が所定の条件より多いユーザを示す情報を、スレッド識別情報毎に出力する、
ことを特徴とするコンピュータプログラム。 A computer used as a search support device that presents an important person related to desired information and supports search of the information,
Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information in which keywords are associated with each other,
Mail reading means for reading e-mail from mail storing means for storing e-mail;
Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table ,
If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
Accepting means for receiving search conditions,
The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for obtaining a user who is set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
To function as,
The mail storage means sets a user who is a speaker in a conference as a sender, a participant of the conference as a receiver, a conference name of the conference as a subject, and a utterance content of the user as a speaker as a text. In addition, the message identification information of other e-mails that set other utterance contents in the meeting is set as the message identification information of other related e-mails including information indicating that it was generated based on the meeting. Remembers emails,
The information indicating that the analysis result output means is generated based on the conference in the record to be added to the mail table when the information indicating that the analysis result output unit is generated based on the conference is set in the read e-mail. Set further,
The search means specifies, for each acquired thread identification information, each record set in the mail table specified by the thread identification information, and information indicating that the specified record is generated based on a meeting Is set, a predetermined point is given to the user set as the sender in each record, and a point lower than the predetermined point is given to the user set as the receiver. If the information indicating that it has been generated based on the above is not set, a point weighted more than the predetermined point is given to the user set as the sender and the user set as the receiver in each record And
The output control means outputs, for each thread identification information, information indicating a user whose total number of points given by the search means is greater than a predetermined condition.
A computer program characterized by the above.
各電子メールを特定するメッセージ識別情報と、当該電子メールが属するスレッドを特定するスレッド識別情報と、送信者及び受信者との情報を少なくとも含むレコードからなるメールテーブル、及び、各スレッドのスレッド識別情報と、キーワードとを対応づけた情報を示すキーワードテーブルを記憶する分析結果格納手段、 Message identification information for identifying each electronic mail, thread identification information for identifying the thread to which the electronic mail belongs, a mail table composed of records including at least information on a sender and a receiver, and thread identification information for each thread And an analysis result storage means for storing a keyword table indicating information in which keywords are associated with each other,
電子メールを記憶しているメール記憶手段から電子メールを読込むメール読込み手段、 Mail reading means for reading e-mail from mail storing means for storing e-mail;
前記メール読込み手段により読込まれた電子メールのヘッダの情報から、関連する他の電子メールのメッセージ識別情報を取得し、取得したメッセージ識別情報が前記メールテーブルに登録されているかを判断するメール分析手段、 Mail analysis means for acquiring message identification information of other related electronic mail from the information of the header of the electronic mail read by the mail reading means, and determining whether the acquired message identification information is registered in the mail table ,
前記メール分析手段により、登録されていないと判断された場合は、読込んだ電子メールのスレッド識別情報を新たに生成し、登録されていると判断された場合は、前記関連する他の電子メールのメッセージ識別情報により特定されるメールテーブルのレコードからスレッド識別情報を取得し、読込んだ電子メールのヘッダ情報から取得したメッセージ識別情報、送信者及び受信者と、新たに生成したスレッド識別情報または前記メールテーブルから取得したスレッド識別情報とを設定したレコードを前記メールテーブルに追加するとともに、読込んだ電子メールから得られる情報を形態素解析した結果であるキーワードと、前記スレッド識別情報と対応づけて前記キーワードテーブルに書き込む分析結果出力手段、 If it is determined by the mail analysis means that it is not registered, thread identification information of the read e-mail is newly generated, and if it is determined that it is registered, the related other e-mail The thread identification information is acquired from the mail table record specified by the message identification information of the message, the message identification information acquired from the header information of the read electronic mail, the sender and the receiver, and the newly generated thread identification information or A record in which thread identification information acquired from the mail table is set is added to the mail table, and a keyword obtained as a result of morphological analysis of information obtained from the read electronic mail is associated with the thread identification information. Analysis result output means for writing to the keyword table;
検索条件の入力を受ける受付手段、 Accepting means for receiving search conditions,
前記キーワードテーブルから、前記受付手段により受け付けた検索条件で示される検索ワードに一致するキーワードのスレッド識別情報を取得し、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルのレコードから送信者または受信者として設定されているユーザと、当該ユーザが送信者または受信者として設定されている数とを取得する検索手段、 The mail table specified by the thread identification information is acquired for each thread identification information obtained from the keyword table, by acquiring thread identification information of a keyword that matches the search word indicated by the search condition received by the receiving means. Search means for acquiring a user set as a sender or a receiver from the record and a number of the user set as a sender or a receiver,
前記検索手段により取得した数が所定の条件より多いユーザをスレッド識別情報毎に出力する出力制御手段、 Output control means for outputting a user whose number acquired by the search means is greater than a predetermined condition for each thread identification information;
として機能させ、 Function as
前記メールテーブルのレコードは、さらに、同報者の情報を含み、 The mail table record further includes broadcaster information;
前記分析結果出力手段は、前記読込んだ電子メールのヘッダ情報から取得した同報者の情報をさらに設定したレコードを前記メールテーブルに追加し、 The analysis result output means adds, to the mail table, a record further setting information of the broadcaster acquired from the header information of the read electronic mail,
前記検索手段は、取得した各スレッド識別情報毎に、当該スレッド識別情報で特定される前記メールテーブルの各レコードに送信者として設定されているユーザ及び受信者として設定されているユーザに所定の管理者検索対応ポイントを付与するとともに、同報者として設定されているユーザに前記所定の管理者検索対応ポイントより高い管理者検索対応ポイントを付与し、 For each acquired thread identification information, the search means performs predetermined management for a user set as a sender and a user set as a receiver in each record of the mail table specified by the thread identification information. And assigning an administrator search support point higher than the predetermined administrator search support point to the user set as a broadcaster,
前記出力制御手段は、前記管理者検索対応ポイントの合計が所定の条件より多いユーザを管理者として示す情報を、スレッド識別情報毎に出力する、 The output control means outputs, for each thread identification information, information indicating, as an administrator, a user whose total number of administrator search corresponding points is greater than a predetermined condition.
ことを特徴とするコンピュータプログラム。 A computer program characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009029158A JP5348754B2 (en) | 2008-02-12 | 2009-02-10 | Search support apparatus and method, and computer program |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008031033 | 2008-02-12 | ||
JP2008031033 | 2008-02-12 | ||
JP2008222065 | 2008-08-29 | ||
JP2008222065 | 2008-08-29 | ||
JP2009029158A JP5348754B2 (en) | 2008-02-12 | 2009-02-10 | Search support apparatus and method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010079872A JP2010079872A (en) | 2010-04-08 |
JP5348754B2 true JP5348754B2 (en) | 2013-11-20 |
Family
ID=42210192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009029158A Active JP5348754B2 (en) | 2008-02-12 | 2009-02-10 | Search support apparatus and method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5348754B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014069582A1 (en) | 2012-11-05 | 2014-05-08 | 日本電気株式会社 | Related information presentation device, and related information presentation method |
JP6021272B2 (en) * | 2014-07-08 | 2016-11-09 | 京セラドキュメントソリューションズ株式会社 | Information processing system and information processing method |
JP7028179B2 (en) | 2016-09-29 | 2022-03-02 | 日本電気株式会社 | Information processing equipment, information processing methods and computer programs |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000066970A (en) * | 1998-08-19 | 2000-03-03 | Nec Corp | Personal relationship information management system, its method and recording medium |
JP2000112931A (en) * | 1998-10-08 | 2000-04-21 | Toshiba Corp | Intelligent conference support system |
JP3446886B2 (en) * | 1999-12-21 | 2003-09-16 | 日本電気株式会社 | Personal network data management system and personal network search method |
JP2002185530A (en) * | 2000-12-11 | 2002-06-28 | Hitachi Ltd | Mail participant prediction system |
JP2002351888A (en) * | 2001-05-25 | 2002-12-06 | Osaka Gas Co Ltd | Retrieval method, retrieval system, central unit, and computer program |
JP2004046680A (en) * | 2002-07-15 | 2004-02-12 | Recruit Co Ltd | Method and system for determinining communication pattern |
JP4378131B2 (en) * | 2003-08-12 | 2009-12-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information processing apparatus, information processing system, database search method, and program |
-
2009
- 2009-02-10 JP JP2009029158A patent/JP5348754B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010079872A (en) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8781080B2 (en) | Systems and methods for presenting audio messages | |
US7693267B2 (en) | Personalized user specific grammars | |
JP5671557B2 (en) | System including client computing device, method of tagging media objects, and method of searching a digital database including audio tagged media objects | |
US20080281927A1 (en) | Summarization tool and method for a dialogue sequence | |
KR101513888B1 (en) | Apparatus and method for generating multimedia email | |
US8230034B2 (en) | Automatic display of email distribution lists | |
EP2680165B1 (en) | System and method to perform textual queries on voice communications | |
US20190050406A1 (en) | Intelligent query system for attachments | |
US20200137224A1 (en) | Comprehensive log derivation using a cognitive system | |
JP2012514938A5 (en) | ||
WO2016163028A1 (en) | Utterance presentation device, utterance presentation method, and program | |
CN102984050A (en) | Method, client and system for searching voices in instant messaging | |
US20190303384A1 (en) | Method and system for consolidating data retrieved from different sources | |
JP5348754B2 (en) | Search support apparatus and method, and computer program | |
JP5611155B2 (en) | Content tagging program, server and terminal | |
US20230163988A1 (en) | Computer-implemented system and method for providing an artificial intelligence powered digital meeting assistant | |
US10733981B2 (en) | Digital messaging system | |
JPWO2018061824A1 (en) | Information processing apparatus, information processing method, and computer program | |
JP2001014309A (en) | Device and method for converting character and recording medium recording program for character conversion | |
US20050134938A1 (en) | Systems and methods for tracking communication | |
CN113495941A (en) | Method and apparatus for retrieving content items | |
Gruber | Communication in the New Media | |
JPH1146212A (en) | Electronic mail distribution system and record medium storing program to activate computer as the system and readable by the computer | |
JPH10177529A (en) | Electronic incoming guidance method and device therefor, and storage medium storing electronic mail incoming guidance program | |
Hunter et al. | Keeping your threads untangled: an intelligent system for semi-automatically organising corporate messages by content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5348754 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |