JP2017199258A - Related topic detection device - Google Patents

Related topic detection device Download PDF

Info

Publication number
JP2017199258A
JP2017199258A JP2016090869A JP2016090869A JP2017199258A JP 2017199258 A JP2017199258 A JP 2017199258A JP 2016090869 A JP2016090869 A JP 2016090869A JP 2016090869 A JP2016090869 A JP 2016090869A JP 2017199258 A JP2017199258 A JP 2017199258A
Authority
JP
Japan
Prior art keywords
topic
information
section
user
posted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016090869A
Other languages
Japanese (ja)
Inventor
柊 高橋
Hiiragi Takahashi
柊 高橋
悠 菊地
Yu Kikuchi
悠 菊地
健 榎園
Ken Enokizono
健 榎園
佑介 深澤
Yusuke Fukazawa
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2016090869A priority Critical patent/JP2017199258A/en
Publication of JP2017199258A publication Critical patent/JP2017199258A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To more accurately detect a related topic.SOLUTION: A related topic detection device includes: a section topic information storage part 14 for storing section topic information which associates a topic of the contributed information contributed in the section for each section which is a range of the predetermined time with a user having contributed the contributed information; and a related topic detection part 15 for detecting a second topic of a second section relating to a first topic of a first section based on the user who is shown in the section topic information stored by the section topic information storage part 14 and who contributes the contributed information of the first topic and the second topic. The related topic detection part 15 may perform the detection based on a similarity between the user who contributes the contributed information of the first topic within a first section and the user who contributes the contributed information of the second topic within a second section.SELECTED DRAWING: Figure 1

Description

本発明は、ユーザが投稿した投稿情報のトピックが時系列で変化する状況において、あるトピックに関連するトピックを検出する関連トピック検出装置に関する。   The present invention relates to a related topic detection apparatus that detects a topic related to a certain topic in a situation where a topic of posted information posted by a user changes in time series.

従来、メッセージ交換システムにおいて、ユーザ端末間で交換される時系列上のメッセージの内容に関連するトピックに関する表示を行う技術が知られている(下記特許文献1)。   2. Description of the Related Art Conventionally, in a message exchange system, a technique for performing display related to a topic related to the contents of time-series messages exchanged between user terminals is known (Patent Document 1 below).

特開2016−21178号公報Japanese Patent Laid-Open No. 2006-2178

一般的に、トピックの時系列変化の関連性(構造)を明らかにする手法として、単位時間毎のトピックにおける語の出現確率を比較する手法がある。しかしながら、当該手法では、出現確率が類似しているトピック間の関連性は明らかにできるものの、トピック間の語の出現確率が異なる場合、当該トピック間の関連性が明らかにならないという問題がある。すなわち、関連性のあるトピックを確実に検出することができないという問題がある。   Generally, as a technique for clarifying the relevance (structure) of topical time series changes, there is a technique for comparing the appearance probabilities of words in a topic for each unit time. However, although this method can clarify the relationship between topics having similar appearance probabilities, there is a problem that the relationship between the topics is not clarified when the appearance probabilities of words between topics are different. That is, there is a problem that related topics cannot be reliably detected.

そこで、本発明は、かかる課題に鑑みて為されたものであり、関連性のあるトピックをより確実に検出することができる関連トピック検出装置を提供することを目的とする。   Therefore, the present invention has been made in view of such problems, and an object of the present invention is to provide a related topic detection apparatus that can more reliably detect related topics.

上記課題を解決するため、本発明の関連トピック検出装置は、所定の時間の範囲である区間ごとに、当該区間において投稿された投稿情報のトピックと当該投稿情報を投稿したユーザとを対応付けた区間トピック情報を格納する区間トピック情報格納手段と、第1の区間の第1のトピックに関連する第2の区間の第2のトピックを、区間トピック情報格納手段によって格納された区間トピック情報に示されるユーザであって、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて検出する関連トピック検出手段と、を備える。   In order to solve the above problems, the related topic detection device of the present invention associates, for each section that is a predetermined time range, the topic of posted information posted in the section and the user who posted the posted information. Section topic information storage means for storing section topic information and a second topic of the second section related to the first topic of the first section are indicated in the section topic information stored by the section topic information storage means. Relevant topic detection means for detecting based on a user who has posted information on the first topic and the second topic.

かかる構成を採れば、関連トピック検出手段により、第1の区間の第1のトピック(関連元トピック)に関連する第2の区間の第2のトピック(関連先トピック)が、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて検出される。これにより、例えば、第1のトピックと第2のトピックとの間の語の出現確率が異なる場合でも、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいてより確実に、第1のトピックに関連するトピックとして第2のトピックを検出することができる。すなわち、関連性のあるトピックをより確実に検出することができる。   With this configuration, the second topic (related topic) in the second section related to the first topic (related source topic) in the first section is converted into the first topic and the related topic detection unit by the related topic detection unit. It is detected based on the user who posted the posting information of the second topic. Thereby, for example, even when the appearance probabilities of the words between the first topic and the second topic are different, more reliably based on the user who posted the posting information of the first topic and the second topic, The second topic can be detected as a topic related to the first topic. That is, a related topic can be detected more reliably.

また、本発明の関連トピック検出装置において、関連トピック検出手段は、第1のトピックの投稿情報を第1の区間内に投稿したユーザと、第2のトピックの投稿情報を第2の区間内に投稿したユーザとの類似度に基づいて検出することとしてもよい。一般的に、関連性のある2つのトピックそれぞれの投稿情報は、類似度の大きい(より類似している)ユーザが投稿している可能性が高いという特徴がある。かかる構成を採れば、当該特徴を利用して、第1のトピックの投稿情報を第1の区間内に投稿したユーザと、第2のトピックの投稿情報を第2の区間内に投稿したユーザとの類似度に基づいて、より確実に、第1のトピックに関連する第2のトピックを検出することができる。   In the related topic detection apparatus of the present invention, the related topic detection means includes a user who posted the first topic posting information in the first section, and the second topic posting information in the second section. It is good also as detecting based on the similarity with the user who contributed. Generally, the posting information of each of two related topics is characterized by a high possibility that a user with a high degree of similarity (more similar) has posted. With this configuration, using the feature, a user who posted the posting information on the first topic in the first section, and a user who posted the posting information on the second topic in the second section, Based on the similarity, the second topic related to the first topic can be detected more reliably.

また、本発明の関連トピック検出装置において、関連トピック検出手段は、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザの数に基づいて検出することとしてもよい。一般的に、関連性のある2つのトピックそれぞれの投稿情報は、同じユーザが投稿している可能性が高いという特徴がある。かかる構成を採れば、当該特徴を利用して、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザの数に基づいて、より確実に、第1のトピックに関連する第2のトピックを検出することができる。   In the related topic detection apparatus of the present invention, the related topic detection means posts the posting information of the first topic within the first section, and the posting information of the second topic within the second section. It may be detected based on the number of posted users. Generally, the posting information of each of two related topics is characterized by the high possibility that the same user has posted. If such a configuration is adopted, the posting information of the first topic is posted in the first section and the posting information of the second topic is posted in the second section using the feature. Based on the number, the second topic related to the first topic can be detected more reliably.

また、本発明の関連トピック検出装置は、関連トピック検出手段によって第1の区間の第1のトピックに関連する第2の区間の第2のトピックが検出された場合、区間トピック情報格納手段によって格納された区間トピック情報に基づいて、第1のトピックの投稿情報を第1の区間内に投稿したユーザのうち、第2のトピックの投稿情報を第2の区間内に投稿していないユーザを抽出し、抽出されたユーザに対して第2のトピックに基づく出力を行うトピック出力手段をさらに備えることとしてもよい。かかる構成を採れば、関連トピック検出手段によって第1のトピックに関連する第2のトピックが検出された場合、トピック出力手段により、第1のトピックの投稿情報を第1の区間内に投稿したユーザのうち、第2のトピックの投稿情報を第2の区間内に投稿していないユーザが抽出され、抽出されたユーザに対して第2のトピックに基づく出力が行われる。これにより、例えば、第1のトピックに関する投稿を行ったユーザのうち、当該第1のトピックに関連する第2のトピックの存在に気づいていないユーザに対して、当該第2のトピックの存在を気づかせることができる。すなわち、ユーザに対して、当該ユーザが興味のあるトピックと関連があるトピックであって、かつ当該ユーザが気づいていないトピックを気づかせることができる等、ユーザの利便性を向上することができる。   The related topic detection device of the present invention stores the second topic in the second section related to the first topic in the first section by the related topic detection means when the second topic is detected by the section topic information storage means. Out of the users who posted the posting information of the first topic in the first section, the users who have not posted the posting information of the second topic in the second section are extracted based on the section topic information Then, it may be further provided with topic output means for performing output based on the second topic for the extracted user. With this configuration, when the related topic detection unit detects the second topic related to the first topic, the user who posted the posting information of the first topic within the first section by the topic output unit Among them, the user who has not posted the posting information of the second topic within the second section is extracted, and the output based on the second topic is performed on the extracted user. Thereby, for example, among the users who have made postings related to the first topic, the user who is not aware of the existence of the second topic related to the first topic is aware of the existence of the second topic. Can be made. That is, it is possible to improve the convenience of the user, such as making the user aware of a topic that is related to a topic that the user is interested in and that the user is not aware of.

また、本発明の関連トピック検出装置は、関連トピック検出手段によって第1の区間の第1のトピックに関連する第2の区間の第2のトピックが検出された場合、第1のトピックと第2のトピックとの関連度を、区間トピック情報格納手段によって格納された区間トピック情報に示されるユーザであって、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて算出する関連度算出手段をさらに備え、トピック出力手段は、関連度算出手段によって算出された関連度に基づいて第2のトピックに基づく出力を行うこととしてもよい。かかる構成を採れば、関連トピック検出手段によって第1のトピックに関連する第2のトピックが検出された場合、関連度算出手段により、第1のトピックと第2のトピックとの関連度が、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて算出され、トピック出力手段により、算出された関連度に基づいて第2のトピックに基づく出力が行われる。これにより、第1のトピックに関連する第2のトピックに基づく出力が、第1のトピックと第2のトピックとの関連度に基づいて行われるため、例えば、より関連度が高いトピックを優先的にユーザに表示することができる等、ユーザの利便性を向上することができる。   Further, the related topic detection apparatus of the present invention detects the second topic in the second section related to the first topic in the first section and the second topic when the related topic detection unit detects the second topic in the second section. The degree of relevance to the topic is calculated based on the user who is indicated in the section topic information stored by the section topic information storage means and has posted the posting information of the first topic and the second topic The degree calculation means may be further provided, and the topic output means may perform output based on the second topic based on the degree of association calculated by the degree of association calculation means. With this configuration, when the second topic related to the first topic is detected by the related topic detecting unit, the degree of association between the first topic and the second topic is calculated by the related level calculating unit. It is calculated based on the user who posted the posting information of the first topic and the second topic, and the topic output means performs output based on the second topic based on the calculated degree of association. Thereby, since the output based on the second topic related to the first topic is performed based on the degree of association between the first topic and the second topic, for example, a topic having a higher degree of association is given priority. The convenience of the user can be improved, such as being able to display to the user.

また、本発明の関連トピック検出装置は、ユーザと当該ユーザの他のユーザに対する影響度とを対応付けたユーザ情報を格納するユーザ情報格納手段をさらに備え、関連度算出手段は、ユーザ情報格納手段において、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザに対応付けられた影響度に基づいて算出することとしてもよい。一般的に、2つのトピックの関連度は、当該2つのトピックに関する投稿を行ったユーザの、他のユーザに対する影響度に関連するという特徴がある。かかる構成を採れば、当該特徴を利用して、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザに対応付けられた影響度に基づいて、より確実に、第1のトピックと第2のトピックとの関連度を算出することができる。   The related topic detection apparatus of the present invention further includes user information storage means for storing user information in which a user is associated with the degree of influence of the user on other users, and the related degree calculation means is user information storage means. , The posting information of the first topic is posted within the first section, and the posting information of the second topic is calculated based on the degree of influence associated with the user who posted the posting information within the second section It is good as well. In general, the degree of relevance between two topics is characterized in that it is related to the degree of influence of a user who has posted on the two topics with respect to other users. By adopting such a configuration, it is possible to use the feature to post the posting information on the first topic in the first section and to the user who posted the posting information on the second topic in the second section. The degree of association between the first topic and the second topic can be calculated more reliably based on the associated degree of influence.

本発明によれば、関連性のあるトピックをより確実に検出することができる。   According to the present invention, related topics can be detected more reliably.

本発明の実施形態に係る関連トピック検出装置の機能ブロック図である。It is a functional block diagram of the related topic detection apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る関連トピック検出装置のハードウェア構成図である。It is a hardware block diagram of the related topic detection apparatus which concerns on embodiment of this invention. 投稿情報履歴のテーブル例を示す図である。It is a figure which shows the example of a table of contribution information history. ユーザ情報のテーブル例を示す図である。It is a figure which shows the example of a table of user information. 区間トピック情報のテーブル例を示す図である。It is a figure which shows the example of a table of area topic information. 関連トピック情報のテーブル例を示す図である。It is a figure which shows the example of a table of related topic information. 出力トピック情報のテーブル例を示す図である。It is a figure which shows the example of a table of output topic information. 本発明の実施形態に係る関連トピック検出装置で実行される処理を示すフローチャートである。It is a flowchart which shows the process performed with the related topic detection apparatus which concerns on embodiment of this invention. 従来手法と本発明の実施形態に係る関連トピック検出装置による手法との比較を示す図である。It is a figure which shows the comparison with the technique by the related topic detection apparatus which concerns on the related technique detection method which concerns on embodiment of this invention.

以下、図面とともに本発明による関連トピック検出装置の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。   Hereinafter, embodiments of a related topic detection apparatus according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.

図1は、本発明の実施形態に係る関連トピック検出装置1の機能ブロック図である。図1に示す通り、関連トピック検出装置1は、投稿情報履歴格納部10、ユーザ情報格納部11(ユーザ情報格納手段)、指示取得部12、区間トピック算出部13、区間トピック情報格納部14(区間トピック情報格納手段)、関連トピック検出部15(関連トピック検出手段)、関連トピック情報格納部16、関連度算出部17(関連度算出手段)、トピック出力部18(トピック出力手段)及び出力トピック情報格納部19を含んで構成される。   FIG. 1 is a functional block diagram of a related topic detection apparatus 1 according to an embodiment of the present invention. As shown in FIG. 1, the related topic detection device 1 includes a posting information history storage unit 10, a user information storage unit 11 (user information storage unit), an instruction acquisition unit 12, a section topic calculation unit 13, and a section topic information storage unit 14 ( Section topic information storage unit), related topic detection unit 15 (related topic detection unit), related topic information storage unit 16, relevance degree calculation unit 17 (relevance degree calculation unit), topic output unit 18 (topic output unit), and output topic An information storage unit 19 is included.

図2は、関連トピック検出装置1のハードウェア構成図である。図1に示される関連トピック検出装置1は、物理的には、図2に示すように、一又は複数のCPU100、主記憶装置であるRAM101及びROM102、キーボード、マウス及びディスプレイ等の入出力装置103、ネットワークカード等のデータ送受信デバイスである通信モジュール104並びにハードディスクや半導体メモリ等の補助記憶装置105等を含むコンピュータシステムとして構成されている。   FIG. 2 is a hardware configuration diagram of the related topic detection apparatus 1. As shown in FIG. 2, the related topic detection apparatus 1 shown in FIG. 1 physically includes one or a plurality of CPUs 100, a RAM 101 and a ROM 102 as main storage devices, and an input / output device 103 such as a keyboard, a mouse, and a display. The computer system includes a communication module 104 which is a data transmission / reception device such as a network card, and an auxiliary storage device 105 such as a hard disk or a semiconductor memory.

図1における各機能は、図2に示すCPU100及びRAM101等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU100の制御のもとで入出力装置103及び通信モジュール104を動作させるとともに、RAM101及び補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。   Each function in FIG. 1 causes the input / output device 103 and the communication module 104 to operate under the control of the CPU 100 by reading predetermined computer software on the hardware such as the CPU 100 and the RAM 101 shown in FIG. This is realized by reading and writing data in the RAM 101 and the auxiliary storage device 105.

なお、CPU100などのプロセッサが図1における各機能を実行することに代えて、その機能全部または一部を専用の集積回路を構築することにより各機能を実行するように構成してもよい。例えば、画像処理や通信制御を行なうための専用の集積回路を構築することにより上記機能を実行するようにしてもよい。   Instead of executing the functions shown in FIG. 1 by a processor such as the CPU 100, all or a part of the functions may be executed by constructing a dedicated integrated circuit. For example, the above functions may be executed by constructing a dedicated integrated circuit for performing image processing and communication control.

以下、図1に示す関連トピック検出装置1の各機能ブロックについて説明する。   Hereinafter, each functional block of the related topic detection apparatus 1 illustrated in FIG. 1 will be described.

投稿情報履歴格納部10は、ユーザが投稿した投稿情報の時系列上の履歴である投稿情報履歴を格納する。投稿情報は、テキストや画像等のコンテンツであり、具体例として、ユーザが自身の状況や雑記などを表現したテキスト(つぶやき)、ユーザが作成した電子メール、ユーザが撮像した画像、ユーザがインターネット上のショッピングサイトで購入した商品に関する商品購入データ等が挙げられる。投稿情報履歴は、投稿情報と、当該投稿情報が投稿された(又は作成された)時刻や日時等の時間情報と等が対応付けられた情報である。本実施形態では、関連トピック検出装置1はマイクロブログの機能を備え、投稿情報履歴格納部10には複数のユーザから投稿されたつぶやきが蓄積されていることを想定する。   The posted information history storage unit 10 stores a posted information history that is a time-series history of posted information posted by the user. Posted information is content such as text and images. Specific examples include text (tweets) that expresses the user's situation and notes, emails created by the user, images captured by the user, and users on the Internet. Product purchase data related to products purchased at a shopping site. The posted information history is information in which posted information is associated with time information such as time and date when the posted information is posted (or created). In the present embodiment, it is assumed that the related topic detection device 1 has a microblogging function, and tweets posted by a plurality of users are accumulated in the posting information history storage unit 10.

図3は、投稿情報履歴格納部10によって格納された投稿情報履歴のテーブル例を示す図である。図3に示すテーブル例の通り、投稿情報履歴は、各投稿情報の識別情報を示す「投稿ID」、当該投稿情報の内容(コンテンツ)を示す「投稿内容」、当該投稿情報を投稿したユーザの識別情報であるユーザ識別情報を示す「投稿ユーザ」、及び当該投稿情報が当該ユーザによって投稿された投稿日時(投稿時刻)を示す「投稿日時」が対応付けられている。   FIG. 3 is a diagram illustrating a table example of the posted information history stored by the posted information history storage unit 10. As shown in the table example in FIG. 3, the posted information history includes a “post ID” indicating identification information of each posted information, a “posted content” indicating the content (content) of the posted information, and the user who posted the posted information. “Posting user” indicating user identification information as identification information and “posting date” indicating posting date (posting time) when the posting information was posted by the user are associated with each other.

本実施形態では、関連トピック検出装置1が投稿情報履歴格納部10を備えているが、関連トピック検出装置1とネットワーク接続されている外部のサーバ装置が投稿情報履歴格納部10(と同様の機能)を備えていてもよい。その場合、関連トピック検出装置1は、投稿情報履歴格納部10に対してネットワークを介して必要な情報等の送受信を行うことで、本実施形態で説明する処理と同様の処理を実現することができる。   In the present embodiment, the related topic detection device 1 includes the posted information history storage unit 10, but an external server device connected to the related topic detection device 1 through a network is configured with the same function as the posted information history storage unit 10 ( ) May be provided. In that case, the related topic detection device 1 can realize the same processing as the processing described in the present embodiment by transmitting / receiving necessary information and the like to / from the posted information history storage unit 10 via the network. it can.

ユーザ情報格納部11は、ユーザのステータスを示す等、ユーザに関するユーザ情報を格納する。具体的には、ユーザ情報格納部11は、ユーザと当該ユーザの他のユーザに対する影響度とを対応付けたユーザ情報を格納する。より具体的には、ユーザ情報は、投稿情報を投稿するユーザの購読者数(フォロワー数)及び被購読者数(フォロイー数)を含む。購読者数とは、対象のユーザの投稿を購読(フォロー)しているユーザの数である。なお、購読とは、金銭のやりとりが発生しないサブスクライブ(申込、契約、登録)も含む。被購読者数とは、対象のユーザが購読(フォロー)しているユーザの数である。図4は、ユーザ情報格納部11によって格納されたユーザ情報のテーブル例を示す図である。図4に示すテーブル例の通り、ユーザ情報は、ユーザ識別情報を示す「ユーザID」、当該ユーザ識別情報が示すユーザの購読者数を示す「フォロワー数」、及び当該ユーザ識別情報が示すユーザの被購読者数を示す「フォロイー数」が対応付けられている。   The user information storage unit 11 stores user information related to the user, such as indicating the status of the user. Specifically, the user information storage unit 11 stores user information in which a user is associated with the degree of influence of the user on other users. More specifically, the user information includes the number of subscribers (the number of followers) and the number of subscribers (the number of followers) of the users who post the posted information. The number of subscribers is the number of users who subscribe (follow) the posting of the target user. Note that the subscription includes a subscription (application, contract, registration) in which no money exchange occurs. The number of subscribers is the number of users subscribed (followed) by the target user. FIG. 4 is a diagram illustrating an example of a table of user information stored by the user information storage unit 11. As shown in the table example in FIG. 4, the user information includes “user ID” indicating user identification information, “number of followers” indicating the number of subscribers of the user indicated by the user identification information, and user information indicated by the user identification information. “Number of followers” indicating the number of subscribers is associated.

指示取得部12は、関連トピック検出装置1の管理者等からの指示に関する指示情報を取得する。指示情報は、関連トピックの検出の開始を指示する旨の情報を含む。指示情報は、他にも情報を含んでもよく、どのような情報を含んでもよいかは適宜後述する。指示取得部12は、指示情報を、他の装置からネットワーク及び通信モジュール104を介して取得してもよいし、入出力装置103(例えばキーボード)を介して取得してもよい。指示取得部12は、取得した指示情報を区間トピック算出部13、関連トピック検出部15、関連度算出部17及びトピック出力部18等に出力する。指示取得部12は、また、指示取得部12は、取得した指示情報を関連トピック検出装置1に一時的に格納し、他の機能ブロックが適宜参照及び利用するようにしてもよい。   The instruction acquisition unit 12 acquires instruction information related to an instruction from an administrator or the like of the related topic detection device 1. The instruction information includes information for instructing the start of detection of related topics. The instruction information may include other information, and what information may be included will be described later as appropriate. The instruction acquisition unit 12 may acquire the instruction information from another device via the network and communication module 104, or may acquire it via the input / output device 103 (for example, a keyboard). The instruction acquisition unit 12 outputs the acquired instruction information to the section topic calculation unit 13, the related topic detection unit 15, the relevance calculation unit 17, the topic output unit 18, and the like. The instruction acquisition unit 12 may also temporarily store the acquired instruction information in the related topic detection apparatus 1 so that other functional blocks can refer to and use the information appropriately.

区間トピック算出部13は、指示取得部12から指示情報が入力されると、投稿情報履歴格納部10によって格納された投稿情報履歴に基づき、所定の時間の範囲である区間ごとの、当該区間において投稿された投稿情報のトピックと当該投稿情報の投稿を行ったユーザとを示す区間トピック情報を算出する。以下、具体的に説明する。区間トピック算出部13は、指示取得部12から関連トピックの検出の開始を指示する旨の指示情報が入力されると、投稿情報履歴格納部10によって格納された投稿情報履歴のうち、任意の複数のユーザであるサンプルユーザの投稿情報履歴を抽出する。サンプルユーザは、区間トピック算出部13によって、ランダムに決定されたものであってもよいし、所定の期間(例えば、過去3ヶ月)の投稿数が多いユーザを多い順に所定の人数(例えば、100人)に含まれるユーザであってもよいし、投稿情報履歴に含まれる全ユーザであってもよい。また、抽出する投稿情報履歴は、投稿情報履歴格納部10によって格納された投稿情報履歴の全期間分であってもよいし、所定の期間(例えば、過去1ヶ月)分であってもよい。ここで、区間トピック算出部13が利用する上述の「所定の期間」、「所定の人数」及び「所定の期間」に関する情報は、例えば関連トピック検出装置1に予め格納されていてもよいし、指示取得部12から入力された指示情報に含まれていてもよい。   When the instruction information is input from the instruction acquisition unit 12, the section topic calculation unit 13 is based on the posting information history stored by the posting information history storage unit 10, in each section within a predetermined time range. Section topic information indicating the topic of the posted information posted and the user who posted the posted information is calculated. This will be specifically described below. When the instruction information for instructing the start of the detection of the related topic is input from the instruction acquisition unit 12, the section topic calculation unit 13 selects an arbitrary plurality of post information histories stored in the post information history storage unit 10. The post information history of the sample user who is the user is extracted. The sample users may be randomly determined by the section topic calculation unit 13, or a predetermined number of users (for example, 100) in descending order of the number of users having a large number of posts in a predetermined period (for example, the past three months). A user included in the person) or all users included in the posted information history. Further, the posted information history to be extracted may be for the entire period of the posted information history stored by the posted information history storage unit 10 or for a predetermined period (for example, the past one month). Here, the information regarding the above-mentioned “predetermined period”, “predetermined number of people”, and “predetermined period” used by the section topic calculating unit 13 may be stored in the related topic detecting device 1 in advance, It may be included in the instruction information input from the instruction acquisition unit 12.

次に、区間トピック算出部13は、抽出した投稿情報履歴を、所定の時間の範囲(例えば、1週間)である区間ごとに分割する。ここで、区間トピック算出部13が利用する上述の「区間」に関する情報は、例えば関連トピック検出装置1に予め格納されていてもよいし、指示取得部12から入力された指示情報に含まれていてもよい。次に、区間トピック算出部13は、分割された区間ごとの投稿情報履歴に含まれる投稿情報に対して、従来技術であるトピックモデリングを行うことで、区間ごとの、当該区間において投稿された投稿情報のトピックと当該投稿情報の投稿を行ったユーザとを示す区間トピック情報を算出する。トピックモデリングの一例として下記非特許文献にて開示されているLDA(Latent Dirichlet Allocation。潜在的ディリクレ配分法)が挙げられる。LDAの具体的な計算方法については、下記非特許文献を参照されたい。
非特許文献:Blei, David M., Andrew Y. Ng, and Michael I. Jordan. "Latent dirichlet allocation." the Journal of machine Learning research 3 (2003): 993-1022.
Next, the section topic calculation unit 13 divides the extracted posted information history into sections that are within a predetermined time range (for example, one week). Here, the information regarding the above-mentioned “section” used by the section topic calculation unit 13 may be stored in advance in the related topic detection device 1, for example, or included in the instruction information input from the instruction acquisition unit 12. May be. Next, the section topic calculation unit 13 performs topic modeling, which is a conventional technique, on the posted information included in the post information history for each divided section, thereby posting posts posted in the section for each section. Section topic information indicating the topic of information and the user who posted the posted information is calculated. One example of topic modeling is LDA (Latent Dirichlet Allocation) disclosed in the following non-patent literature. For the specific calculation method of LDA, refer to the following non-patent literature.
Non-patent literature: Blei, David M., Andrew Y. Ng, and Michael I. Jordan. "Latent dirichlet allocation." The Journal of machine Learning research 3 (2003): 993-1022.

図5は、区間トピック算出部13によって算出された区間トピック情報のテーブル例を示す図である。図5に示すテーブル例の通り、区間トピック情報は、区間の識別情報である区間識別情報を示す「区間ID」、当該区間内に投稿された投稿情報のトピックの識別情報であるトピック識別情報を示す「トピックID」、当該トピックを構成する単語の出現確率分布を示す「単語の出現確率分布」、及び当該トピックに関する投稿情報を当該区間において投稿した(一人以上の)ユーザのユーザ識別情報を示す「投稿ユーザ」が対応付けられている。区間トピック算出部13は、算出した区間トピック情報を区間トピック情報格納部14に出力する(格納させる)と共に、区間トピック情報の算出が完了した旨の区間トピック情報算出完了情報を関連トピック検出部15に出力する。   FIG. 5 is a diagram illustrating a table example of the section topic information calculated by the section topic calculation unit 13. As shown in the example of the table in FIG. 5, the section topic information includes “section ID” indicating section identification information that is section identification information, and topic identification information that is topic identification information of posted information posted in the section. "Topic ID" to indicate, "Word Appearance Probability Distribution" indicating the probability distribution of words constituting the topic, and user identification information of (one or more) users who posted posting information related to the topic in the section “Posting user” is associated. The section topic calculation unit 13 outputs (stores) the calculated section topic information to the section topic information storage unit 14 and also stores section topic information calculation completion information indicating that the calculation of section topic information has been completed. Output to.

なお、区間トピック算出部13が区間トピック情報を算出するタイミングは、指示取得部12から指示情報が入力された場合に限らず、定期的(例えば、1週間に1回)にバックグラウンドで行ってもよい。   Note that the timing at which the section topic calculation unit 13 calculates the section topic information is not limited to the case where the instruction information is input from the instruction acquisition unit 12, but periodically (for example, once a week) in the background. Also good.

区間トピック情報格納部14は、区間トピック算出部13から入力された区間トピック情報を格納する。すなわち、区間トピック情報格納部14は、所定の時間の範囲である区間ごとに、当該区間において投稿された投稿情報のトピック(を識別するトピック識別情報)と当該投稿情報を投稿したユーザ(を識別するユーザ識別情報)とを対応付けた区間トピック情報を格納する。区間トピック情報格納部14は、例えば、図5のテーブル例にて示した区間トピック情報を格納する。   The section topic information storage unit 14 stores the section topic information input from the section topic calculation unit 13. That is, the section topic information storage unit 14 identifies, for each section within a predetermined time range, the topic of the posted information posted in the section (topic identification information for identifying) and the user who posted the posted information ( Section topic information associated with user identification information). For example, the section topic information storage unit 14 stores the section topic information shown in the table example of FIG.

関連トピック検出部15は、第1の区間の第1のトピックに関連する第2の区間の第2のトピックを、区間トピック情報格納部14によって格納された区間トピック情報に示されるユーザであって、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて検出する。関連トピック検出部15は、第1のトピックの投稿情報を第1の区間内に投稿したユーザと、第2のトピックの投稿情報を第2の区間内に投稿したユーザとの類似度に基づいて検出してもよい。また、関連トピック検出部15は、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザの数に基づいて検出してもよい。以下、具体的に説明する。   The related topic detection unit 15 is a user indicated in the section topic information stored in the section topic information storage unit 14 by referring to the second topic of the second section related to the first topic of the first section. , Based on the user who posted the posting information of the first topic and the second topic. The related topic detection unit 15 is based on the similarity between the user who posted the first topic posting information in the first section and the user who posted the second topic posting information in the second section. It may be detected. Further, the related topic detection unit 15 posts the posting information of the first topic within the first section, and based on the number of users who posted the posting information of the second topic within the second section. It may be detected. This will be specifically described below.

まず、関連トピック検出部15は、区間トピック算出部13から区間トピック情報算出完了情報が入力されると、区間トピック情報格納部14によって格納された区間トピック情報のうち、第1の区間の第1のトピック及び第2の区間の第2のトピックを選択する。第1の区間は、区間トピック情報格納部14によって格納された区間トピック情報のうち任意の区間であってもよいし、指示取得部12によって取得された指示情報において指定された区間であってもよいし、(関連トピック検出装置1が備える組み込み機能を利用して取得した)現在時刻が含まれる区間の時系列的に一つ前の区間であってもよい。以降、第1の区間を区間tと記す。第1のトピックは、区間tに含まれる任意のトピックであってもよいし、指示取得部12によって取得された指示情報において指定されたトピックであってもよい。以降、第1のトピックをTopicと記す。第2の区間は、区間tの時系列的に一つ次の区間であってもよいし、区間トピック情報格納部14によって格納された区間トピック情報のうち任意の区間であってもよいし、指示取得部12によって取得された指示情報において指定された区間であってもよいし、(関連トピック検出装置1が備える組み込み機能を利用して取得した)現在時刻が含まれる区間であってもよい。以降、第2の区間を区間t+1と記す。第2のトピックは、区間t+1に含まれる任意のトピックであってもよいし、指示取得部12によって取得された指示情報において指定されたトピックであってもよい。以降、第2のトピックをTopicと記す。 First, when the topic topic information calculation completion information is input from the section topic calculation unit 13, the related topic detection unit 15 first of the first section among the section topic information stored by the section topic information storage unit 14. Topic and the second topic of the second interval. The first section may be any section of the section topic information stored by the section topic information storage unit 14 or may be a section specified in the instruction information acquired by the instruction acquisition unit 12. Alternatively, it may be a previous section in time series of a section including the current time (obtained by using a built-in function included in the related topic detection apparatus 1). Hereinafter, the first section is referred to as section t. The first topic may be an arbitrary topic included in the section t, or may be a topic specified in the instruction information acquired by the instruction acquisition unit 12. Hereinafter, the first topic is referred to as Topic i . The second section may be a first order section in time series of the section t, or may be an arbitrary section of the section topic information stored by the section topic information storage unit 14, It may be a section specified in the instruction information acquired by the instruction acquisition unit 12, or may be a section including the current time (acquired using a built-in function included in the related topic detection device 1). . Hereinafter, the second section is referred to as section t + 1. The second topic may be an arbitrary topic included in the section t + 1, or may be a topic specified in the instruction information acquired by the instruction acquisition unit 12. Hereinafter, the second topic is denoted as Topic j .

次に、関連トピック検出部15は、区間トピック情報格納部14によって格納された区間トピック情報を参照し、選択した区間tのTopicの投稿情報を当該区間tにおいて投稿したユーザのユーザ識別情報を取得する。以降、取得した当該ユーザ識別情報が示すユーザの集合をUと記す。例えば、図5に示すテーブル例において、関連トピック検出部15が選択した区間tの区間識別情報が「I001」及び選択したTopicのトピック識別情報が「T001」であった場合、関連トピック検出部15は、当該区間識別情報及びトピック識別情報を含むレコードに対応付いたユーザ識別情報である「U001」、「U003」及び「U005」を取得する。同様に、関連トピック検出部15は、区間トピック情報格納部14によって格納された区間トピック情報を参照し、選択した区間t+1のTopicの投稿情報を当該区間t+1において投稿したユーザのユーザ識別情報を取得する。以降、取得した当該ユーザ識別情報が示すユーザの集合をUと記す。 Next, the related topic detection unit 15 refers to the section topic information stored by the section topic information storage unit 14, and obtains the user identification information of the user who posted the posting information of Topic i of the selected section t in the section t. get. Hereinafter, a set of users indicated by the acquired user identification information is referred to as U i . For example, in the example of the table illustrated in FIG. 5, when the section identification information of the section t selected by the related topic detection unit 15 is “I001” and the topic identification information of the selected Topic i is “T001”, the related topic detection unit 15 acquires “U001”, “U003”, and “U005”, which are user identification information associated with the record including the section identification information and the topic identification information. Similarly, the related topic detection unit 15 refers to the section topic information stored by the section topic information storage unit 14, and obtains the user identification information of the user who posted the posted information of Topic j of the selected section t + 1 in the section t + 1. get. Hereinafter, a set of users indicated by the acquired user identification information is denoted as U j .

次に、関連トピック検出部15は、TopicがTopicに関連するか否かを、U及びUに基づいて判定する。例えば、関連トピック検出部15は、ダイス係数による比較に基づいて判定してもよい。その場合、関連トピック検出部15は、まず、UとUとの類似度sim(U,U)を以下の式(1)によって算出する。

Figure 2017199258

ここで、|U|は集合Uに含まれるユーザの人数を示し、|U|は集合Uに含まれるユーザの人数を示し、|U∩U|は集合Uと集合Uとの共通部分に含まれるユーザの人数を示す。なお、|U∩U|は、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザの数である。次に、関連トピック検出部15は、算出されたsim(U,U)が所定の閾値以上であるか否かを判定し、閾値以上であればTopic(関連先トピック)がTopic(関連元トピック)に関連すると判定し(Topicに関連するトピックとしてTopicを検出し)、閾値未満であればTopicがTopicに関連しないと判定する。所定の閾値は、例えば関連トピック検出装置1に予め格納されているものとし、関連トピック検出部15は当該所定の閾値を参照及び利用する。 Next, the related topic detection unit 15 determines whether Topic j is related to Topic i based on U i and U j . For example, the related topic detection unit 15 may make a determination based on comparison using a dice coefficient. In this case, related topics detector 15, first, U i and U j and the similarity sim (U i, U j) is calculated by equation (1) below.
Figure 2017199258

Here, | U i | indicates the number of users included in the set U i , | U j | indicates the number of users included in the set U j , and | U i ∩U j | indicates the set U i and the set U i The number of users included in the common part with U j is shown. Note that | U i ∩U j | is the number of users who posted Topic i posting information in section t and posted Topic j posting information in section t + 1. Next, Related Topics detector 15 calculated sim (U i, U j) is equal to or greater than a predetermined threshold value, if the above threshold Topic in j (associated destination topics) is Topic in i (Topic j is detected as a topic related to Topic i ), and if it is less than the threshold, it is determined that Topic j is not related to Topic i . For example, it is assumed that the predetermined threshold value is stored in advance in the related topic detection device 1, and the related topic detection unit 15 refers to and uses the predetermined threshold value.

次に、関連トピック検出部15は、TopicがTopicに関連すると判定した場合、当該判定結果を関連トピック情報として算出する。関連トピック情報は、Topicに関連するTopicを検出した旨を示し、Topicのトピック識別情報とTopicのトピック識別情報との組を含む。関連トピック検出部15は、一つ以上の第1の区間の一つ以上の第1のトピックに関連する、一つ以上の第2の区間の一つ以上の第2のトピックを検出してもよい。例えば、関連トピック検出部15は、指示取得部12によって取得された指示情報において指定された第1の区間に含まれる全てのトピックそれぞれについて、当該第1の区間の時系列的に一つ次の第2に区間に含まれる全てのトピックそれぞれに対して関連するか否かを判定し、関連するトピックを全て検出してもよい。その場合、関連トピック検出部15は、関連すると検出した関連元トピックの識別情報及び関連先トピックの識別情報の組の集合である関連トピック情報を算出する。 Next, when the related topic detection unit 15 determines that Topic j is related to Topic i , the related topic detection unit 15 calculates the determination result as related topic information. Related Topics information indicates that it has detected a Topic in j associated with Topic in i, including a set of the topic identification information topic identification information and Topic in j the Topic in i. The related topic detection unit 15 may detect one or more second topics in one or more second sections, which are related to one or more first topics in one or more first sections. Good. For example, the related topic detection unit 15 performs, for each of all topics included in the first section specified in the instruction information acquired by the instruction acquisition unit 12, the chronological order of the first section. Secondly, it may be determined whether or not all topics included in the section are related, and all related topics may be detected. In that case, the related topic detection unit 15 calculates related topic information that is a set of identification information of the related source topic detected as related and identification information of the related destination topic.

図6(a)は、関連トピック検出部15によって算出された関連トピック情報のテーブル例を示す図である。図6(a)に示すテーブル例の通り、関連トピック情報は、関連元トピックのトピック識別情報を示す「関連元トピック」、及び関連先トピックのトピック識別情報を示す「関連先トピック」が対応付けられている。関連トピック検出部15は、算出した関連トピック情報を関連トピック情報格納部16に出力する(格納させる)と共に、関連トピック情報の出力が完了した旨の関連トピック情報算出完了情報を関連度算出部17及びトピック出力部18に出力する。なお、関連トピック検出部15は、算出した関連トピック情報を関連度算出部17及びトピック出力部18に出力してもよい。また、関連トピック検出部15は、TopicがTopicに関連しないと判定した場合、当該判定結果(TopicはTopicに関連しないことを検出した旨)をトピック出力部18に出力してもよい。 FIG. 6A is a diagram illustrating a table example of related topic information calculated by the related topic detection unit 15. As shown in the table example of FIG. 6A, the related topic information is associated with “related source topic” indicating the topic identification information of the related source topic and “related destination topic” indicating the topic identification information of the related destination topic. It has been. The related topic detection unit 15 outputs (stores) the calculated related topic information to the related topic information storage unit 16 and also stores related topic information calculation completion information indicating that the output of the related topic information is completed. And output to the topic output unit 18. Note that the related topic detection unit 15 may output the calculated related topic information to the relevance degree calculation unit 17 and the topic output unit 18. If the related topic detection unit 15 determines that Topic j is not related to Topic i , the related topic detection unit 15 may output the determination result (that Topic j has been detected not related to Topic i ) to the topic output unit 18. Good.

関連トピック情報格納部16は、関連トピック検出部15から出力された関連トピック情報を格納する。関連トピック情報格納部16は、例えば、図6(a)のテーブル例にて示した関連トピック情報を格納する。   The related topic information storage unit 16 stores the related topic information output from the related topic detection unit 15. For example, the related topic information storage unit 16 stores the related topic information shown in the table example of FIG.

関連度算出部17は、関連トピック検出部15によって区間tのTopicに関連する区間t+1のTopicが検出された場合、TopicとTopicとの関連度を、区間トピック情報格納部14によって格納された区間トピック情報に示されるユーザであって、Topic及びTopicの投稿情報を投稿したユーザに基づいて算出する。関連度算出部17は、ユーザ情報格納部11において、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザに対応付けられた影響度に基づいて算出してもよい。以下、具体的に説明する。 When the related topic detection unit 15 detects the Topic j of the section t + 1 related to the Topic i of the section t, the related degree calculation unit 17 determines the relevance between the Topic i and Topic j by the section topic information storage unit 14. The calculation is based on the user indicated in the stored section topic information and who posted the posting information of Topic i and Topic j . In the user information storage unit 11, the relevance calculation unit 17 posts the posting information of Topic i within the section t, and the influence degree associated with the user who posted the posting information of Topic j within the section t + 1. You may calculate based on. This will be specifically described below.

関連度算出部17は、関連トピック検出部15から関連トピック情報算出完了情報が入力されると(すなわち、関連トピック検出部15によって区間tのTopicに関連する区間t+1のTopicが検出された場合)、区間トピック情報格納部14によって格納された区間トピック情報に含まれるTopicとTopicとの関連度(重要度)weight(Topic,Topic)を以下の式(2)によって算出する。

Figure 2017199258

ここで、αは所定の値(パラメータ)を示し、u∈U∩Uはユーザ集合Uとユーザ集合Uとの共通部分に含まれる各ユーザuを示し、num_followerはユーザuのフォロワー数を示し、num_followeeはユーザuのフォロイー数を示す。αは、例えば関連トピック検出装置1に予め格納されているものとし、関連度算出部17が当該αを適宜利用及び参照する。また、num_follower及びnum_followeeはユーザ情報格納部11によって格納されたユーザ情報を関連度算出部17が参照及び利用する。例えば、関連度算出部17は、ユーザuのユーザ識別情報を引数として、ユーザ情報格納部11によって格納されたユーザ情報から当該ユーザuの識別情報に対応付いたnum_follower及びnum_followeeを取得する。なお、m_follower及びnum_followeeは、値が0の場合は1とする。 When the related topic information calculation completion information is input from the related topic detection unit 15 (that is, the related topic detection unit 15 detects the Topic j of the section t + 1 related to the Topic i of the section t). ), The relevance (importance) weight (Topic i , Topic j ) between Topic i and Topic j included in the section topic information stored by the section topic information storage unit 14 is calculated by the following equation (2). .
Figure 2017199258

Here, α represents a predetermined value (parameter), u k εU i ∩U j represents each user u included in the common part of the user set U i and the user set U j, and num_follower u represents the user u Num_followe u indicates the number of followers of user u. For example, α is stored in advance in the related topic detection device 1, and the relevance calculation unit 17 uses and refers to α as appropriate. Further, the num_follower u and the num_followe u are referred to and used by the relevance calculation unit 17 with the user information stored by the user information storage unit 11. For example, the relevance calculation unit 17 uses the user identification information of the user u as an argument to obtain num_lower u and num_followee u associated with the identification information of the user u from the user information stored by the user information storage unit 11. In addition, m_follower u and num_followe u are set to 1 when the value is 0.

なお、関連度算出部17による関連度の算出は、上述のフォロワー数及びフォロイー数に基づく算出に限らない。例えば、|U∩U|の大きさに基づいた算出であってもよい。 Note that the relevance calculation by the relevance calculation unit 17 is not limited to the calculation based on the number of followers and the number of followers. For example, the calculation may be based on the size of | U i ∩U j |.

関連度算出部17は、算出した関連度を用いて関連トピック情報格納部16によって格納された関連トピック情報を更新する。図6(b)に示す関連トピック情報のテーブル例は、図6(a)に示す関連トピック情報のテーブル例が関連度算出部17によって更新された後のテーブル例を示す。すなわち、関連度算出部17によって、算出されたTopicとTopicとの関連度が、当該Topicのトピック識別情報とTopicのトピック識別情報との組で示されるレコードにさらに対応付けられて格納される。 The related degree calculation unit 17 updates the related topic information stored by the related topic information storage unit 16 using the calculated related degree. The table example of the related topic information illustrated in FIG. 6B illustrates a table example after the table example of the related topic information illustrated in FIG. That is, the degree of association between Topic i and Topic j calculated by the degree-of-association calculating unit 17 is further associated with a record indicated by a combination of the topic identification information of Topic i and the topic identification information of Topic j. Stored.

関連度算出部17は、関連度の算出が完了すると、関連度の算出が完了した旨の関連度算出完了情報をトピック出力部18に出力する。   When the calculation of the relevance level is completed, the relevance level calculation unit 17 outputs relevance level calculation completion information indicating that the relevance level calculation has been completed to the topic output unit 18.

トピック出力部18は、関連トピック検出部15によって区間tのTopicに関連する区間t+1のTopicが検出された場合、区間トピック情報格納部14によって格納された区間トピック情報に基づいて、Topicの投稿情報を区間t内に投稿したユーザ集合Uのうち、Topicの投稿情報を区間t+1内に投稿していないユーザを抽出し、抽出されたユーザに対してTopicに基づく出力を行う。以下、具体的に説明する。 The topic output unit 18, when the related topic detection unit 15 detects the Topic j of the section t + 1 related to the Topic i of the section t, based on the section topic information stored by the section topic information storage unit 14, Topic i Out of the user set U i that posted the posting information in the section t, the users who have not posted the posting information of Topic j in the section t + 1 are extracted, and output based on Topic j is performed for the extracted users . This will be specifically described below.

まず、トピック出力部18は、関連トピック検出部15から関連トピック情報算出完了情報が入力されると、区間トピック情報格納部14によって格納された区間トピック情報に基づいて、Topicの投稿情報を区間t内に投稿したユーザ集合Uのうち、Topicの投稿情報を区間t+1内に投稿していないユーザ集合U−Uを抽出する。例えば、図5に示すテーブル例において、区間tの区間識別情報が「I001」及びTopicのトピック識別情報が「T001」であり、区間t+1の区間識別情報が「I002」及びTopicのトピック識別情報が「T101」である場合、Uはユーザ識別情報が「U001」、「U003」及び「U005」であるユーザを含む集合であり、Uはユーザ識別情報が「U003」及び「U004」であるユーザを含む集合であるため、トピック出力部18は、U−Uとしてユーザ識別情報が「U001」及び「U005」であるユーザを含む集合を抽出する。 First, when the related topic information calculation completion information is input from the related topic detection unit 15, the topic output unit 18 converts the topic i information posted to the topic i based on the section topic information stored by the section topic information storage unit 14. From the user set U i posted in t, the user set U j -U i that has not posted the posting information of Topic j in the section t + 1 is extracted. For example, in the table example shown in FIG. 5, the section identification information of section t is “I001” and the topic identification information of Topic i is “T001”, the section identification information of section t + 1 is “I002”, and the topic identification of Topic j . When the information is “T101”, U i is a set including users whose user identification information is “U001”, “U003”, and “U005”, and U j is user identification information “U003” and “U004”. Therefore, the topic output unit 18 extracts a set including users whose user identification information is “U001” and “U005” as U j −U i .

次に、トピック出力部18は、例えば、抽出したユーザ集合U−Uに含まれる各ユーザの携帯端末に対して、区間t+1において投稿されたTopicに関する投稿情報を、ネットワークを介して出力する。なお、ユーザの携帯端末の特定は、例えば、予めユーザ識別情報と携帯端末の識別情報とが対応付いた携帯端末情報が関連トピック検出装置1に格納されており、トピック出力部18が当該携帯端末情報に基づいて特定するようにしてもよい。また、出力する情報はTopicに関する投稿情報に限らず、Topicに基づくものであればいかなる情報であってもよい。 Next, the topic output unit 18 outputs, for example, post information on Topic j posted in the section t + 1 to the mobile terminals of each user included in the extracted user set U j -U i via the network. To do. For example, the mobile terminal information in which the user identification information and the mobile terminal identification information are associated with each other is stored in the related topic detection device 1 in advance, and the topic output unit 18 is connected to the mobile terminal. You may make it identify based on information. The information to be output is not limited to post information about Topic in j, it may be any information as long as it is based on Topic in j.

トピック出力部18は、関連度算出部17によって算出された関連度に基づいてTopicに基づく出力を行ってもよい。例えば、トピック出力部18は、関連度算出部17から関連度算出完了情報が入力されると、上記と同様にユーザ集合U−Uを抽出すると共に、ユーザ集合U−Uに含まれる各ユーザ(出力対象ユーザ)に対するTopic(出力対象トピック)を抽出する。次に、トピック出力部18は、関連度算出部17によって算出された関連度(関連トピック情報格納部16によって格納された関連トピック情報)に基づいて、ユーザ集合U−Uに含まれる各ユーザごとのTopicを関連度の大きい順に並べたリストである出力トピック情報を算出する。図7は、トピック出力部18によって算出された出力トピック情報のテーブル例を示す図である。図7に示すテーブル例の通り、出力トピック情報は、出力対象ユーザのユーザ識別情報である「出力対象ユーザ」、出力対象トピックのトピック識別情報である「出力対象トピック」、及び関連度である「関連度」が対応付けられている。図7に示すテーブル例において、関連度は、図6(b)に示す関連トピック情報のテーブル例において、関連先トピックが出力対象トピックであるレコードに対応付いた関連度に対応する。トピック出力部18は、算出した出力トピック情報を出力トピック情報格納部19に出力してもよい(格納させてもよい)。次に、トピック出力部18は、算出した出力トピック情報に含まれる各出力対象ユーザに対して、例えば、関連度の上位N件の出力対象トピックに基づく出力を行う。ここでNは所定の数であり、例えば関連トピック検出装置1に予め格納されているものとし、トピック出力部18は当該Nを参照及び利用する。 The topic output unit 18 may perform output based on Topic j based on the relevance calculated by the relevance calculation unit 17. For example, when the relevance calculation completion information is input from the relevance calculation unit 17, the topic output unit 18 extracts the user set U j -U i and includes it in the user set U j -U i as described above. Topic j (output target topic) is extracted for each user (output target user). Next, the topic output unit 18 includes each of the user sets U j -U i included in the user set U j -U i based on the degree of association calculated by the degree of association calculation unit 17 (related topic information stored by the related topic information storage unit 16). Output topic information that is a list in which Topic j for each user is arranged in descending order of relevance is calculated. FIG. 7 is a diagram illustrating an example of a table of output topic information calculated by the topic output unit 18. As shown in the example of the table in FIG. 7, the output topic information includes “output target user” that is the user identification information of the output target user, “output target topic” that is the topic identification information of the output target topic, and “ “Relevance” is associated. In the table example shown in FIG. 7, the relevance level corresponds to the relevance level associated with the record whose related destination topic is the output target topic in the related topic information table example shown in FIG. The topic output unit 18 may output (or store) the calculated output topic information to the output topic information storage unit 19. Next, the topic output unit 18 performs output based on, for example, the top N output target topics with the degree of relevance for each output target user included in the calculated output topic information. Here, N is a predetermined number, for example, stored in the related topic detection device 1 in advance, and the topic output unit 18 refers to and uses the N.

なお、トピック出力部18は、関連トピック検出部15から、TopicはTopicに関連しないことを検出した旨の判定結果が入力された場合、特に処理を行わないか、又は当該結果をユーザ等に伝えるエラー情報を出力する。 Note that when the topic output unit 18 receives a determination result indicating that Topic j is not related to Topic i from the related topic detection unit 15, the topic output unit 18 does not perform any particular processing or displays the result as a user or the like. Output error information to be communicated to.

出力トピック情報格納部19は、トピック出力部18から出力された出力トピック情報を格納する。出力トピック情報格納部19は、例えば、図7のテーブル例にて示した出力トピック情報を格納する。   The output topic information storage unit 19 stores the output topic information output from the topic output unit 18. The output topic information storage unit 19 stores, for example, the output topic information shown in the table example of FIG.

続いて、図8に示すフローチャート図を用いて、本実施形態に係る関連トピック検出装置1における関連トピック検出方法の処理について説明する。   Next, processing of the related topic detection method in the related topic detection apparatus 1 according to the present embodiment will be described using the flowchart shown in FIG.

まず、指示取得部12により、指示情報が取得される(ステップS1、指示情報取得ステップ)。次に、区間トピック算出部13により、S1にて取得された指示情報及び投稿情報履歴格納部10によって格納された投稿情報履歴に基づいて、区間トピック情報が算出され(ステップS2、区間トピック情報算出ステップ)、算出された区間トピック情報が区間トピック情報格納部14によって格納される。次に、関連トピック検出部15により、S2にて算出された区間トピック情報(又は区間トピック情報格納部14によって格納された区間トピック情報)に基づいて、関連トピック情報が算出され(ステップS3、関連トピック情報算出ステップ)、算出された関連トピック情報が関連トピック情報格納部16によって格納される。次に、関連度算出部17により、S3にて算出された関連トピック情報(又は関連トピック情報格納部16によって格納された関連トピック情報)に基づいて、関連度が算出され(ステップS4、関連度算出ステップ)、算出された関連度が関連トピック情報格納部16によって格納される。次に、トピック出力部18により、S3にて算出された関連トピック情報(又は関連トピック情報格納部16によって格納された関連トピック情報)及びS4にて算出された関連度(又は関連トピック情報格納部16によって格納された関連トピック情報に含まれる関連度)に基づいて、出力トピック情報が算出されると共に、算出された出力トピック情報に基づく出力が行われる(ステップS5、出力トピック情報出力ステップ)。   First, the instruction information is acquired by the instruction acquisition unit 12 (step S1, instruction information acquisition step). Next, the section topic calculation unit 13 calculates the section topic information based on the instruction information acquired in S1 and the posted information history stored in the posted information history storage unit 10 (step S2, section topic information calculation). Step), the calculated section topic information is stored by the section topic information storage unit 14. Next, the related topic detection unit 15 calculates related topic information based on the section topic information calculated in S2 (or the section topic information stored by the section topic information storage unit 14) (step S3, related Topic information calculation step), the calculated related topic information is stored by the related topic information storage unit 16. Next, the relevance level is calculated by the relevance level calculation unit 17 based on the related topic information calculated in S3 (or the related topic information stored by the related topic information storage unit 16) (step S4, relevance level). (Calculation step), the calculated relevance level is stored by the related topic information storage unit 16. Next, the topic output unit 18 related topic information calculated in S3 (or related topic information stored by the related topic information storage unit 16) and the relevance calculated in S4 (or related topic information storage unit) The output topic information is calculated based on the degree of relevance included in the related topic information stored in step 16 and output based on the calculated output topic information is performed (step S5, output topic information output step).

以上、関連トピック検出装置1における関連トピック検出方法の処理について説明した。なお、区間トピック情報が予め区間トピック情報格納部14によって格納されている場合は、S1及びS2の処理は必須ではなく、関連トピック検出装置1はS3から処理を始めてもよい。また、S4の処理は必須ではなく、S4を省略する場合、S5では、トピック出力部18により、S3にて算出された関連トピック情報のみに基づいて出力トピック情報が算出されると共に、算出された出力トピック情報に基づく出力が行われる。   The processing of the related topic detection method in the related topic detection device 1 has been described above. When section topic information is stored in advance by the section topic information storage unit 14, the processes of S1 and S2 are not essential, and the related topic detection apparatus 1 may start the process from S3. Further, the process of S4 is not essential, and when S4 is omitted, in S5, the topic output unit 18 calculates and calculates the output topic information based only on the related topic information calculated in S3. Output based on the output topic information is performed.

次に、本実施形態のように構成された関連トピック検出装置1の作用効果について説明する。   Next, the effect of the related topic detection apparatus 1 configured as in the present embodiment will be described.

本実施形態の関連トピック検出装置1によれば、関連トピック検出部15により、区間tのTopic(関連元トピック)に関連する区間t+1のTopic(関連先トピック)が、Topic及びTopicの投稿情報を投稿したユーザに基づいて検出される。これにより、例えば、TopicとTopicとの間の語の出現確率が異なる場合でも、Topic及びTopicの投稿情報を投稿したユーザに基づいてより確実に、Topicに関連するトピックとしてTopicを検出することができる。すなわち、関連性のあるトピックをより確実に検出することができる。 According to a related topic detection device 1 of the present embodiment, the relevant topic detection unit 15, interval t of Topic in i (relation source topic) in the relevant section t + 1 of the Topic in j (associated destination topics) is, Topic in i and Topic in j It is detected based on the user who posted the posting information. Thereby, for example, even when the appearance probabilities of words between Topic i and Topic j are different, Topic i is more reliably determined as a topic related to Topic i based on the user who posted the posted information of Topic i and Topic j. j can be detected. That is, a related topic can be detected more reliably.

また、本実施形態の関連トピック検出装置1によれば、関連トピック検出部15は、Topicの投稿情報を区間t内に投稿したユーザと、Topicの投稿情報を区間t+1内に投稿したユーザとの類似度に基づいて検出することとしてもよい。一般的に、関連性のある2つのトピックそれぞれの投稿情報は、類似度の大きい(より類似している)ユーザが投稿している可能性が高いという特徴がある。かかる構成を採れば、当該特徴を利用して、Topicの投稿情報を区間t内に投稿したユーザと、Topicの投稿情報を区間t+1内に投稿したユーザとの類似度に基づいて、より確実に、Topicに関連するTopicを検出することができる。 Further, according to the related topic detection device 1 of the present embodiment, the related topic detection unit 15 includes a user who posted Topic i posting information in the section t and a user who posted Topic j posting information in the section t + 1. It is good also as detecting based on the similarity with. Generally, the posting information of each of two related topics is characterized by a high possibility that a user with a high degree of similarity (more similar) has posted. With this configuration, based on the similarity between the user who posted Topic i posting information in the section t and the user who posted Topic j posting information in the section t + 1, using the feature, Certainly, Topic j associated with Topic i can be detected.

また、本実施形態の関連トピック検出装置1によれば、関連トピック検出部15は、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザの数に基づいて検出することとしてもよい。一般的に、関連性のある2つのトピックそれぞれの投稿情報は、同じユーザが投稿している可能性が高いという特徴がある。かかる構成を採れば、当該特徴を利用して、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザの数に基づいて、より確実に、Topicに関連するTopicを検出することができる。 Further, according to the related topic detection apparatus 1 of the present embodiment, the related topic detection unit 15 posts the posting information of Topic i within the section t, and the user who posted the posting information of Topic j within the section t + 1 It is good also as detecting based on the number of. Generally, the posting information of each of two related topics is characterized by the high possibility that the same user has posted. By adopting such a configuration, it is possible to more reliably use the feature based on the number of users who have posted Topic i posting information in the section t and posted Topic j posting information in the section t + 1. , Topic j associated with Topic i can be detected.

また、本実施形態の関連トピック検出装置1によれば、関連トピック検出部15によってTopicに関連するTopicが検出された場合、トピック出力部18により、Topicの投稿情報を区間t内に投稿したユーザのうち、Topicの投稿情報を区間t+1内に投稿していないユーザが抽出され、抽出されたユーザに対してTopicに基づく出力が行われる。これにより、例えば、Topicに関する投稿を行ったユーザのうち、当該Topicに関連するTopicの存在に気づいていないユーザに対して、当該Topicの存在を気づかせることができる。すなわち、ユーザに対して、当該ユーザが興味のあるトピックと関連があるトピックであって、かつ当該ユーザが気づいていないトピックを気づかせることができる等、ユーザの利便性を向上することができる。 Further, according to the relevant topic detection device 1 of the present embodiment, if the Topic in j associated with Topic in i by Topic detection unit 15 is detected, the topic output unit 18, a post information Topic in i in the interval t Among the posted users, users who have not posted the posting information of Topic j within the section t + 1 are extracted, and an output based on Topic j is performed on the extracted users. Thus, for example, of the user who made the post about Topic in i, the user unaware of the presence of a Topic in j related to the Topic in i, it is possible to notice the presence of the Topic in j. That is, it is possible to improve the convenience of the user, such as making the user aware of a topic that is related to a topic that the user is interested in and that the user is not aware of.

また、本実施形態の関連トピック検出装置1によれば、関連トピック検出部15によってTopicに関連するTopicが検出された場合、関連度算出部17により、TopicとTopicとの関連度が、Topic及びTopicの投稿情報を投稿したユーザに基づいて算出され、トピック出力部18により、算出された関連度に基づいてTopicに基づく出力が行われる。これにより、Topicに関連するTopicに基づく出力が、TopicとTopicとの関連度に基づいて行われるため、例えば、より関連度が高いトピックを優先的にユーザに表示することができる等、ユーザの利便性を向上することができる。 Also according to the relevant topic detection device 1 of the present embodiment, if the Topic in j associated with Topic in i by Topic detection unit 15 is detected, the relevant degree calculator 17, the degree of association between Topic in i and Topic in j Is calculated based on the user who posted the posting information of Topic i and Topic j , and the topic output unit 18 performs output based on Topic j based on the calculated relevance. Thus, the output based on the Topic in j associated with the Topic in i is, Topic in i and to be done on the basis of the relevance of the Topic in j, for example, it can be displayed preferentially to the user a more relevance is high topics The convenience of the user can be improved.

また、本実施形態の関連トピック検出装置1によれば、関連度算出部17は、ユーザ情報格納部11において、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザに対応付けられた影響度(ユーザのフォロワー数、フォロイー数)に基づいて算出することとしてもよい。一般的に、2つのトピックの関連度は、当該2つのトピックに関する投稿を行ったユーザの、他のユーザに対する影響度に関連するという特徴がある。かかる構成を採れば、当該特徴を利用して、Topicの投稿情報を区間t内に投稿し、かつ、Topicの投稿情報を区間t+1内に投稿したユーザに対応付けられた影響度に基づいて(影響力のある投稿ユーザがどれほどトピック間を遷移しているかに基づいて)、より確実に、TopicとTopicとの関連度を算出することができる。 Further, according to the related topic detection device 1 of the present embodiment, the relevance calculation unit 17 posts the posting information of Topic i in the section t and the posting information of Topic j in the user information storage unit 11. It is good also as calculating based on the influence degree (the number of a user's follower, the number of followers) matched with the user who contributed in the area t + 1. In general, the degree of relevance between two topics is characterized in that it is related to the degree of influence of a user who has posted on the two topics with respect to other users. With such a configuration, based on the degree of influence associated with the user who posted Topic i posting information in the section t and posted Topic j posting information in the section t + 1 using the feature. (Based on how much an influential posting user has transitioned between topics), the degree of association between Topic i and Topic j can be calculated more reliably.

本実施形態では、トピックを用いて説明したが、これに限るものではない。例えば、トピックの替わりに、投稿情報の内容の特徴を示す情報として、キーワードや画像等を利用してもよい。   Although the present embodiment has been described using topics, the present invention is not limited to this. For example, instead of a topic, a keyword, an image, or the like may be used as information indicating the characteristics of the content of posted information.

以上の通り、本実施形態の関連トピック検出装置1では、マイクロブログ等の投稿から学習されたトピック情報とともに、そのトピックの投稿ユーザ情報を用いてトピックの時間的構造変化(トピック間構造)を抽出する。次に、抽出されたトピック間構造に、投稿ユーザ情報を用いて関連度(重要度)スコアを付加する。最後に、あるトピックに投稿あるいは閲覧していたユーザに対し、最新の重要度の高い関連トピックにおける投稿情報を提示する。これにより、最新かつ重要度の高い関連トピック情報の提示が可能になる。すなわち、マイクロブログ等を用いたリアルタイムなトピック情報をユーザに提示することができる。   As described above, the related topic detection apparatus 1 of the present embodiment extracts topical structure change (inter-topic structure) using topic posting user information together with topic information learned from posts such as microblogs. To do. Next, a relevance (importance) score is added to the extracted inter-topic structure using posted user information. Finally, the posting information on the latest related topic with high importance is presented to a user who has posted or browsed on a topic. Thereby, it is possible to present related topic information having the latest and high importance. That is, real-time topic information using a microblog or the like can be presented to the user.

図9は、ユーザが投稿した投稿情報のトピックが時系列で変化する状況において、トピックの時系列変化(トピック間構造、リンク構造)を判定する手法として、従来手法を用いた場合と、本実施形態の関連トピック検出装置1による手法を用いた場合との比較を示す図である。   FIG. 9 shows a case where a conventional method is used as a method for determining a time series change (inter-topic structure, link structure) of a topic in a situation where a topic of posting information posted by a user changes in time series, and this implementation. It is a figure which shows the comparison with the case where the method by the related topic detection apparatus 1 of a form is used.

図9(a)に示す従来手法では、時刻別のトピック間構造は,各トピックにおける単語の確率分布の比較等により行われる。しかしながら、現実にはトピックが変化するだけではなく、複数のトピックに枝分かれしたり、あるいは複数のトピックが1つのトピックに吸収されたりし、単語の確率分布の比較だけからは確実なトピック間構造は判定できない。   In the conventional method shown in FIG. 9A, the structure between topics according to time is performed by comparing the probability distribution of words in each topic. However, in reality, not only the topic changes, but it also branches into multiple topics, or multiple topics are absorbed into one topic, and a reliable inter-topic structure is only determined by comparing the probability distribution of words. Cannot judge.

一方、図9(b)に示す本実施形態の関連トピック検出装置1による手法では、関連するトピックであれば、単語の確率分布が違ったとしても、そのトピックに投稿しているユーザは似ている点に着目し、トピックと、当該トピックに投稿しているユーザ情報を用い、トピック間構造を明らかにする。さらに、トピックに投稿しているユーザ情報を用いることで、トピック間構造に関連度スコアを付加することが可能となり、より正確なトピック間構造を判定することができる。   On the other hand, in the method using the related topic detection apparatus 1 of the present embodiment shown in FIG. 9B, if the topic is a related topic, even if the probability distribution of words is different, the users who are posting to the topic are similar. The topic structure is clarified by using the topic and user information posted on the topic. Furthermore, by using user information posted to a topic, it is possible to add a relevance score to the inter-topic structure, and a more accurate inter-topic structure can be determined.

本実施形態の関連トピック検出装置1は、検索、自然言語処理及びリコメンドといった分野で適応可能である。   The related topic detection apparatus 1 of this embodiment can be applied in the fields of search, natural language processing, and recommendation.

1…関連トピック検出装置、10…投稿情報履歴格納部、11…ユーザ情報格納部、12…指示取得部、13…区間トピック算出部、14…区間トピック情報格納部、15…関連トピック検出部、16…関連トピック情報格納部、17…関連度算出部、18…トピック出力部、19…出力トピック情報格納部。   DESCRIPTION OF SYMBOLS 1 ... Related topic detection apparatus, 10 ... Posting information history storage part, 11 ... User information storage part, 12 ... Instruction acquisition part, 13 ... Section topic calculation part, 14 ... Section topic information storage part, 15 ... Related topic detection part, 16 ... related topic information storage unit, 17 ... relevance degree calculation unit, 18 ... topic output unit, 19 ... output topic information storage unit.

Claims (6)

所定の時間の範囲である区間ごとに、当該区間において投稿された投稿情報のトピックと当該投稿情報を投稿したユーザとを対応付けた区間トピック情報を格納する区間トピック情報格納手段と、
第1の区間の第1のトピックに関連する第2の区間の第2のトピックを、前記区間トピック情報格納手段によって格納された区間トピック情報に示されるユーザであって、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて検出する関連トピック検出手段と、
を備える関連トピック検出装置。
Section topic information storage means for storing section topic information that associates a topic of posted information posted in the section with a user who posted the posted information for each section that is a predetermined time range;
The second topic of the second section related to the first topic of the first section is a user indicated in the section topic information stored by the section topic information storage means, and the first topic and the first topic Related topic detection means for detecting based on the user who posted the posting information of the two topics,
Related topic detection apparatus comprising:
前記関連トピック検出手段は、第1のトピックの投稿情報を第1の区間内に投稿したユーザと、第2のトピックの投稿情報を第2の区間内に投稿したユーザとの類似度に基づいて検出する、請求項1に記載の関連トピック検出装置。   The related topic detecting means is based on the similarity between the user who posted the posting information of the first topic in the first section and the user who posted the posting information of the second topic in the second section. The related topic detection apparatus according to claim 1, wherein the related topic detection apparatus detects the related topic. 前記関連トピック検出手段は、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザの数に基づいて検出する、請求項1に記載の関連トピック検出装置。   The related topic detecting means detects the posting information of the first topic within the first section, and detects the posting information of the second topic based on the number of users who have posted within the second section. The related topic detection device according to claim 1. 前記関連トピック検出手段によって第1の区間の第1のトピックに関連する第2の区間の第2のトピックが検出された場合、前記区間トピック情報格納手段によって格納された区間トピック情報に基づいて、第1のトピックの投稿情報を第1の区間内に投稿したユーザのうち、第2のトピックの投稿情報を第2の区間内に投稿していないユーザを抽出し、抽出されたユーザに対して第2のトピックに基づく出力を行うトピック出力手段をさらに備える、請求項1〜3の何れか一項に記載の関連トピック検出装置。   When the second topic of the second section related to the first topic of the first section is detected by the related topic detection unit, based on the section topic information stored by the section topic information storage unit, Among the users who posted the posting information of the first topic in the first section, the users who have not posted the posting information of the second topic in the second section are extracted, and for the extracted users The related topic detection device according to claim 1, further comprising topic output means for performing output based on the second topic. 前記関連トピック検出手段によって第1の区間の第1のトピックに関連する第2の区間の第2のトピックが検出された場合、第1のトピックと第2のトピックとの関連度を、前記区間トピック情報格納手段によって格納された区間トピック情報に示されるユーザであって、第1のトピック及び第2のトピックの投稿情報を投稿したユーザに基づいて算出する関連度算出手段をさらに備え、
前記トピック出力手段は、前記関連度算出手段によって算出された関連度に基づいて第2のトピックに基づく出力を行う、
請求項4に記載の関連トピック検出装置。
When the second topic of the second section related to the first topic of the first section is detected by the related topic detection means, the degree of association between the first topic and the second topic is determined as the section. Relevance calculation means for calculating based on a user who is indicated in the section topic information stored by the topic information storage means and has posted the posting information of the first topic and the second topic,
The topic output means performs output based on a second topic based on the relevance calculated by the relevance calculation means.
The related topic detection apparatus according to claim 4.
ユーザと当該ユーザの他のユーザに対する影響度とを対応付けたユーザ情報を格納するユーザ情報格納手段をさらに備え、
前記関連度算出手段は、前記ユーザ情報格納手段において、第1のトピックの投稿情報を第1の区間内に投稿し、かつ、第2のトピックの投稿情報を第2の区間内に投稿したユーザに対応付けられた影響度に基づいて算出する、請求項5に記載の関連トピック検出装置。
A user information storage unit that stores user information in which the user and the degree of influence of the user on other users are associated;
In the user information storage means, the relevance calculation means posts the posting information of the first topic within the first section, and the user who posted the posting information of the second topic within the second section The related topic detection apparatus according to claim 5, wherein the related topic detection apparatus calculates the influence based on the degree of influence associated with.
JP2016090869A 2016-04-28 2016-04-28 Related topic detection device Pending JP2017199258A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016090869A JP2017199258A (en) 2016-04-28 2016-04-28 Related topic detection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016090869A JP2017199258A (en) 2016-04-28 2016-04-28 Related topic detection device

Publications (1)

Publication Number Publication Date
JP2017199258A true JP2017199258A (en) 2017-11-02

Family

ID=60237956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016090869A Pending JP2017199258A (en) 2016-04-28 2016-04-28 Related topic detection device

Country Status (1)

Country Link
JP (1) JP2017199258A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020047141A (en) * 2018-09-21 2020-03-26 日本電気株式会社 Selection device, selection method and selection program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020047141A (en) * 2018-09-21 2020-03-26 日本電気株式会社 Selection device, selection method and selection program
JP7180231B2 (en) 2018-09-21 2022-11-30 日本電気株式会社 Selection device, selection method and selection program

Similar Documents

Publication Publication Date Title
US10169708B2 (en) Determining trustworthiness and compatibility of a person
US11797595B2 (en) Method, apparatus, and computer program product for user-specific contextual integration for a searchable enterprise platform
CA3001453C (en) Method and system for performing a probabilistic topic analysis of search queries for a customer support system
US9218568B2 (en) Disambiguating data using contextual and historical information
US20130332385A1 (en) Methods and systems for detecting and extracting product reviews
US20180060915A1 (en) Audience expansion for online social network content
US20190197176A1 (en) Identifying relationships between entities using machine learning
US20140244532A1 (en) Candidate and job trending in employment system
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
CN103563332A (en) Social media identity discovery and mapping
US20190294731A1 (en) Search query dispatcher using machine learning
US20160225017A1 (en) Size of prize predictive model
US10497045B2 (en) Social network data processing and profiling
US20140129460A1 (en) Social network for employment search
US10097552B2 (en) Network of trusted users
CN107809370B (en) User recommendation method and device
US20170061016A1 (en) Discovery of network based data sources for ingestion and recommendations
JP2014203442A (en) Recommendation information generation device and recommendation information generation method
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
US10164931B2 (en) Content personalization based on attributes of members of a social networking service
US20180285751A1 (en) Size data inference model based on machine-learning
US20160034915A1 (en) Document performance indicators based on referral context
CN106575418B (en) Suggested keywords
JP2017199258A (en) Related topic detection device
KR101871827B1 (en) Content priority personalization apparatus, method and program