JP2015035026A - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP2015035026A
JP2015035026A JP2013164522A JP2013164522A JP2015035026A JP 2015035026 A JP2015035026 A JP 2015035026A JP 2013164522 A JP2013164522 A JP 2013164522A JP 2013164522 A JP2013164522 A JP 2013164522A JP 2015035026 A JP2015035026 A JP 2015035026A
Authority
JP
Japan
Prior art keywords
unit
keyword
posted
message
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013164522A
Other languages
Japanese (ja)
Other versions
JP5645233B1 (en
Inventor
大原 一人
Kazuto Ohara
一人 大原
向井 理朗
Michiaki Mukai
理朗 向井
育雄 芥子
Ikuo Keshi
育雄 芥子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013164522A priority Critical patent/JP5645233B1/en
Priority to PCT/JP2014/066291 priority patent/WO2015019723A1/en
Application granted granted Critical
Publication of JP5645233B1 publication Critical patent/JP5645233B1/en
Publication of JP2015035026A publication Critical patent/JP2015035026A/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information processing device, an information processing method, and an information processing program that can improve convenience to a user when reporting living-up.SOLUTION: An information processing device includes: a keyword extraction part which extracts a keyword from a document posted within a predetermined time; a document extraction part which extracts a representative document as a representative from one group of posted documents; and a word order change part which rearranges keywords extracted by the keyword extraction part in the order of words appearing in the representative document extracted by the document extraction part.

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and an information processing program.

放映中のテレビ番組をTwitter(登録商標)などへの投稿メッセージ数から盛り上がり度合を算出して、当該盛り上がり度合をユーザに通知するものがある(非特許文献1参照)。ここで、盛り上がりとは、現在時刻の投稿メッセージ数が所定数を越え、かつ同時刻の過去の投稿メッセージ数よりも現在時刻の投稿メッセージ数が多い状態のことである。また、録画したテレビ番組を効率よく楽しむために、テレビ番組に関連する投稿メッセージ数の変動から重要シーンを自動的に検出し、投稿メッセージの内容から各シーンでの主要人物とイベント内容とを推定し、シーンを表すラベルとして付与するものがある(非特許文献2参照)。   There is one that calculates the degree of excitement of the TV program being broadcast from the number of messages posted to Twitter (registered trademark) and notifies the user of the degree of excitement (see Non-Patent Document 1). Here, the excitement is a state in which the number of posted messages at the current time exceeds a predetermined number and the number of posted messages at the current time is larger than the number of posted messages at the same time. In order to enjoy recorded TV programs efficiently, important scenes are automatically detected from fluctuations in the number of posted messages related to TV programs, and the main characters and event contents in each scene are estimated from the contents of posted messages. However, some labels are given as scene labels (see Non-Patent Document 2).

“おしえてリモコン”、[online]、シャープ株式会社、[平成25年7月1日検索]、インターネット<URL:https://play.google.com/store/apps/details?id=jp.co.sharp.clpf.android.cloudremocon>“Teach me remote control”, [online], Sharp Corporation, [searched July 1, 2013], Internet <URL: https://play.google.com/store/apps/details? id = jp.co.sharp.clpf.android.cloudremocon> 中澤昌美、帆足啓一郎、小野智弘、“Twitterによるテレビ番組重要シーン検出及びラベル付与手法”、Proceedings of the 3rd Forum on Data Engineering and Information Management、F5−6、2011年2月.Masami Nakazawa, Keiichiro Hoashi, Tomohiro Ono, “Twitter TV Program Important Scene Detection and Labeling Technique”, Proceedings of the 3rd Forum on Data Engineering and Information Management, F5-6, February 2011.

しかしながら、非特許文献1に記載の技術を用いても、盛り上がり度合をユーザに通知しても、盛り上がりが発生した理由がわからないという欠点があった。また、非特許文献2に記載の技術を用いても、主要人物と関連しないイベントの内容などを推定できないという欠点があった。このように、盛り上がりを通知するときのユーザの利便性が十分でないという課題があった。   However, even if the technology described in Non-Patent Document 1 is used or the degree of climax is notified to the user, there is a drawback that the reason for the climax is not known. Moreover, even if the technique described in Non-Patent Document 2 is used, there is a drawback that the contents of events that are not related to the main person cannot be estimated. As described above, there is a problem that the convenience of the user when notifying the excitement is not sufficient.

本発明は、上記の点に鑑みてなされたものであり、盛り上がりを通知するときのユーザの利便性を向上させることができる情報処理装置、情報処理方法および情報処理プログラムを提供することを課題とする。   The present invention has been made in view of the above points, and it is an object of the present invention to provide an information processing apparatus, an information processing method, and an information processing program that can improve user convenience when notifying a rise. To do.

(1)本発明は上記の課題を解決するためになされたものであり、本発明の第一の態様は、情報処理装置であって、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備えることを特徴とする情報処理装置である。   (1) The present invention has been made to solve the above-described problems, and a first aspect of the present invention is an information processing apparatus that extracts keywords from sentences posted within a predetermined time. An extraction unit; a sentence extraction unit that extracts a representative sentence from the group of the posted sentences; and a word that appears in the representative sentence extracted by the sentence extraction unit by the keyword extracted by the keyword extraction unit An information processing apparatus comprising: a word order changing unit for rearranging in the order of

(2)また、本発明の第二の態様は、情報処理方法であって、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出過程と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、を有することを特徴とする情報処理方法である。   (2) Moreover, the second aspect of the present invention is an information processing method, comprising: a keyword extraction process for extracting a keyword from a sentence posted within a predetermined time; and a representative from a group of the posted sentences. A sentence extraction process for extracting a representative sentence, and a word order changing process for rearranging the keywords extracted in the keyword extraction process in the order of words appearing in the representative sentence extracted in the sentence extraction process. Is an information processing method characterized by

(3)また、本発明の第三の態様は、情報処理プログラムであって、情報処理装置のコンピュータに、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、を実行させるための情報処理プログラムである。   (3) Further, a third aspect of the present invention is an information processing program, the keyword extracting step for extracting a keyword from a sentence posted within a predetermined time to a computer of the information processing apparatus, and the posted A sentence extraction step for extracting a representative sentence from the group of sentences, and a word order for rearranging the keywords extracted in the keyword extraction step into the order of words appearing in the representative sentence extracted in the sentence extraction step An information processing program for executing the change step.

本発明の情報処理装置、情報処理方法および情報処理プログラムによれば、盛り上がりを通知するときのユーザの利便性を向上させることができる。   According to the information processing apparatus, the information processing method, and the information processing program of the present invention, it is possible to improve the convenience of the user when notifying the excitement.

本発明の第1の実施形態に係る情報処理システムの構成の一例を示す概略図である。It is the schematic which shows an example of a structure of the information processing system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る情報処理装置の構成の一例を示す概略ブロック図である。It is a schematic block diagram which shows an example of a structure of the information processing apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る検知部および抽出部の構成の一例を示す概略図である。It is the schematic which shows an example of a structure of the detection part and extraction part which concern on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る解析部の構成の一例を示す概略ブロック図である。It is a schematic block diagram which shows an example of a structure of the analysis part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るキーワード抽出部、重み算出部および重み付け部の処理の一例を説明する説明図である。It is explanatory drawing explaining an example of a process of the keyword extraction part which concerns on the 1st Embodiment of this invention, a weight calculation part, and a weighting part. 本発明の第1の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。It is explanatory drawing explaining an example of a process of the text extraction part which concerns on the 1st Embodiment of this invention, a word order change part, and an output part. 本発明の第1の実施形態に係る解析部の処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process of the analysis part which concerns on the 1st Embodiment of this invention. 本発明の第2の実施形態に係る解析部の構成の一例を示す概略ブロック図である。It is a schematic block diagram which shows an example of a structure of the analysis part which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係るキーワード抽出部、重み算出部および重み付け部の処理の一例を説明する説明図である。It is explanatory drawing explaining an example of the process of the keyword extraction part which concerns on the 2nd Embodiment of this invention, a weight calculation part, and a weighting part. 本発明の第2の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。It is explanatory drawing explaining an example of a process of the text extraction part which concerns on the 2nd Embodiment of this invention, a word order change part, and an output part. 本発明の第3の実施形態に係る解析部の構成の一例を示す概略ブロック図である。It is a schematic block diagram which shows an example of a structure of the analysis part which concerns on the 3rd Embodiment of this invention. 本発明の第3の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。It is explanatory drawing explaining an example of a process of the text extraction part which concerns on the 3rd Embodiment of this invention, a word order change part, and an output part. 本発明の第4の実施形態に係る解析部の構成の一例を示す概略ブロック図である。It is a schematic block diagram which shows an example of a structure of the analysis part which concerns on the 4th Embodiment of this invention.

(第1の実施形態)
以下、図面を参照しながら本発明の第1の実施形態について詳述する。
図1は、本発明の第1の実施形態に係る情報処理システムS1の構成の一例を示す概略図である。
情報処理システムS1は、投稿端末装置1と、投稿サービスサーバ装置2と、情報処理装置3と、電子機器4と、を含んで構成される。投稿端末装置1と投稿サービスサーバ装置2と情報処理装置3と電子機器4とのそれぞれは、ネットワークN1を介して有線または無線で通信を行う。
(First embodiment)
Hereinafter, a first embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a schematic diagram showing an example of the configuration of the information processing system S1 according to the first embodiment of the present invention.
The information processing system S1 includes a posting terminal device 1, a posting service server device 2, an information processing device 3, and an electronic device 4. Each of posting terminal device 1, posting service server device 2, information processing device 3, and electronic device 4 performs wired or wireless communication via network N1.

投稿端末装置1は、例えば、PC(パーソナルコンピュータ:Personal Computer)であり、ユーザからメッセージの入力を受け付ける。投稿サービスサーバ装置2は、例えば、ソーシャルメディアサーバ装置である。ここで、ソーシャルメディアとは、個人と個人、個人と組織、組織と組織の間の情報発信が、ウェブサービスを経由することによってそれ自体が意味を持つコミュニティとなり、実社会に広く拡散されて影響力を持ち始めたメディアサービスであり、例えば、ブログやミニブログ、電子掲示板、ソーシャルネットワークサービス、投稿サービスなどである。   The posting terminal device 1 is, for example, a PC (Personal Computer) and receives a message input from the user. The posting service server device 2 is, for example, a social media server device. Here, social media is a community in which information transmission between individuals and individuals, individuals and organizations, and organizations and organizations is meaningful by itself via web services, and is widely spread and influenced in the real world. For example, blogs, miniblogs, electronic bulletin boards, social network services, posting services, etc.

ユーザは、投稿端末装置1を利用して、メッセージを投稿サービスサーバ装置2に投稿する。なお、以下の説明において、投稿サービスサーバ装置2に投稿されたメッセージを投稿メッセージと称する。   The user posts a message to the posting service server device 2 using the posting terminal device 1. In the following description, a message posted to the posting service server device 2 is referred to as a posting message.

情報処理装置3は、ネットワークN1を介し、投稿サービスサーバ装置2から投稿メッセージを取得する。そして、情報処理装置3は、所定時間内の複数の投稿メッセージから複数のキーワードを抽出し、複数の投稿メッセージから代表となる代表メッセージを抽出する。情報処理装置3は、抽出した複数のキーワードを、代表メッセージに出現する単語の順序に並び替え、ネットワークN1を介して電子機器4に送信する。電子機器4の表示部41は、代表メッセージの順序に並び替えられたキーワードを表示する。
電子機器4は、例えば、PCや、電話やメール機能の他にPDA(携帯情報端末)の機能が付いた多機能携帯電話機(スマートフォン)や、タブレットPCなどである。
The information processing device 3 acquires a posted message from the posting service server device 2 via the network N1. Then, the information processing apparatus 3 extracts a plurality of keywords from a plurality of posted messages within a predetermined time, and extracts a representative message as a representative from the plurality of posted messages. The information processing device 3 rearranges the extracted keywords in the order of words appearing in the representative message, and transmits them to the electronic device 4 via the network N1. The display unit 41 of the electronic device 4 displays the keywords rearranged in the order of representative messages.
The electronic device 4 is, for example, a PC, a multi-function mobile phone (smart phone) with a PDA (personal digital assistant) function in addition to a telephone or mail function, a tablet PC, or the like.

図2は、本発明の第1の実施形態に係る情報処理装置3の構成の一例を示す概略ブロック図である。
情報処理装置3は、取得部31と、記憶部32と、検知部33と、抽出部34とを含んで構成される。
取得部31は、投稿サービスサーバ装置2から複数の投稿メッセージ情報を、API(Application Program Interface:エーピーアイ)を利用して取得する。当該投稿メッセージ情報には、投稿メッセージのメッセージ本文と当該メッセージが投稿サービスサーバ装置2に投稿された時刻とが含まれる。取得部31は、取得した投稿メッセージ情報を記憶部32に記憶させ、記憶部32は、当該投稿メッセージ情報を記憶する。
FIG. 2 is a schematic block diagram showing an example of the configuration of the information processing apparatus 3 according to the first embodiment of the present invention.
The information processing apparatus 3 includes an acquisition unit 31, a storage unit 32, a detection unit 33, and an extraction unit 34.
The acquisition unit 31 acquires a plurality of posted message information from the posting service server device 2 using an API (Application Program Interface). The posted message information includes the message body of the posted message and the time when the message was posted to the posting service server device 2. The acquisition unit 31 stores the acquired posted message information in the storage unit 32, and the storage unit 32 stores the posted message information.

検知部33は、所定時間内の投稿メッセージの件数を検出し、検出結果に基づいて抽出部34を動作させる。また、検知部33は、検出結果と後述する抽出部34から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に送信する。詳細な検知部33の処理は後述する。
抽出部34は、投稿メッセージから複数のキーワードを抽出する。抽出部34は、抽出した複数のキーワードを並び替えてキーワード情報を生成する。抽出部34は、生成したキーワード情報を検知部33に出力する。詳細な抽出部34の処理は後述する。
The detection unit 33 detects the number of posted messages within a predetermined time, and operates the extraction unit 34 based on the detection result. In addition, the detection unit 33 transmits the detection result and keyword information input from the extraction unit 34 described later to the electronic device 4 via the network N1. Detailed processing of the detection unit 33 will be described later.
The extraction unit 34 extracts a plurality of keywords from the posted message. The extraction unit 34 rearranges the extracted keywords to generate keyword information. The extraction unit 34 outputs the generated keyword information to the detection unit 33. Detailed processing of the extraction unit 34 will be described later.

図3は、本発明の第1の実施形態に係る検知部33および抽出部34の構成の一例を示す概略図である。
検知部33は、検出部331と、通知部332と、を含んで構成される。
検出部331は、所定時間内の投稿メッセージの件数を検出し、当該所定時間内に検出した投稿メッセージの件数が所定の数以上である場合に、盛り上がりとして検出し、抽出部34を動作させる。また、検出部331は、検出した盛り上がりを表す盛り上がり情報を通知部332に出力する。
通知部332は、検出部331から入力された盛り上がり情報と解析部342から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に通知する。
FIG. 3 is a schematic diagram illustrating an example of the configuration of the detection unit 33 and the extraction unit 34 according to the first embodiment of the present invention.
The detection unit 33 includes a detection unit 331 and a notification unit 332.
The detection unit 331 detects the number of posted messages within a predetermined time, and detects the swell when the number of posted messages detected within the predetermined time is equal to or greater than the predetermined number, and operates the extraction unit 34. In addition, the detection unit 331 outputs excitement information indicating the detected excitement to the notification unit 332.
The notification unit 332 notifies the electronic device 4 of the climax information input from the detection unit 331 and the keyword information input from the analysis unit 342 via the network N1.

抽出部34は、読み出し部341と、解析部342と、を含んで構成される。
読み出し部341は、検出部331が盛り上がりを検出すると、記憶部32から所定時間内の投稿メッセージ情報を読み出し、当該投稿メッセージ情報を解析部342に出力する。
解析部342は、投稿メッセージ情報に含まれる投稿メッセージ本文から複数のキーワードを抽出する。解析部342は、例えば、公知の手段を利用してキーワードを抽出する。解析部342は、抽出したキーワードに基づいて代表メッセージを抽出する。そして、解析部342は、抽出した複数のキーワードを、代表メッセージ本文に出現する単語の順序に並び替えてキーワード情報を生成する。解析部342は、生成したキーワード情報を通知部332に出力する。詳細な解析部342の処理は後述する。
The extraction unit 34 includes a reading unit 341 and an analysis unit 342.
When the detecting unit 331 detects the excitement, the reading unit 341 reads posted message information within a predetermined time from the storage unit 32 and outputs the posted message information to the analyzing unit 342.
The analysis unit 342 extracts a plurality of keywords from the posted message text included in the posted message information. The analysis unit 342 extracts keywords using, for example, known means. The analysis unit 342 extracts a representative message based on the extracted keyword. Then, the analysis unit 342 generates keyword information by rearranging the extracted keywords in the order of words appearing in the representative message text. The analysis unit 342 outputs the generated keyword information to the notification unit 332. Detailed processing of the analysis unit 342 will be described later.

図4は、本発明の第1の実施形態に係る解析部342の構成の一例を示す概略ブロック図である。
解析部342は、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、を含んで構成される。
キーワード抽出部3421は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文からキーワードを抽出する。キーワード抽出部3421は、抽出したキーワードを重み算出部3422に出力する。
FIG. 4 is a schematic block diagram illustrating an example of the configuration of the analysis unit 342 according to the first embodiment of the present invention.
The analysis unit 342 includes a keyword extraction unit 3421, a weight calculation unit 3422, a weighting unit 3423, a sentence extraction unit 3424, a word order change unit 3425, and an output unit 3426.
The keyword extracting unit 3421 extracts a keyword from each posted message body of a plurality of posted messages included in the posted message information input from the reading unit 341. The keyword extraction unit 3421 outputs the extracted keyword to the weight calculation unit 3422.

重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。また、重み算出部3422は、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422は、集計したキーワードに対する重みを算出する。重み算出部3422は、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422が算出した重みと、を重み付け部3423に出力する。また、重み算出部3422は、計数したキーワードの出現回数を文章抽出部3424に出力する。   The weight calculation unit 3422 counts the number of appearances of the keyword extracted by the keyword extraction unit 3421 for the posted message. Further, the weight calculation unit 3422 counts the number of appearances of the keyword counted for each posted message for the posted messages within a predetermined time. Then, the weight calculation unit 3422 calculates weights for the tabulated keywords. The weight calculation unit 3422 outputs the keyword extracted by the keyword extraction unit 3421 and the weight calculated by the weight calculation unit 3422 for the keyword to the weighting unit 3423. Further, the weight calculation unit 3422 outputs the counted number of appearances of the keyword to the text extraction unit 3424.

重み付け部3423は、重み算出部3422から入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423は、重みを付与したキーワードを文章抽出部3424および語順変更部3425に出力する。   The weighting unit 3423 assigns a weight to the keyword based on the keyword input from the weight calculation unit 3422 and the weight for the keyword. The weighting unit 3423 outputs the weighted keyword to the sentence extracting unit 3424 and the word order changing unit 3425.

文章抽出部3424は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。ここで、投稿メッセージ点数とは、要素点数の総和であり、要素点数とは、各キーワードの出現回数に各キーワードの重みを乗算することで算出される点数である。文章抽出部3424は、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、代表となる代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425に出力する。   The text extraction unit 3424 determines the number of posted messages from the posted message texts of a plurality of posted messages included in the posted message information input from the reading unit 341, based on the keywords to which the weights input from the weighting unit 3423 are assigned. Is calculated. The posted message score is calculated from the weight assigned to the keyword and the number of appearances of the keyword counted for each posted message. Here, the posted message score is the sum of the element scores, and the element score is a score calculated by multiplying the number of appearances of each keyword by the weight of each keyword. The text extraction unit 3424 extracts a posted message having the highest posted message score from a plurality of posted messages as a representative message based on the calculated posted message score. The sentence extracting unit 3424 outputs the extracted representative message to the word order changing unit 3425.

語順変更部3425は、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424から入力された代表メッセージとに基づいて、重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425は、生成したキーワード情報を出力部3426に出力する。
出力部3426は、語順変更部3425から入力されたキーワード情報を通知部332に出力する。
The word order changing unit 3425 causes the word order of the weighted keywords to appear in the representative message based on the weighted keyword input from the weighting unit 3423 and the representative message input from the text extracting unit 3424. The keyword information is generated by rearranging the words in the order. The word order changing unit 3425 outputs the generated keyword information to the output unit 3426.
The output unit 3426 outputs the keyword information input from the word order change unit 3425 to the notification unit 332.

図5は、本発明の第1の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
処理内容例Ex1において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「[ABC開幕戦日本vsタイ]試合終了日本5−3タイ日本代表苦しみながらも見事逆転勝利!」から「ABC開幕戦」、「日本vsタイ」、「試合終了」、「日本」、「5−3」、「タイ」、「日本代表」、「苦しい」、「見事」、「逆転勝利」の各キーワードを抽出する。
FIG. 5 is an explanatory diagram illustrating an example of processing of the keyword extraction unit 3421, the weight calculation unit 3422, and the weighting unit 3423 according to the first embodiment of the present invention.
In the processing content example Ex1, the keyword extraction unit 3421 extracts keywords from a plurality of posted message texts included in the posted message information. For example, the keyword extraction unit 3421 determines that the posting message “[ABC Opening Game Japan vs. Thailand] Game End Japan 5-3 Thailand Japan National Team is suffering, but it ’s a great reversal victory!” From “ABC Opening Game”, “Japan vs. Thailand”, “ The keywords “End of game”, “Japan”, “5-3”, “Thailand”, “Japan national team”, “Hard”, “Superb”, and “Reversal victory” are extracted.

重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「ABC開幕戦[1]」、「日本vsタイ[1]」、「試合終了[1]」、「日本[1]」、「5−3[1]」、「タイ[1]」、「日本代表[1]」、「苦しい[1]」、「見事[1]」、「逆転勝利[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。   The weight calculation unit 3422 counts the number of appearances of the keyword extracted by the keyword extraction unit 3421 for the posted message. For example, the weight calculation unit 3422 determines the number of appearances of each extracted keyword as “ABC opening game [1]”, “Japan vs. Thailand [1]”, “Game end [1]”, “Japan [1]”, “5-3 [1]”, “Thai [1]”, “Japan National Team [1]”, “Bad [1]”, “Superb [1]”, “Reversal victory [1]” are counted. Here, the number in [] given to each keyword represents the appearance frequency of the keyword.

重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex2において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「勝つ[31]」、「日本代表チーム[22]」、「日本[14]」、「試合終了[13]」、「タイ[7]」、「勝利[6]」、「初戦[5]」、「5−3[5]」、「苦しい[4]」、「日本勝利[4]」、・・・、と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。   The weight calculation unit 3422 uses posted messages within a predetermined time (for example, 1 minute) as extracted frames, and totals keywords for the posted messages in the extracted frames. In the processing content example Ex2, for example, the weight calculation unit 3422 sets the keywords in the extracted frame to “win [31]”, “Japan national team [22]”, “Japan [14]”, “match end [13]”. , “Thailand [7]”, “Victory [6]”, “First Battle [5]”, “5-3 [5]”, “Bad [4]”, “Japan Victory [4]”, And sum up. Here, the number in [] given to each keyword represents the number of posted messages in the extracted frame in which the keyword appears.

重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex3において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「勝つ[5]」、「日本代表チーム[46]」、「日本[4]」、「試合終了[0]」、「タイ[3]」、「勝利[0]」、「初戦[0]」、「5−3[1]」、「苦しい[0]」、「日本勝利[0]」、・・・、と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。   The weight calculation unit 3422 uses a posted message within a predetermined time (for example, 10 minutes) as a reference frame, extracts the same keyword as each keyword extracted in the extracted frame from the posted message in the reference frame, and tabulates it. In the processing content example Ex3, for example, the weight calculation unit 3422 determines each keyword in the reference frame as “win [5]”, “Japan national team [46]”, “Japan [4]”, “match end [0]”. ”,“ Thailand [3] ”,“ Victory [0] ”,“ First Battle [0] ”,“ 5-3 [1] ”,“ Bad [0] ”,“ Japan Victory [0] ”, etc. , And extract and aggregate. Here, the number in [] given to each keyword represents the number of posted messages in the reference frame in which the keyword appears.

重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、式(1)により算出する。   Based on the number of posted messages in the extracted frame and the number of posted messages in the reference frame, the weight calculating unit 3422 calculates the weight for each keyword using Equation (1).

Figure 2015035026
Figure 2015035026

ここで、Weight(w)は、キーワードごとの重みを表す。また、r(w)、r10(w)は、式(2)、式(3)により算出する。 Here, Weight (w) represents a weight for each keyword. Also, r 0 (w), r 10 (w) , the formula (2), is calculated by the equation (3).

Figure 2015035026
Figure 2015035026

Figure 2015035026
Figure 2015035026

ここで、r(w)、r10(w)は、抽出フレームにおける各キーワードの出現率、参照フレームにおける各キーワードの出現率をそれぞれ表し、x(w)、x10(w)は、抽出フレームにおける各キーワードが出現する投稿メッセージの件数、参照フレームにおける各キーワードが出現する投稿メッセージの件数をそれぞれ表す。また、N、N10は、抽出フレームにおける投稿メッセージの総数、参照フレームにおける投稿メッセージの総数をそれぞれ表す。 Here, r 0 (w) and r 10 (w) represent the appearance rate of each keyword in the extracted frame and the appearance rate of each keyword in the reference frame, respectively, and x 0 (w) and x 10 (w) are This represents the number of posted messages in which each keyword appears in the extracted frame and the number of posted messages in which each keyword appears in the reference frame. N 0 and N 10 represent the total number of posted messages in the extracted frame and the total number of posted messages in the reference frame, respectively.

重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex4のようにキーワードに対して重みを付与する。
例えば、重み付け部3423は、「試合終了 3.10」、「勝つ 1.69」、「勝利 0.71」、「初戦 0.51」、「日本 0.45」、「苦しい 0.34」、「日本勝利 0.34」、「5−3 0.26」、「タイ 0.14」、「日本代表チーム 0.13」のように、キーワードに対して重みを付与する。
The weighting unit 3423 gives the weight for each keyword calculated by the weight calculation unit 3422 according to the expression (1) to the keyword as in the processing content example Ex4.
For example, the weighting unit 3423 may include “game end 3.10”, “win 1.69”, “win 0.71”, “first match 0.51”, “Japan 0.45”, “sad 0.34”, Weights are given to keywords such as “Japan win 0.34”, “5-3 0.26”, “Thailand 0.14”, “Japan national team 0.13”.

これにより、参照フレームにおける投稿メッセージによく出現するキーワードには、低い重みが付与され、参照フレームにおける投稿メッセージに出現しにくい(出現しない)キーワードには、高い重みが付与される。この例では、「試合終了」、「勝利」、「初戦」などのキーワードの重みが高くなり、「日本代表チーム」に対する重みは低くなる。   Thereby, a low weight is assigned to a keyword that frequently appears in a posted message in the reference frame, and a high weight is assigned to a keyword that does not appear (not appear) in the posted message in the reference frame. In this example, the weight of keywords such as “End of game”, “Victory”, “First game” is high, and the weight for “Japan national team” is low.

図6は、本発明の第1の実施形態に係る文章抽出部3424、語順変更部3425および出力部3426の処理の一例を説明する説明図である。
処理内容例Ex5は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424は、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424は、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424は、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 6 is an explanatory diagram illustrating an example of processing of the text extraction unit 3424, the word order change unit 3425, and the output unit 3426 according to the first embodiment of the present invention.
The processing content example Ex5 is an example of a keyword given a weight by the weighting unit 3423. The text extracting unit 3424 calculates the element score of the posted message of the extracted frame based on the keyword given the weight by the weighting unit 3423. Specifically, the sentence extraction unit 3424 calculates the element score by multiplying the number of appearances of each keyword in the extracted frame counted by the weighting unit 3423 by the weight of each keyword. The text extraction unit 3424 calculates the total sum of the calculated element scores as a posted message score for each posted message.

処理内容例Ex6において、文章抽出部3424は、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位5つの投稿メッセージを抽出する。そして、文章抽出部3424は、上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、代表メッセージとして抽出する。
例えば、文章抽出部3424は、処理内容例Ex7のように、投稿メッセージ「ABC試合終了 予選ラウンド 日本5−3タイ ※7回表、日本が一挙3点を取り逆転、開幕戦に勝利」を、代表メッセージとして抽出する。
In the processing content example Ex6, the text extraction unit 3424 rearranges each posted message in the extracted frame in descending order of the number of posted messages, and extracts a predetermined number, for example, the top five posted messages. Then, the text extraction unit 3424 extracts a posted message having the highest calculated posted message score from the top five posted messages as a representative message.
For example, the text extraction unit 3424, like the processing example Ex7, posted the message “ABC game end qualifying round Japan 5-3 Thailand * 7 times, Japan took 3 points at a time and won the opening game” Extracted as a representative message.

語順変更部3425は、重み付け部3423により重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex8は、語順変更部3425により生成され、出力部3426から通知部332に出力されるキーワード情報の一例である。
語順変更部3425は、処理内容例Ex5の重みが付与された各キーワードの語順を、処理内容例Ex8のように、キーワード「試合終了」、「日本」、「5−3」、「タイ」、「勝利」と並び替えて、キーワード情報を生成する。
The word order changing unit 3425 generates keyword information by rearranging the word order of the keywords weighted by the weighting unit 3423 into the order of words appearing in the representative message. For example, the processing content example Ex8 is an example of keyword information generated by the word order changing unit 3425 and output from the output unit 3426 to the notification unit 332.
The word order change unit 3425 changes the word order of each keyword to which the weight of the processing content example Ex5 is given, as in the processing content example Ex8, with the keywords “game end”, “Japan”, “5-3”, “ Rearrange with “Victory” to generate keyword information.

図7は、本発明の第1の実施形態に係る解析部342の処理の一例を示すフローチャートである。
ステップST101において、キーワード抽出部3421は、抽出フレームにおける投稿メッセージのそれぞれからキーワードを抽出する。
ステップST102において、重み算出部3422は、抽出フレームにおける投稿メッセージのキーワードの出現率と、参照フレームにおける投稿メッセージのキーワードの出現率とから、キーワードごとの重みを算出する。
FIG. 7 is a flowchart showing an example of processing of the analysis unit 342 according to the first embodiment of the present invention.
In step ST101, the keyword extraction unit 3421 extracts keywords from each posted message in the extraction frame.
In step ST102, the weight calculation unit 3422 calculates the weight for each keyword from the keyword appearance rate of the posted message in the extracted frame and the keyword appearance rate of the posted message in the reference frame.

ステップST103において、重み付け部3423は、キーワード抽出部3421が抽出した各キーワードに対して、重み算出部3422が算出したキーワードごとの重みを付与する。
ステップST104において、文章抽出部3424は、キーワードごとの重みと、キーワードの出現回数とから要素点数および投稿メッセージ点数を算出し、算出結果に基づいて、代表メッセージを抽出する。
In step ST103, the weighting unit 3423 assigns a weight for each keyword calculated by the weight calculation unit 3422 to each keyword extracted by the keyword extraction unit 3421.
In step ST104, the text extraction unit 3424 calculates the element score and the posted message score from the weight for each keyword and the number of appearances of the keyword, and extracts the representative message based on the calculation result.

ステップST105において、語順変更部3425は、キーワード抽出部3421が抽出したキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。   In step ST105, the word order changing unit 3425 rearranges the word order of the keywords extracted by the keyword extracting unit 3421 into the order of words appearing in the representative message, and generates keyword information.

このように、本実施形態によれば、情報処理装置3は、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424と、キーワード抽出部3421が抽出したキーワードを文章抽出部3424が抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。   As described above, according to the present embodiment, the information processing apparatus 3 includes the keyword extraction unit 3421 that extracts a keyword from a sentence (post message) posted within a predetermined time, and a group of posted sentences (post message). A text extraction unit 3424 that extracts representative text (representative message) from (post message in the extraction frame) and a keyword extracted by the keyword extraction unit 3421 appear in the representative text (representative message) extracted by the text extraction unit 3424. And a word order changing unit 3425 for rearranging the words in order.

これにより、情報処理装置3は、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の語順に抽出したキーワードを並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3は、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。   Accordingly, the information processing device 3 can extract keywords from a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. You can follow the topic of the message. Moreover, since the information processing apparatus 3 can notify the user of the reason for the excitement by following the topicality, the convenience when notifying the user of the excitement can be improved.

(第2の実施形態)
以下、図面を参照しながら本発明の第2の実施形態について詳しく説明する。
図8は、本発明の第2の実施形態に係る解析部342Aの構成の一例を示す概略ブロック図である。
解析部342Aは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424Aと、語順変更部3425Aと、出力部3426Aと、を含んで構成される。第1の実施形態に係る解析部342と第2の実施形態に係る解析部342Aとを比較すると、文章抽出部3424A、語順変更部3425Aおよび出力部3426Aが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Second Embodiment)
Hereinafter, a second embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 8 is a schematic block diagram showing an example of the configuration of the analysis unit 342A according to the second embodiment of the present invention.
The analysis unit 342A includes a keyword extraction unit 3421, a weight calculation unit 3422, a weighting unit 3423, a sentence extraction unit 3424A, a word order change unit 3425A, and an output unit 3426A. When the analysis unit 342 according to the first embodiment and the analysis unit 342A according to the second embodiment are compared, the sentence extraction unit 3424A, the word order change unit 3425A, and the output unit 3426A are different. Since the other configuration is the same as that of the first embodiment, the same reference numerals are given and description thereof is omitted.

文章抽出部3424Aは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Aは、抽出した代表メッセージを、語順変更部3425Aに出力する。次いで、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425Aに出力する。   The sentence extraction unit 3424A obtains the number of posted messages from the posted message texts of a plurality of posted messages included in the posted message information input from the reading unit 341 based on the weighted keyword input from the weighting unit 3423. Is calculated. The posted message score is calculated from the weight assigned to the keyword and the number of appearances of the keyword counted for each posted message. First, the text extraction unit 3424A extracts a posted message having the highest posted message score from a plurality of posted messages as a first representative message based on the calculated posted message score. The sentence extracting unit 3424A outputs the extracted representative message to the word order changing unit 3425A. Next, the text extracting unit 3424A extracts a posted message having the second highest posted message score from the plurality of posted messages as a second representative message based on the calculated posted message score. The sentence extracting unit 3424 outputs the extracted representative message to the word order changing unit 3425A.

語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Aは、生成したキーワード情報を出力部3426Aに出力する。
出力部3426Aは、語順変更部3425Aから入力されたキーワード情報を通知部332に出力する。
The word order changing unit 3425A determines the first word order of the weighted keywords based on the weighted keyword input from the weighting unit 3423 and the first representative message input from the text extracting unit 3424A. The keyword information is generated by rearranging in the order of words appearing in the representative message. Next, the word order changing unit 3425A determines the word order of the weighted keywords based on the weighted keyword input from the weighting unit 3423 and the second representative message input from the text extracting unit 3424A. The keyword information is generated by rearranging in the order of words appearing in the second representative message. Word order changing unit 3425A outputs the generated keyword information to output unit 3426A.
The output unit 3426A outputs the keyword information input from the word order change unit 3425A to the notification unit 332.

図9は、本発明の第2の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
処理内容例Ex9において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「緊急地震速報が鳴る→起こされる→揺れが始まる→A放送局で諸々チェック中。」から「緊急地震速報」、「鳴る」、「起こされる」、「揺れ」、「始まる」、「A放送局」、「諸々チェック中」の各キーワードを抽出する。
FIG. 9 is an explanatory diagram illustrating an example of processing of the keyword extraction unit 3421, the weight calculation unit 3422, and the weighting unit 3423 according to the second embodiment of the present invention.
In the processing content example Ex9, the keyword extraction unit 3421 extracts keywords from a plurality of posted message texts included in the posted message information. For example, the keyword extraction unit 3421 reads from the posted message “Earthquake early warning sounds → Wakes up → Starts shaking → A variety of checks are being performed at the broadcasting station A” to “Earthquake Early Warning”, “Sounds”, “Wakes up”, “ The keywords “shaking”, “beginning”, “A broadcasting station”, and “under various checks” are extracted.

重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「緊急地震速報[1]」、「鳴る[1]」、「起こされる[1]」、「揺れ[1]」、「始まる[1]」、「A放送局[1]」、「諸々チェック中[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。   The weight calculation unit 3422 counts the number of appearances of the keyword extracted by the keyword extraction unit 3421 for the posted message. For example, the weight calculation unit 3422 displays the number of appearances of each extracted keyword as “Earthquake Early Warning [1]”, “Sound [1]”, “Wake [1]”, “Swing [1]”, “Starts”. [1] "," A broadcasting station [1] ", and" various checking [1] "are counted. Here, the number in [] given to each keyword represents the appearance frequency of the keyword.

重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex10において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「津波の心配[40]」、「地震[18]」、「見る[16]」、「つける[15]」、「□□大島[14]」、「震度5強[12]」、「緊急地震速報[8]」、・・・と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。   The weight calculation unit 3422 uses posted messages within a predetermined time (for example, 1 minute) as extracted frames, and totals keywords for the posted messages in the extracted frames. In the processing content example Ex10, for example, the weight calculation unit 3422 sets the keywords in the extracted frame as “tsunami concern [40]”, “earthquake [18]”, “see [16]”, “attach [15]”, “□□ Oshima [14]”, “High seismic intensity 5 [12]”, “Earthquake early warning [8]”, and so on. Here, the number in [] given to each keyword represents the number of posted messages in the extracted frame in which the keyword appears.

重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex11において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「津波の心配[21]」、「地震[34]」、「見る[36]」、「つける[61]」、「□□大島[59]」、「震度5強[39]」、「緊急地震速報[22]」、・・・と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。   The weight calculation unit 3422 uses a posted message within a predetermined time (for example, 10 minutes) as a reference frame, extracts the same keyword as each keyword extracted in the extracted frame from the posted message in the reference frame, and tabulates it. In the processing content example Ex11, for example, the weight calculation unit 3422 displays the keywords in the reference frame as “Tsunami Concern [21]”, “Earthquake [34]”, “View [36]”, and “Add [61]”. , “□□ Oshima [59]”, “Seismic intensity 5 strong [39]”, “Earthquake Early Warning [22]”, and so on. Here, the number in [] given to each keyword represents the number of posted messages in the reference frame in which the keyword appears.

重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、上述の式(1)により算出する。
重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex12のようにキーワードに対して重み付けを行う。
例えば、重み付け部3423は、「津波の心配 0.35」、「地震 0.05」、「見る 0.03」、「震度5強 0.02」、「つける 0.02」、「□□大島 0.02」、「緊急地震速報 0.01」、・・・のようにキーワードに対して重みを付与する。
Based on the number of posted messages in the extracted frame and the number of posted messages in the reference frame, the weight calculating unit 3422 calculates the weight for each keyword using the above equation (1).
The weighting unit 3423 weights the keyword for each keyword calculated by the weight calculation unit 3422 according to the expression (1) as in the processing content example Ex12.
For example, the weighting unit 3423 includes “tsunami worry 0.35”, “earthquake 0.05”, “view 0.03”, “seismic intensity 5 strong 0.02”, “attach 0.02”, “□□ Oshima 0.02 ”,“ Earthquake Early Warning 0.01 ”,...

図10は、本発明の第2の実施形態に係る文章抽出部3424A、語順変更部3425Aおよび出力部3426Aの処理の一例を説明する説明図である。
処理内容例Ex13は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424Aは、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Aは、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Aは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 10 is an explanatory diagram illustrating an example of processing of the text extraction unit 3424A, the word order change unit 3425A, and the output unit 3426A according to the second embodiment of the present invention.
The processing content example Ex13 is an example of a keyword given a weight by the weighting unit 3423. The text extraction unit 3424A calculates the number of elements of the post message in the extracted frame based on the keyword given the weight by the weighting unit 3423. Specifically, the sentence extracting unit 3424A calculates the number of element points by multiplying the number of appearances of each keyword in the extracted frame counted by the weighting unit 3423 by the weight of each keyword. The text extraction unit 3424A calculates the total sum of the calculated element scores as a posted message score for each posted message.

処理内容例Ex14において、文章抽出部3424Aは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
例えば、文章抽出部3424Aは、処理内容例Ex15のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
In the processing content example Ex14, the text extraction unit 3424A sorts the posted messages in the extracted frame in descending order of the posted message score, and extracts a predetermined number, for example, the top five posted messages. Then, the text extraction unit 3424A extracts the posted message having the highest calculated posted message score from the top five posted messages as the first representative message.
For example, the sentence extraction unit 3424A, as shown in the processing example Ex15, the posted message “around 5:33, a very strong earthquake with the epicenter of YYX in XX prefecture. No worries about tsunami "is extracted as the first representative message.

また、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。
例えば、文章抽出部3424Aは、処理内容例Ex16のように、投稿メッセージ「大丈夫ですか?いまテレビで、津波の心配はないと言っていました。震度5強は怖いっす…」を、第2の代表メッセージとして抽出する。
In addition, the sentence extraction unit 3424A extracts a posted message having the second highest calculated posted message score from the top five posted messages as the second representative message.
For example, the sentence extraction unit 3424A, like the processing content example Ex16, posted the message “Are you okay? Now on TV, you are not worried about the tsunami. Extracted as a representative message.

語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、1行目のキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えて、2行目のキーワード情報を生成する。例えば、処理内容例Ex17は、語順変更部3425Aにより生成され、出力部3426Aから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Aは、処理内容例Ex13のような重みが付与された各キーワードの語順を、第1の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と並び替え、改行して、2行目に、第2の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「津波の心配」、「震度5強」と、並び替えて、キーワード情報を生成する。
The word order changing unit 3425A rearranges the word order of the keywords weighted by the weighting unit 3423 into the order of words appearing in the first representative message, and generates keyword information on the first line. Next, the word order changing unit 3425A rearranges the word order of the keywords weighted by the weighting unit 3423 into the order of the words appearing in the second representative message, and generates keyword information on the second line. For example, the processing content example Ex17 is an example of keyword information generated by the word order changing unit 3425A and output from the output unit 3426A to the notification unit 332.
The word order changing unit 3425A, as shown in the processing content example Ex17 based on the first representative message, indicates the word order of each keyword to which a weight is given as in the processing content example Ex13, as shown in the processing content example Ex17. ”,“ Seismic intensity 5 strong ”,“ Tsunami worry ”, line feed, and on the second line, as shown in the processing example Ex17 based on the second representative message, the keyword“ Tsunami worry ”, The keyword information is generated by rearranging “Seismic intensity 5+”.

このように、本実施形態によれば、情報処理装置3Aは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Aと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Aが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Aと、を備える。   As described above, according to the present embodiment, the information processing apparatus 3A includes the keyword extracting unit 3421 that extracts a keyword from a sentence (post message) posted within a predetermined time, and a group of posted sentences (post message). A sentence extracting unit 3424A that extracts representative sentences (first representative message and second representative message) from (post message in the extraction frame) and a keyword extracted by the keyword extracting unit 3421 are extracted by the sentence extracting unit 3424A. And a word order changing unit 3425A for rearranging the words in the order of words appearing in the representative sentences (first representative message, second representative message).

これにより、情報処理装置3Aは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3Aは、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。   Accordingly, the information processing apparatus 3A can extract keywords from a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. You can follow the topic of the message. Moreover, since the information processing apparatus 3A can notify the user of the reason for the excitement by following the topicality, the convenience when notifying the user of the excitement can be improved.

(第3の実施形態)
以下、図面を参照しながら本発明の第3の実施形態について詳しく説明する。
図11は、本発明の第3の実施形態に係る解析部342Bの構成の一例を示す概略ブロック図である。
解析部342Bは、キーワード抽出部3421と、重み算出部3422Bと、重み付け部3423Bと、文章抽出部3424Bと、語順変更部3425Bと、出力部3426Bと、を含んで構成される。第1の実施形態に係る解析部342と第3の実施形態に係る解析部342Bとを比較すると、重み算出部3422B、重み付け部3423B、文章抽出部3424B、語順変更部3425Bおよび出力部3426Bが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Third embodiment)
Hereinafter, the third embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 11 is a schematic block diagram illustrating an example of the configuration of the analysis unit 342B according to the third embodiment of the present invention.
The analysis unit 342B includes a keyword extraction unit 3421, a weight calculation unit 3422B, a weighting unit 3423B, a sentence extraction unit 3424B, a word order change unit 3425B, and an output unit 3426B. When the analysis unit 342 according to the first embodiment and the analysis unit 342B according to the third embodiment are compared, the weight calculation unit 3422B, the weighting unit 3423B, the sentence extraction unit 3424B, the word order changing unit 3425B, and the output unit 3426B are different. . Since the other configuration is the same as that of the first embodiment, the same reference numerals are given and description thereof is omitted.

重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。また、重み算出部3422Bは、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422Bは、集計したキーワードに対する重みを算出する。重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422Bが算出した重みと、を重み付け部3423Bに出力する。
そして、重み算出部3422Bは、語順変更部3425Bからキーワード情報が入力されると、当該キーワード情報に含まれるキーワードに対する重みを除外する。重み算出部3422Bは、キーワード抽出部3421から入力されたキーワードから、語順変更部3425Bから入力されたキーワード情報に含まれるキーワードを除外したキーワードと、当該キーワードに対する重みとを重み付け部3423Bに出力する。
The weight calculation unit 3422B counts the number of appearances of the keyword extracted by the keyword extraction unit 3421 for the posted message. Further, the weight calculation unit 3422B totals the number of appearances of the keyword counted for each posted message for the posted messages within a predetermined time. Then, the weight calculation unit 3422B calculates weights for the tabulated keywords. The weight calculation unit 3422B outputs the keyword extracted by the keyword extraction unit 3421 and the weight calculated by the weight calculation unit 3422B for the keyword to the weighting unit 3423B.
Then, when the keyword information is input from the word order changing unit 3425B, the weight calculating unit 3422B excludes the weights for the keywords included in the keyword information. The weight calculation unit 3422B outputs, to the weighting unit 3423B, a keyword obtained by excluding the keyword included in the keyword information input from the word order change unit 3425B from the keyword input from the keyword extraction unit 3421 and the weight for the keyword.

重み付け部3423Bは、重み算出部3422Bから入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423Bは、重みを付与したキーワードを文章抽出部3424Bおよび語順変更部3425Bに出力する。   The weighting unit 3423B gives a weight to the keyword based on the keyword input from the weight calculation unit 3422B and the weight for the keyword. The weighting unit 3423B outputs the weighted keyword to the text extracting unit 3424B and the word order changing unit 3425B.

文章抽出部3424Bは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Bは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第1の代表メッセージを、語順変更部3425Bに出力する。また、文章抽出部3424Bは、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を、再度、算出する。そして、文章抽出部3424Bは、再度算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから第1の代表メッセージ以外であって、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第2の代表メッセージを、語順変更部3425Bに出力する。   The sentence extraction unit 3424B obtains the number of posted messages from the posted message texts of a plurality of posted messages included in the posted message information input from the reading unit 341, based on the keyword to which the weight input from the weighting unit 3423B is assigned. Is calculated. The posted message score is calculated from the weight assigned to the keyword and the number of appearances of the keyword counted for each posted message. First, the text extraction unit 3424B extracts a posted message having the highest posted message score from a plurality of posted messages as a first representative message based on the calculated posted message score. The sentence extracting unit 3424B outputs the extracted first representative message to the word order changing unit 3425B. In addition, the text extraction unit 3424B calculates again the posted message score based on the keyword to which the weight input from the weighting unit 3423B is given. Then, based on the recalculated post message score, the text extraction unit 3424B extracts, as a second representative message, a post message having the highest post message score other than the first representative message from the plurality of post messages. To do. The sentence extracting unit 3424B outputs the extracted second representative message to the word order changing unit 3425B.

語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Bは、生成したキーワード情報を、重み算出部3422Bおよび出力部3426Bに出力する。
出力部3426Bは、語順変更部3425Bから入力されたキーワード情報を通知部332に出力する。
The word order changing unit 3425B determines the first word order of the weighted keywords based on the weighted keyword input from the weighting unit 3423B and the first representative message input from the text extracting unit 3424B. The keyword information is generated by rearranging in the order of words appearing in the representative message. Next, the word order changing unit 3425B determines the word order of the weighted keywords based on the weighted keyword input from the weighting unit 3423B and the second representative message input from the text extracting unit 3424B. The keyword information is generated by rearranging in the order of words appearing in the second representative message. Word order changing unit 3425B outputs the generated keyword information to weight calculation unit 3422B and output unit 3426B.
The output unit 3426B outputs the keyword information input from the word order change unit 3425B to the notification unit 332.

図12は、本発明の第3の実施形態に係る文章抽出部3424B、語順変更部3425Bおよび出力部3426Bの処理の一例を説明する説明図である。
処理内容例Ex18は、重み付け部3423Bにより重みが付与されたキーワードの一例である。
文章抽出部3424Bは、重み付け部3423Bにより重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Bは、重み付け部3423Bが計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Bは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 12 is an explanatory diagram illustrating an example of processing of the text extraction unit 3424B, the word order change unit 3425B, and the output unit 3426B according to the third embodiment of the present invention.
The processing content example Ex18 is an example of a keyword given a weight by the weighting unit 3423B.
The text extraction unit 3424B calculates the element score of the post message of the extracted frame based on the keyword given the weight by the weighting unit 3423B. Specifically, the sentence extraction unit 3424B calculates the element score by multiplying the number of appearances of each keyword in the extracted frame counted by the weighting unit 3423B by the weight of each keyword. The text extraction unit 3424B calculates the total sum of the calculated element scores as a posted message score for each posted message.

処理内容例Ex19において、文章抽出部3424Bは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Bは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
例えば、文章抽出部3424Bは、処理内容例Ex20のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
In the processing content example Ex19, the text extraction unit 3424B sorts the posted messages in the extracted frame in descending order of the posted message score, and extracts, for example, the top five posted messages. Then, the text extraction unit 3424B extracts the posted message having the highest calculated posted message score from the top five posted messages as the first representative message.
For example, the sentence extraction unit 3424B, like the processing example Ex20, posted the message “around 5:33, a very strong earthquake with an epicenter of YYY in XX prefecture. No worries about tsunami "is extracted as the first representative message.

語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex21は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Bは、処理内容例Ex18のような重みが付与された各キーワードの語順を、処理内容例Ex21のように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と、第1の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
The word order changing unit 3425B generates keyword information by rearranging the word order of the keywords weighted by the weighting unit 3423B into the order of the words appearing in the first representative message. For example, the processing content example Ex21 is an example of keyword information generated by the word order changing unit 3425B and output from the output unit 3426B to the notification unit 332.
The word order changing unit 3425B changes the word order of each keyword to which a weight such as the processing content example Ex18 is assigned, using the keywords “earthquake”, “□□ Oshima”, “5 seismic intensity 5”, “ The keyword information is generated by rearranging based on the tsunami concern and the first representative message.

次いで、重み算出部3422Bは、語順変更部3425Bが生成したキーワード情報に含まれるキーワードに対する重みを除外する。例えば、重み付け部3423Bは、処理内容例Ex22のように、キーワードに対して「見る 0.03」、「つける 0.02」、「緊急地震速報 0.01」、「津波は心配ない 0.01」のように重みを付与する。   Next, the weight calculation unit 3422B excludes the weight for the keyword included in the keyword information generated by the word order change unit 3425B. For example, as in the processing content example Ex22, the weighting unit 3423B performs “viewing 0.03”, “attaching 0.02”, “emergency earthquake early warning 0.01”, “tsunami is not concerned 0.01” for the keyword 0.01 The weight is given as follows.

文章抽出部3424Bは、上位5つの投稿メッセージのうち、第1の代表メッセージ以外で、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。
例えば、文章抽出部3424Bは、処理内容例Ex23のように、投稿メッセージ「緊急地震速報!こんな朝方。津波は心配ないって、A放送局で言ってる」を、第2の代表メッセージとして抽出する。
The sentence extraction unit 3424B extracts, as the second representative message, the posted message having the highest posted message score other than the first representative message among the top five posted messages.
For example, the sentence extraction unit 3424B extracts the posted message “Earthquake early warning! This morning, I am not worried about the tsunami, saying at the A broadcast station” as the second representative message, as in the processing example Ex23. .

次いで、語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex24は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Bは、処理内容例Ex22のような重みが付与された各キーワードの語順を、処理内容例Ex24のように、キーワード「緊急地震速報」、「津波は心配ない」と、第2の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
Next, the word order changing unit 3425B generates keyword information by rearranging the word order of the keywords weighted by the weighting unit 3423B into the order of words appearing in the second representative message. For example, the processing content example Ex24 is an example of keyword information generated by the word order changing unit 3425B and output from the output unit 3426B to the notification unit 332.
The word order changing unit 3425B sets the keywords “Earthquake Early Warning” and “Don't worry about tsunami” as in the case of the processing content example Ex24. The keyword information is generated by rearranging based on the representative message.

このように、キーワード抽出部3421が抽出したキーワードを、文章抽出部3424Bが抽出した第1の代表メッセージと第2の代表メッセージとのそれぞれに出現する単語の順序に並び替え、第1の代表メッセージと第2の代表メッセージとで重複するキーワードを選択しないように、キーワードに対する重みの算出を繰り返すことで、処理内容例Ex25のような、並び替えられたキーワードが重複することなく並び替えることができる。   In this way, the keywords extracted by the keyword extraction unit 3421 are rearranged in the order of words appearing in the first representative message and the second representative message extracted by the text extraction unit 3424B, and the first representative message is sorted. By repeating the calculation of the weight for the keyword so as not to select a keyword that overlaps with the second representative message, the rearranged keywords such as the processing content example Ex25 can be rearranged without duplication. .

このように、本実施形態によれば、情報処理装置3Bは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Bと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Bが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Bと、を備える。   As described above, according to the present embodiment, the information processing apparatus 3B includes the keyword extraction unit 3421 that extracts a keyword from a sentence (post message) posted within a predetermined time, and a group of posted sentences (post message). A sentence extracting unit 3424B that extracts representative sentences (first representative message and second representative message) from (post message in the extraction frame) and a keyword extracted by the keyword extracting unit 3421 are extracted by the sentence extracting unit 3424B. And a word order changing unit 3425B for rearranging words in the order of words appearing in the representative sentences (first representative message, second representative message).

これにより、情報処理装置3Bは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Bは、当該話題の移り変わりを抽出することにより、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。   Thereby, the information processing apparatus 3B can extract keywords for a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. It is possible to extract changes in topics. Further, the information processing device 3B can notify the user of the reason for the excitement by extracting the transition of the topic, so that it is possible to improve convenience when notifying the user of the excitement. it can.

(第4の実施形態)
以下、図面を参照しながら本発明の第4の実施形態について詳しく説明する。
図13は、本発明の第4の実施形態に係る解析部342Cの構成の一例を示す概略ブロック図である。
解析部342Cは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、フィルタ部3427Cと、を含んで構成される。第1の実施形態に係る解析部342と第4の実施形態に係る解析部342Cとを比較すると、フィルタ部3427Cが追加されている。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Fourth embodiment)
Hereinafter, a fourth embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 13 is a schematic block diagram illustrating an example of the configuration of the analysis unit 342C according to the fourth embodiment of the present invention.
The analysis unit 342C includes a keyword extraction unit 3421, a weight calculation unit 3422, a weighting unit 3423, a sentence extraction unit 3424, a word order change unit 3425, an output unit 3426, and a filter unit 3427C. . When the analysis unit 342 according to the first embodiment and the analysis unit 342C according to the fourth embodiment are compared, a filter unit 3427C is added. Since the other configuration is the same as that of the first embodiment, the same reference numerals are given and description thereof is omitted.

フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対してフィルタ処理を行う。具体的には、フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対して、例えば、放送局、チャンネル、番組などの識別情報によりフィルタ処理を行い、放送局ごと、チャンネルごと、番組ごとの投稿メッセージ情報を抽出する。フィルタ部3427Cは、抽出した投稿メッセージ情報をキーワード抽出部3421および文章抽出部3424に出力する。   The filter unit 3427C performs a filtering process on the posted message information input from the reading unit 341. Specifically, the filter unit 3427C performs filtering processing on the posted message information input from the reading unit 341 based on identification information such as, for example, a broadcasting station, a channel, a program, and the like. Each post message information is extracted. The filter unit 3427C outputs the extracted posted message information to the keyword extraction unit 3421 and the text extraction unit 3424.

このように、本実施形態によれば、情報処理装置3Cは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424Cと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Cが抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。   As described above, according to the present embodiment, the information processing apparatus 3C includes the keyword extraction unit 3421 that extracts a keyword from a sentence (post message) posted within a predetermined time, and a group of posted sentences (post message). A text extraction unit 3424C that extracts representative text (representative message) from (post message in the extracted frame) and a keyword extracted by the keyword extraction unit 3421 appear in the representative text (representative message) extracted by the text extraction unit 3424C. And a word order changing unit 3425 for rearranging the words in order.

これにより、情報処理装置3Cは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに放送局、チャンネル、番組ごとの投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Cは、当該放送局、チャンネル、番組ごとの話題の移り変わりを抽出することにより、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。   Thereby, the information processing apparatus 3C can extract keywords from a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. It is possible to extract changes in the topic of posted messages for each channel and program. In addition, the information processing apparatus 3C can notify the user of the reason for the excitement by extracting the transition of the topic for each broadcast station, channel, and program. Convenience can be improved.

なお、上述した各実施形態において、第4の実施形態のようにフィルタ部3427Cを備え、投稿メッセージ情報に対してフィルタ処理を行うことで、任意の投稿メッセージを抽出するようにしてもよい。   In each of the embodiments described above, an arbitrary posted message may be extracted by including the filter unit 3427C as in the fourth embodiment and performing filtering processing on the posted message information.

なお、上述した各実施形態において、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との比からキーワードごとの重みを算出したが、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との差から重みを算出してもよい。   In each of the above-described embodiments, the weight for each keyword is calculated from the ratio between the keyword appearance rate in the extracted frame and the keyword appearance rate in the reference frame. However, the keyword appearance rate in the extracted frame and the keyword appearance rate in the reference frame are calculated. The weight may be calculated from the difference from the appearance rate.

なお、上述した各実施形態において、抽出したキーワードを代表メッセージに出現する単語の順序に並び替えると説明したが、代表メッセージをそのまま通知してもよい。
なお、上述した各実施形態において、1つまたは2つの代表メッセージを抽出して、キーワードの並び替えると説明したが、3つ以上の代表メッセージを抽出してキーワードを並び替えてもよい。
In each of the above-described embodiments, it has been described that the extracted keywords are rearranged in the order of words appearing in the representative message. However, the representative message may be notified as it is.
In each of the above-described embodiments, one or two representative messages are extracted and the keywords are rearranged. However, three or more representative messages may be extracted and the keywords may be rearranged.

なお、上述した各実施形態において、文章抽出部が要素点数として、各キーワードの出現回数に各キーワードの重みを乗算することで算出する一例について説明したが、要素点数は、これに限らず、例えば、キーワードに付与された重みやキーワードの出現回数をそのまま要素点数としてもよい。
なお、上述した各実施形態において、文章抽出部は、投稿メッセージ点数に基づいて代表メッセージを抽出する一例を示したが、所定時間内に繰り返し投稿される投稿メッセージの投稿回数に基づいて代表メッセージを抽出してもよいし、投稿メッセージ本文の文字数に基づいて代表メッセージを抽出してもよいし、これらの抽出手段のうちの複数を組み合わせて代表メッセージを抽出してもよい。
In each embodiment described above, an example has been described in which the text extraction unit calculates the element score by multiplying the number of appearances of each keyword by the weight of each keyword. However, the element score is not limited to this, for example, The weight given to the keyword and the number of appearances of the keyword may be used as the element score as they are.
In each of the embodiments described above, the sentence extraction unit has shown an example of extracting a representative message based on the number of posted messages, but the representative message is extracted based on the number of postings of posted messages that are repeatedly posted within a predetermined time. The representative message may be extracted based on the number of characters in the posted message body, or the representative message may be extracted by combining a plurality of these extraction means.

なお、上述した各実施形態における情報処理装置3、3A、3B、3Cの一部、または全部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、情報処理装置3、3A、3B、3Cに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。   In addition, you may make it implement | achieve a part or all of information processing apparatus 3, 3A, 3B, 3C in each embodiment mentioned above with a computer. In that case, the program for realizing the control function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read by a computer system and executed. Here, the “computer system” is a computer system built in the information processing apparatuses 3, 3 A, 3 B, and 3 C, and includes an OS and hardware such as peripheral devices.

また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。   The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In such a case, a volatile memory inside a computer system that serves as a server or a client may be included that holds a program for a certain period of time.

また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。   The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

また、上述した実施形態における情報処理装置3、3A、3B、3Cの一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。情報処理装置3、3A、3B、3Cの各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。   Moreover, you may implement | achieve part or all of the information processing apparatus 3, 3A, 3B, 3C in embodiment mentioned above as integrated circuits, such as LSI (Large Scale Integration). Each functional block of the information processing apparatuses 3, 3A, 3B, and 3C may be individually made into a processor, or a part or all of them may be integrated into a processor. Further, the method of circuit integration is not limited to LSI, and may be realized by a dedicated circuit or a general-purpose processor. Further, in the case where an integrated circuit technology that replaces LSI appears due to progress in semiconductor technology, an integrated circuit based on the technology may be used.

以上、図面を参照してこの発明の各実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。   As described above, the embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to that described above, and various design changes and the like can be made without departing from the scope of the present invention. It is possible to

(付記1)所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備えることを特徴とする情報処理装置。   (Additional remark 1) The keyword extraction part which extracts a keyword from the text posted within the predetermined time, the sentence extraction part which extracts the representative sentence from the group of the posted sentences, and the keyword extraction part extract An information processing apparatus comprising: a word order changing unit that rearranges the keywords in the order of words appearing in the representative sentence extracted by the sentence extracting unit.

(付記2)前記キーワード抽出部が抽出した前記キーワードのそれぞれに対して重みを付与する重み付け部をさらに備えることを特徴とする(付記1)に記載の情報処理装置。   (Appendix 2) The information processing apparatus according to (Appendix 1), further comprising a weighting unit that assigns a weight to each of the keywords extracted by the keyword extraction unit.

(付記3)前記文章抽出部は、前記重み付け部が重みを付与した前記キーワードに基づいて、前記代表文章を抽出することを特徴とする(付記2)に記載の情報処理装置。   (Additional remark 3) The said text extraction part extracts the said representative sentence based on the said keyword which the said weighting part gave the weight, The information processing apparatus as described in (Additional remark 2) characterized by the above-mentioned.

(付記4)投稿された前記文章の数を検出する検出部をさらに備え、前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出することを特徴とする(付記3)に記載の情報処理装置。   (Additional remark 4) The detection part which detects the number of the said posted sentences is further provided, and when the said detection part detects the number of the said sentence more than a predetermined number within the said predetermined time, the said keyword extraction part is the said The information processing apparatus according to (Appendix 3), wherein a keyword is extracted from the sentence posted within a predetermined time.

(付記5)所定時間内に投稿された文章からキーワードを抽出するキーワード抽出過程と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、を有することを特徴とする情報処理方法。   (Supplementary Note 5) Keyword extraction process for extracting a keyword from sentences posted within a predetermined time, sentence extraction process for extracting representative sentences from a group of the posted sentences, and extraction by the keyword extraction process And a word order changing step of rearranging the keyword in the order of words appearing in the representative sentence extracted by the sentence extraction process.

(付記6)情報処理装置のコンピュータに、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、を実行させるための情報処理プログラム。   (Additional remark 6) The keyword extraction step which extracts a keyword from the text posted in the predetermined time in the computer of the information processing apparatus, and the text extraction step which extracts a representative text from the group of the posted text An information processing program for executing a word order changing step of rearranging the keywords extracted in the keyword extraction step in the order of words appearing in the representative sentence extracted in the sentence extraction step.

S1・・・情報処理システム、1・・・投稿端末装置、2・・・投稿サービスサーバ装置、3、3A、3B、3C・・・情報処理装置、4・・・電子機器、N1・・・ネットワーク、31・・・取得部、32・・・記憶部、33・・・検知部、34・・・抽出部、331・・・検出部、332・・・通知部、341・・・読み出し部、342、342A、342B、342C・・・解析部、3421・・・キーワード抽出部、3422、3422B・・・重み算出部、3423、3423B・・・重み付け部、3424、3424A、3424B・・・文章抽出部、3425、3425A、3425B・・・語順変更部、3426、3426A、3426B・・・出力部、3427C・・・フィルタ部 S1 ... Information processing system, 1 ... Posting terminal device, 2 ... Posting service server device, 3, 3A, 3B, 3C ... Information processing device, 4 ... Electronic equipment, N1 ... Network 31 ... acquisition unit 32 ... storage unit 33 ... detection unit 34 ... extraction unit 331 ... detection unit 332 ... notification unit 341 ... reading unit , 342, 342A, 342B, 342C ... analysis unit, 3421 ... keyword extraction unit, 3422, 3422B ... weight calculation unit, 3423, 3423B ... weighting unit, 3424, 3424A, 3424B ... sentence Extraction unit, 3425, 3425A, 3425B ... word order change unit, 3426, 3426A, 3426B ... output unit, 3427C ... filter unit

Claims (6)

所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、
前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、
を備えることを特徴とする情報処理装置。
A keyword extraction unit that extracts keywords from sentences posted within a predetermined time;
A sentence extraction unit that extracts representative sentences from the group of the posted sentences;
A word order changing unit for rearranging the keywords extracted by the keyword extracting unit in the order of words appearing in the representative sentence extracted by the sentence extracting unit;
An information processing apparatus comprising:
前記キーワード抽出部が抽出した前記キーワードのそれぞれに対して重みを付与する重み付け部
をさらに備えることを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, further comprising a weighting unit that assigns a weight to each of the keywords extracted by the keyword extraction unit.
前記文章抽出部は、前記重み付け部が重みを付与した前記キーワードに基づいて、前記代表文章を抽出すること
を特徴とする請求項2に記載の情報処理装置。
The information processing apparatus according to claim 2, wherein the sentence extraction unit extracts the representative sentence based on the keyword given a weight by the weighting unit.
投稿された前記文章の数を検出する検出部をさらに備え、
前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出すること
を特徴とする請求項1から請求項3のいずれか一項に記載の情報処理装置。
A detection unit for detecting the number of posted sentences;
The keyword extraction unit extracts a keyword from the sentence posted within the predetermined time when the detection unit detects the number of the sentences equal to or greater than a predetermined number within the predetermined time. The information processing apparatus according to any one of claims 1 to 3.
所定時間内に投稿された文章からキーワードを抽出するキーワード抽出過程と、
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、
前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、
を有することを特徴とする情報処理方法。
A keyword extraction process to extract keywords from sentences posted within a predetermined time;
A sentence extraction process for extracting representative sentences from the group of the posted sentences;
A word order changing process for rearranging the keywords extracted in the keyword extraction process in the order of words appearing in the representative sentence extracted in the sentence extraction process;
An information processing method characterized by comprising:
情報処理装置のコンピュータに、
所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、
前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、
を実行させるための情報処理プログラム。
In the computer of the information processing device,
A keyword extraction step for extracting keywords from sentences posted within a predetermined time;
A sentence extraction step of extracting representative sentences from the group of the posted sentences;
A word order changing step of rearranging the keywords extracted in the keyword extraction step in the order of words appearing in the representative sentence extracted in the sentence extraction step;
Information processing program to execute.
JP2013164522A 2013-08-07 2013-08-07 Information processing apparatus, information processing method, and information processing program Expired - Fee Related JP5645233B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013164522A JP5645233B1 (en) 2013-08-07 2013-08-07 Information processing apparatus, information processing method, and information processing program
PCT/JP2014/066291 WO2015019723A1 (en) 2013-08-07 2014-06-19 Information processing device, information processing method, information processing program, information processing system, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013164522A JP5645233B1 (en) 2013-08-07 2013-08-07 Information processing apparatus, information processing method, and information processing program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014220716A Division JP5818391B2 (en) 2014-10-29 2014-10-29 Information processing system and electronic device

Publications (2)

Publication Number Publication Date
JP5645233B1 JP5645233B1 (en) 2014-12-24
JP2015035026A true JP2015035026A (en) 2015-02-19

Family

ID=52139222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013164522A Expired - Fee Related JP5645233B1 (en) 2013-08-07 2013-08-07 Information processing apparatus, information processing method, and information processing program

Country Status (2)

Country Link
JP (1) JP5645233B1 (en)
WO (1) WO2015019723A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156196A (en) * 2015-04-22 2016-11-23 富士通株式会社 Extract the apparatus and method of text feature

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190450A (en) * 1996-01-09 1997-07-22 Canon Inc Information processor and its method
WO2009101954A1 (en) * 2008-02-15 2009-08-20 Nec Corporation Text information analysis system
JP5474455B2 (en) * 2009-09-07 2014-04-16 日本電信電話株式会社 Document group processing apparatus, document group processing method, and document group processing program

Also Published As

Publication number Publication date
WO2015019723A1 (en) 2015-02-12
JP5645233B1 (en) 2014-12-24

Similar Documents

Publication Publication Date Title
Koo Development of a cell phone addiction scale for Korean adolescents
O'Sullivan Linking online sexual activities to health outcomes among teens
Pearlman et al. Hurricane Katrina's effect on the perception of New Orleans leisure tourists
CN103544954A (en) Method and device for adding text label to voice message
JP2013206389A (en) Intimacy calculation method, intimacy calculation program and intimacy calculation device
Freeman Claims, frames, and blame: Coverage of climate change in ASEAN’s English-language newspapers, 2002-2012
JP2016110213A (en) Information processing device, information processing system, terminal device, information processing method, and information processing program
WO2012111226A1 (en) Time-series document summarization device, time-series document summarization method and computer-readable recording medium
Alim Analysis of tweets related to cyberbullying: Exploring information diffusion and advice available for cyberbullying victims
Onashoga et al. Securix: A 3D game-based learning approach for phishing attack awareness
JP5645233B1 (en) Information processing apparatus, information processing method, and information processing program
JP6572218B2 (en) Danger detection device, danger detection method, and danger detection program
Sheffer New media, old ways: An analysis of sports media's depiction of female athletes on Instagram and Snapchat
Takata et al. Confront phishing attacks—from a perspective of security education
JP5818391B2 (en) Information processing system and electronic device
Sharma et al. Digital literacy: A skill for survival
Maheswari Frequency of using WhatsApp Messenger among college students in Salem district, TamilNadu
Herlina et al. The influence of cybercrime against teenage angst in online media
Wang et al. Ethnic digital media as agenda setters and agenda marketers: The case of WXC and the Jimmy Kimmel Live! controversy
Burch et al. ‘Get back to the kitchen, cos u talk s*** on tv’: gendered online abuse and trigger events in sport
Helfrich et al. No nos vamos, nos echan
Tassitano More Than Ever, It Is Time to Ensure Regular Opportunities for Physical Activity Among Children and Adolescents: The Potential of Structured Settings
Obidi et al. Cyber-Bullying: Assessment of its Awareness and Threats to Social Media Development
WO2012056775A1 (en) Information-processing device, prompting method, and computer-readable recording medium
Ezeonyejiaku et al. TACKLING SOCIAL MEDIA AND COVID-19 ISSUES IN NIGERIA: THE CASE OF FAKE NEWS AND MISCONCEPTIONS

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141029

R150 Certificate of patent or registration of utility model

Ref document number: 5645233

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees