JP2015035026A - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP2015035026A JP2015035026A JP2013164522A JP2013164522A JP2015035026A JP 2015035026 A JP2015035026 A JP 2015035026A JP 2013164522 A JP2013164522 A JP 2013164522A JP 2013164522 A JP2013164522 A JP 2013164522A JP 2015035026 A JP2015035026 A JP 2015035026A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- keyword
- posted
- message
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and an information processing program.
放映中のテレビ番組をTwitter(登録商標)などへの投稿メッセージ数から盛り上がり度合を算出して、当該盛り上がり度合をユーザに通知するものがある(非特許文献1参照)。ここで、盛り上がりとは、現在時刻の投稿メッセージ数が所定数を越え、かつ同時刻の過去の投稿メッセージ数よりも現在時刻の投稿メッセージ数が多い状態のことである。また、録画したテレビ番組を効率よく楽しむために、テレビ番組に関連する投稿メッセージ数の変動から重要シーンを自動的に検出し、投稿メッセージの内容から各シーンでの主要人物とイベント内容とを推定し、シーンを表すラベルとして付与するものがある(非特許文献2参照)。 There is one that calculates the degree of excitement of the TV program being broadcast from the number of messages posted to Twitter (registered trademark) and notifies the user of the degree of excitement (see Non-Patent Document 1). Here, the excitement is a state in which the number of posted messages at the current time exceeds a predetermined number and the number of posted messages at the current time is larger than the number of posted messages at the same time. In order to enjoy recorded TV programs efficiently, important scenes are automatically detected from fluctuations in the number of posted messages related to TV programs, and the main characters and event contents in each scene are estimated from the contents of posted messages. However, some labels are given as scene labels (see Non-Patent Document 2).
しかしながら、非特許文献1に記載の技術を用いても、盛り上がり度合をユーザに通知しても、盛り上がりが発生した理由がわからないという欠点があった。また、非特許文献2に記載の技術を用いても、主要人物と関連しないイベントの内容などを推定できないという欠点があった。このように、盛り上がりを通知するときのユーザの利便性が十分でないという課題があった。
However, even if the technology described in Non-Patent
本発明は、上記の点に鑑みてなされたものであり、盛り上がりを通知するときのユーザの利便性を向上させることができる情報処理装置、情報処理方法および情報処理プログラムを提供することを課題とする。 The present invention has been made in view of the above points, and it is an object of the present invention to provide an information processing apparatus, an information processing method, and an information processing program that can improve user convenience when notifying a rise. To do.
(1)本発明は上記の課題を解決するためになされたものであり、本発明の第一の態様は、情報処理装置であって、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備えることを特徴とする情報処理装置である。 (1) The present invention has been made to solve the above-described problems, and a first aspect of the present invention is an information processing apparatus that extracts keywords from sentences posted within a predetermined time. An extraction unit; a sentence extraction unit that extracts a representative sentence from the group of the posted sentences; and a word that appears in the representative sentence extracted by the sentence extraction unit by the keyword extracted by the keyword extraction unit An information processing apparatus comprising: a word order changing unit for rearranging in the order of
(2)また、本発明の第二の態様は、情報処理方法であって、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出過程と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、を有することを特徴とする情報処理方法である。 (2) Moreover, the second aspect of the present invention is an information processing method, comprising: a keyword extraction process for extracting a keyword from a sentence posted within a predetermined time; and a representative from a group of the posted sentences. A sentence extraction process for extracting a representative sentence, and a word order changing process for rearranging the keywords extracted in the keyword extraction process in the order of words appearing in the representative sentence extracted in the sentence extraction process. Is an information processing method characterized by
(3)また、本発明の第三の態様は、情報処理プログラムであって、情報処理装置のコンピュータに、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、を実行させるための情報処理プログラムである。 (3) Further, a third aspect of the present invention is an information processing program, the keyword extracting step for extracting a keyword from a sentence posted within a predetermined time to a computer of the information processing apparatus, and the posted A sentence extraction step for extracting a representative sentence from the group of sentences, and a word order for rearranging the keywords extracted in the keyword extraction step into the order of words appearing in the representative sentence extracted in the sentence extraction step An information processing program for executing the change step.
本発明の情報処理装置、情報処理方法および情報処理プログラムによれば、盛り上がりを通知するときのユーザの利便性を向上させることができる。 According to the information processing apparatus, the information processing method, and the information processing program of the present invention, it is possible to improve the convenience of the user when notifying the excitement.
(第1の実施形態)
以下、図面を参照しながら本発明の第1の実施形態について詳述する。
図1は、本発明の第1の実施形態に係る情報処理システムS1の構成の一例を示す概略図である。
情報処理システムS1は、投稿端末装置1と、投稿サービスサーバ装置2と、情報処理装置3と、電子機器4と、を含んで構成される。投稿端末装置1と投稿サービスサーバ装置2と情報処理装置3と電子機器4とのそれぞれは、ネットワークN1を介して有線または無線で通信を行う。
(First embodiment)
Hereinafter, a first embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a schematic diagram showing an example of the configuration of the information processing system S1 according to the first embodiment of the present invention.
The information processing system S1 includes a
投稿端末装置1は、例えば、PC(パーソナルコンピュータ:Personal Computer)であり、ユーザからメッセージの入力を受け付ける。投稿サービスサーバ装置2は、例えば、ソーシャルメディアサーバ装置である。ここで、ソーシャルメディアとは、個人と個人、個人と組織、組織と組織の間の情報発信が、ウェブサービスを経由することによってそれ自体が意味を持つコミュニティとなり、実社会に広く拡散されて影響力を持ち始めたメディアサービスであり、例えば、ブログやミニブログ、電子掲示板、ソーシャルネットワークサービス、投稿サービスなどである。
The posting
ユーザは、投稿端末装置1を利用して、メッセージを投稿サービスサーバ装置2に投稿する。なお、以下の説明において、投稿サービスサーバ装置2に投稿されたメッセージを投稿メッセージと称する。
The user posts a message to the posting
情報処理装置3は、ネットワークN1を介し、投稿サービスサーバ装置2から投稿メッセージを取得する。そして、情報処理装置3は、所定時間内の複数の投稿メッセージから複数のキーワードを抽出し、複数の投稿メッセージから代表となる代表メッセージを抽出する。情報処理装置3は、抽出した複数のキーワードを、代表メッセージに出現する単語の順序に並び替え、ネットワークN1を介して電子機器4に送信する。電子機器4の表示部41は、代表メッセージの順序に並び替えられたキーワードを表示する。
電子機器4は、例えば、PCや、電話やメール機能の他にPDA(携帯情報端末)の機能が付いた多機能携帯電話機(スマートフォン)や、タブレットPCなどである。
The
The
図2は、本発明の第1の実施形態に係る情報処理装置3の構成の一例を示す概略ブロック図である。
情報処理装置3は、取得部31と、記憶部32と、検知部33と、抽出部34とを含んで構成される。
取得部31は、投稿サービスサーバ装置2から複数の投稿メッセージ情報を、API(Application Program Interface:エーピーアイ)を利用して取得する。当該投稿メッセージ情報には、投稿メッセージのメッセージ本文と当該メッセージが投稿サービスサーバ装置2に投稿された時刻とが含まれる。取得部31は、取得した投稿メッセージ情報を記憶部32に記憶させ、記憶部32は、当該投稿メッセージ情報を記憶する。
FIG. 2 is a schematic block diagram showing an example of the configuration of the
The
The
検知部33は、所定時間内の投稿メッセージの件数を検出し、検出結果に基づいて抽出部34を動作させる。また、検知部33は、検出結果と後述する抽出部34から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に送信する。詳細な検知部33の処理は後述する。
抽出部34は、投稿メッセージから複数のキーワードを抽出する。抽出部34は、抽出した複数のキーワードを並び替えてキーワード情報を生成する。抽出部34は、生成したキーワード情報を検知部33に出力する。詳細な抽出部34の処理は後述する。
The
The
図3は、本発明の第1の実施形態に係る検知部33および抽出部34の構成の一例を示す概略図である。
検知部33は、検出部331と、通知部332と、を含んで構成される。
検出部331は、所定時間内の投稿メッセージの件数を検出し、当該所定時間内に検出した投稿メッセージの件数が所定の数以上である場合に、盛り上がりとして検出し、抽出部34を動作させる。また、検出部331は、検出した盛り上がりを表す盛り上がり情報を通知部332に出力する。
通知部332は、検出部331から入力された盛り上がり情報と解析部342から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に通知する。
FIG. 3 is a schematic diagram illustrating an example of the configuration of the
The
The
The
抽出部34は、読み出し部341と、解析部342と、を含んで構成される。
読み出し部341は、検出部331が盛り上がりを検出すると、記憶部32から所定時間内の投稿メッセージ情報を読み出し、当該投稿メッセージ情報を解析部342に出力する。
解析部342は、投稿メッセージ情報に含まれる投稿メッセージ本文から複数のキーワードを抽出する。解析部342は、例えば、公知の手段を利用してキーワードを抽出する。解析部342は、抽出したキーワードに基づいて代表メッセージを抽出する。そして、解析部342は、抽出した複数のキーワードを、代表メッセージ本文に出現する単語の順序に並び替えてキーワード情報を生成する。解析部342は、生成したキーワード情報を通知部332に出力する。詳細な解析部342の処理は後述する。
The
When the detecting
The
図4は、本発明の第1の実施形態に係る解析部342の構成の一例を示す概略ブロック図である。
解析部342は、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、を含んで構成される。
キーワード抽出部3421は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文からキーワードを抽出する。キーワード抽出部3421は、抽出したキーワードを重み算出部3422に出力する。
FIG. 4 is a schematic block diagram illustrating an example of the configuration of the
The
The
重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。また、重み算出部3422は、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422は、集計したキーワードに対する重みを算出する。重み算出部3422は、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422が算出した重みと、を重み付け部3423に出力する。また、重み算出部3422は、計数したキーワードの出現回数を文章抽出部3424に出力する。
The
重み付け部3423は、重み算出部3422から入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423は、重みを付与したキーワードを文章抽出部3424および語順変更部3425に出力する。
The
文章抽出部3424は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。ここで、投稿メッセージ点数とは、要素点数の総和であり、要素点数とは、各キーワードの出現回数に各キーワードの重みを乗算することで算出される点数である。文章抽出部3424は、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、代表となる代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425に出力する。
The
語順変更部3425は、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424から入力された代表メッセージとに基づいて、重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425は、生成したキーワード情報を出力部3426に出力する。
出力部3426は、語順変更部3425から入力されたキーワード情報を通知部332に出力する。
The word
The
図5は、本発明の第1の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
処理内容例Ex1において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「[ABC開幕戦日本vsタイ]試合終了日本5−3タイ日本代表苦しみながらも見事逆転勝利!」から「ABC開幕戦」、「日本vsタイ」、「試合終了」、「日本」、「5−3」、「タイ」、「日本代表」、「苦しい」、「見事」、「逆転勝利」の各キーワードを抽出する。
FIG. 5 is an explanatory diagram illustrating an example of processing of the
In the processing content example Ex1, the
重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「ABC開幕戦[1]」、「日本vsタイ[1]」、「試合終了[1]」、「日本[1]」、「5−3[1]」、「タイ[1]」、「日本代表[1]」、「苦しい[1]」、「見事[1]」、「逆転勝利[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。
The
重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex2において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「勝つ[31]」、「日本代表チーム[22]」、「日本[14]」、「試合終了[13]」、「タイ[7]」、「勝利[6]」、「初戦[5]」、「5−3[5]」、「苦しい[4]」、「日本勝利[4]」、・・・、と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。
The
重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex3において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「勝つ[5]」、「日本代表チーム[46]」、「日本[4]」、「試合終了[0]」、「タイ[3]」、「勝利[0]」、「初戦[0]」、「5−3[1]」、「苦しい[0]」、「日本勝利[0]」、・・・、と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。
The
重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、式(1)により算出する。
Based on the number of posted messages in the extracted frame and the number of posted messages in the reference frame, the
ここで、Weight(w)は、キーワードごとの重みを表す。また、r0(w)、r10(w)は、式(2)、式(3)により算出する。 Here, Weight (w) represents a weight for each keyword. Also, r 0 (w), r 10 (w) , the formula (2), is calculated by the equation (3).
ここで、r0(w)、r10(w)は、抽出フレームにおける各キーワードの出現率、参照フレームにおける各キーワードの出現率をそれぞれ表し、x0(w)、x10(w)は、抽出フレームにおける各キーワードが出現する投稿メッセージの件数、参照フレームにおける各キーワードが出現する投稿メッセージの件数をそれぞれ表す。また、N0、N10は、抽出フレームにおける投稿メッセージの総数、参照フレームにおける投稿メッセージの総数をそれぞれ表す。 Here, r 0 (w) and r 10 (w) represent the appearance rate of each keyword in the extracted frame and the appearance rate of each keyword in the reference frame, respectively, and x 0 (w) and x 10 (w) are This represents the number of posted messages in which each keyword appears in the extracted frame and the number of posted messages in which each keyword appears in the reference frame. N 0 and N 10 represent the total number of posted messages in the extracted frame and the total number of posted messages in the reference frame, respectively.
重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex4のようにキーワードに対して重みを付与する。
例えば、重み付け部3423は、「試合終了 3.10」、「勝つ 1.69」、「勝利 0.71」、「初戦 0.51」、「日本 0.45」、「苦しい 0.34」、「日本勝利 0.34」、「5−3 0.26」、「タイ 0.14」、「日本代表チーム 0.13」のように、キーワードに対して重みを付与する。
The
For example, the
これにより、参照フレームにおける投稿メッセージによく出現するキーワードには、低い重みが付与され、参照フレームにおける投稿メッセージに出現しにくい(出現しない)キーワードには、高い重みが付与される。この例では、「試合終了」、「勝利」、「初戦」などのキーワードの重みが高くなり、「日本代表チーム」に対する重みは低くなる。 Thereby, a low weight is assigned to a keyword that frequently appears in a posted message in the reference frame, and a high weight is assigned to a keyword that does not appear (not appear) in the posted message in the reference frame. In this example, the weight of keywords such as “End of game”, “Victory”, “First game” is high, and the weight for “Japan national team” is low.
図6は、本発明の第1の実施形態に係る文章抽出部3424、語順変更部3425および出力部3426の処理の一例を説明する説明図である。
処理内容例Ex5は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424は、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424は、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424は、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 6 is an explanatory diagram illustrating an example of processing of the
The processing content example Ex5 is an example of a keyword given a weight by the
処理内容例Ex6において、文章抽出部3424は、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位5つの投稿メッセージを抽出する。そして、文章抽出部3424は、上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、代表メッセージとして抽出する。
例えば、文章抽出部3424は、処理内容例Ex7のように、投稿メッセージ「ABC試合終了 予選ラウンド 日本5−3タイ ※7回表、日本が一挙3点を取り逆転、開幕戦に勝利」を、代表メッセージとして抽出する。
In the processing content example Ex6, the
For example, the
語順変更部3425は、重み付け部3423により重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex8は、語順変更部3425により生成され、出力部3426から通知部332に出力されるキーワード情報の一例である。
語順変更部3425は、処理内容例Ex5の重みが付与された各キーワードの語順を、処理内容例Ex8のように、キーワード「試合終了」、「日本」、「5−3」、「タイ」、「勝利」と並び替えて、キーワード情報を生成する。
The word
The word
図7は、本発明の第1の実施形態に係る解析部342の処理の一例を示すフローチャートである。
ステップST101において、キーワード抽出部3421は、抽出フレームにおける投稿メッセージのそれぞれからキーワードを抽出する。
ステップST102において、重み算出部3422は、抽出フレームにおける投稿メッセージのキーワードの出現率と、参照フレームにおける投稿メッセージのキーワードの出現率とから、キーワードごとの重みを算出する。
FIG. 7 is a flowchart showing an example of processing of the
In step ST101, the
In step ST102, the
ステップST103において、重み付け部3423は、キーワード抽出部3421が抽出した各キーワードに対して、重み算出部3422が算出したキーワードごとの重みを付与する。
ステップST104において、文章抽出部3424は、キーワードごとの重みと、キーワードの出現回数とから要素点数および投稿メッセージ点数を算出し、算出結果に基づいて、代表メッセージを抽出する。
In step ST103, the
In step ST104, the
ステップST105において、語順変更部3425は、キーワード抽出部3421が抽出したキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。
In step ST105, the word
このように、本実施形態によれば、情報処理装置3は、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424と、キーワード抽出部3421が抽出したキーワードを文章抽出部3424が抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。
As described above, according to the present embodiment, the
これにより、情報処理装置3は、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の語順に抽出したキーワードを並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3は、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。
Accordingly, the
(第2の実施形態)
以下、図面を参照しながら本発明の第2の実施形態について詳しく説明する。
図8は、本発明の第2の実施形態に係る解析部342Aの構成の一例を示す概略ブロック図である。
解析部342Aは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424Aと、語順変更部3425Aと、出力部3426Aと、を含んで構成される。第1の実施形態に係る解析部342と第2の実施形態に係る解析部342Aとを比較すると、文章抽出部3424A、語順変更部3425Aおよび出力部3426Aが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Second Embodiment)
Hereinafter, a second embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 8 is a schematic block diagram showing an example of the configuration of the
The
文章抽出部3424Aは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Aは、抽出した代表メッセージを、語順変更部3425Aに出力する。次いで、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425Aに出力する。
The
語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Aは、生成したキーワード情報を出力部3426Aに出力する。
出力部3426Aは、語順変更部3425Aから入力されたキーワード情報を通知部332に出力する。
The word
The
図9は、本発明の第2の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
処理内容例Ex9において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「緊急地震速報が鳴る→起こされる→揺れが始まる→A放送局で諸々チェック中。」から「緊急地震速報」、「鳴る」、「起こされる」、「揺れ」、「始まる」、「A放送局」、「諸々チェック中」の各キーワードを抽出する。
FIG. 9 is an explanatory diagram illustrating an example of processing of the
In the processing content example Ex9, the
重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「緊急地震速報[1]」、「鳴る[1]」、「起こされる[1]」、「揺れ[1]」、「始まる[1]」、「A放送局[1]」、「諸々チェック中[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。
The
重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex10において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「津波の心配[40]」、「地震[18]」、「見る[16]」、「つける[15]」、「□□大島[14]」、「震度5強[12]」、「緊急地震速報[8]」、・・・と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。
The
重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex11において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「津波の心配[21]」、「地震[34]」、「見る[36]」、「つける[61]」、「□□大島[59]」、「震度5強[39]」、「緊急地震速報[22]」、・・・と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。
The
重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、上述の式(1)により算出する。
重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex12のようにキーワードに対して重み付けを行う。
例えば、重み付け部3423は、「津波の心配 0.35」、「地震 0.05」、「見る 0.03」、「震度5強 0.02」、「つける 0.02」、「□□大島 0.02」、「緊急地震速報 0.01」、・・・のようにキーワードに対して重みを付与する。
Based on the number of posted messages in the extracted frame and the number of posted messages in the reference frame, the
The
For example, the
図10は、本発明の第2の実施形態に係る文章抽出部3424A、語順変更部3425Aおよび出力部3426Aの処理の一例を説明する説明図である。
処理内容例Ex13は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424Aは、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Aは、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Aは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 10 is an explanatory diagram illustrating an example of processing of the
The processing content example Ex13 is an example of a keyword given a weight by the
処理内容例Ex14において、文章抽出部3424Aは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
例えば、文章抽出部3424Aは、処理内容例Ex15のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
In the processing content example Ex14, the
For example, the
また、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。
例えば、文章抽出部3424Aは、処理内容例Ex16のように、投稿メッセージ「大丈夫ですか?いまテレビで、津波の心配はないと言っていました。震度5強は怖いっす…」を、第2の代表メッセージとして抽出する。
In addition, the
For example, the
語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、1行目のキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えて、2行目のキーワード情報を生成する。例えば、処理内容例Ex17は、語順変更部3425Aにより生成され、出力部3426Aから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Aは、処理内容例Ex13のような重みが付与された各キーワードの語順を、第1の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と並び替え、改行して、2行目に、第2の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「津波の心配」、「震度5強」と、並び替えて、キーワード情報を生成する。
The word
The word
このように、本実施形態によれば、情報処理装置3Aは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Aと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Aが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Aと、を備える。
As described above, according to the present embodiment, the information processing apparatus 3A includes the
これにより、情報処理装置3Aは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3Aは、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。 Accordingly, the information processing apparatus 3A can extract keywords from a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. You can follow the topic of the message. Moreover, since the information processing apparatus 3A can notify the user of the reason for the excitement by following the topicality, the convenience when notifying the user of the excitement can be improved.
(第3の実施形態)
以下、図面を参照しながら本発明の第3の実施形態について詳しく説明する。
図11は、本発明の第3の実施形態に係る解析部342Bの構成の一例を示す概略ブロック図である。
解析部342Bは、キーワード抽出部3421と、重み算出部3422Bと、重み付け部3423Bと、文章抽出部3424Bと、語順変更部3425Bと、出力部3426Bと、を含んで構成される。第1の実施形態に係る解析部342と第3の実施形態に係る解析部342Bとを比較すると、重み算出部3422B、重み付け部3423B、文章抽出部3424B、語順変更部3425Bおよび出力部3426Bが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Third embodiment)
Hereinafter, the third embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 11 is a schematic block diagram illustrating an example of the configuration of the
The
重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。また、重み算出部3422Bは、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422Bは、集計したキーワードに対する重みを算出する。重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422Bが算出した重みと、を重み付け部3423Bに出力する。
そして、重み算出部3422Bは、語順変更部3425Bからキーワード情報が入力されると、当該キーワード情報に含まれるキーワードに対する重みを除外する。重み算出部3422Bは、キーワード抽出部3421から入力されたキーワードから、語順変更部3425Bから入力されたキーワード情報に含まれるキーワードを除外したキーワードと、当該キーワードに対する重みとを重み付け部3423Bに出力する。
The weight calculation unit 3422B counts the number of appearances of the keyword extracted by the
Then, when the keyword information is input from the word
重み付け部3423Bは、重み算出部3422Bから入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423Bは、重みを付与したキーワードを文章抽出部3424Bおよび語順変更部3425Bに出力する。
The
文章抽出部3424Bは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Bは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第1の代表メッセージを、語順変更部3425Bに出力する。また、文章抽出部3424Bは、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を、再度、算出する。そして、文章抽出部3424Bは、再度算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから第1の代表メッセージ以外であって、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第2の代表メッセージを、語順変更部3425Bに出力する。
The
語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Bは、生成したキーワード情報を、重み算出部3422Bおよび出力部3426Bに出力する。
出力部3426Bは、語順変更部3425Bから入力されたキーワード情報を通知部332に出力する。
The word
The
図12は、本発明の第3の実施形態に係る文章抽出部3424B、語順変更部3425Bおよび出力部3426Bの処理の一例を説明する説明図である。
処理内容例Ex18は、重み付け部3423Bにより重みが付与されたキーワードの一例である。
文章抽出部3424Bは、重み付け部3423Bにより重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Bは、重み付け部3423Bが計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Bは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
FIG. 12 is an explanatory diagram illustrating an example of processing of the
The processing content example Ex18 is an example of a keyword given a weight by the
The
処理内容例Ex19において、文章抽出部3424Bは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Bは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
例えば、文章抽出部3424Bは、処理内容例Ex20のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
In the processing content example Ex19, the
For example, the
語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex21は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Bは、処理内容例Ex18のような重みが付与された各キーワードの語順を、処理内容例Ex21のように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と、第1の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
The word
The word
次いで、重み算出部3422Bは、語順変更部3425Bが生成したキーワード情報に含まれるキーワードに対する重みを除外する。例えば、重み付け部3423Bは、処理内容例Ex22のように、キーワードに対して「見る 0.03」、「つける 0.02」、「緊急地震速報 0.01」、「津波は心配ない 0.01」のように重みを付与する。
Next, the weight calculation unit 3422B excludes the weight for the keyword included in the keyword information generated by the word
文章抽出部3424Bは、上位5つの投稿メッセージのうち、第1の代表メッセージ以外で、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。
例えば、文章抽出部3424Bは、処理内容例Ex23のように、投稿メッセージ「緊急地震速報!こんな朝方。津波は心配ないって、A放送局で言ってる」を、第2の代表メッセージとして抽出する。
The
For example, the
次いで、語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex24は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
語順変更部3425Bは、処理内容例Ex22のような重みが付与された各キーワードの語順を、処理内容例Ex24のように、キーワード「緊急地震速報」、「津波は心配ない」と、第2の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
Next, the word
The word
このように、キーワード抽出部3421が抽出したキーワードを、文章抽出部3424Bが抽出した第1の代表メッセージと第2の代表メッセージとのそれぞれに出現する単語の順序に並び替え、第1の代表メッセージと第2の代表メッセージとで重複するキーワードを選択しないように、キーワードに対する重みの算出を繰り返すことで、処理内容例Ex25のような、並び替えられたキーワードが重複することなく並び替えることができる。
In this way, the keywords extracted by the
このように、本実施形態によれば、情報処理装置3Bは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Bと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Bが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Bと、を備える。
As described above, according to the present embodiment, the information processing apparatus 3B includes the
これにより、情報処理装置3Bは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Bは、当該話題の移り変わりを抽出することにより、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。 Thereby, the information processing apparatus 3B can extract keywords for a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. It is possible to extract changes in topics. Further, the information processing device 3B can notify the user of the reason for the excitement by extracting the transition of the topic, so that it is possible to improve convenience when notifying the user of the excitement. it can.
(第4の実施形態)
以下、図面を参照しながら本発明の第4の実施形態について詳しく説明する。
図13は、本発明の第4の実施形態に係る解析部342Cの構成の一例を示す概略ブロック図である。
解析部342Cは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、フィルタ部3427Cと、を含んで構成される。第1の実施形態に係る解析部342と第4の実施形態に係る解析部342Cとを比較すると、フィルタ部3427Cが追加されている。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
(Fourth embodiment)
Hereinafter, a fourth embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 13 is a schematic block diagram illustrating an example of the configuration of the
The
フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対してフィルタ処理を行う。具体的には、フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対して、例えば、放送局、チャンネル、番組などの識別情報によりフィルタ処理を行い、放送局ごと、チャンネルごと、番組ごとの投稿メッセージ情報を抽出する。フィルタ部3427Cは、抽出した投稿メッセージ情報をキーワード抽出部3421および文章抽出部3424に出力する。
The
このように、本実施形態によれば、情報処理装置3Cは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424Cと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Cが抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。
As described above, according to the present embodiment, the information processing apparatus 3C includes the
これにより、情報処理装置3Cは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに放送局、チャンネル、番組ごとの投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Cは、当該放送局、チャンネル、番組ごとの話題の移り変わりを抽出することにより、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。 Thereby, the information processing apparatus 3C can extract keywords from a plurality of posted sentences and rearrange the extracted keywords in the order of words appearing in the representative sentences. It is possible to extract changes in the topic of posted messages for each channel and program. In addition, the information processing apparatus 3C can notify the user of the reason for the excitement by extracting the transition of the topic for each broadcast station, channel, and program. Convenience can be improved.
なお、上述した各実施形態において、第4の実施形態のようにフィルタ部3427Cを備え、投稿メッセージ情報に対してフィルタ処理を行うことで、任意の投稿メッセージを抽出するようにしてもよい。
In each of the embodiments described above, an arbitrary posted message may be extracted by including the
なお、上述した各実施形態において、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との比からキーワードごとの重みを算出したが、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との差から重みを算出してもよい。 In each of the above-described embodiments, the weight for each keyword is calculated from the ratio between the keyword appearance rate in the extracted frame and the keyword appearance rate in the reference frame. However, the keyword appearance rate in the extracted frame and the keyword appearance rate in the reference frame are calculated. The weight may be calculated from the difference from the appearance rate.
なお、上述した各実施形態において、抽出したキーワードを代表メッセージに出現する単語の順序に並び替えると説明したが、代表メッセージをそのまま通知してもよい。
なお、上述した各実施形態において、1つまたは2つの代表メッセージを抽出して、キーワードの並び替えると説明したが、3つ以上の代表メッセージを抽出してキーワードを並び替えてもよい。
In each of the above-described embodiments, it has been described that the extracted keywords are rearranged in the order of words appearing in the representative message. However, the representative message may be notified as it is.
In each of the above-described embodiments, one or two representative messages are extracted and the keywords are rearranged. However, three or more representative messages may be extracted and the keywords may be rearranged.
なお、上述した各実施形態において、文章抽出部が要素点数として、各キーワードの出現回数に各キーワードの重みを乗算することで算出する一例について説明したが、要素点数は、これに限らず、例えば、キーワードに付与された重みやキーワードの出現回数をそのまま要素点数としてもよい。
なお、上述した各実施形態において、文章抽出部は、投稿メッセージ点数に基づいて代表メッセージを抽出する一例を示したが、所定時間内に繰り返し投稿される投稿メッセージの投稿回数に基づいて代表メッセージを抽出してもよいし、投稿メッセージ本文の文字数に基づいて代表メッセージを抽出してもよいし、これらの抽出手段のうちの複数を組み合わせて代表メッセージを抽出してもよい。
In each embodiment described above, an example has been described in which the text extraction unit calculates the element score by multiplying the number of appearances of each keyword by the weight of each keyword. However, the element score is not limited to this, for example, The weight given to the keyword and the number of appearances of the keyword may be used as the element score as they are.
In each of the embodiments described above, the sentence extraction unit has shown an example of extracting a representative message based on the number of posted messages, but the representative message is extracted based on the number of postings of posted messages that are repeatedly posted within a predetermined time. The representative message may be extracted based on the number of characters in the posted message body, or the representative message may be extracted by combining a plurality of these extraction means.
なお、上述した各実施形態における情報処理装置3、3A、3B、3Cの一部、または全部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、情報処理装置3、3A、3B、3Cに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。
In addition, you may make it implement | achieve a part or all of
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。 The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In such a case, a volatile memory inside a computer system that serves as a server or a client may be included that holds a program for a certain period of time.
また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。 The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
また、上述した実施形態における情報処理装置3、3A、3B、3Cの一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。情報処理装置3、3A、3B、3Cの各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
Moreover, you may implement | achieve part or all of the
以上、図面を参照してこの発明の各実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 As described above, the embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to that described above, and various design changes and the like can be made without departing from the scope of the present invention. It is possible to
(付記1)所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備えることを特徴とする情報処理装置。 (Additional remark 1) The keyword extraction part which extracts a keyword from the text posted within the predetermined time, the sentence extraction part which extracts the representative sentence from the group of the posted sentences, and the keyword extraction part extract An information processing apparatus comprising: a word order changing unit that rearranges the keywords in the order of words appearing in the representative sentence extracted by the sentence extracting unit.
(付記2)前記キーワード抽出部が抽出した前記キーワードのそれぞれに対して重みを付与する重み付け部をさらに備えることを特徴とする(付記1)に記載の情報処理装置。 (Appendix 2) The information processing apparatus according to (Appendix 1), further comprising a weighting unit that assigns a weight to each of the keywords extracted by the keyword extraction unit.
(付記3)前記文章抽出部は、前記重み付け部が重みを付与した前記キーワードに基づいて、前記代表文章を抽出することを特徴とする(付記2)に記載の情報処理装置。 (Additional remark 3) The said text extraction part extracts the said representative sentence based on the said keyword which the said weighting part gave the weight, The information processing apparatus as described in (Additional remark 2) characterized by the above-mentioned.
(付記4)投稿された前記文章の数を検出する検出部をさらに備え、前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出することを特徴とする(付記3)に記載の情報処理装置。 (Additional remark 4) The detection part which detects the number of the said posted sentences is further provided, and when the said detection part detects the number of the said sentence more than a predetermined number within the said predetermined time, the said keyword extraction part is the said The information processing apparatus according to (Appendix 3), wherein a keyword is extracted from the sentence posted within a predetermined time.
(付記5)所定時間内に投稿された文章からキーワードを抽出するキーワード抽出過程と、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、を有することを特徴とする情報処理方法。 (Supplementary Note 5) Keyword extraction process for extracting a keyword from sentences posted within a predetermined time, sentence extraction process for extracting representative sentences from a group of the posted sentences, and extraction by the keyword extraction process And a word order changing step of rearranging the keyword in the order of words appearing in the representative sentence extracted by the sentence extraction process.
(付記6)情報処理装置のコンピュータに、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、を実行させるための情報処理プログラム。 (Additional remark 6) The keyword extraction step which extracts a keyword from the text posted in the predetermined time in the computer of the information processing apparatus, and the text extraction step which extracts a representative text from the group of the posted text An information processing program for executing a word order changing step of rearranging the keywords extracted in the keyword extraction step in the order of words appearing in the representative sentence extracted in the sentence extraction step.
S1・・・情報処理システム、1・・・投稿端末装置、2・・・投稿サービスサーバ装置、3、3A、3B、3C・・・情報処理装置、4・・・電子機器、N1・・・ネットワーク、31・・・取得部、32・・・記憶部、33・・・検知部、34・・・抽出部、331・・・検出部、332・・・通知部、341・・・読み出し部、342、342A、342B、342C・・・解析部、3421・・・キーワード抽出部、3422、3422B・・・重み算出部、3423、3423B・・・重み付け部、3424、3424A、3424B・・・文章抽出部、3425、3425A、3425B・・・語順変更部、3426、3426A、3426B・・・出力部、3427C・・・フィルタ部
S1 ... Information processing system, 1 ... Posting terminal device, 2 ... Posting service server device, 3, 3A, 3B, 3C ... Information processing device, 4 ... Electronic equipment, N1 ...
Claims (6)
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出部と、
前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、
を備えることを特徴とする情報処理装置。 A keyword extraction unit that extracts keywords from sentences posted within a predetermined time;
A sentence extraction unit that extracts representative sentences from the group of the posted sentences;
A word order changing unit for rearranging the keywords extracted by the keyword extracting unit in the order of words appearing in the representative sentence extracted by the sentence extracting unit;
An information processing apparatus comprising:
をさらに備えることを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1, further comprising a weighting unit that assigns a weight to each of the keywords extracted by the keyword extraction unit.
を特徴とする請求項2に記載の情報処理装置。 The information processing apparatus according to claim 2, wherein the sentence extraction unit extracts the representative sentence based on the keyword given a weight by the weighting unit.
前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出すること
を特徴とする請求項1から請求項3のいずれか一項に記載の情報処理装置。 A detection unit for detecting the number of posted sentences;
The keyword extraction unit extracts a keyword from the sentence posted within the predetermined time when the detection unit detects the number of the sentences equal to or greater than a predetermined number within the predetermined time. The information processing apparatus according to any one of claims 1 to 3.
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出過程と、
前記キーワード抽出過程により抽出された前記キーワードを前記文章抽出過程により抽出された前記代表文章に出現する単語の順序に並びかえる語順変更過程と、
を有することを特徴とする情報処理方法。 A keyword extraction process to extract keywords from sentences posted within a predetermined time;
A sentence extraction process for extracting representative sentences from the group of the posted sentences;
A word order changing process for rearranging the keywords extracted in the keyword extraction process in the order of words appearing in the representative sentence extracted in the sentence extraction process;
An information processing method characterized by comprising:
所定時間内に投稿された文章からキーワードを抽出するキーワード抽出ステップと、
前記投稿された前記文章の一群から代表となる代表文章を抽出する文章抽出ステップと、
前記キーワード抽出ステップにより抽出された前記キーワードを前記文章抽出ステップにより抽出された前記代表文章に出現する単語の順序に並びかえる語順変更ステップと、
を実行させるための情報処理プログラム。 In the computer of the information processing device,
A keyword extraction step for extracting keywords from sentences posted within a predetermined time;
A sentence extraction step of extracting representative sentences from the group of the posted sentences;
A word order changing step of rearranging the keywords extracted in the keyword extraction step in the order of words appearing in the representative sentence extracted in the sentence extraction step;
Information processing program to execute.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013164522A JP5645233B1 (en) | 2013-08-07 | 2013-08-07 | Information processing apparatus, information processing method, and information processing program |
PCT/JP2014/066291 WO2015019723A1 (en) | 2013-08-07 | 2014-06-19 | Information processing device, information processing method, information processing program, information processing system, and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013164522A JP5645233B1 (en) | 2013-08-07 | 2013-08-07 | Information processing apparatus, information processing method, and information processing program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014220716A Division JP5818391B2 (en) | 2014-10-29 | 2014-10-29 | Information processing system and electronic device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5645233B1 JP5645233B1 (en) | 2014-12-24 |
JP2015035026A true JP2015035026A (en) | 2015-02-19 |
Family
ID=52139222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013164522A Expired - Fee Related JP5645233B1 (en) | 2013-08-07 | 2013-08-07 | Information processing apparatus, information processing method, and information processing program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5645233B1 (en) |
WO (1) | WO2015019723A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156196A (en) * | 2015-04-22 | 2016-11-23 | 富士通株式会社 | Extract the apparatus and method of text feature |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09190450A (en) * | 1996-01-09 | 1997-07-22 | Canon Inc | Information processor and its method |
WO2009101954A1 (en) * | 2008-02-15 | 2009-08-20 | Nec Corporation | Text information analysis system |
JP5474455B2 (en) * | 2009-09-07 | 2014-04-16 | 日本電信電話株式会社 | Document group processing apparatus, document group processing method, and document group processing program |
-
2013
- 2013-08-07 JP JP2013164522A patent/JP5645233B1/en not_active Expired - Fee Related
-
2014
- 2014-06-19 WO PCT/JP2014/066291 patent/WO2015019723A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2015019723A1 (en) | 2015-02-12 |
JP5645233B1 (en) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Koo | Development of a cell phone addiction scale for Korean adolescents | |
O'Sullivan | Linking online sexual activities to health outcomes among teens | |
Pearlman et al. | Hurricane Katrina's effect on the perception of New Orleans leisure tourists | |
CN103544954A (en) | Method and device for adding text label to voice message | |
JP2013206389A (en) | Intimacy calculation method, intimacy calculation program and intimacy calculation device | |
Freeman | Claims, frames, and blame: Coverage of climate change in ASEAN’s English-language newspapers, 2002-2012 | |
JP2016110213A (en) | Information processing device, information processing system, terminal device, information processing method, and information processing program | |
WO2012111226A1 (en) | Time-series document summarization device, time-series document summarization method and computer-readable recording medium | |
Alim | Analysis of tweets related to cyberbullying: Exploring information diffusion and advice available for cyberbullying victims | |
Onashoga et al. | Securix: A 3D game-based learning approach for phishing attack awareness | |
JP5645233B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6572218B2 (en) | Danger detection device, danger detection method, and danger detection program | |
Sheffer | New media, old ways: An analysis of sports media's depiction of female athletes on Instagram and Snapchat | |
Takata et al. | Confront phishing attacks—from a perspective of security education | |
JP5818391B2 (en) | Information processing system and electronic device | |
Sharma et al. | Digital literacy: A skill for survival | |
Maheswari | Frequency of using WhatsApp Messenger among college students in Salem district, TamilNadu | |
Herlina et al. | The influence of cybercrime against teenage angst in online media | |
Wang et al. | Ethnic digital media as agenda setters and agenda marketers: The case of WXC and the Jimmy Kimmel Live! controversy | |
Burch et al. | ‘Get back to the kitchen, cos u talk s*** on tv’: gendered online abuse and trigger events in sport | |
Helfrich et al. | No nos vamos, nos echan | |
Tassitano | More Than Ever, It Is Time to Ensure Regular Opportunities for Physical Activity Among Children and Adolescents: The Potential of Structured Settings | |
Obidi et al. | Cyber-Bullying: Assessment of its Awareness and Threats to Social Media Development | |
WO2012056775A1 (en) | Information-processing device, prompting method, and computer-readable recording medium | |
Ezeonyejiaku et al. | TACKLING SOCIAL MEDIA AND COVID-19 ISSUES IN NIGERIA: THE CASE OF FAKE NEWS AND MISCONCEPTIONS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5645233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |