WO2015019723A1 - 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器 - Google Patents

情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器 Download PDF

Info

Publication number
WO2015019723A1
WO2015019723A1 PCT/JP2014/066291 JP2014066291W WO2015019723A1 WO 2015019723 A1 WO2015019723 A1 WO 2015019723A1 JP 2014066291 W JP2014066291 W JP 2014066291W WO 2015019723 A1 WO2015019723 A1 WO 2015019723A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
keyword
posted
information processing
extracted
Prior art date
Application number
PCT/JP2014/066291
Other languages
English (en)
French (fr)
Inventor
大原 一人
向井 理朗
育雄 芥子
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Publication of WO2015019723A1 publication Critical patent/WO2015019723A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Definitions

  • the present invention relates to an information processing apparatus, an information processing method, an information processing program, an information processing system, and an electronic device.
  • An information processing apparatus extracts a keyword extraction unit that extracts a keyword from a sentence posted within a predetermined time, and extracts a representative sentence from a group of the posted sentences And a word order changing unit that rearranges the keywords extracted by the keyword extracting unit in the order of words appearing in the representative sentences extracted by the sentence extracting unit.
  • the information processing method includes a step of extracting a keyword from a sentence posted within a predetermined time, and a representative sentence that is representative from a group of the posted sentences. And a step of rearranging the extracted keywords in the order of words appearing in the extracted representative sentence.
  • FIG. 6 is an explanatory diagram illustrating an example of processing of the text extraction unit 3424, the word order change unit 3425, and the output unit 3426 according to the first embodiment of the present invention.
  • the processing content example Ex5 is an example of a keyword given a weight by the weighting unit 3423.
  • the text extracting unit 3424 calculates the element score of the posted message of the extracted frame based on the keyword given the weight by the weighting unit 3423. Specifically, the sentence extraction unit 3424 calculates the element score by multiplying the number of appearances of each keyword in the extracted frame counted by the weighting unit 3423 by the weight of each keyword.
  • the text extraction unit 3424 calculates the total sum of the calculated element scores as a posted message score for each posted message.
  • the word order changing unit 3425 generates keyword information by rearranging the word order of the keywords weighted by the weighting unit 3423 into the order of words appearing in the representative message.
  • the processing content example Ex8 is an example of keyword information generated by the word order changing unit 3425 and output from the output unit 3426 to the notification unit 332.
  • the word order changing unit 3425 changes the word order of each keyword to which the weight of the processing content example Ex5 is assigned, as in the processing content example Ex8, using the keywords “End of game”, “Japan”, “5-3”, “Thai”, Rearrange with “Victory” to generate keyword information.
  • step ST103 the weighting unit 3423 assigns a weight for each keyword calculated by the weight calculation unit 3422 to each keyword extracted by the keyword extraction unit 3421.
  • step ST104 the text extraction unit 3424 calculates the element score and the posted message score from the weight for each keyword and the number of appearances of the keyword, and extracts the representative message based on the calculation result.
  • the sentence extraction unit 3424A obtains the number of posted messages from the posted message texts of a plurality of posted messages included in the posted message information input from the reading unit 341 based on the weighted keyword input from the weighting unit 3423. Is calculated.
  • the posted message score is calculated from the weight assigned to the keyword and the number of appearances of the keyword counted for each posted message.
  • the text extraction unit 3424A extracts a posted message having the highest posted message score from a plurality of posted messages as a first representative message based on the calculated posted message score.
  • the sentence extracting unit 3424A outputs the extracted representative message to the word order changing unit 3425A.
  • the text extracting unit 3424A extracts a posted message having the second highest posted message score from the plurality of posted messages as a second representative message based on the calculated posted message score.
  • the sentence extracting unit 3424 outputs the extracted representative message to the word order changing unit 3425A.
  • the word order changing unit 3425B rearranges the word order of the keywords (processing content example Ex22) that are not excluded from the keywords weighted by the weighting unit 3423B to the order of the words appearing in the second representative message.
  • Keyword information is generated.
  • the processing content example Ex24 is an example of keyword information generated by the word order changing unit 3425B and output from the output unit 3426B to the notification unit 332.
  • the word order changing unit 3425B sets the keywords “Earthquake Early Warning” and “Don't worry about tsunami” as in the case of the processing content example Ex24.
  • the keyword information is generated by rearranging based on the representative message.
  • the keywords extracted by the keyword extraction unit 3421 are rearranged in the order of words appearing in the first representative message and the second representative message extracted by the text extraction unit 3424B, and the first representative message is sorted.
  • the rearranged keywords such as the processing content example Ex25 can be rearranged without duplication. .
  • the “computer-readable recording medium” means a storage device such as a flexible disk, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system.
  • the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In such a case, a volatile memory inside a computer system serving as a server or a client may be included and a program that holds a program for a certain period of time.
  • the program may be a program for realizing a part of the above-described functions, and may be a program that can realize the above-described functions in combination with a program already recorded in a computer system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 本発明の一態様に係る情報処理装置は、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備える。

Description

情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器
 本発明は、情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器に関する。
 本願は、2013年8月7日に、日本に出願された特願2013-164522号に基づき優先権を主張し、その内容をここに援用する。
 放映中のテレビ番組をTwitter(登録商標)などへの投稿メッセージ数から盛り上がり度合を算出して、当該盛り上がり度合をユーザに通知するものがある(非特許文献1参照)。ここで、盛り上がりとは、現在時刻の投稿メッセージ数が所定数を越え、かつ同時刻の過去の投稿メッセージ数よりも現在時刻の投稿メッセージ数が多い状態のことである。また、録画したテレビ番組を効率よく楽しむために、テレビ番組に関連する投稿メッセージ数の変動から重要シーンを自動的に検出し、投稿メッセージの内容から各シーンでの主要人物とイベント内容とを推定し、シーンを表すラベルとして付与するものがある(非特許文献2参照)。
"おしえてリモコン"、[online]、シャープ株式会社、[平成25年7月1日検索]、インターネット<URL:https://play.google.com/store/apps/details?id=jp.co.sharp.clpf.android.cloudremocon> 中澤昌美、帆足啓一郎、小野智弘、"Twitterによるテレビ番組重要シーン検出及びラベル付与手法"、Proceedings of the 3rd Forum on Data Engineering and Information Management、F5-6、2011年2月.
 しかしながら、非特許文献1に記載の技術を用いても、盛り上がり度合をユーザに通知しても、盛り上がりが発生した理由がわからないという欠点があった。また、非特許文献2に記載の技術を用いても、主要人物と関連しないイベントの内容などを推定できない。このように、盛り上がりを通知するときのユーザの利便性が十分でない。
 本発明は、盛り上がりを通知するときのユーザの利便性を向上させることができる情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器を提供することを一目的とする。
 (1)本発明の第一の態様に係る情報処理装置は、所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備える。
 (2)また、本発明の第二の態様に係る情報処理方法は、所定時間内に投稿された文章からキーワードを抽出するステップと、前記投稿された文章の一群から代表となる代表文章を抽出するステップと、前記抽出されたキーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、を有する。
 (3)また、本発明の第三の態様に係る情報処理プログラムは、所定時間内に投稿された文章からキーワードを抽出するステップと、前記投稿された文章の一群から代表となる代表文章を抽出するステップと、前記抽出されたキーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、を情報処理装置のコンピュータに実行させるための情報処理プログラムである。
 (4)また、本発明の第四の態様に係る情報処理システムは、第1情報処理装置と、前記第1情報処理装置と接続可能な第2情報処理装置と、を備える。前記第1情報処理装置は、所定時間内に投稿された文章からキーワードを抽出し、前記投稿された文章の一群から代表となる代表文章を抽出し、前記抽出したキーワードを前記抽出した代表文章に出現する単語の順序に並びかえる。前記第2情報処理装置は、前記第1情報処理装置から前記並び替えられたキーワードを取得する。
 (5)また、本発明の第五の態様に係る電子機器は、所定時間内に投稿された文書から抽出されたキーワードを表示する表示部を備え、前記キーワードは、前記投稿された文書の一群から抽出された代表となる代表文章に出現する順序に並び替えられている。
 本発明の態様に係る情報処理装置、情報処理方法、情報処理プログラムによれば、盛り上がりを通知するときのユーザの利便性を向上させることができる。
本発明の第1の実施形態に係る情報処理システムの構成の一例を示す概略図である。 本発明の第1の実施形態に係る情報処理装置の構成の一例を示す概略ブロック図である。 本発明の第1の実施形態に係る検知部および抽出部の構成の一例を示す概略図である。 本発明の第1の実施形態に係る解析部の構成の一例を示す概略ブロック図である。 本発明の第1の実施形態に係るキーワード抽出部、重み算出部および重み付け部の処理の一例を説明する説明図である。 本発明の第1の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。 本発明の第1の実施形態に係る解析部の処理の一例を示すフローチャートである。 本発明の第2の実施形態に係る解析部の構成の一例を示す概略ブロック図である。 本発明の第2の実施形態に係るキーワード抽出部、重み算出部および重み付け部の処理の一例を説明する説明図である。 本発明の第2の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。 本発明の第3の実施形態に係る解析部の構成の一例を示す概略ブロック図である。 本発明の第3の実施形態に係る文章抽出部、語順変更部および出力部の処理の一例を説明する説明図である。 本発明の第4の実施形態に係る解析部の構成の一例を示す概略ブロック図である。
(第1の実施形態)
 以下、図面を参照しながら本発明の第1の実施形態について詳述する。
 図1は、本発明の第1の実施形態に係る情報処理システムS1の構成の一例を示す概略図である。
 情報処理システムS1は、投稿端末装置1と、投稿サービスサーバ装置2と、情報処理装置3と、電子機器4と、を含んで構成される。投稿端末装置1と投稿サービスサーバ装置2と情報処理装置3と電子機器4とのそれぞれは、ネットワークN1を介して有線または無線で通信を行う。
 投稿端末装置1は、例えば、PC(パーソナルコンピュータ:Personal Computer)であり、ユーザからメッセージの入力を受け付ける。投稿サービスサーバ装置2は、例えば、ソーシャルメディアサーバ装置である。ここで、ソーシャルメディアとは、個人と個人、個人と組織、組織と組織の間の情報発信が、ウェブサービスを経由することによってそれ自体が意味を持つコミュニティとなり、実社会に広く拡散されて影響力を持ち始めたメディアサービスであり、例えば、ブログやミニブログ、電子掲示板、ソーシャルネットワークサービス、投稿サービスなどである。
 ユーザは、投稿端末装置1を利用して、メッセージを投稿サービスサーバ装置2に投稿する。なお、以下の説明において、投稿サービスサーバ装置2に投稿されたメッセージを投稿メッセージと称する。
 情報処理装置3は、ネットワークN1を介し、投稿サービスサーバ装置2から投稿メッセージを取得する。そして、情報処理装置3は、所定時間内の複数の投稿メッセージから複数のキーワードを抽出し、複数の投稿メッセージから代表となる代表メッセージを抽出する。情報処理装置3は、抽出した複数のキーワードを、代表メッセージに出現する単語の順序に並び替え、ネットワークN1を介して電子機器4に送信する。電子機器4の表示部41は、代表メッセージの順序に並び替えられたキーワードを表示する。
 電子機器4は、例えば、PCや、電話やメール機能の他にPDA(携帯情報端末)の機能が付いた多機能携帯電話機(スマートフォン)や、タブレットPCなどである。
 図2は、本発明の第1の実施形態に係る情報処理装置3の構成の一例を示す概略ブロック図である。
 情報処理装置3は、取得部31と、記憶部32と、検知部33と、抽出部34とを含んで構成される。
 取得部31は、投稿サービスサーバ装置2から複数の投稿メッセージ情報を、API(Application Program Interface:エーピーアイ)を利用して取得する。当該投稿メッセージ情報には、投稿メッセージのメッセージ本文と当該メッセージが投稿サービスサーバ装置2に投稿された時刻とが含まれる。取得部31は、取得した投稿メッセージ情報を記憶部32に記憶させ、記憶部32は、当該投稿メッセージ情報を記憶する。
 検知部33は、所定時間内の投稿メッセージの件数を検出し、検出結果に基づいて抽出部34を動作させる。また、検知部33は、検出結果と後述する抽出部34から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に送信する。詳細な検知部33の処理は後述する。
 抽出部34は、投稿メッセージから複数のキーワードを抽出する。抽出部34は、抽出した複数のキーワードを並び替えてキーワード情報を生成する。抽出部34は、生成したキーワード情報を検知部33に出力する。詳細な抽出部34の処理は後述する。
 図3は、本発明の第1の実施形態に係る検知部33および抽出部34の構成の一例を示す概略図である。
 検知部33は、検出部331と、通知部332と、を含んで構成される。
 検出部331は、所定時間内の投稿メッセージの件数を検出し、当該所定時間内に検出した投稿メッセージの件数が所定の数以上である場合に、盛り上がりとして検出し、抽出部34を動作させる。また、検出部331は、検出した盛り上がりを表す盛り上がり情報を通知部332に出力する。
 通知部332は、検出部331から入力された盛り上がり情報と解析部342から入力されるキーワード情報とを、ネットワークN1を介して電子機器4に通知する。
 抽出部34は、読み出し部341と、解析部342と、を含んで構成される。
 読み出し部341は、検出部331が盛り上がりを検出すると、記憶部32から所定時間内の投稿メッセージ情報を読み出し、当該投稿メッセージ情報を解析部342に出力する。
 解析部342は、投稿メッセージ情報に含まれる投稿メッセージ本文から複数のキーワードを抽出する。解析部342は、例えば、公知の手段を利用してキーワードを抽出する。解析部342は、抽出したキーワードに基づいて代表メッセージを抽出する。そして、解析部342は、抽出した複数のキーワードを、代表メッセージ本文に出現する単語の順序に並び替えてキーワード情報を生成する。解析部342は、生成したキーワード情報を通知部332に出力する。詳細な解析部342の処理は後述する。
 図4は、本発明の第1の実施形態に係る解析部342の構成の一例を示す概略ブロック図である。
 解析部342は、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、を含んで構成される。
 キーワード抽出部3421は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文からキーワードを抽出する。キーワード抽出部3421は、抽出したキーワードを重み算出部3422に出力する。
 重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージごとに計数する。また、重み算出部3422は、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422は、集計したキーワードに対する重みを算出する。重み算出部3422は、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422が算出した重みと、を重み付け部3423に出力する。また、重み算出部3422は、計数したキーワードの出現回数を文章抽出部3424に出力する。
 重み付け部3423は、重み算出部3422から入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423は、重みを付与したキーワードを文章抽出部3424および語順変更部3425に出力する。
 文章抽出部3424は、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。ここで、投稿メッセージ点数とは、要素点数の総和であり、要素点数とは、各キーワードの出現回数に各キーワードの重みを乗算することで算出される点数である。文章抽出部3424は、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、代表となる代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425に出力する。
 語順変更部3425は、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424から入力された代表メッセージとに基づいて、重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425は、生成したキーワード情報を出力部3426に出力する。
 出力部3426は、語順変更部3425から入力されたキーワード情報を通知部332に出力する。
 図5は、本発明の第1の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
 処理内容例Ex1において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「[ABC開幕戦日本vsタイ]試合終了日本5-3タイ日本代表苦しみながらも見事逆転勝利!」から「ABC開幕戦」、「日本vsタイ」、「試合終了」、「日本」、「5-3」、「タイ」、「日本代表」、「苦しい」、「見事」、「逆転勝利」の各キーワードを抽出する。
 重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージごとに計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「ABC開幕戦[1]」、「日本vsタイ[1]」、「試合終了[1]」、「日本[1]」、「5-3[1]」、「タイ[1]」、「日本代表[1]」、「苦しい[1]」、「見事[1]」、「逆転勝利[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。
 重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex2において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「勝つ[31]」、「日本代表チーム[22]」、「日本[14]」、「試合終了[13]」、「タイ[7]」、「勝利[6]」、「初戦[5]」、「5-3[5]」、「苦しい[4]」、「日本勝利[4]」、・・・、と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。
 重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex3において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「勝つ[5]」、「日本代表チーム[46]」、「日本[4]」、「試合終了[0]」、「タイ[3]」、「勝利[0]」、「初戦[0]」、「5-3[1]」、「苦しい[0]」、「日本勝利[0]」、・・・、と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。
 重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、式(1)により算出する。
Figure JPOXMLDOC01-appb-M000001
 
 ここで、Weight(w)は、キーワードごとの重みを表す。また、r(w)、r10(w)は、式(2)、式(3)により算出する。
Figure JPOXMLDOC01-appb-M000002
 
Figure JPOXMLDOC01-appb-M000003
 
 ここで、r(w)、r10(w)は、抽出フレームにおける各キーワードの出現率、参照フレームにおける各キーワードの出現率をそれぞれ表し、x(w)、x10(w)は、抽出フレームにおける各キーワードが出現する投稿メッセージの件数、参照フレームにおける各キーワードが出現する投稿メッセージの件数をそれぞれ表す。また、N、N10は、抽出フレームにおける投稿メッセージの総数、参照フレームにおける投稿メッセージの総数をそれぞれ表す。
 重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex4のようにキーワードに対して重みを付与する。
 例えば、重み付け部3423は、「試合終了 3.10」、「勝つ 1.69」、「勝利 0.71」、「初戦 0.51」、「日本 0.45」、「苦しい 0.34」、「日本勝利 0.34」、「5-3 0.26」、「タイ 0.14」、「日本代表チーム 0.13」のように、キーワードに対して重みを付与する。
 これにより、参照フレームにおける投稿メッセージによく出現するキーワードには、低い重みが付与され、参照フレームにおける投稿メッセージに出現しにくい(出現しない)キーワードには、高い重みが付与される。この例では、「試合終了」、「勝利」、「初戦」などのキーワードの重みが高くなり、「日本代表チーム」に対する重みは低くなる。
 図6は、本発明の第1の実施形態に係る文章抽出部3424、語順変更部3425および出力部3426の処理の一例を説明する説明図である。
 処理内容例Ex5は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424は、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424は、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424は、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
 処理内容例Ex6において、文章抽出部3424は、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位5つの投稿メッセージを抽出する。そして、文章抽出部3424は、上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、代表メッセージとして抽出する。
 例えば、文章抽出部3424は、処理内容例Ex7のように、投稿メッセージ「ABC試合終了 予選ラウンド 日本5-3タイ ※7回表、日本が一挙3点を取り逆転、開幕戦に勝利」を、代表メッセージとして抽出する。
 語順変更部3425は、重み付け部3423により重みが付与されたキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex8は、語順変更部3425により生成され、出力部3426から通知部332に出力されるキーワード情報の一例である。
 語順変更部3425は、処理内容例Ex5の重みが付与された各キーワードの語順を、処理内容例Ex8のように、キーワード「試合終了」、「日本」、「5-3」、「タイ」、「勝利」と並び替えて、キーワード情報を生成する。
 図7は、本発明の第1の実施形態に係る解析部342の処理の一例を示すフローチャートである。
 ステップST101において、キーワード抽出部3421は、抽出フレームにおける投稿メッセージのそれぞれからキーワードを抽出する。
 ステップST102において、重み算出部3422は、抽出フレームにおける投稿メッセージのキーワードの出現率と、参照フレームにおける投稿メッセージのキーワードの出現率とから、キーワードごとの重みを算出する。
 ステップST103において、重み付け部3423は、キーワード抽出部3421が抽出した各キーワードに対して、重み算出部3422が算出したキーワードごとの重みを付与する。
 ステップST104において、文章抽出部3424は、キーワードごとの重みと、キーワードの出現回数とから要素点数および投稿メッセージ点数を算出し、算出結果に基づいて、代表メッセージを抽出する。
 ステップST105において、語順変更部3425は、キーワード抽出部3421が抽出したキーワードの語順を、代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。
 このように、本実施形態によれば、情報処理装置3は、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424と、キーワード抽出部3421が抽出したキーワードを文章抽出部3424が抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。
 これにより、情報処理装置3は、投稿された複数の文章に対してキーワードの抽出を行い、抽出したキーワードを代表文章に出現する単語の語順に並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3は、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。
(第2の実施形態)
 以下、図面を参照しながら本発明の第2の実施形態について詳しく説明する。
 図8は、本発明の第2の実施形態に係る解析部342Aの構成の一例を示す概略ブロック図である。
 解析部342Aは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424Aと、語順変更部3425Aと、出力部3426Aと、を含んで構成される。第1の実施形態に係る解析部342と第2の実施形態に係る解析部342Aとを比較すると、文章抽出部3424A、語順変更部3425Aおよび出力部3426Aが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
 文章抽出部3424Aは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423から入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Aは、抽出した代表メッセージを、語順変更部3425Aに出力する。次いで、文章抽出部3424Aは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424は、抽出した代表メッセージを、語順変更部3425Aに出力する。
 語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423から入力された重みが付与されたキーワードと文章抽出部3424Aから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Aは、生成したキーワード情報を出力部3426Aに出力する。
 出力部3426Aは、語順変更部3425Aから入力されたキーワード情報を通知部332に出力する。
 図9は、本発明の第2の実施形態に係るキーワード抽出部3421、重み算出部3422および重み付け部3423の処理の一例を説明する説明図である。
 処理内容例Ex9において、キーワード抽出部3421は、投稿メッセージ情報に含まれる複数の投稿メッセージ本文からキーワードをそれぞれ抽出する。例えば、キーワード抽出部3421は、投稿メッセージ「緊急地震速報が鳴る→起こされる→揺れが始まる→A放送局で諸々チェック中。」から「緊急地震速報」、「鳴る」、「起こされる」、「揺れ」、「始まる」、「A放送局」、「諸々チェック中」の各キーワードを抽出する。
 重み算出部3422は、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージについて計数する。例えば、重み算出部3422は、抽出した各キーワードの出現回数を、「緊急地震速報[1]」、「鳴る[1]」、「起こされる[1]」、「揺れ[1]」、「始まる[1]」、「A放送局[1]」、「諸々チェック中[1]」と計数する。ここで、各キーワードに付与された[]内の数字は、当該キーワードの出現回数を表す。
 重み算出部3422は、所定時間内(例えば、1分間)の投稿メッセージを抽出フレームとし、当該抽出フレームの投稿メッセージに対してキーワードを集計する。処理内容例Ex10において、例えば、重み算出部3422は、抽出フレームにおけるキーワードを、「津波の心配[40]」、「地震[18]」、「見る[16]」、「つける[15]」、「□□大島[14]」、「震度5強[12]」、「緊急地震速報[8]」、・・・と集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する抽出フレームにおける投稿メッセージの件数を表す。
 重み算出部3422は、所定時間内(例えば、10分間)の投稿メッセージを参照フレームとし、当該参照フレームの投稿メッセージから、抽出フレームにおいて抽出された各キーワードと同様のキーワードを抽出し、集計する。処理内容例Ex11において、例えば、重み算出部3422は、参照フレームにおける各キーワードを、「津波の心配[21]」、「地震[34]」、「見る[36]」、「つける[61]」、「□□大島[59]」、「震度5強[39]」、「緊急地震速報[22]」、・・・と抽出し、集計する。ここで、各キーワードに付与された[]内の数字は、当該キーワードが出現する参照フレームにおける投稿メッセージの件数を表す。
 重み算出部3422は、抽出フレームにおける投稿メッセージの件数と参照フレームにおける投稿メッセージの件数とに基づいて、キーワードごとの重みを、上述の式(1)により算出する。
 重み付け部3423は、重み算出部3422が式(1)により算出したキーワードごとの重みを、処理内容例Ex12のようにキーワードに対して重み付けを行う。
 例えば、重み付け部3423は、「津波の心配 0.35」、「地震 0.05」、「見る 0.03」、「震度5強 0.02」、「つける 0.02」、「□□大島 0.02」、「緊急地震速報 0.01」、・・・のようにキーワードに対して重みを付与する。
 図10は、本発明の第2の実施形態に係る文章抽出部3424A、語順変更部3425Aおよび出力部3426Aの処理の一例を説明する説明図である。
 処理内容例Ex13は、重み付け部3423により重みが付与されたキーワードの一例である。文章抽出部3424Aは、重み付け部3423により重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Aは、重み付け部3423が計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Aは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
 処理内容例Ex14において、文章抽出部3424Aは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、所定数、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
 例えば、文章抽出部3424Aは、処理内容例Ex15のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
 また、文章抽出部3424Aは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が2番目に高い投稿メッセージを、第2の代表メッセージとして抽出する。
 例えば、文章抽出部3424Aは、処理内容例Ex16のように、投稿メッセージ「大丈夫ですか?いまテレビで、津波の心配はないと言っていました。震度5強は怖いっす…」を、第2の代表メッセージとして抽出する。
 語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、1行目のキーワード情報を生成する。次いで、語順変更部3425Aは、重み付け部3423により重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えて、2行目のキーワード情報を生成する。例えば、処理内容例Ex17は、語順変更部3425Aにより生成され、出力部3426Aから通知部332に出力されるキーワード情報の一例である。
 語順変更部3425Aは、処理内容例Ex13のような重みが付与された各キーワードの語順を、第1の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と並び替え、改行して、2行目に、第2の代表メッセージに基づいて処理内容例Ex17に示すように、キーワード「津波の心配」、「震度5強」と、並び替えて、キーワード情報を生成する。
 このように、本実施形態によれば、情報処理装置3Aは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Aと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Aが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Aと、を備える。
 これにより、情報処理装置3Aは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに変化する投稿メッセージの話題性を追従することができる。また、情報処理装置3Aは、当該話題性の追従により、盛り上がりの理由をユーザに対して通知することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。
(第3の実施形態)
 以下、図面を参照しながら本発明の第3の実施形態について詳しく説明する。
 図11は、本発明の第3の実施形態に係る解析部342Bの構成の一例を示す概略ブロック図である。
 解析部342Bは、キーワード抽出部3421と、重み算出部3422Bと、重み付け部3423Bと、文章抽出部3424Bと、語順変更部3425Bと、出力部3426Bと、を含んで構成される。第1の実施形態に係る解析部342と第3の実施形態に係る解析部342Bとを比較すると、重み算出部3422B、重み付け部3423B、文章抽出部3424B、語順変更部3425Bおよび出力部3426Bが異なる。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
 重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードの出現回数を、投稿メッセージごとに計数する。また、重み算出部3422Bは、投稿メッセージごとに計数したキーワードの出現回数を、所定時間内の投稿メッセージについて集計する。そして、重み算出部3422Bは、集計したキーワードに対する重みを算出する。重み算出部3422Bは、キーワード抽出部3421が抽出したキーワードと、当該キーワードに対して重み算出部3422Bが算出した重みと、を重み付け部3423Bに出力する。
 そして、重み算出部3422Bは、語順変更部3425Bからキーワード情報が入力されると、当該キーワード情報に含まれるキーワードに対する重みを除外する。重み算出部3422Bは、キーワード抽出部3421から入力されたキーワードから、語順変更部3425Bから入力されたキーワード情報に含まれるキーワードに対する重みを除外したキーワードと、当該キーワードに対する重みとを重み付け部3423Bに出力する。
 重み付け部3423Bは、重み算出部3422Bから入力されたキーワードと当該キーワードに対する重みとに基づいて、当該キーワードに対して重みを付与する。重み付け部3423Bは、重みを付与したキーワードを文章抽出部3424Bおよび語順変更部3425Bに出力する。
 文章抽出部3424Bは、読み出し部341から入力された投稿メッセージ情報に含まれる複数の投稿メッセージのそれぞれの投稿メッセージ本文から、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を算出する。当該投稿メッセージ点数は、キーワードに付与された重みと投稿メッセージごとに計数したキーワードの出現回数とから算出される。まず、文章抽出部3424Bは、算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第1の代表メッセージを、語順変更部3425Bに出力する。また、文章抽出部3424Bは、重み付け部3423Bから入力された重みが付与されたキーワードに基づいて投稿メッセージ点数を、再度、算出する。そして、文章抽出部3424Bは、再度算出した投稿メッセージ点数に基づいて、複数の投稿メッセージから第1の代表メッセージ以外であって、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。文章抽出部3424Bは、抽出した第2の代表メッセージを、語順変更部3425Bに出力する。
 語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第1の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。次いで、語順変更部3425Bは、重み付け部3423Bから入力された重みが付与されたキーワードと文章抽出部3424Bから入力された第2の代表メッセージとに基づいて、重みが付与されたキーワードの語順を、第2の代表メッセージに出現する単語の順序に並び替えてキーワード情報を生成する。語順変更部3425Bは、生成したキーワード情報を、重み算出部3422Bおよび出力部3426Bに出力する。
 出力部3426Bは、語順変更部3425Bから入力されたキーワード情報を通知部332に出力する。
 図12は、本発明の第3の実施形態に係る文章抽出部3424B、語順変更部3425Bおよび出力部3426Bの処理の一例を説明する説明図である。
 処理内容例Ex18は、重み付け部3423Bにより重みが付与されたキーワードの一例である。
 文章抽出部3424Bは、重み付け部3423Bにより重みが付与されたキーワードに基づいて、抽出フレームの投稿メッセージの要素点数を算出する。具体的には、文章抽出部3424Bは、重み付け部3423Bが計数した抽出フレームにおける各キーワードの出現回数に各キーワードの重みを乗算することで要素点数を算出する。文章抽出部3424Bは、算出した要素点数の総和を、投稿メッセージごとに投稿メッセージ点数として算出する。
 処理内容例Ex19において、文章抽出部3424Bは、抽出フレームにおける各投稿メッセージを、投稿メッセージ点数が高い順に並び替え、例えば、上位の5つの投稿メッセージを抽出する。そして、文章抽出部3424Bは、当該上位5つの投稿メッセージのうち、算出した投稿メッセージ点数が最も高い投稿メッセージを、第1の代表メッセージとして抽出する。
 例えば、文章抽出部3424Bは、処理内容例Ex20のように、投稿メッセージ「5時33分ごろ、XX県のYY灘を震源とする非常に強い地震。□□大島で震度5強。この地震による津波の心配はありません。」を、第1の代表メッセージとして抽出する。
 語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードの語順を、第1の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex21は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
 語順変更部3425Bは、処理内容例Ex18のような重みが付与された各キーワードの語順を、処理内容例Ex21のように、キーワード「地震」、「□□大島」、「震度5強」、「津波の心配」と、第1の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
 次いで、重み算出部3422Bは、重み付け部3423Bにより重みが付与されたキーワード(処理内容例Ex18)から、語順変更部3425Bが生成したキーワード情報に含まれるキーワード(処理内容例Ex21)を除外する。その結果、例えば、重み付け部3423Bにより重みが付与されたキーワードのうち、除外されなかったキーワードは、処理内容例Ex22のように、「見る 0.03」、「つける 0.02」、「緊急地震速報 0.01」、「津波は心配ない 0.01」となる。
 文章抽出部3424Bは、上位5つの投稿メッセージのうち、第1の代表メッセージ以外で、投稿メッセージ点数が最も高い投稿メッセージを、第2の代表メッセージとして抽出する。
 例えば、文章抽出部3424Bは、処理内容例Ex23のように、投稿メッセージ「緊急地震速報!こんな朝方。津波は心配ないって、A放送局で言ってる」を、第2の代表メッセージとして抽出する。
 次いで、語順変更部3425Bは、重み付け部3423Bにより重みが付与されたキーワードのうち、除外されなかったキーワード(処理内容例Ex22)の語順を、第2の代表メッセージに出現する単語の順序に並び替えて、キーワード情報を生成する。例えば、処理内容例Ex24は、語順変更部3425Bにより生成され、出力部3426Bから通知部332に出力されるキーワード情報の一例である。
 語順変更部3425Bは、処理内容例Ex22のような重みが付与された各キーワードの語順を、処理内容例Ex24のように、キーワード「緊急地震速報」、「津波は心配ない」と、第2の代表メッセージに基づいて並び替えて、キーワード情報を生成する。
 このように、キーワード抽出部3421が抽出したキーワードを、文章抽出部3424Bが抽出した第1の代表メッセージと第2の代表メッセージとのそれぞれに出現する単語の順序に並び替え、第1の代表メッセージと第2の代表メッセージとで重複するキーワードを選択しないように、キーワードに対する重みの算出を繰り返すことで、処理内容例Ex25のような、並び替えられたキーワードが重複することなく並び替えることができる。
 このように、本実施形態によれば、情報処理装置3Bは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(第1の代表メッセージ、第2の代表メッセージ)を抽出する文章抽出部3424Bと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Bが抽出した代表文章(第1の代表メッセージ、第2の代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425Bと、を備える。
 これにより、情報処理装置3Bは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Bは、当該話題の移り変わりを抽出することにより、盛り上がりの理由をユーザが認識することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。
(第4の実施形態)
 以下、図面を参照しながら本発明の第4の実施形態について詳しく説明する。
 図13は、本発明の第4の実施形態に係る解析部342Cの構成の一例を示す概略ブロック図である。
 解析部342Cは、キーワード抽出部3421と、重み算出部3422と、重み付け部3423と、文章抽出部3424と、語順変更部3425と、出力部3426と、フィルタ部3427Cと、を含んで構成される。第1の実施形態に係る解析部342と第4の実施形態に係る解析部342Cとを比較すると、フィルタ部3427Cが追加されている。それ以外の構成は、第1の実施形態と同様であるため、同一の符号を付して説明を省略する。
 フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対してフィルタ処理を行う。具体的には、フィルタ部3427Cは、読み出し部341から入力される投稿メッセージ情報に対して、例えば、放送局、チャンネル、番組などの識別情報によりフィルタ処理を行い、放送局ごと、チャンネルごと、番組ごとの投稿メッセージ情報を抽出する。フィルタ部3427Cは、抽出した投稿メッセージ情報をキーワード抽出部3421および文章抽出部3424に出力する。
 このように、本実施形態によれば、情報処理装置3Cは、所定時間内に投稿された文章(投稿メッセージ)からキーワードを抽出するキーワード抽出部3421と、投稿された文章(投稿メッセージ)の一群(抽出フレームにおける投稿メッセージ)から代表となる代表文章(代表メッセージ)を抽出する文章抽出部3424Cと、キーワード抽出部3421が抽出したキーワードを文章抽出部3424Cが抽出した代表文章(代表メッセージ)に出現する単語の順序に並びかえる語順変更部3425と、を備える。
 これにより、情報処理装置3Cは、投稿された複数の文章に対してキーワードの抽出を行い、代表文章に出現する単語の順序に抽出したキーワードを並び替えることができるため、時間経過とともに放送局、チャンネル、番組ごとの投稿メッセージの話題の移り変わりを抽出することができる。また、情報処理装置3Cは、当該放送局、チャンネル、番組ごとの話題の移り変わりを抽出することにより、盛り上がりの理由をユーザが認識することが可能となるため、盛り上がりをユーザに通知するときの利便性を向上させることができる。
 なお、上述した各実施形態において、第4の実施形態のようにフィルタ部3427Cを備え、投稿メッセージ情報に対してフィルタ処理を行うことで、任意の投稿メッセージを抽出するようにしてもよい。
 なお、上述した各実施形態において、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との比からキーワードごとの重みを算出したが、抽出フレームにおけるキーワードの出現率と参照フレームにおけるキーワードの出現率との差から重みを算出してもよい。
 なお、上述した各実施形態において、抽出したキーワードを代表メッセージに出現する単語の順序に並び替えると説明したが、代表メッセージをそのまま通知してもよい。
 なお、上述した各実施形態において、1つまたは2つの代表メッセージを抽出して、キーワードの並び替えると説明したが、3つ以上の代表メッセージを抽出してキーワードを並び替えてもよい。
 なお、上述した各実施形態において、文章抽出部が要素点数として、各キーワードの出現回数に各キーワードの重みを乗算することで算出する一例について説明したが、要素点数は、これに限らず、例えば、キーワードに付与された重みやキーワードの出現回数をそのまま要素点数としてもよい。
 なお、上述した各実施形態において、文章抽出部は、投稿メッセージ点数に基づいて代表メッセージを抽出する一例を示したが、所定時間内に繰り返し投稿される投稿メッセージの投稿回数に基づいて代表メッセージを抽出してもよいし、投稿メッセージ本文の文字数に基づいて代表メッセージを抽出してもよいし、これらの抽出手段のうちの複数を組み合わせて代表メッセージを抽出してもよい。
 なお、上述した各実施形態における情報処理装置3、3A、3B、3Cの一部、または全部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、情報処理装置3、3A、3B、3Cに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。
 また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。
 また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
 また、上述した実施形態における情報処理装置3、3A、3B、3Cの一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。情報処理装置3、3A、3B、3Cの各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
 以上、図面を参照してこの発明の各実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
 (付記1)所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、前記投稿された文章の一群から代表となる代表文章を抽出する文章抽出部と、前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、を備える情報処理装置。
 (付記2)前記キーワード抽出部が抽出した前記キーワードのそれぞれに対して重みを付与する重み付け部をさらに備える(付記1)に記載の情報処理装置。
 (付記3)前記文章抽出部は、前記重み付け部が重みを付与した前記キーワードに基づいて、前記代表文章を抽出する(付記2)に記載の情報処理装置。
 (付記4)前記投稿された文章の数を検出する検出部をさらに備え、前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出する(付記3)に記載の情報処理装置。
 (付記5)所定時間内に投稿された文章からキーワードを抽出するステップと、前記投稿された文章の一群から代表となる代表文章を抽出するステップと、前記抽出された前記キーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、を有する情報処理方法。
 (付記6)情報処理装置のコンピュータに、所定時間内に投稿された文章からキーワードを抽出するステップと、前記投稿された文章の一群から代表となる代表文章を抽出するステップと、前記抽出されたキーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、を実行させるための情報処理プログラム。
 (付記7)第1情報処理装置と、前記第1情報処理装置と接続可能な第2情報処理装置と、を備え、前記第1情報処理装置は、所定時間内に投稿された文章からキーワードを抽出し、前記投稿された文章の一群から代表となる代表文章を抽出し、前記抽出したキーワードを前記抽出した代表文章に出現する単語の順序に並びかえ、前記第2情報処理装置は、前記第1情報処理装置から前記並び替えられたキーワードを取得する、情報処理システム。
 (付記8)所定時間内に投稿された文書から抽出されたキーワードを表示する表示部を備え、前記キーワードは、前記投稿された文書の一群から抽出された代表となる代表文章に出現する順序に並び替えられている、電子機器。
 本発明は、携帯電話、パーソナルコンピュータ、タブレット型コンピュータなどに適用できる。
 S1  情報処理システム
 1  投稿端末装置
 2  投稿サービスサーバ装置
 3、3A、3B、3C  情報処理装置
 4  電子機器
 N1  ネットワーク
 31  取得部
 32  記憶部
 33  検知部
 34  抽出部
 331  検出部
 332  通知部
 341  読み出し部
 342、342A、342B、342C  解析部
 3421  キーワード抽出部
 3422、3422B  重み算出部
 3423、3423B  重み付け部
 3424、3424A、3424B  文章抽出部
 3425、3425A、3425B  語順変更部
 3426、3426A、3426B  出力部
 3427C  フィルタ部

Claims (8)

  1.  所定時間内に投稿された文章からキーワードを抽出するキーワード抽出部と、
     前記投稿された文章の一群から代表となる代表文章を抽出する文章抽出部と、
     前記キーワード抽出部が抽出した前記キーワードを前記文章抽出部が抽出した前記代表文章に出現する単語の順序に並びかえる語順変更部と、
     を備える情報処理装置。
  2.  前記キーワード抽出部が抽出した前記キーワードのそれぞれに対して重みを付与する重み付け部
     をさらに備える請求項1に記載の情報処理装置。
  3.  前記文章抽出部は、前記重み付け部が重みを付与した前記キーワードに基づいて、前記代表文章を抽出する
     請求項2に記載の情報処理装置。
  4.  前記投稿された文章の数を検出する検出部をさらに備え、
     前記検出部が前記所定時間内に所定の数以上の前記文章の数を検出した場合に、前記キーワード抽出部が前記所定時間内に投稿された前記文章からキーワードを抽出する
     請求項1から請求項3のいずれか一項に記載の情報処理装置。
  5.  所定時間内に投稿された文章からキーワードを抽出するステップと、
     前記投稿された文章の一群から代表となる代表文章を抽出するステップと、
     前記抽出されたキーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、
     を有する情報処理方法。
  6.  情報処理装置のコンピュータに、
     所定時間内に投稿された文章からキーワードを抽出するステップと、
     前記投稿された文章の一群から代表となる代表文章を抽出するステップと、
     前記抽出されたキーワードを前記抽出された代表文章に出現する単語の順序に並びかえるステップと、
     を実行させるための情報処理プログラム。
  7.  第1情報処理装置と、
     前記第1情報処理装置と接続可能な第2情報処理装置と、
     を備え、
     前記第1情報処理装置は、
     所定時間内に投稿された文章からキーワードを抽出し、
     前記投稿された文章の一群から代表となる代表文章を抽出し、
     前記抽出したキーワードを前記抽出した代表文章に出現する単語の順序に並びかえ、
     前記第2情報処理装置は、
     前記第1情報処理装置から前記並び替えられたキーワードを取得する、
     情報処理システム。
  8.  所定時間内に投稿された文書から抽出されたキーワードを表示する表示部
     を備え、
     前記キーワードは、前記投稿された文書の一群から抽出された代表となる代表文章に出現する順序に並び替えられている、
     電子機器。
PCT/JP2014/066291 2013-08-07 2014-06-19 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器 WO2015019723A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-164522 2013-08-07
JP2013164522A JP5645233B1 (ja) 2013-08-07 2013-08-07 情報処理装置、情報処理方法および情報処理プログラム

Publications (1)

Publication Number Publication Date
WO2015019723A1 true WO2015019723A1 (ja) 2015-02-12

Family

ID=52139222

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/066291 WO2015019723A1 (ja) 2013-08-07 2014-06-19 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム、および電子機器

Country Status (2)

Country Link
JP (1) JP5645233B1 (ja)
WO (1) WO2015019723A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156196A (zh) * 2015-04-22 2016-11-23 富士通株式会社 提取文本特征的装置和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190450A (ja) * 1996-01-09 1997-07-22 Canon Inc 情報処理装置および方法
WO2009101954A1 (ja) * 2008-02-15 2009-08-20 Nec Corporation テキスト情報分析システム
JP2011059814A (ja) * 2009-09-07 2011-03-24 Nippon Telegr & Teleph Corp <Ntt> 文書群処理装置、文書群処理方法および文書群処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09190450A (ja) * 1996-01-09 1997-07-22 Canon Inc 情報処理装置および方法
WO2009101954A1 (ja) * 2008-02-15 2009-08-20 Nec Corporation テキスト情報分析システム
JP2011059814A (ja) * 2009-09-07 2011-03-24 Nippon Telegr & Teleph Corp <Ntt> 文書群処理装置、文書群処理方法および文書群処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156196A (zh) * 2015-04-22 2016-11-23 富士通株式会社 提取文本特征的装置和方法

Also Published As

Publication number Publication date
JP5645233B1 (ja) 2014-12-24
JP2015035026A (ja) 2015-02-19

Similar Documents

Publication Publication Date Title
CN106844404B (zh) 消息显示方法及终端设备
Koo Development of a cell phone addiction scale for Korean adolescents
O'Sullivan Linking online sexual activities to health outcomes among teens
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
US10540430B2 (en) Techniques for providing a natural language narrative
Huang War on women: interlocking conflicts within The Vagina Monologues in China
JP6069870B2 (ja) 親密度算出方法、親密度算出プログラムおよび親密度算出装置
Hamby et al. Privacy at the margins| technology in rural Appalachia: cultural strategies of resistance and navigation
CN103544954A (zh) 用于向语音消息添加文字标签的方法和装置
JP2016110213A (ja) 情報処理装置、情報処理システム、端末装置、情報処理方法、及び情報処理プログラム
JP5881647B2 (ja) 判定装置、判定方法及び判定プログラム
Schapals et al. “Everything Has Changed, and Nothing Has Changed in Journalism”: Revisiting Journalistic Sourcing Practices and Verification Techniques during the 2011 Egyptian Revolution and Beyond
Onashoga et al. Securix: A 3D game-based learning approach for phishing attack awareness
JP5645233B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6572218B2 (ja) 危険検出装置、危険検出方法、及び危険検出プログラム
JP5818391B2 (ja) 情報処理システムおよび電子機器
JP2010128849A (ja) 情報システム
Maheswari Frequency of using WhatsApp Messenger among college students in Salem district, TamilNadu
Herlina et al. The influence of cybercrime against teenage angst in online media
Wang et al. Ethnic digital media as agenda setters and agenda marketers: The case of WXC and the Jimmy Kimmel Live! controversy
Helfrich et al. No nos vamos, nos echan
KR20130104570A (ko) 자동 게임방 생성 방법 및 장치
McCabe Anonymity No More? Age Checks Come to the Web.
Burch et al. ‘Get back to the kitchen, cos u talk s*** on tv’: gendered online abuse and trigger events in sport
Obidi et al. Cyber-Bullying: Assessment of its Awareness and Threats to Social Media Development

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14834622

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14834622

Country of ref document: EP

Kind code of ref document: A1