JP2017117068A - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2017117068A
JP2017117068A JP2015249682A JP2015249682A JP2017117068A JP 2017117068 A JP2017117068 A JP 2017117068A JP 2015249682 A JP2015249682 A JP 2015249682A JP 2015249682 A JP2015249682 A JP 2015249682A JP 2017117068 A JP2017117068 A JP 2017117068A
Authority
JP
Japan
Prior art keywords
post
posts
data
contribution
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015249682A
Other languages
English (en)
Other versions
JP2017117068A5 (ja
JP6675868B2 (ja
Inventor
琢麻 蔵満
Takuma Kuramitsu
琢麻 蔵満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2015249682A priority Critical patent/JP6675868B2/ja
Publication of JP2017117068A publication Critical patent/JP2017117068A/ja
Publication of JP2017117068A5 publication Critical patent/JP2017117068A5/ja
Application granted granted Critical
Publication of JP6675868B2 publication Critical patent/JP6675868B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 投稿に対して、より詳細な分析作業を必要とするか否かの判断材料をシステム利用者に提供し、システム利用者の作業負荷軽減を図ることを目的とする。【解決手段】 本発明に係る情報処理装置は、マイクロブログから特定の対象に関する投稿を取得し、投稿データ120に格納する投稿取得部111と、投稿データ120に保存された投稿を参照し、投稿データの時系列グラフを生成するために必要な各種集計処理を行い、集計結果を投稿集計データ130に格納する投稿集計部112と、投稿集計データ130を参照し、投稿データの時系列グラフを生成する投稿可視化部113と、を備える。【選択図】図3

Description

本発明は、Twitterなどのマイクロブログから投稿を抽出する技術に関する。
Twitterなどのマイクロブログは、いつでも誰でも書き込むことが可能であるため、部分的ではあるものの、世の中の声がテキストデータとしてリアルタイムに集まる場所とみることができる。近年では、速報性が高い情報源としてマイクロブログを活用しているユーザや企業も多い。
しかし、人手で確認できる投稿の量には限界があり、日々増加する投稿を全て確認することは困難であるため、非特許文献1に示されるように、投稿の集合に対してなんらかの機械的な処理を施し、全体を俯瞰して評判や話題を抽出する研究が盛んにおこなわれている。
例えば、図1に示すように、特定の商品名を含む投稿を抽出し、投稿数の時系列推移を可視化することにより、商品に対してなんらかのイベントが発生したタイミングを把握することができる。また、図2に示すように、投稿中に含まれる各単語の頻度など、統計情報を参照することにより、全ての投稿を読まずとも、どのような話題が数多く発生しているかを大まかに把握できる。
前述の技術を組み合わせ、話題が急増した期間を確認して該当する期間の話題を可視化することが可能となる。しかし、投稿数が急増したすべての期間を人手で調査する作業には非常に手間がかかる。また、イベントが発生した期間においては、拡散された投稿や、イベントに関連する単語が頻出する傾向があり、イベントに関連しない話題や評価を把握しづらくなる問題もある。
グラフが急増・急減した原因分析を分かりやすくする手法として、特許文献1では、イベントの発生を表す単語(「発売」「発表」「開催」「発覚」など)と時間表現とを含む投稿から特定の対象に発生したイベントのスケジュール情報を自動的に抽出し、時系列のグラフ上に注釈付する手法が提案されている。
WO2009/101954
奥村 学、「ソーシャルメディアを対象としたテキストマイニング」電子情報通信学会基礎・境界ソサイエティFundamental Review Vol.6 No.4 pp.285-293, 2013. 乾 孝司、他「テキストを対象とした評価情報の分析に関する研究動向」自然言語処理、言語処理学会、2006年7月、Vol.13、No.3、pp.201−241
特許文献1に示される技術では、各期間において発生しているイベントの一部を時系列グラフ上に提示することが可能にはなるが、提示するイベントに関する投稿が対象の期間中においてどの程度の割合を占めるかを示すことができない。すなわち、提示されているイベント以外の話題が投稿数の急増に寄与している可能性もあることから、システムの利用者はより詳細な分析が必要かどうかを注釈付された情報のみからは判断できず、投稿数が急増した原因分析の労力削減という観点において十分であるとはいえない。
本発明は、前述の問題点に鑑みてなされたもので、投稿に対して、より詳細な分析作業を必要とするか否かの判断材料をシステム利用者に提供し、システム利用者の作業負荷軽減を図ることを目的とする。
前述した課題を解決するための第1の発明は、マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに分類し集計する集計手段と、投稿の種別ごとの集計情報を表示する表示手段と、を備えることを特徴とする情報処理装置である。
第1の発明によれば、抽出された投稿を、投稿の種別ごとに分類・集計し、投稿の種別ごとの集計情報として表示する。これにより、投稿の種別ごとに集計結果を把握することができるため、投稿に対して、より詳細な分析作業を必要とするか否かの判断材料をシステム利用者に提供し、システム利用者の作業負担軽減を図ることが可能となる。
第1の発明において、前記集計手段は、抽出された投稿を、少なくとも、投稿の拡散を目的とする投稿と、Web上の記事を紹介することを目的とする投稿と、に分類し集計することが望ましい。
これによって、抽出された投稿を、少なくとも、投稿の拡散を目的とする投稿と、Web上の記事を紹介することを目的とする投稿と、に分類して分析することが可能となる。
第1の発明において、前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示することが望ましい。このとき、前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段を更に備えることが望ましい。これによって、注釈付きの時系列グラフ上において、投稿の構成(種別)を把握することが容易になり、更に詳細な分析を行う必要があるか否かを判断するための時間を短縮することができる。
また、投稿数に基づいてイベント発生期間を取得するイベント取得手段を、更に備え、前記注釈付与手段は、取得した前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与することが望ましい。これによって、投稿数が増加するイベント発生期間において投稿の構成(種別)を容易に把握することが可能となる。
また、前記注釈の内容は、投稿数の多い投稿の種別順に抽出した話題と、当該話題ごとの件数であることが望ましい。これにより、時系列グラフ上において、主な話題と話題ごとの投稿数を併せて注釈付与することで、投稿数が増えた原因分析が容易となる。
第2の発明は、マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出ステップと、抽出された各投稿を投稿の種別ごとに分類し集計する集計ステップと、集計した投稿の種別ごとの集計情報を表示する表示ステップと、を含むことを特徴とする情報処理方法である。
第3の発明は、コンピュータを、マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに分類し集計する集計手段と、投稿の種別ごとの集計情報を表示する表示手段と、して機能させることを特徴とするプログラムである。
本発明によれば、投稿に対して、より詳細な分析をする必要があるか否かの判断材料をシステム利用者に提供することができるようになる。
投稿数の時系列推移の可視化例を示す図 投稿中に含まれる各単語の頻度を示す図 マイクロブログ分析システム100の機能構成を示す図 情報処理装置101のハードウェア構成の一例を示すブロック図 投稿データ120の一例を示す図 投稿集計データ130の一例を示す図 投稿取得処理のフローチャート 投稿集計処理のフローチャート 投稿可視化部113が生成した投稿数日別推移グラフの一例を示す図 投稿可視化部113が生成した時系列グラフの一例を示す図 図10の注釈の全内容を示す図
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図4は、本発明の実施形態に係わる情報処理装置101のハードウェア構成の一例を示すブロック図である。
図4において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な各種プログラム等が記憶されている。
202はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
また、205は入力コントローラで、入力装置209等からの入力を制御する。206はビデオコントローラで、液晶ディスプレイ等のディスプレイ装置210への表示を制御する。なお、ディスプレイ装置は、液晶ディスプレイに限られず、CRTディスプレイなどであっても良い。これらは必要に応じてクライアントが使用するものである。
207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶するハードディスク(HD)や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
外部メモリ211には、後述するマイクロブログ分析システム100の各機能をCPU201により実行するプログラムが格納されている。このプログラムを汎用のコンピュータにインストールすることによって、本発明に係る情報処理装置101を得ることができる。
208は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN400)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
なお、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ装置210上での表示を可能としている。また、CPU201は、ディスプレイ装置210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
ハードウェア上で動作する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。
なお、全ての装置がこれらの構成を備えているわけではなく、必要なものを備えていればよい。
本発明は、マイクロブログにおいて投稿が急増する際(イベント発生時)には、イベントの情報に関連するWebページのURLが投稿に含まれる可能性が高いことや、マイクロブログユーザの関心を集めた投稿が引用されて拡散されやすいことなど、マイクロブログの性質を利用して話題の抽出、および、可視化を行う。以下、図面を参照して、本発明の実施形態を詳細に説明する。
図3は、本発明の実施形態におけるマイクロブログ分析システム100の機能構成を示す図である。
マイクロブログ分析システム100は、投稿取得部111と、投稿集計部112と、投稿可視化部113と、投稿データ120と、投稿集計データ130とを備える。
投稿取得部111は、マイクロブログから特定の対象に関する投稿を取得し、投稿データ120に格納する。投稿取得部111における投稿取得処理については、後に例を用いて詳しく説明する。
投稿集計部112は、投稿データ120に保存された投稿を参照し、投稿データの時系列グラフを生成するために必要な各種集計処理を行い、集計結果を投稿集計データ130に格納する。投稿集計部112における集計処理については、後に例を用いて詳しく説明する。
投稿可視化部113は、投稿集計データ130を参照し、投稿データの時系列グラフ生成を行う。時系列グラフの生成方法については、後に例を用いて詳しく説明する。
図5は、投稿データ120の一例であり、投稿を一意に識別する投稿IDと、投稿日時、投稿文に加え、投稿取得部111が別途付与する記事タイトルと、拡散対象IDとを投稿ごとに保持する。記事タイトル、および、拡散対象IDについては、後の投稿取得処理の説明において詳しく説明する。
図6は、投稿集計データ130の一例である。投稿集計データ130は、全投稿集計データ131、記事投稿集計データ132、拡散投稿集計データ133、意見投稿集計データ134から成る。各データの詳細は、後の投稿集計処理の説明において詳しく説明する。
次に、投稿取得部111における投稿取得処理、投稿集計部112における集計処理、投稿可視化部113における時系列グラフの生成方法について、順に例を用いて説明する。
まず、投稿取得部111における投稿取得処理について、図5、図7を用いて説明する。図7は、本発明の実施形態における投稿取得処理のフローチャートである。以下、図7の処理に従って、「製品A」に関する投稿をマイクロブログから取得する例を示す。
ステップS101において、情報処理装置101のCPU201(投稿取得部111)は、分析対象である「製品A」を投稿文中に含む投稿をマイクロブログから取得する。以降の処理を説明するため、ここでは下表に示す5件の投稿(投稿A〜投稿E)を含む投稿の集合を取得したものとする。
なお、ステップS101によって、本発明の「マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段」の一例が構成されている。
Figure 2017117068
ステップS101で取得した各投稿に対して、CPU201(投稿取得部111)は、ステップS102〜ステップS107の処理を繰り返し実行する。ステップS102〜ステップS107の処理は、投稿に含まれるURLや、他の投稿を引用した投稿に対して付加情報を取得し、投稿データ120に保存する処理である。
まず、ステップS103において、CPU201(投稿取得部111)は、投稿文にURLが含まれるか否かを判定する。CPU201(投稿取得部111)は、投稿文にURLが含まれていれば、処理をステップS104に移行する。例えば、投稿AはURLを投稿文中に含むため、CPU201(投稿取得部111)は、ステップS104の処理を実行する。
ステップS104において、CPU201(投稿取得部111)は、URLが示すWebページのタイトルをインターネット経由で取得する。ここで、取得したタイトルを「記事タイトル」と呼ぶ。なお、投稿文に複数のURLが含まれている場合、CPU201(投稿取得部111)は、すべてのURLに対する記事タイトルを取得する。例えば、投稿Aにおいては、URL「http://zsha.example.com/news/1001.html」に対する記事タイトル「製品Aを今冬発売予定」と、URL「http://zsha.example.com/news/1002.html」に対する記事タイトル「製品Aの性能表」をそれぞれ取得する。
次に、ステップS105において、CPU201(投稿取得部111)は、投稿が他の投稿を引用したものであるかを判定する。CPU201(投稿取得部111)は、投稿が他の投稿を引用したものでれば、処理をステップS106に移行する。例えば、投稿Cは投稿Bを引用した投稿であるため、ステップS106の処理を実行する。ここで、説明を簡略化するため、各投稿が引用した投稿は、マイクロブログから投稿を取得する時点で取得可能な情報として説明する。
ステップS106において、CPU201(投稿取得部111)は、引用した投稿の投稿IDを取得する。ここで取得した投稿IDを「拡散対象ID」と呼ぶ。
次に、ステップ107において、CPU201(投稿取得部111)は、投稿IDと、投稿日時と、投稿文と、ステップ104で取得した記事タイトルと、ステップ106で取得した拡散対象IDとを、投稿データ120に追加する。ここで、記事タイトルが存在する投稿を「記事投稿」(Web上の記事を紹介することを目的とする投稿)、拡散対象IDが存在する投稿を「拡散投稿」(投稿の拡散を目的とする投稿)、いずれも存在しない投稿を「意見投稿」と呼ぶ。例えば、投稿A、投稿Bは記事投稿、投稿Cは記事投稿かつ拡散投稿、投稿Dは意見投稿、投稿Eは拡散投稿である。
以上、投稿取得部111における投稿取得処理について、例を用いて説明した。なお、説明の簡略化のため、ステップS105について、各投稿が引用した投稿は、マイクロブログから投稿を取得する時点で取得可能な情報として説明したが、取得不可能な環境においても、投稿文の内容や投稿日時の前後関係により、引用対象の投稿を機械的に取得することが可能である。
次に、投稿集計部112における投稿集計処理について、図5、図6、図8を用いて説明する。図8は、本発明の実施形態における投稿集計処理のフローチャートである。以下、図8の処理に従って、「製品A」に関する「2015年10月4日」の投稿を集計する例を示す。
まず、ステップS201において、情報処理装置101のCPU201(投稿集計部112)は、集計対象期間に投稿された投稿を投稿データから取得する。例えば、集計対象期間が2015年10月4日の1日間である場合、図5の投稿データ120において投稿A、投稿B、投稿C、投稿Dは取得対象であり、投稿Eは取得対象外である。
次に、ステップS201で取得した各投稿に対して、CPU201(投稿集計部112)は、ステップS202〜ステップS209の処理を繰り返し実行する。ステップS202〜ステップS209の処理は、投稿集計データ130を更新する処理である。
まずステップS203において、CPU201(投稿集計部112)は、投稿データに記事タイトルが存在するか否かを判定する。CPU201(投稿集計部112)は、投稿データに記事タイトルが含まれていれば、処理をステップS204に移行する。
ステップS204において、CPU201(投稿集計部112)は、記事投稿集計データ132を更新する。記事投稿集計データ132は、集計対象期間、記事タイトル、投稿数から成る。ここで、投稿数は、各集計期間において各記事タイトルが含まれる投稿の数である。CPU201(投稿集計部112)は、記事投稿集計データ132を参照し、投稿データと同じ集計対象期間・記事タイトルであるレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。
次にステップS205において、CPU201(投稿集計部112)は、投稿データに拡散対象IDが存在するか否かを判定する。CPU201(投稿集計部112)は、投稿データに拡散対象IDが含まれていれば、処理をステップS206に移行する。
ステップS206において、CPU201(投稿集計部112)は、拡散投稿集計データ133を更新する。拡散投稿集計データ133は、集計対象期間、拡散対象ID、投稿数から成る。ここで、投稿数は、各集計期間において各拡散対象IDが含まれる投稿の数である。CPU201(投稿集計部112)は、拡散投稿集計データ133を参照し、投稿データと同じ集計対象期間・拡散対象IDであるレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。
次にステップS207において、CPU201(投稿集計部112)は、投稿データが意見投稿(記事タイトルも拡散対象IDも存在しない)であるか否かを判定する。CPU201(投稿集計部112)は、投稿データが意見投稿であれば、処理をステップS208に移行する。
ステップS208において、CPU201(投稿集計部112)は、意見投稿集計データ134を更新する。意見投稿集計データ134は、集計対象期間、意見、投稿数から成る。ここで、「意見」は、投稿文から自然言語処理を用いて抽出する文字列である。説明を簡略化するため、ここでは投稿文に含まれる形容詞や動詞を投稿データの意見として取り扱う(形容詞や動詞を抽出することは公知の技術で可能である)。例えば、図5の投稿データ120における投稿Dの投稿文「製品A欲しいな…。性能3倍とかすごい。」から、「欲しい」「すごい」などの形容詞を抽出する。CPU201(投稿集計部112)は、意見投稿集計データ134を参照し、抽出した各意見に対して、同じ集計対象期間のレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。
次にステップS209において、CPU201(投稿集計部112)は、全投稿集計データ131を更新する。全投稿集計データ131は、投稿数、記事投稿数、拡散投稿数、意見投稿数から成る。投稿集計部112は、全投稿集計データ131を参照し、同じ集計対象期間のレコードが存在すれば、該当するレコードにおいて、投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。また、投稿データが記事投稿であれば記事投稿数に1を加算し、拡散投稿であれば拡散投稿に1を加算し、意見投稿であれば意見投稿数に1を加算する。
以上、投稿集計部112における投稿集計処理について、例を用いて説明した。なお、説明の簡略化のため、ステップS208について、形容詞や動詞の原型を投稿データの意見として取り扱う方法を説明したが、非特許文献2で紹介されるような、評価情報抽出技術の出力結果を用いてもよい。
なお、図7(投稿取得処理)のステップS102〜ステップS107および図8(投稿集計処理)のステップS201〜ステップS209によって、本発明の「抽出された各投稿を投稿の種別ごとに分類し集計する集計手段」「前記集計手段は、抽出された投稿を、少なくとも、投稿の拡散を目的とする投稿と、Web上の記事を紹介することを目的とする投稿と、に分類し集計する」の一例が構成されている。投稿の種別は、拡散投稿かつ記事投稿、拡散投稿を除く記事投稿、記事投稿を除く拡散投稿、意見投稿を含む。
次に、投稿可視化部113における投稿データの可視化方法について、図1、図6、図9、図10を用いて説明する。図9、および、図10は、投稿可視化部113が投稿集計データ130を参照して生成する時系列グラフであり、システムの利用者はWebブラウザなどを通じて当該グラフを閲覧、操作することができる。図11は、図10の注釈の全内容を示した図である。
以下、時系列グラフの構成について説明する。
情報処理装置101のCPU201(投稿可視化部113)は、全投稿集計データ131を参照し、集計対象期間ごとの投稿数を、積上げ棒グラフにより可視化する。図9は、投稿可視化部113が生成した製品Aに対する2015年10月の投稿数日別推移グラフである。投稿可視化部113は、拡散投稿を除く記事投稿の投稿、記事投稿かつ拡散投稿の投稿数、記事投稿を除く拡散投稿の投稿数、意見投稿数をそれぞれ別の色で可視化する。なおこれによって、本発明の「投稿の種別ごとの集計情報を表示する表示手段」「前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示する」の一例が構成されている。
なお、各投稿数は、全投稿集計データ131が保持する値を用いて、下記の式で算出できる。
(数1)
α = 記事投稿かつ拡散投稿の投稿数 = (記事投稿数+拡散投稿数+意見投稿数) - 投稿数
拡散投稿をのぞく記事投稿の投稿数 = 記事投稿数 - α
記事投稿をのぞく拡散投稿の投稿数 = 拡散投稿数 - α
意見投稿数 = 意見投稿数
また、CPU201(投稿可視化部113)は、投稿集計データ130を参照し、システムの利用者によるクリック操作で展開する注釈を時系列グラフ上に付与する。図10は、システムの利用者が、「10月4日」、「10月10日」、「10月20日」における棒グラフをクリックし、それぞれの注釈を展開した後の時系列グラフを表している。なおこれによって、本発明の「前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段」の一例が構成されている。
以下、投稿可視化部113における注釈に記載する内容の取得方法について説明する。
注釈は、イベントが発生したと考えられる箇所(イベント発生期間)に付与される。
イベント発生期間とは、具体的には以下の方法により求めることが可能である。
まず、CPU201(投稿可視部113)は、分析期間内における単位期間あたりの投稿数を降順でソートし、下位半分の投稿数の平均値を取得する(平常時平均値)。そして、CPU201(投稿可視部113)は、投稿数がN以上かつ平常時平均値のM倍以上である箇所をイベント発生期間と判断する。なおこれによって、本発明の「投稿数に基づいてイベント発生期間を取得するイベント取得手段」の一例が構成されている。
CPU201(投稿可視化部113)は、各イベント発生期間において、投稿の種別ごとに特徴的な話題を抽出し、投稿数の多い投稿の種別順に抽出した話題を話題ごとの件数付で時系列グラフ上に注釈を付与する。なおこれによって、本発明の「前記注釈付与手段は、前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与する」「前記注釈の内容は、投稿数の多い投稿の種別順に抽出した話題と、当該話題ごとの件数である」の一例が構成されている。
以下、記事投稿、拡散投稿、意見投稿の順に、話題の抽出方法を説明する。
まず、記事投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、記事投稿集計データ132を参照し、集計対象期間における記事タイトルのうち、投稿数の上位L件を話題として抽出する。(Lは自然数)
次に、拡散投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、拡散投稿集計データ133を参照し、集計対象期間における拡散対象IDのうち、投稿数の上位M件を抽出し、各拡散対象IDに対応する投稿を話題として抽出する。(Mは自然数)
次に、意見投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、意見投稿集計データ134を参照し、集計対象期間における意見のうち、投稿数の上位N件を話題として抽出する。(Nは自然数)
以上で説明した、投稿可視化部113が出力する注釈付きの時系列グラフを参照することにより、システムの利用者は時系列グラフ上において、集計対象期間における投稿の構成を把握することが容易になり、更に詳細な分析を行う必要があるか否かを判断するための時間を短縮することができる。例えば、図10から、「10月10日に投稿数が急増している原因は、製品Aを紛失したユーザの投稿が拡散されているだけで、製品A自体に問題が発生したわけではない」ことが分かるため、当該期間に関する分析を省略するという判断をすることが可能となる。また、投稿の種別ごとに話題を集約することで、意見投稿のみを分析することが可能となり、イベントとは関係の無い評価(通常時の評判)を分析することが可能となる。
また、「10月4日、10月20日を境に意見投稿数の割合が増加している」ことが分かるため、当該期間に関してより注力して分析する、という判断をすることが可能になる。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な内容で構成されることは言うまでもない。
また、本発明は、システム或いは装置にプログラムを供給することにとって達成される場合にも適用できることは言うまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記録媒体を該システム或いは装置に読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのソフトウェアによって表されるプログラムをネットワーク上のサーバ、データーベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。
なお、上述した各実施形態及びその変形例を組み合わせた構成もすべて本発明に含まれるものである。
100…………マイクロブログ分析システム
101…………情報処理装置
111…………投稿取得部
112…………投稿集計部
113…………投稿可視化部
120…………投稿データ
130…………投稿集計データ
131…………全投稿集計データ
132…………記事投稿集計データ
133…………拡散投稿集計データ
134…………意見投稿集計データ
201…………CPU
202…………RAM
203…………ROM
204…………システムバス
209…………入力装置
210…………ディスプレイ装置
211…………外部メモリ

Claims (8)

  1. マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段と、
    抽出された各投稿を投稿の種別ごとに分類し集計する集計手段と、
    投稿の種別ごとの集計情報を表示する表示手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記集計手段は、抽出された投稿を、少なくとも、投稿の拡散を目的とする投稿と、Web上の記事を紹介することを目的とする投稿と、に分類し集計する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示する
    ことを特徴とする請求項1または請求項2に記載の情報処理装置。
  4. 前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段
    を更に備えることを特徴とする請求項3に記載の情報処理装置。
  5. 投稿数に基づいてイベント発生期間を取得するイベント取得手段を、更に備え、
    前記注釈付与手段は、前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与する
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記注釈の内容は、投稿数の多い投稿の種別順に抽出した話題と、当該話題ごとの件数である
    ことを特徴とする請求項4または請求項5に記載の情報処理装置。
  7. マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出ステップと、
    抽出された各投稿を投稿の種別ごとに分類し集計する集計ステップと、
    集計した投稿の種別ごとの集計情報を表示する表示ステップと、
    を含むことを特徴とする情報処理方法。
  8. コンピュータを、
    マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段と、
    抽出された各投稿を投稿の種別ごとに分類し集計する集計手段と、
    投稿の種別ごとの集計情報を表示する表示手段と、
    して機能させることを特徴とするプログラム。
JP2015249682A 2015-12-22 2015-12-22 情報処理装置、情報処理方法、及びプログラム Active JP6675868B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015249682A JP6675868B2 (ja) 2015-12-22 2015-12-22 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015249682A JP6675868B2 (ja) 2015-12-22 2015-12-22 情報処理装置、情報処理方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2017117068A true JP2017117068A (ja) 2017-06-29
JP2017117068A5 JP2017117068A5 (ja) 2019-02-07
JP6675868B2 JP6675868B2 (ja) 2020-04-08

Family

ID=59234696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015249682A Active JP6675868B2 (ja) 2015-12-22 2015-12-22 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6675868B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019207482A (ja) * 2018-05-28 2019-12-05 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム
JP7009719B1 (ja) 2021-03-03 2022-01-26 しるし株式会社 購買分析システム、購買分析方法、及びコンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005032197A (ja) * 2003-07-11 2005-02-03 Nippon Telegr & Teleph Corp <Ntt> 情報解析システム及び方法
JP2012079247A (ja) * 2010-10-06 2012-04-19 Hironori Abe 口コミ情報管理システム及び口コミ情報管理プログラム
JP2013033375A (ja) * 2011-08-02 2013-02-14 Sony Corp 情報処理装置、情報処理方法、および、プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005032197A (ja) * 2003-07-11 2005-02-03 Nippon Telegr & Teleph Corp <Ntt> 情報解析システム及び方法
JP2012079247A (ja) * 2010-10-06 2012-04-19 Hironori Abe 口コミ情報管理システム及び口コミ情報管理プログラム
JP2013033375A (ja) * 2011-08-02 2013-02-14 Sony Corp 情報処理装置、情報処理方法、および、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鳥海 不二夫: ""震災時におけるTwitterのリツイート分析"", 電子情報通信学会技術研究報告 AI2012-1-AI2012-7 人工知能と知識処理, vol. 第112巻,第94巻, JPN6019050318, 14 June 2012 (2012-06-14), JP, pages 19 - 24, ISSN: 0004178746 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019207482A (ja) * 2018-05-28 2019-12-05 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム
JP7048891B2 (ja) 2018-05-28 2022-04-06 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム
JP7009719B1 (ja) 2021-03-03 2022-01-26 しるし株式会社 購買分析システム、購買分析方法、及びコンピュータプログラム
JP2022134595A (ja) * 2021-03-03 2022-09-15 しるし株式会社 購買分析システム、購買分析方法、及びコンピュータプログラム

Also Published As

Publication number Publication date
JP6675868B2 (ja) 2020-04-08

Similar Documents

Publication Publication Date Title
Shaw et al. Laboratories of oligarchy? How the iron law extends to peer production
US8799796B2 (en) System and method for generating graphical dashboards with drill down navigation
US20170116388A1 (en) Lifestyle and phenotype database and analytics platform
JP6048977B2 (ja) サイトまとめ方法、サイトまとめシステム、情報処理装置、及びプログラム
US20170060824A1 (en) Interactive preview teasers in communications
JP2022133401A (ja) 関連スコア算出システム、方法およびプログラム
US8843882B1 (en) Systems, methods, and algorithms for software source code analytics and software metadata analysis
Tomomitsu et al. The evolution of studies on information technology and organizational agility: a bibliometric analysis
JP6898542B2 (ja) 情報処理装置、その制御方法、及びプログラム
JP6675868B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN113704288A (zh) 数据展示方法、装置、计算机可读介质及电子设备
JP6966289B2 (ja) 情報分析装置、プログラム及び方法
US20140297341A1 (en) System and method for forensic analysis and investigation of digital data in digital media device
JP5156692B2 (ja) 擬似データ生成装置、擬似データ生成方法及びコンピュータプログラム
Waldner et al. Linking unstructured evidence to structured observations
van Banerveld et al. A natural language processing tool for white collar crime investigation
KR102081553B1 (ko) 문화 매체를 위한 홍보 컨텐츠의 빅데이터 기반 모니터링 시스템
Serrano et al. Webtool for the analysis and visualization of the evolution of wiki online communities
CN113420042A (zh) 基于演示文稿的数据统计方法、装置、设备及存储介质
JP7009160B2 (ja) サイト改善装置、サイト改善方法およびサイト改善プログラム
JP6955330B2 (ja) プロジェクト管理項目評価システム及びプロジェクト管理項目評価方法
Funk et al. The sensei overview of newspaper readers’ comments
CN111625589B (zh) 信息显示方法及设备
JP7098122B1 (ja) 記事監視システム、注目情報が記述された記事の監視方法、コンピュータプログラム
JP2019109758A (ja) テキスト分析装置、テキスト分析方法、及び、テキスト分析プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200311

R150 Certificate of patent or registration of utility model

Ref document number: 6675868

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250