JP2016071596A - 情報分析装置、情報分析方法、及び、プログラム - Google Patents
情報分析装置、情報分析方法、及び、プログラム Download PDFInfo
- Publication number
- JP2016071596A JP2016071596A JP2014199945A JP2014199945A JP2016071596A JP 2016071596 A JP2016071596 A JP 2016071596A JP 2014199945 A JP2014199945 A JP 2014199945A JP 2014199945 A JP2014199945 A JP 2014199945A JP 2016071596 A JP2016071596 A JP 2016071596A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- text data
- execution
- target word
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 61
- 238000000605 extraction Methods 0.000 claims abstract description 43
- 239000000284 extract Substances 0.000 claims abstract description 19
- 230000014509 gene expression Effects 0.000 claims description 29
- 238000013500 data storage Methods 0.000 abstract description 23
- 235000015278 beef Nutrition 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 239000005441 aurora Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000015243 ice cream Nutrition 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】情報分析装置1は、まず、投稿サーバ3からネットワーク7を介して予め指定された投稿者の投稿テキストを取得し、投稿テキスト記憶部21に格納する。次に、情報分析装置1は、投稿テキストを分析し、希望文を含む投稿テキストを抽出し、投稿者のアカウントと投稿日時、希望文の対象語、抽出件数を希望文データ記憶部23に格納する。次に、情報分析装置1は、当該投稿者のその後の投稿テキストから、希望文の対象語に関する実行文を抽出し、実行文の抽出件数を実行文データ記憶部25に格納する。最後に、情報分析装置1は、希望文の抽出件数に対する実行文の抽出件数の割合から各投稿者のアカウント毎に有言実行度を算出する。
【選択図】図3
Description
また、投稿テキストには「この夏絶対に食べたいかき氷ベスト10http://www.・・・」のように他のテキスト等を参照するものも含まれ、キーワードが含まれる投稿テキスト数の多少から、売上等の影響の大きさを推測することは困難である。
ここでいう「対象語」とは、希望文に含まれる、係り受けにおいて希望を示す表現に係る名詞である。
ここでいう「まとまり毎に関連付け」されたテキストデータとは、掲示板の同一スレッド内の投稿テキストデータや、ブログのある日記内の投稿テキストデータなど、特定の対象に対して投稿された関連のあるテキストデータである。
前記識別情報は、ユーザ毎に固有の情報又は分類分けされた情報である。
前記希望文抽出手段は、希望を示す助動詞又は動詞が含まれる前記テキストデータを希望文として抽出する。
また、前記実行文抽出手段は、前記対象語が係る動詞、形容詞、形容動詞に、過去又は完了の助動詞が付随する前記テキストデータを実行文として抽出する。
また、前記テキストデータは、ウェブサーバを介して抽出されることが望ましい。
すなわち、特定の商品の名前を含む希望文を含む投稿テキストの件数と、それらの投稿テキストを投稿したユーザの有言実行度から、その商品の売れ行きを予測することができる。
情報分析装置1は、例えば、投稿サーバ3とネットワーク7を介して接続され、ネットワーク7を介して投稿サーバ3と接続されたユーザ端末5から投稿され、投稿サーバ3が管理する投稿テキストデータを分析する。
ユーザ端末5は、インターネット等のネットワーク7を介して投稿サーバ3に接続可能であり、投稿サーバ3にアカウントを持つユーザは、ユーザ端末5から、投稿サーバ3の支援によりブログ、Twitter(登録商標)を作成し投稿する。
情報分析装置1は、投稿サーバ3が管理している投稿テキストから、予め指定したユーザの投稿テキストデータを取得し、投稿テキストデータを分析し、ユーザ・アカウント毎にユーザの有言実行度を算出する。
有言実行度、及び、有言実行度の算出方法については後述する。
情報分析装置1は、例えば、パーソナルコンピュータ等のコンピュータ装置で構成することが可能である。
情報分析装置1は、例えば、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F(インタフェース)部17等がバス18で接続された構成である。
ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部12、ROM、記憶媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行うために使用するワークエリアを備える。
処理プログラムについては後述する。
プログラムのコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUにより実行される。
通信制御部14は、通信制御装置、通信ポート等を有し、ネットワーク7を介して、他の装置、例えば、投稿サーバ3との通信制御を行う。ネットワークは、有線、無線を問わない。
表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置であり、表示部16には、情報分析装置1により分析された各ユーザの有言実行度等を表示することが可能である。
ブログやTwitter(登録商標)への投稿テキストには、「○○が欲しい」、「○○したい」といった物事への興味や希望を示す文章(以下、希望文と呼ぶ)が含まれている。そして、この興味、希望を実現して、「○○を手に入れた」、「○○をやった」という実行を示す文章(実行文)も投稿される。
図3は、情報分析装置1の処理の流れを示すフローチャートである。
投稿テキスト記憶部21には、例えば、投稿日時、ユーザ・アカウント、及び、投稿テキストデータが格納される。
投稿テキスト記憶部21には、指定されたユーザ・アカウントの投稿テキストデータが、投稿日時とともに、すべて格納される。
ここでは、図5(a)の希望文及び対象語の抽出について説明する。
希望文とは、希望を示す表現と、その対象語を含む文である。
希望を示す表現とは、例えば、希望の助動詞である「〜たい」、「〜たがる」や、希望を示す動詞である「欲しい」、「欲する」等である。
また、対象語とは、希望文に含まれる、係り受けにおいて希望を示す表現に係る名詞である。
すなわち、形態素解析及び構文解析により1文を文節に分割するとともに係り受け関係を解析し、文節から希望を示す表現を探索し、探索できたら係り受けにおいて希望を示す表現に係る名詞を対象語として抽出する。希望を示す表現とその対象語が抽出できた文を希望文として抽出する。
希望文データ記憶部23には、ユーザ・アカウント、投稿日時、希望文の対象語、希望文数w等が格納される。
図5(a)に示した方法により希望文及び対象語が抽出されると、希望文データ記憶部23に、ユーザ・アカウント毎に、希望文の対象語と、その希望文を含む投稿テキストの投稿日時、及び、抽出された希望文数wが格納される。
ユーザ・アカウント「aa」の投稿テキストデータから、「◎◎アイス食べたい」、「△△のCD超欲しい」、「××に相談したいことがあるんだよね」、「いつか本物のオーロラ見てみたいな」が希望文として抽出され、各希望文の投稿日時及び対象語「◎◎アイス」、「△△のCD」、「××」、「オーロラ」と希望文数w=4が希望文データ記憶部23に格納されている。
以下、他のユーザ・アカウントについても同様に希望文が抽出され、希望文の対象語と投稿日時、希望文数wが希望文データ記憶部23に格納される。
実行文とは、希望文の対象語とその実行を示す表現を含み、当該希望文の投稿日時以降の投稿日時の情報をもつ文である。
実行を示す表現とは、例えば、動詞、形容詞、形容動詞+過去又は過去完了の助動詞「た」である。
すなわち、形態素解析及び構文解析により1文を文節に分割するとともに係り受け関係を解析し、文節から実行を示す表現を探索し、探索できたら係り受けにおいて希望文の対象語が実行を示す表現に係っているか判定する。係っているならばこの文を実行文とする。
この例では、「食べたよー」という動詞+過去の助動詞「た」が存在するので、この投稿テキストは実行文であると判定される。
実行文データ記憶部25は、例えば、ユーザ・アカウント、及び、希望文の対象語に対応する実行文数eで構成される。
ユーザ・アカウント「aa」については、図6に格納された希望文の対象語「◎◎アイス」、「△△のCD」、「××」、「オーロラ」に対して、投稿テキスト記憶部21の投稿テキストデータから、「◎◎アイスおいしかった!」、「△△のCD買っちゃった」、「××といっぱい話せて良かった!」が実行文と判別され、実行文データ記憶部25には、実行文数e=3が格納される。
以下、他のユーザ・アカウントについても同様に実行文が抽出され、ユーザ・アカウント毎に実行文数eが実行文データ記憶部25に格納される。
有言実行度は、希望文数wに対する実行文数eの割合(e/w)である。
有言実行度記憶部27は、ユーザ・アカウント及び有言実行度で構成される。
図8の例では、ユーザ・アカウント「aa」の有言実行度(e/w)は、希望文数w=4、実行文数e=3から75%、ユーザ・アカウント「bb」の有言実行度(e/w)は、希望文数w=4、実行文数e=1から25%である。
商品発売前に商品の特徴や価格などの情報を公開しておくと、投稿者は投稿サーバ3を介して、その商品を買ってみたい、あるいは、試してみたいといった希望文を含む投稿テキストを投稿する。
所定の期間に投稿サーバ3に投稿された投稿テキストデータを情報分析装置1で分析し、その商品名を希望文の対象語とする希望文を含む投稿テキストを抽出し、それらの投稿テキストの投稿者全員の平均有言実行度が高ければ、その商品は高い売上が予測でき、また、平均有言実行度が低ければ、その商品はあまり売れないだろうと予測することができ、売上予測の精度を高めることが可能になる。
投稿件数からはB社の商品○○の反響が大きく高い売上が予測されるが、有言実行度の情報を活用すると、投稿者の平均有言実行度はA社の商品◎◎の方が高く、A社の商品◎◎の高い売上を予測できる。
発売前の商品のプロモーションに対して、その商品を希望文の対象語として含む投稿テキストを投稿した投稿者の平均有言実行度と、発売後のその商品を対象語とする実行文を投稿した投稿者の割合を比較し、実行文を投稿した投稿者の割合が希望文を投稿した投稿者の平均有言実行度よりも低い場合は、予想より商品が売れていず、更にプロモーションが必要であると判断できる。
すなわち、売れ行きの好調/不調を定量化でき、プロモーションの必要性の有無を判断することが可能になる。
有言実行度が所定の値以上の投稿者にヒアリングやアンケートを実施したり、有言実行度が所定の値以上の投稿者のその後の投稿テキストを重点的に分析することにより、より有効な情報を得ることが可能になる。
例えば、図3のステップ101において、予め指定された投稿者(ユーザ・アカウント)の投稿テキストデータを取得するとしたが、投稿テキストデータを取得する対象は、ユーザ・アカウントのみに限られない。
また、情報分析装置1の制御部11は、所定の分類に属するユーザ・アカウントの投稿テキストデータを取得するようにしてもよい。
さらに、例えば、A社の商品◎◎に対する年齢層別の投稿者の平均有言実行度の違いから、売上予測やプロモーションの計画立案をすることが可能である。
この場合には、図3のステップS103において、情報分析装置1の制御部11は、まとまり毎の関連付けを参照して、希望文に関連する投稿テキストデータを判定し、希望文に関連する投稿テキストデータから、実行文を抽出してもよい。
3………投稿サーバ
5………ユーザ端末
7………ネットワーク
21………投稿テキスト記憶部
23………希望文データ記憶部
25………実行文データ記憶部
27………有言実行度記憶部
Claims (9)
- 日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、
前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、
前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、
を具備することを特徴とする情報分析装置。 - 前記テキストデータは、まとまり毎に関連付けされ、
前記実行文抽出手段は、前記関連付けを参照して前記希望文に関連するテキストデータを判定し、前記希望文に関連するテキストデータから実行文を抽出することを特徴とする請求項1記載の情報分析装置。 - 前記テキストデータは、識別情報を有し、
前記希望文抽出手段及び前記実行文抽出手段は、前記識別情報が同一のテキストデータからそれぞれ抽出することを特徴とする請求項1又は請求項2に記載の情報分析装置。 - 前記識別情報は、ユーザ毎に固有の情報又は分類分けされた情報であることを特徴とする請求項1から請求項3のいずれか1項に記載の情報分析装置。
- 前記希望文抽出手段は、希望を示す助動詞又は動詞が含まれる前記テキストデータを希望文として抽出することを特徴とする請求項1から請求項4のいずれか1項に記載の情報分析装置。
- 前記実行文抽出手段は、前記対象語が係る動詞、形容詞、形容動詞に過去又は完了の助動詞が付随する前記テキストデータを実行文として抽出することを特徴とする請求項1から請求項5のいずれか1項に記載の情報分析装置。
- 前記テキストデータは、ウェブサーバを介して抽出されることを特徴とする請求項1から請求項6のいずれか1項に記載の情報分析装置。
- 日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出ステップと、
前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出ステップと、
前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出ステップと、
を含むことを特徴とする情報分析方法。 - コンピュータを、
日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、
前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、
前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014199945A JP6384242B2 (ja) | 2014-09-30 | 2014-09-30 | 情報分析装置、情報分析方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014199945A JP6384242B2 (ja) | 2014-09-30 | 2014-09-30 | 情報分析装置、情報分析方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016071596A true JP2016071596A (ja) | 2016-05-09 |
JP6384242B2 JP6384242B2 (ja) | 2018-09-05 |
Family
ID=55864711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014199945A Active JP6384242B2 (ja) | 2014-09-30 | 2014-09-30 | 情報分析装置、情報分析方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6384242B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020514847A (ja) * | 2017-01-20 | 2020-05-21 | コウベ・グローバル・テクノロジーズ・ピーティイー・リミテッドKobe Global Technologies Pte Ltd | インフルエンサーを広告キャンペーンとマッチングするためのシステムと方法 |
US11132699B2 (en) | 2017-09-05 | 2021-09-28 | Honda Motor Co., Ltd. | Apparatuses, method, and computer program for acquiring and evaluating information and noise removal |
-
2014
- 2014-09-30 JP JP2014199945A patent/JP6384242B2/ja active Active
Non-Patent Citations (1)
Title |
---|
稲本伸二、外3名: "ブログの言及記事数を用いた売上予測手法の提案", 第2回データ工学と情報マネジメントに関するフォーラム−DEIM 2010−論文集 [ONLINE], JPN6018016591, 25 May 2010 (2010-05-25) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020514847A (ja) * | 2017-01-20 | 2020-05-21 | コウベ・グローバル・テクノロジーズ・ピーティイー・リミテッドKobe Global Technologies Pte Ltd | インフルエンサーを広告キャンペーンとマッチングするためのシステムと方法 |
US11132699B2 (en) | 2017-09-05 | 2021-09-28 | Honda Motor Co., Ltd. | Apparatuses, method, and computer program for acquiring and evaluating information and noise removal |
Also Published As
Publication number | Publication date |
---|---|
JP6384242B2 (ja) | 2018-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220156643A1 (en) | Using Machine Learning to Predict Outcomes for Documents | |
US10990631B2 (en) | Linking documents using citations | |
Lee et al. | Mining perceptual maps from consumer reviews | |
US11138284B2 (en) | Systems and methods for determining credibility at scale | |
Lopez Barbosa et al. | Evaluating hotels rating prediction based on sentiment analysis services | |
US20110258054A1 (en) | Automatic Generation of Bid Phrases for Online Advertising | |
Wang et al. | Customer-driven product design selection using web based user-generated content | |
US11392631B2 (en) | System and method for programmatic generation of attribute descriptors | |
CN107798622B (zh) | 一种识别用户意图的方法和装置 | |
US11055745B2 (en) | Linguistic personalization of messages for targeted campaigns | |
Ahmed et al. | Thematic analysis on user reviews for depression and anxiety chatbot apps: machine learning approach | |
Nam et al. | Structuralizing biomedical abstracts with discriminative linguistic features | |
JP6384242B2 (ja) | 情報分析装置、情報分析方法、及び、プログラム | |
Birari et al. | Perception and Practices of EdTech Platform: A Sentiment Analysis | |
Dey et al. | Applying Text Mining to Understand Customer Perception of Mobile Banking App | |
Downer et al. | All work and no play: A text analysis | |
Wilmink et al. | On the ability of lightweight checks to detect ambiguity in requirements documentation | |
Ljajić et al. | Sentiment analysis of textual comments in field of sport | |
Wang et al. | Word intuition agreement among Chinese speakers: a Mechanical Turk-based study | |
Tsai et al. | Aspect-category-based sentiment classification with aspect-opinion relation | |
He et al. | Developing a workflow approach for mining online social media data | |
JP2012146046A (ja) | 要求獲得支援装置、要求獲得支援方法、およびプログラム | |
Sembodo et al. | Review Restaurant with Descriptive and Predictive Mining Based on Spatiotemporal Data Analytics | |
Chiu et al. | App review analytics of free games listed on google play | |
Aini et al. | Application of the Naive Bayes Method for Sentiment Analysis of Sunscreen Product Reviews Based on the Female Daily Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170727 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6384242 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |