JP2014081882A - トレンド分析装置、方法及びプログラム - Google Patents

トレンド分析装置、方法及びプログラム Download PDF

Info

Publication number
JP2014081882A
JP2014081882A JP2012230957A JP2012230957A JP2014081882A JP 2014081882 A JP2014081882 A JP 2014081882A JP 2012230957 A JP2012230957 A JP 2012230957A JP 2012230957 A JP2012230957 A JP 2012230957A JP 2014081882 A JP2014081882 A JP 2014081882A
Authority
JP
Japan
Prior art keywords
keyword
trend
trend analysis
data
diffusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012230957A
Other languages
English (en)
Other versions
JP5940955B2 (ja
Inventor
Masayuki Chikamatsu
昌幸 親松
Kazue Hiroi
和重 廣井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012230957A priority Critical patent/JP5940955B2/ja
Publication of JP2014081882A publication Critical patent/JP2014081882A/ja
Application granted granted Critical
Publication of JP5940955B2 publication Critical patent/JP5940955B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
ソーシャルメディアからのトレンド抽出において、マスメディアのみの利用者やソーシャルメディアでの潜在的な利用者を含むトレンドを抽出する。
【解決手段】
トレンド分析装置は、マスメディアから収集したメタデータを分析してマスメディアトレンドキーワードを抽出するマスメディアトレンド分析手段を有し、前記マスメディアトレンドキーワードとソーシャルメディアデータからキーワード拡散度データを算出するソーシャル拡散度解析手段を有し、キーワード拡散度と商品マスタを用いて利用者の業務にとって好適なトレンドキーワードを抽出する手段を有している。
【選択図】 図2

Description

本発明は、マスメディアから抽出したキーワードからソーシャルメディアにおけるトレンドを抽出するトレンド分析装置、トレンド分析方法及びプログラムに関する。
近年、口コミサイト、ブログ、SNS(Social Networking Service)の普及が進んでおり、企業側からの宣伝方法において、従来のテレビCM等による一方的な広告発信だけでなく、ソーシャルメディアを通じた消費者との対話によるマーケティングが注目されている。消費者はある商品の購入動機として、ソーシャルメディアによる友人からの口コミを最も重要視するようになっている。よってソーシャルメディアの中で行われる人々の会話の中から流行の可能性のある商品や製品を抽出して、売上予測や在庫管理の効率化への活用が望まれている。
本技術分野の背景技術として、特開2010−20731号公報(特許文献1)がある。この公報には、「将来的に流行につながる可能性の高い情報を早期かつ確実に発見することができる情報分析装置及び情報分析プログラム」について記載されている(要約参照)。
特開2010−20731号公報
特許文献1では流行する可能性のあるトレンドキーワード候補を抽出しているが、トレンドキーワード候補の抽出方法としてキーワードの出現頻度の高いものとして決定している。そのため単に発言頻度の高いユーザが発言したキーワードがランキング上位に位置付けられてしまう。発言頻度の高いユーザの発言が必ずしも多くのユーザに閲覧されているとは限らないため、発言の多いキーワードが流行を生み出すとは一意には言えない。
また、特許文献1ではトレンドキーワードの抽出元としてソーシャルメディアで出現した未知語を対象としている。そのためソーシャルメディアを利用していない消費者からのトレンドキーワードを抽出することができない。またソーシャルメディアの発言から得られたキーワードは非常に数が多く、一つ一つ評価すると多大な時間を要する。以上のことからトレンドキーワードの抽出精度が低下する可能性がある。
上記課題を解決するために、例えば下記の構成を採用する。
本願のトレンド分析装置は、マスメディアから収集したメタデータを分析してマスメディアトレンドキーワードを抽出するマスメディアトレンド分析手段を有し、前記マスメディアトレンドキーワードとソーシャルメディアデータから、マスメディアを発信源とするキーワードが、ソーシャルメディアを通じた拡散によって認知される度合いを示すキーワード拡散度データを算出するソーシャル拡散度解析手段を有し、キーワード拡散度と商品マスタを用いて利用者の業務にとって好適なトレンドキーワードを抽出する手段を有している。
本発明によって、マスメディアを発信源とするトレンドキーワードに対してソーシャルメディアにおける拡散度合いを考慮したトレンドキーワードを抽出することにより、トレンドキーワードの精度を高め、より広い範囲の消費者を考慮したトレンドキーワードを抽出することができる。
また、本発明によって、トレンドキーワードと商品リストの照合を行うことにより、業務にとって最適なトレンドキーワードを簡単な作業で抽出することができるようになる。
実施例1、2に係るトレンド分析装置の構成図の例である。 実施例1に係るトレンド分析プログラムの構成図の例である。 実施例1、2に係るメタデータの例である。 実施例1、2に係るマスメディアトレンドキーワードデータの例である。 実施例1、2に係るマスメディアトレンド分析部の処理フローの例である。 実施例1、2に係るソーシャルメディアデータの例である。 実施例1、2に係る肯定的キーワード拡散度データの例である。 実施例1、2に係る否定的キーワード拡散度データの例である。 実施例1、2に係るソーシャル拡散度解析部の処理フローの例である。 実施例1、2に係る商品リストの例である。 実施例1、2に係るトレンド分析装置のユーザインターフェイス画面例である。 実施例1、2に係るトレンド分析結果表示部の処理フローの例である。 実施例2に係るトレンド分析プログラムの構成図の例である。 実施例2に係る売り上げデータの例である。 実施例2に係る売り上げデータ比較部の処理フローの例である。 実施例2に係る売り上げデータとキーワード拡散度データの関係事例を説明する図である。 実施例2に係る売り上げデータとキーワード拡散度データの関係事例を説明する図である。 実施例2に係る売り上げデータと需要予測結果及びキーワード拡散度データの関係事例を説明する図である。
以下、実施例を、図面を用いて詳細に説明する。
図1は、本実施例のトレンド分析装置の構成図の例である。トレンド分析装置はCPU101、主記憶装置102、補助記憶装置103、入力装置104、出力装置105、チューナ106、アンテナ107及びネットワークインターフェイス108から構成される。これらの装置はバス109を介して接続されており、バス109を経由してそれぞれデータの入出力を行う。
CPU101は、主記憶装置102中のトレンド分析プログラムの指令を受け、トレンド分析プログラムにおけるデータ入力、計算、データ出力等の様々な処理を実行する。
主記憶装置102には、CPU101で処理されるプログラム、及びデータなどが格納される。主記憶装置102は例えばRAM等の不揮発性のメモリである。
補助記憶装置103は、トレンド分析装置が扱うデータやプログラム全体を格納する装置であり、CPU101の命令により主記憶装置102へのデータ入出力を行う。補助記憶装置103は、例えばHDD(Hard Disk Drive)等の磁気ディスクやDVD等の光学ディスク等で構成され、複数台で構成される場合がある。
入力装置104は、トレンド分析装置を使用するユーザの指示を受け取りCPU101へ伝達する。入力装置104は、例えばキーボードやマウスやタッチパネル等で構成される。
出力装置105は、CPU101の指示に基づいてトレンド分析装置のユーザインターフェイス画面を表示する装置である。出力装置105は液晶ディスプレイ等である。
チューナ106は、アンテナ107が受信した電波からテレビやラジオ等の放送に関連するデータ(マスメディアデータ)を抽出して主記憶装置102や補助記憶装置103に出力する装置である。
アンテナ107は、テレビやラジオ等の放送に用いられる電波を受信してチューナ106へ出力する装置である。
ネットワークインターフェイス108は、インターネットを介してソーシャルメディアデータ等のデータ送受信を行う装置である。ネットワークインターフェイス108の送受信する内容はCPU101により制御される。ネットワークインターフェイス108は例えばNIC(Network Interface Card)や無線LANインターフェイスカードなどで構成される。
本実施例では、トレンド分析装置におけるトレンド分析方法及びプログラムの例を説明する。
図2は、図1のCPU101で実行されるトレンド分析プログラムの構成図の例である。トレンド分析プログラムはマスメディアデータ201、メタデータ取得部202、メタデータ203、マスメディアトレンド分析部204、マスメディアトレンドキーワードデータ205、ソーシャルメディアデータ210、ソーシャルメディアデータ収集部211、辞書データ212、蓄積ソーシャルメディアデータ213、ソーシャル拡散度解析部214、キーワード拡散度データ215、商品マスタ220、キーワードランキング生成部221、トレンド分析結果表示部222で構成される。
図2に示したトレンド分析プログラムを、計算機で読み取り可能な記憶媒体に格納し、これを図1に示した主記憶装置102に読み込んでCPU101で実行することもできる。
図2においてメタデータ取得部202、マスメディアトレンド分析部204、ソーシャルメディアデータ収集部211、ソーシャル拡散度解析部214、キーワードランキンング生成部221、トレンド分析結果表示部222は、図1のCPU101で実行されるプログラムである。また、マスメディアデータ201、メタデータ203、マスメディアトレンドキーワードデータ205、ソーシャルメディアデータ210、辞書データ212、蓄積ソーシャルメディアデータ213、キーワード拡散度データ215、商品マスタ220は図1の主記憶装置102に格納されるが、データ量等の必要に応じて補助記憶装置103へ格納してもよい。
マスメディアデータ201は、図1のチューナ106やネットワークインターフェイス108を介して取得する、テレビや雑誌、新聞等のマスメディアから発信されるデータである。マスメディアデータ201がデジタルテレビ放送の場合、動画や音声が多重化されたTS(Transport Stream)パケットとなっている。また、マスメディアデータ201が、雑誌、新聞等の場合は、新聞社や雑誌社が保有する記事データやYahoo(登録商標)等のWebサイトから記事データをインターネット経由で取得する。
ここで、図2に示したトレンド分析方法の処理概要を以下に示す。(5−2)の各ステップの末尾の( )内は図11の各ステップの符号である。(6)は後述する実施例2で追加される処理である。
(1)メタデータ取得:マスメディアデータからテキスト(メタデータ)生成
(2)トレンド分析:
(2−1)メタデータからキーワード抽出し、キーワードの出現数をカウント
(2−2)キーワードの発信元の数とTF−IDFとからスコア算出
(TF−IDF:キーワードの特徴の度合いを示す指標)
(3)ネットワークからソーシャルメディアデータ収集
(4)ソーシャル拡散度解析:
(4−1)キーワードが含まれるソーシャルメディアデータから拡散を目的とする
発言数算出
(4−2)肯定的発言数と拡散目的の発言数とに基づいてキーワード拡散度算出、
否定的発言についても同様に算出
(5)キーワードランキング生成:
(5−1)商品マスタを提示してトレンド分析対象を選択
(5−2)ランキング生成とトレンド分析結果の表示:
(a)キーワードのスコアを算出してマスメディアトレンドキーワード生成(1102)
(b)マスメディアトレンドキーワードを用いてキーワード拡散度生成(1103)
(c)キーワード拡散度データに含まれるキーワードを元に、商品スコアを算出
して、商品マスタに含まれる各商品のランキング生成(1104)
(d)商品スコアの高い順にキーワード表示(1105)
(e)マスメディアトレンドキーワードと利用者によって選択されたキーワードを
照合して選択されたキーワードの発生回数取得(1106)
(f)選択されたキーワードに対する、ソーシャルメディアでのキーワード拡散
度取得(1107)
(g)発生回数とキーワード拡散度を表示(1108)
(6)売り上げデータ比較(実施例2):
(6−1)トレンドキーワードに対応する商品の売り上げデータ取得
(6−2)トレンド分析期間前の売り上げデータから商品の需要を予測し、
キーワード拡散度に基づいて補正
以下では各処理の詳細を説明する。
(1)メタデータ取得
メタデータ取得部202は、取得したマスメディアデータ201を処理してメタデータ203を生成する。図3にメタデータ203の一例を示す。
メタデータ203は出現時刻301とテキスト302で構成される。出現時刻301はテキスト302を取得した時刻、あるいはテキスト302が出現した時刻を示す。テキスト302はメタデータ取得部202がマスメディアデータ201より取得した文字データを示す。例えばマスメディアデータ201がデジタルテレビ放送の場合、メタデータ取得部202は動画に含まれているテロップ、音声データ、字幕データ、EPG(Electronic Program Guide:電子番組表)を文字データに変換してテキスト302を生成し、出現した時刻を出現時刻301としてメタデータ203に保存する。デジタルテレビのデータを文字データに変換する方法については、テロップ認識や音声認識等の公知の手法を用いる。また、マスメディアデータ201が新聞や雑誌の記事データの場合、記事データに含まれる文字データをテキスト302とし、その記事が掲載された時刻を出現時刻301として保存する。
なお、メタデータ203はデジタルテレビ放送の番組単位や雑誌や記事の区切りを一つの単位として保存する。またメタデータ203には番組名や番組ジャンル、出演者などの情報を保存してもよい。
(2)マスメディアトレンド分析
再び図2の説明に戻る。マスメディアトレンド分析部204は、メタデータ取得部202が生成したメタデータ203を処理して、マスメディアトレンドキーワードデータ205を出力する。図4にマスメディアトレンドキーワードデータ205の一例を示す。
マスメディアトレンドキーワードデータ205は、マスメディアにおける各キーワードの出現状況を示し、順位401、キーワード402、スコア403、発生回数404で構成される。順位401は、各キーワードの順位を示し、当該順位はスコア403により決定する。キーワード402は、図2のメタデータ203より抽出したキーワードを示す。スコア403は、メタデータ203がマスメディアトレンド分析部にとって処理される際に算出される数値である。発生回数404は、キーワード402に対して、表示された日付毎にメタデータ203に含まれる回数を示したものである。
なお、図4の例では順位401が1位から50位までのキーワードを表示した例を示しているが、マスメディアトレンドキーワードデータ205へ保存するキーワードの数はマスメディアトレンド分析部204が一意に決定してもよい。また、ユーザからの指示によりキーワード数を変更してもよい。
また、マスメディアトレンドキーワードデータ205は、特定の期間毎に別表あるいは別ファイル等で分けて保存してもよい。
(2−1)キーワード抽出
次に、マスメディアトレンド分析部204の処理フローを図5に示す。マスメディアトレンド分析部204はCPU101の指示により処理を開始すると、メタデータ取得部202が生成したメタデータ203を取得する(ステップ501)。ステップ501で取得するメタデータ203は、CPU101より指定された期間内における、マスメディアがデジタルテレビの場合は1番組分、マスメディアが雑誌や新聞の場合は1記事分のデータとなる。
続いて、マスメディアトレンド分析部204は、ステップ501で取得したメタデータ203からキーワードを抽出する(ステップ502)。ステップ502で抽出するキーワードは、図3のテキスト302に対して例えば公知の技術である形態素解析を適用して、名詞のみを抽出する。また、形態素解析の結果で名詞が連続していた場合は連結して一つの名詞で出力してもよい。あるいは別途辞書データを用意して、辞書データとテキスト302の照合によりキーワードを抽出してもよい。また、テキスト302が、デジタルテレビ放送のEPGのように構成が特徴的な文章であれば、特定の節のみを処理対象として(例えばEPGの番組説明のみを対象とする)キーワードを抽出してもよい。ステップ502でのキーワードは、メタデータ203に含まれる図3の全ての出現時刻301のテキスト302に対して形態素解析を行う。
続いて、マスメディアトレンド分析部204は、ステップ502で抽出したキーワードに対して、メタデータ203の中での出現数をカウントする(ステップ503)。抽出したキーワードに対して、図3の全てのテキスト302に含まれる数を求めて出現数として出力する。
続いて、マスメディアトレンド分析部204は、CPU101から指定された期間内において残りのメタデータ203があるか否かをチェックする(ステップ504)。ステップ504において、残りのメタデータ203があると判定された場合はステップ501に戻り、次のメタデータ203に対して処理を行う。一方、ステップ504において、残りのメタデータが含まれないと判定された場合はステップ505に進む。
(2−2)キーワードスコアの算出
続いて、マスメディアトレンド分析部204は、デジタルテレビ放送の番組等の区切り単位で、各キーワードに対するTF−IDF(Term Frequency-Inverse Document Frequency)を算出する(ステップ505)。TF−IDFは文章中の単語に対する重み付けを行う公知の手法であり、文書中に出現した特定の単語(キーワード)がどのくらい特徴的であるかを識別する指標であって、単語の出現頻度と逆文書頻度の二つの指標(の積)に基づいて計算される。前述の単語の出現頻度は、ステップ503で算出したキーワード出現数を用いる。本実施例でTF−IDFを用いるのは、複数のメタデータ203で用いられるような一般語をフィルタするためである。つまり、特定のメタデータ203にしか出現しない単語の重要度を上げる役割を果たす。本実施例では、流行の商品はある特定の番組や記事で取り上げられることが発端になることが多いことに着目している。
続いて、マスメディアトレンド分析部204は、ステップ505で算出した各キーワードのTF−IDFに対して、キーワードが出現した番組や記事の情報、あるいは出演者を考慮した重み付けを行う(ステップ506)。例えば食品に関する流行商品を知りたい場合には、番組ジャンルが音楽やバラエティよりも、番組ジャンルが情報の番組を発信源とするキーワードの方を視聴者が信用する傾向にある。また、同じジャンルの番組であっても特定の出演者の発言が信頼される可能性がある。マスメディアデータが新聞や雑誌の場合は例えば記事の発行元や記事のライターによって評価が異なる。本ステップでは前記の考えの元、キーワードjに対するマスメディアトレンドキーワードスコアを数1で算出する。
〔数1〕 TMS(j)=TFIDF(j)(+)
TMS(j):キーワードjに対するマスメディアトレンドキーワードスコア
TFIDF(j):キーワードjに対するTF-IDF
d(j,g):ジャンルgの番組もしくは記事に対してキーワードjが含まれている数
α(g):ジャンルgに対する重み付け
G:総ジャンル数
f(j,k):出演者kの出演する番組(もしくはライターkが記載した記事)に対してキーワードjが含まれている数
β(k):出演者kに対する重み付け
K:総出演者数
本ステップで算出したTMS(j)を図4のスコア403として出力する。なお本実施例では番組ジャンルや出演者による重み付けの例を示したが、これらの重み付けに対するルール表を装置内で予め用意していてもよい。また、検出したいキーワードの種類や時代によって変化する可能性があるため、出演者やジャンルに対する重み付けを修正できるような仕組みを設けてもよい。また、出演者やジャンルの評価だけでなく、視聴率や記事のビュー数等の他のパラメータによる重み付けを行ってもよい。
再び図5のフローの説明に戻る。マスメディアトレンド分析部204は、ステップ506の後に、マスメディアトレンドキーワードデータ205に出力する(ステップ507)。ステップ501〜506の処理で検出したキーワードを、図4のキーワード402に、またステップ506で算出したTMS(j)をスコア403にそれぞれ格納する。また指定期間における時間ステップ単位でキーワードが出現した回数を求めて、発生回数404に出力する。一方、図4のようにキーワード402に対して、スコア403が大きい順番になるように入れ替えて出力してもよい。また、キーワードの数に制限を設けるようにしてもよい。例えばスコアの大きい上位50個のキーワードを出力してもよい。
マスメディアトレンド分析部204はステップ507でマスメディアトレンドキーワードデータ205を出力した後に処理を終了する。
(3)ソーシャルメディアデータ収集
再び図2の説明に戻る。ソーシャルメディアデータ210は、ブログやSNS等のネットワーク上のソーシャルメディアの構成データである。例えばソーシャルメディアデータ210は、運用されるサービスによってデータ形式が決まっており、HTMLやXML等の構造化されたデータやJSON(JavaScript Object Notation(登録商標)、データ記述言語の一種)等の構造が特に定まっていないデータ等様々な形式である。
ソーシャルメディアデータ収集部211は、図1のネットワークインターフェイス108を介してネットワークからソーシャルメディアデータ210を収集して、蓄積ソーシャルメディアデータ213として本実施例に係るトレンド分析装置内に保存する。ソーシャルメディアデータ収集部211は、ソーシャルメディアデータ210を収集する際、ブログやSNSが公開している取得手段やAPIを用いてデータを取得する。また、取得したソーシャルメディアデータは、データ量が膨大になるため、予め辞書データ212に含まれる単語を含むデータで限定する、あるいは辞書データ212に含まれる単語を含むデータを除外するようにしてもよい。
蓄積ソーシャルメディアデータ213は、ソーシャルメディアデータ収集部211が収集したソーシャルメディアデータ210を装置内に保存するための形式に変換したものである。蓄積ソーシャルメディアデータ213の例を図6に示す。
蓄積ソーシャルメディアデータ213は、発言ID601、発言者ID602、発言日時603及び発言内容604で構成される。発言ID601は、各発言を区別するための任意の文字列あるいは数値からなる識別子である。発言者ID602は、各発言を発言した人を特定するための識別子である。例えばソーシャルメディアデータ210がブログの場合はブログの作者名やユーザ名、ソーシャルメディアデータ210がSNSの場合は、ユーザ名とすることができる。複数のサービスのソーシャルメディアデータを収集する場合には、発言者ID602の中にサービスを識別する文字列(例えばURLやドメイン名)を挿入してもよい。発言日時603は、ブログやSNSにおいて記事が掲載された日時を示す。発言内容604はブログやSNSにおいて掲載された記事のテキスト部分である。
(4)ソーシャル拡散度解析
(4−0)キーワード拡散度データ
再び図2の説明に戻る。ソーシャル拡散度解析部214は、CPU101より指定された期間における蓄積ソーシャルメディアデータ213及びマスメディアトレンドキーワードデータ205を解析して、キーワード拡散度データ215を生成する。キーワード拡散度データ215の例を図7A及び図7Bに示す。
キーワード拡散度データ215は、図7A及び図7Bに示す通り拡散度順位701、キーワード名702、平均キーワード拡散度703及びキーワード拡散度704で構成される。キーワード拡散度データ215は、マスメディアを発信源とするキーワードが指定期間内においてソーシャルメディア上で時間とともに拡散する状況を表すデータである。キーワード拡散度データ215において図7Aと図7Bはデータの形式は同じであるが、それぞれのキーワードに対して肯定的な意見及び否定的な意見それぞれに対して後述するキーワード拡散度を算出するために、別データとして用意する。
図7A及び図7Bにおいて、拡散度順位701は各キーワードに対する平均キーワード拡散度703の順位を示す。キーワード名702は、指定期間内においてマスメディアトレンドキーワードデータ205から取得したキーワードを示す。平均キーワード拡散度703は、指定期間内におけるキーワード拡散度704の平均値である。キーワード拡散度704は、ソーシャル拡散度解析部214が後述の方法により算出した、ソーシャルメディアにおけるキーワード名702の拡散度(情報伝搬の度合い)を示す数値である。
(4−1)発言内容の分析
次に、ソーシャル拡散度解析部214の処理フローを図8に示す。ソーシャル拡散度解析部214はCPU101の指示により処理を開始すると、マスメディアトレンドキーワードデータ205の図4におけるキーワード402を含み、且つ、指定された期間内に含まれる蓄積ソーシャルメディアデータ213を取得する(ステップ801)。本ステップでは、例えば、図4において「オリンピック」や「うなぎ」等のマスメディアトレンドキーワードデータ205に含まれる各キーワードに対して、蓄積ソーシャルメディアデータ213における図6の発言内容604の中を検索し、当該キーワードを含む蓄積ソーシャルメディアデータを取得する。
続いて、ソーシャル拡散度解析部214は、ステップ801の次に、各キーワードが含まれる蓄積ソーシャルメディアデータ213に対して拡散目的の発言数を算出する(ステップ802)。本ステップでは、ステップ801で抽出したキーワードを含む蓄積ソーシャルメディアデータ213の発言内容604を解析して、ソーシャルメディアにおける拡散を目的とした発言数を算出する。本ステップで、発言内容604がソーシャルメディアにおける拡散を目的としているか否かの判別方法は、例えばソーシャルメディアがSNSのTwitterである場合には、公式RT(発言内容の先頭にRTが含まれる)や#で始まるハッシュタグの内容から拡散目的であるかどうかを判定する。前記Twitterの例のようにSNSやブログ等のソーシャルメディアサービスでは、容易に発言内容の拡散を促すルールが公式もしくは非公式に存在する。前記ルールを解釈して、発言内容604が拡散目的の発言数を算出する。
続いて、ソーシャル拡散度解析部214は、ステップ802の次に、図6の発言者ID602に対するフォロー数を算出する(ステップ803)。本ステップでは、ステップ801で抽出したマスメディアトレンドキーワード205の各キーワードを含む蓄積ソーシャルメディアデータ213について、各発言者ID602のフォロー数を求める。SNSやブログ等では、発言者が承認した他の利用ユーザに発言内容を自動的に通知あるいはホーム画面上に表示する仕組みを持たせている場合が多い。フォロー数とは、前記発言者が承認、あるいは未承認の場合でも、ソーシャルメディアサービスが把握している発言者の内容が自動的に通知もしくはホーム画面等に表示されるような利用ユーザの数である。例えば、ソーシャルメディアサービスがSNSのTwitterの場合、フォロワーと呼ばれる利用ユーザの数である。本ステップでは、各キーワードに対してフォロー数の合計を算出する。
続いて、ソーシャル拡散度解析部214は、ステップ803の後に、図6の発言内容604の意見分析を行う(ステップ804)。本ステップでは、発言内容604の内容を、肯定的意見、否定的意見あるいは中立意見のいずれかに分類する。発言内容604の分類方法は、例えば辞書データ212に肯定、否定を表す単語を用意しておき、肯定あるいは否定の単語が含まれているかどうかの判定により分類する。あるいは、辞書に含まれる単語ではなく、肯定、または否定の単語を複数組み合わせることで肯定、または否定の表現を判定するといったルールで判別してもよい。もし後者で判定する場合には、発言内容604に対して予め形態素解析を行うといった処理を施してもよい。
(4−2)拡散度の算出
続いて、ソーシャル拡散度解析部214は、ステップ804の後に、キーワード拡散度を算出する(ステップ805)。キーワード拡散度はマスメディアを発信源とするキーワードが指定期間内においてソーシャルメディア上で時間とともに拡散する状況を表すデータである。本実施例におけるキーワード拡散度の定義は、マスメディアトレンドキーワードデータ205に含まれるキーワードをソーシャルメディアサービスの利用者が注目することで発言され、当該発言を閲覧する可能性のある他の利用者へキーワードが拡散する様子を表す指標である。本実施例では、キーワード拡散度の高いキーワードが、潜在する利用ユーザへの認知度が高く、急激な売り上げ増加等、流行の候補になり易いと捉えている。また、キーワードを含む意見が肯定的、または否定的それぞれに意味があるため、肯定的、または否定的な意見に分けて拡散度を算出する。
キーワード拡散度の算出には、マスメディアトレンドキーワードデータ205に含まれる図4のスコア403、ステップ802で算出した拡散目的の発言数、ステップ803で算出したフォロー数、ステップ804の意見分析結果を用いる。具体的には数2によりキーワードjに対するキーワード拡散度を算出する。
〔数2〕 KPS(j)=TMS(j)(+)
KSP(j):キーワードjに対するキーワード拡散度
TMS(j):キーワードjに対するマスメディアトレンドキーワードスコア
tpos(j,m):キーワードjを含む肯定的発言mの肯定度合い
follow(m):肯定的発言mの発言者に対するフォロー数
M:総発言数
rtpos(j,n):キーワードjを含む拡散目的の肯定的発言nの肯定度合い
rfollow(n):拡散目的の肯定的発言nの発言者に対するフォロー数
数2は肯定的意見のキーワード拡散度を算出する例を示している。否定的意見のキーワード拡散度については同様の計算方法で算出すればよい。このキーワード拡散度を特定の時間単位で算出する。
ここで、tpos(j,m)はステップ804の意見分析結果において、肯定度合いを考慮している。例えば肯定の感情の強さを表す指標を辞書データ212やステップ804の意見分析で与えるようにしてもよい。または、必ずしもtpos(j,m)については必須ではなく、全ての意見を同等の感情の強さで扱ってもよい。
また、ステップ804において蓄積ソーシャルメディアデータの発言内容604が中立意見であるかどうかを分析している。中立意見についても数2で同様に算出し、肯定的及び否定的意見のキーワード拡散度それぞれに適当な重み付けを施した結果を加算するようにしてもよい。
再び図8の説明に戻る。続いて、ソーシャル拡散度解析部214は、ステップ805で算出したキーワード拡散度に対して期間内の平均を算出する(ステップ806)。その後、ソーシャル拡散度解析部214における解析結果である図7A及び図7Bのキーワード名702、平均キーワード拡散度703及びキーワード拡散度704の出力と、当該出力結果を平均キーワード拡散度703の高い順番に並べ替えて、拡散度順位701を付与して、図2のキーワード拡散度データ214として出力する。以上でソーシャル拡散度解析部214の処理を終了する。
図8のステップ806においてソーシャル拡散度解析部214は期間内のキーワード拡散度に対する平均を算出して出力したが、他にも期間内のキーワード拡散度の中央値、最大値、最小値あるいはキーワード拡散度の時間微分の最大値等を出力してもよい。その場合にはキーワード拡散度データ214は、前述の中央値、最大値、最小値等を含むようにしてもよい。また、拡散度順位701は、前述の中央値、最大値、最小値等で決定してもよい。
(5)キーワードランキング生成
(5−0)商品マスタ
再び図2の説明に戻る。商品マスタ220は、本実施例におけるトレンド分析装置の利用者あるいは企業で扱っている商品あるいは扱う可能性のある商品の一覧である。商品マスタ220の一例を図9に示す。
商品マスタ220は、図9に示す通り、商品名901、商品ジャンル902、販売価格903、リードタイム904、取り扱いステータス905、商品説明906で構成される。商品名901は本実施例におけるトレンド分析装置の利用者あるいは企業で取り扱っている商品の商品名を示す。商品ジャンル902は商品の分類名を示す。図9は例えば小売業で扱っている商品の例であり、鮮魚、惣菜等が設定される。販売価格903は、商品の販売価格を示す。リードタイム904は、本実施例におけるトレンド分析装置の利用者あるいは企業で取り扱っている商品を注文後に入荷するまでに要する期間を示す。取り扱いステータス905は、本実施例におけるトレンド分析装置の利用者あるいは企業で商品を取り扱っているか否かを示す。商品説明906は商品に関する説明が記載された文章である。例えば商品に関する売り文句等を記載する。
なお、商品マスタ220はトレンド分析装置の利用者が修正する仕組みを用意してもよい。また、商品マスタ220は、図9の項目を別のテーブルに分割してもよい。例えば図9の商品マスタ220において、取り扱いステータス905の項目をなくし、取り扱っている商品と取り扱っていない商品のそれぞれのテーブルを用意してもよい。
再び図2の説明に戻る。キーワードランキング生成部221は、ソーシャル拡散度解析部214によって生成されたキーワード拡散度データ215に対して、商品マスタ220を組み合わせて処理することによって、本実施例におけるトレンド分析装置の利用者あるいは企業にとって有用なトレンド情報を抽出する。キーワードランキング生成部221の動作については後述する。
(5−1)トレンド分析結果表示の内容
トレンド分析結果表示部222は、本実施例におけるトレンド分析装置の利用者に対して図1の出力装置105に出力するユーザインターフェイス画面を構成する役割を担う。また、トレンド分析結果表示部222は、ユーザインターフェイス画面に対する本実施例におけるトレンド分析装置の利用者からの指示を入力装置104から受け付ける役割を担う。図10にトレンド分析結果表示部222で出力されるユーザインターフェイス画面の一例を示す。
トレンド分析結果表示部222で出力されるユーザインターフェイス画面は、図10に示すように、マスメディア設定1001、トレンド商品数設定1002、トレンド分析期間設定1003、商品フィルタ設定1004、トレンドキーワード表示1005、マスメディア取り上げ回数表示1006、肯定意見キーワード拡散度表示1007、否定意見キーワード拡散度表示1008で構成される。
マスメディア設定1001は、図2のメタデータ203のうち、TVや雑誌等のどのマスメディアデータからのトレンドを抽出するかを選択する。マスメディア設定1001で表示されている項目のうち一部あるいは全部の項目を選択してもよい。
トレンド商品数設定1002は、トレンドキーワード表示1005に表示するキーワード数を設定する。
トレンド分析期間設定1003は、本実施例におけるトレンド分析装置が分析対象とする期間及び分析期間の粒度(例えば1日単位)を設定する。
商品フィルタ設定1004は、本実施例におけるトレンド分析装置が商品マスタ220の中から分析対象を制限するための設定項目である。例えば商品マスタ220の中で商品ジャンル902、販売価格903、リードタイム904、取り扱いステータス905に含まれる項目をトレンド分析結果表示部222が解釈して、利用者に対して選択できるようにしてもよい。商品フィルタ設定1004で利用者が指定した項目に該当する商品リスト220に含まれる商品が、トレンドキーワード表示1005の対象となる。
トレンドキーワード表示1005は、キーワードランキング生成部221の算出結果を表示する。トレンドキーワード表示1005に表示する項目は、順位(#)1005a、キーワード名1005b、及び後述する商品スコア1005cを出力する。また、トレンドキーワード表示1005において、本実施例におけるトレンド分析装置の利用者の指示により、マスメディア取り上げ回数表示1006、肯定意見キーワード拡散度表示1007、否定意見キーワード拡散度表示1008に表示する商品を設定することが可能で、利用者が選択した商品は選択部分の表示色を変更する等で分かり易く表示する。
マスメディア取り上げ回数表示1006は、トレンドキーワード表示1005で選択したキーワードに対して、マスメディアで取り上げられた回数を時系列で表示する。マスメディア取り上げ回数表示1006は、トレンドキーワード表示1005で選択したキーワード1005bを図2のマスメディアトレンドキーワードデータ205と照合して、該当するキーワードの図4における発生回数404を取得して表示する。また、複数のキーワードの発生回数404を表示してもよい。
肯定意見キーワード拡散度表示1007、及び否定意見キーワード拡散度表示1008は、トレンドキーワード表示1005で選択したキーワード1005bに対して、ソーシャルメディアでの図7A及び図7Bのキーワード拡散度704を表示する。また、複数のキーワードのキーワード拡散度704を表示してもよい。
本実施例におけるトレンド分析装置の利用者は、図10のようなユーザインターフェイス画面によって、利用者の業務で扱う商品に関するトレンド分析結果及びトレンド候補、及びトレンド候補を裏付けるマスメディア取り上げ回数やソーシャルメディアでのキーワード拡散度を確認することができる。
なお、本実施例においては、マスメディア取り上げ回数表示1006、肯定意見キーワード拡散度表示及び否定意見キーワード拡散度表示をそれぞれ別の領域で描画しているが、同じ領域で表示する手段を提供してもよい。その方が、選択した商品の、マスメディア取り上げ回数とキーワード拡散度の比較が容易になる。
(5−2)キーワードランキング生成の処理とトレンド分析結果の表示
次に、本実施例におけるトレンド分析装置の利用者が図10のユーザインターフェイス画面を操作した場合のトレンド分析結果表示部222の処理フローを図11に示す。また、図11の処理フローで、キーワードランキング生成部221の処理を併せて説明する。
本実施例におけるトレンド分析装置の利用者が図10のユーザインターフェイス画面を操作した場合、トレンド分析結果表示部は最初に、マスメディア設定1001、トレンド商品数設定1002、トレンド分析期間設定1003、商品フィルタ設定1004の各設定内容を取得する(ステップ1101)。
次に、トレンド分析結果表示部222は、ステップ1101で取得したマスメディア設定1001とトレンド分析期間設定1003により、マスメディアトレンド分析部204でのマスメディアトレンド抽出処理を実行する(ステップ1102)。マスメディアトレンド分析部204は、図5の処理フローに従ってキーワードスコア算出の処理を行ない、マスメディアトレンドキーワードデータ205を出力する。
次に、トレンド分析結果表示部222は、ステップ1101で取得したトレンド分析期間設定1003における、ソーシャル拡散度解析部214でソーシャル拡散度解析を実行する(ステップ1103)。ソーシャル拡散度解析部214は、蓄積ソーシャルメディアデータ213及びステップ1102で生成したマスメディアトレンドキーワードデータ205を用いて、図8のフローに従って処理を行い、キーワード拡散度データ215を生成する。
次に、トレンド分析結果表示部222は、ステップ1101で取得したトレンド商品数設定1002と商品フィルタ設定1004における、キーワードランキング生成部221でのキーワードランキング生成処理を実行する(ステップ1104)。
キーワードランキング生成部221は、キーワード拡散度データ215に含まれる各キーワードを元に、商品マスタ220に含まれる各商品のランキングを生成する。各キーワードが商品マスタ220の商品名901や商品ジャンル902、商品説明906等に含まれるかどうかを判定し、肯定的キーワード拡散度、及び否定的キーワード拡散度を一定のルールで加算して、図10のトレンドキーワード表示1005の商品スコア1005cを算出する。
前記商品スコア算出のルールの一例を挙げると、図7Aの肯定的キーワード拡散度データに「うなぎ」が含まれていた場合、「うなぎ」の肯定的キーワード拡散度データと否定的キーワード拡散度の平均を算出して商品スコア1005cとする。また、「うなぎの蒲焼き」等の「うなぎ」を含む商品は前述の(拡散度の)平均値に適当な重み付けで掛け算を行い、商品スコア1005cとする。
前記商品スコア算出のルールの他の例として図7Bの否定的キーワード拡散度に「電気代」が含まれていた場合、電気代を低く抑える商品が注目される可能性がある。よって、商品説明906に「省エネ」等の電気代を改善するキーワードが含まれる家電製品の商品スコアに「電気代」の否定的キーワード拡散度を加算する。一方、電気代を改善するようなキーワードが含まれない家電製品の商品スコアに、否定的キーワード拡散度に適当な割合を掛けた値を加算する。
前記商品スコア算出のルールの他の例として図7Bの否定的キーワード拡散度に「蚊」が含まれていた場合、蚊の殺虫剤が注目される可能性がある。よって、商品説明に「蚊に効く」が含まれる殺虫剤Bの商品スコアに否定的キーワード拡散度を加算する。
なお、キーワードランキング生成部221の商品スコアの算出ルールは、利用者が独自に設定できるようにしてもよい。
再び図11の説明に戻る。トレンド分析結果表示部222は、キーワードランキング生成部221の結果を受け取り、ステップ1104の後にステップ1104で算出した商品スコアの高い順番で、図10のトレンド商品数設定の個数分のキーワードとその商品スコアを図10のトレンドキーワード表示1005に表示する(ステップ1105)。
次に、トレンド分析結果表示部222は、トレンドキーワード表示1005でキーワードが選択されている場合、図2のマスメディアトレンドキーワードデータ205と照合して、該当するキーワードの図4における発生回数404を取得する(ステップ1106)。トレンドキーワード表示1005でキーワードが選択されていない場合は何も処理をせずに次のステップへ進む。
次に、トレンド分析結果表示部222は、トレンドキーワード表示1005でキーワード1005bが選択されている場合、トレンドキーワード表示1005で選択したキーワードに対して、ソーシャルメディアでの図7A及び図7Bのキーワード拡散度704を取得する(ステップ1107)。トレンドキーワード表示1005でキーワードが選択されていない場合は何も処理をせずに次のステップへ進む。
次に、トレンド分析結果表示部222は、トレンドキーワード表示1005でキーワード1005bが選択されている場合、ステップ1106で取得した発生回数404を図10のマスメディア取り上げ回数表示1006へ表示し、同時に、ステップ1107で取得したキーワード拡散度704を肯定意見キーワード拡散度表示1007、及び否定意見キーワード拡散度表示1008に表示して処理を終了する(ステップ1108)。トレンドキーワード表示1005でキーワード1005bが選択されていない場合は何も表示せずに処理を終了する。
以上により、本実施例におけるトレンド分析装置の利用者は、マスメディアを発信源とするトレンドキーワードがソーシャルメディア上で時間とともに拡散するその拡散度を考慮したトレンド分析を、利用者本人が扱う業務範囲で最適な結果の簡易な操作で得ることができる。
なお、本実施例においては、マスメディアデータ201を受信して、トレンドキーワードを抽出したが、将来的に流行の発信源として信頼のある新規メディアが出現した場合には、当該新規メディアデータからテキストデータを抽出してトレンドキーワード抽出を行ってもよい。
また、本実施例においては、商品マスタ220は本実施例におけるトレンド分析装置の利用者の業務に応じた内容になってもよい。例えば本実施例におけるトレンド分析装置の利用者が製造業であれば、自社及びライバル会社で扱っている製品リスト等となっていいてもよい。
また、本実施例におけるトレンド分析装置及び方法、プログラムは、必ずしも図1及び図2のように全ての機能を単一の処理装置で処理する必要はない。必要に応じて並列、分散処理が行えるように、図2に示した各処理を複数の処理装置のそれぞれで分担して実行してもよいものとする。例えば、情報の管理元や表示先に応じて、メタデータ取得部202とマスメディアトレンド分析部204を第1の処理装置で実行し、ソーシャルメディア収集部211とソーシャル拡散度解析部214を第2の処理装置で実行し、キーワードランキング生成部221とトレンド分析結果表示部222を第3の処理装置で実行するようにしてもよい。
本実施例では、トレンドキーワードの抽出だけでなく、売り上げデータとの比較及び需要予測との連動も行えるトレンド分析装置、トレンド分析方法及びプログラムの例を説明する。本実施例のトレンドキーワード装置の利用者は、売り上げデータの偶然的な変動の要因分析を行うことが可能となる。
図12は、実施例2における図2のCPU101で実行されるトレンド分析プログラムの構成図の例である。図2のトレンド分析プログラムの構成図のうち、既に説明した図2に示された同一の符号を付された構成と、同一の機能を有する部分については、説明を省略する。実施例2のトレンド分析プログラムでは、実施例1の図2のトレンド分析プログラムの構成に加えて、売り上げデータ1230、及び売り上げデータ比較部1231が追加されている。
売り上げデータ1230は、本実施例におけるトレンド分析装置の利用者が扱う商品マスタ220に記載された商品の売り上げデータである。売り上げデータ1230の一例を図13に示す。
売り上げデータ1230は、商品名1301と売上高1302で構成される。商品名1301は、商品マスタ220における図9の商品名901と同様である。売上高1302は、商品マスタ220に記載された製品の特定の期間内における売上高を示す。図13に示すように必要に応じて、日別、月別等の売上高を含む。一方、期間や日別、月別等の売上高を別表としてもよい。
なお、売り上げデータ1230の構成において商品マスタ220と関連付ける項目は必須であるが、必ずしも商品名である必要はない。例えば図9の商品マスタ220にユニークなIDを付与して、前記IDを売り上げデータ1230に付与してもよい。
(1)売り上げデータ比較
再び図12の説明に戻る。売り上げデータ比較部1231は、キーワードランキング生成部221で得られたトレンドキーワードと売り上げデータ1230における商品の売上高との比較、及び需要予測との連動に関する処理を行う。売り上げデータ比較部1231は例えば図11のステップ1104の後に実行してもよい。売り上げデータ比較部1231の処理フローを図14に示す。
売り上げデータ比較部1231は、処理を開始すると、キーワードランキング生成部221の処理結果である図10のトレンドキーワード表示1005において、本実施例におけるトレンド分析装置の利用者が選択したキーワード名を取得する(ステップ1401)。
次に、売り上げデータ比較部1231は、売り上げデータ1230からステップ1401で取得したキーワードに対応する商品名1301を照合し、該当する商品名の売上高1302を図10のトレンンド分析期間設定1003の期間よりも以前の期間内から取得する(ステップ1402)。
(2)需要予測との連動
続いて、売り上げデータ比較部1231は、ステップ1403で取得した商品の売上高に対して需要予測を実施する。本ステップの目的は、商品の売上高の変動と図2のキーワード拡散度データ215との関連性を把握するために、トレンンド分析期間設定1003より前の売上高からの需要予測を算出することである。本実施例におけるトレンド分析装置の利用者は、需要予測と実際の売上高の差分が大きく、その原因としてキーワード拡散度データの推移との関連性が見られる場合には、在庫管理等を注視する必要がある等の対策を行うことができる。ステップ1403の需要予測の算出方法は、ウィンターズモデルやARIMAモデル等の公知の手法を用いる。
続いて、売り上げデータ比較部1231は、ステップ1403で取得した商品の売上高の需要予測に対して、キーワード拡散度データ215を用いた一定のルールにより補正を行う(ステップ1404)。
例えばキーワード拡散度データ215を用いた売上高の補正の例を図15に示す。図15は図10において選択された商品Aの売り上げ1501と商品Aに対する肯定的キーワード拡散度1502を同一グラフでプロットしたものである。商品Aは肯定的キーワード拡散度が7/10付近から高いスコアを占めているが、平坦な変化をしている。よって、例えば商品Aの売上高は、肯定的キーワード拡散度があるため正のトレンド成分を有しており、また、肯定的キーワード拡散度の平坦な変化に対応して、売上高の需要予測の周期性は安定していると推測を行う。よって、需要予測モデルに正のトレンド成分を加える。
別の例を図16A及び図16Bで説明する。図16Aは、図10のトレンドキーワード表示部1005で選択された商品Bの売り上げ1601と、図2のキーワード拡散度データ215で肯定的キーワード拡散度と否定的キーワード拡散度の比を求めたキーワード拡散度比(肯定的キーワード拡散度/否定的キーワード拡散度×100(%)で算出)を、同一グラフでプロットしたものである。また、図16Bは、図16Aと同様に商品Bの実際の売り上げデータ1601と、補正前の需要予測1604及び補正後の需要予測1605を同一グラフにプロットしたものである。
図16Aにおいて商品Bの売上高は、7/15付近で急激に増え、7/30以降に急激に落ち込んでいる。一方、キーワード拡散度比は7/12付近で急激に肯定的キーワード拡散度の割合が増加しており、また、7/25付近で否定的キーワード拡散度の割合が急激に増大している。図16Aにおける売上高とキーワード拡散度比の関係から、例えば肯定的キーワード拡散度の割合が急激に増大した2〜3日後に売上高が急激に増大し、否定的キーワード拡散度の割合が急激に増大した2〜3日後に売上高が低下するといった補正ルールを需要予測モデルに適用する。具体的には、図16Bにおいて、補正ルール適用前の需要予測1604と実際の売り上げ1601には大きな差があるが、前記補正ルールを適用することで、補正後の需要予測1605のような実際の売り上げデータとの関連度の高い需要予測が得られる。
以上のような補正ルールは、本実施例のトレンド分析装置の利用者が作成あるいは修正できるようにしてもよい。また、どの補正ルールを適用するかを選択する手段を提供してもよい。
また、補正ルールで得られた実際の売り上げデータ1601と補正後の需要予測1605の差分とキーワード拡散度の関係を蓄積し、他の商品での関係を逐次学習することで実際の売り上げに近づけられるような補正値を取得する仕組みを設けてよい。
再び図14の説明に戻り、売り上げデータ比較部1231は、ステップ1404の後にその処理を終了する。一方、トレンド分析結果表示部222は、図15、図16A及び図16Bのような、商品の売上高とキーワード拡散度の関係を、図10のインターフェイス画面に表示してもよい。
また、図16Aや図16Bのように売上高と需要予測との関係をキーワードランキング生成部221へ反映する仕組みを設けてもよい。例えば、図16Bの商品Bのように実際の売上高と需要予測との差分が大きい商品は、在庫切れを起こす可能性のある注目商品として、商品スコアへ反映する仕組みを設けてもよい。
また、図16Aや図16Bのように売上高と需要予測及びキーワード拡散度との関係から、マスメディアトレンド分析部204において商品Bを紹介したマスメディアの番組や出演者、ジャンルに対する重み付けを変更する仕組みを設けてもよい。
また、図12の売り上げデータ1230は、本実施例におけるトレンド分析装置の利用者が扱う売り上げデータだけでなく、一般の市場売り上げデータであってもよく、その場合は例えば図1のネットワークインターフェイスを介して、一般の市場売り上げデータを流通する事業者から取得する。
101:CPU、102:主記憶装置、103:補助記憶装置、104:入力装置、105:出力装置、106:チューナ、107:アンテナ、108:ネットワークインターフェイス、201:マスメディアデータ、202:メタデータ取得部、203:メタデータ、204:マスメディアトレンド分析部、205:マスメディアトレンドキーワードデータ、210:ソーシャルメディアデータ、211:ソーシャルメディアデータ収集部、212:辞書データ、213:蓄積ソーシャルメディアデータ、214:ソーシャル拡散度解析部、215:キーワード拡散度データ、220:商品マスタ、221:キーワードランキング生成部、222:トレンド分析結果表示部、1230:売り上げデータ、1231:売り上げデータ比較部

Claims (13)

  1. マスメディアからトレンドキーワードを抽出するトレンド分析装置は、
    マスメディアデータからテキスト形式のメタデータを生成するメタデータ取得手段、
    前記メタデータに含まれるキーワードのスコアを算出するトレンド分析手段、
    ネットワークからソーシャルメディアデータを収集するソーシャルメディアデータ収集手段、
    前記収集したソーシャルメディアデータから、前記キーワードの伝搬の度合いを示すキーワード拡散度を算出するソーシャル拡散度解析手段、及び
    前記キーワードに関連した商品に関する情報と前記キーワード拡散度とに基づいて前記キーワードのランキングを含むトレンド情報を生成するキーワードランキング生成手段
    を有することを特徴とするトレンド分析装置。
  2. 前記トレンド分析手段は、
    前記メタデータからキーワード抽出し、前記キーワードの出現数をカウントし、
    前記キーワードの発信元の数と、前記出現数に基づいて求めた、前記キーワードの特徴の度合いを示す指標とから前記キーワードに対するスコアを算出することを特徴とする請求項1記載のトレンド分析装置。
  3. 前記ソーシャル拡散度解析手段は、
    前記キーワードが含まれる前記ソーシャルメディアデータから、前記キーワードの拡散を目的とする発言の発言数を算出し、
    前記ソーシャルメディアデータに含まれる肯定的発言の発言数と前記拡散目的の肯定的発言の発言数とに基づいて前記肯定的発言に対するキーワード拡散度算出し、
    前記ソーシャルメディアデータに含まれる否定的発言の発言数と前記拡散目的の否定的発言の発言数とに基づいて前記否定的発言に対するキーワード拡散度算出する、
    ことを特徴とする請求項1記載のトレンド分析装置。
  4. 前記キーワードランキング生成手段は、
    商品に関する情報を格納した商品マスタを提示して、利用者の指示に基づいてトレンド分析対象の商品を選択し、
    前記選択した商品に関するランキングを生成し、前記ランキングを含むトレンド分析結果を表示することを特徴とする請求項1記載のトレンド分析装置。
  5. 前記ランキングの生成、及びトレンド分析結果の表示において、
    前記トレンド分析手段によって、前記キーワードのスコアを算出してマスメディアトレンドキーワードを生成し、
    前記ソーシャル拡散度解析手段によって、前記マスメディアトレンドキーワードを用いてキーワード拡散度を生成し、
    前記キーワード拡散度データに含まれるキーワードを元に、商品スコアを算出することによって、前記商品マスタに含まれる各商品のランキングを生成し、
    前記商品スコアの高い順に前記キーワードを表示し、
    前記マスメディアトレンドキーワードと利用者によって選択されたキーワードを照合して前記選択されたキーワードの発生回数を取得し、
    前記選択されたキーワードに対する、前記ソーシャルメディアでのキーワード拡散度を取得し、
    前記発生回数と前記キーワード拡散度を表示する
    ことを特徴とする請求項4記載のトレンド分析装置。
  6. 前記トレンド分析装置は、更に、売り上げデータ比較手段を有し、
    前記売り上げデータ比較手段は、
    前記トレンドキーワードに対応する商品の売り上げデータを取得し、
    前記トレンド分析期間前の前記売り上げデータから商品の需要を予測し、前記キーワード拡散度に基づいて前記需要を補正することを特徴とする請求項1記載のトレンド分析装置。
  7. マスメディアからトレンドキーワードを抽出するトレンド分析装置によるトレンド分析方法であって、
    マスメディアデータからテキスト形式のメタデータを生成するメタデータ取得ステップ、
    前記メタデータに含まれるキーワードのスコアを算出するトレンド分析ステップ、
    ネットワークからソーシャルメディアデータを収集するソーシャルメディアデータ収集ステップ、
    前記収集したソーシャルメディアデータから、前記キーワードの伝搬の度合いを示すキーワード拡散度を算出するソーシャル拡散度解析ステップ、さらに、
    前記キーワードに関連した商品に関する情報と前記キーワード拡散度とに基づいて前記キーワードのランキングを含むトレンド情報を生成するキーワードランキング生成ステップ
    を有することを特徴とするトレンド分析方法。
  8. 前記トレンド分析ステップは、
    前記メタデータからキーワード抽出し、前記キーワードの出現数をカウントし、
    前記キーワードの発信元の数と、前記出現数に基づいて求めた、前記キーワードの特徴の度合いを示す指標とから前記キーワードに対するスコアを算出することを特徴とする請求項7記載のトレンド分析方法。
  9. 前記ソーシャル拡散度解析ステップは、
    前記キーワードが含まれる前記ソーシャルメディアデータから、前記キーワードの拡散を目的とする発言の発言数を算出し、
    前記ソーシャルメディアデータに含まれる肯定的発言の発言数と前記拡散目的の肯定的発言の発言数とに基づいて前記肯定的発言に対するキーワード拡散度算出し、
    前記ソーシャルメディアデータに含まれる否定的発言の発言数と前記拡散目的の否定的発言の発言数とに基づいて前記否定的発言に対するキーワード拡散度算出する、
    ことを特徴とする請求項7記載のトレンド分析方法。
  10. 前記キーワードランキング生成ステップは、
    商品に関する情報を格納した商品マスタを提示して、利用者の指示に基づいてトレンド分析対象の商品を選択し、
    前記選択した商品に関するランキングを生成し、前記ランキングを含むトレンド分析結果を表示することを特徴とする請求項7記載のトレンド分析方法。
  11. 前記ランキングの生成、及びトレンド分析結果の表示において、
    前記トレンド分析ステップによって、前記キーワードのスコアを算出してマスメディアトレンドキーワードを生成し、
    前記ソーシャル拡散度解析ステップによって、前記マスメディアトレンドキーワードを用いてキーワード拡散度を生成し、
    前記キーワード拡散度データに含まれるキーワードを元に、商品スコアを算出することによって、前記商品マスタに含まれる各商品のランキングを生成し、
    前記商品スコアの高い順に前記キーワードを表示し、
    前記マスメディアトレンドキーワードと利用者によって選択されたキーワードを照合して前記選択されたキーワードの発生回数を取得し、
    前記選択されたキーワードに対する、前記ソーシャルメディアでのキーワード拡散度を取得し、
    前記発生回数と前記キーワード拡散度を表示する
    ことを特徴とする請求項10記載のトレンド分析方法。
  12. 前記トレンド分析方法は、更に、売り上げデータ比較ステップを有し、
    前記売り上げデータ比較ステップは、
    前記トレンドキーワードに対応する商品の売り上げデータを取得し、
    前記トレンド分析期間前の前記売り上げデータから商品の需要を予測し、前記キーワード拡散度に基づいて前記需要を補正することを特徴とする請求項7記載のトレンド分析方法。
  13. マスメディアからトレンドキーワードを抽出するトレンド分析装置によるトレンド分析方法を実行するためのプログラムを格納した、計算機で読み取り可能な記憶媒体であって、
    前記トレンド分析方法は、
    マスメディアデータからテキスト形式のメタデータを生成するメタデータ取得ステップ、
    前記メタデータに含まれるキーワードのスコアを算出するトレンド分析ステップ、
    ネットワークからソーシャルメディアデータを収集するソーシャルメディアデータ収集ステップ、
    前記収集したソーシャルメディアデータから、前記キーワードの伝搬の度合いを示すキーワード拡散度を算出するソーシャル拡散度解析ステップ、さらに、
    前記キーワードに関連した商品に関する情報と前記キーワード拡散度とに基づいて前記キーワードのランキングを含むトレンド情報を生成するキーワードランキング生成ステップ、を有することを特徴とする記憶媒体。
JP2012230957A 2012-10-18 2012-10-18 トレンド分析装置、方法及びプログラム Active JP5940955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012230957A JP5940955B2 (ja) 2012-10-18 2012-10-18 トレンド分析装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012230957A JP5940955B2 (ja) 2012-10-18 2012-10-18 トレンド分析装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014081882A true JP2014081882A (ja) 2014-05-08
JP5940955B2 JP5940955B2 (ja) 2016-06-29

Family

ID=50785995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012230957A Active JP5940955B2 (ja) 2012-10-18 2012-10-18 トレンド分析装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5940955B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018136805A (ja) * 2017-02-23 2018-08-30 カシオ計算機株式会社 広告作成装置、販促情報作成装置及びプログラム
JP2018181104A (ja) * 2017-04-18 2018-11-15 株式会社Nttドコモ 表示順序提示装置および表示順序提示方法
JP2019053621A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN110223092A (zh) * 2018-03-01 2019-09-10 北京京东尚科信息技术有限公司 选品方法、装置和计算机可读存储介质
JP2020086909A (ja) * 2018-11-26 2020-06-04 株式会社プラップジャパン 情報処理装置、情報処理方法、及び情報処理プログラム
KR102167347B1 (ko) * 2020-03-30 2020-10-19 주식회사 지에스아이티엠 인공지능을 이용한 온라인 쇼핑 시스템
JP2020184260A (ja) * 2019-05-09 2020-11-12 挙 山本 分析装置、分析方法および分析プログラム
JP2021047785A (ja) * 2019-09-20 2021-03-25 株式会社Nttドコモ 情報提供システム
JP2021131715A (ja) * 2020-02-19 2021-09-09 株式会社日立製作所 情報提供システム、情報提供方法、及び情報提供プログラム
JP2021527883A (ja) * 2018-06-11 2021-10-14 オムニオウス カンパニー リミテッド ソーシャルネットワークを利用した影響力測定方法および装置
KR102538950B1 (ko) * 2022-12-07 2023-06-01 주식회사 올리브인터내셔널 클러스터 커머스 구축 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012946A1 (en) * 2007-07-02 2009-01-08 Sony Corporation Information processing apparatus, and method and system for searching for reputation of content
JP2009123015A (ja) * 2007-11-15 2009-06-04 Bbmedia Inc ブランドランク評価システムおよび方法
JP2010020731A (ja) * 2008-07-14 2010-01-28 Datasection Inc 情報分析装置及び情報分析プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012946A1 (en) * 2007-07-02 2009-01-08 Sony Corporation Information processing apparatus, and method and system for searching for reputation of content
JP2009015407A (ja) * 2007-07-02 2009-01-22 Sony Corp 情報処理装置、コンテンツの評判検索方法およびコンテンツの評判検索システム
JP2009123015A (ja) * 2007-11-15 2009-06-04 Bbmedia Inc ブランドランク評価システムおよび方法
JP2010020731A (ja) * 2008-07-14 2010-01-28 Datasection Inc 情報分析装置及び情報分析プログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018136805A (ja) * 2017-02-23 2018-08-30 カシオ計算機株式会社 広告作成装置、販促情報作成装置及びプログラム
JP2018181104A (ja) * 2017-04-18 2018-11-15 株式会社Nttドコモ 表示順序提示装置および表示順序提示方法
JP2019053621A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN110223092A (zh) * 2018-03-01 2019-09-10 北京京东尚科信息技术有限公司 选品方法、装置和计算机可读存储介质
JP2021527883A (ja) * 2018-06-11 2021-10-14 オムニオウス カンパニー リミテッド ソーシャルネットワークを利用した影響力測定方法および装置
JP7082216B2 (ja) 2018-06-11 2022-06-07 オムニオウス カンパニー リミテッド ソーシャルネットワークを利用した影響力測定方法および装置
JP2020086909A (ja) * 2018-11-26 2020-06-04 株式会社プラップジャパン 情報処理装置、情報処理方法、及び情報処理プログラム
JP2020184260A (ja) * 2019-05-09 2020-11-12 挙 山本 分析装置、分析方法および分析プログラム
JP2021047785A (ja) * 2019-09-20 2021-03-25 株式会社Nttドコモ 情報提供システム
JP7212600B2 (ja) 2019-09-20 2023-01-25 株式会社Nttドコモ 情報提供システム
JP2021131715A (ja) * 2020-02-19 2021-09-09 株式会社日立製作所 情報提供システム、情報提供方法、及び情報提供プログラム
JP7377126B2 (ja) 2020-02-19 2023-11-09 株式会社日立製作所 情報提供システム、情報提供方法、及び情報提供プログラム
KR102167347B1 (ko) * 2020-03-30 2020-10-19 주식회사 지에스아이티엠 인공지능을 이용한 온라인 쇼핑 시스템
KR102538950B1 (ko) * 2022-12-07 2023-06-01 주식회사 올리브인터내셔널 클러스터 커머스 구축 시스템

Also Published As

Publication number Publication date
JP5940955B2 (ja) 2016-06-29

Similar Documents

Publication Publication Date Title
JP5940955B2 (ja) トレンド分析装置、方法及びプログラム
Lou et al. Investigating consumer engagement with influencer-vs. brand-promoted ads: The roles of source and disclosure
Ilhan et al. Battle of the brand fans: Impact of brand attack and defense on social media
US8335719B1 (en) Generating advertisement sets based on keywords extracted from data feeds
US20150186790A1 (en) Systems and Methods for Automatic Understanding of Consumer Evaluations of Product Attributes from Consumer-Generated Reviews
US20130097176A1 (en) Method and system for data mining of social media to determine an emotional impact value to media content
Chung et al. A long-term study of a crowdfunding platform: Predicting project success and fundraising amount
US20150046371A1 (en) System and method for determining sentiment from text content
US20070198459A1 (en) System and method for online information analysis
JP5398413B2 (ja) 銘柄推奨システム及び銘柄推奨プログラム
JP2009123015A (ja) ブランドランク評価システムおよび方法
KR101935937B1 (ko) 오피니언 마이닝을 이용한 광고 정보 제공 시스템 및 그 방법
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
Gulla et al. Implicit user profiling in news recommender systems
KR101544450B1 (ko) 소셜 데이터의 분석을 통한 감성 영향 인덱스의 생성 방법 및 그 시스템
US20160358207A1 (en) System and method for aggregating and analyzing user sentiment data
JP2015164008A (ja) 解析装置及び解析方法
JP5155290B2 (ja) 購買ステージ判定装置及び購買ステージ判定方法
Guo et al. An opinion feature extraction approach based on a multidimensional sentence analysis model
Kim et al. A user opinion and metadata mining scheme for predicting box office performance of movies in the social network environment
JP2016009426A (ja) トレンド分析装置、及びトレンド分析方法
JP6457986B2 (ja) メッセージ分類システム、メッセージ分類方法及びプログラム
Vasconcelos et al. Popularity dynamics of foursquare micro-reviews
JP5011185B2 (ja) 情報分析装置、情報分析方法、及び情報分析プログラム
Tanaltay et al. Can social media predict soccer clubs’ stock prices? the case of turkish teams and twitter

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140908

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160519

R150 Certificate of patent or registration of utility model

Ref document number: 5940955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250