JP2016099875A - 情報処理装置及び方法、並びにプログラム - Google Patents

情報処理装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2016099875A
JP2016099875A JP2014237878A JP2014237878A JP2016099875A JP 2016099875 A JP2016099875 A JP 2016099875A JP 2014237878 A JP2014237878 A JP 2014237878A JP 2014237878 A JP2014237878 A JP 2014237878A JP 2016099875 A JP2016099875 A JP 2016099875A
Authority
JP
Japan
Prior art keywords
information
passive
word
active
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014237878A
Other languages
English (en)
Inventor
エルマー・ジェイ・ブローディー
J Brody Elmer
えり 権田
Eri Gonda
えり 権田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Economic Index Co Ltd
Original Assignee
Economic Index Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Economic Index Co Ltd filed Critical Economic Index Co Ltd
Priority to JP2014237878A priority Critical patent/JP2016099875A/ja
Publication of JP2016099875A publication Critical patent/JP2016099875A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】所定の評価対象に関する大衆の関心の動きを的確に分析して、その分析結果を各種各様の分野に活用可能にすること。【解決手段】能動情報取得部503は、対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を、能動情報として取得する。受動値算出部502は、能動情報に含まれる、対象ワードと組になる関連ワードの能動値を演算する。受動情報取得部501は、対象ワードに関する情報のうち、大衆以外の情報源が発信し大衆が受動的に受け入れる類の情報を、受動情報として取得する。受動値算出部502は、受動情報に含まれる、対象ワードと組になる関連ワードの受動値を演算する。ヒット指数生成部505は、複数の関連ワードの夫々について、当該関連ワードの能動値及び受動値に基づいて、対象ワードと関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成する。【選択図】図3

Description

本発明は、情報処理装置及び方法、並びにプログラムに関する。
近年、インターネットを通じて、人々が受動的に情報を受け取るだけでなく、ブログやツイッター(登録商標)等を通じて能動的に情報を発信することが容易となった。このようなインターネット上の膨大な情報をテキストマイニングすることにより、商品、タレント、映画、商業施設等、およそ評価の対象となる全ての評価対象に対する評価指数を算出することが試みられるようになった(特許文献1参照)。
特開2007−41869号公報
しかしながら、インターネット上等に存在する無限の情報から、これらの評価対象について、大衆の関心という点で分析を適切にすることが要求されているが、特許文献1に示される評価指数では、当該要求に十分に応えられていない状況である。
本発明は、かかる状況に鑑みてなされたものであり、インターネット上等に存在する無限の情報から、所定の評価対象に関する大衆の関心の動きを的確に分析して、その分析結果を、各種各様の分野、例えばマーケティングや、映画製作の分野に活用可能にすることを目的とする。
本発明の一側面の情報処理装置は、
対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を能動情報として、複数の能動情報を能動母集団として設定し、当該能動母集団における複数の関連ワードの夫々の位置づけを示すパラメータ値を、当該関連ワードの能動値として演算する能動値算出手段と、
対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報を受動情報として、複数の受動情報を受動母集団として設定し、当該受動母集団における夫々の関連ワードの位置づけを示すパラメータ値を、当該関連ワードの受動値として演算する受動値算出手段と、
前記複数の関連ワードの夫々について、当該関連ワードの前記能動値及び前記受動値に基づいて、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成するヒット指数生成手段と、
を備えることを特徴とする。
ここで、前記ヒット指数生成手段は、前記能動値の第1軸と、前記受動値の第2軸とから構築される2次元平面上において、
所定関連ワードの前記能動値を前記第1軸の座標とし、当該所定関連ワードの前記受動値を前記第2軸の座標とする点を関連ワード点として、
当該関連ワード点の所定の位置関係に基づいて、前記対象ワードに関する前記所定関連ワードのヒット指数を生成することができる。
また、複数の前記関連ワード点を前記2次元平面上にプロットした画像を表示する制御を実行する画像表示制御手段をさらに備えることができる。
また、前記ヒット指数生成手段は、
前記関連ワードとは独立して、大衆自身が能動的に発信した類の情報から無作為に抽出したワードを能動情報として、情報源が発信し大衆が受動的に受け入れる類の情報から無作為に抽出したワードを受動情報として、当該能動情報と当該受動情報との組の夫々の位置づけを示すパラメータ値を用いた第1ヒット指数を演算し、
前記対象ワードと前記関連ワードとの組の夫々の位置づけを示すパラメータ値を用いて第2ヒット指数を演算し、
前記第1ヒット指数と前記第2ヒット指数を比較することにより、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を求め、その度合をヒット指数として生成する、
ことができる。
また、前記ヒット指数生成手段は、前記第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として、関連ワードと同等の重みを持つワードを抽出する
ことができる。
また、前記ヒット指数生成手段は、前記ヒット指数を過去に演算した前記関連ワードを、前記第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として抽出する
ことができる。
また、前記複数の関連ワード点は、複数のカテゴリのうち少なくとも1つに分類されており、
前記複数のカテゴリのうち、1以上のカテゴリを指定する指定手段をさらに備え、
前記画像表示制御手段は、前記指定手段により指定された前記1以上のカテゴリに属する関連ワードに対応する関連ワード点を、前記2次元平面上にプロットした画像を表示する制御をさらに実行することができる。
ここで、前記複数のカテゴリの夫々はさらに階層化されており、
前記指定手段は、前記1以上のカテゴリの夫々を階層単位でさらに指定することができる。
また、前記指定手段は、さらに、前記複数の関連ワードのうち、詳細情報を提示する関連ワードを指定し、
前記画像表示制御手段は、さらに、指定された前記関連ワードの詳細情報を示す画像を表示する制御をさらに実行することができる。
本発明の一態様の情報処理方法及びプログラムは、上述の本発明の一態様の情報処理装置に対応する方法及びプログラムである。
本発明によれば、インターネット上等に存在する無限の情報から、所定の評価対象に関する大衆の関心の動きを的確に分析して、各種各様の分野、例えばマーケティングや、映画製作の分野に活用可能にすることができる。
また、大衆に受ける映画に関するどのキーワードがヒットの要因なのかを知ることができ、新たな映画のコンセプト作りに役立てることもできる。
本発明の一実施形態に係るヒット指数出力システム1の全体構成を示す図である。 図1の端末20a、20b、20c、・・・、ヒット指数出力装置10及び情報源サーバ40のハードウェア構成を示す図である。 図1のヒット指数出力装置10の機能的構成を示す機能ブロック図である。 図1のヒット指数出力装置10が出力する関連ワード点のプロット画像を説明する図である。 図1のヒット指数出力装置10が出力する関連ワードのプロット画像の一例である。 図1のヒット指数出力装置10が出力する関連ワードのプロット画像の別の例である。 図1のヒット指数出力装置10が実行するヒット指数表示処理を示すフローチャートである。
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本発明の一実施形態に係るヒット指数出力システム1の全体構成を示す図である。図1に示すように、本実施形態に関わるヒット指数出力システム1は、端末20a、20b、20c、・・・、ヒット指数出力装置10、通信ネットワーク30、及び情報源サーバ40を備える。端末20a、20b、20c、・・・は、通信ネットワーク30を介してヒット指数出力装置10、及び情報源サーバ40と接続可能である。
図2に示すように、端末20a、20b、20c、・・・、ヒット指数出力装置10及び情報源サーバ40は、制御部110、210、410、入力部120、220、420、表示部130、230、430、記憶部140、240、440及び通信I/F部150、250、450が夫々バス160、260、460を介して接続されて構成される。
制御部110、210、410は、CPU(Central Processing Unit)により構成してよく、夫々端末20a、20b、20c、・・・、ヒット指数出力装置10、及び情報源サーバ40全体を制御し、例えば、記憶部140、240、440に記憶されたプログラムを読み出して実行することにより、これらのハードウェアと協働して後述する各種手段を実現している。
入力部120、220、420は、キーボード、マウス等により実現することができる。
表示部130、230、430は、液晶ディスプレイ、ブラウン管CRT等により実現することができる。
端末20a、20b、20c、・・・の記憶部140、ヒット指数出力装置10の記憶部240及び情報源サーバ40の記憶部440は、端末20a、20b、20c、・・・、ヒット指数出力装置10及び情報源サーバ40が夫々端末、サーバ及び情報源サーバとして機能するための各種プログラム及び本発明の機能を実行するプログラム等を格納する。これらの記憶部140、240、440は、内部又は外部の記憶媒体に格納されてもよく、記憶媒体として、ハードディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、メモリーカード等全ての記憶装置及び記憶媒体を使用することができる。
通信I/F部150、250、450は、LANアダプタ、モデムアダプタ等により実現することができる。
ここで、本発明が適用される情報処理装置の一実施形態としてのヒット指数出力装置10の機能的構成を説明する前に、前提事項について説明する。
所定の対象ワードに関する文章等の情報に含まれる任意のワードが、関連ワードとして採用され得る。
対象ワードと関連ワードとの組が、大衆(対象キーワードについて主に第三者の立場にある人を多く含む不特定多数の集団)の心にどれだけ刺さるのかを示す度合が、本明細書では、「ヒット指数」と呼ばれている。
このようなヒット指数を演算して出力する装置が、ヒット指数出力装置10である。
以下、ヒット指数出力装置10の機能的構成について説明する。
[ヒット指数出力装置10の機能構成]
図3は、図1で説明した本実施形態に係るヒット指数出力装置10の機能的構成を示す機能ブロック図である。図3に示すように、制御部110には、受動情報取得部501と、受動値算出部502と、能動情報取得部503と、能動値算出部504と、ヒット指数生成部505と、プロット画像生成部506と、画像表示制御部507と、プロット対象指定部508と、が設けられている。
ヒット指数出力装置10は、コンピュータとして実現した例で説明しているが、これに限らず、専用に設計された情報機器として実現してもよい。
受動情報取得部501は、所定の対象ワードと組になる関連ワードについて受動情報を取得する。受動値算出部502は、当該所定の対象ワードと組になる当該関連ワードについて、当該受動情報に基づいて受動値を算出する。
能動情報取得部503は、当該所定の対象ワードと組になる当該関連ワードについて能動情報を取得する。能動値算出部504は、当該所定の対象ワードと組になる当該関連ワードについて、当該能動情報に基づいて能動値を算出する。
ここで、能動値とは、次のような値をいう。
即ち、対象ワードに関する情報(例えば大衆ワードを含む文章等)のうち、大衆が自ら能動的に発信した類の情報が、本明細書では「能動情報」と呼ばれている。
この場合、複数の能動情報が能動母集団として設定された際に、当該能動母集団における夫々の当該関連ワードの位置づけを示すパラメータ値が、能動値として採用されている。
本実施形態では、所定の対象ワードと組になる関連ワードの能動情報として、例えば、当該所定の対象ワードと当該関連ワードが含まれるテキスト情報、具体的には例えば、ブログのテキスト、ツイッター(登録商標)の書き込み、検索サイトに入力された検索ワード等が採用される。
これらの能動情報を能動母集団として、例えば、その中での各関連ワードの出現頻度を、その能動母集団の中での最大出現頻度で正規化した値として、当該関連ワードの能動値が算出される。
なお、能動値の算出手法は、上述の手法に限定されないことは言うまでもない。
また、受動値とは、次のような値をいう。
即ち、当該対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報が、本明細書では「受動情報」と呼ばれている。
情報源としては、主として大衆以外の情報源(望ましくは、ある程度信用度を持った情報源、即ち大衆が受動的に受け入れる権威的情報源)であるが、特にこれに限定されず、大衆の発信等全て含むインターネット上のあらゆる情報が情報源となる。
この場合、複数の受動情報を受動母集団として設定された際に、当該受動母集団における夫々の当該関連ワードの位置づけを示すパラメータ値が、受動値として採用されている。
本実施形態では、所定の対象ワードと組になる関連ワードの受動情報として、例えば、当該所定の対象ワードと当該関連ワードが含まれるテキスト情報、具体的には、アナリストサイトや報道サイトの内容、当該所定の対象ワードに関連する商品や役務を提供している企業(メーカー等)の公式サイトや、当該商品や役務に関するプロダクションの公式サイトの内容等が採用される。
これらの受動情報を受動母集団として、例えば上記能動値と同様に受動値が算出される。
なお、受動値の算出手法は、上述の手法に限定されないことは言うまでもない。
ヒット指数生成部505は、所定の対象ワードと夫々組になる複数の関連ワード毎に、当該関連ワードの能動値及び受動値に基づいて、当該所定の対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成する。
プロット画像生成部506は、能動値の第1軸(例えば横軸)と、受動値の第2軸(例えば縦軸)とから構築される2次元平面上において、所定関連ワードの能動値を第1軸の座標とし、当該所定関連ワードの受動値を第2軸の座標とする点を関連ワード点として、当該所定の対象キーワードと夫々組になる複数の関連ワードの夫々の複数の関連ワード点をプロットした画像(以下、「プロット画像」と呼ぶ)のデータを生成する。
画像表示制御部507は、当該プロット画像を表示部130等に表示させる制御を実行する。
プロット対象指定部508については、後述する。
図4は、画像表示制御部507により表示が制御されたプロット画像の一例を示す図である。
図4に示すプロット画像は、横軸に能動値、縦軸に受動値を取って、所定の対象キーワードと夫々組になる複数の関連ワードの能動値と受動値のうち、例えば夫々の最大値を横軸と縦軸の100として各関連ワードを正規化し、左下の原点(0,0)から右上の(100,100)の点までの2次元空間に、6つの関連ワード点P1〜P6をプロットしたものである。
なお、横軸と縦軸の座標100(最大値)の定義の手法は、上述の手法に限定されないことは言うまでもない。また、図5や図6を参照して説明するように、プロット画像にプロットされる関連ワード点の個数は、特に限定されないことも言うまでもない。
図4中、4つの領域A1、A2、A3、A4は、多数の対象ワード毎に多数の関連ワードの夫々の能動値及び受動値を時系列的に実際に演算してきた結果として、経験的に区分けされたものであり、夫々に次のような意味合いがある。
先ず、所定の対象ワードの組として新たに用いられる関連ワード(新しく生まれたワード)に対応する関連ワード点は、当然、最初は出現頻度ゼロから出発するので、原点付近から領域A1に沿って推移する。それは先ず口コミのような能動情報として現れ、メディアの報道等の受動情報はそれより遅れて現れる傾向にある。それゆえ、領域A1に存在する関連ワード点P1、P2、P3の夫々に対応する各関連ワードは、当該所定の対象ワードとの組として、新しく大衆の関心を集め始めたワードであり、例えばその右上への推移の速さが流行の度合のバロメータとなり得る。ただし、素早く右上に推移した後、直ぐに逆戻りして消えてしまう一発屋的ワードもあるし、しっかりと定着するワードもあるため、領域A1に存在する関連ワード点についてはその後も時系列的に監視していくとよい。
領域A2は、大衆の関心を集め、メディア上にも良く出現するので、能動値のみならず受動値も高くなる領域であり、ヒット指数が最も高くなる領域である。つまり、この領域A2に存在する関連ワード点P4に対応する関連ワードは、当該所定の対象ワードとの組み合わせとして、まさに現在のトレンドの代表となるワードといえる。
しかし、メディア上に定着した頃には、既に飽きられてブログや検索の回数は減り、その結果として、受動値は高いものの能動値は低くなるという領域A3に移行する。つまり、領域A3に存在する関連ワード点P5に対応する関連ワードは、当該所定の対象ワードとの組み合わせとして、旬(ピーク)が過ぎたワードといえる。
そして、最終的にはメディアの登場回数も減少していき、能動値のみならず受動値も低くなっていく領域A4に移行する。つまり、領域A4に存在する関連ワード点P6に対応する関連ワードは、当該所定の対象ワードとの組み合わせとして、最終的に消えゆく存在のワードといえる。
こうしてみると、所定の対象ワードとの組になる関連ワードに対応する関連ワード点は、領域A1→領域A2→領域A3→領域A4という順番で、プロット画像において右回りに回転をするように時間的に推移する。
そこで、このような関連ワード点の動きを時間的に追跡すれば、これから流行するアイテム(当該所定の対象ワードとの組になる関連ワードに関連するアイテム)とか、流行が終わりつつあるアイテム等の予測に役立つ。
例えば、領域A1に存在する関連ワード点を調査すれば、これからヒットするであろうアイテムを把握することができるので、当該所定の対象ワードに関する未来のトレンド予測に役立つ。
また例えば、領域A2に存在する関連ワード点を調査すれば、現在実際にヒットしているアイテムが何であるのかを把握することができるので、当該所定の対象ワードに関する現在のトレンドの調査に役立つ。
以上のことから、当該所定の対象ワードと組になる関連ワードのヒット指数は、対応する関連ワード点の2次元平面(プロット画像)上の所定の位置関係に基づいて求めると好適である。
例えば、右上の点(100,100)を原点として、当該原点から関連ワード点に向かうベクトルに基づいて、当該関連ワードのヒット指数を求めてもよい。
また例えば、所定の対象ワードと夫々組になる複数の関連ワード(全てでもよいし、ランダムに抽出したものでもよい)の能動値と受動値の平均値を演算し、原点からその平均値をプロットした点(以下、「平均点」と呼ぶ)までのベクトルを基準として、基準のベクトルと、各関連ワードのベクトルとの位置関係に基づく所定の演算(例えば類似度演算等)により、当該関連ワードのヒット指数を求めてもよい。このように、平均点との比較を用いることで、世の中の平均的関心よりどれだけ高い関心を得ているかを知ることができる。
図5は、「ミステリー」という対象ワードに関するプロット画像の具体例を示したものである。
図5において、例えば、「ミステリー」と組になる「ミステリーレター攻略」の関連ワード点は、座標(能動値,受動値)=(55,25)に位置している。図4の見解によれば、「ミステリーレター攻略」の関連ワード点は領域A1に属しており、「ミステリー」に対して、「ミステリーレター攻略」が今後流行る可能性があると推測することができる。
また例えば、「ミステリー」と組になる「古代」の関連ワード点は、座標(能動値,受動値)=(100,85)に位置している。従って、「ミステリー」に対して、「古代」は「ミステリーレター攻略」よりもヒット指数が高いことがわかる。即ち、図4の見解によれば、「古代」の関連ワード点は領域A2に属しており、「ミステリー」に対して、「古代」が現在トレンドの組み合わせであると推測することができる。
図6は、「江戸」という対象ワードに関するプロット画像の具体例を示したものである。
図6において、例えば、「江戸」と組になる「多摩境」の関連ワード点は、座標(能動値,受動値)=(85,35)に位置している。図4の見解によれば、「多摩境」の関連ワード点は領域A1に属しており、「江戸」に対して、「多摩境」が今後流行る可能性があると推測することができる。
また例えば、「江戸」と組になる「浅草」の関連ワード点は、座標(能動値,受動値)=(95,85)に位置している。従って、「江戸」に対して、「浅草」は「多摩境」よりもヒット指数が高いことがわかる。即ち、図4の見解によれば、「浅草」の関連ワード点は領域A2に属しており、「江戸」に対して、「浅草」が現在トレンドの組み合わせであると推測することができる。
ここで、図6において、「多摩境」や「浅草」は地名に関する関連ワードである。一方「江戸もんじゃ」や「江戸前ネギ」は食べ物に関する関連ワードである。従って、これらの関連ワードを、複数のカテゴリに予め分類しておくことで、ユーザが指定したカテゴリに属する関連ワード点のみをプロットしたプロット画像を、ユーザに提示することができる。例えば、「地名」というカテゴリをユーザが指定すれば、「多摩境」や「浅草」の関連ワード点のみが表示され、それ以外の「江戸もんじゃ」や「江戸前ネギ」の関連ワードが消去される。
即ち、複数の関連ワード点は、複数のカテゴリのうち少なくとも1つに分類されており、複数のカテゴリのうち、1以上のカテゴリを指定するために(即ち指定できるカテゴリの種類数は特に限定されない)、図3のプロット対象指定部508が設けられている。
画像表示制御部507は、プロット対象指定部508により指定された1以上のカテゴリに属する関連ワードに対応する関連ワード点のみを、2次元平面上にプロットした画像を、プロット画像として表示する制御を実行する。
これにより、多数の関連ワード点があって判別しにくい際には、ユーザは、所望のカテゴリのみに絞った関連ワード点を表示させることができるので、ヒット指数の解析等を容易に行うことができるようになる。
なお、このような関連ワードのカテゴリ分類は、階層化することもできる。例えば、上述の例の「地名」という大カテゴリの下層として、さらに、「東京都区内」、「東京多摩地区」等の小カテゴリに分類することもできる。この場合、「浅草」という関連ワードは「東京都区内」に分類され、「多摩境」という関連ワードは「東京多摩地区」に分類されることになる。
これにより、ユーザは、きめ細かいトレンドの解析を行うことが容易にできる。
また、図示はしないが、画像表示制御部507は、各関連ワード点をカテゴリ毎にグループ化して、各カテゴリを示す点(以下、「カテゴリ点」と呼ぶ)を2次元平面上にプロットした画像を、プロット画像として表示することもできる。
例えば、上述の例では、「地名」に属する各関連ワードの受動値及び能動値の夫々の平均値を座標とする点が、「地名」のカテゴリ点としてプロットされる。また、「食べ物」に属する各関連ワードの受動値及び能動値の夫々の平均値を座標とする点が、「食べ物」のカテゴリ点としてプロットされる。
なお、何れのカテゴリをカテゴリ点とするのかについては、図3のプロット対象指定部508により指定されるものとする。
これにより、ユーザは、「江戸」に対する組み合わせとして、「地名」と「食べ物」の何れが流行っているのか等、カテゴリ単位(大きな概念の単位)で検討することもできるようになる。
プロット対象指定部508は、さらに、複数の関連ワードのうち、詳細情報を提示する関連ワードを指定することができる。
画像表示制御部507は、さらに、指定された関連ワードの詳細情報を示す画像を表示する制御をさらに実行する。
ここでいう詳細情報を示す画像の形態は、特に限定されないが、図5や図6において、関連ワード点に対応する関連ワード(テキスト)が表示されたポップアップ画像を採用することができる。
また、詳細情報は、当然ながら、指定された関連ワードに関する情報であれば足り、例えば、指定された関連ワードについてのヒット指数の値や、これまでの時間的経緯の傾向を示す矢印等のシンボル等の他、当該関連ワード点のこれまでの時間推移を示す小さなプロット画像等を採用することができる。
ユーザは、トレンドの検討時に詳細情報をみることができるので、容易に検討できるようになると共に、検討内容の一助にもなり得るので、便宜である。
なお、図5や図6において、「自動」とは、対象ワードと組み合わされる関連ワードとして、制御部110が自動的に抽出したものである。具体的には、対象ワードと同時に検索されているキーワードや対象ワードと同時に新規に書込まれたキーワードの中から推薦するものを、組合せの興味が高そうな関連ワードとして制御部110が抽出したものが「自動」に該当する。
「マニュアル」とは、操作する人間が計算したい、対象ワードと組み合わされる関連ワードをいう。
「ランダム」とは、対象ワードとの組み合わせの分布で、情報が大衆に与える平均的な影響を表すキーワードを、制御部110が無作為に抽出したものをいう。後述するように、これら「ランダム」と対象ワードとの組合せの分布と、対象ワードと各関連ワードとの組合せの分布とを比較することで、ヒット指数を求めることもできる。
[ヒット指数表示処理]
次に、ヒット指数出力装置10が実行する処理であって、ヒット指数を演算してプロット画像を出力するまでの一連の処理(以下、「ヒット指数表示処理」と呼ぶ)について説明する。
図7は、本実施形態に関わるヒット指数出力処理を示すフローチャートである。
ステップS1において、制御部110は、ユーザによる入力部120に対する入力内容に基づいて、対象ワードを決定する。
ステップS2において、受動情報取得部501は、通信I/F部150を介して、情報源サーバ40からステップS1で決定した対象ワードに関する受動情報を取得する。
ステップS3において、能動情報取得部503は、通信I/F部150を介して、情報源サーバ40からステップS1で決定した対象ワードに関する能動情報を取得する。
ステップS4において、受動値算出部502は、ステップS2で取得した受動情報に含まれる全ての関連ワードを集計して、夫々の関連ワードの受動値を算出する。
ステップS5において、能動値算出部504は、ステップS3で取得した能動情報に含まれる全ての関連ワードを集計して、夫々の関連ワードの能動値を算出する。
ステップS6において、ヒット指数生成部505は、ステップS2で取得した受動情報とステップS3で取得した能動情報の和集合に含まれる全ての関連ワードについて、夫々の関連ワードのヒット指数を生成する。
ステップS7において、プロット対象指定部508は、ステップS6でヒット指数が生成された全ての関連ワードのうち、どの関連ワードをプロットするかを指定する。
ステップS8において、プロット画像生成部506は、ステップS7で指定された関連ワードの関連ワード点をプロットした画像を、プロット画像のデータとして生成する。
ステップS9において、画像表示制御部507は、ステップS8で生成されたプロット画像を表示部130に表示させる。
これにより、ヒット指数表示処理は終了となる。
なお、図7の例では、ステップS1〜S6の処理でヒット指数が生成された後、ステップS7以降の処理でプロット画像が表示されるものとしているが、プロット画像の表示は特に必須ではなく、ユーザにより指定された時のみプロット画像を表示するようにしてもよい。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
換言すると、本発明が適用される情報処理装置は、上述の実施形態としてのヒット指数出力装置10を含め、次のような構成を有する各種各様の実施形態を取ることができる。
即ち、ヒット指数出力装置10を含め、本発明が適用される情報処理装置は、
対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を能動情報として、複数の能動情報を能動母集団として設定し、当該能動母集団における複数の関連ワードの夫々の位置づけを示すパラメータ値を、当該関連ワードの能動値として演算する能動値算出手段と、
対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報を受動情報として、複数の受動情報を受動母集団として設定し、当該受動母集団における夫々の関連ワードの位置づけを示すパラメータ値を、当該関連ワードの受動値として演算する受動値算出手段と、
前記複数の関連ワードの夫々について、当該関連ワードの前記能動値及び前記受動値に基づいて、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成するヒット指数生成手段と、
を備える。
これにより、インターネット等に存在する無限の情報から、所定の対象ワードに関する関連ワードに対する大衆の関心の動きを的確に分析することができる。
その分析結果に基づいて、各種各様の分野、例えばマーケティングや、映画製作の分野に活用することができる。
また、大衆に受ける映画に関するどのキーワードがヒットの要因なのかを知ることができ、新たな映画のコンセプト作りに役立てることもできる。
さらに、情報処理装置は、上述の実施形態等に記載した機能等の他、例えば次のような各種各様な機能を持つことができる。
例えば、情報処理装置は、重みの調整機能を持つことができる。この機能は、関連ワードと同等の重みを持つ、ランダムワードを自動的に抽出する機能である。ここでいうランダムワードとは、図5や図6に示す「ランダム」に該当する。従って、このような重みの調整機能を持つことにより、ヒット指数を演算するための関連ワードとランダムワードの比較、より具体的には、対象ワードと各関連ワードの組合せの分布と、対象ワードとランダムワードとの組合せの分布との比較を、より平等にできる。
例えば、情報処理装置は、過去の関連ワードからランダムワードをつくる機能を持つことができる。これにより、対象ワードとランダムワードとの組の分布を用いて、情報が大衆に与える平均的な影響を表すことが可能になる。従って、情報処理装置は、このような機能により得られた「対象ワードとランダムワードとの組合せの分布」を、ヒット指数の演算時の比較元として用いて、当該比較元と、対象ワードと各関連ワードの組合せの分布との比較を行うことで、より精度のよいヒット指数を算出することができる。
即ち、当該機能は、ランダムワード一覧に過去の関連ワードを追加することで、換言すると、実際に登場した関連ワードをランダムワードのリストに追加することで実現される。これにより、ランダムワードが有用で多彩になるため、ヒット指数の演算精度が向上する。
換言すると、図3のヒット指数生成部505は、関連ワードとは独立して、大衆自身が能動的に発信した類の情報から無作為に抽出したワードを能動情報として、情報源が発信し大衆が受動的に受け入れる類の情報から無作為に抽出したワードを受動情報として、当該能動情報と当該受動との組の夫々の位置づけを示すパラメータ値を用いたて第1ヒット指数を演算することができる。
また、ヒット指数生成部505は、上述の実施形態と同様の手法を用いて、対象ワードと関連ワードとの組の夫々の位置づけを示すパラメータ値を用いて第2ヒット指数を演算することができる。
そして、ヒット指数生成部505は、第1ヒット指数と第2ヒット指数を比較することにより、対象ワードと関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を求め、その度合をヒット指数として生成することができる。
この場合、情報処理装置が重みの調整機能を持つならば、ヒット指数生成部505は、第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として、関連ワードと同等の重みを持つワードを抽出することができる。
また、情報処理装置が過去の関連ワードからランダムワードをつくる機能を持つならば、ヒット指数生成部505は、ヒット指数を過去に演算した関連ワードを、第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として抽出することができる。
また例えば、情報処理装置は、バリデーションチェック機能を持つことができる。この機能は、対象ワードと関連ワードの組合せの重複を調べる機能である。この機能があることで、作業効率を高めることができる。ここで、情報処理装置は、バリデーションチェックをクリアしないと、ヒット指数を算出できないものとしてもよい。
例えば、情報処理装置は、感情分析機能を持つことができる。この機能を持つ情報処理装置は、分析対象(例えば物語や脚本等)の展開の時間軸に沿ってどのような感情に支配されているのかを、感情キーワードデーターベースと比較することで算出し、分析対象(例えば物語や脚本等)を感情毎に分割し、夫々の感情を考慮したヒット指数を計算することで、ヒットの法則を見つけることができる。
また、例えば、情報処理装置は、次のような機能を持つこともできる。この機能は、「ヒット指数」と、映像作品(又は楽曲等)の「興行収入/広告宣伝費」(又は楽曲等)との相関関係を見つけ出して、今後の映画等の映像作品(又は楽曲等)の収益予測を行う、又は広告宣伝費の目標額を見出す機能である。
また、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図3の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能がヒット指数出力装置10に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図3の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布されるリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディアは、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図2の記憶部140等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
1 ヒット指数出力システム
10 ヒット指数出力装置
20a、20b、20c 端末
30 通信ネットワーク
40 情報源サーバ
110、210、410 制御部
120、220、420 入力部
130、230、430 表示部
140、240、440 記憶部
150、250、450 通信I/F部
160、260、460 バス
501 受動情報取得部
502 受動値算出部
503 能動情報取得部
504 能動値算出部
505 ヒット指数生成部
506 プロット画像生成部
507 画像表示制御部
508 プロット対象指定部

Claims (11)

  1. 対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を能動情報として、複数の能動情報を能動母集団として設定し、当該能動母集団における複数の関連ワードの夫々の位置づけを示すパラメータ値を、当該関連ワードの能動値として演算する能動値算出手段と、
    対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報を受動情報として、複数の受動情報を受動母集団として設定し、当該受動母集団における夫々の関連ワードの位置づけを示すパラメータ値を、当該関連ワードの受動値として演算する受動値算出手段と、
    前記複数の関連ワードの夫々について、当該関連ワードの前記能動値及び前記受動値に基づいて、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成するヒット指数生成手段と、
    を備える情報処理装置。
  2. 前記ヒット指数生成手段は、
    前記能動値の第1軸と、前記受動値の第2軸とから構築される2次元平面上において、
    所定関連ワードの前記能動値を前記第1軸の座標とし、当該所定関連ワードの前記受動値を前記第2軸の座標とする点を関連ワード点として、
    当該関連ワード点の所定の位置関係に基づいて、前記対象ワードに関する前記所定関連ワードのヒット指数を生成する、
    請求項1に記載の情報処理装置。
  3. 複数の前記関連ワード点を前記2次元平面上にプロットした画像を表示する制御を実行する画像表示制御手段をさらに備える、
    請求項2に記載の情報処理装置。
  4. 前記ヒット指数生成手段は、
    前記関連ワードとは独立して、大衆自身が能動的に発信した類の情報から無作為に抽出したワードを能動情報として、情報源が発信し大衆が受動的に受け入れる類の情報から無作為に抽出したワードを受動情報として、当該能動情報と当該受動情報との組の夫々の位置づけを示すパラメータ値を用いた第1ヒット指数を演算し、
    前記対象ワードと前記関連ワードとの組の夫々の位置づけを示すパラメータ値を用いて第2ヒット指数を演算し、
    前記第1ヒット指数と前記第2ヒット指数を比較することにより、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を求め、その度合をヒット指数として生成する、
    請求項1乃至3のうち何れか1項に記載の情報処理装置。
  5. 前記ヒット指数生成手段は、前記第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として、関連ワードと同等の重みを持つワードを抽出する
    請求項4に記載の情報処理装置。
  6. 前記ヒット指数生成手段は、前記ヒット指数を過去に演算した前記関連ワードを、前記第1ヒット指数の演算に用いる当該能動情報と当該受動情報の夫々として抽出する
    請求項4又は5に記載の情報処理装置。
  7. 前記複数の関連ワード点は、複数のカテゴリのうち少なくとも1つに分類されており、
    前記複数のカテゴリのうち、1以上のカテゴリを指定する指定手段をさらに備え、
    前記画像表示制御手段は、前記指定手段により指定された前記1以上のカテゴリに属する関連ワードに対応する関連ワード点を、前記2次元平面上にプロットした画像を表示する制御をさらに実行する
    請求項3に記載の情報処理装置。
  8. 前記複数のカテゴリの夫々はさらに階層化されており、
    前記指定手段は、前記1以上のカテゴリの夫々を階層単位でさらに指定する
    請求項7に記載の情報処理装置。
  9. 前記指定手段は、さらに、前記複数の関連ワードのうち、詳細情報を提示する関連ワードを指定し、
    前記画像表示制御手段は、さらに、指定された前記関連ワードの詳細情報を示す画像を表示する制御をさらに実行する
    請求項7又は8に記載の情報処理装置。
  10. 情報処理装置が実行する情報処理方法であって、
    対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を能動情報として、複数の能動情報を能動母集団として設定し、当該能動母集団における複数の関連ワードの夫々の位置づけを示すパラメータ値を、当該関連ワードの能動値として演算する能動値算出ステップと、
    対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報を受動情報として、複数の受動情報を受動母集団として設定し、当該受動母集団における夫々の関連ワードの位置づけを示すパラメータ値を、当該関連ワードの受動値として演算する受動値算出ステップと、
    前記複数の関連ワードの夫々について、当該関連ワードの前記能動値及び前記受動値に基づいて、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成するヒット指数生成ステップと、
    を含む情報処理方法。
  11. コンピュータに、
    対象ワードに関する情報のうち、大衆自身が能動的に発信した類の情報を能動情報として、複数の能動情報を能動母集団として設定し、当該能動母集団における複数の関連ワードの夫々の位置づけを示すパラメータ値を、当該関連ワードの能動値として演算する能動値算出ステップと、
    対象ワードに関する情報のうち、情報源が発信し大衆が受動的に受け入れる類の情報を受動情報として、複数の受動情報を受動母集団として設定し、当該受動母集団における夫々の関連ワードの位置づけを示すパラメータ値を、当該関連ワードの受動値として演算する受動値算出ステップと、
    前記複数の関連ワードの夫々について、当該関連ワードの前記能動値及び前記受動値に基づいて、前記対象ワードと当該関連ワードとの組が、大衆の心にどれだけ刺さるのかを示す度合を、ヒット指数として生成するヒット指数生成ステップと、
    を含む制御処理を実行させるプログラム。
JP2014237878A 2014-11-25 2014-11-25 情報処理装置及び方法、並びにプログラム Pending JP2016099875A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014237878A JP2016099875A (ja) 2014-11-25 2014-11-25 情報処理装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014237878A JP2016099875A (ja) 2014-11-25 2014-11-25 情報処理装置及び方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2016099875A true JP2016099875A (ja) 2016-05-30

Family

ID=56077191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014237878A Pending JP2016099875A (ja) 2014-11-25 2014-11-25 情報処理装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2016099875A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011662A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 話題規模管理装置
WO2007043322A1 (ja) * 2005-09-30 2007-04-19 Nec Corporation トレンド評価装置と、その方法及びプログラム
JP2009003888A (ja) * 2007-06-25 2009-01-08 Toshiba Corp キーワード提示のための装置、方法、及びプログラム
JP2011159205A (ja) * 2010-02-03 2011-08-18 Ntt Docomo Inc 日記作成支援システム、日記作成支援方法
JP2012243032A (ja) * 2011-05-18 2012-12-10 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011662A (ja) * 2005-06-30 2007-01-18 Nomura Research Institute Ltd 話題規模管理装置
WO2007043322A1 (ja) * 2005-09-30 2007-04-19 Nec Corporation トレンド評価装置と、その方法及びプログラム
JP2009003888A (ja) * 2007-06-25 2009-01-08 Toshiba Corp キーワード提示のための装置、方法、及びプログラム
JP2011159205A (ja) * 2010-02-03 2011-08-18 Ntt Docomo Inc 日記作成支援システム、日記作成支援方法
JP2012243032A (ja) * 2011-05-18 2012-12-10 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP6397144B2 (ja) 画像からの事業発見
CN108701155B (zh) 社交网络中的专家检测
JP5857124B2 (ja) 画像解析装置、画像解析システム、画像解析方法
US20170300862A1 (en) Machine learning algorithm for classifying companies into industries
US9075870B2 (en) System, method and apparatus for detecting related topics and competition topics based on topic templates and association words
CN103038769B (zh) 用于将内容导引到社交网络引擎用户的系统和方法
US10671619B2 (en) Information processing system and information processing method
US8924491B2 (en) Tracking message topics in an interactive messaging environment
Kordopatis-Zilos et al. Geotagging text content with language models and feature mining
KR101426765B1 (ko) 협업 파트너 검색 서비스를 제공하는 시스템 및 방법
CN106537387B (zh) 检索/存储与事件相关联的图像
Cimen et al. Classification of human motion based on affective state descriptors
CN110737824A (zh) 内容查询方法和装置
CN115170049A (zh) 可信度评分方法、装置、电子设备、存储介质和程序产品
US20160034915A1 (en) Document performance indicators based on referral context
US20180239790A1 (en) Provision device, provision method and non-transitory computer readable storage medium
Chen et al. SenseMap: Urban performance visualization and analytics via semantic textual similarity
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
US10043070B2 (en) Image-based quality control
KR101994564B1 (ko) 사용자 인증 방법 및 장치
Heravi et al. Tweet location detection
Lu et al. Optimized training of deep neural network for image analysis using synthetic objects and augmented reality
EP4384924A1 (en) Evolution of topics in a messaging system
Gao et al. Rumor detection model based on multimodal machine learning
JP2016099875A (ja) 情報処理装置及び方法、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181211

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190611