JP5258532B2 - 評判指数を出力する方法及び評判指数出力装置 - Google Patents

評判指数を出力する方法及び評判指数出力装置 Download PDF

Info

Publication number
JP5258532B2
JP5258532B2 JP2008313452A JP2008313452A JP5258532B2 JP 5258532 B2 JP5258532 B2 JP 5258532B2 JP 2008313452 A JP2008313452 A JP 2008313452A JP 2008313452 A JP2008313452 A JP 2008313452A JP 5258532 B2 JP5258532 B2 JP 5258532B2
Authority
JP
Japan
Prior art keywords
data
reputation
information source
target
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008313452A
Other languages
English (en)
Other versions
JP2010020745A (ja
Inventor
ブローディ ドージェ
マイスター ベルナルド
ブローディ ジュリアン
清 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008313452A priority Critical patent/JP5258532B2/ja
Publication of JP2010020745A publication Critical patent/JP2010020745A/ja
Application granted granted Critical
Publication of JP5258532B2 publication Critical patent/JP5258532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、評判指数を出力する方法及び評判指数出力装置に関する。特に、所定の評価対象に関する評判を表す評判指数を出力する方法及び評判指数出力装置に関する。
近年、インターネットの普及に伴い、ネットワーク上で売買注文を行う投資家が急増している。このような投資家は、マスメディアで流れるニュースの他、投資銘柄の企業のホームページの投資家向け情報や証券会社等が流すアナリストレポート等を参照して投資判断を行うことが多い。
一方、ブログや電子掲示板等の一般人による書き込みが容易なメディアの普及に伴い、真正なニュースのみならず、根拠のない噂が流れる可能性も高まっている。そして、そのような噂が実際に投資銘柄の価格に(特に短期的に)変動をもたらすこともある。
こうした状況において、ブログ等の内容に応じて投資銘柄の評価を行い、投資家が投資の予測を立てるのをサポートする技術が提案されている。
例えば、特許文献1においては、抽出されたブログ及び掲示板の内容をテキストマイニングし、テキストデータを予めカテゴリ毎に意味データと基本ポイントとを対応付けして登録したマスタに応じてデータ化して、当該内容の各ブログ及び掲示板における評価ポイントを算出することを特徴とする投資支援システムに関する技術が開示されている。
このような技術によれば、投資家は、ブログ及び掲示板の内容について、投資支援システムが算出した評価ポイントに応じて投資判断を行うことができる。
特開2007−41869号公報
しかしながら、特許文献1に開示された技術によっても、投資対象毎に予め決められた商品やサービスに関する評価ポイントしか算出することができず、新たな関連商品やサービスがブログに登場した場合においても、それを当該投資対象への評価に反映することができない。
また、根拠のない書き込みや何らかの意図的な書き込み等の読者を誘導して広告収入を得る目的で自動生成された大量のブログ記事等が評価値に影響を与えてしまう可能性もある(スパムの影響)。
また、ブログからの抽出に伴うエラーやテキストマイニングの性能等、技術に起因すること以外にも、社会での出来事や企業の決算発表等のイベントに対する著者の期待や予測等の主観的な要素が評価値に影響を与えてしまう可能性もある(ノイズの影響)。
更に、最近ではインターネット上のブログやニュース記事等の様々な情報によって、上述のような直接の投資対象だけではなく、広く商品、サービス、タレント、映画、ドラマ、観光地、レジャー施設等あらゆるものが消費者のマインドによる評価の対象となっている。そのため、これらの幅広い評価対象を網羅して評価することができる手段を提供することと、上述のスパムやノイズの影響を排除した評価の提供が求められている。
そこで、本発明は、所定の評価対象に関連する新たな商品やサービスがニュース記事、アナリストレポート、インターネット上のブログや電子掲示板等、何らかの情報源に登場した場合においても、それを当該所定の評価対象への評価に自動的に反映することができる評判指数を出力する方法及び評判指数出力装置を提供することを目的とする。
更に、直接の投資対象ではないものも含む評価可能なあらゆるものの評価を反映する評判指数を出力する方法及び評判指数出力装置を提供することを目的とする。
また更に、評価対象に対する本来の評価とは関係ないスパムやノイズの影響を排除できるような評判指数を出力する方法及び評判指数出力装置を提供することを目的とする。
本発明は、具体的には次のようなものを提供する。
(1) 評判指数出力装置が所定の評価対象(例えば、投資銘柄、投資ポートフォリオ、商品、サービス)に関する評判を表す評判指数(例えば、評判インデックス)を出力する方法であって、
前記所定の評価対象に関する複数の対象データ(例えば、投資銘柄名、或いは商品名を示すテキストデータ)を含む複数の情報源データ(例えば、ブログ、ニュース、アナリストレポート、検索ログ)で構成する情報源データベース(必ずしも一のテーブル、一のハードウェアで実現しなくともよい)から前記所定の評価対象に関する対象データを抽出する抽出ステップと、
抽出した前記対象データの各々について解析することによって、前記所定の評価対象の評判を決定する評判ポイントデータ(例えば、プラス1、マイナス1、ニュートラル)を算出して前記評価対象の各々に関連付けて記憶する解析ステップと、
前記複数の情報源データの各々の重要度を示すウエイトデータ(例えば、0〜1の間の任意の数値)を前記複数の情報源データに関連付けて記憶するウエイト付与ステップと、
記憶した前記評判ポイントデータと、前記評判ポイントデータに関連付けられた前記対象データを含む前記情報源データに関連付けられた前記ウエイトデータと、を乗ずることにより、前記所定の評価対象の前記評判指数を算出して出力する出力ステップと、を含み、
前記複数の対象データは、前記所定の評価対象を示すキーワードを含む主対象データ(例えば、投資銘柄名や商品名、サービス名そのもの)と、前記所定の評価対象に関連する副対象データ(例えば、当該投資銘柄の商品名やサービス名、或いは当該商品のメーカー名)と、を少なくとも含み、
前記評判指数出力装置は、前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度(例えば、0〜1の間の任意の数値)を示す関連テーブル(例えば、投資銘柄名をキーとする商品名・サービス名テーブル、或いは、商品名をキーとするメーカー名、販売店名テーブル)を生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定するものである方法。
本発明のこのような構成によれば、前記評判指数出力装置は、前記所定の評価対象に関する複数の対象データ(例えば、投資銘柄名或いは商品名を示すテキストデータ)を含む複数の情報源データ(例えば、ブログ、ニュース、アナリストレポート、検索ログ)で構成する情報源データベース(必ずしも一のテーブル、一のハードウェアで実現しなくともよい)から前記所定の評価対象に関する対象データを抽出し、
抽出した前記評価対象の各々について解析することによって、前記所定の評価対象の評判を決定する評判ポイントデータ(例えば、プラス1、マイナス1、ニュートラル)を算出して前記評価対象の各々に関連付けて記憶し、
前記複数の情報源データの各々の重要度を示すウエイトデータ(例えば、0〜1の間の任意の数値)を前記複数の情報源データに関連付けて記憶し、
記憶した前記評判ポイントデータと、前記評判ポイントデータに関連付けられた前記評価対象を含む前記情報源データに関連付けられた前記ウエイトデータと、を乗ずることにより、前記所定の評価対象の前記評判指数を算出して出力し、
前記複数の対象データは、前記所定の評価対象を示すキーワードを含む主対象データ(例えば、投資銘柄名や商品名、サービス名そのもの)と、前記所定の評価対象に関連する副対象データ(例えば、投資銘柄の商品名やサービス名、或いは商品のメーカー名)と、を少なくとも含み、
前記評判指数出力装置は、前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度(例えば、0〜1の間の任意の数値)を示す関連テーブル(例えば、投資銘柄名をキーとする商品名・サービス名テーブル、或いは、商品名をキーとするメーカー名、販売店名テーブル)を生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定する。
このことにより、前記評判指数出力装置は、主対象データのみならず、主対象データに関連する副対象データに関する評価も含めて評価対象に関する評判指数を出力することができる。
その結果、主対象データ(例えば、投資銘柄名、或いは商品名、サービス名そのもの)に新たに関連する副対象データ(例えば、当該投資銘柄の商品名やサービス名、或いは当該商品のメーカー名)が加わった場合においても、自動的にその評価を織り込んで評判指数に反映することができる。更に評価対象は直接の投資対象のみならず、ネット上で評価可能なあらゆるものを対象として、当該ネット上の評価を前記評判指数に反映することができる。
(2) 前記評判指数のボラティリティを示す評判指数ボラティリティデータを更に算出して出力する(1)に記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、前記評判指数のボラティリティを示す評判指数ボラティリティデータを更に算出して出力する。
このことにより、出力された評判指数ボラティリティデータに基づいて、ユーザは、対象データの評価を下すことができる。ボラティリティデータは当該評価対象の評価の時系列上の動きの大きさ、早さを反映するので、ユーザは、それらの情報を加味した評判指数に基づいて投資判断等をすることができる。
(3) 前記評判ポイントデータは少なくともプラス評価及びマイナス評価を含んで構成する(1)又は(2)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、少なくともプラス評価及びマイナス評価を含む前記評判ポイントデータに基づいて前記評判指数を計算する。
このことにより、プラス評価及びマイナス評価という比較的シンプルでわかりやすい評価データを使用することになるので、自動的に判定する際の精度向上に好適である。
(4) 前記評判ポイントデータは、ニュートラル評価を更に含んで構成する(1)から(3)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、ニュートラル評価を更に含む評判ポイントデータに基づいて前記評判指数を計算する。
このことにより、プラスともマイナスとも言えない評価が入力されている場合にニュートラル評価を行うことができるので、無理にプラス評価やマイナス評価を行うのに比べてスパムやノイズの影響を抑制することが可能で、評価の実態を素直に表現する上で好適である。
(5) 前記評判指数のドリフトを示す評判指数ドリフトデータを更に算出して出力する(1)から(4)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、前記評判指数のドリフトを示す評判指数ドリフトデータを更に算出して出力する。
このことにより、前記評判指数出力装置は、評判指数ドリフトデータによって前記評判指数の動きを表現してユーザに提供することができる。
その結果、ユーザは、評価対象の評判指数の絶対値のみならず、動きを知ることによって投資等の判断の参考とすることができる。また、自動生成された大量のブログ記事等によるスパムの影響は評判指数の動きに影響を与えるため、ユーザは、その評判指数からスパムの影響を推測することができる。
(6) 前記ウエイトデータは、前記情報源データの重要度を示す情報源ウエイトデータ(例えば、ブログのウエイト:0.1、ニュースのウエイト:0.5、検索ログ:0.7、アナリストレポート:1.0等)及び前記情報源データの情報源被参照数(例えば、クリック数、検索キーワード入力数、サブスクライブ数)に基づいて決定する(1)から(5)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、前記ウエイトデータを、前記情報源データの重要度を示す情報源ウエイトデータ(例えば、ブログのウエイト:0.1、ニュースのウエイト:0.5、検索ログ:0.7、アナリストレポート:1.0等)及び前記情報源データの情報源被参照数(例えば、クリック数、検索キーワード入力数、サブスクライブ数)に基づいて決定する。
このことにより、前記評判指数出力装置は、前記ウエイトデータを、情報源ウエイトデータに基づいて軽重を付けて最終的な評判指数に反映することができる。
(7) 前記ウエイトデータは、更に前記評判指数出力装置のユーザの投資性向を示す投資性向データ(例えば、短期リスク注目型、長期リスク注目型)に基づいて決定する(1)から(6)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、前記ウエイトデータを、更に前記評判指数出力装置のユーザの投資性向を示す投資性向データ(例えば、短期リスク注目型、長期リスク注目型)に基づいて決定する。
このことにより、前記評判指数出力装置は、前記ユーザの投資性向に応じて前記ウエイトデータを調整して前記評判指数を算出することができる。
その結果、使用するユーザの投資性向に応じて決定するウエイトを反映した評判指数を提供することができる。
(8) 前記情報源データベースにおいて、所定の評判情報が前記対象データと共に現れる頻度を算出して記憶する記憶ステップを更に含み、
前記抽出ステップは、前記記憶ステップにより記憶された前記頻度の高い対象データを優先的に抽出することを特徴とする(1)から(7)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、所定の評判情報と共起する確率の高い対象データを優先的に抽出し、処理件数を減らすことができる。その結果、例えば、精度検証のために1年間や数年間等の大規模なデータを用いて評判指数を求める場合に、処理の効率化を図ることができる。更に、評判情報と共起する有意義なデータを用いるので、評判指数の精度を高めることができる。
(9) 前記複数の情報源データの各々を順位付けする評価値を算出し、当該情報源データに関連付けて記憶する評価ステップを更に含み、
前記抽出ステップは、前記評価ステップにより記憶された前記評価値の高い情報源データから優先的に前記対象データを抽出することを特徴とする(1)から(8)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、情報源データを順位付けするための、例えば、ページランク(登録商標)やHITS(Hypertext Induced Topic Selection)等の評価値を算出し、この評価値の高い情報源データを優先して処理する。これにより処理件数が減るので、例えば精度検証のために大規模なデータを用いて評判指数を求める場合に、処理の効率化を図ることができる。更に、スパム等の評価値が低い情報源データを排除することにより、評判指数の精度を高めることができる。
(10) 前記出力ステップは、所定の期間毎の前記情報源データに基づいて、当該期間それぞれにおける前記評判指数を算出することを特徴とする(1)から(9)のいずれかに記載の方法。
本発明のこのような構成によれば、前記評判指数出力装置は、所定の期間毎に評判指数を出力するので、ユーザは、過去の複数の時点での評判を知ることができる。その結果、特に1年間や数年間等の大規模なデータを用いた場合に、時系列での傾向を把握することができる。
(11) 所定の評価対象(例えば、投資銘柄、投資ポートフォリオ、商品、サービス)に関する評判を表す評判指数(例えば、評判インデックス)を出力する評判指数出力装置であって、
前記所定の評価対象に関する複数の対象データ(例えば、投資銘柄名、或いは商品名を示すテキストデータ)を含む複数の情報源データ(例えば、ブログ、ニュース、アナリストレポート、検索ログ)で構成する情報源データベース(必ずしも一のテーブル、一のハードウェアで実現しなくともよい)から前記所定の評価対象に関する対象データを抽出する抽出手段と、
抽出した前記対象データの各々について解析することによって、前記所定の評価対象の評判を決定する評判ポイントデータ(例えば、プラス1、マイナス1、ニュートラル)を算出して前記評価対象の各々に関連付けて記憶する解析手段と、
前記複数の情報源データの各々の重要度を示すウエイトデータ(例えば、0〜1の間の任意の数値)を前記複数の情報源データに関連付けて記憶するウエイト付与手段と、
記憶した前記評判ポイントデータと、前記評判ポイントデータに関連付けられた前記対象データを含む前記情報源データに関連付けられた前記ウエイトデータと、を乗ずることにより、前記所定の評価対象の前記評判指数を算出して出力する出力手段と、を含み、
前記複数の対象データは、前記所定の評価対象を示すキーワードを含む主対象データ(例えば、投資銘柄名や商品名、サービス名そのもの)と、前記所定の評価対象に関連する副対象データ(例えば、当該投資銘柄の商品名やサービス名、或いは当該商品のメーカー名)と、を少なくとも含み、
前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度(例えば、0〜1の間の任意の数値)を示す関連テーブル(例えば、投資銘柄名をキーとする商品名・サービス名テーブル、或いは、商品名をキーとするメーカー名、販売店名テーブル)を生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定するものである評判指数出力装置。
本発明によれば、評判指数出力装置は、所定の評価対象を示すキーワードを含む主対象データと、前記所定の評価対象に関連する副対象データと、を少なくとも含んで構成する複数の対象データを情報源データベースから抽出して解析することによって、前記所定の評価対象に関する評判指数を算出して出力する。更に、前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度を示す関連テーブルを生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定する。このことにより、所定の評価対象に関連する新たな商品やサービスがインターネット上のブログや電子掲示板、アナリストレポート等の情報源に登場した場合においても、それを当該所定の評価対象への評判指数の出力に自動的に反映することができる。
<第1実施形態>
以下、本発明の第1実施形態について説明する。
図1は、本実施形態に係る評判指数出力システムの全体構成を示す図である。図2は、本実施形態に係る端末20a、20b、20c、・・・、評判指数出力装置10及び情報源サーバ40のハードウェア構成を示す図である。図3は、本実施形態に係る評判指数出力装置の機能構成を示す図である。図4は、本実施形態に係る評判指数出力処理を示すフローチャートである。図5は、本実施形態に係る情報源データベースの一例を示す図である。図6は、本実施形態に係る関連テーブルの一例を示す図である。図7は、本実施形態に係る対象データテーブルの一例を示す図である。図8は、本実施形態に係る投資性向データの一例を示す図である。
[評判指数出力システムの全体構成]
図1に示すように、本実施形態に係る評判指数出力システム1は、端末20a、20b、20c、・・・、評判指数出力装置10、通信ネットワーク30、情報源サーバ40を含む。端末20a、20b、20c、・・・は通信ネットワーク30を介して評判指数出力装置10及び情報源サーバ40と接続可能である。ここで、端末20a、20b、20c、・・・は、一般にクライアントと呼称されることがある。
[端末、評判指数出力装置、情報源サーバのハードウェア構成]
図2に示すように、端末20a、20b、20c、・・・、評判指数出力装置10及び情報源サーバ40は、制御部110、210、410、入力部120、220、420、表示部130、230、430、記憶部140、240、440及び通信I/F部150、250、450がそれぞれバス160、260、460を介して接続されて構成される。
制御部110、210、410は、CPU(Central Processing Unit)により構成してよく、それぞれ端末20a、20b、20c、・・・、評判指数出力装置10、情報源サーバ40全体を制御し、例えば、記憶部140、240、440に記憶されたプログラムを読み出して実行することにより、これらのハードウェアと協働して後述する各種手段を実現している。
入力部120、220、420は、キーボード、マウス等により実現することができる。
表示部130、230、430は、液晶ディスプレイ、ブラウン管CRT等により実現することができる。
端末20a、20b、20c、・・・の記憶部140、評判指数出力装置10の記憶部240及び情報源サーバ40の記憶部440は、端末20a、20b、20c、・・・、評判指数出力装置10及び情報源サーバ40がそれぞれ端末、サーバ及び情報源サーバとして機能するための各種プログラム及び本発明の機能を実行するプログラム等を格納する。これらの記憶部140、240、440は、内部又は外部の記憶媒体に格納されてもよく、記憶媒体として、ハードディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、メモリーカード等全ての記憶装置及び記憶媒体を使用することができる。
通信I/F部150、250、450は、LANアダプタ、モデムアダプタ等により実現することができる。
[評判指数出力装置の機能構成]
図3は、図1で説明した本実施形態に係る評判指数出力装置10の機能構成の一例を示す図である。評判指数出力装置10は、関連テーブル生成手段111、抽出手段112、解析手段113、ウエイト付与手段114、出力手段115を含んで構成されている。更に、情報源データベース121、関連テーブル122、対象データテーブル123を含んで構成されている。更に、対象データテーブル123は、主対象データ1231、副対象データ1232を含んで構成されている。
評判指数出力装置10は、コンピュータとして実現した例で説明しているが、これに限らず、専用に設計された情報機器として実現してもよい。
端末20a、20b、20c、・・・は、コンピュータとして実現した例で説明しているが、これに限らず、携帯電話、PDA(Personal Data Assistant)等の情報端末や、Webテレビのようなネットワーク接続可能な情報表示装置で実現してもよい。
[評判指数出力処理]
図4は、本実施形態に係る評判指数出力処理を示すフローチャートである。
まず、評判指数出力装置10の関連テーブル生成手段111が、情報源データベース121に基づいて関連テーブル122を生成する(ステップS101)。具体的には、例えば、図5に示すような情報源データベース121が参照される。図5の例では、「http://WWW.blog1.com」という情報源サーバ40から、「○○の△△は、おいしかった。・・・」というデータ内容を受信して記憶しており、その内容は「2806」回参照されているものであることが分かる。更に、「http://WWW.blog1.com」という情報源サーバ40の重要度を示すウエイトは「0.5」であることが記憶されている。
なお、情報源データベース121のデータ内容は、クローラ等と呼ばれる公知の様々なプログラムを実行することにより、内部或いは外部の情報源サーバ40から定期的に、或いは管理者のコマンド入力を受け付けることによって、受信して記憶する。このようして、評判指数出力装置10は、評判指数を出力するための基礎情報となるデータ内容を収集する。情報源サーバ40としては、データ内容を参照ログと共に管理しているいわゆるブログサーバ、ニュース配信サーバ、或いは検索ログを管理しているサーチサービスサーバ等、様々なサーバが該当する。
ここで、図6の例では、関連テーブル生成手段111は、このデータ内容「○○の△△は、おいしかった。・・・」に基づいて、「○○」を主対象データとし、「△△」、「△○」等を副対象データとして関連テーブル122に記憶する。更に、これらの副対象データの主対象データとの関連度がそれぞれ「0.9」、「0.85」であることも合わせて関連テーブル122に記憶する。この関連度は管理者が予め設定しておいてもよいし、過去の検索結果において同じコンテンツに登場した回数等に基づいて自動的に設定するようにしてもよい。
次に、抽出手段112が、関連テーブル122に基づいて、対象データテーブル123を生成する(ステップS102)。具体的には例えば、図7に示すように、対象「○○」について、「○○」、「△△」、「△○」等を抽出して記憶する。この際、関連テーブル122において、対象「○○」と関連度の高いものから順に抽出すると好適である。
次に、解析手段113が、対象データテーブル123を参照し、対象データのそれぞれについて解析して評判ポイントデータを算出して記憶する(ステップS103)。具体的には、例えば、図7の例において、対象データ「○○」について、「http://WWW.blog1.com」のデータ内容「○○の△△は、おいしかった。・・・」を形態素解析し、「○○」がポジティブに捉えられていると判断した場合には「+1」を評判ポイントとして設定して記憶する。逆にネガティブに捉えられていると判断した場合には「−1」を評判ポイントとして設定して記憶する。また、ニュートラルに捉えられていると判断した場合には「±0」を評判ポイントとして設定して記憶する。このようにして、評判指数出力装置10は、各対象データに対して評判ポイントを付与していく。
次に、ウエイト付与手段114が、投資性向データ124に基づいて、ウエイトデータを付与する(ステップS104)。具体的には、例えば、図7に示す最初のレコード「○○」に対して、図5に示す情報源データベースの情報源ウエイトデータ「0.5」に被参照数「2806」を乗じた「1403」をウエイトデータとして付与してもよい。また、図8に示すような投資性向データ124が記憶されていた場合には、ユーザの投資性向によって、情報源ウエイトデータの値を修正して適用してもよい。例えば、「User1」というユーザに対しては、投資性向が「短期」であることから、ブログサーバに関する情報源ウエイトデータが相対的に大きくなるように修正してもよい。
次に、出力手段115が、評判ポイントデータ及びウエイトデータに基づいて、評判指数を算出して出力する(ステップS105)。具体的には、例えば、図7に示す例では、対象「○○」について、それぞれ評判ポイントにウエイトデータを乗じたものを集計して評判指数として出力してもよい。このようにして、評判指数出力装置10は、様々な対象について評判指数を算出することができる。対象は、投資銘柄や、カテゴリに限らず、CMタレントや、商品、サービスそのもの等、独立して評判をトラッキングすることができるあらゆるものを対象とすることができる。
なお、上述のように評判指数出力装置10が出力した内容は、通信ネットワーク30を介してユーザの端末20a、20b、20c、・・・に送信されて出力されることになる。
[計算例]
ここで、上述の評判指数の具体的な計算方法、及び更なる加工計算の一例について説明する。例えば、ある対象について、次のように変数を定義する。
Figure 0005258532
この場合、アイテムiの評判指数(インデックス)Hは、以下のように計算できる。
Figure 0005258532
ここで、それぞれのアイテムの評判指数(インデックス)にウエイトWを乗ずると、全体の評判指数(インデックス)は次のように計算できる。
Figure 0005258532
更に、ボラティリティを計算すると、
Figure 0005258532
となる。このようなボラティリティを加味して指数を分析し、投資可否を判断してもよい。
更に、ドリフトを計算すると、
Figure 0005258532
を計算し、
Figure 0005258532
に基づいて投資可否を判断してもよい。即ち、対象の評判指数のボラティリティ及び対象が掲載された情報源の数の動向にウエイトをかけたものに基づいて投資可否を判断してもよい。このように、評判指数出力装置10による評判指数に基づいて、ユーザは投資活動を始めとする様々な判断を行うことができる。
<第2実施形態>
以下、本発明の第2実施形態について説明する。本実施形態では、第1実施形態により出力される評判指数の精度、即ち評判指数出力装置10の有効性を検証することを想定する。具体的には、情報源データベース121として、例えば1年間や数年間等の大規模データを用いて、過去一定期間における評判指数の推移を管理者に提示する。なお、第1実施形態と同様の機能を果たす部分には同一の符号を付し、説明を省略する。
図9は、本実施形態に係る評判指数出力装置10aの機能構成の一例を示す図である。評判指数出力装置10aは、第1実施形態に加えて、選別手段116及び評価対象データベース125を更に含んで構成されている。
選別手段116は、まず、情報源データベース121aの中から、評判情報が書かれている確率の高い対象データ(銘柄や製品名等のアイテム)を選別する。このとき、選別手段116は、確率として、例えば、対象データの出現回数に対して、対象データが「良い」、「悪い」、「美味しい」、「不味い」等の評判情報と共起する回数の割合を算出して記憶する。なお、この評判情報と共起する回数の割合は、情報源データベース121aをテキストマイニングすることにより算出することができるが、評判指数出力装置10aの辞書編集者等の人手により与えられることとしてもよい。
図10は、本実施形態に係る評価対象データベース125の一例を示す図である。評価対象データベース125には、各対象データと共に、この対象データに関して上記の評判情報が書かれている確率が記憶されている。この確率は、対象データそれぞれの優先度を示しており、抽出手段112aは、優先度の高い対象データから優先して抽出する。優先度の高い対象データを用いて評判指数を算出することにより、評判指数出力装置10aは、精度の高い指数を出力することができる。
なお、優先度は、ユーザからの指定入力を受け付けて調整されてもよい。また、このような入力情報を、上記の確率とは別の評価情報として対象データに関連付けて記憶してもよい。
次に、選別手段116は、価値の高い情報源データを選別する。具体的には、選別手段116は、ページランク(登録商標)やHITS等の情報源データを順位付けする評価値を算出し、情報源データと対応付けて記憶する。また、情報源データが例えばブログや掲示板等であれば、アクセス数、コメント数、引用数等を評価値として算出してもよい。
図11は、本実施形態に係る評価値と記事(情報源データ)数との関係、及び処理の優先度を示す図である。評価値が低い記事は多数存在するものの、有効な情報が取り出せないスパムである場合が多い。一方、評価値が高くなるほど存在する記事数は少なくなるが、信頼性の高い記事の割合が高いことが期待できる。
そこで、例えば、全記事数をほぼ半数ずつに分ける評価値「3600」以上の記事を用いることにより、高い精度で処理の効率化を図ることができる。更に、評価値「3600」以上の記事数を半数に分け、評価値が上位の記事を優先的に処理し、下位の記事を次に処理するように優先順位を付けてもよい。
図12は、本実施形態に係る情報源データベース121aの一例を示す図である。第1実施形態における情報源データベース121(図5)に加えて、更に情報源データ(Webページ)毎の評価値が記憶されている。図11の例に従えば、評価値が「3600」以上である1番目と2番目の情報源データが用いられる。
図13は、本実施形態に係る評判指数出力処理を示すフローチャートである。なお、第1実施形態と同一の処理には同一の符号を付し、説明を省略する。
まず、選別手段116は、情報源データベース121aに基づいて、評判が書かれている確率の高い対象データを、この確率(優先度)と共に評価対象データベース125に記憶する(ステップS201)。
次に、選別手段116は、情報源データそれぞれの評価値を算出し、情報源データベース121aを更新する(ステップS202)。なお、ステップS201及びステップS202の処理順序は限定されない。
そして、抽出手段112aは、関連テーブル122及び評価対象データベース125に基づいて、対象データを抽出して記憶する(ステップS203)。このとき、抽出手段112aは、評価対象データベース125において優先度が高く設定された対象データ、また、情報源データベース121aで評価値が高く設定された情報源データを抽出して、対象データテーブル123(図7)を生成する。
本実施形態では、情報源データとして過去一定期間の大規模データを利用した。ここで、情報源データが作成された日時を取得することにより、評判指数出力装置10aは、所定期間を対象とした評判指数を出力することができる。具体的には、情報源データベース121aに作成日時フィールドが追加されてよい。また、評判指数出力装置10aは、所定期間毎に分割して、それぞれの期間で算出された評判指数を、評判の推移として出力することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
本発明の第1実施形態に係る評判指数出力システムの全体構成を示す図である。 本発明の第1実施形態に係る端末20a、20b、20c、・・・、評判指数出力装置10及び情報源サーバ40のハードウェア構成を示す図である。 本発明の第1実施形態に係る評判指数出力装置の機能構成を示す図である。 本発明の第1実施形態に係る評判指数出力処理を示すフローチャートである。 本発明の第1実施形態に係る情報源データベースの一例を示す図である。 本発明の第1実施形態に係る関連テーブルの一例を示す図である。 本発明の第1実施形態に係る対象データテーブルの一例を示す図である。 本発明の第1実施形態に係る投資性向データの一例を示す図である。 本発明の第2実施形態に係る評判指数出力装置の機能構成を示す図である。 本発明の第2実施形態に係る評価対象データベースの一例を示す図である。 本発明の第2実施形態に係る評価値と記事数との関係、及び処理の優先度を示す図である。 本発明の第2実施形態に係る情報源データベースの一例を示す図である。 本発明の第2実施形態に係る評判指数出力処理を示すフローチャートである。
符号の説明
1 評判指数出力システム
10、10a 評判指数出力装置
20a、20b、20c 端末
30 通信ネットワーク
40 情報源サーバ
110、210、410 制御部
120、220、420 入力部
130、230、430 表示部
140、240、440 記憶部
150、250、450 通信I/F部
160、260、460 バス

Claims (11)

  1. 評判指数出力装置が所定の評価対象に関する評判を表す評判指数を出力する方法であって、
    前記所定の評価対象に関する複数の対象データを含む複数の情報源データで構成する情報源データベースから前記所定の評価対象に関する対象データを抽出する抽出ステップと、
    抽出した前記対象データの各々について解析することによって、前記所定の評価対象の評判を決定する評判ポイントデータを算出して前記評価対象の各々に関連付けて記憶する解析ステップと、
    前記複数の情報源データの各々の重要度を示すウエイトデータを前記複数の情報源データに関連付けて記憶するウエイト付与ステップと、
    記憶した前記評判ポイントデータと、前記評判ポイントデータに関連付けられた前記対象データを含む前記情報源データに関連付けられた前記ウエイトデータと、を乗ずることにより、前記所定の評価対象の前記評判指数を算出して出力する出力ステップと、を含み、
    前記複数の対象データは、前記所定の評価対象を示すキーワードを含む主対象データと、前記所定の評価対象に関連する副対象データと、を少なくとも含み、
    前記評判指数出力装置は、前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度を示す関連テーブルを生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定するものである方法。
  2. 前記評判指数のボラティリティを示す評判指数ボラティリティデータを更に算出して出力する請求項1に記載の方法。
  3. 前記評判ポイントデータは少なくともプラス評価及びマイナス評価を含んで構成する請求項1又は請求項2のいずれかに記載の方法。
  4. 前記評判ポイントデータは、ニュートラル評価を更に含んで構成する請求項1から請求項3のいずれかに記載の方法。
  5. 前記評判指数のドリフトを示す評判指数ドリフトデータを更に算出して出力する請求項1から請求項4のいずれかに記載の方法。
  6. 前記ウエイトデータは、前記情報源データの重要度を示す情報源ウエイトデータ及び前記情報源データの情報源被参照数に基づいて決定する請求項1から請求項5のいずれかに記載の方法。
  7. 前記ウエイトデータは、更に前記評判指数出力装置のユーザの投資性向を示す投資性向データに基づいて決定する請求項1から請求項6のいずれかに記載の方法。
  8. 前記情報源データベースにおいて、所定の評判情報が前記対象データと共に現れる頻度を算出して記憶する記憶ステップを更に含み、
    前記抽出ステップは、前記記憶ステップにより記憶された前記頻度の高い対象データを優先的に抽出することを特徴とする請求項1から請求項7のいずれかに記載の方法。
  9. 前記複数の情報源データの各々を順位付けする評価値を算出し、当該情報源データに関連付けて記憶する評価ステップを更に含み、
    前記抽出ステップは、前記評価ステップにより記憶された前記評価値の高い情報源データから優先的に前記対象データを抽出することを特徴とする請求項1から請求項8のいずれかに記載の方法。
  10. 前記出力ステップは、所定の期間毎の前記情報源データに基づいて、当該期間それぞれにおける前記評判指数を算出することを特徴とする請求項1から請求項9のいずれかに記載の方法。
  11. 所定の評価対象に関する評判を表す評判指数を出力する評判指数出力装置であって、
    前記所定の評価対象に関する複数の対象データを含む複数の情報源データで構成する情報源データベースから前記所定の評価対象に関する対象データを抽出する抽出手段と、
    抽出した前記対象データの各々について解析することによって、前記所定の評価対象の評判を決定する評判ポイントデータを算出して前記評価対象の各々に関連付けて記憶する解析手段と、
    前記複数の情報源データの各々の重要度を示すウエイトデータを前記複数の情報源データに関連付けて記憶するウエイト付与手段と、
    記憶した前記評判ポイントデータと、前記評判ポイントデータに関連付けられた前記対象データを含む前記情報源データに関連付けられた前記ウエイトデータと、を乗ずることにより、前記所定の評価対象の前記評判指数を算出して出力する出力手段と、を含み、
    前記複数の対象データは、前記所定の評価対象を示すキーワードを含む主対象データと、前記所定の評価対象に関連する副対象データと、を少なくとも含み、
    前記情報源データベースに基づいて、前記副対象データと前記所定の評価対象との関連度を示す関連テーブルを生成して記憶し、記憶した前記関連テーブルに基づいて、前記評価対象と関連度の高い前記副対象データを選定するものである評判指数出力装置。
JP2008313452A 2008-06-10 2008-12-09 評判指数を出力する方法及び評判指数出力装置 Active JP5258532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008313452A JP5258532B2 (ja) 2008-06-10 2008-12-09 評判指数を出力する方法及び評判指数出力装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008152121 2008-06-10
JP2008152121 2008-06-10
JP2008313452A JP5258532B2 (ja) 2008-06-10 2008-12-09 評判指数を出力する方法及び評判指数出力装置

Publications (2)

Publication Number Publication Date
JP2010020745A JP2010020745A (ja) 2010-01-28
JP5258532B2 true JP5258532B2 (ja) 2013-08-07

Family

ID=41705529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008313452A Active JP5258532B2 (ja) 2008-06-10 2008-12-09 評判指数を出力する方法及び評判指数出力装置

Country Status (1)

Country Link
JP (1) JP5258532B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978665A (zh) * 2015-06-16 2015-10-14 北京畅游天下网络技术有限公司 一种品牌评估方法和装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101186987B1 (ko) * 2010-04-12 2012-09-28 송길영 브랜드 맵 생성 방법 및 브랜드 맵 생성 시스템
JP5810452B2 (ja) * 2010-05-16 2015-11-11 アクセス ビジネス グループ インターナショナル リミテッド ライアビリティ カンパニー インパクト分析や影響追跡を含むマルチメディアのためのデータ収集、追跡及び分析手法
EP2649577A4 (en) * 2010-12-09 2015-12-30 Exacttarget Inc SYSTEM, METHOD AND COMPUTER-READABLE PROGRAM FOR REAL-TIME ACTIVITY MANAGEMENT
JP5679194B2 (ja) * 2011-05-18 2015-03-04 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP5399451B2 (ja) * 2011-07-26 2014-01-29 ヤフー株式会社 評価指標提供装置、方法及びプログラム
JP2014002446A (ja) * 2012-06-15 2014-01-09 Sony Corp 情報処理装置およびプログラム
CN108491377B (zh) * 2018-03-06 2021-10-08 中国计量大学 一种基于多维度信息融合的电商产品综合评分方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3738011B2 (ja) * 2001-11-20 2006-01-25 株式会社ジャストシステム 情報処理装置、情報処理方法、及び情報処理プログラム
JP4148522B2 (ja) * 2004-11-19 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現検出システム、表現検出方法、及びプログラム
JP2006301718A (ja) * 2005-04-15 2006-11-02 Pioneer Electronic Corp 情報処理装置、情報処理システム、情報処理方法、情報処理プログラム、および、そのプログラムを記録した記録媒体
JP4744404B2 (ja) * 2006-09-13 2011-08-10 C2cube株式会社 評価出力装置、評価出力方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978665A (zh) * 2015-06-16 2015-10-14 北京畅游天下网络技术有限公司 一种品牌评估方法和装置

Also Published As

Publication number Publication date
JP2010020745A (ja) 2010-01-28

Similar Documents

Publication Publication Date Title
JP5258532B2 (ja) 評判指数を出力する方法及び評判指数出力装置
US7895227B1 (en) System and method for detecting trends in network-based content
Olteanu et al. Web credibility: Features exploration and credibility prediction
US8990241B2 (en) System and method for recommending queries related to trending topics based on a received query
O'Leary Blog mining-review and extensions:“From each according to his opinion”
Ruiz et al. Correlating financial time series with micro-blogging activity
US7685091B2 (en) System and method for online information analysis
US20080228574A1 (en) System And Method For Conveying Content Changes Over A Network
US11257161B2 (en) Methods and systems for predicting market behavior based on news and sentiment analysis
US9443245B2 (en) Opinion search engine
JP4464975B2 (ja) コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法
US20080104034A1 (en) Method For Scoring Changes to a Webpage
US9384501B2 (en) Managing reputations
US9639622B2 (en) Image processing system, image processing method, program, and non-transitory information storage medium
WO2008144444A1 (en) Ranking online advertisements using product and seller reputation
US9251249B2 (en) Entity summarization and comparison
US8495210B1 (en) Predictive publishing of internet digital content
US20110258560A1 (en) Automatic gathering and distribution of testimonial content
WO2007143223A2 (en) System and method for entity based information categorization
Vosecky et al. Searching for quality microblog posts: Filtering and ranking based on content analysis and implicit links
US20210209624A1 (en) Online platform for predicting consumer interest level
US20120271806A1 (en) Generating domain-based training data for tail queries
US20070233563A1 (en) Web-page sorting apparatus, web-page sorting method, and computer product
Ye et al. Internet big data and capital markets: a literature review
US20110276553A1 (en) Classifying documents according to readership

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130423

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5258532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250