JP5729308B2 - 評判分析装置、評判分析方法、および評判分析用プログラム - Google Patents

評判分析装置、評判分析方法、および評判分析用プログラム

Info

Publication number
JP5729308B2
JP5729308B2 JP2011543226A JP2011543226A JP5729308B2 JP 5729308 B2 JP5729308 B2 JP 5729308B2 JP 2011543226 A JP2011543226 A JP 2011543226A JP 2011543226 A JP2011543226 A JP 2011543226A JP 5729308 B2 JP5729308 B2 JP 5729308B2
Authority
JP
Japan
Prior art keywords
reputation
time
spontaneous
description
spontaneous behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011543226A
Other languages
English (en)
Other versions
JPWO2011065295A1 (ja
Inventor
穣 岡嶋
穣 岡嶋
安藤 真一
真一 安藤
聡 中澤
聡 中澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011543226A priority Critical patent/JP5729308B2/ja
Publication of JPWO2011065295A1 publication Critical patent/JPWO2011065295A1/ja
Application granted granted Critical
Publication of JP5729308B2 publication Critical patent/JP5729308B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、入力されたキーワードが示す対象に対する評判の時間的な変化を分析するために利用される、評判分析装置、評判分析方法、及び評判分析用プログラムに関する。
大量のテキスト情報を解析することで、ある対象に対する人々の評判を抽出する技術が存在する。このような技術は、人間の意思決定支援やマーケティングのために非常に有用である。例えば、ある製品について買うか買わないか迷っている人にとっては、他の人がその製品をどのように評価しているかを知ることが重要な参考情報となる。また、企業にとっては、ある製品についての評判を知ることで、次の製品の開発や展開に反映させることができる。
特に、評価の出現数を時系列として解析することで、評判の時間的な変化を分析する技術が近年注目されている。評判の時間的な変化を分析することの、第一の利点は、古くて無効になった過去の評価を排除できることである。第二の利点は、評判の変化の原因を知ることが意志決定の重要な手がかりとなることである。
例えば、ある時点tにおいて対象に関する重大な問題点が判明して、それ以後、対象への評判が変化し、誰もが対象に否定的な評価を抱くようになったとする。その場合、人々が問題点を知らなかった時点t以前よりも、問題点を知ったt以後の評価のほうが意思決定には重要な手がかりとなる。
また、このようなとき、評判が変わった時点を特定することで、個々の人々の評価に影響を与えた、対象に関する重大な問題点を知ることができ、意思決定の重大な手がかりとすることができる。
以上のような利点が存在するため、ブログなどの大量の文書の集合から、評判の時間的な変化を抽出する技術が様々に研究されている。
非特許文献1には、評価表現抽出技術を用いて、文書の記述者が自らの対象への評価を明示する際に用いる表現を文書中から抽出し、その出現数を合計して時系列グラフを描くことで、評判の時間的な変化を提示する技術について記載されている。
非特許文献1に記載の技術は、まず最初に「良い」「悪い」というような、記述者が対象への評価を明示する際に用いる評価表現を、機械的な自動処理で収集して、予め辞書に登録する。非特許文献1に記載の技術は、評価表現を形容詞や形容動詞に限定しており、このような評価表現の抽出には、非特許文献2の方法を使っている。
非特許文献1に記載の技術は、この辞書中の表現に一致する文書中の表現を抽出することで、肯定的評価表現と否定的評価表現を収集する。非特許文献1に記載の技術は、肯定的評価表現と否定的評価表現の出現数のグラフを、各時点における対象への評判を表すグラフと見なして出力する。
非特許文献2には、非特許文献1で用いられた、肯定的なレビューや否定的なレビューに偏って出現する表現を評価表現として抽出する技術が記載されている。非特許文献2に記載の技術は、「明るい」「綺麗」「ひどい」「駄目」など、レビューの記述者が自らの評価を明示する際に良く使われる表現を抽出する。
また、本件に関連する技術が、特許文献1〜3に記載されている。
特許文献1に記載の技術は、問題を解決するための情報を検索する検索サーバであって、目的語と行動語とを含むタスクについての階層構造を表すサブツリー情報と、問題を表す目的語と行動語と修飾語と、を対応付けて記憶する。検索サーバは、入力された検索語から、目的語と行動語と修飾語とを判別する。検索サーバは、判別した目的語と行動語と修飾語とに基づいて、記憶しているサブツリー情報を取得する。
特許文献1に記載の検索サーバが上記構成を取ることにより、ユーザは、簡便な入力で、容易に問題解決のための情報を検索することができ、入力の手間を軽減することができる。
特許文献2に記載の技術は、感性評価システムであって、ネットワーク上に存在するテキスト情報を収集し、テキスト情報に付随して得られる時刻情報を基に前記テキスト情報を分類して記憶装置に格納する。感性評価システムは、テキスト情報から感性を示す形容詞及び副詞とそれらに係る名詞の組合せを記憶装置に格納された辞書を用いて抽出する。また、感性評価システムは、感性情報抽出処理で抽出された各名詞に係る形容詞及び副詞のうち、出現率の高い形容詞及び副詞を指標とし、該指標となる形容詞及び副詞と類似する形容詞及び副詞の出現率の推移を示す感性マップを各名詞に対応してそれぞれ生成する。感性評価システムは、生成した感性マップを感性マップデータベースとして記憶装置に格納する感性情報マッピング処理を実行する。感性評価システムは、検索キーワードが入力されると、該検索キーワードと同じ言葉に基づいて作成された感性マップと最も類似する感性マップを、記憶装置に格納された感性マップデータベースから検索し、その検索結果を評価の予測結果として出力する感性マップ検索処理を実行する。
特許文献2に記載の感性評価システムが上記構成を取ることにより、ユーザは、高い精度で感性の推移を検索できる。
特許文献3に記載の技術は、時系列情報処理装置であって、日時と値が関連付けられた時系列情報として、ユーザによる第1の時系列情報の指定入力を検出する。時系列情報処理装置は、複数種類の時系列情報を保持するデータベースから、第1の時系列情報と比較するための第2の時系列情報を取得する。時系列情報処理装置は、所定期間における第1の時系列情報における値の変化傾向と、第2の時系列情報における値の変化傾向を比較して、その変化傾向の類似度を所定の評価関数により相関値として算出する。時系列情報処理装置は、相関値が所定の閾値以上となったとき、第2の時系列情報と第1の時系列情報とを同一画面上にて重ねて表示させる。
特許文献3に記載の時系列情報処理装置は、上記構成を取ることにより、相関のある複数の時系列情報を可視化し分析を支援する技術を提供することができる。
特開2005―332212号公報 特開2007―219929号公報 特開2008―250975号公報
山名健悟,西村圭亮,滝沢敏裕,湯浅将英,大山実,″blog検索と類似品情報を用いた選定支援システム″,情報処理学会研究報告2005−DD−52pp.17−2 1,2005年 藤村滋,豊田正史,喜連川優,″電子掲示板からの評価表現および 評判情報の抽出″,人工知能学会第18回全国大会,3F1−03,2004年
しかしながら、記述者が自らの評価を明示する際に用いる表現を抽出する方法では、人々が対象に対して抱いている評判の変化を、継続的及び定常的に計測することができず、評判の時間的な変化を適切に分析することができない。
なぜならば、人々が自らの評価を明示する際に用いる表現は継続的及び定常的に明示され続けるものではないため、このような表現を元に各時点において実際に評判の変化が起こったかどうかを正しく判定することは困難だからである。
本発明は、自発的行動の記述に着目して、動作主の持つ評価を推定することで、上記課題を解決する。上記、非特許文献1、2及び特許文献1〜3のいずれにも自発的な行動を表わす語と自発的でない行動を表わす語を区別して、動作主の持つ評価を推定する技術は開示されていない。
以上より、本発明の目的は、上記課題を解決し、キーワードが示す対象に対する評判の時間的な変化を適切に分析し得る、評判分析装置、評判分析方法、及び評判分析用プログラムを提供することにある。
上記目的を達成するために、本発明の評判分析装置は、複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出する自発的行動記述抽出手段と、前記対象に関する自発的行動を表す記述が表現する自発的行動の行われた時点ごとに自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する評判時系列データ推定手段と、を備える。
上記目的を達成するために、本発明の評判分析方法は、複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出し、前記対象に関する自発的行動を表す記述が表現する自発的行動の行われた時点ごとに自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する。
上記目的を達成するために、本発明のプログラム記録媒体に格納されている評判分析用プログラムは、複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出し、前記対象に関する自発的行動を表す記述が表現する自発的行動の行われた時点ごとに自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する、処理をコンピュータに実行させる。
本発明の評判分析装置、評判分析方法、及び評判分析用プログラムによれば、キーワードが示す対象に対する評判の時間的な変化を適切に分析することができる。
本発明の第1の実施の形態に係る評判分析装置100のハードウェア構成図である。 本発明の第1の実施の形態に係る評判分析装置100の機能構成を示すブロック図である。 文書集合データベース30が記憶している文書集合の例を示す図である。 自発的行動表現辞書20が記憶している内容の例を示す図である。 評判分析装置100の動作を示すフローチャートである。 自発的行動記述抽出部10の出力するデータの例を示す図である。 評判時系列データ推定部40の推定する評判時系列データの例を示す図である。 第2の実施の形態における自発的行動表現辞書20の記憶している内容の例を示す図である。 第2の実施の形態に係る自発的行動記述抽出部10の出力するデータの例を示す図である。 第2の実施の形態に係る評判時系列データ推定部40の推定する評判時系列データの例を示す図である。 本発明の第4の実施の形態に係る評判分析装置200の機能構成を示すブロック図である。 第4の実施の形態に係る評判分析装置200の動作を示すフローチャートである。 評判時系列データがスカラー値の系列の場合において、評判変化判定部50が出力するデータの例を示す図である。 評判時系列データがベクトル値の系列の場合において、評判変化判定部50が出力するデータの例を示す図である。
本発明に関連する技術文書では、評価と評判というふたつの語の意味に明確な区別をしないことが多い。しかし概ね、個々の人間が対象へと抱く肯定や否定などの意見を「評価」と呼び、多くの人々の評価を集めた結果得られる世間的な総体としての評価を「評判」と呼んで使い分ける傾向がある。これにならい、本明細書においては、「評価」は個々の人間が対象へ抱く肯定や否定などの意見を、「評判」は多くの人々の評価を集めた結果得られる世間的な総体としての評価を、それぞれ表わすものとして明確に区別する。なお、このように用語を使い分けるのは、内容の理解を容易にするための便宜上の区別であり、本発明の技術的範囲を制限するものではない。
まず、本発明の理解を容易にするために、本発明の背景と概要を説明する。
ブログなどにおいて、人々が自ら評価を直接的に明示しようとするのは、対象に関する新情報が出た時点に偏っており、それ以外の時点では評判の変化の分析に十分なほどの量の評価表現が出現しにくい。
例えば、製品Aが新しく発売されたとする。人々は、製品Aの新発売という新情報に興味を持ち、ブログ上にも「製品Aはこの点が良い」「この点が悪い」などという様々なレビューが掲載される。しかし、その後しばらくして話題の目新しさがなくなり、製品Aが定着して日常化すると、意識的な評価がなされなくなり、明示的な評価表現の数が少なくなる。評価表現の数が少なくなるのは製品Aへの評判が変化したためではなく、単に情報の目新しさがなくなったことによる。
人間は、新しい情報が得られた直後はその情報に基づいて下した自らの評価を明示しようとするが、時間が経ち情報が定着すると、評価を表明する動機づけを失い、自らの評価を文書中に明示しなくなる傾向が存在する。そのため、対象への評価を明示する際に用いる表現を抽出する方法では、個々の人間の評価の時間的変化を継続的及び定常的に計測することができない。ひいては、多くの人々の評価を集計した結果得られる総体である評判についても、その時間的変化を継続的及び定常的に計測することができない。よって、長期的な評判の時間変化を見るためには、明示的な評価表現を用いる方法は適当ではない。
一方で、人間は対象へ何らかの評価を下したとき、その結果として評価内容を反映した様々な自発的行動を取る。例えば、ある製品について肯定的な評価を下した人は、その後、その製品を探したり、その製品を予約したり、その製品を買ったり、その製品を実際に使ったりする。逆に考えれば、ある製品を探したり、予約したり、買ったり、使ったりしている人は、その製品に対して、肯定的な評価を持っていると推論することができる。
自発的行動の記述は、対象への評価を意識的に明示する記述とは異なり、人間が日々の日常の記録の中で用いる記述である。よって、人間が対象への評価を明示的に言い表そうとしない時期であっても、自発的行動の記述は、継続的及び定常的に用いられる。よって、自発的行動の記述から人々の評判を推定することができれば、多くの人々の評価の総体である評判についても、その時間的変化を継続的及び定常的に観測することができる。
上記の例で、製品Aが定着して日常化した場合であっても、製品Aに関する自発的行動の記述は、人々の日常の様々な記録に含まれる。そのため、自発的行動の記述は、明示的な評価表現の記述と比較して、継続的及び定常的に観測される。製品Aに関する自発的行動の記述は、例えば「今日は製品Aを持って出かけた。」「製品Aで料理をした。」などの記述である。
上記の考えに基づき、本発明の評判分析装置は、自発的行動の記述を手がかりとして、人々が対象をどう評価しているかを継続的及び定常的に計測する。
以下、本発明の実施の形態を説明する。
なお、以下の本発明の実施の形態においては、本発明の対象の文書は日本語で記述されているものとして説明する。しかし、本発明の技術的範囲はこれに限られるものではない。すなわち、本発明は、日本語以外の言語で記述された文書が対象である場合であっても、各言語の文法に対応させて適用が可能である。
<第1の実施の形態>
図1は、本発明の第1の実施の形態に係る評判分析装置100のハードウェア構成図である。図1に示すように、評判分析装置100は、CPU(central processing unit)1と、通信インターフェース(IF)2と、メモリ3と、HDD(ハードディスクドライブ)4と、入力装置5と、出力装置6とを有する。これらの構成要素は、バス7を通して互いに接続されており、データの入出力を行なう。通信IF2は、外部のネットワークに接続するためのインターフェースである。入力装置5は、例えば、キーボードやマウスである。出力装置6は、例えばディスプレイなどである。本発明は、CPU1が、メモリ3又はHDD4に記憶されているプログラムを実行することにより実現される。
図2は、本発明の第1の実施の形態に係る評判分析装置100の機能構成を示すブロック図である。図2に示すように、評判分析装置100は、自発的行動記述抽出部10と評判時系列データ推定部40とを有する。また、評判分析装置100は、例えばLAN(Local Area Network)又はWAN(Wide Area Network)を介して自発的行動表現辞書20及び文書集合データベース30と接続されている。なお、評判分析装置100は、自発的行動表現辞書20及び文書集合データベース30の少なくともいずれかを有していても良い。この場合、自発的行動表現辞書20は、メモリ3やHDD4などの記憶装置により実現されていても良い。
評判分析装置100において、自発的行動記述抽出部10は、複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出する。
自発的行動表現辞書20は、対象に関する自発的行動を表す表現(自発的行動表現)を記憶する。自発的行動表現とは、対象に関する自発的行動を表わすと考えられる表現のことである。本実施の形態では、自発的行動記述抽出部10は、自発的行動表現辞書20を用いて、入力されたキーワードと、自発的行動表現辞書20が記憶している表現とを含む記述を、複数の文書の中から抽出する。後述する評判時系列データ推定部40は、自発的行動表現辞書20を用いて抽出した自発的行動の記述を、対象への評価を示す手がかりとして、各時点において人々が対象へ抱く評価を推定する。
文書集合データベース30は、自発的行動記述抽出部10が自発的行動を表す記述を抽出する対象となる文書集合(複数の文書)を提供する。図3は、文書集合データベース30が記憶している文書集合の例を示す図である。図3に示すように、文書集合データベース30が記憶している文書集合は、文書の内容と、時間情報とを含む。図3に示す文書の具体例としては、例えば、インターネット上に公開されているブログ、同じくWebページ、及び電子メールなどから取得されたテキストデータが挙げられる。また、時間情報は、例えばブログやWebページに付されている更新日、電子メールの送信及び受信日時などである。時間情報は、文書が作成された時間を表していても良いし、文書が発信された時間を表していても良い。また、時間情報に含まれる時間の単位は、年、月、日、時、分、秒のどのレベルであっても良い。なお、文書集合データベース30が記憶している文書集合は、必ずしも時間情報を有するものでなくても良い。
評判時系列データ推定部40は、対象に関する自発的行動を表す記述から、該自発的行動の動作主の、対象に対する評価を時系列で表す評判時系列データを推定する。具体的には、評判時系列データ推定部40は、自発的行動記述抽出部10が抽出した自発的行動を表す記述を元に、自発的行動の要因となった、行動の動作主が対象に対して持つ評価を推定して集計する。その結果に基づいて、評判時系列データ推定部40は、自発的行動記述抽出部10が自発的行動を表す記述を抽出した各時点での対象への評判を表す時系列データ(評判時系列データ)を推定する。
例えば、評判時系列データ推定部40は、対象に関する自発的行動を表す記述が表現する自発的行動の行われた時点ごとに自発的行動の出現数を数えて、自発的行動の時系列データを生成しても良い。評判時系列データ推定部40は、生成した自発的行動の時系列データを評判時系列データの推定値としても良い。
次に、自発的行動記述抽出部10と自発的行動表現辞書20について詳細に説明する。
自発的行動記述抽出部10は、評価の結果として行なわれた自発的な行動の記述を、文書集合から抽出する。例えば、インターネット上のブログに以下のような記述があったとする。
「製品Aが、一番性能が良く、値段が安かったので、昨日製品Aを買った。」
上記の記述において、「買った」が、評価の結果として行われた自発的行動に当たる。本発明に関連する技術は、対象への評価を明示する際に用いる表現である「性能が良い」「値段が安い」という記述を、評価表現として抽出していた。一方、本発明の自発的行動記述抽出部10は、「昨日製品Aを買った。」という記述を抽出する。なお、関連する技術が抽出していた評価表現に加えて、自発的行動の記述を抽出する構成としても良い。
自発的行動記述抽出部10は、自発的でない行動の記述の抽出は行なわない。自発的でない行動の記述は、自発的な行動と異なり、行動の動作主の持つ評価の推定には用いることができないからである。例えば「私は昨日、電気店で製品Aを見かけた。」という記述があったとする。この場合、「見かける」という行動は、動作主の意志に関わらず起こる行動なので、動作主である「私」が対象に対してどのような評価を持っているか推定するための手がかりにならない。一方、「私は昨日、電気店に製品Aを見に行った。」という記述があったとする。この場合、「見に行った」という行動は、動作主の意志を反映した自発的行動であり、動作主が製品Aに対する肯定的な評価、少なくとも関心を抱いていることが判断できる。そのため、自発的行動記述抽出部10は、動作主の持つ製品Aへの評価の推定に用いるために、「製品Aを見に行った」という記述を抽出する。
以上より、自発的行動記述抽出部10は、「製品Aを買う」「製品Aを使う」「製品Aで音楽を聞く」「施設Aを見に行く」「サービスAについて調べる」「サービスAの予約をする」のような、動作主が意識的に行う自発的行動の記述のみを抽出する。自発的行動記述抽出部10は、「製品Aを見かける」「施設Aのチケットをもらう」「サービスAの開始を知る」のような受動的な自発的でない行動の記述は抽出しない。
図4は、自発的行動表現辞書20が記憶している内容の例を示す図である。図4に示すように、自発的行動表現辞書20には、少なくとも、自発的行動表現が単独で列挙されていれば良い。自発的行動表現のもっとも単純な例は、文法上で動詞と分類される語のうち、対象に関する自発的行動を表わす動詞を指す。「買う」「行く」などが考えられる。自発的行動表現辞書20は、このような自発的行動を表わす動詞を記憶した辞書でも良い。
自発的行動表現辞書20は、対象に関する自発的行動を表わすと考えられる、複数の語の組み合わせによる表現を記憶していても良い。例えば、「見に行く」「予約をする」「チケットを買う」などである。
なお、対象に関する自発的行動であっても、必ずしも動作主の対象への評価を推定する手がかりとはならない。例えば、「(対象)を移動した。」という表現は、対象に関する自発的行動を表わしていると言えるが、単に移動したというだけでは、動作主が対象へどのような評価を抱いていたかを推定しづらい。よって、自発的行動表現辞書20は、このような評価の推定の手がかりとしづらい自発的行動表現は初めから記憶せず、あくまで評価の結果として行なわれた自発的な行動の表現のみを記憶していても良い。
評価の結果として行なわれた自発的な行動としては、対象を利用する行動、対象を利用する意図を持った行動、又は対象の利用を可能にする行動が代表的である。
対象を利用する行動とは、例えば「買う」「使う」「(対象)で○○する」(○○には任意のサ変名詞が入る)などの表現である。対象を利用する意図を持った行動とは、例えば「探す」「(対象)について調べる」などの表現である。対象の利用を可能にする行動とは、例えば「インストールする」「予約する」などの表現である。
次に、評判分析装置100の動作を説明する。
図5は、評判分析装置100の動作を示すフローチャートである。図5に示すように、まず、自発的行動記述抽出部10は、ユーザからキーワードの入力を受け付ける(S1)。次に、自発的行動記述抽出部10は、自発的行動の記述を文書集合から抽出する(S2)。次に、評判時系列データ推定部40は、評判時系列データの推定を行なう(S3)。
S1の動作を具体的に説明する。本実施の形態では、ユーザは、自発的行動記述抽出部10へのキーワードの入力を、キーボードなどの入力装置5によって行う。又は、ユーザは、自発的行動記述抽出部10へのキーワードの入力を、通信IF2を介してネットワークなどで接続された外部のコンピュータなどによって行っても良い。キーワードは、特に限定されるものではなく、例えば、ユーザが評価の時間変化を判定したい物、サービス、組織、イベントなどが挙げられる。また、入力されるキーワードは、一つであっても良いし、単一の物・サービスなどを表すのであれば、複数であっても良い。
自発的行動記述抽出部10は、上述したようにして、キーボードなどにより行なわれるユーザによるキーワードの入力を受け付ける。
次に、S2の動作を具体的に説明する。本実施の形態では、自発的行動記述抽出部10は、自発的行動表現辞書20を用いて、外部から入力されたキーワードと自発的行動表現辞書20に登録されている自発的行動表現とを含む記述を文書集合から抽出する。
具体的には、自発的行動記述抽出部10は、キーワードが入力されると、文書集合データベース30内の文書集合を検索して、入力されたキーワードを含む文書集合を取得する。次に、自発的行動記述抽出部10は、この取得した文書集合の中から、自発的行動表現辞書20が記憶している自発的行動表現を抽出する。この自発的行動表現が抽出された文書には、上記のキーワードと自発的行動表現とを含む記述が含まれている。自発的行動記述抽出部10は、キーワードと自発的行動表現とを含む記述を、そのまま、対象への評価に基づいて行われる自発的行動記述(自発的行動表現が含まれる記述)と見なして、評判時系列データ推定部40に出力しても良い。
図6は、自発的行動記述抽出部10の出力するデータの例を示す図である。図6に示すように、自発的行動記述抽出部10は、自発的行動表現と時間情報とを含むデータを評判時系列データ推定部40に出力する。なお、自発的行動表現を含む記述の中に時間に関する表現が含まれている場合は、出力データは必ずしも時間情報を含んでなくても良い。時間に関する表現についての詳細は後述する。
次に、S3の動作を具体的に説明する。評判時系列データ推定部40は、自発的行動記述抽出部10の出力する自発的行動表現を含むデータを受け取り、このデータを元に、各時点での対象への評判を表す時系列データを推定する。評判時系列データ推定部40の出力する評判時系列データは、各時点での評判の大きさを表わす値が系列としてひとまとまりになったものである。各時点での評判の大きさを表わす値は、スカラー値でも良い。
図7は、評判時系列データ推定部40の推定する評判時系列データの例を示す図である。図7に示すように、評判時系列データはただひとつのスカラー値の時間的系列でも良い。
評判時系列データ推定部40が、本実施の形態において、自発的行動記述から評判時系列データを推定する方法を説明する。評判時系列データ推定部40は、対象に関する自発的行動を表す記述が表現する自発的行動の行われた時点ごとに自発的行動の出現数を数えて、評判時系列データの推定値とする。すなわち、評判時系列データ推定部40は、自発的行動記述において記された自発的行動が行われた時点を、動作主の対象への評価が行われた時点であると推定する。評判時系列データ推定部40は、自発的行動が行なわれた各時点における自発的行動の数を数えることで、各時点における評判の大きさを推定する。
評判時系列データ推定部40は、文書の作成時若しくは発信時を示す時間情報又は自発的行動を表す記述中の時間に関する表現の少なくともいずれか一方を用いて、自発的行動の行なわれた時点を推定する構成としても良い。
すなわち、評判時系列データ推定部40は、自発的行動記述が含まれる文書の時間情報が示す時点を、自発的行動が行われた時点であると推定しても良い。また、評判時系列データ推定部40は、文書の時間情報だけでなく、記述中の時間に関する表現を用いて、自発的行動が行われた時点を推定しても良い。例えば、2005年4月5日に発信されたという時間情報が付与された文書に「昨日、製品Aを使って料理した。」という自発的行動記述が含まれていたとする。この場合、評判時系列データ推定部40は、文書発信の前日、つまり2005年4月4日に自発的行動が行われたものとして推定しても良い。
また、時間情報が付与されておらず、自発的行動表現を含む記述の中に時間に関する表現が含まれていれば、評判時系列データ推定部40は、その表現によって自発的行動が行なわれた時点を推定しても良い。例えば、発信時間が不明な文書において「2005年4月4日、製品Aを使って料理した。」という記述があるとする。この場合、評判時系列データ推定部40は、時間に関する表現である「2005年4月4日」という表現によって、「使う」「料理する」という自発的行動が行なわれた時点を、2005年4月4日であると推定しても良い。
評判時系列データ推定部40は、以上のようにして自発的行動が行われた時点を推定して、各時点における自発的行動の出現数を数える。評判時系列データ推定部40は、この自発的行動の出現数に基づき、各時点における評判の大きさを推定する。
評判時系列データ推定部40は、例えば、各時点での自発的行動の出現数を、そのまま各時点での評判の大きさを表わす推定値と見なし、図7のようなスカラー値の系列として評判時系列データを生成しても良い。この場合、評判時系列データ推定部40は、自発的行動が具体的にどのような評価を表わすかによらず、あらゆる自発的行動の出現数の合計を計算している。対象に対して多くの人々が自発的行動を取ったということは、対象に対して多くの人々が関心を持ったということを表わしている。そのため、この評判時系列データは、特に、人々の関心の大きさの時間的な変遷をスカラー値の系列で表わしたものである。
本実施の形態における評判分析用プログラムは、コンピュータに、図5に示したステップS1〜S3を実行させるプログラムであれば良い。ユーザは、このプログラムをコンピュータにインストールし、実行することで、評判分析装置100及び評判分析方法を実現する。この場合、図1に示したコンピュータのCPU11は、自発的行動記述抽出部10、評判時系列データ推定部40として機能し、処理を行う。
以上説明したように、第1の実施の形態に係る評判分析装置100によれば、自らの評価を明示する際に用いる表現の数が少ない場合であっても、キーワードが示す対象に対する評判の時間的な変化を適切に分析することができる。
なぜならば、評判分析装置100は、キーワードで示された対象について、直接評価を明示している記述を評価表現として抽出するのではなく、対象に関して行われる自発的行動を表す記述に着目して抽出するためである。自発的行動を表す記述を抽出することより、評判分析装置100は、評価を直接明示する記述を抽出する方法よりも、変化を判定するために十分な量の値を継続的及び定常的に計測することができる。
<第2の実施の形態>
本発明の第2の実施の形態に係る評判分析装置100は、自発的行動表現が表す自発的行動から推定できる動作主の対象への評価をさらに記憶している自発的行動表現辞書20を用いる点で、第1の実施の形態に係る評判分析装置100と異なる。
図8は、第2の実施の形態における自発的行動表現辞書20の記憶している内容の例を示す図である。図8に示すように、自発的行動表現辞書20は、対象に関する自発的行動を表す表現に加え、該表現が表す自発的行動から推定できる動作主の対象への評価の種類をさらに記憶している。例えば、自発的行動表現辞書20は、自発的行動表現として「買う」を記憶しており、その表現に対応する評価の種類である「肯定」を、ペアで記憶している。これにより、評判分析装置100は、文書中で対象に関して「買う」という自発的行動が記述されている場合、自発的行動表現辞書20を用いて、「買う」という行動をした動作主は対象に対して「肯定」の評価をしていると推定する。具体的には、「今日製品Aを買いました。」という記述があるとき、評判分析装置100は、「買う」という行動の動作主が「製品A」に対して「肯定」の評価を持っていたと推定する。
自発的行動表現辞書20は、評価の種類として、例えば「肯定」「否定」「中立」などを記憶する。また、自発的行動表現辞書20は、関心の有無を評価の種類として記憶しても良い。例えば「(対象)について調べた。」という自発的行動は、対象への関心を示している。
また、自発的行動表現辞書20は、「興味がある」「日常的に利用している」「不要だと考えている」など、動作主から対象への評価を表わす、任意の評価の種類を記憶しても良い。評判分析装置100が、動作主が対象へと抱く評価について、より様々な視点からの分析を可能とするためである。例えば、自発的行動表現辞書20が、自発的行動表現のペアとして、「興味がある」又は「興味がない」という情報を記憶しておくことで、評判分析装置100は、対象に対する動作主の評価を、ポジティブな評価とネガティブな評価に分けて判断しても良い。
第1の実施の形態において、評価の結果として行なわれた自発的な行動としては、対象を利用する行動、対象を利用する意図を持った行動、又は対象の利用を可能にする行動が代表的である旨を述べた。第2の実施の形態に係る自発的行動表現辞書20は、対象を利用しない行動、対象を利用しない意図を持った行動、又は対象の利用を不可能にする行動につき、否定的な評価をペアとして記憶していても良い。
対象を利用しない行動とは、例えば「買わない」「使わない」「やめる」などの表現である。対象を利用しない意図を持った行動とは、例えば「しまう」「片付ける」などの表現である。対象の利用を不可能にする行動とは、例えば「捨てる」「アンインストールする」などの表現である。
第2の実施の形態において、自発的行動記述抽出部10は、自発的行動表現辞書20を用いて、文書集合から自発的行動の記述を抽出し、自発的行動の記述に含まれる自発的行動表現に対応する評価の種類を含むデータを、評判時系列データ推定部40に出力する。
図9は、第2の実施の形態に係る自発的行動記述抽出部10の出力するデータの例を示す図である。図9に示すように、本実施の形態に係る自発的行動記述抽出部10は、自発的行動表現と時間情報と評価の種類とを含むデータを評判時系列データ推定部40に出力する。
第2の実施の形態において、評判時系列データ推定部40は、自発的行動表現に対応する評価の種類を含むデータを、自発的行動記述抽出部10から受け取る。評判時系列データ推定部40は、自発的行動を表す表現から推定される動作主の対象への評価を、評価の種類毎に出現数を数えて算出したベクトル値に基づいて、評判時系列データを推定する。
図10は、第2の実施の形態に係る評判時系列データ推定部40の推定する評判時系列データの例を示す図である。図10に示すように、第2の実施の形態に係る評判時系列データ推定部40は、「肯定」と「否定」のそれぞれの評判の大きさを表わすベクトル値の系列として評判時系列データを推定する。
すなわち、評判時系列データ推定部40は、自発的行動が行なわれた各時点における自発的行動記述の出現数を、その自発的行動に対応する評価の種類ごとに、別々に数えることによって、図10のようなベクトル値の系列として評判時系列データを推定する。例えば、肯定と否定の二種類の評価の種類を考えている場合、評判時系列データ推定部40は、肯定の評価が推定される自発的行動記述の出現数と、否定の評価が推定される自発的行動記述の出現数を、それぞれ別に数えて合計する。評判時系列データ推定部40は、肯定の評判の大きさと否定の評判の大きさを表わす2つの値を要素とするベクトル値の評判時系列データを推定する。
第2の実施の形態に係る評判分析装置100の動作を説明する。
第2の実施の形態に係る評判分析装置100の動作は、第1の実施の形態に係る評判分析装置100と同様に、図5によって示される。
ただし、第2の実施の形態に係る評判分析装置100の動作は、自発的行動記述を抽出するS2のステップにおいて、対象への評価をさらに記憶している自発的行動表現辞書20を用いる点で、第1の実施の形態に係る評判分析装置100の動作と異なる。また、第2の実施の形態に係る評判分析装置100の動作は、評判時系列データを推定するS3のステップにおいて、自発的行動記述の出現数を、その自発的行動に対応する評価の種類ごとに別々に数える点で、第1の実施の形態に係る評判分析装置100の動作と異なる。
なお、S1のステップに関しては、第1の実施の形態に係る評判分析装置100のステップと同様であるため、説明を省略する。
S2の動作を具体的に説明する。自発的行動記述抽出部10は、自発的行動表現辞書20を用いて、外部から入力されたキーワードと自発的行動表現辞書20に登録されている自発的行動表現とを含む記述を文書集合から抽出する。第2の実施の形態における自発的行動表現辞書20は、自発的行動表現が表す自発的行動から推定できる動作主の対象への評価をさらに記憶している。
自発的行動記述抽出部10は、キーワードが入力されると、文書集合データベース30内の文書集合を検索して、入力されたキーワードを含む文書集合を取得する。次に、自発的行動記述抽出部10は、この取得した文書集合の中から、自発的行動表現辞書20が記憶している自発的行動表現を抽出する。この自発的行動表現が抽出された文書には、上記のキーワードと自発的行動表現とを含む記述が含まれている。自発的行動記述抽出部10は、キーワードと自発的行動表現とを含む記述及び自発的行動表現に対応する評価の種類とを含むデータ(例えば図9)を、評判時系列データ推定部40に出力する。
次に、S3の動作を具体的に説明する。評判時系列データ推定部40は、自発的行動記述抽出部10の出力する自発的行動表現を含むデータを受け取り、このデータを元に、評価の種類毎に各時点での対象への評判を表す時系列データを推定する。評判時系列データ推定部40の出力する評判時系列データは、各時点での評判の大きさを表わす値が系列としてひとまとまりになったものである。本実施の形態においては、各時点での評判の大きさを表わす値は、ベクトル値である。
評判時系列データ推定部40は、例えば図10に示すような、評価の種類毎の評判の大きさを表わすベクトル値の系列として表された評判時系列データを推定する。
本実施の形態における評判分析用プログラムは、コンピュータに、図5に示したステップS1〜S3を実行させるプログラムであって、上述した動作を実行させるプログラムであれば良い。
以上説明したように、本発明の第2の実施の形態によれば、動作主が対象へと抱く評価について、より様々な視点から推定することができる。なぜならば、自発的行動表現辞書20が、自発的行動表現に対して、自発的行動表現の要因として考えられる評価を、ペアで記憶しているからである。
また、本発明の第2の実施の形態によれば、評価の種類ごとに評判時系列データを推定することで、対象への評価の変化をより細かく分析することができる。例えば、本発明の第2の実施の形態によれば、肯定的な評価は以前と変わらないが、否定的な評価だけが大きく増えた、というような分析をすることができる。
<第3の実施の形態>
本発明の第3の実施の形態に係る評判分析装置100は、自発的行動記述抽出部10が、対象を表すキーワードと自発的行動表現との間の位置関係や文法的関係を記述した規則に従って自発的行動記述を抽出する点で、第1の実施の形態に係る評判分析装置100と異なる。
自発的行動記述抽出部10は、例えば、自発的行動表現と対象を表すキーワードとが、文中で、N語以内で共起している場合に、自発的行動記述を抽出しても良い。または、自発的行動記述抽出部10は、「(対象)を使う」や「(対象)で音楽を聞く」のように、自発的行動表現と対象を表すキーワードとの間に、日本語文法におけるヲ格やデ格の関係にあたるような、動作(動詞で表される表現等)とその動作の目的語や、動作とその動作の手段(動作のための道具や方法等)を示す関係がある場合に、自発的行動記述を抽出しても良い。この関係の制約は、日本語に限定されず、本発明を実施する際に処理対象とする文書の言語において、自発的行動表現と対象を表すキーワードとの間に、動作とその動作の目的語や、動作とその動作の手段を示す関係があればよい。
または、自発的行動表現辞書20が、自発的行動表現と対応付けて、対象を表すキーワードとの間の位置関係や文法的関係による規則を記憶しており、自発的行動記述抽出部10は、その規則を満たす自発的行動記述のみ抽出するという構成にしても良い。
自発的行動記述抽出部10は、活用形や付属語、及びそれらによって表現される、極性(肯定形か否定形か)、態、相、時制、法や法性による規則に従って自発的行動記述を抽出しても良い。
自発的行動記述抽出部10は、第2の実施の形態のように評価の種類を考慮して、極性が肯定である記述は評価の種類を肯定として、極性が否定である記述は評価の種類を否定として、自発的行動記述を抽出しても良い。具体的には、自発的行動記述抽出部10は、「(対象)を買いました。」のような極性が肯定である記述について、評価の種類を肯定として抽出する。また、自発的行動記述抽出部10は、「(対象)を買いませんでした。」のような極性が否定である記述について、評価の種類を否定として抽出する。
また、自発的行動記述抽出部10は、実際に実行された行動ではなく、「利用しようとした」「買おうとした」「使おうとした」のような、目的を達成していない表現であっても、自発的行動表現と見なして抽出しても良い。例えば、「今日、施設Aを利用しようとしたが、閉鎖していたので、施設Aは使えなかった。」というような記述があったとする。自発的行動記述抽出部10は、実際に利用できなかったとしても、施設Aを利用しようとした行動の動作主は、施設Aに対して肯定的な評価を持っていたとして、自発的行動記述を抽出しても良い。
一方、自発的行動記述抽出部10は、通常は自発的行動と見なす行動であっても、外部から強制されて行う行動や、動作主にとって不本意な行動は、自発的行動表現とは見なさず、抽出しなくても良い。例えば、自発的行動記述抽出部10は、「(対象)を使った。」という表現は自発的行動と見なすが、「(対象)を使わされた。」「(対象)を使ってしまった。」という表現は自発的行動と見なさない、などの規則に従って記述を抽出しても良い。
自発的行動記述抽出部10は、行動の動作主に関する規則に従って自発的行動記述を抽出しても良い。例えば、自発的行動記述抽出部10は、「昨日、私は(対象)を買った。」という記述は抽出するが、「昨日、某タレントが(対象)を買ったと話していた。」という記述は抽出しなくても良い。なぜなら、「昨日、私は(対象)を買った。」という記述の場合、「買った」という行動の動作主は文書の記述者である。そのため、「買った」という行動は、文書の記述者の評価を反映した行動だと言える。一方、「昨日、某タレントが(対象)を買ったと話していた。」という記述の場合、動作主はタレントである。よって、この場合の「買った」という行動は、タレントの評価を反映した行動だと言える。多数の人々がこのタレントの同じ行動について述べている記述を集めても、そのひとりのタレントの評価が分かるだけで、多数の人々自身の評価を知る手がかりにはならない。よって、自発的行動記述抽出部10は、自発的行動記述の行動の動作主が文書の記述者であれば記述を抽出するという規則に従って、記述を抽出しても良い。
その他、自発的行動記述抽出部10は、自発的行動表現と対象を表わすキーワードとの関係を様々に限定する規則に従って、より厳密に、自発的行動記述を抽出することができる。
第3の実施の形態に係る評判分析装置100の動作を説明する。
第3の実施の形態に係る評判分析装置100の動作は、第1の実施の形態に係る評判分析装置100と同様に、図5によって示される。
ただし、第3の実施の形態に係る評判分析装置100の動作は、自発的行動記述を抽出するS2のステップにおける動作が、第1の実施の形態に係る評判分析装置100の動作と異なる。すなわち、本実施の形態においては、自発的行動記述抽出部10は、対象を表すキーワードと自発的行動表現との間の位置関係や文法的関係を記述した規則に従って自発的行動記述を抽出する。
なお、S1、S3のステップに関しては、第1の実施の形態に係る評判分析装置100のステップと同様であるため、説明を省略する。
S2の動作を具体的に説明する。自発的行動記述抽出部10は、例えば、自発的行動表現と対象を表すキーワードとが、文中で、N語以内で共起している場合に、自発的行動記述を抽出しても良い。または、自発的行動記述抽出部10は、「(対象)を使う」や「(対象)で音楽を聞く」のように、自発的行動表現と対象を表すキーワードとの間に、日本語文法におけるヲ格やデ格の関係にあたるような、動作とその動作の目的語や、動作とその動作の手段を示す関係がある場合に、自発的行動記述を抽出しても良い。
その他、上述した様々な規則に従って、自発的行動記述抽出部10は、自発的行動記述を抽出する。
本実施の形態における評判分析用プログラムは、コンピュータに、図5に示したステップS1〜S3を実行させるプログラムであって、上述した動作を実行させるプログラムであれば良い。
以上説明したように、本発明の第3の実施の形態によれば、より厳密に動作主の持つ評価を推定できる。なぜならば、自発的行動記述抽出部10が、対象を表すキーワードと自発的行動表現との間の位置関係や文法的関係による規則に従って自発的行動記述を抽出するからである。
<第4の実施の形態>
図11は、本発明の第4の実施の形態に係る評判分析装置200の機能構成を示すブロック図である。図11に示すように、本発明の第4の実施の形態に係る評判分析装置200は、評判変化判定部50をさらに備える点で、第1の実施の形態に係る評判分析装置100と異なる。
自発的行動記述抽出部10、自発的行動表現辞書20、文書集合データベース30、評判時系列データ推定部40は、第1の実施の形態に記載したものと同様であるため、説明を省略する。
評判変化判定部50は、評判時系列データ推定部40の推定結果に基づいて、対象への評判の時間的な変化を判定する。
評判変化判定部50は、評判時系列データ推定部40の出力する評判時系列データに基づいて、指定時点tの前後での評判の変化量を判定する。ここで、指定時点tは、評判時系列データの扱う最も古い時点から最も新しい時点までの時間の範囲内にある。評判変化判定部50は、tを基準にした評判の大きさの変化量を判定することで、評判の時点tの前後における変化を判定する。評判変化判定部50は、このtを複数個取り、複数の時点での変化量を計算することで、評判の変化量の時系列データを生成しても良い。
指定時点tの定め方は、様々な方法がある。評判変化判定部50は、評判時系列データに含まれる全ての時点について評判の変化を判定しても良い。また、評判変化判定部50は、評判時系列データの扱う最も古い時点から最も新しい時点までの任意の時点をランダムにサンプリングすることでtを決めても良い。また、ユーザが、対象に関連するイベントが起こった日時などの特定の時点を、予めtとして評判変化判定部50に登録していても良い。
第4の実施の形態に係る評判分析装置200の動作を説明する。
図12は、第4の実施の形態に係る評判分析装置200の動作を示すフローチャートである。図12に示すように、評判分析装置200の動作は、評判変化量を判定するS4のステップを有する点で、第1の実施の形態に係る評判分析装置100の動作(図5)と異なる。
S1〜S3のステップに関しては、第1の実施の形態に係る評判分析装置100のステップと同様であるため、説明を省略する。
S4において、評判変化判定部50は、評判変化量の判定を行なう。評判変化判定部50は、時点tでの評判の変化量を、時点tを基準としてtより過去の評判時系列データとtより未来の評判時系列データを比較することで判定する。
具体的に、評判時系列データ推定部40の出力する評判時系列データがスカラー値の系列の場合の、評判変化判定部50の動きを説明する。評判変化判定部50は、時系列データの対象とする時間範囲内の時点tに関して、tを基準とした過去数日間と未来数日間とについて、それぞれの期間内での評判時系列データの値を合計する。評判変化判定部50は、過去と未来とについて合計した値の両者の比率を求め、求めた比率を時点tでの変化量と見なす。
図13は、評判時系列データがスカラー値の系列の場合において、評判変化判定部50が出力するデータの例を示す図である。図13に示すように、評判変化判定部50は、判定した各時点における時間情報とスカラー値で表される変化量をペアにしたデータを出力しても良い。図13は、時点tを基準とした過去2日間と未来2日間の値(図7における推定値)をそれぞれ合計して比率を求めたものである。「−」が記入されている欄は、過去か未来のデータが十分得られないため判定しない区間である。
評判時系列データ推定部40の出力する評判時系列データがベクトル値の系列の場合は、評判変化判定部50は、ベクトル値を構成する各要素について、スカラー値の場合と同様に、各時点tでの変化量を求める。評判変化判定部50は、評価の種類ごとの評判の変化量を表わす時系列データを出力する。
図14は、評判時系列データがベクトル値の系列の場合において、評判変化判定部50が出力するデータの例を示す図である。図14に示すように、評判時系列データが肯定と否定の2要素を持つベクトル値の系列であるとき、評判変化判定部50は、時点tにおける、肯定を表わす値の変化量と、否定を表わす値の変化量を、それぞれ別々に計算する。評判変化判定部50は、各時点における、肯定を表わす値の変化量と、否定を表わす値の変化量の2要素を持つベクトル値の系列を出力する。図14の出力例のベクトルの各要素の値は、図13と同様に、過去2日間と未来2日間の値(図10のベクトルの各要素の値)をそれぞれ合計して比率を求めたものである。
また、評判変化判定部50は、ベクトル値を構成する各要素について、個別に変化量を考えるのではなく、複数の要素を組み合わせて変化量を求めても良い。例えば、評判変化判定部50は、各時点での複数の要素の値の和を計算して系列を作ることで、和の系列の変化量を求めても良い。また、評判変化判定部50は、各時点での複数の要素の比率を取って系列を作り、比率の系列の変化量を求めても良い。評判変化判定部50は、これらの系列の変化量を、スカラー量の系列の変化量と同様に計算しても良い。
本実施の形態における評判分析用プログラムは、コンピュータに、図12に示したステップS1〜S4を実行させるプログラムであれば良い。
以上説明したように、本発明の第4の実施の形態によれば、キーワードが示す対象に対する評判の時間的な変化を、一目で判断することができる。なぜならば、評判変化判定部50が、評判の変化量を出力するからである。
以上、実施の形態を参照して本願発明を説明したが、本願発明は以上の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で同業者が理解し得る様々な変更をすることができる。
この出願は、2009年11月27日に出願された日本出願特願2009−269484を基礎とする優先権を主張し、その開示の全てをここに取り込む。
以上説明したように、本発明は、キーワードが示す対象に対する評判の時間的な変化を適切に判定することができる評判分析装置として有用である。
1 CPU
2 通信IF
3 メモリ
4 HDD
5 入力装置
6 出力装置
7 バス
10 自発的行動記述抽出部
20 自発的行動表現辞書
30 文書集合データベース
40 評判時系列データ推定部
50 評判変化判定部
100 第1の実施の形態に係る評判分析装置
200 第4の実施の形態に係る評判分析装置

Claims (9)

  1. 複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出する自発的行動記述抽出手段と、
    前記文書の作成時若しくは発信時を示す時間情報を付与される場合、前記時間情報および前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、前記文書の作成時若しくは発信時を示す時間情報を付与されない場合、前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、記自発的行動を表す記述が表現する前記自発的行動の行われた時点ごとに前記自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する評判時系列データ推定手段と、
    を備える評判分析装置。
  2. 対象に関する自発的行動を表す表現を記憶する自発的行動表現辞書をさらに備え、
    前記自発的行動記述抽出手段は、前記自発的行動表現辞書を用いて、前記キーワードと、前記自発的行動表現辞書が記憶している表現とを含む記述を、前記複数の文書の中から抽出する、請求項1記載の評判分析装置。
  3. 前記自発的行動表現辞書は、対象に関する自発的行動を表す表現に加え、該表現が表す自発的行動から推定できる動作主の前記対象への評価の種類をさらに記憶している請求項2記載の評判分析装置。
  4. 前記評判時系列データ推定手段は、前記自発的行動を表す表現から推定される動作主の前記対象への評価を、評価の種類毎に出現数を数えて算出したベクトル値に基づいて、前記評判時系列データを推定する請求項3記載の評判分析装置。
  5. 前記自発的行動記述抽出手段は、前記キーワードと前記自発的行動を表す表現との間の位置関係や文法的関係を記述した規則に従って自発的行動記述を抽出する、請求項1乃至4のいずれか1項に記載の評判分析装置。
  6. 前記評判時系列データ推定手段の推定結果に基づいて、前記対象への評判の時間的な変化を判定する評判変化判定手段をさらに備える請求項1乃至5のいずれか1項に記載の評判分析装置。
  7. 前記評判変化判定手段は、前記判定した評判の時間的な変化を、可視化したデータとして出力する、請求項6に記載の評判分析装置。
  8. コンピュータが
    複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出し、
    前記文書の作成時若しくは発信時を示す時間情報を付与される場合、前記時間情報および前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、前記文書の作成時若しくは発信時を示す時間情報を付与されない場合、前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、記自発的行動を表す記述が表現する前記自発的行動の行われた時点ごとに前記自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する、
    評判分析方法。
  9. 複数の文書の中から、入力されたキーワードが示す対象に関する自発的行動を表す記述を抽出し、
    前記文書の作成時若しくは発信時を示す時間情報を付与される場合、前記時間情報および前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、前記文書の作成時若しくは発信時を示す時間情報を付与されない場合、前記自発的行動を表す記述中の時間に関する表現に基づいて、前記自発的行動の行なわれた時点を推定し、記自発的行動を表す記述が表現する前記自発的行動の行われた時点ごとに前記自発的行動の出現数を数えて、該自発的行動の動作主の、前記対象に対する評価を時系列で表す評判時系列データを推定する、
    処理をコンピュータに実行させる評判分析用プログラム。
JP2011543226A 2009-11-27 2010-11-15 評判分析装置、評判分析方法、および評判分析用プログラム Active JP5729308B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011543226A JP5729308B2 (ja) 2009-11-27 2010-11-15 評判分析装置、評判分析方法、および評判分析用プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009269484 2009-11-27
JP2009269484 2009-11-27
JP2011543226A JP5729308B2 (ja) 2009-11-27 2010-11-15 評判分析装置、評判分析方法、および評判分析用プログラム
PCT/JP2010/070645 WO2011065295A1 (ja) 2009-11-27 2010-11-15 評判分析装置、評判分析方法、および評判分析用プログラム

Publications (2)

Publication Number Publication Date
JPWO2011065295A1 JPWO2011065295A1 (ja) 2013-04-11
JP5729308B2 true JP5729308B2 (ja) 2015-06-03

Family

ID=44066399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011543226A Active JP5729308B2 (ja) 2009-11-27 2010-11-15 評判分析装置、評判分析方法、および評判分析用プログラム

Country Status (3)

Country Link
US (1) US9245023B2 (ja)
JP (1) JP5729308B2 (ja)
WO (1) WO2011065295A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5599073B2 (ja) * 2011-06-10 2014-10-01 株式会社野村総合研究所 感性分析システム及びプログラム
JP5895052B2 (ja) * 2012-05-30 2016-03-30 株式会社日立製作所 情報分析システム及び情報分析方法
TW201525905A (zh) * 2013-12-17 2015-07-01 Telexpress Corp 用於電子化文章之商品口碑辨識方法及其系統
CN103744893B (zh) * 2013-12-23 2017-03-29 网讯电通股份有限公司 用于电子化文章的商品口碑辨识方法及其系统
CN103678721A (zh) * 2014-01-02 2014-03-26 中国联合网络通信集团有限公司 一种处理缺失数据的方法及装置
JP6851958B2 (ja) * 2017-11-29 2021-03-31 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
JP6514799B1 (ja) * 2018-03-06 2019-05-15 楽天株式会社 サーバ装置、サービス方法、ならびに、プログラム
US11372939B2 (en) * 2020-08-03 2022-06-28 Walmart Apollo, Llc Systems and methods for clustered inventory management

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
JP2005332212A (ja) 2004-05-20 2005-12-02 Ntt Docomo Inc 検索サーバ、検索端末、検索方法、及び、検索実行方法
US8880521B2 (en) * 2004-09-15 2014-11-04 3Degrees Llc Collections of linked databases
JP2007219929A (ja) 2006-02-17 2007-08-30 Nec Corp 感性評価システム及び方法
JP2008250975A (ja) 2007-03-08 2008-10-16 Just Syst Corp 時系列情報処理装置、方法、及びプログラム
EP2359276A4 (en) * 2008-12-01 2013-01-23 Topsy Labs Inc ORDERING AND SELECTION OF UNITS PER CALCULATED REPUTATION OR INFLUENCES

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG201000308138; 戸田 智子: '局所性を用いた多様性を考慮したブログからのトピック抽出手法について' 第1回データ工学と情報マネジメントに関するフォーラム-DEIMフォーラム-論文集 [online] , 電子情報通信学会データ工学研究専門委員会 *
CSNG201000308161; 旭 直人: '行動連鎖を用いた情報検索支援とWebからの行動連鎖の抽出' 第1回データ工学と情報マネジメントに関するフォーラム-DEIMフォーラム-論文集 [online] , 電子情報通信学会データ工学研究専門委員会 *
JPN6014038118; 戸田 智子: '局所性を用いた多様性を考慮したブログからのトピック抽出手法について' 第1回データ工学と情報マネジメントに関するフォーラム-DEIMフォーラム-論文集 [online] , 電子情報通信学会データ工学研究専門委員会 *
JPN6014038120; 旭 直人: '行動連鎖を用いた情報検索支援とWebからの行動連鎖の抽出' 第1回データ工学と情報マネジメントに関するフォーラム-DEIMフォーラム-論文集 [online] , 電子情報通信学会データ工学研究専門委員会 *

Also Published As

Publication number Publication date
US20120239665A1 (en) 2012-09-20
JPWO2011065295A1 (ja) 2013-04-11
WO2011065295A1 (ja) 2011-06-03
US9245023B2 (en) 2016-01-26

Similar Documents

Publication Publication Date Title
JP5729308B2 (ja) 評判分析装置、評判分析方法、および評判分析用プログラム
US20210019339A1 (en) Machine learning classifier for content analysis
Zhang et al. Mining millions of reviews: a technique to rank products based on importance of reviews
JP5387578B2 (ja) 情報分析装置、情報分析方法、及びプログラム
Lubis et al. The effect of the TF-IDF algorithm in times series in forecasting word on social media
JP5895052B2 (ja) 情報分析システム及び情報分析方法
JP2011108053A (ja) ニュース記事評価システム
CN110309251A (zh) 文本数据的处理方法、装置和计算机可读存储介质
JP2012248119A (ja) キーワード抽出及びウエブコンテンツアクセス情報の収集装置
Wu et al. Patient-level temporal aggregation for text-based asthma status ascertainment
JP5964149B2 (ja) 共起語を特定する装置およびプログラム
JP2015130136A (ja) 情報処理システム、情報処理装置、その制御方法、及び制御プログラム
Muralikumar et al. A Human-Centered Evaluation of a Toxicity Detection API: Testing Transferability and Unpacking Latent Attributes
Almquist et al. Towards content expiry date determination: predicting validity periods of sentences
JP2012248120A (ja) ウエブコンテンツの提供装置、方法、及びプログラム
JP4539616B2 (ja) 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム
KR20100098095A (ko) 평점 계산 방법 및 그 시스템
JP2010218216A (ja) 類似文書検索システム、方法及びプログラム
JP4192760B2 (ja) カテゴリ別新出特徴語ランキング方法及び装置及びプログラム及びカテゴリ別新出特徴語ランキングプログラムを記録したコンピュータ読み取り可能な記憶媒体
van Hoof et al. Googling Politics? The Computational Identification of Political and News-related Searches from Web Browser Histories
JP6153262B2 (ja) 対象文章を象徴する簡易文を推定するプログラム、装置及びサーバ
JP6383605B2 (ja) 習慣評価方法、装置およびプログラム
JP2006343891A (ja) 利用者情報検索システム,検索方法およびコンピュータプログラムとその記録媒体
Ushiama et al. Review Ranking to Support Selection of Recommended Items
Hamid et al. PrivacyLens: A Framework to Collect and Analyze the Landscape of Past, Present, and Future Smart Device Privacy Policies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150323

R150 Certificate of patent or registration of utility model

Ref document number: 5729308

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150