JP2007018285A - 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム - Google Patents

情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム Download PDF

Info

Publication number
JP2007018285A
JP2007018285A JP2005199334A JP2005199334A JP2007018285A JP 2007018285 A JP2007018285 A JP 2007018285A JP 2005199334 A JP2005199334 A JP 2005199334A JP 2005199334 A JP2005199334 A JP 2005199334A JP 2007018285 A JP2007018285 A JP 2007018285A
Authority
JP
Japan
Prior art keywords
information
words
word
document
occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005199334A
Other languages
English (en)
Inventor
Yoichi Inagaki
陽一 稲垣
Shotaro Tanaka
昇太郎 田中
Mitsuhiro Setoguchi
光宏 瀬戸口
Hideya Ushio
栄冶 潮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CAC Corp
Original Assignee
CAC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CAC Corp filed Critical CAC Corp
Priority to JP2005199334A priority Critical patent/JP2007018285A/ja
Publication of JP2007018285A publication Critical patent/JP2007018285A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 例えばインターネット上に存在するブログのような意見情報を利用して、利用者にリアルタイムで必要な情報を提示する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムを提供する。
【解決手段】 情報提供者側に設けられた第1のコンピュータ10と、利用者側に設けられた第2のコンピュータ20を備え、第1のコンピュータ10には、意見情報から文書ファイルを取得するファイル取得手段1と、取得した文書ファイルから文書を取り出し、文書を分解する変換手段3と、語に識別情報を付与する識別情報付与手段と、生成された語の集合を演算して利用者への提供情報を生成する情報生成手段とを備え、第2のコンピュータ20は第1のコンピュータ10が提供情報を生成するための指示情報を入力する入力手段と、提供情報を表示する表示手段を備えている。
【選択図】 図1

Description

本発明は情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムに係り、特に、インターネット上のブログ等の、時間情報が付いた意見情報を利用して、現在の市場動向を知るための情報を提供する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムに関する。
従来より、顧客のニーズに合致した商品やサービスを提供するために、種々の方法で市場動向について情報の取得が行われている。
例えば、POSシステムを利用し、キーワードに基づいてマーケットの流行を判断するシステムが提案されている(例えば、特許文献1参照)。
特開2005−92721号公報(第7−8頁)
上記システムによれば、商品に感性語を表すキーワードが付されており、このキーワードに基づいて、現在において売上が伸びている商品を把握し、商品開発に役立てることが可能となる。
しかし、上記システムで提供される情報は、POS情報に基づくものであり、商品が売れてからの情報であり、速報性に欠けるという問題があった。
また、キーワードは、予め商品に付されたものであるため、あくまでもキーワードは販売者が想定した範囲内のものとなり、予め予想された範囲内での結果しか得られないという不都合があった。
ところで、近年、社会的なニュースや所定のトピックスに関して、個人的な意見や分析或いは解説を日記的に公開する、ブログと呼ばれるウェブサイトが広がりを見せている。
ブログでは記事が頻繁に更新され、掲載された記事は時系列で並べて提示される。また、他のブログの関連記事について言及したときに、その記事から自分の記事にリンクさせることができる、トラックバックと呼ばれる機能を備えている。
ブログは単に情報を発信するだけでなく、コミュニケーション手段としての機能を備えている。そして、ブログによる口コミ情報が広がる等の現象が起こっている。
このように、ブログには話題性のあるトピックスについて、生の情報が流通しており、ブログに掲載された情報に注目することにより、現在、世の中で話題になっている事柄について、タイムリーに把握することが可能になる。
しかし、ウェブ上には膨大な数のブログが存在し、記事は1日数十万単位で増加しているため、ブログに形成された情報をマーケティング等に利用するには、単に記事を一つ一つ参照するのでは多大な手間と時間がかかってしまう。このため、記事に含まれる情報を加工及び分析する必要がある。
本発明の目的は、例えばインターネット上に存在するブログのような意見情報を利用して、利用者にリアルタイムで必要な情報を提示する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムを提供することにある。
上記課題は、本発明の情報提供システムによれば、時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供システムであって、
情報提供者側に設けられた第1のコンピュータと、利用者側に設けられた第2のコンピュータを備え、前記第1のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、前記語に識別情報を付与する識別情報付与手段と、前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、前記第2のコンピュータは前記第1のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、前記提供情報を表示する表示手段と、を備えた、ことにより解決される。
このように、本発明の情報提供システムによれば、刻々と情報が更新されるブログのような意見情報から言葉を抽出し、抽出された言葉に基づいて情報を作成し、利用者に提供する機能を有している。
本発明の情報提供方法は、時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供方法であって、前記意見情報から文書ファイルを取得する工程と、該取得した文書ファイルから文書を取り出し、該文書を分解する工程と、前記語に識別情報を付与する工程と、前記生成された語の集合を演算して利用者への提供情報を生成する工程と、前記提供情報を表示する工程と、を備えたことを特徴とする。
前記提供情報を生成する工程では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされる。
また、前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされる。
さらに、前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされる。
上記機能により、ブログ等の意見情報のなかで語られている言葉を複数のカテゴリに分類し、カテゴリ別に、現在どのようなことが話題になっているのかを利用者に提示することが可能となる。また、時間とともに変化する話題を利用者に知らせることが可能となる。
前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされる。そして、前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされる。
さらに、前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされる。
これにより、例えば利用者が提示した商品名等について、ブログ等の意見情報のなかでどのような言葉とともに語られているのかについて、最新の情報を提供することが可能である。
前記提供情報を表示する工程では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされる。
本発明の情報提供装置は、時間情報が付いた意見情報から言葉を抽出し、該言葉に基づく分析を行う情報提供装置であって、前記意見情報から文書ファイルを取得するファイル取得手段と、該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、前記語に識別情報を付与する識別情報付与手段と、前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備えたことを特徴とする。
前記情報生成手段は、前記語を前記識別情報に基づいて複数のカテゴリに分類する分類手段を備えている。また、前記カテゴリに分類された語を出現頻度の高い順にまたは出現増加率の高い順に整列する整列手段を備えている。
また、前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理を行う。
前記情報生成手段は、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する共起語判定手段を備えている。また、前記情報生成手段は、さらに前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理を行う。
前記情報生成手段は、さらに前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理を行う。
本発明の情報提供プログラムは、時間情報が付いた意見情報から言葉を抽出し、該言葉に基づく分析を行う情報提供プログラムであって、前記意見情報から文書ファイルを取得する処理と、該取得した文書ファイルから文書を取り出し、該文書を分解する処理と、前記語に識別情報を付与する処理と、前記生成された語の集合を演算して利用者への提供情報を生成する処理と、前記提供情報を表示する処理と、を備えたことを特徴とする。
前記提供情報を生成する処理では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされる。また、前記提供情報を生成する処理では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に選択する処理がなされる。
さらに、前記提供情報を生成する処理では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされる。
前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされる。また、前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされる。
さらに、前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされる。
前記提供情報を表示する処理では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされる。
以下、本発明の一実施の形態を図面に基づいて説明する。なお、以下に説明する処理ステップ、装置等は本発明を限定するものでなく、本発明の趣旨の範囲内で種々改変することができるものである。
図1乃至図21は本発明の一実施の形態例を示すものであり、図1は本発明の情報提供システムを示す説明図、図2は情報提供者側の第1のコンピュータを示す説明図、図3はブログから記事を取得する処理を示すフローチャート、図4は語変換部の処理を示すフローチャート、図5は語への識別情報付与処理を示すフローチャート、図6はコーパスデータ記憶部のデータの一例を示す説明図、図7は利用者側コンピュータの例を示す説明図、図8は語をカテゴリ別に示す処理を示すフローチャート、図9は第一の情報の表示画面を示す説明図、図10は第二の情報の表示画面を示す説明図、図11は話題回数分析情報の提示処理を示すフローチャート、図12は話題回数分析情報の表示画面を示す説明図、図13はキーワード分析情報の提示処理を示すフローチャート、図14はキーワード分析情報の表示画面を示す説明図、図15は評判分析情報の提示処理を示すフローチャート、図16は評判分析情報の表示画面を示す説明図、図17はイメージジャンル分析情報の提示処理を示すフローチャート、図18はイメージジャンル分析情報の表示画面を示す説明図、図19はライフスタイル分析情報の提示処理を示すフローチャート、図20はライフスタイル分析情報の表示画面を示す説明図、図21は第三の情報の表示態様を示す説明図である。
本例に係る情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムは、時間情報が付いた意見情報から文書を取り出し、文書を分解して語を取り出し、これら語を集計・分析して利用者に市場動向情報として提供するものである。
上記意見情報としては、例えばインターネット上のブログやネット掲示板等があるが、これに限らず、意見情報のデータベースなど他の形態の情報源であっても良い。
図1は、本例に係る情報提供システムの構成を示す説明図である。情報提供システムSは、ファイル取得手段としてのブログクローラ1と、取得したHTMLファイルを記憶するHTMLファイル記憶部2と、変換手段としての語変換部3と、識別情報付与手段を構成する辞書部4と、コーパスデータ記憶部5と、検索エンジン6と、を備えて構成されている。
これらの機能は、情報提供者側の第1のコンピュータ10に設けられている。これらの機能は、一つのコンピュータ上に設けられていても良く、或いは複数のコンピュータ上に設けられていても良い。
情報提供システムSを構成する第1のコンピュータ10は、図2に示すように、制御部11、通信制御部12、入力部13、出力部14、記憶部15を備えて構成されている。第1のコンピュータ10は通信制御部12を介してインターネットIに接続されている。
記憶部15は、語変換部3で生成された語を記憶する語記憶部3aと、語に識別情報を付与する際に辞書として機能する辞書部4と、本システムで最終的に生成された語を記憶するコーパスデータ記憶部5とを備えている。
ブログクローラ1、語変換部3、検索エンジン6は、所定のプログラムを備えて構成されている。このプログラムにしたがって制御部11により、所定の処理が行われる。
ブログクローラ1は文書取得プログラムを備え、語変換部3は語変換プログラム及び識別情報付与プログラムを備え、検索エンジン6は検索プログラム及び情報生成プログラムを備えている。制御部11は、上記各プログラムに従って作動し、これにより、ブログからの文書取得処理と、ブログの文書の語変換処理と、語への識別情報付与処理と、情報生成処理と、がそれぞれなされる。
ブログクローラ1は、インターネット上から記事を取得する機能を有するものである。
ここで、図3のフローチャートに従って、ブログクローラの動作について説明する。はじめに、ステップS1で、ブログクローラ1はインターネット上のピングサーバ7にアクセスする。ピングサーバ7はインターネット上におかれており、新規更新された記事のURLを収集する機能を有するサーバである。ピングサーバ7にアクセスすることにより、更新のあった記事のURL情報を取得する(ステップS2)。
次いで、取得したURLにアクセスし、その記事のHTMLファイルを取得する(ステップS3)。
ブログクローラ1により、各ブログから、常に最新の情報が収集される。収集された記事のHTMLファイルは、HTMLファイル記憶部2に格納される(ステップS4)。
語変換部3は、HTMLファイル記憶部2に格納された文書を、語に分解する機能を有するものである。
図4のフローチャートに従って、語変換部3の動作を説明する。
まず、語変換部3は、ブログから取得された記事に対して、形態素解析を行って文書を語に分解する(ステップS11)。
形態素とは、さらに細かくすると意味がなくなってしまう最小の文字列を言うものであるが、ここで形成される語は、その語自身が意味を持ち、利用者に提示される市場動向情報を構成するものである。
このとき、文書中の語の順番を、文書中の順序のままにして保持する。
語は、タグ付きテキストとして語記憶部3aに記憶される(ステップS12)。
次に、辞書部4の情報に基づいて、語に識別情報を付与する処理が行われる。辞書部4の情報に基づいて、語に識別情報が付与される。
この処理を行うための識別情報付与プログラムと、このプログラムを実行する制御部11と、辞書部4とが、本発明の識別情報付与手段を構成する。
ここで、辞書部4について説明する。辞書部4には、一般語,専門語,固有名などの基本概念に基づき、カテゴリごとに予め様々な言葉が登録されている。
また、辞書部4に登録されている語には、名詞,形容詞,動詞の種類、及びポジティブ語またはネガティブ語の種類が予め特定されている。
一般語としては、例えば、自動車、ビール銘柄、日用品、ペット、医薬品などの各分類が設けられており、それぞれの分類ごとに、さらに商品名などの固有の言葉が設定されている。
例えば、自動車であれば、スポーツカー、ホイール、ヘッドレストなどの一般的な言葉や、車種X,車種Yなどの様々な車種名が登録されている。
専門語としては、例えば、ビジネス、時事、法律、育児、金融などの分類が設けられており、それぞれの分類ごとに、各種専門用語が登録されている。
固有名としては、例えば、雑誌、芸能人、店舗、スポーツ選手、映画・ドラマタイトル、製品名などの分類が設けられており、それぞれの分類ごとに固有名が登録されている。
語に識別情報を付与する一例を示す。例えば、「ラブラドールと散歩に行き○○カフェに入りました。」という文章があった場合、「ラブラドール」、「と」、「散歩」、「に」、「行」、「き」、「○○カフェ」、「に」、「入」、「り」、「ました」が文章を構成する語として取り出される。
登録対象とされる語には識別情報が付される。例えば語「ラブラドール」については、辞書部4が照会され、「ラブラドール」の言葉があるか否かが判定される(ステップS21)。
選択された語が辞書部4に格納されている場合、選択された語を辞書部のIDに変換する。これにより、選択された語のカテゴリや種類が特定される(ステップS22)。そして、次の語の検証を続けて行う。
上記のようにして変換された語は、コーパスデータ記憶部5に格納される(ステップS23)。
なお、辞書部4に該当する言葉が格納されていない場合(ステップS21;No)、未知語であるとして、別途記憶される(ステップS24)。そして、カテゴリ、名詞,形容詞,動詞の種類、ポジティブ語またはネガティブ語の特定がなされ、(ステップS25)、辞書部4に登録される。そして、ステップS23に進む。
或いは、「駅で買った週刊○○に面白い記事が載っていた」という文章からは、「駅」、「買」、「週刊○○」、「面白い」、「記事」、「載」が登録対象の語として取り出される。
例えば「週刊○○」について、辞書部4が照会され、「週刊○○」分類が雑誌であることが確認される。
この場合、「週刊○○」のカテゴリは「雑誌」であると認定され、「雑誌」を示すフラグが付される。また、「週刊○○」は名詞であるから、名詞を示すフラグが付与される。
コーパスデータ記憶部5には、フラグが付された語が格納される。このとき、語は文書中の順番を保持して記憶される。
図6に、コーパスデータ記憶部5に記憶されるデータの一例を示す。ここでの語は、上記処理によりフラグが付され、カテゴリに関する情報及び言葉の種類に関する情報を備えている。
すなわち、コーパスデータ記憶部5に記憶される語には、所属カテゴリを示すフラグ、ポジティブ語か否かを示すフラグ、ネガティブ語か否かを示すフラグ、語の種類を示すフラグが付されている。
また、コーパスデータ記憶部5に記憶される語には、その語が語られた記事を特定するための識別子が付されている。
本例の情報提供システムSでは、上記語に基づいて、利用者に大きく分けて二種類の情報が提供されるように構成されている。
一つ目の情報(以下「第一の情報」という)は、語とそのカテゴリに基づき形成された情報である。
二つ目の情報(以下「第二の情報」という)は、利用者が入力した指定語と、この指定語の共起語に基づき形成された情報である。
システムの利用者側には、第2のコンピュータ20が設けられている。第2のコンピュータ20は、パソコン、PDA、携帯電話等から構成されている。
第2のコンピュータ20は、図7に示すように、制御部21と、インターネットIへの接続機能を有する通信制御部22と、マウスやキーボードからなる入力部23と、表示手段としての出力部24と、記憶部25とを備えて構成されている。
利用者が本システムを利用する際は、通信制御部22によりインターネットIを介して本システムにアクセスし、表示画面より指示語を入力する。すると、次述する各処理がなされ、出力部24に情報が提示される。
図8及び図9に、第一の情報の表示処理と表示態様を示す。
ここでは、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。
この処理を行うための検索プログラム及び情報生成プログラムと、このプログラムを実行する制御部11とが、本発明の分類手段及び整列手段を構成する。
はじめに、カテゴリが確認される(ステップS31)。提示されるカテゴリは予め設定されていても良いし、利用者が適宜選択するものであっても良い。
次に、各カテゴリについて、語が選択される(ステップS32)。
すなわち、例えばスポーツであれば、コーパスデータ記憶部5に記憶された語のうち、スポーツのフラグが付いた語が選択される。
語のスコアは、ある期間における出現頻度または総頻度の逆数で重み付けした値を用いる。
総頻度の逆数による重みづけは、頻出語のスコアを相対的に低下させるため、通常は出現頻度が低いものの、当該期間に特に頻度が高くなった語を探したい場合に有効である。
当該期間における出現頻度をfrq、全期間における出現頻度をFRQとすると、重みづけありのスコアは、次式により算出される。
Score=frq/FRQ
このようにして、各カテゴリにおいて語のスコアに応じて選択が行われる。
情報の選択が終了したら、これらの情報が利用者に提示される(ステップS33)。
なお、ステップS32〜ステップS33は繰り返し行われ、カテゴリでの上位話題は時間とともに刻々と変化する。
図9に、第一の情報の表示態様を示す。この表示態様は、第一の情報の表示画面100として、利用者コンピュータに表示される。
表示画面100は、メイン表示部110と、表示ジャンル選択ボタン120と、検索欄130とから構成されている。
メイン表示部110はマトリクス状に形成されており、図9の例では9つのカテゴリ欄111から構成されている。なお、カテゴリ欄の数は9つに限らず、他の個数であっても良い。また、表示態様は図9に示すマトリクス状に限らず、箇条書き形式等、他の形式であっても良い。
カテゴリ欄111には、各カテゴリにおいてスコアの高い語が、1位から順に示されている。例えば、ペットのカテゴリであれば、コーパスデータ記憶部5で最もスコアが高かった「ラブラドール」が最も話題になった語として一番上に表示される。次いで、二番目にスコアが高かった「フェレット」、三番目にスコアが高かった「アメリカンショートヘア」の順に表示がなされる。
また、ここでは、表示された語をクリックすると、その語について語っていたブログが表示されるように構成されている。
表示された語をクリックすると、ランク付けされた語それぞれについて、その語に関する記事が特定される(ステップS34)。そして、その語を含む記事が時間情報の最新順に整列され、選定される。
利用者が表示されたタイトルをクリックすると、該当記事が表示される。このようにして、利用者は記事を閲覧することが可能となる。
表示ジャンル選択ボタン120は、メイン表示部110に表示されるカテゴリ欄111を選択するものである。
表示ジャンル選択ボタン120をクリックすると、表示可能なカテゴリ全てが一覧表示される。ここで表示される全てのカテゴリは、本例の辞書部4に対応している。
利用者が所定のカテゴリを選択すると、そのカテゴリにおける語がコーパスデータ記憶部5から検索され、上位から順に表示される。
なお、この画面で利用者がブログを閲覧したときに、その語がブログ内のどの場所に登場したのかがすぐに判ると好適である。このため、本例では、検索欄130を設けている。検索欄130に所定の語を入力すれば、ブログ内でその語が表示されている箇所が表示され、語の登場箇所を容易に特定することが可能となる。
第一の情報により、利用者は一般社会事象等のトレンドを見たり、今現在、ブログで何が話題になっているか、そしてその具体的なページの内容はどうなっているか、について知ることが可能となる。
次に、第二の情報の表示処理と表示態様を示す。第二の情報として、回数分析情報、キーワード分析情報、評判分析情報、イメージジャンル分析情報、ライフスタイル分析情報、の各種情報が提示される。
なお、キーワード分析情報、評判分析情報、イメージジャンル分析情報、ライフスタイル分析情報の提示処理には、語の共起を利用して検索を行う処理が含まれている。
「共起」とは、特定の範囲内において、ある語とある語が同時に出願する現象をさす言語学の用語である。共起度は語同士の関連性の強さを示す。
例えば、「・・・ました。携帯音楽プレーヤはほしいし、もともとウーロン茶が・・・」という文脈において、「携帯音楽プレーヤ」を指定語としていた場合、「ほしい」、「ウーロン茶」などは共起している。
本例では、大量の言語データを元に、共起語を集計することによって、利用者が指定した言葉と関係する概念を抽出する。また、共起語の持つポジティブまたはネガティブなイメージを元に、指定語の評判・評価の推移を計測する。
図10は、第二の情報が示される表示画面200を示すものである。この画面は、利用者コンピュータに表示される。まず、表示画面の構成を説明する。
表示画面200は、メイン表示部210と、利用者が入力を行うための入力欄220として、指定語入力欄221と、データ日付入力欄222と、表示区切設定入力欄223と、分析方法選択入力欄224と、が設けられている。
分析方法選択入力欄224は、回数分析選択ボタン224aと、キーワード分析選択ボタン224bと、評判分析選択ボタン224cと、イメージジャンル分析ボタン224dと、ライフスタイル分析ボタン224eと、表示選択ボタン224f,224gを備えている。
利用者は、キーボードやマウス等の入力手段を用いて、これら入力欄220に入力を行う。
指定語入力欄221には、特定の商品名等が指定語として入力される。
指定語入力欄221は、メイン指定語入力欄221aと、比較対象語入力欄221bと、を備えており、本例では比較対象語入力欄221bは二つ設けられている。
例えば、自社製品に関する評判を知りたい場合は、メイン指定語入力欄221aには自社の製品名が入力される。また、比較対象語221bには他社の競合する製品名が入力される。
或いは、社会現象など、現在のトレンドに関する情報を取得する場合は、メイン指定語入力欄221aには「ワールドカップ」等の言葉が入力される。そして、比較対象語221bには、「MLB」、「ゴルフ」等の言葉が入力される。
その他、指定語入力欄221a及び比較対象語入力欄221bには、芸能人名、店舗名、キャラクタ名、時事に関する言葉など、分析対象に応じて種々の言葉が入力される。
データ日付入力欄222には、最新データの日付が表示される。
表示区切設定入力欄223では、データの集計単位を設定することができる。本例では、週単位、月単位、日単位のいずれかから選択することが可能である。
第二の情報の提示のうち、話題回数分析情報の提示について、図11のフローチャート及び図12の表示画面に基づいて説明する。
話題回数分析は、利用者の指定語がブログでどれだけ話題になっているかを示すものであり、ブログでのヒット数を示すものである。指定語のヒット数を示すことにより、話題の量を把握することが可能となる。
はじめに、利用者が入力した指定語が確認される(ステップS41)。図12の例では、指定語として「車種X」が入力されている。
また、比較対象語が入力されているか否かが確認される(ステップS42)。入力されていた場合は(ステップS42;Yes)、比較対象語が確認される(ステップS43)。図12の例では、指定語として「車種Y」及び「車種Z」が入力されている。比較対象語が入力されていない場合(ステップS42;No)は、ステップS44に進む。
ステップS44では、指定語及び比較対象語について、コーパスデータ記憶部5が検索され、指定語及び比較対象語に該当する言葉がカウントされる。
カウントが終了したら、メイン表示部210にてカウント数が利用者に提示される(ステップS45)。
指定語及び比較対象語のヒット数の推移は、週,月,日の任意の時系列で示すことができる。
また、図12に示すように、指定語と、指定語の比較対象語との出現度を比較できるグラフが示されるように構成されている。
次に、第二の情報の提示のうち、キーワード分析情報の提示について、図13のフローチャート及び図14の表示画面に基づいて説明する。
キーワード分析は、利用者の指定語と共に使われている単語を、利用者が指定した言葉の種類により、その上位順に表示するものである。ここで提示される情報により、指定語が、具体的にどのような言葉と共に使われているのかの概念変性度を把握することが可能である。
キーワード分析では、分析において、どのような種類の共起語を検出するのかを選択することができる。本例では、表示選択ボタン224fをクリックすることにより、語の種類を指定することができる。
表示選択ボタン224fをクリックすると、全種類,名詞,形容詞,ポジティブ語,ネガティブ語,カテゴリ,の順で切り替わり、いずれかを選択できる。本例では、表示選択で動詞は選択肢に入れていないが、動詞を選択肢に入れても良い。
例えば、名詞を選択した場合は、指定語の共起語のなかから、名詞のみが検出されることとなる。
カテゴリを選択した場合は、さらに選択肢が表示される。選択肢は辞書部4が保持している分類、すなわち、自動車、ビール銘柄、ビジネス、時事、雑誌、芸能人などのカテゴリ名が全て表示される。利用者は、表示されたカテゴリのなかから一つを選択する。
キーワード分析情報の提示処理は次の通りである。この処理を行うための検索プログラム及び情報生成プログラムと、このプログラムを実行する制御部11とが、本発明の共起語判定手段及び整列手段を構成する。
はじめに、利用者が入力した指定語が確認される(ステップS51)。図12の例では、「車種X」が指定語として入力されている。
次に、どの種類の共起語の提示が指定されているのかが確認される(ステップS52)。提示する共起語の種類は、利用者により予め設定される。利用者は設定する共起語について、全種類,名詞,形容詞,ポジティブ語,ネガティブ語,所定のカテゴリに属する語,のいずれかから選択することができる。
次に、コーパスデータ記憶部5から、指定語の共起語が検索・分析される(ステップS53)。このとき、名詞,形容詞,ポジティブ語,ネガティブ語,カテゴリのいずれかが選択されていたかを考慮して検索が行われる。
共起語が選出されると、選出された語の集合を演算して利用者への提供情報が作成される。
共起語は共起度に応じて整列され、利用者に提示される。
共起度の算出方法としては、言語研究分野で用いられている方法として、単純頻度、tスコア、MIスコア、LogLogスコア等がある。
単純頻度はその語の出現数による共起度であり、tスコアはt検定の手法を応用して2つの語の共起強度を計る指標の一つである。
また、MIスコアはキーワードと共起語それぞれのコーパスにおける頻度によって共起頻度を割ることで、特徴的にノードワードと結び付く語が上位にランクされ、コーパスに多数回出現する高頻度語は逆に下位にランクされるものである。
LogLogスコアは、MIスコアに共起頻度の対数を乗じたものである。共起頻度をより積極的に評価する算出方式であり、頻度のみを考える単純頻度と特徴的な語を上位におくMIスコアの中間の尺度を与えるものである。
本発明の最も特徴的な点は、上記共起度によるスコア方法に加えて、共起分析を時系列で実施する点にある。
語がどのような語と強い共起関係にあるか、すなわちその共起パターンの時間変化をみることによって、対象語が表現する概念の変性が理解される。
すなわち、共起度に応じて共起語を上位順に並べ替えて(ステップS54)、これらの情報が利用者に提示される(ステップS55)。
共起語のうち名詞が提示されるように設定されていた場合は、指定語の前後に出現した名詞が表示される。
図12の例では、2005年3月の時点では、「車種X」とともに出現した共起語(名詞)として「新型」が最も多く検出されたことが示されている。
「新型」の語は、日が経つにつれて減少し、現時点では「CM」が最も多く話題になっていることが示されている。
なお、画面中の矢印211をクリックすることにより、更に下位用語を見ることができる。
このように、検出される共起語を名詞とした場合は、どんな話題とともに指定語に関するものが語られているかを時系列で知ることが可能となる。
また、単に共起パターンの時間変化を見るだけではなく、各共起語の共起度の増加率を見ることで、流行現象の発生の近傍を見つけることができる。
従来、あまり高くなかった共起度が急激に高くなる場合、概念に何かしら革新的な変化が生起して、それが話題化している可能性が高い。
このような変化のきざしを検索するには、話題ランキング上位の語について、当該期間における高共起語を得て、その共起語群を共起度の増加度合でランキングすれば良い。
共起度の増加率は、全期間における共起度で当該期間の共起度を除することで得られる。
例えば、単純頻度による共起度で考えた場合、「眼鏡」と「かわいい」の共起頻度が当該期間において100、全期間では103とすれば、100/103となる。
全期間での語Xと語Yの共起度をCOLXYとして、当該期間における同共起度をcolxyとおくと、
共起度の増加率=colxy/COLXY
となる。この値で整列した組み合わせを利用者に提示する。
なお、検出される共起語を形容詞とした場合は、「かっこいい」、「かわいい」、「新しい」、「古い」、「高い」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語を形容詞とした場合は、指定語に関するものがどんなトーンで語られているかを知ることが可能となる。
検出される共起語をポジティブ語とした場合は、「心地よい」、「静か」、「新しい」、「楽しい」、「美しい」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語をポジティブ語とした場合は、指定語が具体的にどのようなポジティブ語とともに使われているかを知ることが可能となる。
検出される共起語をネガティブ語とした場合は、「不快」、「騒音」、「暗い」、「故障」、「クレーム」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語をネガティブ語とした場合は、指定語が具体的にどのようなネガティブ語とともに使われているかを知ることが可能となる。
検出される共起語をカテゴリとし、カテゴリのなかから例えば「雑誌」を選択した場合は、指定語と共に語られている雑誌名が検出される。そして、共起度の高い順に提示される。
このように、検出される共起語について、所定のカテゴリに含まれるものとした場合は、指定語が具体的にどのような語とともに使われているか、カテゴリを絞って知ることが可能となる。
また、この検索では、指定語として形容詞、例えば、指定語として「かわいい」という言葉が入力されていた場合、「かわいい」という語と共に語られている共起語を知ることが可能となる。
この分析は、例えば次のように利用することができる。「かわいい」という語について、芸能人のカテゴリに含まれる共起語を検出する。これにより、「かわいい」と共に語られている芸能人名が提示される。
本システムの検索により、特定の商品が「かわいい」という言葉と共に語られていると知った場合、さらに「かわいい」と共に語られる芸能人名を検索することにより、世間一般で「かわいい」とイメージされている芸能人名を知ることができる。
これにより、例えば、上記商品について広告を製作するときに、商品のイメージに合致する芸能人を選ぶことが可能となる。
そして、芸能人名だけでなく、「かわいい」と共に語られる雑誌名、テレビ番組名、店舗名等を知ることにより、広告の提供先を適切に選定することが可能となる。
次に、第二の情報の提示のうち、評判分析情報の提示について、図15のフローチャート及び図16の表示画面に基づいて説明する。
評判分析情報は、利用者の指定語と共に使われているポジティブ語とネガティブ語をそれぞれ検出し、それぞれの総数を時系列で示すものである。
評判分析情報処理では、はじめに、利用者が入力した指定語が確認される(ステップS61)。
次に、コーパスデータ記憶部5から、指定語の共起語のうち、ポジティブ語及びネガティブ語が検索される(ステップS62)。
ポジティブ語及びネガティブ語が検出されると、それぞれについてカウントを行い(ステップS63)、指定された期間ごとの集計及び分析を行う。
そして、集計結果を時系列で利用者に提示する(ステップS64)。
本例では、ポジティブ語及びネガティブ語の出現度合を棒グラフで示すように構成されている。
評判分析情報により、指定語に関する時期ごとの評価のトーンを大掴みに把握することが可能となる。
次に、第二の情報の提示のうち、イメージジャンル分析情報の提示について、図17のフローチャート及び図18の表示画面に基づいて説明する。
イメージジャンル分析情報は、イメージを表現する所定の言葉が、利用者の指定語とともにどれくらいの頻度で使われているかを時系列で示すものである。
イメージジャンル分析情報では、表示選択ボタン224gをクリックすることにより、イメージ語を指定することができる。
表示選択ボタン224gをクリックすると、予め設定されたイメージ語が表示される。イメージ語として、例えば、「家庭的な」、「高級な」、「平凡な」、「きれいな」、「良さそう」等の言葉が予め設定されている。利用者は、これら設定されたイメージ語から所定のものを選ぶことができる。
なお、予め設定されたイメージ語を選ぶのではなく、利用者が所定の語を入力することにより、イメージ語を設定することもできる。
イメージジャンル分析情報の提示処理は次の通りである。
はじめに、利用者が入力した指定語が確認される(ステップS71)。
次に、利用者が設定したイメージ語が確認される(ステップS72)。
次いで、コーパスデータ記憶部5から、設定されたイメージ語が検索され、イメージ語が検出されると、それぞれについてカウントを行う(ステップS73)。そして、指定された期間ごとの集計を行う(ステップS74)。
そして、集計結果を時系列で利用者に提示する(ステップS75)。
イメージジャンル分析情報により、利用者が指定した「家庭的な」、「高級な」等のイメージジャンルに当てはまる単語が、指定語とどのくらいの頻度で同時に使用されていたかを把握することが可能となる。
この分析により、指定語に係る商品等のイメージが、販売者の意図通りに消費者に伝わっているのか、消費者の指定語に対するイメージがどのように変わっているのか、等を知ることが可能となる。
次に、第二の情報の提示のうち、ライフスタイル分析情報の提示について、図19のフローチャート及び図20の表示画面に基づいて説明する。
ライフスタイル分析情報は、任意の期間に特定のキーワードを使った人だけをグループ化し、そのグループの特定カテゴリに関する話題のランキングと、その文脈を表示するものである。
図10の画面で、ライフスタイル分析ボタン224eをクリックすると、図20に示す表示画面300が表示される。
表示画面300には、セグメント条件入力欄310と、表示条件入力欄320と、メイン表示部330とが設けられている。
セグメント条件入力欄310には、期間指定欄311と、使用語指定欄312が、表示条件入力欄320には、期間指定欄321と、ジャンル指定欄322が、そしてメイン表示部330には、順位表示欄331と、記事表示欄332が設けられている。
セグメント条件入力欄310では、抽出するセグメントの条件として、期間と話題とを指定する。期間指定欄311にはセグメント対象の期間の入力を、使用語指定欄312にはセグメント対象の言葉の入力、またはジャンルの選択を行う。これにより、指定した期間に指定した話題について語った記事の著者集合が特定される。
例えば、「2005年4月1日から4月30日」の期間に「スポーツ」に関する話題を語った人の記事だけを対象にした分析、という指定が行える。
表示条件入力欄320では、前項で特定した人たちを対象に、改めて期間と話題を指定する。期間指定欄321では、期間の入力もしくは期間指定をしない場合には「全期間」を選択し、ジャンル指定欄322では、辞書部4が保持しているすべてのカテゴリジャンルについて、ジャンル毎の順位表示をするか、ある特定のジャンルにおける語の順位表示をするかを選択する。後者の場合には、具体的なジャンル名を選択する。
例えば、「全期間」,「ビール銘柄」と指定すると、先のセグメント条件で設定した「2005年4月1日から4月30日の間に、スポーツに関する話題を語った」著者たちすべての記事の中から、「すべての期間においてビール銘柄について語った記事」が抽出される。
メイン表示部330には処理結果が表示される。順位表示欄331には、期間指定欄321で指定したジャンル条件に応じて、ジャンル名あるいは指定ジャンルに登録された語が、「出現頻度」順または「出現頻度/総頻度」順に表示される。記事表示欄332には、順位表示欄331で最上位にあるジャンルあるいは指定ジャンルに登録された語を含む記事が時間情報の最新順に表示される。なお、順位表示欄331に表示されている出現頻度第2位以下のジャンル名あるいは語をクリックすると、記事表示欄332は、そのクリックしたジャンルあるいは語を含む記事の表示に切り替わる。
ライフスタイル分析情報の提示処理は次の通りである。
はじめに、分析対象を絞り込むための「期間」および「ジャンルあるいは語」が確認される(ステップS81)。図20の例では、「2005年4月1日〜2005年4月30日」の期間と「スポーツ」ジャンルが指定されている。
そして、コーパスデータ記憶部5から、指定期間における、辞書部4が保持しているスポーツカテゴリ内の語が検索される(ステップS82)。
コーパスデータ記憶部5では、格納されている語について、その語が語られた記事を特定するための識別子が付されているので、この識別子が特定されるとともに、記事が特定される。さらに、記事情報には著者情報が含まれているため、著者も特定される。これにより、指定期間においてスポーツについて語った記事の著者のすべての記事が選択される(ステップS83)。
次に、全抽出記事を対象として、表示条件として設定された期間とジャンルが検索される。
図20の例では、「全期間」,「ビール銘柄」が指定されている。この場合、期間指定が「全期間」であることから、その著者によって書かれたすべての記事を対象に、辞書部4が保持しているビール銘柄カテゴリ内の語が検索される(ステップS84)。これにより、特定の著者集合によって語られた「ビール銘柄」に関する語を抽出することができる。
「ビール銘柄」に関する語が選出されると、語ごとにカウントを行い、上位順または総頻度により重み付けされた順に並べ替えが行われる(ステップS85)。
また、検出された語が、どのような文脈で言及されたかが検出され、時間情報の最新順に整列される(ステップS86)。
そして、利用者にステップS85およびステップS86で形成された情報が表示される(ステップS87)。このとき、ステップS86の処理結果は、ステップS85の第1位のジャンルあるいは語を含む記事のみが表示される。これは、ステップS85で処理され表示されている他のジャンルあるいは語をクリックすることで、そのジャンルあるいは語を含む記事へと切り替えることができる。
この分析により、例えば、スポーツを話題とする人たちが関心を示すビールの銘柄を見ることができる。また、ある新商品の発売初期時点でその商品を話題にした、いわゆるアーリーアダプターだけのグループの、別のあるジャンルへの関心事を見ることもできる。
また、どのような文脈でその話題が出たのかを、実際の文章を見ることにより把握することが可能になる。
第三の情報の提示処理と表示態様を示す。
第一の情報の説明で述べたように、第一の提示処理では、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。第三の情報の提示処理では、第一の提示処理で表示された語について、さらにその共起語を検索し、図21に示すように並列表示する。
第三の情報の提示処理において、カテゴリ別に、直近の一定期間で最も多く登場した順に語を特定するまでの処理は、第一の情報の提示処理と同様である。
本例では、さらに、その語について、コーパスデータ記憶部5から共起語を検索する処理を行う。
そして、共起語として検出された語について、当該期間における共起度の高い順に提示する。第三の情報により、ある言葉に関連して、どういうことが語られているのか、ニュースのヘッドラインを見るように、容易に把握することが可能となる。
本発明の情報提供システムを示す説明図である。 情報提供者側の第1のコンピュータを示す説明図である。 ブログから記事を取得する処理を示すフローチャートである。 語変換部の処理を示すフローチャートである。 語への識別情報付与処理を示すフローチャートである。 コーパスデータ記憶部のデータの一例を示す説明図である。 利用者側コンピュータの例を示す説明図である。 語をカテゴリ別に示す処理を示すフローチャートである。 第一の情報の表示画面を示す説明図である。 第二の情報の表示画面を示す説明図である。 話題回数分析情報の提示処理を示すフローチャートである。 話題回数分析情報の表示画面を示す説明図である。 キーワード分析情報の提示処理を示すフローチャートである。 キーワード分析情報の表示画面を示す説明図である。 評判分析情報の提示処理を示すフローチャートである。 評判分析情報の表示画面を示す説明図である。 イメージジャンル分析情報の提示処理を示すフローチャートである。 イメージジャンル分析情報の表示画面を示す説明図である。 ライフスタイル分析情報の提示処理を示すフローチャートである。 ライフスタイル分析情報の表示画面を示す説明図である。 第三の情報の表示態様を示す説明図である。
符号の説明
1 ブログクローラ(ファイル取得手段)
2 HTMLファイル記憶部
3 語変換部
4 辞書部
5 コーパスデータ記憶部
6 検索エンジン
7 ピングサーバ
10 第1のコンピュータ
20 第2のコンピュータ
100,200,300 表示画面
110,210 メイン表示部
120 表示ジャンル選択ボタン
130 検索欄
220 入力欄
310 セグメント条件入力欄
320 表示条件入力欄
330 メイン表示部
S 情報提供システム

Claims (24)

  1. 時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供システムであって、
    情報提供者側に設けられた第1のコンピュータと、利用者側に設けられた第2のコンピュータを備え、
    前記第1のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、
    該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
    前記語に識別情報を付与する識別情報付与手段と、
    前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、
    前記第2のコンピュータは前記第1のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、
    前記提供情報を表示する表示手段と、を備えたことを特徴とする情報提供システム。
  2. 時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供方法であって、
    前記意見情報から文書ファイルを取得する工程と、
    該取得した文書ファイルから文書を取り出し、該文書を分解する工程と、
    前記語に識別情報を付与する工程と、
    前記生成された語の集合を演算して利用者への提供情報を生成する工程と、
    前記提供情報を表示する工程と、
    を備えたことを特徴とする情報提供方法。
  3. 前記提供情報を生成する工程では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項2記載の情報提供方法。
  4. 前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
  5. 前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項4記載の情報提供方法。
  6. 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項2記載の情報提供方法。
  7. 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
  8. 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
  9. 前記提供情報を表示する工程では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項2記載の情報提供方法。
  10. 時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供装置であって、
    前記意見情報から文書ファイルを取得するファイル取得手段と、
    該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
    前記語に識別情報を付与する識別情報付与手段と、
    前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備えたことを特徴とする情報提供装置。
  11. 前記情報生成手段は、前記語を前記識別情報に基づいて複数のカテゴリに分類する分類手段を備えたことを特徴とする請求項10記載の情報提供装置。
  12. 前記情報生成手段は、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項11記載の情報提供装置。
  13. 前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する整列手段を備えたことを特徴とする請求項12記載の情報提供装置。
  14. 前記情報生成手段は、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する共起語判定手段を備えたことを特徴とする請求項10記載の情報提供装置。
  15. 前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する整列手段を備えたことを特徴とする請求項14記載の情報提供装置。
  16. 前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項14記載の情報提供装置。
  17. 時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供プログラムであって、
    前記意見情報から文書ファイルを取得する処理と、
    該取得した文書ファイルから文書を取り出し、該文書を分解する処理と、
    前記語に識別情報を付与する処理と、
    前記生成された語の集合を演算して利用者への提供情報を生成する処理と、
    前記提供情報を表示する処理と、
    を備えたことを特徴とする情報提供プログラム。
  18. 前記提供情報を生成する処理では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
  19. 前記提供情報を生成する処理では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
  20. 前記提供情報を生成する処理では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項19記載の情報提供プログラム。
  21. 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
  22. 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
  23. 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
  24. 前記提供情報を表示する処理では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項17記載の情報提供プログラム。
JP2005199334A 2005-07-07 2005-07-07 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム Pending JP2007018285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005199334A JP2007018285A (ja) 2005-07-07 2005-07-07 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005199334A JP2007018285A (ja) 2005-07-07 2005-07-07 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム

Publications (1)

Publication Number Publication Date
JP2007018285A true JP2007018285A (ja) 2007-01-25

Family

ID=37755405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005199334A Pending JP2007018285A (ja) 2005-07-07 2005-07-07 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム

Country Status (1)

Country Link
JP (1) JP2007018285A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269014A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp 名称変換認知装置、方法
WO2009101954A1 (ja) * 2008-02-15 2009-08-20 Nec Corporation テキスト情報分析システム
JP2010134651A (ja) * 2008-12-03 2010-06-17 Yahoo Japan Corp 商品idサーバ装置、および商品idサーバ装置の制御方法
KR101021204B1 (ko) * 2008-10-01 2011-03-11 주식회사 버즈니 인터넷을 이용한 의견 검색 및 광고 서비스 방법
JP2011511384A (ja) * 2008-02-07 2011-04-07 ブランド・アフィニティー・テクノロジーズ・インコーポレイテッド キーワードを用いたブランドをレーティングするための質的な及び量的な方法
KR101044699B1 (ko) 2010-12-24 2011-06-27 주식회사 버즈니 인터넷을 이용한 의견 검색 및 광고 서비스 시스템
JP2013190847A (ja) * 2012-03-12 2013-09-26 Internatl Business Mach Corp <Ibm> ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。
US8595151B2 (en) 2011-06-08 2013-11-26 Hewlett-Packard Development Company, L.P. Selecting sentiment attributes for visualization
JP2014002653A (ja) * 2012-06-20 2014-01-09 Ntt Docomo Inc 共起語を特定する装置およびプログラム
US8862577B2 (en) 2011-08-15 2014-10-14 Hewlett-Packard Development Company, L.P. Visualizing sentiment results with visual indicators representing user sentiment and level of uncertainty
KR101498944B1 (ko) * 2011-11-28 2015-03-06 세종대학교산학협력단 상품 판매 업체 관련 글 판단 방법 및 그 장치
US9792377B2 (en) 2011-06-08 2017-10-17 Hewlett Packard Enterprise Development Lp Sentiment trent visualization relating to an event occuring in a particular geographic region

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002334106A (ja) * 2001-05-11 2002-11-22 Fujitsu Ltd 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
JP2003203136A (ja) * 2002-01-09 2003-07-18 Nec Corp 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002334106A (ja) * 2001-05-11 2002-11-22 Fujitsu Ltd 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
JP2003203136A (ja) * 2002-01-09 2003-07-18 Nec Corp 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269014A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp 名称変換認知装置、方法
JP2011511384A (ja) * 2008-02-07 2011-04-07 ブランド・アフィニティー・テクノロジーズ・インコーポレイテッド キーワードを用いたブランドをレーティングするための質的な及び量的な方法
WO2009101954A1 (ja) * 2008-02-15 2009-08-20 Nec Corporation テキスト情報分析システム
KR101021204B1 (ko) * 2008-10-01 2011-03-11 주식회사 버즈니 인터넷을 이용한 의견 검색 및 광고 서비스 방법
JP2010134651A (ja) * 2008-12-03 2010-06-17 Yahoo Japan Corp 商品idサーバ装置、および商品idサーバ装置の制御方法
KR101044699B1 (ko) 2010-12-24 2011-06-27 주식회사 버즈니 인터넷을 이용한 의견 검색 및 광고 서비스 시스템
US8595151B2 (en) 2011-06-08 2013-11-26 Hewlett-Packard Development Company, L.P. Selecting sentiment attributes for visualization
US9792377B2 (en) 2011-06-08 2017-10-17 Hewlett Packard Enterprise Development Lp Sentiment trent visualization relating to an event occuring in a particular geographic region
US8862577B2 (en) 2011-08-15 2014-10-14 Hewlett-Packard Development Company, L.P. Visualizing sentiment results with visual indicators representing user sentiment and level of uncertainty
KR101498944B1 (ko) * 2011-11-28 2015-03-06 세종대학교산학협력단 상품 판매 업체 관련 글 판단 방법 및 그 장치
JP2013190847A (ja) * 2012-03-12 2013-09-26 Internatl Business Mach Corp <Ibm> ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。
JP2014002653A (ja) * 2012-06-20 2014-01-09 Ntt Docomo Inc 共起語を特定する装置およびプログラム

Similar Documents

Publication Publication Date Title
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
US8538989B1 (en) Assigning weights to parts of a document
KR101506380B1 (ko) 무한 브라우즈
US7966305B2 (en) Relevance-weighted navigation in information access, search and retrieval
KR101171405B1 (ko) 검색 결과에서 배치 내용 정렬의 맞춤화
US8229949B2 (en) Apparatus, method and program product for presenting next search keyword
CA2833359C (en) Analyzing content to determine context and serving relevant content based on the context
US20160117395A1 (en) Optimized ontology based internet search systems and methods
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US20100235343A1 (en) Predicting Interestingness of Questions in Community Question Answering
US20100235311A1 (en) Question and answer search
US20170154116A1 (en) Method and system for recommending contents based on social network
CN102163211A (zh) 信息处理设备、重要度计算方法和程序
KR20110085995A (ko) 검색 결과들의 제공
EP2316065A1 (en) Personalization engine for classifying unstructured documents
JP5494126B2 (ja) 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム
US9015172B2 (en) Method and subsystem for searching media content within a content-search service system
US20150160847A1 (en) System and method for searching through a graphic user interface
JP2009169924A (ja) 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体
JP6018338B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2021111400A1 (en) System and method for enabling a search platform to users
RU2683482C2 (ru) Метод отображения релевантной контекстно-зависимой информации
EP2384476A1 (en) Personalization engine for building a user profile
JP2009223372A (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
Duan et al. Mining distinguishing customer focus sets from online customer reviews

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110412