JP2007018285A

JP2007018285A - 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム

Info

Publication number: JP2007018285A
Application number: JP2005199334A
Authority: JP
Inventors: Yoichi Inagaki; 陽一稲垣; Shotaro Tanaka; 昇太郎田中; Mitsuhiro Setoguchi; 光宏瀬戸口; Hideya Ushio; 栄冶潮
Original assignee: CAC Corp
Current assignee: CAC Corp
Priority date: 2005-07-07
Filing date: 2005-07-07
Publication date: 2007-01-25

Abstract

【課題】例えばインターネット上に存在するブログのような意見情報を利用して、利用者にリアルタイムで必要な情報を提示する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムを提供する。
【解決手段】情報提供者側に設けられた第１のコンピュータ１０と、利用者側に設けられた第２のコンピュータ２０を備え、第１のコンピュータ１０には、意見情報から文書ファイルを取得するファイル取得手段１と、取得した文書ファイルから文書を取り出し、文書を分解する変換手段３と、語に識別情報を付与する識別情報付与手段と、生成された語の集合を演算して利用者への提供情報を生成する情報生成手段とを備え、第２のコンピュータ２０は第１のコンピュータ１０が提供情報を生成するための指示情報を入力する入力手段と、提供情報を表示する表示手段を備えている。
【選択図】図１

Description

本発明は情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムに係り、特に、インターネット上のブログ等の、時間情報が付いた意見情報を利用して、現在の市場動向を知るための情報を提供する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムに関する。

従来より、顧客のニーズに合致した商品やサービスを提供するために、種々の方法で市場動向について情報の取得が行われている。
例えば、ＰＯＳシステムを利用し、キーワードに基づいてマーケットの流行を判断するシステムが提案されている（例えば、特許文献１参照）。
特開２００５−９２７２１号公報（第７−８頁）

上記システムによれば、商品に感性語を表すキーワードが付されており、このキーワードに基づいて、現在において売上が伸びている商品を把握し、商品開発に役立てることが可能となる。

しかし、上記システムで提供される情報は、ＰＯＳ情報に基づくものであり、商品が売れてからの情報であり、速報性に欠けるという問題があった。

また、キーワードは、予め商品に付されたものであるため、あくまでもキーワードは販売者が想定した範囲内のものとなり、予め予想された範囲内での結果しか得られないという不都合があった。

ところで、近年、社会的なニュースや所定のトピックスに関して、個人的な意見や分析或いは解説を日記的に公開する、ブログと呼ばれるウェブサイトが広がりを見せている。

ブログでは記事が頻繁に更新され、掲載された記事は時系列で並べて提示される。また、他のブログの関連記事について言及したときに、その記事から自分の記事にリンクさせることができる、トラックバックと呼ばれる機能を備えている。

ブログは単に情報を発信するだけでなく、コミュニケーション手段としての機能を備えている。そして、ブログによる口コミ情報が広がる等の現象が起こっている。

このように、ブログには話題性のあるトピックスについて、生の情報が流通しており、ブログに掲載された情報に注目することにより、現在、世の中で話題になっている事柄について、タイムリーに把握することが可能になる。

しかし、ウェブ上には膨大な数のブログが存在し、記事は１日数十万単位で増加しているため、ブログに形成された情報をマーケティング等に利用するには、単に記事を一つ一つ参照するのでは多大な手間と時間がかかってしまう。このため、記事に含まれる情報を加工及び分析する必要がある。

本発明の目的は、例えばインターネット上に存在するブログのような意見情報を利用して、利用者にリアルタイムで必要な情報を提示する、情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムを提供することにある。

上記課題は、本発明の情報提供システムによれば、時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供システムであって、
情報提供者側に設けられた第１のコンピュータと、利用者側に設けられた第２のコンピュータを備え、前記第１のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、前記語に識別情報を付与する識別情報付与手段と、前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、前記第２のコンピュータは前記第１のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、前記提供情報を表示する表示手段と、を備えた、ことにより解決される。

このように、本発明の情報提供システムによれば、刻々と情報が更新されるブログのような意見情報から言葉を抽出し、抽出された言葉に基づいて情報を作成し、利用者に提供する機能を有している。

本発明の情報提供方法は、時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供方法であって、前記意見情報から文書ファイルを取得する工程と、該取得した文書ファイルから文書を取り出し、該文書を分解する工程と、前記語に識別情報を付与する工程と、前記生成された語の集合を演算して利用者への提供情報を生成する工程と、前記提供情報を表示する工程と、を備えたことを特徴とする。

前記提供情報を生成する工程では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされる。
また、前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされる。
さらに、前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされる。
上記機能により、ブログ等の意見情報のなかで語られている言葉を複数のカテゴリに分類し、カテゴリ別に、現在どのようなことが話題になっているのかを利用者に提示することが可能となる。また、時間とともに変化する話題を利用者に知らせることが可能となる。

前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされる。そして、前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされる。
さらに、前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされる。
これにより、例えば利用者が提示した商品名等について、ブログ等の意見情報のなかでどのような言葉とともに語られているのかについて、最新の情報を提供することが可能である。

前記提供情報を表示する工程では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされる。

本発明の情報提供装置は、時間情報が付いた意見情報から言葉を抽出し、該言葉に基づく分析を行う情報提供装置であって、前記意見情報から文書ファイルを取得するファイル取得手段と、該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、前記語に識別情報を付与する識別情報付与手段と、前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備えたことを特徴とする。

前記情報生成手段は、前記語を前記識別情報に基づいて複数のカテゴリに分類する分類手段を備えている。また、前記カテゴリに分類された語を出現頻度の高い順にまたは出現増加率の高い順に整列する整列手段を備えている。
また、前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理を行う。

前記情報生成手段は、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する共起語判定手段を備えている。また、前記情報生成手段は、さらに前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理を行う。

前記情報生成手段は、さらに前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理を行う。

本発明の情報提供プログラムは、時間情報が付いた意見情報から言葉を抽出し、該言葉に基づく分析を行う情報提供プログラムであって、前記意見情報から文書ファイルを取得する処理と、該取得した文書ファイルから文書を取り出し、該文書を分解する処理と、前記語に識別情報を付与する処理と、前記生成された語の集合を演算して利用者への提供情報を生成する処理と、前記提供情報を表示する処理と、を備えたことを特徴とする。

前記提供情報を生成する処理では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされる。また、前記提供情報を生成する処理では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に選択する処理がなされる。

さらに、前記提供情報を生成する処理では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされる。

前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされる。また、前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされる。

さらに、前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされる。

前記提供情報を表示する処理では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされる。

以下、本発明の一実施の形態を図面に基づいて説明する。なお、以下に説明する処理ステップ、装置等は本発明を限定するものでなく、本発明の趣旨の範囲内で種々改変することができるものである。

図１乃至図２１は本発明の一実施の形態例を示すものであり、図１は本発明の情報提供システムを示す説明図、図２は情報提供者側の第１のコンピュータを示す説明図、図３はブログから記事を取得する処理を示すフローチャート、図４は語変換部の処理を示すフローチャート、図５は語への識別情報付与処理を示すフローチャート、図６はコーパスデータ記憶部のデータの一例を示す説明図、図７は利用者側コンピュータの例を示す説明図、図８は語をカテゴリ別に示す処理を示すフローチャート、図９は第一の情報の表示画面を示す説明図、図１０は第二の情報の表示画面を示す説明図、図１１は話題回数分析情報の提示処理を示すフローチャート、図１２は話題回数分析情報の表示画面を示す説明図、図１３はキーワード分析情報の提示処理を示すフローチャート、図１４はキーワード分析情報の表示画面を示す説明図、図１５は評判分析情報の提示処理を示すフローチャート、図１６は評判分析情報の表示画面を示す説明図、図１７はイメージジャンル分析情報の提示処理を示すフローチャート、図１８はイメージジャンル分析情報の表示画面を示す説明図、図１９はライフスタイル分析情報の提示処理を示すフローチャート、図２０はライフスタイル分析情報の表示画面を示す説明図、図２１は第三の情報の表示態様を示す説明図である。

本例に係る情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラムは、時間情報が付いた意見情報から文書を取り出し、文書を分解して語を取り出し、これら語を集計・分析して利用者に市場動向情報として提供するものである。
上記意見情報としては、例えばインターネット上のブログやネット掲示板等があるが、これに限らず、意見情報のデータベースなど他の形態の情報源であっても良い。

図１は、本例に係る情報提供システムの構成を示す説明図である。情報提供システムＳは、ファイル取得手段としてのブログクローラ１と、取得したＨＴＭＬファイルを記憶するＨＴＭＬファイル記憶部２と、変換手段としての語変換部３と、識別情報付与手段を構成する辞書部４と、コーパスデータ記憶部５と、検索エンジン６と、を備えて構成されている。
これらの機能は、情報提供者側の第１のコンピュータ１０に設けられている。これらの機能は、一つのコンピュータ上に設けられていても良く、或いは複数のコンピュータ上に設けられていても良い。

情報提供システムＳを構成する第１のコンピュータ１０は、図２に示すように、制御部１１、通信制御部１２、入力部１３、出力部１４、記憶部１５を備えて構成されている。第１のコンピュータ１０は通信制御部１２を介してインターネットＩに接続されている。

記憶部１５は、語変換部３で生成された語を記憶する語記憶部３ａと、語に識別情報を付与する際に辞書として機能する辞書部４と、本システムで最終的に生成された語を記憶するコーパスデータ記憶部５とを備えている。

ブログクローラ１、語変換部３、検索エンジン６は、所定のプログラムを備えて構成されている。このプログラムにしたがって制御部１１により、所定の処理が行われる。

ブログクローラ１は文書取得プログラムを備え、語変換部３は語変換プログラム及び識別情報付与プログラムを備え、検索エンジン６は検索プログラム及び情報生成プログラムを備えている。制御部１１は、上記各プログラムに従って作動し、これにより、ブログからの文書取得処理と、ブログの文書の語変換処理と、語への識別情報付与処理と、情報生成処理と、がそれぞれなされる。

ブログクローラ１は、インターネット上から記事を取得する機能を有するものである。
ここで、図３のフローチャートに従って、ブログクローラの動作について説明する。はじめに、ステップＳ１で、ブログクローラ１はインターネット上のピングサーバ７にアクセスする。ピングサーバ７はインターネット上におかれており、新規更新された記事のＵＲＬを収集する機能を有するサーバである。ピングサーバ７にアクセスすることにより、更新のあった記事のＵＲＬ情報を取得する（ステップＳ２）。

次いで、取得したＵＲＬにアクセスし、その記事のＨＴＭＬファイルを取得する（ステップＳ３）。
ブログクローラ１により、各ブログから、常に最新の情報が収集される。収集された記事のＨＴＭＬファイルは、ＨＴＭＬファイル記憶部２に格納される（ステップＳ４）。

語変換部３は、ＨＴＭＬファイル記憶部２に格納された文書を、語に分解する機能を有するものである。

図４のフローチャートに従って、語変換部３の動作を説明する。
まず、語変換部３は、ブログから取得された記事に対して、形態素解析を行って文書を語に分解する（ステップＳ１１）。
形態素とは、さらに細かくすると意味がなくなってしまう最小の文字列を言うものであるが、ここで形成される語は、その語自身が意味を持ち、利用者に提示される市場動向情報を構成するものである。
このとき、文書中の語の順番を、文書中の順序のままにして保持する。
語は、タグ付きテキストとして語記憶部３ａに記憶される（ステップＳ１２）。

次に、辞書部４の情報に基づいて、語に識別情報を付与する処理が行われる。辞書部４の情報に基づいて、語に識別情報が付与される。
この処理を行うための識別情報付与プログラムと、このプログラムを実行する制御部１１と、辞書部４とが、本発明の識別情報付与手段を構成する。
ここで、辞書部４について説明する。辞書部４には、一般語，専門語，固有名などの基本概念に基づき、カテゴリごとに予め様々な言葉が登録されている。
また、辞書部４に登録されている語には、名詞，形容詞，動詞の種類、及びポジティブ語またはネガティブ語の種類が予め特定されている。

一般語としては、例えば、自動車、ビール銘柄、日用品、ペット、医薬品などの各分類が設けられており、それぞれの分類ごとに、さらに商品名などの固有の言葉が設定されている。
例えば、自動車であれば、スポーツカー、ホイール、ヘッドレストなどの一般的な言葉や、車種Ｘ，車種Ｙなどの様々な車種名が登録されている。

専門語としては、例えば、ビジネス、時事、法律、育児、金融などの分類が設けられており、それぞれの分類ごとに、各種専門用語が登録されている。
固有名としては、例えば、雑誌、芸能人、店舗、スポーツ選手、映画・ドラマタイトル、製品名などの分類が設けられており、それぞれの分類ごとに固有名が登録されている。

語に識別情報を付与する一例を示す。例えば、「ラブラドールと散歩に行き○○カフェに入りました。」という文章があった場合、「ラブラドール」、「と」、「散歩」、「に」、「行」、「き」、「○○カフェ」、「に」、「入」、「り」、「ました」が文章を構成する語として取り出される。

登録対象とされる語には識別情報が付される。例えば語「ラブラドール」については、辞書部４が照会され、「ラブラドール」の言葉があるか否かが判定される（ステップＳ２１）。
選択された語が辞書部４に格納されている場合、選択された語を辞書部のＩＤに変換する。これにより、選択された語のカテゴリや種類が特定される（ステップＳ２２）。そして、次の語の検証を続けて行う。
上記のようにして変換された語は、コーパスデータ記憶部５に格納される（ステップＳ２３）。

なお、辞書部４に該当する言葉が格納されていない場合（ステップＳ２１；Ｎｏ）、未知語であるとして、別途記憶される（ステップＳ２４）。そして、カテゴリ、名詞，形容詞，動詞の種類、ポジティブ語またはネガティブ語の特定がなされ、（ステップＳ２５）、辞書部４に登録される。そして、ステップＳ２３に進む。

或いは、「駅で買った週刊○○に面白い記事が載っていた」という文章からは、「駅」、「買」、「週刊○○」、「面白い」、「記事」、「載」が登録対象の語として取り出される。

例えば「週刊○○」について、辞書部４が照会され、「週刊○○」分類が雑誌であることが確認される。
この場合、「週刊○○」のカテゴリは「雑誌」であると認定され、「雑誌」を示すフラグが付される。また、「週刊○○」は名詞であるから、名詞を示すフラグが付与される。

コーパスデータ記憶部５には、フラグが付された語が格納される。このとき、語は文書中の順番を保持して記憶される。
図６に、コーパスデータ記憶部５に記憶されるデータの一例を示す。ここでの語は、上記処理によりフラグが付され、カテゴリに関する情報及び言葉の種類に関する情報を備えている。
すなわち、コーパスデータ記憶部５に記憶される語には、所属カテゴリを示すフラグ、ポジティブ語か否かを示すフラグ、ネガティブ語か否かを示すフラグ、語の種類を示すフラグが付されている。
また、コーパスデータ記憶部５に記憶される語には、その語が語られた記事を特定するための識別子が付されている。

本例の情報提供システムＳでは、上記語に基づいて、利用者に大きく分けて二種類の情報が提供されるように構成されている。
一つ目の情報(以下「第一の情報」という)は、語とそのカテゴリに基づき形成された情報である。
二つ目の情報(以下「第二の情報」という)は、利用者が入力した指定語と、この指定語の共起語に基づき形成された情報である。

システムの利用者側には、第２のコンピュータ２０が設けられている。第２のコンピュータ２０は、パソコン、ＰＤＡ、携帯電話等から構成されている。
第２のコンピュータ２０は、図７に示すように、制御部２１と、インターネットＩへの接続機能を有する通信制御部２２と、マウスやキーボードからなる入力部２３と、表示手段としての出力部２４と、記憶部２５とを備えて構成されている。

利用者が本システムを利用する際は、通信制御部２２によりインターネットＩを介して本システムにアクセスし、表示画面より指示語を入力する。すると、次述する各処理がなされ、出力部２４に情報が提示される。

図８及び図９に、第一の情報の表示処理と表示態様を示す。
ここでは、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。
この処理を行うための検索プログラム及び情報生成プログラムと、このプログラムを実行する制御部１１とが、本発明の分類手段及び整列手段を構成する。
はじめに、カテゴリが確認される（ステップＳ３１）。提示されるカテゴリは予め設定されていても良いし、利用者が適宜選択するものであっても良い。
次に、各カテゴリについて、語が選択される（ステップＳ３２）。
すなわち、例えばスポーツであれば、コーパスデータ記憶部５に記憶された語のうち、スポーツのフラグが付いた語が選択される。

語のスコアは、ある期間における出現頻度または総頻度の逆数で重み付けした値を用いる。
総頻度の逆数による重みづけは、頻出語のスコアを相対的に低下させるため、通常は出現頻度が低いものの、当該期間に特に頻度が高くなった語を探したい場合に有効である。
当該期間における出現頻度をｆｒｑ、全期間における出現頻度をＦＲＱとすると、重みづけありのスコアは、次式により算出される。
Ｓｃｏｒｅ＝ｆｒｑ／ＦＲＱ

このようにして、各カテゴリにおいて語のスコアに応じて選択が行われる。
情報の選択が終了したら、これらの情報が利用者に提示される（ステップＳ３３）。
なお、ステップＳ３２〜ステップＳ３３は繰り返し行われ、カテゴリでの上位話題は時間とともに刻々と変化する。

図９に、第一の情報の表示態様を示す。この表示態様は、第一の情報の表示画面１００として、利用者コンピュータに表示される。
表示画面１００は、メイン表示部１１０と、表示ジャンル選択ボタン１２０と、検索欄１３０とから構成されている。

メイン表示部１１０はマトリクス状に形成されており、図９の例では９つのカテゴリ欄１１１から構成されている。なお、カテゴリ欄の数は９つに限らず、他の個数であっても良い。また、表示態様は図９に示すマトリクス状に限らず、箇条書き形式等、他の形式であっても良い。
カテゴリ欄１１１には、各カテゴリにおいてスコアの高い語が、１位から順に示されている。例えば、ペットのカテゴリであれば、コーパスデータ記憶部５で最もスコアが高かった「ラブラドール」が最も話題になった語として一番上に表示される。次いで、二番目にスコアが高かった「フェレット」、三番目にスコアが高かった「アメリカンショートヘア」の順に表示がなされる。

また、ここでは、表示された語をクリックすると、その語について語っていたブログが表示されるように構成されている。

表示された語をクリックすると、ランク付けされた語それぞれについて、その語に関する記事が特定される（ステップＳ３４）。そして、その語を含む記事が時間情報の最新順に整列され、選定される。
利用者が表示されたタイトルをクリックすると、該当記事が表示される。このようにして、利用者は記事を閲覧することが可能となる。

表示ジャンル選択ボタン１２０は、メイン表示部１１０に表示されるカテゴリ欄１１１を選択するものである。
表示ジャンル選択ボタン１２０をクリックすると、表示可能なカテゴリ全てが一覧表示される。ここで表示される全てのカテゴリは、本例の辞書部４に対応している。

利用者が所定のカテゴリを選択すると、そのカテゴリにおける語がコーパスデータ記憶部５から検索され、上位から順に表示される。
なお、この画面で利用者がブログを閲覧したときに、その語がブログ内のどの場所に登場したのかがすぐに判ると好適である。このため、本例では、検索欄１３０を設けている。検索欄１３０に所定の語を入力すれば、ブログ内でその語が表示されている箇所が表示され、語の登場箇所を容易に特定することが可能となる。

第一の情報により、利用者は一般社会事象等のトレンドを見たり、今現在、ブログで何が話題になっているか、そしてその具体的なページの内容はどうなっているか、について知ることが可能となる。

次に、第二の情報の表示処理と表示態様を示す。第二の情報として、回数分析情報、キーワード分析情報、評判分析情報、イメージジャンル分析情報、ライフスタイル分析情報、の各種情報が提示される。

なお、キーワード分析情報、評判分析情報、イメージジャンル分析情報、ライフスタイル分析情報の提示処理には、語の共起を利用して検索を行う処理が含まれている。
「共起」とは、特定の範囲内において、ある語とある語が同時に出願する現象をさす言語学の用語である。共起度は語同士の関連性の強さを示す。

例えば、「・・・ました。携帯音楽プレーヤはほしいし、もともとウーロン茶が・・・」という文脈において、「携帯音楽プレーヤ」を指定語としていた場合、「ほしい」、「ウーロン茶」などは共起している。

本例では、大量の言語データを元に、共起語を集計することによって、利用者が指定した言葉と関係する概念を抽出する。また、共起語の持つポジティブまたはネガティブなイメージを元に、指定語の評判・評価の推移を計測する。

図１０は、第二の情報が示される表示画面２００を示すものである。この画面は、利用者コンピュータに表示される。まず、表示画面の構成を説明する。

表示画面２００は、メイン表示部２１０と、利用者が入力を行うための入力欄２２０として、指定語入力欄２２１と、データ日付入力欄２２２と、表示区切設定入力欄２２３と、分析方法選択入力欄２２４と、が設けられている。
分析方法選択入力欄２２４は、回数分析選択ボタン２２４ａと、キーワード分析選択ボタン２２４ｂと、評判分析選択ボタン２２４ｃと、イメージジャンル分析ボタン２２４ｄと、ライフスタイル分析ボタン２２４ｅと、表示選択ボタン２２４ｆ，２２４ｇを備えている。

利用者は、キーボードやマウス等の入力手段を用いて、これら入力欄２２０に入力を行う。
指定語入力欄２２１には、特定の商品名等が指定語として入力される。
指定語入力欄２２１は、メイン指定語入力欄２２１ａと、比較対象語入力欄２２１ｂと、を備えており、本例では比較対象語入力欄２２１ｂは二つ設けられている。

例えば、自社製品に関する評判を知りたい場合は、メイン指定語入力欄２２１ａには自社の製品名が入力される。また、比較対象語２２１ｂには他社の競合する製品名が入力される。

或いは、社会現象など、現在のトレンドに関する情報を取得する場合は、メイン指定語入力欄２２１ａには「ワールドカップ」等の言葉が入力される。そして、比較対象語２２１ｂには、「ＭＬＢ」、「ゴルフ」等の言葉が入力される。

その他、指定語入力欄２２１ａ及び比較対象語入力欄２２１ｂには、芸能人名、店舗名、キャラクタ名、時事に関する言葉など、分析対象に応じて種々の言葉が入力される。

データ日付入力欄２２２には、最新データの日付が表示される。
表示区切設定入力欄２２３では、データの集計単位を設定することができる。本例では、週単位、月単位、日単位のいずれかから選択することが可能である。

第二の情報の提示のうち、話題回数分析情報の提示について、図１１のフローチャート及び図１２の表示画面に基づいて説明する。
話題回数分析は、利用者の指定語がブログでどれだけ話題になっているかを示すものであり、ブログでのヒット数を示すものである。指定語のヒット数を示すことにより、話題の量を把握することが可能となる。

はじめに、利用者が入力した指定語が確認される（ステップＳ４１）。図１２の例では、指定語として「車種Ｘ」が入力されている。
また、比較対象語が入力されているか否かが確認される（ステップＳ４２）。入力されていた場合は（ステップＳ４２；Ｙｅｓ）、比較対象語が確認される(ステップＳ４３)。図１２の例では、指定語として「車種Ｙ」及び「車種Ｚ」が入力されている。比較対象語が入力されていない場合(ステップＳ４２；Ｎｏ)は、ステップＳ４４に進む。

ステップＳ４４では、指定語及び比較対象語について、コーパスデータ記憶部５が検索され、指定語及び比較対象語に該当する言葉がカウントされる。
カウントが終了したら、メイン表示部２１０にてカウント数が利用者に提示される（ステップＳ４５）。

指定語及び比較対象語のヒット数の推移は、週，月，日の任意の時系列で示すことができる。
また、図１２に示すように、指定語と、指定語の比較対象語との出現度を比較できるグラフが示されるように構成されている。

次に、第二の情報の提示のうち、キーワード分析情報の提示について、図１３のフローチャート及び図１４の表示画面に基づいて説明する。
キーワード分析は、利用者の指定語と共に使われている単語を、利用者が指定した言葉の種類により、その上位順に表示するものである。ここで提示される情報により、指定語が、具体的にどのような言葉と共に使われているのかの概念変性度を把握することが可能である。

キーワード分析では、分析において、どのような種類の共起語を検出するのかを選択することができる。本例では、表示選択ボタン２２４ｆをクリックすることにより、語の種類を指定することができる。

表示選択ボタン２２４ｆをクリックすると、全種類，名詞，形容詞，ポジティブ語，ネガティブ語，カテゴリ，の順で切り替わり、いずれかを選択できる。本例では、表示選択で動詞は選択肢に入れていないが、動詞を選択肢に入れても良い。
例えば、名詞を選択した場合は、指定語の共起語のなかから、名詞のみが検出されることとなる。
カテゴリを選択した場合は、さらに選択肢が表示される。選択肢は辞書部４が保持している分類、すなわち、自動車、ビール銘柄、ビジネス、時事、雑誌、芸能人などのカテゴリ名が全て表示される。利用者は、表示されたカテゴリのなかから一つを選択する。

キーワード分析情報の提示処理は次の通りである。この処理を行うための検索プログラム及び情報生成プログラムと、このプログラムを実行する制御部１１とが、本発明の共起語判定手段及び整列手段を構成する。
はじめに、利用者が入力した指定語が確認される（ステップＳ５１）。図１２の例では、「車種Ｘ」が指定語として入力されている。
次に、どの種類の共起語の提示が指定されているのかが確認される（ステップＳ５２）。提示する共起語の種類は、利用者により予め設定される。利用者は設定する共起語について、全種類，名詞，形容詞，ポジティブ語，ネガティブ語，所定のカテゴリに属する語，のいずれかから選択することができる。

次に、コーパスデータ記憶部５から、指定語の共起語が検索・分析される（ステップＳ５３）。このとき、名詞，形容詞，ポジティブ語，ネガティブ語，カテゴリのいずれかが選択されていたかを考慮して検索が行われる。

共起語が選出されると、選出された語の集合を演算して利用者への提供情報が作成される。
共起語は共起度に応じて整列され、利用者に提示される。
共起度の算出方法としては、言語研究分野で用いられている方法として、単純頻度、ｔスコア、ＭＩスコア、ＬｏｇＬｏｇスコア等がある。

単純頻度はその語の出現数による共起度であり、ｔスコアはｔ検定の手法を応用して２つの語の共起強度を計る指標の一つである。
また、ＭＩスコアはキーワードと共起語それぞれのコーパスにおける頻度によって共起頻度を割ることで、特徴的にノードワードと結び付く語が上位にランクされ、コーパスに多数回出現する高頻度語は逆に下位にランクされるものである。
ＬｏｇＬｏｇスコアは、ＭＩスコアに共起頻度の対数を乗じたものである。共起頻度をより積極的に評価する算出方式であり、頻度のみを考える単純頻度と特徴的な語を上位におくＭＩスコアの中間の尺度を与えるものである。

本発明の最も特徴的な点は、上記共起度によるスコア方法に加えて、共起分析を時系列で実施する点にある。
語がどのような語と強い共起関係にあるか、すなわちその共起パターンの時間変化をみることによって、対象語が表現する概念の変性が理解される。

すなわち、共起度に応じて共起語を上位順に並べ替えて（ステップＳ５４）、これらの情報が利用者に提示される（ステップＳ５５）。
共起語のうち名詞が提示されるように設定されていた場合は、指定語の前後に出現した名詞が表示される。
図１２の例では、２００５年３月の時点では、「車種Ｘ」とともに出現した共起語（名詞）として「新型」が最も多く検出されたことが示されている。
「新型」の語は、日が経つにつれて減少し、現時点では「ＣＭ」が最も多く話題になっていることが示されている。
なお、画面中の矢印２１１をクリックすることにより、更に下位用語を見ることができる。
このように、検出される共起語を名詞とした場合は、どんな話題とともに指定語に関するものが語られているかを時系列で知ることが可能となる。

また、単に共起パターンの時間変化を見るだけではなく、各共起語の共起度の増加率を見ることで、流行現象の発生の近傍を見つけることができる。
従来、あまり高くなかった共起度が急激に高くなる場合、概念に何かしら革新的な変化が生起して、それが話題化している可能性が高い。

このような変化のきざしを検索するには、話題ランキング上位の語について、当該期間における高共起語を得て、その共起語群を共起度の増加度合でランキングすれば良い。
共起度の増加率は、全期間における共起度で当該期間の共起度を除することで得られる。
例えば、単純頻度による共起度で考えた場合、「眼鏡」と「かわいい」の共起頻度が当該期間において１００、全期間では１０３とすれば、１００／１０３となる。

全期間での語Ｘと語Ｙの共起度をＣＯＬ_ＸＹとして、当該期間における同共起度をｃｏｌ_ｘｙとおくと、
共起度の増加率＝ｃｏｌ_ｘｙ／ＣＯＬ_ＸＹ
となる。この値で整列した組み合わせを利用者に提示する。

なお、検出される共起語を形容詞とした場合は、「かっこいい」、「かわいい」、「新しい」、「古い」、「高い」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語を形容詞とした場合は、指定語に関するものがどんなトーンで語られているかを知ることが可能となる。

検出される共起語をポジティブ語とした場合は、「心地よい」、「静か」、「新しい」、「楽しい」、「美しい」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語をポジティブ語とした場合は、指定語が具体的にどのようなポジティブ語とともに使われているかを知ることが可能となる。

検出される共起語をネガティブ語とした場合は、「不快」、「騒音」、「暗い」、「故障」、「クレーム」等の言葉が検索され、指定語の共起語として多く検出された順に提示される。
このように、検出される共起語をネガティブ語とした場合は、指定語が具体的にどのようなネガティブ語とともに使われているかを知ることが可能となる。

検出される共起語をカテゴリとし、カテゴリのなかから例えば「雑誌」を選択した場合は、指定語と共に語られている雑誌名が検出される。そして、共起度の高い順に提示される。
このように、検出される共起語について、所定のカテゴリに含まれるものとした場合は、指定語が具体的にどのような語とともに使われているか、カテゴリを絞って知ることが可能となる。

また、この検索では、指定語として形容詞、例えば、指定語として「かわいい」という言葉が入力されていた場合、「かわいい」という語と共に語られている共起語を知ることが可能となる。
この分析は、例えば次のように利用することができる。「かわいい」という語について、芸能人のカテゴリに含まれる共起語を検出する。これにより、「かわいい」と共に語られている芸能人名が提示される。

本システムの検索により、特定の商品が「かわいい」という言葉と共に語られていると知った場合、さらに「かわいい」と共に語られる芸能人名を検索することにより、世間一般で「かわいい」とイメージされている芸能人名を知ることができる。
これにより、例えば、上記商品について広告を製作するときに、商品のイメージに合致する芸能人を選ぶことが可能となる。
そして、芸能人名だけでなく、「かわいい」と共に語られる雑誌名、テレビ番組名、店舗名等を知ることにより、広告の提供先を適切に選定することが可能となる。

次に、第二の情報の提示のうち、評判分析情報の提示について、図１５のフローチャート及び図１６の表示画面に基づいて説明する。
評判分析情報は、利用者の指定語と共に使われているポジティブ語とネガティブ語をそれぞれ検出し、それぞれの総数を時系列で示すものである。

評判分析情報処理では、はじめに、利用者が入力した指定語が確認される（ステップＳ６１）。
次に、コーパスデータ記憶部５から、指定語の共起語のうち、ポジティブ語及びネガティブ語が検索される（ステップＳ６２）。
ポジティブ語及びネガティブ語が検出されると、それぞれについてカウントを行い（ステップＳ６３）、指定された期間ごとの集計及び分析を行う。
そして、集計結果を時系列で利用者に提示する（ステップＳ６４）。
本例では、ポジティブ語及びネガティブ語の出現度合を棒グラフで示すように構成されている。

評判分析情報により、指定語に関する時期ごとの評価のトーンを大掴みに把握することが可能となる。

次に、第二の情報の提示のうち、イメージジャンル分析情報の提示について、図１７のフローチャート及び図１８の表示画面に基づいて説明する。
イメージジャンル分析情報は、イメージを表現する所定の言葉が、利用者の指定語とともにどれくらいの頻度で使われているかを時系列で示すものである。

イメージジャンル分析情報では、表示選択ボタン２２４ｇをクリックすることにより、イメージ語を指定することができる。

表示選択ボタン２２４ｇをクリックすると、予め設定されたイメージ語が表示される。イメージ語として、例えば、「家庭的な」、「高級な」、「平凡な」、「きれいな」、「良さそう」等の言葉が予め設定されている。利用者は、これら設定されたイメージ語から所定のものを選ぶことができる。
なお、予め設定されたイメージ語を選ぶのではなく、利用者が所定の語を入力することにより、イメージ語を設定することもできる。

イメージジャンル分析情報の提示処理は次の通りである。
はじめに、利用者が入力した指定語が確認される（ステップＳ７１）。
次に、利用者が設定したイメージ語が確認される（ステップＳ７２）。
次いで、コーパスデータ記憶部５から、設定されたイメージ語が検索され、イメージ語が検出されると、それぞれについてカウントを行う（ステップＳ７３）。そして、指定された期間ごとの集計を行う（ステップＳ７４）。
そして、集計結果を時系列で利用者に提示する（ステップＳ７５）。

イメージジャンル分析情報により、利用者が指定した「家庭的な」、「高級な」等のイメージジャンルに当てはまる単語が、指定語とどのくらいの頻度で同時に使用されていたかを把握することが可能となる。
この分析により、指定語に係る商品等のイメージが、販売者の意図通りに消費者に伝わっているのか、消費者の指定語に対するイメージがどのように変わっているのか、等を知ることが可能となる。

次に、第二の情報の提示のうち、ライフスタイル分析情報の提示について、図１９のフローチャート及び図２０の表示画面に基づいて説明する。
ライフスタイル分析情報は、任意の期間に特定のキーワードを使った人だけをグループ化し、そのグループの特定カテゴリに関する話題のランキングと、その文脈を表示するものである。

図１０の画面で、ライフスタイル分析ボタン２２４ｅをクリックすると、図２０に示す表示画面３００が表示される。
表示画面３００には、セグメント条件入力欄３１０と、表示条件入力欄３２０と、メイン表示部３３０とが設けられている。
セグメント条件入力欄３１０には、期間指定欄３１１と、使用語指定欄３１２が、表示条件入力欄３２０には、期間指定欄３２１と、ジャンル指定欄３２２が、そしてメイン表示部３３０には、順位表示欄３３１と、記事表示欄３３２が設けられている。

セグメント条件入力欄３１０では、抽出するセグメントの条件として、期間と話題とを指定する。期間指定欄３１１にはセグメント対象の期間の入力を、使用語指定欄３１２にはセグメント対象の言葉の入力、またはジャンルの選択を行う。これにより、指定した期間に指定した話題について語った記事の著者集合が特定される。
例えば、「２００５年４月１日から４月３０日」の期間に「スポーツ」に関する話題を語った人の記事だけを対象にした分析、という指定が行える。

表示条件入力欄３２０では、前項で特定した人たちを対象に、改めて期間と話題を指定する。期間指定欄３２１では、期間の入力もしくは期間指定をしない場合には「全期間」を選択し、ジャンル指定欄３２２では、辞書部４が保持しているすべてのカテゴリジャンルについて、ジャンル毎の順位表示をするか、ある特定のジャンルにおける語の順位表示をするかを選択する。後者の場合には、具体的なジャンル名を選択する。
例えば、「全期間」，「ビール銘柄」と指定すると、先のセグメント条件で設定した「２００５年４月１日から４月３０日の間に、スポーツに関する話題を語った」著者たちすべての記事の中から、「すべての期間においてビール銘柄について語った記事」が抽出される。

メイン表示部３３０には処理結果が表示される。順位表示欄３３１には、期間指定欄３２１で指定したジャンル条件に応じて、ジャンル名あるいは指定ジャンルに登録された語が、「出現頻度」順または「出現頻度／総頻度」順に表示される。記事表示欄３３２には、順位表示欄３３１で最上位にあるジャンルあるいは指定ジャンルに登録された語を含む記事が時間情報の最新順に表示される。なお、順位表示欄３３１に表示されている出現頻度第２位以下のジャンル名あるいは語をクリックすると、記事表示欄３３２は、そのクリックしたジャンルあるいは語を含む記事の表示に切り替わる。

ライフスタイル分析情報の提示処理は次の通りである。
はじめに、分析対象を絞り込むための「期間」および「ジャンルあるいは語」が確認される（ステップＳ８１）。図２０の例では、「２００５年４月１日〜２００５年４月３０日」の期間と「スポーツ」ジャンルが指定されている。

そして、コーパスデータ記憶部５から、指定期間における、辞書部４が保持しているスポーツカテゴリ内の語が検索される（ステップＳ８２）。

コーパスデータ記憶部５では、格納されている語について、その語が語られた記事を特定するための識別子が付されているので、この識別子が特定されるとともに、記事が特定される。さらに、記事情報には著者情報が含まれているため、著者も特定される。これにより、指定期間においてスポーツについて語った記事の著者のすべての記事が選択される（ステップＳ８３）。

次に、全抽出記事を対象として、表示条件として設定された期間とジャンルが検索される。
図２０の例では、「全期間」，「ビール銘柄」が指定されている。この場合、期間指定が「全期間」であることから、その著者によって書かれたすべての記事を対象に、辞書部４が保持しているビール銘柄カテゴリ内の語が検索される（ステップＳ８４）。これにより、特定の著者集合によって語られた「ビール銘柄」に関する語を抽出することができる。

「ビール銘柄」に関する語が選出されると、語ごとにカウントを行い、上位順または総頻度により重み付けされた順に並べ替えが行われる（ステップＳ８５）。

また、検出された語が、どのような文脈で言及されたかが検出され、時間情報の最新順に整列される（ステップＳ８６）。
そして、利用者にステップＳ８５およびステップＳ８６で形成された情報が表示される（ステップＳ８７）。このとき、ステップＳ８６の処理結果は、ステップＳ８５の第１位のジャンルあるいは語を含む記事のみが表示される。これは、ステップＳ８５で処理され表示されている他のジャンルあるいは語をクリックすることで、そのジャンルあるいは語を含む記事へと切り替えることができる。

この分析により、例えば、スポーツを話題とする人たちが関心を示すビールの銘柄を見ることができる。また、ある新商品の発売初期時点でその商品を話題にした、いわゆるアーリーアダプターだけのグループの、別のあるジャンルへの関心事を見ることもできる。

また、どのような文脈でその話題が出たのかを、実際の文章を見ることにより把握することが可能になる。

第三の情報の提示処理と表示態様を示す。
第一の情報の説明で述べたように、第一の提示処理では、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。第三の情報の提示処理では、第一の提示処理で表示された語について、さらにその共起語を検索し、図２１に示すように並列表示する。

第三の情報の提示処理において、カテゴリ別に、直近の一定期間で最も多く登場した順に語を特定するまでの処理は、第一の情報の提示処理と同様である。
本例では、さらに、その語について、コーパスデータ記憶部５から共起語を検索する処理を行う。
そして、共起語として検出された語について、当該期間における共起度の高い順に提示する。第三の情報により、ある言葉に関連して、どういうことが語られているのか、ニュースのヘッドラインを見るように、容易に把握することが可能となる。

本発明の情報提供システムを示す説明図である。情報提供者側の第１のコンピュータを示す説明図である。ブログから記事を取得する処理を示すフローチャートである。語変換部の処理を示すフローチャートである。語への識別情報付与処理を示すフローチャートである。コーパスデータ記憶部のデータの一例を示す説明図である。利用者側コンピュータの例を示す説明図である。語をカテゴリ別に示す処理を示すフローチャートである。第一の情報の表示画面を示す説明図である。第二の情報の表示画面を示す説明図である。話題回数分析情報の提示処理を示すフローチャートである。話題回数分析情報の表示画面を示す説明図である。キーワード分析情報の提示処理を示すフローチャートである。キーワード分析情報の表示画面を示す説明図である。評判分析情報の提示処理を示すフローチャートである。評判分析情報の表示画面を示す説明図である。イメージジャンル分析情報の提示処理を示すフローチャートである。イメージジャンル分析情報の表示画面を示す説明図である。ライフスタイル分析情報の提示処理を示すフローチャートである。ライフスタイル分析情報の表示画面を示す説明図である。第三の情報の表示態様を示す説明図である。

符号の説明

１ブログクローラ（ファイル取得手段）
２ＨＴＭＬファイル記憶部
３語変換部
４辞書部
５コーパスデータ記憶部
６検索エンジン
７ピングサーバ
１０第１のコンピュータ
２０第２のコンピュータ
１００，２００，３００表示画面
１１０，２１０メイン表示部
１２０表示ジャンル選択ボタン
１３０検索欄
２２０入力欄
３１０セグメント条件入力欄
３２０表示条件入力欄
３３０メイン表示部
Ｓ情報提供システム

Claims

時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供システムであって、
情報提供者側に設けられた第１のコンピュータと、利用者側に設けられた第２のコンピュータを備え、
前記第１のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、
該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
前記語に識別情報を付与する識別情報付与手段と、
前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、
前記第２のコンピュータは前記第１のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、
前記提供情報を表示する表示手段と、を備えたことを特徴とする情報提供システム。
時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供方法であって、
前記意見情報から文書ファイルを取得する工程と、
該取得した文書ファイルから文書を取り出し、該文書を分解する工程と、
前記語に識別情報を付与する工程と、
前記生成された語の集合を演算して利用者への提供情報を生成する工程と、
前記提供情報を表示する工程と、
を備えたことを特徴とする情報提供方法。
前記提供情報を生成する工程では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項２記載の情報提供方法。
前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項２記載の情報提供方法。
前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項４記載の情報提供方法。
前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項２記載の情報提供方法。
前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項２記載の情報提供方法。
前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項２記載の情報提供方法。
前記提供情報を表示する工程では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項２記載の情報提供方法。
時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供装置であって、
前記意見情報から文書ファイルを取得するファイル取得手段と、
該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
前記語に識別情報を付与する識別情報付与手段と、
前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備えたことを特徴とする情報提供装置。
前記情報生成手段は、前記語を前記識別情報に基づいて複数のカテゴリに分類する分類手段を備えたことを特徴とする請求項１０記載の情報提供装置。
前記情報生成手段は、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項１１記載の情報提供装置。
前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する整列手段を備えたことを特徴とする請求項１２記載の情報提供装置。
前記情報生成手段は、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する共起語判定手段を備えたことを特徴とする請求項１０記載の情報提供装置。
前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する整列手段を備えたことを特徴とする請求項１４記載の情報提供装置。
前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項１４記載の情報提供装置。
時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供プログラムであって、
前記意見情報から文書ファイルを取得する処理と、
該取得した文書ファイルから文書を取り出し、該文書を分解する処理と、
前記語に識別情報を付与する処理と、
前記生成された語の集合を演算して利用者への提供情報を生成する処理と、
前記提供情報を表示する処理と、
を備えたことを特徴とする情報提供プログラム。
前記提供情報を生成する処理では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項１７記載の情報提供プログラム。
前記提供情報を生成する処理では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項１７記載の情報提供プログラム。
前記提供情報を生成する処理では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項１９記載の情報提供プログラム。
前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項１７記載の情報提供プログラム。
前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項１７記載の情報提供プログラム。
前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項１７記載の情報提供プログラム。
前記提供情報を表示する処理では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項１７記載の情報提供プログラム。