JP2007018285A - 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム - Google Patents
情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム Download PDFInfo
- Publication number
- JP2007018285A JP2007018285A JP2005199334A JP2005199334A JP2007018285A JP 2007018285 A JP2007018285 A JP 2007018285A JP 2005199334 A JP2005199334 A JP 2005199334A JP 2005199334 A JP2005199334 A JP 2005199334A JP 2007018285 A JP2007018285 A JP 2007018285A
- Authority
- JP
- Japan
- Prior art keywords
- information
- words
- word
- document
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 230000008569 process Effects 0.000 claims description 83
- 238000004458 analytical method Methods 0.000 claims description 67
- 238000012545 processing Methods 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 abstract description 4
- 238000004220 aggregation Methods 0.000 abstract description 4
- 238000013500 data storage Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 235000013405 beer Nutrition 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003442 weekly effect Effects 0.000 description 5
- 235000006468 Thea sinensis Nutrition 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000020333 oolong tea Nutrition 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241000282341 Mustela putorius furo Species 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】 情報提供者側に設けられた第1のコンピュータ10と、利用者側に設けられた第2のコンピュータ20を備え、第1のコンピュータ10には、意見情報から文書ファイルを取得するファイル取得手段1と、取得した文書ファイルから文書を取り出し、文書を分解する変換手段3と、語に識別情報を付与する識別情報付与手段と、生成された語の集合を演算して利用者への提供情報を生成する情報生成手段とを備え、第2のコンピュータ20は第1のコンピュータ10が提供情報を生成するための指示情報を入力する入力手段と、提供情報を表示する表示手段を備えている。
【選択図】 図1
Description
例えば、POSシステムを利用し、キーワードに基づいてマーケットの流行を判断するシステムが提案されている(例えば、特許文献1参照)。
情報提供者側に設けられた第1のコンピュータと、利用者側に設けられた第2のコンピュータを備え、前記第1のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、前記語に識別情報を付与する識別情報付与手段と、前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、前記第2のコンピュータは前記第1のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、前記提供情報を表示する表示手段と、を備えた、ことにより解決される。
また、前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされる。
さらに、前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされる。
上記機能により、ブログ等の意見情報のなかで語られている言葉を複数のカテゴリに分類し、カテゴリ別に、現在どのようなことが話題になっているのかを利用者に提示することが可能となる。また、時間とともに変化する話題を利用者に知らせることが可能となる。
さらに、前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされる。
これにより、例えば利用者が提示した商品名等について、ブログ等の意見情報のなかでどのような言葉とともに語られているのかについて、最新の情報を提供することが可能である。
また、前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理を行う。
上記意見情報としては、例えばインターネット上のブログやネット掲示板等があるが、これに限らず、意見情報のデータベースなど他の形態の情報源であっても良い。
これらの機能は、情報提供者側の第1のコンピュータ10に設けられている。これらの機能は、一つのコンピュータ上に設けられていても良く、或いは複数のコンピュータ上に設けられていても良い。
ここで、図3のフローチャートに従って、ブログクローラの動作について説明する。はじめに、ステップS1で、ブログクローラ1はインターネット上のピングサーバ7にアクセスする。ピングサーバ7はインターネット上におかれており、新規更新された記事のURLを収集する機能を有するサーバである。ピングサーバ7にアクセスすることにより、更新のあった記事のURL情報を取得する(ステップS2)。
ブログクローラ1により、各ブログから、常に最新の情報が収集される。収集された記事のHTMLファイルは、HTMLファイル記憶部2に格納される(ステップS4)。
まず、語変換部3は、ブログから取得された記事に対して、形態素解析を行って文書を語に分解する(ステップS11)。
形態素とは、さらに細かくすると意味がなくなってしまう最小の文字列を言うものであるが、ここで形成される語は、その語自身が意味を持ち、利用者に提示される市場動向情報を構成するものである。
このとき、文書中の語の順番を、文書中の順序のままにして保持する。
語は、タグ付きテキストとして語記憶部3aに記憶される(ステップS12)。
この処理を行うための識別情報付与プログラムと、このプログラムを実行する制御部11と、辞書部4とが、本発明の識別情報付与手段を構成する。
ここで、辞書部4について説明する。辞書部4には、一般語,専門語,固有名などの基本概念に基づき、カテゴリごとに予め様々な言葉が登録されている。
また、辞書部4に登録されている語には、名詞,形容詞,動詞の種類、及びポジティブ語またはネガティブ語の種類が予め特定されている。
例えば、自動車であれば、スポーツカー、ホイール、ヘッドレストなどの一般的な言葉や、車種X,車種Yなどの様々な車種名が登録されている。
固有名としては、例えば、雑誌、芸能人、店舗、スポーツ選手、映画・ドラマタイトル、製品名などの分類が設けられており、それぞれの分類ごとに固有名が登録されている。
選択された語が辞書部4に格納されている場合、選択された語を辞書部のIDに変換する。これにより、選択された語のカテゴリや種類が特定される(ステップS22)。そして、次の語の検証を続けて行う。
上記のようにして変換された語は、コーパスデータ記憶部5に格納される(ステップS23)。
この場合、「週刊○○」のカテゴリは「雑誌」であると認定され、「雑誌」を示すフラグが付される。また、「週刊○○」は名詞であるから、名詞を示すフラグが付与される。
図6に、コーパスデータ記憶部5に記憶されるデータの一例を示す。ここでの語は、上記処理によりフラグが付され、カテゴリに関する情報及び言葉の種類に関する情報を備えている。
すなわち、コーパスデータ記憶部5に記憶される語には、所属カテゴリを示すフラグ、ポジティブ語か否かを示すフラグ、ネガティブ語か否かを示すフラグ、語の種類を示すフラグが付されている。
また、コーパスデータ記憶部5に記憶される語には、その語が語られた記事を特定するための識別子が付されている。
一つ目の情報(以下「第一の情報」という)は、語とそのカテゴリに基づき形成された情報である。
二つ目の情報(以下「第二の情報」という)は、利用者が入力した指定語と、この指定語の共起語に基づき形成された情報である。
第2のコンピュータ20は、図7に示すように、制御部21と、インターネットIへの接続機能を有する通信制御部22と、マウスやキーボードからなる入力部23と、表示手段としての出力部24と、記憶部25とを備えて構成されている。
ここでは、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。
この処理を行うための検索プログラム及び情報生成プログラムと、このプログラムを実行する制御部11とが、本発明の分類手段及び整列手段を構成する。
はじめに、カテゴリが確認される(ステップS31)。提示されるカテゴリは予め設定されていても良いし、利用者が適宜選択するものであっても良い。
次に、各カテゴリについて、語が選択される(ステップS32)。
すなわち、例えばスポーツであれば、コーパスデータ記憶部5に記憶された語のうち、スポーツのフラグが付いた語が選択される。
総頻度の逆数による重みづけは、頻出語のスコアを相対的に低下させるため、通常は出現頻度が低いものの、当該期間に特に頻度が高くなった語を探したい場合に有効である。
当該期間における出現頻度をfrq、全期間における出現頻度をFRQとすると、重みづけありのスコアは、次式により算出される。
Score=frq/FRQ
情報の選択が終了したら、これらの情報が利用者に提示される(ステップS33)。
なお、ステップS32〜ステップS33は繰り返し行われ、カテゴリでの上位話題は時間とともに刻々と変化する。
表示画面100は、メイン表示部110と、表示ジャンル選択ボタン120と、検索欄130とから構成されている。
カテゴリ欄111には、各カテゴリにおいてスコアの高い語が、1位から順に示されている。例えば、ペットのカテゴリであれば、コーパスデータ記憶部5で最もスコアが高かった「ラブラドール」が最も話題になった語として一番上に表示される。次いで、二番目にスコアが高かった「フェレット」、三番目にスコアが高かった「アメリカンショートヘア」の順に表示がなされる。
利用者が表示されたタイトルをクリックすると、該当記事が表示される。このようにして、利用者は記事を閲覧することが可能となる。
表示ジャンル選択ボタン120をクリックすると、表示可能なカテゴリ全てが一覧表示される。ここで表示される全てのカテゴリは、本例の辞書部4に対応している。
なお、この画面で利用者がブログを閲覧したときに、その語がブログ内のどの場所に登場したのかがすぐに判ると好適である。このため、本例では、検索欄130を設けている。検索欄130に所定の語を入力すれば、ブログ内でその語が表示されている箇所が表示され、語の登場箇所を容易に特定することが可能となる。
「共起」とは、特定の範囲内において、ある語とある語が同時に出願する現象をさす言語学の用語である。共起度は語同士の関連性の強さを示す。
分析方法選択入力欄224は、回数分析選択ボタン224aと、キーワード分析選択ボタン224bと、評判分析選択ボタン224cと、イメージジャンル分析ボタン224dと、ライフスタイル分析ボタン224eと、表示選択ボタン224f,224gを備えている。
指定語入力欄221には、特定の商品名等が指定語として入力される。
指定語入力欄221は、メイン指定語入力欄221aと、比較対象語入力欄221bと、を備えており、本例では比較対象語入力欄221bは二つ設けられている。
表示区切設定入力欄223では、データの集計単位を設定することができる。本例では、週単位、月単位、日単位のいずれかから選択することが可能である。
話題回数分析は、利用者の指定語がブログでどれだけ話題になっているかを示すものであり、ブログでのヒット数を示すものである。指定語のヒット数を示すことにより、話題の量を把握することが可能となる。
また、比較対象語が入力されているか否かが確認される(ステップS42)。入力されていた場合は(ステップS42;Yes)、比較対象語が確認される(ステップS43)。図12の例では、指定語として「車種Y」及び「車種Z」が入力されている。比較対象語が入力されていない場合(ステップS42;No)は、ステップS44に進む。
カウントが終了したら、メイン表示部210にてカウント数が利用者に提示される(ステップS45)。
また、図12に示すように、指定語と、指定語の比較対象語との出現度を比較できるグラフが示されるように構成されている。
キーワード分析は、利用者の指定語と共に使われている単語を、利用者が指定した言葉の種類により、その上位順に表示するものである。ここで提示される情報により、指定語が、具体的にどのような言葉と共に使われているのかの概念変性度を把握することが可能である。
例えば、名詞を選択した場合は、指定語の共起語のなかから、名詞のみが検出されることとなる。
カテゴリを選択した場合は、さらに選択肢が表示される。選択肢は辞書部4が保持している分類、すなわち、自動車、ビール銘柄、ビジネス、時事、雑誌、芸能人などのカテゴリ名が全て表示される。利用者は、表示されたカテゴリのなかから一つを選択する。
はじめに、利用者が入力した指定語が確認される(ステップS51)。図12の例では、「車種X」が指定語として入力されている。
次に、どの種類の共起語の提示が指定されているのかが確認される(ステップS52)。提示する共起語の種類は、利用者により予め設定される。利用者は設定する共起語について、全種類,名詞,形容詞,ポジティブ語,ネガティブ語,所定のカテゴリに属する語,のいずれかから選択することができる。
共起語は共起度に応じて整列され、利用者に提示される。
共起度の算出方法としては、言語研究分野で用いられている方法として、単純頻度、tスコア、MIスコア、LogLogスコア等がある。
また、MIスコアはキーワードと共起語それぞれのコーパスにおける頻度によって共起頻度を割ることで、特徴的にノードワードと結び付く語が上位にランクされ、コーパスに多数回出現する高頻度語は逆に下位にランクされるものである。
LogLogスコアは、MIスコアに共起頻度の対数を乗じたものである。共起頻度をより積極的に評価する算出方式であり、頻度のみを考える単純頻度と特徴的な語を上位におくMIスコアの中間の尺度を与えるものである。
語がどのような語と強い共起関係にあるか、すなわちその共起パターンの時間変化をみることによって、対象語が表現する概念の変性が理解される。
共起語のうち名詞が提示されるように設定されていた場合は、指定語の前後に出現した名詞が表示される。
図12の例では、2005年3月の時点では、「車種X」とともに出現した共起語(名詞)として「新型」が最も多く検出されたことが示されている。
「新型」の語は、日が経つにつれて減少し、現時点では「CM」が最も多く話題になっていることが示されている。
なお、画面中の矢印211をクリックすることにより、更に下位用語を見ることができる。
このように、検出される共起語を名詞とした場合は、どんな話題とともに指定語に関するものが語られているかを時系列で知ることが可能となる。
従来、あまり高くなかった共起度が急激に高くなる場合、概念に何かしら革新的な変化が生起して、それが話題化している可能性が高い。
共起度の増加率は、全期間における共起度で当該期間の共起度を除することで得られる。
例えば、単純頻度による共起度で考えた場合、「眼鏡」と「かわいい」の共起頻度が当該期間において100、全期間では103とすれば、100/103となる。
共起度の増加率=colxy/COLXY
となる。この値で整列した組み合わせを利用者に提示する。
このように、検出される共起語を形容詞とした場合は、指定語に関するものがどんなトーンで語られているかを知ることが可能となる。
このように、検出される共起語をポジティブ語とした場合は、指定語が具体的にどのようなポジティブ語とともに使われているかを知ることが可能となる。
このように、検出される共起語をネガティブ語とした場合は、指定語が具体的にどのようなネガティブ語とともに使われているかを知ることが可能となる。
このように、検出される共起語について、所定のカテゴリに含まれるものとした場合は、指定語が具体的にどのような語とともに使われているか、カテゴリを絞って知ることが可能となる。
この分析は、例えば次のように利用することができる。「かわいい」という語について、芸能人のカテゴリに含まれる共起語を検出する。これにより、「かわいい」と共に語られている芸能人名が提示される。
これにより、例えば、上記商品について広告を製作するときに、商品のイメージに合致する芸能人を選ぶことが可能となる。
そして、芸能人名だけでなく、「かわいい」と共に語られる雑誌名、テレビ番組名、店舗名等を知ることにより、広告の提供先を適切に選定することが可能となる。
評判分析情報は、利用者の指定語と共に使われているポジティブ語とネガティブ語をそれぞれ検出し、それぞれの総数を時系列で示すものである。
次に、コーパスデータ記憶部5から、指定語の共起語のうち、ポジティブ語及びネガティブ語が検索される(ステップS62)。
ポジティブ語及びネガティブ語が検出されると、それぞれについてカウントを行い(ステップS63)、指定された期間ごとの集計及び分析を行う。
そして、集計結果を時系列で利用者に提示する(ステップS64)。
本例では、ポジティブ語及びネガティブ語の出現度合を棒グラフで示すように構成されている。
イメージジャンル分析情報は、イメージを表現する所定の言葉が、利用者の指定語とともにどれくらいの頻度で使われているかを時系列で示すものである。
なお、予め設定されたイメージ語を選ぶのではなく、利用者が所定の語を入力することにより、イメージ語を設定することもできる。
はじめに、利用者が入力した指定語が確認される(ステップS71)。
次に、利用者が設定したイメージ語が確認される(ステップS72)。
次いで、コーパスデータ記憶部5から、設定されたイメージ語が検索され、イメージ語が検出されると、それぞれについてカウントを行う(ステップS73)。そして、指定された期間ごとの集計を行う(ステップS74)。
そして、集計結果を時系列で利用者に提示する(ステップS75)。
この分析により、指定語に係る商品等のイメージが、販売者の意図通りに消費者に伝わっているのか、消費者の指定語に対するイメージがどのように変わっているのか、等を知ることが可能となる。
ライフスタイル分析情報は、任意の期間に特定のキーワードを使った人だけをグループ化し、そのグループの特定カテゴリに関する話題のランキングと、その文脈を表示するものである。
表示画面300には、セグメント条件入力欄310と、表示条件入力欄320と、メイン表示部330とが設けられている。
セグメント条件入力欄310には、期間指定欄311と、使用語指定欄312が、表示条件入力欄320には、期間指定欄321と、ジャンル指定欄322が、そしてメイン表示部330には、順位表示欄331と、記事表示欄332が設けられている。
例えば、「2005年4月1日から4月30日」の期間に「スポーツ」に関する話題を語った人の記事だけを対象にした分析、という指定が行える。
例えば、「全期間」,「ビール銘柄」と指定すると、先のセグメント条件で設定した「2005年4月1日から4月30日の間に、スポーツに関する話題を語った」著者たちすべての記事の中から、「すべての期間においてビール銘柄について語った記事」が抽出される。
はじめに、分析対象を絞り込むための「期間」および「ジャンルあるいは語」が確認される(ステップS81)。図20の例では、「2005年4月1日〜2005年4月30日」の期間と「スポーツ」ジャンルが指定されている。
図20の例では、「全期間」,「ビール銘柄」が指定されている。この場合、期間指定が「全期間」であることから、その著者によって書かれたすべての記事を対象に、辞書部4が保持しているビール銘柄カテゴリ内の語が検索される(ステップS84)。これにより、特定の著者集合によって語られた「ビール銘柄」に関する語を抽出することができる。
そして、利用者にステップS85およびステップS86で形成された情報が表示される(ステップS87)。このとき、ステップS86の処理結果は、ステップS85の第1位のジャンルあるいは語を含む記事のみが表示される。これは、ステップS85で処理され表示されている他のジャンルあるいは語をクリックすることで、そのジャンルあるいは語を含む記事へと切り替えることができる。
第一の情報の説明で述べたように、第一の提示処理では、カテゴリ別に、語を、直近の一定期間で最も多く登場した順に並べ、利用者に示す処理が行われる。第三の情報の提示処理では、第一の提示処理で表示された語について、さらにその共起語を検索し、図21に示すように並列表示する。
本例では、さらに、その語について、コーパスデータ記憶部5から共起語を検索する処理を行う。
そして、共起語として検出された語について、当該期間における共起度の高い順に提示する。第三の情報により、ある言葉に関連して、どういうことが語られているのか、ニュースのヘッドラインを見るように、容易に把握することが可能となる。
2 HTMLファイル記憶部
3 語変換部
4 辞書部
5 コーパスデータ記憶部
6 検索エンジン
7 ピングサーバ
10 第1のコンピュータ
20 第2のコンピュータ
100,200,300 表示画面
110,210 メイン表示部
120 表示ジャンル選択ボタン
130 検索欄
220 入力欄
310 セグメント条件入力欄
320 表示条件入力欄
330 メイン表示部
S 情報提供システム
Claims (24)
- 時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供システムであって、
情報提供者側に設けられた第1のコンピュータと、利用者側に設けられた第2のコンピュータを備え、
前記第1のコンピュータには、前記意見情報から文書ファイルを取得するファイル取得手段と、
該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
前記語に識別情報を付与する識別情報付与手段と、
前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備え、
前記第2のコンピュータは前記第1のコンピュータが前記提供情報を生成するための指示情報を入力する入力手段と、
前記提供情報を表示する表示手段と、を備えたことを特徴とする情報提供システム。 - 時間情報が付いた意見情報から語を抽出し、該語に基づく情報を提供する情報提供方法であって、
前記意見情報から文書ファイルを取得する工程と、
該取得した文書ファイルから文書を取り出し、該文書を分解する工程と、
前記語に識別情報を付与する工程と、
前記生成された語の集合を演算して利用者への提供情報を生成する工程と、
前記提供情報を表示する工程と、
を備えたことを特徴とする情報提供方法。 - 前記提供情報を生成する工程では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項2記載の情報提供方法。
- 前記提供情報を生成する工程では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
- 前記提供情報を生成する工程では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項4記載の情報提供方法。
- 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項2記載の情報提供方法。
- 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
- 前記提供情報を生成する工程では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項2記載の情報提供方法。
- 前記提供情報を表示する工程では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項2記載の情報提供方法。
- 時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供装置であって、
前記意見情報から文書ファイルを取得するファイル取得手段と、
該取得した文書ファイルから文書を取り出し、該文書を分解する変換手段と、
前記語に識別情報を付与する識別情報付与手段と、
前記生成された語の集合を演算して利用者への提供情報を生成する情報生成手段と、を備えたことを特徴とする情報提供装置。 - 前記情報生成手段は、前記語を前記識別情報に基づいて複数のカテゴリに分類する分類手段を備えたことを特徴とする請求項10記載の情報提供装置。
- 前記情報生成手段は、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項11記載の情報提供装置。
- 前記提供情報生成手段は、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する整列手段を備えたことを特徴とする請求項12記載の情報提供装置。
- 前記情報生成手段は、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する共起語判定手段を備えたことを特徴とする請求項10記載の情報提供装置。
- 前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する整列手段を備えたことを特徴とする請求項14記載の情報提供装置。
- 前記情報生成手段は、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する整列手段を備えたことを特徴とする請求項14記載の情報提供装置。
- 時間情報が付いた意見情報から語を抽出し、該語に基づく分析を行う情報提供プログラムであって、
前記意見情報から文書ファイルを取得する処理と、
該取得した文書ファイルから文書を取り出し、該文書を分解する処理と、
前記語に識別情報を付与する処理と、
前記生成された語の集合を演算して利用者への提供情報を生成する処理と、
前記提供情報を表示する処理と、
を備えたことを特徴とする情報提供プログラム。 - 前記提供情報を生成する処理では、前記語を前記識別情報に基づいて複数のカテゴリに分類する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
- 前記提供情報を生成する処理では、前記カテゴリに分類された語を出現頻度の高い順または出現増加率の高い順に整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
- 前記提供情報を生成する処理では、前記出現頻度の高い語または出現増加率の高い語のなかから、時間情報の最新順に整列する処理がなされることを特徴とする請求項19記載の情報提供プログラム。
- 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
- 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を共起度に応じて整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
- 前記提供情報を生成する処理では、前記取り出された語のうち、文書中の所定範囲内に出現した共起語を判定するとともに、前記文書中の所定範囲内に出現した共起語を出現増加率の高い順に整列する処理がなされることを特徴とする請求項17記載の情報提供プログラム。
- 前記提供情報を表示する処理では、前記語を前記カテゴリに分類した情報を表示する処理、前記指示情報の出現頻度または出現増加率に関する情報を表示する処理、前記指示情報の共起語に関する情報を表示する処理、のいずれかがなされることを特徴とする請求項17記載の情報提供プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005199334A JP2007018285A (ja) | 2005-07-07 | 2005-07-07 | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005199334A JP2007018285A (ja) | 2005-07-07 | 2005-07-07 | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007018285A true JP2007018285A (ja) | 2007-01-25 |
Family
ID=37755405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005199334A Pending JP2007018285A (ja) | 2005-07-07 | 2005-07-07 | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007018285A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008269014A (ja) * | 2007-04-16 | 2008-11-06 | Yahoo Japan Corp | 名称変換認知装置、方法 |
WO2009101954A1 (ja) * | 2008-02-15 | 2009-08-20 | Nec Corporation | テキスト情報分析システム |
JP2010134651A (ja) * | 2008-12-03 | 2010-06-17 | Yahoo Japan Corp | 商品idサーバ装置、および商品idサーバ装置の制御方法 |
KR101021204B1 (ko) * | 2008-10-01 | 2011-03-11 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 및 광고 서비스 방법 |
JP2011511384A (ja) * | 2008-02-07 | 2011-04-07 | ブランド・アフィニティー・テクノロジーズ・インコーポレイテッド | キーワードを用いたブランドをレーティングするための質的な及び量的な方法 |
KR101044699B1 (ko) | 2010-12-24 | 2011-06-27 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 및 광고 서비스 시스템 |
JP2013190847A (ja) * | 2012-03-12 | 2013-09-26 | Internatl Business Mach Corp <Ibm> | ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。 |
US8595151B2 (en) | 2011-06-08 | 2013-11-26 | Hewlett-Packard Development Company, L.P. | Selecting sentiment attributes for visualization |
JP2014002653A (ja) * | 2012-06-20 | 2014-01-09 | Ntt Docomo Inc | 共起語を特定する装置およびプログラム |
US8862577B2 (en) | 2011-08-15 | 2014-10-14 | Hewlett-Packard Development Company, L.P. | Visualizing sentiment results with visual indicators representing user sentiment and level of uncertainty |
KR101498944B1 (ko) * | 2011-11-28 | 2015-03-06 | 세종대학교산학협력단 | 상품 판매 업체 관련 글 판단 방법 및 그 장치 |
US9792377B2 (en) | 2011-06-08 | 2017-10-17 | Hewlett Packard Enterprise Development Lp | Sentiment trent visualization relating to an event occuring in a particular geographic region |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002334106A (ja) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2003203136A (ja) * | 2002-01-09 | 2003-07-18 | Nec Corp | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム |
-
2005
- 2005-07-07 JP JP2005199334A patent/JP2007018285A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002334106A (ja) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2003203136A (ja) * | 2002-01-09 | 2003-07-18 | Nec Corp | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008269014A (ja) * | 2007-04-16 | 2008-11-06 | Yahoo Japan Corp | 名称変換認知装置、方法 |
JP2011511384A (ja) * | 2008-02-07 | 2011-04-07 | ブランド・アフィニティー・テクノロジーズ・インコーポレイテッド | キーワードを用いたブランドをレーティングするための質的な及び量的な方法 |
WO2009101954A1 (ja) * | 2008-02-15 | 2009-08-20 | Nec Corporation | テキスト情報分析システム |
KR101021204B1 (ko) * | 2008-10-01 | 2011-03-11 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 및 광고 서비스 방법 |
JP2010134651A (ja) * | 2008-12-03 | 2010-06-17 | Yahoo Japan Corp | 商品idサーバ装置、および商品idサーバ装置の制御方法 |
KR101044699B1 (ko) | 2010-12-24 | 2011-06-27 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 및 광고 서비스 시스템 |
US8595151B2 (en) | 2011-06-08 | 2013-11-26 | Hewlett-Packard Development Company, L.P. | Selecting sentiment attributes for visualization |
US9792377B2 (en) | 2011-06-08 | 2017-10-17 | Hewlett Packard Enterprise Development Lp | Sentiment trent visualization relating to an event occuring in a particular geographic region |
US8862577B2 (en) | 2011-08-15 | 2014-10-14 | Hewlett-Packard Development Company, L.P. | Visualizing sentiment results with visual indicators representing user sentiment and level of uncertainty |
KR101498944B1 (ko) * | 2011-11-28 | 2015-03-06 | 세종대학교산학협력단 | 상품 판매 업체 관련 글 판단 방법 및 그 장치 |
JP2013190847A (ja) * | 2012-03-12 | 2013-09-26 | Internatl Business Mach Corp <Ibm> | ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。 |
JP2014002653A (ja) * | 2012-06-20 | 2014-01-09 | Ntt Docomo Inc | 共起語を特定する装置およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007018285A (ja) | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム | |
US8538989B1 (en) | Assigning weights to parts of a document | |
KR101506380B1 (ko) | 무한 브라우즈 | |
US7966305B2 (en) | Relevance-weighted navigation in information access, search and retrieval | |
KR101171405B1 (ko) | 검색 결과에서 배치 내용 정렬의 맞춤화 | |
US8229949B2 (en) | Apparatus, method and program product for presenting next search keyword | |
CA2833359C (en) | Analyzing content to determine context and serving relevant content based on the context | |
US20160117395A1 (en) | Optimized ontology based internet search systems and methods | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
US20100235343A1 (en) | Predicting Interestingness of Questions in Community Question Answering | |
US20100235311A1 (en) | Question and answer search | |
US20170154116A1 (en) | Method and system for recommending contents based on social network | |
CN102163211A (zh) | 信息处理设备、重要度计算方法和程序 | |
KR20110085995A (ko) | 검색 결과들의 제공 | |
EP2316065A1 (en) | Personalization engine for classifying unstructured documents | |
JP5494126B2 (ja) | 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム | |
US9015172B2 (en) | Method and subsystem for searching media content within a content-search service system | |
US20150160847A1 (en) | System and method for searching through a graphic user interface | |
JP2009169924A (ja) | 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体 | |
JP6018338B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
WO2021111400A1 (en) | System and method for enabling a search platform to users | |
RU2683482C2 (ru) | Метод отображения релевантной контекстно-зависимой информации | |
EP2384476A1 (en) | Personalization engine for building a user profile | |
JP2009223372A (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
Duan et al. | Mining distinguishing customer focus sets from online customer reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070323 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110412 |