JP2005063242A - 情報解析システム及び方法 - Google Patents
情報解析システム及び方法 Download PDFInfo
- Publication number
- JP2005063242A JP2005063242A JP2003293939A JP2003293939A JP2005063242A JP 2005063242 A JP2005063242 A JP 2005063242A JP 2003293939 A JP2003293939 A JP 2003293939A JP 2003293939 A JP2003293939 A JP 2003293939A JP 2005063242 A JP2005063242 A JP 2005063242A
- Authority
- JP
- Japan
- Prior art keywords
- information
- analysis
- report
- text
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 177
- 230000014509 gene expression Effects 0.000 claims abstract description 19
- 238000003860 storage Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 利用者が簡単に所望する風評の解析結果を得ることができる情報解析システム及び方法を提供する。
【解決手段】 利用者コンピュータ105は、キーワードを含むレポート出力要求を解析サーバ10へ送信する(ステップS222a)。解析サーバ103は、ネガティブ表現の単語を取得し(ステップS222b〜S222c)、キーワードに相当する格納した単語と、取得したネガティブ表現の単語とが同時に出現している、1以上の文章情報をデータベース202に照会する(ステップS222d)。解析サーバ103は、データベース202にから照会結果を取得し(ステップS222e)、それを表やグラフなどの形式に整えた解析レポートを作成する。解析サーバ103は、解析レポートをコンピュータネットワークを介して利用者コンピュータ105に送信可能である(ステップS224)。
【選択図】 図2
【解決手段】 利用者コンピュータ105は、キーワードを含むレポート出力要求を解析サーバ10へ送信する(ステップS222a)。解析サーバ103は、ネガティブ表現の単語を取得し(ステップS222b〜S222c)、キーワードに相当する格納した単語と、取得したネガティブ表現の単語とが同時に出現している、1以上の文章情報をデータベース202に照会する(ステップS222d)。解析サーバ103は、データベース202にから照会結果を取得し(ステップS222e)、それを表やグラフなどの形式に整えた解析レポートを作成する。解析サーバ103は、解析レポートをコンピュータネットワークを介して利用者コンピュータ105に送信可能である(ステップS224)。
【選択図】 図2
Description
本発明は、情報解析システム及び方法に関する。より詳しくは、コンピュータネットワーク上の風評の広がりを検知する情報解析システム、そのサーバシステム、そのクライアントシステム、及び情報解析方法に関する。
従来、企業が自社や自社製品あるいはライバル社やライバル社の製品に関する、ユーザの声を把握したい場合には、
・アンケートを実施する
・マーケティング調査会社に依頼し、市場調査を実施する
・お客様相談室などに寄せられた声を収集する
などの方法が取られている。
・アンケートを実施する
・マーケティング調査会社に依頼し、市場調査を実施する
・お客様相談室などに寄せられた声を収集する
などの方法が取られている。
これに対し、インターネット上の文章を収集し、解析し、その結果をレポートとして提供する方法として、Webのクリッピングサービスとテキストマイニングを応用した分析方法があり、例えば、野村総合研究所のトゥルーテラー(登録商標)を用いたクチコミ情報分析サービスなどがある(例えば、非特許文献1参照)。
ここでは、インターネット上の特定サイト『価格.com』(http://www.kakaku.com/)の提示板からテキスト情報を収集し、形態素解析によって単語を切り出し、多変量解析や統計的手法により抽出した単語を、量的な指標およびその時系列で解析している。また、解析した結果をCD(compact disk)−ROM(read only memory)に格納し、顧客にレポートとして提供することも行っている。
トゥルーテラーV.2では分析機能として、単語出現頻度ランキング・ドリルダウン分析・主な話題の分析、特徴的な単語分析、マッピング、テキスト詳細表示、グループ属性分析、時系列モニタ、スコアリング、レポートが具備されている。
一方、一般の消費者が興味のある商品・場所・人などに関する口コミ情報を得ようとする場合には、口コミ投稿サイト(例えば上記『価格.com』や『アット・コスメ』(http://cosme.net/) など)で検索するか、Yahoo!(登録商標)やGoogle(登録商標)のような検索サイトで適当な単語を入力し検索する方法が一般的である。
図5は、従来のWeb文章解析サービスを実現するWeb文章解析システムの一例を示したシステム構成図である。図6は、図5のWeb文章解析システムに対応する信号シーケンス図である。
図5において、文章を投稿する発言者のクライアントシステムである発言者コンピュータ701と、文章が公開されているWebサイトを運営するWebサーバ702と、解析サーバ703が、インターネット等のコンピュータネットワーク704に接続されている。発言者コンピュータ701には文章を投稿することの可能なブラウザ706が具備されている。Webサーバ702は、ニュース・個人HP(ホームページ)・BBS(bulletin board system;電子掲示板システム)等のWebサイトを運営しており、文章の投稿を受け付けるBBSソフト707が具備されている。また、解析サーバ703には文章収集モジュール708、単語抽出モジュール709、単語解析モジュール710、解析レポート作成モジュール711が具備されている。
また、Web文章解析情報を得ようとする利用者の、コンピュータネットワーク704に接続されていないクライアントシステムである利用者コンピュータ705には、解析レポートを参照するための解析レポート閲覧ソフト712が具備されている。
図6において、発言者は発言者コンピュータ701のブラウザ706を用いて、Webサーバ702内のBBSソフト707に文章の投稿の発言を行う。発言情報はWebサーバ702内に蓄積される(ステップS800)。解析サーバ703は利用者コンピュータ705の利用者からのWeb文章収集依頼を、郵送等のオフラインで、又は利用者コンピュータ705の一時的なオンラインによって受け付ける(ステップS802)。
次いで解析サーバ703は、文章収集モジュール708を用いてWebサーバ702内のBBSソフト707からテキスト文章を収集する(ステップS804〜S806)。収集されたテキスト文章は文章収集モジュール708から単語抽出モジュール709に送信され、単語抽出モジュール709により形態素解析などの手法により名詞など単語単位に分割される(ステップS808)。
抽出された単語は単語抽出モジュール709から単語解析モジュール710に送信され、単語解析モジュール710において、単語の種類毎に集計され出現頻度や統計的な手法により単語間の相関値が計算される(ステップS810)。単語解析モジュール710において解析された結果は解析レポート作成モジュール711に送信され、解析レポート作成モジュール711はその結果を表やグラフなどの形式に整えた解析レポートを作成する(ステップS812)。解析レポートはCD−ROMに格納されオフラインで利用者に渡される(ステップS814)。
上記CD−ROMを受領した利用者は、利用者コンピュータ705の解析レポート閲覧ソフト712を用いて解析レポートを閲覧する(ステップS816)。この際、解析レポートには単語出現頻度ランキングやドリルダウン分析などのメニューは用意されているが、例えば利用者が風評((よくない)うわさ)の広がりを探索したい場合には、そのための解析手順は用意されていないため、利用者自身が様々な角度から試行錯誤しながら結果を解析する必要がある。
野村総合研究所、"クチコミ情報分析サービス"、[online]、[平成15年7月4日検索]、インターネット<URL:http://www.trueteller.net/kuchikomi/kdc/index.html>
上述の従来技術において、従来のアンケート調査や市場調査などでは、必ずしもユーザの本音が聞けない、アンケートを作成する時点で仮説を設定しているので、仮説に外れた新しい発見が得られない、さらには結果が得られるまでにかなりの時間を要する、などの問題点があった。
また、コンピュータネットワーク上の風評を収集するためには、Webのクリッピングサービスとテキストマイニングを応用した分析方法では、事前に分析サービスを実施している業者にキーワードを登録する必要があり、業者がそのキーワードに関する文章情報をある程度の期間収集して解析し、その結果をCD−ROM等で顧客に提供するため、顧客の知りたい時に即時に情報が得られないという問題があった。
一方、検索サイトを用いた風評の調査は入力したキーワードに一致する文章を即座に閲覧することができるが、それらがどの期間に投稿されたものなのか、投稿者は何人なのか、どのWebサイトで多く投稿されたのかといった情報を即座に可視化できない問題があった。
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、利用者が簡単に所望する風評の解析結果を得ることができる情報解析システム及び方法を提供することにある。
このような目的を達成するために、本発明の情報解析システムは、コンピュータネットワークに接続されている第1のサーバシステムが、発言者によって発言された情報を受け付け当該受け付けた情報を含むテキスト文章を前記コンピュータネットワーク上で公開している情報ソースを有する、1つ又は複数の第2のサーバシステムから、前記テキスト文章を収集及び解析してレポートを作成し、前記コンピュータネットワークに接続可能なクライアントシステムが、前記レポートに基づく情報を表示する情報解析システムであって、前記第1のサーバシステムは、予めネガティブ表現の単語が登録されている登録手段と、収集した前記テキスト文章を少なくとも、前記情報を含む本文、該本文の発言者の識別情報、該発言者によって発言された前記情報ソースの識別情報、及び該本文の発言時期に解析し、当該解析した結果から成る文章情報を記憶手段に記憶する第1の解析手段と、前記クライアントシステムからキーワードを受信し、当該受信したキーワードに相当する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得する情報取得手段と、該情報取得手段によって取得した文章情報を少なくともグラフ化することによって、前記レポートを作成するレポート作成手段とを備え、前記クライアントシステムは、前記キーワードを前記第1のサーバシステムへ送信する送信手段と、前記レポートに基づいて、期間毎の前記文章情報の数を時系列に示すグラフを表示し、当該表示されたグラフから特定の期間の選択を受け付ける期間選択手段と、前記期間選択手段によって選択された期間中の前記文章情報の数と発言者の数とを時系列に示すグラフを、前記レポートに基づいて表示し、当該表示されたグラフを構成する文章情報が含む本文の閲覧の指示を受け付ける閲覧指示手段と、前記閲覧指示手段によって前記指示を受け付けた場合に、前記期間選択手段によって選択された期間中の前記文章情報が含む本文を記載した表を、前記レポートに基づいて表示する表示手段とを備え、前記レポート作成手段は、前記情報取得手段によって取得した文章情報を、前記期間選択手段と前記閲覧指示手段とによって表示される各グラフ、及び前記表示手段によって表示される表の形式に整えた前記レポートを作成し、前記期間選択手段、前記閲覧指示手段、及び表示手段を順に逐次実行する手順を前記クライアントシステムに指示するデータ設定を、予め前記レポート内に設定しておくことを特徴とする。
以上の構成により、コンピュータネットワーク上の風評の人的広がりを検知することを可能とする。
ここで前記閲覧指示手段は、前記発言者の数に替えて前記情報ソースの数を時系列に示すグラフを表示することを特徴とすることができる。
以上の構成により、コンピュータネットワーク上の風評の情報ソースでの広がりを検知することを可能とする。
また、前記特定の期間は、前記文章情報の数が最大の期間であることを特徴とすることができる。
また、前記第1の解析手段によって得られた前記本文から単語を抽出して前記記憶手段に記憶する第2の解析手段をさらに備え、前記情報取得手段は、受信した前記キーワードに相当する単語が前記記憶手段に存在する場合、当該存在する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得することができる。
また、上記目的を達成するために、本発明の情報解析システムのサーバシステムは、上記に記載のサーバシステムが有する前記登録手段、前記第1の解析手段、前記情報取得手段、及び前記レポート作成手段を備えたことを特徴とする。
ここで、本発明の情報解析システムのサーバシステムは、上記に記載のサーバシステムが有する前記第2の解析手段をさらに備えたことを特徴とすることができる。
また、上記目的を達成するために、本発明の情報解析システムのクライアントシステムは、上記に記載のクライアントシステムが有する前記送信手段、前記期間選択手段、前記閲覧指示手段、及び前記表示手段を備えたことを特徴とする。
また、上記目的を達成するために、本発明の情報解析方法は、コンピュータネットワークに接続されている第1のサーバシステムが、発言者によって発言された情報を受け付け当該受け付けた情報を含むテキスト文章を前記コンピュータネットワーク上で公開している情報ソースを有する、1つ又は複数の第2のサーバシステムから、前記テキスト文章を収集及び解析してレポートを作成し、前記コンピュータネットワークに接続可能なクライアントシステムが、前記レポートに基づく情報を表示する情報解析システムの情報解析方法であって、前記第1のサーバシステムは、予めネガティブ表現の単語が登録されている登録手段を有しており、前記第1のサーバシステムが、収集した前記テキスト文章を少なくとも、前記情報を含む本文、該本文の発言者の識別情報、該発言者によって発言された前記情報ソースの識別情報、及び該本文の発言時期に解析し、当該解析した結果から成る文章情報を記憶手段に記憶する第1の解析ステップと、前記第1のサーバシステムが、前記クライアントシステムからキーワードを受信し、当該受信したキーワードに相当する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得する情報取得ステップと、前記第1のサーバシステムが、前記情報取得ステップにおいて取得した文章情報を少なくともグラフ化することによって、前記レポートを作成するレポート作成ステップとを備え、前記クライアントシステムが、前記キーワードを前記第1のサーバシステムへ送信する送信ステップと、前記クライアントシステムが、前記レポートに基づいて、期間毎の前記文章情報の数を時系列に示すグラフを表示し、当該表示されたグラフから特定の期間の選択を受け付ける期間選択ステップと、前記クライアントシステムが、前記期間選択ステップにおいて選択された期間中の前記文章情報の数と発言者の数とを時系列に示すグラフを、前記レポートに基づいて表示し、当該表示されたグラフを構成する文章情報が含む本文の閲覧の指示を受け付ける閲覧指示ステップと、前記クライアントシステムが、前記閲覧指示ステップにおいて前記指示を受け付けた場合に、前記期間選択ステップにおいて選択された期間中の前記文章情報が含む本文を記載した表を、前記レポートに基づいて表示する表示ステップとを備え、前記サーバシステムは、前記レポート作成ステップにおいて、前記情報取得ステップによって取得した文章情報を、前記クライアントシステムにおける、前記期間選択ステップと前記閲覧指示ステップにおいて表示される各グラフ、及び前記表示ステップにおいて表示される表の形式に整えた前記レポートを作成し、前記クライアントシステムの前記期間選択ステップ、前記閲覧指示ステップ、及び表示ステップを順に逐次実行する手順を前記クライアントシステムに指示するデータ設定を、予め前記レポート内に設定しておくことを特徴とする。
本発明の以上の構成により、インターネット等のユーザがWebサイトに投稿する文章を収集し、インターネット等のコンピュータネットワークから収集した文章の中から入力キーワード(企業名、製品名など)とシステムに登録しておいたネガティブ表現が同時に出現しているものをリアルタイムで検出し、さらに選択した期間中にそれらの文章を投稿した発言者や投稿されたサイトを取り出す。そしてこれら取り出した情報に基づき、調べたい単語に関する文章が投稿された日時、投稿した発言者数、投稿されたサイト及びその数等を表やグラフなどのレポートとして提供する仕組みを導入することにより、インターネット上の風評の広がりを検知することを可能とする。
以上説明したように本発明によれば、利用者が簡単に所望する風評の解析結果を得ることができる。
以下、図面を参照して本発明の実施形態を詳細に説明する。なお、各図面において同様の機能を有する箇所には同一の符号を付し、説明の重複は省略する。
図1は、本発明の実施形態の風評検知サービスを実現するWeb文章解析システムを示したシステム構成図である。図2は、図1のWeb文章解析システムに対応する信号シーケンス図である。
図1において、文章の投稿を発言する発言者のクライアントシステムである、1つ又は複数の発言者コンピュータ101と、風評情報などが公開されている情報ソースのWebサイトを運営するサーバシステムである、1つ又は複数のWebサーバ102と、解析用のサーバシステムである解析サーバ103が、インターネット等のコンピュータネットワーク104に接続されている。発言者コンピュータ101には文章の投稿を発言することの可能なブラウザ106が具備されている。Webサーバ102は、ニュース・個人HP・BBS等のWebサイトを運営しており、文章の投稿の発言を受け付けるBBSソフト107が具備されている。また、解析サーバ103には文章収集モジュール108、単語抽出モジュール109、解析レポート作成モジュール111が具備されている。
また、風評解析情報を得ようとする利用者のクライアントシステムである利用者コンピュータ105が、コンピュータネットワーク104に有線又は無線で接続可能であり、解析レポートを参照するための解析レポート閲覧ソフト112が具備されている。さらに、解析サーバ103には、文章解析モジュール201、収集した口コミ情報を格納するデータベース202、及び予めネガティブ表現の単語が登録されている登録辞書モジュール203が具備されている。
ここで、本実施形態において、「ネガティブ表現」とは「否定的に評価している品詞」と定義付ける。ネガティブ表現の一例としては、「パソコンAは性能が悪い」の「悪い」等が相当する。
上述の各クライアントシステム及び各サーバシステムのいずれにおいても、不図示のCPU(central processing unit)が不図示のシステムメモリにロードされているプログラムを読み取って動作する。即ち、各クライアントシステム及び各サーバシステムにおいて、各CPUは、所定のプログラム(ブラウザ106、BBSソフト107、文章収集モジュール108、単語抽出モジュール109、解析レポート作成モジュール111、文章解析モジュール201、登録辞書モジュール203、解析レポート閲覧ソフト112)の指示に従って動作する。解析サーバ103の有する上記各モジュールは、1つのソフトウェアを構成する機能モジュールを意図している。他の形態としては、各モジュール又はいくつかのモジュールの組み合わせが、それぞれ独立したソフトウェアであってもよい。
図2に示すWeb文章解析システムの処理手順は、上記各CPUが実行する処理とその連携を示し、各CPUが、システムメモリにロードされているプログラムを読み出して実行することにより行われる。図2のシーケンスにおけるデータの送受信には、TCP/IP(transmission control protocol/internet protocol )、HTTP(hypertext transfer protocol)、SMTP(simple mail transfer protocol)、FTP(file transfer protocol)等通常のプロトコルを使用すればよい。
図2において、発言者が発言者コンピュータ101のブラウザ106を用いて文章の投稿を発言すると、発言者コンピュータ101のCPUはブラウザ106からWebサーバ102内のBBSソフト107へ発言情報を送信する。発言情報はWebサーバ102のCPUによって、発言情報を含むテキスト文章としてWebサーバ102の不図示の記憶装置内に蓄積される(ステップS200)。利用者コンピュータ105のCPUは、解析レポート閲覧ソフト112によって利用者から受け付けたWeb文章収集依頼を解析サーバ103へ送信し、解析サーバ103のCPUは、Web文章収集依頼を受け付ける(ステップS202)。
次いで解析サーバ103のCPUは、文章収集モジュール108を用いてWebサーバ102内のBBSソフト107から発言情報を含むテキスト文章を収集する(ステップS204〜S206)。解析サーバ103のCPUは、収集されたテキスト文章を文章収集モジュール108から文章解析モジュール201に送信し(ステップS208)、文章解析モジュール201によって、
(1)発言情報を含む本文
(2)その本文の発言者を識別する情報(発言者名等)
(3)その本文の発言者が発言したWebサイトを識別する情報(Webサイトの種類、アドレス等)
(4)その本文の発言日時
等に解析して(1)〜(4)で構成される文章情報を1以上取得し、それら文章情報を解析結果としてデータベース202に格納する(ステップS210)。
(1)発言情報を含む本文
(2)その本文の発言者を識別する情報(発言者名等)
(3)その本文の発言者が発言したWebサイトを識別する情報(Webサイトの種類、アドレス等)
(4)その本文の発言日時
等に解析して(1)〜(4)で構成される文章情報を1以上取得し、それら文章情報を解析結果としてデータベース202に格納する(ステップS210)。
さらに解析サーバ103のCPUは、上記(1)の発言情報を含む本文を文章解析モジュール201から単語抽出モジュール109に送信し(ステップS212)、形態素解析などにより単語単位に分割して単語を抽出し、それらの単語をデータベース202に格納する(ステップS218)。
利用者コンピュータ105のCPUは、解析レポート閲覧ソフト112によって利用者から受け付けたキーワードを含むレポート出力要求を解析サーバ103へ送信し、解析サーバ103のCPUは、レポート出力要求を受け付ける(ステップS222a)。次いで解析サーバ103のCPUは、解析レポート作成モジュール111を用いて登録辞書モジュール203から、ネガティブ表現の単語を取得する(ステップS222b〜S222c)。解析サーバ103のCPUは、解析レポート作成モジュール111により、レポート出力要求に含まれるキーワードに相当するステップS218で格納した単語と、登録辞書モジュール203から取得したネガティブ表現の単語とが同時に出現している、ステップS210で格納した1以上の文章情報をデータベース202に照会する(ステップS222d)。
解析サーバ103のCPUは、キーワードがステップS218で格納した単語には存在しない、又は、キーワードに相当するステップS218で格納した単語と、登録辞書モジュール203から取得したネガティブ表現の単語とが同時に出現している文章情報が、ステップS210で格納した文章情報には存在しない場合、解析レポート作成モジュール111によってNG(照会失敗)の照会結果を取得し(ステップS222e)、処理を終了する。
照会OKの場合、解析サーバ103のCPUは、解析レポート作成モジュール111によって、データベース202にから照会結果を取得し(ステップS222e)、それを後述の図3、4の各ステップのグラフを初めとする表やグラフなどの形式に整えた解析レポートを作成する。解析サーバ103のCPUは、解析レポートをコンピュータネットワーク104を介して利用者コンピュータ105の解析レポート閲覧ソフト112に送信可能である(ステップS224)。また他の形態として、解析レポートがCD−ROMなどの媒体に格納された後オフラインで利用者コンピュータ105の元へ送付され、それを解析レポート閲覧ソフト112で読み取ってもよい。
利用者コンピュータ105のCPUは、解析レポート閲覧ソフト112を用いて解析レポートを解析レポート作成モジュール111から受信し、表示装置(不図示)上に表示して、利用者のための閲覧処理を行う。ここで、解析サーバ103のCPUは、解析レポート閲覧ソフト112が実行する風評検知の解析手順(図3、4を参照し後述)を指示するデータ設定を、解析レポート作成モジュール111によって予め解析レポート内に設定しておく。
このデータ設定は、より具体的には、後述の図3、4に示されるように、解析レポート閲覧ソフト112への利用者からの入力イベントを検知して、各ステップの描画と情報提示を行うためのデータ設定である。このデータ設定は、解析レポート閲覧ソフト112が一般的なインターネット用ブラウザの機能を有するならば、例えばマークアップ言語のHTML(hypertext markup language)やXML(eXtensible Markup Language)等で構築してもよく、或いは解析レポート閲覧ソフト112固有のフォーマットで構築してもよい。
利用者コンピュータ105の利用者は、解析レポート閲覧時に解析レポート閲覧ソフト112を用いて上記解析手順を指示するデータ設定に基づく手順(図3、4を参照し後述)を選択し、必要に応じて期間などの条件を設定して結果を絞り込み所望の結果を簡単に得ることができる。
図3と4は、本発明の実施形態において、利用者コンピュータ105の利用者が風評検知を行う場合の解析手順の一例で、特に後述のステップ1以降は予め解析レポート作成モジュール111が解析レポート内に設定している解析手順である。利用者コンピュータ105のCPUは、解析レポート閲覧ソフト112を用いて解析レポートを解析レポート作成モジュール111から受信して、利用者のための閲覧処理を行う際、この解析手順を実行する(特に後述のステップ1以降)。解析手順は、まず、解析レポート閲覧ソフト112により、利用者コンピュータ105の表示装置上に、図3に示す<ステップ0>における「結果表示画面」と「条件設定画面」とを含むウィンドウが表示され開始される。各ステップの説明を以下に示す。
<ステップ0(トップページ)>
図3に示すように、利用者は解析レポート閲覧ソフト112を用いて解析レポートを閲覧する際に、最初に「条件設定画面」にキーワード入力欄302に1以上の所望のキーワードを入力する。キーワードが入力されると、上述のステップS222a〜S222eの処理が行われ、解析サーバ103の解析レポート作成モジュール111は、入力されたキーワードと登録辞書モジュール203に登録されているネガティブな表現が同時に出現している文章情報をデータベース202に照会する。この場合、「結果表示画面」には後述のステップ1以降の結果のグラフ等は表示されず、替わりに、例えば解析レポート閲覧ソフトの起動画面、案内画面等が表示されてもよい(図中符号301)。
図3に示すように、利用者は解析レポート閲覧ソフト112を用いて解析レポートを閲覧する際に、最初に「条件設定画面」にキーワード入力欄302に1以上の所望のキーワードを入力する。キーワードが入力されると、上述のステップS222a〜S222eの処理が行われ、解析サーバ103の解析レポート作成モジュール111は、入力されたキーワードと登録辞書モジュール203に登録されているネガティブな表現が同時に出現している文章情報をデータベース202に照会する。この場合、「結果表示画面」には後述のステップ1以降の結果のグラフ等は表示されず、替わりに、例えば解析レポート閲覧ソフトの起動画面、案内画面等が表示されてもよい(図中符号301)。
以下の説明は、オンライン処理の場合の上述のステップS224以降の処理に相当している。尚、他の形態として、キーワード入力に伴い「条件設定画面」のメニューで解析レポートを格納した「CD−ROM送付」を選択することで、「結果表示画面」に後日送付の旨の案内画面が出て解析レポート閲覧ソフト112を一度終了し、後に送付されたCD−ROMを解析レポート閲覧ソフト112で読み取って、後述のステップ1以降の結果を得るようにしてもよい。
<ステップ1(入力キーワードによる文章検出結果)>
上述のステップS224による解析レポートの受信に応答して、ステップ0で入力された入力キーワード303が「結果表示画面」に表示される。さらに、受信した解析レポートの内容に基づいて、入力キーワード303と登録辞書203に登録されているネガティブな表現が同時に出現している文章の数を週単位で表す時系列なグラフ304が作成され、「結果表示画面」に表示される。例えば、グラフ304は、上述のステップS202におけるWeb文章収集依頼を受け付けた週を第1週とした場合の、現在の第10週目までのグラフである。
上述のステップS224による解析レポートの受信に応答して、ステップ0で入力された入力キーワード303が「結果表示画面」に表示される。さらに、受信した解析レポートの内容に基づいて、入力キーワード303と登録辞書203に登録されているネガティブな表現が同時に出現している文章の数を週単位で表す時系列なグラフ304が作成され、「結果表示画面」に表示される。例えば、グラフ304は、上述のステップS202におけるWeb文章収集依頼を受け付けた週を第1週とした場合の、現在の第10週目までのグラフである。
この時点で、「条件設定画面」には注目期間の選択メニューが表示されるので、利用者は「条件設定画面」で特定の注目期間(例えば、特に文章数が多い図中符号305の第7週)を選択可能である。
<ステップ2(選択注目期間中の発言者数)>
続いて図4に示すように、利用者がステップ1における「条件設定画面」で特に文章数が多い注目期間を選択すると、「結果表示画面」には、その選択された注目期間(例えば第7週)中の文章数のヒストグラムとその文章を投稿した発言者数の折れ線グラフを、その週の日単位で表す時系列なグラフ401が表示される。例えば、グラフ401は、第3週が5/29から始まる週の場合の1週間のグラフである。利用者は文章数と発言者数を同時に時系列で閲覧することで、これらネガティブな表現を含む文章が特定少数の発言者によって繰り返し投稿されているのか、それとも不特定多数の発言者によって広く投稿されているのかを把握することができる(風評の人的広がりの検知)。例えば、同一期間中、発言者数の折れ線グラフ402が比較的少数で推移し、文章数のヒストグラムが比較的多数で推移している場合、特定少数の発言者によって繰り返し投稿されている可能性が高い。
続いて図4に示すように、利用者がステップ1における「条件設定画面」で特に文章数が多い注目期間を選択すると、「結果表示画面」には、その選択された注目期間(例えば第7週)中の文章数のヒストグラムとその文章を投稿した発言者数の折れ線グラフを、その週の日単位で表す時系列なグラフ401が表示される。例えば、グラフ401は、第3週が5/29から始まる週の場合の1週間のグラフである。利用者は文章数と発言者数を同時に時系列で閲覧することで、これらネガティブな表現を含む文章が特定少数の発言者によって繰り返し投稿されているのか、それとも不特定多数の発言者によって広く投稿されているのかを把握することができる(風評の人的広がりの検知)。例えば、同一期間中、発言者数の折れ線グラフ402が比較的少数で推移し、文章数のヒストグラムが比較的多数で推移している場合、特定少数の発言者によって繰り返し投稿されている可能性が高い。
尚、解析レポート閲覧ソフト112はステップ2において、上記「発言者数」に替えて、発言者が発言したWebサイトの数(「Webサイト数」)を折れ線グラフ402として表示するようにしてもよい。これは、ステップ1〜2への遷移において、利用者がステップ1における「条件設定画面」で特に文章数が多い注目期間を選択したことに続けて、「条件設定画面」に「発言者数」又は「Webサイト数」のいずれかを選択可能な選択メニューを表示し、利用者が選択した「発言者数」又は「Webサイト数」の所望の情報を閲覧可能にすればよい。利用者は文章数とWebサイト数を同時に時系列で閲覧することで、これらネガティブな表現を含む文章が特定少数のWebサイトに繰り返し投稿されているのか、それとも不特定多数のWebサイトに広く投稿されているのかを把握することができる(風評のWebサイトでの広がりの検知)。例えば、同一期間中、Webサイト数の折れ線グラフ402が比較的少数で推移し、文章数のヒストグラムが比較的多数で推移している場合、特定少数のWebサイトに繰り返し投稿されている可能性が高い。
この時点で、「条件設定画面」には選択メニューが表示されるので、利用者は「条件設定画面」で文章閲覧メニュー403を選択可能である。
<ステップ3(選択注目期間中の文章閲覧)>
利用者が、ステップ2における「条件設定画面」で文章閲覧メニュー403を選択すると、「結果表示画面」には、選択された注目期間(例えば第3週)中の文章一覧405が表示される。ここで、「一覧」とは、「ひと目で見て内容が分かるように、簡単に表にまとめたもの」のことである。尚、この時点で、「条件設定画面」には任意の選択メニューを表示してよく、利用者は「条件設定画面」で所望のメニュー406を選択可能である。
利用者が、ステップ2における「条件設定画面」で文章閲覧メニュー403を選択すると、「結果表示画面」には、選択された注目期間(例えば第3週)中の文章一覧405が表示される。ここで、「一覧」とは、「ひと目で見て内容が分かるように、簡単に表にまとめたもの」のことである。尚、この時点で、「条件設定画面」には任意の選択メニューを表示してよく、利用者は「条件設定画面」で所望のメニュー406を選択可能である。
図4に示すように、文章一覧405は、風評を含む本文、その本文の発言者が発言したWebサイトの種類、及びその本文の発言日時を含み、その本文中において、入力キーワード404に相当する部位とネガティブ表現には、強調表示(太字、下線等)が施される。例えば、文章一覧405中の”5/29 ニュース 「株式会社○○」の株価急落”という本文は、ニュースサイトで5/29日に発言された本文で、キーワード「株式会社○○」に対してネガティブ表現「急落」との風評が流布していることが分かる。このように、利用者は元の記事文章の本文を閲覧することで、風評の広がりを確認する。
(実施形態の効果)
以上説明したように本実施形態によれば、企業ユーザが自社企業名や自社製品名がインターネット上にてどのように語られているのか、何人の発言者によって語られているのか、どのようなWebサイトで語られているのかをリアルタイムで可視化することで、インターネット上の風評の検知が可能となりうる。また、消費者ユーザが購入しようとしている商品名のインターネット上での評判をチェックすることも可能となる。
以上説明したように本実施形態によれば、企業ユーザが自社企業名や自社製品名がインターネット上にてどのように語られているのか、何人の発言者によって語られているのか、どのようなWebサイトで語られているのかをリアルタイムで可視化することで、インターネット上の風評の検知が可能となりうる。また、消費者ユーザが購入しようとしている商品名のインターネット上での評判をチェックすることも可能となる。
101 発言者コンピュータ
102 Webサーバ
103 解析サーバ
104 コンピュータネットワーク
105 利用者コンピュータ
106 ブラウザ
107 BBSソフト
108 文章収集モジュール
109 単語抽出モジュール
111 解析レポート作成モジュール
112 解析レポート閲覧ソフト
201 文章解析モジュール
202 データベース
203 登録時書モジュール
301 起動画面
302 キーワード入力欄
303、404 入力キーワード
304、401、402 グラフ
305 所望の注目期間
403 文章閲覧メニュー
405 文章一覧
406 メニュー
102 Webサーバ
103 解析サーバ
104 コンピュータネットワーク
105 利用者コンピュータ
106 ブラウザ
107 BBSソフト
108 文章収集モジュール
109 単語抽出モジュール
111 解析レポート作成モジュール
112 解析レポート閲覧ソフト
201 文章解析モジュール
202 データベース
203 登録時書モジュール
301 起動画面
302 キーワード入力欄
303、404 入力キーワード
304、401、402 グラフ
305 所望の注目期間
403 文章閲覧メニュー
405 文章一覧
406 メニュー
Claims (8)
- コンピュータネットワークに接続されている第1のサーバシステムが、発言者によって発言された情報を受け付け当該受け付けた情報を含むテキスト文章を前記コンピュータネットワーク上で公開している情報ソースを有する、1つ又は複数の第2のサーバシステムから、前記テキスト文章を収集及び解析してレポートを作成し、前記コンピュータネットワークに接続可能なクライアントシステムが、前記レポートに基づく情報を表示する情報解析システムであって、
前記第1のサーバシステムは、
予めネガティブ表現の単語が登録されている登録手段と、
収集した前記テキスト文章を少なくとも、前記情報を含む本文、該本文の発言者の識別情報、該発言者によって発言された前記情報ソースの識別情報、及び該本文の発言時期に解析し、当該解析した結果から成る文章情報を記憶手段に記憶する第1の解析手段と、
前記クライアントシステムからキーワードを受信し、当該受信したキーワードに相当する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得する情報取得手段と、
該情報取得手段によって取得した文章情報を少なくともグラフ化することによって、前記レポートを作成するレポート作成手段とを備え、
前記クライアントシステムは、
前記キーワードを前記第1のサーバシステムへ送信する送信手段と、
前記レポートに基づいて、期間毎の前記文章情報の数を時系列に示すグラフを表示し、当該表示されたグラフから特定の期間の選択を受け付ける期間選択手段と、
前記期間選択手段によって選択された期間中の前記文章情報の数と発言者の数とを時系列に示すグラフを、前記レポートに基づいて表示し、当該表示されたグラフを構成する文章情報が含む本文の閲覧の指示を受け付ける閲覧指示手段と、
前記閲覧指示手段によって前記指示を受け付けた場合に、前記期間選択手段によって選択された期間中の前記文章情報が含む本文を記載した表を、前記レポートに基づいて表示する表示手段とを備え、
前記レポート作成手段は、前記情報取得手段によって取得した文章情報を、前記期間選択手段と前記閲覧指示手段とによって表示される各グラフ、及び前記表示手段によって表示される表の形式に整えた前記レポートを作成し、前記期間選択手段、前記閲覧指示手段、及び表示手段を順に逐次実行する手順を前記クライアントシステムに指示するデータ設定を、予め前記レポート内に設定しておく
ことを特徴とする情報解析システム。 - 請求項1に記載の情報解析システムにおいて、
前記閲覧指示手段は、前記発言者の数に替えて前記情報ソースの数を時系列に示すグラフを表示する
ことを特徴とする情報解析システム。 - 請求項1又は2に記載の情報解析システムにおいて、
前記特定の期間は、前記文章情報の数が最大の期間である
ことを特徴とする情報解析システム。 - 請求項1乃至3のいずれかに記載の情報解析システムにおいて、
前記第1の解析手段によって得られた前記本文から単語を抽出して前記記憶手段に記憶する第2の解析手段をさらに備え、
前記情報取得手段は、受信した前記キーワードに相当する単語が前記記憶手段に存在する場合、当該存在する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得する
ことを特徴とする情報解析システム。 - 請求項1乃至3のいずれかに記載のサーバシステムが有する前記登録手段、前記第1の解析手段、前記情報取得手段、及び前記レポート作成手段を備えたことを特徴とする情報解析システムのサーバシステム。
- 請求項4に記載のサーバシステムが有する前記登録手段、前記第1の解析手段、前記第2の解析手段、前記情報取得手段、及び前記レポート作成手段を備えたことを特徴とする情報解析システムのサーバシステム。
- 請求項1乃至4のいずれかに記載のクライアントシステムが有する前記送信手段、前記期間選択手段、前記閲覧指示手段、及び前記表示手段を備えたことを特徴とする情報解析システムのクライアントシステム。
- コンピュータネットワークに接続されている第1のサーバシステムが、発言者によって発言された情報を受け付け当該受け付けた情報を含むテキスト文章を前記コンピュータネットワーク上で公開している情報ソースを有する、1つ又は複数の第2のサーバシステムから、前記テキスト文章を収集及び解析してレポートを作成し、前記コンピュータネットワークに接続可能なクライアントシステムが、前記レポートに基づく情報を表示する情報解析システムの情報解析方法であって、
前記第1のサーバシステムは、予めネガティブ表現の単語が登録されている登録手段を有しており、
前記第1のサーバシステムが、収集した前記テキスト文章を少なくとも、前記情報を含む本文、該本文の発言者の識別情報、該発言者によって発言された前記情報ソースの識別情報、及び該本文の発言時期に解析し、当該解析した結果から成る文章情報を記憶手段に記憶する第1の解析ステップと、
前記第1のサーバシステムが、前記クライアントシステムからキーワードを受信し、当該受信したキーワードに相当する単語と前記登録手段に登録されている単語とを含む前記文章情報を前記記憶手段から取得する情報取得ステップと、
前記第1のサーバシステムが、前記情報取得ステップにおいて取得した文章情報を少なくともグラフ化することによって、前記レポートを作成するレポート作成ステップとを備え、
前記クライアントシステムが、前記キーワードを前記第1のサーバシステムへ送信する送信ステップと、
前記クライアントシステムが、前記レポートに基づいて、期間毎の前記文章情報の数を時系列に示すグラフを表示し、当該表示されたグラフから特定の期間の選択を受け付ける期間選択ステップと、
前記クライアントシステムが、前記期間選択ステップにおいて選択された期間中の前記文章情報の数と発言者の数とを時系列に示すグラフを、前記レポートに基づいて表示し、当該表示されたグラフを構成する文章情報が含む本文の閲覧の指示を受け付ける閲覧指示ステップと、
前記クライアントシステムが、前記閲覧指示ステップにおいて前記指示を受け付けた場合に、前記期間選択ステップにおいて選択された期間中の前記文章情報が含む本文を記載した表を、前記レポートに基づいて表示する表示ステップとを備え、
前記サーバシステムは、前記レポート作成ステップにおいて、前記情報取得ステップによって取得した文章情報を、前記クライアントシステムにおける、前記期間選択ステップと前記閲覧指示ステップにおいて表示される各グラフ、及び前記表示ステップにおいて表示される表の形式に整えた前記レポートを作成し、前記クライアントシステムの前記期間選択ステップ、前記閲覧指示ステップ、及び表示ステップを順に逐次実行する手順を前記クライアントシステムに指示するデータ設定を、予め前記レポート内に設定しておく
ことを特徴とする情報解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003293939A JP2005063242A (ja) | 2003-08-15 | 2003-08-15 | 情報解析システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003293939A JP2005063242A (ja) | 2003-08-15 | 2003-08-15 | 情報解析システム及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005063242A true JP2005063242A (ja) | 2005-03-10 |
Family
ID=34370676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003293939A Pending JP2005063242A (ja) | 2003-08-15 | 2003-08-15 | 情報解析システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005063242A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165599A (ja) * | 2006-12-28 | 2008-07-17 | National Institute Of Information & Communication Technology | 風評情報抽出装置及び風評情報抽出方法 |
JP2008262301A (ja) * | 2007-04-10 | 2008-10-30 | Dainippon Printing Co Ltd | 検索キーワードの流行時期を提示する方法及び検索サーバ |
US7599926B2 (en) | 2006-02-17 | 2009-10-06 | Fujitsu Limited | Reputation information processing program, method, and apparatus |
JP2009245369A (ja) * | 2008-03-31 | 2009-10-22 | Nomura Research Institute Ltd | 取引先リスク管理装置 |
JP2011180745A (ja) * | 2010-02-26 | 2011-09-15 | Nec Corp | 評価コメント表示システム、および評価コメント表示方法 |
JP2012256283A (ja) * | 2011-06-10 | 2012-12-27 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
CN108089843A (zh) * | 2018-01-18 | 2018-05-29 | 福建省农村信用社联合社 | 一种智能化的银行企业级需求管理系统 |
JP2019083076A (ja) * | 2016-12-02 | 2019-05-30 | 本田技研工業株式会社 | 評価装置、評価方法、および評価プログラム |
US11373198B2 (en) | 2016-12-02 | 2022-06-28 | Honda Motor Co., Ltd. | Evaluation device, evaluation method, and evaluation program |
-
2003
- 2003-08-15 JP JP2003293939A patent/JP2005063242A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7599926B2 (en) | 2006-02-17 | 2009-10-06 | Fujitsu Limited | Reputation information processing program, method, and apparatus |
JP2008165599A (ja) * | 2006-12-28 | 2008-07-17 | National Institute Of Information & Communication Technology | 風評情報抽出装置及び風評情報抽出方法 |
JP2008262301A (ja) * | 2007-04-10 | 2008-10-30 | Dainippon Printing Co Ltd | 検索キーワードの流行時期を提示する方法及び検索サーバ |
JP2009245369A (ja) * | 2008-03-31 | 2009-10-22 | Nomura Research Institute Ltd | 取引先リスク管理装置 |
JP2011180745A (ja) * | 2010-02-26 | 2011-09-15 | Nec Corp | 評価コメント表示システム、および評価コメント表示方法 |
JP2012256283A (ja) * | 2011-06-10 | 2012-12-27 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
JP2019083076A (ja) * | 2016-12-02 | 2019-05-30 | 本田技研工業株式会社 | 評価装置、評価方法、および評価プログラム |
US11373198B2 (en) | 2016-12-02 | 2022-06-28 | Honda Motor Co., Ltd. | Evaluation device, evaluation method, and evaluation program |
CN108089843A (zh) * | 2018-01-18 | 2018-05-29 | 福建省农村信用社联合社 | 一种智能化的银行企业级需求管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5160601B2 (ja) | 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置 | |
US7370032B2 (en) | Data gathering | |
KR101695011B1 (ko) | 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법 | |
KR102075788B1 (ko) | 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템 | |
US20130263019A1 (en) | Analyzing social media | |
JP4787902B2 (ja) | オンライン電子メールサービスシステム及びその方法 | |
US20130198195A1 (en) | System and method for identifying one or more resumes based on a search query using weighted formal concept analysis | |
CN110298029B (zh) | 基于用户语料的好友推荐方法、装置、设备及介质 | |
US9015168B2 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
JP5013065B2 (ja) | 風説監視システム、風説監視方法及びプログラム | |
CN113505264A (zh) | 用于推荐视频的方法及系统 | |
JP5045194B2 (ja) | 検索キーワードの流行時期を提示する方法及び検索サーバ | |
US20130282361A1 (en) | Obtaining data from electronic documents | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
JP2004145541A (ja) | チャットシステム | |
JP5427127B2 (ja) | 検索支援システム、検索支援方法及び検索支援プログラム | |
JP2005063242A (ja) | 情報解析システム及び方法 | |
JP6653169B2 (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
JP2005032197A (ja) | 情報解析システム及び方法 | |
JP5890385B2 (ja) | データ処理装置、及びデータ処理方法 | |
JP5535022B2 (ja) | 広告文作成支援システム | |
Wang et al. | Enriching descriptions for public web services using information captured from related web pages on the internet | |
JP2013109513A (ja) | 情報表示制御装置、情報表示制御方法、及びプログラム | |
JP5265597B2 (ja) | 文書品質評価システムおよび文書品質評価プログラム | |
Hassanzadeh et al. | T2r: System for converting textual documents into rdf triples |