JP2004185572A - 口コミ情報解析方法及び装置 - Google Patents
口コミ情報解析方法及び装置 Download PDFInfo
- Publication number
- JP2004185572A JP2004185572A JP2002355285A JP2002355285A JP2004185572A JP 2004185572 A JP2004185572 A JP 2004185572A JP 2002355285 A JP2002355285 A JP 2002355285A JP 2002355285 A JP2002355285 A JP 2002355285A JP 2004185572 A JP2004185572 A JP 2004185572A
- Authority
- JP
- Japan
- Prior art keywords
- information
- word
- mouth
- analysis
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】投稿者名などのユーザ情報に配慮した口コミ情報の解析を行える口コミ情報解析方法及び装置の提供。
【解決手段】収集した文章S3を分割した各記事S2につきユーザ情報、時間情報、文章情報に区別して抽出する口コミ情報抽出モジュール54と、当該抽出された文章情報につき、単語単位に分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を文章解析情報S5として返す文章情報解析モジュール52と、当該抽出された各記事S2のユーザ情報及び時間情報並びに文章情報解析モジュール52による文章解析情報から口コミ基礎情報S6の作成をも行う口コミ情報抽出モジュール54と、口コミ基礎情報S6を受けて、統計処理の結果たる統計情報S7を含んだ口コミ解析情報S8を作成する統計解析モジュール53と、口コミ解析情報S8を用いて、口コミ情報の解析を行う口コミ解析モジュール55とを具備する、という特徴的構成手段の採用。
【選択図】図3
【解決手段】収集した文章S3を分割した各記事S2につきユーザ情報、時間情報、文章情報に区別して抽出する口コミ情報抽出モジュール54と、当該抽出された文章情報につき、単語単位に分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を文章解析情報S5として返す文章情報解析モジュール52と、当該抽出された各記事S2のユーザ情報及び時間情報並びに文章情報解析モジュール52による文章解析情報から口コミ基礎情報S6の作成をも行う口コミ情報抽出モジュール54と、口コミ基礎情報S6を受けて、統計処理の結果たる統計情報S7を含んだ口コミ解析情報S8を作成する統計解析モジュール53と、口コミ解析情報S8を用いて、口コミ情報の解析を行う口コミ解析モジュール55とを具備する、という特徴的構成手段の採用。
【選択図】図3
Description
【0001】
【発明の属する技術分野】
本発明は、自然言語処理を用いた口コミ情報解析方法及び装置に関し、特に、ネットワーク上で流通している口コミ情報から文章情報、時間情報、ユーザ情報を抽出し、当該抽出した各情報を用いて口コミ情報の解析を行う口コミ情報解析方法及びその方法の発明の実施に直接使用する口コミ情報解析装置に関するものである。
【0002】
【従来の技術】
従来、インターネット上に存在するテキスト情報に対する情報解析システムとして、インターネット上から収集した情報に対してテキストマイニングを行い、特定の商品名の出現回数などを求めて統計解析を行うシステムがある。
【0003】
例えば、野村総合研究所の「TRUE TELLER」では、収集したテキスト情報に対して形態素解析を行うことにより含まれる単語を抽出し、更に情報取得日を時間情報として加えて統計解析を行うことにより、単語の量的な特徴、時系列による単語の量的な変化の分析を行っている(非特許文献1)。
【0004】
図8は、従来の、テキスト情報に対する統計解析システムの構成図、図9は、その処理シーケンス図である。
従来の、テキスト情報に対する統計解析システムは、口コミ情報を投稿・参照する利用者端末1と、口コミ情報の登録・蓄積・公開を行うWebサーバ2と、口コミ情報の収集・解析を行う解析サーバ3とを、ネットワーク4により接続された構成であり、各構成要素は次の処理を行う。
【0005】
利用者端末1は、具備しているブラウザ機能11を用いることにより、Webサーバ2に対して記事投稿を行い(ST1)、その結果としての投稿結果を受ける(ST2)処理により、口コミ情報を投稿文章としてWebサーバ2に対して投稿を行う共に、口コミ情報をWebサーバ2に蓄積されている記事として参照を行う。
【0006】
Webサーバ2は、具備しているBBSサーバ機能21を用いることにより、投稿された口コミ情報それ自体である投稿文章を、投稿者名、投稿日時などと共に記事として登録し、当該登録された記事を一定期間蓄積すると共に、口コミ情報の参照要求に対して蓄積されている該当の記事の提供などの応答を行う。
【0007】
解析サーバ3は、次の第一乃至第三の処理をその順に行う。
第一の処理として、具備している文章収集モジュール31により、記事取得要求をWebサーバ2に対して行い(ST3)、その返答としての記事を受ける(ST4)ことにより、Webサーバ2から公開されている一以上の記事を文章として収集する。
【0008】
第二の処理として、文章収集モジュール31から文章情報解析モジュール32に対して文章解析要求を行う(ST5)ことにより、その文章情報解析モジュール32でもって、その収集された文章を、テキスト情報として形態素解析などの手法により単語単位毎に分割し、各単語の品詞の判定を行い、各単語について文章情報解析モジュール32内の辞書を用いて商品名、評価表現、ポジティブ/ネガティブの判定を行って、単語、品詞、対応商品名、対応評価表現、ポジティブ/ネガティブ結果の組から構成される順序列に変換する。
【0009】
第三の処理として、文章情報解析モジュール32が統計解析モジュール33に対して統計解析要求を行う(ST6)ことにより、解析統計モジュール33で以って、その順序列を統計的な手法により単語の出現頻度などの統計情報を作成する。
【0010】
かように、従来のテキスト情報に対する統計解析システムにおいては、解析した単語の量的な特徴、変化に基いて、テキスト情報中に含まれる多くの単語から重要な単語の抽出、特定単語に関する重要な時間情報を抽出することにより、テキスト情報と時間情報に基いた解析が可能である。
【0011】
【非特許文献1】
「TRUE TELLER(トゥルーテラー)Ver.2.0」、野村総合研究所、[online]、2002年2月18日掲載、[2002年9月30日検索]、インターネット<URL:http://www.nri.co.jp/news/2002/020218>
【0012】
【発明が解決しようとする課題】
しかしながら、従来の、テキスト情報に対する統計解析システムにおいては、インターネット一般について広く解析を行うことを目的に、インターネットをテキスト情報と時間情報と捉えている為に、投稿者と投稿日時と投稿文書とを含む口コミを対象とした解析についても、文章中に存在する投稿者名などの情報を区別することなく、テキスト情報の一部として解析している故に、投稿者に関して解析を行うことができない、という問題があった。
【0013】
ここにおいて、本発明の解決すべき主要な目的は以下の通りである。
【0014】
本発明の第1の目的は、口コミ情報中に存する投稿者名などの情報を区別して口コミ情報の解析を行える口コミ情報解析方法及び装置を提供することにある。
【0015】
本発明の第2の目的は、投稿者に関する情報、投稿日時に関する情報及び投稿された文章に関する情報をそれぞれ口コミ情報を元に区別して口コミ情報の解析を行える口コミ情報解析方法及び装置を提供することにある。
【0016】
本発明の第3の目的は、口コミ情報につき多様な解析を行える口コミ情報解析方法及び装置を提供することにある。
【0017】
本発明の他の目的は、明細書、図面、特に特許請求の範囲における各請求項の記載から自ずと明らかとなろう。
【0018】
【課題を解決するための手段】
本発明方法は、上記課題の解決に当たり、口コミ情報から、投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出し、当該抽出されたユーザ情報、時間情報、文章情報を任意に組合せて分析し統計処理を行うことにより、口コミ情報の解析を行う、という特徴的構成手法を講じる。
【0019】
本発明装置は、上記課題の解決に当たり、Webサーバにより公開されている文章を収集する文章収集モジュールと、当該収集された文章を記事毎に分割し且つ当該分割した各記事につき投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出する口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールにより抽出された文章情報につき、単語単位へ分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を文章解析情報として、当該口コミ情報抽出モジュールに返す文章情報解析モジュールと、当該口コミ情報抽出モジュールにより抽出された各記事のユーザ情報及び時間情報並びに当該文章情報解析モジュールによる文章解析情報から口コミ基礎情報を作成する前出の口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールからの当該作成された口コミ基礎情報を受けて、統計処理を行った結果たる統計情報を含んだ口コミ解析情報を作成する統計解析モジュールと、当該統計解析モジュールにより当該作成された口コミ解析情報を用いて、口コミ情報の解析を行う口コミ解析モジュールとを具備する、という特徴的構成手段を講じる。
【0020】
更に、具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する新規な特徴的構成手法又は手段を採用することにより、上記目的を達成するようになされる。
【0021】
本発明方法の第1の特徴は、一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する口コミ情報解析装置を用いた解析方法であって、前記公開されている口コミ情報から、投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出し、当該抽出されたユーザ情報、時間情報、文章情報を任意に組合せて分析し統計処理を行うことにより、前記口コミ情報の解析を行ってなる、口コミ情報解析方法の構成採用にある。
【0022】
本発明方法の第2の特徴は、上記本発明方法の第1の特徴における前記解析方法が、前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記抽出したユーザ情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0023】
本発明方法の第3の特徴は、上記本発明方法の第1の特徴における前記解析方法が、前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記口コミ情報の内、前記投稿文章その他の文章情報を構成する単語に関する流行を、前記抽出した時間情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0024】
本発明方法の第4の特徴は、上記本発明方法の第3の特徴における前記解析方法が、前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記抽出した時間情報及び前記ユーザ情報並びに前記抽出した文章情報を分析した結果たる文章解析情報を再度組合せて統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0025】
本発明方法の第5の特徴は、上記本発明方法の第2、第3又は第4の特徴における前記文章解析情報が、単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組である、口コミ情報解析方法の構成採用にある。
【0026】
本発明方法の第6の特徴は、上記本発明方法の第1、第2、第3、第4又は第5の特徴における前記解析方法が、前記抽出したユーザ情報につき、投稿者名、各投稿者の投稿数、各単語の投稿者数の何れか一以上求めて、実施してなる、口コミ情報解析方法の構成採用にある。
【0027】
本発明方法の第7の特徴は、上記本発明方法の第1、第2、第3、第4、第5又は第6の特徴における前記解析方法が、前記抽出した時間情報につき、投稿日時、指定された日時からの経過日時、指定された単位に基き算出した特定単位の日時の何れか一以上求めて、実施してなる、口コミ情報解析方法の構成採用にある。
【0028】
本発明装置の第1の特徴は、一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する装置であって、前記Webサーバにより公開されている文章を収集する文章収集モジュールと、当該収集された文章を記事毎に分割し且つ当該分割した各記事につき投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出するとともに、抽出された当該各記事のユーザ情報及び時間情報並びに次なる文章情報解析モジュールより受けた文章解析情報から口コミ基礎情報を作成する口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールにより抽出された文章情報につき、単語単位へ分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を前記文章解析情報として、当該口コミ情報抽出モジュールに返す前記文章情報解析モジュールと、当該口コミ情報抽出モジュールからの前記作成された口コミ基礎情報を受けて、統計処理を行った結果たる統計情報を含んだ口コミ解析情報を作成する統計解析モジュールと、当該統計解析モジュールにより当該作成された口コミ解析情報を用いて、前記口コミ情報の解析を行う口コミ解析モジュールと、を具備してなる、口コミ情報解析装置の構成採用にある。
【0029】
本発明装置の第2の特徴は、上記本発明装置の第1の特徴における前記口コミ解析モジュールが、前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出したユーザ情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0030】
本発明装置の第3の特徴は、上記本発明装置の第1の特徴における前記口コミ解析モジュールが、前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記投稿文章その他の文章情報を構成する単語に関する流行を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出した時間情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0031】
本発明装置の第4の特徴は、上記本発明装置の第3の特徴における前記口コミ解析モジュールが、前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記口コミ情報抽出モジュールにより抽出した時間情報及びユーザ情報並びに前記文章情報解析モジュールによる文章解析情報を再度組合せて求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0032】
本発明装置の第5の特徴は、上記本発明装置の第1、第2、第3又は第4の特徴における前記分割した各単語につき各種の認定・判定が、当該各単語についての、品詞の特定、商品名、評価表現、ポジティブ/ネガティブの判定である、口コミ情報解析装置の構成採用にある。
【0033】
本発明装置の第6の特徴は、上記本発明装置の第1、第2、第3、第4又は第5の特徴における前記文章解析情報が、単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組合せからなる、口コミ情報解析装置の構成採用にある。
【0034】
かように、本発明においては、ユーザ情報と時間情報と文章情報とをそれぞれ識別可能なテキスト情報を蓄積しているネットワーク(インターネットなど)上に存する掲示板、チャット、これに類するユーザ間の口コミ媒体となるサービスをテキスト情報の収集対象とする。
【0035】
それ故、口コミ情報の解析元のデータ構造を、文章中に存在する、口コミ情報の投稿者に関する情報を含むユーザ情報と、口コミ情報の投稿日時の情報を含む時間情報と、口コミ情報の投稿文章を含む文章情報とから構成されるデータ構造とすることにより、ユーザ情報と時間情報と文章情報とをそれぞれ異なる情報項目として区別して解析可能となり、これにより、投稿者を考慮してかかるサービスに存する口コミ情報を解析可能となる。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態を装置例及び方法例につき図面に基いて説明する。
【0037】
(装置例)
図1は、本発明の一実施形態である口コミ情報解析装置を一要素としたシステムの機能構築図である。
【0038】
図1のシステムは、利用者から配信される情報(特に主観的な情報。例えば、実世界における意見、感想、評判、うわさが該当。客観的な情報でも可。以下「口コミ情報それ自体」とする。)を投稿し、その投稿された情報を参照する利用者端末1と、口コミ情報(口コミ情報それ自体に、利用者に関する情報(例えば、利用者の氏名又は名称、住所又は居所、利用者のアドレスなどの連絡先)、時間に関する情報(例えば、投稿した日時)という口コミ情報それ自体に付随する情報を併せて、「口コミ情報」とする。)の登録・蓄積・公開を行うWebサーバ2と、図8の解析サーバ3とは異なり、文章収集モジュール51、文章情報解析モジュール52及び統計解析モジュール53の他に口コミ情報抽出モジュール54及び口コミ解析モジュール55を具備して、口コミ情報の収集・解析を行う口コミ情報解析装置(サーバの類)5とを、インターネットなどのネットワーク4により接続し、後述の方法例にて説明する処理を順次行うシステム構成である。
【0039】
(方法例)
本発明の一実施形態である口コミ情報解析方法を図1のシステムに適用して説明する。
【0040】
図2は、図1のシステムのシーケンス図、図3は、図1のシステムの構成要素又は内部構成要素間における情報のフローをシステム構成と共に示した図、図4は、図3の文章、記事の両者の関係についての一例を説明した図、図5は、図3の文章解析情報の一例を示した図、図6は、図3の口コミ基礎情報の一例を示した図、図7は、図1の口コミ解析モジュールにて使用する口コミ解析情報の項目の一例を示した図である。
【0041】
利用者端末1は、ブラウザ機能11を利用して口コミ情報それ自体を投稿文章S1として、Webサーバ2に対して投稿し(ST1)、それを受けたWebサーバ2によりそれに対応した処理が行われて、その結果たる投稿結果が返される(ST2)。
【0042】
以上のように、一以上の利用者端末1からWebサーバ2に対して一以上の記事投稿がなされ、Webサーバ2が、BBSサーバ機能21により、投稿された口コミ情報それ自体である投稿文章S1を、投稿者名、投稿日時などと共に記事S2として登録し、その記事S2を一定期間蓄積する。
【0043】
それと共に、口コミ情報の参照要求に対して蓄積されている該当の記事S2の提供などの応答を行うという状況下において、口コミ情報解析装置5に対して、口コミ情報の解析を行う命令を外部から又は内部から受けると、口コミ情報解析装置5は、次の第1乃至第6の処理を順に行う。
【0044】
第1の処理として、文章収集モジュール51により、Webサーバ2に対して記事取得要求を行い(ST3)、それに対応してWebサーバ2から返答された、一以上の記事S2を文章S3として受けて(ST4)収集した後に、口コミ情報抽出モジュール54に対して記事解析要求を行う(ST7)。
【0045】
ここで、文章S3とは、一以上の記事S2から構成されたもの、記事S2とは、口コミ情報それ自体に該当する投稿文章S1、並びに口コミ情報として付随する、ユーザ情報に該当する投稿者名及び時間情報に該当する投稿日時から構成されたものである(図4参照)。
【0046】
第2の処理として、記事解析要求を受けた口コミ情報抽出モジュール54により、▲1▼文章S3を記事S2毎に再分割し、▲2▼各記事S2から投稿日時(図4の投稿日の欄にある、例えば「200X/Y/ZZ hh:mm」)、投稿者名(図4の名前の欄にある、例えば「ユーザ1」)、投稿文章(図4の各記事S2の2行目にある、例えば「○○○○○○○○○○○○○○○○○○○○」)を特定する。
【0047】
そして、それぞれ、記事S2における、時間情報、ユーザ情報、文章情報として抽出した後に、▲3▼記事S2における文章情報たる投稿文章を分析する為に、文字情報解析モジュール52に対して文章解析要求を行う(ST8)。
【0048】
第3の処理として、文章解析要求を受けた文章情報解析モジュール52により、口コミ情報抽出モジュール54にて抽出された投稿文章S4を、形態素解析などの手法を適用して、▲1▼単語単位に分割し、▲2▼各単語の品詞を判定し、▲3▼各単語について文章情報解析モジュール52内の辞書(評価用語・商品名辞書など)を用いて、商品名、評価表現、ポジティブ/ネガティブなどの判定を行う。
【0049】
▲4▼単語、品詞、対応商品名、対応評価表現、ポジティブ/ネガティブ結果などの組から構成される順序列である文章解析情報S5(図5参照)に変換し、▲5▼文章解析結果として返答を行う(ST9)。
【0050】
第4の処理として、かかる返答を受けた口コミ情報解析モジュール54は、▲1▼第2の処理として既に抽出している投稿者名及び投稿日時並びに第3の処理による文章解析情報S5から口コミ基礎情報S6(図6参照)を作成した後に(尚、作成には、投稿者名、投稿日時に限定されず、口コミ基礎情報S6に係る、ユーザ情報、時間情報でも可。)、▲2▼統計解析モジュール53に対して統計解析要求を行って統計解析モジュール53を呼出す(ST10)。
【0051】
第5の処理として、かかる統計解析要求を受けた統計解析モジュール53は、▲1▼口コミ基礎情報S6(図6参照)から、統計的な手法にて単語、ユーザの出現頻度などを求めて作成された統計情報S7(図7に列挙した、例えば記事数、単語数、ポジティブ/ネガティブ発言数、投稿ユーザ数、投稿回数などの何れかの項目の情報で、項目としては全てが存在するものではない。)を含んだ口コミ解析情報S8を作成した後に、▲2▼口コミ解析モジュール55に対して口コミ解析要求を行って口コミ情報解析モジュール55を呼出す(ST11)。
【0052】
なお、口コミ解析情報S8に係るユーザ情報については、各投稿者について全ユーザ情報における出現回数の算出により、ユーザ毎の記事S2の投稿回数を算出し、文章情報中に含まれる各単語につき該当する単語を含む文章の投稿者数を重複なく数える(例えば、図4の第1枠目の記事S2と第3枠目の記事S2とに係る名前は共に「ユーザ1」であるので、このような重複をダブルカウントすることなく、数える)ことにより、単語毎に投稿ユーザ数を算出する。
【0053】
口コミ解析情報S8に係る時間情報については、各投稿日時に対して予め指定されたイベント開催などの日時から経過時間を算出し、各投稿日時に対し、予め指定された単位(時、日、週、曜日、月、年。例えば2002年11月を第1期とし、同年12月を第2期などとした単位)に基き特定単位における日時(先の例では、第5期)を算出する。
【0054】
第6の処理として、口コミ解析要求(S11)を受けた口コミ解析モジュール55は、記事S2中の投稿文章S4における特定の単語(例えば、後述する「商品情報」(商品名、サービス名、商品、サービスを提供する企業名なども可。))につき、ユーザ情報(投稿者名、投稿者数(投稿ユーザ数)、投稿回数など)、時間情報(投稿日時、特定期間など)に配慮して、口コミ情報の解析として、例えば、次の様な解析を行う。
【0055】
解析例1として、商品情報と、投稿者の総数と、当該商品情報について投稿をした者の数(投稿者数)とを組合せ、各商品に関する投稿者数を投稿者の総数で割った値を、各商品に関する認知度として、口コミ情報の解析を行う。
【0056】
解析例2として、商品情報と投稿日時とを組合せ、当該商品情報の単語を含む記事S2について特定期間に投稿された記事数が全期間に投稿された全記事数と比べて相対的に多い期間を抽出することにより、各商品に関する話題の盛上りを抽出する。
【0057】
解析例3として、商品情報と投稿日時とを組合せ、特定期間について各商品情報の単語を含む記事S2の件数を其々比較し、特定期間に記事数が最も多い商品を抽出することより、商品に関する流行を抽出する。
【0058】
解析例4として、前述の解析例2の要領により抽出した話題の盛上りにつき、その盛上りの時期と投稿ユーザ数とを組合せ、各盛上りを構成する記事の投稿ユーザ数と投稿記事数の割合の変化を解析することにより、各話題の浸透度を解析する。
【0059】
解析例5として、前述の解析例2の要領により抽出した話題の盛上りにつき、その盛上り初期の時期に投稿を行った投稿者を対象として、過去の投稿された記事S2と話題の類似性を解析することにより、盛上りの発端(キー)となった重要発言者を抽出する。
【0060】
以上、本発明の形態である装置例及び方法例を説明したが、本発明の目的を達し、下記する効果を奏する範囲において、適宜変更して実施可能である。
【0061】
【発明の効果】
本発明によれば、テキスト情報の解析に関し、口コミ情報から文章情報、時間情報及びユーザ情報を抽出し、その抽出した、文章情報、時間情報及びユーザ情報を元にして口コミ情報の解析を行うことにより、ユーザ情報に配慮した口コミ情報を解析することができるなどの優れた効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施形態である口コミ情報解析装置を一要素としたシステム構築図である。
【図2】図1のシステムのシーケンス図である。
【図3】図1のシステムの構成要素又は内部構成要素間における情報のフローをシステム構成と共に示した図である。
【図4】図3の文章、記事の両者の関係についての一例を説明した図である。
【図5】図3の文章解析情報の一例を示した図である。
【図6】図3の口コミ基礎情報の一例を示した図である。
【図7】図1の口コミ解析モジュールにて使用する口コミ解析情報の項目の一例を示した図である。
【図8】従来のテキスト情報に対する統計解析システムの構成図である。
【図9】図8の処理シーケンス図である。
【符号の説明】
1…利用者端末
11…ブラウザ機能
2…Webサーバ
21…BBSサーバ機能
3…解析サーバ
31…文章収集モジュール
32…文章情報解析モジュール
33…統計解析モジュール
4…ネットワーク
5…口コミ情報解析装置
51…文章収集モジュール
52…文章情報解析モジュール
53…統計解析モジュール
54…口コミ情報抽出モジュール
55…口コミ解析モジュール
S1…投稿文章
S2…記事
S3…文章
S4…投稿文章
S5…文章解析情報
S6…口コミ基礎情報
S7…統計情報
S8…口コミ解析情報
【発明の属する技術分野】
本発明は、自然言語処理を用いた口コミ情報解析方法及び装置に関し、特に、ネットワーク上で流通している口コミ情報から文章情報、時間情報、ユーザ情報を抽出し、当該抽出した各情報を用いて口コミ情報の解析を行う口コミ情報解析方法及びその方法の発明の実施に直接使用する口コミ情報解析装置に関するものである。
【0002】
【従来の技術】
従来、インターネット上に存在するテキスト情報に対する情報解析システムとして、インターネット上から収集した情報に対してテキストマイニングを行い、特定の商品名の出現回数などを求めて統計解析を行うシステムがある。
【0003】
例えば、野村総合研究所の「TRUE TELLER」では、収集したテキスト情報に対して形態素解析を行うことにより含まれる単語を抽出し、更に情報取得日を時間情報として加えて統計解析を行うことにより、単語の量的な特徴、時系列による単語の量的な変化の分析を行っている(非特許文献1)。
【0004】
図8は、従来の、テキスト情報に対する統計解析システムの構成図、図9は、その処理シーケンス図である。
従来の、テキスト情報に対する統計解析システムは、口コミ情報を投稿・参照する利用者端末1と、口コミ情報の登録・蓄積・公開を行うWebサーバ2と、口コミ情報の収集・解析を行う解析サーバ3とを、ネットワーク4により接続された構成であり、各構成要素は次の処理を行う。
【0005】
利用者端末1は、具備しているブラウザ機能11を用いることにより、Webサーバ2に対して記事投稿を行い(ST1)、その結果としての投稿結果を受ける(ST2)処理により、口コミ情報を投稿文章としてWebサーバ2に対して投稿を行う共に、口コミ情報をWebサーバ2に蓄積されている記事として参照を行う。
【0006】
Webサーバ2は、具備しているBBSサーバ機能21を用いることにより、投稿された口コミ情報それ自体である投稿文章を、投稿者名、投稿日時などと共に記事として登録し、当該登録された記事を一定期間蓄積すると共に、口コミ情報の参照要求に対して蓄積されている該当の記事の提供などの応答を行う。
【0007】
解析サーバ3は、次の第一乃至第三の処理をその順に行う。
第一の処理として、具備している文章収集モジュール31により、記事取得要求をWebサーバ2に対して行い(ST3)、その返答としての記事を受ける(ST4)ことにより、Webサーバ2から公開されている一以上の記事を文章として収集する。
【0008】
第二の処理として、文章収集モジュール31から文章情報解析モジュール32に対して文章解析要求を行う(ST5)ことにより、その文章情報解析モジュール32でもって、その収集された文章を、テキスト情報として形態素解析などの手法により単語単位毎に分割し、各単語の品詞の判定を行い、各単語について文章情報解析モジュール32内の辞書を用いて商品名、評価表現、ポジティブ/ネガティブの判定を行って、単語、品詞、対応商品名、対応評価表現、ポジティブ/ネガティブ結果の組から構成される順序列に変換する。
【0009】
第三の処理として、文章情報解析モジュール32が統計解析モジュール33に対して統計解析要求を行う(ST6)ことにより、解析統計モジュール33で以って、その順序列を統計的な手法により単語の出現頻度などの統計情報を作成する。
【0010】
かように、従来のテキスト情報に対する統計解析システムにおいては、解析した単語の量的な特徴、変化に基いて、テキスト情報中に含まれる多くの単語から重要な単語の抽出、特定単語に関する重要な時間情報を抽出することにより、テキスト情報と時間情報に基いた解析が可能である。
【0011】
【非特許文献1】
「TRUE TELLER(トゥルーテラー)Ver.2.0」、野村総合研究所、[online]、2002年2月18日掲載、[2002年9月30日検索]、インターネット<URL:http://www.nri.co.jp/news/2002/020218>
【0012】
【発明が解決しようとする課題】
しかしながら、従来の、テキスト情報に対する統計解析システムにおいては、インターネット一般について広く解析を行うことを目的に、インターネットをテキスト情報と時間情報と捉えている為に、投稿者と投稿日時と投稿文書とを含む口コミを対象とした解析についても、文章中に存在する投稿者名などの情報を区別することなく、テキスト情報の一部として解析している故に、投稿者に関して解析を行うことができない、という問題があった。
【0013】
ここにおいて、本発明の解決すべき主要な目的は以下の通りである。
【0014】
本発明の第1の目的は、口コミ情報中に存する投稿者名などの情報を区別して口コミ情報の解析を行える口コミ情報解析方法及び装置を提供することにある。
【0015】
本発明の第2の目的は、投稿者に関する情報、投稿日時に関する情報及び投稿された文章に関する情報をそれぞれ口コミ情報を元に区別して口コミ情報の解析を行える口コミ情報解析方法及び装置を提供することにある。
【0016】
本発明の第3の目的は、口コミ情報につき多様な解析を行える口コミ情報解析方法及び装置を提供することにある。
【0017】
本発明の他の目的は、明細書、図面、特に特許請求の範囲における各請求項の記載から自ずと明らかとなろう。
【0018】
【課題を解決するための手段】
本発明方法は、上記課題の解決に当たり、口コミ情報から、投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出し、当該抽出されたユーザ情報、時間情報、文章情報を任意に組合せて分析し統計処理を行うことにより、口コミ情報の解析を行う、という特徴的構成手法を講じる。
【0019】
本発明装置は、上記課題の解決に当たり、Webサーバにより公開されている文章を収集する文章収集モジュールと、当該収集された文章を記事毎に分割し且つ当該分割した各記事につき投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出する口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールにより抽出された文章情報につき、単語単位へ分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を文章解析情報として、当該口コミ情報抽出モジュールに返す文章情報解析モジュールと、当該口コミ情報抽出モジュールにより抽出された各記事のユーザ情報及び時間情報並びに当該文章情報解析モジュールによる文章解析情報から口コミ基礎情報を作成する前出の口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールからの当該作成された口コミ基礎情報を受けて、統計処理を行った結果たる統計情報を含んだ口コミ解析情報を作成する統計解析モジュールと、当該統計解析モジュールにより当該作成された口コミ解析情報を用いて、口コミ情報の解析を行う口コミ解析モジュールとを具備する、という特徴的構成手段を講じる。
【0020】
更に、具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する新規な特徴的構成手法又は手段を採用することにより、上記目的を達成するようになされる。
【0021】
本発明方法の第1の特徴は、一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する口コミ情報解析装置を用いた解析方法であって、前記公開されている口コミ情報から、投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出し、当該抽出されたユーザ情報、時間情報、文章情報を任意に組合せて分析し統計処理を行うことにより、前記口コミ情報の解析を行ってなる、口コミ情報解析方法の構成採用にある。
【0022】
本発明方法の第2の特徴は、上記本発明方法の第1の特徴における前記解析方法が、前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記抽出したユーザ情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0023】
本発明方法の第3の特徴は、上記本発明方法の第1の特徴における前記解析方法が、前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記口コミ情報の内、前記投稿文章その他の文章情報を構成する単語に関する流行を、前記抽出した時間情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0024】
本発明方法の第4の特徴は、上記本発明方法の第3の特徴における前記解析方法が、前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記抽出した時間情報及び前記ユーザ情報並びに前記抽出した文章情報を分析した結果たる文章解析情報を再度組合せて統計処理を行って求めることにより、実施してなる、口コミ情報解析方法の構成採用にある。
【0025】
本発明方法の第5の特徴は、上記本発明方法の第2、第3又は第4の特徴における前記文章解析情報が、単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組である、口コミ情報解析方法の構成採用にある。
【0026】
本発明方法の第6の特徴は、上記本発明方法の第1、第2、第3、第4又は第5の特徴における前記解析方法が、前記抽出したユーザ情報につき、投稿者名、各投稿者の投稿数、各単語の投稿者数の何れか一以上求めて、実施してなる、口コミ情報解析方法の構成採用にある。
【0027】
本発明方法の第7の特徴は、上記本発明方法の第1、第2、第3、第4、第5又は第6の特徴における前記解析方法が、前記抽出した時間情報につき、投稿日時、指定された日時からの経過日時、指定された単位に基き算出した特定単位の日時の何れか一以上求めて、実施してなる、口コミ情報解析方法の構成採用にある。
【0028】
本発明装置の第1の特徴は、一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する装置であって、前記Webサーバにより公開されている文章を収集する文章収集モジュールと、当該収集された文章を記事毎に分割し且つ当該分割した各記事につき投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出するとともに、抽出された当該各記事のユーザ情報及び時間情報並びに次なる文章情報解析モジュールより受けた文章解析情報から口コミ基礎情報を作成する口コミ情報抽出モジュールと、当該口コミ情報抽出モジュールにより抽出された文章情報につき、単語単位へ分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を前記文章解析情報として、当該口コミ情報抽出モジュールに返す前記文章情報解析モジュールと、当該口コミ情報抽出モジュールからの前記作成された口コミ基礎情報を受けて、統計処理を行った結果たる統計情報を含んだ口コミ解析情報を作成する統計解析モジュールと、当該統計解析モジュールにより当該作成された口コミ解析情報を用いて、前記口コミ情報の解析を行う口コミ解析モジュールと、を具備してなる、口コミ情報解析装置の構成採用にある。
【0029】
本発明装置の第2の特徴は、上記本発明装置の第1の特徴における前記口コミ解析モジュールが、前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出したユーザ情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0030】
本発明装置の第3の特徴は、上記本発明装置の第1の特徴における前記口コミ解析モジュールが、前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記投稿文章その他の文章情報を構成する単語に関する流行を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出した時間情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0031】
本発明装置の第4の特徴は、上記本発明装置の第3の特徴における前記口コミ解析モジュールが、前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記口コミ情報抽出モジュールにより抽出した時間情報及びユーザ情報並びに前記文章情報解析モジュールによる文章解析情報を再度組合せて求めることにより、前記口コミ情報の解析機能を有してなる、口コミ情報解析装置の構成採用にある。
【0032】
本発明装置の第5の特徴は、上記本発明装置の第1、第2、第3又は第4の特徴における前記分割した各単語につき各種の認定・判定が、当該各単語についての、品詞の特定、商品名、評価表現、ポジティブ/ネガティブの判定である、口コミ情報解析装置の構成採用にある。
【0033】
本発明装置の第6の特徴は、上記本発明装置の第1、第2、第3、第4又は第5の特徴における前記文章解析情報が、単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組合せからなる、口コミ情報解析装置の構成採用にある。
【0034】
かように、本発明においては、ユーザ情報と時間情報と文章情報とをそれぞれ識別可能なテキスト情報を蓄積しているネットワーク(インターネットなど)上に存する掲示板、チャット、これに類するユーザ間の口コミ媒体となるサービスをテキスト情報の収集対象とする。
【0035】
それ故、口コミ情報の解析元のデータ構造を、文章中に存在する、口コミ情報の投稿者に関する情報を含むユーザ情報と、口コミ情報の投稿日時の情報を含む時間情報と、口コミ情報の投稿文章を含む文章情報とから構成されるデータ構造とすることにより、ユーザ情報と時間情報と文章情報とをそれぞれ異なる情報項目として区別して解析可能となり、これにより、投稿者を考慮してかかるサービスに存する口コミ情報を解析可能となる。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態を装置例及び方法例につき図面に基いて説明する。
【0037】
(装置例)
図1は、本発明の一実施形態である口コミ情報解析装置を一要素としたシステムの機能構築図である。
【0038】
図1のシステムは、利用者から配信される情報(特に主観的な情報。例えば、実世界における意見、感想、評判、うわさが該当。客観的な情報でも可。以下「口コミ情報それ自体」とする。)を投稿し、その投稿された情報を参照する利用者端末1と、口コミ情報(口コミ情報それ自体に、利用者に関する情報(例えば、利用者の氏名又は名称、住所又は居所、利用者のアドレスなどの連絡先)、時間に関する情報(例えば、投稿した日時)という口コミ情報それ自体に付随する情報を併せて、「口コミ情報」とする。)の登録・蓄積・公開を行うWebサーバ2と、図8の解析サーバ3とは異なり、文章収集モジュール51、文章情報解析モジュール52及び統計解析モジュール53の他に口コミ情報抽出モジュール54及び口コミ解析モジュール55を具備して、口コミ情報の収集・解析を行う口コミ情報解析装置(サーバの類)5とを、インターネットなどのネットワーク4により接続し、後述の方法例にて説明する処理を順次行うシステム構成である。
【0039】
(方法例)
本発明の一実施形態である口コミ情報解析方法を図1のシステムに適用して説明する。
【0040】
図2は、図1のシステムのシーケンス図、図3は、図1のシステムの構成要素又は内部構成要素間における情報のフローをシステム構成と共に示した図、図4は、図3の文章、記事の両者の関係についての一例を説明した図、図5は、図3の文章解析情報の一例を示した図、図6は、図3の口コミ基礎情報の一例を示した図、図7は、図1の口コミ解析モジュールにて使用する口コミ解析情報の項目の一例を示した図である。
【0041】
利用者端末1は、ブラウザ機能11を利用して口コミ情報それ自体を投稿文章S1として、Webサーバ2に対して投稿し(ST1)、それを受けたWebサーバ2によりそれに対応した処理が行われて、その結果たる投稿結果が返される(ST2)。
【0042】
以上のように、一以上の利用者端末1からWebサーバ2に対して一以上の記事投稿がなされ、Webサーバ2が、BBSサーバ機能21により、投稿された口コミ情報それ自体である投稿文章S1を、投稿者名、投稿日時などと共に記事S2として登録し、その記事S2を一定期間蓄積する。
【0043】
それと共に、口コミ情報の参照要求に対して蓄積されている該当の記事S2の提供などの応答を行うという状況下において、口コミ情報解析装置5に対して、口コミ情報の解析を行う命令を外部から又は内部から受けると、口コミ情報解析装置5は、次の第1乃至第6の処理を順に行う。
【0044】
第1の処理として、文章収集モジュール51により、Webサーバ2に対して記事取得要求を行い(ST3)、それに対応してWebサーバ2から返答された、一以上の記事S2を文章S3として受けて(ST4)収集した後に、口コミ情報抽出モジュール54に対して記事解析要求を行う(ST7)。
【0045】
ここで、文章S3とは、一以上の記事S2から構成されたもの、記事S2とは、口コミ情報それ自体に該当する投稿文章S1、並びに口コミ情報として付随する、ユーザ情報に該当する投稿者名及び時間情報に該当する投稿日時から構成されたものである(図4参照)。
【0046】
第2の処理として、記事解析要求を受けた口コミ情報抽出モジュール54により、▲1▼文章S3を記事S2毎に再分割し、▲2▼各記事S2から投稿日時(図4の投稿日の欄にある、例えば「200X/Y/ZZ hh:mm」)、投稿者名(図4の名前の欄にある、例えば「ユーザ1」)、投稿文章(図4の各記事S2の2行目にある、例えば「○○○○○○○○○○○○○○○○○○○○」)を特定する。
【0047】
そして、それぞれ、記事S2における、時間情報、ユーザ情報、文章情報として抽出した後に、▲3▼記事S2における文章情報たる投稿文章を分析する為に、文字情報解析モジュール52に対して文章解析要求を行う(ST8)。
【0048】
第3の処理として、文章解析要求を受けた文章情報解析モジュール52により、口コミ情報抽出モジュール54にて抽出された投稿文章S4を、形態素解析などの手法を適用して、▲1▼単語単位に分割し、▲2▼各単語の品詞を判定し、▲3▼各単語について文章情報解析モジュール52内の辞書(評価用語・商品名辞書など)を用いて、商品名、評価表現、ポジティブ/ネガティブなどの判定を行う。
【0049】
▲4▼単語、品詞、対応商品名、対応評価表現、ポジティブ/ネガティブ結果などの組から構成される順序列である文章解析情報S5(図5参照)に変換し、▲5▼文章解析結果として返答を行う(ST9)。
【0050】
第4の処理として、かかる返答を受けた口コミ情報解析モジュール54は、▲1▼第2の処理として既に抽出している投稿者名及び投稿日時並びに第3の処理による文章解析情報S5から口コミ基礎情報S6(図6参照)を作成した後に(尚、作成には、投稿者名、投稿日時に限定されず、口コミ基礎情報S6に係る、ユーザ情報、時間情報でも可。)、▲2▼統計解析モジュール53に対して統計解析要求を行って統計解析モジュール53を呼出す(ST10)。
【0051】
第5の処理として、かかる統計解析要求を受けた統計解析モジュール53は、▲1▼口コミ基礎情報S6(図6参照)から、統計的な手法にて単語、ユーザの出現頻度などを求めて作成された統計情報S7(図7に列挙した、例えば記事数、単語数、ポジティブ/ネガティブ発言数、投稿ユーザ数、投稿回数などの何れかの項目の情報で、項目としては全てが存在するものではない。)を含んだ口コミ解析情報S8を作成した後に、▲2▼口コミ解析モジュール55に対して口コミ解析要求を行って口コミ情報解析モジュール55を呼出す(ST11)。
【0052】
なお、口コミ解析情報S8に係るユーザ情報については、各投稿者について全ユーザ情報における出現回数の算出により、ユーザ毎の記事S2の投稿回数を算出し、文章情報中に含まれる各単語につき該当する単語を含む文章の投稿者数を重複なく数える(例えば、図4の第1枠目の記事S2と第3枠目の記事S2とに係る名前は共に「ユーザ1」であるので、このような重複をダブルカウントすることなく、数える)ことにより、単語毎に投稿ユーザ数を算出する。
【0053】
口コミ解析情報S8に係る時間情報については、各投稿日時に対して予め指定されたイベント開催などの日時から経過時間を算出し、各投稿日時に対し、予め指定された単位(時、日、週、曜日、月、年。例えば2002年11月を第1期とし、同年12月を第2期などとした単位)に基き特定単位における日時(先の例では、第5期)を算出する。
【0054】
第6の処理として、口コミ解析要求(S11)を受けた口コミ解析モジュール55は、記事S2中の投稿文章S4における特定の単語(例えば、後述する「商品情報」(商品名、サービス名、商品、サービスを提供する企業名なども可。))につき、ユーザ情報(投稿者名、投稿者数(投稿ユーザ数)、投稿回数など)、時間情報(投稿日時、特定期間など)に配慮して、口コミ情報の解析として、例えば、次の様な解析を行う。
【0055】
解析例1として、商品情報と、投稿者の総数と、当該商品情報について投稿をした者の数(投稿者数)とを組合せ、各商品に関する投稿者数を投稿者の総数で割った値を、各商品に関する認知度として、口コミ情報の解析を行う。
【0056】
解析例2として、商品情報と投稿日時とを組合せ、当該商品情報の単語を含む記事S2について特定期間に投稿された記事数が全期間に投稿された全記事数と比べて相対的に多い期間を抽出することにより、各商品に関する話題の盛上りを抽出する。
【0057】
解析例3として、商品情報と投稿日時とを組合せ、特定期間について各商品情報の単語を含む記事S2の件数を其々比較し、特定期間に記事数が最も多い商品を抽出することより、商品に関する流行を抽出する。
【0058】
解析例4として、前述の解析例2の要領により抽出した話題の盛上りにつき、その盛上りの時期と投稿ユーザ数とを組合せ、各盛上りを構成する記事の投稿ユーザ数と投稿記事数の割合の変化を解析することにより、各話題の浸透度を解析する。
【0059】
解析例5として、前述の解析例2の要領により抽出した話題の盛上りにつき、その盛上り初期の時期に投稿を行った投稿者を対象として、過去の投稿された記事S2と話題の類似性を解析することにより、盛上りの発端(キー)となった重要発言者を抽出する。
【0060】
以上、本発明の形態である装置例及び方法例を説明したが、本発明の目的を達し、下記する効果を奏する範囲において、適宜変更して実施可能である。
【0061】
【発明の効果】
本発明によれば、テキスト情報の解析に関し、口コミ情報から文章情報、時間情報及びユーザ情報を抽出し、その抽出した、文章情報、時間情報及びユーザ情報を元にして口コミ情報の解析を行うことにより、ユーザ情報に配慮した口コミ情報を解析することができるなどの優れた効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施形態である口コミ情報解析装置を一要素としたシステム構築図である。
【図2】図1のシステムのシーケンス図である。
【図3】図1のシステムの構成要素又は内部構成要素間における情報のフローをシステム構成と共に示した図である。
【図4】図3の文章、記事の両者の関係についての一例を説明した図である。
【図5】図3の文章解析情報の一例を示した図である。
【図6】図3の口コミ基礎情報の一例を示した図である。
【図7】図1の口コミ解析モジュールにて使用する口コミ解析情報の項目の一例を示した図である。
【図8】従来のテキスト情報に対する統計解析システムの構成図である。
【図9】図8の処理シーケンス図である。
【符号の説明】
1…利用者端末
11…ブラウザ機能
2…Webサーバ
21…BBSサーバ機能
3…解析サーバ
31…文章収集モジュール
32…文章情報解析モジュール
33…統計解析モジュール
4…ネットワーク
5…口コミ情報解析装置
51…文章収集モジュール
52…文章情報解析モジュール
53…統計解析モジュール
54…口コミ情報抽出モジュール
55…口コミ解析モジュール
S1…投稿文章
S2…記事
S3…文章
S4…投稿文章
S5…文章解析情報
S6…口コミ基礎情報
S7…統計情報
S8…口コミ解析情報
Claims (13)
- 一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する口コミ情報解析装置を用いた解析方法であって、
前記公開されている口コミ情報から、投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出し、当該抽出されたユーザ情報、時間情報、文章情報を任意に組合せて分析し統計処理を行うことにより、前記口コミ情報の解析を行う、
ことを特徴とする口コミ情報解析方法。 - 前記解析方法は、
前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記抽出したユーザ情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施する、
ことを特徴とする請求項1に記載の口コミ情報解析方法。 - 前記解析方法は、
前記口コミ情報の内、前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記口コミ情報の内、前記投稿文章その他の文章情報を構成する単語に関する流行を、前記抽出した時間情報と前記抽出した文章情報を分析した結果たる文章解析情報とから統計処理を行って求めることにより、実施する、
ことを特徴とする請求項1に記載の口コミ情報解析方法。 - 前記解析方法は、
前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記抽出した時間情報及び前記ユーザ情報並びに前記抽出した文章情報を分析した結果たる文章解析情報を再度組合せて統計処理を行って求めることにより、実施する、
ことを特徴とする請求項3に記載の口コミ情報解析方法。 - 前記文章解析情報は、
単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組である、
ことを特徴とする請求項2、3又は4に記載の口コミ情報解析方法。 - 前記解析方法は、
前記抽出したユーザ情報につき、投稿者名、各投稿者の投稿数、各単語の投稿者数の何れか一以上求めて、実施する、
ことを特徴とする請求項1、2、3、4又は5に記載の口コミ情報解析方法。 - 前記解析方法は、
前記抽出した時間情報につき、投稿日時、指定された日時からの経過日時、指定された単位に基き算出した特定単位の日時の何れか一以上求めて、実施する、ことを特徴とする請求項1、2、3、4、5又は6に記載の口コミ情報解析方法。 - 一以上の記事からなる文章を閲覧・投稿可能な利用者端末から当該文章たる口コミ情報を蓄積・公開するWebサーバとネットワークを介して接続され且つ当該Webサーバにより公開されている口コミ情報を解析する装置であって、
前記Webサーバにより公開されている文章を収集する文章収集モジュールと、
当該収集された文章を記事毎に分割し且つ当該分割した各記事につき投稿者名その他のユーザ情報、投稿日時その他の時間情報、投稿文章その他の文章情報に区別して抽出するとともに、抽出された当該各記事のユーザ情報及び時間情報並びに次なる文章情報解析モジュールより受けた文章解析情報から口コミ基礎情報を作成する口コミ情報抽出モジュールと、
当該口コミ情報抽出モジュールにより抽出された文章情報につき、単語単位へ分割し、当該分割した各単語につき各種の認定・判定を行ってその結果を前記文章解析情報として、当該口コミ情報抽出モジュールに返す前記文章情報解析モジュールと、
当該口コミ情報抽出モジュールからの前記作成された口コミ基礎情報を受けて、統計処理を行った結果たる統計情報を含んだ口コミ解析情報を作成する統計解析モジュールと、
当該統計解析モジュールにより当該作成された口コミ解析情報を用いて、前記口コミ情報の解析を行う口コミ解析モジュールと、
を具備する、
ことを特徴とする口コミ情報解析装置。 - 前記口コミ解析モジュールは、
前記投稿文章その他の文章情報を構成する特定の単語についての認知度を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出したユーザ情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有する、
ことを特徴とする請求項8に記載の口コミ情報解析装置。 - 前記口コミ解析モジュールは、
前記投稿文章その他の文章情報を構成する特定の単語に関する話題の盛上り又は任意の特定期間中における前記投稿文章その他の文章情報を構成する単語に関する流行を、前記口コミ解析情報の内、前記口コミ情報抽出モジュールにより前記抽出した時間情報と前記文章情報解析モジュールによる文章解析情報とから求めることにより、前記口コミ情報の解析機能を有する、
ことを特徴とする請求項8に記載の口コミ情報解析装置。 - 前記口コミ解析モジュールは、
前記求めた話題の盛上りの浸透度又はキーとなる投稿者を、前記口コミ情報抽出モジュールにより抽出した時間情報及びユーザ情報並びに前記文章情報解析モジュールによる文章解析情報を再度組合せて求めることにより、前記口コミ情報の解析機能を有する、
ことを特徴とする請求項10に記載の口コミ情報解析装置。 - 前記分割した各単語につき各種の認定・判定は、
当該各単語についての、品詞の特定、商品名、評価表現、ポジティブ/ネガティブの判定である、
ことを特徴とする請求項8、9、10又は11に記載の口コミ情報解析情報装置。 - 前記文章解析情報は、
単語、品詞、商品名、評価表現、ポジティブ/ネガティブ結果の組合せからなる、
ことを特徴とする請求項8、9、10、11又は12に記載の口コミ情報解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002355285A JP2004185572A (ja) | 2002-12-06 | 2002-12-06 | 口コミ情報解析方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002355285A JP2004185572A (ja) | 2002-12-06 | 2002-12-06 | 口コミ情報解析方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004185572A true JP2004185572A (ja) | 2004-07-02 |
Family
ID=32756024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002355285A Pending JP2004185572A (ja) | 2002-12-06 | 2002-12-06 | 口コミ情報解析方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004185572A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008919A1 (ja) * | 2004-07-16 | 2006-01-26 | The University Of Tokyo | 情報処理装置およびプログラム |
JP2006079412A (ja) * | 2004-09-10 | 2006-03-23 | Nippon Telegr & Teleph Corp <Ntt> | イベント情報抽出方法及び装置及びプログラム |
JP2006244053A (ja) * | 2005-03-02 | 2006-09-14 | Sony Corp | 提示装置および方法、プログラム、並びに記録媒体 |
WO2007043322A1 (ja) * | 2005-09-30 | 2007-04-19 | Nec Corporation | トレンド評価装置と、その方法及びプログラム |
US7526462B2 (en) | 2005-05-26 | 2009-04-28 | Kabushiki Kaisha Toshiba | Method and apparatus for generating time-series data from web pages |
JP2010092217A (ja) * | 2008-10-07 | 2010-04-22 | Kansai Electric Power Co Inc:The | 文書処理方法 |
JP5070281B2 (ja) * | 2007-03-23 | 2012-11-07 | パイオニア株式会社 | 情報提供システム、情報管理サーバ、情報管理方法、情報管理プログラム及び記憶媒体 |
JP2013069175A (ja) * | 2011-09-22 | 2013-04-18 | Nec Corp | キーワード抽出システム、キーワード抽出方法及びプログラム |
JP2013205864A (ja) * | 2012-03-27 | 2013-10-07 | Kddi Corp | 話題語抽出装置、話題語抽出方法、およびプログラム |
JP2014182445A (ja) * | 2013-03-18 | 2014-09-29 | Mitsubishi Electric Corp | 情報処理装置およびナビゲーション装置 |
JP2014197300A (ja) * | 2013-03-29 | 2014-10-16 | 株式会社Jvcケンウッド | テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム |
CN104715000A (zh) * | 2013-12-17 | 2015-06-17 | 国际商业机器公司 | 用于支持评价分析的装置和方法 |
-
2002
- 2002-12-06 JP JP2002355285A patent/JP2004185572A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008919A1 (ja) * | 2004-07-16 | 2006-01-26 | The University Of Tokyo | 情報処理装置およびプログラム |
JP4496900B2 (ja) * | 2004-09-10 | 2010-07-07 | 日本電信電話株式会社 | イベント情報抽出装置及びプログラム |
JP2006079412A (ja) * | 2004-09-10 | 2006-03-23 | Nippon Telegr & Teleph Corp <Ntt> | イベント情報抽出方法及び装置及びプログラム |
JP2006244053A (ja) * | 2005-03-02 | 2006-09-14 | Sony Corp | 提示装置および方法、プログラム、並びに記録媒体 |
US7526462B2 (en) | 2005-05-26 | 2009-04-28 | Kabushiki Kaisha Toshiba | Method and apparatus for generating time-series data from web pages |
WO2007043322A1 (ja) * | 2005-09-30 | 2007-04-19 | Nec Corporation | トレンド評価装置と、その方法及びプログラム |
JP5067556B2 (ja) * | 2005-09-30 | 2012-11-07 | 日本電気株式会社 | トレンド評価装置と、その方法及びプログラム |
JP5070281B2 (ja) * | 2007-03-23 | 2012-11-07 | パイオニア株式会社 | 情報提供システム、情報管理サーバ、情報管理方法、情報管理プログラム及び記憶媒体 |
JP2010092217A (ja) * | 2008-10-07 | 2010-04-22 | Kansai Electric Power Co Inc:The | 文書処理方法 |
JP2013069175A (ja) * | 2011-09-22 | 2013-04-18 | Nec Corp | キーワード抽出システム、キーワード抽出方法及びプログラム |
JP2013205864A (ja) * | 2012-03-27 | 2013-10-07 | Kddi Corp | 話題語抽出装置、話題語抽出方法、およびプログラム |
JP2014182445A (ja) * | 2013-03-18 | 2014-09-29 | Mitsubishi Electric Corp | 情報処理装置およびナビゲーション装置 |
JP2014197300A (ja) * | 2013-03-29 | 2014-10-16 | 株式会社Jvcケンウッド | テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム |
CN104715000A (zh) * | 2013-12-17 | 2015-06-17 | 国际商业机器公司 | 用于支持评价分析的装置和方法 |
US10185915B2 (en) | 2013-12-17 | 2019-01-22 | International Business Machines Corporation | Analysis of evaluations from internet media |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8306962B1 (en) | Generating targeted paid search campaigns | |
US9201880B2 (en) | Processing a content item with regard to an event and a location | |
US8161059B2 (en) | Method and apparatus for collecting entity aliases | |
CN102119385B (zh) | 用于在内容检索服务系统内检索媒体内容的方法和子系统 | |
KR100863990B1 (ko) | 카테고리 광고 시스템 및 방법 | |
CN107544988B (zh) | 一种获取舆情数据的方法和装置 | |
US20130179257A1 (en) | In-Text Embedded Advertising | |
US20070192129A1 (en) | Method and system for the objective quantification of fame | |
CN114238573A (zh) | 基于文本对抗样例的信息推送方法及装置 | |
US9015168B2 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
CN108052586A (zh) | 舆情分析方法、系统、计算机设备和存储介质 | |
CA2634918A1 (en) | Analyzing content to determine context and serving relevant content based on the context | |
KR20120108095A (ko) | 소셜 데이터 분석 시스템 | |
KR101652433B1 (ko) | Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법 | |
JP2004185572A (ja) | 口コミ情報解析方法及び装置 | |
CN110298029A (zh) | 基于用户语料的好友推荐方法、装置、设备及介质 | |
JP5013065B2 (ja) | 風説監視システム、風説監視方法及びプログラム | |
JP2011108053A (ja) | ニュース記事評価システム | |
CN112380457A (zh) | 一种基于采购信息的精准个性化推荐方法 | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
CN108280081B (zh) | 生成网页的方法和装置 | |
CN108491496A (zh) | 一种推广信息的处理方法及装置 | |
CN106708932A (zh) | 问答类网站的回复的摘要提取方法及装置 | |
JP2020521246A (ja) | ネットワークアクセス可能なコンテンツの自動化された分類 | |
Maynard et al. | Automatic language-independent induction of gazetteer lists |