以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、口コミ等のコメントの評価対象を決定し、当該評価対象に対応する評価語辞書を用いて、コメントを分析し、評価対象の評価を得る情報システム1について説明する。
また、本実施の形態において、評価対象は、階層化されており、評価語辞書も階層化されている情報システム1について説明する。
また、本実施の形態において、固有名称と評価対象を示す評価対象語の対応表を有する情報システム1について説明する。
また、本実施の形態において、一のコメントの中に、2以上の評価対象のコメントである2以上の部分コメントが存在し得る情報システム1について説明する。
さらに、本実施の形態において、評価対象語をコメントから取得する情報システム1について説明する。
図1は、本実施の形態における情報システム1の概念図である。情報システム1は、1以上の外部装置11、情報処理装置12、および1以上の端末装置13を備える。外部装置11は、口コミ等のコメントを格納しているサーバ装置である。コメントは、ユーザが入力したブログ、掲示板、SNS、いわゆるツィッター等へ投函された情報であり、いわゆるCGM(Consumer Generated Media:消費者生成メディア)を含む、と考えて良い。また、情報処理装置12は、1以上のコメントを解析し、評価対象の評価を取得する装置である。さらに、端末装置13は、情報処理装置12にアクセスし、評価対象の評価を出力するユーザ端末である。
図2は、本実施の形態における情報システム1のブロック図である。
情報システム1を構成する外部装置11は、コメント格納部111、指示受信部112、コメント送信部113を備える。
情報処理装置12は、辞書格納部121、固有名称情報格納部122、コメント取得部123、評価対象決定部124、コメント評価値取得部125、対象評価値取得部126、出力部127を備える。
端末装置13は、端末受付部131、端末送信部132、端末受信部133、端末出力部134を備える。
外部装置11を構成するコメント格納部111は、1以上のコメントを格納している。コメントは、上述したように、1以上のユーザが入力した口コミ等の情報であり、いわゆるCGMである。また、コメントは、通常、テキストであるが、そのデータタイプやデータ構造等は問わない。
指示受信部112は、情報処理装置12からコメント送信の指示を受信する。
コメント送信部113は、コメント送信の指示に応じて、1以上のコメントをコメント格納部111から取得し、情報処理装置12に送信する。
なお、外部装置11は、指示を受信しなくとも、情報処理装置12にコメントを情報処理装置12に送信しても良い。
情報処理装置12を構成する辞書格納部121は、2以上の評価対象ごとに、評価情報を格納し得る。評価情報は、評価対象を示す用語である評価対象語と、評価語辞書とを有する。評価語辞書は、1以上の評価語を有する。また、評価語辞書は、評価語と評価の程度を示すランクとの組を、1組以上有しても良い。ここで、評価語とは、評価対象に対する評価を示す用語であり、例えば、良い、悪い、すばらしい、いい、ヒリヒリ、若い、ハリ、ダメ、キープ、綺麗、保湿、ボリューム、安い、高い等である。評価語は、通常、形容詞であるが、名詞等の他の品詞でも良い。また、評価語は、通常、評価に関係する用語であり、単語だけではなく、句でも良い。さらに、評価語は、評価対象が同一の2以上のコメント(評価対象を評価したコメント)に、予め決められた条件を満たすほど頻度高く出現する用語であっても良い。かかる評価語の取得は、公知技術により可能であるので、詳細な説明を省略する。また、ランクは、通常、数値であるが、アルファベット等の順序を示す情報であれば良い。
また、辞書格納部121は、階層化されている3以上の評価対象の階層関係を示す情報である階層情報をも格納していることは好適である。階層情報とは、評価対象語の階層関係を示す情報であり、例えば、評価対象語のIDと、その親の評価対象語のIDを有する。階層情報とは、評価対象語の階層関係を示す情報であり、例えば、評価対象語のIDと、その親の評価対象語のID、およびその子の1以上の評価対象語のIDを有しても良い。つまり、かかる場合、評価対象が階層化されており、評価語辞書は階層化されている評価対象ごとに存在する。
さらに、評価対象が階層化されており、評価対象を評価する場合、一の評価対象に対応する評価語は、当該一の評価対象に対応する評価語だけではなく、当該一の評価対象の上位の評価対象に対応する評価語をも用いて、評価対象を評価することは好適である。
固有名称情報格納部122は、1以上の固有名称情報を格納し得る。固有名称情報は、固有名称と評価対象語とを対応付ける情報であり、例えば、固有名称と評価対象語とを有する情報である。なお、固有名称とは、評価対象の商品名、人名、地名等である。かかる場合、評価対象語は、固有名称の分類を示す情報である、とも言える。なお、固有名称も評価対象語として捕らえても良い。
コメント取得部123は、1以上のユーザが入力した1以上のコメントであり、外部装置11に格納されていた1以上のコメントを取得する。ここで、取得とは、通常、外部装置11からの受信であるが、外部装置11から取得されたコメントが格納されている記録媒体からの読み出し等であっても良い。
また、コメント取得部123は、コメントの送信指示を外部装置11に送信し、当該指示の送信に応じて、1以上のコメントを外部装置11から受信しても良い。
評価対象決定部124は、コメント取得部123が取得した1以上の各コメントの評価対象を決定する。ここで、評価対象の決定とは、通常、評価対象語の取得である。評価対象決定部124は、コメント取得部123が取得した1以上の各コメントと辞書格納部121に格納されている1以上の評価対象語とを用いて、評価対象語を取得することは好適である。但し、コメント取得部123が取得したコメントに評価対象語が付加されており、評価対象決定部124は、コメントに付加されている評価対象語を取得しても良い。
評価対象決定部124は、評価語をも用いて、各コメントの評価対象を決定することは好適である。つまり、評価対象決定部124は、例えば、各コメントに出現する1以上の各評価語の頻度等を用いて、各評価語に対応する評価対象語を取得しても良い。さらに具体的には、評価対象決定部124は、例えば、各コメントの出現頻度が予め決められた条件を満たすほど多い1以上の評価語を取得し、当該1以上の評価語のうち、最も多くの評価語に対応する一の評価対象語を取得する。
また、評価対象決定部124は、実施の形態2で説明するように、1以上の評価語のみを用いて、各コメントの評価対象を決定しても良い。
また、さらに具体的には、評価対象語が階層化されている場合、評価対象決定部124は、例えば、各コメントの出現頻度が予め決められた条件を満たすほど多い1以上の評価語を取得し、当該評価語に対応する評価対象語のうちで、最も下位の評価対象語を取得する。例えば、「スキンケア」が上位語、「化粧水」がその下位語である場合、予め決められた条件を満たすほど多い出現頻度の評価語に対応する評価対象語が「スキンケア」「化粧水」である場合、評価対象決定部124は、例えば、最下位の評価対象語「化粧水」を取得する。
また、評価対象語が階層化されており、評価対象決定部124が複数の評価対象語を取得した場合、例えば、評価対象決定部124は、階層化されている最下位の一の評価対象語を取得することは好適である。
評価対象決定部124は、コメント取得部123が取得した1以上の各コメントと固有名称情報格納部122の1以上の固有名称とを用いて、各コメントの評価対象に対応する固有名称を決定することは好適である。つまり、例えば、評価対象決定部124は、コメントに出現する固有名称を、評価対象語として取得する。
評価対象決定部124は、一のコメントに中から、2以上の評価対象、および2以上の部分コメントを、対応付けて取得することは好適である。部分コメントとは、一のコメントの一部であり、2以上の各評価対象に対応するコメントの部分である。評価対象決定部124は、改行、改行+スペースなどの手がかり句を用いて、コメントを部分コメントに分割する。また、評価対象決定部124は、文単位で評価対象を決定し、評価対象が変化するまでを部分コメントとして取得する等しても良い。
評価対象決定部124は、コメント取得部123が取得した1以上の各コメントまたは1以上の各部分コメントと、辞書格納部121に格納されている1以上の評価対象語、または1以上の評価語、または1以上の評価対象語と1以上の評価語を用いて、各コメントまたは各部分コメントに対応する評価対象を決定することは好適である。
コメント評価値取得部125は、1以上の各コメントに対して、評価対象決定部124が決定した評価対象を示す評価対象語に対応する評価語辞書を用いて、各コメントの評価値を取得する。コメント評価値取得部125は、例えば、1以上の各コメントを単語に分割し、評価対象語に対応する評価語辞書に含まれる評価語の数を算出し、当該評価語の数を用いて、コメントの評価値を取得しても良い。また、コメント評価値取得部125は、例えば、否定語(例えば、「ではない」「不」等)を用いて、肯定的な評価語(例えば、「スベスベ」)を否定的な評価語(例えば、「スベスベでない」が「ザラザラ」と)として処理したり、否定的な評価語(例えば、「ザラザラ」)を肯定的な評価語(例えば、「ザラザラでない」が「スベスベ」と)として処理したりすることは好適である。
コメント評価値取得部125は、評価対象決定部124が決定した評価対象の上位にある評価対象に対応する評価語辞書をも用いて、各コメントの評価値を取得することは好適である。なお、評価対象の上位にある評価対象は、階層情報を用いて取得され得る。
コメント評価値取得部125は、1以上の各コメントに対して、評価対象決定部124が決定した固有名称に対応する評価対象語と対になる評価語辞書を用いて、各コメントの評価値を取得する。固有名称に対応する評価対象語は、固有名称情報格納部122から取得され得る。なお、固有名称に対応する評価対象語とは、固有名称が属するグループとも言える。
コメント評価値取得部125は、2以上の各部分コメントに対して、各部分コメントに対応する評価対象と対になる評価語辞書を用いて、各部分コメントの評価値を取得することは好適である。評価対象に対応する評価語辞書とは、評価対象を示す評価対象語と対になる評価語辞書である。
対象評価値取得部126は、評価対象ごとに、評価対象に対応する1以上の評価値を用いて、評価対象の評価値を取得する。また、対象評価値取得部126は、通常、評価対象の1以上の評価値を統計処理して、評価対象の総合的な評価値を算出する。統計処理は、例えば、平均値や中央値の算出等である。なお、この評価対象の1以上の評価値は、コメント評価値取得部125が取得した評価値である。
出力部127は、評価対象ごとに、対象評価値取得部126が取得した評価対象の評価値を出力する。ここで、出力部127は、例えば、評価対象語と評価値とを対応付けて出力する。ここで、出力とは、例えば、記録媒体への蓄積であるが、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置(例えば、端末装置13)への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
端末装置13の端末受付部131は、ユーザからの指示や情報を受け付ける。指示とは、例えば、評価対象語や固有名称の評価を取得する評価取得指示であり、評価対象語や固有名称の評価を含む指示である。また、情報とは、例えば、評価対象語や固有名称に対する評価に関するコメントである。
端末送信部132は、端末受付部131が受け付けた指示や情報を、情報処理装置12や外部装置11等に送信する。
端末受信部133は、評価取得指示の送信に対応して、評価値を情報処理装置12から受信する。端末受信部133は、情報処理装置12や外部装置11等から、評価値以外の情報を受信しても良い。
端末出力部134は、端末受信部133が受信した情報(例えば、評価値)を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
コメント格納部111、辞書格納部121、固有名称情報格納部122は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。コメント格納部111等にコメント等が記憶される過程は問わない。例えば、記録媒体を介してコメント等がコメント格納部111等で記憶されるようになってもよく、通信回線等を介して送信されたコメント等がコメント格納部111等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力されたコメント等がコメント格納部111等で記憶されるようになってもよい。
指示受信部112、コメント取得部123、端末受信部133は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
コメント送信部113、出力部127、端末送信部132は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
評価対象決定部124、コメント評価値取得部125、対象評価値取得部126は、通常、MPUやメモリ等から実現され得る。評価対象決定部124の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
端末出力部134は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部127は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
次に、情報システム1の動作について説明する。まず、外部装置11の動作について説明する。外部装置11の指示受信部112は、情報処理装置12からコメントの送信指示を受信する。そして、コメント送信部113は、コメントの送信指示に応じて、1以上のコメントをコメント格納部111から取得し、情報処理装置12に送信する。
次に、情報処理装置12の動作について、図3のフローチャートを用いて説明する。
(ステップS301)コメント取得部123は、1以上のコメントを取得する。なお、コメント取得部123は、図示しない記録媒体から1以上のコメントを読み出しても良いし、1以上の外部装置11から1以上のコメントを受信しても良い。
(ステップS302)評価対象決定部124は、カウンタiに1を代入する。
(ステップS303)評価対象決定部124は、ステップS301で取得した1以上のコメントの中のi番目のコメントを取得する。そして、評価対象決定部124は、i番目のコメントが存在するか否かを判断する。i番目のコメントが存在すればステップS304に行き、i番目のコメントが存在しなければステップS306に行く。
(ステップS304)コメント評価値取得部125等は、コメント評価値を取得する。コメント評価値を取得する処理について、図4のフローチャートを用いて説明する。
(ステップS305)評価対象決定部124は、カウンタiを1、インクリメントする。ステップS303に戻る。
(ステップS306)対象評価値取得部126は、カウンタjに1を代入する。
(ステップS307)対象評価値取得部126は、バッファに一時蓄積された評価対象語の中で、j番目の評価対象語が存在するか否かを判断する。j番目の評価対象語が存在すればステップS308に行き、存在しなければ処理を終了する。
(ステップS308)対象評価値取得部126は、j番目の評価対象語に対応する1以上の評価値をバッファから取得する。なお、この評価値はコメントの評価値である。
(ステップS309)対象評価値取得部126は、ステップS308で取得した1以上の評価値を用いて、j番目の評価対象語(j番目の評価対象)に対する評価値を算出する。通常、対象評価値取得部126は、ステップS308で取得した1以上の評価値を統計処理し、j番目の評価対象の評価値を算出する。
(ステップS310)対象評価値取得部126は、j番目の評価対象語と、ステップS309で取得した評価値とを対応付けて出力する。
(ステップS311)対象評価値取得部126は、カウンタjを1、インクリメントする。ステップS307に戻る。
なお、図3のフローチャートにおいて、コメントごとにコメントの評価値を算出したが、複数の各コメントの評価対象語をすべて取得した後、複数の各コメントの評価値を算出する等、上記のフローチャートとは異なる手順で、最終的に評価対象に対応する評価値を取得すれば良いことは言うまでもない。
また、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、ステップS304のコメント評価値を取得する処理について、図4のフローチャートを用いて説明する。
(ステップS401)評価対象決定部124は、処理対象のコメントを分割する処理を行なう。ここで分割処理は、評価対象ごとに、コメントを分割する処理である。分割によって、2以上の部分コメントを取得し得る。なお、ここで、分割できない場合もあり、かかる場合、コメントの評価対象は一つである。また、かかる分割処理について、図5のフローチャートを用いて説明する。
(ステップS402)コメント評価値取得部125は、カウンタiに1を代入する。
(ステップS403)コメント評価値取得部125は、i番目の部分コメントが存在するか否かを判断する。i番目の部分コメントが存在すればステップS404に行き、存在しなければ上位処理にリターンする。なお、1番目の部分コメントは、コメントである場合もある。
(ステップS404)コメント評価値取得部125は、i番目の部分コメントに対応する評価語辞書を取得する。かかる評価語辞書取得処理について、図6のフローチャートを用いて説明する。なお、本ステップで、i番目の部分コメントに対応する評価対象語も取得する。
(ステップS405)コメント評価値取得部125は、ステップS404で取得した評価語辞書に含まれる1以上の評価語を用いて、i番目の部分コメントを検索し、i番目の部分コメントに出現する1以上の評価語を取得する。
(ステップS406)コメント評価値取得部125は、ステップS405で取得した1以上の評価語を用いて、評価値を算出する。
(ステップS407)コメント評価値取得部125は、i番目の部分コメントに対応する評価対象語と、評価値とを対応付けて、バッファに一時蓄積する。
(ステップS408)コメント評価値取得部125は、カウンタiを1、インクリメントする。ステップS403に戻る。
次に、ステップS401の分割処理について、図5のフローチャートを用いて説明する。
(ステップS501)評価対象決定部124は、初期化を行なう。初期化とは、カウンタiに1を代入し、部分コメントバッファにNULLを代入し、評価対象バッファにNULLを代入することである。なお、部分コメントバッファとは、部分コメントが格納されるバッファであり、評価対象バッファとは評価対象語が格納されるバッファである。
(ステップS502)評価対象決定部124は、コメントの中に、i番目の処理単位が存在するか否かを判断する。i番目の処理単位が存在すればステップS503に行き、存在しなければステップS506に行く。そして、ステップS506の処理の後、上位処理にリターンする。なお、処理単位とは、カレントの部分コメントの中の情報であるか、次の新しい部分コメントの中の情報であるかを判断するための単位となる情報であり、例えば、文である。ただし、処理単位は、主語が存在する文または句または段落等でも良い。
(ステップS503)評価対象決定部124は、コメントから、i番目の処理単位を取得する。
(ステップS504)評価対象決定部124は、i番目の処理単位から評価対象語または固有名称を取得する。なお、ここで評価対象語または固有名称を取得できない場合もあり得る。評価対象語等が取得できない場合、(i−1)番目の処理単位における評価対象語等から変化がない、と判断される。また、評価対象決定部124は、例えば、i番目の処理単位を形態素解析し、固有名称を取得しても良いし、i番目の処理単位を形態素解析し、主語である評価対象語を取得しても良いし、辞書格納部121の評価対象語を用いて、i番目の処理単位に出現している評価対象語を取得しても良い。また、評価対象決定部124は、複数のアルゴリズムを組み合わせて、評価対象語または固有名称を取得しても良い。なお、固有名称等を取得する技術は公知技術であるので、詳細な説明を省略する。
(ステップS505)評価対象決定部124は、ステップS504で評価対象語または固有名称を取得でき、かつ取得した評価対象語または固有名称が、評価対象バッファに格納されている評価対象語または固有名称と同一であるか否かを判断する。かかる条件を満たす場合はステップS506に行き、かかる条件を満たさない場合はステップS509に行く。なお、かかる条件を満たす場合は話題(評価対象)の変更があった場合であり、かかる条件を満たさない場合は話題の変更がなかった場合である。
(ステップS506)評価対象決定部124は、部分コメントバッファの情報と、評価対象バッファの情報とを、図示しない記録媒体に一時蓄積する。この一時蓄積された情報が、評価値を算出する対象のコメントまたは部分コメントである。なお、部分コメントバッファの情報がNULLの場合は、本ステップの動作は行なわれない、とする。
(ステップS507)評価対象決定部124は、部分コメントバッファにi番目の処理単位を上書きし、評価対象バッファにステップS504で取得した評価対象語または固有名称を上書きする。
(ステップS508)評価対象決定部124は、カウンタiを1、インクリメントする。ステップS502に戻る。
(ステップS509)評価対象決定部124は、i番目の処理単位を部分コメントバッファに追記する。ステップS508に行く。
次に、ステップS404の評価語辞書取得処理について、図6のフローチャートを用いて説明する。
(ステップS601)コメント評価値取得部125は、処理対象の部分コメント(コメントの場合もある)に対応する固有名称、または評価対象語を取得する。なお、固有名称または評価対象語の取得方法は、ステップS504における取得方法と同じで良く、説明を省略する。
(ステップS602)コメント評価値取得部125は、ステップS601で取得した情報が固有名称であるか否かを判断する。固有名称である場合はステップS603に行き、固有名称でない場合はステップS604に行く。
(ステップS603)コメント評価値取得部125は、ステップS601で取得した固有名称と対になる評価対象語を、固有名称情報格納部122から取得する。
(ステップS604)コメント評価値取得部125は、ステップS601で取得した評価対象語またはステップS603で取得した評価対象語に対応する評価語辞書を辞書格納部121から取得する。なお、本ステップで利用した評価対象語をカレントの評価対象語とする。
(ステップS605)コメント評価値取得部125は、階層情報を利用して、評価語辞書を取得するか否かを判断する。階層情報を利用する場合はステップS606に行き、階層情報を利用しない場合は上位処理にリターンする。なお、階層情報を利用するか否かは、予め決められている、とする。
(ステップS606)コメント評価値取得部125は、カレントの評価対象語の親が存在するか否かを、階層情報を用いて判断する。親が存在すればステップS607に行き、親が存在しなければ上位処理にリターンする。
(ステップS607)コメント評価値取得部125は、カレントの評価対象語の親の評価対象語に対応する評価語辞書を辞書格納部121から取得する。
(ステップS608)コメント評価値取得部125は、カレントの評価対象語を、親の評価対象語とする。ステップS606に戻る。
次に、端末装置13の動作について説明する。端末装置13の端末受付部131は、ユーザから評価取得指示を受け付ける。次に、端末送信部132は、端末受付部131が受け付けた評価取得指示を、情報処理装置12に送信する。そして、端末受信部133は、評価取得指示の送信に対応して、評価値を情報処理装置12から受信する。端末出力部134は、端末受信部133が受信した評価値を出力する。なお、評価取得指示は、通常、評価対象語を含む。また、端末受信部133は、評価取得指示に含まれる評価対象語の評価値を情報処理装置12から受信する。
以下、本実施の形態における情報システム1の具体的な動作について説明する。情報システム1の概念図は図1である。
今、情報処理装置12の辞書格納部121は、図7に示す評価対象語の階層関係を示す階層情報を管理する階層情報管理表を格納している。階層情報管理表は、「ID」「評価対象語」「親ID」を有する2または3以上のレコードを格納している。「ID」は、評価対象語の識別子である。評価対象語の識別子は、評価対象の識別子であるとも言える。また、ここでの「評価対象語」は、コスメの分類を示す情報である。「親ID」は、対応する評価対象語の親の評価対象語のIDである。
また、辞書格納部121は、図8に示す評価対象語ごとの評価語辞書を格納している。図8のレコードは「ID」「評価語」「ラベル」を有する。「ID」は、図7の「ID」に対応する。また、「ラベル」は、評価語が示す評価の程度を示す情報であり、プラスはポジティブ(肯定的)、マイナスはネガティブ(否定的)を意味する。
また、固有名称情報格納部122は、図9に示す固有名称情報管理表を格納している。固有名称情報管理表は、「ID」「固有名称」「評価対象語」を有するレコードを1以上格納している。本レコードは、固有名称情報である。固有名称に対応する評価対象語は、固有名称の分類を示す、と言える。
さらに、外部装置11は、図10に示すようなコメントを格納している。なお、図10に示す複数のコメントは、一の外部装置11に格納されているものであっても良いし、2以上の外部装置11に格納されているものを集めたものであっても良い。
かかる状況において、例えば、情報システム1は、以下のように動作する。ここでは、情報処理装置12が評価対象語または固有名称の評価値を出力する処理について説明する。
まず、情報処理装置12のコメント取得部123は、1または2以上の外部装置11にコメントの送信指示を送信する。
そして、1または2以上の外部装置11の指示受信部112は、送信指示を受信する。そして、1または2以上の外部装置11のコメント送信部113は、1以上のコメントをコメント格納部111から読み取り、情報処理装置12に送信する。
次に、情報処理装置12のコメント取得部123は、1または2以上の外部装置11から、1または2以上のコメントを受信する。コメント取得部123が受信したコメントの集合が、図10である。
次に、評価対象決定部124等は、以下のように、図10の各コメントを順に処理する。
まず、評価対象決定部124は、1番目のコメントの処理を行なう。つまり、評価対象決定部124は、部分コメントバッファにNULLを代入し、評価対象バッファにNULLを代入する。そして、評価対象決定部124は、1番目のコメントの第1文「A社の化粧品はすばらしい。」を取得する。次に、評価対象決定部124は、第1文「A社の化粧品はすばらしい。」を、例えば、形態素解析し、主語を構成する句「A社の化粧品」を取得する。なお、ここでは、文の主語「A社の化粧品」が評価対象語または固有名称であるが、辞書格納部121に格納されている評価対象語と一致する「化粧品」を評価対象語としても良い。
次に、評価対象決定部124は、評価対象語は取得できたが、取得した評価対象語が、評価対象バッファに格納されている評価対象語または固有名称と同一でない、と判断する。そして、評価対象決定部124は、第1文「A社の化粧品はすばらしい。」を、部分コメントバッファに蓄積する。また、評価対象決定部124は、評価対象バッファに評価対象語「A社の化粧品」を蓄積する。なお、評価対象決定部124は、評価対象バッファに「化粧品」を蓄積しても良い。
次に、評価対象決定部124は、1番目のコメントの第2文「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」を取得する。次に、評価対象決定部124は、第2文「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」を、例えば、形態素解析し、主語を構成する固有名称「XYZ化粧水」を取得する。
次に、評価対象決定部124は、評価対象語は取得できたが、取得した評価対象語「XYZ化粧水」が、評価対象バッファに格納されている評価対象語または固有名称と同一でない、と判断する。
そして、評価対象決定部124は、部分コメントバッファの情報「A社の化粧品はすばらしい。」と、評価対象バッファの情報「A社の化粧品」とを、部分コメントおよび評価対象語として、図示しない記録媒体に一時蓄積する。なお、図示しない記録媒体に蓄積された情報を図11に示す。ここで、一時蓄積された情報は、図11の「ID=1」のレコードである。なお、図11は、コメント評価対象語対応表である。コメント評価対象語対応表は、コメントまたは部分コメントと、当該コメントまたは部分コメントに対応する評価対象語または固有名称とを有する1以上のレコードを管理する。
次に、評価対象決定部124は、部分コメントバッファに第2文「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」を上書きする。また、評価対象決定部124は、評価対象バッファに固有名称「XYZ化粧水」を上書きする。
次に、評価対象決定部124は、部分コメントバッファの情報「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」と、評価対象バッファの情報「XYZ化粧水」とを、部分コメントおよび評価対象語として、図示しない記録媒体に一時蓄積する。ここで、一時蓄積された情報は、図11の「ID=2」のレコードである。
次に、2番目のコメントの処理を行なう。つまり、評価対象決定部124は、部分コメントバッファにNULLを代入し、評価対象バッファにNULLを代入する。そして、評価対象決定部124は、「ID=2」のコメント「A社のABC化粧水は、しっとりし、ハリも出るのよ。」を取得する。
次に、評価対象決定部124は、コメント「A社のABC化粧水は、しっとりし、ハリも出るのよ。」を形態素解析し、主語である評価対象語「A社のABC化粧水」を取得する。
次に、評価対象決定部124は、評価対象語は取得できたが、取得した評価対象語が、評価対象バッファに格納されている評価対象語または固有名称と同一でない、と判断する。そして、評価対象決定部124は、コメント「A社のABC化粧水は、しっとりし、ハリも出るのよ。」を、部分コメントバッファに蓄積する。また、評価対象決定部124は、評価対象バッファに評価対象語(ここでは、固有名称)「A社のABC化粧水」を蓄積する。なお、評価対象決定部124は、評価対象バッファに「ABC化粧水」を蓄積しても良い。
次に、評価対象決定部124は、部分コメントバッファの情報「A社のABC化粧水は、しっとりし、ハリも出るのよ。」と、評価対象バッファの情報「A社のABC化粧水」とを、コメントおよび固有名称として、図示しない記録媒体に一時蓄積する。なお、図示しない記録媒体に蓄積された情報を図11に示す。ここで、一時蓄積された情報は、図11の「ID=3」のレコードである。
以下、同様に、評価対象決定部124は、図10の「ID=4」以降のコメントを処理し、図11の「ID=4」以降のレコードを得た、とする。図11の表により、評価対象ごとに、コメントを分割できた。
次に、コメント評価値取得部125は、図11のコメントまたは部分コメントに対して、コメントまたは部分コメントごとの評価値を算出する。
まず、コメント評価値取得部125は、図11の「ID=1」の評価対象語等の「A社の化粧品」を取得する。コメント評価値取得部125は、「A社の化粧品」は固有名称ではない、と判断する。なお、形態素解析等の公知技術により、固有名称であるか否かは判断可能であるので、上記判断方法の詳細な説明を省略する。
次に、コメント評価値取得部125は、評価対象語「A社の化粧品」に対応する評価対象語「化粧品」を辞書格納部121から取得する。この評価語辞書は、図8の「ID=1」に対応する評価語とラベルの集合である。ここで、「対応する」とは、予め決められた関係を有することを言う。予め決められた関係とは、例えば、一致すること、または部分一致すること等である、とする。
次に、ここでは、コメント評価値取得部125は、階層情報を利用して、評価語辞書を取得すると判断した、とする。また、コメント評価値取得部125は、カレントの評価対象語「化粧品」の親が存在しないと、図7の階層情報を用いて判断する。
次に、コメント評価値取得部125は、部分コメント「A社の化粧品はすばらしい。」に含まれる評価語(ここでは「すばらしい」)を取得する。そして、コメント評価値取得部125は、評価語「すばらしい」に対応するラベル「5」を、取得した評価語辞書から取得する。そして、コメント評価値取得部125は、ラベル「5」を、部分コメント「A社の化粧品はすばらしい。」の評価値とし、蓄積する。かかる処理により、図12のコメント評価値管理表の「ID=1」のレコードが生成された。コメント評価値管理表は、「ID」「コメントまたは部分コメント」「評価対象語または固有名称」「評価値」を有する1以上のレコードからなる。「評価値」は、コメントに対する評価値である。
次に、コメント評価値取得部125は、図11の「ID=2」の評価対象語等の「XYZ化粧水」を取得する。次に、コメント評価値取得部125は、「XYZ化粧水」は固有名称である、と判断する。
次に、コメント評価値取得部125は、取得した固有名称「XYZ化粧水」と対になる評価対象語「化粧水」を、図9の固有名称情報管理表から取得する。
次に、コメント評価値取得部125は、取得した評価対象語「化粧水」に対応する評価語辞書を辞書格納部121から取得する。この評価語辞書は、図8の「ID=112」に対応するレコードの集合である。
次に、コメント評価値取得部125は、階層情報を利用して、評価語辞書を取得すると判断する。そして、コメント評価値取得部125は、カレントの評価対象語「化粧水」の親の評価対象語は、「ID=11」の「スキンケア」であると判断する。次に、コメント評価値取得部125は、評価対象語「スキンケア」に対応する評価語辞書を辞書格納部121から取得する。この評価語辞書は、図8の「ID=11」に対応するレコードの集合である。そして、コメント評価値取得部125は、カレントの評価対象語を「スキンケア」とする。次に、コメント評価値取得部125は、カレントの評価対象語「スキンケア」の親の評価対象語は、「ID=1」の「化粧品」であると判断する。次に、コメント評価値取得部125は、評価対象語「化粧品」に対応する評価語辞書を辞書格納部121から取得する。この評価語辞書は、図8の「ID=1」に対応するレコードの集合である。以上より、図8の「ID=1」「ID=11」「ID=112」に対応する評価語とラベルの集合が、辞書格納部121から取得された。
次に、コメント評価値取得部125は、部分コメント「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」に含まれる評価語(ここでは「潤い」)を取得する。また、コメント評価値取得部125は、当該部分コメントから、評価語に後続する否定語「出ない」を取得する。そして、評価語「潤い」に対応するラベル「3」を、取得した評価語辞書から取得する。次に、否定語「出ない」により、コメント評価値取得部125は、取得したラベル「3」に「−1」を乗算し、評価値「−3」を取得する。そして、コメント評価値取得部125は、評価値「−3」を、部分コメント「ただ、XYZ化粧水だけは、潤いが出ない、と思うの。」の評価値とし、蓄積する。かかる処理により、図12のコメント評価値管理表の「ID=2」のレコードが生成された。なお、ここでは、否定語を有する場合、評価語に対するラベルに「−1」を乗算したが、他の演算式により、評価値を取得しても良い。
次に、コメント評価値取得部125は、図11の「ID=3」の評価対象語等の「A社のABC化粧水」を取得する。次に、コメント評価値取得部125は、「A社のABC化粧水」は固有名称「ABC化粧水」を含む、と判断する。
次に、コメント評価値取得部125は、取得した固有名称「ABC化粧水」と対になる評価対象語「化粧水」を、図9の固有名称情報管理表から取得する。
次に、コメント評価値取得部125は、取得した評価対象語「化粧水」に対応する評価語辞書を辞書格納部121から取得する。この評価語辞書は、図8の「ID=112」に対応するレコードの集合である。さらに、上記と同様に、コメント評価値取得部125は、コメント評価値取得部125は、階層情報を利用して、評価語辞書を取得する。つまり、コメント評価値取得部125は、図8の「ID=1」「ID=11」「ID=112」に対応する評価語とラベルの集合を、評価のための辞書の情報として取得する。
次に、コメント評価値取得部125は、コメント「A社のABC化粧水は、しっとりし、ハリも出るのよ。」に含まれる評価語(ここでは「しっとり」「ハリ」)を取得する。そして、評価語「しっとり」「ハリ」に対応するラベル「4」「5」を、取得した評価語辞書から取得する。次に、コメント評価値取得部125は、取得したラベル「4」「5」の和である評価値「9」を取得する。なお、ここでは、一のコメントまたは部分コメントが2以上のラベルを含む場合、当該2以上のラベルの和を評価値としたが、2以上のラベルの増加関数により、評価値を算出すれば良い。
次に、コメント評価値取得部125は、図11の「ID=4」以降のコメントまたは部分コメントを同様に処理し、図12の表を得た、とする。
次に、対象評価値取得部126は、評価対象語ごとに、対応する1以上のコメントの評価値を統計処理し、評価対象の評価値を算出する。例えば、対象評価値取得部126は、図12の「ID=3」および「ID=7」のレコードが有する2つの「評価値」の平均を算出し、評価対象語「ABC化粧水」の評価値「7」を取得する。なお、平均ではなく、対象評価値取得部126は、2以上のコメント評価値の合計や中央値等を算出して、評価対象の評価値を取得しても良い。
以上、本実施の形態によれば、評価対象ごとに、少なくとも一部に異なる評価語辞書を用いて、口コミ等のコメントの評価対象を決定し、当該評価対象に対応する評価語辞書を用いて、コメントを分析し、評価対象の評価を得ることができる。
また、本実施の形態において、階層化されている評価語辞書を用いて、コメントを分析し、評価対象の評価を適切に得ることができる。
また、本実施の形態において、商品やサービスや人等の固有名称が属する分類に応じて異なる評価語辞書を用いて、コメントを分析し、評価対象の評価を得ることができる。
さらに、本実施の形態において、一のコメントの中に、2以上の評価対象のコメントが存在する場合でも、評価対象の評価を適切に得ることができる。
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置12を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータ読み取り可能な記録媒体は、評価対象を示す用語である評価対象語と、評価対象に対する評価を示す用語である1以上の評価語を有する評価語辞書とを有する評価情報を、2以上の評価対象ごとに格納し得る辞書格納部121を具備し、コンピュータを、1以上のユーザが入力した1以上のコメントであり、外部装置11に格納されていた1以上のコメントを取得するコメント取得部123と、前記コメント取得部123が取得した1以上の各コメントの評価対象を決定する評価対象決定部124と、前記1以上の各コメントに対して、前記評価対象決定部124が決定した評価対象を示す評価対象語に対応する評価語辞書を用いて、各コメントの評価値を取得するコメント評価値取得部125と、前記評価対象ごとに、当該評価対象に対応する1以上の評価値を用いて、前記評価対象の評価値を取得する対象評価値取得部126と、前記評価対象ごとに、前記対象評価値取得部126が取得した評価対象の評価値を出力する出力部127として機能させるためのプログラム、である。
また、上記プログラムにおいて、前記評価対象は3以上存在し、前記3以上の評価対象は階層化されており、前記辞書格納部121は、前記階層化されている3以上の評価対象の階層関係を示す情報である階層情報をも格納しているものとして、コンピュータを動作させることは好適である。
また、上記プログラムにおいて、前記コメント評価値取得部125は、前記評価対象決定部124が決定した評価対象の上位にある評価対象に対応する評価語辞書をも用いて、各コメントの評価値を取得するものとして、コンピュータを動作させることは好適である。
また、前記記録媒体は、固有名称と評価対象語とを対応付ける1以上の固有名称情報を格納し得る固有名称情報格納部122をさらに具備し、上記プログラムにおいて、前記評価対象決定部124は、前記コメント取得部123が取得した1以上の各コメントと前記固有名称情報格納部122の1以上の固有名称とを用いて、各コメントの評価対象に対応する固有名称を決定し、前記コメント評価値取得部125は、前記1以上の各コメントに対して、前記評価対象決定部124が決定した固有名称に対応する評価対象語と対になる評価語辞書を用いて、各コメントの評価値を取得するものとして、コンピュータを動作させることは好適である。
また、上記プログラムにおいて、前記評価対象決定部124は、一のコメントの中から、2以上の評価対象、および当該2以上の各評価対象に対応するコメントの部分である2以上の部分コメントを、対応付けて取得し、前記コメント評価値取得部125は、前記2以上の各部分コメントに対して、当該各部分コメントに対応する評価対象と対になる評価語辞書を用いて、各部分コメントの評価値を取得するものとして、コンピュータを動作させることは好適である。
また、上記プログラムにおいて、前記評価対象決定部124は、前記コメント取得部123が取得した1以上の各コメントまたは1以上の各部分コメントと、前記辞書格納部121に格納されている1以上の評価対象語および1以上の評価語とを用いて、各コメントまたは各部分コメントに対応する評価対象を決定するものとして、コンピュータを動作させることは好適である。
(実施の形態2)
本実施の形態において、評価対象ごとに、一部に異なる評価語辞書を格納しており、評価語辞書を用いて、口コミ等のコメントの評価対象を決定し、コメントに評価対象語を付与することにより、コメントを分類する情報システム2について説明する。
また、本実施の形態において、口コミ等のコメントに対して、階層化されている評価対象により異なる評価語辞書を用いて、2以上のコメントを分類できる情報システム2について説明する。
また、本実施の形態において、一のコメントの中に、2以上の評価対象のコメントである2以上の部分コメントが存在し得る場合でも、部分コメントを適切に分類できる情報システム2について説明する。
さらに、本実施の形態において、評価対象により異なる評価語辞書を用いて、2以上のコメントの対象の粒度を取得できる。
本実施の形態における情報システム2の概念図は、図1と同様である。図13は、本実施の形態における情報システム2のブロック図である。情報システム2は、1以上の外部装置11、情報処理装置22、および1以上の端末装置13を備える。情報処理装置22は、口コミ等の2以上のコメントの評価対象を決定し、当該評価対象を用いて、2以上のコメントを分類する装置である。
情報処理装置22は、辞書格納部121、コメント取得部123、評価対象決定部224、出力部227を備える。
情報処理装置22を構成する評価対象決定部224は、コメント取得部123が取得した1以上の各コメントと、辞書格納部121に格納されている2以上の評価語辞書を用いて、各コメントに対応する評価対象語を取得する。
評価対象決定部224は、コメント取得部123が取得した1以上の各コメントと、辞書格納部121に格納されている1以上の評価語とを用いて、各コメントに対応する評価対象語を取得しても良い。例えば、評価対象決定部224は、コメント中に出現する1以上の各評価語に対応する1以上の評価対象語を取得し、当該1以上の評価対象語のうち、最も多い数の評価対象語を、当該コメントの評価対象語と決定しても良い。なお、この評価対象語は、コメントの分類を示す、と言える。
評価対象決定部224は、コメント取得部123が取得した1以上の各コメントと、辞書格納部121に格納されている1以上の評価対象語および1以上の評価語とを用いて、各コメントに対応する評価対象語を取得することは好適である。
評価対象決定部224は、一の評価対象の上位にある評価対象に対応する評価語辞書をも用いて、コメント取得部123が取得した1以上の各コメントを分析し、各コメントに対応する評価対象語を取得することは好適である。ここで、評価対象語の取得について、複数の評価対象語を取得した場合、例えば、階層化されている最下位の一の評価対象語を、最終的な評価対象語として取得しても良い。
また、評価対象決定部224は、コメント取得部123が取得した1以上の各コメントのうちの少なくとも一のコメントを2以上の部分コメントに分け、2以上の各部分コメントを、辞書格納部121に格納されている2以上の評価語を用いて分析し、各部分コメントに対応する評価対象語を取得することは好適である。ここで、コメントを2以上の部分コメントに分けるアルゴリズムの例は、実施の形態1で説明した。
さらに、評価対象決定部224は、評価対象語に対応する階層識別子、または階層識別子に対応する階層をも取得することは好適である。
評価対象決定部224は、通常、MPUやメモリ等から実現され得る。評価対象決定部224の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部227は、1以上の各コメントと、評価対象決定部224が取得した評価対象語とを対応付けて出力する。出力部227は、1以上の各コメントと、評価対象決定部224が取得した階層識別子または階層識別子に対応する階層とを出力しても良い。出力部227は、1以上の各コメントと、評価対象決定部224が取得した評価対象語と、評価対象決定部224が取得した階層識別子または階層識別子に対応する階層とを対応付けて出力しても良い。
出力部227は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部227は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
次に、情報処理装置22の動作について、図14のフローチャートを用いて説明する。図14のフローチャートにおいて、図3のフローチャートと同一のステップについて、説明を省略する。
(ステップS1401)評価対象決定部224は、ステップS303で取得されたコメントを分類する。かかるコメント分類処理について、図15のフローチャートを用いて説明する。
次に、ステップS1401のコメント分類処理について、図15のフローチャートを用いて説明する。
(ステップS1501)評価対象決定部224は、ステップS303で取得されたコメントを、例えば、手がかり句(例えば、「改行」、または「改行+全角スペース」等)を用いて、2以上の部分コメントに分割する。なお、ここで、ステップS303で取得されたコメントを分割できない場合もあり、かかる場合、コメントは一の部分コメントからなる、と考えても良い。なお、本ステップにおいて、ステップS401のコメント分割処理により、コメントを分割しても良い。
(ステップS1502)評価対象決定部224は、カウンタiに1を代入する。
(ステップS1503)評価対象決定部224は、ステップS1501で取得したi番目の部分コメントが存在するか否かを判断する。i番目の部分コメントが存在すればステップS1504に行き、存在しなければ上位処理にリターンする。
(ステップS1504)評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、i番目の部分コメントの中の1以上の評価語を取得する。
(ステップS1505)評価対象決定部224は、ステップS1504で取得した1以上の各評価語に対応する1以上の評価対象語を、辞書格納部121から取得する。
(ステップS1506)評価対象決定部224は、辞書格納部121の情報を用いて、ステップS1505で取得した1以上の評価対象語のうち、最も多く出現する評価対象語を取得する。そして、評価対象決定部224は、当該取得した評価対象語の階層識別子を、階層情報を用いて取得する。なお、階層識別子は、評価対象語の階層を特定する情報である。
(ステップS1507)出力部227は、i番目の部分コメントと、ステップS1506で取得した評価対象語と、階層識別子とを出力する。なお、出力部227は、i番目の部分コメントと評価対象語、またはi番目の部分コメントと階層識別子を出力しても良い。
(ステップS1508)評価対象決定部224は、カウンタiを1、インクリメントする。ステップS1503に戻る。
なお、図15のフローチャートのステップS1506において、評価対象決定部224は、最も多く出現する評価対象語を取得した。しかし、ステップS1506において、評価対象決定部224は、評価対象語のうちで、最下位の階層の評価対象語を取得する等しても良い。
以下、本実施の形態における情報システム2の具体的な動作について説明する。情報システム2の概念図は図1と同様である。
今、情報処理装置22の辞書格納部121は、図7に示す評価対象語の階層関係を示す階層情報を管理する階層情報管理表を格納している。また、辞書格納部121は、図8に示す評価対象語ごとの評価語辞書を格納している。なお、ここでは、評価語辞書は、「ラベル」を有さなくても良い。さらに、外部装置11は、図10に示すようなコメントを格納している。
なお、本具体例において、部分コメントは考慮せず、情報処理装置22は、コメントを分類する、とする。
まず、コメント取得部123は、1以上のコメントを取得する。ここで、取得されたコメントは、図10のコメントである、とする。
まず、評価対象決定部224は、取得されたコメントの中の1つ目のコメントの処理を行なう。つまり、まず、評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、1番目のコメントの中の1以上の評価語「すばらしい」「潤い」を取得する。
次に、評価対象決定部224は、取得した2つの評価語「すばらしい」「潤い」に対応する評価対象語「化粧品」「化粧水」を、辞書格納部121から取得する。次に、評価対象決定部224は、評価対象語「化粧品」「化粧水」のうちで、最下位の階層の評価対象語「化粧水」を取得する。
また、評価対象決定部224は、当該取得した評価対象語「化粧水」の階層識別子「3」を、階層情報を用いて取得する。なお、階層識別子は、階層、または階層の深さを示す情報であり、ここでは、「化粧品」は「1」、「スキンケア」は「2」、「化粧水」は「3」である。
次に、出力部227は、1番目のコメントと、取得した評価対象語「化粧水」と、階層識別子「3」とを出力する。ここで、出力した情報は、図16の「ID=1」のレコードである。なお、図16は、コメント分類管理表である。図16は、コメントの分類に関する情報を含む表であり、「ID」「コメント」「分類」「階層識別子」を有する1以上のレコードを管理する。
次に、評価対象決定部224は、取得されたコメントの中の2つ目のコメントの処理を行なう。つまり、まず、評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、2番目のコメントの中の1以上の評価語「しっとり」「ハリ」を取得する。
次に、評価対象決定部224は、取得した2つの評価語「しっとり」「ハリ」に対応する評価対象語「スキンケア」「化粧水」を、辞書格納部121から取得する。次に、評価対象決定部224は、評価対象語「スキンケア」「化粧水」のうちで、最下位の階層の評価対象語「化粧水」を取得する。
また、評価対象決定部224は、当該取得した評価対象語「化粧水」の階層識別子「3」を、階層情報を用いて取得する。
次に、出力部227は、2番目のコメントと、取得した評価対象語「化粧水」と、階層識別子「3」とを出力する。ここで、出力した情報は、図16の「ID=2」のレコードである。
次に、評価対象決定部224は、取得されたコメントの中の3つ目のコメントの処理を行なう。つまり、まず、評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、3番目のコメントの中の1以上の評価語「すっきり」を取得する。
次に、評価対象決定部224は、取得した評価語「すっきり」に対応する評価対象語「洗顔」を、辞書格納部121から取得する。
また、評価対象決定部224は、当該取得した評価対象語「洗顔」の階層識別子「3」を、階層情報を用いて取得する。
次に、出力部227は、3番目のコメントと、取得した評価対象語「洗顔」と、階層識別子「3」とを出力する。ここで、出力した情報は、図16の「ID=3」のレコードである。
次に、評価対象決定部224は、取得されたコメントの中の4つ目のコメントの処理を行なう。つまり、まず、評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、4番目のコメントの中の1以上の評価語「湿疹」を取得する。
次に、評価対象決定部224は、取得した評価語「湿疹」に対応する評価対象語「スキンケア」を、辞書格納部121から取得する。
また、評価対象決定部224は、当該取得した評価対象語「スキンケア」の階層識別子「2」を、階層情報を用いて取得する。
次に、出力部227は、4番目のコメントと、取得した評価対象語「スキンケア」と、階層識別子「2」とを出力する。ここで、出力した情報は、図16の「ID=4」のレコードである。
次に、評価対象決定部224は、取得されたコメントの中の5つ目のコメントの処理を行なう。つまり、まず、評価対象決定部224は、辞書格納部121の1以上の評価語を用いて、4番目のコメントの中の1以上の評価語「すばらしい」「もちもち」「ハリ」を取得する。
次に、評価対象決定部224は、取得した評価語「すばらしい」「もちもち」「ハリ」に対応する評価対象語「化粧品」「スキンケア」「化粧水」を、辞書格納部121から取得する。次に、評価対象決定部224は、評価対象語「化粧品」「スキンケア」「化粧水」のうちで、最下位の階層の評価対象語「化粧水」を取得する。
また、評価対象決定部224は、当該取得した評価対象語「化粧水」の階層識別子「3」を、階層情報を用いて取得する。
次に、出力部227は、5番目のコメントと、取得した評価対象語「化粧水」と、階層識別子「3」とを出力する。ここで、出力した情報は、図16の「ID=5」のレコードである。
以上の処理を取得されたコメントの中の6つ目以降のコメントに対しても行ない、図16のコメント分類管理表を得る。なお、図16において、コメントが分類されており、かつコメントの階層(粒度)は判別できる。
以上、本実施の形態によれば、評価対象により異なる評価語辞書を用いて、2以上のコメントを分類できる。
また、本実施の形態によれば、口コミ等のコメントに対して、階層化されている評価対象により異なる評価語辞書を用いて、2以上のコメントを分類できる。
さらに、本実施の形態によれば、評価対象により異なる評価語辞書を用いて、2以上のコメントの対象の粒度を取得できる。
なお、本実施の形態における情報処理装置22を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータ読み取り可能な記録媒体は、評価対象を示す用語である評価対象語と評価対象に対する評価を示す用語である1以上の評価語とを有する評価語辞書とを有する評価情報を、2以上の評価対象ごとに格納し得る辞書格納部121を具備し、コンピュータを、1以上のユーザが入力した1以上のコメントであり、外部装置11に格納されていた1以上のコメントを取得するコメント取得部123と、前記コメント取得部123が取得した1以上の各コメントと、前記辞書格納部121に格納されている2以上の評価語辞書を用いて、各コメントに対応する評価対象語を取得する評価対象決定部224と、前記1以上の各コメントと前記評価対象決定部224が取得した評価対象語とを対応付けて出力する出力部227として機能させるためのプログラム、である。
上記プログラムにおいて、前記評価対象決定部224は、前記コメント取得部123が取得した1以上の各コメントと、前記辞書格納部121に格納されている1以上の評価語とを用いて、各コメントに対応する評価対象語を取得するものとして、コンピュータを機能させるプログラムであることは好適である。
上記プログラムにおいて、前記評価対象は3以上存在し、前記3以上の評価対象は階層化されており、前記辞書格納部121は、前記階層化されている3以上の評価対象の階層関係を示す情報である階層情報をも格納しているものとして、コンピュータを機能させるプログラムであることは好適である。
上記プログラムにおいて、前記評価対象決定部224は、一の評価対象の上位にある評価対象に対応する評価語辞書をも用いて、前記コメント取得部123が取得した1以上の各コメントを分析し、前記各コメントに対応する評価対象語を取得するものとして、コンピュータを機能させるプログラムであることは好適である。
上記プログラムにおいて、前記評価対象決定部224は、前記コメント取得部123が取得した1以上の各コメントのうちの少なくとも一のコメントを2以上の部分コメントに分け、当該2以上の各部分コメントを、前記辞書格納部121に格納されている2以上の評価語を用いて分析し、前記各部分コメントに対応する評価対象語を取得するものとして、コンピュータを機能させるプログラムであることは好適である。
上記プログラムにおいて、前記階層情報は、各評価対象語に対応する階層を識別する階層識別子を有し、前記評価対象決定部224は、前記評価対象語に対応する階層識別子、または当該階層識別子に対応する階層をも取得し、前記出力部227は、前記1以上の各コメントと、前記階層識別子または当該階層識別子に対応する階層とを対応付けて出力するものとして、コンピュータを機能させるプログラムであることは好適である。
また、図17は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図17は、このコンピュータシステム300の概観図であり、図18は、システム300のブロック図である。
図17において、コンピュータシステム300は、CD−ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304と、マイクと、スピーカーとを含む。
図18において、コンピュータ301は、CD−ROMドライブ3012に加えて、MPU3013と、バス3014と、ROM3015と、RAM3016と、ハードディスク3017とを含む。なお、バス3014は、MPU3013やCD−ROMドライブ3012に接続されている。また、ROM3015には、ブートアッププログラム等のプログラムが記憶されている。また、RAM3016は、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのものである。また、ハードディスク3017は、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのものである。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム300に、上述した実施の形態の情報処理装置等の機能を実行させるプログラムは、CD−ROM3101に記憶されて、CD−ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD−ROM3101またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ301に、上述した実施の形態の情報処理装置等の機能を実行させるオペレーティングシステム、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信するステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。