JP2003281161A

JP2003281161A - 情報分類方法、情報分類装置、プログラムおよび記録媒体

Info

Publication number: JP2003281161A
Application number: JP2002076922A
Authority: JP
Inventors: Koji Yamada; 孝司山田; Takashige Tanaka; 敬重田中
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 2002-03-19
Filing date: 2002-03-19
Publication date: 2003-10-03

Abstract

(57)【要約】【課題】例えばメーカの担当者が顧客の反響を取り入
れ、顧客が満足する製品を開発するときの指針を得るこ
とができるように文書データを分類する。【解決手段】問合せ分析装置１０の問合せデータ分類
部１００は、問合せデータベース２４ａに蓄積されてい
る問合せデータを内容ごとに分類する。そして、感情判
定部１０４は、各問合せデータの問合せ文に反映された
顧客の感情を判定し、この判定結果に従って、データ集
計部１０６が内容ごとに分類された問合せデータを感情
ごとに細分類する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報分類方法、情
報分類装置、コンピュータを情報分類装置として機能さ
せるためのプログラム、および、このプログラムを記録
したコンピュータ読み取り可能な記録媒体に関する。

【０００２】

【従来の技術】近年では、一般家庭へのコンピュータの
普及と、インターネット環境の発達とが相俟って、顧客
が購入した製品のサポートに電子メールなどを利用する
メーカが増えている。顧客から寄せられる電子メールの
内容には、消費者の動向や製品に対する要望、ニーズと
いったメーカ側にとって貴重な情報が含まれていること
が多い。そこで、メーカでのサポート業務に携わるコー
ルセンタなどでは、顧客から寄せられた電子メールを文
書データとしてデータベースに蓄積し、テキストマイニ
ングと呼ばれる手法により、例えば製品名などのキーワ
ードを基に類似する内容の文書データを分類し、顧客の
ニーズなどを把握するといったことが行われている。例
えば、テキストマイニングの結果、「○○製品」という
キーワードに類似する内容の文書データの数よりも、
「××製品」というキーワードに類似する内容の文書デ
ータの数の方が多ければ、メーカは、顧客の関心が「×
×製品」に傾倒していると類推できるのである。

【０００３】

【発明が解決しようとする課題】しかしながら、メーカ
側は、従来の文書データの分類手法による分類結果か
ら、顧客からの反響がどの製品に対して多かったかを把
握できるものの、それがどのような反響であるかを把握
するのは困難である。従って、従来の分類手法では、メ
ーカが顧客の反響を取り入れ、顧客が満足する製品を開
発するときの指針を得ることができないといった問題が
あった。

【０００４】本発明は、上述した事情を鑑みてなされた
ものであり、例えばメーカの担当者が顧客の反響を取り
入れ、顧客が満足する製品を開発するときの指針を得る
ことができるように文書データを分類する情報分類方
法、情報分類装置、プログラムおよび記録媒体を提供す
ることを目的とする。

【０００５】

【課題を解決するための手段】上記目的を達成するため
に、本発明は、テキスト文を含む文書データを分類する
情報分類方法において、文書データのテキスト文を解析
して、この解析結果に応じて当該文書データをクラスタ
に分類する第１の過程と、クラスタに分類された文書デ
ータのテキスト文の感情表現に応じて当該文書データを
サブクラスタに細分類する第２の過程とを備える情報分
類方法を提供する。また、上記目的を達成するために、
本発明は、テキスト文を含む文書データを分類する情報
分類装置において、文書データのテキスト文を解析し
て、この解析結果に応じて当該文書データをクラスタに
分類する第１の分類手段と、クラスタに分類された文書
データのテキスト文の感情表現に応じて当該文書データ
をサブクラスタに細分類する第２の分類手段とを備える
情報分類装置を提供する。

【０００６】上述の情報分類方法および情報分類装置に
よれば、テキスト文の解析結果に応じて文書データがク
ラスタに分類され、更に、当該テキスト文の感情表現に
応じて当該文書データがサブクラスタに細分類される。
これにより、例えばメーカの担当者などは、どのような
問合せ（問合せ文）があるかを把握でき、なおかつ、そ
の問合せ文に反映された顧客の感情を把握できる。従っ
て、担当者は、ある製品に対して、顧客がどのような怒
りを覚え、または、喜んでいるのかといった、製品が顧
客にどのような反響を与えたかを容易に把握でき、顧客
が満足する製品を開発する指針を得ることができる。

【０００７】ここで、上述した情報分類方法において、
前記第１の過程における解析にあっては、文書データの
テキスト文に含まれる各単語の統計値を解析することが
望ましい。また、前記統計値は、全てのテキスト文を対
象に計数された単語の出現回数と、テキスト文ごとに計
数された単語の出現回数とから算出され、テキスト文に
出現する各単語と、当該各単語の統計値とに従って、各
テキスト文を、テキスト文の各々に出現する全ての単語
を要素とした空間ベクトルにて表し、各テキスト文の空
間ベクトル間の距離に応じて各文書データをクラスタに
分類することが望ましい。

【０００８】さらに、上述した情報分類方法において、
前記テキスト文の感情表現は、単語ごとに感情が予め数
値化された感情値と、前記文書データのテキスト文に含
まれる各単語とから特定されることが望ましい。より具
体的には、前記感情値は、複数の感情の各々を要素とす
る感情ベクトルによって表される値であり、前記テキス
ト文の感情表現は、テキスト文に含まれる各単語の感情
ベクトルを要素ごとに積算したときに、積算値が最も大
きい要素に対応する感情から特定される。

【０００９】上記目的を達成するために、本発明は、テ
キスト文を含む文書データを分類するコンピュータを、
文書データのテキスト文を解析して、この解析結果に応
じて当該文書データをクラスタに分類する第１の分類手
段、および、クラスタに分類された文書データのテキス
ト文の感情表現に応じて当該文書データをサブクラスタ
に細分類する第２の分類手段として機能させるためのプ
ログラムを提供する。このプログラムは、例えば磁気デ
ィスクや光磁気ディスク、光ディスクなどのコンピュー
タ読み取り可能な記録媒体に記録されていても良い。

【００１０】

【発明の実施の形態】以下、図面を参照して本発明の実
施形態について説明する。本実施形態では、メーカなど
のコールセンタに寄せられた問合せを、その内容に応じ
て分類するとともに、その問合せに反映された顧客の感
情に応じて分類して分析する問合せ分析装置に本発明が
適用された場合について例示する。

【００１１】図１は、本発明の実施形態に係る問合せ分
析装置が用いられるコールセンタシステムの構成を示す
ブロック図である。この図において、担当者入力端末２
０は、コールセンタ１のサポート担当者によって利用さ
れるコンピュータ端末である。サポート担当者は、電話
交換網５ａを介して顧客から電話やＦＡＸなどで寄せら
れる問合せに対応する者であり、受け付けた問合せを文
章化して担当者入力端末２０に入力する。また、担当者
入力端末２０は、例えばＬＡＮ（Local Area Network）
などの社内ネットワーク２２を介してデータベースサー
バ２４と接続されている。データベースサーバ２４は、
磁気ディスク装置などの記憶装置に格納された問合せデ
ータベース２４ａを有しており、問合せ文が電子データ
化された問合せデータを担当者入力端末２０から受け取
り、問合せデータベース２４ａに蓄積する。

【００１２】メールサーバ２６は、インターネット５ｂ
に接続された端末との間で電子メールの送受信するもの
であり、顧客が利用する顧客端末３から製品に対する問
合せ文を含んだ電子メールを受信し、社内ネットワーク
２２を介してデータベースサーバ２４に送信する。デー
タベースサーバ２４は、メールサーバ２６から受け取っ
た電子メールを、問合せデータベース２４ａに問合せデ
ータとして蓄積する。このような構成により、問合せデ
ータベース２４ａには、顧客からの問合せに応じた問合
せデータが次々に蓄積される。

【００１３】また、同図において、問合せ分析装置１０
は、問合せデータベース２４ａに蓄積されている問合せ
データを分類・集計し、この結果を問合せ分析担当者に
示すものである。この問合せ分析装置１０は、コンピュ
ータなどにより構成されるものであり、問合せデータ分
類部１００を備えている。問合せデータ分類部１００
は、データベースサーバ２４を介して問合せデータベー
ス２４ａに蓄積されている問合せデータを順次受信した
後に、問合せデータの問合せ文に含まれる単語に応じて
分類する分類処理（テキストマイニング処理）を実行し
て、この処理結果を記憶部１０２に出力する。この問合
せデータ分類部１００は、コンピュータにおけるネット
ワークインタフェースデバイス、ＣＰＵおよびＲＡＭに
相当する。

【００１４】ここで、問合せデータ分類部１００が実行
する分類処理には、ベクトル化処理と、クラスタリング
処理との２つの処理が含まれている。より具体的に説明
すると、ベクトル化処理は、次のようにして行われる。
先ず、１件の問合せ文ｄを単語（形態素）に分解する形
態素解析を実行し、この１件の問合せ文ｄに対して、１
つの単語ｔが出現する頻度を示す単語出現頻度ＴＦ（Te
rm Frequency）を、その問合せ文に含まれる単語ごとに
算出する。ここで、単語出現頻度ＴＦは、その問合せ文
ｄに現れる単語の数で正規化されており、次式によって
算出される。単語出現頻度ＴＦ（ｄ、ｔ）＝（単語ｔが問合せ文ｄに出現する回数）／（問合せ文ｄに含まれる単語の数）

【００１５】次いで、全問合せ文からみて、単語ｔを含
む問合せ文がどの程度特徴的であるか（すなわち、全問
合せ文数に対して単語ｔを含む問合せ文数がどの程度
か）を示す文書出現頻度ＩＤＦ（Inverse Document Fre
quency）を次式によって算出する。ＩＤＦ（ｔ）＝ｌｏｇ｛（全問合せ文の数）／（単語ｔが出現する問合せ文の数）｝

【００１６】そして、単語出現頻度ＴＦと、文書出現頻
度ＩＤＦとから、１つの問合せ文ｄにおいて単語ｔがど
れだけ特徴的（すなわち、出現頻度が高く）であり、な
おかつ、その問合せ文ｄが、問合せ文全体から見てどれ
だけ特徴的であるか（すなわち、どれだけ少ないか）を
示す単語文書出現頻度ＴＦＩＤＦ（Term Frequency Inv
erse Document Frequency）を次式から算出する。ＴＦＩＤＦ（ｄ、ｔ）＝ＴＦ（ｄ、ｔ）×ＩＤＦ（ｔ）

【００１７】次に、全ての問合せ文から、各々の問合せ
文において出現した全単語について、各々の単語の単語
文書出現頻度ＴＦＩＤＦ（Term Frequency Inverse Doc
ument Frequency）を要素とするベクトル空間を形成
し、このベクトル空間における問合せ文ｄのベクトルを
求める。問合せ文ｄのベクトルは、その問合せ文ｄに出
現する各単語についての単語文書出現頻度ＴＦＩＤＦを
要素として求められ、次式のようになる。問合せ文ｄのベクトル＝（ＴＦＩＤＦ（ｔ１）、ＴＦＩＤＦ（ｔ２）、・・・・ＴＦＩＤＦ（ｔｎ））なお、ｎは、問合せ文ｄに出現する単語数である。

【００１８】さて、上述の分類処理におけるクラスタリ
ング処理は、上述したベクトル空間上で、ベクトル間距
離が近い問合せ文同士をグループ化（以下、グループを
「クラスタ」と言う）する処理である。さらに説明する
と、このクラスタリング処理にあっては、略同じ値の単
語文書出現頻度ＴＦＩＤＦの単語によって構成されるベ
クトルを持つ問合せ文同士がグループ化されるため、同
じような文章内容（以下、単に「内容」という）の問い
合わせ文がクラスタに分類されることになる。

【００１９】問合せデータ分類部１００は、この分類処
理を実行することにより、クラスタリング結果テーブル
５０を生成し、分類処理結果として記憶部１０２に記憶
させる。このクラスタリング結果テーブル５０は、図１
２に示すように、問合せデータがどのクラスタに属する
かを示すものであり、問合せデータごとに固有に割り当
てられた問合せ識別情報と、問合せデータが属するクラ
スタのクラスタ識別情報とが対応付けられている。

【００２０】記憶部１０２は、例えば磁気ディスク装置
などの記憶装置で構成されており、問合せデータ分類部
１００からの分類処理結果を記憶する。感情判定部１０
４は、問合せデータ分類部１００にてクラスタに分類さ
れた各問合せデータに対して顧客の感情を判定し、この
判定結果を記憶部１０２に出力するものであり、コンピ
ュータにおけるネットワークインタフェースデバイス、
ＣＰＵおよび記憶装置などから構成される。

【００２１】図２は、感情判定部の機能的構成を示すブ
ロック図である。同図において、辞書記憶部１０４２
は、各種辞書を記憶するものである。形態素解析部１０
４０は、辞書記憶部１０４２に記憶されている辞書を参
照して、問合せデータが示す問合せ文に対して形態素解
析する。

【００２２】より詳細に説明すると、辞書記憶部１０４
２には、自立語辞書７０、付属語辞書７２、感情表現辞
書７４の各々が記憶されている。自立語辞書７０には、
名詞、動詞、形容詞、副詞といった単独でも文節を構成
することのできる単語（自立語）が収録されている。ま
た、付属語辞書７２には、助詞、接続詞といった単独で
は文節を構成せず、常に自立語に付属する単語（付属
語）が収録されている。なお、感情表現辞書７４につい
ては、後述する。形態素解析部１０４０は、自立語辞書
７０および付属語辞書７２を参照しつつ、問合せデータ
の問合せ文を単語（形態素）に分解するといった形態素
解析を実行し、各単語を単語ベクトル検索部１０４４に
出力する。なお、形態素解析には、接続コスト最小法な
どの一般的なアルゴリズムが適用され得る。

【００２３】単語ベクトル検索部１０４４は、形態素解
析部１０４０からの単語を検索キーとして、感情表現辞
書７４を検索し、その単語に該当する感情ベクトル値を
特定するものである。感情表現辞書７４は、図３に示す
ように、１つの単語に感情表現を構成する要素（感情要
素）がどの程度含まれているかを感情ベクトル値として
表したものである。ここで、本実施形態では、図３に示
すように、感情表現は、「喜び」、「悲しみ」、「驚
き」、「恐怖」、「怒り」および「嫌悪」の６次元の感
情要素で構成されるものとし、また、各単語の感情ベク
トル値は、感情要素ごとの合計が「１」になるように割
り当てられるものとする。なお、感情要素として、他の
要素（例えば「苛立ち」や「あせり」など）が含まれる
ようにしても良いことは勿論である。このように単語を
感情要素で数値化すると、例えば、「ありがとう」とい
う単語は、「喜び」の感情ベクトル値が「１」で、他の
感情ベクトル値が「０」となり、また、「わからない」
という単語は、「悲しみ」と「驚き」の感情ベクトル値
が各々「０．５」で、他の感情ベクトル値が「０」とな
る。

【００２４】この感情表現辞書７４は、上述した６次元
の感情要素を有する問合せ文のサンプル（以下、「サン
プル文」という）から感情ベクトル値を求めることによ
り作成されている。感情表現辞書７４の作成手順は、簡
単に説明すると次の通りである。すなわち、第１に、１
つの感情要素につき数十個程度の単語が含まれるような
サンプル文に対して形態素解析する。第２に、形態素解
析によって得られた各単語を、既知の単語文書出現頻度
ＴＦＩＤＦを使用した単語を次元とするベクトル空間上
に配置して、感情の平均ベクトルを求める。ここで、感
情ベクトルの次元数は、全てのサンプル文書における出
現単語数になる。

【００２５】図４は、ベクトル空間上に配置された感情
要素ごとの感情ベクトルの分布を示す模式図である。同
図には、「喜び」の感情を有するサンプル文、「悲し
み」の感情を有するサンプル文、「驚き」の感情を有す
るサンプル文、「恐怖」の感情を有するサンプル文、
「怒り」の感情を有するサンプル文、「嫌悪」の感情を
有するサンプル文の夫々について感情ベクトルの分布が
模式的に示されている。次に各単語について感情要素ご
とに感情の平均ベクトルを求め（図５参照）、その平均
ベクトルの中からベクトル値の大きい感情要素を取り出
して感情表現辞書を作成するのである。

【００２６】さて、このようにして作成された感情表現
辞書７４に対して、単語ベクトル検索部１０４４は、形
態素解析部１０４０からの各単語を検索キーとした検索
を行い、１件の問合せ文（すなわち、１つの問合せデー
タ）に含まれる各単語の感情ベクトル値を単語ごとに感
情表現積算部１０４６に順次出力する。感情表現積算部
１０４６は、受け取った感情ベクトル値を次々に積算
し、問合せ文全体の感情ベクトル値を算出して、判定部
１０４８に出力する。判定部１０４８は、受け取った問
合せ文全体の感情ベクトル値から、この問合せ文に反映
された顧客の感情を判定し、判定結果を記憶部１０２に
出力する。この判定は、例えば問合せ文全体について積
算された感情ベクトル値のうち、最大値を示す感情要素
をもってその問合せ文に反映された顧客の感情と判定す
る。例えば、図６に示すように、問合せ文Ａの場合、積
算された感情ベクトル値のうち、「怒り」の感情ベクト
ル値が最大なので、問合せ文Ａに反映されている顧客の
感情は、「怒り」であると判定される。同様にして、問
合せ文Ｂに反映されている顧客の感情は、「悲しみ」で
あると判定され、問合せ文Ｃに反映されている顧客の感
情は、「喜び」であると判定される。

【００２７】判定部１０４８は、問合せデータベース２
４ａに蓄積されている全ての問合せデータに対して上述
した判定を行い、この判定結果から図１１に示す感情判
定結果テーブル５４を生成し、記憶部１０２に記憶させ
る。同図に示すように、感情判定結果テーブル５４に
は、問合せデータの問合せ識別情報と、この問合せデー
タの問合せ文について判定された感情とが対応付けて記
録されている。

【００２８】次いで、図１において、データ集計部１０
６は、記憶部１０２に記憶されている感情判定結果テー
ブル５４に従って、同一のクラスタであり、かつ、同一
の感情に分類される問合せデータの数を計数し、計数結
果を降順に並べ替えた集計結果テーブル５８を生成し、
記憶部１０２に記憶させるものである。このデータ集計
部１０６は、コンピュータにおけるＣＰＵおよびＲＡＭ
に相当する。

【００２９】また、表示部１１０は、例えばＣＲＴ（Ca
thode-Ray Tube）ディスプレイや液晶ディスプレイなど
の表示装置に相当し、各種情報を示す画面を表示する。
表示制御部１０８は、表示部１１０に表示動作を制御す
るものであり、コンピュータにおけるＣＰＵなどが相当
する。より具体的には、表示制御部１０８は、記憶部１
０２に記憶された集計結果テーブル５８に従って、デー
タ集計部１０６の集計結果画面を表示部１１０に表示さ
せる（図１５参照）。

【００３０】さて、このような構成の下、問合せ分析装
置１０は、問合せデータベース２４ａに蓄積されている
問合せデータを分類・集計する分析処理を行う。この分
析処理の処理手順を示すプログラムは、記憶部１０２に
記憶されている。また、このプログラムは、例えば、光
ディスクや光磁気ディスクなどの可搬型の記録媒体に記
録されたプログラムである。なお、このプログラムがイ
ンターネットなどを介して他のコンピュータから受信さ
れたプログラムがインストールされたものであっても良
い。

【００３１】図７は、問合せ分析装置１０によって実行
される分析処理の手順を示すフローチャートである。同
図に示すように、先ず、問合せ分析装置１０の問合せデ
ータ分類部１００が問合せデータベース２４ａに蓄積さ
ている問合せデータに対してテキストマイニング処理を
実行する（ステップＳ１）。このテキストマイニング処
理にあっては、図８に示すように、上述した問合せデー
タの問合せ文のベクトル化処理（ステップＳ１０）が行
われる。図９は、このベクトル化処理の手順を示すフロ
ーチャートである。同図に示すように、問合せデータ分
類部１００は、問合せデータベースサーバ２４から問合
せデータを１つ取得する（ステップＳ１０１）。次い
で、問合せデータ分類部１００は、この問合せデータの
問合せ文を形態素解析して単語（形態素）に分解する
（ステップＳ１０２）。次に、問合せデータ分類部１０
０は、その問合せ文を対象にして上述した単語出現頻度
ＴＦと文書出現頻度ＩＤＦとを算出し（ステップＳ１０
３）、問合せデータに固有の識別情報を割り当て、識別
情報と単語出現頻度ＴＦと文書出現頻度ＩＤＦとの各々
を対応づけてＲＡＭに格納する（ステップＳ１０４）。
次いで、問合せデータ分類部１００は、問合せデータベ
ース２４ａ内に未処理の問合せデータがあるかを判別し
（ステップＳ１０５）、この判別結果がＹＥＳであれ
ば、この未処理の問合せデータを処理すべく、処理手順
をステップＳ１０１に戻す。一方、ステップＳ１０５の
判別結果がＮＯであれば、問合せデータごとに、上述し
た単語文書出現頻度ＩＦＩＤＦを算出して各問合せ文を
ベクトル化する（ステップＳ１０６）。

【００３２】次いで、問合せデータ分類部１００は、図
８に示すように、問合せ文のベクトル化処理（ステップ
Ｓ１０）が終了した後、ベクトル化された各問合せデー
タに対してクラスタリング処理を行う（ステップＳ１
２）。図１０は、クラスタリング処理の手順を示すフロ
ーチャートである。同図に示すように、先ず、問合せデ
ータ分類部１００は、問合せデータごとに、その問合せ
データに対応するクラスタを生成する（ステップ１２
０）。次いで、問合せデータ分類部１００は、問合せデ
ータのベクトルをクラスタのベクトルとして、ベクトル
間距離が一定値以下となるクラスタをまとめ、新たなク
ラスタを生成する（ステップＳ１２１）。次に、問合せ
データ分類部１００は、ステップＳ１２１にて生成した
各クラスタに固有の識別情報を割り当て（ステップＳ１
２２）、クラスタリング結果テーブル５０（図１２参
照）を生成し、記憶部１０２に記憶させる（ステップ１
２３）。

【００３３】このようにして、各問合せデータが分類さ
れた後、図７に示すように、感情判定部１０４が各問合
せデータに対して上述した感情判定処理を行う（ステッ
プＳ２）。図１１は、感情判定処理の手順を示すフロー
チャートである。同図に示すように、先ず、形態素解析
部１０４０は、データベースサーバ２４から問合せデー
タを１つ取得する（ステップＳ２０１）。次に、形態素
解析部１０４０は、辞書記憶部１０４２に記憶されてい
る辞書を参照して、問合せデータの問合せ文に対して形
態素解析する（ステップＳ２０２）。次いで、単語ベク
トル検索部１０４４は、形態素解析部１０４０からの各
単語の感情ベクトル値を、感情表現辞書７４を参照して
特定し、感情表現積算部１０４６に単語ごとに順次出力
する（ステップＳ２０３）。

【００３４】感情表現積算部１０４６は、単語ベクトル
検索部１０４４から順次受け取った感情ベクトル値を次
々に積算し、問合せ文全体の感情ベクトル値を算出し
て、判定部１０４８に出力する（ステップＳ２０４）。
そして、判定部１０４８は、受け取った問合せ文全体の
感情ベクトル値から、この問合せ文に反映された顧客の
感情（感情表現）を判定し、この判定結果をＲＡＭなど
に格納する（ステップＳ２０５）。次いで、形態素解析
部１０４０は、問合せデータベース２４ａ内に未処理の
問合せデータがあるかを判別し（ステップＳ２０６）、
この判別結果がＹＥＳであれば、その問合せデータに対
して処理を実行すべく、処理手順をステップＳ２０１に
戻す。一方、ステップＳ２０６における判別結果がＮＯ
であれば、判定部１０４８は、各問合せデータについて
判定した感情から、図１３に示すような感情判定結果テ
ーブル５４を生成し、記憶部１０２に記憶させる（ステ
ップＳ２０７）

【００３５】次いで、図７に示すように、データ集計部
１０６は、感情判定結果テーブル５４を参照して、同一
のクラスタであり、かつ、同一の感情に分類される問合
せデータの数を計数し、計数結果を降順に並べ替えた集
計結果テーブル５８を生成し、記憶部１０２に記憶させ
る（ステップＳ３）。そして、表示制御部１０８が記憶
部１０２に記憶された集計結果テーブル５８に従って、
図１５に示すような集計結果画面を表示部１１０に表示
させる（ステップＳ４）。これにより、問合せ分析担当
者は、顧客がどのような感情を抱いているかを、問合せ
の内容別に把握することができる。ここで、図１５にお
いて、集計結果画面の「内容」に表示される文は、クラ
スタに含まれる全問合せデータに対して重要文抽出を実
施し、最も重要であると判定される文である。なお、以
上説明した分析処理は、問合せデータベース２４ａの更
新に対応すべく、一定時間ごとに行われるものであって
も良く、また、問合せ分析担当者の指示があったときに
行われるものであっても良い。

【００３６】以上説明したように、本実施形態によれ
ば、顧客の問合せがその内容および感情によって分類さ
れる。これにより、メーカの担当者などは、顧客がどの
ようなことに対して不満を抱いているかが把握でき、そ
の対応策を講じることができる。すなわち、メーカの担
当者などが顧客の反響を取り入れ、顧客が満足する製品
を開発するときの指針を得ることができる。

【００３７】＜変形例＞上述した実施形態は、あくまで
も例示であって、本発明の一態様を示すものであり、本
発明の範囲内で任意に変形可能である。そこで、以下
に、各種の変形例について説明する。

【００３８】（変形例１）上述した実施形態において、
テキストマイニング処理として、空間ベクトルを用いた
方法について例示したが、これに限らず、例えば、構文
木を用いたものであっても良い。

【００３９】（変形例２）上述した実施形態において、
本発明がメーカなどのコールセンタに寄せられた問合せ
内容を分析する問合せ分析装置に適用された場合につい
て例示したが、これに限らない、すなわち、本発明は、
人の意見が反映された文書データを感情別に分類する装
置に適用可能であり、例えば、インターネット上に設け
られた掲示板に書き込まれた文書を対象として分類する
装置や、アンケートの結果を対象として分類する装置に
も適用可能である。

【００４０】（変形例３）上述した実施形態において、
感情判定部１０４が全ての問合せデータに対して感情を
判定する場合について例示したが、これに限らず、問合
せデータ数が比較的大きいクラスタについてのみ、感情
判定する構成であっても良い。

【００４１】

【発明の効果】メーカの担当者などが顧客の反響を取り
入れ、顧客が満足する製品を開発するときの指針を得る
ことができるように文書データを分類する情報分類方
法、情報分類装置、プログラムおよび記録媒体が提供さ
れる。

【図面の簡単な説明】

【図１】本発明の実施形態に係る情報分類装置が用い
られたコールセンタシステムの構成を示すブロック図で
ある。

【図２】感情判定部の機能的構成を示すブロック図で
ある。

【図３】感情表現辞書の構成を示す概念図である。

【図４】ベクトル空間上に配置された感情要素ごとの
感情ベクトルの分布を示す模式図である。

【図５】感情要素ごとの平均ベクトルを示す模式図で
ある。

【図６】問合せ文の感情判定方法を説明するための図
である。

【図７】問合せ分析装置によって実行される分析処理
の手順を示すフローチャートである。

【図８】問合せデータ分類部によって実行されるテキ
ストマイニング処理の手順を示すフローチャートであ
る。

【図９】問合せデータ分類部によって実行されるベク
トル化処理の手順を示すフローチャートである。

【図１０】問合せデータ分類部によって実行されるク
ラスタリング処理の手順を示すフローチャートである。

【図１１】感情判定部によって実行される感情判定処
理の手順を示すフローチャートである。

【図１２】クラスタリング結果テーブルの一例を示す
図である。

【図１３】感情判定結果テーブルの一例を示す図であ
る。

【図１４】集計結果テーブルの一例を示す図である。

【図１５】表示部に表示される画面の一例を示す図で
ある。

【符号の説明】

１０・・・問合せ分析装置（情報分類装置）、５０・・・クラ
スタリング結果テーブル、５４・・・感情判定結果テーブ
ル、５８・・・集計結果テーブル、１００・・・問合せデータ
分類部、１０２・・・記憶部、１０４・・・感情判定部、１０
６・・・データ集計部、１１０・・・表示部。

Claims

【特許請求の範囲】

【請求項１】テキスト文を含む文書データを分類する
情報分類方法において、文書データのテキスト文を解析して、この解析結果に応
じて当該文書データをクラスタに分類する第１の過程
と、クラスタに分類された文書データのテキスト文の感情表
現に応じて当該文書データをサブクラスタに細分類する
第２の過程とを具備することを特徴とする情報分類方
法。
【請求項２】前記第１の過程における解析にあって
は、文書データのテキスト文に含まれる各単語の統計値
を解析することを特徴とする請求項１に記載の情報分類
方法。
【請求項３】前記統計値は、全てのテキスト文を対象
に計数された単語の出現回数と、テキスト文ごとに計数
された単語の出現回数とから算出され、テキスト文に出現する各単語と、当該各単語の統計値と
に従って、各テキスト文を、テキスト文の各々に出現す
る全ての単語を要素とした空間ベクトルにて表し、各テ
キスト文の空間ベクトル間の距離に応じて各文書データ
をクラスタに分類することを特徴とする請求項２に記載
の情報分類方法。
【請求項４】前記テキスト文の感情表現は、単語ごと
に感情が予め数値化された感情値と、前記文書データの
テキスト文に含まれる各単語とから特定されることを特
徴とする請求項１に記載の情報分類方法。
【請求項５】前記感情値は、複数の感情の各々を要素
とする感情ベクトルによって表される値であり、前記テキスト文の感情表現は、テキスト文に含まれる各
単語の感情ベクトルを要素ごとに積算したときに、積算
値が最も大きい要素に対応する感情から特定されること
を特徴とする請求項４に記載の情報分類方法。
【請求項６】テキスト文を含む文書データを分類する
情報分類装置において、文書データのテキスト文を解析して、この解析結果に応
じて当該文書データをクラスタに分類する第１の分類手
段と、クラスタに分類された文書データのテキスト文の感情表
現に応じて当該文書データをサブクラスタに細分類する
第２の分類手段とを具備することを特徴とする情報分類
装置。
【請求項７】テキスト文を含む文書データを分類する
コンピュータを、文書データのテキスト文を解析して、この解析結果に応
じて当該文書データをクラスタに分類する第１の分類手
段、および、クラスタに分類された文書データのテキスト文の感情表
現に応じて当該文書データをサブクラスタに細分類する
第２の分類手段として機能させるためのプログラム。
【請求項８】テキスト文を含む文書データを分類する
コンピュータを、文書データのテキスト文を解析して、この解析結果に応
じて当該文書データをクラスタに分類する第１の分類手
段、および、クラスタに分類された文書データのテキスト文の感情表
現に応じて当該文書データをサブクラスタに細分類する
第２の分類手段として機能させるためのプログラムを記
録したコンピュータ読み取り可能な記録媒体。