JP3787318B2 - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法、及び情報処理プログラム Download PDF

Info

Publication number
JP3787318B2
JP3787318B2 JP2002196995A JP2002196995A JP3787318B2 JP 3787318 B2 JP3787318 B2 JP 3787318B2 JP 2002196995 A JP2002196995 A JP 2002196995A JP 2002196995 A JP2002196995 A JP 2002196995A JP 3787318 B2 JP3787318 B2 JP 3787318B2
Authority
JP
Japan
Prior art keywords
document data
impression
impression expression
narrowing
expression word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002196995A
Other languages
English (en)
Other versions
JP2004038729A (ja
Inventor
紀孝 大塚
雅子 北浦
真 佐野
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP2002196995A priority Critical patent/JP3787318B2/ja
Publication of JP2004038729A publication Critical patent/JP2004038729A/ja
Application granted granted Critical
Publication of JP3787318B2 publication Critical patent/JP3787318B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関し、例えば、商品に対する顧客ニーズを分析するものに関する。
【0002】
【従来の技術】
従来の商品企画を支援する発明として、例えば特開平6−259441号公報に開示されている発明がある。
この発明は、商品の内容を表現した複数の知識からなるデータベースを元に新商品を提案するものであって、前記データベースにおける知識を、推論に適した表現形式に変換する構文解析手段と、前記内部表現を、所定の基準に基づいて、複数の領域に分類する領域分割手段と、前記各領域間での知識の類推を行い、新知識を構築する新知識構築手段とを備えたものである。
また、一方で特開2000−67109号公報に開示されている発明のように、商品企画活動において収集した顧客ニーズを商品の品質特性に基づいて企画コンセプトを絞り込んでいくものもある。
【0003】
【発明が解決しようとする課題】
ところが、これらの方法では顧客ニーズのうち機能品質や仕様的なものしか考慮されず、感性的・情緒的なニーズ、コンセプトに関するものは対象とされていなかった。また、このことから商品やブランドに対するイメージ、印象といったもののコンセプトが見出されていなかった。
【0004】
そこで、本発明の目的は、顧客アンケート群やWeb上に散在している文書などの文書データを用いて感性的・情緒的な顧客ニーズを発見することができる情報処理装置などを提供することである。
【0005】
【課題を解決するための手段】
本発明は、前記目的を達成するために、請求項1に記載の発明では、文書データを取得する文書データ取得手段と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書と、前記第1の辞書を用いて、前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と、を具備したことを特徴とする情報処理装置を提供する。
請求項に記載の発明では、文書データを取得する文書データ取得手段と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、印象表現語間の類似度を規定した第2の辞書と、前記第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と、を具備したことを特徴とする情報処理装置を提供する。
請求項に記載の発明では、文書データを取得する文書データ取得手段と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の出現頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と、を具備したことを特徴とする情報処理装置を提供する。
請求項に記載の発明では、前記文書データ取得手段で取得した複数の文書データを1つの文書データに併合する併合手段を具備し、前記抽出手段は、前記併合手段で併合した文書データから前記対を抽出することを特徴とする請求項1、請求項2、又は請求項3に記載の情報処理装置を提供する。
請求項に記載の発明では、前記抽出した対に含まれる印象表現語及び名詞句のうち少なくとも一方の表記を統一する表記統一手段を具備し、前記絞り込み手段は、前記表記統一手段で表記が統一された印象表現語と名詞句の対を絞り込むことを特徴とする請求項1から請求項4までのうちの何れか1の請求項に記載の情報処理装置を提供する。
請求項に記載の発明では、前記文書データを前記絞り込み手段で絞り込んだ場合に適切な結果が得られるか否かの適性度を、前記文書データ中の自立語の総数に対する形容詞と形容動詞の数の割合を用いて判定する適性度判定手段を具備し、前記適性度判定手段で適切な結果が得られると判定された場合に、前記絞り込み手段は絞り込みを行うことを特徴とする請求項1から請求項5までのうちの何れか1の請求項に記載の情報処理装置を提供する。
請求項に記載の発明では、前記文書データを前記絞り込み手段で絞り込んだ場合に適切な結果が得られるか否かの適性度を、前記文書データ中の用言の総数に対する、体言との係受けを有する用言の割合を用いて判定する第2の適性度判定手段を具備し、前記第2の適性度判定手段で適切な結果が得られると判定された場合に、前記絞り込み手段は絞り込みを行うことを特徴とする請求項1から請求項までのうちの何れか1の請求項に記載の情報処理装置を提供する。
請求項に記載の発明では、前記文書データの作成順序を取得する作成順序取得手段と、前記取得した作成順序を用いて、前記絞り込み手段による絞り込み結果の前記作成順序における変化である経時変化を取得する経時変化取得手段と、前記取得した経時変化を用いて、前記絞り込み手段による絞り込み結果を更に絞り込む第4の絞り込み手段と、を具備し、前記絞り込み結果提示手段は、前記第4の絞り込み手段による絞り込み結果を提示することを特徴とする請求項1から請求項までのうちの何れか1の請求項に記載の情報処理装置を提供する。
請求項に記載の発明では、前記文書データ取得手段で複数の文書データを取得した場合に、前記印象表現語の使用者が当該印象表現語を用いることによって表す肯定否定に関する印象の度合いを、前記第1の辞書を用いることにより、前記複数の文書データについて解析する解析手段と、前記解析された印象の度合いを用いて前記文書データを分類する分類手段と、を具備し、前記抽出手段は、前記分類された文書データから印象表現語と名詞句の対を抽出することを特徴とする請求項に記載の情報処理装置を提供する。
請求項10に記載の発明では、前記文書データ取得手段で複数の文書データを取得した場合に、前記印象表現語に類似する印象表現語数を、前記第2の辞書を用いることにより算出する解析手段と、当該算出した値を用いて前記文書データを分類する分類手段と、を具備し、前記抽出手段は、前記分類された文書データから印象表現語と名詞句の対を抽出することを特徴とする請求項に記載の情報処理装置を提供する。
請求項11に記載の発明では、文書データ取得手段と、抽出手段と、印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、前記絞り込み手段が、前記第1の辞書を用いて、前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、から構成された情報処理方を提供する。
請求項12に記載の発明では、文書データ取得手段と、抽出手段と、印象表現語間の類似度を規定した第2の辞書と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、前記絞り込み手段が、前記第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、から構成された情報処理方を提供する。
請求項13に記載の発明では、文書データ取得手段と、抽出手段と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、前記絞り込み手段が、前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、から構成された情報処理方を提供する。
請求項14に記載の発明では、文書データを取得する文書データ取得機能と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書を用いて、前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、をコンピュータで実現するための情報処理プログラを提供する。
請求項15に記載の発明では、文書データを取得する文書データ取得機能と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、印象表現語間の類似度を規定した第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、をコンピュータで実現するための情報処理プログラを提供する。
請求項16に記載の発明では、文書データを取得する文書データ取得機能と、対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、をコンピュータで実現するための情報処理プログラを提供する。
【0006】
【発明の実施の形態】
以下、本発明の好適な実施の形態について、図1〜図16を参照して詳細に説明する。
[実施形態の概要]
本実施の形態の顧客ニーズ発見システム1(図1)は、印象表現抽出装置2、パラメータ算出装置4、顧客ニーズ発見装置6から構成されている。
【0007】
印象表現抽出装置2は、特定の商品に対して実施された顧客アンケートなどの文書データを1つのファイルに併合し(文書データ併合部12)、その文書データが顧客ニーズを発見するのに適した文書データか否かを判定する(適性判定部14)。文書データが顧客ニーズを発見するのに適さない場合は、処理を終了する。
【0008】
文書データが顧客ニーズを発見するのに適したものである場合は、当該文書データから印象表現語と当該印象表現語に結びついた名詞句を組で抽出する(印象表現処理部20)。抽出した印象表現語と名詞句の組には、例えば、「もち/悪い」、「付け心地/悪い」(商品が口紅の場合)などと、当該商品に対する顧客ニーズ(顧客が商品に関して不満に思っている点)が含まれているものがある他、顧客ニーズに関係ないものも含まれている。
印象表現抽出装置2は、文書データから抽出した印象表現語と名詞句の組を出現頻度と共にパラメータ算出装置4に出力する。
【0009】
パラメータ算出装置4は、印象表現抽出装置2から受け取った印象表現語と名詞句の組に対して未知価値度(未知価値度算出部26で算出)、評価固定度(評価固定度算出部28で算出)、アフェクト度(アフェクト度算出部30で算出)の各パラメータを算出する。
【0010】
未知価値度は、他の商品から差別化しやすい顧客ニーズを発見する手掛かりを与えるパラメータである。
評価固定度は、どの顧客ニーズから着手すべきかの手掛かりを与えるパラメータである。
アフェクト度は、顧客が商品に対して不満を持っている点を発見する手掛かりを与えるパラメータである。
パラメータ算出装置4は、これらのパラメータを顧客ニーズ発見装置6に出力する。
【0011】
顧客ニーズ発見装置6は、パラメータ算出装置4から受け取った各パラメータを用いて、印象表現語と名詞句の組を絞り込み、顧客ニーズを仮決定する(顧客ニーズ仮決定部36)。
更に、顧客ニーズ発見装置6は、仮決定した顧客ニーズを抽出元文書データの作成日時順にソートし、単位期間ごとに各パラメータを算出する。算出された値の時間推移から、仮決定された顧客ニーズが、増加傾向にあるのか、慢性的なものであるのか、あるいは収束傾向にあるのかがわかる。
【0012】
顧客ニーズ発見装置6は、増加傾向、慢性的な顧客ニーズを絞り込む(時系列調査部38)。
顧客ニーズ発見装置6は、絞り込まれた顧客ニーズに関連するものがある場合(絞り込まれた顧客ニーズの絞り込み元となった文書データに出現する他の印象表現語と名詞句の組など)、これを加えて(関連ニーズ抽出部40)、結果を提示する(顧客ニーズ出力部42)。
【0013】
以上の情報処理により、自由に記述された文書からの顧客ニーズを発見し提示することができる。また、発見者(マーケッター)のスキルによらない安定した顧客ニーズの発見が可能となる。
【0014】
[実施形態の詳細]
図1は、本実施の形態に係る顧客ニーズ発見システム1の構成の一例を示した図である。
顧客ニーズ発見システム1は、印象表現抽出装置2、パラメータ算出装置4、顧客ニーズ発見装置6から構成されている。
【0015】
顧客ニーズ発見システム1は、例えば、所定のプログラムをCPU(Central Processing Unit)によって実行することにより、ソフトウェア的に実現することができる。また、各構成要素の機能を持ったハードウェアを組み合わせることによりハードウェア的に構成することも可能である。
【0016】
印象表現抽出装置2は、文書データ入力部10、文書データ併合部12、適性判定部14、印象表現処理部20などから構成されている。
文書データ入力部10(文書データ取得手段)は、顧客ニーズを抽出するために収集した文書データを入力する機能部である。
【0017】
この文書データは、ある対象(顧客ニーズを発見したい対象)について自由に記述(自由記述)されたものであり、例えば当該対象に対して行ったアンケートや、インターネットを用いて当該対象に対する感想を集めたりしたものである。
【0018】
本実施の形態では、これら文書データは、例えば特定の銘柄の口紅Aといったように、単一の対象に対して記述されたものであるとする。なお、複数の対象に対するものであって、記述内容を対象ごとに自動的に分離することも可能である。
即ち、例えば、口紅Aと口紅Bに関する記述が混在した文書データを、口紅Aに関する文書データと口紅Bに関する文書データに分離することも可能である。
また、本実施の形態で処理する文書データは、当該対象に対して自由に記述された自然文であるとしたが、これに限定せず、所定のフォーマットに従って記入された文書データとすることも可能である。
【0019】
文書データ併合部12(併合手段)は、文書データ入力部10から入力された文書データを受け取り、これらを1つのファイルに併合する。
文書データの併合(マージ)は、ファイル名をキーとして、受け取った文書データをファイル名順に1つの順編成ファイルにまとめることにより行う。
ここで、順編成ファイルとは、入力された順番でレコードが連続して格納されいるファイルを意味する。
以降、特に区別する場合は、併合して生成された文書データを併合文書データと呼び、併合前の個別の文書データを個別文書データと呼ぶことにする。
【0020】
図2は、文書データ併合部12によって併合された併合文書データの一例を示した図である。図に示したように、併合文書データは、ファイル名をキーとしてファイル名順(数字の場合は番号順、英字の場合はアルファベット順など)にソートされ、1つのファイルにまとめられている。
【0021】
これらの文書データは、ある銘柄の口紅に関するアンケート調査から取得したものである。これら、自由記述された文書データから、顧客ニーズを発見することになる。
【0022】
適性判定部14(図1)は、併合文書データが顧客ニーズを抽出するのに相応しいか否かを第1の判定手段16と第2の判定手段18を用いて判定する。
顧客が自由に記述した文書において、顧客ニーズは、ニーズ対象に対する印象を表す印象表現語を用いて表現される場合が多い。
そこで、適性判定部14は、併合文書データ中の印象表現語を分析することにより顧客ニーズを発見することを試みる。
【0023】
第1の判定手段16(適性度判定手段)は、併合文書データにおいて、自立語の総数に対する、形容詞と形容動詞の数の割合により適性判定を行う。
これは、印象表現語は主に形容詞、形容動詞から構成されている点に着目し、形容詞、形容動詞の割合が小さい文書データは、顧客ニーズの発見に適さないと判定するものである。
【0024】
例えば、形容詞や形容動詞を含む文書として、「塗り心地は最高に良いですね」を考えると、顧客がこの商品に対して大変満足していることが推測できる。また、「もちが悪いのが残念」といった文書からは、もちの良いものが求められているという顧客ニーズを抽出することができる。
【0025】
一方、形容詞や形容動詞を含まない文書として、「サンプルでつけてみました」を考えると、顧客がサンプルを付けたところどのような心証を持ったのか不明であり、顧客ニーズを抽出するのには適さない。
【0026】
そこで、第1の判定手段16は、併合文書データを形態素解析し、自立語の総数に対する形容詞と形容動詞の数の割合を調査する。その結果、当該割合が閾値より小さい場合は、併合文書データから印象表現が得にくいので顧客ニーズ抽出に適さないと判定する。適性判定の閾値は任意に設定することができる。
【0027】
図3は、第1の判定手段16により、口紅A及び口紅Bに関するアンケート調査の文書データ、及び新聞記事に対して自立語数に対する形容詞、形容動詞数の割合を分析した結果を示した図である。
図に示したように、口紅Aに関する文書データでは、自立語が13304個あり、そのうち形容詞が929個(割合6.98%)、形容動詞が142個(1.07%)である。また、形容詞と形容動詞の合計は1071個(8.05%)である。
【0028】
口紅Bに関してもほぼ同様の割合で形容詞と形容動詞が含まれている。
一方、新聞記事中には、形容詞が1.71%、形容動詞が0.23%しか含まれていない。
今、適性判定の閾値を5%(自立語数に対する形容詞と形容動詞数の割合)に設定すると、口紅A、口紅Bに関する文書データは、顧客ニーズ発見に関して適性があると判定され、新聞記事は適性がないと判定される。
【0029】
図1に戻り、第2の判定手段18(第2の適性度判定手段)は、第1の判定手段16で適性ありと判定された文書データに対して、用言(形容詞、形容動詞、動詞)の総数に対する体言(名詞)との係り受けがある用言の数の割合を調査し、所定の閾値と比較する。
その結果、割合が閾値より小さい文書データは、何に対する記述かが明示的ではないので、顧客ニーズを抽出するのに適性がないと判定する。適性判定の閾値は任意に設定できる。
【0030】
体言と係り受けがある用言を含む文として「でも塗り心地はしっとりして良いですよ」を考えると、「しっとりして」(用言)−「塗り心地」(体言)、「良いですよ」(用言)−「塗り心地」(体言)といった係り受け関係が含まれている。この結果、この文書は「塗り心地」に対する記述であることがわかる。
また、他の文として「つけた瞬間リップクリームのような軽い付け心地で驚き!」を考えると、「軽い」(用言)−「付け心地」(体言)といった係り受け関係が含まれており、「付け心地」に対する記述であることがわかる。
【0031】
一方、体言と係り受けがない用言を含む文として「よかった!高かったんだけど」、及び「でも、基本的には好きかも(どっちだよ〜)」を考えると、前者は、「よかった」(用言)、後者は「好きかも」(用言)を含むが、何に対する記述であるのかが不明確である。このように、体言と係り受けがない用言を多く含む文書データは、顧客ニーズの抽出に不適格であると考えられる。
【0032】
図4は、先の口紅A、口紅Bに関する文書データ中の用言の数に対する、体言と係受けのある用言の割合を示した図である。
口紅Aに関する文書データでは52.35%であり、口紅Bに関する文書データでは45.58%である。今、閾値を40%に設定した場合、どちらの文書データも適性があると判定される。適性判定の閾値は任意に設定できる。
【0033】
適性判定部14(図1)が、以上で説明した第1の判定手段16、及び第2の判定手段18により、併合文書データが顧客ニーズの発見に適していると判定した場合、顧客ニーズ発見システム1は文書データを用いて顧客ニーズの抽出を行い、適していないと判定した場合は、その旨のアラームを発して処理を終了する。
【0034】
併合文書データが、適性判定部14で顧客ニーズの抽出に適していないと判定された場合でも、第1の判定手段16、及び第2の判定手段18の閾値を変更することで、当該併合文書データが適していると判定させることもできる。
このように、第1の判定手段16、及び第2の判定手段18の閾値は変更可能であるので、試行錯誤しながら適切な閾値を探すことができる。
【0035】
印象表現処理部20は、併合文書データ中の印象表現に関して主に以下の処理を行う。
(1)併合文書データ中から印象表現語と名詞句の組を抽出する(抽出手段)。
(2)名詞句を上位語に集約する(表記統一手段)。
(3)印象表現語を正規化する(表記統一手段)。
以下に、これらの処理について説明する。
【0036】
(1)併合文書データ中から印象表現語と名詞句の組を抽出する。
この処理は、印象表現語と、当該印象表現語に結びついた名詞句の組を併合文書データ中から抽出するものである。
なお、印象表現語と名詞句の組は、印象表現語1つに対して名詞句1つを対応させた印象表現語と名詞句の対から構成されている。
【0037】
印象表現処理部20は、併合文書データを形態素解析、及び構文解析することにより、併合文書データ中に含まれる語の品詞や係り受けを解析する。そして、併合文書データ中の印象表現語と、当該印象表現語と係り受け関係がある名詞句を組で抽出する。また、印象表現語に程度副詞が結びついている場合は、その程度副詞も共に抽出する。程度副詞とは、例えば「すごく」、「あまり(〜ない)」といったように、印象の強さを調節する副詞である。
【0038】
ここで、印象表現語とは、対象となるものの物理的な特徴ではなく、直感的な印象を形容詞や形容動詞などを用いて表現する語である。例えば、「やわらかい」、「クリアな」などの語がある。印象表現語は、感性語、印象語、表現語などと呼ばれることもある。
【0039】
本実施の形態では、印象表現語を次の2つの条件を満たす語として定義する。
(条件1)受け手によってその意味や程度が変わってくるような感性を表す語。
例えば、「美しい」という語は、何を美しいと思うか、どのくらい美しいと思うかは人によって異なるので、条件1を満たしている。
(条件2)単独で用いても一文として意味をなす語。
例えば、「不明」、「不可能」という語は、「何が」の部分がないと単独では意味をなさないため、条件2を満たさない。
【0040】
また、別の表現を用いれば、印象表現語とは差の概念を表す語であるとも言える。即ち、印象表現語は、「Aは、Bより〜だ」の「〜」の部分に当てはめることができる。
例えば、印象表現語「広い」は、通常「アメリカは日本より広い」などと用いられ、このパターンに当てはめることができる。
【0041】
本実施の形態では、上の条件1、2を満たす語を集めた印象表現語辞書を用いて併合文書データ中の印象表現語を認識する。
即ち、各種の印象表現語を登録した印象表現語辞書を用意し、これと、併合文書データ中の語と比較することにより印象表現語を抽出する。
なお、印象表現語辞書を用いずに、形態素解析による品詞パターンから印象表現語を抽出することも可能である。この場合は、品詞パターン条件を満たしているが印象表現語として抽出したくないものや、品詞パターンを満たしていないが印象表現語として抽出したいものを辞書に用意しておくことで、各種の印象表現語を登録した印象表現語辞書を用意した場合と同じ結果を得ることができる。
【0042】
この場合、「口紅用印象表現語辞書」、「香水用印象表現語辞書」、・・・などと、印象表現語辞書を分野別に用意すると、当該分野に関係のない印象表現語と名詞句の組の抽出を防ぐことができる。
また、後述する主観評価表現辞書32を印象表現語辞書として用いることも可能である。
【0043】
(2)名詞句を上位語に集約する。
印象表現処理部20は、抽出した名詞句を図示しないシソーラス辞書を参照しながら上位語に集約する。
シソーラス辞書は、「付け心地 > つけ心地、塗り心地、ぬり心地、・・・」(「付け心地」が、「つけ心地」、「塗り心地」、「ぬり心地」の上位語であることを意味する)、「持ち > もち、モチ、・・・」などの、上位語、下位語に関する知識を保持している。
印象表現処理部20は、シソーラス辞書を参照しながら、印象表現語と名詞句の組に現れる「つけ心地」、「ぬり心地」、・・・などの表記を「付け心地」に変換し、名詞句の表記を統一する。
【0044】
(3)印象表現語を正規化する。
印象表現処理部20は、抽出した印象表現語に対し以下の処理を行い、表記を正規化する。
まず、抽出した印象表現語の活用形を終止形にする。例えば、「しっとりとして」、「良いですよ」は、それぞれ終止形「しっとりとした」、「良い」に変換される。
次に、印象表現処理部20は、図示しない表記揺れ辞書を参照し、同義である漢字、ひらがな、カタカナを何れかの正規化表現に統制する。例えば、「いい」、「よい」、「良い」などの表記を「良い」に統一する。
【0045】
以上の処理によって併合文書データ中の印象表現語を予め設定した標準的な正規形に集約し、表記を正規化表現に統一することができる。
また、必要があれば、正規化された印象表現語で個別文書データを分類することも可能である。
【0046】
印象表現処理部20は、これら表記を統一した印象表現語と名詞句の組を集計して出現頻度を算出し、これら印象表現語と名詞句の組(程度副詞があればこれも含む)、出現頻度、当該組を抽出する元となった個別文書データのファイル名を出力する(図5)。
【0047】
パラメータ算出装置4(図1)は、印象表現抽出装置2から図5に示したような印象表現語と名詞句の組に関する情報を受け取り、(1)未知価値度(未知価値度算出部26で算出)、(2)評価固定度(評価固定度算出部28で算出)、(3)アフェクト度(アフェクト度算出部30で算出)の各パラメータを算出する。
以下にこれらのパラメータについて説明する。
【0048】
(1)未知価値度:
顧客ニーズは、一般的なものより特殊なものに着目した方が競合する商品との差別化が図れるという効果が期待できる。
ここではこれら特殊な顧客ニーズを既知の一般的なニーズから区別するために未知価値度というパラメータを導入し、潜在的な顧客ニーズの分析に用いる。
【0049】
以下で、価値(ある顧客ニーズ)が未知である程度を数値化した未知価値度の考え方、及び算出方法について説明する。なお、未知価値度の計算手順は、まず印象表現語の未知価値度を計算した後、これを用いて名詞句の未知価値度を求めることとした。
【0050】
同一表記の印象表現語で表される印象表現の出現頻度が高いほど、顧客はその印象表現語で表される特徴を求めていると考えられる。しかしこれらの出現頻度を単純に加算した場合、その印象表現語によって表される特徴が一般的なものである場合には、その印象表現語に対する評価が高くなってしまい、本来顧客ニーズを発見する上で重要な印象表現語の評価が相対的に低くなってしまう可能性がある。
【0051】
ところで、例えば「少ない」といった一般的な印象表現語の場合、量の少なさを表す類似の印象表現語はいくつか存在する。
更に、「小さい」のように量が少ないことを表すと拡大解釈できる印象表現語や、「減りやすい」のように対象となる分野特有の表現を含めると更にその数は増える。このように、類似の表現が多い印象表現は、表現方法が多い分、既知の価値であり、潜在的な顧客ニーズではないと考えられる。
【0052】
従って、印象表現語の未知価値度の算出方法は、類似する印象表現語の数を考慮したものとするのが望ましく(即ち、出現頻度が多いと数値が大きくなるのに対し、類似する印象表現語数が多いと小さくなる)、次の式(1)を採用することとした。
【0053】
(印象表現語の未知価値度)=
(印象表現語の出現頻度)/(1+類似する印象表現語数の2乗)・・(1)
【0054】
印象表現語の未知価値度を式(1)で定義することにより、未知価値度は当該印象表現語が文書データ中に出現する頻度が増えるほど大きくなる一方、当該印象表現語に類似する印象表現語が多い場合には小さくなる。
【0055】
従って、この値が大きい印象表現語は顧客が求めている特徴的な印象表現語であると言え、この値が大きい印象表現語で表される特徴ほど潜在的な顧客ニーズが大きいと考えられる。
【0056】
なお、類似する印象表現語数は、ある2つの印象表現語が類似するか否かを判定するための知識(後述する主観評価表現辞書・・・印象表現語間の類似度を規定している)を予め用意しておき、これを用いて当該印象表現語に類似する印象表現語の数を計測する。
主観評価表現辞書に登録してある印象表現語は既知なものであるため、これが多くなるほど未知の価値ではなくなる。
【0057】
次に、上で求めた印象表現語の未知価値度を用いて、当該印象表現語と係り受け関係がある名詞句の未知価値度を計算する。
印象表現語と名詞句の組において、同一表記で表される名詞句に対して、これを修飾している印象表現語ごとに上記の未知価値度を算出し、これを足し合わせる。
【0058】
この値は、名詞句が表す対象に対する顧客の注目の高さを表すと言える。
そして、これを印象表現語の種類の数(異なり印象表現語数と呼ぶことにする)で割る。この値は、印象表現語あたりの名詞句における注目の高さを表している。
【0059】
名詞句の未知価値度は次のように表現することもできる。印象表現語と名詞句の組を、名詞句をノードとして印象表現語を集約し、当該名詞句に集約された印象表現語の未知価値度を合計する。そして、この合計値を、当該名詞句に集約された印象表現語の種類の数で割る。
これを式で表すと下の式(2)のようになる。
【0060】
(名詞句の未知価値度)=
Σ(印象表現語の未知価値度)/(異なり印象表現語数)・・・(2)
【0061】
式(2)で計算される名詞句の未知価値度は、当該名詞句を修飾している各印象表現語の未知価値度の平均である。従って未知価値度の高い印象表現語に多く修飾されていると、名詞句の未知価値度も大きくなる。このように、未知価値度が大きい名詞句の対象には高い感性的な期待が込められていると考えられる。
【0062】
図6は、名詞句の未知価値度の計算例を説明するための図である。
図6(a)は、ある口紅に対する顧客意見から生成した併合文書データに関して、名詞句「潤い感」をノードとして、これと結びついている印象表現語を集約したものである。
【0063】
図に示したように、併合文書データ中、名詞句「潤い感」は4回出現し、これと結びついている印象表現語として「(けっこう)ある」、「ない」、「(全然)ない」、「なかなかだ」が抽出されている。これら印象表現語の未知価値度は、「なかなかだ」が2で、他は1である。印象表現語の未知価値度は、式(1)を用いて算出したものである。
これらを下に示したように式(2)に代入して計算し、名詞句「潤い感」の未知価値度は1.25となる。
【0064】
(1+1+1+2)/4=1.25
【0065】
図6(b)は、同じ文書データに関して、名詞句「ツヤ」をノードとして、これと結びついている印象表現語を集約したものである。図に示したように、文書データ中名詞句「ツヤ」は9回出現している。これに結びつく印象表現語として「自然だ」、「いまいちだ」、・・・などがある。
【0066】
そして、例えば印象表現語「自然だ」に類似する印象表現語は6個あり、印象表現語「自然だ」の未知価値度を式(1)に従って計算すると0.027027となる。
図に示した数値を下に示したように式(2)に代入して名詞句「ツヤ」の未知価値度を計算すると0.4490となる。
【0067】
Figure 0003787318
【0068】
これらより名詞句「潤い感」と名詞句「ツヤ」とでは名詞句「潤い感」の方が、未知価値度が高くなる。このように、顧客の意見数としては「ツヤ」の方が多いにも関わらず「潤い感」の方が重要な意見であることが示唆される。
後に、名詞句の未知価値度の大きいものから印象表現語と名詞句の組を並べ、上位にあるものを顧客の潜在的なニーズとして絞り込む。
【0069】
次に、主観評価表現辞書について説明する。ここでは、お酒に関する印象表現語を規定したお酒用印象表現語辞書群を用いて説明する。この表現語辞書群には、ビール用、ワイン用、日本酒用など、お酒に関する印象表現語をカテゴリごとに規定した主観評価表現辞書が格納されている。
【0070】
アンケート対象がビールの場合は、ビール用の主観評価表現辞書を用い、ワインが対象の場合はワイン用の主観評価表現辞書を用いるといったように、対象に応じたカテゴリの主観評価表現辞書を用いる。
同様に、化粧品用表現辞書群は、口紅用、香水用、・・・などとカテゴリ別の主観評価表現辞書から構成されている。
【0071】
図7はお酒用主観評価表現辞書群の内容を概念的に表したものである。
この図7に示されるように、お酒用主観評価表現辞書群は、ビール用、ワイン用、日本酒用の各主観評価表現辞書など、対象となる各種カテゴリ(お酒の種類)ごとの主観評価表現辞書から構成されている。
【0072】
そして、各カテゴリに属する対象の印象を表すのに用いられる印象表現語、具体的には形容詞・形容動詞に代表される表現語と程度副詞、更に印象の要因と強く結びついている名詞・固有名詞などが予めカテゴリごとに収集され、それぞれ主観評価表現辞書として主観評価表現辞書群に格納される。
【0073】
一方、各カテゴリに関しては、そのカテゴリに属する対象に対して、主観的な類似性を表す要素(主観的特徴要素)が設定されている。例えば、対象を映画とすると、作品の性質に関して「スリル度」、「感動度」、「コメディ度」などの主観的特徴要素が設定されている。また、カテゴリ「ビール」に対しては、図7に示すように、「コク」「キレ」「うまみ」「のどごし」「爽快感」などの主観的特徴要素が設定されている。
【0074】
そして、各印象表現語に対して主観的特徴要素の強さ(レベル値)を指定することで、各印象表現語に対する印象データ(主観的特徴要素)を座標軸とする座標空間に布置される、多次元の座標値(ベクトル)が決定される。
即ち、収集した印象表現語に対して、個々の表現が主観的な特徴要素の強さを指定する、これは印象データ空間の特定の範囲を指し示すという仮説に基づいて、各特徴要素の相対的なレベル値を与えたものである。
【0075】
例えば、図7に示すように、カテゴリ「ビール」に対する印象表現語「コクのある」には、主観的特徴要素「コク」の相対値が3、主観的特徴要素「キレ」の相対値が0、・・・という印象データが与えられている。
換言すれば、主観評価表現辞書の論理的な構成は、座標軸に主観的特徴要素を対応させたN次元のユークリッド空間において、当該空間内の点に印象表現語を対応させたものとなっている。ここでNは主観的特徴要素の数である。
このように、主観的特徴要素を基本ベクトルとするN次元のベクトル空間に、各印象表現語を布置すると、これら印象表現語はこの空間でベクトルとして表される。
【0076】
もっとも、本実施の形態では、主観評価表現辞書の論理的な構造を簡単にするため、座標軸上に主観的特徴要素がのっており、座標軸の定性的側面(軸の方向)と定量的な側面(軸上の目盛りの間隔)を規定しているが、必ずしも座標軸上に主観的特徴要素がのっている必要はない。
【0077】
この座標空間に布置された2つの印象表現語があった場合、布置された座標のユークリッド距離が短いほどこれら2つの印象表現語はユーザに与える印象が類似している。
ここで、ユークリッド空間では、点(x1、x2、・・・、xn)と点(y1、y2、・・・、yn)のユークリッド距離は次式で定義される。
【0078】
{(x1−y1)2+(x2−y2)2+・・・+(xn−yn)21/2
【0079】
図8は、主観的特徴要素を座標軸とする座標空間(X軸に「コク」、Y軸に「キレ」、Z軸に「うまみ」を対応させている)と、この座標空間に布置された各印象表現語に対する印象データを例示したものである。
図8では、ビールの座標空間を、コク、キレ、うまみの主観的特徴要素3要素を座標軸として表現し、印象表現語「クリーミーな」「まろやかな」「ドライな」に対する印象データを布置したものである。
【0080】
図8に示されるように、各印象表現語は、そのカテゴリに属する対象に対して抽出される主観的特徴要素を座標軸とし、各座標値を要素とする印象データ(ベクトル)で表現される。
【0081】
なお、図7に例示されるように、実際の印象表現語は、各主観的特徴要素の相対値を示す座標値の他に、印象表現語に含まれる範囲を示す範囲データが付属している。従って印象表現語は、各主観的特徴要素の座標値を中心とする範囲(座標値を中心とする一定の範囲)で囲まれる印象データ空間で指定されるようになっている。
【0082】
以上のように、構成された主観評価表現辞書で、ある印象表現語に類似する印象表現語は、次のようにして求めることができる。
主観的特徴要素を座標軸とするユーグリッド空間に布置された印象表現語は、ユーグリット距離が短いほど印象が類似していることを意味している。
そこである印象表現語を中心とする所定の半径r(例えば0.5)の球をユーグリッド空間中に描き、この球の内部に布置している印象表現語を類似した印象表現語とする。
【0083】
例えば、印象表現語「味気ない」に類似する印象表現語は、ユーグリッド空間中で印象表現語「味気ない」を中心とする半径rの球を描き、この球の内部に布置されている印象表現語が類似した印象表現語となる。
【0084】
また、印象表現語を中心とする球を計算せずに、主観評価表現辞書中の範囲を用いて類似する印象表現語を求めることもできる。
ある印象表現語に類似する印象表現語を求める場合、当該印象表現語に設定されている範囲で規定されるユーグリッド空間に含まれる印象表現語を類似する印象表現語とすることができる。
【0085】
図9は、印象表現語の印象データ空間を2次元の座標で表したものである。
この図9に例示されるように、例えば、カテゴリ「ビール」の印象表現語「クリーミーな」は、主観的特徴要素「コク」に対して座標値4を中心とするプラスマイナス2の範囲、即ち2〜6の範囲で指定され、また、主観的特徴要素「キレ」に対して座標値−2を中心としてプラスマイナス2の範囲、即ち−4〜0の範囲で指定される。
【0086】
このように、印象表現語の印象データは各座標軸(主観的特徴要素)に対して一定の範囲を有することで、座標空間上の点で表されるのではなく、座標空間上の一定空間(容積)で表すことができ、この印象表現語の印象データ空間内に含まれる類似の印象表現語をリストアップすることができる。
【0087】
このように印象表現語の印象データ空間内の対象をリストアップすることで、全印象表現語に対する印象データとの類似度を判定する(ユークリッド距離を計算する)必要がなくなり、判断を高速化することができる。
【0088】
また、このように印象表現語に予め範囲を指定しておき、その範囲内にある他の印象表現語を類似する印象表現語と定義した場合、0でない座標値の数が少ないほど類似する印象表現語の数が多くなる傾向がある。以下、これについて図10を用いて説明する。
【0089】
図10(a)に示したような主観的特徴要素X、Y、Zを座標軸とする3次元空間に印象表現語が分布している場合を考える。
今、印象表現語Aが座標(X、Y、Z)=(3、0、0)に布置していたとする。また、印象表現語AのX方向の範囲として±1が指定されていたとする。
このとき、印象表現語Aに類似する他の印象表現語は、平面;X=3+1と平面;X=3−1で挟まれた空間45に含まれるものである。図では、図示する関係上この2つの平面を有限な面積を持つ矩形として描いてあるが、実際は無限に広い平面である。
【0090】
また、図10(b)に示したように、印象表現語Bが座標(X、Y、Z)=(0、3、3)に布置していたとする。また、印象表現語BのY方向の範囲として±1が、Z方向の範囲として±1が指定されていたとする。
このとき、印象表現語Bに類似する他の印象表現語は、平面;Y=3+1と平面;Y=3−1、及び平面;Z=3+1と平面;Z=3−1で囲まれた空間46(X軸方向に無限の長さを持つ)に含まれるものである。
【0091】
更に、図10(c)に示したように、印象表現語Cが座標(X、Y、Z)=(3、3、3)に布置していたとする。また、印象表現語CのX方向の範囲として±1が、Y方向の範囲として±1が、Z方向の範囲として±1が指定されていたとする。
このとき、印象表現語Cに類似する他の印象表現語は、平面;X=3+1と平面;X=3−1、及び平面;Y=3+1と平面;Y=3−1、及び平面;Z=3+1と平面;Z=3−1で囲まれた空間47に含まれるものである。
【0092】
このように、0でない座標値が少ないほど、空間中の範囲が広くなり、その結果、類似する印象表現語の数が増える傾向がある。
なお、以上の説明は一般的な傾向であって、空間中の印象表現語の分布状況、印象表現語に設定された範囲指定の値によって、印象表現語の数は異なってくる。
以上、3次元空間ついて説明したが、一般のN次元空間についても同様のこと
が言える。
【0093】
以上に説明したように、未知価値度算出部26は、印象表現語間の類似度を規定した第2の辞書(主観評価表現辞書32)を用いて、抽出した印象表現語と名詞句の組に含まれる印象表現語に類似する印象表現語数を算出する算出手段を構成している。
この算出した値を元に後述の顧客ニーズ仮決定部36が絞り込みを行い、このため、未知価値度算出部26と顧客ニーズ仮決定部36により第2の絞り込み手段が構成される。
【0094】
(2)評価固定度:
顧客ニーズは十人十色で、様々なものが抽出されてしまう。この場合、どの顧客ニーズから対処すれば良いのかが分かりにくくなる。そこで、その中でどの顧客ニーズから対応するのが好ましいかという指針(優先度)が必要となってくる。
【0095】
もし、併合文書データから抽出した印象表現語と名詞句の組に関して、ある名詞句にいつも同じ印象表現語、または類似する印象表現語が結びついている場合(表現が定まっている場合)、これを顧客全体のニーズと捉えることができ、早期に対応することが望まれる。
【0096】
しかし当該名詞句に対して様々な表現がされている場合、顧客ニーズの方向性が捉えにくい。従って対応すべき顧客のニーズの優先度を示す指標があると顧客ニーズに応える上で有用である。
そこで、本実施の形態では、そのような指標として評価固定度を導入する。評価固定度はある名詞句に対してどの程度一定した表現がなされているかを表すパラメータである。
【0097】
まず、表現方法が多様であるかどうかを調べるため、名詞句を修飾している印象表現語の数を中心に考える。
今、2つの名詞句を考える。これら名詞句に結びついている印象表現語の数が同数である場合、名詞句の出現頻度が大きい方がより表現方法が定まっていると考えられる。従って、表現方法の多様性を数値化する場合、印象表現語の種類の数をこれらが修飾している名詞句の出現頻度で割るのが妥当であると考えられる。
【0098】
この値が大きいほど名詞句が表している対象に対する表現方法がバラエティに富んでいると考えられ、小さいほど固定的なイメージがあると考えられる。
印象表現語の数が1の時には、この名詞句を表す印象は1つしか存在せず、表現の固定している度合いとしては最高となるべきであると考えられる。
【0099】
また、印象表現語の数と名詞句の出現頻度が同数である場合には、印象表現語の数の少ない方が、名詞句の表す対象がより固定的なイメージを持っていると考えられる。
以上の考察から、次の式(3)で評価固定度を定義する。
【0100】
Figure 0003787318
【0101】
評価関数を異なり印象表現語数の対数(ここでは、底を10とする常用対数を用いることにする)で定義し、これに異なり印象表現語を名詞句の出現頻度で除した値を掛ける。そして、得られた値を評価固定度と定義する。
【0102】
このように、評価関数を対数で表すことにした理由は、(1)印象表現語の数が1であるとき0となり、評価固定度を0とすることができる、(2)印象表現語の数が小さいものどうしでの比較は差が大きく出て判定しやすく、大きいものどうしでの比較には差が小さくなり近い値と見なすことができる、の2点において適していると考えるためである。
【0103】
式(3)で算出される評価固定度の値は、顧客が、名詞句が表す対象に対して抱いているイメージの広さを表していると考えられる。この値が大きいほど顧客は名詞句が表す対象に対し、多様なイメージを抱いていると考えられ、着手すべきポイントを見出すには別の要因が必要になってくる。
【0104】
一方、この値が小さいものほど顧客の抱いているイメージが固定的であるため、これらイメージを顧客ニーズとして捉えた場合、多くの顧客に受け入れられるものであると考えられる。
従って、評価固定度の小さいものから印象表現語と名詞句の組を並べて、上位にあるものほど早期に対応すべき顧客ニーズと考えることができる。
【0105】
次に、図11を用いて評価固定度の計算例を示す。図11は、口紅のアンケート文書データにおいて、印象表現語を名詞句(「持ち」と「付け心地」)をノードとして集約したものである。
【0106】
図に示したように、名詞句「持ち」に関しては、出現頻度が14回であり、これに結びついている印象表現語は、「良い」(出現頻度8)、「悪い」(出現頻度3回)、「良くない」(出現頻度2回)、「かなりだ」(出現頻度1回)である。
この場合、式(3)に従い、名詞句「持ち」に関しての評価固定度は次のようになる。
【0107】
4/14×Log(4)=0.1720
【0108】
同様にして、名詞句「付け心地」の評価固定度は、次のようになる。
【0109】
6/7×Log(6)=0.6670
【0110】
このように、名詞句「持ち」の評価固定度は、名詞句「付け心地」の評価固定度よりも小さいため、「持ち」に関する顧客の評価は「付け心地」に関する顧客の評価よりも固定的であると言える。
これは、「持ち」に対する評価が、「良い」、「悪い」にほぼ二分されているのに対し、「付け心地」に関しては、様々な種類の評価があることに起因する。
【0111】
このため、「持ち」に関しては、顧客ニーズに答えるための対策が立てやすく、また対策後の商品も多くの顧客ニーズ答えたものとすることができるのに対し、「付け心地」に関しては、顧客ニーズに答えるためにどこから着手するのが良いのか分かりにくく、また、対策後の商品も必ずしも多くの顧客に受け入れられるとは言い難い。
このように、評価固定度を計算することにより、商品を改良するための着眼点が得やすくなる。
【0112】
以上に説明したように、評価固定度算出部28は、印象表現語と名詞句組に含まれる名詞句に結びつく印象表現語の種類の数と頻度を用いて、当該名詞句に関する表現が固定している程度を算出する算出手段を構成している。
また、印象表現語の種類の数だけを用いて表現が固定している程度を算出しても良いし、あるいは頻度だけを用いて表現が固定している程度を計算しても良い。
この算出した値を元に後述の顧客ニーズ仮決定部36が絞り込みを行い、このため、評価固定度算出部28と顧客ニーズ仮決定部36により第3の絞り込み手段が構成される。
【0113】
(3)アフェクト度:
印象表現語の中には、その語が持つ意味として修飾対象が良い/悪いといった主観的な情動性を含むものがある。
ここで、情動性とは、その言葉が肯定的な感情に結びついているか、否定的な感情に結びついているか、もしくは何れでもない、という性質を言うことにする。
【0114】
例えば、「素敵なお店」といった表現があった場合、この表現には、表現者がこのお店に対して抱いている肯定的な印象が込められている。また、この表現を受け取った側もこのお店に対して肯定的な印象を受ける。
【0115】
一方、「さびれたお店」といった表現があった場合、この表現には、表現者がこのお店に対して抱いている否定的な印象が込められている。また、この表現を受け取った側もこのお店に対し、否定的な印象を受ける。
【0116】
このように、ある印象表現語が、人に肯定的、否定的な心の動き(情動)を起こさせる性質をアフェクト性と呼び、その印象表現語に対して抱く肯定的(ポジティブ)、否定的(ネガティブ)といった印象の度合いをアフェクト度と呼ぶことにする。
【0117】
顧客ニーズとは、顧客がその商品に対して抱いている不満や要望であると捉えることができる。そのため、顧客アンケートなどで、顧客ニーズは、否定的なアフェクト性を持った印象表現語を用いて表現されていると考えられる。これにより、印象表現語のアフェクト性に着目することにより、顧客ニーズの抽出が容易になると考えられる。
【0118】
印象表現語のアフェクト度を数値化するためには、予め印象表現語とその印象表現語が持つアフェクト度との知識を予め用意しておく必要がある。そこで、本実施の形態では、これらの知識を集めたアフェクト辞書34(図1)を用意し、これを用いて印象表現語の被修飾名詞が表している対象がどのような評価を受けているかを算出することとした。
【0119】
図12は、アフェクト辞書34の論理的な構成を示した図である。
アフェクト辞書34は、見出し語とアフェクトターム情報から構成されている。
見出し語は、アフェクト表現(情動性が表現された表現)の中心をなす語が収録されている。見出し語は、主に印象表現語から構成されている。
【0120】
アフェクトターム情報は、見出し語が有する情動性に関する情報が格納されており、極性と強度から構成されている。
極性は、見出し語に関する情動性の方向を表す属性であり、見出し語が表す情動性が肯定的な場合は+、否定的な場合は−に設定してある。
強度は、情動性の強さを数値で表すパラメータであり、予めシステムの設計者が設定する。数値が大きいほど情動性の強さが大きくなるように設定されている。
【0121】
これらの、情動性の方向や大きさは、定性的・主観的な文から定量的な情報を得るのに利用することができる。
なお、どの見出し語が+になり、また−になるのかは辞書の作り方に依存するため、見出し語のポジティブ性あるいはネガティブ性は一般的なものではなく、辞書の設計者が決めるものである。
【0122】
また、「とても」、「かなり」などの程度副詞は、見出し語と結びついて見出し語の強度を変化させる働きがある。このため、図示しないが、程度副詞について程度値をあらかじめ設定した知識を用意し、見出し語が程度副詞と結びついている場合は、見出し語の強度に程度値を乗じたものを情動性の強さとすることもできる。
例えば、「とても」に、程度値2を設定しておき、「とてもすてき」というアフェクト表現に対しては、「(「すてき」の強度)×2」などとして、見出し語の強度を変化させることができる。
【0123】
以上のように構成されたアフェクト辞書34を用いてアフェクト度算出部30(図1)は、個々の印象表現語のアフェクト度を算出した後、名詞句のアフェクト度を算出する。
まず、アフェクト辞書34に蓄えられた知識により個々の印象表現語のアフェクト度の求め方について説明する。
【0124】
印象表現語に程度副詞が結びついている場合は、印象表現語のアフェクト度に程度副詞の強調度を掛け合わせて、アフェクト度を更新する。これにより、印象表現語のアフェクト度は、次の式(4)で表される。ただし、印象表現が程度副詞を含まない場合は、程度値を1とする。
【0125】
(印象表現のアフェクト度)=
(程度副詞の程度値)×(印象表現語のアフェクト度)・・・(4)
【0126】
これは印象表現語の頻度の分だけ存在しているので、足し合わせたものが頻度も考慮した印象表現語のアフェクト度となる。
名詞句のアフェクト度は、当該名詞句に結びついた同表記の印象表現について、頻度も考慮した印象表現のアフェクト度を求め、これを足し合わせる。これにより、名詞句のアフェクト度は、下の式(5)で定義する。
これは名詞句の印象表現あたりのアフェクト度であり、被修飾名詞句が表している対象に対する情動性を表している。
【0127】
(名詞句のアフェクト度)=
(Σ((印象表現のアフェクト度)×(印象表現語を含む印象表現の頻度))/(アフェクト度が得られた印象表現語の頻度))・・・(5)
【0128】
式(5)で計算した名詞句のアフェクト度が低い場合、その名詞句の対象に対する顧客の評価が低いということが言える。顧客の評価が低いということは、顧客ニーズを知る手掛かりにすることができる。
従って、アフェクト度の低いものから印象表現と名詞句の組を並べて、上位にあるものを顧客のニーズとして捉える。
【0129】
図13(a)は、口紅に対する顧客アンケートから、口紅のケースに対して抽出した印象表現に一例を示した図である。
ケースに対するアフェクト度を式(5)に従って計算すると次のようになる。
【0130】
(5×2+1×2+1×1)/(5+1+1)=1.857
【0131】
図13(b)は、口紅のグロスに対して抽出した印象表現である。グロスとは光沢のことである。
グロスに対するアフェクト度を同様に式(5)に従って計算すると次のようになる。
【0132】
(1×−1+1×1+1×2)/(1+1+1)=0.667
【0133】
以上の計算からケースに比べてグロスに関する評価が低いことがわかる。このため、グロスよりケースの方が多くの顧客ニーズを含んでいることが推察できる。
【0134】
以上に説明したように、アフェクト度算出部30は、印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書(アフェクト辞書34)を用いて、印象表現語と名詞句の組に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出する算出手段を構成している。
この算出した値を元に後述の顧客ニーズ仮決定部36が絞り込みを行い、このため、アフェクト度算出部30と顧客ニーズ仮決定部36により第1の絞り込み手段が構成される。
【0135】
このように、パラメータ算出装置4は、印象表現語を名詞句に集約し、各名詞句に対して未知価値度、評価固定度、アフェクト度を計算する。算出したこれらのパラメータは、印象表現語と名詞句の組などと共に顧客ニーズ発見装置6に出力される。
【0136】
顧客ニーズ発見装置6(図1)は、顧客ニーズ仮決定部36、時系列調査部38、関連ニーズ抽出部40、顧客ニーズ出力部42から構成されている。
顧客ニーズ発見装置6は、パラメータ算出装置4で算出されたパラメータを元に顧客ニーズを決定して出力する。
【0137】
顧客ニーズ仮決定部36(絞り込み手段)は、パラメータ算出装置4で算出されたパラメータを元に、印象表現語と名詞句の組を絞り込んで顧客ニーズを以下の手順で仮決定する。
【0138】
まず、顧客ニーズ仮決定部36は、印象表現語と名詞句の組を名詞句のアフェクト度の低い順に並べ、上位のものを絞り込む。アフェクト度の高いもの(顧客が満足と感じていると考えられるもの)は顧客ニーズではないと考えられるためこれらは消去する。絞り込む数は任意に設定することができる。
【0139】
次に、顧客ニーズ仮決定部36は、残った印象表現語と名詞句の組を未知価値度が大きい順に並べ替え、上位のものを絞り込む。
未知価値度の低い組、つまり既知の価値や一般的な価値であるものはニーズとして新規性や訴求力の低いものと考えられるためこれを消去する。絞り込む数は任意に設定することができる。
【0140】
更に、顧客ニーズ仮決定部36は、残った印象表現語と名詞句の組に対して、名詞句の評価固定度が小さい順に並べ替えを行う。評価固定度が小さい方が解決すべき顧客ニーズと考えられるため、印象表現語と名詞句の組の順位が、顧客ニーズとして解決すべき優先順位になっていると考えられる。
【0141】
ここで評価固定度が大きいものは、顧客ニーズが多様化していると考えられる。そのため、対象とする顧客群に対して訴求力のある解決方法を見出すことは困難であると考え消去する。
以上の絞り込みにより残った印象表現語と名詞句の組を顧客ニーズとして捉え仮決定する。
このように顧客ニーズ仮決定部36は、第1の絞り込み手段、第2の絞り込み手段、第3の絞り込み手段をも構成している。
【0142】
本実施の形態では、顧客ニーズ仮決定部36は、アフェクト度、未知価値度、評価固定度の順で、印象表現語と名詞句の組を絞り込んでいくように構成したが、他の順序で絞り込んでも良い。
また、これら3つのパラメータの全てを用いて絞り込まずに、一部を用いて(例えば、アフェクト度のみ、あるいはアフェクトと未知価値度など)絞り込むように構成しても良い。
または、これらパラメータに閾値を設定し、閾値との大小関係によって、印象表現語と名詞句の組を絞り込むようにしても良い。
【0143】
時系列調査部38(作成順序取得手段、経時変化取得手段、第4の絞り込み手段を構成する)は、仮決定した印象表現語と名詞句の組(顧客ニーズ)を、抽出元の個別文書データの作成日時順に並べ、単位期間ごとに各パラメータの算出を行う。各パラメータの算出は、パラメータ算出装置4を利用して行う。
【0144】
パラメータ値の揺れが一定の場合は、当該印象表現語と名詞句の組は慢性的な顧客ニーズを表していると考えられ、また、パラメータの値が増加傾向にあれば、当該印象表現語と名詞句の組が増加している顧客ニーズを表していると考えられる。
【0145】
一方、パラメータ値の揺れが一時的なもの、あるいは収束傾向にあるものに関しては、顧客ニーズはあるが解決すべき優先度は低いと考えられる。このためパラメータ値の揺れが一時的な印象表現語と名詞句の組は、顧客ニーズが収束傾向にあると考え、仮決定した顧客ニーズから消去する。
【0146】
関連ニーズ抽出部40は、「バスケット分析」と呼ばれている手法などを利用して印象表現間の関連性を調べる。
例えば、仮決定した顧客ニーズを抽出した抽出元の個別文書データに、絞り込みの際に捨てられてしまった印象表現語と名詞句の組が含まれている場合がある。この場合、捨てられてしまった組は、この顧客にとって同時に満たされて欲しい顧客ニーズである可能性が高い。
【0147】
従って、顧客ニーズ仮決定部36や時系列調査部38で一旦消去した印象表現語と名詞句の組であっても、関連ニーズ抽出部40で復活させる場合がある。
このように、顧客ニーズとして捉えた印象表現語と名詞句の組に対して相関性の高い印象表現語と名詞句の組を顧客ニーズとして求めることができる。
【0148】
顧客ニーズ出力部42(絞り込み結果提示手段)は、以上の一連の絞り込みで残った印象表現語と名詞句の組(程度副詞がある場合は程度副詞も)を顧客ニーズとして出力する。
図14は、口紅を対象とする文書データを用いて出力された顧客ニーズの一例を示した図である。
【0149】
図からわかるように、当該口紅は、(1)潤い感がいまいちである、(2)伸びが悪い、(3)持ちが悪い、(4)唇がガサガサする、(5)落ち方がちょっと汚い、などの評価を得ていることがわかる。そこで、当該口紅に対する顧客ニーズとしては、(1)潤い感を出す、(2)伸びを良くする、(3)持ちを良くする、(4)唇を滑らかにする、(5)きれいに落ちるようにする、などの項目があることがわかる。
【0150】
図15は、顧客ニーズ発見システム1のハードウェア的な構成の一例を示した図である。顧客ニーズ発見システム1は、例えばパーソナルコンピュータを用いて構成することができる。
【0151】
顧客ニーズ発見システム1は、制御部66にバスライン73を介して入力装置74、出力装置78、通信制御装置82、記憶装置88、記憶媒体駆動装置76、入出力インターフェース84などの周辺機器が接続して構成されている。
バスライン73は、制御部66と周辺機器の間で送受信される制御信号やデータ信号の送受信を媒介する。
【0152】
制御部66は、顧客ニーズ発見プログラム50などに従って入力文書から顧客ニーズを抽出したり、顧客ニーズ発見システム1全体を制御したりなど、各種情報処理や制御を行う。
制御部66は、CPU68、ROM(Read Only Memory)70、RAM(Random Access Memory)72などから構成されている。
【0153】
ROM70は、CPU68が各種演算や制御を行うための各種プログラム、データ及びパラメータなどを格納したリードオンリーメモリである。CPU68は、ROM70からプログラムやデータ、パラメータなどを読み込むことはできるが、これらを書き換えたり消去したりすることはできない。
【0154】
RAM72は、CPU68にワーキングメモリとして使用されるランダムアクセスメモリである。CPU68は、RAM72にプログラムやデータなどを書き込んだり消去したりすることができる。本実施の形態では、RAM72には、CPU68が入力文書から顧客ニーズを抽出したり、その他の各種情報処理を行ったりするためのエリアが確保可能となっている。
【0155】
入力装置74は、例えばキーボードやマウスなどの入力装置から構成されている。入力装置から第1の判定手段16、第2の判定手段18の閾値やその他の閾値の入力を行うことができる。
【0156】
キーボードは、顧客ニーズ発見システム1に対して文字や数字などの情報を入力するための装置である。
キーボードは、カナや英文字などを入力するためのキーや数字を入力するためのテンキー、各種機能キー、カーソルキー及びその他のキーによって構成されている。
【0157】
マウスは、ポインティングデバイスである。GUI(Graphical User Interface)などを用いて顧客ニーズ発見システム1を操作する場合、表示装置上に表示されたボタンやアイコンなどをマウスでクリックすることにより、所定の情報の入力を行うことができる。
【0158】
出力装置78は、例えば表示装置、印刷装置などのから構成されている。
表示装置は、例えばCRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、プラズマディスプレイなどで構成された情報を画面上に提示するための装置である。
表示装置は、キーボードやマウスの入力結果や、入力文書、抽出した顧客ニーズなどを表示することができる。
【0159】
印刷装置は、例えば、抽出した顧客ニーズなどをテキストの形で紙などの印刷媒体に印刷する装置である。印刷装置は、例えば、インクジェットプリンタ、レーザプリンタ、熱転写プリンタ、ドットプリンタなどの各種プリンタ装置によって構成されている。
【0160】
通信制御装置82は、通信回線を介して顧客ニーズ発見システム1をサーバ装置やその他の端末装置に接続するための装置であって、モデム、ターミナルアダプタその他の装置によって構成されている。
【0161】
通信制御装置82は、例えばインターネットやLAN(Local AreaNetwork)などに接続しており、これらのネットワークに接続した他の端末装置あるいはサーバ装置などから通信によって入力文章を受信したり、あるいはこれらの装置に対して抽出した顧客ニーズを送信したりすることができる。通信制御装置82はCPU68によって制御され、所定のプロトコルに従ってこれら端末装置やサーバ装置との信号及びデータの送受信を行う。
【0162】
記憶媒体駆動装置76は、着脱可能な記憶媒体を駆動してデータの読み書きを行うための駆動装置である。着脱可能な記憶媒体としては、例えば、光磁気ディスク、磁気ディスク、磁気テープ、半導体メモリ、データをパンチした紙テープ、CD−ROMなどがある。なお、CD−ROMや紙テープは、読み込みのみ可能である。
【0163】
記憶装置88は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータを読み書きするための駆動装置によって構成されている。当該記憶媒体として主にハードディスクが使用されるが、その他に、例えば、光磁気ディスク、磁気ディスク、半導体メモリなどの他の読み書き可能な記憶媒体によって構成することも可能である。
【0164】
記憶装置88は、顧客ニーズ発見プログラム50、その他のプログラム52、形態素解析辞書54、構文解析辞書56、主観評価表現辞書32、アフェクト辞書34、その他のデータなどが記憶されている。
CPU68は、記憶装置88の駆動装置を駆動することにより、記憶装置88に対してプログラムやデータの読み込みや書き出しを行うことができる。
【0165】
顧客ニーズ発見プログラム50は、CPU68に顧客ニーズ発見機能を発揮させるためのプログラムである。顧客ニーズ発見プログラム50がCPU68に読み込まれて実行されることにより、図1に示した文書データ入力部10〜顧客ニーズ出力部42の各構成要素がソフトウェア的に構成される。
【0166】
その他のプログラム52は、例えば、通信制御装置82を制御し、顧客ニーズ発見システム1とネットワークでつながれた端末装置やサーバ装置との通信を維持する通信プログラムや、メモリ管理や入出力管理などの顧客ニーズ発見システム1を動作させるための基本ソフトウェアであるOS(Operating System)などの各種プログラムで構成されている。
【0167】
形態素解析辞書54や構文解析辞書56は、それぞれ顧客ニーズ発見システム1が形態素解析や構文解析を行う際に使用される。
主観評価表現辞書32は、未知価値度算出部26(図1)が未知価値度を算出する際に使用され、アフェクト辞書34は、アフェクト度算出部30がアフェクト度を算出する際に使用される。
【0168】
図示しないが、記憶装置88には、顧客ニーズを抽出するための個別文書データがテキストファイルとして記憶してある。
このテキストファイルは、通信制御装置82を介してインターネット経由で取得したり、あるいはテキストファイルを記憶した記憶媒体を記憶媒体駆動装置76から読み込んだり、あるいは、入力装置74のキーボードから直接アンケート調査結果などを入力したりしたものである。
【0169】
入出力インターフェース84は、例えば、シリアルインターフェースやその他の規格のインターフェースにより構成されている。入出力インターフェース84に当該インターフェースに対応した外部機器を接続することにより、顧客ニーズ発見システム1の機能を拡張することができる。このような外部機器として例えば、ハードディスクなどの記憶装置、スピーカ、マイクロフォンなどがある。
【0170】
図16は、顧客ニーズ発見システム1の動作を説明するためのフローチャートである。
以下に説明する各構成要素の動作は、CPU68が顧客ニーズ発見プログラム50に従って行うものである。
【0171】
まず、文書データ入力部10が個別文書データの入力を受け付ける(ステップ5)。
これは、文書データ入力部10が記憶装置88に記憶してあるテキストデータを読み込むことにより行われる。または、記憶媒体駆動装置76に装着した記憶媒体から読み込んでも良い。
【0172】
次に、文書データ併合部12が、個別文書データを併合して併合文書データを生成し、1つのファイルとする(ステップ10)。
次に、第1の判定手段16が、併合した文書データにおいて、自立語の総数に対する、形容詞と形容動詞の数の割合により適性判定を行う(ステップ15)。
【0173】
自立語に対する、形容詞と形容動詞の数の割合が所定の閾値よりも小さい場合は、併合文書データが顧客ニーズを抽出するのに適さないと判定し、処理を終了する(ステップ15;N)。
一方、自立語に対する、形容詞と形容動詞の数の割合が所定の閾値以上である場合は、併合文書データが顧客ニーズを抽出するのに適していると判定し、処理を続行する(ステップ15;Y)。
【0174】
次に、第2の判定手段18が、併合文書データに対して、用言(形容詞、形容動詞、動詞)の総数に対する体言(名詞)との係り受けがある用言の数の割合を調査し、更に併合文書データの適性判定を行う(ステップ20)。
この割合が所定の閾値よりも小さい場合は、適性がないと判定し、処理を終了する(ステップ20;N)。
この割合が、所定の閾値以上である場合は、適性ありと判定し、処理を続行する(ステップ20;Y)。
【0175】
次に、印象表現処理部20が、併合文書データ中の印象表現を処理する。即ち、併合した文書データから印象表現語と名詞句の組を抽出し、これら印象表現語と名詞句の表記を統一する(ステップ25)。
次に、未知価値度算出部26が、印象表現処理部20によって処理された印象表現語と名詞句の組に関して、主観評価表現辞書32を参照しながら未知価値度を算出する(ステップ30)。
【0176】
次に、評価固定度算出部28が、印象表現処理部20によって処理された印象表現語と名詞句の組に関して評価固定度を算出する(ステップ35)。
次に、アフェクト度算出部30が、アフェクト辞書34を参照しながら、印象表現処理部20によって処理された印象表現語と名詞句の組に関してアフェクト度を算出する(ステップ40)。
なお、以上のステップ30、35、40の処理の順序は任意で良い。または、同時に行っても良い。
【0177】
次に、顧客ニーズ仮決定部36が、先に算出した未知価値度、評価固定度、アフェクト度を用いて印象表現語と名詞句の組を絞り込み、顧客ニーズを仮決定する(ステップ45)。
即ち、未知価値度が大きく、かつ評価固定度が小さく、かつアフェクト度の値が小さいものを絞り込む。
【0178】
次に、時系列調査部38が仮決定した印象表現語と名詞句の組を、抽出元文書データ(併合する前の文書データ)の作成日時順に並べ、単位期間ごとに各パラメータの算出を行い、各パラメータ(未知価値度、評価固定度、アフェクト度)の経時変化を調査する(ステップ50)。
そして、顧客ニーズが慢性的か増加傾向にあるものを絞り込み、収束に向かっているものを取り除く。
【0179】
次に、関連ニーズ抽出部40が、絞り込んだ印象表現語と名詞句の組に関連する印象表現語などを文書データから抽出し、既に絞り込んである印象表現語と名詞句の組に加える(ステップ55)。
次に、顧客ニーズ出力部42が絞り込んだ顧客ニーズを出力し(ステップ60)、処理を終了する。
【0180】
以上に説明したように、本実施の形態の顧客ニーズ発見システム1は、抽出手段(印象表現処理部20)によって、顧客アンケートなどの文書中の文章から、顧客ニーズ発見対象に対する印象を表す形容詞、形容動詞などの印象表現語と、当該印象表現語と結びついている名詞句を組として抽出する。
【0181】
そして、印象表現語集約手段(パラメータ算出装置4)で、抽出した印象表現語と名詞句の組を、前記名詞句をノードとして当該名詞句に結びついている印象表現語を集約する。これにより同じ意見がどの程度の頻度で寄せられているかがわかる。
【0182】
次に、印象表現語を集約したものを利用し、印象表現語と名詞句の組から顧客ニーズの発見につながるパラメータ(値)を算出する。これを元に印象表現語と名詞句の組の並べ替えを行い、顧客ニーズ発見のための視点を提示する。パラメータとしては、未知価値度、評価固定度、アフェクト度を採用した。
パラメータの値を用いて、印象表現語と名詞句の組を絞り込み(フィルタリングし)、絞り込まれた印象表現語と名詞句の組を用いて、顧客ニーズを決定する。
【0183】
このように、構成された本実施の形態により以下のような効果を得ることができる。
アンケートフォームなどによらず、顧客が自由に記述した内容から顧客ニーズを発見することができる。
適性判定部14で、文書データが、顧客ニーズを発見するのに相応しいか否か、その適性を判定することができる。
【0184】
未知価値度算出部26で、未知価値度を算出することにより、他の類似製品から差別化すべき点を抽出することができる。
評価固定度算出部28で、評価固定度を算出することにより、顧客ニーズに答えるために着手する点を抽出することができる。
アフェクト度算出部30で、アフェクト度を算出することにより、顧客が不満に思っている点を抽出することができる。
【0185】
時系列調査部38で、各パラメータ(未知価値度、評価固定度、アフェクト度)の経時変化を調査することにより、慢性、あるいは増加傾向にある顧客ニーズを収束傾向にある顧客ニーズから分離することができる。
絞り込みの過程で捨てられた印象表現語と名詞句のセットであっても、抽出された顧客ニーズに関連が深いものは関連ニーズ抽出部40で拾い上げることができる。
【0186】
以上に説明した本実施の形態では、未知価値度算出部26、評価固定度算出部28、アフェクト度算出部30の全てを用い、算出されたパラメータを総合的に判定して印象表現語と名詞句の組を絞り込んだが、印象表現語と名詞句の絞り込み方法は、これに限定するものではなく、例えば、これらの手段のうち1つ、あるいは何れか2つを組み合わせて用いても良い。また、顧客ニーズ仮決定部36の結果をもって顧客ニーズとしても良い。
【0187】
また、本実施の形態では、アフェクト度の低い印象表現を抽出することにより、対象に対する顧客ニーズを抽出したが、逆にアフェクト度の高い印象表現語を抽出することにより対象に対して顧客が好意的に見ている点を抽出することができる。
これによって、例えば、ライバル商品に対するアンケートを実施して、ライバル商品のどのようなところに顧客が満足しているかを分析し、分析結果を自社製品に適用することができる。
【0188】
(実施の形態の変形例)
顧客アンケートなどから収集した文書データが自由に記述されたものである場合、対象となる商品に対する単なる感想や、不満、あるいは好意的な意見など、種々雑多なものが混在している。
【0189】
適性判定部14で、文書データの適性を確認するものの、これは収集された文書データの質(例えば、製品に対する不満を記述したものであるとか、製品に対する要望を記述したものであるなど)の均一性を確認するものではない。
【0190】
ところで、この課題の解決策として、特願2001−263118の発明で
は、顧客からの問い合せなどから特徴的な複数の文字列を抽出して概念を形成させ、これを分類条件と比較して分類を行う方法が提案されている。
しかし、この方法は、事前に定めた区分に当てはまるように文書データを分類するものであり、同質のニーズを持つセグメントを見出して分類するのに適しているとは言い難い。ここで、セグメントとは、同質な文書データからなるグループを意味する。
【0191】
即ち、自由に記述された文書データでは、どのような分類が現れるか予め知ることはできないため、文書データに、どのような顧客ニーズがあるかを事前に見極めることはできない。
そのため、事前に分類区分を定めると、これに該当しない顧客ニーズは、拾い上げることができないことになる。
【0192】
また、仮にこの方法での分類結果を同質のニーズを持つセグメントと見なしたとしても、セグメントとしての同質性を保証することができない。即ち、同じ区分に製品に対する不満や肯定的な意見などが混在してしまう可能性がある。
【0193】
そこで、本変形例の目的は、顧客ニーズ抽出に使用する文書データに何らかの顧客ニーズがあるかを事前に見極め、何らかのニーズがあると判定した場合に同質のニーズを持つセグメントを見出し、そのセグメントの同質性を保証して、セグメント別のニーズを抽出しやすくすることである。
【0194】
そのために、本変形例では、アフェクト度、または未知価値度を用いて、文書データを同質の顧客ニーズを含むセグメントに分類する。
更に、評価固定度を用いて切り分けしたセグメントの妥当性の検証を行う。
このように、文書データに含まれる顧客ニーズの均一性を保証した上で、実施の形態で説明したパラメータ算出装置4、顧客ニーズ発見装置6を作用させることにより、顧客ニーズが抽出しやすくなる他、より高い精度で顧客ニーズを発見できることが期待できる。
【0195】
図17は、本実施の形態の変形例に係る印象表現抽出装置2aの構成の一例を示した図である。
顧客ニーズ発見システム1a(図示せず)は、印象表現抽出装置2aでセグメント分けされた文書データに関して、パラメータ算出装置4、顧客ニーズ発見装置6を用いて顧客ニーズを発見する。
【0196】
印象表現抽出装置2aは、文書データ入力部10、文書データ併合部12、適性判定部14、仮セグメント分け部91、セグメント判定部94、セグメント別文書データ併合部95、印象表現処理部20などから構成されている。
これらのうち、文書データ入力部10、文書データ併合部12、適性判定部14、印象表現処理部20の機能は、実施の形態の印象表現抽出装置2における機能と同様であるので説明を省略する。
【0197】
仮セグメント分け部91は、併合文書データを構成する個別文書データをセグメントに分類する。
仮セグメント分け部91は、アフェクト度解析部92と、未知価値度解析部93を備えており、これらのうち、何れかを選択的に使用することができる。
【0198】
アフェクト度解析部92(解析手段、分類手段)は、個別文書データのアフェクト度を用いてこれらをセグメントに分類する。
一方、未知価値度解析部93(解析手段、分類手段)は、個別文書データの未知価値度を用いてこれらをセグメントに分類する。
【0199】
まず、アフェクト度解析部92について説明する。
アフェクト度解析部92は、印象表現語(正規化されている)について、アフェクト辞書34(図1)を用いてアフェクト度を付与し、ポジティブな値を持つもの、ネガティブな値を持つもの、どちらでもないものの3つに個別文書データを統合する。ここで統合されたものが仮セグメントとなる。
【0200】
以下に図18〜図21を用いてアフェクト度を用いたセグメント分けの手順について説明する。
図18は、文書データ入力部10に入力する個別文書データの一例を示した図である。
図に示したように、個別文書データは、「でも塗り心地はしっとりしていてよいですよ。」などと自由に記述された文書により構成されている。
【0201】
これらの個別文書データは、文書データ併合部12で併合されて併合文書データとなった後、適性判定部14で適性を判定される。
併合文書データが適性ありと判定された場合は、印象表現処理部20で印象表現の抽出と表記統一処理が行われる。
【0202】
図19は、併合文書データから抽出された印象表現語と名詞句の組を示した図である。
例えば、併合文書データを構成する個別文書データ「0101.txt」からは、「塗り心地」(名詞句)−「しっとりして」(印象表現語)、「塗り心地」(名詞句)−「よいですよ」(印象表現語)などの組が抽出されている。そして、これらの組を抽出する元となった個別文書データファイル名も記録しておく。また、図示しないが程度副詞が存在する場合はこれも抽出しておく。
【0203】
印象表現処理部20は、名詞句に関してはシソーラス辞書を参照しながら上位語に統一し、印象表現語は、表記揺れ辞書を参照して正規化表現に統一することにより、名詞句と印象表現語の表記を統一する。
【0204】
アフェクト度解析部92は、印象表現処理部20から表記を統一した印象表現語と名詞句の組、及びこれらの組を抽出する元となった個別文書データファイル名を取得し、印象表現語を、名詞句をノードとして集約する。ここで、印象表現語は正規化表現に変換されたものであり、名詞句は上位語に統一されたものである。
【0205】
図20は、印象表現語の集約結果の一例を示した図である。名詞句「付け心地」に関しては、「しっとりした」、「良い」、「軽い」、・・・などの印象表現語が集約されている。
また、名詞句「持ち」に関しては、「満足だ」、「良い」、「悪い」、・・・などの印象表現語が集約されている。
【0206】
アフェクト度解析部92は、名詞句をノードとして印象表現語を集約した後、アフェクト辞書34を参照しながら各印象表現語のアフェクト度を取得する。
そして、印象表現語のアフェクト度がポジティブ、ネガティブ、その他のうちの何れであるか(アフェクト性の方向)を判定する。例えば「良い」、「悪い」、「満足だ」、「不満だ」のアフェクト度は、それぞれ+2、−2、+2、−2などと設定されている。
【0207】
そして、アフェクト度解析部92は、集約された中で、判定したアフェクト度に従って、印象表現語と名詞句の組を統合する。
統合された印象表現語の抽出元となった個別文書データの組を仮セグメントとする。
【0208】
図21は、セグメント分けの結果の一例を示した図である。名詞句「付け心地」に集約されている印象表現語のうち、「しっとりした」と「良い」は、+のアフェクト度を持っており、「軽い」のアフェクト度は、+でも−でもない。
【0209】
これにより、印象表現語「しっとりした」、「良い」を抽出する元となった個別文書データ「0101.txt」と「0103.txt」は1つの仮セグメント(セグメント1とする)として統合される。
同様に、他の個別文書データもセグメント2、3、4、・・・に統合する。
【0210】
以上のように、アフェクト度解析部92を用いて生成した仮セグメントでは、アフェクト性の方向と、対象となる名詞句が揃えられている。
【0211】
次に、図22、23を用いて未知価値度解析部93について説明する。
未知価値度解析部93は、印象表現処理部20から表記を統制した印象表現語と名詞句の組を受け取る。そして、名詞句をノードとして印象表現語を集約する。
【0212】
次に、未知価値度解析部93は、主観評価表現辞書32(図1)を参照して、各印象表現語につき、当該印象表現語に類似している印象表現語の数を調べる。これにより、例えば前述の式(1)を用いることにより、当該印象表現語の未知価値度を求めることができる。
そして未知価値度解析部93は、名詞句ごとに、当該名詞句に集約されている印象表現語の未知価値度の平均値を計算する。
【0213】
また、この際に、当該名詞句の重みも求めておく。ここで重みとは、当該名詞句に集約されている印象表現語の未知価値度を累積したものである。
次に、名詞句を未知価値度の高い順(類似の印象表現語数が少なく、頻度の高い印象表現語が係っている順)に名詞句を並べ替える。
【0214】
図22は、名詞句を未知価値度の高い順に並べたところを示した図である。
名詞句「潤い感」に結びついている印象表現語「なかなかだ」、「ない」、・・・の未知価値度を平均した結果、名詞句「潤い感」に対する未知価値度は1.250となっている。
そして、名詞句に対する未知価値度の高い順に各名詞句を並べ替えた結果、名詞句は、「潤い感」、「唇」、「グロス」、「付け心地」、・・・の順序となっている。
【0215】
次に、未知価値度解析部93は、更に、各名詞句の重みを考慮して名詞句を並べ替える。
より詳細には、セグメント数を任意で設定し、未知価値度と重みの類似度による階層クラスタリングを行い、その結果生成されたクラスターをセグメントとする。
【0216】
図23は、クラスタリングの例を示した図である。
クラスターAは、未知価値度と重みの双方が大きい名詞句からなるクラスターである。
クラスターBは、未知価値度が大きく、重みが小さい名詞句からなるクラスターである。
【0217】
クラスターCは、未知価値度、重みの双方が小さい名詞句からなるクラスターである。
クラスタリングの際の未知価値度、重みの判定基準は、設定されたセグメント数に応じて適当に設定される。
【0218】
仮セグメント分け部91は、このように生成されたクラスターを仮セグメントとする。
例えば、クラスターAに属する個別文書データファイル0203.txt、0206.txtが1つの仮セグメントになる。
同様に、他のクラスターに属する個別データファイルがそれぞれ仮セグメントになる。
【0219】
図17に戻り、セグメント判定部94は、仮セグメント分け部91が生成した仮セグメントの妥当性を次の2つの条件を元に判定する。
(条件1)仮セグメント分けで使用した名詞句の評価固定度が、併合文書データ全体における評価固定度より小さくなっているかどうか。
(条件2)評価固定度が小さいものが多数を占めているかどうか。
【0220】
(条件1)は、仮セグメントに出現する名詞句が、実際に仮セグメント内において評価が定まっているかを確認するための条件である。
仮セグメント分けで使用した名詞句の評価固定度が、併合文書データ全体における評価固定度より小さい場合に、仮セグメントが妥当であると判定する。
条件1は、仮セグメントの妥当性を判定するための必須条件である。
【0221】
(条件2)は、仮セグメント全体の同質性を保証するための条件である。
評価固定度が小さいものが多数を占めている場合に、仮セグメントが妥当であると判定する。
仮セグメントの同一性が保証されると、仮セグメント内のノイズ(顧客ニーズに関係のない印象表現)の少なさが保証される。
条件2が満たされている場合は、注目した名詞句について同質であるだけでなく、他の名詞句についても同一である可能性が高い。
【0222】
逆にこの条件を満たしていない場合は、注目した名詞句については同質であるが、他の名詞句については同質である可能性が低い。このように、条件2はセグメント全体の傾向を示すものである。
条件2は、仮セグメントの妥当性を判定するための必須条件ではない。なお、評価固定度の大小を判定する閾値は任意に設定することができる。
【0223】
図24は、口紅を対象とした仮セグメントの評価固定度の一例を示した図である。
図に示したように、例えば、名詞句「付け心地」をノードとして集約した仮セグメントにおいて、名詞句「付け心地」の評価固定度を計算したところ0.00であった。一方、併合文書データにおける名詞句「付け心地」の評価固定度は、0.48であった。この場合、名詞句「付け心地」は、条件1を満たしている。
【0224】
同様に、名詞句「テクスチャー」、「伸び」、「色」に関して集約された仮セグメントに関しても、仮セグメントにおける評価固定度が併合文書データにおける評価固定度よりも小さいので、何れも条件1を満たしている。
【0225】
また、何れの仮セグメントにおいても、評価固定度が0.30未満の名詞句の割合が100%であったとすると、何れの仮セグメントも条件2を満たす。
以上の条件1と条件2の何れをも満たした仮セグメントが妥当なセグメントとされる。
なお、条件1と条件2の双方を課さずに、条件1のみを妥当性判定の条件として課す構成にしても良い。
【0226】
仮セグメントが、条件1、または条件2を満たさなかった場合は、併合文書データに何らかの顧客ニーズがあるが、セグメントとしての傾向が読めないものとして処理を終了する。
【0227】
または、仮セグメント分け部91で、セグメント分けの条件を変化させるか、あるいは、別の方法(アフェクト度解析部92で生成したセグメントが妥当でなかった場合は、未知価値度解析部93でセグメントを生成するなど)でセグメントを生成し、再度妥当性を判定しても良い。
【0228】
図17に戻り、セグメント判定部94は、妥当として判定した仮セグメントを正式なセグメントとしてセグメント別文書データ併合部95に出力する。
セグメント別文書データ併合部95は、セグメント判定部94から取得した各セグメントに対して、当該セグメントを生成する元となった個別文書データを併合する。これによって、セグメントごとに併合文書データが生成される。
【0229】
以上に説明した本変形例では、セグメント別文書データ併合部95によって生成された併合文書データが、顧客ニーズの発見という点において質が均一となっている。
そのため、これら併合文書データを、パラメータ算出装置4、顧客ニーズ発見装置6(図1)で解析することにより、顧客ニーズ抽出が容易となると共に精度も向上する。
【0230】
以上、本発明の1実施形態について説明したが、本発明は説明した実施形態に限定されるものではなく、各請求項に記載した範囲において各種の変形を行うことが可能である。
【0231】
【発明の効果】
本発明によれば、文書データを用いて適切な顧客ニーズを発見することができる。
【図面の簡単な説明】
【図1】顧客ニーズ発見システムの構成の一例を示した図である。
【図2】併合文書データの一例を示した図である。
【図3】第1の判定手段による分析結果の一例を示した図である。
【図4】文書データ中の用言の数に対する、体言と係受けのある用言の割合の一例を示した図である。
【図5】印象表現処理部の出力結果の一例を示した図である。
【図6】名詞句の未知価値度の計算例を説明するための図である。
【図7】お酒用主観評価表現辞書群の内容を概念的に表したものである。
【図8】座標空間に布置された各印象表現語に対する印象データを例示したものである。
【図9】印象表現語の印象データ空間を2次元の座標で表したものである。
【図10】類似する印象表現語の範囲を説明するための図である。
【図11】評価固定度の計算例を説明するための図である。
【図12】アフェクト辞書の論理的な構成を示した図である。
【図13】アフェクト度の計算例を説明するための図である。
【図14】顧客ニーズの一例を示した図である。
【図15】顧客ニーズ発見システムのハードウェア的な構成の一例を示した図である。
【図16】顧客ニーズ発見システムの動作を説明するためのフローチャートである。
【図17】変形例に係る印象表現抽出装置の構成の一例を示した図である。
【図18】個別文書データの一例を示した図である。
【図19】併合文書データから抽出された印象表現語と名詞句の組を示した図である。
【図20】印象表現語の集約結果の一例を示した図である。
【図21】セグメント分けの結果の一例を示した図である。
【図22】名詞句を未知価値度の高い順に並べたところを示した図である。
【図23】クラスタリングの例を示した図である。
【図24】口紅を対象とした仮セグメントの評価固定度の一例を示した図である。
【符号の説明】
1 顧客ニーズ発見システム
2 印象表現抽出装置
4 パラメータ算出装置
6 顧客ニーズ発見装置
10 文書データ入力部
12 文書データ併合部
14 適性判定部
16 第1の判定手段
18 第2の判定手段
20 印象表現処理部
26 未知価値度算出部
28 評価固定度算出部
30 アフェクト度算出部
32 主観評価表現辞書
34 アフェクト辞書
36 顧客ニーズ仮決定部
38 時系列調査部
40 関連ニーズ抽出部
42 顧客ニーズ出力部
50 顧客ニーズ発見プログラム
52 その他のプログラム
54 形態素解析辞書
56 構文解析辞書
66 制御部
68 CPU
70 ROM
72 RAM
73 バスライン
74 入力装置
76 記憶媒体駆動装置
78 出力装置
82 通信制御装置
84 入出力インターフェース
88 記憶装置
91 仮セグメント分け部
92 アフェクト度解析部
93 未知価値度解析部
94 セグメント判定部

Claims (16)

  1. 文書データを取得する文書データ取得手段と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、
    印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書と、
    前記第1の辞書を用いて前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と
    を具備したことを特徴とする情報処理装置。
  2. 文書データを取得する文書データ取得手段と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、
    印象表現語間の類似度を規定した第2の辞書と、
    前記第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と
    を具備したことを特徴とする情報処理装置。
  3. 文書データを取得する文書データ取得手段と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出手段と、
    前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の出現頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み手段と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示手段と
    を具備したことを特徴とする情報処理装置。
  4. 前記文書データ取得手段で取得した複数の文書データを1つの文書データに併合する併合手段を具備し、
    前記抽出手段は、前記併合手段で併合した文書データから前記対を抽出することを特徴とする請求項1、請求項2、又は請求項3に記載の情報処理装置。
  5. 前記抽出した対に含まれる印象表現語及び名詞句のうち少なくとも一方の表記を統一する表記統一手段を具備し、
    前記絞り込み手段は、前記表記統一手段で表記が統一された印象表現語と名詞句の対を絞り込むことを特徴とする請求項1から請求項4までのうちの何れか1の請求項に記載の情報処理装置。
  6. 前記文書データを前記絞り込み手段で絞り込んだ場合に適切な結果が得られるか否かの適性度を、前記文書データ中の自立語の総数に対する形容詞と形容動詞の数の割合を用いて判定する適性度判定手段を具備し
    前記適性度判定手段で適切な結果が得られると判定された場合に、前記絞り込み手段は絞り込みを行うことを特徴とする請求項1から請求項5までのうちの何れか1の請求項に記載の情報処理装置。
  7. 前記文書データを前記絞り込み手段で絞り込んだ場合に適切な結果が得られるか否かの適性度を、前記文書データ中の用言の総数に対する、体言との係受けを有する用言の割合を用いて判定する第2の適性度判定手段を具備し
    前記第2の適性度判定手段で適切な結果が得られると判定された場合に、前記絞り込み手段は絞り込みを行うことを特徴とする請求項1から請求項までのうちの何れか1の請求項に記載の情報処理装置。
  8. 前記文書データの作成順序を取得する作成順序取得手段と、
    前記取得した作成順序を用いて、前記絞り込み手段による絞り込み結果の前記作成順序 における変化である経時変化を取得する経時変化取得手段と、
    前記取得した経時変化を用いて、前記絞り込み手段による絞り込み結果を更に絞り込む第4の絞り込み手段と、
    を具備し、
    前記絞り込み結果提示手段は、前記第4の絞り込み手段による絞り込み結果を提示することを特徴とする請求項1から請求項までのうちの何れか1の請求項に記載の情報処理装置。
  9. 前記文書データ取得手段で複数の文書データを取得した場合に、前記印象表現語の使用者が当該印象表現語を用いることによって表す肯定否定に関する印象の度合いを、前記第1の辞書を用いることにより、前記複数の文書データについて解析する解析手段と、
    前記解析された印象の度合いを用いて前記文書データを分類する分類手段と、
    を具備し、
    前記抽出手段は、前記分類された文書データから印象表現語と名詞句の対を抽出することを特徴とする請求項に記載の情報処理装置。
  10. 前記文書データ取得手段で複数の文書データを取得した場合に、前記印象表現語に類似する印象表現語数を、前記第2の辞書を用いることにより算出する解析手段と、
    当該算出した値を用いて前記文書データを分類する分類手段と、
    を具備し、
    前記抽出手段は、前記分類された文書データから印象表現語と名詞句の対を抽出することを特徴とする請求項に記載の情報処理装置。
  11. 文書データ取得手段と、抽出手段と、印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、
    前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、
    前記絞り込み手段が、前記第1の辞書を用いて、前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、
    前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、
    から構成された情報処理方法。
  12. 文書データ取得手段と、抽出手段と、印象表現語間の類似度を規定した第2の辞書と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、
    前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、
    前記絞り込み手段が、前記第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、
    前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、
    から構成された情報処理方法。
  13. 文書データ取得手段と、抽出手段と、絞り込み手段と、絞り込み結果提示手段と、を備えたコンピュータにおいて、
    前記文書データ取得手段が、文書データを取得する文書データ取得ステップと、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから前記抽出手段が抽出する抽出ステップと、
    前記絞り込み手段が、前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込みステップと、
    前記絞り込んだ絞り込み結果を、前記絞り込み結果提示手段が提示する絞り込み結果提示ステップと、
    から構成された情報処理方法。
  14. 文書データを取得する文書データ取得機能と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、
    印象表現語の使用者が当該印象表現語で表す肯定否定に関する印象の度合いを印象表現語ごとに定義した第1の辞書を用いて、前記対に含まれる印象表現語が表す肯定否定に関する印象の度合いを算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、
    をコンピュータで実現するための情報処理プログラム。
  15. 文書データを取得する文書データ取得機能と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、
    印象表現語間の類似度を規定した第2の辞書を用いて、前記抽出した対に含まれる印象表現語に類似する印象表現語数を名詞句ごとに算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、
    をコンピュータで実現するための情報処理プログラム。
  16. 文書データを取得する文書データ取得機能と、
    対象に対する印象を表現する印象表現語と当該印象表現語が結びつく名詞句との対を、前記取得した文書データから抽出する抽出機能と、
    前記対に含まれる名詞句に結びつく異なる印象表現語の数を当該名詞句の頻度で除することにより、当該名詞句に関する表現が固定している程度を算出し、当該算出した値を用いて前記抽出した対を絞り込む絞り込み機能と、
    前記絞り込んだ絞り込み結果を提示する絞り込み結果提示機能と、
    をコンピュータで実現するための情報処理プログラム。
JP2002196995A 2002-07-05 2002-07-05 情報処理装置、情報処理方法、及び情報処理プログラム Expired - Fee Related JP3787318B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002196995A JP3787318B2 (ja) 2002-07-05 2002-07-05 情報処理装置、情報処理方法、及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002196995A JP3787318B2 (ja) 2002-07-05 2002-07-05 情報処理装置、情報処理方法、及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2004038729A JP2004038729A (ja) 2004-02-05
JP3787318B2 true JP3787318B2 (ja) 2006-06-21

Family

ID=31704879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002196995A Expired - Fee Related JP3787318B2 (ja) 2002-07-05 2002-07-05 情報処理装置、情報処理方法、及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP3787318B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4872504B2 (ja) * 2006-07-19 2012-02-08 富士ゼロックス株式会社 分類情報管理装置、分類情報管理システムおよび分類情報管理プログラム
JP2008225582A (ja) * 2007-03-08 2008-09-25 Mazda Motor Corp テキスト分類装置及びプログラム
JP5138621B2 (ja) * 2009-03-02 2013-02-06 日本電信電話株式会社 情報処理装置及び不満解決商品発見方法及びプログラム
JP5138622B2 (ja) * 2009-03-02 2013-02-06 日本電信電話株式会社 情報処理装置及び不満抽出方法及びプログラム
JP5471673B2 (ja) * 2010-03-23 2014-04-16 大日本印刷株式会社 文書分類装置、プログラムおよび記憶媒体
JP5863537B2 (ja) 2012-03-30 2016-02-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 電子文書に含まれる非自己記述的用語を特定するためのコンピュータ実装方法、プログラムおよびシステム
JP6169444B2 (ja) * 2013-08-30 2017-07-26 富士通クラウドテクノロジーズ株式会社 匿名化システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021445A (ja) * 2002-06-14 2004-01-22 Nri & Ncc Co Ltd テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2004038729A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
Kim et al. Mining affective experience for a kansei design study on a recliner
Jiao et al. A proposal for Kansei knowledge extraction method based on natural language processing technology and online product reviews
JP2012027845A (ja) 情報処理装置、関連文提供方法、及びプログラム
Choi et al. Fontmatcher: font image paring for harmonious digital graphic design
Doshi et al. Movie genre detection using topological data analysis
JP3738011B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Carberry et al. Access to multimodal articles for individuals with sight impairments
Wu et al. Multimodal web aesthetics assessment based on structural SVM and multitask fusion learning
JP3787318B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Čok et al. Methodology for mapping form design elements with user preferences using Kansei engineering and VDI
JP4067603B2 (ja) 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
Molina Beltrán et al. Improving the affective analysis in texts: automatic method to detect affective intensity in lexicons based on Plutchik’s wheel of emotions
CN116882414B (zh) 基于大规模语言模型的评语自动生成方法及相关装置
JP2004240887A (ja) 検索情報表示システム及び検索キーワード情報表示方法及び検索キーワード情報表示プログラム
JP3408998B2 (ja) データ検索装置、及びデータ検索用プログラムが記憶された記憶媒体
Dařena et al. Clients’ freely written assessment as the source of automatically mined opinions
Noor et al. Applying Kansei Engineering to Determine Emotional Signature of Online Clothing Websites.
JP4614526B2 (ja) データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体
JP4712221B2 (ja) 主観的特徴要素生成装置、主観的特徴要素生成方法、及び主観的特徴要素生成プログラム
JP2002358323A (ja) 検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索プログラム
JP2004054732A (ja) 人材活用支援システムおよび人材活用支援プログラム
Ding et al. Short text processing for analyzing user portraits: a dynamic combination
Chou et al. Chinese font recommendation based on emotional adjectives
JP7249222B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
Mehta et al. A Comparative Analysis Of Sentiment analysis In Big Data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120331

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees