JP4614526B2 - データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体 - Google Patents

データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体 Download PDF

Info

Publication number
JP4614526B2
JP4614526B2 JP2000358382A JP2000358382A JP4614526B2 JP 4614526 B2 JP4614526 B2 JP 4614526B2 JP 2000358382 A JP2000358382 A JP 2000358382A JP 2000358382 A JP2000358382 A JP 2000358382A JP 4614526 B2 JP4614526 B2 JP 4614526B2
Authority
JP
Japan
Prior art keywords
subjective
feature
data
acquired
information data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000358382A
Other languages
English (en)
Other versions
JP2002163417A (ja
Inventor
真 佐野
淳 高藤
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP2000358382A priority Critical patent/JP4614526B2/ja
Publication of JP2002163417A publication Critical patent/JP2002163417A/ja
Application granted granted Critical
Publication of JP4614526B2 publication Critical patent/JP4614526B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体に係り、詳細には、分析対象を主観的な観点から数値化し分析することのできるデータ分析装置、及びデータ分析用プログラムに関する。
【0002】
【従来の技術】
商品情報分析等のデータ分析においては、例えば、商品情報分析における商品の仕様に関する数値情報等の数値情報が利用されている。
このような数値情報を利用したデータ分析として、最近では、テキスト情報に基づいた数値情報を利用することも可能になっている。テキスト情報を利用する分析では、例えば、分析対象に付属するテキストからキーワードを抽出して、このキーワードの頻度やテキスト中での位置等を数値化する。尚、キーワードとしては、分析者が注目したテーマに関連する語句や、商品名、属性名など、主に名詞や名詞からなるフレーズが用いられる。
このように、数値情報を利用した従来のデータ分析では、商品の仕様や名詞句中心のキーワード等、客観的な特徴が数値化され、情報の収集・分類・抽出等が行われる。
【0003】
【発明が解決しようとする課題】
しかし、上述のような従来のデータ分析においては、例えば顧客の要望アンケートの回答として得る「わかりやすく」や「もっとすっきりと」といった表現のように、分析対象についてのイメージや認知に関わる情報が主観的特徴を表現している場合に、これを数値化することが困難である。
そのため、主観的な特徴情報の収集方法として、例えばアンケート分析の手法としてSD法がよく用いられている。このSD手法は、互いに相対する関係の形容詞対を予め用意しておき、各対の形容詞間を5段階程度に区分して印象を評価させる。例えば、「欲しい 1−2−3−4−5 欲しくない」、「高い 1−2−3−4−5 安い」、「格好いい 1−2−3−4−5 格好悪い」等の設問を用意し、顧客に番号を選択させる。この手法では、顧客の主観的な評価を収集することが可能となる。しかし、用意された形容詞対以上の印象についての情報は得ることはできない。
このような問題点に対応するため、SD法を採用したアンケート等では、自由記述項目を設け、用意された形容詞対に含まれない印象等の主観的特徴についてはこの欄に記述してもらうことが行われる。そして、分析に対しては、分析者が、一つずつ目を通していったり、特定のキーワードに絞り込んで目を通していく。そのため、分析対象についての全体像や特徴、注目したい点について定量的に把握、蓄積することはできない。
【0004】
従って、本発明は、分析対象を主観的な観点から数値化し分析することのできるデータ分析装置、及びデータ分析用プログラムが記録された記録媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】
請求項1記載の発明では、分析対象としての情報データを取得する情報データ取得手段と、この情報データ取得手段で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得手段と、情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得手段で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出手段と、前記数値データ検出手段で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備え、前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得手段で取得した前記情報データの主観的特徴とする客観的特徴変換手段と、を含み、前記取得した情報データから主観的特徴が取得された場合には、当該取得した主観的特徴を用い、取得されなかった場合には、前記客観的特徴変換手段で変換された主観的特徴を用いる、ことを特徴とするデータ分析装置を提供する。
請求項記載の発明では、分析対象としての情報データを取得する情報データ取得手段と、この情報データ取得手段で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得手段と、情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得手段で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出手段と、前記数値データ検出手段で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備え、前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得手段で取得した前記情報データの主観的特徴とする客観的特徴変換手段と、を含み、前記情報データ取得手段で取得した情報データに文書データが含まれている場合に、該文書データから、主観的特徴を表現する印象表現語を抽出する印象表現語抽出手段を含み、該印象表現語抽出手段で抽出された印象表現語を主観的特徴として取得し、前記数値データ検出手段は、印象表現語と、印象表現語を構成する主観的特徴要素及び該主観的特徴要素のレベル値データとの対応を保持する前記特徴−要素対応辞書から、前記主観的特徴要素と該主観的特徴要素のレベル値とを検出する、ことを特徴とするデータ分析装置を提供する。
請求項記載の発明では、前記出力手段は、前記主観数値データ取得手段で取得された前記主観数値データと、該主観数値データの取得元の前記情報データに付随し前記客観的特徴取得手段で取得された前記客観的特徴との対応を認識可能に、出力することを特徴とする請求項1または請求項に記載のデータ分析装置を提供する。
請求項記載の発明では、分析対象としての情報データを取得する情報データ取得機能と、この情報データ取得機能で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得機能と、情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得機能で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出機能と、前記数値データ検出機能で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得機能で取得した情報データを数値化した主観数値データを取得する主観数値データ取得機能と、前記主観数値データ取得機能で取得された前記主観数値データに基づく出力を行う出力機能とをコンピュータに実現させるデータ分析用プログラムが記憶された記憶媒体であって、前記主観的特徴取得機能は、前記情報データ取得機能で取得した情報データに付随する客観的特徴を取得する客観的特徴取得機能と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得機能で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得機能で取得した前記情報データの主観的特徴とする客観的特徴変換機能と、を含み、前記取得した情報データから主観的特徴が取得された場合には、当該取得した主観的特徴を用い、取得されなかった場合には、前記客観的特徴変換機能で変換された主観的特徴を用いる、ことを特徴とするデータ分析用プログラムが記憶された記憶媒体を提供する。
【0015】
【発明の実施の形態】
以下、本発明のデータ分析装置、及びデータ分析用プログラムが記憶された記憶媒体における好適な実施の形態について、図1から図16を参照して説明する。
【0016】
図1は本発明のデータ分析装置の一実施形態の構成であり、本発明のデータ分析用プログラムが記憶された記憶媒体の該プログラムが読みとられたコンピュータの構成を、概念的に表したものである。
この概念構成図に示されるように、データ分析装置(コンピュータ)は、入力手段1、情報データ取得手段2、主観的特徴取得手段3、数値データ検出手段4、特徴−要素対応辞書5、主観数値データ取得手段6、及び出力手段7を備えている。
【0017】
入力手段1は、ユーザがデータ分析処理装置に行わせる各種処理についての命令を入力したり、CD−ROMやDVD等の補助記憶装置や外部装置に予め格納された情報データの中からデータ分析の分析対象を選択するためのものである。入力手段1には、キーボード、マウス、マイク及びこのマイクからの音声の音声認識装置等の入力装置と、これらの入力装置からの入力を制御する入力制御手段とが含まれる。またこの入力手段1は、分析対象となり得る文書データや音声データ等の情報データの入力や、外部の装置等からの取り込みその他の操作の対象となる情報データの指定、分析対象となる情報データの指定等にも使用される。
情報データ取得手段2は、分析対象としての情報データを取得する情報データ取得処理を行う。情報データ取得手段2は、入力手段1から入力された情報データを直接取得したり、入力手段1でデータ分析処理の対象として指定・選択された情報データを、内部記憶装置から、また通信手段やインターフェイスを介して、補助記憶装置や外部装置から、有線または無線で取得する。外部装置としては、LAN接続された他のパーソナルコンピュータや、インターネットのワールド・ワイド・ウェブ(WWW)に接続された外部のパーソナルコンピュータなどが該当する。
尚、本実施形態では、分析対象は、アンケート結果であり、文書データや、音声認識手段やOCRによって文書に変換できるデータであるが、この他、分析対象となる情報データとしては、主観的な類似性によって相対関係を表現できる形式のデータ全てが含まれ、例えば、画像データ、音楽データ、出版物等のテキストデータ、その他信号データ、及び、これらを要素とするコンテンツ等を採用することができる。また、分析対象となる情報データは、そのデータ中に主観的な表現を含む等主観的特徴を直接把握できるものでなくてもよく、客観的特徴のみを有しているものであってもよい。
【0018】
主観的特徴抽出手段3は、情報データ取得手段2で取得した情報データから主観的特徴を抽出する主観的特徴抽出処理を行う。
本実施形態では、主観的特徴抽出手段3は、音声認識手段31を備えており、情報データが音声データである場合に、音声認識手段31によって、音声データを文書データに変換する音声データ変換処理を行う。また、主観的特徴抽出手段3は、文字認識手段(OCR)32を備えており、情報データが画像データの場合に、文字認識手段32によって、入力手段1からの命令に応じて画像データ中から文書データを抽出する文字認識処理を行う。
また、主観的特徴抽出手段3は、印象表現語抽出手段33を備えている。印象表現語抽出手段33は、情報データ取得手段2で取得した情報データに文書データが含まれている場合に、文書データから、主観的特徴を表現する印象表現語を抽出する印象表現語抽出処理を行う。また、本実施形態においては、情報データから音声認識手段31や文字認識手段32によって文書データが得られた場合にも、この文書データから印象表現語を抽出する。
本実施形態において、主観的特徴抽出手段3で抽出される主観的特徴は、印象表現語である。ここで印象表現語とは、事物を表現する場合に用いられる語(句)であって、事物の物理的な特徴ではなく、直感的な印象を「やわらかい」、「クリアな」等の形容詞や形容動詞によって表現する言葉(感性語)である。そして、主観的特徴抽出手段3の印象表現語抽出手段33は、情報データ取得手段2で取得した情報データに文書データが含まれている場合、音声データを文書データに変換した場合、及び画像データを文書データに変換した場合に、これらの文書データから、特徴−要素対応辞書5に保持される印象表現語を主観的特徴として抽出する。
【0019】
更に、本実施形態においては、主観的特徴抽出手段3は、客観的特徴取得手段35、客観的特徴変換手段36、及び特徴変換辞書37を備えており、情報データから印象表現語が抽出されなかった場合に、客観的特徴を抽出し、抽出された客観的特徴に基づいて印象表現語を得るようになっている。
尚、情報データから主観的特徴が抽出されなかった場合とは、情報データが文書データでなかった場合、情報データが音声データまたは画像データであってこれらのデータから文書データが得られなかった場合、情報データが文書データであったり変換により文書データが得られたが、この文書データから印象表現語が得られなかった場合である。
【0020】
客観的特徴取得手段35は、情報データ取得手段2で取得した情報データから印象表現語が抽出されなかった場合に、情報データ取得手段2で取得した情報データに付随する客観的特徴を取得する客観的特徴取得処理を行う。
客観的特徴取得処理においては、情報データ取得処理2で取得した情報データから得た文書データにおいて、特徴変換辞書37に格納されている客観的特徴と一致する語句を検出し、この語句を情報データ取得手段2で取得した情報データに付随する客観的特徴とする。尚、客観的特徴は、情報データから検出する他、情報データとは別途、入力手段1からの入力により得ることも可能である。例えば、情報データから得た文書データ中に客観的特徴が検出されなかった場合に、出力装置にこの情報データに関する客観的特徴を問い合わせるメッセージを出力し、操作者からの入力手段1への入力により回答を得る等である。
客観的特徴変換手段36は、特徴変換辞書37から、客観的特徴取得手段35で取得した客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、情報データ取得手段2で取得した情報データの主観的特徴とする客観的特徴変換処理を行う。
また、本実施形態においては、情報データ取得手段2で取得した情報データから印象表現語が抽出された場合にも、客観的特徴抽出処理を行う。そして、抽出された客観的特徴は、特徴変換辞書37により印象表現語を得るために使用された場合も含み、出力手段7から出力される出力データを生成するために使用される。
【0021】
図2は、特徴変換辞書37の内容を概念的に表したものである。
この図2に示すように、特徴変換辞書37には、カテゴリ分類毎に、情報データに含まれる客観的特徴に、この客観的特徴が付随する情報データにおいて抽出され易い主観的特徴が対応して、格納されている。例えば、カテゴリ「ビール」では、客観的特徴として、商品名が、その主観的特徴(印象表現語)と対応して格納されている。図2に示す特徴変換辞書37によれば、アサヒスーパードライには、「ドライな」という印象表現語が対応している。そして、文書データから印象表現語「ドライな」が抽出されたのと同様に、以降の処理において主観数値データが取得される。
この特徴変換辞書37に格納される客観的特徴と主観的特徴との対応は、情報データ取得手段2で取得される情報データから主観的特徴が取得された場合に客観的特徴を取得しておき、共通の情報データから取得される客観的特徴と主観的特徴との対応を取得し、取得した対応に基づいて更新することができる。この場合、更新は、取得した対応を随時、または、同一の対応が所定回数以上得られた場合等の所定の条件を満たした場合に行うようにすることができる。また対応は、情報データから取得した対応をそのまま格納しても、所定の統計的処理を施してその結果を格納してもよい。また、分析対象となる情報データ以外の文献等から、客観的特徴と主観的特徴の対応を抽出し特徴変換辞書37を構築、更新するようにしてもよい。
【0022】
尚、本実施形態では、入力手段1から入力された文書データや、画像データを文書データに変換したデータから主観的特徴及び客観的特徴を取得しているが、文書データ以外のデータから、これらを取得するようにしてもよい。主観的特徴として画像データを取得しこれから主観数値データを得る手法としては、例えば、特徴−要素対応辞書5に、画像データ(特徴画像データ)と主観数値データとを対応させ格納しておき、入力手段1から取得した画像データに配色パターンや輪郭パターンの最も類似する特徴画像データを検索し、この特徴画像データに対応する主観数値データを、入力された画像データの主観数値データとする。また、特徴−要素対応辞書5に、音データ(特徴音データ)と主観数値データとを対応させ格納しておき、入力手段1から取得した音データに一定時間における音圧レベルの時系列分布や周波数分布が最も類似する特徴音データを検索し、この特徴音データに対応する主観数値データを、入力された音データの主観数値データとする。
また、入力手段1から取得した画像データの配色や輪郭の特徴を表す物理量や、音データの一定時間における音圧レベルの時系列分布や周波数分布、音データが音楽データの場合にそのテンポや音色属性を客観的特徴として、特徴変換辞書37にこれらの客観的特徴と主観的特徴との対応を備え、これらの客観的特徴を主観的特徴に変換するようにしてもよい。
画像データや音データから主観数値データを取得し分析することは、例えば、ある期間に公開された映画の主観的特徴を比較する場合、映画本編からサンプリングされた画像データ、音楽データ及び映画紹介の文書データを総合的に分析することができ、文書データのみでは得られたい特徴を把握し、より効果的な分析結果を得る可能性がある。このように、文書データ、音楽データ、画像データ、その他の各種データから主観的特徴を得る場合、複数種類のデータから映画作品等のトータルな主観数値データを得るようにしてもよい。
【0023】
数値データ検出手段4は、特徴−要素対応辞書5から、主観的特徴取得手段3で取得された主観的特徴に対応する主観的特徴要素及びその数値データとを検出する数値データ検出処理を行う。
【0024】
図3は、特徴−要素対応辞書5の内容を表した説明図である。
この図3に示すように、特徴−要素対応辞書5には、情報データから取得された文書データにおいて主観的に表現される印象表現語と、それら主観的特徴を構成する主観的特徴要素及び該主観的特徴要素のレベル値データとが、対応して格納されている。
本実施形態においては、特徴−要素対応辞書5は、主観的特徴を表現する印象表現語に対応して、印象表現語を構成する主観的特徴要素とこの主観的特徴要素のレベルを表す数値データとが、ビール、ワイン、日本酒、映画、テレビ番組情報、Web上の旅行情報、オンラインショッピング等の、分析対象となる情報データのカテゴリ毎に分類されて格納されている。特徴−要素対応辞書5におけるカテゴリは、特徴変換辞書37におけるカテゴリと同一である。
特徴−要素対応辞書5には、各カテゴリに属する印象表現語、具体的には形容詞・形容動詞に代表される表現語と、程度副詞(「やや」「かなり」などの程度を指し示す副詞)や印象の要因と強く結びついている名詞・固有名詞等が、予め各カテゴリ毎に収集され、格納される。例えば、ビールについてのアンケートで、希望するビールについてのイメージや感覚等の印象が自然言語で表現された場合に、使用される印象表現語が各カテゴリ毎に分類して格納される。
【0025】
そして、各印象表現語に対して主観的特徴要素とその強さが指定され、各印象表現語に対する主観数値データとして、主観的特徴要素を主観的特徴要素とする座標空間に布置される、多次元のレベル値(ベクトル)が決定されている。このように、本実施形態では、印象表現語に対して、個々の表現が主観的な特徴要素の強さを指定する(主観数値データ空間の特定の位置を指し示す)という仮説に基づいて、印象表現語それぞれに対する各類似性要素の相対的なレベル値が与えられている。
ここで主観的特徴要素とは、主観的な特徴を表す要素(主観的特徴要素)である。例えば、分析対象となる情報データのカテゴリを映画とすると、作品の性質である「スリル度」、「感動度」、「コメディ度」等が主観的特徴要素となっている。また、カテゴリ「ビール」に対しては、「コクのある−あっさりとした」「キレのある−やわらかい」「うまみのある−味気ない」「のどごしのよい−のみにくい」「爽快感のある−重々しい」等が主観的特徴要素となっている。
そして、例えば、図3に示されるように、カテゴリ「ビール」に対する印象表現語「コクのある」には、主観的特徴要素「コクのある−あっさりとした」のレベル値が3、主観的特徴要素「キレのある−やわらかい」のレベル値が0、・・・という主観数値データが与えられている。
尚、主観的特徴要素「コクのある−あっさりとした」「キレのある−やわらかい」「うまみのある−味気ない」「のどごしのよい−のみにくい」「爽快感のある−重々しい」等は、それぞれ相反する意味が対局(マイナス)のレベル値として表現されるようになっており、例えば、「コクのある−あっさりとした」の主観的特徴要素では、コクがある場合にレベル値が正となり、あっさりとしている場合にレベル値が負となり、それらの度合いが大きいほどレベル値の絶対値が大きくなるようになっている。
【0026】
図4は、主観的特徴要素を主観的特徴要素とする座標空間と、この座標空間に布置された各印象表現語に対する主観数値データを例示したものである。この図4では、ビールの座標空間を、コク(コクのある−あっさりとした)、キレ(キレのある−やわらかい)、うまみ(うまみのある−味気ない)の3要素の主観的特徴要素で表現し、印象表現語「クリーミーな」「まろやかな」「ドライな」に対する主観数値データを布置したものである。
この図4に示されるように、各印象表現語は、そのカテゴリに属するイメージ情報に対して抽出される主観的特徴要素を主観的特徴要素とし、各レベル値を要素とする主観数値データ(ベクトル)で表現される。
【0027】
図1に示す主観数値データ取得手段6は、数値データ検出手段4で検出した主観的特徴要素及びレベル値データに基づいて、情報データ取得手段2で取得した情報データを数値化した主観数値データを取得する主観数値データ取得処理を行う。
この主観数値データ取得処理は、分析の単位1つ分の情報データから1つの印象表現語のみが取得されている場合には、その印象表現語から得た主観的特徴要素とレベル値を、そのままその情報データの主観数値データとして決定する。分析の単位1つ分の情報データから複数の印象表現語が取得され、各印象表現語についての主観的特徴要素及びレベル値が取得されている場合に、後述の統合処理による処理結果を、主観数値データとする。統合処理によって得られる処理結果は、印象表現語と同様に主観的特徴要素とレベル値とで構成されている。
【0028】
出力手段7は、主観数値データ取得手段6で取得された主観数値データに基づく出力を行う出力処理を行う。出力手段7には、ディスプレイやプリンタ等の出力装置と、これらの出力装置からの出力を制御する出力制御手段とが含まれる。
出力手段7は、本実施形態においては、情報データ取得手段2で取得した情報データに付随する客観的特徴を客観的特徴取得手段35から数値データ検出手段4及び主観数値データ取得手段6を介して取得する。そして、主観数値データ取得手段6で取得された主観数値データと、この主観数値データの取得元の情報データに付随し客観的特徴取得手段35で取得された客観的特徴との対応を、認識可能な出力データを生成し、この出力データを出力する。
出力手段7による出力は、主観数値データと客観的特徴との対応を認視可能なイメージデータを、出力装置である表示装置に表示したり出力装置である印刷装置に印刷出力することにより行われる。
【0029】
図5は、このように構成されたデータ分析装置の、具体的なシステム構成を表したものである。
図5に示されるように、データ分析装置はパーソナルコンピュータやワードプロセッサ等を含むコンピュータシステムによって構成される。
データ分析装置は、図5に示すようにシステム全体を制御するための制御部11を備えている。この制御部11には、データバス等のバスラインを介して、入力装置としてのキーボード12やマウス13、表示装置14、印刷装置15、記憶装置16、記憶媒体駆動装置17、通信制御装置18、入出力I/F19、及び文字認識装置20、音声認識装置21が接続されている。
【0030】
制御部11は、CPU111、ROM112、RAM113を備えている。
CPU111は、プログラムに従って各種装置を制御し演算を行う。
ROM112は、コンピュータの起動時に実行されるプログラム等が予め格納されたリードオンリーメモリである。RAM113は、CPUが各種制御や演算を行うためのプログラムやデータが格納されるワーキングメモリとして使用され、本実施形態によるデータ分析処理等の各種処理を行うための各種エリアが確保可能になっている。
【0031】
キーボード12は、入力手段1を構成し、ユーザがデータ分析処理装置に行わせる各種処理についての命令や、情報データ、客観的特徴データを入力したり、CD−ROMやDVD等の補助記憶装置や外部装置に予め格納された情報データの中からデータ分析の分析対象を選択するために使用される。キーボード12には、仮名文字を入力するための仮名キーやテンキー、各種機能を実行するための機能キー、カーソルキー、等の各種キーが配置されている。
マウス13は、ポインティングデバイスであり、キーボードと同様に入力手段1を構成し、表示装置14に表示されたキーやアイコン等をクリックすることで分析対象となる情報データを指定したり処理の命令を行う。
表示装置14は、例えばCRTや液晶ディスプレイ等が使用される。この表示装置には、データ分析対象となり得る情報データがアイコンやファイル名で表示され、分析を行う情報データをキーボード12やマウス13により選択するようになっている。またこの表示装置14は出力手段7を構成し、情報データから取得された主観数値データを、情報データに付随する客観的特徴との対応を認識可能に画像表示するようになっている。
印刷装置15は、出力手段7を構成し、表示装置14に表示された画像等の印刷を行うためのものである。この印刷装置としては、レーザプリンタ、ドットプリンタ、インクジェットプリンタ、ページプリンタ、感熱式プリンタ、熱転写式プリンタ、等の各種印刷装置が使用される。
【0032】
記憶装置(補助記憶装置)16は、読み書き可能な記憶媒体と、その記憶媒体に対してプログラムやデータ等の各種情報を読み書きするための駆動装置で構成されている。この記憶装置16に使用される記憶媒体としては、主としてハードディスクが使用されるが、後述の記憶媒体駆動装置17で使用される各種記憶媒体のうちの読み書き可能な記憶媒体を使用するようにしてもよい。
記憶装置16は、仮名漢字変換辞書161、プログラム格納部162、データ格納部163、特徴変換辞書37、特徴−要素対応辞書5、図示しないその他の格納部(例えば、この記憶装置16内に格納されているプログラムやデータ等をバックアップするための格納部)等を有している。
プログラム格納部162には、本実施形態における情報データ取得処理を行う情報データ取得処理プログラム、主観的特徴取得処理を行う主観的特徴処理プログラム、数値データ検出処理を行う数値データ検出処理プログラム、主観数値データ取得処理を行う主観数値データ処理プログラム、出力処理を行う出力処理プログラム、等の各種プログラムの他、仮名漢字変換辞書161を使用して入力された仮名文字列を漢字混り文に変換する仮名漢字変換プログラム等の各種プログラムが格納されている。
データ格納部163には、情報データやシステムが必要とする各種データが格納される。
【0033】
記憶媒体駆動装置17は、CPU111が外部の記憶媒体からコンピュータプログラムや文書を含むデータ等を読み込むための駆動装置である。記憶媒体に記憶されているコンピュータプログラム等には、本実施形態のデータ分析装置により実行される情報データ取得処理や、主観的特徴取得処理、数値データ検出処理、主観数値データ取得処理、出力処理等の各種処理プログラム、及び、そこで使用される特徴変換辞書37、特徴−要素対応辞書5、データ等も含まれる。
ここで、記憶媒体とは、コンピュータプログラムやデータ等が記憶される記憶媒体をいい、具体的には、フロッピーディスク、ハードディスク、磁気テープ等の磁気記憶媒体、メモリチップやICカード等の半導体記憶媒体、CD−ROMやMO、PD(相変化書換型光ディスク)等の光学的に情報が読み取られる記憶媒体、紙カードや紙テープ等の用紙(及び、用紙に相当する機能を持った媒体)を用いた記憶媒体、その他各種方法でコンピュータプログラム等が記憶される記憶媒体が含まれる。
本実施形態のデータ分析装置において使用される記憶媒体としては、主として、CD−ROMやフロッピーディスク等の記憶媒体が使用される。
記憶媒体駆動装置17は、これらの各種記憶媒体からコンピュータプログラムを読み込む他に、フロッピーディスクのような書き込み可能な記憶媒体に対してRAM113や記憶装置16に格納されているデータ等を書き込むことが可能である。
【0034】
なお、フロッピーディスクやメモリチップ、ICカード等に格納された情報データや客観的特徴を記憶媒体駆動装置17を介して読み込んで、本実施形態によるイメージ情報検索を行う場合、記憶媒体駆動装置17は情報データ取得手段2や客観的特徴取得手段35として機能する。
【0035】
本実施形態のデータ分析装置では、制御部11のCPU111が、記憶媒体駆動装置17にセットされた外部の記憶媒体からコンピュータプログラムを読み込んで、記憶装置16の各部に格納(インストール)する。そして、本実施形態によるデータ分析処理等の各種処理を実行する場合、記憶装置16から該当プログラムをRAM113に読み込み、CPU111で実行するようになっている。
但し、記憶装置16からではなく、記憶媒体駆動装置17により外部の記憶媒体から直接RAM113にプログラムを読み込んで実行することも可能である。
また、データ分析装置によっては、本実施形態のデータ分析処理のための各プログラムを予めROM112に記憶させておき、これをCPU111が実行するようにしてもよい。
更に、本実施形態のデータ分析処理のためのプログラム等の各種プログラムやデータを、通信制御装置18を介して他の記憶媒体からダウンロードし、実行するようにしてもよい。
【0036】
通信制御装置18は、データ分析装置と他のパーソナルコンピュータやワードプロセッサ等の各種外部電子機器との間をネットワーク接続するための制御装置である。
通信制御装置18は、これら各種外部電子機器からこの通信制御装置18を介してのアクセスを可能にしており、外部電子機器から情報データや客観的特徴を入力することができる。この場合の通信制御装置18は情報データ取得手段2や客観的特徴取得手段35として機能する。また、通信制御装置18を介して外部電子機器から特徴変換辞書37や特徴−要素対応辞書5に格納される各種対応を取得して更新することができ、この場合の通信制御装置18は、特徴変換辞書更新手段や特徴−要素対応辞書更新手段の一部として機能する。また、情報データから取得された主観数値データに基づいて作成される出力データを通信制御装置18を介して外部電子機器に出力することが可能であり、この場合の通信制御装置18は、出力手段7として機能する。
【0037】
入出力I/F19は、音声や音楽等の出力を行うスピーカ等の各種機器を接続するためのインターフェースである。
文字認識装置20は、用紙等に記載された文字をテキスト形式やHTML等の各種形式で認識する装置であり、イメージスキャナや文字認識プログラム等で構成されている。この文字認識装置20は、検索条件文取得手段2として機能し、またイメージ情報追加手段の一部として機能する。
音声認識装置21には音声を取り込む音声取り込み手段として機能する図示しないマイクが接続されており、このマイクから取り込んだ音声を認識してテキストデータに変換するようになっている。マイクから入力される音声による情報データを認識し文書データに変換する場合の音声認識装置21は、主観的特徴取得手段3として機能する。
【0038】
本実施形態のデータ分析装置は、パーソナルコンピュータやワードプロセッサ等を含むコンピュータシステムで構成するだけでなく、LAN(ローカル・エリア・ネットワーク)のサーバ、コンピュータ(パソコン)通信のホスト、インターネット上に接続されたコンピュータシステム等によって構成することも可能である。また、ネットワーク上の各機器に機能分散させ、ネットワーク全体でデータ分析装置を構成することも可能である。
図6は、このようなネットワークによりデータ分析装置を構成した場合のシステム構成図を表したものである。
図6に示すように、データ分析装置は、主観的特徴取得処理、数値データ検出処理、及び主観数値データ取得処理、主観数値データに基づく出力データの生成処理等を行うホスト装置30と、情報データを取得しホスト装置30に送信し、ホスト装置30から送信されてきた出力データに基づく出力を行う複数のクライアントPC50と、ホスト装置30と各クライアントPCとを接続するネットワーク40とから構成されている。
ネットワーク40としては主としてインターネットに接続されるが、LAN(ローカル・エリア・ネットワーク)や、コンピュータネットワーク等の各種ネットワーク40と接続可能になっている。
ネットワーク40にはパーソナルコンピュータ等のクライアントPC50が適宜接続されるようになっており、適時複数のクライアントPC50がホスト装置30にアクセス可能になっている。
【0039】
クライアントPC50は、パーソナルコンピュータ等のいわゆるパソコンシステムにより構成され、ダイヤルアップソフトウェア等によりネットワーク40(インターネット)に接続されWWW(World Wide Web)のデータをブラウザ(browser)ソフトによりに閲覧可能になっている。
一方、クライアントPC50は制御部、表示部、入力部、出力部、通信制御部、記憶部、その他の機器を備えている。クライアントPC50の制御部は、装置全体を所定のプログラムに従って処理、制御するようになっており、入力部から入力された情報データを、通信制御部及びネットワーク40を介してホスト装置30に送信すると共に、ホスト装置30で生成された出力データを受信して表示部に表示し、記憶部に格納し、又は出力部から印刷出力するようになっている。
【0040】
一方、ホスト装置30は、制御部31を備えておりデータバス等のバスラインBを介して入出力部32、表示部34、通信制御部38、記憶部36、図示しないその他の機器が接続されている。
これらの各部31〜38の基本的構成は、図5に示したデータ分析装置と同様であるため、特に異なる点を中心に説明する。
本実施形態における制御部31は、WWWサーバとして機能し、図5に示したデータ分析装置の制御部11や、クライアントPC50の制御部11に比べ高速処理が可能であると共に、複数のクライアントPC50からのアクセスに対応するために並列処理が可能になっている。
同様に通信制御部35も複数のISDN回線との接続が可能であると共に、クライアントPC50のそれよりも高速処理が可能になっている。
【0041】
以上のように構成されたデータ分析装置による処理動作について次に説明する。
図7は、データ分析装置によるデータ分析処理の流れを表したフローチャートである。
データ分析装置によるデータ分析では、まず、データ分析の対象となる情報データが取得される(情報データ取得処理)(ステップ10)。情報データの取得は、自然言語による文書をキーボードから入力したり、音声をマイクから入力したり、画像をスキャナで読みとったり、データ格納部162や記憶媒体、外部装置に格納される上述の各種データを選択することにより行われる。
本実施形態においては、複数の情報データについてそれぞれ分析処理を行い、結果を個別または同時に出力することが可能になっており、情報データ取得処理においては、複数の情報データを一度に入力したり選択することが可能になっている。ここで1つの情報データとは、分析対象としての単位であり、この単位は、操作者が分析対象を指定する際に決定される。従って、1つの情報データの中に、複数の文書データが含まれたり、文書データと音データ等複数のデータが含まれる場合もある。
取得された情報データはRAM113の所定の作業エリアに格納される。
【0042】
そして、情報データ取得処理において取得された情報データから、主観的特徴としての印象表現語が取得される(印象表現語取得処理)(ステップ20)。
図8は、印象表現語取得処理の処理の流れを表したフローチャートである。
情報データ取得処理で取得された情報データは、まず。文書データを含むかどうか判断される(ステップ21)。
そして、情報データに文書データが含まれない場合(ステップ21;N)には、文書データ取得処理が行われる(ステップ23)。文書データ取得処理では、情報データが音データの場合には、音データを音声認識装置により音声認識処理を行い、情報データが画像データの場合には、文字認識装置により文字認識処理を行う。
【0043】
情報データに文書データが含まれていた場合(ステップ21;Y)、及び、文書データ取得処理(ステップ23)により文書データが得られた場合(ステップ2t;Y)には、これらの文書データから印象表現語、程度副詞、及びカテゴリ分類情報が抽出される(印象表現語抽出処理)(ステップ27)。例えば、文書データ「上品でさわやかなビール、23才、OL」からは、印象表現語「上品な」「さわやかな」が抽出され、カテゴリ分類情報「ビール」が抽出される。
そして、文書データ取得処理(ステップ23)により文書データが得られなかった場合(ステップ25;N)には、客観的特徴入力画面を表示する等によりユーザに客観的特徴の入力を促し、客観的特徴を取得する(ステップ31)。例えば、データ分析対象がアンケートの回答である場合、回答者の年齢、性別等の回答者のプロフィール、回答のうち数値や固有名詞等客観的な特徴を示すもの(一週間のうちの飲酒日数や一回の飲酒量、気に入っているブランド名等)である。
客観的特徴を得ると、特徴変換辞書37が参照され、取得した客観的特徴に対応する印象表現語(主観的特徴)が取得される(ステップ33)。尚、得られた回答に含まれる客観的特徴は、全てを印象表現語を取得する際に参照しなくてもよく、一部は出力処理において出力される主観数値データとともに出力するためのみに参照されてもよい。客観的特徴のうちいずれを印象表現語を取得するために参照するかは、アンケート等、主観数値データを得る目的に応じて異なる。参照される客観的特徴は、予め固定的に設定されていても、操作者が設定できるようになっていてもよい。本実施形態においては、回答者のプロフィールと、主観数値データとの相関関係を分析する目的があることから、回答者のプロフィールについては、客観的特徴を得る際には参照されないようになっている。
【0044】
文書データから印象表現語が抽出された場合(ステップ29;Y)、及び客観的特徴から印象表現語が取得された場合(ステップ33後)には、カテゴリ分類情報が取得されているかどうかが調べられる(ステップ35)。即ち、文書データから印象表現語等を抽出した場合には、このときに印象表現語とともにカテゴリ分類情報も抽出されたか否かが確認され、客観的特徴が取得された場合には、この客観的特徴にカテゴリ分類情報が含まれていたかどうかが確認される。そしてカテゴリ分類情報が取得されていない場合には(ステップ35;N)、カテゴリ情報取得処理を行う(ステップ37)。即ち、カテゴリ入力画面として、特徴変換辞書37においてステップ27で抽出された印象表現語が含まれている各カテゴリ名をリスト表示し、ユーザにカテゴリの選択を促し、ユーザからの選択入力により、カテゴリ情報を取得する。
ステップ35において既にカテゴリ分類情報が取得されていた場合、及びカテゴリ情報取得処理(ステップ37)の後は、印象表現語取得処理を終了し、メインのルーチンにリターンする。
【0045】
印象表現語取得処理により印象表現語が取得されると、続いて、数値データ検出手段4が、特徴−要素対応辞書5から、主観的特徴取得手段3で取得された主観的特徴に対応する主観的特徴要素及びその数値データを検出する(数値データ検出処理)(ステップ40)。即ち、主観的特徴要素に対するレベル値のデータを各印象表現語について特徴−要素対応辞書5から取り出す。
ステップ40において印象表現語について、主観的特徴要素とレベル値のデータが取得されると、主観数値データ取得手段6が、これらのデータに基づいて各情報データに対する主観数値データを取得する(主観数値データ取得処理)(ステップ60)。
図9は、主観数値データ取得処理の流れを表したフローチャートである。
この主観数値データ取得処理では、図9に示すように、主観数値データ取得手段6が、ステップ20の印象表現語取得処理において、文書データからの抽出や客観的特徴条件取得により程度副詞が取得されているかどうかを調べ(ステップ61)、程度副詞が取得されている場合には(ステップ61;Y)、この程度副詞に応じて、印象表現語の主観的特徴要素に対するレベル値を、補正する(ステップ63)。程度副詞による主観数値データの補正は、主観数値データのレベル値の絶対値が変化するように変更することによる。例えば、文書データとして「かなりあっさりとした…」というデータがあった場合、印象表現語「あっさりとした」の主観的特徴要素「コク」に対するレベル値が「−3」から、その絶対値が増加する「−3.5」に補正される。
なお、程度副詞によるレベル値補正は、「とても」「かなり」「めちゃくちゃ」「超」等の強調語の場合には絶対値が増加するように補正し、「やや」「少し」「ちょっと」等の語調を弱める語の場合には絶対値が減少するように補正する。
【0046】
本実施形態においては、補正値として、一律0.5だけ変化させるようになっているが、各程度副詞に応じて変化値(補正幅)を変えるようにしてもよい。この場合、各程度副詞と変化値の対応表が特徴−要素対応辞書5に格納される。また、レベル値補正は、所定の値を加減する以外に、所定の値を掛けてもよい。この場合にも、変化値(補正幅)である乗数を、各程度副詞に応じて異なるように設定してもしてもよい。
【0047】
各文書データに程度副詞がなかった場合(ステップ61;N)、及び程度副詞に従って主観特徴要素のレベル値を補正した後(ステップ63後)は、続いて、各情報データから取得された印象表現語の主観特徴要素及びレベル値のデータ(補正された場合には補正後のデータ)に基づいて、各情報データに対する主観数値データを生成する。この主観数値データは、情報データから複数の印象表現語が取得されている場合(ステップ65;N)には、この情報データに対する主観数値データは、統合処理(ステップ67)を行って取得する。情報データから1つの印象表現語のみが取得されている場合(ステップ65;Y)は、この印象表現語の主観特徴要素及びそのレベル値を、情報データに対する主観数値データとする(ステップ68)。
【0048】
図10は、ステップ67で行われる統合処理の流れを表すフローチャートである。
統合処理では、図10に示すように、まず統合対象を取得する(ステップ671)。統合対象となるのは、1つの情報データについての最初の場合には、情報データにおいて統合処理の処理方向で最初に出現する印象表現語と、統合処理の方向からみて次に出現する印象表現語である。この統合処理の処理方向とは、情報データが文書データであったり、音データや画像データでありこれらのデータから文書データを取得した場合には、それらの文書データの文書の先頭側から文末側への方向である。そして、文書データから印章表現語や客観的特徴が抽出された場合には、印章表現語や印章表現語への変換前の客観的特徴の文書データにおける位置が文頭側のものから文末側へ、統合処理が行われる。また、情報データから印章表現語も客観的特徴も抽出できず、客観的特徴をユーザからの入力等で取得した場合には、取得順である。
また、既に統合処理が行われている場合は、統合処理の結果得たデータと、統合処理の方向からみて統合された印象表現語の次に出現する印象表現語である。
【0049】
そして、新たに統合処理を行う統合対象が特定されなかった場合(ステップ673;N)には、既に行われた統合により得られたデータ、及び統合されなかった印象表現語の主観数値データを、統合結果として、統合処理を終了し主観数値データ取得処理(図9)のルーチンにリターンする。
【0050】
統合対象が取得された場合(ステップ673;Y)には、2つの統合対象の主観数値データから、同局要素を取得する(ステップ675)。同局要素とは、2つの統合対象の主観的特徴要素のうちそのレベル値の符号が同局(レベル値が共にプラス、または共にマイナス)となっている主観的特徴要素である。
次に、同局要素の割合が、所定の設定値H(例えば、60%、65%、70%、75%、80%、85%、n%(nは1〜100の範囲で変更可能な変数))以上であるか否かを判断する(ステップ677)。この同局要素の割合は、同局要素の数を全ての主観的特徴要素の数で除した値である。
同局要素の割合が設定値H未満の場合(ステップ677;N)は、統合対象の主観的特徴の内容が離れすぎているために統合が成立しないものとして、各統合対象のデータを統合せずに、ステップ671にリターンし、次の統合対象を特定する。
【0051】
同局要素の割合が設定値H以上の場合(ステップ677;Y)には、主観数値データ取得手段6は、各統合対象のうち、ベースとなる統合対象を決定するベース決定処理を行う(ステップ679〜ステップ688)。
ベース決定処理において、まず、ステップ671で取得した2つの統合対象の比較対象要素それぞれのレベル値二乗和を算出する(ステップ679)。そして、算出した両レベル値二乗和の値が同じか否かを判断し(ステップ681)、同値でない場合には(ステップ681;N)、レベル値二乗和が大きい方の統合対象をベースとする(ステップ683)。
【0052】
一方、両レベル値二乗和の値が同値である場合(ステップ681;Y)は、レベル値が0でない主観的特徴要素の数を各統合対象について調べ(ステップ685)、レベル値≠0の主観的特徴要素数が同じでなければ(ステップ685;N)、当該主観的特徴要素数が多い方の統合対象をベースとする(ステップ687)。
レベル値≠0の主観的特徴要素数も同じである場合(ステップ687;Y)、基準印象表現語をベースとする(ステップ688)。ここで、基準印象表現語とは、統合対象のうち一方が既に行われた統合処理の統合結果である場合には、その統合結果である。また、統合が行われていない印象表現語どうしの場合には、統合処理方向にみて最初側(印象表現後が文書データから得られている場合には、文書データの文頭側)の印象表現語である。
ベースとなる統合対象を特定した後(ステップ683後、ステップ687後、及びステップ688後)は、
ベースとなる印象表現語のレベル値のうち対局要素の値を省く(クリアする)。即ち、対局要素のレベル値を0とする。そして、ベースとなる印象表現語の、対局要素の値を0とした主観数値データを統合結果とする。
統合結果が取得されると、統合手段は、この統合結果の主観数値データを所定の領域に格納し、ステップ671にリターンし、再び統合対象の取得からの処理を繰り返す。
【0053】
尚、上述した統合処理は、複数の印象表現について、各評価要素をより強調する方向、共通部分に特別な意味を付加していく方向で、集約することを目指した特化統合であるが、主観的特徴要素のうち、互いのレベル値の正負が異なる要素を除き、残った要素の二乗和の小さい方について、残った要素で構成される主観数値データを、統合した主観数値データとする、一般化統合とすることもできる。
特化統合では、複数の印象表現語が、各評価要素をより強調する方向、共通部分に特別な意味を付加していく方向で、集約され、一般化統合では、複数の印象表現語が、各評価要素ができるだけ突出しないようにする方向、特別な意味をそぎ落として共通部分を取り出す方向で、集約される。一般的に、特化統合によって有効な主観的特徴要素数(主観数値データのベクトルの各要素(主観的特徴要素)のなかでレベル値を有する主観的特徴要素)はできるだけ維持されていく方向になり、一般化統合によって有効な主観的特徴要素数は減る方向になる。
本実施形態では、両統合処理のうち、上述したイメージ情報検索処理、イメージ情報追加処理、及び印象表現語追加処理の各処理において、特化統合が使用されるが、オプション設定により一般化統合に切り替えることができるようにしてもよい。
【0054】
この一般化統合による場合には、上述の特化統合に対して、ベースとなる印象表現語の決め方(ベース決定処理)(図10のステップ679〜ステップ688)と、統合結果の求め方(ステップ689)とが異なったもである。
即ち、ベースとなる統合対象は、2つの統合対象のレベル値二乗和の値が同じ値でない場合には、レベル値二乗和が小さい方の統合対象をベースとし、また、レベル値二乗和の値が同値である場合にはレベル値が0でない主観的特徴要素の数を両統合対象の主観数値データについて調べ、レベル値≠0の主観的特徴要素数が同じでなければ、当該主観的特徴要素数が少ない方の印象表現語をベースとする。また、レベル値≠0の主観的特徴要素数も同じである場合には、基準印象表現語でない方の印象表現語をベースとする。
また、ベースとなる統合対象の主観数値データのうち、対局要素についてのレベル値を0として統合結果とする。
【0055】
2つの統合対象が検出されなくなり(ステップ672:N)統合処理から主観数値データ取得処理(図9)にリターンすると、主観情報取得手段は、統合結果の主観的特徴要素とそのレベル値、及び統合されなかった印象表現語の主観的特徴要素とそのレベル値を、主観数値データとする(ステップ69)。そして、主観数値データを取得した後(ステップ68後、及びステップ69後)は、主観数値データ取得処理を終了し、メインのルーチンへリターンする。
【0056】
次に、統合処理について、具体例に基づき説明する。
図11は、統合処理により印象表現語から主観数値データが統合される過程を表す説明図である。
この図11(a)に示すように、いま、情報データ取得手段による情報データ取得処理において、情報データとして、「黒ビール独特の豊かな香ばしさ。」という文書データが取得されたとする(ステップ10)。文書データが取得されると、続いて、印象表現語取得処理により、印象表現語として「豊かな」及び「香ばしい」が抽出される(ステップ20)。そして、抽出された印象表現語それぞれについて主観的特徴要素とそのレベル値及び範囲データが、図2の特徴−要素対応辞書5から取得され(ステップ40)、これらの値に基づいて、主観数値データ取得手段6により主観数値データ取得処理が行われるとする。取得した主観的特徴要素とレベル値とを次に示すが、各主観的特徴要素(「コクのある−あっさりとした」、「キレのある−やわらかい」等)の次に示した数字がレベル値である。なお、図11に示したビールの主観的特徴要素数は6要素以上存在するが、以下の説明では「コクのある−あっさりとした」〜「爽快感のある−重々しい」の5つの要素であるものとして説明する。
また、統合の成否を決定する同局要素割合の設定値Hを60%として説明する。
【0057】
「豊かな」;「コクのある−あっさりとした 4」,「キレのある−やわらかい−1.5」,「うまみのある−味気ない 1」,「のどごしのよい−のみにくい 2」,「爽快感のある−重々しい 1」
「香ばしい」;「コクのある−あっさりとした 4」,「キレのある−やわらかい −2」,「うまみのある−味気ない 2」,「のどごしのよい−のみにくい1」,「爽快感のある−重々しい −1」
【0058】
主観数値データ取得処理では、まず、情報データには程度副詞の有無が調べられる(ステップ61)。そして、この情報データには、程度副詞は含まれておらず(ステップ61;N)、複数の印象表現語が含まれている(ステップ65;Y)ので、抽出した印象表現語に基づいて、統合処理が行われる(ステップ67)。
統合処理においては、文頭側から2つの印象表現語を統合対象として取得する(ステップ671、673;Y)。そして、これらの印象表現語の主観的特徴要素のレベル値及び範囲データから、主観的特徴要素数と同局要素数とを取得する(ステップ675)。この例では、主観的特徴要素数は5となる。また、主観的特徴要素のうち、「コクのある−あっさりとした」について「豊かな」と「香ばしい」のいずれもレベル値が4であり、「うまみのある−味気ない」について「豊かな」のレベル値が1、「香ばしい」の中心レベル値が2であり両者の符号が共にプラスであり、「のどごしのよい−のみにくい」について「豊かな」のレベル値が2、「香ばしい」のレベル値が1であり両者の符号が共にプラスであり、これらの3つの主観的特徴要素が同局要素となる。従って同局要素数は3である。
【0059】
次に、同局要素の全主観的特徴要素に対する割合を調べると、(3/5)×100=60%で、設定値H>=60%を満たすため、統合可能となる。即ち、印象表現語「豊かな」と「香ばしい」との統合は成立可能になる(ステップ677;Y)ので、続いて、ベース決定処理(ステップ679〜ステップ688)を行う。
【0060】
ベース決定処理では、主観的特徴要素のレベル値二乗和を各統合対象について算出する(ステップ679)。この例では、統合対象の一方である「豊かな」のレベル値二乗和は、(4×4)+(1.5×1.5)+(1×1)+(2×2)+(1×1)=24.25となる。同様に、「香ばしい」のレベル値二乗和は、(4×4)+((−2)×(−2))+(2×2)+(1×1)+((−1)×(−1))=26となる。
従って、両統合対象のレベル値二乗和は同値ではなく(ステップ681;N)、レベル値二乗和が大きい方の印象表現語「香ばしい」がベースとなる(ステップ683)。
【0061】
そして、ベースとなる統合対象のデータから対局要素のレベル値を0にクリアしたものを統合結果とする(ステップ689)。この例においては、印象表現語「香ばしい」と「豊かな」の主観的特徴要素「キレ」と「爽快感」のレベル値の符号が異なっているので、これらの主観的特徴要素が対局要素となる。従って、主観数値データ(コクのある−あっさりとした 4,キレのある−やわらかい 0,うまみのある−味気ない 2,のどごしのよい−のみにくい 1,爽快感のある−重々しい 0)が統合結果として得られ、この統合結果のデータが、主観数値データとなる。
【0062】
尚、上述の例においては、1つの情報データから得られた文書データが1つの文のみを含んでおり且つこの文に2つの印象表現語のみが含まれているが、文が2つ以上の場合や、各文に3つ以上の印象表現語が含まれている場合には、次のようになる。
即ち、複数の文に基づいて主観数値データ取得処理を行う場合には、一文一区切りを単位として、各文それぞれの単位内での統合処理が繰り返しが行われる。従って、少なくとも文の数以上の統合結果が得られる。
また、各文に3つ以上の印象表現語が含まれる場合には、文頭側から統合処理が行われ、統合結果と新たな印象表現語についての統合が繰り返し行われる。途中統合が不成立の場合には、不成立となった統合での文末側の印象表現語と、次の印象表現語から新たな統合処理が行われる。
例えば、図11(b)に示す検索条件文「すっきりとして、爽快な味わい、それでいてキレのある、シャープなビール。更に上品なコクとさわやかなのどごし。」といった2文に基づいて、主観数値データ取得処理を行う場合には、印象表現語「すっきりとした」及び「上品な」のそれぞれから文末方向に統合処理1と統合処理2が繰り返される。
統合処理1では、「すっきりとした」と次の「爽快な」との統合(1)を行い、その統合結果と、次の「キレのある」との統合(2)を行う。統合(2)も成功した場合には更に統合(2)の統合結果を新たな基準印象表現語とし、次の「シャープな」との統合(3)を行って、統合処理1が終わる。
なお、統合(1)の統合が成功しなかった場合、統合(1)における他方の印象表現語「爽快な」と次の印象表現語「キレのある」との統合(2’)を行い、この統合(2’)が成功し、その統合結果と「シャープな」との統合(3’)も成功した場合、統合処理1の統合結果としては、2つの主観数値データ(「すっきりとした」の主観数値データそのものと、「爽快な」「キレのある」「シャープな」の統合で生成された主観数値データの2つ)が得られる。また、統合(1)が不成立で、統合(2’)が成立し、統合(3’)が不成立であった場合、統合処理1の統合結果として、「すっきりとした」の主観数値データそのものと、「爽快な」「キレのある」の統合(2’)で生成された主観数値データと、「シャープな」の主観数値データそのもの3つの主観数値データが得られる。
【0063】
統合処理2では、区切りから処理方向(文末方向)にみて最初の印象表現語「上品な」と次の印象表現語「さわやかな」との統合(4)を行う。ここでは統合(4)が失敗したものとする。ここで次の印象表現語がある場合には、「さわやかな」と次の印象表現語との統合を行うが、図11(b)の例では次の印象表現語がないので、統合処理2を終わる。
なお、統合(4)が成功した場合にも統合処理2は終了し、この場合統合処理2の結果としては、1つの主観数値データ(「上品な」と「さわやかな」の統合で生成された主観数値データ)が得られる。
以上のように図11(b)に示す文からの印象表現語による統合処理では、統合(1)〜(3)が成功し、1次統合(4)が失敗した場合、統合処理1によって主観数値データ1つ(1次統合(3)の統合結果)が得られ、統合処理2によって主観数値データ2つ(「上品な」の主観数値データそのものと、「さわやかな」の主観数値データそのもの)が得られる。
【0064】
主観数値データ取得手段6によって主観数値データが取得されると(ステップ60後)、次に、出力手段7によって、主観数値データ取得手段6で取得された前記主観数値データに基づいて出力データが生成され出力が行われる(出力処理)(ステップ80)。
図12は、出力処理の流れを表したフローチャートである。
この図12に示すように、本実施形態においては、出力手段7が、まず、各情報データの客観的特徴を取得する(ステップ81)。この客観的特徴は、印象表現語取得処理(図8)のステップ31で取得されている場合には、この客観的特徴を所定のデータ格納エリアから取得する。また、ステップ31で取得されていない場合には、表示装置等の出力手段7に客観的特徴の入力を促す画面表示等の出力を行い、操作者から客観的特徴の入力を得る。例えば、アンケートの場合には回答者の性別や年齢、商品名等である。
そして、取得した客観的特徴の項目を取得する(ステップ83)。ここで項目とは、21才、35才等の客観的特徴自体ではなくそれを総称する、例えば年齢、性別、等の総称名である。項目は、特徴変換辞書37において、客観的特徴と対応して格納されており、特徴変換辞書37から、客観的特徴に対応する項目を取得する。
【0065】
項目が取得されると、主観数値データ取得処理で主観数値データの取得元となっている情報データの客観的特徴に対応する項目を、表示装置等に出力する。そして、操作者により、情報データの分析に使用したい項目(情報データを分析する観点)を選択させる(ステップ85)。
そして、各情報データについてステップ60の主観数値データ取得処理で取得され所定の記憶エリアに格納されている主観数値データを取得し(ステップ87)、選択された項目の客観的特徴と、主観数値データとを対応させて表示するための表示データを生成し、表示装置等の出力装置から出力し表示データによる画像等を出力させる(ステップ89)。
【0066】
図13は、このような出力データにより表示装置から出力(表示)される表示画面の一例である。
図13に示すように、本実施形態では、主観数値データを、2次元または3次元の空間における位置として表示し、各主観数値データの近傍に対応する客観的特徴を表示するようになっている。
図13に示す例は、ある発泡酒Aの試飲の個人毎のアンケートを取った結果を本実施形態のデータ分析装置により分析したものであり、このアンケートでは、自由記入形式の試飲の感想と、回答者の性別及び年齢を得ている。
そして、データ分析装置では、アンケート結果を情報データとして取得し、試飲の感想から主観的特徴を抽出し、この主観的特徴に基づいて主観数値データを取得している。また、性別及び年代を客観的特徴として取得し、主観数値データと、客観的特徴である性別と年代とを対応して認視可能な表示データを生成し、表示装置に表示させている。
【0067】
図13に示す表示例では、主観数値データについては、「キレのある−やわらかい」と「コクのある−あっさりとした」の2組の相対する主観的特徴要素を各組で座標軸とした平面に対して、各回答者の主観数値データを配置して表示している。また、客観的特徴の各項目(性別と年代)は、各個人の主観数値データの位置に、その回答者の性別及び年代を表示し、且つ、データ表示中に性別と年代のうちいずれかを操作者が選択することによって、項目の詳細分類(性別の場合には男女の別、年代の場合には年代別)毎に各回答者のデータ位置が色分けされるようになっている。
また本実施形態では、データ表示中で各回答者の布置位置でマウスクリックすることにより、その回答者の情報データ(テキストファイル)が表示されるようになっている。そして、例えば、図13に示す画面で40代男性2の位置をクリックすると、「香ばしく、深い味わいでビールと変わらない感じです。」との情報データ(アンケートの回答で自由記入された文書データ)が表示される。また情報データとして文書データが表示される場合には、文書データのうち、主観数値データを生成する際に抽出された印象表現語が反転表示されるようになっており、上述の回答では、「香ばしく」と「深い」が反転表示され、これらが印象表現語として抽出され、これらの印象表現語から「コクのある−あっさりとした」と「キレのある−やわらかい」を主観的特徴要素とした主観数値データが取得され図13に示すような布置となっていることが把握できるようになっている。
【0068】
そして、横軸「コクのある−あっさりとした」について観察すると、男性は「コクのある」方向に、女性は主に、「あっさりとした」方向に主観的特徴が布置されていることが把握でき、女性と男性とで相反する評価をしていることが判る。
そこで、30代女性3の位置をクリックして文書データを参照すると、「のどごしが爽やかで、とても飲みやすい。」との文書が表示され、「爽やか」と「飲みやすい」とが印象表現語として抽出されたことが把握できる。
このように、例えば図13の表示例からは、女性は(発泡酒特有の)さっぱり感を評価している人が多く、男性は、(発泡酒なのに)コクがあるといった、これまでの発泡酒との比較の始点で評価をしている人が多いということが把握できる。
更に、縦軸「キレのある−やわらかい」について観察すると、年齢層の高い方が「やわらかい」印象を受け、より若い層の方が「キレのある」印象を受けているということも把握できる。
このように、本実施形態では、主観的特徴を表す主観数値データを座標軸上にマッピングし、更に客観的特徴を分類して視覚化することで、客観的特徴だけを観察したのでは発見できない情報を発掘することが可能である。
また、各回答者が受けた印象の差分情報も取り出すことができる。例えば、30代女性1よりも20代女性1のほうがよりキレのある印象を受けたという差分情報を取り出すことができる。
この他、アンケートの対象となっている発泡酒に付されているプロモーションのコピーからも主観数値データを取得し、この主観数値データと、アンケートの回答から取得した主観数値データとの差分情報を取り出すことにより、回答者に受け止められたイメージとメーカー側との意図の差違を明確に把握することができる。そして、取り出された差分情報を利用して、その差を生じさせた要因となる客観的特徴について解析する等、新たな分析ステップを創出し更に深い考察を進めることが可能となる。
【0069】
このデータ表示中には、この主観的特徴と客観的特徴によりクラスタ分析を実行するか、他の客観的特徴によるデータ分析を実行するか、データ分析を終了するかがキーボード等から入力できるようになっている。
そして、クラスタ分析の実行が選択された場合(ステップ91;Y)には、ステップ89における表示データ生成に用いられた客観的特徴と主観数値データとから、クラスタ分析を行い、分析結果に基づいた出力データを生成し、出力させる(ステップ93)。
図14は、クラスタ分析の分析結果に基づいて生成された出力データである表示データにより表示装置の表示画面に表示された表示画像の一例を示す図である。
この図14に示す表示例では、図13と同じデータに基づいてクラスタ分析をした分析結果が表示されている。この分析結果では、男性と女性の評価傾向の違いが統計量として明確に表示される。
このように、本実施形態では、主観的特徴を主観数値データとして数値化しているので、様々な数値解析を実施し、明確な統計量による考察、論理展開を行うことができる。
なお、図14に示す例では、主観数値データのみを解析に利用したが、目的に応じて客観的特徴も分析データに含めたり、あるいは、クラスタ分析以外の手法による数値解析を実施することもできる。
【0070】
表示データ出力中にクラスタ分析の実行が選択されない場合(ステップ91;N)、及びクラスタ分析の分析結果の出力後(ステップ93)であって、他の客観的特徴によるデータ分析を実行するとの選択があった場合(ステップ95;Y)には、ステップ85にリターンし、客観的特徴の項目の表示以降の処理を繰り返す。
他の客観的特徴によるデータ分析を実行するとの選択がなく(ステップ95;N)、データ分析を終了するとの選択もない場合(ステップ97;N)には、ステップ91にリターンし、選択の入力に待機する。分析を終了するとの選択があった場合(ステップ97;Y)には、出力処理を終了してメインのルーチンにリターンする。そして、データ分析処理を終了する。
【0071】
このように、本実施形態のデータ分析装置では、客観的特徴と主観数値データとの対応を認視可能に表示することで、客観的特徴と主観的特徴との相関が容易に分析可能になる。
特に本実施形態では、主観数値データを、2組の相対する主観的特徴要素を座標軸とした平面上に表示しているので、2組の主観的特徴要素についてデータ分析結果を認視により容易に把握可能である。
また、操作者により客観的特徴の項目を選択可能になっており、種々の客観的特徴について、個別に主観的特徴との相関を分析することが可能となっている。
更に、客観的特徴の各項目について詳細分類毎に色分けされ、一層容易にデータ分析を行うことが可能である。
また本実施形態では、主観数値データと客観的特徴とを表示するだけでなく、クラスタ処理を行うことが可能になっており、より容易に、相関性を把握できるようになっている。
【0072】
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、請求項に記載された発明の範囲内で種々の変形をすることが可能である。
例えば、上述の実施形態では、出力処理(図12)において、情報データに付随する客観的特徴の項目のうちから所定の項目を操作者が選択し、選択された項目の客観的特徴が主観数値データによる表示上に表示されるようになっているが、客観的特徴の項目の取得(ステップ83)や操作者による選択項目の取得(ステップ85)をせず、情報データに付随する取得した客観的特徴を全て主観数値データによる表示上に表示するようにしてもよい。
上述の実施形態では、客観的特徴の項目は、特徴変換辞書37に主観的特徴とともに客観的特徴に対応して格納されているが、客観的特徴と項目との対応を格納した項目記憶部を独自に設けるようにしてもよい。
【0073】
上述の実施形態では、主観的特徴を、該主観的特徴から得た主観数値データのレベル値によって、主観的特徴要素を軸とした座標平面上に布置することによって、認視可能に出力しているが、主観数値データの出力は、平面や立体座標上に布置する他、各主観的特徴要素を軸としたレーダーチャートや棒グラフその他種々の表示手法によって、表示させたり印刷する等の出力を行うことができる。
また、主観的特徴要素のうち、操作者による入力その他の手法によって所定の主観的特徴要素のみを選択し、選択された主観的特徴要素のみについてそのレベル値に基づいた出力を行うようにしてもよい。
また、出力手段7に、情報データから取得した印象表現語について、その主観的特徴要素とレベル値とを認識可能に出力する機能を備えてもよい。図15は、このような出力機能によって表示装置に表示される表示例を表す図である。この表示例では、図13及び図14と同じ情報データに含まれ、操作者の入力その他の手法によって選択された印象表現語「コクのある」と「クリーミーな」とについて、図13と同様の平面上の布置を表示している。従来の技術では、印象表現語を共通のパラメータで数値化しておらず、分析対象となっている全ての文書データとそこに含まれる印象表現語の出現頻度及び位置情報に基づいて統計的に印象表現語の相対的な関係を数値化したとしても、これが必ずしも主観的な類似性を反映した結果となっているとは限らなかった。そして、「コクのある」と「クリーミーな」とが共に含まれている文書データが分析対象に存在しなければ、これらの2つの印象表現語の類似関係についての情報は得られなかった。本発明では、特徴−要素対応辞書5において、印象表現語について所定のパラメータによって数値化され、印象表現語間の類似性が反映されており、これを利用することによって、「コクのある」と「クリーミーな」等の印象表現語間の主観的な類似性についての情報を得ることができる。
図15中、「コクのある」と「クリーミーな」という印象表現語は、横軸「コクのある−あっさりとした」についてはいずれも重みを持っているが、縦軸「キレのある−やわらかい」について重みを持っているのは「クリーミーな」だけである。このことから、「クリーミーな」という表現は、「コクのある」という印象側面に、「やわらかい」という印象側面を加味した表現であることが把握できる。そして、「クリーミーな」の方は「コクのある」よりもよりやわらかいという差分情報を取り出すことができる。
【0074】
また、主観数値データとに対応して主観表現を格納する特徴−要素対応辞書と、主観数値データに対応する主観表現を検出する主観表現検出手段と、この主観表現検出手段で検出した主観表現を用いて、主観数値データの取得元である情報データについての主観表現文を生成する表現文生成手段とを備え、出力手段7から、表現文生成手段で生成された主観表現文を出力する機能を具備させてもよい。これにより、情報データに含まれる主観的特徴に基づいて主観表現文を生成し、主観表現文によって情報データに含まれる主観的特徴を容易に把握することが可能となる。また、各情報データ毎に異なった媒体や表現で表現された主観的特徴が、主観表現文として統一された形で揃って出力されるので、情報データの主観的特徴の異同が容易に把握できる。例えば、図13及び図14と同じ情報データのうち、40代男性2の主観数値データ(コクのある−あっさりとした 2.5,キレのある−やわらかい 1.5)のうち、主観表現辞書においてコクのある−あっさりとした 2.5には「コクのある」が対応しており、キレのある−やわらかい 1.5には「やや、やわらかい」が対応しており、「この男性は、コクのある、やや、やわらかい発泡酒と評価」という主観表現文を生成することができる。尚、特徴−要素対応辞書は、1つの主観的特徴要素に対して1またはレベル値別に複数の主観表現が対応していなくてもよく、複数の主観的特徴要素とそれらのレベル値とから、1または複数の主観表現が特定されるようにしてもよい。例えば2つの主観的特徴要素を座標軸とした座標平面において、所定のエリアAに位置する主観数値データは主観表現「クリーミーな」が対応し、別の所定エリアBに位置する主観数値データには主観表現「爽快な」が対応する等である。また、分析の結果得られた主観数値データと特定の印象表現語のデータとの間に高い類似度がある場合、この印象表現語を生成する主観表現文に採用することもできる。図13及び図14の情報データの例で、「20代女性1」の主観数値データが「軽快な」という印象表現語のデータと高い類似性を持っている場合、「この女性は軽快な発泡酒と評価」という特長文を生成することができる。このように、簡潔な主観表現文を生成することにより、分析結果の傾向を文書として捉えることが可能となる。
【0075】
更に、検索条件文取得手段と、検索条件文取得手段に含まれる主観的特徴、または主観的特徴と客観的特徴、または客観的特徴のうちのすくなくともいずれか1つを取得する検索特徴取得手段と、検索特徴取得手段で取得された特徴を含む情報データまたは当該情報データが含み且つ検索条件文取得手段から取得されなかった主観的特徴、または主観的特徴と客観的特徴、または客観的特徴のうちのすくなくともいずれか1つを取得する出力特徴取得手段とを備え、前記出力手段は、前記出力特徴取得手段で取得された前記特徴を認識可能に出力するようにしてもよい。例えば、「すっきりとしたビールを好む20代女性」という検索条件文から、「すっきりとした」という印象表現語と「ビール」「20代」「女性」という客観的特徴を取得し、好みのアルコールに対するアンケートの回答の情報データから、回答者を抽出し、回答者の氏名を表示する等である。
上述の実施形態では、回答者のプロフィールは主観的特徴を取得するためのデータとしては使用されていないが、特徴変換辞書に、回答者のプロフィールとなる項目と主観的特徴とを対応させたテーブルを含み、回答者のプロフィールから主観的特徴を取得するようにしてもよい。例えば、20〜25才に「ドライな」等の嗜好傾向を主観的特徴として対応させておく等である。このような、回答者のプロフィールから主観的特徴や主観数値データを得る手法は、上述のようにアンケートデータの相関傾向を見る場合には適当でない場合もあるが、例えば、アンケート回答者に適した商品や懸賞を選ぶため等の目的での分析には、欠落情報を保管するという意味で利用価値がある。
上述の実施形態では、客観的特徴を主観的特徴に変換し、変換により取得した主観的特徴から主観数値データを取得しているが、図17に示すような、客観的特徴に主観的特徴要素とそのレベル値とを対応させた客観的特徴−要素対応辞書を備え、客観的特徴から直接主観数値データを取得するようにしてもよい。
また、特徴変換辞書や、客観的特徴−要素対応辞書を用いずに、または、これらによる主観数値データの取得とともに、客観的特徴として取得した数値情報を直接主観数値データに変換する変換式を備え、この式に基づいて主観数値データを取得するようにしてもよい。例えば、一週間のうちの飲酒日数や一回の飲酒量等の数値情報と嗜好傾向に因果関係のあることを重回帰分析等で見出し、客観的特徴データで取得された日数データや飲酒量データから主観数値データを得る重回帰式を所定の記憶部に格納しておき、この重回帰式によって主観数値データを得る等である。
【0076】
また、客観的特徴として、例えば上述の実施形態においてはアンケートの実施時期を取得し、この結果を時期−主観評価対応テーブルに蓄積しておき、図16に示す表示例のように、出力装置は、客観的特徴としてのアンケートの実施時期と主観数値データとを認識可能に出力して、主観的特徴の時系列での変遷を把握できるようにしてもよい。尚、この時期−主観評価対応テーブルは、時期を含め、他の客観的特徴も一緒に、主観的特徴と対応させて蓄積するものでもよい。図16では、A社のライトビールについて1年に4回アンケートを実施した結果について、各回の回答毎に集計し各回毎に回答の平均的な主観数値データを求め、表示したものである。
従来のように、用意された質問に対して回答を選択肢から選択する方式のアンケートでは、回答者の嗜好や価値観が時間とともに変わっていき、質問自体に意味が無くなることがあり、過去のデータと現在のデータとを同等に比較・分析することはできなくなる。本実施形態では、自由記入形式のアンケートから主観数値データを得ることができるので、様々な回答に対応して主観的なデータを得ることができ、比較・分析が不可能になる可能性はすくない。
上述の各変形例は、請求項に記載された発明の範囲を逸脱しない範囲において、これらのうちの1つのみでなく複数について、適宜、適用することが可能である。
本実施の形態は、分析対象としての情報データを取得する情報データ取得手段と、この情報データ取得手段で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得手段と、情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得手段で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出手段と、前記数値データ検出手段で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備えるデータ分析装置(第1の構成)を提供することにより、上記目的を達成する。
この第1の構成のデータ分析装置では、情報データから主観的特徴が抽出され、抽出された主観的特徴に対応する主観的特徴要素とその数値データとが、特徴−要素対応辞書から検出され、この主観的特徴要素及び数値データに基づいて、主観数値データが生成される。この主観数値データは、情報データにおいて主観的に表現される主観的特徴を数値化したデータとなる。
前記出力手段は、主観数値データに基づく出力を行うものであればよく、主観数値データそのものを、音声出力、画像出力、データ出力、印刷出力等により出力するものが含まれる。また、主観数値データそのものではなく、主観数値データを加工して上記各出力等を行うものも含まれる。例えば、主観数値データの値の度合いをグラフや所定形状の大きさ、色の濃淡等により、認識可能に視覚化して出力するものとすることができる。また、複数の情報データについての出力を一度に行うもの、1つの情報データについての出力を行うもののいずれも含まれる。
本実施の形態は、前記第1の構成のデータ分析装置において、前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに文書データが含まれている場合に、該文書データから、主観的特徴を表現する印象表現語を抽出する印象表現語抽出手段を含み、該印象表現語抽出手段で抽出された印象表現語を主観的特徴として取得し、前記数値データ検出手段は、印象表現語と、印象表現語を構成する主観的特徴要素及び該主観的特徴要素のレベル値データとの対応を保持する前記特徴−要素対応辞書から、前記主観的特徴要素と該主観的特徴要素のレベル値とを検出するデータ分析装置(第2の構成)を提供することにより、前記目的を達成する。
第2の構成のデータ分析装置では、文書データから印象表現語が抽出され、抽出された印象表現語に対応する主観的特徴要素とその数値データとが、特徴−要素対応辞書から検出され、この主観的特徴要素及び数値データに基づいて、主観数値データが生成される。従って、この主観数値データは、文書データにおいて主観的に表現される印象表現語を数値化したデータとなる。従って第2の構成のデータ分析装置によって、文書データの主観的特徴を数値データにより容易に把握し、分析することが可能となる。
本実施の形態は、前記第1または第2の構成のデータ分析装置において、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段を備え、前記出力手段は、前記客観的特徴取得手段で取得された前記客観的特徴と、該客観的特徴が付随する前記情報データから取得された前記主観数値データとの対応を認識可能に、前記出力を行うデータ分析装置(第3の構成)を提供することにより、前記目的を達成する。
ここで、客観的特徴とは、主観的特徴に対するもので、分析対象となる情報データに関連して得られる客観的、物理的な特徴であり、情報データが画像である場合の色や形、情報データが自動車に関する文書データである場合の排気量、燃費、重量など定量的で計測可能な数値データ、人名や商品名、等が含まれる。
客観的特徴は、情報データに付随していればよく、情報データに含まれていても、情報データとは別途取得されたものであってもよい。従って、客観的特徴取得手段は、客観的特徴を、情報データ取得手段で取得した情報データから抽出するようにしても、また情報データとは別途、操作者からのキーボードや音声その他の入力により取得してもよい。
第3の構成のデータ分析装置では、情報データ取得手段で取得した情報データについて、主観的特徴と客観的特徴との対応を認識し、その相対関係の有無等、主観的特徴と客観的特徴との関係を分析することが可能となる。
この第3の構成のデータ分析装置は、分析したい客観的特徴を入力する客観的特徴入力手段と、前記客観的特徴入力手段で入力された客観的特徴を含む情報データを抽出する情報データ抽出手段とを備え、前記数値データ検出手段は、前記情報データ抽出手段で抽出された情報データに含まれる主観的特徴に対応する主観的特徴要素とその数値データを前記特徴−要素対応辞書から検出し、前記主観数値データ取得手段は、前記数値データ検出手段で検出された主観的特徴要素とその数値データとから、前記情報データ抽出手段で抽出された情報データ全体についての前記主観数値データを取得するデータ分析装置(第4の構成)とすることができる。
この第4の構成のデータ分析装置によれば、所定の客観的特徴を含む情報データについての主観数値データが取得され、客観的特徴と主観的特徴との関係を容易に分析することが可能である。
この第4の構成のデータ分析装置において、前記主観数値データ取得手段は、情報データ抽出手段で抽出された情報データ全体についての主観数値データを取得する際に、各情報データの主観的特徴に対応する数値データについて、重み付けをしてもよい。例えば、客観的特徴として情報データの取得時期が含まれている場合に、取得時期が現在に近い情報データについての数値データについて大きな重み付けをする等である。
また、前記第3の構成のデータ分析装置は、分析したい客観的特徴を入力する客観的特徴入力手段と、前記客観的特徴入力手段で入力された客観的特徴を含む情報データを抽出する情報データ抽出手段とを備え、前記数値データ検出手段は、前記情報データ抽出手段で抽出された情報データそれぞれについて、含まれる主観的特徴に対応する主観的特徴要素とその数値データを前記主観情報辞書から検出し、前記主観数値データ取得手段は、前記数値データ検出手段で検出された主観的特徴要素とその数値データとから、前記情報データ抽出手段で抽出された情報データそれぞれについての前記主観数値データを取得するデータ分析装置(第5の構成)とすることができる。
この第5の構成のデータ分析装置によれば、所定の客観的特徴を含む情報データそれぞれについての主観数値データが取得され、客観的特徴と主観的特徴との関係を容易に分析することが可能である。
第3の構成のデータ分析装置は、前記情報データ取得手段から複数の情報データが取得された場合に、該情報データそれぞれについての前記主観数値データ取得手段で取得された前記主観数値データに基づいて、前記複数の情報データを複数の主観クラスタに分類する主観クラスタリング手段を備え、前記出力手段は、前記複数の情報データの主観クラスタの異同を認識可能に前記主観数値データを出力するデータ分析装置(第6の構成)とすることができる。
この第6の構成のデータ分析装置によれば、主観クラスタ毎の客観的特徴を認識でき、客観的特徴と主観的特徴との相関関係を容易に分析することが可能となる。
本実施の形態は、前記第1の構成及び第6の構成のデータ分析装置において、前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得手段で取得した前記情報データの主観的特徴とする客観的特徴変換手段と、を含むデータ分析装置(第7の構成)を提供することにより、前記目的を達成する。
客観的特徴は、情報データに付随していればよく、情報データに含まれていても、情報データとは別途取得されたものであってもよい。従って、客観的特徴取得手段は、客観的特徴を、情報データ取得手段で取得した情報データから抽出するようにしても、また情報データとは別途、操作者からのキーボードや音声その他の入力により取得してもよい。
第7の構成のデータ分析装置は、情報データ取得手段で取得した情報データから直接主観的特徴が抽出されなかった場合にのみ、客観的特徴取得手段により客観的特徴を取得し、この客観的特徴から客観的特徴変換手段により主観的特徴を取得するようにすることができる。また、情報データ取得手段で取得した情報データから直接主観的特徴を取得するとともに、客観的特徴取得手段及び上記客観的特徴変換手段により客観的特徴に基づいて主観的特徴を取得し、これらの両方の主観的特徴に基づいて、主観数値データ取得手段において主観数値データを得るようにしてもよい。
第7の構成のデータ分析装置では、情報データに付随する客観的特徴が取得され、この客観的特徴に対応する主観的特徴が特徴変換辞書から検出され、この主観的特徴に基づいて情報データの主観的特徴の数値化データが取得される。従って、第3の構成のデータ分析装置では、情報データに付随する客観的特徴から主観的特徴を推定し、推定に基づいて数値化データが取得される。従って、文書データ等の情報データに直接主観的特徴が含まれていない場合でも、主観的特徴の数値化データを取得しこの数値化データに基づいた分析を行うことが可能である。
前記第7の構成のデータ分析装置は、前記客観的特徴取得手段で取得した客観的特徴と、該客観的特徴が付随する前記情報データから取得された主観的特徴との対応を取得する対応取得手段と、前記対応取得手段で取得した前記対応に基づいて、前記特徴変換辞書の前記対応を更新する特徴変換辞書更新手段とを備え、取得した情報データについての客観的特徴と主観的特徴とに基づいて対応を取得し、特徴変換辞書を構築・更新するようにしてもよい。
この場合、前記対応取得手段により取得される前記客観的特徴と主観的特徴との対応は、複数の前記情報データの客観的特徴と主観的特徴とから統計的に取得するものとすることができる。また、前記客観的特徴と主観的特徴との対応は、操作者による入力から、取得するようにしてもよい。
尚、第7の構成のデータ分析装置と同様の効果は、前記第1の構成から第6の構成のデータ分析装置において、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段を備え、前記数値データ検出手段が、情報データに付随する客観的特徴に主観的特徴要素とその数値データとを対応させて保持する特徴−数値データ変換辞書から、前記客観的特徴取得手段で取得された客観的特徴に対応する主観的特徴要素とその数値データとを検出するデータ分析装置によっても得ることが可能である。
また、第7の構成のデータ分析装置と同様の効果は、分析対象としての情報データを取得する情報データ取得手段と、この情報データ取得手段で取得した情報データから客観的特徴を取得する客観的特徴取得手段と、情報データに付随する客観的特徴に主観的特徴要素とその数値データとを対応させて保持する特徴−数値データ変換辞書から、前記客観的特徴取得手段で取得された客観的特徴に対応する主観的特徴要素とその数値データとを検出する数値データ検出手段と、前記数値データ検出手段で検出した主観的特徴要素及び数値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備えるデータ分析装置によっても、得ることができる。
更に、第1の構成から第7の構成のデータ分析装置は、分析対象としての情報データについての時間データを取得する時間データ取得手段を備え、前記出力手段は、前記主観数値データとともにその情報データについての時間データを認識可能に出力するデータ分析装置(第8の構成)とすることができる。
この第8の構成のデータ分析装置では、時間経過にともなう主観的特徴の変遷を容易に分析することが可能となる。
この第8の構成のデータ分析装置において、時間データは、客観的特徴として情報データからまたは情報データとは別に操作者からの入力等により取得することができる。
前記第1の構成から第8の構成のデータ分析装置は、主観数値データに対応して主観表現を格納する主観表現辞書に基づいて、前記主観数値データ取得手段で取得した前記主観数値データに対応する主観表現を検出する主観表現検出手段と、前記主観表現検出手段で検出した主観表現を用いて、前記主観数値データの取得元である情報データについての主観表現文を生成する表現文生成手段とを備え、前記出力手段は、前記表現文生成手段で生成された主観表現文を出力するデータ分析装置(第9の構成)とすることができる。
この第9の構成のデータ分析装置では、情報データに含まれる主観的特徴に基づいて主観表現文が生成され出力されるので、情報データに含まれる主観的特徴を容易に把握することができる。また、各情報データ毎に異なった媒体や表現で表現された主観的特徴が、主観表現文として統一された形で出力され、情報データの主観的特徴の異同が容易に把握できる。
前記第9の構成のデータ分析装置において、前記主観表現辞書は、主観表現として所定の印象表現語を、主観数値データに対応させたものとすることができる。
前記第1の構成から第9の構成のデータ分析装置は、検索条件文取得手段と、検索条件文取得手段に含まれる主観的特徴、または主観的特徴と客観的特徴、または客観的特徴のうちのすくなくともいずれか1つを取得する検索特徴取得手段と、検索特徴取得手段で取得された特徴を含む情報データまたは当該情報データが含み且つ検索条件文取得手段から取得されなかった主観的特徴、または主観的特徴と客観的特徴、または客観的特徴のうちのすくなくともいずれか1つを取得する出力特徴取得手段とを備え、前記出力手段は、該出力特徴取得手段で取得された前記特徴を認識可能に出力するデータ分析装置とすることもできる。
前記第1の構成から第9の構成のデータ分析装置において、前記情報データ取得手段は、ネットワークに接続された外部装置から前記情報データを取得し、前記出力手段は、前記ネットワーク接続された外部装置に前記主観数値データに基づく出力を行うデータ分析装置(第10の構成)とすることができる。また第1の構成から第9の構成のデータ分析装置において、前記特徴−要素対応辞書をネットワークに接続された外部装置に格納し、主観数値データ取得手段は、ネットワークに接続された外部装置の特徴−要素対応辞書から、前記主観的特徴に対応する主観的特徴要素及び数値データを取得するデータ分析装置(第11の構成)としてもよい。
第10の構成及び第11の構成において、第3の構成における客観的特徴変換手段を備える場合には、前記特徴変換辞書をネットワークに接続された外部装置に格納し、客観的特徴変換手段は、ネットワークに接続された外部装置の特徴変換辞書から、客観的特徴に対応する主観的特徴を取得するデータ分析装置(第12の構成)としてもよい。
本実施の形態は、分析対象としての情報データを取得する情報データ取得機能と、この情報データ取得機能で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得機能と、情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得機能で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出機能と、前記数値データ検出機能で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得機能と、前記主観数値データ取得機能で取得された前記主観数値データに基づく出力を行う出力機能とをコンピュータに実現させるためのデータ分析用プログラムが記憶された記憶媒体(第13の構成)を提供することにより、上記目的を達成する。
または、前記情報データ取得機能と、前記主観的特徴抽出機能と、前記主観数値データ取得機能とをコンピュータに実現させるためのデータ分析用プログラム、データ分析用プログラム信号、データ分析用プログラム伝送媒体、又はデータ分析用プログラム搬送波としてもよい。
第13の構成のデータ分析用プログラムが記憶された記憶媒体、及び上記データ分析用プログラム、データ分析用プログラム信号、データ分析用プログラム伝送媒体、又はデータ分析用プログラム搬送波では、そのデータ分析用プログラムをコンピュータに読み込ませ実行させることにより、第1の構成のデータ分析装置を実現することが可能である。
この第13の構成のデータ分析用プログラムが記憶された記憶媒体において、前記出力機能は、主観数値データを音声出力するもの、画像出力するもの、データ出力するもの、印刷出力するもの等とすることができる。また、主観数値データそのものではなく、主観数値データの値の度合いを認識可能に視覚化して出力するものとすることができる。
本実施の形態は、前記第13の構成のデータ分析用プログラムが記憶された記憶媒体において、前記主観的特徴取得機能は、前記情報データ取得機能で取得した情報データに文書データが含まれている場合に、該文書データから、主観的特徴を表現する印象表現語を抽出する印象表現語抽出手段機能を含み、該印象表現語抽出機能で抽出された印象表現語を主観的特徴として取得し、前記数値データ検出機能は、印象表現語と、印象表現語を構成する主観的特徴要素及び該主観的特徴要素のレベル値データとの対応を保持する前記特徴−要素対応辞書から、前記主観的特徴要素と該主観的特徴要素のレベル値とを検出するデータ分析用プログラムが記憶された記憶媒体(第14の構成)を提供することにより、前記目的を達成する。
第13の構成のデータ分析用プログラムが記憶された記憶媒体では、コンピュータにデータ分析用プログラムを読み込ませ実行させることによって、第2の構成のデータ分析装置を実現することができる。
本実施の形態は、前記第13または第14の構成のデータ分析用プログラムが記憶された記憶媒体において、前記情報データ取得機能で取得した情報データに付随する客観的特徴を取得する客観的特徴取得機能を備え、前記出力機能は、前記客観的特徴取得機能で取得された前記客観的特徴と、該客観的特徴が付随する前記情報データから取得された前記主観数値データとの対応を認識可能に、出力するデータ分析用プログラムが記憶された記憶媒体(第15の構成)を提供することにより、前記目的を達成する。
客観的特徴は、情報データに付随していればよく、情報データに含まれていても、情報データとは別途取得されたものであってもよい。従って、客観的特徴取得手段は、客観的特徴を、情報データ取得手段で取得した情報データから抽出するようにしても、また情報データとは別途、操作者からのキーボードや音声その他の入力により取得してもよい。
第15の構成のデータ分析用プログラムが記憶された記憶媒体では、コンピュータにデータ分析用プログラムを読み込ませ実行させることによって、第4の構成のデータ分析装置を実現することができる。
この第15の構成のデータ分析用プログラムが記憶された記憶媒体は、分析したい客観的特徴を入力する客観的特徴入力機能と、前記客観的特徴入力機能で入力された客観的特徴を含む情報データを抽出する情報データ抽出機能とを備え、前記数値データ検出機能は、前記情報データ抽出機能で抽出された情報データに含まれる主観的特徴に対応する主観的特徴要素とその数値データを前記主観情報辞書から検出し、前記主観数値データ取得機能は、前記数値データ検出機能で検出された主観的特徴要素とその数値データとから、前記情報データ抽出機能で抽出された情報データ全体についての前記主観数値データを取得するデータ分析用プログラムが記憶された記憶媒体(第16の構成)とすることができる。
この第16の構成のデータ分析用プログラムが記憶された記憶媒体によれば、所定の客観的特徴を含む情報データについての主観数値データが取得され、客観的特徴と主観的特徴との関係を容易に分析することが可能である。
また、前記第15の構成のデータ分析用プログラムが記憶された記憶媒体は、分析したい客観的特徴を入力する客観的特徴入力機能と、前記客観的特徴入力機能で入力された客観的特徴を含む情報データを抽出する情報データ抽出機能とを備え、前記数値データ検出機能は、前記情報データ抽出機能で抽出された情報データそれぞれについて、含まれる主観的特徴に対応する主観的特徴要素とその数値データを前記主観情報辞書から検出し、前記主観数値データ取得機能は、前記数値データ検出機能で検出された主観的特徴要素とその数値データとから、前記情報データ抽出機能で抽出された情報データそれぞれについての前記主観数値データを取得するデータ分析用プログラムが記憶された記憶媒体(第17の構成)とすることができる。
この第17の構成のデータ分析用プログラムが記憶された記憶媒体によれば、所定の客観的特徴を含む情報データそれぞれについての主観数値データが取得され、客観的特徴と主観的特徴との関係を容易に分析することが可能である。
第15の構成のデータ分析用プログラムが記憶された記憶媒体は、前記情報データ取得機能から複数の情報データが取得された場合に、該情報データそれぞれについての前記主観数値データ取得機能で取得された前記主観数値データに基づいて、前記複数の情報データを複数の主観クラスタに分類する主観クラスタリング機能を備え、前記出力機能は、前記複数の情報データの主観クラスタの異同を認識可能に前記主観数値データを出力するデータ分析用プログラムが記憶された記憶媒体(第18の構成)とすることができる。
この第18の構成のデータ分析用プログラムが記憶された記憶媒体によれば、主観クラスタ毎の客観的特徴を認識でき、客観的特徴と主観的特徴との相関関係を容易に分析することが可能となる。
本実施の形態は、前記第13の構成から第18の構成までのいずれか1の構成のデータ分析用プログラムが記憶された記憶媒体において、前記主観的特徴取得機能は、前記情報データ取得機能で取得した情報データに付随する客観的特徴を取得する客観的特徴取得機能と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段機能で取得された前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得機能で取得した前記情報データの主観的特徴とする客観的特徴変換機能とを含むデータ分析用プログラムが記憶された記憶媒体(第19の構成)を提供することにより、前記目的を達成する。
客観的特徴は、情報データに付随していればよく、情報データに含まれていても、情報データとは別途取得されたものであってもよい。従って、客観的特徴取得機能は、客観的特徴を、情報データ取得手段で取得した情報データから抽出するようにしても、また情報データとは別途、操作者からのキーボードや音声その他の入力により取得してもよい。
第19の構成のデータ分析用プログラムが記憶された記憶媒体では、コンピュータにデータ分析用プログラムを読み込ませ実行させることによって、第3の構成のデータ分析装置を実現することができる。
第19の構成のデータ分析用プログラムが記憶された記憶媒体は、情報データ取得機能で取得した情報データから直接主観的特徴が抽出されなかった場合にのみ、客観的特徴取得機能により客観的特徴を取得し、この客観的特徴から客観的特徴変換機能により主観的特徴を取得するようにすることができる。また、情報データ取得機能で取得した情報データから直接主観的特徴を取得するとともに、客観的特徴取得機能及び上記客観的特徴変換機能により客観的特徴に基づいて主観的特徴を取得し、これらの両方の主観的特徴に基づいて、主観数値データ取得手段において主観数値データを得るようにしてもよい。
客観的特徴は、情報データに付随していればよく、情報データに含まれていても、情報データとは別途取得されたものであってもよい。従って、客観的特徴は、情報データ取得機能で取得した情報データから抽出するようにしても、また情報データとは別途、操作者からのキーボードや音声その他の入力により取得してもよい。
前記第19の構成のデータ分析用プログラムが記憶された記憶媒体は、前記客観的特徴取得機能で取得した客観的特徴と、該客観的特徴が付随する前記情報データから取得された主観的特徴との対応を取得する対応取得機能と、前記対応取得機能で取得した前記対応に基づいて、前記特徴変換辞書の前記対応を更新する特徴変換辞書更新機能とを備え、取得した情報データについての客観的特徴と主観的特徴とに基づいて対応を取得し、特徴変換辞書を構築・更新するようにしてもよい。
この場合、前記対応取得機能により取得される前記客観的特徴と主観的特徴との対応は、複数の前記情報データの客観的特徴と主観的特徴とから統計的に取得するものとすることができる。また、前記客観的特徴と主観的特徴との対応は、操作者による入力から、取得するようにしてもよい。
尚、第19の構成のデータ分析用プログラムが記憶された記憶媒体と同様の効果は、前記第13の構成から前記第18の構成のうちのいずれか1の構成のデータ分析用プログラムが記憶された記憶媒体において、前記情報データ取得機能で取得した情報データに付随する客観的特徴を取得する客観的特徴取得機能を備え、前記数値データ検出機能が、情報データに付随する客観的特徴に主観的特徴要素とその数値データとを対応させて保持する特徴−数値データ変換辞書から、前記客観的特徴取得機能で取得された客観的特徴に対応する主観的特徴要素とその数値データとを検出するデータ分析用プログラムが記憶された記憶媒体によっても得ることが可能である。
また、第19の構成のデータ分析用プログラムが記憶された記憶媒体と同様の効果は、分析対象としての情報データを取得する情報データ取得機能と、この情報データ取得機能で取得した情報データから客観的特徴を取得する客観的特徴取得機能と、情報データに付随する客観的特徴に主観的特徴要素とその数値データとを対応させて保持する特徴−数値データ変換辞書から、前記客観的特徴取得機能で取得された客観的特徴に対応する主観的特徴要素とその数値データとを検出する数値データ検出機能と、前記数値データ検出機能で検出した主観的特徴要素及び数値データに基づいて、前記情報データ取得機能で取得した情報データを数値化した主観数値データを取得する主観数値データ取得機能と、前記主観数値データ取得機能で取得された前記主観数値データに基づく出力を行う出力機能とをコンピュータに実現するためのデータ分析用プログラムが記憶された記憶媒体によっても、得ることができる。
更に、第13の構成から第19の構成のデータ分析用プログラムが記憶された記憶媒体は、分析対象としての情報データについての時間データを取得する時間データ取得機能を備え、前記出力機能は、前記主観数値データとともにその情報データについての時間データを認識可能に出力するデータ分析用プログラムが記憶された記憶媒体(第20の構成)とすることができる。
この第20の構成のデータ分析用プログラムが記憶された記憶媒体では、時間経過にともなう主観的特徴の変遷を容易に分析することが可能となる。
この第20の構成のデータデータ分析用プログラムが記憶された記憶媒体において、時間データは、客観的特徴として情報データからまたは情報データとは別に操作者からの入力等により取得することができる。
前記第13の構成から第20の構成のデータ分析用プログラムが記憶された記憶媒体は、主観数値データに対応して主観表現を格納する主観表現辞書に基づいて、前記主観数値データ取得機能で取得した前記主観数値データに対応する主観表現を検出する主観表現検出機能と、前記主観表現検出機能で検出した主観表現を用いて、前記主観数値データの取得元である情報データについての主観表現文を生成する表現文生成機能とを備え、前記出力機能は、前記表現文生成手段機能でされた主観表現文を出力するデータ分析用プログラムが記憶された記憶媒体(第21の構成)とすることができる。
この第21の構成のデータ分析用プログラムが記憶された記憶媒体では、情報データに含まれる主観的特徴に基づいて主観表現文が生成され出力されるので、情報データに含まれる主観的特徴を容易に把握することができる。また、各情報データ毎に異なった媒体や表現で表現された主観的特徴が、主観表現文として統一された形で出力され、情報データの主観的特徴の異同が容易に把握できる。
前記第21の構成のデータ分析用プログラムが記憶された記憶媒体において、前記主観表現辞書は、主観表現として所定の印象表現語を、主観数値データに対応させたものとすることができる。
前記第13の構成から第21の構成のデータ分析用プログラムが記憶された記憶媒体において、前記情報データ取得機能は、ネットワークに接続された外部装置から前記情報データを取得し、前記出力機能は、前記ネットワーク接続された外部装置に前記主観数値データに基づく出力を行うデーデータ分析用プログラムが記憶された記憶媒体(第22の構成)とすることができる。また第13の構成から第21の構成のデータ分析用プログラムが記憶された記憶媒体において、前記特徴−要素対応辞書をネットワークに接続された外部装置に格納し、主観数値データ取得機能は、ネットワークに接続された外部装置の特徴−要素対応辞書から、前記主観的特徴に対応する主観的特徴要素及び数値データを取得するデータ分析用プログラムが記憶された記憶媒体(第23の構成)としてもよい。
第22の構成及び第23の構成において、第15の構成における客観的特徴変換機能を備えるプログラムが含まれる場合には、前記特徴変換辞書をネットワークに接続された外部装置に格納し、客観的特徴変換機能は、ネットワークに接続された外部装置の特徴変換辞書から、客観的特徴に対応する主観的特徴を取得するデーデータ分析用プログラムが記憶された記憶媒体(第24の構成)としてもよい。
【0077】
【発明の効果】
以上説明したように、本発明は、分析対象から主観的特徴を取得し、主観的特徴に基づいて主観的特徴要素をパラメータとし各主観的特徴要素にレベル値を付与した主観数値データを取得し、この主観数値データに基づいた出力を行う。このように、本発明は、分析対象を主観的な観点から数値化し出力するので、分析対象を主観的な観点で分析することが可能となる。
【図面の簡単な説明】
【図1】本発明のデータ分析装置の一実施形態の構成であり、本発明のデータ分析用プログラムが記憶された記憶媒体の該プログラムが読みとられたコンピュータの構成を表したブロック図である。
【図2】図1のデータ分析装置(コンピュータ)の特徴変換辞書の内容を表した説明図である。
【図3】図1のデータ分析装置(コンピュータ)の特徴−要素対応辞書の内容を表した説明図である。
【図4】主観的特徴要素を主観的特徴要素とする座標空間と、この座標空間に布置された各印象表現語に対する主観数値データを例示したものである。
【図5】図1のデータ分析装置(コンピュータ)の、具体的なシステム構成を表したものである。
【図6】図1のデータ分析装置(コンピュータ)をネットワークにより構成した場合のシステム構成図である。
【図7】図1のデータ分析装置(コンピュータ)によるデータ分析処理の流れを表したフローチャートである。
【図8】印象表現語取得処理の処理の流れを表したフローチャートである。
【図9】主観数値データ取得処理の流れを表したフローチャートである。
【図10】統合処理の流れを表すフローチャートである。
【図11】統合処理により印象表現語から主観数値データが統合される過程を表す説明図である。
【図12】出力処理の流れを表したフローチャートである。
【図13】図12の出力処理において、出力データにより表示装置から出力(表示)される表示画面の一例である。
【図14】クラスタ分析の分析結果に基づいて生成された出力データである表示データにより表示装置の表示画面に表示された表示画像の一例を示す図である。
【図15】本発明の他の実施形態において、出力処理により出力表示される表示画像の一例を表した図である。
【図16】本発明のその他の実施形態において、出力処理により出力表示される表示画像の一例を表した図である。
【図17】本発明のその他の実施形態に用いられる客観的特徴−要素対応辞書の内容を表した図である。
【符号の説明】
1 入力手段
2 情報データ取得手段
3 主観的特徴取得手段
4 数値データ検出手段
5 特徴−要素対応辞書
6 主観数値データ取得手段
7 出力手段
31 音声認識手段
32 文字認識手段
33 印象表現語抽出手段
35 客観的特徴取得手段
36 客観的特徴変換手段
37 特徴変換辞書

Claims (4)

  1. 分析対象としての情報データを取得する情報データ取得手段と、
    この情報データ取得手段で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得手段と、
    情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得手段で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出手段と、
    前記数値データ検出手段で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、
    前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備え、
    前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得手段で取得した前記情報データの主観的特徴とする客観的特徴変換手段と、を含み、前記取得した情報データから主観的特徴が取得された場合には、当該取得した主観的特徴を用い、取得されなかった場合には、前記客観的特徴変換手段で変換された主観的特徴を用いる、ことを特徴とするデータ分析装置。
  2. 分析対象としての情報データを取得する情報データ取得手段と、
    この情報データ取得手段で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得手段と、
    情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得手段で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出手段と、
    前記数値データ検出手段で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得手段で取得した情報データを数値化した主観数値データを取得する主観数値データ取得手段と、
    前記主観数値データ取得手段で取得された前記主観数値データに基づく出力を行う出力手段とを備え、
    前記主観的特徴取得手段は、前記情報データ取得手段で取得した情報データに付随する客観的特徴を取得する客観的特徴取得手段と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得手段で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得手段で取得した前記情報データの主観的特徴とする客観的特徴変換手段と、を含み、前記情報データ取得手段で取得した情報データに文書データが含まれている場合に、該文書データから、主観的特徴を表現する印象表現語を抽出する印象表現語抽出手段を含み、該印象表現語抽出手段で抽出された印象表現語を主観的特徴として取得し、
    前記数値データ検出手段は、印象表現語と、印象表現語を構成する主観的特徴要素及び該主観的特徴要素のレベル値データとの対応を保持する前記特徴−要素対応辞書から、前記主観的特徴要素と該主観的特徴要素のレベル値とを検出する、
    ことを特徴とするデータ分析装置。
  3. 前記出力手段は、前記主観数値データ取得手段で取得された前記主観数値データと、該主観数値データの取得元の前記情報データに付随し前記客観的特徴取得手段で取得された前記客観的特徴との対応を認識可能に、出力する
    ことを特徴とする請求項1または請求項に記載のデータ分析装置。
  4. 分析対象としての情報データを取得する情報データ取得機能と、
    この情報データ取得機能で取得した情報データから、主観的に表現される主観的特徴を取得する主観的特徴取得機能と、
    情報データから取得される主観的特徴に、この主観的特徴を表現する主観的特徴要素及び該主観的特徴要素のレベル値データを対応させた特徴−要素対応辞書から、前記主観的特徴取得機能で取得された主観的特徴に対応する主観的特徴要素及びそのレベル値データを検出する数値データ検出機能と、
    前記数値データ検出機能で検出した主観的特徴要素及びレベル値データに基づいて、前記情報データ取得機能で取得した情報データを数値化した主観数値データを取得する主観数値データ取得機能と、
    前記主観数値データ取得機能で取得された前記主観数値データに基づく出力を行う出力機能と
    をコンピュータに実現させるデータ分析用プログラムが記憶された記憶媒体であって
    前記主観的特徴取得機能は、前記情報データ取得機能で取得した情報データに付随する客観的特徴を取得する客観的特徴取得機能と、客観的特徴に主観的特徴を対応させた特徴変換辞書から、前記客観的特徴取得機能で取得した前記客観的特徴に対応する主観的特徴を検出し、検出した主観的特徴を、前記情報データ取得機能で取得した前記情報データの主観的特徴とする客観的特徴変換機能と、を含み、前記取得した情報データから主観的特徴が取得された場合には、当該取得した主観的特徴を用い、取得されなかった場合には、前記客観的特徴変換機能で変換された主観的特徴を用いる、ことを特徴とするデータ分析用プログラムが記憶された記憶媒体。
JP2000358382A 2000-11-24 2000-11-24 データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体 Expired - Fee Related JP4614526B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000358382A JP4614526B2 (ja) 2000-11-24 2000-11-24 データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000358382A JP4614526B2 (ja) 2000-11-24 2000-11-24 データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体

Publications (2)

Publication Number Publication Date
JP2002163417A JP2002163417A (ja) 2002-06-07
JP4614526B2 true JP4614526B2 (ja) 2011-01-19

Family

ID=18830294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000358382A Expired - Fee Related JP4614526B2 (ja) 2000-11-24 2000-11-24 データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体

Country Status (1)

Country Link
JP (1) JP4614526B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260519B2 (en) * 2003-03-13 2007-08-21 Fuji Xerox Co., Ltd. Systems and methods for dynamically determining the attitude of a natural language speaker
JP4940734B2 (ja) * 2006-04-04 2012-05-30 富士ゼロックス株式会社 デザイン制作支援装置及びデザイン制作支援プログラム
JP6502233B2 (ja) * 2015-10-26 2019-04-17 Kddi株式会社 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法
JP6917348B2 (ja) * 2017-04-24 2021-08-11 ヤフー株式会社 提供装置、提供方法、及び提供プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131972A (ja) * 1989-10-18 1991-06-05 Nec Corp 個人用情報格納・検索方法と装置
JPH08339360A (ja) * 1995-06-13 1996-12-24 Hitachi Ltd ニューラルネットを応用した学習システム
JPH11232288A (ja) * 1998-02-13 1999-08-27 Fuji Xerox Co Ltd 検索装置及び文書画像登録装置
JP2000250907A (ja) * 1999-02-26 2000-09-14 Fuji Xerox Co Ltd 文書処理装置および記録媒体
JP2000298669A (ja) * 1999-04-12 2000-10-24 Just Syst Corp 文書作成装置、文書作成方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132509A (ja) * 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 出会いを支援するコミュニケーションサービス方法及びシステム及びコミュニケーションサービスプログラムを格納した記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131972A (ja) * 1989-10-18 1991-06-05 Nec Corp 個人用情報格納・検索方法と装置
JPH08339360A (ja) * 1995-06-13 1996-12-24 Hitachi Ltd ニューラルネットを応用した学習システム
JPH11232288A (ja) * 1998-02-13 1999-08-27 Fuji Xerox Co Ltd 検索装置及び文書画像登録装置
JP2000250907A (ja) * 1999-02-26 2000-09-14 Fuji Xerox Co Ltd 文書処理装置および記録媒体
JP2000298669A (ja) * 1999-04-12 2000-10-24 Just Syst Corp 文書作成装置、文書作成方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2002163417A (ja) 2002-06-07

Similar Documents

Publication Publication Date Title
JP6061729B2 (ja) 商品情報提供システムおよび商品情報提供用プログラム
US8577887B2 (en) Content grouping systems and methods
JP3738011B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP5527548B2 (ja) 情報分析装置、情報分析方法、及びプログラム
JP3408998B2 (ja) データ検索装置、及びデータ検索用プログラムが記憶された記憶媒体
JP4614526B2 (ja) データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体
JP4787955B2 (ja) 対象文書からキーワードを抽出する方法、システムおよびプログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
JP2003157255A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2002140465A (ja) 自然文処理装置及び自然文処理用プログラム
JP3787318B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP3951586B2 (ja) ドキュメント作成システム、ドキュメント作成方法、及び、コンピュータ読取り可能な記録媒体
JP4129132B2 (ja) 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム
JP7310899B2 (ja) ユーザ・商品マップ推定装置、方法およびプログラム
JP4657430B2 (ja) データ検索装置、及びデータ検索用プログラムが記憶された記憶媒体
JP4047417B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP2021165892A (ja) 情報処理装置、情報処理方法およびプログラム
JP4712221B2 (ja) 主観的特徴要素生成装置、主観的特徴要素生成方法、及び主観的特徴要素生成プログラム
CN113127597A (zh) 搜索信息的处理方法、装置及电子设备
JP3943005B2 (ja) 情報検索プログラム
JP4669642B2 (ja) 文書分類装置および文書分類方法、並びに文書分類方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4156279B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、及びデータ検索装置
JP5727970B2 (ja) 感覚推定装置、感覚推定方法及び感覚推定プログラム
JP2011022874A (ja) データ処理装置及びデータ処理方法
JP7037778B2 (ja) 検索装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100406

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101015

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101019

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees