JP2004164079A - データ分析装置及び方法、並びにプログラム - Google Patents

データ分析装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2004164079A
JP2004164079A JP2002326698A JP2002326698A JP2004164079A JP 2004164079 A JP2004164079 A JP 2004164079A JP 2002326698 A JP2002326698 A JP 2002326698A JP 2002326698 A JP2002326698 A JP 2002326698A JP 2004164079 A JP2004164079 A JP 2004164079A
Authority
JP
Japan
Prior art keywords
modifier
noun phrase
dictionary
degree
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002326698A
Other languages
English (en)
Other versions
JP3955522B2 (ja
Inventor
Makoto Sano
真 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2002326698A priority Critical patent/JP3955522B2/ja
Publication of JP2004164079A publication Critical patent/JP2004164079A/ja
Application granted granted Critical
Publication of JP3955522B2 publication Critical patent/JP3955522B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】テキストマイニングの手法により顧客などの主観的な情報を捉えて的確なデータ分析を行う。
【解決手段】分析対象となる文書から名詞句を抽出し、抽出した名詞句に対応した主題毎に文書をまとめる(S13)。次に、主題毎にデータ分析を行う(S14)。データ分析では、主題の名詞句と修飾・被修飾関係にある形容詞句を抽出し、抽出した各形容詞句に与えられた好評・不評のレベル値を集計したアフェクト度を求める評価分析(S14−1)と、主題の名詞句と修飾・被修飾関係にある形容詞句がどの程度同一のものに集約されているかを示す評価集約度を求める感性分析(S14−2)と、主題の名詞句と修飾・被修飾関係にある動詞句がどの程度同一のものに集約されているかを示す意見集約度を求める機能要求分析(S14−3)とを行う。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、テキストマイニングの手法によるデータ分析装置及び方法、並びにプログラムに関する。
【0002】
【従来の技術】
近年、経営戦略或いはマーケティング戦略を有効に策定するためには、経営やマーケティングにとって必要な現時点までの傾向やパターンなどを導き出し、データ分析を行うことが不可欠となっている。このデータ分析において傾向やパターンなどを導き出す手法として、データマイニングが適用されている。データマイニングにおいて顧客情報を取り扱う場合は、アンケート結果などによる一義的、具体的な事実に基づいた定量的な顧客情報(属性情報)による分析が中心となっている。
【0003】
例えば、購買履歴からのデータマイニングの適用としては、顧客の年齢、購入日時などの数値情報、購入アイテムに関する属性データを入力データとし、属性データの因果関係をマイニングして、クロスセル・アップセル分析を行うものである。製品開発場面でのデータマイニングの適用としては、ノートPCの開発を例とすると、バッテリー駆動時間、DVDドライブの有無などの属性データの組み合わせ条件から、コンジョイント分析などの手法で知覚品質を評価したりしている。
【0004】
データマイニングにおける分析では、このように一義的、具体的な事実に基づいた属性情報を分析するものであり、その背後にある顧客の主観的意図は分析対象としていない。このため、例えば、(1)顧客が評価を行った場所、時間、状況などの関わりが考慮されない。(2)どのような考えで顧客が購買行動に至ったのかが分からない。(3)顧客がなぜその状況で商品を購入したか分からない。(4)どのような考えで特定のモデルを高く(低く)評価したかが分からない。等の問題があった。
【0005】
そこで、上記のデータマイニングのように一義的、具体的な情報を分析するだけでなく、例えば、顧客が文章で回答した結果を分析しようとするテキストマイニングが提唱されている。テキストマイニングで対象とする顧客の回答文などには、顧客の主観的意図が含まれている場合があり、経営やマーケティングにとってより有用な情報が得られることが期待される。
【0006】
【発明が解決しようとする課題】
しかしながら、これまでのテキストマイニングの手法は、データマイニングの手法を踏襲しただけのものが多かった。ここでは、文章の中に含まれる言葉をキーワードとして一義的、具体的なデータとして捉え、データマイニングと同じような手法でしか分析を行っておらず、その言葉の背後にある顧客の主観的意図がほとんど何も分析されないでいた。
【0007】
このため、結果として生成される経営分析或いはマーケティング分析用のデータからは、顧客の主観的意図に関する情報が欠落してしまっていた。また、データマイニングの手法を踏襲しただけのテキストマイニングでは、結果として生成されるデータの質もデータマイニングの場合と同程度であり、結果として得られたデータから経営戦略やマーケティング戦略を策定するには、戦略策定者の経験や勘に頼らなければいけない部分が多かった。
【0008】
本発明は、テキストマイニングの手法により主観的な情報を捉えて的確なデータ分析を行うことができるデータ分析装置及び方法、並びにプログラムを提供することを目的とする。
【0009】
本発明は、また、経営戦略やマーケティング戦略等の策定が容易となる分析結果を提供することができるデータ分析装置及び方法、並びにプログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
上記目的を達成するため、本発明の第1の観点にかかるデータ分析装置は、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、
前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書と、
前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出する名詞句抽出手段と、
前記修飾語句辞書を参照して、前記名詞句抽出手段が抽出した名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
前記修飾語句抽出手段が抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記名詞句抽出手段が抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出するアフェクト度算出手段と、
前記アフェクト度算出手段が算出した名詞句毎のアフェクト度を出力するアフェクト度出力手段と
を備えることを特徴とする。
【0011】
上記第1の観点にかかるデータ分析装置は、
前記名詞句抽出手段が抽出した各名詞句の前記分析対象となる文章における出現頻度を算出する名詞句頻度算出手段をさらに備えていてもよい。この場合、
前記アフェクト度出力手段は、各名詞句について前記アフェクト度算出手段が算出したアフェクト度と前記名詞句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力するものとすることができる。
【0012】
上記第1の観点にかかるデータ分析装置は、
前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段と、
前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段と、
前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段とをさらに備えるものとすることができる。
【0013】
この場合において、上記第1の観点にかかるデータ分析装置は、
前記修飾語句抽出手段が抽出した各修飾語句の前記分析対象となる文章における出現頻度を算出する修飾語句頻度算出手段をさらに備えていてもよい。そして、
前記集約度出力手段は、各修飾語句について前記集約度算出手段が算出した集約度と前記修飾語句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力するものとすることができる。
【0014】
上記目的を達成するため、本発明の第2の観点にかかるデータ分析装置は、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、
前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書と、
前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段と、
前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段と、
前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段と
を備えることを特徴とする。
【0015】
上記第2の観点にかかるデータ分析装置は、
前記修飾語句抽出手段が抽出した各修飾語句の前記分析対象となる文章における出現頻度を算出する修飾語句頻度算出手段をさらに備えていてもよい。この場合において、
前記集約度出力手段は、各修飾語句について前記集約度算出手段が算出した集約度と前記修飾語句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力するものとすることができる。
【0016】
上記第1、第2の観点にかかるデータ分析装置において、
前記分析対象となる文章は、現状に関する記述と、現状に関連した将来の状態に関する記述とを含んでおり、前記現状に関する記述と前記将来の状態に関する記述とが別々に分析対象とされるものであってもよい。
【0017】
ここで、上記第1、第2の観点にかかるデータ分析装置は、
前記分析対象となる文章の中から現状に関する記述と将来の状態に関する記述とを切り分ける切り分け手段をさらに備えていてもよく、
前記切り分け手段が切り分けた前記現状に関する記述と前記将来の状態に関する記述とが別々に分析対象とされるものとすることができる。
【0018】
上記目的を達成するため、本発明の第3の観点にかかるデータ分析方法は、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書とを有するコンピュータ装置において、
前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出し、
前記修飾語句辞書を参照して、前記抽出した名詞句を修飾する修飾語句を抽出し、
前記抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出し、
前記算出した名詞句毎のアフェクト度を出力する
ことを特徴とする。
【0019】
上記第3の観点にかかるデータ分析方法は、
前記抽出した各名詞句の前記分析対象となる文章における出現頻度をさらに算出するものとすることができる。この場合において、
前記アフェクト度は、前記算出した出現頻度と視覚的に関連付けて、各名詞句毎に出力されるものとすることができる。
【0020】
上記目的を達成するため、本発明の第4の観点にかかるデータ分析方法は、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書とを有するコンピュータ装置において、
前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出し、
前記名詞句辞書を参照して、前記抽出した各修飾語句によって修飾される名詞句を抽出し、
前記名詞句の抽出結果に基づいて、前記抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出し、
前記算出した修飾語句毎の集約度を出力する
ことを特徴とする。
【0021】
上記第4の観点にかかるデータ分析方法は、
前記抽出した各修飾語句の前記分析対象となる文章における出現頻度をさらにものとすることができる。この場合において、
前記集約度は、前記算出した出現頻度と視覚的に関連付けて、各修飾語句毎に視覚的に出力されるものとすることができる。
【0022】
上記目的を達成するため、本発明の第5の観点にかかるプログラムは、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書とを有するコンピュータ装置を、
前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出する名詞句抽出手段、
前記修飾語句辞書を参照して、前記名詞句抽出手段が抽出した名詞句を修飾する修飾語句を抽出する修飾語句抽出手段、
前記修飾語句抽出手段が抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記名詞句抽出手段が抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出するアフェクト度算出手段、及び、
前記アフェクト度算出手段が算出した名詞句毎のアフェクト度を出力するアフェクト度出力手段
として機能させることを特徴とする。
【0023】
上記第5の観点にかかるプログラムは、前記コンピュータ装置を、
前記名詞句抽出手段が抽出した各名詞句の前記分析対象となる文章における出現頻度を算出する名詞句頻度算出手段としてさらに機能させるものとすることができる。この場合において、
前記アフェクト度出力手段は、各名詞句について前記アフェクト度算出手段が算出したアフェクト度と前記名詞句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力するものとすることができる。
【0024】
上記目的を達成するため、本発明の第6の観点にかかるプログラムは、
分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書とを有するコンピュータ装置を、
前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段、
前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段、
前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段、及び、
前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段
として機能させることを特徴とする。
【0025】
上記第6の観点にかかるプログラムは、前記コンピュータ装置を、
前記修飾語句抽出手段が抽出した各修飾語句の前記分析対象となる文章における出現頻度を算出する修飾語句頻度算出手段としてさらに機能させるものであってもよい。この場合において、
前記集約度出力手段は、各修飾語句について前記集約度算出手段が算出した集約度と前記修飾語句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力するものとすることができる。
【0026】
【発明の実施の形態】
以下、添付図面を参照して、本発明の実施の形態について説明する。
【0027】
図1は、この実施の形態にかかるデータ分析装置を中心としたシステムの構成を示すブロック図である。このデータ分析装置1は、LAN(Local Area Network)3を介して管理部門の社員が利用する端末装置(パーソナルコンピュータやワークステーションなど)2に接続される。さらにゲートウェイ5からインターネット6を介して顧客の端末装置(パーソナルコンピュータや携帯電話機など)4にも接続される。このデータ分析装置1は、CPU(Central Processing Unit)11と、記憶装置12と、通信装置13と、ファイル装置14とを備えている。
【0028】
CPU11は、記憶装置12に記憶されたプログラムを実行し、後述するようにテキストマイニングの手法によりデータ分析を行う。記憶装置12は、主記憶装置及び補助記憶装置を含むものであり、CPU11が実行するプログラムを記憶すると共に、CPU11のワークエリアとして使用される。通信装置13は、LAN3やインターネット6を介して端末装置2、4などと情報を送受信する。
【0029】
ファイル装置14は、アンケートファイル14aと、知識辞書14bと、分析結果データベース14cとを含んでいる。ファイル装置14は、物理的には記憶装置12の補助記憶装置の中に含まれるものではあるが、本発明において重要な役割を有するファイル、データベースを含むものであるため、特に構成を分けて記載している。
【0030】
アンケートファイル14aは、顧客が製品に対して自然言語の文章で入力したアンケート結果のテキストデータを記録したファイルである。このアンケートは、図2に示すような記入フォーム100に従って端末装置4において記入され、インターネット6を介してデータ分析装置1に送信されて、アンケートファイル14aに記録される。
【0031】
図2の記入フォーム100は、アンケートの対象とした製品に対して顧客が便利だと感じる点の記入欄(満足記入欄)101と、便利な点をさらに延ばすために何を期待するかの記入欄(進展期待記入欄)102と、顧客が不便だと感じる点の記入欄(不満記入欄)103と、不便な点をどのように改善することを望むかの記入欄(改善期待記入欄)104とに分かれている。ここで、記入欄101、103には現状が、記入欄102、104には将来あるべき状態が記入されることとなる。
【0032】
知識辞書14bは、単語辞書と、文法辞書と、品詞辞書とを含んでいる。単語辞書及び文法辞書は、文章を形態素解析し、構文解析するために従来より用いられている辞書と実質的に同じものが適用される。品詞辞書には、単語辞書に登録された文法的な意味での単語が登録されるのではなく、評価の対象となる語句(1語、複数語の連接により1つのまとまった意味をなす句)が登録されている。また、品詞辞書は、名詞、形容詞及び動詞の別に用意されているが、これらは文法的な働きにより分類されているのではなく、意味上名詞的な働きをするか、形容詞的な働きをするか、動詞的な働きをするかによって分類されている。
【0033】
名詞句辞書は、形容詞句、動詞句によって修飾される名詞句を登録した辞書である。形容詞句辞書及び動詞句辞書は、名詞句を修飾することとなる形容詞句、動詞句をそれぞれ登録した辞書である。ここでの修飾・被修飾関係は、文法的に修飾語・被修飾語となるかどうかまでを要求するのではなく、意味的に係り受けの関係にあればよい。また、修飾語は、被修飾語に前置されているか後置されているかを問わない。特に形容詞句辞書は、後述する評価分析を行うため、図3に示すように形容詞句(表現語及び正規化表現)に対応付けて、その言葉が好ましい評価をするのか好ましくない評価をするのかを示すレベル値を登録している。
【0034】
分析結果データベース14cは、アンケートファイル14aに記録されたアンケートの文章に対して、知識辞書14bを参照して、後述するデータ分析を行った結果を登録するデータベースである。分析結果データベース14cには、データ分析の最終結果として出力される前の段階の解析・分析結果(後述する形態素解析及び構文解析の結果、並びに主題分析の結果)をも登録してもよい。
【0035】
以下、この実施の形態にかかるデータ分析装置1における処理について説明する。ここでは、テキストマイニングの対象となるアンケートは、既に端末装置4から送られてきて、アンケートファイル14aに記録されているが、未だ分析は行われていないものとする。図4は、データ分析装置1における処理を示すフローチャートである。このフローチャートの処理は、端末装置2から処理開始の指示が送られてくることで開始する。
【0036】
処理が開始すると、CPU11は、まず、知識辞書14bの単語辞書及び文法辞書を参照して、アンケートファイル14aに記録されている各アンケートの文章を形態素解析し(ステップS11)、構文解析する(ステップS12)。形態素解析及び構文解析は、従来と同様の手法により行われ、その構文解析結果に基づいて後述する修飾・被修飾関係を把握することが可能となる。
【0037】
形態素解析及び構文解析を終了すると、CPU11は、次に主題分析を行う(ステップS13)。主題分析では、CPU11は、アンケートファイル14aに記録されている各アンケートをサブドキュメント単位に区切り、知識辞書14bの名詞句辞書を参照して、各サブドキュメントから名詞句を抽出する。CPU11は、抽出した各名詞句に対してサブドキュメント中の出現頻度、アンケート全体における分布等の統計情報を求め、この統計情報を利用して各サブドキュメントをベクター表現に変換する。
【0038】
CPU11は、各サブドキュメントのベクター表現に基づいて、アンケート毎のベクター表現を生成し、アンケート毎のベクター表現の類似度を求め、所定の値を超えるアンケートの文書同士を1つのクラスタとする。CPU11は、各クラスタのベクター表現の類似度を求め、所定の値を超えるクラスタ同士を同じ主題のものとしてまとめていく。なお、1つのアンケートが複数の主題に分類される場合もある。
【0039】
主題分析が終了すると、CPU11は、主題分析で得られた主題についてデータ分析を行い、アンケートに記載された問題点等を抽出する(ステップS14)。データ分析は、問題点等を抽出する際の切り口となる視点により、評価分析(ステップS14−1)と、感性分析(ステップS14−2)と、機能要求分析(ステップS14−3)とを行う。
【0040】
このデータ分析は、現状に関する記述(記入フォーム100の記入欄101、103に記入された事項)と将来の状態に関する記述(記入フォーム100の記入欄102、104に記入された事項)とを分けて行うことができる。ここで、ステップS13の主題分析により分類された主題は、例えば、図5に示すように簡易デンドログラム表示され、この中からオペレータがデータ分析を行いたい主題を選択する。
【0041】
ステップS14−1の評価分析では、CPU11は、名詞句辞書を参照して、選択された主題の分類に含まれる名詞句を抽出し、名詞句毎の出現度数(頻度)を求める。CPU11は、さらに構文解析結果及び形容詞句辞書を参照して、各名詞句を修飾している形容詞句を抽出し、抽出した形容詞句のレベル値に従って各名詞句のアフェクト度を取得する。アフェクト度の取得についてより詳細に説明すると、名詞句を修飾する形容詞句が抽出されると、知識辞書14b中の形容詞句辞書に登録された当該形容詞句に対応するレベル値を取得する。このレベル値を次の数式1に従って名詞句毎に集計した結果(マイナスの計算をする場合があり)が、各名詞句のアフェクト度となる。
【0042】
【数1】
アフェクト度=Σ((形容詞句のレベル値)×(被修飾名詞句と形容詞句からなるフレーズの頻度))÷(被修飾名詞句を含むフレーズの頻度)
但し、Σは被修飾名詞句のリデュースにより類型化された形容詞句毎の重み付けレベル値算出結果の合計
【0043】
なお、リデュースとは、複数の処理対象の中で指定された条件に基づく共通・重複分を集計・集約することをいう。集約の結果、共通・重複部分は唯一の(リデュースされた)ものとなり、共通・重複しない部分は、差分情報として類型化される。例えば、「美しい−色」「綺麗な−色」「すてきな−色」という3つのフレーズ(形容詞句−名詞句)について、被修飾名詞句をリデュースすると、「色−美しい/綺麗な/すてきな」となる。
【0044】
ステップS14−2の感性分析では、CPU11は、形容詞句辞書を参照して、選択された主題の分類に含まれる形容詞句を抽出し、各形容詞句の出現度数(頻度)を求める。CPU11は、さらに構文解析結果及び名詞句辞書を参照して、各形容詞句が修飾している名詞句がどれだけ固定的であるかを示す評価集約度を取得する。ここで、評価集約度は、次の数式2に従って求められ、同一の形容詞句と修飾・被修飾関係にある名詞句のバリエーションが形容詞句の頻度に比べて少ない場合、その形容詞句の評価集約度が高くなる。
【0045】
【数2】
評価集約度=−log(名詞句の異なり語数/形容詞句の頻度)
但し、名詞句、形容詞句のいずれも修飾・被修飾関係にあるもののみを計数対象とする。
【0046】
ステップS14−3の機能要求分析では、CPU11は、動詞句辞書を参照して、選択された主題の分類に含まれる名詞句を修飾している動詞句を抽出し、各動詞句の出現頻度(度数)を求める。CPU11は、さらに構文解析結果及び名詞句辞書を参照して、各動詞句が修飾している名詞句がどれだけ固定的であるかを示す意見集約度を取得する。ここで、意見集約度は、次の数式3に従って求められ、同一の動詞句と修飾・被修飾関係にある名詞句のバリエーションが動詞句の頻度に比べて少ない場合、その動詞句の意見集約度が高くなる。
【0047】
【数3】
意見集約度=−log(名詞句の異なり語数/動詞句の頻度)
但し、名詞句、動詞句のいずれも修飾・被修飾関係にあるもののみを計数対象とする。
【0048】
なお、ステップS14−1の評価分析、ステップS14−2の感性分析、及びステップS14−3の機能要求分析における名詞句、形容詞句或いは動詞句の抽出については、後に詳しく説明するものとする。
【0049】
選択した主題についてのデータ分析が終了すると、CPU11は、その分析結果を分析結果データベース14cに登録する(ステップS15)。また、CPU11は、その分析結果を処理開始の指示をした端末装置2に対して通信装置13から送信させ、当該端末装置2の表示装置に表示して出力させる(ステップS16)。これで、データ分析装置1における処理が終了する。なお、分析結果データベース14cに登録された分析結果は、端末装置2から要求することにより、いつでも取り出すことができるようになっている。
【0050】
次に、ステップS14−1の評価分析、ステップS14−2の感性分析、ステップS14−3の機能要求分析における名詞句、形容詞句、或いは動詞句の抽出について説明する。前述したとおり、ここでの名詞句、形容詞句或いは動詞句の抽出は、アフェクト度、評価集約度、或いは意見集約度の算出の前提となるものである。なお、ここでは、現状に関する記述(記入フォーム100の記入欄101、103に記入された事項)を対象としたデータ分析の結果の出力例を示している。
【0051】
図6は、評価分析における名詞句、形容詞句の抽出を説明する図である。ここでは、反転表示して示すように「単語登録」という名詞句がまず抽出される。次に「単語登録」という名詞句を修飾している形容詞句として、枠囲みして示すように「面倒」という形容詞句が抽出される。この場合において、名詞句「単語登録」の頻度は4、形容詞句「面倒」のレベル値を−1とすると、他に「単語登録」を修飾する形容詞句がないのであれば、アフェクト度は−1と求められることが分かる。
【0052】
図7は、感性分析における形容詞句、名詞句の抽出を説明する図である。ここでは、反転表示して示すように「正しい」という形容詞句がまず抽出される。次に「正しい」という形容詞句が修飾している名詞句として、枠囲みして示すように「日本語」という名詞句が抽出される。この場合において、形容詞句「正しい」の頻度は4、評価集約度は1と求められることが分かる。
【0053】
図8は、機能要求分析における動詞句、名詞句の抽出を説明する図である。ここでは、反転表示して示すように「設定」という動詞句がまず抽出される。次に「設定」という動詞句が修飾している名詞句として、枠囲みして示すように「辞書」という名詞句が抽出される。この場合において、動詞句「設定」の頻度は4、意見集約度は1と求められることが分かる。
【0054】
次に、ステップS14−1の評価分析、ステップS14−2の感性分析、ステップS14−3の機能要求分析の結果の出力例について、具体例を挙げて説明する。ここでも、現状に関する記述(記入フォーム100の記入欄101、103に記入された事項)を対象として説明する。
【0055】
図9は、ステップS14−1の評価分析の結果である各名詞句のアフェクト度の出力例を示す図である。この図において、縦軸が名詞句のアフェクト度、横軸が名詞句の頻度を示している。アフェクト度は、その値がプラスになる場合(評価として好評の場合)、縦軸の正領域(図の上側)に表示され、その値がマイナスになる場合(評価として不評の場合)、縦軸の負領域(図の下側)に表示されるものとなる。
【0056】
図9を参照すると、例えば、「変換精度」については、頻度が大きく、アフェクト度も高いので、現状の製品でもかなり顧客に満足されていることを視覚的に容易に認識することができる。これに対して、「単語登録」については、頻度が大きくてもアフェクト度がマイナスを示しているので、現状の製品における顧客の不満が大きく、今後の製品開発において改良すべき点であると考えられることを視覚的に容易に認識することができる。
【0057】
図10は、ステップS14−2の感性分析の結果である各形容詞句毎の評価集約度の出力例を示す図である。この図において、縦軸が形容詞句の評価集約度、横軸が形容詞句の頻度を示している。図10を参照すると、例えば、「難しい」や「正しい」については、頻度が大きく、評価集約度も高くなっているので、多くの顧客が同じ製品の同じ点について「難しい」とか「正しい」とか感じていることを視覚的に容易に認識することができる。
【0058】
図11は、ステップS14−3の機能要求分析の結果である各動詞句の意見集約度の出力例を示す図である。この図において、縦軸が動詞句の意見集約度、横軸が動詞句の頻度を示している。図11を参照すると、例えば、「インストール」については、頻度が大きく、意見集約度も高くなっているので、多くの顧客が「インストール」に関する同じ点について同じ要求を持っていることを視覚的に容易に認識することができる。
【0059】
以上説明したように、この実施の形態にかかるデータ分析装置1では、評価分析において各名詞句に着目し、名詞句毎に抽出した形容詞句のレベル値を集計してアフェクト度を算出している。このアフェクト度は、対応する名詞句の点に対する顧客の評価が好評であるか不評であるかを数値化して示すものである。この名詞句毎のアフェクト度により、製品の様々な点について顧客がどのように評価しているかが即座に分かるようになるので、評価分析の結果を経営戦略やマーケティング戦略などの策定に役立てるのが容易になる。
【0060】
感性分析においては各形容詞句に着目し、各形容詞句が修飾する名詞句に基づいて評価集約度を算出している。この評価集約度は、対応する形容詞句のような感じ方が、同じ点に集中してなされているのか、それとも様々な点に分散してなされているのかを数値化して示すものである。この形容詞句毎の評価集約度により、同じ感じ方が同じ点に集中してなされているのかどうかが即座に分かるようになるので、感性分析の結果を経営戦略やマーケティング戦略などの策定に役立てるのが容易になる。
【0061】
機能要求分析においては動詞句に着目し、各動詞句が修飾する名詞句に基づいて意見集約度を算出している。この意見集約度は、対応する動詞句のような要求が、同じ点に集中してなされているのか、それとも様々な点に分散してなされているのかを数値化して示すものである。この動詞句毎の意見集約度により、同じ要求が同じ点に集中してなされているのかどうかが即座に分かるようになるので、機能要求分析の結果を経営戦略やマーケティング戦略などの策定に役立てるのが容易になる。
【0062】
また、評価分析、感性分析、機能要求分析の結果としてのアフェクト度、評価集約度、意見集約度は、これらをグラフの縦軸とし、対応する語句の頻度を横軸として出力される。このため、多くの顧客が感じていることや要求していることを、視覚表現から容易に把握することができるようになり、データ分析の結果を経営戦略やマーケティング戦略などの策定に役立てるのが容易になる。
【0063】
さらに、この実施の形態でデータ分析の対象としているアンケートは、記入欄101〜104を有する記入フォーム100に従って記載されている。ここで、現状に関する記述は記入欄101、103に、将来の状態に関する記述は記入欄102、104に記入されるもので、互いに切り分けられている。このため、現状の問題点などに関する分析と、問題解決後のものとしてユーザが望む状態の分析とを、切り分けて行うことができるので、データ分析の結果を経営戦略やマーケティング戦略などの策定に役立てるのが容易になる。
【0064】
本発明は、上記の実施の形態に限られず、種々の変形、応用が可能である。以下、本発明に適用可能な上記の実施の形態の変形態様について説明する。
【0065】
上記の実施の形態では、顧客のアンケートにおいて、図2の記入フォーム100を用意しておき、現状と将来の状態とを切り分けて記入させるものとしていた。しかしながら、必ずしも現状と将来の状態とが明確に切り分けられてアンケートが記入されているとは限らない。また、図2の記入フォーム100にとらわれず、自由にアンケートに回答したいと思う顧客も存在し得る。図2の記入フォーム100のような記入方法によらなければ、そもそも現状と将来の状態とが切り分けられてアンケートが記入されることがない。
【0066】
そこで、次の4つのいずれかを任意に複合した方法により、現状と将来の状態との切り分けを行ってから、データ分析を行うものとすることができる。図2の記入フォーム100に従って記入されたアンケートの文章では、現状と将来の状態とが切り分けられたものとして推定するが、最終的に確定するのは、次のような方法で処理を行った後とすることができる。
【0067】
第1の方法として、文章の時制として現在形または過去形が用いられている部分を現状の記述として判断し、未来形が用いられている部分を将来の状態の記述として判断して、現状と将来の状態とを切り分けることができる。第2の方法として、時間的な先後から通常は現状に関する記述の方が将来の状態に関する記述よりも先に現れるので、記述の先後に従って現状と将来の状態との切り分けを行うことができる。
【0068】
第3の方法としては、不便な点として記載されたものに着目した場合、ステップS14−1の評価分析で得られたアフェクト度を利用して、アフェクト度の低い部分の記述を現状として把握する。同一の文章内において同一の名詞句についてアフェクト度の高い部分があれば、その部分の記述を将来の状態として把握して、現状と将来の状態とを切り分けることができる。
【0069】
第4の方法としては、知識辞書14bとして、さらに図12に示すような辞書を用意しておく。この辞書は、将来の状態を記述するために頻繁に用いられる語句を登録したものである。アンケートの文章のうちで、図12に示す辞書に登録された語句を含む部分の記述を将来の状態として把握する。同一の文章内において同一の名詞句を有する対応する記載があれば、その部分の記述を現状として把握して、現状と将来の状態とを切り分けることができる。
【0070】
上記のような方法で現状と将来の状態との切り分けを明確に行って、アンケートの文章を分析することによって、アンケートの対象とした製品に対する顧客の満足・不満と要望とを別々に分かり易く把握できるようになる。これにより、経営戦略やマーケティング戦略を策定する者は、顧客満足度を向上させるための的確な戦略を容易に作成できるようになる。
【0071】
上記の実施の形態では、データ分析の対象となる文章は、図2の記入フォーム100に従って記入されたアンケートであり、顧客が自己の端末装置4からデータ分析装置1にアクセスして、アンケートファイル14aに記録させるものであった。これに対して、データ分析の対象となる文章は、顧客が自らデータ分析装置1に送ったものだけでなく、インターネット6上のWebサーバに書き込まれた掲示板や記事などのデータを収集したものであってもよい。このような文章では、現状と将来の状態とが切り分けられていないので、上記した切り分け技術の適用が特に有効となる。
【0072】
上記の実施の形態では、データ分析装置1は、LAN3を介して端末装置2に接続されており、端末装置2からの指示に従ってアンケートファイル14aに記録されたアンケートをデータ分析し、その分析結果を指示元の端末装置2に返却するものとしていた。すなわち、クライアント−サーバ構成のシステムにおいて本発明が実現されていた。これに対して、データ分析装置1が入力装置及び表示装置を有するものとして、スタンドアローン型のシステムにおいて本発明が実現されるものとしてもよい。
【0073】
上記の実施の形態では、データ分析装置1のがアンケートに対してデータ分析するためのプログラムは、記憶装置12に予め記憶されているものとして説明した。しかしながら、このプログラムをCD−ROMやDVD−ROMなどのコンピュータ読み取り可能な記録媒体に格納して、ハードウェアとは独立して配布するものとしてもよい。また、これらの処理プログラムをインターネット上のWebサーバ装置が有する固定ディスク装置に格納しておき、インターネットを通じて配信するものとしてもよい。
【0074】
【発明の効果】
以上説明したように、本発明によれば、テキストマイニングの手法により主観的な情報を容易に捉えて的確なデータ分析を行うことができるようになる。また、その分析結果により、また、経営戦略やマーケティング戦略等の策定が容易になる。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかるデータ分析装置を中心としたのシステムの構成を示すブロック図である。
【図2】アンケートファイルに記録されるアンケートの記入フォームを示す図である。
【図3】知識辞書の例を示す図である。
【図4】本発明の実施の形態にかかるデータ分析装置における処理を示すフローチャートである。
【図5】主題分析により分類された主題の簡易デンドログラム表示の例を示す図である。
【図6】評価分析における名詞句と形容詞句の抽出を説明する図である。
【図7】感性分析における形容詞句と名詞句の抽出を説明する図である。
【図8】機能要求分析における動詞句と名詞句の抽出を説明する図である。
【図9】評価分析の結果である各名詞句のアフェクト度の出力例を示す図である。
【図10】感性分析の結果である各形容詞句毎の評価集約度の出力例を示す図である。
【図11】機能要求分析の結果である各動詞句の意見集約度の出力例を示す図である。
【図12】変形例において、知識辞書として追加される辞書の例を示す図である。
【符号の説明】
1 データ分析装置
2 端末装置
3 LAN
4 端末装置
5 ゲートウェイ
6 インターネット
11 CPU
12 記憶装置
13 通信装置
14 ファイル装置
14a アンケートファイル
14b 知識辞書
14c 分析結果データベース

Claims (12)

  1. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、
    前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書と、
    前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出する名詞句抽出手段と、
    前記修飾語句辞書を参照して、前記名詞句抽出手段が抽出した名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
    前記修飾語句抽出手段が抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記名詞句抽出手段が抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出するアフェクト度算出手段と、
    前記アフェクト度算出手段が算出した名詞句毎のアフェクト度を出力するアフェクト度出力手段と
    を備えることを特徴とするデータ分析装置。
  2. 前記名詞句抽出手段が抽出した各名詞句の前記分析対象となる文章における出現頻度を算出する名詞句頻度算出手段をさらに備え、
    前記アフェクト度出力手段は、各名詞句について前記アフェクト度算出手段が算出したアフェクト度と前記名詞句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力する
    ことを特徴とする請求項1に記載のデータ分析装置。
  3. 前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
    前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段と、
    前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段と、
    前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段とをさらに備える
    ことを特徴とする請求項1または2に記載のデータ分析装置。
  4. 前記修飾語句抽出手段が抽出した各修飾語句の前記分析対象となる文章における出現頻度を算出する修飾語句頻度算出手段をさらに備え、
    前記集約度出力手段は、各修飾語句について前記集約度算出手段が算出した集約度と前記修飾語句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力する
    ことを特徴とする請求項3に記載のデータ分析装置。
  5. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、
    前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書と、
    前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段と、
    前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段と、
    前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段と、
    前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段と
    を備えることを特徴とするデータ分析装置。
  6. 前記修飾語句抽出手段が抽出した各修飾語句の前記分析対象となる文章における出現頻度を算出する修飾語句頻度算出手段をさらに備え、
    前記集約度出力手段は、各修飾語句について前記集約度算出手段が算出した集約度と前記修飾語句頻度算出手段が算出した出現頻度とを視覚的に関連付けて出力する
    ことを特徴とする請求項5に記載のデータ分析装置。
  7. 前記分析対象となる文章は、現状に関する記述と、現状に関連した将来の状態に関する記述とを含んでおり、前記現状に関する記述と前記将来の状態に関する記述とが別々に分析対象とされる
    ことを特徴とする請求項1乃至6のいずれか1項に記載のデータ分析装置。
  8. 前記分析対象となる文章の中から現状に関する記述と将来の状態に関する記述とを切り分ける切り分け手段をさらに備え、
    前記切り分け手段が切り分けた前記現状に関する記述と前記将来の状態に関する記述とが別々に分析対象とされる
    ことを特徴とする請求項7に記載のデータ分析装置。
  9. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書とを有するコンピュータ装置において、
    前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出し、
    前記修飾語句辞書を参照して、前記抽出した名詞句を修飾する修飾語句を抽出し、
    前記抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出し、
    前記算出した名詞句毎のアフェクト度を出力する
    ことを特徴とするデータ分析方法。
  10. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書とを有するコンピュータ装置において、
    前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出し、
    前記名詞句辞書を参照して、前記抽出した各修飾語句によって修飾される名詞句を抽出し、
    前記名詞句の抽出結果に基づいて、前記抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出し、
    前記算出した修飾語句毎の集約度を出力する
    ことを特徴とするデータ分析方法。
  11. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を、各修飾語句が意味的に好ましいか好ましくないかを示すレベル値と対応付けて登録した修飾語句辞書とを有するコンピュータ装置を、
    前記名詞句辞書を参照して、分析対象となる文章から名詞句を抽出する名詞句抽出手段、
    前記修飾語句辞書を参照して、前記名詞句抽出手段が抽出した名詞句を修飾する修飾語句を抽出する修飾語句抽出手段、
    前記修飾語句抽出手段が抽出した修飾語句について前記修飾語句辞書に登録されたレベル値を前記名詞句抽出手段が抽出した名詞句毎に集計して、該集計したレベル値を名詞句毎のアフェクト度として算出するアフェクト度算出手段、及び、
    前記アフェクト度算出手段が算出した名詞句毎のアフェクト度を出力するアフェクト度出力手段
    として機能させるためのプログラム。
  12. 分析対象となる文章に含まれ得る名詞句を登録した名詞句辞書と、前記名詞句辞書に登録された名詞句を修飾し得る修飾語句を登録した修飾語句辞書とを有するコンピュータ装置を、
    前記修飾語句辞書を参照して、分析対象となる文章において名詞句を修飾する修飾語句を抽出する修飾語句抽出手段、
    前記名詞句辞書を参照して、前記修飾語句抽出手段が抽出した各修飾語句によって修飾される名詞句を抽出する名詞句抽出手段、
    前記名詞句抽出手段による名詞句の抽出結果に基づいて、前記修飾語句抽出手段が抽出した修飾語句が同一の名詞句を修飾している度合いを示す集約度を修飾語句毎に算出する集約度算出手段、及び、
    前記集約度算出手段が算出した修飾語句毎の集約度を出力する集約度出力手段
    として機能させるためのプログラム。
JP2002326698A 2002-11-11 2002-11-11 データ分析装置及び方法、並びにプログラム Expired - Fee Related JP3955522B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002326698A JP3955522B2 (ja) 2002-11-11 2002-11-11 データ分析装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002326698A JP3955522B2 (ja) 2002-11-11 2002-11-11 データ分析装置及び方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2004164079A true JP2004164079A (ja) 2004-06-10
JP3955522B2 JP3955522B2 (ja) 2007-08-08

Family

ID=32805553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002326698A Expired - Fee Related JP3955522B2 (ja) 2002-11-11 2002-11-11 データ分析装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP3955522B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140337B2 (en) 2006-08-03 2012-03-20 Nec Corporation Apparatus, method and program for text mining
US8380741B2 (en) 2008-08-29 2013-02-19 Nec Corporation Text mining apparatus, text mining method, and computer-readable recording medium
WO2013136865A1 (ja) * 2012-03-12 2013-09-19 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
US8751531B2 (en) 2008-08-29 2014-06-10 Nec Corporation Text mining apparatus, text mining method, and computer-readable recording medium
CN106021234A (zh) * 2016-05-31 2016-10-12 徐子涵 标签提取方法及系统
KR101841615B1 (ko) * 2016-02-05 2018-03-26 한국과학기술원 의미 기반 명사 유사도 계산 장치 및 방법
KR101958986B1 (ko) 2012-03-15 2019-03-15 엘지디스플레이 주식회사 터치스크린 품질감 평가 장치 및 그 평가 방법
CN112749558A (zh) * 2020-09-03 2021-05-04 腾讯科技(深圳)有限公司 一种目标内容获取方法、装置、计算机设备和存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140337B2 (en) 2006-08-03 2012-03-20 Nec Corporation Apparatus, method and program for text mining
US8380741B2 (en) 2008-08-29 2013-02-19 Nec Corporation Text mining apparatus, text mining method, and computer-readable recording medium
US8751531B2 (en) 2008-08-29 2014-06-10 Nec Corporation Text mining apparatus, text mining method, and computer-readable recording medium
WO2013136865A1 (ja) * 2012-03-12 2013-09-19 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
JP2013190848A (ja) * 2012-03-12 2013-09-26 Rakuten Inc 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
US9311607B2 (en) 2012-03-12 2016-04-12 Rakuten, Inc. Information processing device, information processing method, program for information processing device, and recording medium
KR101958986B1 (ko) 2012-03-15 2019-03-15 엘지디스플레이 주식회사 터치스크린 품질감 평가 장치 및 그 평가 방법
KR101841615B1 (ko) * 2016-02-05 2018-03-26 한국과학기술원 의미 기반 명사 유사도 계산 장치 및 방법
CN106021234A (zh) * 2016-05-31 2016-10-12 徐子涵 标签提取方法及系统
CN112749558A (zh) * 2020-09-03 2021-05-04 腾讯科技(深圳)有限公司 一种目标内容获取方法、装置、计算机设备和存储介质
CN112749558B (zh) * 2020-09-03 2023-11-24 腾讯科技(深圳)有限公司 一种目标内容获取方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
JP3955522B2 (ja) 2007-08-08

Similar Documents

Publication Publication Date Title
CN110516067B (zh) 基于话题检测的舆情监控方法、系统及存储介质
US7698129B2 (en) Information processor, customer need-analyzing method and program
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
KR20060059986A (ko) 문서를 콘텐츠에 매치하기 위해 문서의 의미를 결정하는방법 및 시스템
WO2016147276A1 (ja) データ分析システム及びデータ分析方法並びにデータ分析プログラム
KR20120108095A (ko) 소셜 데이터 분석 시스템
WO2014002775A1 (ja) 同義語抽出システム、方法および記録媒体
JP4859779B2 (ja) 有害コンテンツの評価付与装置、プログラム及び方法
Carberry et al. Access to multimodal articles for individuals with sight impairments
Uhrig et al. Collocation candidate extraction from dependency-annotated corpora: exploring differences across parsers and dependency annotation schemes
JP3955522B2 (ja) データ分析装置及び方法、並びにプログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
JP2000172691A (ja) 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
Darmawiguna et al. Indonesian sentiment summarization for lecturer learning evaluation by using textrank algorithm
JP2002140465A (ja) 自然文処理装置及び自然文処理用プログラム
JP2012093870A (ja) システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム
CN113535936B (zh) 一种基于深度学习的规章制度检索方法及系统
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
Fu et al. Mining newsworthy events in the traffic accident domain from Chinese microblog
JP2006293616A (ja) 文書集約方法及び装置及びプログラム
Vermeij The orientation of user opinions through adverbs, verbs and nouns
JP2006119697A (ja) 質問応答システム、質疑応答方法および質疑応答プログラム
Tao et al. Mining Pain Points from Hotel Online Comments Based on Sentiment Analysis
JP5138622B2 (ja) 情報処理装置及び不満抽出方法及びプログラム
JP2003108583A (ja) 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070502

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees