JP2002304401A - アンケート処理装置及びアンケート処理方法並びにプログラム - Google Patents
アンケート処理装置及びアンケート処理方法並びにプログラムInfo
- Publication number
- JP2002304401A JP2002304401A JP2001107197A JP2001107197A JP2002304401A JP 2002304401 A JP2002304401 A JP 2002304401A JP 2001107197 A JP2001107197 A JP 2001107197A JP 2001107197 A JP2001107197 A JP 2001107197A JP 2002304401 A JP2002304401 A JP 2002304401A
- Authority
- JP
- Japan
- Prior art keywords
- questionnaire
- free
- classification
- sentence
- questionnaire answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims description 39
- 238000000605 extraction Methods 0.000 claims description 37
- 230000014509 gene expression Effects 0.000 claims description 28
- 230000004044 response Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 29
- 239000013598 vector Substances 0.000 abstract description 27
- 238000004458 analytical method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000000877 morphologic effect Effects 0.000 description 10
- 238000012937 correction Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
(57)【要約】
【課題】 手作業による苦情文の辞書登録を行わない方
法で、アンケートを任意のカテゴリに分類するアンケー
ト処理装置を提供すること。 【解決手段】 アンケート回答文データベース2から訓
練例に用いるセグメント化されたフリーアンケート回答
文を含む訓練回答文集合4を抽出する。各セグメントに
は、アンケート分析者が、苦情、要望、感想などの分類
カテゴリを付与する。特徴抽出部5では、訓練回答文集
合4とフレーズ抽出ルール3を入力として、特徴ベクタ
集合を作成する。分類規則獲得部6では、複数の特徴ベ
クタと分類カテゴリからなる訓練例をもとに、特徴ベク
タから分類カテゴリを求めるための分類規則を学習す
る。そして、獲得された分類規則を用いて、アンケート
回答文抽出部7により、フリーアンケート回答文を分類
する。また、アンケート分析者が指定した分類カテゴリ
に属するフリーアンケート回答文を抽出して提示する。
法で、アンケートを任意のカテゴリに分類するアンケー
ト処理装置を提供すること。 【解決手段】 アンケート回答文データベース2から訓
練例に用いるセグメント化されたフリーアンケート回答
文を含む訓練回答文集合4を抽出する。各セグメントに
は、アンケート分析者が、苦情、要望、感想などの分類
カテゴリを付与する。特徴抽出部5では、訓練回答文集
合4とフレーズ抽出ルール3を入力として、特徴ベクタ
集合を作成する。分類規則獲得部6では、複数の特徴ベ
クタと分類カテゴリからなる訓練例をもとに、特徴ベク
タから分類カテゴリを求めるための分類規則を学習す
る。そして、獲得された分類規則を用いて、アンケート
回答文抽出部7により、フリーアンケート回答文を分類
する。また、アンケート分析者が指定した分類カテゴリ
に属するフリーアンケート回答文を抽出して提示する。
Description
【0001】
【発明の属する技術分野】本発明は、利用者が指定した
任意のカテゴリにフリーアンケート回答文を分類するア
ンケート処理装置及びアンケート処理方法に関する。
任意のカテゴリにフリーアンケート回答文を分類するア
ンケート処理装置及びアンケート処理方法に関する。
【0002】
【従来の技術】アンケート文から任意のカテゴリに属す
る文を抽出する技術としては、例えば、特開2000−
181926号公報(第2頁〜第17頁参照)に記載さ
れている方法が知られている。
る文を抽出する技術としては、例えば、特開2000−
181926号公報(第2頁〜第17頁参照)に記載さ
れている方法が知られている。
【0003】この方法では、予め人の手によって苦情文
を辞書(苦情文辞書)に登録しておく。そして、電子メ
ールが入力されると、上記苦情文辞書を参照して、入力
電子メールから、苦情文を含む電子メールを抽出する。
苦情文を含む電子メールが抽出されたならば、その苦情
文をその電子メールのID(識別情報)と関連付けて記
憶する。苦情文については種別が分けられており、記憶
した苦情文を含む電子メールを表示する際に、苦情文の
部分を強調表示あるいは種別毎に区別して強調表示して
いる。これによって、入力電子メールから苦情の電子メ
ールを抽出すると共にその苦情内容を種別に分けて検索
・集計および苦情内容の指摘を行うことができる。
を辞書(苦情文辞書)に登録しておく。そして、電子メ
ールが入力されると、上記苦情文辞書を参照して、入力
電子メールから、苦情文を含む電子メールを抽出する。
苦情文を含む電子メールが抽出されたならば、その苦情
文をその電子メールのID(識別情報)と関連付けて記
憶する。苦情文については種別が分けられており、記憶
した苦情文を含む電子メールを表示する際に、苦情文の
部分を強調表示あるいは種別毎に区別して強調表示して
いる。これによって、入力電子メールから苦情の電子メ
ールを抽出すると共にその苦情内容を種別に分けて検索
・集計および苦情内容の指摘を行うことができる。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
苦情文抽出処理においては、予め利用者が手作業により
苦情文を辞書に登録しなければならないという問題点が
あった。このため、苦情文の辞書登録に多大なる労力を
要するとともに、必ずしも有効な苦情文辞書を作成する
ことができず、抽出能力や分類能力にも問題があった。
苦情文抽出処理においては、予め利用者が手作業により
苦情文を辞書に登録しなければならないという問題点が
あった。このため、苦情文の辞書登録に多大なる労力を
要するとともに、必ずしも有効な苦情文辞書を作成する
ことができず、抽出能力や分類能力にも問題があった。
【0005】本発明は、上記事情を考慮してなされたも
ので、手作業による苦情文の辞書登録を行わない方法
で、アンケートを任意のカテゴリに分類するアンケート
処理装置及びアンケート処理方法を提供することを目的
とする。
ので、手作業による苦情文の辞書登録を行わない方法
で、アンケートを任意のカテゴリに分類するアンケート
処理装置及びアンケート処理方法を提供することを目的
とする。
【0006】
【課題を解決するための手段】本発明は、フリーアンケ
ート回答文をそれに含まれる内容に応じて分類するため
のアンケート処理装置であって、分類規則生成のために
用意された複数のフリーアンケート回答文をもとにし
て、カテゴリ分類の基準となる表現の候補を複数種類抽
出するための抽出手段と、前記複数のフリーアンケート
回答文の各々について、当該フリーアンケート回答文に
前記抽出手段により抽出された個々の前記表現の候補に
相当する内容が含まれるか否かを示す特徴情報に変換す
るための変換手段と、前記複数のフリーアンケート回答
文の各々に対応する前記特徴情報及び該フリーアンケー
ト回答文の各々に対して指定された分類カテゴリをもと
にして、分類対象のフリーアンケート回答文に該当する
分類カテゴリを求めるための分類規則を生成するための
生成手段とを備えたことを特徴とする。
ート回答文をそれに含まれる内容に応じて分類するため
のアンケート処理装置であって、分類規則生成のために
用意された複数のフリーアンケート回答文をもとにし
て、カテゴリ分類の基準となる表現の候補を複数種類抽
出するための抽出手段と、前記複数のフリーアンケート
回答文の各々について、当該フリーアンケート回答文に
前記抽出手段により抽出された個々の前記表現の候補に
相当する内容が含まれるか否かを示す特徴情報に変換す
るための変換手段と、前記複数のフリーアンケート回答
文の各々に対応する前記特徴情報及び該フリーアンケー
ト回答文の各々に対して指定された分類カテゴリをもと
にして、分類対象のフリーアンケート回答文に該当する
分類カテゴリを求めるための分類規則を生成するための
生成手段とを備えたことを特徴とする。
【0007】好ましくは、前記抽出手段は、前記カテゴ
リ分類の基準となる表現の候補として、名詞句表現又は
文末語尾表現に相当するものを抽出するようにしてもよ
い。
リ分類の基準となる表現の候補として、名詞句表現又は
文末語尾表現に相当するものを抽出するようにしてもよ
い。
【0008】好ましくは、前記生成手段は、前記特徴情
報及び前記分類カテゴリ並びに前記表現の候補を入力と
した帰納学習によって前記分類規則を導くものであるよ
うにしてもよい。
報及び前記分類カテゴリ並びに前記表現の候補を入力と
した帰納学習によって前記分類規則を導くものであるよ
うにしてもよい。
【0009】好ましくは、フリーアンケート回答文を含
むアンケート回答文を複数記憶するための第1の記憶手
段と、前記分類規則に基づいて、前記記憶手段に記憶さ
れた分類対象のフリーアンケート回答文を複数の分類カ
テゴリのいずれかに分類するための分類手段と、前記分
類手段により分類されたフリーアンケート回答文と、該
フリーアンケート回答文に該当する分類カテゴリと、該
フリーアンケート回答文を含む前記アンケート回答文を
識別する識別情報とを対応付けて記憶するための第2の
記憶手段とを更に備えるようにしてもよい。
むアンケート回答文を複数記憶するための第1の記憶手
段と、前記分類規則に基づいて、前記記憶手段に記憶さ
れた分類対象のフリーアンケート回答文を複数の分類カ
テゴリのいずれかに分類するための分類手段と、前記分
類手段により分類されたフリーアンケート回答文と、該
フリーアンケート回答文に該当する分類カテゴリと、該
フリーアンケート回答文を含む前記アンケート回答文を
識別する識別情報とを対応付けて記憶するための第2の
記憶手段とを更に備えるようにしてもよい。
【0010】また、本発明は、フリーアンケート回答文
をそれに含まれる内容に応じて分類するためのアンケー
ト処理装置におけるアンケート処理方法であって、分類
規則生成のために用意された複数のフリーアンケート回
答文をもとにして、カテゴリ分類の基準となる表現の候
補を複数種類抽出し、前記複数のフリーアンケート回答
文の各々について、当該フリーアンケート回答文に前記
抽出手段により抽出された個々の前記表現の候補に相当
する内容が含まれるか否かを示す特徴情報に変換し、前
記複数のフリーアンケート回答文の各々に対応する前記
特徴情報及び該フリーアンケート回答文の各々に対して
指定された分類カテゴリをもとにして、分類対象のフリ
ーアンケート回答文に該当する分類カテゴリを求めるた
めの分類規則を生成することを特徴とする。
をそれに含まれる内容に応じて分類するためのアンケー
ト処理装置におけるアンケート処理方法であって、分類
規則生成のために用意された複数のフリーアンケート回
答文をもとにして、カテゴリ分類の基準となる表現の候
補を複数種類抽出し、前記複数のフリーアンケート回答
文の各々について、当該フリーアンケート回答文に前記
抽出手段により抽出された個々の前記表現の候補に相当
する内容が含まれるか否かを示す特徴情報に変換し、前
記複数のフリーアンケート回答文の各々に対応する前記
特徴情報及び該フリーアンケート回答文の各々に対して
指定された分類カテゴリをもとにして、分類対象のフリ
ーアンケート回答文に該当する分類カテゴリを求めるた
めの分類規則を生成することを特徴とする。
【0011】なお、装置に係る本発明は方法に係る発明
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。また、装置または方法に係る本発明
は、コンピュータに当該発明に相当する手順を実行させ
るための(あるいはコンピュータを当該発明に相当する
手段として機能させるための、あるいはコンピュータに
当該発明に相当する機能を実現させるための)プログラ
ムとしても成立し、該プログラムを記録したコンピュー
タ読取り可能な記録媒体としても成立する。
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。また、装置または方法に係る本発明
は、コンピュータに当該発明に相当する手順を実行させ
るための(あるいはコンピュータを当該発明に相当する
手段として機能させるための、あるいはコンピュータに
当該発明に相当する機能を実現させるための)プログラ
ムとしても成立し、該プログラムを記録したコンピュー
タ読取り可能な記録媒体としても成立する。
【0012】本発明によれば、フリーアンケート回答文
のサンプルから、対象となるフリーアンケート回答文を
分類することができる分類規則を学習することができる
ため、手作業による苦情文などの辞書登録を行わない方
法で、アンケートを任意のカテゴリに分類することが可
能になる。
のサンプルから、対象となるフリーアンケート回答文を
分類することができる分類規則を学習することができる
ため、手作業による苦情文などの辞書登録を行わない方
法で、アンケートを任意のカテゴリに分類することが可
能になる。
【0013】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
実施の形態を説明する。
【0014】なお、アンケートに対する回答のうち、自
由記述による回答文を、「フリーアンケート回答文」と
呼ぶものとする。
由記述による回答文を、「フリーアンケート回答文」と
呼ぶものとする。
【0015】図1に、本発明の一実施形態に係るアンケ
ート処理装置の構成例を示す。
ート処理装置の構成例を示す。
【0016】本アンケート処理装置1は、フリーアンケ
ート回答文の内容から分類カテゴリ(例えば、苦情、要
望、感想など)を求める分類規則を学習するための機能
や、アンケート分析者等のユーザ(以下、単にアンケー
ト分析者と呼ぶ)(101)が抽出しようとしている任
意の分類カテゴリに属するフリーアンケート回答文の提
示・記録などを行うための機能等を有するものである。
ート回答文の内容から分類カテゴリ(例えば、苦情、要
望、感想など)を求める分類規則を学習するための機能
や、アンケート分析者等のユーザ(以下、単にアンケー
ト分析者と呼ぶ)(101)が抽出しようとしている任
意の分類カテゴリに属するフリーアンケート回答文の提
示・記録などを行うための機能等を有するものである。
【0017】図1に示されるように、本アンケート処理
装置1は、アンケート回答文データベース2、フレーズ
抽出ルール3、訓練回答文集合4、特徴抽出部5、分類
規則獲得部6、アンケート回答文抽出部7を備えてい
る。
装置1は、アンケート回答文データベース2、フレーズ
抽出ルール3、訓練回答文集合4、特徴抽出部5、分類
規則獲得部6、アンケート回答文抽出部7を備えてい
る。
【0018】なお、ユーザインタフェース手段について
は、例えば、アンケート処理装置1にLAN等のネット
ワークを介して接続された端末100にてアンケート分
析者等が操作を行う形態(サーバ・クライアント型)で
あってもよいし、アンケート処理装置1の持つ入出力装
置(図示せず)にてアンケート分析者等が操作を行う形
態(スタンドアローン型)であってもよいし、両者が可
能であってもよい。
は、例えば、アンケート処理装置1にLAN等のネット
ワークを介して接続された端末100にてアンケート分
析者等が操作を行う形態(サーバ・クライアント型)で
あってもよいし、アンケート処理装置1の持つ入出力装
置(図示せず)にてアンケート分析者等が操作を行う形
態(スタンドアローン型)であってもよいし、両者が可
能であってもよい。
【0019】アンケート回答文データベース2には、ア
ンケート回答者(102)から寄せられたアンケート回
答文が登録される。
ンケート回答者(102)から寄せられたアンケート回
答文が登録される。
【0020】アンケート回答者からアンケート回答文を
受け取る手段は、例えば、インターネットなどのネット
ワークを介する方法であってもよいし、記録媒体を介す
る方法であってもよい。また、例えば回答者から電話で
寄せられた回答に基づいて本アンケート処理装置1上で
アンケート回答文を作成・入力する方法も可能である。
もちろん、複数の方法を併用してもよい。
受け取る手段は、例えば、インターネットなどのネット
ワークを介する方法であってもよいし、記録媒体を介す
る方法であってもよい。また、例えば回答者から電話で
寄せられた回答に基づいて本アンケート処理装置1上で
アンケート回答文を作成・入力する方法も可能である。
もちろん、複数の方法を併用してもよい。
【0021】例えば、インターネットのホームページを
利用したWEBアンケートなどの手段により図2に例示
するようなアンケートが行われ、これに対してアンケー
ト回答者(102)から寄せられた回答が、図3に例示
するように「行」をアンケート回答者とし、「列」を質
問とし、「セル」を各回答者の各質問に対する回答とし
て、アンケート回答文データベース2に登録される。
利用したWEBアンケートなどの手段により図2に例示
するようなアンケートが行われ、これに対してアンケー
ト回答者(102)から寄せられた回答が、図3に例示
するように「行」をアンケート回答者とし、「列」を質
問とし、「セル」を各回答者の各質問に対する回答とし
て、アンケート回答文データベース2に登録される。
【0022】フレーズ抽出ルール3は、フリーアンケー
トの分類に必要な情報を抽出する規則を、形態素の正規
表現により記述したものである。図4に、フレーズ抽出
ルールの一例を示す。図4では、フリーアンケート回答
文の「名詞句表現」(ID=“#R1”)と「文末表
現」(ID=“#R1”)を抽出する規則を例示してい
る。
トの分類に必要な情報を抽出する規則を、形態素の正規
表現により記述したものである。図4に、フレーズ抽出
ルールの一例を示す。図4では、フリーアンケート回答
文の「名詞句表現」(ID=“#R1”)と「文末表
現」(ID=“#R1”)を抽出する規則を例示してい
る。
【0023】訓練回答文集合4は、アンケート回答文デ
ータベース2に含まれるフリーアンケート回答文に対す
る部分集合を、以下の情報も加えて記述したものであ
る。・アンケート回答文ID・フリーアンケート回答文
・分類カテゴリただし、分類カテゴリは、アンケート分
析者(101)により付与される。
ータベース2に含まれるフリーアンケート回答文に対す
る部分集合を、以下の情報も加えて記述したものであ
る。・アンケート回答文ID・フリーアンケート回答文
・分類カテゴリただし、分類カテゴリは、アンケート分
析者(101)により付与される。
【0024】図5に、訓練回答文集合の一例を示す。な
お、図5では、アンケート回答文ID(例えば、Q3#
1)は、図3に例示したアンケート回答文データベース
2の「列」(例えば、Q3)と「セル」(例えば、#
1)に対応させている。また、#T1,#T2,#T
3,…は、各訓練回答文のIDである。
お、図5では、アンケート回答文ID(例えば、Q3#
1)は、図3に例示したアンケート回答文データベース
2の「列」(例えば、Q3)と「セル」(例えば、#
1)に対応させている。また、#T1,#T2,#T
3,…は、各訓練回答文のIDである。
【0025】以下、本実施形態のアンケート処理装置1
の動作手順について説明する。
の動作手順について説明する。
【0026】図6に、アンケート処理装置1の動作手順
の一例を示す。
の一例を示す。
【0027】本実施形態のアンケート処理装置1の処理
は、図6(a)に例示したような学習フェーズと、図6
(b)に例示したような運用フェーズとに分けられる。
は、図6(a)に例示したような学習フェーズと、図6
(b)に例示したような運用フェーズとに分けられる。
【0028】学習フェーズは、アンケート処理装置1を
はじめて利用する場合や分類規則を修正する場合に行わ
れる処理である。運用フェーズは、アンケート分析者
(101)がアンケート分析を行う場合の処理である。
はじめて利用する場合や分類規則を修正する場合に行わ
れる処理である。運用フェーズは、アンケート分析者
(101)がアンケート分析を行う場合の処理である。
【0029】(学習フェーズ)学習フェーズにおいて、
アンケート分析者(101)は、予め分類カテゴリ(例
えば、苦情、要望、感想など)を設定する(ステップS
1)。例えば、分類カテゴリ設定画面を表示して分類カ
テゴリの入力を受け付け、アンケート分析者(101)
により入力された分類カテゴリを格納する。あるいは、
例えば、分類カテゴリ設定画面にて種々の分類カテゴリ
を表示し、アンケート分析者(101)による選択入力
を受け付ける。
アンケート分析者(101)は、予め分類カテゴリ(例
えば、苦情、要望、感想など)を設定する(ステップS
1)。例えば、分類カテゴリ設定画面を表示して分類カ
テゴリの入力を受け付け、アンケート分析者(101)
により入力された分類カテゴリを格納する。あるいは、
例えば、分類カテゴリ設定画面にて種々の分類カテゴリ
を表示し、アンケート分析者(101)による選択入力
を受け付ける。
【0030】次に、アンケート回答文データベース2か
らフリーアンケート回答文のみを抽出し、さらに適度な
部分集合を抽出する(ステップS2)。適度な部分集合
としてどのくらいの量を抽出するかについては、例え
ば、抽出するサンプル数あるいはサンプル数/全回答文
の比率を、その都度、アンケート分析者(101)が指
示するか、あるいは、予め設定しておくなどする方法に
よってもよい。
らフリーアンケート回答文のみを抽出し、さらに適度な
部分集合を抽出する(ステップS2)。適度な部分集合
としてどのくらいの量を抽出するかについては、例え
ば、抽出するサンプル数あるいはサンプル数/全回答文
の比率を、その都度、アンケート分析者(101)が指
示するか、あるいは、予め設定しておくなどする方法に
よってもよい。
【0031】次に、フリーアンケート回答文の部分集合
の各フリーアンケート回答文を、『。』や『 』(後者
は空白文字)のような句点により分割し、セグメント化
を行う(ステップS3)。セグメント化に関しては他に
も逆接語、『、』読点などによる分割等、他の方法も考
えられる。
の各フリーアンケート回答文を、『。』や『 』(後者
は空白文字)のような句点により分割し、セグメント化
を行う(ステップS3)。セグメント化に関しては他に
も逆接語、『、』読点などによる分割等、他の方法も考
えられる。
【0032】そして、アンケート分析者(101)は、
セグメント化された各々のフリーアンケート回答文に対
して、上記の分類カテゴリのうちから適切なものを選択
して付加し、訓練回答文集合4を完成させる(ステップ
S4)。例えば、分類カテゴリ割り当て画面にて、セグ
メント化されたフリーアンケート回答文および分類カテ
ゴリの一覧を表示し、アンケート分析者(101)によ
り選択入力された(割り当てられた)分類カテゴリを、
当該セグメント化されたフリーアンケート回答文に付与
することを繰り返すことによって、訓練回答文集合4を
完成させる。
セグメント化された各々のフリーアンケート回答文に対
して、上記の分類カテゴリのうちから適切なものを選択
して付加し、訓練回答文集合4を完成させる(ステップ
S4)。例えば、分類カテゴリ割り当て画面にて、セグ
メント化されたフリーアンケート回答文および分類カテ
ゴリの一覧を表示し、アンケート分析者(101)によ
り選択入力された(割り当てられた)分類カテゴリを、
当該セグメント化されたフリーアンケート回答文に付与
することを繰り返すことによって、訓練回答文集合4を
完成させる。
【0033】なお、ステップS1〜S4までの処理おい
て、図3が入力データ例に相当し、図5が出力データ例
に相当する。
て、図3が入力データ例に相当し、図5が出力データ例
に相当する。
【0034】ステップS4で得られた訓練回答文集合4
は、後の再学習のために保存しておくのが好ましい。
は、後の再学習のために保存しておくのが好ましい。
【0035】続いて、特徴抽出部5では、詳しくは後述
するように、図5のような訓練回答文集合4と図4のよ
うなフレーズ抽出ルール3を入力として、分類規則獲得
部6の入力となるフリーアンケート特徴ベクタ集合(図
10参照)を作成する(ステップS5)。
するように、図5のような訓練回答文集合4と図4のよ
うなフレーズ抽出ルール3を入力として、分類規則獲得
部6の入力となるフリーアンケート特徴ベクタ集合(図
10参照)を作成する(ステップS5)。
【0036】続いて、分類規則獲得部6では、詳しくは
後述するように、フリーアンケート特徴ベクタ集合を入
力として、分類規則(図13参照)を学習し、記録する
(ステップS6)。
後述するように、フリーアンケート特徴ベクタ集合を入
力として、分類規則(図13参照)を学習し、記録する
(ステップS6)。
【0037】(運用フェーズ)運用フェーズでは、分類
規則獲得部6によって獲得された分類規則を用いてアン
ケート回答文抽出部7により、フリーアンケート回答文
を分類し、アンケート分析者(101)が必要とするカ
テゴリに属するフリーアンケート回答文を抽出すること
ができる(ステップS11)。
規則獲得部6によって獲得された分類規則を用いてアン
ケート回答文抽出部7により、フリーアンケート回答文
を分類し、アンケート分析者(101)が必要とするカ
テゴリに属するフリーアンケート回答文を抽出すること
ができる(ステップS11)。
【0038】ここで、本実施形態では、再学習を行うこ
ともできるようにしている。
ともできるようにしている。
【0039】すなわち、アンケート分析者(101)
は、ステップS11で抽出されたフリーアンケート回答
文を見て、明らかに誤分類されたフリーアンケート回答
文が存在するか確認する(ステップS12)。
は、ステップS11で抽出されたフリーアンケート回答
文を見て、明らかに誤分類されたフリーアンケート回答
文が存在するか確認する(ステップS12)。
【0040】存在しない場合は、処理を終了するが、誤
分類されたフリーアンケート回答文が存在する場合は、
セグメント単位で正しい分類カテゴリを付加する(ステ
ップS13)。
分類されたフリーアンケート回答文が存在する場合は、
セグメント単位で正しい分類カテゴリを付加する(ステ
ップS13)。
【0041】正しい分類カテゴリを付加されたセグメン
トは、アンケート処理装置1により新たに訓練回答文と
して登録される(ステップS14)。
トは、アンケート処理装置1により新たに訓練回答文と
して登録される(ステップS14)。
【0042】そして、更新された訓練回答文集合4によ
ってステップS5,S6を行って、再学習を実行する。
ってステップS5,S6を行って、再学習を実行する。
【0043】以上のように、本実施形態によれば、予め
分類規則を与えることなく任意のカテゴリに分類、抽出
することが可能なアンケート処理装置を実現することが
できる。
分類規則を与えることなく任意のカテゴリに分類、抽出
することが可能なアンケート処理装置を実現することが
できる。
【0044】さて、以下では、特徴抽出部5、分類規則
獲得部6、アンケート回答文抽出部7についてそれぞれ
さらに詳しく説明する。
獲得部6、アンケート回答文抽出部7についてそれぞれ
さらに詳しく説明する。
【0045】まず、特徴抽出部5について説明する。
【0046】図7に、特徴抽出部5の構成例を示す。図
7に示されるように、本特徴抽出部5は、形態素解析部
11、その出力である形態素つき訓練回答文集合12、
キーフレーズ抽出部13、その出力であるキーフレーズ
ベクタ14、フォーマット変換部15、その出力である
フリーアンケート回答文特徴ベクタ集合16を含む。
7に示されるように、本特徴抽出部5は、形態素解析部
11、その出力である形態素つき訓練回答文集合12、
キーフレーズ抽出部13、その出力であるキーフレーズ
ベクタ14、フォーマット変換部15、その出力である
フリーアンケート回答文特徴ベクタ集合16を含む。
【0047】形態素つき訓練回答文集合12は、図8に
例示するように訓練回答文集合4(図5参照)に形態素
のタグがついた形式で与えられる。なお、図8のタグは
一例であり、形態素のタグは形態素解析部11の実装に
応じて種々の形式のものが使用可能である。
例示するように訓練回答文集合4(図5参照)に形態素
のタグがついた形式で与えられる。なお、図8のタグは
一例であり、形態素のタグは形態素解析部11の実装に
応じて種々の形式のものが使用可能である。
【0048】キーフレーズベクタ14は、図9に例示す
るように形態素タグのついた表現(キーフレーズ)と、
各表現の形態素つき訓練回答文における出現頻度とのペ
アで記録されている。出現頻度は、当該キーフレーズを
後の処理で使用するか否か破棄するかを決定するために
用いるもので、例えば、出現頻度が所定の基準値以上の
場合に、当該キーフレーズを後の処理で使用すると決定
する。この場合、所定の基準値は、予め定めてもよい
し、得られたキーフレーズベクタ14の出現頻度の大き
さやばらつきを考慮してその都度決めてもよい(なお、
後述する例では、説明を簡単にするために、基準値=1
にしている)。また、例えば、選択するキーフレーズの
数を先に決定して、その数に達するまで出現頻度の大き
い順にキーフレーズを選択する方法もあるし、その他に
も種々の方法が考えられる。
るように形態素タグのついた表現(キーフレーズ)と、
各表現の形態素つき訓練回答文における出現頻度とのペ
アで記録されている。出現頻度は、当該キーフレーズを
後の処理で使用するか否か破棄するかを決定するために
用いるもので、例えば、出現頻度が所定の基準値以上の
場合に、当該キーフレーズを後の処理で使用すると決定
する。この場合、所定の基準値は、予め定めてもよい
し、得られたキーフレーズベクタ14の出現頻度の大き
さやばらつきを考慮してその都度決めてもよい(なお、
後述する例では、説明を簡単にするために、基準値=1
にしている)。また、例えば、選択するキーフレーズの
数を先に決定して、その数に達するまで出現頻度の大き
い順にキーフレーズを選択する方法もあるし、その他に
も種々の方法が考えられる。
【0049】フリーアンケート回答文特徴ベクタ集合1
6は、図10に例示するように、下記のフィールドを1
レコードに登録したものである。 ・アンケート回答文ID ・特徴ベクタ ・分類カテゴリ 特徴ベクタは、キーフレーズベクタ14の各フレーズが
当該回答文セグメントに出現した場合の値として1、出
現しなかった場合の値として0をとるバイナリ値の列と
して表現される。例えば、図10では、最上位ビットが
図9のID=#K1のキーフレーズの出現の有無に対応
しており、最下位ビットが図9のID=#K8のキーフ
レーズの出現の有無に対応している。
6は、図10に例示するように、下記のフィールドを1
レコードに登録したものである。 ・アンケート回答文ID ・特徴ベクタ ・分類カテゴリ 特徴ベクタは、キーフレーズベクタ14の各フレーズが
当該回答文セグメントに出現した場合の値として1、出
現しなかった場合の値として0をとるバイナリ値の列と
して表現される。例えば、図10では、最上位ビットが
図9のID=#K1のキーフレーズの出現の有無に対応
しており、最下位ビットが図9のID=#K8のキーフ
レーズの出現の有無に対応している。
【0050】図11に、図7に示した特徴抽出部5の動
作手順の一例を示す。
作手順の一例を示す。
【0051】アンケート回答文データベース2から生成
された訓練回答文集合4(図5参照)に対し、形態素解
析部11によって形態素解析を行い、形態素つき訓練回
答文集合12(図8参照)を得る(ステップS21)。
された訓練回答文集合4(図5参照)に対し、形態素解
析部11によって形態素解析を行い、形態素つき訓練回
答文集合12(図8参照)を得る(ステップS21)。
【0052】次に、キーフレーズ抽出部13では、得ら
れた形態素つき訓練回答文集合12をフレーズ抽出ルー
ル3(図4参照)に照合し、該当する表現をキーフレー
ズベクタ14(図9参照)に格納する(ステップS2
2)。
れた形態素つき訓練回答文集合12をフレーズ抽出ルー
ル3(図4参照)に照合し、該当する表現をキーフレー
ズベクタ14(図9参照)に格納する(ステップS2
2)。
【0053】そして、フォーマット変換部15では、形
態素つき訓練回答文集合12の各形態素つき訓練回答文
に対して(ステップS23,S24)、上記セグメント
化された各形態素つき訓練回答文をフリーアンケート回
答文特徴ベクタへと変換し、フリーアンケート回答文特
徴ベクタ集合16(図10参照)へと格納する(ステッ
プS25)。
態素つき訓練回答文集合12の各形態素つき訓練回答文
に対して(ステップS23,S24)、上記セグメント
化された各形態素つき訓練回答文をフリーアンケート回
答文特徴ベクタへと変換し、フリーアンケート回答文特
徴ベクタ集合16(図10参照)へと格納する(ステッ
プS25)。
【0054】上記処理手順に従えば、例えば、図5のI
D=“#T1”の訓練回答文 “製品Oはよく壊れて困る” に対しては、ステップS21により図8の “/製品<名>/O<英>+は<付>/よ<形>+く<活尾>/壊れ<下
一>+て<付>/困<五ら>+る<活尾>/。<句読>” が得られ、ステップS22により図4のフレーズ抽出ル
ール#R1および#R2から、それぞれ図9のID=
“#K1”のキーフレーズ “/製品<名>/O<英>” およびID=“#K2”のキーフレーズ “/困<五ら>+る<活尾>” を得る。同様の処理を他の訓練回答文に関しても行った
結果が図9のキーフレーズベクタである。
D=“#T1”の訓練回答文 “製品Oはよく壊れて困る” に対しては、ステップS21により図8の “/製品<名>/O<英>+は<付>/よ<形>+く<活尾>/壊れ<下
一>+て<付>/困<五ら>+る<活尾>/。<句読>” が得られ、ステップS22により図4のフレーズ抽出ル
ール#R1および#R2から、それぞれ図9のID=
“#K1”のキーフレーズ “/製品<名>/O<英>” およびID=“#K2”のキーフレーズ “/困<五ら>+る<活尾>” を得る。同様の処理を他の訓練回答文に関しても行った
結果が図9のキーフレーズベクタである。
【0055】フリーアンケート回答文特徴ベクタの特徴
ベクタフィールドは、キーフレーズベクタの先頭から順
にそのフレーズが出現した場合を1、しなかった場合を
0とした値をベクトル表現として与えたものであるか
ら、上記例の “/製品<名>/O<英>+は<付>/よ<形>+く<活尾>/壊れ<下
一>+て<付>/困<五ら>+る<活尾>/。<句読>” は、ステップS25により図10のID=“#F1”の
特徴ベクタのように “11000000” と変換される。
ベクタフィールドは、キーフレーズベクタの先頭から順
にそのフレーズが出現した場合を1、しなかった場合を
0とした値をベクトル表現として与えたものであるか
ら、上記例の “/製品<名>/O<英>+は<付>/よ<形>+く<活尾>/壊れ<下
一>+て<付>/困<五ら>+る<活尾>/。<句読>” は、ステップS25により図10のID=“#F1”の
特徴ベクタのように “11000000” と変換される。
【0056】次に、分類規則獲得部6について説明す
る。
る。
【0057】図12に、分類規則獲得部6の構成例を示
す。図9のようなキーフレーズベクタ(特徴集合)14
と図10のようなフリーアンケート回答文特徴ベクタ集
合(訓練事例)16とを入力として、帰納学習部21に
より、フリーアンケート回答文を適切なカテゴリに分類
するための分類規則データベース22を得る。
す。図9のようなキーフレーズベクタ(特徴集合)14
と図10のようなフリーアンケート回答文特徴ベクタ集
合(訓練事例)16とを入力として、帰納学習部21に
より、フリーアンケート回答文を適切なカテゴリに分類
するための分類規則データベース22を得る。
【0058】なお、帰納学習部21における帰納学習と
しては、例えば、特開平5−257694号公報に開示
されたファジィ知識獲得装置の手法を用いることができ
る。もちろん、これに限定されるものではなく、種々の
学習手法が利用可能である。
しては、例えば、特開平5−257694号公報に開示
されたファジィ知識獲得装置の手法を用いることができ
る。もちろん、これに限定されるものではなく、種々の
学習手法が利用可能である。
【0059】例えば、図9の例および図10の例を入力
して、帰納学習部21により、図13のような決定木に
よる分類規則を得ることができる。図13の分類規則の
解釈は、以下のようである。 “/困<五ら>+る<活尾>”が回答文に出現したら“苦
情”に分類される。 “/壊れ<下一>+て<付>/困<五ら>+る<活尾>”が出現し
ないで、かつ、“/よ<形>+い<活尾>”が出現した場合、
“感想+”に分類される。 “/壊れ<下一>+て<付>/困<五ら>+る<活尾>”が出現し
ないで、かつ、“/よ<形>+い<活尾>”が出現しない場
合、“感想−”に分類される。
して、帰納学習部21により、図13のような決定木に
よる分類規則を得ることができる。図13の分類規則の
解釈は、以下のようである。 “/困<五ら>+る<活尾>”が回答文に出現したら“苦
情”に分類される。 “/壊れ<下一>+て<付>/困<五ら>+る<活尾>”が出現し
ないで、かつ、“/よ<形>+い<活尾>”が出現した場合、
“感想+”に分類される。 “/壊れ<下一>+て<付>/困<五ら>+る<活尾>”が出現し
ないで、かつ、“/よ<形>+い<活尾>”が出現しない場
合、“感想−”に分類される。
【0060】以上により、特定のカテゴリを抽出する分
類規則をアンケート分析者が予め記述しなくとも、アン
ケートの分類するための分類規則を獲得することができ
る。
類規則をアンケート分析者が予め記述しなくとも、アン
ケートの分類するための分類規則を獲得することができ
る。
【0061】次に、アンケート回答文抽出部7について
説明する。
説明する。
【0062】図14に、アンケート分析者(101)が
指定した分類カテゴリに属するフリーアンケート回答文
を抽出するアンケート回答文抽出部7の構成例を示す。
指定した分類カテゴリに属するフリーアンケート回答文
を抽出するアンケート回答文抽出部7の構成例を示す。
【0063】アンケート分析者(101)は、例えば後
で説明する図16のような分析インタフェース32を通
して、アンケート回答文データベース2のフリーアンケ
ート回答文を分類することが可能である。推論エンジン
31は、その分類処理を行うものである。
で説明する図16のような分析インタフェース32を通
して、アンケート回答文データベース2のフリーアンケ
ート回答文を分類することが可能である。推論エンジン
31は、その分類処理を行うものである。
【0064】図15に、図14に示したアンケート回答
文抽出部7の動作手順の一例を示す。
文抽出部7の動作手順の一例を示す。
【0065】ステップS31では、フリーアンケート回
答文をアンケート回答文データベース2から抽出する。
答文をアンケート回答文データベース2から抽出する。
【0066】なお、ここでは、すべてのフリーアンケー
ト回答文を抽出する方法と、指定された条件を満たすフ
リーアンケート回答文を抽出する方法と、それらを選択
可能とする方法とがある。条件の指定方法としては、例
えば、フリーアンケート回答文に分類カテゴリ以外の属
性情報を付与し、アンケート分析者(101)が所望の
属性情報を指定する方法がある。
ト回答文を抽出する方法と、指定された条件を満たすフ
リーアンケート回答文を抽出する方法と、それらを選択
可能とする方法とがある。条件の指定方法としては、例
えば、フリーアンケート回答文に分類カテゴリ以外の属
性情報を付与し、アンケート分析者(101)が所望の
属性情報を指定する方法がある。
【0067】次に、抽出されたフリーアンケート回答文
の集合に対して形態素解析を行う(ステップS32)。
ここで用いる形態素解析は、図7の形態素解析部11で
利用したものと同じものとするのが好ましい。
の集合に対して形態素解析を行う(ステップS32)。
ここで用いる形態素解析は、図7の形態素解析部11で
利用したものと同じものとするのが好ましい。
【0068】次に、各々の形態素つきフリーアンケート
回答文に対して(ステップS33,S34)、以下の処
理を行う。
回答文に対して(ステップS33,S34)、以下の処
理を行う。
【0069】すなわち、まず、当該形態素つきフリーア
ンケート回答文をセグメント化する(ステップSS3
5)。
ンケート回答文をセグメント化する(ステップSS3
5)。
【0070】次に、当該セグメント化された形態素つき
フリーアンケート回答文を、分類規則データベース22
の条件部に照合し(ステップS36)、分類規則に照合
したならば(ステップS37)、当該セグメント化され
た形態素つきフリーアンケート回答文と、照合した分類
規則の結論部(分類カテゴリ)と、該当するアンケート
IDとを対応づけて、データベース33に記録する(ス
テップS36〜S38)。
フリーアンケート回答文を、分類規則データベース22
の条件部に照合し(ステップS36)、分類規則に照合
したならば(ステップS37)、当該セグメント化され
た形態素つきフリーアンケート回答文と、照合した分類
規則の結論部(分類カテゴリ)と、該当するアンケート
IDとを対応づけて、データベース33に記録する(ス
テップS36〜S38)。
【0071】上記処理終了後、アンケート分析者(10
1)が、分析インタフェース32を介して、分析を行う
質問の番号や、予め設定した分類カテゴリから分類カテ
ゴリを選択することで、カテゴリに属するアンケート回
答文を抽出して分類の判断に至ったセグメントを強調表
示して提示したり、誤った結果を修正したり、別記憶領
域に保存することが可能となる(ステップS39)。
1)が、分析インタフェース32を介して、分析を行う
質問の番号や、予め設定した分類カテゴリから分類カテ
ゴリを選択することで、カテゴリに属するアンケート回
答文を抽出して分類の判断に至ったセグメントを強調表
示して提示したり、誤った結果を修正したり、別記憶領
域に保存することが可能となる(ステップS39)。
【0072】図16に、アンケート回答文抽出部7の分
析インタフェース32のGUI(グラフィカルユーザイ
ンタフェース)画面321のイメージ例を示す。
析インタフェース32のGUI(グラフィカルユーザイ
ンタフェース)画面321のイメージ例を示す。
【0073】本例の分析インタフェース32は、質問文
選択ボックス201、分類カテゴリ選択ボックス20
2、検索ボタン203、抽出回答文表示ウインドウ20
4、修正ボタン205、保存ボタン206などのGUI
環境をユーザに提供する。
選択ボックス201、分類カテゴリ選択ボックス20
2、検索ボタン203、抽出回答文表示ウインドウ20
4、修正ボタン205、保存ボタン206などのGUI
環境をユーザに提供する。
【0074】この場合の実行手順は、以下に示す通りで
ある。
ある。
【0075】分析インタフェース32は、質問文選択ボ
ックス201および分類カテゴリ選択ボックス202か
ら分析を行いたいフリーアンケート質問および分類カテ
ゴリを選択する。そして、検索ボタン203を選択する
ことで、抽出回答文表示ウインドウ204に上記設定さ
れた条件に照合するフリーアンケート回答文の判断に至
ったセグメントを強調表示して出力する。また、結果が
明らかに間違っている場合は、修正ボタン205を選択
し修正処理を行う。また、保存ボタン205を選択する
ことでファイルに保存される。
ックス201および分類カテゴリ選択ボックス202か
ら分析を行いたいフリーアンケート質問および分類カテ
ゴリを選択する。そして、検索ボタン203を選択する
ことで、抽出回答文表示ウインドウ204に上記設定さ
れた条件に照合するフリーアンケート回答文の判断に至
ったセグメントを強調表示して出力する。また、結果が
明らかに間違っている場合は、修正ボタン205を選択
し修正処理を行う。また、保存ボタン205を選択する
ことでファイルに保存される。
【0076】もちろん、上記の例の他にも、種々のイン
タフェースが実現可能である。
タフェースが実現可能である。
【0077】なお、以上の各機能は、ソフトウェアとし
て実現可能である。また、本実施形態は、コンピュータ
に所定の手段を実行させるための(あるいはコンピュー
タを所定の手段として機能させるための、あるいはコン
ピュータに所定の機能を実現させるための)プログラム
として実施することもでき、該プログラムを記録したコ
ンピュータ読取り可能な記録媒体として実施することも
できる。
て実現可能である。また、本実施形態は、コンピュータ
に所定の手段を実行させるための(あるいはコンピュー
タを所定の手段として機能させるための、あるいはコン
ピュータに所定の機能を実現させるための)プログラム
として実施することもでき、該プログラムを記録したコ
ンピュータ読取り可能な記録媒体として実施することも
できる。
【0078】なお、この発明の実施の形態で例示した構
成は一例であって、それ以外の構成を排除する趣旨のも
のではなく、例示した構成の一部を他のもので置き換え
たり、例示した構成の一部を省いたり、例示した構成に
別の機能あるいは要素を付加したり、それらを組み合わ
せたりすることなどによって得られる別の構成も可能で
ある。また、例示した構成と論理的に等価な別の構成、
例示した構成と論理的に等価な部分を含む別の構成、例
示した構成の要部と論理的に等価な別の構成なども可能
である。また、例示した構成と同一もしくは類似の目的
を達成する別の構成、例示した構成と同一もしくは類似
の効果を奏する別の構成なども可能である。また、この
発明の実施の形態で例示した各種構成部分についての各
種バリエーションは、適宜組み合わせて実施することが
可能である。また、この発明の実施の形態は、個別装置
としての発明、関連を持つ2以上の装置についての発
明、システム全体としての発明、個別装置内部の構成部
分についての発明、またはそれらに対応する方法の発明
等、種々の観点、段階、概念またはカテゴリに係る発明
を包含・内在するものである。従って、この発明の実施
の形態に開示した内容からは、例示した構成に限定され
ることなく発明を抽出することができるものである。
成は一例であって、それ以外の構成を排除する趣旨のも
のではなく、例示した構成の一部を他のもので置き換え
たり、例示した構成の一部を省いたり、例示した構成に
別の機能あるいは要素を付加したり、それらを組み合わ
せたりすることなどによって得られる別の構成も可能で
ある。また、例示した構成と論理的に等価な別の構成、
例示した構成と論理的に等価な部分を含む別の構成、例
示した構成の要部と論理的に等価な別の構成なども可能
である。また、例示した構成と同一もしくは類似の目的
を達成する別の構成、例示した構成と同一もしくは類似
の効果を奏する別の構成なども可能である。また、この
発明の実施の形態で例示した各種構成部分についての各
種バリエーションは、適宜組み合わせて実施することが
可能である。また、この発明の実施の形態は、個別装置
としての発明、関連を持つ2以上の装置についての発
明、システム全体としての発明、個別装置内部の構成部
分についての発明、またはそれらに対応する方法の発明
等、種々の観点、段階、概念またはカテゴリに係る発明
を包含・内在するものである。従って、この発明の実施
の形態に開示した内容からは、例示した構成に限定され
ることなく発明を抽出することができるものである。
【0079】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0080】
【発明の効果】本発明によれば、手作業による苦情文の
辞書登録を行わない方法で、アンケートを任意のカテゴ
リに分類することができる。
辞書登録を行わない方法で、アンケートを任意のカテゴ
リに分類することができる。
【図1】本発明の一実施形態に係るアンケート処理装置
の構成例を示す図
の構成例を示す図
【図2】アンケート質問の一例を示す図
【図3】アンケート回答文データベースの一例を示す図
【図4】フレーズ抽出ルールの一例を示す図
【図5】訓練回答文集合の一例を示す図
【図6】同実施形態に係るアンケート処理装置の動作手
順の一例を示すフローチャート
順の一例を示すフローチャート
【図7】同実施形態に係るアンケート処理装置の特徴抽
出部の構成例を示す図
出部の構成例を示す図
【図8】形態素つき訓練回答文集合の一例を示す図
【図9】キーフレーズベクタの一例を示す図
【図10】フリーアンケート回答文特徴ベクタ集合の一
例を示す図
例を示す図
【図11】同実施形態に係るアンケート処理装置の特徴
抽出部の動作手順の一例を示すフローチャート
抽出部の動作手順の一例を示すフローチャート
【図12】同実施形態に係るアンケート処理装置の分類
規則獲得部の構成例を示す図
規則獲得部の構成例を示す図
【図13】分類規則の一例を示す図
【図14】同実施形態に係るアンケート処理装置のアン
ケート回答文抽出部の構成例を示す図
ケート回答文抽出部の構成例を示す図
【図15】同実施形態に係るアンケート処理装置のアン
ケート回答文抽出部の動作手順の一例を示すフローチャ
ート
ケート回答文抽出部の動作手順の一例を示すフローチャ
ート
【図16】同実施形態に係るアンケート処理装置のアン
ケート回答文抽出部のアンケート分析インタフェースの
イメージ例を示す図
ケート回答文抽出部のアンケート分析インタフェースの
イメージ例を示す図
1…アンケート処理装置 2…アンケート回答文データベース 3…フレーズ抽出ルール 4…訓練回答文集合 5…特徴抽出部 6…分類規則獲得部 7…アンケート回答文抽出部 11…形態素解析部 12…形態素つきフリーアンケート回答文集合 13…キーフレーズ抽出部 14…キーフレーズベクタ 15…フォーマット変換部 16…フリーアンケート回答文特徴ベクタ集合 21…帰納学習部 22…分類規則データベース 31…推論エンジン 32…分析インタフェース 33…データベース 100…端末 201…質問文選択ボックス 202…分類カテゴリ選択ボックス 203…検索ボタン 204…抽出回答文表示ウインドウ 205…修正ボタン 206…保存ボタン 321…GUI画面
───────────────────────────────────────────────────── フロントページの続き (72)発明者 市村 由美 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 折原 良平 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B075 ND03 ND20 NK06 NK31 NR12 PQ46
Claims (9)
- 【請求項1】フリーアンケート回答文をそれに含まれる
内容に応じて分類するためのアンケート処理装置であっ
て、 分類規則生成のために用意された複数のフリーアンケー
ト回答文をもとにして、カテゴリ分類の基準となる表現
の候補を複数種類抽出するための抽出手段と、 前記複数のフリーアンケート回答文の各々について、当
該フリーアンケート回答文に前記抽出手段により抽出さ
れた個々の前記表現の候補に相当する内容が含まれるか
否かを示す特徴情報に変換するための変換手段と、 前記複数のフリーアンケート回答文の各々に対応する前
記特徴情報及び該フリーアンケート回答文の各々に対し
て指定された分類カテゴリをもとにして、分類対象のフ
リーアンケート回答文に該当する分類カテゴリを求める
ための分類規則を生成するための生成手段とを備えたこ
とを特徴とするアンケート処理装置。 - 【請求項2】前記抽出手段は、前記カテゴリ分類の基準
となる表現の候補として、名詞句表現又は文末語尾表現
に相当するものを抽出することを特徴とする請求項1に
記載のアンケート処理装置。 - 【請求項3】前記特徴情報は、前記表現の候補の種類数
と同数のビット列であり、 前記ビット列の個々のビットは、当該ビットに対応する
前記表現の候補に相当する内容が、対応する前記フリー
アンケート回答文に含まれるか否かを示すものであるこ
とを特徴とする請求項1に記載のアンケート処理装置。 - 【請求項4】前記生成手段は、前記特徴情報及び前記分
類カテゴリ並びに前記表現の候補を入力とした帰納学習
によって前記分類規則を導くものであることを特徴とす
る請求項1に記載のアンケート処理装置。 - 【請求項5】前記分類規則は、前記表現に基づく決定木
により前記分類カテゴリを与えるものであることを特徴
とする請求項1に記載のアンケート処理装置。 - 【請求項6】フリーアンケート回答文を含むアンケート
回答文を複数記憶するための第1の記憶手段と、 前記分類規則に基づいて、前記記憶手段に記憶された分
類対象のフリーアンケート回答文を複数の分類カテゴリ
のいずれかに分類するための分類手段と、 前記分類手段により分類されたフリーアンケート回答文
と、該フリーアンケート回答文に該当する分類カテゴリ
と、該フリーアンケート回答文を含む前記アンケート回
答文を識別する識別情報とを対応付けて記憶するための
第2の記憶手段とを更に備えたことを特徴とする請求項
1に記載のアンケート処理装置。 - 【請求項7】所望の分類カテゴリが指定された抽出要求
を受け付けるための手段と、 この手段により前記抽出要求が受け付けられた場合に、
前記第2の記憶手段を参照して、指定された前記分類カ
テゴリに該当するフリーアンケート回答文を抽出する手
段と、 この手段により抽出された前記フリーアンケート回答文
に関する所定の表示を行うための手段とを更に備えたこ
とを特徴とする請求項6に記載のアンケート処理装置。 - 【請求項8】フリーアンケート回答文をそれに含まれる
内容に応じて分類するためのアンケート処理装置におけ
るアンケート処理方法であって、 分類規則生成のために用意された複数のフリーアンケー
ト回答文をもとにして、カテゴリ分類の基準となる表現
の候補を複数種類抽出し、 前記複数のフリーアンケート回答文の各々について、当
該フリーアンケート回答文に前記抽出手段により抽出さ
れた個々の前記表現の候補に相当する内容が含まれるか
否かを示す特徴情報に変換し、 前記複数のフリーアンケート回答文の各々に対応する前
記特徴情報及び該フリーアンケート回答文の各々に対し
て指定された分類カテゴリをもとにして、分類対象のフ
リーアンケート回答文に該当する分類カテゴリを求める
ための分類規則を生成することを特徴とするアンケート
処理方法。 - 【請求項9】フリーアンケート回答文をそれに含まれる
内容に応じて分類するためのアンケート処理装置として
コンピュータを機能させるためのプログラムであって、 分類規則生成のために用意された複数のフリーアンケー
ト回答文をもとにして、カテゴリ分類の基準となる表現
の候補を複数種類抽出するための抽出機能と、 前記複数のフリーアンケート回答文の各々について、当
該フリーアンケート回答文に前記抽出機能により抽出さ
れた個々の前記表現の候補に相当する内容が含まれるか
否かを示す特徴情報に変換するための変換機能と、 前記複数のフリーアンケート回答文の各々に対応する前
記特徴情報及び該フリーアンケート回答文の各々に対し
て指定された分類カテゴリをもとにして、分類対象のフ
リーアンケート回答文に該当する分類カテゴリを求める
ための分類規則を生成するための生成機能とをコンピュ
ータに実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001107197A JP2002304401A (ja) | 2001-04-05 | 2001-04-05 | アンケート処理装置及びアンケート処理方法並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001107197A JP2002304401A (ja) | 2001-04-05 | 2001-04-05 | アンケート処理装置及びアンケート処理方法並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002304401A true JP2002304401A (ja) | 2002-10-18 |
Family
ID=18959555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001107197A Pending JP2002304401A (ja) | 2001-04-05 | 2001-04-05 | アンケート処理装置及びアンケート処理方法並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002304401A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005174330A (ja) * | 2003-12-05 | 2005-06-30 | Internatl Business Mach Corp <Ibm> | テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム |
WO2007077991A1 (ja) * | 2006-01-06 | 2007-07-12 | Sony Corporation | 情報処理装置および方法、並びにプログラム |
JP2009070256A (ja) * | 2007-09-14 | 2009-04-02 | Toshiba Corp | 情報共有システム及び情報共有プログラム |
WO2011143523A3 (en) * | 2010-05-13 | 2012-04-19 | Alexander Poltorak | Electronic personal interactive device |
JP2012141910A (ja) * | 2011-01-06 | 2012-07-26 | Hitachi Ltd | 情報取得装置 |
JP2013105226A (ja) * | 2011-11-11 | 2013-05-30 | Fujitsu Ltd | 受信メール分類装置、受信メール分類プログラム及び受信メール分類方法 |
JP2016110188A (ja) * | 2014-12-02 | 2016-06-20 | トヨタ自動車株式会社 | 潜在的ニーズ導出装置 |
CN107741933A (zh) * | 2016-08-08 | 2018-02-27 | 北京京东尚科信息技术有限公司 | 用于检测文本的方法和装置 |
-
2001
- 2001-04-05 JP JP2001107197A patent/JP2002304401A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7865354B2 (en) | 2003-12-05 | 2011-01-04 | International Business Machines Corporation | Extracting and grouping opinions from text documents |
JP2005174330A (ja) * | 2003-12-05 | 2005-06-30 | Internatl Business Mach Corp <Ibm> | テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム |
US8204837B2 (en) | 2006-01-06 | 2012-06-19 | Sony Corporation | Information processing apparatus and method, and program for providing information suitable for a predetermined mood of a user |
WO2007077991A1 (ja) * | 2006-01-06 | 2007-07-12 | Sony Corporation | 情報処理装置および方法、並びにプログラム |
JP2009070256A (ja) * | 2007-09-14 | 2009-04-02 | Toshiba Corp | 情報共有システム及び情報共有プログラム |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
WO2011143523A3 (en) * | 2010-05-13 | 2012-04-19 | Alexander Poltorak | Electronic personal interactive device |
US11341962B2 (en) | 2010-05-13 | 2022-05-24 | Poltorak Technologies Llc | Electronic personal interactive device |
US11367435B2 (en) | 2010-05-13 | 2022-06-21 | Poltorak Technologies Llc | Electronic personal interactive device |
JP2012141910A (ja) * | 2011-01-06 | 2012-07-26 | Hitachi Ltd | 情報取得装置 |
JP2013105226A (ja) * | 2011-11-11 | 2013-05-30 | Fujitsu Ltd | 受信メール分類装置、受信メール分類プログラム及び受信メール分類方法 |
JP2016110188A (ja) * | 2014-12-02 | 2016-06-20 | トヨタ自動車株式会社 | 潜在的ニーズ導出装置 |
CN107741933A (zh) * | 2016-08-08 | 2018-02-27 | 北京京东尚科信息技术有限公司 | 用于检测文本的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9489446B2 (en) | Computer-implemented system and method for generating a training set for use during document review | |
EP1522933B1 (en) | Computer aided query to task mapping | |
JP4093012B2 (ja) | ハイパーテキスト検査装置および方法並びにプログラム | |
JP4929704B2 (ja) | コンピュータ処理方法及びコンピュータ処理装置 | |
US7467079B2 (en) | Cross lingual text classification apparatus and method | |
CN106649778B (zh) | 基于深度问答的交互方法和装置 | |
US20090144051A1 (en) | Method of providing personal dictionary | |
US20060155688A1 (en) | Database search system | |
US7240045B1 (en) | Automatic system for configuring to dynamic database search forms | |
JP7434867B2 (ja) | ウェブページから情報を抽出する方法、装置及び記憶媒体 | |
US11386263B2 (en) | Automatic generation of form application | |
US20220004715A1 (en) | Evaluating chatbots for knowledge gaps | |
JPH11224256A (ja) | 情報検索方法および情報検索プログラムを記録した記録媒体 | |
CN112101567A (zh) | 基于人工智能的自动化建模方法及装置 | |
JP2002304401A (ja) | アンケート処理装置及びアンケート処理方法並びにプログラム | |
CN114090777A (zh) | 文本数据处理方法及装置 | |
JP7159576B2 (ja) | 情報提示装置、情報提示システム、情報提示方法及びプログラム | |
JP2009003814A (ja) | 質問応答方法及びシステム | |
JP2005190284A (ja) | 情報分類装置および情報分類方法 | |
WO2020175662A1 (ja) | 辞書作成装置、辞書作成方法及び辞書作成プログラム | |
CN111460119A (zh) | 经济知识智能问答方法、系统及智能设备 | |
CN109213830B (zh) | 专业性技术文档的文档检索系统 | |
JP5877775B2 (ja) | コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体 | |
JP4057962B2 (ja) | 質問応答装置、質問応答方法及びプログラム | |
TW200409046A (en) | Optical character recognition device, document searching system, and document searching program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060130 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060328 |