JP2001266060A - アンケート回答分析システム - Google Patents
アンケート回答分析システムInfo
- Publication number
- JP2001266060A JP2001266060A JP2000071657A JP2000071657A JP2001266060A JP 2001266060 A JP2001266060 A JP 2001266060A JP 2000071657 A JP2000071657 A JP 2000071657A JP 2000071657 A JP2000071657 A JP 2000071657A JP 2001266060 A JP2001266060 A JP 2001266060A
- Authority
- JP
- Japan
- Prior art keywords
- questionnaire
- text
- database
- answer
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
自由回答記述を含むアンケート回答文から、テキスト分
類エンジンを用いることにより、アンケート回答分析を
自動的に行い、分析結果をルール形式の知識として要求
者に出力する。 【解決手段】アンケート回答者は回答者コンピュータ1
11〜11Nからアンケート回答文を送信する。アンケ
ート回答文は、ネットワーク12を通じてデータベース
13に蓄積される。テキスト分類エンジン14は、デー
タベース13から蓄積されたアンケート回答文を読み出
して、アンケート回答文を分類するルールを学習して、
要求者に出力する。
Description
システムに関し、特にテキスト自動分類技術,自然言語
処理技術,およびネットワーク利用技術を使用するアン
ケート回答分析システムに関する。
て得られる、自然言語による自由回答記述を含むアンケ
ート回答文から全体的な特徴や傾向を導き出す作業は、
従来の多くは人手で行われてきた。 株式会社電通が開
発したDE―FACTO(パンフレット)や富士通株式会
社のKeyword Associator(渡部勇:発
散的思考支援システム「Keyword Associ
ator」第二版,計測自動制御学会第15回システム
工学部会研究会資料,1994年7月),HIPS等の
テキストマイニングツール(渡辺,三末,新田,杉山:
ハイブリッド発想支援システム「HIPS」, 計測自動
制御学会第15回システム工学部会研究会資料,199
5年1月)は、テキスト情報から言葉の関係性を導き出
すのに用いられた。しかし、これらのツールは、ルール
という形式でアンケート回答文の特徴を表現するもので
はなかった。
アンケート回答文をインターネット等のネットワークを
通じて自動的に収集して分析し、場合によっては要求者
に分析結果を配信するようなシステムやサービスはこれ
まで存在しなかった。たとえば、特開平11−0660
36号公報,特開平11−143856号公報等には、
ネットワークを通してアンケートを実施し、回答をデー
タベースに蓄積する技術が開示されているが、ルールと
いう形式でアンケート回答文の特徴を抽出することまで
は行われていない。
よるアンケート回答分析では、アンケート回答文の数が
大量になると、非効率で手に負えないという問題点があ
った。
キストマイニングツールでは、ルールという形式でアン
ケート回答文の特徴を抽出できないので、コンパクトで
分かりやすい知識の提示という点で十分ではないという
問題点があった。
分類ツールは、アンケート回答分析にも有力なツールで
あるが、自然言語による自由回答記述を含むアンケート
回答文の分析に用いられている前例はなかった。
ジンを用いることによって、自然言語による自由回答記
述を含むアンケート回答文からコンパクトで分かりやす
いルール形式の知識を自動的に提示することを可能にす
るアンケート回答分析システムを提供することにある。
て、ネットワークを通じて集めたアンケート回答文から
ルール形式の知識を自動的に抽出し、要求者に分析結果
を配信するアンケート回答分析システムを提供すること
にある。
分析システムは、自然言語による自由回答記述を含むア
ンケート回答文を入力する手段と、前記アンケート回答
文を送信するネットワークと、前記送信されたアンケー
ト回答文を蓄積するデータベースと、該データベースか
ら前記アンケート回答文を読み出して、前記アンケート
回答文を分類するルールを学習するテキスト分類エンジ
ンとを備えることを特徴とする。
ムは、自然言語による自由回答記述を含むアンケート回
答文を入力する手段と、前記アンケート回答文を蓄積す
るデータベースと、該データベースから前記アンケート
回答文を読み出して、前記アンケート回答文を分類する
ルールを学習するテキスト分類エンジンとを備えること
を特徴とする。
テムは、自然言語による自由回答記述を含むアンケート
回答文を入力する手段と、 前記アンケート回答文を送
信するネットワークと、前記送信されたアンケート回答
文を蓄積するデータベースと、該データベースから前記
アンケート回答文を読み出して、前記アンケート回答文
を分類するルールを学習するテキスト分類エンジンと、
該ルールを要求者からの要求に応じて前記ネットワーク
を通じて配信する手段とを備えることを特徴とする。
て図面を参照して詳細に説明する。
答分析システムの全体構成を示すブロック図である。本
実施の形態に係るアンケート回答分析システムは、回答
者コンピュータ111〜11N(Nは正整数)と、ネッ
トワーク12と、データベース13と、テキスト分類エ
ンジン14とから、その主要部が構成されている。
ンピュータ,携帯情報端末,携帯電話機等の各種のメッ
セージ,メール等の送信機能を持つ機器が該当し、ネッ
トワーク12に接続されている。
ない各種の公衆回線網,専用線網や、LAN(Loca
l Area Network)等の各種のネットワー
クが含まれる。
接続されており、回答者コンピュータ111〜11Nか
らネットワーク12を通じて送信された、複数のアンケ
ート回答者からのアンケート回答文を蓄積する。
ス13から複数のアンケート回答文を読み出して、アン
ケート回答文を分類するルールを導き出し、ルールを要
求者に出力する。テキスト分類エンジン14は、データ
ベース13に蓄積されたアンケート回答文の全文に対し
て形態素解析を行う形態素解析手段15と、テキスト分
類エンジン14に対してカテゴリとテキストとを指定さ
せるカテゴリ・テキスト指定手段16と、データベース
13から読み込んだ複数のアンケート回答文に対して属
性選択を行う属性選択手段17と、属性選択手段17に
より属性選択された単語を基にテキストとカテゴリとの
対応を表すルールを学習するルール学習手段18と、ル
ールを出力するルール出力手段19とを含んで構成され
ている。
ゴリとテキストとの間の対応関係を分類則として学習す
るエンジンであり、たとえば、Li and Yaman
ishiにより提案されているエンジン(h.Li a
nd k.Yamanishi:Text Classi
fication Using ESC―based S
tochastic Decision Lists,P
roccedingsof 1999 Internat
ional Conference on Inform
ation & Knowledge Manageme
nt, pp:122―130, 1999)を用いるこ
とができる。このテキスト分類エンジン14は、基本的
に特許第2581196号に開示された「決定リストの
生成方法及び装置」の方式を利用したものである。
ンケート回答文の集合の構造を示す。各列はアンケート
項目を表し、各行は1人分のアンケート回答文を表す。
14の処理は、形態素解析ステップ31と、テキストと
カテゴリとの指定ステップ32と、属性選択ステップ3
3と、ルール学習ステップ34と、ルール出力ステップ
35とからなる。
のより詳しい処理は、ΔSC(ω)計算ステップ41
と、属性選択ステップ42とからなる。
4のより詳しい処理は、データ成形ステップ51と、成
長処理ステップ52と、刈り込み処理ステップ53とか
らなる。
分析結果であるルール形式の知識(確率的決定リスト)
の一例を示す図である。
分析結果であるルール形式の知識(確率的決定リスト)
の他の例を示す図である。
形態に係るアンケート回答分析システムの動作について
説明する。
111〜11Nからアンケート回答文を送信すると、ア
ンケート回答文はネットワーク12を通じてデータベー
ス13に蓄積される。ここで、アンケート回答者の数
は、N人とする。この際、アンケート回答文は、自然言
語による自由回答記述を含むものであってよい。
素解析手段15により、データベース13に蓄積された
アンケート回答文の全文に対して形態素解析を行う(ス
テップ31)。
ゴリ・テキスト指定手段16により、オペレータにアン
ケート回答文中のカテゴリとテキストとを指定させる
(ステップ32)。ここで、カテゴリの指定とは、1つ
の列の回答に注目して分類するものである。例えば、図
2の1列目に注目して、その回答を「A社」と「A社以
外」とに分類することが、カテゴリ指定である。また、
テキスト指定とは、カテゴリ指定に用いられた列を除い
て、分析に用いる列を指定することである。 例えば、
図2の2列目を選択してテキスト指定を行う。
性選択手段17により、データベース13から読み込ん
だ複数のアンケート回答文に対して属性選択を行う(ス
テップ33)。ここで、属性選択とは、テキストとカテ
ゴリとの対応を表すのに重要な単語を選択することであ
る。
ル学習手段18により、属性選択された単語を基にテキ
ストとカテゴリとの対応を表すルールを学習する(ステ
ップ34)。例えば、上記のカテゴリ指定とテキスト指
定とをしたときに、図6のようなルールが得られる。
テキストの中で「使いやすい」という単語が現れていれ
ば、そのような回答をした人の92.0%がハイテク企
業としてA社を想起している、ということを示す。も
し、「使いやすい」という単語が現れていなければ、次
に、「未来」と「プライベート」という単語が同時に現
れているかどうかをチェックし、現れていれば、そのよ
うな回答をした人の87.2%がハイテク企業としてA
社を想起している、ということを示す。以下同様に、i
f―then―else型のルールに従って、上から下
へと条件文を読んで行く。このようなルールは、ハイテ
ク企業とハイテク感との間の関係を分かりやすくコンパ
クトに示すものである。
「B社」と「B社以外」とにカテゴリ指定したときに、
同様な手順で図7のルールが得られたとする。
と比較すると、A社をハイテク企業と想起する人のハイ
テク感は、使い勝手や嗜好品感覚を重視するのに対し、
B社をハイテク企業と想起する人のハイテク感は効率性
を重視していることがわかる。このように、ルールの比
較により、アンケート回答分析が容易になる。
ール出力手段19により、分析結果のルール形式の知識
を要求者に出力する(ステップ35)。
的決定リストをとり上げ、これを生成するための属性選
択ステップ33およびルール学習ステップ34について
より詳しく説明する。
if−then型の確率的ルールの順序付きリストのこ
とである。各確率的ルールは、”c=1←t(確率
p)”の形をとる。ここで、c=1は分類の決定、tは
分類の条件、(確率p)は確率を表す。
く述べる。
ば、’A社’と’A社でない’)に対して、そのカテゴ
リと深く関係する単語を集めることである。具体的に
は、図4に示すように、ステップ41で、テキストに出
現する単語ωの各々について、その単語ωの出現を考慮
しない場合のテキスト集合の確率的コンプレキシティ
(SCとかく)と考慮する場合のSCとの差ΔSC
(ω)を計算し、ステップ42で、その差ΔSC(ω)
が、与えられたしきい値τより大きければ単語ωを属性
として選択する。
る。入力されたアンケート回答文中のテキストの集合を (d1,cl),(d2,c2),…,(dm,cm) と表す。ここで、diはi番目のテキストを表し、i番
目のテキストに現れる単語の列として表現される。ci
はi番目のテキストに対応するカテゴリの値(ラベル)
を表し、各ciは所与のカテゴリ(’A社’)に属する
ならば1、そうでなければ(’A社でない’)0の値を
とる。mはテキストの数である。
cm、テキスト列をdm=d1,…,dmと書く。ラベ
ル列cmのSCを、数1のように計算する。
であるラベルの数を表す。また、logは自然対数を表
し、数2とする。
her information and stoch
astic complexity.IEEE Tra
ns.on Infomation Theory,4
2(1):40―47(1996)に述べられているよ
うに、SC(cm)は、ラベル列cmを与えられたモデ
ル(ここではベルヌイモデル)を用いて記述するのに必
要な最短の記述長という意味をもつ。また、
ciからなるラベル列であるとする。ここに、mωは、
iからなるラベル列であるとする。mωは、
慮する場合のSCとの差ΔSC(ω)は、数5のように
計算される。
れたカテゴリによく現れる、あるいはほとんど現れない
単語である。それらの単語がそのカテゴリと深く関係す
るとみることができる。そこで、τを与えられた閾値と
し、ΔSC(ω)>τなる単語ωを属性として選択す
る。
しく述べる。
し、ω1,…,ωnとする。ステップ51で、まず、入
力されたテキストの集合を、以下の表現に置き換える。 (d1,cl),(d2,c2),…,(dm,cm)
に多値の離散ベクトル) di=(ωi1,ωi2,…,ωin)(i=1,…,
m) を表す。ここで、ωijは、属性選択で得られた単語ω
jがi番目のテキストに現れれば1、そうでなければ0
の値をとる(j=1,…,n)。ciはi番日のテキス
トに対応するカテゴリの値(ラベル)を表し、各ciは
所与のカテゴリに属するならば1、そうでなければ0の
値をとる。mはテキストの数である。
se型のルールを選択し、確率的決定リストAに順番に
追加していく。これを「成長」とよぶ。ルールの選択に
は、例えば、拡張型確率的コンプレキシティ(ESCと
かく)最小原理を用いる。
た正の整数とする。属性選択された単語ωを基に可能な
すべてのk項(単語ωのk個までの連言)の集合をTと
する。次に、集合Tの項tの中からテキストに一度も現
れないものを取り除く。また、空の確率的決定リストA
を用意する。次に、ESCの値の減少分がもっとも大き
いルールを確率的決定リストAに順次追加する。
う。全データ集合Dを (d1,cl),(d2,c2),…,(dm,cm) の形のデータの集合とし、ラベル列をcm=c1,…,
cmとする。ラベル列c mのESCの値は、数6のよう
に近似計算することができる。
ecision−theoreticextensio
n of stochastic complexit
y,and its applicatons to
learning,IEEETrans.Infor
m.Theory,44,1424―1439(199
8)の論文で提案されたオリジナルのESCの1つの近
似形である。
(cm)はデフォルトの分類を行う際の誤りの数を表
す。デフォルトの分類とは、たとえば、すべてのラベル
が0であると仮定することである。tは集合Tの中の項
であるとする。
ルciからなるラベル列であるとする。ここに、m
tは、
一方、
ルciからなるラベル列であるとする。ここに、m¬t
は、
表す。
算することができる。
減少分ΔESC(t)を、数9で計算する。
小になるように項tを選択する。そのようなt=t*が
選ばれたならば、これを真とするような全データ集合D
のデータの数を
ベルをc=1として、c=1であった数を
確率的決定リストAに追加する。ここで、確率値pはラ
プラス推定の方法を用いて、例えば、数10により計算
する。
合Tとし、全データ集合Dから項t*を真にする全ての
データを除いたものを新しい全データ集合Dとして、全
データ集合Dが空になるまで、同じ操作を繰り返す。な
お、上記に用いた基準ESCの代わりに、属性選択に用
いた基準SCを用いることもできる。
得られた確率的決定リストAが学習データに過度に適合
することがあるので、確率的決定リストAの最後からル
ールを1つずつ取り除き、ESC最小原理の観点からみ
てこれを取り除かないほうがよいところまで続ける。こ
れを「刈り込み」とよぶ。
を、以下に述べる。まず、ラベル列cmの確率的決定リ
ストAに対するESCの値を、数11のように、確率的
決定リストAにおけるすべての項tに対するESCの値
の和として定義する。
的決定リストAとの全ESC値を、数12のように定義
する。
(A)は、確率的決定リストAを符号化する時の符号長
である。具体的には、L(A)=logT+log(T
−1)+…+logT(T−i+1)と計算する。ただ
し、Tは可能な項tの数で、iは確率的決定リストAに
おけるルールの数である。
A’は刈り込み後の確率的決定リストを表すものとす
る。 ESC(cm:A)≦ESC(cm:A’)
(A)−L(A’)) が成り立つ限り、刈り込み処理を続け、この条件が満足
されなくなったか、刈り込むべきルールが無くなった時
点で得られている確率的決定リストAを出力する。ES
Cが全体として小さい確率的決定リストAが出力される
ことになる。
析システムでは、ネットワーク12を通じて収集した自
然言語による自由回答記述を含むアンケート回答文から
自動的に分析結果のルールを導くことができる。
析システムにおいて、テキスト分類エンジン14とし
て、例えば、Li and Yamanishiにより提
案されているエンジン (h.Li and k.Yam
anishi: Text Classificati
on Using ESC―based Stochas
tic Decision Lists,Proceed
ings of 1999 International
Conference on Information
& Knowledge Management, p
p:122―130,1999)を用いると、O(nk
m)の計算量で、高速にアンケート回答文からルールを
導き出すことができる。ここに、nはアンケート回答文
から属性選択された単語の数、mはアンケート回答文の
数、kはルール1つの条件にとられる連言に含まれる単
語の最大数である。よって、効率的な自動アンケート回
答分析が可能となる。また、得られたルールは特定のカ
テゴリに属するアンケート回答文をif―then―e
lse型のルール形式で、コンパクトにかつ分かりやす
く表現している。
析システムは、例えば、以下のようなビジネスとして展
開できる。企業に関するイメージ調査,特定の商品やサ
ービス等のアンケートを請け負って、図2のようなアン
ケート項目でアンケートをネットワーク12上で実施
し、ネットワーク12を通じてオンラインで集められた
自然言語による自由回答記述を含むアンケート回答文を
データベース13に蓄え、そこからアンケート回答文を
呼び出して、テキスト分類エンジン14を使用すること
により得られるルールを分析結果として要求者に販売す
る。
答分析システムの全体構成を示すブロック図である。本
実施の形態に係るアンケート回答分析システムは、アン
ケート回答入力手段81と、データベース82と、テキ
スト分類エンジン83とから、その主要部が構成されて
いる。
ークを介さずにデータベース82と直接接続されてい
る。
答者からのアンケート回答文を蓄積する。
た第1の実施の形態に係るアンケート回答分析システム
におけるテキスト分類エンジン14と全く同様のもので
ある。したがって、対応する部分には同一符号を付し
て、それらの詳しい説明を省略する。
形態に係るアンケート回答分析システムの動作について
説明する。
ークを介さずにデータベース82と直接接続して、自然
言語による自由回答記述を含むアンケート回答文を入力
する。
答者からのアンケート回答文を蓄積する。
ス82から複数のアンケート回答文を読み出して、アン
ケート回答文を分類するルールを導き出し、分析結果の
ルールを要求者に出力する。なお、テキスト分類エンジ
ン83の動作の詳細は、第1の実施の形態に係るアンケ
ート回答分析システムにおけるテキスト分類エンジン1
4の場合と全く同様であるので、その詳しい説明を割愛
する。
析システムは、例えば、以下のようなビジネスとして展
開できる。企業に関するイメージ調査,特定の商品やサ
ービス等のアンケートを請け負って、図2のようなアン
ケート項目でアンケートを実施し、自然言語による自由
回答記述を含むアンケート回答文を一度に回収して、こ
れをデータベース82で蓄え、そこからアンケート回答
文を呼び出して、テキスト分類エンジン83を使用する
ことにより得られる分析結果を要求者に販売する。
答分析システムの全体構成を示すブロック図である。本
実施の形態に係るアンケート回答分析システムは、回答
者コンピュータ911〜91Nと、ネットワーク92
と、データベース93と、テキスト分類エンジン94
と、要求者コンピュータ95とから、その主要部が構成
されている。
ンピュータ,携帯情報端末,携帯電話機等の各種のメッ
セージ,メール等の送信機能を持つ機器が該当し、ネッ
トワーク92に接続されている。
ない各種の公衆回線網,専用線網や、LAN等の各種の
ネットワークが含まれる。
接続されており、回答者コンピュータ911〜91Nか
らネットワーク92を通じて送信された、複数のアンケ
ート回答者からのアンケート回答文を蓄積する。
手段19が分析結果のルール形式の知識をネットワーク
92を通じて送信できる点を除いては、図1に示した第
1の実施の形態に係るアンケート回答分析システムにお
けるテキスト分類エンジン14と全く同様のものであ
る。したがって、対応する部分には同一符号を付して、
それらの詳しい説明を省略する。
92を通じてテキスト分類エンジン94に分析結果のル
ール形式の知識を要求し、テキスト分類エンジン94か
ら分析結果のルール形式の知識をネットワーク92を通
じて受信することができる。
形態に係るアンケート回答分析システムの動作について
説明する。
911〜91Nからネットワーク92を介して自然言語
による自由回答記述を含むアンケート回答文を送る。な
お、アンケート回答者は、N人とする。
接続されており、複数のアンケート回答者からのアンケ
ート回答文を蓄積する。
ス93から複数のアンケート回答文を読み出して、アン
ケート回答文を分類するルール形式の知識を導き出す。
テキスト分類エンジン94は、ネットワーク92に接続
し、分析結果のルール形式の知識を要求者コンピュータ
95の要求に応じてネットワーク92を通じて配信す
る。なお、テキスト分類エンジン94の動作の詳細は、
分析結果のルール形式の知識がネットワーク92を通じ
て配信される点を除いて、第1の実施の形態に係るアン
ケート回答分析システムにおけるテキスト分類エンジン
14の場合と全く同様であるので、その詳しい説明を割
愛する。
ステムは、例えば、以下のようなビジネスとして展開で
きる。企業に関するイメージ調査,特定の商品やサービ
ス等のアンケートを請け負って、図2のようなアンケー
ト項目でアンケートをネットワーク92上で実施し、ネ
ットワーク92を通じてオンラインで集められた自然言
語による自由回答記述を含むアンケート回答文をデータ
ベース93で蓄え、そこからアンケート回答文を呼び出
して、テキスト分類エンジン94を使用することにより
得られる分析結果を、要求があれば、ネットワーク92
を通じて要求者に配信サービスすることによりビジネス
を行う。
回答分析システムの全体構成を示すブロック図である。
本実施の形態に係るアンケート回答分析システムは、図
1に示した第1の実施の形態に係るアンケート回答分析
システムにおいて、データベース13に接続されたコン
ピュータ101にテキスト分類エンジンプログラムを記
録した記録媒体102を備えるようにしたものである。
その他の構成は、第1の実施の形態に係るアンケート回
答分析システムと全く同様であるので、対応する部分に
は同一符号を付してそれらの詳しい説明を省略する。
係るアンケート回答分析システムでは、記録媒体102
からコンピュータ101にテキスト分類エンジンプログ
ラムが読み込まれ、形態素解析手段15,カテゴリ・テ
キスト指定手段16,属性選択手段17,ルール学習手
段18,およびルール出力手段19を含むテキスト分類
エンジン14としてコンピュータ101の動作を制御す
る。コンピュータ101上でのテキスト分類エンジン1
4の動作の詳細は、第1の実施の形態に係るアンケート
回答分析システムの場合と全く同様になるので、その詳
しい説明を割愛する。
回答分析システムの全体構成を示すブロック図である。
本実施の形態に係るアンケート回答分析システムは、図
8に示した第2の実施の形態に係るアンケート回答分析
システムにおいて、データベース82に接続されたコン
ピュータ111にテキスト分類エンジンプログラムを記
録した記録媒体112を備えるようにしたものである。
その他の構成は、第2の実施の形態に係るアンケート回
答分析システムと全く同様であるので、対応する部分に
は同一符号を付してそれらの詳しい説明を省略する。
係るアンケート回答分析システムでは、記録媒体112
からコンピュータ111にテキスト分類エンジンプログ
ラムが読み込まれ、形態素解析手段15,カテゴリ・テ
キスト指定手段16,属性選択手段17,ルール学習手
段18,およびルール出力手段19を含むテキスト分類
エンジン83としてコンピュータ111の動作を制御す
る。コンピュータ111上でのテキスト分類エンジン8
3の動作の詳細は、第2の実施の形態に係るアンケート
回答分析システムの場合と全く同様になるので、その詳
しい説明を割愛する。
回答分析システムの全体構成を示すブロック図である。
本実施の形態に係るアンケート回答分析システムは、図
9に示した第3の実施の形態に係るアンケート回答分析
システムにおいて、データベース93に接続されたコン
ピュータ121にテキスト分類エンジンプログラムを記
録した記録媒体122を備えるようにしたものである。
その他の構成は、第3の実施の形態に係るアンケート回
答分析システムと全く同様であるので、対応する部分に
は同一符号を付してそれらの詳しい説明を省略する。
係るアンケート回答分析システムでは、記録媒体122
からコンピュータ121にテキスト分類エンジンプログ
ラムが読み込まれ、形態素解析手段15,カテゴリ・テ
キスト指定手段16,属性選択手段17,ルール学習手
段18,およびルール出力手段19を含むテキスト分類
エンジン94としてコンピュータ121の動作を制御す
る。コンピュータ121上でのテキスト分類エンジン9
4の動作の詳細は、第3の実施の形態に係るアンケート
回答分析システムの場合と全く同様になるので、その詳
しい説明を割愛する。
ージ調査,特定の商品やサービス等のアンケートを請け
負って、アンケートをネットワーク上で実施し、ネット
ワークを通じてオンラインで集められた自然言語による
自由回答記述を含むアンケート回答文をデータベースに
蓄え、そこからアンケート回答文を呼び出して、テキス
ト分類エンジンを使用することにより得られるルール形
式の知識を分析結果として要求者に販売できることであ
る。
ージ調査,特定の商品やサービス等のアンケートを請け
負って、アンケートを実施し、自然言語による自由回答
記述を含むアンケート回答文を一度に回収して、これを
データベースで蓄え、そこからアンケート回答文を呼び
出して、テキスト分類エンジンを使用することにより得
られるルール形式の知識を分析結果として要求者に販売
できることである。
ージ調査,特定の商品やサービス等のアンケートを請け
負って、アンケートをネットワーク上で実施し、ネット
ワークを通じてオンラインで集められた自然言語による
自由回答記述を含むアンケート回答文をデータベースで
蓄え、そこからアンケート回答文を呼び出して、テキス
ト分類エンジンを使用することにより得られるルール形
式の知識を分析結果として、要求者からの要求に応じて
ネットワークを通じて配信サービスすることにより販売
できることである。
答分析システムの構成を示すブロック図である。
回答文を例示する図である。
示すフローチャートである。
示すフローチャートである。
を示すフローチャートである。
であるルール形式の知識(確率的決定リスト)の一例を
示す図である。
であるルール形式の知識(確率的決定リスト)の他の例
を示す図である。
答分析システムの構成を示すブロック図である。
答分析システムの構成を示すブロック図である。
回答分析システムの構成を示すブロック図である。
回答分析システムの構成を示すブロック図である。
回答分析システムの構成を示すブロック図である。
Claims (7)
- 【請求項1】自然言語による自由回答記述を含むアンケ
ート回答文を入力する手段と、前記アンケート回答文を
送信するネットワークと、前記送信されたアンケート回
答文を蓄積するデータベースと、該データベースから前
記アンケート回答文を読み出して、前記アンケート回答
文を分類するルールを学習するテキスト分類エンジンと
を備えることを特徴とするアンケート回答分析システ
ム。 - 【請求項2】自然言語による自由回答記述を含むアンケ
ート回答文を入力する手段と、前記アンケート回答文を
蓄積するデータベースと、該データベースから前記アン
ケート回答文を読み出して、前記アンケート回答文を分
類するルールを学習するテキスト分類エンジンとを備え
ることを特徴とするアンケート回答分析システム。 - 【請求項3】自然言語による自由回答記述を含むアンケ
ート回答文を入力する手段と、前記アンケート回答文を
送信するネットワークと、前記送信されたアンケート回
答文を蓄積するデータベースと、該データベースから前
記アンケート回答文を読み出して、前記アンケート回答
文を分類するルールを学習するテキスト分類エンジン
と、該ルールを要求者からの要求に応じて前記ネットワ
ークを通じて配信する手段とを備えることを特徴とする
アンケート回答分析システム。 - 【請求項4】前記テキスト分類エンジンが、前記データ
ベースに蓄積されたアンケート回答文の全文に対して形
態素解析を行う形態素解析手段と、カテゴリとテキスト
とを指定させるカテゴリ・テキスト指定手段と、前記デ
ータベースから読み込んだ複数のアンケート回答文に対
して属性選択を行う属性選択手段と、前記属性選択手段
により属性選択された単語を基にテキストとカテゴリと
の対応を表すルールを学習するルール学習手段と、前記
ルール学習手段により学習されたルールを出力するルー
ル出力手段とを含む請求項1,請求項2,または請求項
3記載のアンケート回答分析システム。 - 【請求項5】前記属性選択手段が、テキスト中に出現す
る単語の各々について、該単語の出現を考慮しない場合
のテキスト集合の確率的コンプレキシティと考慮する場
合のテキスト集合の確率的コンプレキシティとの差ΔS
C(ω)を計算する手順と、該差ΔSC(ω)がしきい
値τより大きければ属性として選択する手順とを実行す
る請求項4記載のアンケート回答分析システム。 - 【請求項6】前記ルール学習手段が、テキストの集合
を、(d1,cl),(d 2,c2),…,(dm,c
m)[ただし、各diは多値の離散ベクトルdi=(ω
i1,ωi2,…,ωin)(i=1,…,m)、ω
ijは属性選択で得られた単語ωj(j=1,…,n)
がi番目のテキストに現れれば1、そうでなければ0の
値をとる、ciはi番日のテキストに対応するカテゴリ
の値(ラベル)を表し、各ciは所与のカテゴリに属す
るならば1、そうでなければ0の値をとる、mはテキス
トの数]の表現に置き換えて成形する手順と、拡張型確
率的コンプレキシティ最小原理または確率的コンプレキ
シティ最小化原理などの情報量規準を用いてif−th
en−else型のルールを選択して確率的決定リスト
に順番に追加していく成長処理を行う手順と、前記確率
的決定リストの最後からルールを1つずつ取り除き拡張
型確率的コンプレキシティ最小原理の観点からみてこれ
を取り除かないほうがよいところまで続ける刈り込み処
理を行う手順とを実行する請求項4記載のアンケート回
答分析システム。 - 【請求項7】コンピュータを、前記データベースに蓄積
されたアンケート回答文の全文に対して形態素解析を行
う形態素解析手段,前記テキスト分類エンジンに対して
カテゴリとテキストとを指定させるカテゴリ・テキスト
指定手段,前記データベースから読み込んだ複数のアン
ケート回答文に対して属性選択を行う属性選択手段,前
記属性選択手段により属性選択された単語を基にテキス
トとカテゴリとの対応を表すルールを学習するルール学
習手段,および前記ルール学習手段により学習されたル
ールを出力するルール出力手段として機能させるための
プログラムを記録した記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000071657A JP3587120B2 (ja) | 2000-03-15 | 2000-03-15 | アンケート回答分析システム |
US09/805,114 US6876990B2 (en) | 2000-03-15 | 2001-03-14 | Questionnaire analysis system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000071657A JP3587120B2 (ja) | 2000-03-15 | 2000-03-15 | アンケート回答分析システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001266060A true JP2001266060A (ja) | 2001-09-28 |
JP3587120B2 JP3587120B2 (ja) | 2004-11-10 |
Family
ID=18590202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000071657A Expired - Fee Related JP3587120B2 (ja) | 2000-03-15 | 2000-03-15 | アンケート回答分析システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US6876990B2 (ja) |
JP (1) | JP3587120B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006286026A (ja) * | 2006-07-28 | 2006-10-19 | Nec Corp | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム |
JP2009070256A (ja) * | 2007-09-14 | 2009-04-02 | Toshiba Corp | 情報共有システム及び情報共有プログラム |
US20090287642A1 (en) * | 2008-05-13 | 2009-11-19 | Poteet Stephen R | Automated Analysis and Summarization of Comments in Survey Response Data |
WO2010105115A2 (en) * | 2009-03-11 | 2010-09-16 | The Board Of Regents Of The University Of Texas System | Audience response system |
US8452782B2 (en) | 2008-03-12 | 2013-05-28 | Nec Corporation | Text mining device, text mining method, text mining program, and recording medium |
JP2023007228A (ja) * | 2021-07-01 | 2023-01-18 | 株式会社Pkutech | 情報処理装置、プログラム及び情報処理方法 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7657220B2 (en) | 2004-05-21 | 2010-02-02 | Ordinate Corporation | Adaptive scoring of responses to constructed response questions |
US8175909B1 (en) * | 2004-11-03 | 2012-05-08 | Pileri Douglas C | Integrating business constituent interactions into value generating information |
JP2009503563A (ja) * | 2005-07-20 | 2009-01-29 | オーディネイト・コーポレイション | 話し言葉のコンピュータによる習熟度評価 |
AU2010236718B2 (en) * | 2009-04-12 | 2016-06-09 | Thomas M. Cates | Emotivity and vocality measurement |
JP5367869B2 (ja) * | 2012-04-27 | 2013-12-11 | 楽天株式会社 | 集計装置、集計プログラム、集計プログラムを記録したコンピュータ読み取り可能な記録媒体、及び集計方法 |
GB2513537A (en) * | 2012-12-20 | 2014-11-05 | Ibm | Natural language processing |
WO2016109563A1 (en) | 2014-12-31 | 2016-07-07 | Wal-Mart Stores, Inc. | System and method for monitoring gas emission of perishable products |
US20170024668A1 (en) * | 2015-07-23 | 2017-01-26 | Charlene G. Aldridge | Automated Assessment and Solution Methodology |
US10017115B2 (en) * | 2015-11-11 | 2018-07-10 | Ford Global Technologies, Llc | Trailer monitoring system and method |
US10607277B2 (en) * | 2016-02-23 | 2020-03-31 | International Business Machines Corporation | Automated product personalization based on mulitple sources of product information |
CN107741933A (zh) * | 2016-08-08 | 2018-02-27 | 北京京东尚科信息技术有限公司 | 用于检测文本的方法和装置 |
CN110892349B (zh) | 2017-05-23 | 2023-05-23 | 沃尔玛阿波罗有限责任公司 | 自动化检查系统 |
US11448632B2 (en) | 2018-03-19 | 2022-09-20 | Walmart Apollo, Llc | System and method for the determination of produce shelf life |
WO2020023762A1 (en) | 2018-07-26 | 2020-01-30 | Walmart Apollo, Llc | System and method for produce detection and classification |
US11715059B2 (en) | 2018-10-12 | 2023-08-01 | Walmart Apollo, Llc | Systems and methods for condition compliance |
WO2020106332A1 (en) | 2018-11-20 | 2020-05-28 | Walmart Apollo, Llc | Systems and methods for assessing products |
CN111831817B (zh) * | 2020-07-28 | 2024-06-18 | 平安国际融资租赁有限公司 | 问卷生成分析方法、装置、计算机设备及可读存储介质 |
CN112667798A (zh) * | 2021-01-12 | 2021-04-16 | 杭州云嘉云计算有限公司 | 一种基于ai的呼叫中心语言处理方法及系统 |
CN117195907B (zh) * | 2023-08-15 | 2024-04-02 | 广东省粤正评估咨询有限公司 | 应用于市场调查处理系统的调查问卷分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0298775A (ja) * | 1988-10-04 | 1990-04-11 | Nec Corp | 決定リストの生成方法及び装置 |
JPH08166965A (ja) * | 1994-12-14 | 1996-06-25 | Nippon Telegr & Teleph Corp <Ntt> | 日本語テキスト自動分類方法 |
JPH1115832A (ja) * | 1997-06-25 | 1999-01-22 | Fujitsu Ltd | クラスタ生成装置および記録媒体 |
JPH11143856A (ja) * | 1997-11-10 | 1999-05-28 | Naoya Sannomiya | 多人数からの情報収集を目的とした電子メールシステム |
JPH11167581A (ja) * | 1997-12-04 | 1999-06-22 | Ntt Data Corp | 情報分類方法、装置及びシステム |
JPH11345241A (ja) * | 1998-06-03 | 1999-12-14 | Fujitsu Ltd | テキスト情報の分析装置及び記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114802A (ja) | 1995-10-20 | 1997-05-02 | Omron Corp | 調査装置および調査方法 |
US6498921B1 (en) * | 1999-09-01 | 2002-12-24 | Chi Fai Ho | Method and system to answer a natural-language question |
JP2940501B2 (ja) | 1996-12-25 | 1999-08-25 | 日本電気株式会社 | ドキュメント分類装置及び方法 |
JPH1166036A (ja) | 1997-08-11 | 1999-03-09 | Hitachi Inf Syst Ltd | 電子アンケートシステムおよびそれに用いる記憶媒体 |
JPH11250072A (ja) | 1998-02-26 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類方法及び装置及び情報分類プログラムを格納した記憶媒体 |
JP3178406B2 (ja) | 1998-02-27 | 2001-06-18 | 日本電気株式会社 | 階層型文章分類装置およびプログラムを記録した機械読み取り可能な記録媒体 |
US6212532B1 (en) * | 1998-10-22 | 2001-04-03 | International Business Machines Corporation | Text categorization toolkit |
US6477551B1 (en) * | 1999-02-16 | 2002-11-05 | International Business Machines Corporation | Interactive electronic messaging system |
JP3410088B2 (ja) * | 1999-06-02 | 2003-05-26 | 富士通株式会社 | 現実世界の感知情報に対応した仮想コミュニケーション空間構築システム |
US6332143B1 (en) * | 1999-08-11 | 2001-12-18 | Roedy Black Publishing Inc. | System for connotative analysis of discourse |
US6560590B1 (en) * | 2000-02-14 | 2003-05-06 | Kana Software, Inc. | Method and apparatus for multiple tiered matching of natural language queries to positions in a text corpus |
EP1275042A2 (en) * | 2000-03-06 | 2003-01-15 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
-
2000
- 2000-03-15 JP JP2000071657A patent/JP3587120B2/ja not_active Expired - Fee Related
-
2001
- 2001-03-14 US US09/805,114 patent/US6876990B2/en not_active Expired - Lifetime
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0298775A (ja) * | 1988-10-04 | 1990-04-11 | Nec Corp | 決定リストの生成方法及び装置 |
JPH08166965A (ja) * | 1994-12-14 | 1996-06-25 | Nippon Telegr & Teleph Corp <Ntt> | 日本語テキスト自動分類方法 |
JPH1115832A (ja) * | 1997-06-25 | 1999-01-22 | Fujitsu Ltd | クラスタ生成装置および記録媒体 |
JPH11143856A (ja) * | 1997-11-10 | 1999-05-28 | Naoya Sannomiya | 多人数からの情報収集を目的とした電子メールシステム |
JPH11167581A (ja) * | 1997-12-04 | 1999-06-22 | Ntt Data Corp | 情報分類方法、装置及びシステム |
JPH11345241A (ja) * | 1998-06-03 | 1999-12-14 | Fujitsu Ltd | テキスト情報の分析装置及び記録媒体 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006286026A (ja) * | 2006-07-28 | 2006-10-19 | Nec Corp | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム |
JP4539616B2 (ja) * | 2006-07-28 | 2010-09-08 | 日本電気株式会社 | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム |
JP2009070256A (ja) * | 2007-09-14 | 2009-04-02 | Toshiba Corp | 情報共有システム及び情報共有プログラム |
US8452782B2 (en) | 2008-03-12 | 2013-05-28 | Nec Corporation | Text mining device, text mining method, text mining program, and recording medium |
US20090287642A1 (en) * | 2008-05-13 | 2009-11-19 | Poteet Stephen R | Automated Analysis and Summarization of Comments in Survey Response Data |
US8577884B2 (en) * | 2008-05-13 | 2013-11-05 | The Boeing Company | Automated analysis and summarization of comments in survey response data |
WO2010105115A2 (en) * | 2009-03-11 | 2010-09-16 | The Board Of Regents Of The University Of Texas System | Audience response system |
WO2010105115A3 (en) * | 2009-03-11 | 2011-01-13 | The Board Of Regents Of The University Of Texas System | Audience response system |
JP2023007228A (ja) * | 2021-07-01 | 2023-01-18 | 株式会社Pkutech | 情報処理装置、プログラム及び情報処理方法 |
JP7278560B2 (ja) | 2021-07-01 | 2023-05-22 | 株式会社Pkutech | 情報処理装置、プログラム及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3587120B2 (ja) | 2004-11-10 |
US6876990B2 (en) | 2005-04-05 |
US20020004790A1 (en) | 2002-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001266060A (ja) | アンケート回答分析システム | |
Borg et al. | Using VADER sentiment and SVM for predicting customer response sentiment | |
Wang et al. | An outranking approach for multi-criteria decision-making with hesitant fuzzy linguistic term sets | |
CN108415953B (zh) | 一种基于自然语言处理技术的不良资产经营知识管理方法 | |
US5671333A (en) | Training apparatus and method | |
WO2018126953A1 (zh) | 种子人群扩散方法、装置、信息投放系统以及存储介质 | |
US11429834B1 (en) | Neural-based agent assistance interface for providing answers based on a query vector | |
JP2022511619A (ja) | 自動化電子メールアシスタント | |
CN109271514B (zh) | 短文本分类模型的生成方法、分类方法、装置及存储介质 | |
CN111767725A (zh) | 一种基于情感极性分析模型的数据处理方法及装置 | |
Dalip et al. | Quality assessment of collaborative content with minimal information | |
CN113486189A (zh) | 一种开放性知识图谱挖掘方法及系统 | |
CN110674301A (zh) | 一种情感倾向预测方法、装置、系统及存储介质 | |
JP2021092925A (ja) | データ生成装置およびデータ生成方法 | |
Isa et al. | Sentiment classification of Malay newspaper using immune network (SCIN) | |
JP2021140228A (ja) | 広告文自動作成システム | |
Lo et al. | An emperical study on application of big data analytics to automate service desk business process | |
Jasim et al. | Analyzing Social Media Sentiment: Twitter as a Case Study | |
CN115455939A (zh) | 篇章级事件抽取方法、装置、设备及存储介质 | |
BURLĂCIOIU et al. | TEXT MINING IN BUSINESS. A STUDY OF ROMANIAN CLIENT’S PERCEPTION WITH RESPECT TO USING TELECOMMUNICATION AND ENERGY APPS. | |
JP2004171220A (ja) | 文書管理装置および方法 | |
Yıldırım et al. | A new plant intelligence-based method for sentiment analysis: Chaotic sunflower optimization | |
Sindhu et al. | Mapping Distinct Source and Target Domains on Amazon Product Customer Critiques with Cross Domain Sentiment Analysis | |
Sharma et al. | Categorization and classification of Uber reviews | |
Li et al. | A rule-based Chinese sentiment mining system with self-expanding dictionary-taking TripAdvisor as an example |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040206 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040330 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040308 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040720 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040802 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070820 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100820 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110820 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110820 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120820 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |