JP6506839B2 - 不満情報処理装置及びシステム - Google Patents
不満情報処理装置及びシステム Download PDFInfo
- Publication number
- JP6506839B2 JP6506839B2 JP2017520072A JP2017520072A JP6506839B2 JP 6506839 B2 JP6506839 B2 JP 6506839B2 JP 2017520072 A JP2017520072 A JP 2017520072A JP 2017520072 A JP2017520072 A JP 2017520072A JP 6506839 B2 JP6506839 B2 JP 6506839B2
- Authority
- JP
- Japan
- Prior art keywords
- dissatisfaction
- information
- product
- industry
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 40
- 238000004458 analytical method Methods 0.000 claims description 131
- 238000012545 processing Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 24
- 230000016507 interphase Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 3
- 239000000047 product Substances 0.000 description 123
- 230000000877 morphologic effect Effects 0.000 description 10
- 230000006872 improvement Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 235000013305 food Nutrition 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 4
- 230000003442 weekly effect Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000012149 noodles Nutrition 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000014347 soups Nutrition 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
次のようなアルゴリズムを用いる。
ステップ1.事前に用意しておいた辞書や規則をテーブル形式で読み込む。
ステップ2.入力文を読み込む。
ステップ3.慣用句テーブルとのマッチングを行う。マッチングした部分は固定され、以降の解析では変更されない。
ステップ4.句読点と字種の変わり目(基本的にひらがなから漢字に変わる箇所)で、文節を切り出す。
ステップ5.切り出された文節の中で、慣用句にマッチングしていない箇所について、ひらがな書き自立語テーブル等とのマッチングを行う。
ステップ6.以上で出てきた慣用句や単語を接続条件に基づいて連鎖させていく。複数の連鎖がありうる場合、全てを出力する。
ステップ7.結果をファイルに書き出す。
ステップ8.未処理の文節があれば、上記のステップ5に戻る。
なお、前提として、漢字で書かれた部分は基本的に切り分けず、そこが自立語になると想定する。用いるテーブルは、例えば以下のものである。
・慣用句テーブル
・ひらがな部分の単語切り分け用テーブル
・付属語テーブル
・ひらがな自立語テーブル
・活用語尾テーブル
・ひらがな語幹テーブル
・特殊動詞テーブル
・副詞テーブル
・情報テーブル ( 上記テーブル内の各項目に対応した辞書的情報)
・接続テーブル(形態素間の相互接続関係を記述したテーブルであり、規則に相当する。接続カテゴリ(品詞)毎に、その前に出現可能な形態素のカテゴリや活用形が記されている。)
主な手法に「ラティス上の経路予測」と「点予測」がある。
ラティス上の経路予測では、事前に生成可能な単語列 (ラティス) を辞書を使って網羅的に列挙し、各単語間の連結部において両単語が連結して出現する確率に相当するスコアを付与する。文全体でこのスコアの合計がもっとも高くなるような品詞列を答えとする。スコアの計算は隠れマルコフモデル (HMM: Hidden Markov Model) や条件付き確率場 (CRF: Conditional Random Field) 等によりモデル化する。
(単語1)→(単語2)
である。勿論、単語1と単語0が係り受け関係にあり、単語2と単語3が係り受け関係にある場合には、
(単語0)→(単語1)→(単語2)→(単語3)
となる。単語間の関係をマップとして表現することで、単に単語をリストアップする場合に比べて、不満内容を視覚的に容易に理解することができる。不満内容は多岐にわたるが、マップとして表現することで系統的に把握することが容易となる。
「不満対象として「カテゴリ」、「カテゴリ2」、「会社・団体」、「商品名」をもれなく記入すると、買取金額が5ptから10ptにアップします」
とのメッセージ104が表示され、ユーザに対してカテゴリ、会社・団体名、商品名を具体的に特定するように促す。
業界相間解析は、業界毎に不満情報を解析するものであり、入力された不満情報に含まれる「カテゴリ」を用いて分類して査定済み不満データベース12a2に蓄積された不満情報を統計処理した結果を出力する。統計処理には、一定期間における全業界の不満数の算出、一定期間における特定業界の不満数の算出、前記2つの不満数の比率の算出、特定業界における不満数の多い会社の抽出、特定業界における不満数の多い製品の抽出が含まれる。また、入力された不満情報に含まれる「不満の内容」を自然言語解析して得られた単語を統計処理した結果を出力する。この統計処理には、一定期間における不満情報に多く含まれる単語の抽出、一定期間における不満情報に多く含まれる単語のコンビネーションの抽出が含まれる。
不満情報が入力されると、プロセッサ12eは、不満情報に含まれるカテゴリ1及びカテゴリ2を用いて不満情報を分類し、買取の可否及び買取価格を査定し、査定済み不満データベース12a2に登録する。例えば、カテゴリをC1,C2,・・・とし、カテゴリC1に属する会社Aの製品をa1,a2とし、製品a1についての不満情報をfuman111, fuman112, fuman113、製品a2についての不満情報をfuman121, fuman122, fuman123、カテゴリC2に属する会社Bの製品を製品b1とし、製品b1についての不満情報をfuman211,fuman212,fuman213とすると、
カテゴリC1ー会社Aー製品a1ーfuman111, fuman112, fuman113
―会社Aー製品a2ーfuman121, fuman122, fuman123
カテゴリC2ー会社Bー製品b1ーfuman211, fuman212, fuman213
等と登録する。各不満情報には、入力された日付データがメタデータとして付加される。
fuman111= (w1, w2, w3, w4)
として査定済み不満データベース12a2に登録する。なお、各単語には、形態素解析により得られたその品詞を特定するメタデータも含まれる。例えば、単語w1:形容詞、単語w2:名詞等である。
比率=n/N
を算出する。需要者の興味が比較的高い業界においては、一定程度の不満が生じると考えられる(興味のないところには不満もない)ため、比率が一定程度ある場合にはその業界は注目度が高い業界であると解釈し得る。また、比率がある特定の時期において急峻に増大した場合には、当該業界に何らかの問題が生じている可能性があると解釈し得る。逆に、比率が急峻に増大した後に減少に転じた場合には、不満の原因が取り除かれた、つまり当該業界での不満の原因に対する対策が奏功したと解釈し得る。
比率=(指定された業界の不満数n)/(全業界の不満数N)
であり、週間を指定した場合には週単位での不満数、月間を指定した場合には月単位での不満数が用いられる。図5では、週単位を指定した場合の比率のトレンドを示す。
製品相間解析は、製品毎に不満情報を解析するものであり、入力された不満情報に含まれる「製品」を用いて査定済み不満データベース12a2に蓄積された不満情報を検索して統計処理した結果を出力する。統計処理には、一定期間における全業界の不満数の算出、一定期間における特定製品の不満数の算出、前記2つの不満数の比率の算出、特定製品における不満数の多い会社の抽出が含まれる。また、入力された不満情報に含まれる「不満の内容」を自然言語解析して得られた単語を統計処理した結果を出力する。この統計処理には、一定期間における不満情報に多く含まれる単語の抽出、一定期間における不満情報に多く含まれる単語のコンビネーションの抽出が含まれる。
不満情報が入力されると、プロセッサ12eは、不満情報に含まれるカテゴリを用いて不満情報を分類し、カテゴリ毎に買取の可否及び買取価格を査定し、査定済み不満データベース12a2に登録する。
比率=m/N
を算出する。出力装置14から複数の製品が指定された場合、指定された製品毎に比率を算出する。また、プロセッサ12eは、検索して得られた不満情報に含まれる単語を検索し、統計処理して出力装置14に出力する。
比率=(指定された製品の不満数m)/(全業界の不満数N)
であり、週間を指定した場合には週単位での不満数、月間を指定した場合には月単位での不満数が用いられる。図6では、週単位を選択した場合の比率のトレンドを示す。
ランク 製品
3位 a2
5位 a1
1位 a3
等である。ユーザが、これらの製品のいずれかをクリックあるいはタッチして指定すると、当該製品についての不満情報に含まれる単語のうち最も頻度の高い単語がポップアップ表示される。
単語レベル相間解析は、不満情報に含まれる単語間の関係を解析して出力するものである。
fuman111= (w1, w2, w3, w4)
として査定済み不満データベース12a2に登録する。なお、各単語には、その品詞を特定するためのメタデータも含まれる。
w1→w2
w3→w4
の関係を抽出する。プロセッサ12eは、各単語の頻度とともに、係り受けの関係の頻度についてもカウントし、これらの頻度に応じて単語、及び単語間の関係を図形表示する。
例えば、
w1→(5)→w2
w3→(7)→w4
等である。ここで、括弧内の数字は、係り受けの出現頻度を表す。
w1→(5)→w2
を検索して出力装置14に出力する等である。
[word from] → [word to]
となる。ここで、「→」は矢印付きリンクを表す。なお、他の単語を修飾するとともに、他の単語から修飾される単語も存在し得るので、単語としては、
[word from]
[word to]
[word from & word to]
の3種類の単語が存在する。
また、出現頻度に応じて矢印付きリンクの太さを変える、つまり出現頻度に比例してリンクの太さを大きくしてもよい。出現頻度に応じてリンクの色を変化させることも可能である。単語及び単語間の係り受けをこのようなノードとリンクの図形表示とすることで、不満の内容をパターンとして理解することができる。
Claims (5)
- 不満情報処理装置であって、
入力された不満情報を記憶するデータベースと、
前記データベースに記憶された前記不満情報に含まれるカテゴリ属性に基づき、前記不満情報を業界毎に解析し統計処理して業界相間解析結果を出力し、前記データベースに記憶された前記不満情報に含まれる製品属性に基づき、前記不満情報を製品毎に解析し統計処理して製品相間解析結果を出力し、前記データベースに記憶された前記不満情報に含まれる不満内容属性に基づき、前記不満情報を自然言語解析し統計処理して単語相間解析結果を出力するプロセッサと、
を備え、
前記業界相間解析結果は、指定期間における全業界の不満情報数に対する指定業界の不満情報数の比率を含み、
前記製品相間解析結果は、指定期間における全業界の不満情報数に対する指定製品の不満情報数の比率を含み、
前記単語相間解析結果は、指定期間における指定業界あるいは指定製品の不満情報に含まれる単語の係り受けを含む
ことを特徴とする不満情報処理装置。 - 前記業界相間解析結果は、指定期間における指定業界の不満情報に含まれる単語の出現頻度情報を含む
ことを特徴とする請求項1記載の不満情報処理装置。 - 前記製品相間解析結果は、指定期間における指定製品の不満情報が相対的に多い会社情報を含む
ことを特徴とする請求項1記載の不満情報処理装置。 - 前記単語相間解析結果は、指定業界あるいは指定製品の不満情報に含まれる単語をノードとし、前記係り受けを前記ノードの間を結ぶリンクとした図形情報を含む
ことを特徴とする請求項1記載の不満情報処理装置。 - 不満情報処理システムであって、
不満情報を入力する入力装置と、
前記入力装置からの前記不満情報を解析処理する不満情報処理装置と、
前記不満情報処理装置からの解析結果を出力する出力装置と、
を備え、
前記不満情報処理装置は、
前記入力装置からの不満情報を記憶するデータベースと、
前記出力装置からの解析要求に応じ、前記データベースに記憶された前記不満情報に含まれるカテゴリ属性に基づき、前記不満情報を業界毎に解析し統計処理して業界相間解析結果を出力し、前記データベースに記憶された前記不満情報に含まれる製品属性に基づき、前記不満情報を製品毎に解析し統計処理して製品相間解析結果を出力し、前記データベースに記憶された前記不満情報に含まれる不満内容属性に基づき、前記不満情報を自然言語解析し統計処理して単語相間解析結果を出力するプロセッサと、
を備え、
前記業界相間解析結果は、指定期間における全業界の不満情報数に対する指定業界の不満情報数の比率を含み、
前記製品相間解析結果は、指定期間における全業界の不満情報数に対する指定製品の不満情報数の比率を含み、
前記単語相間解析結果は、指定期間における指定業界あるいは指定製品の不満情報に含まれる単語の係り受けを含む
ことを特徴とする不満情報処理システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/064798 WO2016189594A1 (ja) | 2015-05-22 | 2015-05-22 | 不満情報処理装置及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016189594A1 JPWO2016189594A1 (ja) | 2018-03-15 |
JP6506839B2 true JP6506839B2 (ja) | 2019-04-24 |
Family
ID=57392976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017520072A Active JP6506839B2 (ja) | 2015-05-22 | 2015-05-22 | 不満情報処理装置及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6506839B2 (ja) |
WO (1) | WO2016189594A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6731469B2 (ja) * | 2018-12-21 | 2020-07-29 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266586B2 (ja) * | 1999-07-07 | 2002-03-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ分析システム |
JP2002140419A (ja) * | 2000-11-02 | 2002-05-17 | Hitachi Koukiyou Syst Eng Kk | 苦情受付代行業のサービス方法および装置 |
JP5138621B2 (ja) * | 2009-03-02 | 2013-02-06 | 日本電信電話株式会社 | 情報処理装置及び不満解決商品発見方法及びプログラム |
JP5471673B2 (ja) * | 2010-03-23 | 2014-04-16 | 大日本印刷株式会社 | 文書分類装置、プログラムおよび記憶媒体 |
JP5599073B2 (ja) * | 2011-06-10 | 2014-10-01 | 株式会社野村総合研究所 | 感性分析システム及びプログラム |
-
2015
- 2015-05-22 WO PCT/JP2015/064798 patent/WO2016189594A1/ja active Application Filing
- 2015-05-22 JP JP2017520072A patent/JP6506839B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2016189594A1 (ja) | 2018-03-15 |
WO2016189594A1 (ja) | 2016-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10311377B2 (en) | Categorization of user interactions into predefined hierarchical categories | |
US7930302B2 (en) | Method and system for analyzing user-generated content | |
US20150186790A1 (en) | Systems and Methods for Automatic Understanding of Consumer Evaluations of Product Attributes from Consumer-Generated Reviews | |
JP6022056B2 (ja) | 検索結果の生成 | |
US20150286943A1 (en) | Decision Making and Planning/Prediction System for Human Intention Resolution | |
KR20210047229A (ko) | 구매 우선순위와 상품 리뷰 감성분석을 반영한 상품 추천 시스템 및 방법 | |
KR101540683B1 (ko) | 감정어의 극성을 분류하는 방법 및 서버 | |
US20220382794A1 (en) | System and method for programmatic generation of attribute descriptors | |
US20230144844A1 (en) | Systems and methods for managing a personalized online experience | |
Banjar et al. | Aspect-Based Sentiment Analysis for Polarity Estimation of Customer Reviews on Twitter. | |
WO2016186923A1 (en) | Process journey sentiment analysis | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN108470289B (zh) | 基于电商购物平台的虚拟物品发放方法及设备 | |
CN104881446A (zh) | 搜索方法及装置 | |
CN113722487A (zh) | 用户情感分析方法、装置、设备及存储介质 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
JP5138621B2 (ja) | 情報処理装置及び不満解決商品発見方法及びプログラム | |
Groot | Data mining for tweet sentiment classification | |
JP6506839B2 (ja) | 不満情報処理装置及びシステム | |
JP2020154464A (ja) | 推定装置、推定方法及び推定プログラム | |
CN111144122A (zh) | 评价处理方法、装置和计算机系统及介质 | |
JP6993955B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7351502B2 (ja) | 変数データ生成装置、予測モデル生成装置、変数データ生産方法、予測モデル生産方法、プログラム及び記録媒体 | |
JP2018067215A (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
Aishwarya et al. | Summarization and Prioritization of Amazon Reviews based on multi-level credibility attributes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190329 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6506839 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |