JP2007241881A - 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 - Google Patents
意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2007241881A JP2007241881A JP2006066308A JP2006066308A JP2007241881A JP 2007241881 A JP2007241881 A JP 2007241881A JP 2006066308 A JP2006066308 A JP 2006066308A JP 2006066308 A JP2006066308 A JP 2006066308A JP 2007241881 A JP2007241881 A JP 2007241881A
- Authority
- JP
- Japan
- Prior art keywords
- opinion
- sentence
- word
- determination
- semantic category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】本発明は、意見がどうかを判定するための手掛かりとなる意見表現だけでなく、単語の意味カテゴリを用いて文中に含まれる単語の意味を表現し、2値分類可能な機械学習手法を用いた学習を行い作成されたモデルを格納した意見性判定データベースを作成し、当該意見性判定データベースのモデルを用いて分類を行って意味と意見表現の組み合わせを考慮し、意見性を判断する。
【選択図】図1
Description
峠泰成他、「ドメイン特徴語の自動取得によるWeb掲示板からの意見文抽出」、言語処理学会第11回年次大会、pp. 672-675, 2005 立石健二他、「Web文書集合からの意見情報抽出と着眼点に基づく要約生成」、言語処理学会第10回年次大会、pp. 644-647, 2004
単語分割手段が、入力された意見であるかどうかの判定結果が付与された複数の文を形態素解析により単語に分割し、各単語に表記、品詞及び単語の意味的な分類を表す意味カテゴリを付与する単語分割ステップ(ステップ1)と、
意味カテゴリベクトル算出手段が、文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出ステップ(ステップ2)と、
意見表現ベクトル算出手段が、文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、単語列中に含まれる該意見表現リスト中の意見表現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出ステップ(ステップ3)と、
意見性判定データベース作成手段が、各文に対して算出された意味カテゴリベクトルと意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて学習を行い、学習の結果得られたモデルを意見性判定データベースに格納する意見性判定データベース作成ステップ(ステップ4)と、を行う。
入力された意見であるかどうかの判定結果が付与された複数の文を形態素解析により単語に分割し、各単語に表記、品詞及び単語の意味的な分類を表す意味カテゴリを付与する単語分割手段1と、
文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出手段2と、
文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段6に格納されている意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、単語列中に含まれる該意見表現リスト中の意見表現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出手段3と、
各文に対して算出された意味カテゴリベクトルと意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて学習を行い、学習の結果得られたモデルを意見性判定データベース7に格納する意見性判定データベース作成手段4と、を有する。
単語分割手段が、文を形態素解析により単語に分割し、各単語に表記、品詞、及び単語の意味的な分類を表す意味カテゴリを付与する単語分割ステップ(ステップ5)と、
意味カテゴリベクトル算出手段が、文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出ステップ(ステップ6)と、
意見表現ベクトル算出手段が、文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている、意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、該単語列中に含まれる該意見表現リスト中の意見表現の出現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出ステップ(ステップ7)と、
意見性判定手段が、文に対して算出された意味カテゴリベクトルと意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて意見性判定データベースに格納されたモデルに基づき分類を行い、分類の結果から得られた値から文の意見性を判定する意見性判定ステップ(ステップ8)と、を行う。
意見性判定手段が、2値分類可能な機械学習手法を用いて分類した結果得られた値だけでなく、記憶手段に格納された意見・気持ち・感情を特に強く表す特定意見表現が記載された特定意見表現リスト中の特定意見表現を含むかどうかにより得られる値も用いて文の意見性を判定する。
文を形態素解析により単語に分割し、各単語に表記、品詞、及び単語の意味的な分類を表す意味カテゴリを付与する単語分割手段1と、
文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出手段2と、
文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段6に格納されている、意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、該単語列中に含まれる該意見表現リスト中の意見表現の出現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出手段3と、
文に対して算出された意味カテゴリベクトルと意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて、請求項2で作成された意見性判定データベース7に格納されたモデルに基づき分類を行い、分類の結果から得られた値から文の意見性を判定する意見性判定手段5と、を有する。
図5は、本発明の第1の実施の形態における意見性判定データベース作成装置の構成図である。
本実施の形態では、意見性判定装置について説明する。本実施の形態では、第1の実施の形態で作成された意見性判定データベースに基づいて、文の意見性を判定する。
2 意味カテゴリベクトル算出手段、意味カテゴリベクトル算出部
3 意見表現ベクトル算出手段、意見表現ベクトル算出部
4 意見性判定データベース作成手段、意見性判定データベース作成部
5 意見性判定手段、意見性判定部
6 意見表現リスト記憶手段、意見表現リスト記憶部
7 意見性判定データベース
8 文記憶部
Claims (10)
- 単語分割手段、意味カテゴリベクトル算出手段、意見表現ベクトル算出手段、意見性判定データベース作成手段と、を有する意見性判定データベース作成装置において、製品・人物・出来事を含む対象事物について書かれた複数の文を入力として、入力とは異なる文に対しても意見かどうかを判定するためのデータベースを作成する意見性判定データベース作成方法であって、
前記単語分割手段が、入力された意見であるかどうかの判定結果が付与された複数の文を形態素解析により単語に分割し、各単語に表記、品詞及び単語の意味的な分類を表す意味カテゴリを付与する単語分割ステップと、
前記意味カテゴリベクトル算出手段が、前記文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出ステップと、
前記意見表現ベクトル算出手段が、前記文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、単語列中に含まれる該意見表現リスト中の意見表現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出ステップと、
前記意見性判定データベース作成手段が、前記各文に対して算出された前記意味カテゴリベクトルと前記意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて学習を行い、学習の結果得られたモデルを意見性判定データベースに格納する意見性判定データベース作成ステップと、
を行うことを特徴とする意見性判定データベース作成方法。 - 製品・人物・出来事を含む対象事物について書かれた複数の文を入力として、入力とは異なる文に対しても意見かどうかを判定するためのデータベースを作成する意見性判定データベース作成装置であって、
入力された意見であるかどうかの判定結果が付与された複数の文を形態素解析により単語に分割し、各単語に表記、品詞及び単語の意味的な分類を表す意味カテゴリを付与する単語分割手段と、
前記文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出手段と、
前記文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、単語列中に含まれる該意見表現リスト中の意見表現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出手段と、
前記各文に対して算出された前記意味カテゴリベクトルと前記意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて学習を行い、学習の結果得られたモデルを意見性判定データベースに格納する意見性判定データベース作成手段と、
を有することを特徴とする意見性判定データベース作成装置。 - コンピュータを、
請求項2記載の意見性判定データベース作成装置として機能させることを特徴とする意見性判定データベース作成プログラム。 - コンピュータを、
請求項2記載の意見性判定データベース作成装置として機能させる意見性判定データベース作成プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。 - 単語分割手段、意味カテゴリベクトル算出手段、意見表現ベクトル算出手段、意見性判定手段、請求項1で作成された意見性判定データベースと、を有する意見性判定装置において、製品・人物・出来事を含む対象事物について書かれた文から、該文が意見かどうかを判定する意見性判定方法であって、
前記単語分割手段が、前記文を形態素解析により単語に分割し、各単語に表記、品詞、及び単語の意味的な分類を表す意味カテゴリを付与する単語分割ステップと、
前記意味カテゴリベクトル算出手段が、前記文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出ステップと、
前記意見表現ベクトル算出手段が、前記文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている、意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、該単語列中に含まれる該意見表現リスト中の意見表現の出現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出ステップと、
前記意見性判定手段が、前記文に対して算出された前記意味カテゴリベクトルと前記意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて前記意見性判定データベースに格納されたモデルに基づき分類を行い、分類の結果から得られた値から文の意見性を判定する意見性判定ステップと、
を行うことを特徴とする意見性判定方法。 - 前記意見性判定ステップにおいて、
前記意見性判定手段が、前記2値分類可能な機械学習手法を用いて分類した結果得られた値だけでなく、記憶手段に格納された意見・気持ち・感情を特に強く表す特定意見表現が記載された特定意見表現リスト中の特定意見表現を含むかどうかにより得られる値も用いて文の意見性を判定する、
請求項5記載の意見性判定方法。 - 製品・人物・出来事を含む対象事物について書かれた文から、該文が意見かどうかを判定する意見性判定装置であって、
前記文を形態素解析により単語に分割し、各単語に表記、品詞、及び単語の意味的な分類を表す意味カテゴリを付与する単語分割手段と、
前記文内の一部または全ての単語からなる単語列に対し、該単語列中に含まれる意味カテゴリの出現の度合いに応じて算出される値を要素値とする意味カテゴリベクトルを求める意味カテゴリベクトル算出手段と、
前記文内の一部または全ての単語からなる単語列に対し、意見表現リスト記憶手段に格納されている、意見かどうかを表す手掛かりとなる意見表現が記載された意見表現リストを参照して、該単語列中に含まれる該意見表現リスト中の意見表現の出現の度合いに応じて算出される値を要素値とする意見表現ベクトルを求める意見表現ベクトル算出手段と、
前記文に対して算出された前記意味カテゴリベクトルと前記意見表現ベクトルに対し、2値分類可能な機械学習手法を用いて、請求項2で作成された意見性判定データベースに格納されたモデルに基づき分類を行い、分類の結果から得られた値から文の意見性を判定する意見性判定手段と、
を有することを特徴とする意見性判定装置。 - 前記意見性判定手段は、
前記2値分類可能な機械学習手法を用いて分類した結果得られた値だけでなく、記憶手段に格納された意見・気持ち・感情を特に強く表す特定意見表現が記載された特定意見表現リスト中の特定意見表現を含むかどうかにより得られる値も用いて文の意見性を判定する手段を含む請求項7記載の意見性判定装置。 - コンピュータを、
請求項7または8記載の意見性判定装置として機能させることを特徴とする意見性判定プログラム。 - コンピュータを、
請求項7または8記載の意見性判定装置として機能させる意見性判定プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006066308A JP4054046B2 (ja) | 2006-03-10 | 2006-03-10 | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006066308A JP4054046B2 (ja) | 2006-03-10 | 2006-03-10 | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007241881A true JP2007241881A (ja) | 2007-09-20 |
JP4054046B2 JP4054046B2 (ja) | 2008-02-27 |
Family
ID=38587326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006066308A Active JP4054046B2 (ja) | 2006-03-10 | 2006-03-10 | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4054046B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009192311A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 発雷予測装置およびその方法、プログラム |
JP2009192312A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 発雷予測装置およびその方法、プログラム |
JP2011065380A (ja) * | 2009-09-16 | 2011-03-31 | Nippon Hoso Kyokai <Nhk> | 意見分類装置およびプログラム |
WO2016163043A1 (ja) * | 2015-04-10 | 2016-10-13 | 株式会社ソリトンシステムズ | 電子メール誤送信判定装置、電子メール送信システム及び記録媒体 |
CN112256849A (zh) * | 2020-10-20 | 2021-01-22 | 深圳前海微众银行股份有限公司 | 模型训练方法、文本检测方法、装置、设备和存储介质 |
-
2006
- 2006-03-10 JP JP2006066308A patent/JP4054046B2/ja active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009192311A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 発雷予測装置およびその方法、プログラム |
JP2009192312A (ja) * | 2008-02-13 | 2009-08-27 | Nippon Telegr & Teleph Corp <Ntt> | 発雷予測装置およびその方法、プログラム |
JP2011065380A (ja) * | 2009-09-16 | 2011-03-31 | Nippon Hoso Kyokai <Nhk> | 意見分類装置およびプログラム |
WO2016163043A1 (ja) * | 2015-04-10 | 2016-10-13 | 株式会社ソリトンシステムズ | 電子メール誤送信判定装置、電子メール送信システム及び記録媒体 |
US10311408B2 (en) | 2015-04-10 | 2019-06-04 | Soliton Systems K.K. | Electronic mail wrong transmission determination apparatus, electronic mail transmission system, and recording medium |
US11100471B2 (en) | 2015-04-10 | 2021-08-24 | Soliton Systems K.K. | Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program |
CN112256849A (zh) * | 2020-10-20 | 2021-01-22 | 深圳前海微众银行股份有限公司 | 模型训练方法、文本检测方法、装置、设备和存储介质 |
CN112256849B (zh) * | 2020-10-20 | 2024-02-13 | 深圳前海微众银行股份有限公司 | 模型训练方法、文本检测方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4054046B2 (ja) | 2008-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arora et al. | Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis | |
RU2678716C1 (ru) | Использование автоэнкодеров для обучения классификаторов текстов на естественном языке | |
US11210470B2 (en) | Automatic text segmentation based on relevant context | |
CN110110062B (zh) | 机器智能问答方法、装置与电子设备 | |
US9477652B2 (en) | Machine learning dialect identification | |
Jin et al. | A novel lexicalized HMM-based learning framework for web opinion mining | |
US11544177B2 (en) | Mapping of test cases to test data for computer software testing | |
KR20190125153A (ko) | 텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법 | |
KR102310487B1 (ko) | 속성 단위 리뷰 분석 장치 및 방법 | |
CN113011186B (zh) | 命名实体识别方法、装置、设备及计算机可读存储介质 | |
CN112711948A (zh) | 一种中文句子的命名实体识别方法及装置 | |
CN116821318B (zh) | 基于大语言模型的业务知识推荐方法、装置及存储介质 | |
US11755668B1 (en) | Apparatus and method of performance matching | |
CN111753082A (zh) | 基于评论数据的文本分类方法及装置、设备和介质 | |
US20230169058A1 (en) | Efficient Embedding Table Storage and Lookup | |
CN111400584A (zh) | 联想词的推荐方法、装置、计算机设备和存储介质 | |
CN110705304A (zh) | 一种属性词提取方法 | |
Patel et al. | Dynamic lexicon generation for natural scene images | |
Liu et al. | Open intent discovery through unsupervised semantic clustering and dependency parsing | |
JP4054046B2 (ja) | 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
Bodrunova et al. | Topics in the Russian Twitter and relations between their interpretability and sentiment | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
CN113486143A (zh) | 一种基于多层级文本表示及模型融合的用户画像生成方法 | |
US20230178073A1 (en) | Systems and methods for parsing and correlating solicitation video content | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070918 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4054046 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131214 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |