JP6649318B2 - 言語情報分析装置および方法 - Google Patents
言語情報分析装置および方法 Download PDFInfo
- Publication number
- JP6649318B2 JP6649318B2 JP2017106061A JP2017106061A JP6649318B2 JP 6649318 B2 JP6649318 B2 JP 6649318B2 JP 2017106061 A JP2017106061 A JP 2017106061A JP 2017106061 A JP2017106061 A JP 2017106061A JP 6649318 B2 JP6649318 B2 JP 6649318B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- dictionary
- score
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 7
- 230000008451 emotion Effects 0.000 claims description 54
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000000877 morphologic effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 239000012491 analyte Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 208000019901 Anxiety disease Diseases 0.000 description 15
- 230000036506 anxiety Effects 0.000 description 15
- 230000002996 emotional effect Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 206010022998 Irritability Diseases 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000004579 scanning voltage microscopy Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
11 単語組抽出部
11A 形態素解析部
11B 構文解析部
11C 単語組選択部
12 スコア計算部
13 辞書記憶部
14 出力部
100 属性分析装置
200 コンピュータシステム
201 記録媒体
Claims (8)
- 分析対象テキストを入力する入力手段と、
上記入力手段から入力された上記分析対象テキストから、単語、および、係り受け関係にある複数の単語からなる単語組を、抽出する抽出手段と、
辞書エントリとして登録された、単独の単語および単語組のそれぞれについて予め定められた複数の属性カテゴリに関するスコアを記憶する辞書手段と、
上記抽出手段により抽出された上記単語および上記単語組を、上記辞書手段に上記辞書エントリとして登録された上記単独の単語および上記単語組と照合し、照合結果に基づいて、上記辞書手段に上記辞書エントリとして登録された上記単独の単語および上記単語組の上記予め定められた複数の属性カテゴリに関するスコアを所定の規則の下で取得して上記入力された分析対象テキストの上記予め定められた複数の属性カテゴリに関するスコアを計算するスコア計算手段とを有し、
上記所定の規則は、
上記スコア計算手段は、上記抽出手段により抽出され、かつ、同一の属性カテゴリに関して登録されている上記辞書エントリのいずれかに合致し、さらに、部分的に重複する上記単語または上記単語組がある場合、上記同一の属性カテゴリに関しては、当該部分的に重複する上記単語または上記単語組のうち、もっとも単語数の大きな単語組についてのみ、スコアを取得し、それ以外の上記単語または上記単語組についてはスコアを取得しない、
というものであることを特徴とする言語情報分析装置。 - 上記抽出手段から抽出される上記単語および上記単語組は、名詞、動詞、形容詞、または副詞の単語からなる請求項1記載の言語情報分析装置。
- 上記入力手段から入力された上記分析対象テキストが動詞および当該動詞に対して否定を意味する品詞を含む場合、当該動詞を否定形に置き換えて単語とする請求項1または2のいずれかに記載の言語情報分析装置。
- 上記入力手段から入力された上記分析対象テキストが一連の複数の名詞を含む場合、上記複数の名詞を連結して1つの単語とする請求項1〜3のいずれかに記載の言語情報分析装置。
- 上記属性カテゴリは、複数の感情属性カテゴリまたは複数の印象属性カテゴリである請求項1〜4のいずれかに記載の言語情報分析装置。
- 上記抽出手段は、形態素解析手段および構文解析手段を含む請求項1〜5のいずれかに記載の言語情報分析装置。
- 入力手段が分析対象テキストを入力するステップと、
抽出手段が、上記入力手段から入力された上記分析対象テキストから、単語、および、係り受け関係にある複数の単語からなる単語組を、抽出するステップと、
スコア計算手段が、辞書エントリとして登録された、単独の単語および単語組のそれぞれについて予め定められた複数の属性カテゴリに関するスコアを記憶する辞書手段を参照して、上記抽出手段により抽出された上記単語および上記単語組を、上記辞書エントリとして登録された上記単独の単語および上記単語組と照合し、照合結果に基づいて、上記辞書手段に上記辞書エントリとして登録された上記単独の単語および上記単語組の上記予め定められた複数の属性カテゴリに関するスコアを所定の規則の下で取得し、上記入力された分析対象テキストの上記予め定められた複数の属性カテゴリに関するスコアを計算するステップとを有し、
上記所定の規則は、
上記スコア計算手段は、上記抽出手段により抽出され、かつ、同一の属性カテゴリに関して登録されている上記辞書エントリのいずれかに合致し、さらに、部分的に重複する上記単語または上記単語組がある場合、上記同一の属性カテゴリに関しては、当該部分的に重複する上記単語または上記単語組のうち、もっとも単語数の大きな単語組についてのみ、スコアを取得し、それ以外の上記単語または上記単語組についてはスコアを取得しない、
というものであることを特徴とする言語情報分析方法。 - コンピュータを、
入力手段から入力された分析対象テキストから、単語、および、係り受け関係にある複数の単語からなる単語組を、抽出する抽出手段、
辞書エントリとして登録された、単独の単語および単語組のそれぞれについて予め定められた複数の属性カテゴリに関するスコアを記憶する辞書手段、および、
上記抽出手段により抽出された上記単語および上記単語組を、上記辞書手段に上記辞書エントリとして登録された上記単独の単語および上記単語組と照合し、照合結果に基づいて、上記辞書手段に上記辞書エントリとして登録された上記単独の単語および上記単語組の上記予め定められた複数の属性カテゴリに関するスコアを所定の規則の下で取得して上記入力された分析対象テキストの上記予め定められた複数の属性カテゴリに関するスコアを計算するスコア計算手段して実行させるために使用されるコンピュータプログラムであって、
上記所定の規則は、
上記スコア計算手段は、上記抽出手段により抽出され、かつ、同一の属性カテゴリに関して登録されている上記辞書エントリのいずれかに合致し、さらに、部分的に重複する上記単語または上記単語組がある場合、上記同一の属性カテゴリに関しては、当該部分的に重複する上記単語または上記単語組のうち、もっとも単語数の大きな単語組についてのみ、スコアを取得し、それ以外の上記単語または上記単語組についてはスコアを取得しない、
というものであることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017106061A JP6649318B2 (ja) | 2017-05-30 | 2017-05-30 | 言語情報分析装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017106061A JP6649318B2 (ja) | 2017-05-30 | 2017-05-30 | 言語情報分析装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018200650A JP2018200650A (ja) | 2018-12-20 |
JP6649318B2 true JP6649318B2 (ja) | 2020-02-19 |
Family
ID=64668229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017106061A Active JP6649318B2 (ja) | 2017-05-30 | 2017-05-30 | 言語情報分析装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6649318B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102195246B1 (ko) * | 2019-03-15 | 2020-12-24 | 숭실대학교산학협력단 | 음성 신호를 이용한 감정 분류 방법, 이를 수행하기 위한 기록 매체 및 장치 |
JP7229887B2 (ja) * | 2019-09-11 | 2023-02-28 | 株式会社日立製作所 | 文書情報抽出装置、および文書情報抽出方法 |
KR102443629B1 (ko) * | 2020-06-04 | 2022-09-15 | 주식회사 웨이커 | 딥러닝 nlp 모델을 활용한 뉴스 긍정도 분석 솔루션 및 시스템 |
KR102466428B1 (ko) * | 2020-06-04 | 2022-11-11 | 주식회사 웨이커 | 뉴스 긍정도 분석을 위한 인공신경망 학습 모델 및 장치 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005122296A (ja) * | 2003-10-14 | 2005-05-12 | Net Agent Kk | 文書カテゴリ判定方法及び文書カテゴリ抽出システム |
JP6206840B2 (ja) * | 2013-06-19 | 2017-10-04 | 国立研究開発法人情報通信研究機構 | テキストマッチング装置、テキスト分類装置及びそれらのためのコンピュータプログラム |
JP2015125570A (ja) * | 2013-12-26 | 2015-07-06 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、及びプログラム |
-
2017
- 2017-05-30 JP JP2017106061A patent/JP6649318B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018200650A (ja) | 2018-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10319370B2 (en) | System and method for data-driven socially customized models for language generation | |
US10936664B2 (en) | Dialogue system and computer program therefor | |
WO2019153522A1 (zh) | 智能交互方法、电子装置及存储介质 | |
JP6649318B2 (ja) | 言語情報分析装置および方法 | |
WO2016051551A1 (ja) | 文章生成システム | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
WO2012000043A1 (en) | System and method of providing a computer-generated response | |
Krishnan et al. | Emotion detection of tweets using naïve bayes classifier | |
Reganti et al. | Modeling satire in English text for automatic detection | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
Alnajjar et al. | Talent, Skill and Support. A Method for Automatic Creation of Slogans | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
Krommyda et al. | Emotion detection in Twitter posts: a rule-based algorithm for annotated data acquisition | |
JP5872183B2 (ja) | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 | |
JP2014219872A (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
Dey et al. | Emotion extraction from real time chat messenger | |
Lee et al. | Speech2Mindmap: testing the accuracy of unsupervised automatic mindmapping technology with speech recognition | |
Jain et al. | TexEmo: Conveying emotion from text-the study | |
JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
JP5882241B2 (ja) | 質問応答用検索キーワード生成方法、装置、及びプログラム | |
JP6858721B2 (ja) | コンテンツに関する対話を実施可能な対話制御装置、プログラム及び方法 | |
Zhou et al. | Using paralinguistic information to disambiguate user intentions for distinguishing phrase structure and sarcasm in spoken dialog systems | |
Tayal et al. | DARNN: Discourse Analysis for Natural languages using RNN and LSTM. | |
Ahmad et al. | Sentiment Analysis Evaluating Net Brand Reputation of Mobile Phones Using Polarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6649318 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |