JP6502233B2 - 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 - Google Patents
入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 Download PDFInfo
- Publication number
- JP6502233B2 JP6502233B2 JP2015210199A JP2015210199A JP6502233B2 JP 6502233 B2 JP6502233 B2 JP 6502233B2 JP 2015210199 A JP2015210199 A JP 2015210199A JP 2015210199 A JP2015210199 A JP 2015210199A JP 6502233 B2 JP6502233 B2 JP 6502233B2
- Authority
- JP
- Japan
- Prior art keywords
- impression
- score
- phrase
- objective
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
特許文献1から3のいずれに記載された技術も、テキスト自体から読み手が受け取る客観的印象までも考慮したものではない。例えば、「良い天気ですね」は丁寧さを感じるのに対し、「良い天気だね」は親しみを感じるというように、同じ内容であっても印象は異なると考えられる。
主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
してコンピュータを機能させることを特徴とする。
印象要素は、感情及び/又は印象を表す語である
ようにコンピュータを機能させることも好ましい。
客観的印象算出手段における各印象要素の尤度は、入力テキストに含まれるフレーズ全体から計数された各印象要素の個数に対する、フレーズリストの当該印象要素の個数の比率である
ようにコンピュータを機能させることも好ましい。
印象辞書記憶手段の印象辞書は、各フレーズに、当該印象要素に適合するスコアが更に対応付けられており、
客観的印象算出手段における各印象要素の尤度は、入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、フレーズリストの当該印象要素のスコアの比率である
ようにコンピュータを機能させることも好ましい。
印象差分提示手段は、
印象要素毎に、主観的印象に基づく当該印象要素のスコアから、客観的印象に基づく該印象要素のスコアを差し引いた印象差分情報を算出するか、
又は、
主観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアから、客観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアを差し引いた印象差分情報を算出する
ようにコンピュータを機能させることも好ましい。
印象差分情報がマイナスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合)、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する削除候補抽出手段と
してコンピュータを更に機能させることも好ましい。
印象差分がプラスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合)、印象辞書記憶手段に記憶された当該印象要素に対する1つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する追加候補抽出手段と
してコンピュータを更に機能させることも好ましい。
複数のフレーズiを、各カテゴリGjに区分したカテゴリ辞書を記憶したカテゴリ辞書記憶手段としてコンピュータを更に機能させ、
追加候補抽出手段は、
フレーズリストの各フレーズiについて、カテゴリ辞書記憶手段を用いてカテゴリを対応付け、
追加候補フレーズjについて、カテゴリ辞書記憶手段を用いてカテゴリGj を対応付け、
追加候補フレーズj毎に、入力テキストに含まれるフレーズ全体から計数された各カテゴリΣCの合計個数に対する、当該追加候補フレーズjの当該カテゴリGjの個数のカテゴリ関連比率Prel(j)(=Gj/ΣG)を算出し、
追加候補フレーズj毎に、カテゴリ関連比率Prel(j)と、印象辞書記憶手段のスコアPdic(j)とに基づくスコア関連比率P(j)を算出し、
スコア関連比率P(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることも好ましい。
異なるフレーズi及びフレームj間の共起頻度を表す共起辞書を記憶した共起辞書記憶手段としてコンピュータを更に機能させ、
追加候補抽出手段は、
共起辞書記憶手段を用いて、フレーズリストの各フレーズiと、追加候補フレーズjとの間の共起頻度C(i,j)を総当たり的に抽出し、
抽出された全ての共起頻度C(i,j)を合計した合計共起頻度ΣCを算出し、
追加候補フレーズj毎に、フレーズリストの全てのフレーズΣiに対する共起頻度C(j)を合計したフレーズ共起頻度ΣC(j)を算出し、
追加候補フレーズj毎に、合計共起頻度ΣCに対するフレーズ共起頻度ΣC(j)の共起関連比率Prel(j)を算出し、
追加候補フレーズj毎に、共起関連比率Prel(j)と、印象辞書記憶手段のスコアPdic(j)とに基づくスコア関連比率P(j)を算出し、
スコア関連比率P(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることも好ましい。
入力テキストは、顔文字を含み、
形態素解析手段は、一連の顔文字を1つの単語として抽出する
ようにコンピュータを機能させることも好ましい。
入力テキストは、ユーザによって記述された、ブログサーバ又はSNSサーバへの投稿文章であり、
印象差分提示手段は、入力テキストがブログサーバ又はSNSサーバで公開される前に、印象差分情報を当該ユーザに明示する
ようにコンピュータを機能させることも好ましい。
主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
を有することを特徴とする。
主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
装置は、印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶部を有し、
装置は、
入力テキストを、形態素解析によってフレーズに区分する第1のステップと、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成する第2のステップと、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する第3のステップと、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する第4のステップと
を有することを特徴とする。
図3は、本発明における各機能構成部の第1の処理フローを表す説明図である。
テキスト入力部101は、印象を分析すべきテキストを入力する。「入力テキスト」とは、例えば書き手となるテキスト作成者自らが記述したテキストであってもよいし、予め何らかの方法で作成されたテキストであってもよい。具体的には、入力テキストは、推敲されるべき文章が適し、例えば、メールの送信文章や、SNS(ブログ)サーバへの投稿文章であってもよい。勿論、入力テキストには、顔文字や絵文字を含むものであってもよい。
図2(a)及び図3によれば、以下のようなテキストが入力されている。
入力テキストの例:「今日はパンの日です(´ー`)よい週末を♪」
入力テキストは、形態素解析部12へ出力される。
主観的印象入力部102は、ユーザから見た当該テキストに与えたい主観的な印象要素を入力する。「印象要素」とは、感情(emotion, feeling)及び/又は印象(impression)を表す語であって、具体的には感情語や形容詞がある。尚、主観的印象入力部102はオプション的なものであって、1つ以上の印象要素は、システムとして予め固定的に設定されたものであってもよい。
印象要素の例:「喜び」「驚き」「嫌悪」「悲しみ」「期待」・・・
「明るい」「やわらかい」・・・
一方で、「客観的印象」とは、入力テキストから得られる1つ以上の印象要素をいう。
尚、主観的印象には、印象要素毎にスコアが対応付けられている。スコアは、入力テキストに対して、書き手自ら、以下のように表したものであってもよい。
(実施例1)当該印象要素に対する適合割合(%)で表したもの
(実施例2)当該印象要素に対して複数段階のレベル(1〜10段階)で表したもの
(実施例3)当該印象要素に対して単に有/無(0又は1)で表したもの
図2(a)及び図3によれば、入力テキスト「今日はパンの日です(´ー`)よい週末を♪」に対して、以下のような主観的印象が入力されている。
印象要素毎のスコアの例:
「喜び」=80%
「驚き」=50%
「嫌悪」=0%
主観的印象は、印象差分提示部15へ出力される。
印象辞書記憶部11は、印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する。印象辞書は、予め作成されたものであり、人手で作成されたものであってもよいし、機械的に作成されたものであってもよい。
図3によれば、印象要素毎に、以下のようなフレーズが対応付けられている。
[印象要素] [フレーズ]
「喜び」 -> 週末、家族と、♪、(^^)v、・・・
「驚き」 -> 発表会、詳しくはコチラ、パンの日、(;゜Д゜)(゜Д゜;)、
「嫌悪」 -> 謝罪、注意、。。。、(´ー`)、・・・
印象辞書記憶部11は、フレーズリスト生成部13から参照される。
形態素解析部12は、テキスト入力部101からの入力テキストを、形態素解析によってフレーズに区分する。形態素解析とは、文法及び単語辞書を情報源として用いて、自然言語で書かれた文を言語として意味を持つ最小単位である形態素(Morpheme)に分割し、それぞれの品詞を判別する技術をいう。尚、形態素解析部12は、一連の顔文字を1つの単語として抽出する。
入力テキスト「今日はパンの日です(´ー`)よい週末を♪」
形態素 「今日/は/パン/の/日/です/(´ー`)/よい/週末/を/♪」
区分された形態素は、フレーズリスト生成部13へ出力される。
フレーズリスト生成部13は、入力テキストから区分されたフレーズ毎に、印象辞書記憶部11を用いて、印象要素及びスコアを対応付けたフレーズリストを生成する。印象辞書に登録された各フレーズに、印象要素を付与する。印象辞書に登録されていないフレーズは、例えば空白とする。
図2によれば、以下のようなフレーズリストが作成される。
[フレーズ] [印象要素]
・・・・・
週末 -> 喜び
♪ -> 喜び
パンの日 -> 驚き
(´ー`) -> 嫌悪
生成されたフレーズリストは、客観的印象算出部14へ出力される。
客観的印象算出部14は、フレーズリストに対して、読み手が受け取る印象を推定する。具体的には、客観的印象算出部14は、入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する。
[印象要素] [スコア]
喜び -> 50%=2個/4個
驚き -> 25%=1個/4個
嫌悪 -> 25%=1個/4個
算出された客観的印象は、印象差分提示部15へ出力される。
印象差分提示部15は、主観的印象に基づく当該印象要素のスコアと、客観的印象に基づくその印象要素のスコアとを比較した印象差分情報を算出する。
図2(b)によれば、印象要素毎に、主観的印象と客観的印象とが比較して表示されている。
[印象要素] [主観的印象] [客観的印象]
喜び -> 80% 50%
驚き -> 50% 25%
嫌悪 -> 0% 25%
(印象差分情報1)印象差分情報は、印象要素毎に、主観的印象に基づく当該印象要素のスコアから、客観的印象に基づくその印象要素のスコアを差し引いたものである。
図2(c)によれば、印象要素毎に、主観的印象のスコアから、客観的印象のスコアを差し引いた差分が表示される。
[印象要素] [印象差分情報]
喜び -> +30%(=80%−50%)
驚き -> +25%(=50%−25%)
嫌悪 -> −25%(= 0%−20%)
100(最大喜び)----50(基準)----0(最大嫌悪)
ここで、例えば50を基準スタートとして、以下のように総合印象スコアを算出する。
スコア「喜び」+30で、スコア「基準」50+30=80
次に、スコア「嫌悪」−20で、80−20=60
総合印象スコア=60
尚、総合印象スコアを算出する際に、印象要素毎のスコアに重みを付けて算出するものであってもよい。
重み係数「喜び」:α、重み係数「嫌悪」:β
「喜びスコア」+30で、基準50+(30×α)
次に、「嫌悪スコア」−20で、(基準50+(30×α))−(20×β)
総合印象スコア=(基準50+(30×α))−(20×β)
これによって、書き手となる発信側のテキスト作成者自ら、印象差分提示部15から提示された印象差分情報を一見することによって、印象に対するギャップを埋めるようにテキストを推敲することができる。
(印象辞書記憶部11)
図4の印象辞書記憶部11の印象辞書は、図3と比較して、各フレーズに、当該印象要素に適合するスコアが更に対応付けられている。
フレーズ「週末」は、 印象要素「喜び」に対して適合率20%と設定
フレーズ「家族と」は、 印象要素「喜び」に対して適合率40%と設定
フレーズ「♪」は、 印象要素「喜び」に対して適合率10%と設定
フレーズ「(^^)v」は、 印象要素「喜び」に対して適合率10%と設定
・・・・・
フレーズ「発表会」は、 印象要素「驚き」に対して適合率20%と設定
フレーズ「詳しくはコチラ」は、印象要素「驚き」に対して適合率20%と設定
フレーズ「パンの日」は、印象要素「驚き」に対して適合率10%と設定
フレーズ「(;゜Д゜)(゜Д゜;)」は、印象要素「驚き」に対して適合率10%と設定
・・・・・
フレーズ「謝罪」は、 印象要素「嫌悪」に対して適合率20%と設定
フレーズ「注意」は、 印象要素「嫌悪」に対して適合率30%と設定
フレーズ「。。。」は、 印象要素「嫌悪」に対して適合率10%と設定
フレーズ「(´ー`)」は、印象要素「嫌悪」に対して適合率10%と設定
・・・・・
図4のフレーズリスト生成部13は、図3と比較して、フレーズリストのフレーズ毎に、印象要素に加えて、印象辞書記憶部11から抽出したスコアが更に対応付けられている。
図4の客観的印象算出部14は、図3と比較して、各印象要素の尤度が、例えば、入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、フレーズリストの当該印象要素のスコアの比率である。例えば、以下のように客観的印象を算出する。
[印象要素] [スコア]
喜び -> 60%(=30%/50%)
驚き -> 20%(=10%/50%)
嫌悪 -> 20%(=10%/50%)
図4によれば、印象差分提示部15は、以下のように、印象要素毎に、主観的印象のスコアから、客観的印象のスコアを差し引いた差分が表示される。
[印象要素] [印象差分情報]
喜び -> +20%(=80%−60%)
驚き -> +30%(=50%−20%)
嫌悪 -> −20%(= 0%−20%)
削除候補抽出部16は、印象差分情報がマイナスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合)、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する。
図5(a)によれば、印象差分情報がマイナスとなるフレーズ「(´ー`)」が、削除候補としてユーザに明示されている。
例えば顔文字は、一見して理解されやすい反面、誤った印象を与える場合もある。「(´ー`)」は、「しらーっ」とした嫌悪感を与える一方で、その印象は一見して理解しにくい。そのために、主観的印象に反する客観的印象のフレーズを、削除候補としてユーザに明示することができる。
追加候補抽出部17は、印象差分がプラスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合)、印象辞書記憶部11に記憶された当該印象要素に対する1つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する。
[印象要素] [追加候補フレーズ]
喜び -> 「家族と」「(^^)v」
驚き -> 「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」
図5(b)によれば、印象差分情報がプラスとなるフレーズの中から、「家族と」「(^^)v」が、追加候補としてユーザに明示されている。
<カテゴリ辞書を用いた追加候補フレーズの選択>
<共起辞書を用いた追加候補フレーズの選択>
図6は、カテゴリ辞書を用いた追加候補の抽出処理を表す説明図である。
図7は、図6に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。
カテゴリ辞書は、予め作成されたものであって、人手で作成されたものであってもよいし、機械的に作成されたものであってもよい。
図3によれば、カテゴリ毎に、以下のようなフレーズが対応付けられている。
[カテゴリ] [フレーズ]
「雑談」 -> (´ー`)、よい、家族と、週末、♪、(^^)v、・・・
「豆知識」-> 今日、パンの日、詳しくはコチラ、 (;゜Д゜)(゜Д゜;) 、・・・
「端末」 -> 発表会、・・・
「商品・サービス」-> ・・・
「キャンペーン」 -> ・・・
「謝罪」 -> ・・・
(S11)フレーズリストの各フレーズiについて、カテゴリ辞書記憶部171を用いてカテゴリを対応付ける。
図6によれば、フレーズリストは、以下のように対応付けられている。
フレーズ「今日」に、 カテゴリ「豆知識」が対応
フレーズ「よい」に、 カテゴリ「雑談」が対応
フレーズ「週末」に、 カテゴリ「雑談」が対応
フレーズ「♪」に、 カテゴリ「雑談」が対応
フレーズ「パンの日」に、カテゴリ「豆知識」が対応
フレーズ「(´ー`)」に、カテゴリ「雑談」が対応
ここで、図6によれば、前述した図3及び図4における追加候補フレーズとして、「家族と」「(^^)v」「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」がある。
フレーズ「家族と」に、 カテゴリ「雑談」が対応
フレーズ「(^^)v」に、 カテゴリ「雑談」が対応
フレーズ「発表会」に、 カテゴリ「端末」が対応
フレーズ「詳しくはコチラ」に、カテゴリ「豆知識」が対応
フレーズ「(;゜Д゜)(゜Д゜;)」に、カテゴリ「豆知識」が対応
図6によれば、以下のようにカテゴリ関連比率Prel(j)が算出される。
Prel(家族と) =4個(雑談の個数) /7個(全体の個数)=57%
Prel((^^)v) =4個(雑談の個数) /7個(全体の個数)=57%
Prel(発表会) =0個(端末の個数) /7個(全体の個数)= 0%
Prel(詳しくはコチラ)=2個(豆知識の個数)/7個(全体の個数)=29%
Prel((;゜Д゜)(゜Д゜;))=2個(豆知識の個数)/7個(全体の個数)=29%
P(i)=α・Pdic(i)+(1-α)Prel(i)
α:印象辞書のスコアを重視する場合には、 αを大きく設定する
入力テキストとの適合度を重視する場合には、αを小さく設定する
α=0.5
P(家族と) =α×Pdic(家族と)+α×Prel(家族と)
=α×40%+α×57%=49%
P((^^)v) =α×Pdic((^^)v)+α×Prel((^^)v)=α×10%+α×57%=34%
P(発表会) =α×Pdic(発表会)+α×Prel(発表会)=α×20%+α×0%=10%
P(詳しくはコチラ)=α×Pdic(詳しくはコチラ)+α×Prel(詳しくはコチラ)
=α×20%+α×29%=25%
P((;゜Д゜)(゜Д゜;))=α×Pdic((;゜Д゜)(゜Д゜;))
+α×Prel((;゜Д゜)(゜Д゜;))
=α×10%+α×29%=20%
図7によれば、スコア関連比率P(j)が閾値30%以上となる追加候補フレーズ「家族と」「(^^)v」のみが、最終的な追加候補フレーズとして選択される。
図8は、共起辞書を用いた追加候補の抽出処理を表す説明図である。
図9は、図8に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。
(S21)共起辞書記憶部172を用いて、フレーズリストの各フレーズiと、追加候補フレーズjとの間の共起頻度C(i,j)を総当たり的に抽出する。
図8によれば、前述した図3及び図4における追加候補フレーズとして、「家族と」「(^^)v」「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」がある。
図8によれば、合計共起頻度ΣCは、1179回と算出される。
図8によれば、以下のようにフレーズ共起頻度が算出される。
[フレーズ] [フレーズ共起頻度ΣC(j)]
家族と -> 257回
(^^)v -> 232回
発表会 -> 190回
詳しくはコチラ -> 300回
(;゜Д゜)(゜Д゜;) -> 200回
図8によれば、以下のように共起関連比率が算出される。
Prel(家族と) =257回/1,179回=22%
Prel((^^)v) =232回/1,179回=20%
Prel(発表会) =190回/1,179回=16%
Prel(詳しくはコチラ)=300回/1,179回=25%
Prel((;゜Д゜)(゜Д゜;) =200回/1,179回=17%
P(i)=α・Pdic(i)+(1-α)Prel(i)
α=0.5
P(家族と)=α×Pdic(家族と)+α×Prel(家族と)=α×40%+α×22%=31%
P((^^)v)=α×Pdic((^^)v)+α×Prel((^^)v)=α×10%+α×20%=15%
P(発表会)=α×Pdic(発表会)+α×Prel(発表会)=α×20%+α×16%=18%
P(詳しくはコチラ)=α×Pdic(詳しくはコチラ)+α×Prel(詳しくはコチラ)
=α×20%+α×25%=22.5%
P((;゜Д゜)(゜Д゜;))=α×Pdic((;゜Д゜)(゜Д゜;))
+α×Prel((;゜Д゜)(゜Д゜;))
=α×10%+α×17%=13.5%
図9によれば、スコア関連比率P(j)が閾値20%以上となる追加候補フレーズ「家族と」「詳しくはコチラ」のみが、最終的な追加候補フレーズとして選択される。
101 テキスト入力部
102 主観的印象入力部
11 印象辞書記憶部
12 形態素解析部
13 フレーズリスト生成部
14 客観的印象算出部
15 印象差分提示部
16 削除候補抽出部
17 追加候補抽出部
171 カテゴリ辞書記憶部
172 共起辞書記憶部
2 端末
3 SNS(ブログ)サーバ
Claims (13)
- 入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにコンピュータを機能させるテキスト印象を分析するプログラムであって、
前記主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
前記入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
してコンピュータを機能させることを特徴とするプログラム。 - 前記印象要素は、感情及び/又は印象を表す語である
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。 - 前記客観的印象算出手段における各印象要素の尤度は、前記入力テキストに含まれるフレーズ全体から計数された各印象要素の個数に対する、前記フレーズリストの当該印象要素の個数の比率である
ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。 - 前記印象辞書記憶手段の前記印象辞書は、各フレーズに、当該印象要素に適合するスコアが更に対応付けられており、
前記客観的印象算出手段における各印象要素の尤度は、前記入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、前記フレーズリストの当該印象要素のスコアの比率である
ようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。 - 前記印象差分提示手段は、
印象要素毎に、前記主観的印象に基づく当該印象要素のスコアから、前記客観的印象に基づく該印象要素のスコアを差し引いた印象差分情報を算出するか、
又は、
前記主観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアから、前記客観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアを差し引いた印象差分情報を算出する
ようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載のプログラム。 - 前記印象差分情報がマイナスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合)、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する削除候補抽出手段と
してコンピュータを更に機能させることを特徴とする請求項5に記載のプログラム。 - 前記印象差分がプラスである場合(主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合)、前記印象辞書記憶手段に記憶された当該印象要素に対する1つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する追加候補抽出手段と
してコンピュータを更に機能させることを特徴とする請求項5に記載のプログラム。 - 複数のフレーズiを、各カテゴリGjに区分したカテゴリ辞書を記憶したカテゴリ辞書記憶手段としてコンピュータを更に機能させ、
前記追加候補抽出手段は、
前記フレーズリストの各フレーズiについて、前記カテゴリ辞書記憶手段を用いてカテゴリを対応付け、
前記追加候補フレーズjについて、前記カテゴリ辞書記憶手段を用いてカテゴリGj を対応付け、
前記追加候補フレーズj毎に、前記入力テキストに含まれるフレーズ全体から計数された各カテゴリΣCの合計個数に対する、当該追加候補フレーズjの当該カテゴリGjの個数のカテゴリ関連比率Prel(j)(=Gj/ΣG)を算出し、
前記追加候補フレーズj毎に、前記カテゴリ関連比率Prel(j)と、前記印象辞書記憶手段のスコアPdic(j)とに基づくスコア関連比率P(j)を算出し、
前記スコア関連比率P(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることを特徴とする請求項7に記載のプログラム。 - 異なるフレーズi及びフレームj間の共起頻度を表す共起辞書を記憶した共起辞書記憶手段としてコンピュータを更に機能させ、
前記追加候補抽出手段は、
前記共起辞書記憶手段を用いて、前記フレーズリストの各フレーズiと、前記追加候補フレーズjとの間の共起頻度C(i,j)を総当たり的に抽出し、
抽出された全ての共起頻度C(i,j)を合計した合計共起頻度ΣCを算出し、
前記追加候補フレーズj毎に、前記フレーズリストの全てのフレーズΣiに対する共起頻度C(j)を合計したフレーズ共起頻度ΣC(j)を算出し、
前記追加候補フレーズj毎に、合計共起頻度ΣCに対するフレーズ共起頻度ΣC(j)の共起関連比率Prel(j)を算出し、
前記追加候補フレーズj毎に、前記共起関連比率Prel(j)と、前記印象辞書記憶手段のスコアPdic(j)とに基づくスコア関連比率P(j)を算出し、
前記スコア関連比率P(j)が所定閾値以上となる前記追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることを特徴とする請求項7に記載のプログラム。 - 前記入力テキストは、顔文字を含み、
前記形態素解析手段は、一連の顔文字を1つの単語として抽出する
ようにコンピュータを機能させることを特徴とする請求項1から9のいずれか1項に記載のプログラム。 - 前記入力テキストは、ユーザによって記述された、ブログサーバ又はSNS(Social Networking Service)サーバへの投稿文章であり、
前記印象差分提示手段は、前記入力テキストがブログサーバ又はSNSサーバで公開される前に、前記印象差分情報を当該ユーザに明示する
ようにコンピュータを機能させることを特徴とする請求項1から10のいずれか1項に記載のプログラム。 - 入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置であって、
前記主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
前記入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
を有することを特徴とする装置。 - 入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置のテキスト印象分析方法であって、
前記主観的印象は、1つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
前記装置は、印象要素毎に、1つ以上のフレーズ(単語及び自立語)が対応付けられた印象辞書を記憶する印象辞書記憶部を有し、
前記装置は、
前記入力テキストを、形態素解析によってフレーズに区分する第1のステップと、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成する第2のステップと、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する第3のステップと、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する第4のステップと
を有することを特徴とする装置のテキスト印象分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015210199A JP6502233B2 (ja) | 2015-10-26 | 2015-10-26 | 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015210199A JP6502233B2 (ja) | 2015-10-26 | 2015-10-26 | 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017084015A JP2017084015A (ja) | 2017-05-18 |
JP6502233B2 true JP6502233B2 (ja) | 2019-04-17 |
Family
ID=58711110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015210199A Active JP6502233B2 (ja) | 2015-10-26 | 2015-10-26 | 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6502233B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11799813B2 (en) | 2019-03-29 | 2023-10-24 | Aill Inc. | Communication support server, communication support system, communication support method, and communication support program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212493A (ja) * | 1996-01-31 | 1997-08-15 | Fuji Xerox Co Ltd | 文書処理装置 |
JP4614526B2 (ja) * | 2000-11-24 | 2011-01-19 | 株式会社ジャストシステム | データ分析装置、及びデータ分析用プログラムが記憶された記憶媒体 |
JP2007018234A (ja) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置 |
JP4984606B2 (ja) * | 2006-04-03 | 2012-07-25 | 富士ゼロックス株式会社 | デザイン制作支援装置及びデザイン制作支援プログラム |
JP5121763B2 (ja) * | 2009-03-23 | 2013-01-16 | 株式会社東芝 | 感情推定装置、及び方法 |
-
2015
- 2015-10-26 JP JP2015210199A patent/JP6502233B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017084015A (ja) | 2017-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230325590A1 (en) | Artificial intelligence communication assistance | |
US10579717B2 (en) | Systems and methods for identifying and inserting emoticons | |
Rangel Pardo et al. | Overview of the 3rd Author Profiling Task at PAN 2015 | |
US20160226811A1 (en) | System and method for priority email management | |
KR20160097352A (ko) | 전자 디바이스로 이미지 또는 라벨을 입력하기 위한 시스템 및 방법 | |
EP3167380A1 (en) | System and method for identifying and suggesting emoticons | |
Hilte | The social in social media writing: the impact of age, gender and social class indicators on adolescents' informal online writing practices | |
JP7096172B2 (ja) | キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法 | |
Mehra et al. | Sentimental analysis using fuzzy and naive bayes | |
Bansal et al. | Code-switching patterns can be an effective route to improve performance of downstream NLP applications: A case study of humour, sarcasm and hate speech detection | |
JP6757840B2 (ja) | 文抽出システム、文抽出方法、及びプログラム | |
Farnia et al. | Humor markers in computer mediated communication: emotion perception and response | |
JP6502233B2 (ja) | 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法 | |
WO2018232033A1 (en) | Response center | |
Spina | Emoticons as multifunctional and pragmatic resources: A corpus-based study on Twitter | |
McIntyre | From Cave Paintings to Shakespeare and Back Again: What Are Emoji and Should I Be Afraid? | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
US20220292261A1 (en) | Methods for Emotion Classification in Text | |
Li et al. | Twitter sentiment analysis of the 2016 US Presidential Election using an emoji training heuristic | |
JP2019021157A (ja) | 情報提示システム、情報提示方法及びプログラム | |
Schultz | Gender variation in writing: Analyzing online dating ads | |
CN111897990A (zh) | 获取表情信息的方法、装置和系统 | |
Chen et al. | A cross-cultural survey of emoticon research before 2015 | |
Haney | Sentiment analysis: Providing categorical insight into unstructured textual data | |
KR102238973B1 (ko) | 대화 데이터베이스를 이용한 대화문장 추천 방법 및 그것이 적용된 음성대화장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6502233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |