JP6502233B2

JP6502233B2 - 入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法

Info

Publication number: JP6502233B2
Application number: JP2015210199A
Authority: JP
Inventors: 麻佑岩田; 広海石先; 滝嶋　康弘; 康弘滝嶋
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2015-10-26
Filing date: 2015-10-26
Publication date: 2019-04-17
Anticipated expiration: 2035-10-26
Also published as: JP2017084015A

Description

本発明は、ユーザに対するテキストの作成支援の技術に関する。

人によって作成されたテキストは、メールや、Ｗｅｂ、ＣＭ(Commercial)放送など多種多様なメディアを介して発信されている。twitter（登録商標）やfacebook（登録商標）等のＳＮＳ(Social Networking Service)を介したテキストの発信も多く、企業は特に、ソーシャル・マーケティングとしての広告テキストの発信に利用している。これに対し、読み手となるユーザ側は、そのテキストから何らかの印象を受ける。書き手となる発信側は、できる限り良い印象を読み手へ与え、その企業への満足度や好意に繋げたいと考えている。現状、印象の良いテキストを発信するために、企業であっても個人の担当者が自ら、それまでに蓄積した知見や経験、又は勘等に基づいて作成している。そのために、テキストの作成作業は、属人化しており、多くの手間がかかる。

従来、携帯電話機におけるメールのメッセージの作成を支援する技術がある（例えば特許文献１参照）。この技術によれば、受信メールや返信メールのメッセージに含まれる単語や装飾文字（絵文字／顔文字）を解析し、好感度を５段階で定量化する。そして、メールの交換における好感度の履歴に応じて、返信メールのメッセージ作成時に、装飾文字を挿入付加することできる。これによって、メールについて、読み手側の好感度を上げるようなメッセージを作成することができる。

また、視聴者のプロファイルに応じてコンテンツの構成を提案する技術もある（例えば特許文献２参照）。この技術によれば、視聴者の生体情報や行動情報などのプロファイルと、コンテンツそのものに含まれている構成要素（音声情報、静止画像、動画像情報、テキスト情報など）とから、視聴者の関心をひくように、コンテンツの構成要素を取捨選択する。これによって、視聴者となる個人それぞれの興味をひくように、コンテンツを構成することができる。尚、テキスト情報は、形容詞、形容語を動揺軸、柔和軸の２軸にマッピングすることによって解析される。

更に、ドキュメントの作成者が、予め意図した印象を読み手側に対して与えられるように、色やサイズなどのドキュメント属性を変更する技術もある（例えば特許文献３参照）。この技術によれば、ドキュメントから受ける印象（例えば「暖かく」）を表す１つの感性語を示し、ドキュメント作成者が、その感性語に対して与えたい値を指示する。これによって、所望の感性語に適合するように、色やサイズなどのドキュメント属性が変更される。

特開２００７−２００１５９号公報特開２００８−１４６２５２号公報特開２０１４−００６７０３号公報

特許文献１に記載の技術によれば、絵文字や顔文字という装飾文字から受ける印象を考慮したものである。また、特許文献２に記載の技術によれば、コンテンツの構成要素から受ける印象を考慮したものである。更に、特許文献３に記載の技術によれば、ドキュメントの外観から受ける印象を考慮したものである。

これに対し、本願の発明者らは、テキスト自体から受ける印象を考慮することを考えた。即ち、テキストに対して、書き手が読み手へ与えたいとする主観的印象と、当該テキスト自体から得られる客観的印象との比較情報（印象差分情報）を予め知ることができれば、当該テキストの推敲に有効なのではないか？と考えた。
特許文献１から３のいずれに記載された技術も、テキスト自体から読み手が受け取る客観的印象までも考慮したものではない。例えば、「良い天気ですね」は丁寧さを感じるのに対し、「良い天気だね」は親しみを感じるというように、同じ内容であっても印象は異なると考えられる。

そこで、本発明は、入力テキストに対する主観的印象と客観点印象とを比較するテキスト印象分析プログラム、装置及び方法を提供することを目的とする。

本発明によれば、入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにコンピュータを機能させるテキスト印象を分析するプログラムであって、
主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
してコンピュータを機能させることを特徴とする。

本発明のプログラムにおける他の実施形態によれば、
印象要素は、感情及び／又は印象を表す語である
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
客観的印象算出手段における各印象要素の尤度は、入力テキストに含まれるフレーズ全体から計数された各印象要素の個数に対する、フレーズリストの当該印象要素の個数の比率である
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
印象辞書記憶手段の印象辞書は、各フレーズに、当該印象要素に適合するスコアが更に対応付けられており、
客観的印象算出手段における各印象要素の尤度は、入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、フレーズリストの当該印象要素のスコアの比率である
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
印象差分提示手段は、
印象要素毎に、主観的印象に基づく当該印象要素のスコアから、客観的印象に基づく該印象要素のスコアを差し引いた印象差分情報を算出するか、
又は、
主観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアから、客観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアを差し引いた印象差分情報を算出する
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
印象差分情報がマイナスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合）、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する削除候補抽出手段と
してコンピュータを更に機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
印象差分がプラスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合）、印象辞書記憶手段に記憶された当該印象要素に対する１つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する追加候補抽出手段と
してコンピュータを更に機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
複数のフレーズiを、各カテゴリＧjに区分したカテゴリ辞書を記憶したカテゴリ辞書記憶手段としてコンピュータを更に機能させ、
追加候補抽出手段は、
フレーズリストの各フレーズiについて、カテゴリ辞書記憶手段を用いてカテゴリを対応付け、
追加候補フレーズjについて、カテゴリ辞書記憶手段を用いてカテゴリＧj を対応付け、
追加候補フレーズj毎に、入力テキストに含まれるフレーズ全体から計数された各カテゴリΣＣの合計個数に対する、当該追加候補フレーズjの当該カテゴリＧjの個数のカテゴリ関連比率Ｐrel(j)（＝Ｇj／ΣＧ）を算出し、
追加候補フレーズj毎に、カテゴリ関連比率Ｐrel(j)と、印象辞書記憶手段のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出し、
スコア関連比率Ｐ(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
異なるフレーズi及びフレームj間の共起頻度を表す共起辞書を記憶した共起辞書記憶手段としてコンピュータを更に機能させ、
追加候補抽出手段は、
共起辞書記憶手段を用いて、フレーズリストの各フレーズiと、追加候補フレーズjとの間の共起頻度Ｃ(i,j)を総当たり的に抽出し、
抽出された全ての共起頻度Ｃ(i,j)を合計した合計共起頻度ΣＣを算出し、
追加候補フレーズj毎に、フレーズリストの全てのフレーズΣiに対する共起頻度Ｃ(j)を合計したフレーズ共起頻度ΣＣ(j)を算出し、
追加候補フレーズj毎に、合計共起頻度ΣＣに対するフレーズ共起頻度ΣＣ(j)の共起関連比率Ｐrel(j)を算出し、
追加候補フレーズj毎に、共起関連比率Ｐrel(j)と、印象辞書記憶手段のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出し、
スコア関連比率Ｐ(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
入力テキストは、顔文字を含み、
形態素解析手段は、一連の顔文字を１つの単語として抽出する
ようにコンピュータを機能させることも好ましい。

本発明のプログラムにおける他の実施形態によれば、
入力テキストは、ユーザによって記述された、ブログサーバ又はＳＮＳサーバへの投稿文章であり、
印象差分提示手段は、入力テキストがブログサーバ又はＳＮＳサーバで公開される前に、印象差分情報を当該ユーザに明示する
ようにコンピュータを機能させることも好ましい。

本発明によれば、入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置であって、
主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
を有することを特徴とする。

本発明によれば、入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置のテキスト印象分析方法であって、
主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
装置は、印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶部を有し、
装置は、
入力テキストを、形態素解析によってフレーズに区分する第１のステップと、
入力テキストから区分されたフレーズ毎に、印象辞書記憶手段を用いて、印象要素及びスコアを対応付けたフレーズリストを生成する第２のステップと、
入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する第３のステップと、
主観的印象に基づく当該印象要素のスコアと、客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する第４のステップと
を有することを特徴とする。

本発明のテキスト印象分析プログラム、装置及び方法によれば、入力テキストに対する主観的印象と客観点印象とを比較することができる。その比較情報（印象差分情報）を予め知ることによって、書き手となる発信側のテキスト作成者自ら、その印象差分情報に基づいて、印象に対するギャップを埋めるようにテキストを推敲することができる。また、主観的印象を満たすように、削除候補フレーズや追加候補フレーズを予め提示することによって、テキスト作成者における推敲負担を更に軽減することもできる。

本発明におけるテキスト印象分析装置の機能構成図である。本発明における主観的印象と客観的印象とを比較したユーザインタフェースを表す説明図である。本発明における各機能構成部の第１の処理フローを表す説明図である。本発明における各機能構成部の第２の処理フローを表す説明図である。テキストに対する削除候補及び追加候補を明示したユーザインタフェースを表す説明図である。カテゴリ辞書を用いた追加候補の抽出処理を表す説明図である。図６に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。共起辞書を用いた追加候補の抽出処理を表す説明図である。図８に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。

以下、本発明の実施の形態について、図面を用いて詳細に説明する。

図１は、本発明におけるテキスト印象分析装置の機能構成図である。

図１によれば、テキスト印象分析装置（サーバ）１と、ユーザ操作の端末２と、ＳＮＳ（ブログ）サーバ３とがネットワークを介して接続されている。本発明のテキスト印象分析装置１は、入力テキストから得られる「客観的印象」と、所定の「主観的印象」とを比較した「印象比較情報」を出力する。ユーザは、端末２からＳＮＳサーバ３へテキストを投稿する前に、自ら記述したテキストの印象を分析するべく、そのテキストと主観的印象とをテキスト印象分析装置１へ送信する。これに対し、テキスト印象分析装置１は、そのテキストに対する印象比較情報を、端末２へ返信する。端末２を操作するユーザは、その印象比較情報を一見することによって、自ら記述したテキストを推敲することができる。そして、ユーザは、所望の印象に修正したテキストを、ＳＮＳサーバ３へ投稿する。これによって、書き手である発信者側のユーザは、自ら記述したテキストに対して、主観的印象と客観的印象とが同じであることを認識でき、安心して投稿することができる。

図１によれば、テキスト印象分析装置１は、テキスト入力部１０１と、主観的印象入力部１０２と、印象辞書記憶部１１と、形態素解析部１２と、フレーズリスト生成部１３と、客観的印象算出部１４と、印象差分提示部１５と、削除候補抽出部１６と、追加候補抽出部１７と、カテゴリ辞書記憶部１７１と、共起辞書記憶部１７２とを有する。これら機能部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。尚、各機能部の処理の流れは、テキスト印象分析方法としても実行できる。

図２は、本発明における主観的印象と客観的印象とを比較したユーザインタフェースを表す説明図である。
図３は、本発明における各機能構成部の第１の処理フローを表す説明図である。

［テキスト入力部１０１］
テキスト入力部１０１は、印象を分析すべきテキストを入力する。「入力テキスト」とは、例えば書き手となるテキスト作成者自らが記述したテキストであってもよいし、予め何らかの方法で作成されたテキストであってもよい。具体的には、入力テキストは、推敲されるべき文章が適し、例えば、メールの送信文章や、ＳＮＳ（ブログ）サーバへの投稿文章であってもよい。勿論、入力テキストには、顔文字や絵文字を含むものであってもよい。
図２（ａ）及び図３によれば、以下のようなテキストが入力されている。
入力テキストの例：「今日はパンの日です(´ー｀)よい週末を♪」
入力テキストは、形態素解析部１２へ出力される。

［主観的印象入力部１０２］
主観的印象入力部１０２は、ユーザから見た当該テキストに与えたい主観的な印象要素を入力する。「印象要素」とは、感情(emotion, feeling)及び／又は印象(impression)を表す語であって、具体的には感情語や形容詞がある。尚、主観的印象入力部１０２はオプション的なものであって、１つ以上の印象要素は、システムとして予め固定的に設定されたものであってもよい。
印象要素の例：「喜び」「驚き」「嫌悪」「悲しみ」「期待」・・・
「明るい」「やわらかい」・・・

「主観的印象」とは、例えば書き手側のテキスト投稿者自らが設定した１つ以上の印象要素であってもよいし、システムとして予め固定的に設定されたものであってもよい。
一方で、「客観的印象」とは、入力テキストから得られる１つ以上の印象要素をいう。
尚、主観的印象には、印象要素毎にスコアが対応付けられている。スコアは、入力テキストに対して、書き手自ら、以下のように表したものであってもよい。
（実施例１）当該印象要素に対する適合割合（％）で表したもの
（実施例２）当該印象要素に対して複数段階のレベル（１〜１０段階）で表したもの
（実施例３）当該印象要素に対して単に有／無（０又は１）で表したもの
図２（ａ）及び図３によれば、入力テキスト「今日はパンの日です(´ー｀)よい週末を♪」に対して、以下のような主観的印象が入力されている。
印象要素毎のスコアの例：
「喜び」＝８０％
「驚き」＝５０％
「嫌悪」＝０％
主観的印象は、印象差分提示部１５へ出力される。

［印象辞書記憶部１１］
印象辞書記憶部１１は、印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する。印象辞書は、予め作成されたものであり、人手で作成されたものであってもよいし、機械的に作成されたものであってもよい。
図３によれば、印象要素毎に、以下のようなフレーズが対応付けられている。
［印象要素］［フレーズ］
「喜び」 -> 週末、家族と、♪、(^^)v、・・・
「驚き」 -> 発表会、詳しくはコチラ、パンの日、(;゜Д゜)(゜Д゜;)、
「嫌悪」 -> 謝罪、注意、。。。、(´ー｀)、・・・
印象辞書記憶部１１は、フレーズリスト生成部１３から参照される。

尚、印象辞書は、各文章に印象要素を予め付与しておき、それら多数の文章を教師データとして、各印象要素に特徴的に表れるフレーズを、統計的指標を用いて作成したものであってもよい。そのようなアルゴリズムとしては、例えばテキスト解析によれば、χ^２値や赤池情報量基準（ＡＩＣ(Akaike's Information Criterion)）がある。

［形態素解析部１２］
形態素解析部１２は、テキスト入力部１０１からの入力テキストを、形態素解析によってフレーズに区分する。形態素解析とは、文法及び単語辞書を情報源として用いて、自然言語で書かれた文を言語として意味を持つ最小単位である形態素(Morpheme)に分割し、それぞれの品詞を判別する技術をいう。尚、形態素解析部１２は、一連の顔文字を１つの単語として抽出する。

図３によれば、入力テキストは、以下のようなフレーズに区分される。
入力テキスト「今日はパンの日です(´ー｀)よい週末を♪」
形態素「今日／は／パン／の／日／です／(´ー｀)／よい／週末／を／♪」
区分された形態素は、フレーズリスト生成部１３へ出力される。

［フレーズリスト生成部１３］
フレーズリスト生成部１３は、入力テキストから区分されたフレーズ毎に、印象辞書記憶部１１を用いて、印象要素及びスコアを対応付けたフレーズリストを生成する。印象辞書に登録された各フレーズに、印象要素を付与する。印象辞書に登録されていないフレーズは、例えば空白とする。
図２によれば、以下のようなフレーズリストが作成される。
［フレーズ］［印象要素］
・・・・・
週末 -> 喜び
♪ -> 喜び
パンの日 -> 驚き
(´ー｀) -> 嫌悪
生成されたフレーズリストは、客観的印象算出部１４へ出力される。

［客観的印象算出部１４］
客観的印象算出部１４は、フレーズリストに対して、読み手が受け取る印象を推定する。具体的には、客観的印象算出部１４は、入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する。

客観的印象算出部１４における各印象要素の尤度は、例えば、入力テキストに含まれるフレーズ全体から計数された各印象要素の個数に対する、フレーズリストの当該印象要素の個数の比率であってもよい。図２及び図３によれば、以下のように客観的印象を算出する。
［印象要素］［スコア］
喜び -> ５０％＝２個／４個
驚き -> ２５％＝１個／４個
嫌悪 -> ２５％＝１個／４個
算出された客観的印象は、印象差分提示部１５へ出力される。

尚、客観的印象算出部１４は、教師データとなる大量のフレーズをサポートベクタマシン(Support Vector Machine)に入力し、パラメータを生成したものであってもよい。サポートベクタマシンは、線形入力素子を用いて２クラスのパターン識別器を構成するものであって、学習サンプルから、各特徴値との距離を算出することによって、線形入力素子のパラメータを学習する。その識別処理動作は、ブラックボックスとしてしか見えない。例えば印象要素毎に、サポートベクタマシンを備えることによって、印象要素毎に真／偽の判定をすることもできる。

［印象差分提示部１５］
印象差分提示部１５は、主観的印象に基づく当該印象要素のスコアと、客観的印象に基づくその印象要素のスコアとを比較した印象差分情報を算出する。
図２（ｂ）によれば、印象要素毎に、主観的印象と客観的印象とが比較して表示されている。
［印象要素］［主観的印象］［客観的印象］
喜び -> ８０％５０％
驚き -> ５０％２５％
嫌悪 -> ０％２５％

印象差分提示部１５は、例えば以下のような印象差分情報を算出するものであってもよい。
（印象差分情報１）印象差分情報は、印象要素毎に、主観的印象に基づく当該印象要素のスコアから、客観的印象に基づくその印象要素のスコアを差し引いたものである。
図２（ｃ）によれば、印象要素毎に、主観的印象のスコアから、客観的印象のスコアを差し引いた差分が表示される。
［印象要素］［印象差分情報］
喜び -> ＋３０％（＝８０％−５０％）
驚き -> ＋２５％（＝５０％−２５％）
嫌悪 -> −２５％（＝０％−２０％）

（印象差分情報２）印象差分情報は、主観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアから、客観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアを差し引いたものである。例えばスコアを１００〜０とする。
100（最大喜び）----50（基準）----0（最大嫌悪）
ここで、例えば５０を基準スタートとして、以下のように総合印象スコアを算出する。
スコア「喜び」＋３０で、スコア「基準」５０＋３０＝８０
次に、スコア「嫌悪」−２０で、８０−２０＝６０
総合印象スコア＝６０
尚、総合印象スコアを算出する際に、印象要素毎のスコアに重みを付けて算出するものであってもよい。
重み係数「喜び」：α、重み係数「嫌悪」：β
「喜びスコア」＋３０で、基準５０＋（３０×α）
次に、「嫌悪スコア」−２０で、（基準５０＋（３０×α））−（２０×β）
総合印象スコア＝（基準５０＋（３０×α））−（２０×β）

印象差分提示部１５は、入力テキストがブログサーバ又はＳＮＳサーバで公開される前に、印象差分情報を当該ユーザに明示することが好ましい。
これによって、書き手となる発信側のテキスト作成者自ら、印象差分提示部１５から提示された印象差分情報を一見することによって、印象に対するギャップを埋めるようにテキストを推敲することができる。

図４は、本発明における各機能構成部の第２の処理フローを表す説明図である。

図４によれば、図３と比較して、以下のよう各構成要素の処理が異なる。
（印象辞書記憶部１１）
図４の印象辞書記憶部１１の印象辞書は、図３と比較して、各フレーズに、当該印象要素に適合するスコアが更に対応付けられている。
フレーズ「週末」は、印象要素「喜び」に対して適合率２０％と設定
フレーズ「家族と」は、印象要素「喜び」に対して適合率４０％と設定
フレーズ「♪」は、印象要素「喜び」に対して適合率１０％と設定
フレーズ「(^^)v」は、印象要素「喜び」に対して適合率１０％と設定
・・・・・
フレーズ「発表会」は、印象要素「驚き」に対して適合率２０％と設定
フレーズ「詳しくはコチラ」は、印象要素「驚き」に対して適合率２０％と設定
フレーズ「パンの日」は、印象要素「驚き」に対して適合率１０％と設定
フレーズ「(;゜Д゜)(゜Д゜;)」は、印象要素「驚き」に対して適合率１０％と設定
・・・・・
フレーズ「謝罪」は、印象要素「嫌悪」に対して適合率２０％と設定
フレーズ「注意」は、印象要素「嫌悪」に対して適合率３０％と設定
フレーズ「。。。」は、印象要素「嫌悪」に対して適合率１０％と設定
フレーズ「(´ー｀)」は、印象要素「嫌悪」に対して適合率１０％と設定
・・・・・

（フレーズリスト生成部１３）
図４のフレーズリスト生成部１３は、図３と比較して、フレーズリストのフレーズ毎に、印象要素に加えて、印象辞書記憶部１１から抽出したスコアが更に対応付けられている。

（客観的印象算出部１４）
図４の客観的印象算出部１４は、図３と比較して、各印象要素の尤度が、例えば、入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、フレーズリストの当該印象要素のスコアの比率である。例えば、以下のように客観的印象を算出する。
［印象要素］［スコア］
喜び -> ６０％（＝３０％／５０％）
驚き -> ２０％（＝１０％／５０％）
嫌悪 -> ２０％（＝１０％／５０％）

（印象差分提示部１５）
図４によれば、印象差分提示部１５は、以下のように、印象要素毎に、主観的印象のスコアから、客観的印象のスコアを差し引いた差分が表示される。
［印象要素］［印象差分情報］
喜び -> ＋２０％（＝８０％−６０％）
驚き -> ＋３０％（＝５０％−２０％）
嫌悪 -> −２０％（＝０％−２０％）

図５は、テキストに対する削除候補及び追加候補を明示したユーザインタフェースを表す説明図である。

［削除候補抽出部１６］
削除候補抽出部１６は、印象差分情報がマイナスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合）、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する。
図５（ａ）によれば、印象差分情報がマイナスとなるフレーズ「(´ー｀)」が、削除候補としてユーザに明示されている。
例えば顔文字は、一見して理解されやすい反面、誤った印象を与える場合もある。「(´ー｀)」は、「しらーっ」とした嫌悪感を与える一方で、その印象は一見して理解しにくい。そのために、主観的印象に反する客観的印象のフレーズを、削除候補としてユーザに明示することができる。

［追加候補抽出部１７］
追加候補抽出部１７は、印象差分がプラスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合）、印象辞書記憶部１１に記憶された当該印象要素に対する１つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する。

例えば図３及び図４によれば、印象差分情報がプラスとなる「喜び」「驚き」のフレーズを、追加候補としてユーザに明示する。最も簡単な方法としては、印象辞書に含まれる「喜び」「驚き」のフレーズを候補とする。例えば以下のような追加候補フレーズが選択される。
［印象要素］［追加候補フレーズ］
喜び -> 「家族と」「(^^)v」
驚き -> 「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」
図５（ｂ）によれば、印象差分情報がプラスとなるフレーズの中から、「家族と」「(^^)v」が、追加候補としてユーザに明示されている。

追加候補抽出部１７における他の実施形態として、単に印象辞書からフレーズを選択するだけでなく、フレーズリストとの関連性の強いフレーズを印象辞書から選択することが好ましい。例えば以下の２つの方法がある。
＜カテゴリ辞書を用いた追加候補フレーズの選択＞
＜共起辞書を用いた追加候補フレーズの選択＞

＜カテゴリ辞書を用いた追加候補フレーズの選択＞
図６は、カテゴリ辞書を用いた追加候補の抽出処理を表す説明図である。
図７は、図６に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。

カテゴリ辞書は、複数のフレーズiを、各カテゴリＧjに区分したものである。図６にれば、カテゴリ辞書記憶部１７１には、カテゴリ「雑談」「豆知識」「端末」それぞれに、１つ以上のフレーズが対応付けられている。
カテゴリ辞書は、予め作成されたものであって、人手で作成されたものであってもよいし、機械的に作成されたものであってもよい。
図３によれば、カテゴリ毎に、以下のようなフレーズが対応付けられている。
［カテゴリ］［フレーズ］
「雑談」 -> (´ー｀)、よい、家族と、週末、♪、(^^)v、・・・
「豆知識」-> 今日、パンの日、詳しくはコチラ、 (;゜Д゜)(゜Д゜;) 、・・・
「端末」 -> 発表会、・・・
「商品・サービス」-> ・・・
「キャンペーン」 -> ・・・
「謝罪」 -> ・・・

尚、カテゴリ辞書は、各文章にカテゴリを予め付与しておき、それら多数の文章を教師データとして、各印象要素に特徴的に表れるフレーズを、統計的指標を用いて作成したものであってもよい。前述した印象辞書と同様に、そのようなアルゴリズムとしては、例えばテキスト解析によればχ^２値や赤池情報量基準（ＡＩＣ）がある。

追加候補抽出部１７は、以下の処理を実行する。
（Ｓ１１）フレーズリストの各フレーズiについて、カテゴリ辞書記憶部１７１を用いてカテゴリを対応付ける。
図６によれば、フレーズリストは、以下のように対応付けられている。
フレーズ「今日」に、カテゴリ「豆知識」が対応
フレーズ「よい」に、カテゴリ「雑談」が対応
フレーズ「週末」に、カテゴリ「雑談」が対応
フレーズ「♪」に、カテゴリ「雑談」が対応
フレーズ「パンの日」に、カテゴリ「豆知識」が対応
フレーズ「(´ー｀)」に、カテゴリ「雑談」が対応

（Ｓ１２）追加候補フレーズjについて、カテゴリ辞書記憶部１７１を用いてカテゴリＧj を対応付ける。
ここで、図６によれば、前述した図３及び図４における追加候補フレーズとして、「家族と」「(^^)v」「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」がある。
フレーズ「家族と」に、カテゴリ「雑談」が対応
フレーズ「(^^)v」に、カテゴリ「雑談」が対応
フレーズ「発表会」に、カテゴリ「端末」が対応
フレーズ「詳しくはコチラ」に、カテゴリ「豆知識」が対応
フレーズ「(;゜Д゜)(゜Д゜;)」に、カテゴリ「豆知識」が対応

（Ｓ１３）追加候補フレーズj毎に、入力テキストに含まれるフレーズ全体から計数された各カテゴリΣＣの合計個数に対する、当該追加候補フレーズjの当該カテゴリＧjの個数のカテゴリ関連比率Ｐrel(j)（＝Ｇj／ΣＧ）を算出する。
図６によれば、以下のようにカテゴリ関連比率Ｐrel(j)が算出される。
Ｐrel(家族と) ＝４個（雑談の個数）／７個（全体の個数）＝５７％
Ｐrel((^^)v) ＝４個（雑談の個数）／７個（全体の個数）＝５７％
Ｐrel(発表会) ＝０個（端末の個数）／７個（全体の個数）＝０％
Ｐrel(詳しくはコチラ)＝２個（豆知識の個数）／７個（全体の個数）＝２９％
Ｐrel((;゜Д゜)(゜Д゜;))＝２個（豆知識の個数）／７個（全体の個数）＝２９％

（Ｓ１４）追加候補フレーズj毎に、カテゴリ関連比率Ｐrel(j)と、印象辞書記憶部１１のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出する。スコア関連比率Ｐ(j)は、例えば以下の式によって算出される。
Ｐ(i)＝α・Ｐdic(i)＋(1-α)Ｐrel(i)
α：印象辞書のスコアを重視する場合には、 αを大きく設定する
入力テキストとの適合度を重視する場合には、αを小さく設定する

図７によれば、以下のようにスコア関連比率Ｐ(j)が算出される。
α=0.5
Ｐ(家族と) ＝α×Ｐdic(家族と)＋α×Ｐrel(家族と)
＝α×40%＋α×57%＝49%
Ｐ((^^)v) ＝α×Ｐdic((^^)v)＋α×Ｐrel((^^)v)＝α×10%＋α×57%＝34%
Ｐ(発表会) ＝α×Ｐdic(発表会)＋α×Ｐrel(発表会)＝α×20%＋α×0%＝10%
Ｐ(詳しくはコチラ)＝α×Ｐdic(詳しくはコチラ)＋α×Ｐrel(詳しくはコチラ)
＝α×20%＋α×29%＝25%
Ｐ((;゜Д゜)(゜Д゜;))＝α×Ｐdic((;゜Д゜)(゜Д゜;))
＋α×Ｐrel((;゜Д゜)(゜Д゜;))
＝α×10%＋α×29%＝20%

（Ｓ１５）スコア関連比率Ｐ(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する。
図７によれば、スコア関連比率Ｐ(j)が閾値３０％以上となる追加候補フレーズ「家族と」「(^^)v」のみが、最終的な追加候補フレーズとして選択される。

＜共起辞書を用いた追加候補フレーズの選択＞
図８は、共起辞書を用いた追加候補の抽出処理を表す説明図である。
図９は、図８に続いて印象辞書を用いた追加候補の抽出処理を表す説明図である。

共起辞書記憶部１７２は、異なるフレーズi及びフレームj間の共起頻度を表す共起辞書を記憶したものである。共起辞書は、既存のコーパスであってもよい。

追加候補抽出部１７は、以下の処理を実行する。
（Ｓ２１）共起辞書記憶部１７２を用いて、フレーズリストの各フレーズiと、追加候補フレーズjとの間の共起頻度Ｃ(i,j)を総当たり的に抽出する。
図８によれば、前述した図３及び図４における追加候補フレーズとして、「家族と」「(^^)v」「発表会」「詳しくはコチラ」「(;゜Д゜)(゜Д゜;)」がある。

（Ｓ２２）抽出された全ての共起頻度Ｃ(i,j)を合計した合計共起頻度ΣＣを算出する。
図８によれば、合計共起頻度ΣＣは、1179回と算出される。

（Ｓ２３）追加候補フレーズj毎に、フレーズリストの全てのフレーズΣiに対する共起頻度Ｃ(j)を合計したフレーズ共起頻度ΣＣ(j)を算出する。
図８によれば、以下のようにフレーズ共起頻度が算出される。
［フレーズ］［フレーズ共起頻度ΣＣ(j)］
家族と -> 257回
(^^)v -> 232回
発表会 -> 190回
詳しくはコチラ -> 300回
(;゜Д゜)(゜Д゜;) -> 200回

（Ｓ２４）追加候補フレーズj毎に、合計共起頻度ΣＣに対するフレーズ共起頻度ΣＣ(j)の共起関連比率Ｐrel(j)を算出する。
図８によれば、以下のように共起関連比率が算出される。
Ｐrel(家族と) ＝257回／1,179回＝22%
Ｐrel((^^)v) ＝232回／1,179回＝20%
Ｐrel(発表会) ＝190回／1,179回＝16%
Ｐrel(詳しくはコチラ)＝300回／1,179回＝25%
Ｐrel((;゜Д゜)(゜Д゜;) ＝200回／1,179回＝17%

（Ｓ２５）追加候補フレーズj毎に、共起関連比率Ｐrel(j)と、印象辞書記憶部１１のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出する。スコア関連比率Ｐ(j)は、前述した以下の式によって算出される。
Ｐ(i)＝α・Ｐdic(i)＋(1-α)Ｐrel(i)

図９によれば、以下のようにスコア関連比率Ｐ(j)が算出される。
α=0.5
Ｐ(家族と)＝α×Ｐdic(家族と)＋α×Ｐrel(家族と)＝α×40%＋α×22%＝31%
Ｐ((^^)v)＝α×Ｐdic((^^)v)＋α×Ｐrel((^^)v)＝α×10%＋α×20%＝15%
Ｐ(発表会)＝α×Ｐdic(発表会)＋α×Ｐrel(発表会)＝α×20%＋α×16%＝18%
Ｐ(詳しくはコチラ)＝α×Ｐdic(詳しくはコチラ)＋α×Ｐrel(詳しくはコチラ)
＝α×20%＋α×25%＝22.5%
Ｐ((;゜Д゜)(゜Д゜;))＝α×Ｐdic((;゜Д゜)(゜Д゜;))
＋α×Ｐrel((;゜Д゜)(゜Д゜;))
＝α×10%＋α×17%＝13.5%

（Ｓ２６）スコア関連比率Ｐ(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する。
図９によれば、スコア関連比率Ｐ(j)が閾値２０％以上となる追加候補フレーズ「家族と」「詳しくはコチラ」のみが、最終的な追加候補フレーズとして選択される。

以上、詳細に説明したように、本発明のテキスト印象分析プログラム、装置及び方法によれば、入力テキストに対する主観的印象と客観点印象とを比較することができる。その比較情報（印象差分情報）を予め知ることによって、書き手となる発信側のテキスト作成者自ら、その印象差分情報に基づいて、印象に対するギャップを埋めるようにテキストを推敲することができる。また、主観的印象を満たすように、削除候補フレーズや追加候補フレーズを予め提示することによって、テキスト作成者における推敲負担を更に軽減することもできる。

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。

１テキスト印象分析装置
１０１テキスト入力部
１０２主観的印象入力部
１１印象辞書記憶部
１２形態素解析部
１３フレーズリスト生成部
１４客観的印象算出部
１５印象差分提示部
１６削除候補抽出部
１７追加候補抽出部
１７１カテゴリ辞書記憶部
１７２共起辞書記憶部
２端末
３ＳＮＳ（ブログ）サーバ

Claims

入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにコンピュータを機能させるテキスト印象を分析するプログラムであって、
前記主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
前記入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
してコンピュータを機能させることを特徴とするプログラム。
前記印象要素は、感情及び／又は印象を表す語である
ようにコンピュータを機能させることを特徴とする請求項１に記載のプログラム。
前記客観的印象算出手段における各印象要素の尤度は、前記入力テキストに含まれるフレーズ全体から計数された各印象要素の個数に対する、前記フレーズリストの当該印象要素の個数の比率である
ようにコンピュータを機能させることを特徴とする請求項１又は２に記載のプログラム。
前記印象辞書記憶手段の前記印象辞書は、各フレーズに、当該印象要素に適合するスコアが更に対応付けられており、
前記客観的印象算出手段における各印象要素の尤度は、前記入力テキストに含まれるフレーズ全体から計数された各印象要素の合計スコアに対する、前記フレーズリストの当該印象要素のスコアの比率である
ようにコンピュータを機能させることを特徴とする請求項１から３のいずれか１項に記載のプログラム。
前記印象差分提示手段は、
印象要素毎に、前記主観的印象に基づく当該印象要素のスコアから、前記客観的印象に基づく該印象要素のスコアを差し引いた印象差分情報を算出するか、
又は、
前記主観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアから、前記客観的印象に基づく全ての印象要素のスコアから導出された総合印象スコアを差し引いた印象差分情報を算出する
ようにコンピュータを機能させることを特徴とする請求項１から４のいずれか１項に記載のプログラム。
前記印象差分情報がマイナスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが高い場合）、当該入力テキストに記述された当該印象要素に基づくフレーズを、削除候補フレーズとして、ユーザに明示する削除候補抽出手段と
してコンピュータを更に機能させることを特徴とする請求項５に記載のプログラム。
前記印象差分がプラスである場合（主観的印象に基づく当該印象要素のスコアよりも、客観的印象として算出された当該印象要素のスコアが低い場合）、前記印象辞書記憶手段に記憶された当該印象要素に対する１つ以上のフレーズを、追加候補フレーズとして、ユーザに明示する追加候補抽出手段と
してコンピュータを更に機能させることを特徴とする請求項５に記載のプログラム。
複数のフレーズiを、各カテゴリＧjに区分したカテゴリ辞書を記憶したカテゴリ辞書記憶手段としてコンピュータを更に機能させ、
前記追加候補抽出手段は、
前記フレーズリストの各フレーズiについて、前記カテゴリ辞書記憶手段を用いてカテゴリを対応付け、
前記追加候補フレーズjについて、前記カテゴリ辞書記憶手段を用いてカテゴリＧj を対応付け、
前記追加候補フレーズj毎に、前記入力テキストに含まれるフレーズ全体から計数された各カテゴリΣＣの合計個数に対する、当該追加候補フレーズjの当該カテゴリＧjの個数のカテゴリ関連比率Ｐrel(j)（＝Ｇj／ΣＧ）を算出し、
前記追加候補フレーズj毎に、前記カテゴリ関連比率Ｐrel(j)と、前記印象辞書記憶手段のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出し、
前記スコア関連比率Ｐ(j)が所定閾値以上となる追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることを特徴とする請求項７に記載のプログラム。
異なるフレーズi及びフレームj間の共起頻度を表す共起辞書を記憶した共起辞書記憶手段としてコンピュータを更に機能させ、
前記追加候補抽出手段は、
前記共起辞書記憶手段を用いて、前記フレーズリストの各フレーズiと、前記追加候補フレーズjとの間の共起頻度Ｃ(i,j)を総当たり的に抽出し、
抽出された全ての共起頻度Ｃ(i,j)を合計した合計共起頻度ΣＣを算出し、
前記追加候補フレーズj毎に、前記フレーズリストの全てのフレーズΣiに対する共起頻度Ｃ(j)を合計したフレーズ共起頻度ΣＣ(j)を算出し、
前記追加候補フレーズj毎に、合計共起頻度ΣＣに対するフレーズ共起頻度ΣＣ(j)の共起関連比率Ｐrel(j)を算出し、
前記追加候補フレーズj毎に、前記共起関連比率Ｐrel(j)と、前記印象辞書記憶手段のスコアＰdic(j)とに基づくスコア関連比率Ｐ(j)を算出し、
前記スコア関連比率Ｐ(j)が所定閾値以上となる前記追加候補フレーズjのみを、最終的な追加候補フレーズとして抽出する
ようにコンピュータを機能させることを特徴とする請求項７に記載のプログラム。
前記入力テキストは、顔文字を含み、
前記形態素解析手段は、一連の顔文字を１つの単語として抽出する
ようにコンピュータを機能させることを特徴とする請求項１から９のいずれか１項に記載のプログラム。
前記入力テキストは、ユーザによって記述された、ブログサーバ又はＳＮＳ(Social Networking Service)サーバへの投稿文章であり、
前記印象差分提示手段は、前記入力テキストがブログサーバ又はＳＮＳサーバで公開される前に、前記印象差分情報を当該ユーザに明示する
ようにコンピュータを機能させることを特徴とする請求項１から１０のいずれか１項に記載のプログラム。
入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置であって、
前記主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶手段と、
前記入力テキストを、形態素解析によってフレーズに区分する形態素解析手段と、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成するフレーズリスト生成手段と、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する客観的印象算出手段と、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する印象差分提示手段と
を有することを特徴とする装置。
入力テキストから得られる客観的印象と、所定の主観的印象とを比較した印象比較情報を出力するようにテキスト印象を分析する装置のテキスト印象分析方法であって、
前記主観的印象は、１つ以上の印象要素と、当該印象要素毎のスコアとを対応付けたものであり、
前記装置は、印象要素毎に、１つ以上のフレーズ（単語及び自立語）が対応付けられた印象辞書を記憶する印象辞書記憶部を有し、
前記装置は、
前記入力テキストを、形態素解析によってフレーズに区分する第１のステップと、
前記入力テキストから区分された前記フレーズ毎に、前記印象辞書記憶手段を用いて、前記印象要素及びスコアを対応付けたフレーズリストを生成する第２のステップと、
前記入力テキストのフレーズ全体から各印象要素の尤度を算出し、当該尤度を、各印象要素のスコアとして対応付けた客観的印象を算出する第３のステップと、
前記主観的印象に基づく当該印象要素のスコアと、前記客観的印象に基づく該印象要素のスコアとを比較した印象差分情報を算出する第４のステップと
を有することを特徴とする装置のテキスト印象分析方法。