JP2010181993A - 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム - Google Patents

絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム Download PDF

Info

Publication number
JP2010181993A
JP2010181993A JP2009023311A JP2009023311A JP2010181993A JP 2010181993 A JP2010181993 A JP 2010181993A JP 2009023311 A JP2009023311 A JP 2009023311A JP 2009023311 A JP2009023311 A JP 2009023311A JP 2010181993 A JP2010181993 A JP 2010181993A
Authority
JP
Japan
Prior art keywords
evaluation
pictogram
level
character string
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009023311A
Other languages
English (en)
Inventor
Yukiko Habu
由希子 土生
Ryoichi Kawada
亮一 川田
Nobuhide Kozuka
宣秀 小塚
Chiai Nari
智愛 成
Koki Uchiyama
幸樹 内山
Santi Saeyor
セーヨー・サンティ
Kosuke Asano
弘輔 浅野
Hisaaki Shimamura
壽晃 嶋村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Hottolink Inc
Original Assignee
KDDI Corp
Hottolink Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp, Hottolink Inc filed Critical KDDI Corp
Priority to JP2009023311A priority Critical patent/JP2010181993A/ja
Priority to US12/698,486 priority patent/US8478582B2/en
Priority to CN201010112854.0A priority patent/CN101887414B/zh
Publication of JP2010181993A publication Critical patent/JP2010181993A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools

Abstract

【課題】携帯電話機から投稿される絵文字を含む文章ファイルであっても、評判分析のための評価レベルを導出することができる評価分析サーバ等を提供する。
【解決手段】評価分析サーバは、文字列及び絵文字を含む文章ファイルにおける評価レベルを分析する。評価分析サーバは、特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書手段と、文章ファイルを形態素に分解する形態素解析手段と、絵文字辞書手段を用いて、評価絵文字に対応する形態素を抽出する絵文字抽出手段と、絵文字辞書手段を用いて、抽出された評価絵文字に対する評価レベルを検索する絵文字レベル検索手段と、評価絵文字全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する評価レベル決定手段とを有する。
【選択図】図6

Description

本発明は、絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラムに関する。
商品やサービスを評価又は論評した情報は、販売業者や広告業者によって発信される場合が多い。これに対し、インターネットのサイトには、消費者自身の実体験や生の声が、膨大に且つリアルタイムに集積されてきている。このような利害関係に束縛されない情報は、他の消費者にとって極めて重要なサポート情報となり得る。
多数の一般消費者によって生成されていくメディアとして、インターネットを用いたCGM(Consumer Generated Media)が注目されている。具体的には、個人から発信・投稿された情報をデータベース化及びメディア化したWebサイトであって、Web2.0の1つである。例えば、ブログ(Web log)、クチコミサイト、Q&Aコミュニティ、SNS(Social Networking Service)、COI(Community Of Interest)サイトがある。ここで交換される情報は、商品やサービスに関する情報に限られず、日常出来事の内容など様々なものである。
しかしながら、このようなCGMの情報量は極めて膨大であって、且つその情報内容は煩雑である。また、個人によって評価又は論評された情報は、一般に、文字列を含む文章ファイルである。そのため、閲覧する第三者は、その文章ファイルの内容を読み込む必要があり、一見して、その評価内容を把握することができない。また、多数の一般消費者の評価を分析することは更に困難となる。
これに対し、近年、個人がインターネットのサイトに発信・投稿した文章ファイルを検索し、その内容を点数化することによって、その評判を分析する「評判分析サービス」が提供されてきている(例えば非特許文献1及び2参照)。そのサービスを実行する評判分析サーバは、最初に、文章ファイルを読み込み、その文章ファイルに対して形態素解析を実行する。そして、形態素の意味を点数化し、その文章ファイルに対する評判を点数化する(例えば特許文献1参照)。閲覧する第三者は、その評判の点数を見るだけで、その文章ファイルの意図する評判を外観することができる。
特許第3962382号
「日経リサーチ blogVizセンサー」、株式会社日経リサーチ)、[online]、[平成20年12月19日検索]、インターネット<URL:http://viz.nikkei-r.co.jp/> 「電通バズリサーチ」、電通・ホットリンク、[online]、[平成20年11月22日検索]、インターネット<URL:https://www.dbuzz.jp/>
近年、移動通信環境の発達に伴って、携帯電話機からWebサーバへ、文章ファイルが発信・投稿される場合も多くなってきている。このとき、携帯電話機から投稿される文章は、パーソナルコンピュータから投稿される文章と異なって、通常の日本語の文法に則らない場合も多い。具体的には、携帯電話機のアプリケーションでは、文章ファイルの中で、感情表現そのものとして「絵文字」が用いられる場合が多い。利用者は、この絵文字を用いて、感情を表現する言葉を補足し且つ強調している。
しかしながら、文章ファイルの中に絵文字が挿入されることによって、既存の評判分析サービスの処理の中で、正常な文章として認識されず、係り受け解析に失敗する。例えば、本来、主語がくるべきところに絵文字が挿入される場合がある。また、絵文字は、ある文字列に対する感情表現が強調又は補足されていても、絵文字自体は、単なる記号としか認識されない。結局、携帯電話機の利用者が、感情表現そのものとして絵文字を用いているにもかかわらず、評判分析サービスでは、その絵文字に基づいて評判分析をすることはできない。
そこで、本発明は、携帯電話機から投稿される絵文字を含む文章ファイルであっても、評判分析のための評価レベルを導出することができる評価分析サーバ、方法及びプログラムを提供することを目的とする。
本発明によれば、文章ファイルにおける評価レベルを分析する評価分析サーバであって、
文章ファイルは、文字列及び絵文字を含んでおり、
特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書手段と、
文章ファイルを形態素に分解する形態素解析手段と、
絵文字辞書手段を用いて、評価絵文字に対応する形態素を抽出する絵文字抽出手段と、
絵文字辞書手段を用いて、抽出された評価絵文字に対する評価レベルを検索する絵文字レベル検索手段と、
評価絵文字全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する評価レベル決定手段と
を有することを特徴とする。
本発明の評価分析サーバにおける他の実施形態によれば、
特定文字列に評価レベルを対応付けた評価文字列を登録する文字列辞書手段と、
文字列辞書手段を用いて、評価文字列に対応する形態素を抽出する文字列抽出手段と、
文字列辞書手段を用いて、抽出された評価文字列に対する評価レベルを検索する文字列レベル検索手段と
を更に有し、
評価レベル決定手段は、評価文字列全ての評価レベルと、評価絵文字全ての評価レベルとの和に基づいて、文章ファイルの評価レベルを決定することも好ましい。
本発明の評価分析サーバにおける他の実施形態によれば、
絵文字辞書手段は、特定絵文字に副詞的倍率を対応付けた副詞的絵文字を更に登録しており、
絵文字辞書手段を用いて、抽出された副詞的絵文字に対する副詞的倍率を検索する副詞的倍率検索手段と、
副詞的絵文字の係り受けとなる評価絵文字又は評価文字列を検出する係り受け解析手段と
を更に有し、
評価レベル決定手段は、評価絵文字又は評価文字列の評価レベルに、当該副詞的絵文字の副詞的倍率を乗算することも好ましい。
本発明の評価分析サーバにおける他の実施形態によれば、評価レベルは、「肯定的」/「否定的」に段階的に分けられていることも好ましい。
本発明の評価分析サーバにおける他の実施形態によれば、携帯電話機用のWebサーバであってもよい。
本発明によれば、文章ファイルにおける評価レベルを分析する装置における評価分析方法であって、
文章ファイルは、文字列及び絵文字を含んでおり、
特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書を有し、
文章ファイルを形態素に分解する第1のステップと、
絵文字辞書手段を用いて、評価絵文字に対応する形態素を抽出する第2のステップと、
絵文字辞書手段を用いて、抽出された評価絵文字に対する評価レベルを検索する第3のステップと、
評価絵文字全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する第4のステップと
を有することを特徴とする。
本発明の評価分析方法における他の実施形態によれば、
特定文字列に評価レベルを対応付けた評価文字列を登録する文字列辞書を有し、
文字列辞書を用いて、評価文字列に対応する形態素を抽出するステップと、
文字列辞書を用いて、抽出された評価文字列に対する評価レベルを検索するステップと
を更に有し、
第4のステップは、評価文字列全ての評価レベルと、評価絵文字全ての評価レベルとの和に基づいて、文章ファイルの評価レベルを決定することも好ましい。
本発明の評価分析方法における他の実施形態によれば、
絵文字辞書は、特定絵文字に副詞的倍率を対応付けた副詞的絵文字を更に登録しており、
絵文字辞書を用いて、抽出された副詞的絵文字に対する副詞的倍率を検索するステップと、
副詞的絵文字の係り受けとなる評価絵文字又は評価文字列を検出するステップと
を更に有し、
第4のステップは、評価絵文字又は評価文字列の評価レベルに、当該副詞的絵文字の副詞的倍率を乗算することも好ましい。
本発明によれば、文章ファイルにおける評価レベルを分析するサーバに搭載されたコンピュータを機能させる評価分析プログラムであって、
文章ファイルは、文字列及び絵文字を含んでおり、
特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書手段と、
文章ファイルを形態素に分解する形態素解析手段と、
絵文字辞書手段を用いて、評価絵文字に対応する形態素を抽出する絵文字抽出手段と、
絵文字辞書手段を用いて、抽出された評価絵文字に対する評価レベルを検索する絵文字レベル検索手段と、
評価絵文字全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する評価レベル決定手段と
してコンピュータを機能させることを特徴とする。
本発明の評価分析サーバ、方法及びプログラムによれば、携帯電話機から投稿される絵文字を含む文章ファイルであっても、評判分析のための評価レベルを導出することができる。
評価分析サーバを有するシステム構成図である。 特定絵文字に対する評価及び副詞的倍率を表す絵文字辞書テーブルである。 特定文字列に対する評価を表す文字列辞書テーブルである。 具体的な文章を、本発明によって評価した第1の説明図である。 具体的な文章を、本発明によって評価した第2の説明図である。 本発明における評価分析サーバの機能構成図である。 本発明におけるフローチャートである。
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
図1は、評価分析サーバを有するシステム構成図である。
図1によれば、複数の端末及び携帯電話機2が、ネットワークを介して評価分析サーバ1に接続できる。評価分析サーバ1は、携帯電話機2から発信・投稿された文章ファイルを蓄積し、第三者に公開すると共に、その文章ファイルにおける評価レベルを分析する。評価分析サーバ1は、例えば携帯電話機用のWebサーバであってもよい。
本発明における「文章ファイル」は、テキストとしての文字列だけでなく、既存のテキストとは異なる「絵文字」を更に含む。「絵文字」とは、意味(例えば感情表現)を伝えるために用いられる簡略化した絵をいう。これは、例えばピクトグラムとも称され、既存の言語体系に関わらず、誰でも(例えばその言語を理解できない外国人でも)が、その表示の意味を理解できる。
絵文字は、特に、携帯電話機同士のメールの送受信に用いられている。例えば、感情を表現するための「笑顔」「泣き顔」「ハートマーク」等、様々なアイコンが用意されている。絵文字は、テキストを含むメールを書く際に、感情を手軽に表現するアイコンとして用いられる。
「絵文字」は、一般的なテキストとは異なる文字コードを備えている。通常、テキストとは、半角の英数字のようなASCIIコード、日本語漢字のようなJISコード又はシフトJIS、多言語を対象にしたUnicodeなどを意味する。これに対し、絵文字は、これら文字コードと重畳しないように、各携帯電話通信事業者が、独自に絵文字とその文字コードとを決めている。従って、通信事業者又は携帯電話機メーカが異なる場合、完全に同じ絵文字を表示できるとは限らない。また、特定の通信事業者では、エスケープコードの後に絵文字の内容を送信する場合もある。このエスケープコードは、「その後のデータは絵文字である」旨を意味する。従って、パーソナルコンピュータのアプリケーションとしてのテキストエディタでは、絵文字を表示することはできない。このように、テキストと絵文字とは異なる文字体系を有する。
図2は、特定絵文字に対する評価及び副詞的倍率を表す絵文字辞書テーブルである。
図2のテーブルによれば、特定絵文字毎に、カテゴリと、タイトルと、評価と、副詞的倍率とが対応付けられている。ここで、「評価」とは、最も単純には、例えば肯定的(Positive)/否定的(Negative)のレベルに対応付けられる。例えば、肯定的「+1」及び否定的「−1」に点数化する。そして、その文章ファイルの全ての絵文字の点数を合計することによって、その文章ファイルが、「どの程度、肯定的か又は否定的か」を表現することができる。
図2によれば、例えば、タイトル「きらきら」(カテゴリ「気持ち・からだ」)の絵文字には、「肯定的P」が対応付けられている。また、タイトル「ハート」(カテゴリ「気持ち・からだ」)の絵文字には、「肯定的P」が対応付けられている。一方で、タイトル「涙ぽろり」(カテゴリ「顔・表情」)の絵文字には、「否定的N」が対応付けられている。また、タイトル「あせり」(カテゴリ「顔・表情」)の絵文字には、「否定的N」が対応付けられている。
更に、図2によれば、例えば、タイトル「強調」(カテゴリ「気持ち・からだ」)の絵文字には、副詞的倍率1.2が対応付けられている。また、タイトル「勝ち誇り」(カテゴリ「顔・表情」)の絵文字には、副詞的倍率1.1が対応付けられている。
図3は、特定文字列に対する評価を表す文字列辞書テーブルである。
図3のテーブルによれば、特定文字列毎に、評価が対応付けられている。例えば、文字列「スペシャル」及び「ウキウキ」には、「肯定的P」が対応付けられている。一方で、文字列「悔しい」及び「バカやろー」には、「否定的N」が対応付けられている。
図4は、具体的な文章を、本発明によって評価した第1の説明図である。
図4(a)によれば、実際に利用者によって作成された文章が表されている。この文章ファイルは、単なる文字列だけでなく、絵文字も含んでいる。
図4(b)によれば、図4(a)の文章ファイルを、形態素に分解したものが表されている。形態素解析(Morphological Analysis)とは、コンピュータを用いた自然言語処理技術の1つである。形態素解析は、自然言語で書かれた文字列を、形態素(言語上の意味を持つ最小単位)に分割し、各形態素の品詞を判別する。この判別には、言語の文法規則及び品詞付き単語を予め登録した辞書を用いる。ここで、1つの絵文字は、1つの形態素に対応する。
図4(c)によれば、図2の絵文字辞書テーブルと、図3の文字列辞書テーブルとを用いて、登録された形態素に、肯定的「+1」又は否定的「−1」の点数が付与されている。図4(c)によれば、以下の形態素に点数が付与されている。
絵文字「きらきら」 :+1
絵文字「きらきら」 :+1
文字列「スペシャル」:+1
文字列「ウキウキ」 :+1
絵文字「ハート」 :+1
絵文字「涙ぽろり」 :−1
絵文字「あせり」 :−1
図4の文章ファイルについて、評価の点数の合計は「+3」となる。
+1+1+1+1+1+(−1)+(−1)=+3
図5は、具体的な文章を、本発明によって評価した第2の説明図である。
図5(a)によれば、実際に利用者によって作成された文章が表されている。
図5(b)によれば、図5(a)の文章ファイルを、形態素に分解したものが表されている。
図5(c)によれば、図2の絵文字辞書テーブルと、図3の文字列辞書テーブルとを用いて、登録された形態素に、肯定的「+1」又は否定的「−1」の点数が付与されている。図5(c)によれば、以下の形態素に点数が付与されている。
絵文字「涙ぽろり」 :−1
文字列「悔しい」 :−1
絵文字「強調」 :1.2倍
文字列「悔しい」 :−1
文字列「バカやろ」 :−1
絵文字「強調」 :1.2倍
ここで、最初の副詞的絵文字「強調」は、文字列「悔しい」に係り受けする。また、次の副詞的絵文字「強調」は、文字列「バカやろ」に係り受けする。そうすると、図5の文章ファイルについて、評価の点数の合計は「−4.4」となる。
(−1)+(−1×1.2)+(−1)+(−1×1.2)=−4.4
ここで、どの文字列又は絵文字に、副詞的に係り受けされているかは、既存の構文解析(Syntactic Analysis)が用いられる。構文解析の処理は、パーサ(parse)とも称され、文章の文法的な関係を解析する。構文解析は、通常、文章ファイルにおける木構造のデータ構造と、字句解析に基づく字句とを入力し、構文木や抽象構文木のようなデータ構造を生成する。これによって、副詞的文字列及び副詞的絵文字が、どの文字列又は絵文字に係り受けされているかを決定することができる。
図6は、本発明における評価分析サーバの機能構成図である。
図6によれば、評価分析サーバ1は、端末2と通信する通信インタフェース部101と、端末2に対してWWWサーバとして機能するWWWサーバインタフェース部102と、投稿・閲覧される文章ファイルを蓄積するWebファイル蓄積部103とを有する。評価分析サーバ1は、Webサーバであって、例えば携帯電話機用のものであってもよい。
評価分析サービスのための評価分析サーバ1は、基本的に、形態素解析部111と、文字列辞書部112と、文字列抽出部113と、文字列レベル検索部114と、評価レベル決定部115とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させる評価分析プログラムを実行することによって実現される。
形態素解析部111は、Webファイル蓄積部103から文章ファイルを読み込み、その文章ファイルを形態素に分解する。分解された形態素は、文字列抽出部113へ出力される。
文字列辞書部112は、図3のような、特定文字列に評価レベルを対応付けた評価文字列を登録する。評価レベルは、例えば「肯定的」/「否定的」に段階的に分けられているものであってもよい。
文字列抽出部113は、文字列辞書部112を用いて、評価文字列に対応する形態素を抽出する。その評価文字列は、文字列レベル検索部114へ出力される。
文字列レベル検索部114は、文字列辞書部112を用いて、抽出された評価文字列に対する評価レベルを検索する。その評価レベルは、評価レベル決定部115へ出力される。
評価レベル決定部115は、文字列全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する。その評価レベルは、Webファイル蓄積部103の当該文章ファイルに対応付けられる。
本発明の評価分析サーバ1は、更に、絵文字辞書部121と、絵文字抽出部122と、絵文字レベル検索部123と、副詞的倍率検索部124と、係り受け解析部125とを有する。前述した形態素解析部111は、分解された形態素を、絵文字抽出部122へ更に出力する。これら機能構成部は、サーバに搭載されたコンピュータを機能させる評価分析プログラムを実行することによって実現される。
絵文字辞書部121は、図2のように、特定絵文字に評価レベルを対応付けた評価絵文字を登録する。また、特定絵文字に副詞的倍率を対応付けた副詞的絵文字も更に登録される。
絵文字抽出部122は、絵文字辞書部121を用いて、評価絵文字に対応する形態素を抽出する。その評価絵文字は、絵文字レベル検索部123へ出力される。また、絵文字抽出部122は、絵文字辞書部121を用いて、副詞的絵文字に対応する形態素も抽出する。その副詞的絵文字は、副詞的倍率検索部124へ出力される。
絵文字レベル検索部123は、絵文字辞書部121を用いて、抽出された評価絵文字に対する評価レベルを検索する。その評価レベルは、評価レベル決定部115へ出力される。
副詞的倍率検索部124は、絵文字辞書部121を用いて、抽出された副詞的絵文字に対する副詞的倍率を検索する。その副詞的倍率は、係り受け解析部125へ出力される。
係り受け解析部125は、副詞的絵文字の係り受けとなる評価絵文字又は評価文字列を検出する。これは、既存の構文解析技術によって決定される。
評価レベル決定部115は、文字列全て及び評価絵文字全ての評価レベルの和に基づいて、文章ファイルの評価レベルを決定する。このとき、副詞的絵文字の係り受けとなる評価絵文字又は評価文字列の評価レベルに、当該副詞的絵文字の副詞的倍率を乗算する。そして、具体的に図4及び図5で説明したように、文章ファイルにおける形態素毎の点数を合計する。その評価レベルは、Webファイル蓄積部103の当該文章ファイルに対応付けられる。文章ファイル及び評価レベルは同時に、端末を操作する利用者によって閲覧される。
図7は、本発明におけるフローチャートである。
図7によれば、サーバに搭載されたコンピュータを実行させる評価分析プログラムにおけるステップが説明されている。尚、図2に説明された絵文字辞書と、図3に説明された文字列辞書を予め保持する。
(S701)文字列及び絵文字を含む文章ファイルが、読み込まれる。
(S702)文章ファイルを形態素に分解する。
(S703)文字列辞書を用いて、評価文字列に対応する形態素を抽出する。
(S704)文字列辞書を用いて、抽出された評価文字列に対する評価レベルを検索する。
(S705)絵文字辞書を用いて、評価絵文字に対応する形態素を抽出する。
(S706)絵文字辞書を用いて、抽出された評価絵文字に対する評価レベルを検索する。
(S707)絵文字辞書を用いて、抽出された副詞的絵文字に対する副詞的倍率を検索する。
(S708)副詞的絵文字の係り受けとなる評価絵文字又は評価文字列を検出する。
(S709)評価文字列全ての評価レベルと、評価絵文字全ての評価レベルとの和に基づいて、文章ファイルの評価レベルを決定する。このとき、評価絵文字又は評価文字列の評価レベルに、当該副詞的絵文字の前記副詞的倍率を乗算する。
(S710)評価レベルを、当該文章ファイルに対応付ける。
以上、詳細に説明したように、本発明の評価分析サーバ、方法及びプログラムによれば、携帯電話機から投稿される絵文字を含む文章ファイルであっても、評判分析のための評価レベルを導出することができる。また、前述の実施形態によれば、文章ファイルが日本語であるとして説明しているが、英語や他言語であっても、文章ファイルに絵文字が含まれる限り、本発明によって評判分析を評価することができる。
前述した本発明の種々の実施形態において、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 評価分析サーバ
101 通信インタフェース部
102 WWWサーバインタフェース部
103 Webファイル蓄積部
111 形態素解析部
112 文字列辞書部
113 文字列抽出部
114 文字列レベル検索部
115 評価レベル決定部
121 絵文字辞書部
122 絵文字抽出部
123 絵文字レベル検索部
124 副詞的倍率検索部
125 係り受け解析部
2 携帯電話機、端末

Claims (9)

  1. 文章ファイルにおける評価レベルを分析する評価分析サーバであって、
    前記文章ファイルは、文字列及び絵文字を含んでおり、
    特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書手段と、
    前記文章ファイルを形態素に分解する形態素解析手段と、
    前記絵文字辞書手段を用いて、前記評価絵文字に対応する前記形態素を抽出する絵文字抽出手段と、
    前記絵文字辞書手段を用いて、抽出された前記評価絵文字に対する前記評価レベルを検索する絵文字レベル検索手段と、
    前記評価絵文字全ての評価レベルの和に基づいて、前記文章ファイルの評価レベルを決定する評価レベル決定手段と
    を有することを特徴とする評価分析サーバ。
  2. 特定文字列に評価レベルを対応付けた評価文字列を登録する文字列辞書手段と、
    前記文字列辞書手段を用いて、前記評価文字列に対応する前記形態素を抽出する文字列抽出手段と、
    前記文字列辞書手段を用いて、抽出された前記評価文字列に対する前記評価レベルを検索する文字列レベル検索手段と
    を更に有し、
    前記評価レベル決定手段は、前記評価文字列全ての評価レベルと、前記評価絵文字全ての評価レベルとの和に基づいて、前記文章ファイルの評価レベルを決定する
    ことを特徴とする請求項1に記載の評価分析サーバ。
  3. 前記絵文字辞書手段は、特定絵文字に副詞的倍率を対応付けた副詞的絵文字を更に登録しており、
    前記絵文字辞書手段を用いて、抽出された前記副詞的絵文字に対する前記副詞的倍率を検索する副詞的倍率検索手段と、
    前記副詞的絵文字の係り受けとなる前記評価絵文字又は前記評価文字列を検出する係り受け解析手段と
    を更に有し、
    前記評価レベル決定手段は、前記評価絵文字又は前記評価文字列の評価レベルに、当該副詞的絵文字の前記副詞的倍率を乗算することを特徴とする請求項2に記載の評価分析サーバ。
  4. 前記評価レベルは、「肯定的」/「否定的」に段階的に分けられていることを特徴とする請求項1から3のいずれか1項に記載の評価分析サーバ。
  5. 携帯電話機用のWebサーバであることを特徴とする請求項1から4のいずれか1項に記載の評価分析サーバ。
  6. 文章ファイルにおける評価レベルを分析する装置における評価分析方法であって、
    前記文章ファイルは、文字列及び絵文字を含んでおり、
    特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書を有し、
    前記文章ファイルを形態素に分解する第1のステップと、
    前記絵文字辞書を用いて、前記評価絵文字に対応する前記形態素を抽出する第2のステップと、
    前記絵文字辞書を用いて、抽出された前記評価絵文字に対する前記評価レベルを検索する第3のステップと、
    前記評価絵文字全ての評価レベルの和に基づいて、前記文章ファイルの評価レベルを決定する第4のステップと
    を有することを特徴とする評価分析方法。
  7. 特定文字列に評価レベルを対応付けた評価文字列を登録する文字列辞書を有し、
    前記文字列辞書を用いて、前記評価文字列に対応する前記形態素を抽出するステップと、
    前記文字列辞書を用いて、抽出された前記評価文字列に対する前記評価レベルを検索するステップと
    を更に有し、
    第4のステップは、前記評価文字列全ての評価レベルと、前記評価絵文字全ての評価レベルとの和に基づいて、前記文章ファイルの評価レベルを決定する
    ことを特徴とする請求項6に記載の評価分析方法。
  8. 前記絵文字辞書は、特定絵文字に副詞的倍率を対応付けた副詞的絵文字を更に登録しており、
    前記絵文字辞書を用いて、抽出された前記副詞的絵文字に対する前記副詞的倍率を検索するステップと、
    前記副詞的絵文字の係り受けとなる前記評価絵文字又は前記評価文字列を検出するステップと
    を更に有し、
    第4のステップは、前記評価絵文字又は前記評価文字列の評価レベルに、当該副詞的絵文字の前記副詞的倍率を乗算することを特徴とする請求項7に記載の評価分析方法。
  9. 文章ファイルにおける評価レベルを分析するサーバに搭載されたコンピュータを機能させる評価分析プログラムであって、
    前記文章ファイルは、文字列及び絵文字を含んでおり、
    特定絵文字に評価レベルを対応付けた評価絵文字を登録する絵文字辞書手段と、
    前記文章ファイルを形態素に分解する形態素解析手段と、
    前記絵文字辞書手段を用いて、前記評価絵文字に対応する前記形態素を抽出する絵文字抽出手段と、
    前記絵文字辞書手段を用いて、抽出された前記評価絵文字に対する前記評価レベルを検索する絵文字レベル検索手段と、
    前記評価絵文字全ての評価レベルの和に基づいて、前記文章ファイルの評価レベルを決定する評価レベル決定手段と
    してコンピュータを機能させることを特徴とする評価分析プログラム。
JP2009023311A 2009-02-04 2009-02-04 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム Pending JP2010181993A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009023311A JP2010181993A (ja) 2009-02-04 2009-02-04 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム
US12/698,486 US8478582B2 (en) 2009-02-04 2010-02-02 Server for automatically scoring opinion conveyed by text message containing pictorial-symbols
CN201010112854.0A CN101887414B (zh) 2009-02-04 2010-02-04 对包含图像符号的文本消息传达的评价自动打分的服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009023311A JP2010181993A (ja) 2009-02-04 2009-02-04 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2010181993A true JP2010181993A (ja) 2010-08-19

Family

ID=42398431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009023311A Pending JP2010181993A (ja) 2009-02-04 2009-02-04 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム

Country Status (3)

Country Link
US (1) US8478582B2 (ja)
JP (1) JP2010181993A (ja)
CN (1) CN101887414B (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752043B2 (en) 2006-09-29 2010-07-06 Verint Americas Inc. Multi-pass speech analytics
US9122749B2 (en) 2009-02-04 2015-09-01 Popular Metrics, Inc. Internet based system and method for wagering on an artist
US9326099B2 (en) 2008-02-11 2016-04-26 Popular Metrics, Inc. System and method for determining audience characteristics of a music concert based on mobile phone tracking and mobile data transmissions
US9323836B2 (en) 2008-02-11 2016-04-26 Popular Metrics, Inc. Internet based method and system for ranking artists using a popularity profile
US8719016B1 (en) 2009-04-07 2014-05-06 Verint Americas Inc. Speech analytics system and system and method for determining structured speech
US20130110601A1 (en) * 2010-06-29 2013-05-02 Rakuten, Inc. Information processing device, information processing method, information processing program, and recording medium having information processing program recorded thereon
US20130239023A1 (en) * 2010-10-25 2013-09-12 Nec Corporation Information-processing device, comment-prompting method, and computer-readable recording medium
US9292602B2 (en) * 2010-12-14 2016-03-22 Microsoft Technology Licensing, Llc Interactive search results page
WO2012143069A1 (en) 2011-04-21 2012-10-26 Sony Corporation A method for determining a sentiment from a text
US11086905B1 (en) * 2013-07-15 2021-08-10 Twitter, Inc. Method and system for presenting stories
CN104573747B (zh) * 2013-10-17 2019-03-08 北大方正集团有限公司 文字评价方法及装置
US9317566B1 (en) 2014-06-27 2016-04-19 Groupon, Inc. Method and system for programmatic analysis of consumer reviews
US11250450B1 (en) 2014-06-27 2022-02-15 Groupon, Inc. Method and system for programmatic generation of survey queries
US10878017B1 (en) 2014-07-29 2020-12-29 Groupon, Inc. System and method for programmatic generation of attribute descriptors
US10977667B1 (en) * 2014-10-22 2021-04-13 Groupon, Inc. Method and system for programmatic analysis of consumer sentiment with regard to attribute descriptors
US9690772B2 (en) 2014-12-15 2017-06-27 Xerox Corporation Category and term polarity mutual annotation for aspect-based sentiment analysis
KR101634086B1 (ko) * 2015-01-19 2016-07-08 주식회사 엔씨소프트 감정 분석을 통한 스티커 추천 방법 및 시스템
WO2016160941A1 (en) 2015-03-30 2016-10-06 Twiin, Inc. Systems and methods of generating consciousness affects
US20180150886A1 (en) * 2016-11-29 2018-05-31 Facebook, Inc. Controlling a content auction with a threshold value
CN108536671B (zh) * 2018-03-07 2021-12-21 世纪龙信息网络有限责任公司 文本数据的情感指数识别方法和系统
US10904174B1 (en) * 2019-07-03 2021-01-26 International Business Machines Corporation Screen size-based pictorial message translation
CN112684110A (zh) * 2020-12-14 2021-04-20 江西省蚕桑茶叶研究所(江西省经济作物研究所) 一种基于喜好表情的茶叶感官评价方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219733A (ja) * 2006-02-15 2007-08-30 Item:Kk メール文診断システム及びメール文診断プログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185065B1 (en) * 2000-10-11 2007-02-27 Buzzmetrics Ltd System and method for scoring electronic messages
US6983305B2 (en) * 2001-05-30 2006-01-03 Microsoft Corporation Systems and methods for interfacing with a user in instant messaging
US7289949B2 (en) * 2001-10-09 2007-10-30 Right Now Technologies, Inc. Method for routing electronic correspondence based on the level and type of emotion contained therein
AU2002950502A0 (en) * 2002-07-31 2002-09-12 E-Clips Intelligent Agent Technologies Pty Ltd Animated messaging
US7711779B2 (en) * 2003-06-20 2010-05-04 Microsoft Corporation Prevention of outgoing spam
DE60315647T2 (de) * 2003-09-15 2008-04-10 Philippe Baumard Verfahren und System zur Interessenniveaumessung von digitalen Nachrichten
JP3962382B2 (ja) 2004-02-20 2007-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現抽出装置、表現抽出方法、プログラム及び記録媒体
US7571213B2 (en) * 2004-03-26 2009-08-04 Microsoft Corporation Interactive electronic bubble messaging
US8903919B2 (en) * 2004-09-14 2014-12-02 International Business Machines Corporation Dynamic integration of application input and output in an instant messaging/chat session
US20060085515A1 (en) * 2004-10-14 2006-04-20 Kevin Kurtz Advanced text analysis and supplemental content processing in an instant messaging environment
US20070061814A1 (en) * 2005-09-13 2007-03-15 Choi Andrew C Method and apparatus for transparently interfacing a computer peripheral with a messaging system
US20070124387A1 (en) * 2005-11-22 2007-05-31 Yahoo! Inc. Previous communication updating in instant messaging
WO2007080559A2 (en) * 2006-01-16 2007-07-19 Zlango Ltd. Iconic communication
US7640304B1 (en) * 2006-06-14 2009-12-29 Yes International Ag System and method for detecting and measuring emotional indicia
US8010474B1 (en) * 2006-09-05 2011-08-30 Aol Inc. Translating paralinguisitic indicators
US8977631B2 (en) * 2007-04-16 2015-03-10 Ebay Inc. Visualization of reputation ratings
US7996210B2 (en) * 2007-04-24 2011-08-09 The Research Foundation Of The State University Of New York Large-scale sentiment analysis
US20080278520A1 (en) * 2007-05-08 2008-11-13 Andreasson Mans Folke Markus Methods, systems, and computer program products for modifying an electronic text message with warped images
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
US8170872B2 (en) * 2007-12-04 2012-05-01 International Business Machines Corporation Incorporating user emotion in a chat transcript
CN100570611C (zh) * 2008-08-22 2009-12-16 清华大学 一种基于观点检索的信息检索文档的评分方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219733A (ja) * 2006-02-15 2007-08-30 Item:Kk メール文診断システム及びメール文診断プログラム

Also Published As

Publication number Publication date
CN101887414A (zh) 2010-11-17
US20100198584A1 (en) 2010-08-05
CN101887414B (zh) 2014-07-16
US8478582B2 (en) 2013-07-02

Similar Documents

Publication Publication Date Title
JP2010181993A (ja) 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム
Amjad et al. “Bend the truth”: Benchmark dataset for fake news detection in Urdu language and its evaluation
US8412517B2 (en) Dictionary word and phrase determination
Bosco et al. Developing corpora for sentiment analysis: The case of irony and senti-tut
US20170277668A1 (en) Automatic document summarization using search engine intelligence
US10423649B2 (en) Natural question generation from query data using natural language processing system
US20080312910A1 (en) Dictionary word and phrase determination
CN108305180B (zh) 一种好友推荐方法及装置
Rao et al. CMEE-IL: Code Mix Entity Extraction in Indian Languages from Social Media Text@ FIRE 2016-An Overview.
Jabbar et al. An improved Urdu stemming algorithm for text mining based on multi-step hybrid approach
CN101308512B (zh) 一种基于网页的互译翻译对抽取方法及装置
Mataoui et al. A new syntax-based aspect detection approach for sentiment analysis in Arabic reviews
Algur et al. Sentiment analysis by identifying the speaker's polarity in Twitter data
KR101541170B1 (ko) 텍스트 요약 장치 및 방법
CN111555960A (zh) 信息生成的方法
JP2010102564A (ja) 感情特定装置、その方法、プログラム及び記録媒体
Alam et al. Multi-lingual author identification and linguistic feature extraction—A machine learning approach
Ogrodniczuk et al. Lexical correction of polish twitter political data
US20180293508A1 (en) Training question dataset generation from query data
JP2011118797A (ja) モバイルcgm分析システム、方法およびプログラム
KR101909537B1 (ko) 소셜 데이터 분류 시스템 및 방법
Alkhazi Compression-Based Parts-of-Speech Tagger for the Arabic Language
JP5980708B2 (ja) 対象文章を象徴する漢字を推定する漢字推定プログラム、装置、サーバ及び方法
Shah et al. Combining statistical, structural, and linguistic features for keyword extraction from web pages
Ariestya et al. Preprocessing For Crawler Of Short Message Social Media

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130417