JP2011204226A - 文の配列に基づく文書感情分類システムおよび方法 - Google Patents

文の配列に基づく文書感情分類システムおよび方法 Download PDF

Info

Publication number
JP2011204226A
JP2011204226A JP2011013789A JP2011013789A JP2011204226A JP 2011204226 A JP2011204226 A JP 2011204226A JP 2011013789 A JP2011013789 A JP 2011013789A JP 2011013789 A JP2011013789 A JP 2011013789A JP 2011204226 A JP2011204226 A JP 2011204226A
Authority
JP
Japan
Prior art keywords
document
emotion
polarity
sentence
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011013789A
Other languages
English (en)
Other versions
JP5283288B2 (ja
Inventor
Zhao Kai
カイ ザオ
Likun Qiu
リクン チュ
Changjian Hu
チェンジエン フー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2011204226A publication Critical patent/JP2011204226A/ja
Application granted granted Critical
Publication of JP5283288B2 publication Critical patent/JP5283288B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 文書を文の配列として解釈し、かつ文ベースの感情配列を考慮する配列解析を使用して、文書の感情極性を判定するための方法およびシステムを提案する。
【解決手段】 本発明の文書感情分類システムは、入力された文書から特徴語を抽出するための特徴語抽出手段と、特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、入力された文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定するための文感情判定手段と、文感情判定手段によって判定された個々の文の感情極性と感情強度の少なくとも1つに基づいて、文の感情極性の配列を有する文書入力を形成するための文書入力形成手段と、トレーニング済み文書感情判定モデルを使用して、文書入力形成手段によって形成された文書入力を処理することにより、入力された文書の感情極性を判定するための文書感情判定手段とを備える。本発明によれば、文書感情分類の精度を向上させることができる。
【選択図】 図2

Description

本発明は、自然言語処理分野に関し、特に、文の配列に基づく文書感情分類システムおよび方法に関する。
インターネットの普及に伴い、顧客による製品レビュー(感想)や出来事・方針等に関する個人の意見などの情報をインターネット上で発信する人は、増加の一途を辿っている。こうしたレビューや意見の多くはショッピングのウェブサイトやフォーラム、個人のブログなどで公開され、顧客・メーカー・調査機関等の個人や組織にとって大きな価値を持つようになってきている。それは、こうした公開された文書によって顧客やメーカーが製品の長所や短所を把握できるので、製品の改良に役立つほか、調査機関は出来事や方針に関する人々の意見を収集してそれを関連の部署や機関に伝えることができるので、対策の実施や戦略の調整が可能になるからである。こうした情報は膨大な量に上るため、コンピュータを利用して情報を自動的に解析・処理・要約し、その結果をユーザに提示できるのが望ましい。しかし、自然言語は多様で不規則なので、コンピュータによる自動処理を行うには様々な課題を解決することが必須となる。近年では、こうした課題に取り組む技術が必要とされている。
文書の解析は、複数の階層で複数の角度から実行することが可能である。ある種の解析では、その文書が肯定的か、否定的か、中立的かといった、文書の感情極性が判定される。
文書の感情極性の判定方式は、大きく「監視下」と「非監視下」の2つに分類される。監視下方式では、トレーニングサンプルの集合に手動で標識付けする必要がある。この集合は機械学習によるトレーニングに付され、それによってモデルが生成される。そして、この生成されたモデルを使用して、新規サンプルの感情極性が判定される。非監視下方式では、トレーニングサンプルの集合は不要である。代わりに、事前に手動定義された語表を使用していくつかの文書の感情極性が判定され、その後この語表が別の文書の感情極性の判定に使用され、その過程で語表が繰り返し修正される。
特許文献1(US2009/012537 A1、2009年5月14日公開)では、監視下方式と非監視下方式を同時に使用した文書感情の判定方法が開示されている。
文書は1つでも複数でもよいが、ほとんどの場合は複数の文書が存在する。
まず、感情極性を有するいくつかの語に基づいて、文書の感情が判定される。例えば、“convenient”(便利)、“rich”(充実)、“exquisite”(精巧)は肯定的な語であり、“dirty”(汚い)、“raspy”(耳障り)、“ugly”(醜い)は否定的な語である。語の感情極性は、次の2つのうちいずれかの方法で判定できる。(1)人による判定。例えば、HowNet感情辞書のような既存の辞書は、人による判定によって構築されている。(2)言語知識による判定。例えば、人は通常、“not convenient”(便利ではない)、“not rich enough”(あまり充実していない)のように肯定的な語の前に“not”等の否定語を用いて否定的な意味を伝えるので、“convenient”や“rich”のような肯定的な語について、これらの語と同時に否定語が出現しているかどうかに基づいて判定することが可能である。
感情辞書によっては、何らかの感情で語を定義すると同時に感情強度が示されていることもある。感情強度は、例えば、“good”(良い)が+1、“not bad”(悪くない)が+0.5、“bad”(悪い)が−1のような記号付き数値で表される(プラス記号“+”は肯定的な語を表し、マイナス記号“−”は否定的な語を表わす。このように、感情極性は、感情強度記号で表すことができる)。“good”の強度は“not bad”よりも大きいことから、“good”は“not bad”よりも肯定の度合いが強いことは明らかである。感情辞書に感情強度が示されていない場合には、感情強度は肯定的な語であればすべて+1に設定し、否定的な語であればすべて−1に設定すればよい。したがって、感情辞書はすべて、何らかの感情で語を定義すると同時に感情強度も示しているとみなすことができる。
感情極性を有する語を使用した文書感情判定の基本原則は、1つの文書に含まれる肯定感情語の総数が否定感情語の総数よりも多い場合、または1つの文書に含まれる感情極性を有するすべての語(すべての肯定感情語とすべての否定感情語)の感情強度の和がプラスの場合には、その文書は肯定的(肯定極性)と判定され、マイナスの場合には否定的(否定極性)と判定され、総数が等しいか感情強度の和が0の場合には、その文書は中立的と判定される、というものである。
文書感情の判定後、事前に設定された選択しきい値を上回る感情値(感情強度の和の絶対値)を有する文書が、比較的信頼できる文書として選択される。その後、選択された文書からいくつかの特徴が抽出される。これらの特徴と感情値の高い文書は、モデルをより有効なものにするためのトレーニングに使用される。
モデルのトレーニングが完了すると、このトレーニング済みモデルを使用して、上記の方法による新規文書の感情(肯定的、否定的、中立的)の自動判定を行うことができる。
US2009/012537 A1
Lawrence R.Rabiner,(隠れマルコフモデルおよび音声認識において選択されたアプリケーションに関するチュートリアル)。Proceedings of the IEEE、77(2)、p.257−286、February 1989 John Lafferty,Andrew McCallum,and Fernando Pereira.2001.Conditional random fields:Probabilistic models for segmenting and labeling sequence data(条件付き確率場:配列データのセグメント化および標識付けのための確率的モデル)。In Proceedings of ICML2001,2001,pp.282−289
しかしながら、特許文献1に開示される文書感情分類プロセスでは、感情語の出現順序が無視されるため、文書感情を誤判定する危険がある。ここで、誤判定が生じうる例として、以下の2つの文書について考察する。
1.Feel good良い気持ちだ)。Examination location is somewhat devious(試験会場はやや辺鄙な場所にある)。Questions are difficult(設問が難しい)。The examination is relatively successfully taken.(試験はまずまずの出来だ)。
2.Failed失敗した)。Good preparation(しっかり準備した)。High−spirited気合いが入っている)。Depressed, because I found at the arrival of examination location that the examination license was forgotten(試験会場に着いた途端に受験票を忘れたことに気がついて、落ち込んだ)。
上記の2つの文書は、肯定的な語と否定的な語を2つずつ含んでいる(下線太字の語)。これらの肯定的な語と否定的な語は、2つの文書では異なる順序で出現している。これらの文書が特許文献1の方法で処理された場合、語の出現回数のみが考慮され、出現順序は無視されるため、2つとも同じ感情極性を持つという結果となる。しかし実際は、これら2つの文書は明らかに異なる感情極性を有しており、前者は全体としては肯定的、後者は否定的である。そのため、感情極性の判定においては、語の出現順序と感情極性を有する文とを考慮する必要がある。
(発明の目的)
本発明は、上記の誤判定を回避することを目的として、文書を文の配列として解釈し、かつ文ベースの感情配列を考慮する配列解析を使用して、文書の全体的な感情極性を判定するための方法を提案する。
本発明の第1の態様による文書感情分類システムは、入力された文書から特徴語を抽出するための特徴語抽出手段と、特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、入力された文書に含まれる個々の文の感情極性または感情強度(もしくはその両方)を判定する文感情判定手段と、文感情判定手段によって判定された個々の文の感情極性または感情強度の少なくとも1つに基づいて、文の感情極性の配列を有する文書入力を形成する文書入力形成手段と、トレーニング済み文書感情判定モデルを使用して、文書入力形成手段によって形成された文書入力を処理することにより、入力された文書の感情極性を判定する文書感情判定手段とを含む。
文書感情分類システムは、トレーニング済み文書感情判定モデルを取得するために、トレーニング文書サンプルを用いて文書感情判定モデルをトレーニングするモデルトレーニング手段をさらに備えるのが望ましい。
文書感情分類システムは、トレーニング文書の感情極性を判定してトレーニング文書サンプルを形成するための文書サンプル形成手段をさらに備えるのが望ましい。ここで、特徴語抽出手段はトレーニング文書から特徴語を抽出する機能をさらに備え、文感情判定手段は、特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、トレーニング文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定する機能をさらに備え、文書サンプル形成手段は、文感情判定手段によって判定された個々の文の感情極性と感情強度の少なくとも1つに基づいてトレーニング文書の感情極性を判定し、文配列の感情極性と文書感情極性とを有するトレーニング文書サンプルを形成する。
文書感情分類システムは、文書感情判定手段によって出力された結果に基づくか、文書感情判定手段によって出力された結果を新規トレーニング文書サンプルとして使用するか、もしくはこの両方を行って、特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つを更新するための更新手段をさらに備えるのが望ましい。
文書感情分類システムは、特徴語を格納するための特徴語データベースと、トレーニング文書サンプルを格納するための文書サンプルデータベースとをさらに備えるのが望ましい。
本発明の第2の態様による文書感情分類方法は、入力された文書から特徴語を抽出するステップと、抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、入力された文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定するステップと、文の感情極性の配列を有する文書入力を形成するステップと、トレーニング済み文書感情判定モデルを使用して、形成された文書入力を処理することにより、入力された文書の感情極性を判定するステップとを含む。
文書感情分類方法は、トレーニング済み文書感情判定モデルを取得するために、トレーニング文書サンプルを用いて文書感情判定モデルをトレーニングするステップをさらに備えるのが望ましい。
文書感情分類方法は、トレーニング文書から特徴語を抽出するステップと、抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、トレーニング文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定するステップと、判定された個々の文の感情極性と感情強度の少なくとも1つに基づいてトレーニング文書の感情極性を判定するステップと、文配列の感情極性と文書感情極性とを有するトレーニング文書サンプルを形成するステップとをさらに備えるのが望ましい。
文書感情分類方法は、入力された文書に関して判定された感情極性に基づいて、抽出された特徴語の感情極性と感情強度の少なくとも1つを更新するステップと、文配列の感情極性および文書感情極性を有する出力結果を新規トレーニング文書サンプルとして使用するステップとをさらに備えるのが望ましい。
本発明によれば、文書感情分類の精度を向上させることができる。
本発明の上記および他の目的、特徴、並びに利点は、図面を参照して説明された下記の好適な実施例からさらに明らかになるであろう。
本発明による文書感情分類方法の概略フローチャートを示す。 本発明による文書感情分類方法の概略フローチャートを示す。 本発明による文書感情分類システム2000の概略ブロック図を示す。
これらの図では、同一もしくは類似の構造およびステップは同一もしくは類似の参照番号によって示している。
次に、添付図面を参照して、本発明の好適な実施例を説明する。以下の説明では、本発明の概念が曖昧になるのを回避するため、本発明に必須ではない詳細および機能を省略する。
図1Aおよび図1Bは、本発明による文書感情分類方法の概略フローチャートである。うち図1Aは文書感情分類方法のモデルトレーニング段階に関する概略フローチャートを示し、図1Bは文書感情分類方法の実行段階に関する概略フローチャートを示す。
まず、図1Aを参照して、文書感情分類方法のモデルトレーニング段階について詳細に説明する。
ステップS100において、文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定するために、文書から特徴語が抽出される。ここでの特徴語は、“devious”(辺鄙な)、“successful”(上出来の)のような通常の意味での語または句(例えば、広く一般に使用される語や句)であってもよいし、“Examination location is somewhat devious”(試験会場はやや辺鄙な場所にある)という文の一部である“location is somewhat devious”(やや辺鄙な場所)のような、語または句(もしくはその両方)から成る部分列であってもよい。
特徴語の抽出は、例えば、以下の2つの方法のうちいずれかを使用して実行することができる。
1.感情辞書内の語または部分列を特徴語として選択する。その語または部分列が感情辞書に記録されている限り、文書内の任意の語または部分列を特徴語として選択することができる。
2.出現頻度に基づいて、文書内の語または部分列を特徴語として選択する。基本的には、文書の肯定的な部分と否定的な部分における語または部分列の出現頻度の差が大きいほど、その語または部分列が特徴語として選択される可能性が高くなる。
一例を挙げれば、語または部分列の感情強度(w)は式(1)によって計算することができる。
s(w)=(F−F)/(F+F) (1)
ここで、FとFはそれぞれ、肯定的文書内および否定的文書内での語または部分列の出現頻度wを表す。文書内の各語または部分列の感情強度(w)は、式(1)に従って計算される。その後、感情強度s(w)の絶対値|s(w)|の降順リストに基づいて、絶対値|s(w)|がリストの前の部分(例えば、前半)にランクされている語または部分列wが特徴語として選択される。
ここで、いくつかの文書を肯定的または否定感情極性で指標付けしておく必要があることに留意されたい。この指標付けは、手作業で行うことも、あるいは従来技術で開示された適切な方法を用いて自動的に実行することもできる。
ステップS105において、ステップS100で抽出された特徴語の感情極性または感情強度(もしくはその両方)に基づいて、文書内の個々の文の感情極性または感情強度(もしくはその両方)が判定される。ここでは、例えば、まず各文の感情強度を計算し、その後、感情強度が肯定的な場合はその文の感情極性を肯定的と判定し、感情強度が否定的な場合はその文の感情極性は否定的と判定し、感情強度がゼロの場合はその文の感情極性は中立的と判定する、といった方法で、その文の感情極性を判定することができる。あるいは、文に含まれる特徴語の感情極性から直接、文全体の感情極性を判定してもよい。具体的には、肯定極性を有する特徴語の数が否定極性を有する特徴語の数を上回る場合には、その文の感情極性は肯定的と判定される。そして、肯定極性を有する特徴語の数が否定極性を有する特徴語の数を下回る場合には、その文の感情極性は否定的と判定される。さらに、肯定極性を有する特徴語の数が否定極性を有する特徴語の数と等しい場合には、その文の感情極性は中立的と判定される。
文全体の感情極性または感情強度(もしくはその両方)は、例えば以下の4つの方法で判定することができる。
i.特徴語wの感情強度s(w)に基づいて、文seの感情強度s(se)を計算する。
・文seの感情強度s(se)は、式(2)によって計算することができる。
Figure 2011204226
・換言すれば、s(se)は文seに含まれるすべての特徴語の感情強度s(w)の加重和に等しく、ここでλ(w)は特徴語wの重みである。λ(w)の値を設定する際の最も単純な方法は、λ(w)=1とする(すなわち、加重を行わない)ことである。しかし、より複雑な方法を使用して、λ(w)の値を設定することもできる。例えば、各特徴語wについて、特徴語wの長さLと文seの長さLseとに基づいてλ(w)の値を設定する。この場合の基本原則は以下のとおりである。すなわち、(1)特徴語wの長さLが長いほど、重みλ(w)は大きくなる(長い特徴語wは情報量が多いため、意味がより明確になり、信頼性も高まる。例えば、“delightful and congratulatory”(喜ばしく目出度い)という句は、“delightful”(喜ばしい)という語よりも信頼性が高いため、重みλ(w)を大きくする必要がある)。そして、(2)文seの長さLseが短いほど、重みλ(w)は大きくなる(文seが長くなると、特定の特徴語wに影響する語または部分列が増えるため、感情の安定度が低くなる。よって、短い文seは信頼性が高いということができる)。
・特徴語wの重みλ(w)は、式(3)によって決定することができる。
λ(w)=L /Lse (3)
ii.従来の依存関係解析法を用いて文を解析し、これにより文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定する。依存関係解析法においては、各文について、各ノードが1つの語を表し、かつ2つのノード間の各リンクが2つの特徴語間の関係を表すツリー構造がまず取得される。例えば、“I”(私は)→“like”(好きだ)は、主語と述語の関係を表す。その後、個々の文の感情極性または感情強度(もしくはその両方)が上から下の順に計算される。例えば、上記iの方法用いて、各層の特徴語について、感情強度の和を計算することができる。感情強度の和がゼロではない層に到達したら、計算は停止され、その層の感情強度の和が文全体の感情強度として採用される。
iii.各文に含まれる下位文とこれらの下位文間の関係とに基づいて、文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定する。最初に、カンマやセミコロンなどの句読記号に基づいて、文をいくつかの下位文に分割する。続いて、これらの下位文の関係を考慮に入れて、文の感情を調整する。最後に、すべての下位文を合計することにより、文の感情を計算する。詳細については、例えば、CN発明特許出願No.200910175170.2を参照のこと。
iv.手動または自動でいくつかの文サンプルを(肯定的または否定的として)標識付けし、その標識サンプルを使用して文感情判定モデルのトレーニングを行い、このトレーニング済みモデルを使用して文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定する。
文の感情極性または感情強度(もしくはその両方)の判定が完了したら、各文書(d,d,…)に対して以下の形式で標識付けを行う。
:<+,−,−,…>
:<−,+,+,…>
……
または
:<+19.5,−3.3,−2.5,…>
:<−39,+12,+3.2,…>
……
ここで、dとdは2つの文書を表わす。d内の1番目の文は+19.5の感情強度を有し、2番目の文は−3.3の感情強度を有し、以下同様に続く。
ステップS110Aにおいて、各文書からトレーニング文書サンプルを形成するため、個々の文の感情極性または感情強度(もしくはその両方)に基づいて各文書の感情極性が判定される。各文書の感情極性は手動で標識付けしても、あるいは文の感情極性または感情強度(もしくはその両方)の和によって判定してもよい(例えば、すべての文の感情強度がプラス記号付き、マイナス記号付き、またはゼロであれば、文書の感情極性はそれぞれ、肯定的、否定的、または中立的として判定することができる)。
以下のステップS110Aの説明においては、ステップS105で出力された下記の結果を使用する。
:<+19.5,−3.3,−2.5,…>
:<−39,+12,+3.2,…>
……
トレーニングで使用する文書サンプルは、例えば、以下の5つの方法で形成することができる。
A.トレーニングで使用する文書サンプルを得るために、以下の規則に従ってトレーニング文書サンプル内の各文に関する特徴表現<*>を形成する。
文の感情極性が肯定的な場合は、文をプラス記号“+”に置換する。
文の感情極性が否定的な場合は、文をマイナス記号“−”に置換する。
文の感情極性が中立的な場合は、文をゼロ“0”に置換する。
文の感情極性が肯定的な場合は、文を“P”で標識付けする。
文の感情極性が否定的な場合は、文を“N”で標識付けする。
文の感情極性が中立的な場合は、文を“Z”で標識付けする。
以下にその例を示す。
:<<+,P>,<−,P>,<−,P>,…>
:<<−,N>,<+,N>,<+,N>,…>

備考:dは肯定的文書(P)、dは否定的文書(N)である。また、d内の1番目、2番目、3番目の文は、それぞれ、肯定、否定、否定の感情極性を有する。
B.上記Aの方法を踏まえると、トレーニング文書サンプル内の各文の特徴表現<*>は、その文自体の感情極性に加えて、左隣および右隣の文の感情極性も含むことができる。
以下にその例を示す。
:<<none,+,−,P>,<+,−,−,P>,<−,−,+,P>,…>
:<<none,−,+,N>,<−,+,+,N>,<+,+,−,N>,…>

備考:dは肯定的文書(P)である。1番目の文の特徴表現<none,+,−,P>は、文書d内の1番目の文(感情強度は+19.5)に関しては、左隣に文はない(none)が、右隣には否定的(−)な文があり、この文自体は肯定的(+)であることを示す。
C.上記AまたはBの方法を踏まえると、トレーニング文書サンプル内の各文の特徴表現<*>は、その文の文書内における位置に関する情報を含むことができる。
以下にその例を示す。
:<<+,P>,<−,P>,<−,P>,…,<−,P>>,or
:<<none,+,−,P>,<+,−,−,P>,<−,−,+,P>…,<+,−,none,P>>
備考:P、P、およびPは、それぞれ、その文が文書の始め、中央、および最後の部分に位置することを表わす。文の位置は、例えば、以下の方法で決定することができる。
(1)対称分割法:文書内の最初の1/3、中央の1/3、最後の1/3の文が、それぞれ、文書の冒頭部、中央部、末尾部として分割される。
(2)非対称分割法:文書内の最初と最後の文がそれぞれ文書の冒頭部および末尾部として分割され、残りの文は文書の中央部として分割される。言うまでもなく、冒頭部や末尾部に属する文の数は必要に応じて調整することができる。
D.上記A、B、またはCの方法を踏まえると、トレーニング文書サンプル内の各文の特徴表現<*>は、その文の強度ランクを含むことができる。
以下にその例を示す。
:<<+,r,P>,<−,r,P>,<−,r,P>,…>,or
:<<+,r,P>,<−,r,P>,<−,r,P>,…>,or
:<<none,+,−,r,P>,<+,−,−,r,P>,<−,−,+,r,P>…>
ここで、r、r、rはそれぞれ、第1位、第2位、第3位の文強度ランクを表す。ランクは、以下のようにして決定できる。
文の感情強度は[2*(MaxStr−MinStr)/3,MaxStr]の範囲内であることを示す。
文の感情強度は[1*(MaxStr−MinStr)/3,2*(MaxStr−MinStr)/3]]の範囲内であることを示す。
文の感情強度は[MinStr,1*(MaxStr−MinStr)/3)]の範囲内であることを示す。
ここで、MaxStrとMinStrはそれぞれ、文書内のすべての文の中の最大および最小感情強度を表す。
E.上記A〜Dの方法に代えて、各文について4つの特徴<F,F,F,F>を有するベクトルを作成することもできる。ここで、特徴F、F、Fはそれぞれ、文書の冒頭部分、中央部分、および末尾部分にある文の感情を表す。各特徴の値は、文書の対応する部分に属するすべての文の感情強度の和とすることができる。文書の冒頭部分、中央部分、および末尾部分は、上記Cの方法で文書を分割して決定する。特徴Fは文書の感情(P、N、またはZ)を表す。
ステップS110を上記のように実行すると、以下のようなトレーニング文書サンプルが形成される。
A: d:<<+,P>,<−,P>,<−,P>…>;or
B: d:<<none,+,−,P>,<+,−,−,P>,<−,−,+,P>,…>;or
C: <<+,P>,<−,P>,<−,P>,…,<−,P>>;or
D: d:<<+,r,P>,<−,r,P>,<−,r,P>…>;or
E: <F,F,F,F>.
ステップS115において、ステップS110Aで形成されたトレーニング文書サンプルを用いて文書感情判定モデルがトレーニングされ、後の実行段階において、新規に入力された文書の感情極性の判定で使用する、トレーニング済み文書感情判定モデルが生成される。
文書感情判定モデルをトレーニングする方法には、様々なものがある。例えば、隠れマルコフモデル(非特許文献1:Lawrence R.Rabiner,(隠れマルコフモデルおよび音声認識において選択されたアプリケーションに関するチュートリアル)。Proceedings of the IEEE、77(2)、p.257−286、February 1989)、または条件付き確率場(非特許文献2:John Lafferty,Andrew McCallum,and Fernando Pereira.2001.Conditional random fields:Probabilistic models for segmenting and labeling sequence data(条件付き確率場:配列データのセグメント化および標識付けのための確率的モデル)。In Proceedings of ICML2001,2001,pp.282−289)などのような配列トレーニングモードを、A〜Dの方法で形成したトレーニング文書サンプルを使用したモデルトレーニングにおいて採用することができる。また、Eの方法で形成したトレーニング文書サンプルを使用したモデルトレーニングにおいては、サポートベクトルマシンのような非配列トレーニングモードモードを採用することができる。
次に、文書感情分類方法の実行段階について、図1Bを参照しながら詳述する。この図では、図1Aと同じ要素には同じ参照番号を付している。
ステップS100において、新規に入力された文書から特徴語が抽出される。これらの特徴語は、入力された文書内の個々の文の感情極性または感情強度(もしくはその両方)の判定に使用される。
ステップS105において、ステップS100で抽出された特徴語の感情極性または感情強度(もしくはその両方)に基づいて、文書内の個々の文の感情極性または感情強度(もしくはその両方)が判定される。
上記のステップS110Aとは別に、ステップS110Bにおいて、文配列の感情極性を明記した文書入力が形成される。ここでは、文への感情極性または感情強度(もしくはその両方)の標識付けのみが行われ、文自体には感情極性の標識はまだ付けられない。実のところ、文書の感情極性は当該方法の最後に予定される出力である。実行段階のステップS110Bにおいては、文書入力はモデルトレーニング段階のステップS110Aにおいて行われたトレーニング文書サンプルの形成と同じ方法で形成される必要がある。すなわち、A〜Eの中の1つの方法がステップS110AおよびS110Bでも使用されなければならない。
新規に入力された文書は、例えば、“Feel good(良い気持ちだ)。Examination location is somewhat devious(試験会場がやや辺鄙な場所にある)。Questions are difficult(設問が難しい)。The examination is relatively successfully taken.(試験はまずまずの出来だ)」であるとする。
最終的な文書入力は、ステップS110B(方法A)によって“<+,−,−,+>”か、ステップS110B(方法B)によって“<<none,+,−>,<+,−,−>,<−,−,+>,<−,+,none>>”か、またはステップS110B(方法C)によって“<+,−,−,+>”または“<<none,+,−>,<+,−,−>,<−,−,+>,<−,+,none>>”(以下続く)の形式となる。
ステップS120において、ステップS110Bで形成された文書入力が、ステップS115でトレーニングされた文書感情判定モデルに供給され、新規に入力された文書の感情極性が判定される。
引き続きステップS110Bで新規に入力された文書を例にとると、以下のような出力が得られる。
方法Aの場合は“<<+,P>,<−,P>,<−,P>,<+,P>>”、
方法Bの場合は“<<none,+,−,P>,<+,−,−,P>,<−,−,+,P>,<−,+,none,P>>”、または
方法Cの場合は“<<+,P>,<−,P>,<−,P>,<+,P>>”
文書の感情極性はP、N、またはZという単一の記号で表されるため、1番目の文の最初の記号がユーザに提示される最終出力結果となる。
さらに、ステップS100で抽出された特徴語の感情極性または感情強度(もしくはその両方)は、ステップS120の出力結果に基づいて更新することができる。また、出力結果は手動でもしくは自動的に、新規トレーニング文書サンプルとして使用することも可能である。
図2に、本発明による文書感情分類システム2000の概略ブロック図を示す。
図2に示すように、文書感情分類システム2000は、特徴語抽出手段200と、文感情判定手段205と、文書サンプル形成手段210Aと、モデルトレーニング手段215と、文書入力形成手段210Bと、文書感情判定手段220とを主に備える。このうち、図1Aのモデルトレーニング段階では、特徴語抽出手段200と文感情判定手段205と文書サンプル形成手段210Aとモデルトレーニング手段215とが使用され、図1Bの実行段階では、特徴語抽出手段200と文感情判定手段205と文書入力形成手段210Bと文書感情判定手段220とが使用される。文書感情分類システム2000は、特徴語データベース230と文書サンプルデータベース235と更新手段225とをさらに備えることができる。図2には、モデルトレーニング手段215によってトレーニングされ、文書感情判定手段220によって使用される、文書感情判定モデル240も示されている。
図1Aのモデルトレーニング段階においては、特徴語抽出手段200が(ステップS100の方法1もしくは2、または他の既知の方法を用いて)、特徴語データベース230に従って文書から特徴語を抽出する。文感情判定手段205が(ステップS105の方法i〜iv、または他の既知の方法を用いて)、特徴語抽出手段200によって抽出された特徴語の感情極性または感情強度(もしくはその両方)に基づいて、文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定する。文書サンプル形成手段210Aが(ステップS110Aの方法A〜E、または他の既知の方法を用いて)、文感情判定手段205によって判定された個々の文の感情極性または感情強度(もしくはその両方)に基づいて、文書の感情極性を判定し、トレーニング文書サンプルを生成する。文書サンプル形成手段210Aは、形成されたトレーニング文書サンプルを、後の使用のために文書サンプルデータベース235に格納することができる。モデルトレーニング手段215が(ステップS115で説明したトレーニング文書感情判定モデルのトレーニング方法のいずれか、または他の既知の方法を用いて)、文書サンプル形成手段210Aによって形成されたトレーニング文書サンプルを用いて文書感情判定モデル240をトレーニングし、トレーニング済み文書感情判定モデル240を取得する。あるいは、モデルトレーニング手段215が文書サンプルデータベース235から直接トレーニング文書サンプルを読み出して文書感情判定モデル240をトレーニングすることにより、トレーニング済み文書感情判定モデル240を取得することもできる。トレーニング済み文書感情判定モデル240は、実行段階で文書感情判定手段220によって、新規入力文書の感情極性を判定するために使用される。
図1Bの実行段階においては、特徴語抽出手段200が(ステップS100の方法1もしくは2、または他の既知の方法を用いて)、新規入力文書から特徴語を抽出する。文感情判定手段205が(ステップS105の方法i〜iv、または他の既知の方法を用いて)、特徴語抽出手段200によって抽出された特徴語の感情極性または感情強度(もしくはその両方)に基づいて、文書内の個々の文の感情極性または感情強度(もしくはその両方)を判定する。文書入力形成手段210Bが(文書サンプル形成手段210Aによって採用されたのと同じ方法を用いて)、文感情判定手段205によって判定された個々の文の感情極性または感情強度(もしくはその両方)に基づいて、文配列の感情極性を明記した文書入力を形成する。形成された文書入力においては、個々の文の感情極性または感情強度(もしくはその両方)のみが標識付けされ、文書自体の感情極性の標識付けは行われない。事実、文書の感情極性は後に出力される。文書感情判定手段220は、文書入力形成手段210によって形成された文書入力を、モデルトレーニング手段215によってトレーニングされた文書感情判定モデル240に送る(すなわち、この新規入力文書の感情極性の判定を、結果の出力として供給する)。
そして、更新手段225が、文書感情判定手段220の結果の出力に基づいて、特徴語抽出手段200によって抽出された特徴語の感情極性または感情強度(もしくはその両方)を更新する(すなわち、特徴語データベース230を更新する)。また、更新手段225はさらに、ユーザの指示および選択に従って(または自動的に)、文書感情判定手段220からの結果の出力を新たなトレーニング文書サンプルとして文書サンプルデータベース235に格納する(すなわち、文書サンプルデータベース235を更新する)。
上記の説明では、各ステップに関連していくつかの具体例を示した。発明者はこれらの具体例を相互に関連して列記するよう努めたが、列記された具体例が、参照番号によって示唆される対応関係を有する必要があるわけではない。異なるステップにおいて参照番号の面で対応関係にない具体例を選択したとしても、選択した具体例の基礎を成す条件が相互に対立しない限り、これらの具体例によって複数の解決法を達成することが可能である。本発明の範囲にはこうした解決策がすべて内包される。
上記の説明では、本発明の解決法は例として示したに過ぎないことに留意されたい。本発明は上記のステップおよび要素構造に限定されるものではなく、実際の使用条件に合わせてこれらのステップや要素構造を変更および修正することが可能である。また、ステップおよび要素の中には、本発明の全体概念の実装において必須ではないものもある。したがって、本発明の重要な技術的特徴は、上記の特定の具体例にではなく、本発明の全体概念の実装における最低限の要件に限定される。
本発明において開示された実施例のさらに他の構成は、最初に簡単に説明し、その後方法の実施例において詳述したステップおよび動作のためのソフトウェアプログラムから成る。具体的には、このコンピュータプログラム製品は、計算装置上で稼働する間に関連の動作を提供するコンピュータプログラム論理が符号化された、コンピュータ可読媒体を備える実施例である。コンピュータプログラム論理が計算システムの少なくとも1つのプロセッサ上で実行されると、当該プロセッサを介して実施例の動作(ステップ)が実行される。本発明のこうした構成は、典型的には、光媒体(例:CD−ROM)などのコンピュータ可読媒体、フロッピーディスクもしくはハードディスク等の各種タイプの媒体上で提供されるか、または符号化されたソフトウェア、コード、またはその他のデータ構造体、1つ以上のROM、RAM、もしくはPROMチップ上のファームウェアもしくはマイクロコード、特定用途向け集積回路(ASIC)、ダウンロード可能なソフトウェアイメージ、または単一もしくは複数モジュール上の共有データベースとして提供される。ソフトウェアまたはファームウェアの形態をとる構成は、計算装置上にインストールし、当該計算装置内の1つ以上のプロセッサを介して本発明の実施例を実装することができる。ソフトウェアプロセスを、例えば他のエンティティ内のデータ通信装置や計算装置と共に稼働させると、本発明のシステムが提供される。本発明のシステムは、いくつかのソフトウェアプロセスを複数のデータ通信装置間に分散させたり、一連の小型専用コンピュータ上ですべてのソフトウェアプロセスを稼働させたり、あるいは単一のコンピュータ上ですべてのソフトウェアプロセスを稼働させたりすることにより実現することも可能である。
本発明の実施例は、厳密には、ソフトウェアプログラム、1台のデータ通信装置上のソフトウェアおよびハードウェア、独立したソフトウェア、または独立した回路として実装できることに留意されたい。
以上、本発明についてその好適な実施例を参照して説明してきたが、当該技術に精通した当業者には、本発明の精神と範囲から逸脱することなく様々な修正、変更、追加を行うことが可能なことは明らかであろう。したがって、本発明の範囲は上記の特定の実施例に限定されず、付記した請求項によってのみ限定される。
2000:文書感情分類システム
230:特徴語データベース
235:文書サンプルデータベース
225:更新手段
200:特徴語抽出手段
205:文感情判定手段
210A:文書サンプル形成手段
215:モデルトレーニング手段
240:文書感情判定モデル
210B:文書入力形成手段
220:文書感情判定手段

Claims (9)

  1. 入力された文書から特徴語を抽出するための特徴語抽出手段と、
    前記特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、入力された文書に含まれる個々の文の感情極性または感情強度(もしくはその両方)を判定する文感情判定手段と、
    前記文感情判定手段によって判定された個々の文の感情極性または感情強度の少なくとも1つに基づいて、文の感情極性の配列を有する文書入力を形成する文書入力形成手段と、
    トレーニング済み文書感情判定モデルを使用して、前記文書入力形成手段によって形成された文書入力を処理することにより、入力された文書の感情極性を判定する文書感情判定手段と
    を備えることを特徴とする文書感情分類システム。
  2. 前記トレーニング済み文書感情判定モデルを取得するために、トレーニング文書サンプルを用いて文書感情判定モデルをトレーニングするモデルトレーニング手段をさらに備えることを特徴とする請求項1に記載の文書感情分類システム。
  3. トレーニング文書の感情極性を判定してトレーニング文書サンプルを形成する文書サンプル形成手段をさらに備え、
    前記特徴語抽出手段は、トレーニング文書から特徴語を抽出し、
    前記文感情判定手段は、前記特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、トレーニング文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定し、
    前記文書サンプル形成手段は、前記文感情判定手段によって判定された個々の文の感情極性と感情強度の少なくとも1つに基づいてトレーニング文書の感情極性を判定し、文配列の感情極性と文書感情極性とを有するトレーニング文書サンプルを形成することを特徴とする請求項1又は請求項2に記載の文書感情分類システム。
  4. 前記文書感情判定手段によって出力された結果に基づくか、前記文書感情判定手段によって出力された結果を新規トレーニング文書サンプルとして使用するかの少なくとも1つによって、前記特徴語抽出手段によって抽出された特徴語の感情極性と感情強度の少なくとも1つを更新する更新手段をさらに備えることを特徴とする請求項1から請求項3の何れか1項に記載の文書感情分類システム。
  5. 特徴語を格納するための特徴語データベースと、
    トレーニング文書サンプルを格納する文書サンプルデータベースとをさらに備えることを特徴とする請求項1から請求項4の何れか1項に記載の文書感情分類システム。
  6. 入力された文書から特徴語を抽出するステップと、
    抽出された特徴語の感情極性と感情強度の少なくとも1つに基づいて、入力された文書に含まれる個々の文の感情極性と感情強度の少なくとも1つを判定するステップと、
    文の感情極性の配列を有する文書入力を形成するステップと、
    トレーニング済み文書感情判定モデルを使用して、形成された文書入力を処理することにより、入力された文書の感情極性を判定するステップと
    を有することを特徴とする文書感情分類方法。
  7. トレーニング済み文書感情判定モデルを取得するために、トレーニング文書サンプルを用いて文書感情判定モデルをトレーニングするステップをさらに有することを特徴とする請求項6に記載の文書感情分類方法。
  8. トレーニング文書から特徴語を抽出するステップと、
    抽出された特徴語の感情極性または感情強度(もしくはその両方)に基づいて、トレーニング文書に含まれる個々の文の感情極性または感情強度(もしくはその両方)を判定するステップと、
    判定された個々の文の感情極性または感情強度(もしくはその両方)に基づいてトレーニング文書の感情極性を判定するステップと、
    文配列の感情極性と文書感情極性とを有するトレーニング文書サンプルを形成するステップと
    をさらに有することを特徴とする請求項6又は請求項7に記載の文書感情分類方法。
  9. 入力された文書に関して判定された感情極性に基づいて、抽出された特徴語の感情極性と感情強度の少なくとも1つを更新するステップと、
    文配列の感情極性および文書感情極性を有する出力結果を新規トレーニング文書サンプルとして使用するステップとをさらに有することを特徴とする請求項6から請求項8の何れか1項に記載の文書感情分類方法。
JP2011013789A 2010-03-25 2011-01-26 文の配列に基づく文書感情分類システムおよび方法 Expired - Fee Related JP5283288B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010135790.6 2010-03-25
CN2010101357906A CN102200969A (zh) 2010-03-25 2010-03-25 基于句子顺序的文本情感极性分类系统和方法

Publications (2)

Publication Number Publication Date
JP2011204226A true JP2011204226A (ja) 2011-10-13
JP5283288B2 JP5283288B2 (ja) 2013-09-04

Family

ID=44661655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011013789A Expired - Fee Related JP5283288B2 (ja) 2010-03-25 2011-01-26 文の配列に基づく文書感情分類システムおよび方法

Country Status (2)

Country Link
JP (1) JP5283288B2 (ja)
CN (1) CN102200969A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
JP2015075993A (ja) * 2013-10-10 2015-04-20 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2015109004A (ja) * 2013-12-05 2015-06-11 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
WO2019042450A1 (zh) * 2017-09-04 2019-03-07 华为技术有限公司 一种自然语言处理方法和装置
CN110276076A (zh) * 2019-06-25 2019-09-24 北京奇艺世纪科技有限公司 一种文本情绪分析方法、装置及设备
JP2020061177A (ja) * 2019-12-24 2020-04-16 本田技研工業株式会社 情報提供装置
US10929652B2 (en) 2017-06-07 2021-02-23 Honda Motor Co., Ltd. Information providing device and information providing method
CN113688620A (zh) * 2021-08-26 2021-11-23 北京阅神智能科技有限公司 文章情感分析方法和装置
US11544307B2 (en) 2018-04-26 2023-01-03 Panasonic Intellectual Property Corporation Of America Personnel selecting device, personnel selecting system, personnel selecting method, and recording medium

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593334B (zh) * 2012-08-15 2017-07-28 中国电信股份有限公司 一种用于判断文本情感程度的方法和系统
CN103336764A (zh) * 2013-06-18 2013-10-02 百度在线网络技术(北京)有限公司 基于倾向性分析的分类模型建立、内容识别方法及装置
CN104346336A (zh) * 2013-07-23 2015-02-11 广州华久信息科技有限公司 一种基于机器文本对骂的情感发泄方法及系统
CN103593431A (zh) * 2013-11-11 2014-02-19 北京锐安科技有限公司 网络舆情分析方法和装置
CN103631961B (zh) * 2013-12-17 2017-01-18 苏州大学张家港工业技术研究院 一种情感词与评价对象的关系识别方法
CN106104521B (zh) * 2014-01-10 2019-10-25 克鲁伊普有限责任公司 用于自动检测文本中的情感的系统、设备和方法
CN104573030B (zh) * 2015-01-14 2017-12-12 哈尔滨工业大学深圳研究生院 一种文本情绪预测方法及装置
CN104809103B (zh) * 2015-04-29 2018-03-30 北京京东尚科信息技术有限公司 一种人机对话的语义分析方法及系统
CN106557463A (zh) * 2016-10-31 2017-04-05 东软集团股份有限公司 情感分析方法及装置
CN106886580B (zh) * 2017-01-23 2020-01-17 北京工业大学 一种基于深度学习的图片情感极性分析方法
CN107704763A (zh) * 2017-09-04 2018-02-16 中国移动通信集团广东有限公司 多源异构漏洞情报去重方法、分级方法及装置
CN107944911B (zh) * 2017-11-18 2021-12-03 电子科技大学 一种基于文本分析的推荐系统的推荐方法
CN109815335B (zh) * 2019-01-26 2022-03-04 福州大学 一种适用于文献网络的论文领域分类方法
CN109933656B (zh) * 2019-03-15 2023-08-15 深圳市赛为智能股份有限公司 舆情极性预测方法、装置、计算机设备及存储介质
CN112101033B (zh) * 2020-09-01 2021-06-15 广州威尔森信息科技有限公司 一种汽车口碑的情感分析方法和装置
CN113377910A (zh) * 2021-06-09 2021-09-10 平安科技(深圳)有限公司 情感评价方法、装置、电子设备和存储介质
CN113392218A (zh) * 2021-07-12 2021-09-14 北京百度网讯科技有限公司 文本质量评估模型的训练方法和确定文本质量的方法
CN114065742B (zh) * 2021-11-19 2023-08-25 马上消费金融股份有限公司 一种文本检测方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4148522B2 (ja) * 2004-11-19 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現検出システム、表現検出方法、及びプログラム
US20100017391A1 (en) * 2006-12-18 2010-01-21 Nec Corporation Polarity estimation system, information delivery system, polarity estimation method, polarity estimation program and evaluation polarity estimatiom program
CN101174272A (zh) * 2007-10-26 2008-05-07 北京航空航天大学 汉语文本情感数据的组织及提取方法
JP2010020390A (ja) * 2008-07-08 2010-01-28 Toyota Central R&D Labs Inc 感情推定装置及び感情推定プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNG201000459043; 横野 光,外1名: '文とテキストに対する感情極性の同時推定' 言語処理学会第16回年次大会発表論文集 , 20100308, P.182-185, 言語処理学会 *
JPN6012034036; 横野 光,外1名: '文とテキストに対する感情極性の同時推定' 言語処理学会第16回年次大会発表論文集 , 20100308, P.182-185, 言語処理学会 *
JPN6013002457; McDonald,R. et al.: 'Structured Models for Fine-to-Coarse Sentiment Analysis' Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics , 200707, p.432-439, Association for Computational Linguistics *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929860B (zh) * 2012-10-12 2015-05-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
CN102929860A (zh) * 2012-10-12 2013-02-13 浙江理工大学 一种基于上下文语境的中文分句情感极性判别方法
JP2015075993A (ja) * 2013-10-10 2015-04-20 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2015109004A (ja) * 2013-12-05 2015-06-11 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置
US10929652B2 (en) 2017-06-07 2021-02-23 Honda Motor Co., Ltd. Information providing device and information providing method
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
US11645554B2 (en) 2017-06-20 2023-05-09 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium
WO2019042450A1 (zh) * 2017-09-04 2019-03-07 华为技术有限公司 一种自然语言处理方法和装置
US11630957B2 (en) 2017-09-04 2023-04-18 Huawei Technologies Co., Ltd. Natural language processing method and apparatus
US11544307B2 (en) 2018-04-26 2023-01-03 Panasonic Intellectual Property Corporation Of America Personnel selecting device, personnel selecting system, personnel selecting method, and recording medium
CN110276076A (zh) * 2019-06-25 2019-09-24 北京奇艺世纪科技有限公司 一种文本情绪分析方法、装置及设备
JP2020061177A (ja) * 2019-12-24 2020-04-16 本田技研工業株式会社 情報提供装置
CN113688620A (zh) * 2021-08-26 2021-11-23 北京阅神智能科技有限公司 文章情感分析方法和装置
CN113688620B (zh) * 2021-08-26 2024-03-22 北京阅神智能科技有限公司 文章情感分析方法和装置

Also Published As

Publication number Publication date
JP5283288B2 (ja) 2013-09-04
CN102200969A (zh) 2011-09-28

Similar Documents

Publication Publication Date Title
JP5283288B2 (ja) 文の配列に基づく文書感情分類システムおよび方法
Kozlowski et al. The geometry of culture: Analyzing the meanings of class through word embeddings
CN106650943B (zh) 基于人工智能的辅助写作方法和装置
Cosco et al. Lay perspectives of successful ageing: a systematic review and meta-ethnography
Oudah et al. A pipeline Arabic named entity recognition using a hybrid approach
Bhonde et al. Sentiment analysis based on dictionary approach
US20150348569A1 (en) Semantic-free text analysis for identifying traits
KR102235990B1 (ko) 모순 표현 수집장치 및 그를 위한 컴퓨터 프로그램
Shirsat et al. Document level sentiment analysis from news articles
Kumar et al. A deep learning approaches and fastai text classification to predict 25 medical diseases from medical speech utterances, transcription and intent
Aisopos et al. Using n-gram graphs for sentiment analysis: an extended study on Twitter
Chatterjee et al. Suicide ideation detection from online social media: A multi-modal feature based technique
Asgari et al. Identifying key success factors for startups With sentiment analysis using text data mining
Baghdadi et al. Automatic classification of free-text medical causes from death certificates for reactive mortality surveillance in France
Sakib et al. Analysis of suicidal tweets from twitter using ensemble machine learning methods
Wu et al. Annotating cognates in phylogenetic studies of Southeast Asian languages
Schuller et al. Three recent trends in paralinguistics on the way to omniscient machine intelligence
Fha et al. Development of an efficient method to detect mixed social media data with tamil-english code using machine learning techniques
Hussain et al. A technique for perceiving abusive bangla comments
Danner et al. Advancing Mental Health Diagnostics: GPT-Based Method for Depression Detection
Samanta et al. Depression Detection from Twitter Data Using Two Level Multi-modal Feature Extraction
Sarkar et al. Feature-based suicide-ideation detection from Twitter data using machine learning techniques
Nikadon et al. BERTAgent: The development of a novel tool to quantify agency in textual data
Cerulo et al. Irish: A hidden Markov model to detect coded information islands in free text
Obagbuwa et al. Supervised machine learning models for depression sentiment analysis

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120927

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130419

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130430

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130527

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees