JP2004094583A - Method of classifying writings - Google Patents

Method of classifying writings Download PDF

Info

Publication number
JP2004094583A
JP2004094583A JP2002254515A JP2002254515A JP2004094583A JP 2004094583 A JP2004094583 A JP 2004094583A JP 2002254515 A JP2002254515 A JP 2002254515A JP 2002254515 A JP2002254515 A JP 2002254515A JP 2004094583 A JP2004094583 A JP 2004094583A
Authority
JP
Japan
Prior art keywords
rule
classification
sentence
emotion
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002254515A
Other languages
Japanese (ja)
Inventor
Naoko Nabeya
鍋谷 尚子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Advanced Technology Corp
Original Assignee
NTT Advanced Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Advanced Technology Corp filed Critical NTT Advanced Technology Corp
Priority to JP2002254515A priority Critical patent/JP2004094583A/en
Publication of JP2004094583A publication Critical patent/JP2004094583A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method of classifying writings capable of improving the precision of writing classification and fuling extraction by preventing an objective writing from being omitted in classification and extraction, by assigning a range in a rule for specifying a position of word information serving as significant point in the writing, and by conducting the classification and feeling extraction only using rule matching. <P>SOLUTION: The word information such as a result analyzed by configuration element analyzing processing for word-dividing a character, a character string, symbols and a text in the writing is matched to the rule by the assigned range where an appearance position is limited, to narrow and classify the writing, and feeling intended with the writing is also discriminated without reading the writing, using a similar rule system. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、ネットビジネスにおいて、電子メールやWebページからの様々な問い合せに対し、文章の自動分類および感情区分に応じて文章の抽出を行い、業務の効率化を図る文章分類および感情抽出方法に関する。
【0002】
【従来の技術】
従来から文章の分類技術は、蓄積された大量のデータやコーパスをもとに学習した結果を使用し、類似結果から分類を行う。そして、類似度が高い分類項目に分類するようになっている。図15は、従来の文章分類処理の一例を示した図である。文章が入力されると、形態素解析部がその文章を形態素解析する。この解析結果を学習部で前もって登録された大量のデータベースやコーパス等との学習を行い、類似度を計算して最も類似度が高いところへ分類部で分類する。そして、データベースやコーパスの学習結果の類似度が高い類似テキストを回答例として検索して回答部で付与するようになっている。
【0003】
このように従来の文章分類では、文章中の文字列一致によるキーワードに着目しているため、指定したキーワードが文章中に出現した場合のみ、キーワードが指示するところへ分類されるようになっている。また、感情の抽出についても同様に、感情を表現するキーワードの出現の有無で判定するようになっている。
【0004】
【発明が解決しようとする課題】
しかしながら、文章分類には、上記したように学習するための大量のデータやコーパスが必要となる。また、文章中の文字列一致によるキーワードに着目する方法では、大量のデータやコーパスがない、指定したキーワードが文章中に出現していない、キーワードが否定されても指定キーワードと誤認定されてしまう、全く違う文字列の一部分であってもキーワードと誤認定される可能性が高いというようなことが生じる恐れがあった。
また、文章の分類は、過去のデータやコーパスでの学習結果から類似した文章を使用した結果であって、文章そのものからの結果ではなかった。そこで、文章そのものや形態素解析結果による単語情報等を範囲指定した条件式で絞り込むルール方式を使用することにより、データやコーパスを使用せず、入力文章だけで分類および感情の抽出を行うことが要望されている。
【0005】
本発明は、上記事情に鑑みてなされたもので、文章の大きなポイントとなる単語情報の位置を特定するためのルールに範囲指定を実施し、ルールマッチングのみで分類および感情抽出することによって、対象となる文章の分類漏れおよび抽出漏れを防ぎ、文章分類および感情抽出の精度を高めることができる文章分類方法を提供する。
【0006】
【課題を解決するための手段】
請求項1記載の発明では、取得した文章に対して形態素解析処理を行い、複数の単語情報とする第1のステップと、前記複数の単語情報を組み合わせて条件式として記述し、この条件式を組み合わせたものと所定のルール方式とをマッチングさせることにより、当該文章に含まれている感情を抽出し、感情による分類を行う第2のステップとを有することを特徴とする。
請求項2記載の発明では、請求項1記載の発明において、前記条件式を組み合わせたものと所定のルール方式とをマッチングさせることにより、前記文章の内容を分類する第3のステップをさらに有することを特徴とする。
このように文章をルールによる絞り込みを行うことにより、大量のデータベースやコーパスを必要とせず、正か否かによる文章の分類および感情抽出を行うことができる。
【0007】
請求項3記載の発明は、請求項1または請求項2記載の発明において、前記第2のステップで使用するルール方式は、範囲条件式、論理条件式、判定式を繰り返し記述したものであることを特徴とする。
使用されるルールは、複数行、複数個を記述でき、文章中のルールを指定する範囲指定および「OR」、「AND」、「NOTT」等の論理式指定、「全体一致」、「部分一致」、「前方一致」、「後方一致」、「文字長」等、様々な指定のための条件式が繰り返し記述されたものであるので、誤認定の少ない文章分類および感情抽出を行うことができる。
【0008】
請求項4記載の発明では、請求項1ないし請求項3のうちいずれか1に記載の発明において、前記第2のステップのルール方式は、前記単語情報のルールの対象となる範囲を範囲条件式として記述し、当該範囲の中で前記条件式を記述することにより、文章中の単語情報から必要となる重要部分を指定できることを特徴とする。
請求項5記載の発明では、請求項2ないし請求項4のうちいずれか1に記載の発明において、前記第2のステップでは、問い合せ内容で分類する内容分類ルールと、文章が持つ感情を抽出し分類する感情表現ルールの両方に対するマッチングを行うことを特徴とする。
ルールによる分類結果は、内容の分類と感情抽出を分けて実施する、先の分類の結果を保持したまま次の分類を実施する、感情の抽出結果を保持したまま内容の分類を実施するなど、複数実行することができる。
【0009】
請求項6記載の発明において、請求項1ないし請求項5のうちいずれか1に記載の発明において、前記第2のステップで抽出された前記感情を所定のマークに置き換えて提示することを特徴とする。
このように、抽出した感情を問い合せ受付画面上でマークという情報で視覚的に表示するので、ユーザは感情表現を視覚で容易に認識することができる。
【0010】
【発明の実施の形態】
以下、本発明の文章分類方法の好適な実施の形態について図1ないし図14を参照して詳細に説明する。
図1は、本実施の形態に係る文章分類装置の構成を示したブロック図である。文書分類装置は、ネットワークを介して接続されている装置から、電子メールやWebページによる様々な問い合わせの文章を受信することができるものとする。また、文章分類・感情抽出装置は、受信した様々な問い合わせの文章を自動分類および感情の区分を行うようになっている。
文章分類・感情抽出装置は、形態素解析部11、分類部12、回答部13、ルール部14、表示部15を備えている。文章の入力が行われると、形態素解析部11、ルール部14を使用した分類部12および回答部13、表示部15の処理が行われる。
【0011】
まず、形態素解析部11は、文章を形態素解析すると、解析結果として一つの単語に原形表記や標準表記や属性等の多くの単語情報を持たせる。分類部12では、この単語情報を所定のルールにマッヂングさせることにより、ルールにマッチした文章の分類を行う。また、分類が行われた文章は、回答部13においてサジェストルール142にマッチングさせることにより、問い合せ内容に的確な回答が付与されるようになっている。
この形態素解析部11、分類部12の処理において、ルール方式を利用したルールマッチングを実行することにより、文章分類および感情抽出を行うことができる。さらに、回答部13において、同様にルール方式を利用してサジェストルール142にマッチングさせることにより、回答を付与することもできる。
【0012】
図2は、図1の形態素解析部11の動作を説明する図である。形態素解析部11は、文章の文字列を形態素解析システムにより形態素解析を行う。
まず、形態素解析部11は、文字列を読み込みすると(ステップS200)、形態素解析を行い、解析結果として一つの単語に原形表記や標準表記や属性等の多くの単語情報を持たせる(ステップS201)。
この形態素解析(ステップS201)のためには、辞書マッチングを行う必要がある。本実施形態では、辞書マッチングのための辞書として、一般的な単語を登録している標準日本語辞書21、ユーザの会社名や商品名の固有名詞等、一般的な単語として取り扱われない単語を登録している顧客別日本語辞書22、また証券やIT等の専門的な用語を登録している専門用語辞書等23の各種辞書を使用する。
このように形態素解析部11では、様々な辞書を複数個使用することにより、業種ごと顧客ごとに異なる問い合わせ文中の単語を、業種および顧客に対応した単語情報として得ることができ、ルールマッチングの精度を向上することができる。
【0013】
図3は、図2の形態素解析で使用される辞書を説明するための辞書内容の記述例を示した図である。
辞書では、単語の表記31、品詞32、仮名表記(読み)33、標準表記(代表的な表記)34、動詞の場合にはその原形表記(終止形)35、別途用途によって付与する属性26等を有している。
形態素解析部11では、この辞書の単語情報を利用することにより、情報を組み合せて文章が持つ内容理解の精度を向上することができる。
【0014】
図4は、図1のルール部14のルール記述方法を説明する図である。なお、分類部12および回答部13ともに、使用するルール記述方法は同様である。すべてこの形で記述され、文章の目的を絞り込むようになっている。
ルールは、分類したい内容および抽出したい感情(分類ルール141)ごとに、また回答したいサジェストルール142ごとにルールを複数有することができる。また、一つのルールの中に複数の範囲条件式、論理条件式、条件式を必要により繰り返し記述することができる。
【0015】
範囲条件式41では、文章のどの部分についての条件かを規定し、それにより文章中に散在する単語の出現位置を限定する。
論理条件式42では、範囲条件式41の指定された範囲中で、論理条件式42の下位の条件式が「AND、OR、NOT等」どの条件で指定されるかを規定し、単語情報の組み合せ条件を絞り込む。
条件式43は、最終的な判定式であり、論理条件式を使用しながら規定する。この条件式43の中で対象となる評価値を規定し、それが正になった場合を判定式として規定するようになっている。
【0016】
まず、ルール部14で記述したい範囲を範囲条件式41で指定する。この範囲条件式41では、まず、文章のタイトルや本文のどこの部分であるかなどのルール範囲を指定し(ステップS402)、そのうちの何から開始するかの開始条件を指定する(ステップS403)。次に、どんな場合に範囲を適用するかの条件式を指定し(ステップS404)、条件式の対象となる評価値を指定する(ステップS405)。そして、その評価値の判定条件を指定し(ステップS406)、どこまであるいは文書の何までで終了とするか、終了条件を指定する(ステップS406)。
【0017】
次に、論理条件式42によって他の条件式との論理演算を指定することにより、複数の条件式の組み合せが可能となっている。条件式43において、どのような条件式で(ステップS410)、どのような評価値で(ステップS411)、どのような場合に判定式とするかを指定する(ステップS412)。そして、この範囲条件式41、論理条件式42、条件式43を必要に応じて繰り返し指定する。
この複数のルールを目的の分類および回答のために組み合せることにより、目的を絞っていくことができ、分類、感情抽出および回答の精度を高めることができる。
また、このルールを文章に対して分類、感情抽出および回答を導くために細かく記述することにより、文字レベルの文章であっても範囲条件式41、論理条件式42、条件式43から、または範囲条件式41、論理条件式42、条件式43を組み合わせることにより、内容・感情・回答を導き出すことができるようになる。
【0018】
図5は、図4の範囲条件式41を使用した場合の記述を説明する図である。なお、本実施の形態のルール方式では、条件式に範囲指定を用いるところに特徴がある。
範囲条件式としては、文章のタイトルまたは本文の全部または一部51、タイトルまたは本文の全部または一部を形態素解析した結果の形態素解析個数52、または、区切り文字53を指定する。このように、ルールの範囲を指定することで、その指定された範囲から文章のルールをマッチングさせる条件をさらに限定するために、その中で条件式を記述する。
【0019】
また、さらにその指定した範囲の中で何から始まり(開始条件54)、何で終わる(終了条件55)、または、範囲の始まりまたは終わりからの形態素個数56というような条件を条件式で記述することにより、さらに絞込みを行うこともできる。
このように文章のルールにマッチングさせたい範囲を指定し、さらにその中で条件を規定することにより、文章中に散在する単語情報を部分、箇所、その前後の単語情報というように、細かく特定の場所に指定(限定)することができるので、ルールの絞込み精度を向上することができる。
【0020】
図6は、図5で説明したルール部14の記述例であり、複数の条件が繰り返し記述されていることを示している。これにより、文章の絞り込みが可能となる。図7は、感情を抽出するための感情表現ルールの記述例である。感情を判断するために記述されたルールにマッチングされた文章は、記述例のような「怒っている」という感情を表現しているルールにマッチングした場合、その文章の感情は、「怒っている」と規定される。
本実施の形態では、感情表現ルールを使用することにより、感情の絞込みを行い、文章の感情を抽出して分類項目として使用することもできる。また、感情に合致した回答を付与することもでき、感情を把握した適切な対応が可能となっている。
【0021】
図8は、回答を付与するためのサジェストルールの記述例を示した図である。回答を付与するために記述されたルールにマッチングされた文章が、記述例81のような「○○を教えて欲しい」という文章をルールにマッチングした場合、サジェストルール82を使用することで、文章の絞込みを行い、合致した回答83を付与することもできる。これにより、問い合わせに対する自動回答が可能となり、業務の効率化を図ることができる。
【0022】
図9は、分類部12の分類ルール種別手順を示したフローチャートである。
文章には、一般的に様々な感情(怒り、お礼、お願い等)が含まれている。また、感情とともに質問が含まれていることもある。
本実施の形態では、単にルールによる内容の分類(内容分類ルール)だけではなく、同時に文章が持つ感情表現を分類するためのルール(感情表現ルール)を使用することにより、その文章の感情を抽出するようになっている。また、感情だけによる単独による分類も可能である。なお、感情表現ルールについては、図7において、その内容例を記述しているのでここでは説明を省略する。
分類ルールの種別としては、感情表現ルール実施後に感情表現ルールにマッチングしなかった問い合せに対し、さらに内容分類ルールを実施する階層的分類(パターン1)と、感情表現を認識したあとにその感情表現の情報を持ったまま内容を分類する情報保持的分類(パターン2)とが挙げられる。
【0023】
この分類ルールは複数有することが可能であり、そのマッチングする順位によってルールAからルールBへと階層的な分類をも行える(パターン1)。
パターン1の階層的分類では、ルールAでルールマッチングを実行する(ステップS1001)。ここで、ルールAにマッチングした文章は(ステップS1001で「Yes」)、分類1(ステップS1002)、分類2(ステップS1003)に分類される。一方、ルールAでマッチングしなかった文章は(ステップS1001で「No」)、さらにルールBのルールマッチングを実行し(ステップS1004)、マッチングした文章は分類3(ステップS1005)に分類される。
このように階層的分類では、文章の分類を階層で行うことにより、感情抽出による分類と、特別な感情のない文章についての内容による分類とを同時に実行することができる。
【0024】
また、複数の分類ルールの結果の分類情報を保持したまま、さらに分類することも行える(パターン2)。この情報保持的分類(パターン2)では、ルールAの情報を持ったまま、ルールBを実施できるようになっている。
パターン2の情報保持的分類では、ルールAでルールマッチングを実行し(ステップS1021)、マッチングした文章もマッチングしなかった文章もその情報を持ったまま、ルールBのルールマッチングを実行する(ステップS1022)。ここで、ルールBにマッチングした文章は(ステップS1022で「Yes」)、分類4(ステップS1023)、分類5(ステップS1003)に分類される。
このように情報保持的分類では、文章がルールによって得た情報を最後まで保持することにより、文章の分類を多くの意味から行え、感情による分類と内容による分類とを同時に実行することができる。これにより、文章の感情抽出をしながら、その文章を内容に基づいた分類をすることができる。
【0025】
図10は、図9の階層的分類の分類手順を示したフローチャートである。ここでは、図3の形態素解析部11で形態素解析された文章の結果を入力データとしている。
まず、文章結果の入力データを感情表現ルール100にマッチングさせる(ステップS1100)。そして、感情表現ルール100の各ルールにマッチングしたものについて、そのマッチングすべき感情を抽出し、分類1(ステップS1101)、分類2(ステップS1102)に分類する。
すなわち、「怒っている」というような苦情の場合、その入力データは、苦情に分類される。これにより、業務によっては苦情であるか否かの分類を行うこともできる。
【0026】
一方、特別な感情を持たない文章については、その内容による分類が必要となる。そこで、感情表現ルール100にマッチングを実施後、感情表現ルール100にマッチングしなかったものについて内容分類ルール110により、内容分類のルールマッチングを実施する(ステップS1107)。そして、内容分類に基づいて、分類3(ステップS1103)、分類4(ステップS1104)、分類5(ステップS1105)、さらに分類対象外の分類6としてその他(ステップS1106)に分類する。
これにより、特別な感情のない文章についても分類の対象として、分類することが可能となり、文章分類の効率化を図ることができる。
【0027】
図11は、図9の情報保持的分類の分類手順を示したフローチャートである。ここでは、図3の形態素解析部11で形態素解析された文章の結果を入力データとしている。
まず、文章の入力データを感情表現ルール100にマッチングさせる(ステップS1111)。そして、感情表現ルール100の各ルールにマッチングしたものについて、そのマッチングすべき感情を抽出し、情報を付与する(ステップS1112)。すなわち、「怒っている」というような苦情の場合、その文章は、苦情の感情情報を持っているということになる。その苦情という感情情報を保持したまま、文章の内容による分類も行う。
【0028】
文章の内容は、内容分類ルール110にマッチングさせることにより分類を行い(ステップS1113)、分類1(ステップS1114)、分類2(ステップS1115)、分類3(ステップS1116)、分類4(ステップS1117)、分類5(ステップS1118)、さらに分類対象外の分類6としてその他(ステップS1119)というように、内容に合致した分類項目ごとの分類が行われる。すなわち、苦情の場合、苦情であるという感情情報とともに、その内容が何であるかという内容情報を保持することができる。
これにより、文章の持つ感情を把握しながら、その内容についても理解することができ、業務の効率化を図ることができる。
【0029】
図12は、回答部13の動作手順を示したフローチャートである。
まず、分類のためのルールマッチングを行い(ステップS1201)、各分類に分類された文章(ステップS1202、S1203)について、さらにサジェストルール120によるマッチングを行う(ステップS1204、S1205)。
ここで、サジェストルールにマッチしている場合(ステップS1204、S1205で「Yes」)、サジェスト(回答)を付与(ステップS1206)。一方、サジェストルールにマッチしていない場合(ステップS1204、S1205で「No」)、サジェストを付与しない(ステップS1207)。
このように、分類ごとにサジェストルールが存在するために、絞込まれた文章に対してさらに絞込んだ目的での回答を付与するので、文章の内容と対応した精度の高い回答を付与することができる。
【0030】
図13は、図11における感情表現の情報を保持したまま内容分類を実施した場合の回答部13の動作手順を示したフローチャートである。
まず、分類部12によって感情表現ルールのマッチングが行われる(ステップS1301)。ここで、感情表現の情報を持つと分類され、内容分類ルールのマッチング(ステップS1302)により分類された文章は、所定の分類先に分類される。例えば、分類1に分類された文章は(ステップS1303)、さらにその内容による分類先で回答付与のためのサジェストルール142とのマッチングが行われ(ステップS1304)、結果に応じて回答が付与される。
【0031】
分類1に分類された文章が、さらにサジェストルールにマッチしている場合(ステップS1304で「Yes」)、感情表現の情報とサジェスト(回答)をもっているもの(ステップS1305)と、感情表現の情報はないがサジェストをもっているもの(ステップS1306)とに分けられる。また、分類1に分類された文章が、さらにサジェストルールにマッチしていない場合(ステップS1304で「No」)、感情表現だけの情報をもっているもの(ステップS1307)と、感情表現の情報も回答も両方もっていないもの(ステップS1308)とに分けられる。なお、感情表現の情報を持つと分類され、内容分類ルールのマッチング(ステップS1302)により分類2に分類された文章も同様に、分けられる。
このようにサジェストルール142で例えば、「怒っている」という感情を抽出された文章には、どのような回答を付与するかをルール記述することにより、感情を抽出された文章に適切に対応付けした回答を付与することができる。
【0032】
図14は、表示部15の感情表現マークおよび回答付与の一例を示した図である。
図14(a)は、感情表現ルールにより感情情報を抽出された文章の受信画面を示している。感情情報を抽出された文章の提示方法は、文章を開封するボタン1401〜1404を特徴づけることにより、誰もが見ることができ、このように感情をマークヘ転換することで分かりやすくすることができる。また、文章を受け付けて開封する前に、その文章が持つ感情を視覚的に理解でき、文章を読まなくてもその感情を知ることができる。
また、文章受付一覧上で、問い合せ内容の詳細を開くためのボタン1401〜1404上に感情を表すマークを表示しているために、ユーザは感情表現マークを見落とすことなく、問い合せ内容を認識することができる。
【0033】
また、文章を送信する場合には、図14(b)に示すような返信画面が表示される。ここには、内容によって分類された先のサジェストルールでマッチングされた回答が付与されたものを表示する。特別な感情の情報を有していないが、サジェストルールにマッチングした文章は、回答のみが表示されることになる。また、分類された文章でも、サジェストルールにマッチングしなかったものは、回答付与されない。このように回答が自動的に付与されるため、返信業務の効率化を図ることができる。
【0034】
【発明の効果】
以上説明したように、本発明の文書分類および感情抽出方法では、単語情報をルール方式で絞込み、文章の分類および感情抽出するので、正か否かの判定が実施でき、大量のデータベースやコーパスを必要としないため早期導入が可能である。さらに、類似性ではない直接的な精度の高い文章分類および感情抽出を行うことができる。
また、本発明の文書分類および感情抽出方法では、範囲条件式、論理条件式、条件式を繰り返し記述したルール方式を使用するので、正か否かの判定によりさらに精度の高い文章の分類を実行することができる。
【0035】
また、本発明の文書分類および感情抽出方法では、ルールの範囲を指定できるので、文中に散々する単語情報から必要な部分のみを指定したルールを記述でき、違う部分に存在する情報を認識せず、分類誤りのない精度の高い分類を実行することができる。
また、本発明の文書分類および感情抽出方法では、単語情報を使用したルール方式を複数実行するので、内容による分類と感情抽出を同時に実行することができる。さらに、本発明の文書分類および感情抽出方法では、文章の感情を抽出するルールにマッチングさせることにより、文章が持つ感情を自動的に認識し、文章を受取時に視覚で表示することができる。
【図面の簡単な説明】
【図1】本実施の形態に係る文章分類・感情抽出装置の構成を示したブロック図である。
【図2】図1の形態素解析部の動作を説明する図である。
【図3】図2の辞書内容の記述例を示した図である。
【図4】ルール部のルール記述方法を説明する図である。
【図5】ルール部の範囲条件式を説明する図である。
【図6】ルール部の記述例を示した図である。
【図7】感情表現ルールの記述例を示した図である。
【図8】サジェストルールの記述例を示した図である。
【図9】分類部の分類ルール種別手順を示したフローチャートである。
【図10】図9の階層的分類の分類手順を示したフローチャートである。
【図11】図9に情報保持的分類の分類手順を示したフローチャートである。
【図12】回答部の動作手順を示したフローチャートである。
【図13】図11における感情表現の情報を保持したままの場合の回答部の動作手順を示したフローチャートである。
【図14】表示部の感情表現のマークおよび回答付与の一例を示した図である。
【図15】従来の文章分類処理の一例を示した図である。
【符号の説明】
11   形態素解析部
12   分類部
13   回答部
14   ルール部
15   表示部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a sentence classification and sentiment extraction method for improving the efficiency of business by performing automatic sentence classification and sentence extraction in response to various inquiries from e-mails and Web pages in an Internet business. .
[0002]
[Prior art]
2. Description of the Related Art Conventionally, a sentence classification technology uses a result learned based on a large amount of accumulated data or a corpus to perform classification based on similar results. Then, they are classified into classification items having a high degree of similarity. FIG. 15 is a diagram illustrating an example of a conventional text classification process. When a sentence is input, the morphological analysis unit morphologically analyzes the sentence. The learning unit performs learning with a large amount of databases and corpuses registered in advance in the learning unit, calculates the similarity, and classifies the highest similarity in the classifying unit. Then, similar texts having a high degree of similarity between the learning results of the database and the corpus are searched as answer examples, and given by the answer section.
[0003]
As described above, in the conventional sentence classification, the keyword is focused on the character string matching in the sentence, and therefore, only when the specified keyword appears in the sentence, the keyword is classified to the position indicated by the keyword. . Similarly, regarding the extraction of the emotion, the determination is made based on the presence / absence of a keyword expressing the emotion.
[0004]
[Problems to be solved by the invention]
However, sentence classification requires a large amount of data and a corpus for learning as described above. Also, in the method focusing on keywords based on character string matching in sentences, there is no large amount of data or corpus, the specified keywords do not appear in the sentences, and even if the keywords are denied, they are incorrectly recognized as the specified keywords However, there is a possibility that even a part of a completely different character string is likely to be erroneously recognized as a keyword.
The sentence classification is a result of using a similar sentence from past data or a learning result in a corpus, and is not a result of the sentence itself. Therefore, by using a rule method that narrows down the sentence itself or word information based on the result of morphological analysis with a conditional expression that specifies the range, it is desired to perform classification and emotion extraction using only input sentences without using data or corpus. Have been.
[0005]
The present invention has been made in view of the above circumstances, and specifies a range for a rule for specifying the position of word information, which is a major point of a sentence, and performs classification and emotion extraction only by rule matching to obtain a target. Provided is a sentence classification method capable of preventing omission of classification and extraction of a sentence and improving accuracy of sentence classification and emotion extraction.
[0006]
[Means for Solving the Problems]
According to the first aspect of the invention, a morphological analysis process is performed on the acquired sentence, a first step of forming a plurality of word information, and the plurality of word information are combined and described as a conditional expression. A second step of extracting the emotion contained in the sentence by matching the combination with a predetermined rule method and performing classification based on the emotion is provided.
According to a second aspect of the present invention, in the first aspect of the present invention, the method further includes a third step of classifying the contents of the text by matching a combination of the conditional expressions with a predetermined rule method. It is characterized.
By narrowing down sentences according to rules in this way, it is possible to classify sentences and extract emotions based on whether they are correct or not, without requiring a large amount of database or corpus.
[0007]
According to a third aspect of the present invention, in the first or second aspect of the invention, the rule system used in the second step is a repetitive description of a range conditional expression, a logical conditional expression, and a decision expression. It is characterized.
The rules to be used can be described in a plurality of lines and a plurality of rules. A range for specifying the rule in the text and a logical expression such as "OR", "AND", "NOTT", "whole match", "partial match" , "Beginning with", "behind with", "character length", etc., are repeatedly described, so that sentence classification and emotion extraction with less false recognition can be performed. .
[0008]
According to a fourth aspect of the present invention, in the first aspect of the present invention, the rule method of the second step includes a step of defining a range targeted by the rule of the word information as a range condition expression. By describing the conditional expression within the range, a necessary important part can be specified from word information in a sentence.
In the invention according to claim 5, in the invention according to any one of claims 2 to 4, in the second step, a content classification rule for classifying based on an inquiry content and an emotion of a sentence are extracted. It is characterized in that matching is performed for both emotion expression rules to be classified.
Classification results by rules are divided into content classification and emotion extraction, and the following classification is performed while retaining the results of the previous classification, and content classification is performed while retaining the emotion extraction results. More than one can be performed.
[0009]
In the invention according to claim 6, in the invention according to any one of claims 1 to 5, the emotion extracted in the second step is presented by being replaced with a predetermined mark. I do.
As described above, the extracted emotion is visually displayed on the inquiry reception screen with the information of the mark, so that the user can easily recognize the emotion expression visually.
[0010]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, a preferred embodiment of the text classification method according to the present invention will be described in detail with reference to FIGS.
FIG. 1 is a block diagram showing a configuration of a text classification device according to the present embodiment. It is assumed that the document classification device can receive various inquiries by e-mail or Web page from a device connected via a network. In addition, the sentence classification / emotion extraction device is configured to automatically classify sentence of various received inquiries and to classify emotions.
The sentence classification and emotion extraction device includes a morphological analysis unit 11, a classification unit 12, an answer unit 13, a rule unit 14, and a display unit 15. When a sentence is input, processing of the morphological analysis unit 11, the classification unit 12 using the rule unit 14, the response unit 13, and the display unit 15 is performed.
[0011]
First, when the morphological analysis unit 11 morphologically analyzes a sentence, one word has a lot of word information such as an original form notation, a standard notation, and attributes as an analysis result. The classifying unit 12 classifies sentences that match the rules by mapping the word information to predetermined rules. The classified text is matched with the suggestion rule 142 in the answering unit 13 so that an accurate answer is given to the content of the inquiry.
In the processing of the morphological analysis unit 11 and the classification unit 12, by performing rule matching using a rule method, sentence classification and emotion extraction can be performed. Further, the answering unit 13 can also give an answer by matching the suggestion rule 142 using the rule method in the same manner.
[0012]
FIG. 2 is a diagram illustrating the operation of the morphological analysis unit 11 of FIG. The morphological analysis unit 11 performs morphological analysis on a character string of a sentence using a morphological analysis system.
First, when the morphological analysis unit 11 reads a character string (step S200), it performs morphological analysis, and as a result of analysis, gives one word a lot of word information such as original form notation, standard notation, and attributes (step S201). .
For this morphological analysis (step S201), dictionary matching needs to be performed. In the present embodiment, as a dictionary for dictionary matching, a standard Japanese dictionary 21 in which general words are registered, and words that are not treated as general words, such as proper nouns of a user's company name or product name, are used. Various dictionaries such as a registered customer-specific Japanese dictionary 22 and a technical term dictionary 23 for registering technical terms such as securities and IT are used.
As described above, the morphological analysis unit 11 can use a plurality of various dictionaries to obtain words in an inquiry sentence that differs for each type of business and for each customer as word information corresponding to the type of business and the customer. Can be improved.
[0013]
FIG. 3 is a diagram showing a description example of dictionary contents for explaining a dictionary used in the morphological analysis of FIG.
In the dictionary, the word notation 31, the part of speech 32, the kana notation (reading) 33, the standard notation (representative notation) 34, in the case of a verb, the original notation (end form) 35, the attribute 26 to be added depending on the use, etc. have.
By using the word information in the dictionary, the morphological analysis unit 11 can improve the accuracy of understanding the contents of the sentence by combining the information.
[0014]
FIG. 4 is a diagram illustrating a rule description method of the rule unit 14 of FIG. The rule description method used for both the classification unit 12 and the answer unit 13 is the same. Everything is described in this way, narrowing down the purpose of the text.
The rule can have a plurality of rules for each content to be classified and the emotion to be extracted (classification rule 141), and for each suggestion rule 142 to be answered. In addition, a plurality of range conditional expressions, logical conditional expressions, and conditional expressions can be repeatedly described as needed in one rule.
[0015]
The range condition expression 41 defines which part of the sentence is a condition, thereby limiting the appearance positions of words scattered in the sentence.
The logical conditional expression 42 specifies which of the lower conditional expressions of the logical conditional expression 42 is specified as “AND, OR, NOT, etc.” in the range specified by the range conditional expression 41. Narrow down the combination conditions.
The conditional expression 43 is a final determination expression, and is defined using a logical conditional expression. The target evaluation value is defined in the conditional expression 43, and the case where the evaluation value becomes positive is defined as a determination expression.
[0016]
First, a range to be described by the rule unit 14 is specified by a range conditional expression 41. In the range condition expression 41, first, a rule range such as a title of a sentence or a part of a body is specified (step S402), and a start condition of what to start from is specified (step S403). . Next, a conditional expression for when the range is to be applied is specified (step S404), and an evaluation value targeted by the conditional expression is specified (step S405). Then, a condition for judging the evaluation value is specified (step S406), and an end condition is specified to determine the end point or the end point of the document (step S406).
[0017]
Next, by specifying a logical operation with another conditional expression by the logical conditional expression 42, it is possible to combine a plurality of conditional expressions. In the conditional expression 43, what kind of conditional expression is used (step S410), what kind of evaluation value is used (step S411), and in what case the decision expression is specified (step S412). Then, the range conditional expression 41, the logical conditional expression 42, and the conditional expression 43 are repeatedly designated as necessary.
By combining the plurality of rules for the purpose classification and answer, the purpose can be narrowed down, and the accuracy of the classification, emotion extraction and answer can be improved.
In addition, by describing these rules in detail to classify sentences, extract emotions, and guide answers, even in the case of character-level sentences, the range conditional expression 41, the logical conditional expression 42, the conditional expression 43, or the range By combining the conditional expressions 41, the logical conditional expressions 42, and the conditional expressions 43, it is possible to derive the contents, emotions, and answers.
[0018]
FIG. 5 is a diagram illustrating a description when the range conditional expression 41 of FIG. 4 is used. It is to be noted that the rule method according to the present embodiment is characterized in that a range expression is used for a conditional expression.
As the range conditional expression, the whole or a part 51 of the title or the body of the sentence, the number of morphological analysis 52 as a result of the morphological analysis of the whole or a part of the title or the body, or the delimiter 53 is specified. In this way, by specifying the range of the rule, a conditional expression is described therein in order to further limit the condition for matching the rule of the sentence from the specified range.
[0019]
Furthermore, a condition such as what starts in the specified range (start condition 54), ends at what (end condition 55), or the number of morphemes 56 from the start or end of the range is described by a conditional expression. Thereby, further narrowing down can be performed.
In this way, by specifying the range to be matched with the rule of the sentence and further specifying the conditions in it, the word information scattered in the sentence can be finely specified, such as part, location, word information before and after it Since the location can be specified (limited), the accuracy of narrowing down the rules can be improved.
[0020]
FIG. 6 is a description example of the rule unit 14 described in FIG. 5, and shows that a plurality of conditions are repeatedly described. As a result, it is possible to narrow down sentences. FIG. 7 is a description example of an emotion expression rule for extracting an emotion. If the sentence matched to the rule described to judge the emotion matches the rule expressing the feeling of "angry" as in the description example, the sentence of the sentence is "angry" Is defined.
In the present embodiment, the emotion can be narrowed down by using the emotion expression rule, and the emotion of the sentence can be extracted and used as a classification item. In addition, it is possible to give an answer that matches the emotion, and it is possible to take appropriate action with the emotion grasped.
[0021]
FIG. 8 is a diagram showing a description example of a suggestion rule for giving an answer. If the sentence matched to the rule described to give the answer matches the sentence “I want you to teach me XX” as in the description example 81, the suggestion rule 82 is used to change the sentence. Can be narrowed down and a matching answer 83 can be given. As a result, an automatic answer to the inquiry can be made, and the efficiency of the business can be improved.
[0022]
FIG. 9 is a flowchart showing a classification rule type procedure of the classification unit 12.
The sentence generally includes various emotions (anger, thanks, request, etc.). It may also include questions along with emotions.
In the present embodiment, the sentiment of a sentence is extracted by using not only a rule for classifying the contents (content classification rule) but also a rule for classifying the sentiment expression of the sentence (emotion expression rule). It is supposed to. It is also possible to classify only by emotion alone. Note that the example of the content of the emotion expression rules is described in FIG.
The classification rules are classified into hierarchical classification (pattern 1) in which a content classification rule is applied to an inquiry that does not match the emotion expression rule after the emotion expression rule is implemented, and the emotion expression after the emotion expression is recognized. And information-holding classification (pattern 2) for classifying contents while holding the information.
[0023]
It is possible to have a plurality of classification rules, and a hierarchical classification from rule A to rule B can be performed according to the order of matching (pattern 1).
In the hierarchical classification of pattern 1, rule matching is performed using rule A (step S1001). Here, the sentences that match rule A (“Yes” in step S1001) are classified into class 1 (step S1002) and class 2 (step S1003). On the other hand, a sentence that did not match by rule A (“No” in step S1001) is further subjected to rule matching of rule B (step S1004), and the matched sentence is classified into category 3 (step S1005).
As described above, in the hierarchical classification, by classifying sentences in a hierarchy, it is possible to simultaneously perform classification based on emotion extraction and classification based on contents of a sentence having no special emotion.
[0024]
Further, it is possible to perform further classification while holding the classification information as a result of a plurality of classification rules (pattern 2). In the information-holding classification (pattern 2), rule B can be implemented while holding information on rule A.
In the information holding classification of the pattern 2, the rule matching is performed by the rule A (step S1021), and the rule matching of the rule B is performed while the matched text and the unmatched text have the information (step S1022). ). Here, the sentences that match rule B (“Yes” in step S1022) are classified into class 4 (step S1023) and class 5 (step S1003).
As described above, in the information-holding classification, the sentence can be classified from many meanings by retaining the information obtained by the rule according to the rule, and the classification based on the emotion and the classification based on the content can be executed simultaneously. This allows the sentence to be classified based on the content while extracting the sentiment of the sentence.
[0025]
FIG. 10 is a flowchart showing the classification procedure of the hierarchical classification shown in FIG. Here, the result of a sentence subjected to morphological analysis by the morphological analysis unit 11 in FIG. 3 is used as input data.
First, the sentence result input data is matched with the emotion expression rule 100 (step S1100). Then, for those that match each of the emotion expression rules 100, the emotions to be matched are extracted and classified into classification 1 (step S1101) and classification 2 (step S1102).
That is, in the case of a complaint such as "angry", the input data is classified as a complaint. As a result, it is possible to classify a complaint or not depending on the business.
[0026]
On the other hand, sentences that do not have special emotions need to be classified according to their contents. Therefore, after matching with the emotion expression rule 100, rule matching of content classification is performed by the content classification rule 110 for those that did not match with the emotion expression rule 100 (step S1107). Then, based on the content classification, classification is performed as classification 3 (step S1103), classification 4 (step S1104), classification 5 (step S1105), and classification 6 other than the classification target (step S1106).
As a result, it is possible to classify a sentence having no special emotion as an object to be classified, and it is possible to improve the efficiency of the sentence classification.
[0027]
FIG. 11 is a flowchart showing a classification procedure of the information holding classification shown in FIG. Here, the result of a sentence subjected to morphological analysis by the morphological analysis unit 11 in FIG. 3 is used as input data.
First, the sentence input data is matched with the emotion expression rule 100 (step S1111). Then, for those matching each of the emotion expression rules 100, the emotion to be matched is extracted and information is added (step S1112). That is, in the case of a complaint such as “angry”, the sentence has emotion information of the complaint. The classification based on the content of the sentence is also performed while retaining the emotion information of the complaint.
[0028]
The content of the text is classified by matching the content classification rule 110 (step S1113), classification 1 (step S1114), classification 2 (step S1115), classification 3 (step S1116), classification 4 (step S1117), Classification is performed for each classification item that matches the content, such as classification 5 (step S1118), and other classification 6 other than the classification target (step S1119). That is, in the case of a complaint, it is possible to hold emotion information indicating the complaint and content information indicating the content of the complaint.
As a result, it is possible to understand the contents of the sentence while grasping the sentiment, thereby improving the efficiency of the work.
[0029]
FIG. 12 is a flowchart showing the operation procedure of the answering unit 13.
First, rule matching for classification is performed (step S1201), and the text classified into each classification (steps S1202 and S1203) is further matched by the suggest rule 120 (steps S1204 and S1205).
Here, if it matches the suggest rule ("Yes" in steps S1204 and S1205), a suggestion (answer) is given (step S1206). On the other hand, if it does not match the suggestion rule (“No” in steps S1204 and S1205), no suggestion is given (step S1207).
In this way, since there is a suggestion rule for each classification, answers with a narrower purpose are given to narrowed sentences, so it is necessary to give highly accurate answers corresponding to the contents of the sentences Can be.
[0030]
FIG. 13 is a flowchart illustrating an operation procedure of the answering unit 13 when the content classification is performed while the emotion expression information in FIG. 11 is held.
First, matching of emotion expression rules is performed by the classification unit 12 (step S1301). Here, the sentence classified as having the emotion expression information and classified by the matching of the content classification rule (step S1302) is classified into a predetermined classification destination. For example, a sentence classified into category 1 (step S1303) is further matched with a suggestion rule 142 for giving an answer at a destination according to the content (step S1304), and an answer is given according to the result. .
[0031]
If the sentence classified in the category 1 further matches the suggestion rule (“Yes” in step S1304), the sentence having information of emotion expression and a suggestion (answer) (step S1305) and the information of emotion expression are However, it is divided into those having no suggestion but those having a suggestion (step S1306). If the sentence classified in the category 1 further does not match the suggestion rule ("No" in step S1304), the sentence having only the emotional expression (step S1307), the information on the emotional expression and the answer It is divided into those without both (step S1308). It should be noted that sentences classified as having emotion expression information and classified into Class 2 by matching of content classification rules (Step S1302) are similarly divided.
As described above, in the suggestion rule 142, for example, the sentence in which the feeling of “angry” is extracted is described in a rule to describe what kind of answer is given, so that the feeling is appropriately associated with the extracted sentence. Can be given.
[0032]
FIG. 14 is a diagram illustrating an example of an emotion expression mark and an answer assignment on the display unit 15.
FIG. 14A shows a screen for receiving a sentence from which emotion information is extracted according to the emotion expression rules. The presentation method of the sentence from which the emotion information is extracted can be seen by anyone by characterizing the buttons 1401 to 1404 for opening the sentence, and can be easily understood by converting the emotion to the mark in this way. . Also, before receiving and opening a sentence, it is possible to visually understand the emotion of the sentence, and to know the emotion without reading the sentence.
In addition, since the mark indicating the emotion is displayed on the buttons 1401 to 1404 for opening the details of the inquiry on the sentence reception list, the user can recognize the inquiry without overlooking the emotion expression mark. Can be.
[0033]
When a text is transmitted, a reply screen as shown in FIG. 14B is displayed. Here, those to which the answer matched by the previous suggestion rule classified according to the content is displayed. A sentence that does not have special emotion information but matches the suggestion rules will have only the answer displayed. Also, even among the classified sentences that do not match the suggestion rules, no answer is given. Since the answer is automatically given as described above, the efficiency of the reply operation can be improved.
[0034]
【The invention's effect】
As described above, according to the document classification and emotion extraction method of the present invention, word information is narrowed down by a rule method, and sentence classification and emotion extraction are performed. Since it is not required, early introduction is possible. Further, it is possible to perform direct and highly accurate sentence classification and emotion extraction that is not similarity.
Further, in the document classification and emotion extraction method of the present invention, a rule method in which a range conditional expression, a logical conditional expression, and a conditional expression are repeatedly described is used. can do.
[0035]
Further, according to the document classification and emotion extraction method of the present invention, since the range of rules can be specified, a rule in which only necessary parts are specified from scattered word information in a sentence can be described, without recognizing information existing in different parts. In addition, highly accurate classification without classification errors can be performed.
Further, in the document classification and emotion extraction method of the present invention, since a plurality of rule methods using word information are executed, classification based on content and emotion extraction can be executed simultaneously. Furthermore, in the document classification and sentiment extraction method of the present invention, the sentiment of a sentence can be automatically recognized by matching the sentence with a rule for extracting the sentiment, and the sentence can be visually displayed upon receipt.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a sentence classification and emotion extraction device according to the present embodiment.
FIG. 2 is a diagram illustrating an operation of a morphological analysis unit in FIG. 1;
FIG. 3 is a diagram showing a description example of the dictionary contents of FIG. 2;
FIG. 4 is a diagram illustrating a rule description method of a rule part.
FIG. 5 is a diagram illustrating a range conditional expression of a rule part.
FIG. 6 is a diagram showing a description example of a rule part.
FIG. 7 is a diagram illustrating a description example of an emotion expression rule.
FIG. 8 is a diagram illustrating a description example of a suggestion rule.
FIG. 9 is a flowchart illustrating a classification rule classification procedure of a classification unit.
FIG. 10 is a flowchart showing a classification procedure of the hierarchical classification shown in FIG. 9;
FIG. 11 is a flowchart showing a classification procedure of the information holding classification.
FIG. 12 is a flowchart showing an operation procedure of an answering unit.
FIG. 13 is a flowchart showing an operation procedure of the answering unit in a case where the emotion expression information in FIG. 11 is kept.
FIG. 14 is a diagram showing an example of an emotional expression mark on the display unit and an example of providing an answer.
FIG. 15 is a diagram showing an example of a conventional sentence classification process.
[Explanation of symbols]
11 Morphological analysis unit
12 Classification section
13 Answer section
14 Rule section
15 Display

Claims (6)

取得した文章に対して形態素解析処理を行い、複数の単語情報とする第1のステップと、
前記複数の単語情報を組み合わせて条件式として記述し、この条件式を組み合わせたものと所定のルール方式とをマッチングさせることにより、当該文章に含まれている感情を抽出し、感情による分類を行う第2のステップと
を有することを特徴とする文章分類方法。
A first step of performing a morphological analysis process on the acquired sentence to obtain a plurality of word information;
The plurality of pieces of word information are combined and described as a conditional expression, and the combination of the conditional expressions is matched with a predetermined rule method to extract the emotion contained in the sentence and perform classification based on the emotion. And a second step.
前記条件式を組み合わせたものと所定のルール方式とをマッチングさせることにより、前記文章の内容を分類する第3のステップをさらに有することを特徴とする文章分類方法。A sentence classification method, further comprising a third step of classifying the contents of the sentence by matching a combination of the conditional expressions with a predetermined rule method. 前記第2のステップで使用するルール方式は、範囲条件式、論理条件式、判定式を繰り返し記述したものであることを特徴とする請求項1または請求項2記載の文章分類方法。3. The sentence classification method according to claim 1, wherein the rule system used in the second step is a repetitive description of a range conditional expression, a logical conditional expression, and a decision expression. 前記第2のステップのルール方式は、前記単語情報のルールの対象となる範囲を範囲条件式として記述し、当該範囲の中で前記条件式を記述することにより、文章中の単語情報から必要となる重要部分を指定できることを特徴とする請求項1ないし請求項3のうちいずれか1に記載の文章分類方法。In the rule method of the second step, a range that is a target of the rule of the word information is described as a range conditional expression, and the conditional expression is described in the range. The sentence classification method according to claim 1, wherein an important part can be designated. 前記第2のステップでは、問い合せ内容で分類する内容分類ルールと、文章が持つ感情を抽出し分類する感情表現ルールの両方に対するマッチングを行うことを特徴とする請求項2ないし請求項4のうちいずれか1に記載の文章分類方法。5. The method according to claim 2, wherein, in the second step, matching is performed for both a content classification rule for classifying the content of the inquiry and an emotion expression rule for extracting and classifying the sentence of the text. The sentence classification method according to item 1. 前記第2のステップで抽出された前記感情を所定のマークに置き換えて提示することを特徴とする請求項1ないし請求項5のうちいずれか1に記載の文章分類方法。The sentence classification method according to any one of claims 1 to 5, wherein the emotion extracted in the second step is presented by being replaced with a predetermined mark.
JP2002254515A 2002-08-30 2002-08-30 Method of classifying writings Pending JP2004094583A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002254515A JP2004094583A (en) 2002-08-30 2002-08-30 Method of classifying writings

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002254515A JP2004094583A (en) 2002-08-30 2002-08-30 Method of classifying writings

Publications (1)

Publication Number Publication Date
JP2004094583A true JP2004094583A (en) 2004-03-25

Family

ID=32060266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002254515A Pending JP2004094583A (en) 2002-08-30 2002-08-30 Method of classifying writings

Country Status (1)

Country Link
JP (1) JP2004094583A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902726A (en) * 2012-09-06 2013-01-30 北京天宇朗通通信设备股份有限公司 Method and device for sorting electronic mails
KR101473239B1 (en) 2013-07-26 2014-12-16 주식회사 알에스엔 Category and Sentiment Analysis System using Word pattern.
CN104361015A (en) * 2014-10-14 2015-02-18 四川神琥科技有限公司 Mail classification and recognition method
CN106777361A (en) * 2017-01-20 2017-05-31 清华大学 Microblogging text mood sorting technique and categorizing system based on vector paragraph model
CN108595568A (en) * 2018-04-13 2018-09-28 重庆邮电大学 A kind of text sentiment classification method based on very big unrelated multivariate logistic regression

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902726A (en) * 2012-09-06 2013-01-30 北京天宇朗通通信设备股份有限公司 Method and device for sorting electronic mails
KR101473239B1 (en) 2013-07-26 2014-12-16 주식회사 알에스엔 Category and Sentiment Analysis System using Word pattern.
CN104361015A (en) * 2014-10-14 2015-02-18 四川神琥科技有限公司 Mail classification and recognition method
CN106777361A (en) * 2017-01-20 2017-05-31 清华大学 Microblogging text mood sorting technique and categorizing system based on vector paragraph model
CN108595568A (en) * 2018-04-13 2018-09-28 重庆邮电大学 A kind of text sentiment classification method based on very big unrelated multivariate logistic regression
CN108595568B (en) * 2018-04-13 2022-05-17 重庆邮电大学 Text emotion classification method based on great irrelevant multiple logistic regression

Similar Documents

Publication Publication Date Title
JP5791861B2 (en) Information processing apparatus and information processing method
US7885807B2 (en) Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian
US7213205B1 (en) Document categorizing method, document categorizing apparatus, and storage medium on which a document categorization program is stored
KR101136007B1 (en) System and method for anaylyzing document sentiment
JP2006244262A (en) Retrieval system, method and program for answer to question
US7398196B1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
KR102188739B1 (en) System and Method for Automated Emoticon Recommendation based on Emotion Ontology
JP4768882B2 (en) Information search device, information search method, information search program, and recording medium on which information search program is recorded
US11436278B2 (en) Database creation apparatus and search system
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
US20080097741A1 (en) Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient egyptian
Xu et al. RIP emojis and words to contextualize mourning on Twitter
JP2004094583A (en) Method of classifying writings
KR100479205B1 (en) Apparatus and method for recongnizing and classifying named entities from text document using iterated learning
CN111046168A (en) Method, apparatus, electronic device, and medium for generating patent summary information
Rodrigues Processing highly variant language using incremental model selection
JP7180767B2 (en) Response processing program, response processing method, and information processing device
WO2010103916A1 (en) Device for presentation of characteristic words in document and program giving priority of characteristic words
JP2006119697A (en) Question answering system, question answering method, and question answering program
JP4213900B2 (en) Document classification device and recording medium
KR100885527B1 (en) Apparatus for making index-data based by context and for searching based by context and method thereof
JPWO2009041661A1 (en) Information processing apparatus and program
JP5511161B2 (en) Information processing apparatus and information processing method
Demmen Charmed and chattering tongues: Investigating the functions and effects of key word clusters in the dialogue of Shakespeare’s female characters
EP1916609A1 (en) Text analysis, transliteration and translation method and apparatus for hieroglyphic, hieratic, and demotic texts from Ancient Egyptian

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20031107