JP2009163565A - 文整形装置及び文整形プログラム - Google Patents

文整形装置及び文整形プログラム Download PDF

Info

Publication number
JP2009163565A
JP2009163565A JP2008001526A JP2008001526A JP2009163565A JP 2009163565 A JP2009163565 A JP 2009163565A JP 2008001526 A JP2008001526 A JP 2008001526A JP 2008001526 A JP2008001526 A JP 2008001526A JP 2009163565 A JP2009163565 A JP 2009163565A
Authority
JP
Japan
Prior art keywords
sentence
word
emotion
emotion polarity
shaping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008001526A
Other languages
English (en)
Inventor
Ryoko Hotta
良子 堀田
Kentaro Inui
健太郎 乾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2008001526A priority Critical patent/JP2009163565A/ja
Publication of JP2009163565A publication Critical patent/JP2009163565A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】感情生起の原因となる事態を表す文から感情生起と関係のない単語を削除する文整形装置及び文整形プログラムを提供する。
【解決手段】文整形装置は、入力された文に形態素解析を行って前記文を単語に分解する形態素解析部11と、入力された感情語の第1の感情極性及び前記形態素解析部11により分解された単語又は複数の単語から成る節の第2の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるかを判定する感情極性判定部12と、前記感情極性判定部12により判定された前記第1の感情極性と前記第2の感情極性とが、一方がポジティブであり且つ他方がネガティブである単語又は節を抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形部13と、前記文整形部13により整形された文を出力する出力部14と、を備えている。
【選択図】図1

Description

本発明は、感情生起の原因となる事態を表す文から、感情生起に関係のない単語を削除して文を整形する文整形装置及び文整形プログラムに関する。
文をその文を構成する単語に基づいて整形する技術が提案されている、このような文を整形する装置として、議事録の自動要約を目的とした文書要約装置(例えば、特許文献1参照。)が知られている。特許文献1の文書要約装置では、議論がどのように展開したかを把握するため、評価語「反対」、「賛成」、「利点」、「欠点」などを修飾する節を抽出し、これに基づいて要約文を生成する。
特開2007−128401号公報
しかしながら、例えば、「家計は悪化しているが景気は上向きなので賛成だ」という文では、「家計は悪化しているが景気は上向きなので」は「賛成だ」を修飾しているが、「家計は悪化している」は「賛成」と直接関係しない。特許文献1の文書要約装置では、このような場合の判別ができない。この結果、文全体の評価が「賛成=ポジティブ」であると、「悪化=ネガティブ」のように極性が異なる単語が含まれていても「悪化」が「賛成」と関係すると判断してしまうという問題点がある。また、該装置では、係り受け解析を用いているため、係り受け解析の誤りにより、正しい要約が得られないという問題点もある。
本発明は、上記問題点を解決するためになされたものであり、感情生起の原因となる事態を表す文から感情生起と関係のない単語を削除すると共に、係り受け解析の精度が十分でない場合でも精度よく文を整形できる文整形装置及び文整形プログラムを提供することを目的とする。
上記目的を達成するために、請求項1記載の文整形装置は、入力された文に形態素解析を行って前記文を単語に分解する形態素解析手段と、入力された感情語の第1の感情極性及び前記形態素解析手段により分解された単語又は複数の単語から成る節の第2の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるかを判定する感情極性判定手段と、前記感情極性判定手段により判定された前記第1の感情極性と前記第2の感情極性とが一方がポジティブであり且つ他方がネガティブとなるときの前記第2の感情極性に対応する単語又は節を抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段と、前記文整形手段により整形された文を出力する出力手段と、を備えている。
請求項1記載の発明によれば、入力文中から感情生起に関わりのない単語や節を削除することができる。
請求項2記載の文整形装置は、入力された文に形態素解析を行って前記入力された文を単語に分解する形態素解析手段と、入力された感情語の第1の感情極性値、及び前記形態素解析手段により分解された単語又は複数の単語から成る節の感情極性がネガティブ、ポジティブ又はニュートラルの何れかである度合いを示す第2の感情極性値を判定する感情極性判定手段と、前記感情極性判定手段により判定された前記第1の感情極性値及び前記第2の感情極性値に基づいて前記感情語に対する前記単語又は前記節の寄与度を求め、該寄与度が閾値に満たないものを不要な単語又は節として抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段と、前記文整形手段により整形された文を出力する出力手段と、を備えている。
請求項2記載の発明によれば、入力文中から感情生起に関わりのない単語や節を削除する際に、適切な閾値を設定することにより誤削除を防止することができる。
請求項3記載の文整形プログラムは、コンピュータを、入力された文に形態素解析を行って前記入力された文を単語に分解する形態素解析手段、入力された感情語の第1の感情極性及び前記形態素解析手段により分解された単語又は複数の単語から成る節の第2の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるかを判定する感情極性判定手段、及び前記感情極性判定手段により判定された前記第1の感情極性と前記第2の感情極性とが、一方がポジティブであり且つ他方がネガティブである単語又は節を抽出し、該単語又は節を削除することにより入力された文を整形する文整形手段、として機能させる。
請求項3記載の発明によれば、入力文中から感情生起に関わりのない単語や節を削除することができる。
請求項4記載の文整形プログラムは、コンピュータを、入力された文に形態素解析を行って単語に分解する形態素解析手段、入力された感情語の第1の感情極性値、及び前記形態素解析手段により分解された単語又は複数の単語から成る節の感情極性がネガティブ、ポジティブ又はニュートラルの何れかである度合いを示す第2の感情極性値を判定する感情極性判定手段、及び前記感情極性判定手段により判定された前記第1の感情極性値及び前記第2の感情極性値に基づいて前記感情語に対する前記単語又は前記節の寄与度を求め、該寄与度が閾値に満たないものを不要な単語又は節として抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段、として機能させる。
請求項4記載の発明によれば、入力文中から感情生起に関わりのない単語や節を削除することができる。
以上説明したように、本発明によれば、感情生起の原因となる事態を表す文から感情生起と関係のない単語や節を、正しく削除して文を整形することができるという効果が得られる。
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。
図1は、本発明の実施の形態に係る文整形装置の構成を示すブロック図である。同図に示すように、文整形装置は、形態素解析部11と、感情極性判定部12と、文整形部13と、出力部14と、感情語辞書15と、感情関連語辞書16と、を備えている。
形態素解析部11は、事態を表す文(以下「事態文」という。)である入力文に形態素解析を行って単語に分解すると共に、各単語を原型に変換する。ここで、形態素解析とは、文字列を単語に分解し、各単語の品詞を特定する技術をいう。
感情極性判定部12は、感情語として入力された感情、及び事態文に含まれる単語又は複数の単語から成る節の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるか、また感情極性がどの程度ネガティブ、ポジティブ又はニュートラルであるかを表す感情極性値を求める。
文整形部13は、事態文に含まれる単語又は節と感情語との感情極性を用いて、事態文の整形を行う。具体的には、感情語の感情極性と、事態文に含まれる単語又は節の感情極性とが異なる場合に、対象単語又は節を削除する。また、その応用として、感情極性の度合いに応じて単語又は節の寄与度を求め、この寄与度に基づいて単語又は節を削除する。
出力部14は、感情語及び整形された事態文を出力する。
感情語辞書15は、感情語が表す感情極性がネガティブ、ポジティブ及びニュートラルの何れであるか、又は感情語が表す感情極性がどの程度ポジティブ、ネガティブ又はニュートラルであるかを表す感情極性値を定義する。
感情関連語辞書16は、事態文に含まれる単語又は節が表す感情極性がネガティブ、ポジティブ及びニュートラルの何れであるか、又は感情語が表す感情極性がどの程度ポジティブ、ネガティブ又はニュートラルであるか表す感情極性値を定義する。
次に、本発明の各実施の形態に係る文整形装置の作用の流れを図2及び図11に示す各フローチャートに沿って説明する。
<第1の実施の形態>
図2は、第1の実施の形態に係る文整形装置の作用の流れを示すフローチャートである。第1のケースとして、図3に示す事態文「遊園地に行く」と感情を示す感情語「楽しい」が対で入力された場合を例に説明する。
まず、ステップ100では、形態素解析部11が、事態文「遊園地に行く」を形態素解析する。その結果、図4のように、事態文が複数の単語に分解されると同時に、各単語は原形に変換される。
ステップ110では、感情極性判定部12が、感情語「楽しい」の第1の感情極性を判定する。第1の感情極性の判定は、図5に示す感情語辞書15を検索して行われる。検索の結果、「楽しい」の第1の感情極性は「ポジティブ」であることが判る。
ステップ120では、感情極性判定部12が、事態文に含まれる各単語の第2の感情極性を順に判定する。この場合、事態文に含まれる各単語の原形は図4に示すように「遊園地」、「に」、「行く」である。第2の感情極性の判定は、図6に示す感情関連語辞書16を検索して行われる。検索の結果、最初の単語の第2の感情極性は、「遊園地=ポジティブ」であることが判る。
ステップ130では、感情極性判定部12が、事態文に含まれる各単語について順に第2の感情極性がネガティブ又はポジティブであるか否かを判定し、ネガティブ又はポジティブなときはステップ140に進み、その他(ニュートラル)のときはステップ160に進む。本ケースでは、最初の単語である「遊園地」は第2の感情極性がポジティブであるのでステップ140に進む。
ステップ140では、感情極性判定部12が、当該単語の第2の感情極性と感情語の第1の感情極性とが不一致か否かを判定し、不一致のときはステップ150に進み、一致するときはステップ160に進む。
本ケースでは、「遊園地」については、第1の感情極性と第2の感情極性とが一致するのでステップ160に進む。
ステップ160では、文整形部13が、事態文に含まれる全ての単語の処理を終了したか否かを判定し、終了したときはステップ170に進み、終了していないときはステップ120に戻って残りの単語について上述の処理を繰り返す。
本ケースでは、ステップ120で「遊園地」に続く「に」、「行く」の第2の感情極性は何れも「ニュートラル」であることが判るので、ステップ130からステップ160に進む。そして、全ての単語について処理を終了したときには、ステップ170に進む。
ステップ170では、出力部14が、感情語と整形後の事態文を出力する。本ケースでは、ステップ150における事態文の整形は行われなかったので、入力された事態文がそのまま出力される。
本ケースのように、第1の感情極性及び第2の感情極性がネガティブ又はポジティブであり、かつ、第1の感情極性と第2の感情極性とが異なる単語が事態文に含まれない場合には、事態文の整形は行わない。
次に、第2のケースとして、図7に示す事態文「遊園地に行くといつも混雑している」と感情を示す感情語「嫌だ」が対で入力された場合を例に説明する。
第1のケースと同様に、ステップ100では、形態素解析部11が事態文に形態素解析を行う。その結果、図8に示すように、事態文は単語に分解され、かつ、原形に変換される。
ステップ110では、感情極性判定部12が、感情語「嫌だ」の第1の感情極性を判定する。図5に示す感情語辞書15から、第1の感情極性は「ネガティブ」であることが判る。
ステップ120では、感情極性判定部12が、事態文に含まれる各単語の第2の感情極性を順に判定する。この場合、事態文に含まれる各単語の原形は図8に示すように「遊園地」、「に」、「行く」、「と」、「いつも」、「混雑」、「する」、「て」、「いる」である。最初の単語の第2の感情極性は、第1のケースと同様に図6に示す感情関連語辞書16から「遊園地=ポジティブ」であることが判る。
ステップ130では、感情極性判定部12が、事態文に含まれる各単語について順に第2の感情極性がネガティブ又はポジティブであるか否かを判定し、ネガティブ又はポジティブなときはステップ140に進み、その他(ニュートラル)のときはステップ160に進む。本ケースでは、最初の単語である「遊園地」は第2の感情極性がポジティブであるのでステップ140に進む。
ステップ140では、感情極性判定部12が、当該単語の第2の感情極性と感情語の第1の感情極性とが不一致か否かを判定し、不一致のときはステップ150に進み、一致するときはステップ160に進む。
本ケースでは、「遊園地」については、第1の感情極性と第2の感情極性とが不一致であるのでステップ150に進む。
ステップ150では、文整形部13が、当該単語「遊園地」を「unknown」に置き換えて文を整形する。
ステップ160では、文整形部13が、事態文に含まれる全ての単語について処理を終了したか否かを判定し、終了したときは処理を終え、終了してないときはステップ120に戻り、残りの単語について上述の処理を繰り返す。
本ケースの場合、「遊園地」に続く各単語の第2の感情極性は、図6に示す感情関連語辞書16により「に=ニュートラル」、「行く=ニュートラル」、「と=ニュートラル」、「いつも=ニュートラル」、「混雑=ネガティブ」、「する=ニュートラル」、「て=ニュートラル」、「いる=ニュートラル」である。従って、第2の感情極性がネガティブ又はポジティブであり、かつ、第1の感情極性と異なる単語はないので、「遊園地」以外の単語については置き換えを行わずにステップ170に進む。
ステップ170では、出力部14が、感情と整形後の事態文を出力する。本ケースでは、上述のように「遊園地」を「unknown」に置き換えた結果、図9に示すように、感情語「嫌だ」と事態文「〜に行くといつも混雑している」が出力される。これは、「嫌だ」を生起する事態は「〜に行くといつも混雑している」であることを示している。
このように、第1の実施の形態に係る文整形装置では、事態文に含まれる単語の感情極性と感情語の感情極性とが異なる場合に、当該単語を事態文から削除する。従って、感情生起の事態と直接関係しない単語が事態文から削除されるので、データベース検索時のノイズが消去されるので、より適切な検索が可能になる。
以下、具体例を用いて、本実施の形態に係る文整形装置による事態文の整形の有効性を示す。
本発明の応用例として、次の2つのユーザ発話に対して、図10に示す事態文と感情データベースから感情の応答生成をすることを考える。
(ユーザ発話例)
ユーザ発話1:「遊園地 へ 行っ た よ」
ユーザ発話2:「デパート へ 行っ たら 大 混雑 だっ た よ」
上記2つの発話と図10の事態文との類似度を考える。類似度は単語の一致度によって求める。図10のID1の事態文は本発明を適用する前(整形前)の事態文、ID2の事態文は本発明により文を整形した後の事態文を示す。
ID1:「遊園地 に 行く と いつも 混雑 し て いる」
ID2:「unknown に 行く と いつも 混雑 し て いる」
ID1の事態文とユーザ発話との類似度は下記のようになる。
・「ID1の事態文」と「ユーザ発話1」との類似度=1
一致する単語=遊園地
・「ID1の事態文」と「ユーザ発話2」との類似度-=1
一致する単語=混雑
従って、どちらの類似度も1であるため、ユーザ発話1に対しても、ユーザ発話2に対しても感情「嫌だ」を推定してしまう。
一方、ID2の事態文との類似度は下記のようになる。
・「ID2の事態文」と「ユーザ発話1」との類似度=0
一致する単語=該当なし
・「ID2の事態文」と「ユーザ発話2」との類似度=1
一致する単語=混雑
従って、ユーザ発話1に対しては類似度0で「嫌だ」は該当しないが、ユーザ発話2に対しては類似度1で「嫌だ」を推定する。
ここで、一般的には、ユーザ発話1の表現する感情はポジティブ、ユーザ発話2の表現する感情はネガティブと考えられる。このように、本発明に係る文整形装置で整形した事態文を用いることで適切な推定が可能になる。
<第2の実施の形態>
第2の実施の形態では、第1の実施の形態における「感情極性に基づく文整形」の応用として、感情極性値に基づいて「感情に対する単語の寄与度」を求める。
図11は、第2の実施の形態に係る文整形装置の作用の流れを示すフローチャートである。本実施の形態では、第1の実施の形態の第2のケースと同様に、図7に示す事態文「遊園地に行くといつも混雑している」と感情を示す感情語「嫌だ」が対で入力された場合を例に説明する。
ステップ200では、形態素解析部11が事態文に形態素解析を行い、図8に示すように事態文が単語に分割され、かつ、原形に変換される。
ステップ210では、感情極性判定部12が、感情語「嫌だ」の第1の感情極性値を判定する。図12に示す感情語辞書15から、第1の感情極性値は「−1」であることが判る。
ステップ220では、感情極性判定部12が、事態文に含まれる各単語の第2の感情極性値を順に判定する。最初の単語の第2の感情極性値は、図13に示す感情関連語辞書16から「遊園地=+0.84」であることが判る。
ステップ230では、感情極性判定部12が、事態文に含まれる各単語について順に第2の感情極性値がプラス又はマイナスであるか否かを判定し、プラス又はマイナスのときはステップ240に進み、その他(ゼロ)のときはステップ260に進む。最初の単語「遊園地」は第2の感情極性値がプラスであるのでステップ240に進む。
ステップ240では、感情極性判定部12が、当該単語の第2の感情極性値と感情語の第1の感情極性値との正負が不一致か否かを判定し、不一致のときはステップ250に進み、一致するときはステップ260に進む。
「遊園地」については、第1の感情極性値と第2の感情極性値の正負が不一致であるのでステップ250に進む。
ステップ250では、文整形部13が、感情に対する各単語の寄与度を求める。当該ケースのように、第1の感情極性値と第2の感情極性値の正負が不一致の場合には、「当該単語の第2の感情極性値」×「−1」を寄与度とする。従って、「遊園地」の寄与度は図14に示すように「+0.84」×「−1」=「−0.84」となる。
ステップ270では、文整形部13が、当該単語の寄与度と予め定めた閾値と比較し、寄与度が閾値未満のときはステップ280に進み、寄与度が閾値以上のときはステップ290に進む。本実施の形態では、例えば閾値を「−0.3」と定めておくと、「遊園地=−0.84」は閾値未満であるのでステップ280に進む。
ステップ280では、文整形部13が、当該単語「遊園地」を「unknown」に置き換えて文を整形する。
ステップ290では、文整形部13が、事態文に含まれる全ての単語について処理を終了したか否かを判定し、終了したときはステップ300に進み、終了してないときはステップ220に戻り、残りの単語について上述の処理を繰り返す。
本実施の形態の場合、「遊園地」に続く各単語の第2の感情極性値は、図13に示す感情関連語辞書16により、「に=0」、「行く=+0.2」、「と=0」、「いつも=0」、「混雑=−0.98」、「する=0」、「て=0」、「いる=0」である。
このうち、第2の感情極性値が「0」である「に」、「と」、「いつも」、「する」、「て」、「いる」については、以下のように処理が行われる。
ステップ230では、第2の感情極性値がプラスでもマイナスでもないのでステップ260に進む。
ステップ260では、文整形部13が、感情に対する各単語の寄与度を求める。第2の感情極性値が「0」のときは、「当該単語の第2の感情極性値」の絶対値を感情に対する寄与度とする。従って、何れの単語も寄与度は「0」となる。
ステップ270では、文整形部13が、当該単語の寄与度と予め定めた閾値と比較し、寄与度は「0」で閾値「−0.3」以上であるのでステップ290に進み、単語の「unknown」への置き換えは行われない。
第2の感情極性値が「プラス」である「行く=+0.2」については、以下のように処理が行われる。
ステップ230では、第2の感情極性値がプラスであるのでステップ240に進み、第1の感情極性値と正負が不一致であるのでステップ250に進む。
ステップ250では、文整形部13が、感情に対する各単語の寄与度を求める。上述の「遊園地」の場合と同様に、「当該単語の第2の感情極性値」×「−1」を寄与度とする。従って、「行く」の寄与度は図14に示すように「+0.2」×「−1」=「−0.2」となる。
ステップ270では、文整形部13が、当該単語の寄与度と予め定めた閾値と比較し、寄与度は「−0.2」で閾値「−0.3」以上であるのでステップ290に進み、単語の「unknown」への置き換えは行われない。
第2の感情極性値が「マイナス」である「混雑=−0.98」については以下のように処理が行われる。
ステップ230では、第2の感情極性値がマイナスであるのでステップ240に進み、第1の感情極性値と正負が一致するであるのでステップ260に進む。
ステップ260では、文整形部13が、感情に対する各単語の寄与度を求める。第1の感情極性値と第2の感情極性値とが一致するときは、「当該単語の第2の感情極性値」の絶対値を感情に対する寄与度とする。従って、「混雑」の寄与度は「+0.98」となる。
ステップ270では、文整形部13が、当該単語の寄与度と予め定めた閾値と比較し、寄与度は「+0.98」で閾値「−0.3」以上であるのでステップ290に進み、単語の「unknown」への置き換えは行われない。
以上、事態文に含まれる全ての単語について処理を終了した場合には、ステップ300に進む。
ステップ300では、出力部14が、感情語と整形後の事態文を出力する。本実施の形態では、上述のように「遊園地」を「unknown」に置き換えた結果、図9に示すように、感情語「嫌だ」と事態文「〜に行くといつも混雑している」が出力される。
このように、第2の実施の形態に係る文整形装置では、寄与度の閾値を「−0.3」として文を整形すると、「に」、「行く」、「と」、「いつも」、「混雑」、する」、「て」、「いる」が閾値以上の単語として残される。即ち、寄与度の正負のみで要否を判断して削除されていた部分を残すことができる。また、寄与度の閾値を適切に変動させることにより、アプリケーションに合わせて文の整形結果を変更することが可能となる。
なお、本発明は、上述した実施の形態に限定されるものではなく、特許請求の範囲に記載された範囲内で設計上の変更をされたものにも適用可能である。
例えば、入力された文を単語だけでなく、複数の単語から成る節に分解し、単語又は節の感情極性(或いは感情極性値)に基づいて不要な部分を削除して文を整形してもよい。
一例として、事態文「ノートパソコンは薄いがキーボードが小さいので面倒だ」に対して感情がネガティブな場合を考えると、「ノートパソコンは薄い」を節として分解し、当該節の感情極性がポジティブであると、節単位で不要な部分を削除することができる。
本発明の実施の形態に係る文整形装置の構成を示すブロック図である。 第1の実施の形態に係る文整形装置の作用の流れを示すフローチャートである。 事態文と感情語の対1を示す図である。 事態文と感情語の対1の事態文の形態素解析結果を示す図である。 感情語と感情極性の関係を定義する感情語辞書を示す図である。 感情関連語と感情極性の関係を定義する感情関連語辞書を示す図である。 事態文と感情語の対2を示す図である。 事態文と感情語の対2の事態文の形態素解析結果を示す図である。 事態文と感情語の対1の整形結果を示す図である。 整形前と整形後の事態文と感情データベースの例を示す図である。 第2の実施の形態に係る文整形装置の作用の流れを示すフローチャートである。 感情語と感情極性値の関係を定義する感情語辞書を示す図である。 感情関連語と感情極性値の関係を定義する感情関連語辞書を示す図である。 事態文と感情語の対2の整形結果(感情に対する単語の寄与度を用いた場合)を示す図である。
符号の説明
11 形態素解析部
12 感情極性判定部
13 文整形部
14 出力部
15 感情語辞書
16 感情関連語辞書

Claims (4)

  1. 入力された文に形態素解析を行って前記文を単語に分解する形態素解析手段と、
    入力された感情語の第1の感情極性及び前記形態素解析手段により分解された単語又は複数の単語から成る節の第2の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるかを判定する感情極性判定手段と、
    前記感情極性判定手段により判定された前記第1の感情極性と前記第2の感情極性とが一方がポジティブであり且つ他方がネガティブとなるときの前記第2の感情極性に対応する単語又は節を抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段と、
    前記文整形手段により整形された文を出力する出力手段と、
    を備えた文整形装置。
  2. 入力された文に形態素解析を行って前記入力された文を単語に分解する形態素解析手段と、
    入力された感情語の第1の感情極性値、及び前記形態素解析手段により分解された単語又は複数の単語から成る節の感情極性がネガティブ、ポジティブ又はニュートラルの何れかである度合いを示す第2の感情極性値を判定する感情極性判定手段と、
    前記感情極性判定手段により判定された前記第1の感情極性値及び前記第2の感情極性値に基づいて前記感情語に対する前記単語又は前記節の寄与度を求め、該寄与度が閾値に満たないものを不要な単語又は節として抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段と、
    前記文整形手段により整形された文を出力する出力手段と、
    を備えた文整形装置。
  3. コンピュータを、
    入力された文に形態素解析を行って前記入力された文を単語に分解する形態素解析手段、
    入力された感情語の第1の感情極性及び前記形態素解析手段により分解された単語又は複数の単語から成る節の第2の感情極性がネガティブ、ポジティブ及びニュートラルの何れであるかを判定する感情極性判定手段、及び
    前記感情極性判定手段により判定された前記第1の感情極性と前記第2の感情極性とが、一方がポジティブであり且つ他方がネガティブである単語又は節を抽出し、該単語又は節を削除することにより入力された文を整形する文整形手段、
    として機能させるための文整形プログラム。
  4. コンピュータを、
    入力された文に形態素解析を行って単語に分解する形態素解析手段、
    入力された感情語の第1の感情極性値、及び前記形態素解析手段により分解された単語又は複数の単語から成る節の感情極性がネガティブ、ポジティブ又はニュートラルの何れかである度合いを示す第2の感情極性値を判定する感情極性判定手段、及び
    前記感情極性判定手段により判定された前記第1の感情極性値及び前記第2の感情極性値に基づいて前記感情語に対する前記単語又は前記節の寄与度を求め、該寄与度が閾値に満たないものを不要な単語又は節として抽出し、該単語又は節を削除することにより前記入力された文を整形する文整形手段、
    として機能させるための文整形プログラム。
JP2008001526A 2008-01-08 2008-01-08 文整形装置及び文整形プログラム Pending JP2009163565A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008001526A JP2009163565A (ja) 2008-01-08 2008-01-08 文整形装置及び文整形プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008001526A JP2009163565A (ja) 2008-01-08 2008-01-08 文整形装置及び文整形プログラム

Publications (1)

Publication Number Publication Date
JP2009163565A true JP2009163565A (ja) 2009-07-23

Family

ID=40966100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008001526A Pending JP2009163565A (ja) 2008-01-08 2008-01-08 文整形装置及び文整形プログラム

Country Status (1)

Country Link
JP (1) JP2009163565A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375838A (zh) * 2010-08-17 2012-03-14 富士通株式会社 用于构建极性词素数据库以及确定词的极性的方法和装置
KR101136007B1 (ko) 2010-06-29 2012-04-20 (주)워드워즈 문서 감성 분석 시스템 및 그 방법
JP2015109004A (ja) * 2013-12-05 2015-06-11 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101136007B1 (ko) 2010-06-29 2012-04-20 (주)워드워즈 문서 감성 분석 시스템 및 그 방법
CN102375838A (zh) * 2010-08-17 2012-03-14 富士通株式会社 用于构建极性词素数据库以及确定词的极性的方法和装置
JP2015109004A (ja) * 2013-12-05 2015-06-11 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置

Similar Documents

Publication Publication Date Title
CN109241538B (zh) 基于关键词和动词依存的中文实体关系抽取方法
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
CN110502642B (zh) 一种基于依存句法分析与规则的实体关系抽取方法
CN104636466B (zh) 一种面向开放网页的实体属性抽取方法和系统
JP5071373B2 (ja) 言語処理装置、言語処理方法および言語処理用プログラム
CN111241294A (zh) 基于依赖解析和关键词的图卷积网络的关系抽取方法
JP4968036B2 (ja) 韻律語グルーピング方法及び装置
CN107463548B (zh) 短语挖掘方法及装置
US8775158B2 (en) Data processing device, data processing method, and data processing program
CN107515856A (zh) 一种基于局部信息表示的细粒度情感元素抽取方法
CN112818698B (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
JP6427466B2 (ja) 同義語ペア獲得装置、方法、及びプログラム
CN105390137A (zh) 响应生成方法、响应生成装置和响应生成程序
JP2018025956A (ja) モデル作成装置、推定装置、方法、及びプログラム
CN104021202A (zh) 一种知识共享平台的词条处理装置和方法
JP2009163565A (ja) 文整形装置及び文整形プログラム
CN113032582A (zh) 一种基于知识图谱建立实体统一模型及实体统一方法
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
CN115577109A (zh) 文本分类方法、装置、电子设备及存储介质
CN113988047A (zh) 一种语料筛选方法和装置
JP2018077698A (ja) 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム
JP2018077604A (ja) 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置
KR101544639B1 (ko) 입력되는 문자열로부터 사용자의 감정을 판단하는 방법
JP5142395B2 (ja) 関係情報抽出装置、その方法、プログラム及び記録媒体
CN109308352B (zh) 一种基于最短路径的词语相关性判定方法