JP5438603B2 - 感性辞書編集支援システム及びプログラム - Google Patents
感性辞書編集支援システム及びプログラム Download PDFInfo
- Publication number
- JP5438603B2 JP5438603B2 JP2010139012A JP2010139012A JP5438603B2 JP 5438603 B2 JP5438603 B2 JP 5438603B2 JP 2010139012 A JP2010139012 A JP 2010139012A JP 2010139012 A JP2010139012 A JP 2010139012A JP 5438603 B2 JP5438603 B2 JP 5438603B2
- Authority
- JP
- Japan
- Prior art keywords
- term
- sensitivity
- negative
- dictionary
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
例えば、特許文献1にあっては、所定の対象に対する情動表現を含む文章に対して形態素処理や構文解析処理を施した後、多数の情動表現が登録されたアフェクトターム辞書を参照して、当該文章から情動表現を抽出すると共に、各情動表現の属性(ネガ/ポジ等)を集計し、その結果を外部に出力する技術が開示されている。
この結果、「口紅」という評価対象に関し、色つや、におい、付け心地、パッケージといった複数の評価軸毎に、否定的評価と肯定的評価の分布状況を提示することが可能となる。
ところで、自然文で記述されたテキストからユーザの価値判断が示されている部分を高精度で抽出するためには、参照する辞書の登録内容(登録語数及び属性設定の適否)を充実させることが不可欠となる。
しかしながら、特許文献1を含め、このような辞書(以下「感性辞書」)の編集を効率化させるための支援技術はこれまで存在しなかった。
上記「属性」としては、例えば「+」や「−」の極性が該当するが、「肯定」や「否定」、あるいは「P」や「N」等であってもよい(以下同様)。
上記「外部に出力する」とは、感性用語登録画面をディスプレイに表示させることや、同画面をクライアント端末に送信することが該当する(以下同様)。
ここで「感性用語」のデータ項目には、「おいしい」や「うまい」、「まずい」等、事物に対する肯定/否定(良し悪し)に関する人間の主観的な価値判断を表す名詞や形容詞等が格納されている。また、極性のデータ項目には、当該感性用語の意味内容が肯定的な場合には「+」の符号が、否定的な場合には「−」の符号が設定されている。
ここで「二項関係」とは、例えば「値段が高い」のように、二つの単語が助詞を介して組み合わされることにより、初めて一つの具体的な価値判断が生じる言葉を意味している。
すなわち、「高い」という形容詞は、一般的には肯定的な意味合いを観念させるものであるが、「値段が高い」や「危険性が高い」、「腐食性が高い」のように、主語によっては否定的な意味合いが生じる場合がある。あるいは逆に、「低い」という形容詞は、一般的には否定的な意味合いを観念させるものであるが、「危険性が低い」や「毒性が低い」、「違法性が低い」のように、主語によって肯定的な意味合いが生じる場合がある。
このため二項関係辞書46には、このように二つの単語の組合せによって具体的な価値判断を表すこととなる言葉について、「+」または「−」の極性が付与されている。
具体的には、「馬の耳に念仏(感性用語)/−(極性)」、「雨降って地固まる(感性用語)/+(極性)」、「片腹痛い(感性用語)/−(極性)」、「覆水盆に返らず(感性用語)/−(極性)」、「出藍の誉れ(感性用語)/+(極性)」のように、諺や格言のように価値判断を伴う慣用句が「感性用語」のデータ項目に充填されると共に、各慣用句の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
具体的には、「わくわく(感性用語)/+(極性)」、「ほっこり(感性用語)/+(極性)」、「ざわざわ(感性用語)/−(極性)」、「ぎとぎと(感性用語)/−(極性)」のように、価値判断を伴う擬態語が「感性用語」のデータ項目に充填されると共に、各擬態語の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
ただし、各ドメイン別辞書群は、それぞれ特定のカテゴリ(業界、商品分野、サービス分野)毎に用意されており、当該カテゴリに特有の感性用語や極性が登録されている。
クライアント端末58は、OS及びWebブラウザを搭載したPC等よりなる。
まずユーザは、クライアント端末58からWebサーバ54にアクセスし、ID及びパスワードを入力してログインした後、サービスメニューから「感性分析サービス」を選択する。
この結果、Webサーバ54からクライアント端末58に対して分析条件指定画面が送信される。
図においては、「09 12 アンケート結果.csv」という文書ファイルが指定されている。この文書ファイルには、ユーザである「ABC観光ホテル」の宿泊客から集めたアンケート文が複数格納されている。
図においては、ユーザIDに関連付けられた業種コードが「ホテル・旅館業界」であるため、「価格」、「料理」、「部屋」、「風呂」、「立地」、「宴会」、「設備」等が表示されている。
これに対しユーザは、不要な評価軸のチェックボックスに入れられたチェックを外すことにより、当該評価軸を分析項目から除外することができる。
この際、ユーザが指定した文書ファイルと、ユーザが設定した評価軸、及びユーザIDに関連付けられた業種コードが、Webサーバ54に送信される。
これを受けたWebサーバ54は、クライアント端末58からアップロードされた文書ファイルを感性分析システム10に送信し、分析を依頼する。
まず、感性分析システム10の文書登録部12は、Webサーバ54から送信された文書ファイルを、文書記憶部14に格納する(S10)。この文書ファイルには、ユーザが設定した評価軸及びユーザの業種コードが関連付けられている。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を特定する処理をいう。この形態素解析処理は公知技術であり、例えば以下のようなフリーソフトを形態素解析エンジンとして用いることができる。
■MeCab(http://mecab.sourceforge.net/)
■ChaSen(http://chasen.naist.jp/hiki/ChaSen/)
ここで「構文解析」とは、各文に含まれる文節間の係り受け構造を特定する処理をいう。この構文解析自体も公知技術であり、例えば以下のようなフリーソフトを構文解析エンジンとして用いることができる。
■KNP(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html)
■CaboCha(http://chasen.org/~taku/software/cabocha/)
以下、図6のフローチャートに従い、ネガ/ポジ判定処理の具体的な手順について説明する。
そして、特定の形態素または形態素の組合せにマッチする感性用語が感性辞書中に存在していた場合、ネガ/ポジ判定部22はその感性用語の極性を表すタグ(<+>または<−>)を当該表現に付与する(S16-02)。
すなわち、文書解析部16による構文解析処理により、当該文中の「値段が」の文節が「高い」の文節に係ることを示す解析データが生成されているため、ネガ/ポジ判定部22はこの解析データに基づき、二項関係辞書46中の「値段が高い」の極性を「値段が少し高い」の表現に適用可能となる。
そして、否定表現記憶部20中に文中の形態素または形態素の組合せにマッチする否定表現パターンが登録されていた場合、ネガ/ポジ判定部22はその表現(形態素または形態素の組合せ)に対して否定表現タグ(<否定>)を付与する(S16-04)。
そして、「否定的」との判定結果が出た場合、ネガ/ポジ判定部22は当該否定評価文に「<N>(Negative)」のネガ判定タグを付与し、「肯定的」との判定結果が出た場合には、当該肯定評価文に「<P>(Positive)」のポジ判定タグを付与する(S16-06)。
ここで「主題認定処理」とは、ネガ/ポジの評価対象を特定する処理を意味する。
図8においては、「(3) 静かなのがせめてもの救いだった。」の文にも、(1)の文の「部屋」が主格として継承されている。そして、新たな主格である「料理は」を有する(4)の文が登場した時点で、「部屋」の主題としての継承が停止されている。
例えば、「いい香り。」という文の場合、主格が省略されているが、「香り」という名詞(体言)を修飾している連体修飾語「いい(<+>)」が存在しているため、主題認定部24は「香り」を当該文の主題と認定する。
ここで「意図」とは、発言者(文執筆者)の主観的な目的や意向、思惑を意味しており、「不満」や「疑問」、「要望」、「予想外」等に類型化できる概念である。
上記のネガ/ポジ判定部22の抽出対象が、個別の主題に対する発言者の「良い/悪い」という二元論的な価値判断であるのに対し、意図抽出処理の対象となるものは、良し悪しの価値判断の背後に潜む発言目的や、良し悪しの価値判断から離れた発言者の読み手に対する意向や主張、メッセージとなる。
すなわち、図9に示すように、意図表現記憶部26に格納された各レコードは、「意図表現」と「意図類型」のデータ項目を備えている。そこで意図抽出部28は、この意図表現にマッチする表現を各文中において探索し、該当する表現を発見した場合には、対応する意図類型の類型タグを当該表現に関連付ける。
因みに、この文については文全体が「否定的」であることを示す<N>のネガ判定タグが付与されている。
この文については、文全体が「肯定的」であることを示す<P>のポジ判定タグが付与されている。
この文については、文全体が「否定的」であることを示す<N>のネガ判定タグが付与されている。
この文の場合、ネガ/ポジの判定結果を示すタグは付与されていない。
ここで「分析結果」とは、各文に対して主題タグや極性タグ、否定表現タグ、ネガ/ポジ判定タグ、意図類型タグを付与した分析結果データが該当する。
この分析結果表示画面は、Webサーバ54を経由してクライアント端末58に送信される(S26)。
すなわち、外側から3番目の目盛り75がネガ/ポジの割合が50対 50で均衡している位置であり、これよりも外側に頂角がある場合にはポジの割合がネガの割合を上回っており、内側に頂角がある場合にはネガの割合がポジの割合を上回っていることを示している。
この意図分類チャート76は、意図類型に対応した複数の意図類型ボタン77a〜77nを備えており、各ボタン77a〜77nには価格や料理等の評価軸に対応したアンカーテキストが、それぞれツリー状に表示されている。
また、この72件の文の中で、「評価軸:価格」のものが15件、「評価軸:料理」のものが21件、「評価軸:部屋」のものが11件、「評価軸:風呂」のものが13件、「評価軸:立地」のものが8件、「その他(評価軸なし)」のものが4件であったことが示されている。
「不満」ボタン77aや「要望」ボタン77b、「疑問」ボタン(図示省略)等についても同様に、「価格」、「料理」、「部屋」、「風呂」、「立地」、「その他」のアンカーテキストがツリー状に表示されている。
また、ユーザが任意のアンカーテキストにマウスポインタ78を重ねてクリックすると、別ウィンドウが開いて原文がリスト表示される(図示省略)。
この結果ユーザは、発言者の料理に対する具体的な不満を個別に確認することができる。この原文のリストは、分析結果評価部36によって生成されたものである。
まず、分析結果評価部36は、当該文書ファイルに関連付けられた評価軸である「価格」、「料理」、「部屋」、「風呂」、「立地」を取得する(S24-01)。
つぎに分析結果評価部36は、評価軸類似表現記憶部32に格納された業界毎の評価軸類似表現辞書を参照し、各評価軸の展開語を特定する(S24-02)。
例えば、「価格」の評価軸については、「価格」の他に、「料金」、「値段」、「宿泊料」、「宿代」等の類義語や関連語が類似表現として格納されている。これらの類似表現は、一般的な類義語辞書等を参照し、また個々の業界の特性を考慮しつつ、ユーザの属する業界毎に編纂されたものである。
このため、「価格」の評価軸について、「価格」や「料金」、「値段」といった一般的な呼び名の他に、「宿泊料」、「宿代」のようにホテル・旅館業界に特有の呼び名が列記されている。
また、飲食業界に属するユーザに対してサービスを提供する場合には、「宿泊料」や「宿代」の代わりに「飲食代」や「飲み代」等の類似表現が列記された、飲食業界用の評価軸類似表現辞書が適用されることとなる。
例えば、図10(a)の「夕食が粗末なので、もう少し品数を増やして下さい。」という文の場合、主題である「夕食」の文字列が評価軸「料理」の類似表現として登録されているため、分析結果評価部36は「料理」の評価軸識別コードを当該文に関連付ける。
[評価軸:価格]
<P>(ポジ):45個
<N>(ネガ):30個
[評価軸:料理]
<P>(ポジ):18個
<N>(ネガ):25個
この際、分析結果評価部36は、各評価軸のポジ数を合計した総合ポジ数を算出すると共に、各評価軸のネガ数を合計した総合ネガ数を算出し、両者の割合をレーダーチャート73の総合評価の項目にプロットする。
最後に分析結果評価部36は、上記のレーダーチャート73及び意図分類チャート76を備えた分析結果画面70を生成する(S24-07)。
すなわち、分析結果記憶部30には、各文に対して主題タグや極性タグ、否定表現タグ、ネガ/ポジ判定タグ、意図類型タグを付与した文書ファイルが格納されているため、ユーザは分析結果評価部36及びWebサーバ54経由で送信された検索画面(図示省略)上で適当な検索キー(例えば「意図類型:予想外」や「ネガ/ポジ判定結果:ネガ」)を設定することにより、分析結果記憶部30から必要な情報を自由に取り出すことができる。
このため感性分析システム10は、感性辞書のメンテナンスを支援する機能を備えている。以下、辞書のメンテナンス方法について説明する。
この結果、Webサーバ54からクライアント端末58に対して「感性用語登録画面」が送信される。
これに対し管理者は、対象辞書選択欄81における「▼」ボタン83をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の「汎用/二項関係辞書」、「汎用/慣用句辞書」、「汎用/擬態語辞書」を選択することもできる。また、「ホテル・旅館業界用/単語辞書」、「ITサービス業界用/二項関係辞書」、「家電業界用/擬態語辞書」のように、ドメイン別の各種辞書類を編集対象として指定することもできる。
つぎに、管理者が展開ボタン85をクリックすると、クライアント端末58からWebサーバ54に対して、展開語の表示リクエストが送信される。
これを受けたWebサーバ54は、辞書編集支援部38に対して「感動」に関する展開語の抽出を依頼する。
まず、Webサーバ54から起点語を受信した辞書編集支援部38は(S30)、起点語をキーに類義語辞書記憶部34内の類義語辞書を検索し、「感動」という用語の類義語を一次展開語として抽出する(S32)。
つぎに辞書編集支援部38は、抽出した各一次展開語をキーに再度類義語辞書を検索し、それぞれの類義語を「感動」の二次展開語として抽出する(S34)。
つぎに辞書編集支援部38は、一次展開語のリストと二次展開語のリストを生成し、Webサーバに送信する(S36)。
図示の通り、一次展開語リスト86には、「感動」、「うなる」、「心が動く」、「心が躍る」、「心に深く感じる」、「感嘆」、「感銘」、「胸キュン」等、起点語及びその類義語が列記されている。
また、二次展開語リスト87には、「うめく」、「呻吟」、「唸る」、「趣旨を変える」、「心移り」等の用語が列記されている。この二次展開語は、上記の通り一次展開語として抽出された類義語の類義語であり、例えば「うめく(二次展開語)」は「うなる(一次展開語)」の類義語に、「心移り(二次展開語)」は「心が動く(一次展開語)」の類義語に該当する。
必要な用語に対するチェック入れを完了した管理者がプラス登録ボタン88をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた用語を特定する情報と、これらの用語について「+」の極性での登録を求めるリクエストが送信される。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S38)、Webサーバ54から送信された各用語を、対応の辞書に追加登録する(S40)。
この際、辞書編集支援部38は、各用語の「極性」として「+」を設定する。また、類義語辞書から取得しておいた各用語の読みがなを、「読みがな」のデータ項目に追加する。また、送信された用語の中に、対応の辞書中に既に登録済みのものが存在した場合、上書更新される。
具体的には、用語単位で極性選択用の入力項目(例えばラジオボタン)を設けておき、その選択入力に応じて極性の指定がなされるように構成することが当てはまる。
この場合、管理者は管理者用のサービスメニューから「辞書メンテナンスサービス/感性用語削除」を選択する。
この結果、Webサーバ54からクライアント端末58に対して「感性用語削除画面」が送信される。
これに対し管理者は、対象辞書選択欄91における「▼」ボタン93をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の辞書類を編集対象として指定することもできる。
つぎに、管理者が抽出ボタン95をクリックすると、クライアント端末58からWebサーバ54に対して、マイナス設定語の表示リクエストが送信される。
これを受けたWebサーバ54は、辞書編集支援部38に対して極性として「−」が設定された感性用語の抽出を依頼する。
まず、Webサーバ54から上記の依頼を受信した辞書編集支援部38は(S50)、感性辞書記憶部18内における対応辞書から、「−」の極性が設定された感性用語を全て抽出する(S52)。
つぎに辞書編集支援部38は、抽出した各感性用語のリストを生成し、Webサーバ54に送信する(S54)。
図示の通り、マイナス設定語リスト96には、「あぶない」、「危ない」、「あぶなげない」、「あざとい」、「浅ましい」等のマイナス設定語が列記されている。
必要な感性用語に対するチェック入れを完了した管理者が削除ボタン97をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた感性用語を特定する情報と、これらの感性用語について削除を求めるリクエストが送信される。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S56)、Webサーバ54から送信された各感性用語のレコードを、対応の辞書から削除する(S58)。
すなわち、極性として「+」が設定された感性用語の抽出依頼をWebサーバ54から受信した辞書編集支援部38は(S50)、感性辞書記憶部18内における対応辞書から、「+」の極性が設定された感性用語を全て抽出する(S52)。
つぎに辞書編集支援部38は、抽出した各感性用語のリストを生成し、Webサーバ54に送信する(S54)。
これに対し管理者は、このプラス設定語リストに列記された感性用語の要否を個別に検討し、辞書に登録しておく必要がないと判断した場合には対応のチェックボックスにチェックを入れる。
必要な感性用語に対するチェック入れを完了した管理者が削除ボタン97をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた感性用語を特定する情報と、これらの感性用語について削除を求めるリクエストが送信される。
Webサーバ54からの依頼を受信した辞書編集支援部38は(S56)、Webサーバ54から送信された各感性用語のレコードを、対応の辞書から削除する(S58)。
この場合、感性用語削除画面90には辞書登録済みの感性用語及びその極性が列記された感性用語リストが表示され、管理者は各感性用語及びその極性に基づいて要否を判断する。そして管理者は、不要と判断した感性用語のチェックボックスにチェックを入れて、削除ボタン97をクリックする。
登録件数が多い場合には、リストアップされる用語の種類を絞り込むためのボタン(例えば「あ行表示ボタン」等)を画面上に設けておき、一度に表示される用語の数を調整することが望ましい。
これに対し管理者は、対象辞書選択欄102における「▼」ボタン106をクリックしてプルダウンメニューを開き、任意の辞書を選択する。図においては「汎用/単語辞書」が選択されているが、他の辞書類を編集対象として指定することもできる。
必要な推奨用語に対するチェック入れを完了した管理者が登録ボタン108をクリックすると、クライアント端末58からWebサーバ54に対して、リスト中においてチェックが入れられた推奨用語を特定する情報と、これらの用語について対応の極性での登録を求めるリクエストが送信される。
すなわち、感性用語候補記憶部39には、図20(a)に示すように、「感性用語候補」及び「ポイント」のデータ項目を備えたレコードが多数格納されている。各感性用語候補のポイントには、プラスまたはマイナスの符号が付された数値「1」が格納されている。
そして、所定の閾値以上の絶対値(例えば±15以上)を備えた感性用語候補を推奨用語として抽出して推奨用語リスト104を生成した後、Webサーバ54に送信する。Webサーバ54は、この推奨用語リスト104を組み入れた感性用語リコメンド登録画面100を生成し、管理者のクライアント端末58に送信する。
以下、図21のフローチャートに従い、感性用語候補抽出に係る処理手順を説明する。
例えば、図22(b)の文が「主人公もブサメンじゃなかったし。」であった場合、前後の文が肯定評価文であるため、(b)の文も全体として肯定評価文となる筈であるが、「なかった」の表現に<否定>タグが付与されているため、感性用語候補抽出部40は、当該文から抽出した「主人公」及び「ブサメン」に「−」の極性を認定する。
反対に、前後を否定評価文に挟まれたターゲット文に<否定>タグが付与されていた場合、感性用語候補抽出部40は、当該文から抽出した感性用語候補に「+」の極性を認定する。
12 文書登録部
14 文書記憶部
16 文書解析部
18 感性辞書記憶部
20 否定表現記憶部
22 ネガ/ポジ判定部
24 主題認定部
26 意図表現記憶部
28 意図抽出部
30 分析結果記憶部
32 評価軸類似表現記憶部
34 類義語辞書記憶部
36 分析結果評価部
38 辞書編集支援部
42 汎用辞書群
44 ドメイン別辞書群
45 汎用/単語辞書
46 汎用/二項関係辞書
47 汎用/慣用句辞書
48 汎用/擬態語辞書
49 ドメイン別/単語辞書
50 ドメイン別/二項関係辞書
51 ドメイン別/擬態語辞書
54 Webサーバ
56 インターネット
58 クライアント端末
60 分析条件指定画面
61 分析対象ファイル指定欄
62 評価軸指定欄
63 参照ボタン
64 分析開始ボタン
70 分析結果画面
71 ネガ/ポジ分析結果表示欄
72 意図抽出結果表示欄
73 レーダーチャート
74 折れ線図形
76 意図分類チャート
77a 意図分類ボタン
77b 意図分類ボタン
77n 意図分類ボタン
78 マウスポインタ
79 ポップアップウインドウ
80 感性用語登録画面
81 対象辞書選択欄
82 起点語指定欄
84 入力フィールド
85 展開ボタン
86 一次展開語リスト
87 二次展開語リスト
88 プラス登録ボタン
89 マイナス登録ボタン
90 感性用語削除画面
91 対象辞書選択欄
92 極性選択欄
95 抽出ボタン
96 マイナス設定語リスト
97 削除ボタン
100 感性用語リコメンド登録画面
102 対象辞書選択欄
104 推奨用語リスト
108 登録ボタン
Claims (7)
- 事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。 - 事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段と、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段と、
各類義語をキーに上記類義語辞書記憶手段を検索し、各類義語の類義語を抽出する手段と、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。 - 上記リストに掲げられた各用語には、選択入力用のチェックボックスが設けられており、上記感性用語登録画面上には肯定の属性での登録を求めるボタンと、否定の属性での登録を求めるボタンとが設けられており、
上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、
上記何れかのボタンを押下することによって、全選択用語に対する属性の指定情報が入力されることを特徴とする請求項1または2に記載の感性辞書編集支援システム。 - 上記リストに掲げられた各用語には、選択入力用のチェックボックスと、属性選択用の入力項目が設けられており、
上記チェックボックスに対するチェック入れによって1または複数の用語の選択情報が入力され、
上記入力項目に対する選択入力によって、各選択用語対する属性の指定情報が入力されることを特徴とする請求項1または2に記載の感性辞書編集支援システム。 - 事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、
文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段と、
否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段と、
各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段と、
感性用語候補と、プラス/マイナスの何れかの極性を備えたポイントとの組合せを格納しておく感性用語候補記憶手段と、
上記文書ファイル中における、同種のネガ判定タグまたはポジ判定タグを付与された文に挟まれた、何れの判定タグをも付与されていない文を探索し、当該ターゲット文から所定の品詞の形態素または形態素の組合せからなる表現を感性用語候補として抽出する手段と、
ネガ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、ポジ判定タグが付与された文に挟まれたターゲット文が上記の否定表現を含まない場合には、当該ターゲット文から抽出した感性用語候補に対してプラスのポイントを付与し、当該ターゲット文が上記の否定表現を含む場合には、当該ターゲット文から抽出した感性用語候補に対してマイナスのポイントを付与する手段と、
各感性用語候補及びポイントを上記感性用語候補記憶手段に格納する手段と、
上記感性用語候補記憶手段に格納された各感性用語候補のポイントを集計する手段と、
ポイントの絶対値が所定の閾値以上の感性用語候補を推奨用語として抽出し、各推奨用語及びそれぞれの極性を列記した推奨用語リストを生成する手段と、
上記推奨用語リストを含む感性用語登録画面を生成し、外部に出力する手段と、
この画面を介して、上記推奨用語リスト中の1または複数の推奨用語を選択する情報が入力された場合に、選択された推奨用語及びその極性に対応した属性を上記感性辞書記憶手段に格納する手段と、
を備えたことを特徴とする感性辞書編集支援システム。 - 上記感性辞書記憶手段に格納された少なくとも一部の感性用語を抽出して削除対象リストを生成し、このリストを含む感性用語削除画面をディスプレイに表示させる手段と、
この画面を介して、特定の感性用語を削除対象として選択する情報が入力された場合に、選択された感性用語に関するデータを上記感性辞書記憶手段から削除する手段と、
を備えたことを特徴とする請求項1〜5の何れかに記載の感性辞書編集支援システム。 - コンピュータを、
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段、
複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶手段、
起点語が入力された場合に、この起点語をキーに上記類義語辞書記憶手段を検索し、当該起点語の類義語を抽出する手段、
抽出された用語のリストを含む感性用語登録画面を生成し、外部に出力する手段、
この画面を介して、上記リスト中の1または複数の用語を選択する情報と、各用語の属性を指定する情報が入力された場合に、選択された用語を指定された属性に関連付けて上記感性辞書記憶手段に格納する手段、
として機能させることを特徴とする感性辞書編集支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010139012A JP5438603B2 (ja) | 2010-06-18 | 2010-06-18 | 感性辞書編集支援システム及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010139012A JP5438603B2 (ja) | 2010-06-18 | 2010-06-18 | 感性辞書編集支援システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012003574A JP2012003574A (ja) | 2012-01-05 |
JP5438603B2 true JP5438603B2 (ja) | 2014-03-12 |
Family
ID=45535468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010139012A Expired - Fee Related JP5438603B2 (ja) | 2010-06-18 | 2010-06-18 | 感性辞書編集支援システム及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5438603B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101555039B1 (ko) | 2013-11-12 | 2015-09-22 | 연세대학교 산학협력단 | 감정 사전 구축 장치 및 감정 사전 구축 방법 |
JP6297835B2 (ja) * | 2013-12-26 | 2018-03-20 | Kddi株式会社 | マイニング分析装置、方法及びプログラム |
CN106919551B (zh) * | 2015-12-28 | 2020-08-18 | 株式会社理光 | 一种情感词极性的分析方法、装置及设备 |
WO2021117483A1 (ja) * | 2019-12-09 | 2021-06-17 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2010
- 2010-06-18 JP JP2010139012A patent/JP5438603B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012003574A (ja) | 2012-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11334635B2 (en) | Domain specific natural language understanding of customer intent in self-help | |
JP2012003572A (ja) | 感性分析システム及びプログラム | |
US10496756B2 (en) | Sentence creation system | |
JP4796664B1 (ja) | 感性分析システム及びプログラム | |
US20130173247A1 (en) | System and Method for Interactive Auromatic Translation | |
US20140280314A1 (en) | Dimensional Articulation and Cognium Organization for Information Retrieval Systems | |
CN104978332B (zh) | 用户生成内容标签数据生成方法、装置及相关方法和装置 | |
US20230274086A1 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
US20230274094A1 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
US20230274089A1 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
JP5438603B2 (ja) | 感性辞書編集支援システム及びプログラム | |
Fogel-Dror et al. | Role-based association of verbs, actions, and sentiments with entities in political discourse | |
JP5599073B2 (ja) | 感性分析システム及びプログラム | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
JP2012003573A (ja) | 感性分析システム及びプログラム | |
Kim et al. | A user opinion and metadata mining scheme for predicting box office performance of movies in the social network environment | |
JP5717549B2 (ja) | 感性分析システム及びプログラム | |
JP6409071B2 (ja) | 文の並び替え方法および計算機 | |
JP2004280180A (ja) | 広告用キーワード抽出システム、広告文配信システム、広告用キーワード抽出プログラム及び広告文配信プログラム | |
JP2006343925A (ja) | 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム | |
Shi et al. | EOSentiMiner: an opinion-aware system based on emotion ontology for sentiment analysis of Chinese online reviews | |
KR101379935B1 (ko) | 메시지 정보 추출 시스템 및 그 방법 | |
ElGindy et al. | Capturing place semantics on the geosocial web | |
WO2020026229A2 (en) | Proposition identification in natural language and usage thereof | |
JP7037778B2 (ja) | 検索装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5438603 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |