JP2008217064A - 要望抽出装置、方法およびプログラム - Google Patents

要望抽出装置、方法およびプログラム Download PDF

Info

Publication number
JP2008217064A
JP2008217064A JP2007049405A JP2007049405A JP2008217064A JP 2008217064 A JP2008217064 A JP 2008217064A JP 2007049405 A JP2007049405 A JP 2007049405A JP 2007049405 A JP2007049405 A JP 2007049405A JP 2008217064 A JP2008217064 A JP 2008217064A
Authority
JP
Japan
Prior art keywords
request
expression
specifying
document data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2007049405A
Other languages
English (en)
Inventor
Takahiro Kawamura
隆浩 川村
Shinichi Nagano
伸一 長野
Masumi Inaba
真純 稲葉
Yumiko Shimogoori
祐美子 下郡
Kenta Cho
健太 長
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007049405A priority Critical patent/JP2008217064A/ja
Publication of JP2008217064A publication Critical patent/JP2008217064A/ja
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書データに記載された直接的な要望のほか潜在的な要望を抽出する要望抽出装置を提供する。
【解決手段】所定のキーワードを含む文書データを収集する収集手段100と、収集手段100が収集した文書データから、キーワードに対する否定的な語尾パターンを含む否定的表現を不満表現として抽出する第1抽出手段102と、否定的表現のうち否定的な語尾パターンを除く文字列をキーワードに対する直接的要望として特定する第1特定手段104と、収集手段100が収集した文書データから直接的要望を含む文字列を、キーワードに対する潜在的要望として特定する第2特定手段106とを備えた。
【選択図】 図1

Description

本発明は、複数の文書からユーザの要望を抽出する要望抽出装置、方法およびプログラムに関するものである。
テキストマイニングの中でも比較的新しい分野に要望抽出がある。例えば特許文献1には、感性的・情緒的な顧客ニーズを抽出する装置が開示されている。この装置においては、商品アンケートなどから自由に記述された複数の文書データを取得し、これらに含まれている印象表現語と当該印象表現語に結びついた名詞句の組を抽出する。そして、この組に対する未知価値度、評価固定度およびアフェクト度の3つのパラメータに基づいて、顧客ニーズを抽出する。
特開2004−38729号公報
しかしながら上記特許文献1にかかる方法では、文書データに含まれている文字を抽出することにより直接的要望までは特定することができるが、その表現の裏に隠された潜在的要望まで特定することはできない。
例えば「パソコンが重い」という表現は、単純に「パソコンを軽くして欲しい」という直接的な要望を表す他、「持ち運びたいので軽くして欲しい」というように表現には現れていない「持ち運びたい」という潜在的要望が隠されている場合がある。
この「持ち運びたい」という潜在的要望まで把握することができれば、単に軽いだけでなく、持ち運びの際に落としても壊れないような強度を兼ね備えたパソコンが望まれているということを知ることができる。このため、上記特許文献1の技術では、ユーザの潜在的要望までを把握することができず、真の要望を反映した開発等を行うことができないという問題があった。
本発明は、上記に鑑みてなされたものであって、文書データに記載された直接的な要望のほか潜在的要望を抽出することのできる要望抽出装置、方法およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、要望抽出装置であって、所定のキーワードを含む文書データを収集する収集手段と、前記収集手段が収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出手段と、前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定手段と、前記収集手段が収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定手段とを備えたことを特徴とする。
また、本発明の他の形態は、要望抽出装置であって、所定のキーワードを含む文書データを収集する収集手段と、逆の意味を示す2つの表現を対応付けて保持する第1保持手段と、前記キーワードに対する表現のうち、前記第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出手段と、前記第1保持手段において、前記第1抽出手段により抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定手段と、前記収集手段が収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定手段とを備えたことを特徴とする。
また、本発明の他の形態は、要望抽出方法であって、所定のキーワードを含む文書データを収集する収集ステップと、前記収集ステップにおいて収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出ステップと、前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定ステップと、前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップとを有することを特徴とする。
また、本発明の他の形態は、要望抽出方法であって、所定のキーワードを含む文書データを収集する収集ステップと、前記キーワードに対する表現のうち、逆の意味を示す2つの表現を対応付けて保持する第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出ステップと、前記第1保持手段において、前記第1抽出ステップにおいて抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定ステップと、前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップとを有することを特徴とする。
また、本発明の他の形態は、要望抽出処理をコンピュータに実行させるプログラムであって、所定のキーワードを含む文書データを収集する収集ステップと、前記収集ステップにおいて収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出ステップと、前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定ステップと、前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップとを有することを特徴とする。
また、本発明の他の形態は、要望抽出処理をコンピュータに実行させるプログラムであって、所定のキーワードを含む文書データを収集する収集ステップと、前記キーワードに対する表現のうち、逆の意味を示す2つの表現を対応付けて保持する第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出ステップと、前記第1保持手段において、前記第1抽出ステップにおいて抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定ステップと、前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップとを有することを特徴とする。
本発明にかかる要望抽出装置によれば、直接的な要望の裏に潜む真の要望までを把握して真の要望を反映した処理等の支援を行うことができるという効果を奏する。
以下に、本発明にかかる要望抽出装置、方法およびプログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
図1に示すように、実施の形態にかかる要望抽出装置10は、文書収集部100と、不満表現抽出部102と、直接的要望特定部104と、潜在的要望特定部106と、カウント部108と、インタラクション判定部110と、優先度算出部112と、出力部114と、オントロジーデータベース(DB)120とを備えている。
文書収集部100は、ユーザより指定された対象キーワードに対応するウェブ文書をインターネット20に接続されたファイルサーバや共有データ等あるいはWEBサイト等から検索して、検索されたウェブ文書を受信することにより、対象キーワードに対応するウェブ文書を収集する。例えば、対象キーワードが「和食レストラン」である場合には、文書収集部100は、この「和食レストラン」という文字列を含むウェブ文書を収集する。
なお、文書収集部100は、他の例としては、LAN(Local Area Network)に接続されたコンピュータ等に共有データとして保存されている文書データを収集してもよい。このように、要望抽出の対象となる文書データを収集できればよく収集する対象となる文書データは本実施の形態に限定されるものではない。
不満表現抽出部102は、文書収集部100により収集されたウェブ文書の内容を解析してウェブ文書の内容から対象キーワードに対する不満表現を抽出する。具体的には、不満表現抽出部102は、収集したウェブ文書の内容から対象キーワードに「〜がない」など否定的な語尾パターンを付加した不満表現を抽出する。例えば、対象キーワードが「和食レストラン」であった場合には、ウェブ文書中から、「和食レストラン」に否定的な語尾パターンを付加した「和食レストランがない」という文字列が不満表現として抽出される。
不満表現抽出部102は、さらに「重い」と「軽い」のように逆の意味を示す文字列を不満表現として抽出する。例えば、対象キーワードが「パソコン」であった場合には、不満表現抽出部102は、ウェブ文書中から、対象キーワードに逆の意味を示す文字列を付加した「パソコンが重い」というフレーズおよび「パソコンが軽い」というフレーズを不満表現として抽出する。なお、「重い」、「軽い」などの逆の意味を示す文字列の不満表現は、後述のオントロジーDB120に登録されており、不満表現抽出部102は、このオントロジーDB120を参照して上記不満表現を抽出している。
直接的要望特定部104は、不満表現抽出部102により抽出された不満表現の逆の表現を直接的要望として特定する。ここで、「逆の表現」とは、対象キーワードに付加された表現と意味的に逆の意味を付加した表現の他、単に対象キーワードに付加された表現を除外したもの、すなわち対象キーワードそのものも含まれる。例えば、前者の例としては、直接的要望特定部104は、不満表現「パソコンが重い」においては、オントロジーDB120を参照することにより、「重い」と逆の意味を有する「軽い」を特定し、「パソコン、軽い」を直接的要望として特定する。また、後者の例としては、不満表現「和食レストランがない」という否定的表現が直接的要望である場合には、直接的要望特定部104は、「がない」という否定的な語尾パターンを除いた残りの文字列「和食レストラン」を直接的要望として特定する。
次にオントロジーDB120の詳細について説明する。オントロジーDB120においては、図2に示すように、クラス(Class)とインスタンス(Instance)の関係が登録されている。ここで、図2において、subClassOfの矢印は、矢印先のクラスが矢印元のクラスのサブクラスとなる関係を示している。instanceOfの矢印は、矢印先のインスタンスが矢印元のクラスを実体化したものであること示している。complementOfの矢印は、矢印元のクラスと矢印先のクラスとが逆の意味となる関係にあることを示している。
例えば、オントロジーDB120は、「重い」と「軽い」のように逆の意味を有する2つの表現を対応付けて保持している。具体的には、表現クラス(Expression)のサブクラスとしてHeavyとLightとが格納されており、それぞれに対するインスタンスとして「重い」と「軽い」とがオントロジーDB120に登録されている。
不満表現抽出部102は、否定的表現のほか、オントロジーDB120に格納されているこれらの文字列を不満表現として特定する。また、直接的要望特定部104は、オントロジーDB120において不満表現抽出部102により抽出された不満表現に対応付けられている文字列を直接的要望として特定する。
潜在的要望特定部106は、直接的要望特定部104により特定された直接的要望を含む潜在的要望を、文書収集部100が収集したウェブ文書から特定する。すなわち、潜在的要望特定部106は、不満表現が含まれているウェブ文書だけでなく、これ以外のウェブ文書を対象として潜在的要望を特定する。潜在的要望とは、不満表現に直接現れていない要望であり、ユーザの真の希望を示すものと考えられる。具体的には、キーワードを含む論理表現を抽出する。論理表現とは、例えば主語述語の関係を示す2項関係などのn項関係や、if thenなど予め定められた構造の表現である。例えば「この間、家族で和食レストランで食事しました」という文は、2項関係にあり(食事 家族で 和食レストラン)と表現される。また、「和食レストランがあれば、ファミリーで食べられるのに」という文は、if(和食レストラン) then(食事 家族で)と表現される。なお、他の例としては、2項関係にかえて、2項以外のn項の文字列間の関係を示すn項関係を論理表現として抽出してもよい。
潜在的要望特定部106は、さらに、オントロジーDB120を参照し、表現のゆれを統一する。具体的には、図3に示すように、オントロジーDB120は、さらに同一の意味を有する異なる複数の表現を対応付けている。これにより、例えば、「食べる」と「食事する」とは同一と判断することができる。なお、図3において、sameAsの矢印は、同義の関係にあることを示し、他の矢印および記号は図2と同様である。また、rangeは、派生の関係にあることを示している。
多数のウェブ文書から潜在的要望を特定した場合、同一の潜在的要望が得られることがある。カウント部108は、このような同一の潜在的要望の数をカウントする。
インタラクション判定部110は、潜在的要望を含むウェブ文書のメタデータを参照して、潜在的要望特定部106が特定した各潜在的要望に対するインタラクションを判定する。インタラクションとは、潜在的要望を含むウェブ文書を作成した人と不満表現を含むウェブ文書を作成した人との関係がどのくらい近いかを示す指標であり、インタラクション判定部110は、この指標を、潜在的要望を含むウェブ文書のメタデータを参照し、メタデータ中の例えばトラックバック、ハイパーリンク、コメント、足跡、メッセージ、SNSなどを参照してインタラクションに応じた点数として決定している。例えば、不満表現を含むウェブ文書を作成した人とのやり取りがより多いほどインタラクションは密になり、インタラクションに応じた点数は高く設定される。
インタラクションの例として図4を示す。図4に示す例においては、不満表現に最も近いコミュニティ、すなわちインタラクションの最も密なコミュニティに対してインタラクションに応じた点数を10点とし、不満表現から遠くなるほど、すなわちインタラクションが疎になるほどインタラクションに応じた点数として低い点数を与えている。具体的には、図4に示すように、不満表現から離れるにしたがい順にインタラクションに応じた点数として5点、3点、1点を与える。
優先度算出部112は、カウント部108によりカウントされたカウント数およびインタラクション判定部110により判定されたインタラクションに応じた点数に基づいて、優先度を算出する。同一のキーワードに対する潜在的要望は世代や性別などコミュニティごとに異なる可能性が高い。そこで、不満表現を含むウェブ文書の作成者とできるだけ近いコミュニティから得られた潜在的要望を優先することにより、作成者の潜在的要望を正確に特定できると期待できる。そこで、具体的には、優先度算出部112は、カウント数にインタラクションに応じた点数を乗じた数を優先度として算出する。
出力部114は、優先度算出部112により計算された優先度順に各潜在的要望を配列したリストを作成し、これを印刷装置等の外部に出力する。
「ドリンクバー」がキーワードとして指定された場合の要望抽出処理について図5を参照しつつ具体的に説明する。この場合、まず文書収集部100は、「ドリンクバー」を含むウェブ文書を収集する(ステップS100)。これにより例えば以下a〜iの文書群が得られる。

a「ドリンクバーは欲しいけど…」
b「近頃、ファミレスのドリンクバーには、良い機械が置かれている。」
c「ファミレスのドリンクバーでコーヒーを飲んでいたので、カフェインパワー全開に…」
d「ドリンクバーはアイスコーヒーも飲んだんだけど、…」
e「そして、ドリンクバーがあり、そこではエスプレッソマシーンや何種類かのソフトドリンクが…」
f「ドリンクバーといえば、2mixもやります。」
g「このドリンクバーを利用して感じている教訓:(1)カスタマイズは面白い。茶葉をブレンドできるとい…」
h「ドリンクバーでノンシュガーの…」
i「やっぱり、ドリンクバーのジュースは全部入れて混ぜる。」
次に、不満表現抽出部102は、文書収集部100が収集したウェブ文書から対象キーワードに対する不満表現を抽出する(ステップS102)。不満表現としては、否定表現の他、例えば「重い」などオントロジーDB120に登録されている文字列を抽出する。本例においては、不満表現抽出部102は、上記ウェブ文書の語尾パターンを抽出することによりaの「ドリンクバーは欲しいけど…」を論理表現に変換した「notドリンクバー」を不満表現として抽出する。
次に、直接的要望特定部104は、不満表現抽出部102が抽出した不満表現に対する直接的要望を特定する(ステップS104)。具体的には、「not」を除く「ドリンクバー」を直接的要望として特定する。
次に、潜在的要望特定部106は、文書収集部100が収集したウェブ文書から直接的要望特定部104により特定された直接的要望を含む潜在的要望を特定する(ステップS106)。具体的には、まず対象となる文章を論理表現に変換する。ここでは、2項関係の論理表現に変換する。これにより、b〜g,iの文章は、それぞれ以下のように変換される。

b(置かれている ドリンクバー 良い機械)
c(飲む ドリンクバー コーヒー)
d(飲んだ ドリンクバー アイスコーヒー)
e(ある ドリンクバー エスプレッソマシーン)
f(やる ドリンクバー 2mix)
g(できる ドリンクバー ブレンド)
i(混ぜる ドリンクバー ジュース)
さらに、オントロジーDB120を参照して以下のように表記のゆれを統一する(ステップS108)。

b(ある ドリンクバー コーヒーマシーン)
c(飲む ドリンクバー コーヒー)
d(飲む ドリンクバー コーヒー)
e(ある ドリンクバー コーヒーマシーン)
f(ブレンド ドリンクバー)
g(ブレンド ドリンクバー)
i(ブレンド ドリンクバー ジュース)

以上の処理により潜在的要望として以下A〜Cの3つが得られる。
A(ある ドリンクバー コーヒーマシーン)
B(飲む ドリンクバー コーヒー)
C(ブレンド ドリンクバー)
このように、不満表現に対する直接的要望だけでなく、潜在的要望を特定することができる。本例においては、ドリンクバーは飲み放題を目的としていると捉えがちだが、潜在的要望としてコーヒーマシン、コーヒー、ブレンドという文字列が得られたことから、潜在的には、コーヒーへの拘りや、複数のドリンクを自分で配合したオリジナルドリンクを飲みたいなどの要望があることがわかる。
さらに、このうちいずれの潜在的要望がより強く望まれているかを評価するために優先度を算出する(ステップS110)。具体的には、カウント部108は、A〜Cの各潜在的要望の数をカウントする。本例においては、図6に示すようにA、B、Cのカウント数はそれぞれ3、2、2である。さらに、各潜在的要望の点数は図6に示すように、Aは10点、5点、3点のコミュニティにそれぞれ1つずつ属している。Bは、5点、1点のコミュニティにそれぞれ1つずつ属している。Cは、3点1点のコミュニティにそれぞれ1つずつ属している。したがって、以下のように点数と回数とを乗じて各潜在的要望の優先度を算出する(ステップS110)。

A 10点×1+5点×1+3点×1=18点
B 5点×1+1点×1=6点
C 3点×1+1点×1=4点
次に、出力部114は、優先度算出部112により算出された優先度順に潜在的要望を配列したデータを出力する(ステップS112)。本例においては、A、B、Cの順に配列される。以上で、要望抽出処理が完了する。
図7に示すように、要望抽出装置10は、ハードウェア構成として、要望抽出装置10における要望抽出処理を実行する要望抽出プログラムなどが格納されているROM52と、ROM52内のプログラムに従って要望抽出装置10の各部を制御するCPU51と、要望抽出装置10の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べた要望抽出装置10における要望抽出プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(登録商標)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、要望抽出プログラムは、要望抽出装置10において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施の形態の要望抽出プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
要望抽出装置10の機能構成を示すブロック図である。 オントロジーDB120のデータ構成を模式的に示した図である。 オントロジーDB120のデータ構成を模式的に示した図である。 コミュニティを説明するための図である。 要望抽出装置10による要望抽出処理を示すフローチャートである。 A,B,Cの属するコミュニティを示す図である。 要望抽出装置10のハードウェア機能を示す図である。
符号の説明
10 要望抽出装置
100 文書収集部
102 不満表現抽出部
104 直接的要望特定部
106 潜在的要望特定部
108 カウント部
110 インタラクション判定部
112 優先度算出部
114 出力部
120 オントロジーデータベース

Claims (11)

  1. 所定のキーワードを含む文書データを収集する収集手段と、
    前記収集手段が収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出手段と、
    前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定手段と、
    前記収集手段が収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定手段と
    を備えたことを特徴とする要望抽出装置。
  2. 所定のキーワードを含む文書データを収集する収集手段と、
    逆の意味を示す2つの表現を対応付けて保持する第1保持手段と、
    前記キーワードに対する表現のうち、前記第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出手段と、
    前記第1保持手段において、前記第1抽出手段により抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定手段と、
    前記収集手段が収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定手段と
    を備えたことを特徴とする要望抽出装置。
  3. 前記第2特定手段は、n項関係を示す文字列を前記潜在的要望として特定することを特徴とする請求項1または2に記載の装置。
  4. 前記潜在的要望が含まれている前記文書データに付与されているメタデータから前記潜在的要望が含まれている前記文書データと前記不満表現が含まれている前記文書データの間のリンク関係を抽出する第2抽出手段と、
    前記第2抽出手段により抽出された前記リンク関係に基づいて、前記潜在的要望の優先度を算出する算出手段と
    を備えたことを特徴とする請求項1から3のいずれか一項に記載の装置。
  5. 前記算出手段は、前記潜在的要望が含まれている前記文書データと前記不満表現が含まれている前記文書データの間のリンクが密なほど、より高い優先度を算出することを特徴とする請求項4に記載の装置。
  6. 前記第2特定手段は、複数の前記潜在的要望を抽出し、
    複数の前記潜在的要望のうち所定の潜在的要望が得られた数をカウントするカウント手段と、
    前記カウント手段によるカウント数に基づいて、当該所定の潜在的要望の優先度を算出する算出手段と
    をさらに備えたことを特徴とする請求項1から3のいずれか一項に記載の装置。
  7. 同一の意味を有する複数の表現を対応付けて保持する第2保持手段をさらに備え、
    前記カウント手段は、前記第2保持手段において対応付けられている複数の表現を同一であるとして前記所定の潜在的要望が得られた数をカウントすることを特徴とする請求項6に記載の装置。
  8. 所定のキーワードを含む文書データを収集する収集ステップと、
    前記収集ステップにおいて収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出ステップと、
    前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定ステップと、
    前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップと
    を有することを特徴とする要望抽出方法。
  9. 所定のキーワードを含む文書データを収集する収集ステップと、
    前記キーワードに対する表現のうち、逆の意味を示す2つの表現を対応付けて保持する第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出ステップと、
    前記第1保持手段において、前記第1抽出ステップにおいて抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定ステップと、
    前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップと
    を有することを特徴とする要望抽出方法。
  10. 要望抽出処理をコンピュータに実行させるプログラムであって、
    所定のキーワードを含む文書データを収集する収集ステップと、
    前記収集ステップにおいて収集した前記文書データから、前記キーワードに対する否定的な語尾パターンを含む否定的表現を前記不満表現として抽出する第1抽出ステップと、
    前記否定的表現のうち前記否定的な語尾パターンを除く文字列を前記キーワードに対する前記直接的要望として特定する第1特定ステップと、
    前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップと
    を有することを特徴とする要望抽出プログラム。
  11. 要望抽出処理をコンピュータに実行させるプログラムであって、
    所定のキーワードを含む文書データを収集する収集ステップと、
    前記キーワードに対する表現のうち、逆の意味を示す2つの表現を対応付けて保持する第1保持手段において対応付けられている一方の表現を前記不満表現として抽出する第1抽出ステップと、
    前記第1保持手段において、前記第1抽出ステップにおいて抽出された前記不満表現に対応付けられている他方の表現を前記直接的要望として特定する第1特定ステップと、
    前記収集ステップにおいて収集した前記文書データから前記直接的要望を含む文字列を、前記キーワードに対する潜在的要望として特定する第2特定ステップと
    を有することを特徴とする要望抽出プログラム。
JP2007049405A 2007-02-28 2007-02-28 要望抽出装置、方法およびプログラム Abandoned JP2008217064A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007049405A JP2008217064A (ja) 2007-02-28 2007-02-28 要望抽出装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007049405A JP2008217064A (ja) 2007-02-28 2007-02-28 要望抽出装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2008217064A true JP2008217064A (ja) 2008-09-18

Family

ID=39837081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007049405A Abandoned JP2008217064A (ja) 2007-02-28 2007-02-28 要望抽出装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2008217064A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204864A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満解決商品発見方法及びプログラム
JP2010204865A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満抽出方法及びプログラム
JP2011107826A (ja) * 2009-11-13 2011-06-02 Intec Systems Institute Inc 行動情報抽出システム及び抽出方法
JP2011180945A (ja) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd 推薦商品選定装置、推薦商品選定方法、推薦商品選定プログラム及び販売支援システム
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム
JP2013168043A (ja) * 2012-02-16 2013-08-29 Nec Corp 不満抽出装置,不満抽出方法および不満抽出プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204864A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満解決商品発見方法及びプログラム
JP2010204865A (ja) * 2009-03-02 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 情報処理装置及び不満抽出方法及びプログラム
JP2011107826A (ja) * 2009-11-13 2011-06-02 Intec Systems Institute Inc 行動情報抽出システム及び抽出方法
JP2011180945A (ja) * 2010-03-03 2011-09-15 Dainippon Printing Co Ltd 推薦商品選定装置、推薦商品選定方法、推薦商品選定プログラム及び販売支援システム
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム
JP2013168043A (ja) * 2012-02-16 2013-08-29 Nec Corp 不満抽出装置,不満抽出方法および不満抽出プログラム

Similar Documents

Publication Publication Date Title
US10394830B1 (en) Sentiment detection as a ranking signal for reviewable entities
US8010539B2 (en) Phrase based snippet generation
Venetis et al. Recovering semantics of tables on the web
US8819001B1 (en) Systems, methods, and user interface for discovering and presenting important contents in a document
CN110325986A (zh) 文章处理方法、装置、服务器及存储介质
Zhang et al. Mining and clustering service goals for restful service discovery
JP2008217064A (ja) 要望抽出装置、方法およびプログラム
US11126783B2 (en) Output apparatus and non-transitory computer readable medium
JP2008287517A (ja) 強調表示装置及びプログラム
JP2012003572A (ja) 感性分析システム及びプログラム
JP2012243033A (ja) 情報処理装置、情報処理方法、およびプログラム
Zhang et al. An approach of service discovery based on service goal clustering
JP2016218512A (ja) 情報処理装置及び情報処理プログラム
Quan et al. Feature-level sentiment analysis by using comparative domain corpora
Hu et al. Embracing information explosion without choking: Clustering and labeling in microblogging
Fauzi et al. Image understanding and the web: a state-of-the-art review
Pak Automatic, adaptive, and applicative sentiment analysis
JP2012256268A (ja) 広告配信装置及び広告配信プログラム
JP2012003573A (ja) 感性分析システム及びプログラム
JP5085584B2 (ja) 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム
Balasubramanian et al. Automatic generation of topic pages using query-based aspect models
AU2015244356A1 (en) Augmenting search results
Lawrence et al. Freedom and Restraint Tags, Vocabularies and Ontologies.
Gelbukh Computational Linguistics and Intelligent Text Processing: 16th International Conference, CICLing 2015, Cairo, Egypt, April 14-20, 2015, Proceedings, Part II
JP5727846B2 (ja) シリーズアイテム群抽出システム、シリーズアイテム群抽出方法、およびシリーズアイテム群抽出プログラム

Legal Events

Date Code Title Description
A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20100210