JP5311488B2 - 感性情報抽出装置、感性検索装置、その方法およびプログラム - Google Patents

感性情報抽出装置、感性検索装置、その方法およびプログラム Download PDF

Info

Publication number
JP5311488B2
JP5311488B2 JP2009195093A JP2009195093A JP5311488B2 JP 5311488 B2 JP5311488 B2 JP 5311488B2 JP 2009195093 A JP2009195093 A JP 2009195093A JP 2009195093 A JP2009195093 A JP 2009195093A JP 5311488 B2 JP5311488 B2 JP 5311488B2
Authority
JP
Japan
Prior art keywords
sensitivity
information
search
expression
search target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009195093A
Other languages
English (en)
Other versions
JP2011048527A (ja
Inventor
いづみ 高橋
久子 浅野
のぞみ 小林
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009195093A priority Critical patent/JP5311488B2/ja
Publication of JP2011048527A publication Critical patent/JP2011048527A/ja
Application granted granted Critical
Publication of JP5311488B2 publication Critical patent/JP5311488B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、テキストから感性情報を抽出してデータベース化し、このデータベースを利用して情報検索を行う技術に関する。
現在、Web上で商品などの情報を検索する場合は、当該検索対象の名前やカテゴリ、定性的な特徴などを検索クエリ(検索条件)とする検索が主流である。自動車を例に取ると、「T社」の「セダン」、「4ドア」、色は「白」…などが検索条件となる。しかし、欲しい情報はあるが、それに対する上記のような検索条件を記述できず、「かわいい」、「上品な」などのイメージ(印象)や、それを使用した際の気分といった「感性」でしか対象を特徴付けられない場合、このような感性を直接、検索条件として検索できると便利である。しかし、現在、実用化されている感性検索では、その対象が有するイメージを表す定量的な情報(感性情報)を、検索対象毎に人手で付与しておく必要があった(例えば、非特許文献1参照)。
"アマナ 写真130万点を「形容詞」で検索可能に―事例データベース:ITpro"、[online]、日経BP社、[平成21年8月14日検索]、インターネット<URL:http://itpro.nikkeibp.co.jp/article/JIREI/20070827/280366/>
(1)感性検索を行うために各検索対象に対する感性情報を人手で付与するのは手間が大きいため、その作業をできるだけ省力化することが望ましい。
(2)こうした感性検索を低コストに実現する手法としては、検索対象のイメージを表す感性表現をテキストから抽出して足し合わせることで、検索対象のイメージを表現する方法が考えられる。しかし、感性表現は検索対象が有する様々な側面(外見的特長、品質、性格など)毎についてのイメージを表しており、全てを足し合わせてしまうと、却ってその特徴が鈍ってしまう可能性がある。
例えば、ある検索対象のイメージを表す感性表現として「ゴージャス」と「苦い」があった場合、前者は容姿、後者は味という側面についてのイメージを表しており、これを足し合わせることで「ゴージャス」のもつ「美しい」、「派手」といったイメージが損なわれてしまい、望ましい検索結果が得られない。よって感性表現を用いて検索対象の感性情報を生成する際には、異なる側面の特徴がノイズとなることを避ける必要がある。
(3)また感性表現を検索条件として用いる際には、どういった感性表現を用いたかによりユーザの注目している側面が異なる。例えば「苦い」で検索した場合には検索対象の味に注目しているため、味の側面においてイメージが類似している検索対象が出力されることが望ましい。よって検索条件と検索対象との距離計算は、ユーザの注目する側面において行う必要がある。
本発明は、上記の点に鑑みなされたもので、
(1)予め検索対象のイメージ(=感性情報)を大規模なテキストの集合(コーパス)から抽出しておき、感性検索時には、検索条件として入力される感性表現の表すイメージと検索対象のイメージとの感性的な距離を利用することにより、運用コストを省力化した感性検索を行う装置および方法を提供する、
(2)感性表現を用いて検索対象の感性情報を生成する際に、感性表現が検索対象のどういった側面(外見的特長、品質、性格など)についてのイメージを表しているのか考慮する、
(3)ユーザの注目する側面においてイメージの近い検索対象を出力するため、検索条件である感性表現がどういった側面についてのイメージを表しているか考慮する、
という3つの点により、全く異なる側面に関するイメージがノイズとなることを避け、検索精度を向上させることを目的とする。
以下、検索対象や感性表現が有するイメージを定量化した情報を「感性情報」と記述する。
上記の課題(1)については、本発明では、検索対象に関するテキストを入力すると、テキスト解析を行って感性表現を抽出し、抽出した感性表現を用いて検索対象毎の感性情報を生成することで、検索条件として入力される感性表現と感性的に距離の近い検索対象を提示することを特徴とする。
また、課題(2)については、テキストから抽出した感性表現を用いて検索対象の感性情報を生成する際に、検索対象の「外見的特長」や「品質」といった側面毎に感性情報を生成することで、異なる側面の特徴がノイズとなるのを避けることを特徴とする。
また、課題(3)については、検索条件として感性表現を入力すると、その感性表現が表す「外見的特長」や「品質」といった側面において検索条件である感性表現と検索対象との距離計算を行うことで、ユーザの注目する側面においてイメージの類似する検索対象を出力することを特徴とする。
詳細には、
テキストの集合から感性情報を抽出し、検索対象データベースを作成する感性情報抽出装置であって、
感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースと、
入力されたテキストの集合から感性表現を抽出し、当該入力されたテキストが特定の検索対象のみについて記述しているものである場合は、前記抽出した感性表現の全てを当該特定の検索対象に結び付け、又は当該入力されたテキストが検索対象を特定しないものである場合は、前記抽出した感性表現を所定の検索対象リスト中の各検索対象に当該テキスト中での当該検索対象と感性表現との共起情報や係り受け関係情報を利用して結び付ける検索対象情報抽出部と、
結び付けられた検索対象と感性表現とを入力とし、前記感性表現データベースを用いて検索対象に対する前記感性表現が表すイメージの種類を示す側面情報毎の感性情報を生成し、検索対象データベースに格納する感性情報生成部とを備えた感性情報抽出装置、
並びに、
検索対象に対する感性表現が表すイメージの種類を示す側面情報毎の感性情報を少なくとも格納した検索対象データベースを利用して情報検索を行う感性検索装置であって、
感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースと、
検索条件を受け付ける条件入力部と、
前記受け付けた検索条件と前記感性表現データベースとを用いて、前記検索対象データベースの前記検索条件に感性的に近い検索を行う検索部と、
前記検索結果を予め定められた形式で出力する結果出力部とを備えた感性検索装置、
を提案する。
本発明によれば、テキストから検索対象についての感性情報を抽出してデータベース化し、このデータベースを利用して感性表現と検索対象との感性的な距離の計算を行い、その距離を用いて情報検索を行うことにより、感性表現を入力するだけで結果が得られる感性的な検索が可能となるとともに、対象に関するメタデータなどを人手で付与する必要が無く、その分省力化でき、運用コストを低減できる(課題(1)の解消)。
また、本発明によれば、検索対象の感性情報を生成する際と、実際に感性表現を用いて検索を行う際の両方において、感性表現が検索対象のどの側面に関するものなのかを考慮することで、異なる側面の特徴がノイズとなるのを避けることができ、検索精度の向上につながる(課題(2)(3)の解消)。
本発明の感性情報抽出装置および感性検索装置の概要を示す構成図 感性表現データベースの一例を示す説明図 検索対象データベースの一例を示す説明図 感性情報抽出部の実施の形態の一例を示す構成図 感性情報抽出部における感性情報抽出処理を示す流れ図 感性検索部の実施の形態の一例を示す構成図 感性検索部における感性検索処理を示す流れ図 感性情報抽出部での具体的な処理のようすの一例を示す説明図 感性情報抽出部での具体的な処理のようすの他の例を示す説明図
以下、本発明を図示の実施の形態により詳細に説明する。
図1は本発明の感性情報抽出装置および感性検索装置の概要を示すもので、感性情報抽出装置は感性表現データベース(DB)1、検索対象データベース(DB)2および感性情報抽出部3から構成され、感性検索装置は感性表現DB1、検索対象DB2および感性検索部4から構成される。
<感性表現データベース>
感性表現DB1は、感性表現に対する感性情報および当該感性表現が属する側面情報を少なくとも格納したデータベースであり、各レコードは感性表現IDと、感性情報と、側面情報とを少なくとも有する。感性表現DB1は、後述するように、感性情報抽出部3でテキストから抽出される感性表現や感性検索部4で検索条件として入力される感性表現に、感性情報および側面情報を付与するために用いられる。
感性表現IDは、各感性表現を一意に識別するためのIDであり、例えば感性表現の標準形を用いることができる。この際、いくつかの感性表現に同じ感性表現IDを付与すれば、複数の感性表現のイメージをまとめて一つの感性情報として表現することも可能となる。
感性情報は、感性表現が有するイメージを何らかの定量的な値で表したものであり、例えば感性表現同士の共起情報を用いて作成した単語ベクトルを用いても良い。
側面情報は、「外見的特長」、「容姿」、「性格」など、感性表現が表すイメージの種類を示す情報であり、既存のオントロジ等の予め定めた分類体系に従い、1つの感性表現に対して少なくとも1つの側面情報を付与するものとする。
図2は感性表現データベースの一例を示すもので、本例では感性表現IDとして感性表現の標準形を用いている。また、本例では、感性情報は予め定められた次元数を有するベクトル空間の各次元の軸(感性軸)に対して予め定められた値を有する感性ベクトルとする。ここで、感性ベクトルの次元数は7であり、第一次元の軸=美しさ(より美しいほど値が大きい)、第二次元の軸=静かさ、…、第7次元の軸=強さと定めているものとする。また、本例では、側面情報として日本語語彙大系の一般名詞意味属性体系のカテゴリ(高級な,柔らかな:「品質」、明るい:「性格」など)を利用する。但し、以下の説明においては、分かり難いカテゴリ名を便宜上変更してある場合がある。
<検索対象データベース>
検索対象DB2は、後述するように、感性情報抽出部3から出力される、検索対象に対する側面情報毎の感性情報を少なくとも格納したデータベースであり、各レコードは検索対象IDと、少なくとも1つの側面情報と、側面情報毎の感性情報とを少なくとも有する。検索対象DB2は、後述するように、感性検索部4における検索の際に感性表現DB1とともに参照され、検索結果を得るために用いられる。
検索対象IDは、各検索対象を一意に識別するためのIDであり、例えば検索対象の標準形を用いることができる。側面情報は、検索対象が有するイメージの種類を示す、感性表現DB1で用いられるものと同様な情報である。感性情報は、検索対象が有するイメージを側面情報毎に何らかの定量的な値で表したものであり、感性表現DB1と同じ表現形式を用いるものとする。
図3は検索対象データベース2の一例を示すもので、本例では検索対象IDとして検索対象の標準形を用いている。また、本例では、側面情報として図2の感性表現DB1の場合と同様な情報を用いている。また、本例では、感性情報として図2の感性表現DB1の感性情報と同じ次元数および軸を有する感性ベクトルを用いている。
図3の「アメリカン・ショートヘア」を例に取ると、[品質][外見的特長][善意][人柄]の4つの側面情報毎にその感性情報が生成されており、これにより異なった側面のイメージが混ざるのを避けている。図3において側面情報の後に書かれている感性表現は、各側面情報に属する感性表現の例である。
<感性情報抽出部3>
感性情報抽出部3は、図示しない入力手段から直接入力され又は記憶手段から読み出されて入力され又は通信媒体を介して他の装置等から入力されたテキストの集合を入力とし、検索対象単位の感性情報を生成して検索対象DB2に出力するもので、図4に示すように検索対象情報抽出部31および感性情報生成部32からなる。
検索対象情報抽出部31は、入力されたテキストの集合から感性表現を抽出し、抽出した感性表現を検索対象に結び付けて出力する。
感性情報生成部32は、感性表現抽出部31で結びつけられた検索対象と感性表現とを入力とし、感性表現DB1を用いて各検索対象に対する側面情報毎の感性情報を生成し、検索対象DB2に格納する。
図5は感性表現抽出部3における感性情報抽出処理の流れを示すもので、以下、その動作を詳細に説明する。
(ステップS1)検索対象情報抽出部31において、入力されたテキストの集合から、検索対象のイメージを表す感性表現を抽出し、抽出した感性表現を予め定められた方法に従って検索対象に結び付け、ステップS32へ進む。
感性表現とは、ある対象に関する印象や感じ方を表す、「もの静か」「かっこいい」「しっかりした」「クール」等の表現である。
テキストからの感性表現の抽出は、周知の形態素解析処理(単語情報を生成)を含む言語解析処理を行った後、表記、品詞、読み、単語境界等の単語情報を利用したルール等を用いたり、既存技術、例えば特開2008−140359号公報(「評価情報抽出装置、評価情報抽出方法およびそのプログラム」)記載の評価表現抽出部の処理を利用したりすることにより可能である。
また、抽出した感性表現を検索対象に結び付ける方法としては、テキストとして明確に特定の検索対象のみについて書かれているもの(例:図鑑など)が利用できる場合は、テキスト中に出現する感性表現の全てを当該特定の検索対象に結び付けることができる。またそういったテキストが利用できない場合でも、検索対象の名称リスト(対象語リスト)があれば、当該リスト中の各検索対象について、テキスト中での当該検索対象と感性表現との共起情報や係り受け関係情報を利用する手法の他、関係抽出技術(例えば、特開2008−225565号公報「相互に関係する固有表現の組抽出装置及びその方法」)を利用するなどにより同様の処理が可能であり、任意の手法を選択することができる。
(ステップS2)感性情報生成部32において、検索対象情報抽出部31で作成された検索対象とそれに結び付けられた感性表現とから、各感性表現の側面情報毎に検索対象の感性情報を生成し、結果を検索対象DB2へ格納する。
検索対象の感性情報は、当該検索対象に結び付けられた感性表現それぞれの感性情報と側面情報とを感性表現DB1から得て、側面情報が同じ感性情報毎(感性情報を構成する感性ベクトル毎)にその値の平均を取ることで当該側面情報の感性情報を計算し、これを全ての側面情報単位で行う。平均を取る際には、検索対象と感性表現との共起頻度などにより重み付けを行っても良い。
<感性検索部4>
感性検索部4は、図示しない入力手段から直接入力され又は記憶手段から読み出されて入力され又は通信媒体を介して他の装置等から入力された検索条件を入力とし、検索結果を出力するもので、図6に示すように条件入力部41、検索部42および結果出力部43からなる。
条件入力部41は、入力された検索条件を受け付け、解釈する。
検索部42は、前記検索条件と感性表現DB1とを用いて、検索対象DB2の検索、ここでは検索条件に感性的に近い検索対象の検索を行う。
結果出力部43は、前記検索結果を予め定められた形式で表示装置の表示画面等に出力する。
図7は感性検索部4における感性検索処理の流れを示すもので、以下、その動作を詳細に説明する。
(ステップS11)条件入力部41において、検索条件として少なくとも1つの感性表現を取得し、S12へ進む。この際、検索条件の他に提示方法(上位X件のみ表示する、距離が設定した閾値以内である検索結果を表示する、等)を入力しても良い。
検索条件の入力形式としては、様々な方法が考えられる。例えば、複数の感性表現を入力可能とすることも可能である。また、特定の用途に用いる感性検索を行うために、検索条件の一部は固定(例えば、感性表現の一つを「あっさり」に指定する等)として予め保持し、任意に入力可能な検索条件のみ、グラフィカルユーザインタフェース等を用いてユーザに入力させても良い。
以後、検索条件は1単語として説明するが、2単語以上であった場合は(S14)において全ての感性表現についての側面情報を得てその論理積をとった後、感性情報抽出部3の(S2)と同様の方法でその側面情報毎に感性情報を足し合わせ、平均を取ることで検索条件の感性情報を作成するものとする。
(ステップS12)検索部42において、入力された検索条件である感性表現が感性表現DB1に登録されているかないか否か調べ、登録されていればS14へ、登録されていなければS13へ進む。
(ステップS13)結果出力部43において、感性検索ができないため、結果が無いことを示すメッセージを表示する。または、代替としてWebのキーワード検索を行った結果などを表示しても良い。
(ステップS14)検索部42において、感性表現DB1から、検索条件として入力された感性表現に対応する感性情報Xおよび側面情報Yを取り出し、S15へ進む。
(ステップS15)検索対象DB2から前記側面情報Yを含むレコードを検索し、当該レコードの感性情報と前記感性情報Xとの間の距離を計算し、結果出力部43へ出力してS16へ進む。
感性情報を図2、図3のようにベクトルで表現した場合、感性的に近いかどうかを判定するための距離計算は、検索条件として入力された感性表現に対応する感性情報Xを表す感性ベクトルと検索対象DB2中の感性情報を表す感性ベクトルとの間の距離をユークリッド距離、コサイン類似度などの任意の距離尺度を用いて行うことができる。
(ステップS16)結果出力部43において、距離が近いレコード順に検索対象IDその他の情報を並べて画面等に出力し、終了する。
以下、前述した実施の形態における具体的な処理例、ここではペットの検索を対象とした場合を例に取って詳細に説明する。なお、検索部42における検索条件と検索対象DB2に登録された検索対象との感性的な距離の計算にはコサイン距離を用いるものとする。また、検索対象情報抽出部31において使用するテキストは、(1)明確に検索対象のみについて書かれている場合と、(2)そうでない場合との両方について説明する。
<感性情報抽出部3で行う処理>
(1)テキストが検索対象について書かれている場合
テキスト中に出現する感性表現の全てを検索対象に結び付けることができる場合のペット検索(入力した感性表現からペットを検索)を実現するための検索対象データベースの作成方法の一例は以下になる。
(ステップS1)検索対象情報抽出部31へのある時点(文書ID=100の時)での入力の一例を図8(a)に示す。(a)テキスト文書は、文書メタ情報としてペット名、文書IDを有するテキストの例である。テキスト解析結果の例が図8(b)の下線を除く部分であり、テキストから感性表現を抽出した結果が図8(b)の下線部分となる。
テキストから抽出した感性表現は、メタ情報にあるペット名に結び付けて保持する。同一検索対象に関するテキストが複数ある場合は、各テキストから抽出した感性表現を検索対象毎にまとめておく。ここでの抽出内容の例を図8(c)に示す。図8の例のように検索対象が「アメリカン・ショートヘア」であった場合、「力強い」、「やさしい」などの感性表現は文書ID=100以外のテキストからも抽出されており、(c)の抽出総数に反映されている。S2へ進む。
(ステップS2)感性情報生成部32において、感性表現DB1から、S1で抽出した感性表現に対応する感性情報および側面情報を得て、側面情報毎に感性情報を生成する。全てのテキストから感性表現を抽出した結果、検索対象が「アメリカン・ショートヘア」である全てのレコードが図8(c)にある4レコードのみだったとすると、検索対象「アメリカン・ショートヘア」の感性ベクトルは、その各感性表現「ふっくら」、「力強い」、「がっしり」、「やさしい」に対応する感性情報および側面情報を感性表現DB1(図2)より得て、同じ側面に関する感性表現の感性情報を足し合わせ、平均を取ることで計算する。またこの際、(c)の抽出回数で重み付けすることも可能である。
「ふっくら」の側面が[品質][外見的特長]、「力強い」および「がっしり」の側面が[外見的特長]、「優しい」の側面が[善意][人柄]であった場合、「アメリカン・ショートヘア」には[品質][外見的特長][善意][人柄]の合計4つの側面についての感性情報が生成される(図3の検索対象ID=「アメリカン・ショートヘア」の行を参照のこと。側面情報の欄にある感性表現は、抽出された感性表現のうち、同欄の側面情報に属するものが記されている。)。
同様にして他の全ての検索対象についても感性情報を求め、検索対象DB2に格納して終了する。検索対象とともに、以上の方法により求めた側面毎の感性情報を含む検索対象DB2を示したのが図3である。
(2)その他のテキストを用いる場合
検索対象について書かれたテキストが利用できない場合は、対象語リストが必要となる。
(ステップS1)検索対象情報抽出部31へのある時点(文書ID=300の時)での入力の一例を図9(a−1)に示す。(a−1)テキスト文書は、文書メタ情報として文書IDのみを有するテキストの例である。また、対象語リストを図9(a−2)に示す。これは「アメリカン・ショートヘア」、「シンガプーラ」など、検索対象となるペットの表記のリストであり、少なくとも検索対象の標準形である検索対象IDを持つ他、(a−2)ではテキスト中の表記ゆれを吸収するための表記ゆれ情報を保持するものである。
テキスト解析結果の例が図9(b)の下線を除く部分であり、テキストから感性表現を抽出した結果が図9(b)の下線部分となる。入力された対象語リストの検索対象またはその表記ゆれがテキスト中に出現する文の前後2文内に含まれる感性表現を、検索対象と結び付けて作成した抽出結果の例を図9(c)に示す(この例で処理中の対象語は「アメリカン・ショートヘア」)。S2へ進む。
(ステップ S2)以降の処理は(1)の場合と同様のため省略する。
<感性検索部4で行う処理>
上述したペット検索用の検索対象データベース(図3)の検索例を説明する。
(ステップS11)条件入力部で以下の4パターンの検索条件が入力されたとする(なお、[度量衡][装い,外見的特長,人柄]等の側面情報は説明の便宜上、記載したもので、実際に入力されるわけではない。)。
〈入力1〉小さい[度量衡]
〈入力2〉おしゃれ[装い,外見的特長,人柄]
〈入力3〉おしゃれ[装い,外見的特長,人柄],華やか[外見的特長]
〈入力4〉異国情緒あふれる
〈入力1〉の場合
(ステップS12)検索条件「小さい」は感性表現DB1に登録があるので、S14へ進む。
(ステップS14)感性表現DB1から「小さい」の感性情報および側面情報[度量衡]を得る。
(ステップS15)S14で得た感性情報と、検索対象DB2において側面が[度量衡]になっているレコードの感性情報との距離計算を行い、S16へ進む。
(ステップS16)S15での距離が近かった順に検索対象を出力する。検索対象DB2のレコードが図3にある「アメリカン・ショートヘア」、「シンガプーラ」、「シャム」、「ペルシャ」のみと仮定した場合、「小さい」との距離順に検索対象を並べると、「シンガプーラ」、「シャム」、「ペルシャ」となる(「アメリカン・ショートヘア」には側面が[度量衡]である感性情報がないため、検索結果には含まない。)。その3件の検索結果を画面に出力して終了する。
〈入力2〉の場合
(ステップS12)検索条件「おしゃれ」は感性表現DB1に登録があるので、S14へ進む。
(ステップS14)感性表現DB1から「おしゃれ」の感性情報および側面情報を得る。この際、側面情報は[装い,外見的特長,人柄]である。
(ステップS15)S14で得た感性情報と、検索対象DB2において側面が[装い,外見的特長,人柄]の3つのうちのどれかに該当するレコードの感性情報との距離計算を行い、S16へ進む。1検索対象で該当する側面が2つ以上ある場合は、最も距離が近い側面との距離を次のステップで使用する。
(ステップS16)S15での距離が近かった順に検索対象を出力する。検索対象DB2のレコードが図3にある「アメリカン・ショートヘア」、「シンガプーラ」、「シャム」、「ペルシャ」のみと仮定した場合、「おしゃれ」との距離順に検索対象を並べると、「シャム」、「ペルシャ」、「シンガプーラ」、「アメリカン・ショートヘア」となる。結果を画面に出力して終了する。
〈入力3〉の場合
(ステップS12)検索条件は「おしゃれ」と「華やか」の2単語であり、両方とも感性表現DB1に登録があるため、次のステップへ進む。複数の単語入力があり、感性表現DB1に登録が無い単語があった場合は、登録がある単語の情報のみを用いて次ステップ以降の処理を行う。
(ステップS14)感性表現DB1から「おしゃれ」と「華やか」の両単語の感性情報および側面情報を得る。まず、側面情報はそれぞれの単語の側面情報[装い,外見的特長,人柄]と[外見的特長]との論理積をとって、[外見的特長]のみとする。そして、両単語の側面情報が[外見的特長]である感性情報の平均を取ることで、検索条件の感性情報を計算する。S15へ進む。
(ステップS15)S14で得た感性情報と、検索対象DB2において側面が[外見的特長]であるレコードの感性情報との距離計算を行い、S16へ進む。
(ステップS16)S15での距離が近かった順に検索対象を出力する。検索対象DB2のレコードが図3にある「アメリカン・ショートヘア」、「シンガプーラ」、「シャム」、「ペルシャ」のみと仮定した場合、「おしゃれ」「華やか」との距離順に検索対象を並べると、「ペルシャ」、「シャム」、「アメリカン・ショートヘア」、「シンガプーラ」となる。結果を画面に出力して終了する。
〈入力4〉の場合
(ステップS12)検索条件は「異国情緒あふれる」であり、感性表現DB1に登録がないため、S13へ進む。
(ステップS13)感性検索ができないため、結果が無いことを示すメッセージ、例えば「残念ながら感性検索ができませんでした。通常の検索結果を表示します。」を画面に出力して終了する。
なお、本発明は、周知のコンピュータに媒体もしくは通信回線を介して、図1、図4、図6の構成図に示された機能を実現するプログラムあるいは図5、図7の流れ図に示された手順を備えるプログラムをインストールすることによっても実現可能である。
1:感性表現データベース(DB)、2:検索対象データベース(DB)、3:感性情報抽出部、4:感性検索部、31:検索対象情報抽出部、32:感性情報生成部、41:条件入力部、42:検索部、43:結果出力部。

Claims (11)

  1. テキストの集合から感性情報を抽出し、検索対象データベースを作成する感性情報抽出装置であって、
    感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースと、
    入力されたテキストの集合から感性表現を抽出し、当該入力されたテキストが特定の検索対象のみについて記述しているものである場合は、前記抽出した感性表現の全てを当該特定の検索対象に結び付ける検索対象情報抽出部と、
    結び付けられた検索対象と感性表現とを入力とし、前記感性表現データベースを用いて検索対象に対する前記感性表現が表すイメージの種類を示す側面情報毎の感性情報を生成し、検索対象データベースに格納する感性情報生成部とを備えた
    ことを特徴とする感性情報抽出装置。
  2. テキストの集合から感性情報を抽出し、検索対象データベースを作成する感性情報抽出装置であって、
    感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースと、
    入力されたテキストの集合から感性表現を抽出し、当該入力されたテキストが検索対象を特定しないものである場合は、前記抽出した感性表現を所定の検索対象リスト中の各検索対象に当該テキスト中での当該検索対象と感性表現との共起情報や係り受け関係情報を利用して結び付ける検索対象情報抽出部と、
    結び付けられた検索対象と感性表現とを入力とし、前記感性表現データベースを用いて検索対象に対する前記感性表現が表すイメージの種類を示す側面情報毎の感性情報を生成し、検索対象データベースに格納する感性情報生成部とを備えた
    ことを特徴とする感性情報抽出装置。
  3. 感性情報生成部では、
    検索対象に結び付けられた感性表現それぞれの感性情報と側面情報とを、感性表現に対する感性情報であって予め定められた次元数を有するベクトル空間の各次元の軸に対して予め定められた値を有する感性ベクトルで表される感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースから得て、側面情報が同じ感性情報の感性ベクトル毎にその値の平均を取ることで当該側面情報の感性情報を生成する
    ことを特徴とする請求項1または2に記載の感性情報抽出装置。
  4. 検索対象に対する感性表現が表すイメージの種類を示す側面情報毎の感性情報を少なくとも格納した検索対象データベースを利用して情報検索を行う感性検索装置であって、
    感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースと、
    検索条件を受け付ける条件入力部と、
    前記受け付けた検索条件と前記感性表現データベースとを用いて、前記検索対象データベースの前記検索条件に感性的に近い検索を行う検索部と、
    前記検索結果を予め定められた形式で出力する結果出力部とを備えた
    ことを特徴とする感性検索装置。
  5. 検索部は、
    検索条件として入力された感性表現に対応する感性情報および側面情報を感性表現データベースから取り出し、検索対象データベースから同じ側面情報を含むレコードを検索し、当該レコードの感性情報と前記検索条件として入力された感性表現に対応する感性情報との間の距離を計算する
    ことを特徴とする請求項4に記載の感性検索装置。
  6. 検索条件として入力された感性表現が複数の場合、各感性表現に対応する感性情報および側面情報を、感性表現に対する感性情報であって予め定められた次元数を有するベクトル空間の各次元の軸に対して予め定められた値を有する感性ベクトルで表される感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースから取り出し、側面情報の論理積をとった後、側面情報が同じ感性情報の感性ベクトル毎にその値の平均を取ることで検索条件としての感性情報を作成する
    ことを特徴とする請求項5に記載の感性検索装置。
  7. テキストの集合から感性情報を抽出し、検索対象データベースを作成する感性情報抽出方法であって、
    検索対象情報抽出部が、入力されたテキストの集合から感性表現を抽出し、当該入力されたテキストが特定の検索対象のみについて記述しているものである場合は、前記抽出した感性表現の全てを当該特定の検索対象に結び付けるステップと、
    感性情報生成部が、結び付けられた検索対象と感性表現とを入力とし、感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースを用いて検索対象に対する前記感性表現が表すイメージの種類を示す側面情報毎の感性情報を生成し、検索対象データベースに格納するステップとを含む
    ことを特徴とする感性情報抽出方法。
  8. テキストの集合から感性情報を抽出し、検索対象データベースを作成する感性情報抽出方法であって、
    検索対象情報抽出部が、入力されたテキストの集合から感性表現を抽出し、当該入力されたテキストが検索対象を特定しないものである場合は、前記抽出した感性表現を所定の検索対象リスト中の各検索対象に当該テキスト中での当該検索対象と感性表現との共起情報や係り受け関係情報を利用して結び付けるステップと、
    感性情報生成部が、結び付けられた検索対象と感性表現とを入力とし、感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースを用いて検索対象に対する前記感性表現が表すイメージの種類を示す側面情報毎の感性情報を生成し、検索対象データベースに格納するステップとを含む
    ことを特徴とする感性情報抽出方法。
  9. 検索対象に対する感性表現が表すイメージの種類を示す側面情報毎の感性情報を少なくとも格納した検索対象データベースを利用して情報検索を行う感性検索方法であって、
    条件入力部が、検索条件を受け付けるステップと、
    検索部が、前記受け付けた検索条件と、感性表現に対する感性情報および当該感性表現が表すイメージの種類を示す側面情報を少なくとも格納した感性表現データベースとを用いて、前記検索対象データベースの前記検索条件に感性的に近い検索を行うステップと、
    結果出力部が、前記検索結果を予め定められた形式で出力するステップとを含む
    ことを特徴とする感性検索方法。
  10. コンピュータに、請求項7または8に記載の感性情報抽出方法の各処理ステップを実行させるためのプログラム。
  11. コンピュータに、請求項9に記載の感性検索方法の各処理ステップを実行させるためのプログラム。
JP2009195093A 2009-08-26 2009-08-26 感性情報抽出装置、感性検索装置、その方法およびプログラム Active JP5311488B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009195093A JP5311488B2 (ja) 2009-08-26 2009-08-26 感性情報抽出装置、感性検索装置、その方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009195093A JP5311488B2 (ja) 2009-08-26 2009-08-26 感性情報抽出装置、感性検索装置、その方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2011048527A JP2011048527A (ja) 2011-03-10
JP5311488B2 true JP5311488B2 (ja) 2013-10-09

Family

ID=43834795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009195093A Active JP5311488B2 (ja) 2009-08-26 2009-08-26 感性情報抽出装置、感性検索装置、その方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5311488B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018122919A1 (ja) * 2016-12-26 2018-07-05 三菱電機株式会社 感性表現語による検索装置
JP6534767B1 (ja) * 2018-08-28 2019-06-26 本田技研工業株式会社 データベース作成装置及び検索システム
JP2022137568A (ja) 2021-03-09 2022-09-22 本田技研工業株式会社 情報管理システム
KR102500164B1 (ko) * 2022-06-15 2023-02-17 주식회사 스타일여신 객체의 감성 정보를 자동으로 추출하는 감성정보 분석 시스템 및 이를 활용한 감성정보 분석 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3314117B2 (ja) * 1994-09-19 2002-08-12 シャープ株式会社 感性入力用最適文書ファイル抽出機構
JP2001022778A (ja) * 1999-07-09 2001-01-26 Fuji Xerox Co Ltd 検索装置及び検索方法
JP3408998B2 (ja) * 1999-10-01 2003-05-19 株式会社ジャストシステム データ検索装置、及びデータ検索用プログラムが記憶された記憶媒体
JP2003178083A (ja) * 2002-12-06 2003-06-27 Hideki Nishimoto 文献内容判別装置、文献、帯紙、文献内容判別プログラム
JP2005284776A (ja) * 2004-03-30 2005-10-13 Honda Motor Co Ltd テキストマイニング装置及びテキスト分析方法
JP2007018234A (ja) * 2005-07-07 2007-01-25 National Institute Of Information & Communication Technology 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置
JP4576397B2 (ja) * 2006-11-08 2010-11-04 日本電信電話株式会社 評価情報抽出装置、評価情報抽出方法およびそのプログラム

Also Published As

Publication number Publication date
JP2011048527A (ja) 2011-03-10

Similar Documents

Publication Publication Date Title
WO2022227866A1 (zh) 信息展示的方法、装置以及非易失性计算机存储介质
CN102890701B (zh) 情感数据使用的系统和方法
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP2005182280A (ja) 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
CN113157727B (zh) 提供召回结果的方法、设备和存储介质
JP5311488B2 (ja) 感性情報抽出装置、感性検索装置、その方法およびプログラム
JP5204203B2 (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2018010570A (ja) 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム
JP6821528B2 (ja) 評価装置、評価方法、ノイズ除去装置、およびプログラム
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP2000163437A (ja) 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
JP2001084256A (ja) データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
KR20090126862A (ko) 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체
JP5326781B2 (ja) 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
US11495225B2 (en) Response device, response method, and storage medium
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP5137134B2 (ja) 感性情報抽出・検索装置、その方法およびプログラム
JP2022178243A (ja) 画像生成装置、画像生成方法およびプログラム
JP2003108582A (ja) 類義語抽出方法および文書検索装置
JP5289468B2 (ja) 回答検索装置、方法、及びプログラム
Gala et al. Product Sentiment Trend Prediction
KR102251513B1 (ko) 기계학습을 이용한 셀럽의 소셜미디어 정보 기반 학습용 콘텐츠 생성 방법 및 장치
JP2008171243A (ja) コンテンツ検索装置および方法並びにプログラム
JP2007087252A (ja) 情報分析方法、情報分析プログラム、それが記録された記録媒体、情報分析装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101215

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110613

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120709

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130626

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130627

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5311488

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350