JP2002358323A - 検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索プログラム - Google Patents

検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索プログラム

Info

Publication number
JP2002358323A
JP2002358323A JP2002008218A JP2002008218A JP2002358323A JP 2002358323 A JP2002358323 A JP 2002358323A JP 2002008218 A JP2002008218 A JP 2002008218A JP 2002008218 A JP2002008218 A JP 2002008218A JP 2002358323 A JP2002358323 A JP 2002358323A
Authority
JP
Japan
Prior art keywords
search
impression expression
noun phrase
impression
expression word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002008218A
Other languages
English (en)
Other versions
JP4129132B2 (ja
Inventor
Tomoyo Fukunaga
知代 福永
Makoto Sano
真 佐野
Atsushi Takato
淳 高藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2002008218A priority Critical patent/JP4129132B2/ja
Publication of JP2002358323A publication Critical patent/JP2002358323A/ja
Application granted granted Critical
Publication of JP4129132B2 publication Critical patent/JP4129132B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザに明確な検索要求が無い場合や、検索
要求文が思いつかない場合に、検索要求文の作成を支援
する検索入力部生成装置、検索結果提示装置などを提供
すること。 【解決手段】 検索要求文生成装置に関しては、検索情
報付属文書データをマージしてそこから印象表現語と名
詞句のセットを取り出す。重複頻度の高い名詞を評価視
点として採用し、該評価視点を親、該評価視点と結びつ
いた印象表現語を子としたツリー構造をユーザに提示す
る。ユーザは、該ツリー構造から印象表現語と名詞句の
セットを選択することにより、検索入力文を生成するこ
とができる。結果表示装置においては、印象表現語と名
詞句のセットに関して検索順位1位のものと2位以下の
ものの差分を表示する。更に、検索入力文や検索対象に
名詞句に結びつかない印象表現語があった場合、適切な
名詞句を当該印象表現語に付加して印象表現語と名詞句
のセットを生成し、これを検索に用いる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索要求文生成装
置、検索結果提示装置、検索要求文生成方法、検索結果
提示方法、検索要求文生成プログラム、検索結果提示プ
ログラム、データ検索装置、データ検索方法、及びデー
タ検索プログラムに関し、例えば、イメージ情報検索を
行うものに関する。
【0002】
【従来の技術】画像や映像などのイメージデータを検索
する方法は各種提案されており、その1つに印象表現語
などをキーとして検索するものがある。例えば、本出願
人の提案による特願平11−281201(未公開)の
データ検索装置がある。この検索装置は、イメージ情報
の検索にあたって、検索キーとして印象表現、程度副
詞、及び客観的な特徴条件を文章によって入力する手法
を基本とするものである。
【0003】
【発明が解決しようとする課題】しかし、この手法は、
以下のような問題を含んでいる。まず、以下のような場
合に適切な検索要求文の作成が困難である。例えば、ユ
ーザが自身が欲する明確な主観的要求を把握していない
場合、曖昧にしか自らの要求をイメージできていない場
合、文章によって検索要求を表わすことは困難である。
【0004】また、ユーザがコンテンツ内において対象
となっている事項についてどのような主観的特徴を持つ
ものであるのか思いつかない場合、即ちユーザが対象コ
ンテンツについて詳細な情報を得ていない場合、そのコ
ンテンツで対象となっているものがどのような主観的イ
メージを持ちうるのか分らない場合がある。例えば、ワ
インコンテンツにおいて、ワインなどの酒類に詳しくな
いユーザはワインを選択する際の指標である「甘い」、
「フルーティーな」などといたった印象語が思い浮かば
ない場合がある。更に、例えばインターネットの検索サ
イトなどのキーワード検索に親しんでいるユーザの場
合、名詞句は思いついてもフィーリングに関わる言葉は
思いつきにくいこともある。
【0005】この他にも、例えば、印象表現語がかかっ
ている名詞句(評価視点)が不明確である場合にも問題
が生じる。即ち、印象表現語のみを検索キーとする場
合、ユーザが暗黙的にその印象表現語の対象を認識して
おり、システムがそのユーザの意に対して適切な結果が
出せない場合がある。例えば、図25に示したように、
ホテルコンテンツにおいて、ユーザが検索要求として
「部屋が広い」ということを暗黙のうちに認識、要求し
たとしてもシステム側は、「広い」のみからユーザが意
図しない「バスルームが広い」や「エントランスが広
い」といった文章まで取得してしまう。
【0006】また、例えば、特願平11−281201
のデータ検索装置は、より類似性の高いイメージ情報順
に検索結果として出力するが、この検索結果の表示につ
いても次にような問題を含んでいた。まず、どの部分が
ヒットしているのかが分りにくかった。キーワード検索
とは違い、似た要素をもつ印象表現語を含むデータもヒ
ットするため、字面が一致しているところをハイライト
するだけでは、どの語によってヒットしたのかが分りに
くい。
【0007】また、検索結果は、一見して理解できにく
いものであり、ユーザの納得感が低かった。即ち、字面
の一致に着目してもそれぞれの特徴や違いをつかむこと
ができないため、納得感が低くなる。また、検索した結
果、ユーザの意にそぐわなかった場合又は該当する結果
が無い場合、再検索が必要となるが、再入力する際、同
じ意味を持ち、かつ該当する結果が表示されるような検
索要求文はなかなか思いつきにくく、ユーザの負担とな
っていた。
【0008】そこで、本発明の目的は、ユーザに明確な
検索要求が無い場合や、検索要求文が思いつかない場合
に、検索要求文の作成を支援する検索入力部生成装置、
検索要求文生成方法、検索要求文生成プログラムを提供
すること、及び検索要求と結果の一致を明確にすること
ができる検索結果提示装置、検索結果提示方法、検索結
果提示プログラムなどを提供することである。
【0009】
【課題を解決するための手段】本発明は、前記目的を達
成するために、複数検索対象に含まれた文書をマージす
るマージ手段と、前記マージ手段にてマージされたマー
ジ文書から印象表現語と前記印象表現語に結びついた名
詞句をセットで抽出するセット抽出手段と、前記セット
抽出手段にて抽出された前記印象表現語と前記名詞句の
表記を統制する統制手段と、前記統制手段にて統制され
た前記印象表現語と名詞句のセットから、前記各名詞が
重複している頻度が高い名詞句を特定する特定手段と、
前記特定手段にて特定された名詞句と、当該名詞句と結
びついた前記印象表現語を対応付けて提示する提示手段
と、前記提示手段にて提示された前記名詞句と前記名詞
句に対応付けられた前記印象表現語を選択する選択手段
と、前記選択手段にて選択された前記名詞句と前記印象
表現語のセットを用いて検索要求文を生成する要求文生
成手段と、を具備したことを特徴とする検索要求文生成
装置を提供する(第1の構成)。また、第1の構成の前
記提示手段は、前記特定手段にて特定された名詞句を親
とし、当該名詞句に対応した印象表現語を子としたツリ
ー構造として提示するように構成することができる(第
2の構成)。また、本発明は、前記目的を達成するため
に、検索順位を付けられた検索データを取得する検索結
果取得手段と、前記検索結果取得手段にて検索データに
含まれる文書データを取得する文書データ取得手段と、
前記文書データ取得手段にて取得した文書データから前
記検索データごどに印象表現語と前記印象表現語に結び
ついた名詞句をセットで抽出する抽出手段と、前記抽出
手段にて抽出された前記印象表現語と前記名詞句を統制
する統制手段と、前記統制手段にて統制された前記印象
表現語と前記名詞句のセットを用いて、前記検索順位が
2位以下の検索データに含まれる前記印象表現語と前記
名詞句のセットから前記検索順位が1位の検索データに
含まれる前記印象表現語と前記名詞句のセットを除いた
前記印象表現語と前記名詞句のセットを前記検索順位第
2位以下の検索データごとに取得する差分手段と、前記
検索順位第2位以下の検索データに関して、前記差分手
段にて取得した前記印象表現語と前記名詞句のセットを
提示する提示手段と、を具備したことを特徴とする検索
結果提示装置を提供する(第3の構成)。また、第3の
構成の前記抽出手段は、前記印象表現語と前記名詞句と
結びついた程度副詞がある場合は、当該程度副詞をセッ
トとして取り出すように構成することができる(第4の
構成)。また、第3の構成は、前記文書データに含まれ
る程度副詞、前記印象表現語、又は前記印象表現語と結
びつく名詞句のうち、少なくとも1つを強調して提示す
る強調提示手段と、前記文書データのうち、程度副詞、
前記印象表現語、又は前記印象表現語と結びついた名詞
句のうち、少なくとも1つの行を用いて当該文書データ
の要約を提示する要約提示手段とのうち、少なくとも1
つを更に備えるように構成することができる(第5の構
成)。また、前記第5の構成の前記提示手段、又は前記
強調提示手段、又は前記要約手段のうちの少なくとも1
つの提示手段にて提示された程度副詞、又は印象表現
語、又は前記印象表現語に結びついた名詞句を用いて検
索要求文を作成するように構成することができる(第6
の構成)。また、本発明は、前記目的を達成するため
に、複数検索対象に含まれた文書をマージする第1のス
テップと、前記第1のステップにてマージされたマージ
文書から印象表現語と前記印象表現語に結びついた名詞
句をセットで抽出する第2のステップと、前記第2のス
テップにて抽出された前記印象表現語と前記名詞句の表
記を統制する第3のステップと、前記第3のステップに
て統制された前記印象表現語と名詞句のセットから、前
記各名詞が重複している頻度が高い名詞句を特定する第
4のステップと、前記第4のステップにて特定された名
詞句と、当該名詞句と結びついた前記印象表現語を対応
付けて提示する第5のステップと、前記第5のステップ
にて提示された前記名詞句と前記名詞句に対応付けられ
た前記印象表現語を選択する第6のステップと、前記第
6のステップにて選択された前記名詞句と前記印象表現
語のセットを用いて検索要求文を生成する第7のステッ
プと、を備えたことを特徴とする検索要求文生成方法を
提供する。また、本発明は、前記目的を達成するため
に、検索順位を付けられた検索データを取得する第1の
ステップと、前記第1のステップにて検索データに含ま
れる文書データを取得する第2のステップと、前記第2
のステップにて取得した文書データから前記検索データ
ごどに印象表現語と前記印象表現語に結びついた名詞句
をセットで抽出する第3のステップと、前記第3のステ
ップにて抽出つれた印象表現語と前記名詞句を統制する
第4のステップと、前記第4のステップにて統制された
前記印象表現語と前記名詞句を用いて、前記検索順位が
2位以下の検索データに含まれる前記印象表現語と前記
名詞句のセットから前記検索順位が1位の検索データに
含まれる前記印象表現語と前記名詞句のセットを除いた
前記印象表現語と前記名詞句のセットを前記検索順位第
2位以下の検索データごとに取得する第5のステップ
と、前記検索順位第2位以下の検索データに関して、前
記第5のステップにて取得した前記印象表現語と前記名
詞句のセットを提示する第6のステップと、から構成さ
れたことを特徴とする検索結果提示方法を提供する。更
に、本発明は、前記目的を達成するために、複数検索対
象に含まれた文書をマージするマージ機能と、前記マー
ジ機能にてマージされたマージ文書から印象表現語と前
記印象表現語に結びついた名詞句をセットで抽出するセ
ット抽出機能と、前記セット抽出機能にて抽出された前
記印象表現語と前記名詞句の表記を統制する統制機能
と、前記統制機能にて統制された前記印象表現語と名詞
句のセットから、前記各名詞が重複している頻度が高い
名詞句を特定する特定機能と、前記特定機能にて特定さ
れた名詞句と、当該名詞句と結びついた前記印象表現語
を対応付けて提示する提示機能と、前記提示機能にて提
示された前記名詞句と前記名詞句に対応付けられた前記
印象表現語を選択する選択機能と、前記選択機能にて選
択された前記名詞句と前記印象表現語のセットを用いて
検索要求文を生成する要求文生成機能と、をコンピュー
タに実現するための検索要求文生成プログラム、又は、
検索要求文生成プログラムを記憶したコンピュータが読
み取り可能な記憶媒体を提供する。更に、本発明は、前
記目的を達成するために、検索順位を付けられた検索デ
ータを取得する検索結果取得機能と、前記検索結果取得
機能にて検索データに含まれる文書データを取得する文
書データ取得機能と、前記文書データ取得機能にて取得
した文書データから前記検索データごどに印象表現語と
前記印象表現語に結びついた名詞句をセットで抽出する
抽出機能と、前記抽出機能にて抽出された前記印象表現
語と前記名詞句を統制する統制機能と、前記統制機能に
て統制された前記印象表現語と前記名詞句のセットを用
いて、前記検索順位が2位以下の検索データに含まれる
前記印象表現語と前記名詞句のセットから前記検索順位
が1位の検索データに含まれる前記印象表現語と前記名
詞句のセットを除いた前記印象表現語と前記名詞句のセ
ットを前記検索順位第2位以下の検索データごとに取得
する差分機能と、前記検索順位第2位以下の検索データ
に関して、前記差分機能にて取得した前記印象表現語と
前記名詞句のセットを提示する提示機能と、をコンピュ
ータに実現するための検索結果提示プログラム、又は検
索結果提示プログラムを記憶したコンピュータが読み取
り可能な記憶媒体を提供する。また、本発明は、前記目
的を達成するために、印象表現語を含む検索条件文を取
得する検索条件文取得手段と、前記取得した検索条件文
に、名詞句と結びつかない印象表現語が存在した場合
に、予め設定されている印象表現語と名詞句の組合せか
らなるデータベースを用いて、当該印象表現語に名詞句
を結び付け、印象表現語と名詞句のセットを生成するセ
ット生成手段と、前記生成された印象表現語と名詞句の
セットを用いて検索要求文を生成する検索要求文生成手
段と、を具備したことを特徴とする検索要求文生成装置
を提供する(第7の構成)。また、第7の構成は、前記
取得した検索条件文中に、名詞句と結びつかない印象表
現語が存在した場合に、前記印象表現語に名詞句を結び
つけるか否かを判断する判断手段を更に具備し、前記判
断手段で、前記印象表現語に名詞句を結び付けないと判
断した場合、前記検索要求文生成手段は、前記印象表現
語から検索要求文を生成するように構成することができ
る(第8の構成)。また、本発明は、前記目的を達成す
るために、印象表現語と当該印象表現語と結びついた名
詞句を用いて生成された検索要求文を取得する検索要求
文取得手段と、検索対象に、名詞句と結びつかない印象
表現語がある場合に、予め設定されている印象表現語と
名詞句の組合せからなるデータベースを用いて当該印象
表現語に名詞句を結びつける結び付け手段と、前記取得
した検索要求文を用いて、前記結び付け手段で印象表現
語に名詞句を結びつけた検索対象を検索する検索実行手
段と、を具備したことを特徴とするデータ検索装置を提
供する(第9の構成)。また、第9の構成は、前記検索
対象に、名詞句と結びつかない印象表現語がある場合
に、当該印象表現語に名詞句を結びつけるか否かを判断
する判断手段を更に具備し、前記判断手段で、前記印象
表現語に名詞句を結び付けないと判断した場合に、前記
検索実行手段は、前記検索条件文に含まれる印象表現語
を用いて検索対象を検索するように構成することができ
る(第10の構成)。また、本発明は、検索条件文取得
手段と、セット生成手段と、検索要求文生成手段と、を
備えたコンピュータにおいて、前記検索条件文取得手段
で、印象表現語を含む検索条件文を取得する検索条件文
取得ステップと、前記セット生成手段で、前記取得した
検索条件文に、名詞句と結びつかない印象表現語が存在
した場合に、予め設定されている印象表現語と名詞句の
組合せからなるデータベースを用いて当該印象表現語に
名詞句を結び付け、印象表現語と名詞句のセットを生成
するセット生成ステップと、前記検索要求文生成手段
で、前記生成された印象表現語と名詞句のセットを用い
て検索要求文を生成する検索要求文生成ステップと、か
ら構成されたことを特徴とする検索要求文生成方法を提
供する。また、本発明は、前記目的を達成するために、
検索要求文取得手段と、結び付け手段と、検索実行手段
と、を備えたコンピュータにおいて、前記検索要求文取
得手段で、印象表現語と当該印象表現語と結びついた名
詞句を用いて生成された検索要求文を取得する検索要求
文取得ステップと、前記結びつけ手段で、検索対象に、
名詞句と結びつかない印象表現語がある場合に、予め設
定されている印象表現語と名詞句の組合せから成るデー
タベースを用いて当該印象表現語に名詞句を結びつける
結び付けステップと、前記検索実行手段で、前記取得し
た検索要求文を用いて、前記結び付け手段で印象表現語
に名詞句を結びつけた検索対象を検索する検索実行ステ
ップと、から構成されたことを特徴とするデータ検索方
法を提供する。また、本発明は、前記目的を達成するた
めに、印象表現語を含む検索条件文を取得する検索条件
文取得機能と、前記取得した検索条件文に、名詞句と結
びつかない印象表現語が存在した場合に、予め設定され
ている印象表現語と名詞句の組合せから成るデータベー
スを用いて当該印象表現語に名詞句を結び付け、印象表
現語と名詞句のセットを生成するセット生成機能と、前
記生成された印象表現語と名詞句のセットを用いて検索
要求文を生成する検索要求文生成機能と、をコンピュー
タに実現させるための検索要求分生成プログラムを提供
する。また、本発明は、前記目的を達成するために、印
象表現語と当該印象表現語と結びついた名詞句を用いて
生成された検索要求文を取得する検索要求文取得機能
と、検索対象に、名詞句と結びつかない印象表現語があ
る場合に、予め設定されている印象表現語と名詞句の組
合せから成るデータベースを用いて当該印象表現語に名
詞句を結びつける結び付け機能と、前記取得した検索要
求文を用いて、前記結び付け機能で印象表現語に名詞句
を結びつけた検索対象を検索する検索実行機能と、をコ
ンピュータに実現させるためのデータ検索プログラムを
提供する。
【0010】
【発明の実施の形態】(第1の実施の形態)以下、本発
明の第1の実施の形態について、図1から図15を参照
して詳細に説明する。図1は、第1の実施の形態に係る
検索要求文生成システムと検索結果提示システムが装備
されたデータ検索装置11の構成を示した図である。デ
ータ検索装置11は、一例としてイメージ情報検索を行
うものとするが、これに限定するものではなく、例え
ば、「広い」、「甘い」といった印象表現語(感性語)
を用いた検索装置に広く一般的に適用できるものであ
る。データ検索装置11は、中央制御部12、入出力部
16、モデム17記憶装置18などから構成されてる。
入出力部16は、例えば、キーボード、マイクロフォ
ン、マウスなどの入力装置や、ディスプレイ装置、プリ
ンタ、スピーカ、などの出力装置、或いは、磁気ディス
クドライブなどの入出力装置に接続している。そしてユ
ーザは、入力装置を介して検索要求文を入力したり、出
力装置を介して検索結果を取得することができる。更
に、ディスクドライブなどを使用して磁気ディスクなど
へデータの書き込み及び読み込みを行ったりすることが
できるようになっている。
【0011】記憶部18は、例えばハードディスクやそ
の他の不揮発性メモリなどによって構成された記憶装置
である。記憶部18は、検索要求文生成プログラム、検
索結果表示プログラムや、イメージ情報検索プログラム
などの検索プログラム、その他のプログラムが記憶され
たプログラム部19と、コンテンツデータなどの各種デ
ータがデータベース化された記憶されているデータ部2
0、後に説明する印象表現語(形容詞など)の活用形の
統制を行う際に使用する表記ゆれ統制辞書24、評価視
点(印象表現語に強く結びついた名詞句)を統制する際
に使用するシソーラス辞書25を含んでいる。
【0012】モデム17は、例えばインターネットなど
のネットワークを介してデータ検索装置11が外部と通
信をするための部分である。中央制御部12は、CPU
(Central Processing Unit)
13、ROM(Read Only Memory)1
4、RAM(Random Access Memor
y)15から構成されている。RAM15は、プログラ
ム部19のプログラムをロードしたり、CPU13にワ
ーキングメモリを提供したりする読み書き可能なメモリ
である。
【0013】ROM14は、データ検索装置11を動作
させるための基本的なプログラムやパラメータを記憶し
た読取専用のメモリである。CPU13は、ROM14
に記憶されたプログラムやRAM15にロードされたプ
ログラムなどに従って、各種の演算や判断を行うと共に
バスライン21を介して入出力部16、モデム17、記
憶装置18などとのデータの送受信、及びこれらの機器
の制御など行う部分である。
【0014】検索要求文生成システムと、検索結果表示
システムのうち、まず、検索要求文生成システムについ
て説明する。図2は、検索要求文生成システム37の構
成を示したブロック図である。検索要求文生成システム
37の構成要素のうち、表記ゆれ統制辞書24とシソー
ラス辞書25は、記憶装置18(図1)に記憶されてお
り、マージモジュール32、統制モジュール33、名詞
句頻度モジュール34、ソートモジュール35、クエリ
ーツール表示モジュール36は、プログラム部19に格
納されている検索要求文生成プログラムがRAM15に
ロードされ、ソフトウェア的に実現されたモジュールで
ある。入力手段31は、例えば、入出力部16に接続さ
れたキーボードやマウスであって、ユーザは、該キーボ
ードやマウスを用いて検索条件などを入力することがで
きる。
【0015】次に、検索要求文生成システム37の機能
を図3〜図10を用いながら説明する。マージモジュー
ル32は、入力手段から、入力データを取得すると、コ
ンテンツ内の全データをマージ(併合)し、印象表現語
と、該印象表現語と強く結びついている名詞句をセット
取り出す。また、例えば、「やや広い」とか、「かなり
甘い」といったように、程度副詞が印象表現語と結びつ
いている場合、これらの程度副詞も印象表現語と名詞句
と共に取り出しておく。なお、後に説明するクエリーツ
リーを作る場合においては、印象表現語と結びついた程
度副詞を用いる必要がないが、その他の処理では、印象
表現語と結びついた程度副詞がある場合は、これも取り
出しておく。ここで、印象表現語とは、「広い部屋」の
「広い」や「フルーティーなワイン」の「フルーティ
ー」のように、名詞句と結びついた、または単独の形容
詞又は形容動詞などであって、人間の印象や感性を表す
語句である。
【0016】図3は、マージモジュール32の機能を説
明するための図である。まず、コンテンツ内のデータd
ata1、data2、…を全てマージしてマージデー
タ41を生成する。そして、次にマージデータ41から
印象表現語と該印象表現語に強く結びついた名詞句をセ
ットで取り出し、印象表現語名詞句セットデータ42を
生成する。なお、これらの名詞句は印象の対象を意味
し、評価視点とも呼ばれる。図3の例では、マージデー
タ41の「部屋が広く」から印象表現語「広く」とこれ
に結びついた名詞句「部屋」がセットとして取り出さ
れ、印象表現語名詞句セットデータ42に登録されてい
る。同様に、「静かな環境で」から「静かな」/「環
境」のセットが、また、「部屋は広く」から「部屋は」
/「広く」のセットが取り出されている。
【0017】次に、統制モジュール33(図2)は、印
象表現語名詞句セットデータ42に取り出された印象表
現語と名詞句に対して統制を行う。まず、印象表現語
(形容詞、形容動詞など)の統制に関しては、これら形
容詞、形容動詞が活用形である場合は、これらを終止形
に統制する。また、表記揺れ辞書24を参照し、読みが
同じでかつ同義である漢字、ひらがな、カタカナを何れ
かの正規化表現(例えば、ひらがな、カタカナ表記を漢
字表記に揃えるなど、あらかじめ決めておいた標準的な
表記)へ統制する。次に、統制モジュール33は、シソ
ーラス辞書25を参照し、印象表現語名詞句セットデー
タ42の名詞句に対して表記統制を行う。この表記統制
は、名詞句に上位語がある場合は、上位語に揃え、同義
語があれば、正規化表現へ統制する。
【0018】図4は、統制モジュール33の機能を説明
するための図である。まず、統制モジュール33は、印
象表現語名詞句セットデータ42を取得し、図示しない
が、例えば、「広く」、「静かな」などの印象表現語を
終止形「広い」、「静かだ」などに統制する。次に、統
制モジュール33は、表記揺れ辞書24を用いて印象表
記ゆれの統制を行う。表記揺れの統制により、例えば、
「ひろい」、「ヒロイ」などは「広い」に、「あまい」
は「甘い」に、「臭い」、「クサイ」、「くさい」など
は、「臭い」にそれぞれ正規化表現に統制される。表記
揺れ辞書24には、このように、統制する必要のある表
記と、それらを統制した後の表記(正規化表現)をデー
タベースとして持っているものである。
【0019】次に、統制モジュール33は、シソーラス
辞書25を用いて、例えば、「バスルーム」を同義語で
ある「風呂」に、また「大浴場」を上位語である「風呂」
に、更に「銭湯」を上位語である「風呂」に統制し、表
記統制後データ43を生成する。表記統制後データ43
では、印象表現語と名詞句のセットは、例えば、「広
く」/「部屋」などは、「広い」/「部屋」などと、表
記が揃えられている。シソーラス辞書25は、下位語と
それに対応する上位語や、表記を揃えるべき同義語とそ
れを揃えた後の同義語などを格納したデータベースであ
る。
【0020】名詞句頻度モジュール34(図2)は、統
制モジュール33から統制後データを取得し、その中の
名詞句のみを頻度によってソート(並べ替え)し、頻度
の高いものを評価視点(印象表現語の印象の対象となる
もの、例えば、「広い家」の「家」)として採用する。
コンテンツ内に存在する印象表現語が係る名詞句は、そ
のコンテンツ内の、例えば「広い」とか「厚い」などの
主観的表現の対象となっているものであり、ユーザが主
観的表現の対象を検索要求として欲する際の視点である
と言える。
【0021】図5は、ソートモジュール35が生成した
ソートデータ45を示した図である。ソートデータ45
は、ソートモジュール35が表記統制後データ43から
抽出した名詞句の頻度を示している。この頻度は、該名
詞句が結びついている印象表現語に関わらず集計したも
のである。図5から「部屋」の頻度が25(即ち、表記
後統制データ43中の名詞句で「部屋」が現れる回数)
であり、「風呂」が13などとなっている。ソートモジ
ュール35は、ソートデータ45で得られた頻度のう
ち、頻度の高い名詞句を視点として、表現語と共に視点
データ46を生成する。図5のソートデータ45では、
頻度10以上の「部屋」、「風呂」、「ロビー」、「従
業員」が評価視点として選ばれ、視点データとしてソー
トモジュール35から出力される。
【0022】図6は、ソートモジュール45が生成した
視点データ46を示した図である。視点データ46で
は、評価視点として選ばれた名詞句と、この名詞句と結
びつく印象表現語が頻度と共に関連付けられている。ク
エリーツリー表示モジュール36は、視点データ46を
ソートモジュール35から取得し、評価視点を親(ノー
ド)とし、一方セットの印象表現語を子としたツリー構
造(クエリーツリー)として入出力部16(図1)に接
続した表示装置に表示する。また、ユーザは、検索の際
に該クエリーツリーを利用することができる。即ち、ユ
ーザがクエリーツリーから印象表現語と名詞句をマウス
操作などで選択すると、クエリーツリー表示モジュール
36は、選択された印象表現語と名詞句がセットとなっ
た検索要求文を生成し、データ検索システムに送る。
【0023】図7は、表示装置に表示された入力画面4
8を示している。入力画面48は、イメージ情報検索プ
ログラムなどによって、表示されたものである。入力画
面48は、フィーリング入力欄49、文章入力欄50、
客観的情報入力欄51、検索ボタン52などから構成さ
れている。フィーリング入力欄49に表示されているク
エリーツリーは、検索要求文生成プログラムのクエリー
ツリーモジュール36が生成して表示したものである。
【0024】図7に示したように、フィーリング入力欄
49では、評価視点(名詞句)をノードとし、評価視点
と結びつく印象表現語がビジュアルにツリー構造として
表示されている。つまり、名詞句を親として、これに結
びついた印象表現語を子として階層的に表示される。同
じ名詞句に複数の印象表現語が結びついている場合は、
これらの印象表現語は兄弟となる。このように、ツリー
構造によって、頻度の高い名詞句と印象表現語を表示す
ることによって、例えば、通常ワインで使用される「フ
ルーティーな」という印象表現語を想起しないユーザで
あっても、「ワイン」−「フルーティーな」といったよ
うに、容易に適切な印象表現語をクエリーツリーから得
ることができる。また、該クエリーツリーは、ユーザの
評価視点があいまいな場合に、ユーザが評価視点を設定
する際の手がかりとして活用することができる。
【0025】次に、入力画面48を用い方について説明
する。ユーザがフィーリング入力欄49を使用する場合
は、ユーザは、マウス操作によってノードをクリックす
るなどして、フィーリング入力欄49において評価視点
を選択し、決定する。すると、その評価視点に対応した
印象表現語がツリー構造となって表示される。なお、図
7のフィーリング入力欄49は、ユーザにより評価視点
「部屋」、「風呂」、「場所」がクリックされた結果、
「広い」、「清潔だ」、…などの印象表現語がツリー構
造によって表示されたものである。
【0026】例えば、ユーザが評価視点「部屋」と印象
表現語「広い」をクリックした後、検索ボタン52をク
リックすると、イメージ情報付属文書に「広い」/「部
屋」のセットを有するイメージ情報などが検索される。
また、図8は、文章入力欄50に検索情報を入力する場
合を示している。文章入力欄50は、テキスト検索要求
文入力枠である。ここから入力された文章から印象表現
語と名詞句のセットが取り出され、程度副詞がある場合
は、これもセットで取り出される。例えば、フィーリン
グ入力欄49には、「食事」という評価視点が無いが、
文章入力欄50に自然文で「おいしい食事」などと入力
すると、フィーリング入力欄49において「食事」−
「おいしい」のツリーがあり、これを選択したのと同様
の結果を得ることができる。
【0027】また、文章入力欄50には、具体的データ
名を入力してキーワード検索することもできる。これ
は、データ検索装置11は、図示しないキーワード検索
システムを備えており、これを用いて検索するものであ
る。図9は、文章入力欄50に具体的データ名を入力し
たところを示している。例えば、ユーザは文章入力欄5
0に「品川ホテル」という具体名を入力することができ
る。図10は、検索結果の表示画面であり、図示しない
キーワード検索システムが検索した結果を後に説明する
検索結果表示システムが表示装置に表示したものであ
る。
【0028】ここで、ユーザは、自分が「駅から近い」
或いは「新しい部屋」というどちらかの或いは両方の要
素に引かれていたということが分かり、必要と思う印象
表現フレーズを選択し、検索を実行することができる。
また、客観的情報入力欄51の適当な属性をクリックす
ることにより(例えば「青森県」など)、客観的情報を
制約的に用いることができ、結果表示の幅を調節するこ
とができる。なお、印象表現フレーズとは、程度副詞、
及びその程度によって想定されている印象を表す印象表
現語、その印象表現語と強く関わる名詞句の3要素から
なるものである。
【0029】次に、検索結果表示システムについて説明
する。検索結果表示システム61が有する機能は、概略
以下の通りである。イメージ情報付属の文章の本文を表
示する際は、程度副詞、印象表現語、名詞句などを色分
けなどにより強調して表示し、文章の他の部分との差別
化を行う。また、イメージ情報の要約を表示する際は、
印象フレーズを多く持つ文を所定の行数、例えば1行表
示する。更に、2位以下のデータに対しては、1位との
差分情報を取得し、表示する。
【0030】図11は、検索結果表示システム61の構
成を示したブロック図である。表記揺れ統制辞書24と
シソーラス辞書25は、検索入力部文生成システム37
で使用したものと同じものである。検索情報は、図11
の図中下から上方向へ順に処理されていく。まずイメー
ジ情報検索プログラムなどで検索された情報は、印象表
現語名詞句副詞句セットモジュール62に入力される。
以下は、一例として、検索順位が1位と2位のものを表
示するものとして説明するが、これは、更に多くの検索
結果を表示しても良い。
【0031】印象表現語名詞句副詞句セットモジュール
62は、検索順位1位のイメージ情報と2位のイメージ
情報の付属説明文を抽出する。なお、検索結果表示シス
テム61がデータ検索装置から取得する検索結果は、あ
らかじめ順位付けされているものとする。そして、検索
要求文生成システム37と同様にして抽出した付属説明
文から印象表現語と、該印象表現語と名詞句と程度副詞
のセットを取り出す。次に、統制モジュール63に印象
表現語と名詞句のセットに対し、シソーラス辞書25、
表記揺れ統制辞書24を用いて、表記の統制を行う。な
お、統制モジュール63は、検索要求文生成システム3
7の統制モジュール33を用いることもできる。印象表
現語(形容詞、形容動詞など)に対しては、活用形であ
れば終止形にする。また、読みが同じで同義である漢
字、ひらがな、カタカナを何れかの正規化表現へ統制す
る。名詞句に対しては、上位語に統制したり、同義語が
あれば、正規化表現へ統制する。
【0032】差分抽出モジュール64は、2つの文書か
ら取り出された統制後の印象表現語と名詞句のセットを
比較し、違う部分のみ取り出す。これによって、双方の
イメージ情報に共通な面と、異なる面が明らかになる。
そして、差分抽出モジュール64は、2位以下のイメー
ジ情報に対しては、1位のイメージ情報と異なる印象表
現フレーズを表示するようにする。なお、差分抽出モジ
ュール64は、統制された印象表現語と名詞句のセット
を比較するようになっている。強調モジュール65は、
「若々しい」、「スパイシー」などの程度副詞、印象表
現語、名詞句などを色分けするなどして他の語句から差
別化する。
【0033】図12(a)は、検索結果表示システム6
1がワインコンテンツを例としてデータ処理する様子を
示した図である。まず、印象表現語名詞句副詞句セット
モジュール62は、検索結果のイメージ情報に付属した
文書データ71を取得した後、各々のデータから印象表
現語と名詞句のセットを取り出し、セットデータ72を
生成する。例えば、文書データ71の「爽やかな味わ
い」から「爽やかな」/「味わい」といったセットが取
り出される。なお、「とても」などの程度副詞がある場
合は、これもセットで取り出される。
【0034】次に、統制モジュール63が印象表現語と
名詞句の統制を行い、例えば、「爽やかな」/「味わ
い」などの表記は、「爽やかだ」/「味わい」などと正
規化表現などに統制され、統制データ73となる。次
に、差分抽出モジュールは、2つのデータの共通のセッ
ト(印象表現語と名詞句)と異なるセットを調べ、差分
データ74を抽出する。これにより、例えば第1位の検
索結果対象物(以下ワイン1)と第2位の検索結果の対
象物(以下ワイン2)は、共に「爽やかな」/「味」で
あり、ワイン1は、ワイン2に比べて「とても」、「甘
い」/「香り」を持っており、ワイン2は、ワイン1に
比べて「美しい」/「ラベル」と「エレガントだ」/
「香り」を有していることが分かる。
【0035】更に、差分情報を用いて図12(b)に示
したような検索結果を表示することも可能である。図1
2(b)は、表示画面に表示された検索結果を示してい
る。検索順位1位のワイン「キュヴェ・クルーズ・ルー
ジュ」と、2位から4位までのワインまでの差分をそれ
ぞれのワインごとに示している。このように、2位以下
の結果に関して差分情報を抽出すると、ユーザは各ワイ
ンの特徴をより明確に認識することができる。
【0036】図13は、一例としてワインコンテンツを
検索する場合の入力画面48を示した図である。ここ
で、ユーザがツリー構造から「口当たり」/「軽い」を
選択し、客観的情報で「選択せず」を選択して検索した
場合、図14に示した検索結果画面77が表示される。
まず、本文表示欄78では、「若々しい」、「スパイシ
ー」、「フルーティー」、「軽くてフレッシュ」などの
程度副詞、印象表現語、名詞句などが強調モジュール6
5によって着色表示されて強調されている。要約表示欄
79では、印象フレーズを多く持つ部分があらかじめ指
定された行数(ここでは2行)だけ表示されている。
【0037】第1位検索結果表示欄80では、イメージ
情報付属文書から取り出した印象表現語と名詞句と程度
副詞のセットが表示され、このワインの特徴がわかりや
すく表示される。第2位検索結果表示欄81では、第1
位のワインとの差分が表示されるようになっている。
【0038】以上、色分けによる程度副詞、印象表現語
などの強調、要約の表示、及び差分表示の3種類の結果
表示方法を示したが、本文表示欄78、要約欄79、第
1位検索結果表示欄80、第2位検索結果表示欄81の
各々のからユーザが印象表現フレーズをマウスクリック
などにより選択すれば、その印象表現フレーズを検索要
求文として再検索を行うことができるようになってい
る。これにより、ユーザが1度検索を行い、実際のデー
タを見ることにより、自らの要求を明確にした場合も、
その要求を含む印象表現フレーズを選択すると再度検索
を実行できる。例えば、最初に入力した「口当たり」/
「軽い」よりも、「フレッシュだ」/「口当たり」とい
うのが、よりユーザの要求に合致しているとすれば、例
えば、第1検索結果表示欄80の「フレッシュな口当た
り」をマウスでクリックするなどして選択することによ
り再度検索することができる。
【0039】図15は、検索文生成システム37と検索
結果表示システム61の動作を説明するためのフローチ
ャートである。まず、検索文生成システム37により、
フィーリング入力欄49に評価視点をノードとしたクエ
リーツリーが表示される。そして、ユーザは、評価視点
と印象表現語を選択することにより、検索要求文を選択
する(ステップ10)。次に、例えば、イメージ情報検
索システムなどの検索システムにより選択された表現語
と評価視点を用いて検索が行われる(ステップ20)。
【0040】次に、検索結果表示システム61の印象表
現語名詞句副詞句セットモジュール62は、1位と2位
以下の検索されたイメージ情報などに付属した文書デー
タを抽出し、該文書データから印象表現語と名詞句と程
度副詞句のセットを取り出す(ステップ30)。次に、
統制モジュール63は、印象表現語の活用形を終止形に
統制し(ステップ40)、更に印象表現語の統制(ステ
ップ50)、名詞句の統制(ステップ60)を行う。次
に、差分抽出モジュール64は、印象表現語と名詞句と
程度副詞句のセットの重複度を取得する(ステップ7
0)と共に1位と2位以下の各データを比較し、差分を
抽出する(ステップ80)。次に、検索結果を表示装置
に表示する(ステップ90)。更に、再検索が必要な場
合は、再検索のために必要とする印象表現フレーズを差
分情報から選択(ステップ100)した後、検索実行ボ
タン52を選択する(ステップ110)。
【0041】以上に説明した検索結果表示システム61
から以下のような効果を得ることができる。まず、検索
結果提示の際に、結果として表示された付属の説明文の
中で印象表現フレーズをより多く含む文を抽出し、上位
のものを指定数行示すことにより、要約効果を発揮する
ことができる。また、結果として表示された付属の説明
文の中で印象表現フレーズの各要素(程度副詞、印象表
現語、名詞句)に着目し、強調表示などにより、容易に
見て取ることができる。更に、結果として表示された付
属の説明文のにおいて1位のものの印象表現フレーズ及
び2位以下のものに対しては、対1位との差分の印象表
現フレーズを表示することができる。また、再検索につ
いては、検索結果画面77の本文表示欄78、要約欄7
9、第1位検索結果表示欄80、第2位検索結果表示欄
81に表示された要約部分、又は、程度副詞、印象表現
語、名詞句の強調部分或いは、差分の何れかを選択する
と、それをクエリーとして再検索を行うことができる。
【0042】(第2の実施の形態)ところで、本出願人
は、特願平11−281201(未公開)のデータ検索
装置を提案している。第2の実施の形態では、第1の実
施の形態で述べたデータ検索システムとして、当該デー
タ検索装置を用いる。また、特願平11−281201
は、印象表現語と名詞句のセットを用いてイメージ情報
を検索するようには構成されていないが、これを印象表
現語と名詞句のセットにて検索できるようにシステムを
一部変更する。まず、特願平11−281201のデー
タ検索装置について説明する。
【0043】本データ検索装置は、主観的類似性要素を
座標軸とする座標空間に、検索対象となるイメージ情報
に対する印象データが布置された主観評価情報辞書と、
主観的類似性要素を座標軸とする座標空間に、検索キー
となる印象表現語に対する印象データが布置された主観
評価表現辞書と、検索条件として、自然言語により主観
的に表現された検索条件文を取得する検索条件文取得手
段と、この検索条件文取得手段で取得した検索条件文か
ら印象表現語を抽出し、前記主観評価表現辞書に格納さ
れた当該印象表現語の印象データから、前記取得された
検索条件文に対する印象データを生成する検索印象デー
タ生成手段と、この検索印象データ生成手段により生成
された印象データに最も類似する印象データのイメージ
情報を前記主観評価情報辞書から検索するイメージ情報
検索手段と、このイメージ情報検索手段で検索されたイ
メージ情報を出力する出力手段と、を具備している(第
1の構成)。また、第1の構成は、前記主観評価表現辞
書に格納された各印象表現語に対する印象データは、各
座標軸に対する範囲指定する範囲データを備えている
(第2の構成)。また、第1の構成又は第2の構成は、
新たなイメージ情報に関するテキストデータを取得する
テキストデータ取得手段と、このテキストデータ取得手
段で取得したテキストデータから印象表現語を抽出し、
前記主観評価表現辞書に格納されている当該印象表現語
の印象データから前記新たなイメージ情報に対する印象
データを生成する印象データ生成手段と、この印象デー
タ生成手段で生成した印象データを前記新たなイメージ
情報の印象データとして前記主観評価情報辞書に登録す
るイメージ情報追加手段と、を具備するように構成する
ことができる(第3の構成)。また、第1の手段、第2
の手段又は第3の手段は、テキストデータ印象表現語を
抽出する抽出手段と、この抽出手段で抽出した印象表現
語に、前記主観評価表現辞書に登録済みの印象表現語と
未登録の印象表現語が存在する場合、前記登録済みの印
象表現語に対する印象データから前記未登録の印象表現
語に対する印象データを生成する印象表現語印象データ
生成手段と、この印象表現語印象データ生成手段で生成
した印象データを前記未登録の印象表現語の印象データ
として前記主観評価表現辞書に登録する印象表現語追加
手段と、を具備するように構成することができる(第4
の構成)。更に、第1の構成から第4の構成までのうち
の何れかの1の構成の主観評価情報辞書は、各イメージ
情報に対する客観的な特徴条件を備え、前記イメージ情
報検索手段は、前記検索条件取得手段から客観的な特徴
条件が取得された場合には、当該客観的な特徴条件を制
約条件として、イメージ情報を絞り込むように構成する
ことができる(第5の構成)。更に、第1の構成から第
5の構成までのうちの何れかの1の構成の前記主観評価
情報辞書は、各イメージ情報に対する印象データと共に
客観的特徴条件を備え、新たなイメージ情報の客観的特
徴条件に基づいて、前記主観評価情報辞書に格納された
イメージ情報の印象データと客観的な特徴情報との関係
から、前記新たなイメージ情報に対する印象データを生
成し、前記主観情報辞書に格納する第2のイメージ情報
追加手段を具備するように構成することができる(第6
の構成)。更に、第1の構成から第6の構成までのうち
の何れかの1の構成の前記検索条件取得手段は、ネット
ワークに接続された外部装置から前記検索条件を取得
し、前記出力手段は、前記ネットワーク接続された外部
装置にイメージ情報を出力するように構成することがで
きる(第7の構成)。また、本データ検索装置に関連し
たデータ検索用プログラムとして、主観的類似性要素を
座標軸とする座標空間に、検索対象となるイメージ情報
に対する印象データが布置された主観評価情報辞書を作
成する機能と、主観的類似性要素を座標軸とする座標空
間に、検索キーとなる印象表現語に対する印象データが
布置された主観評価表現辞書を作成する機能と、検索条
件として、自然言語により主観的に表現された検索条件
文を取得する検索条件文取得機能と、この検索条件文取
得機能で取得した検索条件文から印象表現語を抽出し、
前記主観評価表現辞書に格納された当該印象表現語の印
象データから、前記取得された検索条件文に対する印象
データを生成する検索印象データ生成機能と、この検索
印象データ生成手段により生成された印象データに最も
類似する印象データのイメージ情報を前記主観評価情報
辞書から検索するイメージ情報検索機能と、このイメー
ジ情報検索手段で検索されたイメージ情報を出力する出
力機能と、をコンピュータに実現させるためのデータ検
索用プログラムと、該データ検索用プログラムが記録さ
れた記録媒体がある。
【0044】(1)データ検索装置の概要 主観的類似性要素を座標軸とする座標空間に、検索対象
となるイメージ情報に対する印象データが布置された主
観評価情報辞書5(図21参照)を保持する。また、主
観的類似性要素を座標軸とする座標空間に、検索キーと
なる印象表現語の印象データが布置された主観評価表現
辞書4(図18参照)を保持する。主観評価表現辞書4
の印象データには各座軸に対する座標値と、座標値を中
心として各座標軸上での範囲を指定する範囲データを備
えている(図19参照)。そして、検索条件として、自
然言語により主観的に表現された検索条件文から自然言
語処理により印象表現語を抽出し、主観評価表現辞書4
から対応する印象データを抽出する。印象表現語が複数
存在する場合には、統合処理により統合した1又は複数
の印象データを検索印象データとして生成する。そし
て、主観的類似性要素を座標軸とする座標空間におい
て、各検索印象データとのユークリッド距離が最も近い
印象データを有するイメージ情報を検索結果として出力
する。一方、新たなイメージ情報を追加する場合には、
追加するイメージ情報に付加される説明文等のテキスト
データから印象表現語を抽出し、統合化処理によって1
つの印象データに統合する。その印象データから範囲デ
ータを除いた座標値からなる印象データを追加するイメ
ージ情報の印象データとして主観評価情報辞書5に登録
する。また、イメージ情報検索、イメージ情報追加の処
理過程で主観評価表現辞書4に未登録の印象表現語が抽
出された場合、同処理で使用される文章やテキストデー
タに含まれる他の印象表現語の印象データを統合するこ
とで1つの印象データを生成し、当該印象表現語の印象
データとして主観評価表現辞書4に登録する。
【0045】(2)データ検索装置の詳細 図16はデータ検索装置の構成を概念的に表したもので
ある。この概念構成図に示されるように、データ検索装
置は、入力手段1、検索条件文取得手段2、検索印象デ
ータ生成手段3、主観評価表現辞書4、主観評価情報辞
書5、イメージ情報検索手段6、出力手段7、イメージ
情報追加手段8及び印象表現語追加手段9を備えてい
る。入力手段1は、ユーザが希望する自然言語による検
索条件文を入力するためのもので、キーボードや、音声
認識装置が使用される。検索条件文取得手段2は、入力
手段1から入力された検索条件文を取得し、又は、有線
接続や無線接続された外部装置から送信される検索条件
文を通信手段を使用して取得する。外部装置としては、
LAN接続された他のパーソナルコンピュータや、ワー
ルド・ワイド・ウェブ(WWW)によりインターネット
に接続された外部のパーソナルコンピュータなどが該当
し、検索条件文取得手段は、これら外部装置からも検索
条件文を取得可能に構成されている。検索印象データ生
成手段は、検索条件文取得手段で取得した検索条件文か
ら、印象表現語等の抽出と、抽出した印象表現語に対応
する印象データを主観評価表現辞書4から抽出し、検索
印象データの生成を行う。
【0046】主観評価表現辞書4は、例えば、ビールに
ついての検索を行う場合に、希望するビールについての
イメージや感覚等の印象を自然言語で表現する場合に使
用される印象表現語を各カテゴリ毎に分類して格納した
辞書である。ここで印象表現語とは、検索対象となるイ
メージ情報の物理的な特徴ではなく、直感的な印象を
「やわらかい」、「クリアな」等の形容詞や形容動詞に
よって表現する言葉(感性語)である。ここで検索対象
となるイメージ情報として取り扱えるのは、主観的類似
性によってその相対関係を表現できるデータ形式すべて
であり、例えば、動画、静止画などの画像の他に、音楽
データや、音声データ、出版物等のテキストデータその
もの、その他の信号データ、また、これらを要素とする
コンテンツも含まれる。図17は主観評価表現辞書4の
内容を概念的に表したものである。この図17に示され
るように、主観評価表現辞書は、ビール、ワイン、日本
酒、映画、テレビ番組情報、Web上の旅行情報、オン
ラインショッピング等の、検索対象となるイメージ情報
に対する各種カテゴリ毎に分類されている。そして、各
カテゴリに属するイメージ情報の印象を表すのに用いら
れる印象表現語、具体的には形容詞・形容動詞に代表さ
れる表現語と程度副詞(「やや」「かなり」などの程度
を指し示す副詞)、さらに印象の要因と強く結びついて
いる名詞・固有名詞等が予め各カテゴリ毎に収集され、
主観評価表現辞書に格納される。
【0047】一方、各カテゴリに対して、そのカテゴリ
に属するイメージ情報に対して、主観的な類似性を表す
要素(主観的類似性要素)を抽出する。例えば、対象と
するイメージ情報のカテゴリを映画とすると、作品の性
質を「スリル度」、「感動度」、「コメディ度」等の主
観的類似性要素を抽出する。また、カテゴリ「ビール」
に対しては、図17に示されるように、「こく」「キ
レ」「うまみ」「のどごし」「爽快感」等の主観的類似
性要素が抽出されている。そして、各印象表現語に対し
て主観的類似性要素の強さを指定することで、各印象表
現語に対する印象データ(主観的類似性要素を座標軸と
する座標空間に布置される、多次元の座標値(ベクト
ル)が決定されている。すなわち、収集した印象表現語
に対して、個々の表現が主観的な類似性要素の強さを指
定する、すなわち印象データ空間の特定の範囲を指し示
すという仮説に基づいて、各類似性要素の相対的なレベ
ル値が与えられている。例えば、図17に示されるよう
に、カテゴリ「ビール」に対する印象表現語「コクのあ
る」には、主観的類似性要素「コク」の相対値が3、主
観的類似性要素「キレ」の相対値が0、…という印象デ
ータが与えられている。
【0048】図18は、主観的類似性要素を座標軸とす
る座標空間と、この座標空間に布置された各印象表現語
に対する印象データを例示したものである。この図18
では、ビールの座標空間を、コク、キレ、うまみの主観
的類似性要素3要素を座標軸として表現し、印象表現語
「クリーミーな」「まろやかな」「ドライな」に対する
印象データを布置したものである。この図18に示され
るように、各印象表現語は、そのカテゴリに属するイメ
ージ情報に対して抽出される主観的類似性要素を座標軸
とし、各座標値を要素とする印象データ(ベクトル)で
表現される。
【0049】なお、図17に例示されるように、実際の
印象表現語は、各主観的類似性要素の相対値を示す座標
値の他に、印象表現語に含まれる範囲を示す範囲データ
が付属している。従って印象表現語は、各主観的類似性
要素の座標値を中心とする範囲(座標値を中心とする一
定の範囲)で囲まれる印象データ空間で指定されるよう
になっている。図19は、印象表現語の印象データ空間
を2次元の座標で表したものである。この図19に例示
されるように、例えば、カテゴリ「ビール」の印象表現
語「クリーミーな」は、主観的類似性要素「コク」に対
して座標値4を中心とするプラスマイナス2の範囲、す
なわち2〜6の範囲で指定され、また、主観的類似性要
素「キレ」に対して座標値−2を中心としてプラスマイ
ナス2の範囲、すなわち−4〜0の範囲で指定される。
このように、印象表現語の印象データは各座標軸(主観
的類似性要素)に対して一定の範囲を有することで、座
標空間上の点で表されるのではなく、座標空間上の一定
空間(容積)で表すことができ、この印象表現語の印象
データ空間内に含まれるイメージ情報を検索候補のイメ
ージ情報としてリストアップすることができる。このよ
うに印象表現語の印象データ空間内のイメージ情報をリ
ストアップすることで、全イメージ情報に対する印象デ
ータとの類似度を判断する必要がなくなり、リストアッ
プしたイメージ情報に対する印象データとの類似性を判
断すればよく、判断を高速化することができる。
【0050】主観評価情報辞書5には、検索対象に関す
るデータが格納されており、各イメージ情報に対する印
象データと付属情報が、カテゴリ毎に分類され格納され
ている。主観評価情報辞書5におけるカテゴリは、主観
評価表現辞書4におけるカテゴリと同一であり、同一カ
テゴリの範囲で検索が行われるようになっている。図2
0は主観評価情報辞書5の内容を概念的に表したもので
ある。この図20に例示されるように、各イメージ情報
に対する印象データは、印象表現語に対する印象データ
と同様に、共通の主観的類似性要素からなる座標軸上の
値を要素とするベクトルで表現される。すなわち、イメ
ージ情報「アサヒスーパードライ」の印象データは、主
観的類似性要素「コク」「キレ」「うまみ」…の各座標
値を要素としてベクトル(3,4,2,3.5,3.
5,…)で表現される。同様に、「アサヒ黒生」「アサ
ヒファーストレディー」「アサヒスーパープレミアム」
「アサヒ生ビールダンク」(いずれも、アサヒビール株
式会社の登録商標又は商標)、「キリンラガービール」
「キリン一番絞り〈生〉ビール」「キリン一番絞り 黒
生ビール」「キリンビール工場 〈生〉」「キリンブラ
ウマイスター」(いずれも麒麟麦酒株式会社の登録商標
又は商標)も、各主観的類似性要素の値を要素とするベ
クトルで表現される。なお、イメージ情報に対する印象
データの各座標値には、印象表現語の場合と異なり、範
囲データが付属していない。従って、主観的類似性要素
を座標軸とする多次元座標空間にイメージ情報が布置さ
れており、座標空間のなかである幅を持った領域(印象
データ空間)を指定することで、その印象データ空間内
に布置されているイメージ情報を検索(リストアップ)
することができる。一方、付属情報としては、数値デー
タ等の客観的特徴条件、対象の画像データ、説明文等の
テキストデータが各イメージ情報毎に格納されている。
付属情報には、その他イメージ情報を印象する要因とな
る各種データが様々なかたちで関連情報として格納され
る。
【0051】付属情報として主観評価情報辞書5に格納
される客観的特徴条件は、イメージ情報の物理的な特徴
データを意味し、定量的で計測可能な数値データのこと
をいう。また、イメージ情報をその性質・用途などによ
って分類したカテゴリ情報も客観的特徴条件に該当す
る。例えば、画像をイメージ情報とした場合、色・形な
どが該当し、乗用車をイメージ情報とした場合、排気
量、燃費、重量などが該当する。客観的特徴条件は、イ
メージ情報の検索の際に、制約条件としてイメージ情報
を絞り込むために使用される。
【0052】イメージ情報を印象する要因となる各種デ
ータとしては、人名や商品名等で、それ自体がある種の
強い印象を持っているもや、画像の構成要素であるプリ
ミティブな図形の印象データ等が該当する。例えば映画
作品をイメージ情報とする場合、作品自体の印象よりも
主演俳優の印象がより支配的であることがあり、このよ
うな場合に、映作品の解説文から抽出された印象表現語
や、シーン画像から推定された印象データよりも、主演
俳優等に付与された印象データを引用して、作品の印象
データを生成する方が主観的な類似性をより反映したも
のとなる場合があるため、主演俳優名等が付属情報とし
て格納される。
【0053】また図17及び図20に示されるように、
主観評価表現辞書4及び主観評価情報辞書には、各カテ
ゴリに含まれる名詞等のカテゴリ分類情報が格納されて
いる。例えば、カテゴリ「ビール」を判断するためのカ
テゴリ分類情報として「ビール」が格納され、カテゴリ
「ワイン」のカテゴリ分類情報として「ワイン」が格納
されている。各カテゴリを示す名詞そのものがカテゴリ
分類情報として格納される他、例えば、カテゴリ「ワイ
ン」に対して「ボルドー」や「ボージョレ・ヌーボー」
等の関連語や、「(ぶどう+ブドウ+葡萄)×醸造」と
いった条件式等もカテゴリ分類語として格納されてい
る。他のカテゴリに対しても関連語や条件式がカテゴリ
分類情報として格納されている。このように、カテゴリ
分類情報が主観評価表現辞書4に格納することで、検索
処理、イメージ情報追加処理、印象表現語追加処理にお
いて、一致する(又は条件式を満たす)名詞等がテキス
トデータ中に含まれる場合に、対応するカテゴリに自動
的に分類することができる。
【0054】イメージ情報検索手段6(図16)は、検
索印象データ生成手段で生成された検索印象データ(主
観的類似性要素のレベル値のセット)と客観的特徴条件
を検索キーとして、主観評価情報辞書5に格納されてい
る各種イメージ情報を検索する。すなわち、主観評価情
報辞書5に登録されているイメージ情報を客観的な特徴
条件を制約条件として絞り込んで、その中でレベル値セ
ットの示す範囲にあるイメージ情報を抽出し、レベル値
とイメージ情報の印象データの類似性判断を行い、より
類似性の高いイメージ情報順に検索結果として出力する
ようになっている。
【0055】出力手段7は、イメージ情報検索手段6で
検索された検索結果を出力する。出力手段7による検索
結果の出力は、検索されたイメージ情報を表示装置に出
力し、印刷装置に印刷出力することにより行われる。
【0056】イメージ情報追加手段8は、新たなイメー
ジ情報に対して、その印象データを生成し付属情報と共
に主観評価情報辞書5に格納する。新たなイメージ情報
の印象データは、そのイメージ情報に付属するテキスト
データから、主観評価表現辞書4に格納されている印象
表現語を抽出し、その印象表現語の印象データを使用し
て生成する。また。主観評価情報辞書5に登録されてい
るイメージ情報の客観的特徴条件と、新たなイメージ情
報に対する客観的特徴条件とから、既登録イメージ情報
の印象データを生成するようになっている。このよう
に、イメージ情報追加手段8により、テキストデータや
客観的特徴条件からイメージ情報を新たに追加できるの
で、主観評価情報辞書を容易に充実させることができ
る。
【0057】印象表現語追加手段9は、未登録の印象表
現語について、その印象データを生成して主観評価表現
辞書4に追加登録する。印象表現語追加手段9による新
たな印象表現語の追加は、イメージ情報の検索の際に入
力された自然言語による文章中や、イメージ情報追加手
段8において未登録の印象表現語がイメージ情報に対す
るテキストデータ中に未登録の印象表現語が存在した場
合に行われるようになっている。このように、印象表現
語追加手段9により自動的に新たな印象表現語が主観評
価表現辞書4に登録されるので、データ検索装置が使用
されればされるほど充実した主観評価表現辞書4にな
る。特に、ユーザのイメージ情報に対する感じ方や感
性、更にそれを表現した文章も多種多様であるため、検
索過程で新たな印象表現語を収集し追加することで、よ
り多くのユーザの感性や表現に対応可能な主観評価表現
辞書4とすることができる。
【0058】ところで、以上に説明した本出願人に係る
特願平11−281201(未公開)のデータ検索装置
の主観評価表現辞書4、主観評価情報辞書5は、印象表
現語と名詞句がセットとして記憶されていないので、評
価視点が定まらないという問題があった。即ち、例え
ば、ユーザが「広い部屋」などと検索文章を作成して検
索すると、評価視点が定まらないために、「広いエント
ランス」や「広いバスルーム」などの情報もヒットして
しまう。そこで、第2の実施の形態では、主観的類似要
素を印象表現語と名詞句のセットを用いて生成すること
にした。
【0059】特願平11−281201のデータ検索装
置(以下前回のデータ検索装置)の主観評価表現辞書4
(以下単に表現辞書4と記す)は、例えば、ビールに対
して、うまみのある、キレのある、コクのある、クリー
ミーな、なの印象表現語に対して印象データが設定され
ていたが、第2の実施の形態の表現辞書4は、図23に
示したように、例えば、印象表現語「広い」に対して
は、「部屋が広い」、「バスルームが広い」などと、印
象表現語と名詞句のセットが印象データを有している。
即ち、主観的類似要素が印象表現語と名詞句のセットに
よって構成されている。また、「広いバスルーム」など
の印象表現語と名詞句のセットは主観的特徴要素である
が、値が5±3の範囲をとる。これは、前回のデータ検
索装置の表現辞書4で、主観的特徴要素で「コク」が3
±2の範囲を持っていたものに対応するものである。
【0060】一方、前回のデータ検索装置における主観
評価情報辞書(以下単に情報辞書5と記す)は、各イメ
ージ情報ごとに作成された主観的類似性要素は、例え
ば、「コク」、「キレ」、「うまみ」などの印象表現語
に対して印象データが作成されている。一方、第2の実
施の形態に情報辞書5は、図24に示したように、主観
的類似性要素が「バスルームが広い」、「部屋が広い」
などと印象表現語と名詞句のセットに対して印象データ
が作成されている。このように、第2の実施の形態で
は、例えば「部屋が広い」、「バスルームが広い」とい
った評価視点を持った主観的類似性要素によってベクト
ル空間を構成することができる。つまり、図18の例を
用いると情報辞書5では、、「まろやかな」、「コ
ク」、「ドライな」という主観的類似性要素によって空
間が張られているが、第2の実施の形態では、更に評価
視点を明確にして、「まろやかなにおい」、「まろやか
な味」、「コクのある味」、…などの印象表現語と名詞
句のセットによって空間が張られることになる。
【0061】このように、前回のデータ検索装置では、
単に「広い」など評価視点を定めずに、主観的類似性要
素を定めていたが、第2の実施の形態では、更に評価視
点を明らかにして「バスルームが広い」、「部屋が広
い」などのように、印象表現語と名詞句をセットにして
主観的類似性要素を構成したため、検索の精度を高める
ことができる。即ち、ユーザが「広い部屋のホテル」と
検索要求文章を作成した場合、主観的類似性要素の「部
屋がひろい」の成分が5±3の値を持つ(統合した値)
イメージ情報はヒットするが、これに該当せず、「バス
ルームが広い」の成分が5±3のイメージ情報はヒット
しない。
【0062】以上に述べたように、第2の実施の形態
は、前回のデータ検索装置の主観的類似性要素を印象表
現語から構成されていたものを印象表現語と名詞句のセ
ットにしたものである。その他の検索の原理などは、前
回のデータ検索装置と同じである。
【0063】図22は、前回のデータ検索装置に、第1
の実施の形態で説明した検索要求文生成システム37
(図2)と検索結果表示システム61(図11)を組み
込んだところを示した図である。なお、前回のデータ検
索装置は、印象表現語と名詞句のセットによって主観的
類似性要素を取り扱えるようになっている。検索要求文
生成システム37は、入力手段1から取得した情報によ
り検索文を生成し、これを検索条件文取得手段2に出力
する。この検索文では、印象表現語と名詞句がセットと
なっており、程度副詞があれば、これもセットとして取
り出されている。一方、検索結果表示システム61は、
検索結果をイメージ情報検索手段6から受け取り、出力
手段7に出力する。
【0064】第2の実施の形態では、データ検索装置に
対して検索要求文生成システム37と検索結果表示シス
テム61を用いることができ、評価視点を定めてながら
印象表現語によるデータ検索を行うことができる。
【0065】(第3の実施の形態)第2の実施の形態で
は、主観的類似性要素(座標軸)を、印象表現語とそれ
と強く結びついている名詞句(被修飾名詞句)のセット
を用いて規定し、これによってイメージ検索を行う場合
について説明したが、このシステムは、以下のような未
解決の課題を持っていた。
【0066】(1)検索要求文内の印象表現語に被修飾
名詞句がない場合。 例えば、ホテルコンテンツにおいてイメージ検索する際
に、ユーザが「広い」とのみクエリーを入力した場合、
第2の実施の形態のデータ検索システムでは、評価視点
がないと見なされ、「広い部屋」という表現(「部屋」
という視点が明記されている)が記述されているイメー
ジ情報の付属データ(コンテンツ内のデータ)が存在し
ても、それはヒットしない。しかし、ホテルコンテンツ
においては、「広い」といえば「部屋」のことを表現し
ている場合が多く、「広い」という検索要求文からは
「部屋が広い」という記述を持つ付属データも検索され
るべきである。
【0067】例えば、検索要求文として単に「広い」と
入力した場合、検索キー「広い」が生成され、「とても
広い」とか、「とにかく広い!」などの表現が記述され
ている付属データが検索される。しかし、「とても部屋
が広い」とか、「シングルルームが広い!」などと記述
されている付属データは検索されない。また仮に、検索
要求文として「広い」が入力された場合に、自動的に
「部屋が広い」といったように評価視点「部屋」を付加
するとしても、例えばホテルコンテンツや交通機関の料
金に関するコンテンツなど、コンテンツごとに評価視点
(名詞句)を設定する必要がある。これをユーザに託す
るのは、ユーザにとって負担であり、また設定にはある
程度の予備知識が必要となるので、困難と感じるユーザ
がいることも考えられる。
【0068】(2)付属データ内の印象表現語が、これ
と強く結びついている名詞句を持たない場合。 例えば、検索要求文が「部屋が広い」であった場合、評
価視点として「部屋」が取得され、付属データ内に「広
い」とのみの記述され、評価視点がないデータは検索さ
れない。例えば、検索要求文として「部屋が広いホテル
を探したい」と入力した場合、検索キー「部屋が広い」
が生成され、「このホテルは部屋が広い」とか、「広い
部屋だ」などと記述されている付属データが検索され
る。しかし、「とても広い」とか、「とにかくここは広
い」などと記述された付属データは検索されない。その
ため、各付属データの主観的類似性要素(座標軸)を設
定する際に、「広い」という記述は「部屋が広い」と同
じに扱って良い旨の情報が必要となる。しかし、これは
コンテンツによって評価視点は変わってしまうため、予
め設定しておくことは難しい。
【0069】(3)検索要求文及び付属データにおい
て、視点を分けることによる弊害が起こる場合。 例えば、ホテルコンテンツにおいて「値段が安い」と
「部屋が安い」とは、多くの場合同義である。しかし、
既存のシソーラス辞書において「値段」と「部屋」が関
連付けられていないと考えられるので、多くの場合「値
段が安い」と「部屋が安い」が別の意味として解釈され
る。例えば、検索用要求文として「値段が安いホテルを
探したい」を入力した場合、検索キー「値段が安い」が
生成され、「このホテルは値段が安い」とか、「安い利
用金で泊まれる」などと記述された付属データが検索さ
れる。しかし、「このホテルの部屋は安い」とか、「と
にかくここは安い!」などと記述された付属データは検
索されない。
【0070】更に、この問題はコンテンツによって異な
った様相を示す。例えば、ホテルコンテンツにおいて
は、「安い」といえば「部屋の料金」であるが、交通機
関の料金に関するコンテンツにおいては、「バス」が安
いのか「電車」が安いのかを区別すること(評価視点を
区別すること)が重要となってくる。表現語1つ1つに
対してユーザに評価視点を分けるべきか否かの判断をゆ
だねるのは、ユーザにとってかなりの負担となってしま
う。このため、検索要求文に対応する場合、及び主観的
類似性要素(座標軸)を設定する際の両方において評価
視点を分ける必要があるか否かということを判定する必
要がある。この判定は、上記(1)の検索要求文内の印
象表現語に被修飾名詞句がない場合、及び(2)の付属
データ内の印象表現語が、これと強く結びついている名
詞句を持たない場合も同様に必要である。
【0071】そこで、本実施の形態では、以下の4点を
目標とする。 (1)検索要求文において印象表現語に強く結びついた
名詞句がない場合に、評価視点を自動的に判定する。 (2)付属データにおいて、印象表現語に強く結びつい
た名詞句がない場合に、主観的類似性要素(座標軸)設
定の際に評価視点を自動的に判定する。 (3)検索要求文において評価視点を分ける必要がない
ものを自動的に判別する。 (4)付属データにおいて、評価視点を分ける必要がな
いものを自動的に判別する。
【0072】以下に、本実施の形態について説明する。
まず、目的(1)、(2)を達成するために、本実施の
形態では、後に説明するフラグ設定テーブル111(図
33)を用いて、強く結びついた名詞句がない印象表現
語に対し、評価視点を自動的に設定する。そこで、ま
ず、このフラグ設定テーブル111を生成するフラグ設
定システム100について説明する。フラグ設定システ
ム100は、プログラム部19(図1)に格納されたフ
ラグ設定プログラムがCPU13によって実行されるこ
とにより、ソフトウェア的に実現することができる。
【0073】図26は、フラグ設定システム100の構
成の1例を示した図である。フラグ設定システム100
は、マージモジュール90、印象表現語・名詞句セット
抽出モジュール91、統制モジュールA92、評価視点
選定モジュール93、統制モジュールB、名詞句ピック
アップモジュール95、計算モジュール96、最多頻度
名詞句モジュール97、フラグ設定モジュール98など
から構成されている。
【0074】マージモジュール90は、、付属データ
(コンテンツ内全データ)を全てマージしてマージデー
タを生成する。
【0075】印象表現語・名詞句セット抽出モジュール
91は、生成したマージデータから印象表現語、及びそ
れと強く結びついている名詞句をセットで取り出す。図
27は、マージデータと抽出した印象表現語と名詞句の
セットの1例を示した図である。図は、一例としてホテ
ルコンテンツに含まれるデータ1、データ2、・・・、
をマージしたマージデータから、「広く/部屋」、「静
かな/環境」、・・・、などといった、印象表現語と名
詞句のセットを抽出したものを示している。なお、本実
施の形態では、予めホテルコンテンツ、ワインコンテン
ツ、・・・、などと個々のコンテンツごとに処理を行う
ものとする。
【0076】統制モジュールA92は、印象表現語・名
詞句セット抽出モジュール91で抽出した印象表現語に
対して表記統制を行う。表記統制は、例えば、印象表現
語が形容詞又は形容動詞の活用形である場合には、これ
を終止形にし、表記揺れがある場合は、表記揺れ辞書を
参照しながら、読みが同じで同義である漢字、平仮名、
カタカナを何れかに正規化表現へ統制する。
【0077】評価視点選定モジュール93は、印象表現
語・名詞句セット抽出モジュール91が抽出した印象表
現語と名詞句のセットのうち名詞句のみに着目し、各名
詞句ごとに出現頻度を抽出する。そして、出現頻度が予
め設定しておいた閾値以上である名詞句を、印象表現語
が被修飾名詞句を伴わない場合の評価視点として選定す
る。即ち、印象表現語と強く結びついた名詞句がない場
合は、ここで選定された名詞句の何れかが付加されるこ
とになる。
【0078】図28は、印象表現語・名詞句セット抽出
モジュール91が抽出し印象表現語と名詞句のセットに
含まれる名詞句を出現頻度順にソートしたものの1例を
示している。図に示したように、印象表現語と名詞句の
セットに含まれる被修飾名詞句「部屋」の出現頻度が5
0であり、最上位にランクされている。続いて、「ホテ
ル」の出現頻度が43、「感じ」の出現頻度が15、・
・・、となっている。そして、本実施の形態では、出現
頻度の閾値を8とし、これ以上の出現頻度の名詞句を評
価視点として選定した。
【0079】統制モジュールB94は、シソーラス辞書
を参照し、評価視点選定モジュール93で決定された視
点を最上位として、その範囲内で上位語に統制する。ま
た、シソーラス辞書を同義語辞書があれば正規化表記へ
統制する。上位語や正規化表記に統制された名詞句は、
名詞グループを構成する。例えば、「風呂」や、「風
呂」に統制された「銭湯」、「バスルーム」などは、
「風呂」グループを成す。
【0080】図29は、印象表現語と名詞句のセットの
統制を説明するための図である。抽出された印象表現語
と名詞句のセット101は、「広く/部屋」とか「静か
だ/部屋」、あるいは図示しないが「大浴場」などと表
記揺れや下位語が含まれている。まず、表記揺れ統制辞
書102によって、「ひろい」→「広い」、「あまい」
→「甘い」、「クサい」→「臭い」などと、表記揺れが
統制される。
【0081】次に、シソーラス辞書103によって、例
えば「大浴場」、「銭湯」などの下位語を「風呂」などの
上位語に統制し、更に、「バスルーム」などの同義語を
有するものは、代表語である「風呂」に統制するなどし
て、正規化表記へ統制して、統制後の印象表現語と名詞
句のセット104を得る。
【0082】名詞句ピックアップモジュール95、コン
テンツ内に存在する印象表現語が係る名詞句を各印象表
現語ごとにピックアップし、名詞句を頻度降順で並び替
える。この際、名詞句と強く結びついていない印象表現
語の出現頻度も数える。
【0083】図30は、印象表現語ごとに、当該印象表
現語に係る名詞句をピックアップし、これを頻度降順で
並び替えたものの一例を示した図である。例えば、印象
表現語「広い」に関しては、当該印象表現語が強く係る
名詞句がないものの出現頻度が最も高く52となってい
る。引き続き「部屋」が49、「風呂」が19、・・
・、などとなっている。
【0084】計算モジュール96は、各印象表現語ご
と、及び各被修飾名詞句ごとに、次の式を計算する。 [印象表現語Tにつく被修飾名詞句Nの頻度]/([印象表現語Tの頻度]−[ 被修飾名詞句がない場合の頻度]) ・・・(1) 式(1)の算出値が大きい名詞句ほど、その印象表現語
に結びつく頻度が高いことになる。
【0085】図31は、各印象表現語に対する式(1)
の計算結果の一例を示した図である。各印象表現語に係
る名詞句の式(1)の算出結果が示されている。例え
ば、印象表現語「広い」の場合、被修飾名詞「部屋」の
算出結果が0.333で最も値が大きく、引き続き「風
呂」が0.129、「調度品」が0.034、・・・、
などとなっている。これらの表から、例えば印象表現語
「広い」に関しては名詞「部屋」が結びつく頻度が高
く、印象表現語「便利」に関しては名詞「交通」が結び
つく頻度が高いことがわかる。
【0086】最多頻度名詞句モジュール97は、計算モ
ジュール96の算出結果から、各印象表現語について最
多出現頻度の名詞のみを取り出す。次に、計算値に所定
の閾値を設定し、その閾値以上の計算値を持つ印象表現
語を特定する。検索要求部内の印象表現語に強く結びつ
いている名詞がない場合、あるいは付属データ内の印象
表現語に強く結びついている名詞がない場合、でかつこ
れらの印象表現語に関する計算値が先の閾値よりも大き
い場合は、当該印象表現語に強く結びつく名詞句(評価
視点)として、計算モジュール96で求めた最多頻度の
名詞句を割り当てるものとする。
【0087】図32の表110は、各印象表現語につい
て最多頻度の名詞を算出結果の数値の降順に並べたもの
を示している。図に示したように、算出結果の数値が最
も大きいのは印象表現語「きれいな」に結びついた被修
飾名詞「部屋」で、算出結果の数値が0.458であ
る。引き続き「安い」に結びつく「値段」、「清潔な」
に結びつく「部屋」、・・・、の順となっている。な
お、本実施の形態では、一例として0.100を算出結
果の閾値とした。そして、例えば印象表現語「きれい
な」が被修飾名詞句を伴わないで、検索要求分に現れた
り、あるいは付属データに現れた場合は、図32で「き
れいな」とセットになっている被修飾名詞「部屋」が評
価視点として結び付けられることになる。
【0088】フラグ設定モジュール98は、主観的類似
性要素(座標軸)の各座標軸に対して、その座標軸に値
をもつ印象表現語がステップ5で設定した各名詞句グル
ープに属する被修飾名詞句を持つ場合にその座標軸の値
を有効とするか否か、あるいは強く結びつく名詞句がな
い場合に、その座標軸の値を有効とするか否かをフラグ
で設定する。「名詞なし」に対しては、図32の表で算
出結果が設定した閾値以上であったものに対応するもの
にフラグを立てる。
【0089】図33は、各座標軸の値を有効とするか否
かを表したフラグ設定テーブル111の1例を示した図
である。ただし、各種類ある座標軸のうち一部のみ示し
てある。表中Tは、フラグを立ててその座標軸を有効に
するものとし、Fは、フラグを立てずにその座標軸を無
効にすることを表す。
【0090】例えば、印象表現語と名詞句のセットを取
得した場合、その名詞句が部屋グループに属するば場合
は、「部屋の広さ」座標軸と「清潔さ」座標軸を有効と
し、他の座標軸を無効とする。また、名詞句が風呂グル
ープに属する場合は、「風呂のひろさ」座標軸を有効と
し、他の座標軸を無効とする。
【0091】強く結びつく名詞句を持たない印象表現語
を取得した場合は、表101で閾値以上の計算値を持
つ、印象表現語で規定される座標軸、あるいは印象表現
語と名詞句で規定される座標軸のフラグを立てる。例え
ば、フラグ設定テーブル111では、「部屋の広さ」座
標軸、「風呂の広さ」座標軸、「安さ」座標軸、「便利
性」座標軸、「清潔さ」座標軸がある。このうち、「部
屋の広さ」座標軸は、表110で印象表現語と名詞句の
セット「広い/部屋」が閾値以上であるのでフラグを立
てる。また、「安さ」座標軸及び「清潔さ」座標軸は、
表110で印象表現語「安い」と「清潔な」が閾値以上
であるのでフラグを立てる。
【0092】フラグ設定テーブル111のフラグは次の
様に機能する。 (1)検索要求文で評価視点を自動設定する場合のフラ
グの機能。 検索要求文において「広い」という、強く結びつく名詞
句(評価視点)を持たない印象表現語がクエリーとして
入力された場合には、フラグ設定テーブル111で、
「部屋の広さ」座標軸はフラグが立っているので有効で
あり、一方「風呂の広さ」座標軸はフラグが立っていな
いので無効となる。そのため、検索要求分に「部屋」と
いう評価視点を自動的に設定することができる。これに
よって、クエリー「広い」が、「部屋の広さ」座標軸に
値を持つものを検索することを表すということが自動的
に判断可能となる。
【0093】(2)付属データの主観的類似性要素(座
標軸)設定時におけるフラグの機能。 例えば、付属データの中に強く結びつく名詞句を持たな
い印象表現語「広い」が現れた場合、この付属データ
は、フラグ設定テーブル111でフラグの立っている
「部屋が広い」座標軸には値を持つことができるが、フ
ラグの立っていない「風呂が広い」座標軸には値を持つ
ことができない。
【0094】このように、フラグ設定テーブル111
は、予め設定されている印象表現語と名詞句のセットを
記憶したデータベースと見ることができる。即ち、クエ
リー、又は付属データに含まれるテキストデータに、結
びつく名詞句を持たない印象表現語があった場合、フラ
グ設定テーブル111により、適当な名詞句(評価視
点)を印象表現語に付加することができる。
【0095】次に、目的(3)、(4)を達成するため
に、後に説明するフラグ設定テーブル(図35)を用い
て、強く結びついた名詞句がない印象表現語に対し、評
価視点を分ける必要の有無を判別する。先に説明したマ
ージモジュール90〜名詞句ピックアップモジュール9
5を用いて図30に示した各表を取得する。次に、各印
象表現語ごとに(被修飾名詞句なしの頻度)/(その印
象表現語の出現頻度)の値を算出する。この算出値が大
きいほど、その印象表現語が、強く結び付く名詞句を伴
わずに単独で使用される頻度が高いことを意味する。
【0096】印象表現語が単独で使用される頻度が高い
ということは、その語のみである意味を表すことができ
るということであり、評価視点を分ける必要がないと考
えられる。即ち、印象表現語と名詞句のセットにおける
名詞句がどの名詞グループに属していても、その印象表
現語に関係する全ての座標軸に値を持たせれば良く、あ
るいは、強く結びついた名詞がない印象表現語の場合
も、その印象表現語に関係する全ての座標軸に値を持た
せれば良い。
【0097】図34は、各印象表現語ごとに(被修飾名
詞句なしの頻度)/(その印象表現語の出現頻度)の値
を算出し、これら印象表現語を算出結果の降順に並べた
表120を示したものである。表120に示したよう
に、「清潔な」、「便利な」、「安い」などの印象表現
語が単独で使用される頻度が高い。そして、本実施の形
態では、0.4を閾値として設定し、この値よりも算出
結果の値が大きい印象表現語は、評価視点を分けないも
のとした。
【0098】図35は、各座標軸の値を有効とするか否
かを表したフラグ設定テーブル121を示した図であ
る。ただし、各種ある座標軸のうち一部のみ示してあ
る。表中Tは、フラグを立ててその座標軸を有効にする
ものとし、Fは、フラグを立てずにその座標軸を無効に
することを表す。
【0099】表120から印象表現語「清潔な」、「便
利な」、「安い」の算出結果は閾値より大きいので、こ
れらの印象表現語に関しては名詞グループによる座標軸
の選択(評価視点の設定)を行う必要が無く、これらの
印象表現語に関しては全ての名詞グループ及び名詞がな
い場合についてフラグを立てる。「部屋の広さ」座標
軸、「風呂の広さ」座標軸に関しては、表120におけ
る印象表現語「広さ」が閾値よりも小さいので、評価視
点による座標軸の選別を行う必要がある。そのため、
「部屋の広さ」座標軸に関しては部屋グループの名詞句
に関してフラグが立っており、「風呂の広さ」座標軸に
関しては風呂グループの名詞句に関してフラグが立って
いる。
【0100】以上のフラグ設定テーブル121により設
定されたフラグは、次の様に機能する。 (1)検索要求文で評価視点を自動設定する場合のフラ
グの機能。 検索要求文において例えば印象表現語「安い」が含んだ
クエリーが入力された場合、それがどのような名詞句と
強く結びついていようが又は、強く結びつく名詞句が無
くても「安さ」座標軸に値を持つものを検索するという
ことを自動的に判断可能となる。 (2)付属データの主観的類似性要素(座標軸)設定時
におけるフラグ機能の役割 同様に、「安さ」座標軸に値を持つ「安い」という印象
表現語がどのような名詞句と強く結びついていようが、
又は、強く結びつく名詞句が無くても「安さ」座標軸に
値を持たせることが可能となる。
【0101】このように、フラグ設定テーブル121
は、予め設定されている印象表現語と名詞句のセットを
記憶したデータベースと見ることができる。即ち、クエ
リー、又は付属データに含まれるテキストデータに、結
びつく名詞句を持たない印象表現語があった場合、フラ
グ設定テーブル111により、適当な名詞句(評価視
点)を印象表現語に付加することができる。また、フラ
グ設定テーブルによれば、印象表現語に名詞句を結びつ
けるか否かを判断することができる。例えば、「広さ」
には名詞句を結び付け、「安さ」には名詞句を結びつけ
ないと判断することができる。
【0102】以上に説明したフラグ設定テーブル11
1、121は何れも第2の実施の形態のデータ検索装置
(図16)で、次のように利用することができる。ユー
ザが入力手段1に入力した自然言語による検索要求文に
名詞句と結びつかない印象表現語が含まれている場合、
フラグ設定テーブル111、121を参照して当該印象
表現語に所定の名詞句を結び付け、当該印象表現語と名
詞句のセットを生成することができる。そして、この印
象表現語と名詞句のセットから検索要求文を生成し、イ
メージデータを検索することができる。第2の実施の形
態では、検索要求文に名詞句と結びつかない印象表現語
があった場合、評価視点(印象表現語と結びついた名詞
句)が定まらず、検索を行うことが困難であったが、本
実施の形態では、フラグ設定テーブル111、121を
用いて評価視点を自動的に補い、検索を行うことができ
る。特に、フラグ設定テーブル121を用いると、検索
要求文に名詞句と結びつかない印象表現語が含まれる場
合に、この印象表現語に名詞句を結び付け、評価視点を
設定するかしないかを判断することができる。更に、本
実施の形態では、付属データ中の印象表現語に結びつい
た名詞句を、コンテンツごとに最適なシソーラス(検索
要求文に自動設定する評価視点)に統制することによ
り、より適切な検索を行うことが可能となる。
【0103】イメージ情報検索手段6は、フラグ設定テ
ーブル111、121を用いて何れの座標軸を有効とす
るかを判断することができる。例えば、ホテルコンテン
ツを格納した主観評価情報辞書5(図16)中に、例え
ば、「広さ」座標軸をもつ付属データがあったとする。
印象表現語と名詞句のセット「部屋の広さ」を用いて生
成された検索要求文が入力された場合、イメージ情報検
索手段6は、「広さ」座標軸を有効にすることにより、
この座標軸に値を持つ付属データをも検索することがで
きる。これは、「広さ」座標軸に「部屋」という名詞句
を付加して評価視点を与えたのと同等である。第2の実
施の形態では、付属データに名詞句と結びつかない印象
表現語があった場合、評価視点が定まった検索要求文に
よって、この付属データを検索することは困難であった
が、本実施の形態では、フラグ設定テーブル111、1
21を用いて付属データ中の名詞句を伴わない印象表現
語に評価視点を自動的に補い、検索を行うことができ
る。特に、フラグ設定テーブル121を用いた場合、印
象表現語ごとに座標軸に名詞句を付加するか否かを判断
することができる。更に、本実施の形態では、検索要求
文中の印象表現語に結びついた名詞句と、付属データ中
の名詞句に結びつかない印象表現語に自動設定する評価
視点をコンテンツごとに最適なシソーラスに統制するこ
とにより、より適切な検索を行うことが可能となる。
【0104】なお、フラグ設定テーブル111、121
の用途は、第2の実施の形態のデータ検索装置に限定す
るものではなく、広くデータ検索に用いることができ
る。即ち、フラグ設定テーブル111、121を用いて
検索要求文中の名詞句に結び付かない印象表現語に、所
定の名詞句を付加して印象表現語と名詞句のセットを生
成し、これを用いて検索を行ったり、また、検索対象で
あるコンテンツ中に名詞句に結びつかない印象表現語が
あった場合、フラグ設定テーブル111、121を用い
てこの印象表現語に適当な名詞句を結び付け、これを検
索の対象とすることなどができる。
【0105】以上に説明したように第3の実施の形態で
は、該当コンテンツ内全被修飾名詞句(何らかの印象表
現語と強く結びついている名詞句)を取得し頻度情報を
入手する。そして、予め設定した閾値以上の被修飾名詞
句を視点と設定する。これによって、該当コンテンツに
おいて必要な視点を自動的に設定する機能を実現するこ
とができる。また、シソーラスによる名詞句の統制時、
上記方法によって決定した視点を基準としてシソーラス
統制を行うようにした。即ち、その基準を最上階層と
し、それらの下位にあたる名詞句があれば、基準となる
名詞に統制する。これによって、コンテンツごとに最適
なシソーラス統制を行うことができる。更に、名詞句が
ない印象表現語、及び視点を分ける必要がない印象表現
語をコンテンツごとに適切に自動的に判断するために、
ある印象表現語と強く結びつく名詞句頻度を抽出した。
そして、名詞句がない場合、及び視点を分ける必要がな
い場合の処理を実現するために、1つの座標軸に視点を
1つだけ設定するのではなく、複数の視点を設定できる
フラグを設定した。
【0106】
【発明の効果】本発明によれば、ユーザに明確な検索要
求が無い場合や、検索要求文が思いつかない場合に、検
索要求文の作成を支援する検索入力部生成装置、検索要
求文生成方法、検索要求文生成プログラムを提供するこ
と、及び検索要求と結果の一致を明確にすることができ
る検索結果提示装置、検索結果提示方法、検索結果提示
プログラムなどを提供することができる。また、検索要
求文や検索対象に名詞句と結びつかない印象表現語が存
在する場合に、適当な名詞句を用いて印象表現語と名詞
句のセットを生成し、これを検索に利用することができ
る検索装置などを提供することができる。
【図面の簡単な説明】
【図1】第1の実施の形態に係るデータ検索装置を示し
たブロック図である。
【図2】検索要求文生成システムを示したブロック図で
ある。
【図3】マージモジュールの機能を説明するための図で
ある。
【図4】統制モジュールの機能を説明するための図であ
る。
【図5】ソートモジュールが生成したソートデータを示
した図である。
【図6】ソートモジュールが生成した視点データを示し
た図である。
【図7】表示装置に表示された検索画面を示した図であ
る。
【図8】文章入力欄に検索情報を入力する場合を示して
いる。
【図9】文章入力欄に具体的データ名を入力したところ
を示している。
【図10】検索結果の表示画面を示した図である。
【図11】検索結果表示システムの構成を示したブロッ
ク図である。
【図12】検索結果表示システムがデータ処理する様子
を示した図である。
【図13】一例としてワインコンテンツを検索する場合
の検索入力画面を示した図である。
【図14】検索結果画面を示した図である。
【図15】検索文生成システムと検索結果表示システム
の動作を説明するためのフローチャートである。
【図16】主観的特徴要素生成システムを組み込む元と
なるデータ検索装置の構成を示したブロック図である。
【図17】同上、データ検索装置における主観的評価表
現辞書の内容を概念的に表わしたものである。
【図18】同上、データ検索装置における主観的類似性
要素を座標軸とする座標空間と、この座標空間に各印象
表現語に対する印象データが布置された概念状態間を例
示した説明図である。
【図19】同上、データ検索装置における印象表現語の
印象データ空間を2次元の座標で表わした説明図であ
る。
【図20】同上、データ検索装置における主観評価情報
辞書の内容を概念的に表わしたものである。
【図21】同上、データ検索装置における主観的類似性
要素を座標軸とする座標空間と、この座標空間に各イメ
ージ情報に対する印象データが布置された概念状態を例
示した説明図である。
【図22】同上、データ検索装置に検索要求文生成シス
テムと検索結果表示システムを組み込んだ状態を示した
ブロック図である。
【図23】主観評価表現辞書の拡張例を示した図であ
る。
【図24】主観評価情報辞書の拡張例を示した図であ
る。
【図25】従来の検索装置での検索例を示した図であ
る。
【図26】フラグ設定システムの構成の1例を示した図
である。
【図27】マージデータと抽出した印象表現語と名詞句
のセットを示した図である。
【図28】印象表現語と名詞句のセットに含まれる名詞
句を出現頻度順にソートしたものの1例を示している。
【図29】印象表現語と名詞句のセットの統制を説明す
るための図である。
【図30】印象表現語ごとに、当該印象表現語に係る名
詞句をピックアップし、これを頻度降順で並び替えたも
のの一例を示した図である。
【図31】各印象表現語に対する式(1)の計算結果の
一例を示した図である。
【図32】各印象表現語について最多頻度の名詞を算出
結果の数値の降順に並べたものを示している。
【図33】各軸の値を有効とするか否かを表したフラグ
設定テーブルを示した図である。
【図34】各印象表現語ごとに(被修飾名詞句なしの頻
度)/(その印象表現語の出現頻度)の値を算出し、こ
れら印象表現語を算出結果の降順に並べた表を示したも
のである。
【図35】各座標軸の値を有効とするか否かを表したフ
ラグ設定テーブルを示した図である。
【符号の説明】
1 入力手段 2 検索条件文取得手段 3 検索印象データ生成手段 4 主観評価表現辞典 5 主観評価情報辞典 6 イメージ情報検索手段 7 出力手段 8 イメージ情報追加手段 9 印象表現語追加手段 11 データ検索装置 12 中央処理部 13 CPU 14 ROM 15 RAM 16 入出力部 17 モデム 18 記憶装置 19 プログラム部 20 データ部 21 バスライン 24 表記揺れ統制辞書 25 シソーラス辞書 31 入力手段 32 マージモジュール 33 統制モジュール 34 名詞句頻度モジュール 35 ソートモジュール 36 クエリーツリー表示モジュール 37 検索要求文生成システム 41 マージデータ 42 印象表現語名詞句セットデータ 43 表記統制後データ 45 ソートデータ 46 視点データ 48 入力画面 49 フィーリング入力欄 50 文章入力欄 51 客観的情報入力欄 52 検索ボタン 61 検索結果表示システム 62 印象表現語名詞句副詞句セットモジュール 63 統制モジュール 64 差分抽出モジュール 65 強調モジュール 71 文章データ 72 セットデータ 73 統制データ 74 差分データ 77 検索結果画面 78 本文表示欄 79 要約欄 80 第1位検索結果表示欄 81 第2位検索結果表示欄 90 マージモジュール 91 印象表現語・名詞句セット抽出モジュール 92 統制モジュールA 93 評価視点選定モジュール 94 統制モジュールB 95 名詞句ピックアップモジュール 96 計算モジュール 97 最多頻度名詞句モジュール 98 フラグ設定モジュール 101 印象表現語と名詞句のセット 102 表記揺れ統制辞書 103 シソーラス辞書 104 表記統制後の印象表現語と名詞句のセット 110 フラグ設定システム 111 フラグ設定テーブル 121 フラグ設定テーブル
フロントページの続き (72)発明者 高藤 淳 徳島県徳島市川内町平石若松108番地の4 株式会社ジャストシステム内 Fターム(参考) 5B075 NK02 NK32 NR05 PP14 PP24 PQ02 PQ32 PQ46 QM08 (54)【発明の名称】 検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文 生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索 プログラム

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 複数検索対象に含まれた文書をマージす
    るマージ手段と、 前記マージ手段にてマージされたマージ文書から印象表
    現語と前記印象表現語に結びついた名詞句をセットで抽
    出するセット抽出手段と、 前記セット抽出手段にて抽出された前記印象表現語と前
    記名詞句の表記を統制する統制手段と、 前記統制手段にて統制された前記印象表現語と名詞句の
    セットから、前記各名詞が重複している頻度が高い名詞
    句を特定する特定手段と、 前記特定手段にて特定された名詞句と、当該名詞句と結
    びついた前記印象表現語を対応付けて提示する提示手段
    と、 前記提示手段にて提示された前記名詞句と前記名詞句に
    対応付けられた前記印象表現語を選択する選択手段と、 前記選択手段にて選択された前記名詞句と前記印象表現
    語のセットを用いて検索要求文を生成する要求文生成手
    段と、 を具備したことを特徴とする検索要求文生成装置。
  2. 【請求項2】 前記提示手段は、前記特定手段にて特定
    された名詞句を親とし、当該名詞句に対応した印象表現
    語を子としたツリー構造として提示することを特徴とす
    る請求項1に記載の検索要求文生成装置。
  3. 【請求項3】 検索順位を付けられた検索データを取得
    する検索結果取得手段と、 前記検索結果取得手段にて検索データに含まれる文書デ
    ータを取得する文書データ取得手段と、 前記文書データ取得手段にて取得した文書データから前
    記検索データごどに印象表現語と前記印象表現語に結び
    ついた名詞句をセットで抽出する抽出手段と、 前記抽出手段にて抽出された前記印象表現語と前記名詞
    句を統制する統制手段と、 前記統制手段にて統制された前記印象表現語と前記名詞
    句のセットを用いて、前記検索順位が2位以下の検索デ
    ータに含まれる前記印象表現語と前記名詞句のセットか
    ら前記検索順位が1位の検索データに含まれる前記印象
    表現語と前記名詞句のセットを除いた前記印象表現語と
    前記名詞句のセットを前記検索順位第2位以下の検索デ
    ータごとに取得する差分手段と、 前記検索順位第2位以下の検索データに関して、前記差
    分手段にて取得した前記印象表現語と前記名詞句のセッ
    トを提示する提示手段と、 を具備したことを特徴とする検索結果提示装置。
  4. 【請求項4】 前記抽出手段は、前記印象表現語と前記
    名詞句と結びついた程度副詞がある場合は、当該程度副
    詞をセットとして取り出すことを特徴とする請求項3に
    記載の検索結果提示装置。
  5. 【請求項5】 前記文書データに含まれる程度副詞、前
    記印象表現語、又は前記印象表現語と結びつく名詞句の
    うち、少なくとも1つを強調して提示する強調提示手段
    と、 前記文書データのうち、程度副詞、前記印象表現語、又
    は前記印象表現語と結びついた名詞句のうち、少なくと
    も1つを行を用いて当該文書データの要約を提示する要
    約提示手段と、 のうち、少なくとも1つを更に備えたことを特徴とする
    請求項3に記載の検索結果提示装置。
  6. 【請求項6】 前記提示手段、又は前記強調提示手段、
    又は前記要約手段のうちの少なくとも1つの提示手段に
    て提示された程度副詞、又は印象表現語、又は前記印象
    表現語に結びついた名詞句を用いて検索要求文を作成す
    ることができる請求項5に記載の検索結果提示装置。
  7. 【請求項7】 複数検索対象に含まれた文書をマージす
    る第1のステップと、 前記第1のステップにてマージされたマージ文書から印
    象表現語と前記印象表現語に結びついた名詞句をセット
    で抽出する第2のステップと、 前記第2のステップにて抽出された前記印象表現語と前
    記名詞句の表記を統制する第3のステップと、 前記第3のステップにて統制された前記印象表現語と名
    詞句のセットから、前記各名詞が重複している頻度が高
    い名詞句を特定する第4のステップと、 前記第4のステップにて特定された名詞句と、当該名詞
    句と結びついた前記印象表現語を対応付けて提示する第
    5のステップと、 前記第5のステップにて提示された前記名詞句と前記名
    詞句に対応付けられた前記印象表現語を選択する第6の
    ステップと、 前記第6のステップにて選択された前記名詞句と前記印
    象表現語のセットを用いて検索要求文を生成する第7の
    ステップと、 を備えたことを特徴とする検索要求文生成方法。
  8. 【請求項8】 検索順位を付けられた検索データを取得
    する第1のステップと、 前記第1のステップにて検索データに含まれる文書デー
    タを取得する第2のステップと、 前記第2のステップにて取得した文書データから前記検
    索データごどに印象表現語と前記印象表現語に結びつい
    た名詞句をセットで抽出する第3のステップと、 前記第3のステップにて抽出つれた印象表現語と前記名
    詞句を統制する第4のステップと、 前記第4のステップにて統制された前記印象表現語と前
    記名詞句を用いて、前記検索順位が2位以下の検索デー
    タに含まれる前記印象表現語と前記名詞句のセットから
    前記検索順位が1位の検索データに含まれる前記印象表
    現語と前記名詞句のセットを除いた前記印象表現語と前
    記名詞句のセットを前記検索順位第2位以下の検索デー
    タごとに取得する第5のステップと、 前記検索順位第2位以下の検索データに関して、前記第
    5のステップにて取得した前記印象表現語と前記名詞句
    のセットを提示する第6のステップと、 から構成されたことを特徴とする検索結果提示方法。
  9. 【請求項9】 複数検索対象に含まれた文書をマージす
    るマージ機能と、 前記マージ機能にてマージされたマージ文書から印象表
    現語と前記印象表現語に結びついた名詞句をセットで抽
    出するセット抽出機能と、 前記セット抽出機能にて抽出された前記印象表現語と前
    記名詞句の表記を統制する統制機能と、 前記統制機能にて統制された前記印象表現語と名詞句の
    セットから、前記各名詞が重複している頻度が高い名詞
    句を特定する特定機能と、 前記特定機能にて特定された名詞句と、当該名詞句と結
    びついた前記印象表現語を対応付けて提示する提示機能
    と、 前記提示機能にて提示された前記名詞句と前記名詞句に
    対応付けられた前記印象表現語を選択する選択機能と、 前記選択機能にて選択された前記名詞句と前記印象表現
    語のセットを用いて検索要求文を生成する要求文生成機
    能と、 をコンピュータに実現するための検索要求文生成プログ
    ラム。
  10. 【請求項10】 検索順位を付けられた検索データを取
    得する検索結果取得機能と、 前記検索結果取得機能にて検索データに含まれる文書デ
    ータを取得する文書データ取得機能と、 前記文書データ取得機能にて取得した文書データから前
    記検索データごどに印象表現語と前記印象表現語に結び
    ついた名詞句をセットで抽出する抽出機能と、 前記抽出機能にて抽出された前記印象表現語と前記名詞
    句を統制する統制機能と、 前記統制機能にて統制された前記印象表現語と前記名詞
    句のセットを用いて、前記検索順位が2位以下の検索デ
    ータに含まれる前記印象表現語と前記名詞句のセットか
    ら前記検索順位が1位の検索データに含まれる前記印象
    表現語と前記名詞句のセットを除いた前記印象表現語と
    前記名詞句のセットを前記検索順位第2位以下の検索デ
    ータごとに取得する差分機能と、 前記検索順位第2位以下の検索データに関して、前記差
    分機能にて取得した前記印象表現語と前記名詞句のセッ
    トを提示する提示機能と、 をコンピュータに実現するための検索結果提示プログラ
    ム。
  11. 【請求項11】 印象表現語を含む検索条件文を取得す
    る検索条件文取得手段と、 前記取得した検索条件文に、名詞句と結びつかない印象
    表現語が存在した場合に、予め設定されている印象表現
    語と名詞句の組合せからなるデータベースを用いて、当
    該印象表現語に名詞句を結び付け、印象表現語と名詞句
    のセットを生成するセット生成手段と、 前記生成された印象表現語と名詞句のセットを用いて検
    索要求文を生成する検索要求文生成手段と、 を具備したことを特徴とする検索要求文生成装置。
  12. 【請求項12】 前記取得した検索条件文中に、名詞句
    と結びつかない印象表現語が存在した場合に、前記印象
    表現語に名詞句を結びつけるか否かを判断する判断手段
    を更に具備し、 前記判断手段で、前記印象表現語に名詞句を結び付けな
    いと判断した場合、前記検索要求文生成手段は、前記印
    象表現語から検索要求文を生成することを特徴とする請
    求項11に記載のデータ検索装置。
  13. 【請求項13】 印象表現語と当該印象表現語と結びつ
    いた名詞句を用いて生成された検索要求文を取得する検
    索要求文取得手段と、 検索対象に、名詞句と結びつかない印象表現語がある場
    合に、予め設定されている印象表現語と名詞句の組合せ
    からなるデータベースを用いて当該印象表現語に名詞句
    を結びつける結び付け手段と、 前記取得した検索要求文を用いて、前記結び付け手段で
    印象表現語に名詞句を結びつけた検索対象を検索する検
    索実行手段と、 を具備したことを特徴とするデータ検索装置。
  14. 【請求項14】 前記検索対象に、名詞句と結びつかな
    い印象表現語がある場合に、当該印象表現語に名詞句を
    結びつけるか否かを判断する判断手段を更に具備し、 前記判断手段で、前記印象表現語に名詞句を結び付けな
    いと判断した場合に、前記検索実行手段は、前記検索条
    件文に含まれる印象表現語を用いて検索対象を検索する
    ことを特徴とする請求項13に記載のデータ検索装置。
  15. 【請求項15】 検索条件文取得手段と、セット生成手
    段と、検索要求文生成手段と、を備えたコンピュータに
    おいて、 前記検索条件文取得手段で、印象表現語を含む検索条件
    文を取得する検索条件文取得ステップと、 前記セット生成手段で、前記取得した検索条件文に、名
    詞句と結びつかない印象表現語が存在した場合に、予め
    設定されている印象表現語と名詞句の組合せからなるデ
    ータベースを用いて当該印象表現語に名詞句を結び付
    け、印象表現語と名詞句のセットを生成するセット生成
    ステップと、 前記検索要求文生成手段で、前記生成された印象表現語
    と名詞句のセットを用いて検索要求文を生成する検索要
    求文生成ステップと、 から構成されたことを特徴とする検索要求文生成方法。
  16. 【請求項16】 検索要求文取得手段と、結び付け手段
    と、検索実行手段と、を備えたコンピュータにおいて、 前記検索要求文取得手段で、印象表現語と当該印象表現
    語と結びついた名詞句を用いて生成された検索要求文を
    取得する検索要求文取得ステップと、 前記結びつけ手段で、検索対象に、名詞句と結びつかな
    い印象表現語がある場合に、予め設定されている印象表
    現語と名詞句の組合せから成るデータベースを用いて当
    該印象表現語に名詞句を結びつける結び付けステップ
    と、 前記検索実行手段で、前記取得した検索要求文を用い
    て、前記結び付け手段で印象表現語に名詞句を結びつけ
    た検索対象を検索する検索実行ステップと、 から構成されたことを特徴とするデータ検索方法。
  17. 【請求項17】 印象表現語を含む検索条件文を取得す
    る検索条件文取得機能と、 前記取得した検索条件文に、名詞句と結びつかない印象
    表現語が存在した場合に、予め設定されている印象表現
    語と名詞句の組合せから成るデータベースを用いて当該
    印象表現語に名詞句を結び付け、印象表現語と名詞句の
    セットを生成するセット生成機能と、 前記生成された印象表現語と名詞句のセットを用いて検
    索要求文を生成する検索要求文生成機能と、 をコンピュータに実現させるための検索要求文生成プロ
    グラム。
  18. 【請求項18】 印象表現語と当該印象表現語と結びつ
    いた名詞句を用いて生成された検索要求文を取得する検
    索要求文取得機能と、 検索対象に、名詞句と結びつかない印象表現語がある場
    合に、予め設定されている印象表現語と名詞句の組合せ
    から成るデータベースを用いて当該印象表現語に名詞句
    を結びつける結び付け機能と、 前記取得した検索要求文を用いて、前記結び付け機能で
    印象表現語に名詞句を結びつけた検索対象を検索する検
    索実行機能と、 をコンピュータに実現させるためのデータ検索プログラ
    ム。
JP2002008218A 2001-03-30 2002-01-17 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム Expired - Fee Related JP4129132B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002008218A JP4129132B2 (ja) 2001-03-30 2002-01-17 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001102708 2001-03-30
JP2001-102708 2001-03-30
JP2002008218A JP4129132B2 (ja) 2001-03-30 2002-01-17 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム

Publications (2)

Publication Number Publication Date
JP2002358323A true JP2002358323A (ja) 2002-12-13
JP4129132B2 JP4129132B2 (ja) 2008-08-06

Family

ID=26612927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002008218A Expired - Fee Related JP4129132B2 (ja) 2001-03-30 2002-01-17 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム

Country Status (1)

Country Link
JP (1) JP4129132B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004447A (ja) * 2003-06-11 2005-01-06 National Institute Of Information & Communication Technology 印象表現語句の分類方法及び装置
JP2005099972A (ja) * 2003-09-24 2005-04-14 Hitachi Ltd 概念検索方法およびシステム
JP2007304744A (ja) * 2006-05-10 2007-11-22 Hiromichi Saito イメージ検索システム
JP2010039731A (ja) * 2008-08-05 2010-02-18 Tokyo Denki Univ 検索システムにおける反復フュージョン型検索方法
JP2013529331A (ja) * 2010-04-30 2013-07-18 トムソン ライセンシング 表示中のテレビジョン・コンテンツのための自動画像発見および推薦
CN109597984A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种印象标签抽取方法和装置
JP2019070985A (ja) * 2017-10-11 2019-05-09 アルパイン株式会社 評価情報生成システムおよび車載装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004447A (ja) * 2003-06-11 2005-01-06 National Institute Of Information & Communication Technology 印象表現語句の分類方法及び装置
JP2005099972A (ja) * 2003-09-24 2005-04-14 Hitachi Ltd 概念検索方法およびシステム
JP2007304744A (ja) * 2006-05-10 2007-11-22 Hiromichi Saito イメージ検索システム
JP2010039731A (ja) * 2008-08-05 2010-02-18 Tokyo Denki Univ 検索システムにおける反復フュージョン型検索方法
JP2013529331A (ja) * 2010-04-30 2013-07-18 トムソン ライセンシング 表示中のテレビジョン・コンテンツのための自動画像発見および推薦
CN109597984A (zh) * 2017-09-30 2019-04-09 北京国双科技有限公司 一种印象标签抽取方法和装置
JP2019070985A (ja) * 2017-10-11 2019-05-09 アルパイン株式会社 評価情報生成システムおよび車載装置

Also Published As

Publication number Publication date
JP4129132B2 (ja) 2008-08-06

Similar Documents

Publication Publication Date Title
US7930302B2 (en) Method and system for analyzing user-generated content
CN109710935B (zh) 一种基于文物知识图谱的博物馆导览与知识推荐方法
JP6381775B2 (ja) 情報処理システム及び情報処理方法
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
JP2012027845A (ja) 情報処理装置、関連文提供方法、及びプログラム
KR20190108838A (ko) 미술 작품 추천 큐레이션 방법 및 시스템
WO2021096677A1 (en) Domain-agnostic structured search query exploration
JP2001075966A (ja) データ分析システム
JP2008287517A (ja) 強調表示装置及びプログラム
CN112133406B (zh) 基于情感图谱的多模态情感引导方法和系统、存储介质
CN109298796B (zh) 一种词联想方法及装置
JP4967133B2 (ja) 情報取得装置、そのプログラム及び方法
JP4129132B2 (ja) 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム
JP3408998B2 (ja) データ検索装置、及びデータ検索用プログラムが記憶された記憶媒体
JPH0962684A (ja) 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置
JP4712221B2 (ja) 主観的特徴要素生成装置、主観的特徴要素生成方法、及び主観的特徴要素生成プログラム
CN111831922B (zh) 一种基于互联网信息的推荐系统与方法
CN111831884B (zh) 一种基于信息查找的匹配系统与方法
JP3739040B2 (ja) 情報処理装置、及び情報処理方法
CN113111664A (zh) 文本的生成方法、装置、存储介质及计算机设备
CN113486155A (zh) 一种融合固定短语信息的中文命名方法
JP2004038729A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7037778B2 (ja) 検索装置および方法
JP4156279B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、及びデータ検索装置
Wang et al. Sweet Apple, company? or food? Adjective-centric commonsense knowledge acquisition with taxonomy-guided induction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080422

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080516

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees