JPH06119405A - 画像検索装置 - Google Patents

画像検索装置

Info

Publication number
JPH06119405A
JPH06119405A JP4271332A JP27133292A JPH06119405A JP H06119405 A JPH06119405 A JP H06119405A JP 4271332 A JP4271332 A JP 4271332A JP 27133292 A JP27133292 A JP 27133292A JP H06119405 A JPH06119405 A JP H06119405A
Authority
JP
Japan
Prior art keywords
image
target
data
background
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4271332A
Other languages
English (en)
Other versions
JP2903904B2 (ja
Inventor
Shusaku Okamoto
修作 岡本
Masahiro Hamada
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4271332A priority Critical patent/JP2903904B2/ja
Priority to US08/135,294 priority patent/US5708805A/en
Publication of JPH06119405A publication Critical patent/JPH06119405A/ja
Application granted granted Critical
Publication of JP2903904B2 publication Critical patent/JP2903904B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Image Processing (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【構成】 入力手段101、言語解析手段102、対象識別手
段103 、未定対象決定ルール109、画像選択手段104、表
示手段105、単語辞書108、画像データベース106とを備
え、前記入力手段で入力した言語文を前記言語解析手段
によって検索された対象データについて、前記対象デー
タが背景・パーツのどちらを表すものであるかを未定対
象決定ルールと対象識別手段によって識別し、背景とパ
ーツに分割して画像を検索する手段を有する。 【効果】 検索問い合わせの入力として文を用い、前記
入力文の表すシーンの構成要素としての画像をもれなく
検索することができる。また、パーツ画像を背景画像の
上に配置することにより自然画を編集合成するシステム
に、本発明による画像検索装置を組み込むことにより、
小規模の画像データベースからでも多くのシーンを合成
することが可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の画像部品を自然
言語を用いて検索する装置に係り、特に、ワードプロセ
ッサなどを用いてパンフレットやマニュアル等の文書作
成を行なう際に、前記文書中に貼り込む画像を容易に検
索する装置に関する。
【0002】
【従来の技術】画像の持つ情報は、言語に比べて具体性
が高くかつ情報量も多いため、パンフレット、雑誌など
様々な文書においてふんだんに使われている。さらに現
在では、そのような文書が家庭でも作れるように、写真
を文書中に貼り込める機能を持つワードプロセッサなど
が普及してきた。ワードプロセッサなどで前記機能を実
現する場合、必要な画像を簡単に検索できることが最も
重要である。これに対して、言語文を入力とし入力文の
内容を表した画像を検索するという手法が知られてい
る。例えば、文献 [高橋、島、岸野、”位置関係を利用
した画像データベース検索システム”、電子情報通信学
会技術報告、PRU89-80、pp.23-28]などがある。この手
法は、あらかじめデータベースに蓄積されているすべて
の画像について、画像内の実体間の関係を階層表現やE-
Rモデル(Entity Relation 表現)などを用いて画像の表
現内容をモデル化したものを画像検索情報として付与し
ておく。上記方式による画像検索は以下のごとく行なわ
れる。まず検索したい画像内容を記述した問い合わせ文
を入力する。次に、言語解析によって前記入力文の表す
内容を前記画像検索情報との類似度を計算できるデータ
に変換する。最後に前記データと各画像検索情報との類
似度の計算を行ない、その評価値の高いものから順に表
示する。
【0003】
【発明が解決しようとする課題】この手法では、蓄積さ
れているすべての画像について、あらかじめモデル化を
行なっておく必要がある。しかしながら、前記モデル化
を自動で行なうことは困難であり手作業で行なわねばな
らず、モデル化に莫大な手間を要するという問題点があ
る。
【0004】また前記方式では、入力文を、画像検索情
報との類似度を計算できるデータに変換しなければなら
ないが、入力文の文法を規制しない場合、文を前記デー
タに変換するための推論規則の作成が困難であること、
逆に、入力文の文法を推論規則に合わせて規制すると、
入力文の文法的な自由度が小さくなりシステムが使いに
くくなることも問題となる。
【0005】さらに、シーンとして構成された画像のみ
しか検索できないため、背景を表す画像とシーンを構成
するパーツとして通常の画像から切り出したものとを組
み合わせて、画像を編集するシステムのための画像検索
という観点からは、前記検索方式は適当であるとは言え
ない。
【0006】従って、文法的に比較的自由度の高い文を
入力として、前記入力文の表す内容の描写に必要な画像
をすべて検索する方式の開発が課題となる。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明の画像検索装置は、言語文を解析するための
情報を記憶する単語辞書と、画素データと前記画素デー
タの特徴を定量化した属性値とからなる画像部品を記憶
する画像データベースと、実体の存在する対象につい
て、前記対象の名称と対象に関する一般知識と対象の実
体を表す画像部品へのポインタとからなる対象データを
記憶する対象データ管理手段と、言語文の入力を行なう
入力手段と、前記単語辞書を用いて言語文を解析し、前
記解析結果から画像表現が可能な対象を抽出し、前記対
象に関する対象データを対象データ管理手段より検索す
る言語解析手段と、対象が背景とパーツのどちらを表す
かを前記対象データの一般知識を用いて識別する対象識
別手段と、複数の対象データを入力して、対象データの
ポインタで指し示されている画像部品の画素データを対
象ごとに区別して抽出し、すべての対象データによって
指し示されている画素データのみを選択する画像選択手
段と、背景かパーツかが未定の対象をどちらかに決定す
るルールを記憶する未定対象決定ルールと、画像部品の
画素データを表示する表示手段とからなる構成を有して
いる。
【0008】
【作用】作成したい画像の内容を自然言語で入力する
と、前記入力手段で入力した言語文を前記言語解析手段
によって検索された対象データについて、前記対象デー
タが背景・パーツのどちらを表すものであるかを対象識
別手段によって識別する。その結果、背景対象について
は、背景を表す対象が複数個ある場合には、前記対象群
に関しては対象ごとに区別せず、前記対象群から画像選
択手段によって選択された画素データを複数個の背景対
象の検索結果とする。背景対象が1つの場合は、前記背
景対象に対応した対象データから検索した画素データを
検索結果とする。また、パーツ対象については、抽出さ
れた各対象ごとに区別して画素データを検索する。
【0009】
【実施例】以下、本発明の一実施例を図面を用いて説明
する。
【0010】図1は、本発明による画像検索装置の実施
例を示したブロック図であり、言語文の入力を行なう入
力手段 101、言語文から画像表現が可能な対象を抽出
し、前記対象に対応した対象データを検索する言語解析
手段 102、対象が背景・パーツのどちらを表すかを識別
する対象識別手段 103 、未定対象決定ルール 109 、複
数の対象データを入力して、それらすべての対象を含む
画素データのみを選択する画像選択手段 104 、画素デ
ータを表示する表示手段 105 、単語辞書 108 、対象デ
ータを記憶する対象データ管理手段 107 、画像部品を
記憶する画像データベース 106 、からなる構成を有す
る。
【0011】図2(a)〜(f)は、対象データ管理手段 107
を構成する対象データをリスト形式で実施した例であ
る。対象データは、対象の名称 201 、下位の対象への
ポインタ 202 、対象に関する一般知識 203 、対象の実
体を表す画像部品へのポインタ 206 からなり、本例で
はそれぞれを CLASS, LOWER_CLASS, COMMON_KNOWLEDGE,
IMAGE_FILE の4種類のラベルで区別している。
【0012】CLASS は、本発明による対象の名称の記述
部 201 を表すラベルで、( CLASS 対象名 )として表さ
れており、図2(a)の例では対象「山」に関する記述で
あることがわかる。
【0013】LOWER_CLASS は、本発明による概念的に下
位の関係となる対象の名称の記述部202 を表すラベル
で、( LOWER_CLASS 下位の対象名もしくはそのリスト
)として表されている。図2(a)の例では対象「山」に
関する下位対象として、「富士山」「アルプス」などが
あることが記述されている。ある対象に対してその下位
の対象データの検索が必要な場合には、この部分を参照
すれば良い。このような対象の上位-下位の関係を概念
的に表したものを図3に示す。
【0014】なお、図2(b)の対象「アルプス」のよう
に、すでに概念が十分具体化されておりそれ以上具体化
が困難である対象については、本データの記述を行わな
いなどの方法でその旨を表す。
【0015】COMMON_KNOWLEDGE は、本発明による対象
の一般知識の記述部 203 を表すラベルで、( COMMON_KN
OWLEDGE 一般知識もしくはそのリスト )として表されて
いる。本例では対象「山」に関する一般知識として、(
CLASS_ATTR BG ) )( ATTR_VAR ( HEIGHT PLACE ) )が
記述されており、次にそれぞれの内容について説明す
る。
【0016】CLASS_ATTR は、本発明による対象が背景
とパーツのどちらを表すものかを識別する情報 204 を
表すラベルで、その次の項によってそれらを識別する。
ここではその値の例として BG, PARTS, NOT_DEF の3種
類を用意しており、各値の意味は以下の通りである。
【0017】BG:背景を表す対象 PARTS:背景中に存在する前景(パーツ) NOT_DEF:背景かパーツかが状況によって決まるもの これにより図2(a)の例の「山」は背景を表す対象であ
ることが識別できる。また、NOT_DEF である対象とは、
例えば次の2つの文において 「山の裾野を列車が走っている。」 「列車の窓から海が見える。」 対象「列車」が、それぞれ「列車」の外観と「列車」の
内部を表しているように、同じ対象名でも状況によって
背景かパーツかが変わる対象を表す。文解析の結果この
ような対象が抽出された場合には、その対象が背景であ
るかパーツであるかを決定する。その方法については、
後の画像検索処理の説明において例を用いて詳述する。
【0018】ATTR_VAR は、本発明による対象の実体を
表す画像を差別化するための属性に関する情報 205 を
表すラベルであり、その次の項またはリストに属性を列
挙する。図2(a)の例では、属性として HEIGHT(高
さ), PLACE(場所) の2種類が定義されており、これ
により本例の「山」の実体を表す画像に、HEIGHT, PLAC
Eについての具体的な値を与えることが出来る。なおこ
の値を用いると、特許出願H03-255025 号などで述べら
れている手法により「山」の実体を表す画像を評価し、
評価値の高いものから検索することも可能となる。
【0019】IMAGE_FILE は、本発明による対象の実体
を表す画像部品へのポインタ 206 を表すラベルであ
り、その次に画像部品へのポインタとして、前記画像部
品のデータが納められたファイル名を列挙する。図4
(b) の例では、「アルプス」を実体として含む画像を収
めたファイルとして、[Jeneva1][Alps1]などがあること
がわかる。
【0020】図4(a),(b) は、画像データベース 106
を構成する画像部品をリスト形式で実施した例である。
【0021】画像部品は、画素データ 401 、画素デー
タに表現されている実体に対応する対象が背景とパーツ
のどちらであるかの識別情報 402 、画素データの特徴
を定量化した属性値からなり 403 、それぞれを IMAGE,
IMAGE_ATTR, BELONG_CLASSの3種類のラベルで区別し
ている。
【0022】IMAGE は画素データを表すラベルであり、
通常は各画素の色情報などといった画像を表示するため
の情報が記録されているが、ここでは説明の都合上、IM
AGEの次の項が前記情報へのポインタであるとして以下
の説明を行なう。
【0023】IMAGE_ATTR は、本発明による対象が背景
とパーツのどちらであるかの識別情報 402 を表すラベ
ルであり、その次の項によってそれらを識別する。ここ
ではその値として BG, PARTS の2種類を用意してお
り、その値が与える意味は対象データの場合と同様であ
る。図4(a)の例の場合は背景を表す画像部品であるこ
とが識別できる。
【0024】BELONG_CLASS は、本発明による画像部品
の画素データの特徴を定量化した属性値の情報 403 を
表すラベルであり、画素データに表現されている実体ご
とに区別する。従って、画素データに複数個の実体が描
写されている場合は、前記個数分が記述されている。BE
LONG_CLASS の次の項は、どの対象に関する属性値の情
報であるかを対象名で示しており、さらにそれ以降に書
かれている項目が、前記対象の CLASS_ATTR において定
義された属性の具体値である。図4(a) では、画素デー
タ [Geneva1.img] に含まれる対象として「アルプス」
「レマン湖」「ジュネーブ」があり、例えば「アルプ
ス」の上位対象「山」の属性に関する具体値として、高
さ(HEIGHT)が 3500 メートル、場所(PLACE)がスイスで
あることがわかる。これに対して図4(b) のように画素
データに表現されている実体がただ1つの場合は、BELO
NG_CLASS はただ1つとなる。
【0025】図5は、未定対象決定ルール 109 を表形
式で示した例である。本例は、入力文から未定対象が抽
出された場合に、背景、パーツ、未定のそれぞれの対象
の個数を求め、その個数を表に対応させることにより、
未定対象を背景とするかパーツとするかを決めるもので
ある。表中の記号『−』『△』『○』『◎』は、それぞ
れ対象の個数が、0個、1個、1個以上、2個以上 を
表している。なお、本ルールを用いた未定対象の決定法
は、後の対象識別手段の説明で述べる。
【0026】第1図において、言語解析手段 102 は、
入力手段 101 において入力された言語文を単語辞書 10
8 を用いて解析し、前記入力文から画像表現が可能な対
象を抽出するためのものであり、その動作例が図6に示
されている。
【0027】まず、入力手段によって文が入力され(60
1)、前記入力文が単語辞書 108 を用い形態素解析によ
って単語に分割される(602)。形態素解析の手法、その
ための単語辞書 108 の構成法については、例えば、文
献 [日高 達、''自然言語理解の基礎−形態論''、情報
処理学会誌、Vol.30、No.10、pp.1169-1175(1989)]など
で述べられている方法を用いれば良い。
【0028】次に、得られた単語のうち画像表現が可能
な対象を表すものを抽出する(603)。まず、得られた単
語のそれぞれについて、対象データ管理手段 107 に登
録されている対象データの対象の名称 201 と一致する
ものがあるかどうかを調べる。もし前記単語と一致する
名称をもつ対象データがあれば、前記単語は画像に表現
可能な対象を表すものとし、前記対象データを対象識別
手段 103 に送り、次の単語に移り同様の処理を行な
う。なければ、その単語は画像に表現できないので次の
単語で同様の処理を行なう。こうしてすべての単語につ
いて対象データの検索処理が完了した時点で、言語解析
手段 102 での処理を終了する。
【0029】なお、図2(a)の実施例で示した対象デー
タでは、呼び名として「山」しか書かれていないので、
同様の意味を表す「マウンテン」などを検索単語として
使えないが、これは、例えば図2(g)の( CLASS ( 山
マウンテン) )のように、対象の名称として対象を表す
名称をあらかじめ列挙しておくことで、入力文において
より多くの対象を表す単語を用いることができる。
【0030】第1図において、対象識別手段 103 は、
対象が背景・パーツのどちらを表すかの識別を、対象デ
ータの一般知識 203 と前記未定対象決定ルール 109 を
用いて推論するものであり、その動作例が図7に示され
ている。
【0031】殆んどの対象は、背景かパーツかのどちら
かに限定することが出来るため、あらかじめどちらかを
各対象データの一般知識 203 に記述しておき、前記一
般知識を参照して識別する。図2の実施例で示した対象
データでは、一般知識において識別情報が( CLASS_ATTR
BG )または、( CLASS_ATTR PARTS )と書かれてお
り、これにより識別することができる。しかし、対象デ
ータのCLASS_ATTR でも説明したように、ごく小数の対
象については、背景とパーツのどちらかが状況に左右さ
れるため前記対象の背景かパーツかの識別については前
記状況を用いた推論が必要である。本実施例では前記状
況として、入力文を解析して得られた対象データを対象
識別手段 103 で識別した結果と図5の未定対象決定ル
ールとを用い、未定の対象データが背景かパーツかを識
別する方法を説明する。
【0032】まず、言語解析手段 102 によって抽出さ
れた対象データを、背景、パーツ、未定のいずれかに分
類し、それぞれに属する対象データの個数を求め(701,7
02)、未定対象が存在するかどうかを調べる(703)。未定
対象が存在する場合は、それらが背景かパーツかを次の
ように決定する(704)。各対象の個数を図5の表の第2
番目のカラム〜第4番目のカラムと比較することによ
り、文解析結果のタイプを図5の表の最初のカラム A
〜F から見つける。そしてそのタイプの最後のカラム
に記されているデータを、未定対象の識別結果とする。
なお本実施例の図5の表において、タイプB、Dは未定
クラスの識別結果が「(パーツ)」(括弧でくくられて
いる)となっているが、これは実際に画像部品を検索す
る際にパーツとしての画像部品を優先して検索すること
を表している。
【0033】第1図において、画像選択手段 104 は、
複数の対象データを入力して、対象データのポインタで
指し示されている画像部品の画素データを対象ごとに区
別して抽出し、すべての対象データによって指し示され
ている画素データのみを選択するものであり、その動作
例が図8に示されている。
【0034】まず、対象データ背景とパーツに分類した
あと(801)、最初に背景画像の検索に移る(802)。背景画
像の検索(802)では、まず背景対象の個数を調べる(80
3)。背景対象が2個以上の場合は、対象データを含む画
像部品を前記対象データのポインタをたどることにより
抽出し、各画像部品に記述されている画素データを格納
したリストを対象データごとに作成する(804)。次に、
入力された対象データのどれか一つを適当に選択し、以
下の作業を行なう(805)。
【0035】1.) 選択された対象データに対する前記リ
ストから、一つ画素データを取り出す。
【0036】2.) その画素データが他のすべてのリスト
にも格納されている場合はその画素データを残し、それ
以外の画素データは削除する。
【0037】3.) 前記リストに他の画素データが残って
いれば、前記 2.の処理を続ける。
【0038】最後に、処理 805 で選択された対象デー
タに対するリストに残った画素データを出力し、画像選
択手段 104 での処理を終了する。
【0039】もし、背景対象がただ1つの場合は、対象
データを含む画像部品を前記対象データのポインタをた
どることにより抽出し、各画像部品に記述されている画
素データを出力するものとする(806)。
【0040】パーツ画像の検索(807)は、背景画像がた
だ1つの場合と同様に、対象データを含む画像部品を前
記対象データのポインタをたどることにより抽出し、各
画像部品に記述されている画素データを出力するもの
で、これを各パーツ画像に対して行なう(808)。
【0041】なお、本実施例による画像選択手段 104
では、背景の画素データを検索したあとそれぞれのパー
ツの画素データを検索しているが、この背景とパーツの
検索の手順を入れ換えても検索結果にまったく影響を与
えないが保証される。
【0042】以上で、本システムを構成する各手段、な
らびに各データ構造の説明を終了し、次に図1〜図8を
参照して本検索方式の動作を説明する。動作を具体的に
説明するために、 「ヘリコプターで山と湖の美しいジュネーブの上空へ」 (1) を例文として入力した場合の処理の流れを示す。 1.) 入力手段 101 で例文(1)を入力する。前記例文は、
文字列データに変換され言語解析手段 102 に送られ
る。 2.) 言語解析手段 102 で、まず形態素解析によって例
文(1)が次のように単語に分割される。
【0043】 ヘリコプター で 山 と 湖 の 美しい ジュネーブ の 上空 へ (2) 次に、得られた単語のそれぞれについて、対象データ管
理手段 107 に登録されているすべての対象データの対
象の名称と一致するかどうかを調べる。対象データとし
て図3に示されている対象データの木構造の各ノードの
ものが用意されているとすると、(2) の単語群のうち対
象データを持つものとして、「ヘリコプター」「山」
「湖」「ジュネーブ」の4つの単語が見つかるので、前
記4つの単語に対応した対象データが抽出される。 3.) 対象識別手段 103 で、対象「ヘリコプター」
「山」「湖」「ジュネーブ」が背景とパーツのどちらで
あるかを、各対象に対する対象データの一般知識と前記
未定対象決定ルール 109 を用いて識別する。対象デー
タとして図2(a)〜(f)の例を用いると、前記各対象は次
のように識別される。
【0044】背景:「山」「湖」「ジュネーブ」 未定:「ヘリコプター」 ここで未定の対象「ヘリコプター」が見つかったので、
次にそれが背景かパーツかを図5の未定対象決定ルール
109 を用いて決定する。言語解析手段 102 の処理結果
より、背景、パーツ、未定の個数はそれぞれ、3、0、
1であることがわかる。この個数に対応する文解析結果
のタイプを図5の表から探すと E なので、さらにタイ
プ E の最後のカラムを調べると未定対象「ヘリコプタ
ー」がパーツであることがわかる。 4.) 対象識別手段 103 で背景かパーツかが確定した対
象データについて、画像選択手段 104 で画像部品を検
索する。すでに各対象データは、 背景:「山」「湖」「ジュネーブ」 パーツ:「ヘリコプター」 と確定しているので、これを背景とパーツに分けて検索
する。背景画像については、「山」「湖」「ジュネー
ブ」をすべて含む画像を検索するため、画像選択手段 1
04 への入力となる対象データは「山」「湖」「ジュネ
ーブ」の3つとなる。
【0045】まず、前記対象についてそれぞれを表す画
像部品が参照され、前記画像部品から検索された画素デ
ータを格納したリストが作成される。引続き対象データ
として図2(a)の例を用い、対象データ「山」について
のリストの作成法を説明する。「山」を含む画素データ
を対象データ「山」に属する画像部品より検索するが、
前記対象データには画像部品が登録されていない。そこ
で、LOWER_CLASS により更に下位の対象データ「アルプ
ス、富士山、…」の画像部品を参照し、前記画像部品か
ら画素データを検索する。最終的には、対象データ
「山」の下位に属する対象データを表す画素データをす
べて含むリストが作成される。同様に、「湖」「ジュネ
ーブ」についてもリストを作成した結果は以下のように
なる。
【0046】山: Geneva1.img, Alps1.img ... 湖: Geneva1.img, Lake-Leman.img ... ジュネーブ: Geneva1.img, Geneva2.img ... 次に、すべての対象データによって指し示されている画
素データのみを選択する。入力された対象データの一つ
として例えば「山」を選択すると、Geneva1.img はその
他のすべてのリストに含まれているので残すが、Alps1.
img は含まれていないので削除する。こうして、すべて
の対象データを含む画素データとして Geneva1 などが
抽出され、それらを背景画像の検索結果とする。
【0047】パーツ画像は個々に検索する。ここではパ
ーツは「ヘリコプター」のみなので、対象データ「ヘリ
コプター」に属する画像部品を参照し、画素データとし
てhelicopter1, helicopter2 ...が検索される。 5.) 表示手段 105 で、上記検索された画素データを背
景とパーツに分けて表示し、検索処理を終了する。
【0048】
【発明の効果】本発明による画像検索システムにおいて
は、画像をあらかじめ背景とパーツとに分類している。
そして本発明による、検索問い合わせの入力として自然
言語文を用い、前記入力文を解析し、背景画像とその前
景を構成するそれぞれのパーツ画像を自動で検索する方
式により、前記入力文の表すシーンの構成要素としての
画像をもれなく検索することができる。
【0049】また、パーツ画像を背景画像の上に配置す
ることにより自然画を編集合成するシステムに、本発明
による画像検索装置を組み込むことにより、前記システ
ムにおいて小規模の画像データベースからでも多くのシ
ーンを合成することが可能となる。
【0050】さらに、背景とパーツのどちらであるかが
状況によって決まる対象についても、前記状況からそれ
を決定するルールを備えているため、より入力文の内容
に強く関連する画像の検索を行なうことができる。
【図面の簡単な説明】
【図1】本発明による画像検索装置の実施例の構成を示
したブロック図
【図2】(a)〜(g) 本発明による対象データをリストの
形式を用いて示した図
【図3】本発明による対象データの上位-下位の関係を
示した概念図
【図4】本発明による画像部品をリストの形式を用いて
示した図
【図5】本発明による未定対象決定ルールを表形式を用
いて示した図
【図6】言語解析手段での処理の流れをフローチャート
の形式で示した図
【図7】対象識別手段での処理の流れをフローチャート
の形式で示した図
【図8】画像選択手段での処理の流れをフローチャート
の形式で示した図
【符号の説明】
101 入力手段 102 言語解析手段 103 対象識別手段 104 画像選択手段 105 表示手段 106 画像データベース 107 対象データ管理手段 108 単語辞書 109 未定対象決定ルール

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】言語文を解析するための情報を記憶する単
    語辞書と、画素データと前記画素データの特徴を定量化
    した属性値とからなる画像部品を記憶する画像データベ
    ースと、実体の存在する対象について、前記対象の名称
    と対象に関する一般知識と対象の実体を表す画像部品へ
    のポインタとからなる対象データを記憶する対象データ
    管理手段と、言語文の入力を行なう入力手段と、前記単
    語辞書を用いて言語文を解析し、前記解析結果から画像
    表現が可能な対象を抽出し、前記対象に関する対象デー
    タを対象データ管理手段より検索する言語解析手段と、
    画像部品の画素データを表示する表示手段とを備え、前
    記入力手段で入力した言語文を前記言語解析手段によっ
    て解析、抽出した対象データについて、前記対象データ
    のポインタで指し示された画像部品の画素データを対象
    ごとに区別して画像表示手段で表示することを特徴とす
    る画像検索装置。
  2. 【請求項2】対象が背景とパーツのどちらを表すかを前
    記対象データの一般知識を用いて識別する対象識別手段
    と、複数の対象データを入力して、対象データのポイン
    タで指し示されている画像部品の画素データを対象ごと
    に区別して抽出し、すべての対象データによって指し示
    されている画素データのみを選択する画像選択手段とを
    備え、前記入力手段で入力した言語文を前記言語解析手
    段によって解析、抽出した対象について、対象識別手段
    によって背景・パーツのいずれかを識別し、背景を表す
    対象が複数個ある場合に、前記対象に関しては対象ごと
    に区別せず、前記対象群から画像選択手段によって選択
    した画素データを、背景を表す対象に対する検索結果と
    することを特徴とする請求項1記載の画像検索装置。
  3. 【請求項3】背景かパーツかが未定の対象をどちらかに
    決定するルールを記憶する未定対象決定ルールを備え、
    対象識別手段は、必要に応じて、言語解析手段で抽出し
    た対象が背景・パーツのどちらを表すかの識別を、対象
    データの一般知識と前記未定対象決定ルールを用いて推
    論することを特徴とする請求項2記載の画像検索装置。
  4. 【請求項4】画像部品は、少なくとも画素データに表現
    されている実体に対応する対象が背景・パーツのどちら
    であるかの識別情報を備え、必要に応じて、前記識別情
    報と対象が背景・パーツのどちらを表すかの識別推論結
    果を用いて画像部品の選択を行なうことを特徴とする請
    求項3記載の画像検索装置。
  5. 【請求項5】画像部品の属性値は、少なくとも画素デー
    タに表現されている実体に対応する対象の名称を備え、
    属性値は画素データに表現されている実体ごとに区別す
    ることを特徴とする請求項1記載の画像検索装置。
  6. 【請求項6】対象データは、さらに概念的に下位の関係
    となる対象がある場合には、前記対象に対応する対象デ
    ータへのポインタを備え、ある対象データにおいて前記
    ポインタをたどることにより、さらに下位の対象データ
    へ検索を移動することを可能とすることを特徴とする請
    求項1記載の画像検索装置。
JP4271332A 1992-10-09 1992-10-09 画像検索装置 Expired - Fee Related JP2903904B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4271332A JP2903904B2 (ja) 1992-10-09 1992-10-09 画像検索装置
US08/135,294 US5708805A (en) 1992-10-09 1993-10-12 Image retrieving apparatus using natural language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4271332A JP2903904B2 (ja) 1992-10-09 1992-10-09 画像検索装置

Publications (2)

Publication Number Publication Date
JPH06119405A true JPH06119405A (ja) 1994-04-28
JP2903904B2 JP2903904B2 (ja) 1999-06-14

Family

ID=17498582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4271332A Expired - Fee Related JP2903904B2 (ja) 1992-10-09 1992-10-09 画像検索装置

Country Status (2)

Country Link
US (1) US5708805A (ja)
JP (1) JP2903904B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207749A (ja) * 2000-10-10 2002-07-26 Eastman Kodak Co 画像の統合された注釈及び検索のためのエージェント
KR100950965B1 (ko) * 2008-04-16 2010-04-02 동국대학교 산학협력단 배경 영상의 자동 교체 시스템 및 그 방법

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
US6108674A (en) * 1994-06-28 2000-08-22 Casio Computer Co., Ltd. Image output devices which automatically selects and outputs a stored selected image in correspondence with input data
JPH10301953A (ja) * 1997-04-28 1998-11-13 Just Syst Corp 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
JP2002506255A (ja) * 1998-03-04 2002-02-26 ザ トラスティズ オブ コロンビア ユニバーシティ イン ザ シティ オブ ニューヨーク 画像およびビデオ検証用セマンティックビジュアルテンプレート発生方法およびシステム
US7143434B1 (en) * 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
GB9908631D0 (en) 1999-04-15 1999-06-09 Canon Kk Search engine user interface
US6941323B1 (en) 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
US7339992B2 (en) * 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
WO2003091850A2 (en) * 2002-04-26 2003-11-06 The Trustees Of Columbia University In The City Of New York Method and system for optimal video transcoding based on utility function descriptors
US8245150B2 (en) * 2004-11-22 2012-08-14 Caterpillar Inc. Parts catalog system
US7120220B2 (en) * 2004-12-23 2006-10-10 Ramtron International Corporation Non-volatile counter
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
US7295719B2 (en) * 2005-08-26 2007-11-13 United Space Alliance, Llc Image and information management system
GB0521544D0 (en) * 2005-10-22 2005-11-30 Ibm A system for modifying a rule base for use in processing data
US7465241B2 (en) * 2007-03-23 2008-12-16 Acushnet Company Functionalized, crosslinked, rubber nanoparticles for use in golf ball castable thermoset layers
US20090082637A1 (en) * 2007-09-21 2009-03-26 Michael Galperin Multi-modality fusion classifier with integrated non-imaging factors
WO2009126785A2 (en) * 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
WO2009155281A1 (en) * 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
AU2010298000A1 (en) 2009-09-25 2012-04-05 Signature Genomics Laboratories Llc Multiplex (+/-) stranded arrays and assays for detecting chromosomal abnormalities associated with cancer and other diseases
KR101912794B1 (ko) * 2013-11-27 2018-10-29 한화테크윈 주식회사 영상 검색 시스템 및 영상 검색 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4695975A (en) * 1984-10-23 1987-09-22 Profit Technology, Inc. Multi-image communications system
US4918588A (en) * 1986-12-31 1990-04-17 Wang Laboratories, Inc. Office automation system with integrated image management
JPH01206432A (ja) * 1988-02-15 1989-08-18 Matsushita Electric Ind Co Ltd 関係データベースを用いたファイルシステム
JPH02220177A (ja) * 1989-02-22 1990-09-03 Nippon Telegr & Teleph Corp <Ntt> 画像検索方式
US5267333A (en) * 1989-02-28 1993-11-30 Sharp Kabushiki Kaisha Image compressing apparatus and image coding synthesizing method
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
US5197005A (en) * 1989-05-01 1993-03-23 Intelligent Business Systems Database retrieval system having a natural language interface
JP2690782B2 (ja) * 1989-05-30 1997-12-17 富士写真フイルム株式会社 画像ファイリングシステム
IL92485A0 (en) * 1989-11-28 1990-08-31 Israel Defence System for simulating x-ray scanners
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
US5459829A (en) * 1991-02-13 1995-10-17 Kabushiki Kaisha Toshiba Presentation support system
US5317508A (en) * 1991-10-24 1994-05-31 Matsushita Electric Industrial Co., Ltd. Image editing apparatus
US5495562A (en) * 1993-04-12 1996-02-27 Hughes Missile Systems Company Electro-optical target and background simulation
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207749A (ja) * 2000-10-10 2002-07-26 Eastman Kodak Co 画像の統合された注釈及び検索のためのエージェント
US7028253B1 (en) 2000-10-10 2006-04-11 Eastman Kodak Company Agent for integrated annotation and retrieval of images
KR100950965B1 (ko) * 2008-04-16 2010-04-02 동국대학교 산학협력단 배경 영상의 자동 교체 시스템 및 그 방법

Also Published As

Publication number Publication date
US5708805A (en) 1998-01-13
JP2903904B2 (ja) 1999-06-14

Similar Documents

Publication Publication Date Title
JP2903904B2 (ja) 画像検索装置
US6904429B2 (en) Information retrieval apparatus and information retrieval method
US5404435A (en) Non-text object storage and retrieval
JP2008165303A (ja) コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム
JPH04229364A (ja) 強調特性変更方法及びシステム
US20100257177A1 (en) Document rating calculation system, document rating calculation method and program
CN106156111B (zh) 专利文件检索方法、装置和系统
JP3573501B2 (ja) 索引作成装置
CN111026832A (zh) 用于生成文章的方法及系统
WO2020136959A1 (ja) マンガ生成システムおよびマンガ生成方法
Steurs et al. Terminology tools
JPWO2004034282A1 (ja) コンテンツ再利用管理装置およびコンテンツ再利用支援装置
US20080015843A1 (en) Linguistic Image Label Incorporating Decision Relevant Perceptual, Semantic, and Relationships Data
JPH08305724A (ja) 設計支援情報文書管理装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH02289087A (ja) マルチメデイア情報入力方法
JP4617608B2 (ja) 代替キーワードのフリー設定による検索システム
JPH06348756A (ja) 索引作成装置及び索引利用装置
JPH08305726A (ja) 情報検索装置
CN118035321B (zh) 一种可视化数据库可视化方法及系统
JPH05189531A (ja) 画像編集装置
JPH10312387A (ja) 情報処理装置及び方法並びに情報処理プログラムを記録した記録媒体
JPH06282539A (ja) ワードプロセッサ
JPH1153355A (ja) 文作成装置
JPH10149364A (ja) 訳語選択装置と記憶媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees