JP3199976B2 - 画像データベース装置 - Google Patents

画像データベース装置

Info

Publication number
JP3199976B2
JP3199976B2 JP05479495A JP5479495A JP3199976B2 JP 3199976 B2 JP3199976 B2 JP 3199976B2 JP 05479495 A JP05479495 A JP 05479495A JP 5479495 A JP5479495 A JP 5479495A JP 3199976 B2 JP3199976 B2 JP 3199976B2
Authority
JP
Japan
Prior art keywords
image
search
state
keyword
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05479495A
Other languages
English (en)
Other versions
JPH08249349A (ja
Inventor
正夫 坂内
敦史 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP05479495A priority Critical patent/JP3199976B2/ja
Publication of JPH08249349A publication Critical patent/JPH08249349A/ja
Application granted granted Critical
Publication of JP3199976B2 publication Critical patent/JP3199976B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像情報を大量に蓄積
し、キーワードを与えることによって画像の検索を行う
ことのできる画像データベース装置に関し、特に、画像
の登録の際に画像からキーワードを自動抽出する画像デ
ータベース装置に関する。
【0002】
【従来の技術】近年、大量に蓄積された画像情報から必
要な画像を効率良く検索するための画像データベース装
置への期待が高まっている。従来、画像を登録する際
に、登録者が、その画像の意味的な情報であるキーワー
ドを手動入力によって同時に登録し、検索時に検索者に
よってキーワードが入力されるとこのキーワードに対応
する画像が抽出される画像データベース装置が知られて
いるが、すべての画像に対して登録者がキーワードを手
動入力するのは効率的でないため、画像認識や画像理解
技術を用いて、画像からキーワードの自動抽出を行うた
めの種々の試みがなされている。
【0003】このような試みとして、例えば、(1)検
索者が感性語を入力し、その感性語に対応する画像を検
索する画像データベース装置(「主観的類似度に適応し
た画像検索」:情報処理学会論文誌,Vol.31,no.2(199
0) 参照)、(2)状態遷移モデルを用いた画像データ
ベース装置(「キーワード自動抽出を考慮した画像デー
タベース」:情報処理学会技報 '91-CV-73-1参照)等が
知られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記し
た従来の構成(1)および(2)は、下記のような問題
点をそれぞれ有している。
【0005】まず、上記(1)の装置では、画像の持つ
色特徴から利用者の主観尺度を反映する感性語への写像
を、サンプル画像に基づいて作成し、検索時には、この
感性語を入力することにより検索を行う構成である。こ
のため、写像作成時に適切なサンプル画像を選択して用
いる必要があると共に、感性語は主観的なものであるの
で汎用性に乏しく、検索者によって写像の調整が必要で
あるという問題点を有している。
【0006】また、上記(2)の装置では、キーワード
の抽出が状態遷移モデルに完全に依存しているために汎
用性に乏しく、モデルに該当しないものに対しては、キ
ーワードが付与されないために全く検索を行うことがで
きないという問題点を有している。また、検索時には、
検索者が例えば「サッカー」等の上位概念のみをキーワ
ードとして入力することが必要であり、シーン記述はモ
デルのみに依存するものとなり、検索者の意志が反映さ
れない。
【0007】本発明は上記した各問題点に鑑みなされた
もので、画像の登録時に、より高度な概念レベルのキー
ワードを画像から自動的に抽出できると共に、汎用性の
高い画像データベース装置を実現することを目的として
いる。
【0008】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明の請求項1記載の画像データベース装置
は、画像をキーワードと対応づけて記憶する画像記憶手
段と、画像を入力する画像入力手段と、入力画像を領域
分割する画像分割手段と、分割された各領域の画像特徴
量を求める画像特徴量算出手段と、画像特徴量をシーン
記述言語に変換するシーン記述言語変換手段と、状態遷
移モデルを記憶する状態遷移モデル記憶手段と、各領域
の状態を上位階層へ遷移させる処理を、各領域のシーン
記述言語が状態遷移モデルの遷移ルールに適合する限り
行う状態遷移手段と、上記状態遷移手段の処理によって
状態が遷移した領域については該領域の最終状態をキー
ワードとし、状態が遷移しなかった領域についてはシー
ン記述言語をキーワードとして、上記入力画像と共に上
記画像記憶手段へ記憶させる登録手段とを備えているこ
とを特徴としている。
【0009】請求項2記載の画像データベース装置は、
請求項1記載の装置において、検索者が検索要求を入力
する検索要求入力手段と、入力された検索要求を解析し
て検索を実行する際の検索キーワードを作成する検索要
求解析手段と、上記検索キーワードに従って画像記憶手
段から画像を検索する画像検索手段と、検索結果の画像
を検索者へ提示する画像提示手段とをさらに備えると共
に、上記検索要求解析手段が、入力された検索要求が状
態遷移モデル中に存在する状態である場合には、該状態
および該状態から遷移ルールを逆行して到達可能な状態
すべてを検索キーワードとして上記画像検索手段へ渡す
一方、入力された検索要求が状態遷移モデル中に状態と
して存在しない場合には、検索者に検索要求入力手段に
よりシーン記述言語を検索要求として入力させ、入力さ
れたシーン記述言語を検索キーワードとして上記画像検
索手段へ渡すことを特徴としている。
【0010】請求項3記載の画像データベース装置は、
請求項1記載の装置において、シーン記述言語が、入力
画像における各領域の位置を示す位置情報を含むと共
に、上記登録手段が、状態遷移手段の処理によって状態
が遷移した領域については、上記最終状態に加えて上記
位置情報をキーワードとして上記画像記憶手段へ記憶さ
せることを特徴としている。
【0011】請求項4記載の画像データベース装置は、
請求項2記載の装置において、上記画像検索手段が検索
キーワードに従って画像を検索する際に、検索キーワー
ドが状態遷移モデル中の状態である場合には、該状態の
状態遷移モデルにおける階層に応じて、検索キーワード
と一致するキーワードを有する画像に得点を付与する一
方、検索キーワードがシーン記述言語である場合には、
画像記憶手段に記憶されている画像のキーワードから遷
移ルールを逆行して到達可能な状態遷移モデルの最下位
階層の状態の持つシーン記述言語と、上記検索キーワー
ドとしてのシーン記述言語とを比較し、その一致度に応
じて上記の画像記憶手段に記憶されている画像に得点を
付与すると共に、上記画像提示手段が、所定の得点より
も高い得点を付与された画像を検索結果として提示する
ことを特徴としている。
【0012】
【作用】請求項1記載の構成によれば、分割された入力
画像の各領域から求められた画像特徴量がシーン記述言
語に変換され、各領域のシーン記述言語が状態遷移モデ
ルの遷移ルールに適合する限り、各領域の状態が上位概
念へ遷移され、状態が遷移した領域についてはその領域
の最終状態がキーワードとして、また状態が遷移しなか
った領域についてはその領域のシーン記述言語がキーワ
ードとして入力画像と共に画像記憶手段に記憶される。
【0013】これにより、状態遷移モデルに適合しない
概念を有する画像に対しても、シーン記述言語がキーワ
ードとして自動的に付与されて画像記憶手段に記憶され
るので、画像の登録を行う際に登録者がキーワードを付
与する必要がないので登録者の作業負担を軽減すること
が可能となると共に、検索時には、シーン記述言語をキ
ーワードとして与えれば上記画像の検索を行うことがで
きる。すなわち、記憶・検索が可能な画像の種類が画像
データベース装置が保持する状態遷移モデルによって限
定されないので、画像データベース装置の汎用性が向上
すると共に、柔軟な検索が可能となる。
【0014】請求項2記載の構成によれば、検索者が入
力した検索要求が、画像データベース装置が保持する状
態遷移モデル中に状態として存在する場合には、この状
態と、上記状態から遷移ルールを逆行して到達可能な下
位階層の状態のすべてとが、検索キーワードとして画像
検索手段に渡され、画像検索手段がこの検索キーワード
と一致するキーワードを有する画像を画像記憶手段から
検索し、その検索結果が検索者へ提示される。一方、検
索者が入力した検索要求が、画像データベース装置が保
持する状態遷移モデル中に状態として存在しない場合に
は、検索者に検索入力手段により入力させたシーン記述
言語が検索キーワードとして画像検索手段へ渡され、画
像検索手段は、検索キーワードとして渡されたシーン記
述言語に従って画像の検索を行う。
【0015】これにより、画像データベース装置が保持
している状態遷移モデルに適合しない画像の検索が要求
された場合であっても、シーン記述言語を検索要求とし
て入力させ、このシーン記述言語に従って画像の検索を
行うことが可能となる。この結果、画像データベース装
置で記憶・検索が可能な画像の種類が状態遷移モデルに
より限定されることがなくなり、画像データベース装置
の汎用性を向上させることが可能となる。
【0016】請求項3記載の構成によれば、状態遷移手
段の処理によって状態が上位階層へ遷移した領域につい
ては、その領域の入力画像中の位置が、領域の最終状態
と共にキーワードとして入力画像と共に登録されるの
で、検索を行う際に、検索者が位置情報として例えば
「中央部」、領域の状態として例えば「人物」という指
定を行うことにより、「中央部に人物が存在する画像」
という条件を与えて画像を検索することが可能となる。
この結果、検索者が抱いている検索対象の画像イメージ
をより具体的に画像データベース装置へ指示して検索を
行うことが可能となり、検索者の意志が反映された柔軟
な検索が可能となると共に、検索効率を向上させること
ができる。
【0017】請求項4記載の構成によれば、状態遷移モ
デルにおける状態を検索キーワードとして検索された画
像は、上記状態の状態遷移モデルにおける階層に応じ
て、階層が高くなるほど高い得点が付与され、シーン記
述言語を検索キーワードとして検索された画像は、画像
記憶手段に記憶されている画像のキーワードから遷移ル
ールを逆行して到達可能な状態遷移モデルの最下位階層
の状態が有するシーン記述言語と、上記検索キーワード
としてのシーン記述言語とを比較し、その一致度が高く
なるほど高い得点が付与され、所定の得点よりも高い得
点を付与された画像のみが検索結果として検索者へ提示
される。
【0018】これにより、検索者が所望する画像である
可能性の高い画像が提示されることとなるため、検索者
が検索結果として提示された画像から所望の画像を選択
する際等の検索効率を向上させることが可能となると共
に、検索者が所望する画像からかけ離れた画像が提示さ
れる可能性を減少させることができ、画像データベース
装置の信頼性を向上させることができる。
【0019】
【実施例】本発明の一実施例について図1ないし図6に
基づいて説明すれば、以下の通りである。本実施例にお
ける画像データベース装置は、カラー画像を登録・検索
する画像データベース装置であり、画像の登録に関する
構成として、図1に示すように、画像とそのキーワード
とを蓄積する画像データベース11と、データベースに
登録する画像を入力するための画像入力部1(画像入力
手段)と、この画像入力部1から入力された画像を蓄積
するための入力画像メモリ2と、この入力画像メモリ2
に蓄積されたフルカラー画像を入力し、その色数を減色
しながら画像全体を複数の領域に分割して限定色画像を
作成する限定色画像作成部3(画像分割手段)と、この
限定色画像を蓄積する限定色画像メモリ4と、上記の限
定色画像をラベリングしてラベリング画像を作成するラ
ベリング部5と、ラベリング画像を蓄積するラベリング
画像メモリ6と、各領域の画像特徴量を計算する画像特
徴量計算部7(画像特徴量算出手段)と、画像特徴量を
シーン記述言語に変換するシーン記述言語変換部8(シ
ーン記述言語変換手段)と、上記の各領域の状態が遷移
するためのルールを蓄積した状態遷移モデルデータベー
ス9(状態遷移モデル記憶手段)と、この状態遷移モデ
ルデータベース9を参照しながら各領域の状態を遷移さ
せる状態遷移部10(状態遷移手段)と、入力画像メモ
リ2の入力画像をキーワードと共に上記画像データベー
ス11へ登録するデータ登録部12(登録手段)とを備
えている。
【0020】ここで、状態遷移モデルについて説明す
る。状態遷移モデルとは、図6に示すような状態遷移図
と、遷移ルールとからなり、同図における例えば"Huma
n" 、"Human-hair"等の状態において、予め設定された
遷移ルールが満たされれば、矢印で示すように状態が上
位階層へ遷移する動作を、満たされる遷移ルールが存在
する限り繰り返すことによって、後述するセグメントの
状態をより上位概念に近づけるためのモデルである。
【0021】ここで、上記の構成によるカラー画像の登
録について、図2に示すフローチャートを参照しなが
ら、以下に説明する。なお、本実施例では、登録される
カラー画像は、赤(R)・緑(G)・青(B)の各要素
がそれぞれ8ビット(0から255までの256階調)
のディジタルデータで表現されたフルカラー画像である
とする。
【0022】まず、画像データベースに登録しようとす
るカラー画像が画像入力部1により入力されて入力画像
メモリ2に蓄積される(ステップ1、以下、S1のよう
に表記する)。
【0023】次に、この入力画像から物体等を認識する
わけであるが、この認識のためには、まず、画像から認
識対象となる物体を切り出す必要がある。ここでは、入
力画像はフルカラー画像であるため、同じような色によ
って構成される領域を抽出するカラーセグメンテーショ
ンの手法を用いる。つまり、限定色画像作成部3が、入
力画像メモリ2から取り出したフルカラーの入力画像か
ら、16色程度に色を限定した限定色画像を作成し(S
2)、ラベリング部5が、上記S2で作成された限定色
画像において、同一色の連結領域に対して同一のラベル
を付与し、同一ラベルを有する領域を一つの連結領域と
することにより画像を複数の領域に分割する(S3)。
以後、これらの分割された領域のそれぞれをセグメント
と呼ぶこととする。
【0024】次に、画像特徴量計算部7が、各セグメン
トについて、面積、外接矩形、色、主軸方向、主軸方向
に対する占有率、円形度、重心等の画像特徴量をそれぞ
れ算出し(S4)、シーン記述言語変換部8が、算出さ
れた画像特徴量から、各セグメントのシーン記述言語を
作成する(S5)。なお、このシーン記述言語は、セグ
メントの大きさ、入力画像全体を縦横それぞれ3分割し
て9個のブロックに分けた場合に該当セグメントが含ま
れるブロック位置、セグメントの色、セグメントの形
状、およびセグメントの主軸方向をそれぞれ表現する複
数種類のパラメータで構成されている。
【0025】続くS6では、状態遷移部10が、各セグ
メントのシーン記述言語と、状態遷移モデルデータベー
ス9に蓄積されている状態遷移モデルとに基づいて、各
セグメントの概念を決定する作業を以下のように行う。
【0026】すなわち、状態遷移部10は、各セグメン
トに対して上記S5で作成されたシーン記述言語が状態
遷移モデルの遷移ルールを満たしているか否かを、状態
遷移モデルの下位概念から順に調べ、遷移ルールが満た
されていれば、該セグメントの状態を1つ上の階層へ遷
移させる。
【0027】より具体的には、図6に示すような状態遷
移モデルが与えられ、あるセグメントのシーン記述言語
におけるセグメントの色を示すパラメータが「黒」であ
れば、このセグメントは遷移ルールを満たしていること
となり、最下位の概念である“Color-segment"から1階
層上位へ遷移して“Black-segment"となる。さらに、こ
のセグメントのシーン記述言語が、人間の頭髪部分の画
像である可能性がある条件を満たしている場合には、さ
らに遷移ルールが満たされたこととなり、さらに1階層
上位へ遷移する。これにより、このセグメントは、人間
の頭髪であるという概念"Human-hair"を有するセグメン
トとして認識される。
【0028】また、上記の状態遷移モデルには、S3に
おける領域分割時の過分割やシェーディング等のため
に、本来1つの物体であるものが複数セグメントに分割
されてしまった物体や、複数色からなる物体等に対応す
るために、比較的上位の階層において、状態を遷移させ
ずにセグメントどうしの統合のみを行う領域統合ルール
としての遷移ルールも含まれており、この領域統合ルー
ルを満たすセグメントどうしは統合され、新たな1つの
概念を有するセグメントとして認識される。
【0029】より具体的には、図6に示すような状態遷
移モデルが与えられ、入力画像に含まれるセグメントと
して、上記の概念"Human-hair"を有するセグメントと、
人間の肌部分の画像であるという概念"Human-skin"を有
するセグメントとが存在する場合には、これらのセグメ
ントは領域統合ルールを満たすものとして統合され、人
間の顔部分の画像であるという概念"Human-face"を有す
る1つのセグメントとして認識される。
【0030】上記したS6の動作は、入力画像中のすべ
てのセグメントの状態が遷移しなくなるまで繰り返さ
れ、この動作が終了した後に、データ登録部12が、各
セグメントに対して上記S6で求められた最終状態、す
なわち例えば上記の"Human-face"等の概念をキーワード
として、上記S1で入力された画像と共に画像データベ
ース11に登録する(S7)。なお、このとき、所定の
階層よりも上位の概念へ遷移したセグメントについて
は、上記キーワードと共に、シーン記述言語の位置パラ
メータも画像データベース11へ登録される。また、上
記S6において状態が全く遷移しなかったセグメントに
ついては、シーン記述言語がキーワードとして登録され
る。
【0031】なお、上記した状態遷移モデルでは、状態
遷移モデルの下位階層ではシーン記述言語を重要視して
状態を遷移させるように遷移ルールが設定されており、
上位階層になるに従いシーン記述言語の重要性は低くな
り、セグメントどうしの統合を優先的に行うよう領域統
合ルールが設定されている。このようにして下位階層で
はシーン記述言語により状態を遷移させることにより汎
用性を高める一方、上位階層ではシーン記述言語にあま
り頼らず、セグメント間の関係等を大局的に見て状態遷
移を行うことで、認識の信頼性が高められている。
【0032】なお、ここで、上記S2における限定色画
像の作成について、図3に示すフローチャートに基づい
てより詳しく説明する。
【0033】まず、限定色画像作成部3は、フルカラー
の入力画像のヒストグラムを作成する(S21)。本実
施例では、R・G・Bのそれぞれが256階調で表現さ
れているため、画像中の各色は、RGB空間中の一辺2
56(0から255)の立方体中の点として表される。
この一辺256の立方体を、セルと呼ばれる一辺8の立
方体に分割する。次に、画像中の画素のRGB値を求
め、その画素がRGB空間中でどのセルに属するかを求
めて、その画素の属するセルの頻度値を1だけ増加させ
る。この処理をすべての画素に対して行い、ヒストグラ
ムを作成する。
【0034】次に、作成されたヒストグラム中で、最も
頻度値の大きいセルである最頻値セルを検出し(S2
2)、この最頻値セルの表す色を代表色とし、この最頻
値セルを中心として予め与えられている半径の球内に含
まれるセルの色を上記代表色で置き換える。このように
色が決定されたセルを対象から除外してS22へ戻り、
同様の処理を対象セルがなくなるまで繰り返す。これら
の処理を行う際の上記半径を適当に調整させることでフ
ルカラー画像の色数を16色程度に減色することができ
る。つまり、色数が少ない場合には、上記半径を小さく
し、多い場合には上記半径を大きくすることにより1つ
の代表色で表すことのできるセルの数を調整し、色数を
希望の数に近づけることができる。
【0035】次に、以上に説明したように画像がキーワ
ードと共に登録されている画像データベース11から、
検索者が画像の検索を行うために、本実施例の画像デー
タベース装置が備える構成と、この構成による画像の検
索動作について、図4および図5を参照しながら説明す
る。
【0036】本実施例の画像データベース装置は、前述
した画像の登録に関する構成にさらに加えて、図4に示
すように、検索を行う検索者が検索要求を入力するため
の検索要求入力部21(検索要求入力手段)と、入力さ
れた検索要求を解析する検索要求解析部22(検索要求
解析手段)と、検索要求の解析結果に基づいて該当する
画像を画像データベース11から検索する検索部23
(画像検索手段)と、検索部23によって検索された画
像を検索者に提示する画像提示部24(画像提示手段)
とを備えた構成である。
【0037】上記の構成において、画像データベース1
1に蓄積されている画像を検索する場合には、まず、検
索者は、検索要求入力部21により、検索したい画像を
構成している構成物の名称を検索要求として入力する
(S11)。より具体的に説明すると、例えば、検索者
が人物を含んだ画像を検索したい場合には、構成物の名
称として"Human" と入力することになる。
【0038】検索要求が入力されると、検索要求解析部
22が状態遷移モデルデータベース9を探索し、S11
で検索要求として入力された構成物の名称と一致する概
念が、状態遷移モデルデータベース9に蓄積されている
状態遷移モデルに含まれていれば(S12)、S11に
戻り、検索要求入力部21が、画像中における上記構成
物の位置に関する検索要求を入力するように検索者に対
して指示する。
【0039】これにより、検索者は、例えば「真中に人
物がいる画像」というような検索要求を作成することが
可能となる。この結果、検索者が抱いている検索対象の
画像イメージをより具体的に画像データベース装置へ指
示して検索を行うことが可能となり、検索者の意志を反
映した柔軟な検索が可能となると共に、検索効率が向上
するという効果を奏する。ただし、検索者は上記の指示
に必ずしも従う必要はなく、位置に関する検索要求を入
力せずに次のステップであるS13へ進むこともでき
る。
【0040】一方、検索要求として入力された構成物の
名称と一致する概念が状態遷移モデルデータベース9に
蓄積されている状態遷移モデルに存在しなければ(S1
2)、S11へ戻り、検索要求入力部21が、シーン記
述言語による検索要求を検索者に入力させる。なお、シ
ーン記述言語とは、前記したように、対象物の大きさ、
入力画像全体に対する位置、色、形状、および主軸方向
である。ただし、検索要求としてこれらすべてを入力す
る必要はない。
【0041】このようにして、状態遷移モデルに存在す
る概念と必要に応じてその位置、あるいは、所望の概念
が状態遷移モデルに存在しない場合はシーン記述言語
が、検索要求として検索部23へ渡される。なお、上記
S11およびS12は、検索者がすべての検索要求の作
成を終了するまで繰り返される(S13)。
【0042】なお、検索者が検索要求を入力するための
検索要求入力部21におけるユーザインターフェイス
は、例えばGUI(Graphical User Interface)による
メニュー画面において状態遷移モデルに含まれている概
念をアイコンとして表示させ、これらのアイコンから検
索者が所望のものを選択すると、選択されたアイコンに
対応する概念が検索要求として検索部23へ渡されるよ
うにすることも可能であり、これによれば、検索者にと
っての操作性を向上させることができる。また、検索者
が所望の構成物に対応する概念がアイコンとして表示さ
れていない場合、すなわち所望の概念が状態遷移モデル
に含まれていない場合には、シーン記述言語の各種のパ
ラメータを入力させるよう画面で指示することもでき
る。
【0043】検索部23は、上記した検索要求に基づい
て画像データベース11から該当する画像を検索し(S
14)、画像提示部24が検索部23の検索結果を検索
者へ提示する(S15)。
【0044】ここで、図6に示す状態遷移モデルの例を
用いて、上記の検索動作についてより詳細に説明する。
【0045】検索要求解析部22は、入力された検索要
求が、状態遷移モデルに存在する概念であるか、あるい
はシーン記述言語であるかによって異なった処理を行
う。まず最初に、検索要求として、状態遷移モデルに存
在する概念が入力された場合の処理について説明する。
ここでは、検索者によって、構成物の名称"Human" が検
索要求として入力され、図6に示すように状態遷移モデ
ルに"Human" が概念として存在しているとする。
【0046】検索要求解析部22の解析により、上記の
検索要求は状態遷移モデルに存在することが判定する
と、検索要求解析部22は、この検索要求"Human" を検
索キーワードとして検索部23へ渡し、検索部23はこ
の検索キーワードに基づいて画像データベース11を探
索する。探索の結果、画像データベース11に"Human"
がキーワードである画像が登録されていれば、該画像を
候補画像とする。さらに、検索要求解析部22は、上記
状態遷移モデルにおいて"Human" から1階層だけ下位へ
下りた概念である"Human-face"を検索キーワードとして
検索部23へ渡し、検索部23はこの検索キーワードと
一致するキーワードを有する画像が画像データベース1
1に登録されているか否かを探索し、存在する場合は該
画像を候補画像としてこの"Human-face"の階層に応じた
得点を与える。なお、上記の得点は、状態遷移モデルの
階層に応じて与えられるものであり、上位の階層に近づ
くほど高得点が与えられるようになっている。
【0047】上記のような検索キーワードによる探索お
よび得点の付与を、状態遷移モデルの最下位の階層まで
順次行った後、候補画像となった画像の内、あらかじめ
設定されている閾値よりも大きな得点を有する画像が、
検索結果の画像として画像提示部24によって検索者へ
提示される。また、複数種類の検索要求がある場合は、
候補画像となった画像の内、すべての検索要求に対する
得点の平均値が上記の閾値よりも大きくなった画像が検
索結果として提示される。
【0048】次に、入力された検索要求がシーン記述言
語であった場合の処理について説明する。ここでも、図
6に示す状態遷移モデルが用いられることとする。
【0049】この場合、検索要求解析部22は、入力さ
れたシーン記述言語を検索キーワードとして検索部23
へ渡す。次に、状態遷移モデルデータベース9の状態遷
移モデルにおける概念の内、登録画像のキーワードとし
て画像データベース11に登録されているものが状態遷
移モデルから選択される。つまり、例えば図6に示す状
態遷移モデルに存在する概念の内、"Human-face"のみが
キーワードとして画像と共に画像データベース11に登
録されているものとすると、この"Human-face"が選択さ
れる。
【0050】そして、検索部23が、"Human-face"から
下位階層へ、遷移ルールを逆行することにより到達する
最下位階層の概念において、検索要求として与えられた
シーン記述言語との比較を行う。より詳しくは、状態遷
移モデルの下位階層における遷移ルールは、シーン記述
言語の各パラメータが満たすべき条件として与えられて
いるものであり、検索要求として与えられたシーン記述
言語の各パラメータと、上記の条件としてのシーン記述
言語の各パラメータとがどの程度一致しているかに応じ
て、上記の"Human-face"をキーワードとして画像データ
ベース11に登録されている画像に対して、候補画像と
しての得点が与えられる。なお、上記の各パラメータの
一致度が高いほど、与えられる得点も高くなるものとす
る。
【0051】上記のように、シーン記述言語の各パラメ
ータに基づく比較および得点の付与を、画像データベー
ス11に登録されているすべてのキーワードに対して行
った後、候補画像となった画像の内、あらかじめ設定さ
れている閾値よりも大きな得点を有する画像が、検索結
果の画像として画像提示部24によって検索者へ提示さ
れる。また、複数種類の検索要求がある場合は、候補画
像となった画像の内、すべての検索要求に対する得点の
平均値が上記の閾値よりも大きい画像が検索結果として
提示される。
【0052】以上のように、本実施例の画像データベー
ス装置は、画像入力部が入力したフルカラーの画像を色
に基づいて複数のセグメントに分割し、各セグメントか
ら算出した画像特徴量からシーン記述言語を作成する。
さらに、このシーン記述言語に状態遷移モデルを適用す
ることによって各セグメントの状態を可能な限り高レベ
ルの概念に遷移させ、画像データベースに画像を登録す
る際は、画像と共に、各セグメントの最終状態をキーワ
ードとして登録する。また、この時、上位階層へ遷移し
たセグメントについては、上記の最終状態と共に画像中
における該セグメントの位置も登録し、上位階層への遷
移が行われなかったセグメントについては、シーン記述
言語を登録する構成である。
【0053】これにより、登録する画像の各々に対して
登録者がキーワードを付与する作業が不要となるので、
画像データベースの作成時の登録者の作業負担を大幅に
削減することができると共に、登録者の主観によらずに
客観的なキーワードが付与されるので、画像データベー
スの汎用性および信頼性を向上させることができるとい
う効果を奏する。
【0054】また、このようにして登録された画像を検
索する際に、状態遷移モデルに存在する概念が検索要求
として与えられた場合には、この概念をキーワードとし
て画像データベースを検索すると共に、上記概念へ到達
する遷移ルールにおける下位概念をキーワードとした画
像が画像データベースに登録されているか否かの探索を
最下位概念まで順次行い、画像が登録されている場合に
は、その画像のキーワードとしての概念の状態遷移モデ
ルにおける階層に応じた得点が上記画像に与えられ、こ
の得点が所定の閾値よりも大きい画像のみを検索結果と
して検索者に提示する構成となっている。
【0055】これにより、検索者が与えた検索要求とし
ての概念がキーワードとして登録されていない場合で
も、その概念の下位階層の概念をキーワードとして登録
されている画像があれば検索結果として提示されるた
め、検索者の所望する画像が検索結果として提示される
可能性を高めることが可能となっている。この結果、よ
り抽象的な高度な概念に基づいた柔軟な検索が可能とな
るという効果を奏する。また、得点が所定の閾値よりも
大きい画像のみが提示されるため、検索者が所望する画
像とかけ離れた画像が提示されることを防止して、検索
者が所望の画像を選択する負担を軽減することが可能と
なると共に、画像データベースの信頼性を向上させるこ
とができる。
【0056】また、画像の登録の際に、本画像データベ
ース装置が保持する状態遷移モデルにより状態が遷移し
なかったセグメントについては、シーン記述言語がキー
ワードとして画像と共に登録され、検索の際に、本画像
データベース装置が保持している状態遷移モデルに存在
しない概念が検索要求として検索者から与えられた場合
には、シーン記述言語レベルでの検索要求を入力するよ
うに検索者に指示を与えると共に、画像データベースに
キーワードとして登録されている概念から遷移ルールを
逆行することにより到達可能な最下位階層の概念におけ
る遷移ルールと、検索者により検索要求として入力され
たシーン記述言語との各パラメータを比較し、その一致
度に応じて上記キーワードに対応して登録されている画
像に得点を与え、この得点が所定の閾値よりも大きい画
像のみを検索結果として提示する構成である。
【0057】これにより、本画像データベース装置が保
持している状態遷移モデルに存在しない概念を有する画
像についても、シーン記述言語を利用することにより登
録および検索を行うことが可能となるので、画像データ
ベースが状態遷移モデルのみに依存することがなく、画
像データベースの汎用性を向上させることができるとい
う効果を奏する。
【0058】なお、本発明は上記実施例に限定されるも
のではなく、例えば本実施例ではシーン記述言語のパラ
メータの種類を、セグメントの大きさ、位置、色、形
状、および主軸方向として説明したが、データベースに
登録する画像の種類に応じてこの他の要素をシーン記述
言語とすることも可能である。また、状態遷移モデルに
ついても、登録する画像の種類やデータベースの利用目
的に応じて、種々のモデルを適用することができる。
【0059】
【発明の効果】以上のように、本発明の請求項1記載の
画像データベース装置は、画像をキーワードと対応づけ
て記憶する画像記憶手段と、画像を入力する画像入力手
段と、入力画像を領域分割する画像分割手段と、分割さ
れた各領域の画像特徴量を求める画像特徴量算出手段
と、画像特徴量をシーン記述言語に変換するシーン記述
言語変換手段と、状態遷移モデルを記憶する状態遷移モ
デル記憶手段と、各領域の状態を上位階層へ遷移させる
処理を、各領域のシーン記述言語が状態遷移モデルの遷
移ルールに適合する限り行う状態遷移手段と、上記状態
遷移手段の処理によって状態が遷移した領域については
該領域の最終状態をキーワードとし、状態が遷移しなか
った領域についてはシーン記述言語をキーワードとし
て、上記入力画像と共に上記画像記憶手段へ記憶させる
登録手段とを備えている構成である。
【0060】これにより、状態遷移モデルに適合しない
概念を有する画像に対してもシーン記述言語がキーワー
ドとして自動的に付与されるので、登録者の作業負担を
軽減することが可能となると共に、記憶・検索が可能な
画像の種類が画像データベース装置が保持する状態遷移
モデルによって限定されないので、画像データベース装
置の汎用性が向上するという効果を奏する。
【0061】請求項2記載の画像データベース装置は、
検索者が検索要求を入力する検索要求入力手段と、入力
された検索要求を解析して検索を実行する際の検索キー
ワードを作成する検索要求解析手段と、上記検索キーワ
ードに従って画像記憶手段から画像を検索する画像検索
手段と、検索結果の画像を検索者へ提示する画像提示手
段とをさらに備えると共に、上記検索要求解析手段が、
入力された検索要求が状態遷移モデル中に存在する状態
である場合には、該状態および該状態から遷移ルールを
逆行して到達可能な状態すべてを検索キーワードとして
上記画像検索手段へ渡す一方、入力された検索要求が状
態遷移モデル中に状態として存在しない場合には、検索
者に検索要求入力手段によりシーン記述言語を検索要求
として入力させ、入力されたシーン記述言語を検索キー
ワードとして上記画像検索手段へ渡す構成である。
【0062】これにより、画像データベース装置が保持
している状態遷移モデルに適合しない画像の検索が要求
された場合であっても、シーン記述言語を検索要求とし
て入力させて画像の検索を行うことが可能となる。この
結果、画像データベース装置で記憶・検索が可能な画像
の種類が状態遷移モデルにより限定されることがなくな
り、より柔軟な検索が可能となると共に、画像データベ
ース装置の汎用性を向上させることが可能となるという
効果を奏する。
【0063】請求項3記載の画像データベース装置は、
シーン記述言語が、入力画像における各領域の位置を示
す位置情報を含むと共に、上記登録手段が、状態遷移手
段の処理によって状態が遷移した領域については、上記
最終状態に加えて上記位置情報をキーワードとして上記
画像記憶手段へ記憶させる構成である。
【0064】これにより、画像に含まれる物体をその位
置と共に検索要求として入力することが可能となるた
め、検索者が抱いている検索対象の画像イメージをより
具体的に画像データベース装置へ指示して検索を行うこ
とが可能となる。この結果、検索者の意志を反映したよ
り柔軟な検索が可能となり、検索効率を向上させること
ができるという効果を奏する。
【0065】請求項4記載の画像データベース装置は、
上記画像検索手段が検索キーワードに従って画像を検索
する際に、検索キーワードが状態遷移モデル中の状態で
ある場合には、該状態の状態遷移モデルにおける階層に
応じて、検索キーワードと一致するキーワードを有する
画像に得点を付与する一方、検索キーワードがシーン記
述言語である場合には、画像記憶手段に記憶されている
画像のキーワードから遷移ルールを逆行して到達可能な
状態遷移モデルの最下位階層の状態の持つシーン記述言
語と、上記検索キーワードとしてのシーン記述言語とを
比較し、その一致度に応じて上記の画像記憶手段に記憶
されている画像に得点を付与すると共に、上記画像提示
手段が、所定の得点よりも高い得点を付与された画像を
検索結果として提示する構成である。
【0066】これにより、検索者が所望する画像である
可能性の高い画像が提示されるので、検索者が検索結果
として提示された画像から所望の画像を選択する際等の
検索効率を向上させることが可能となると共に、検索者
が所望する画像からかけ離れた画像が提示される可能性
が減少するので、検索者が所望の画像を選択する負担を
軽減することができると共に、画像データベース装置の
信頼性を向上させることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例における画像データベース装
置において画像の登録を行うための構成の概略を示すブ
ロック図である。
【図2】上記画像データベース装置における画像の登録
処理の流れを示すフローチャートである。
【図3】上記の画像の登録処理の一部であり、フルカラ
ー画像から限定色画像を作成する処理の流れを示すフロ
ーチャートである。
【図4】上記画像データベース装置において登録されて
いる画像の検索を行うための構成の概略を示すブロック
図である。
【図5】上記画像データベース装置における画像の検索
処理の流れを示すフローチャートである。
【図6】上記画像データベース装置が保持する状態遷移
モデルの一例を示す説明図である。
【符号の説明】
1 画像入力部(画像入力手段) 3 限定色画像作成部(画像分割手段) 7 画像特徴量計算部(画像特徴量算出手段) 8 シーン記述言語変換部(シーン記述言語変換手
段) 9 状態遷移モデルデータベース(状態遷移モデル記
憶手段) 10 状態遷移部(状態遷移手段) 11 画像データベース(画像記憶手段) 12 データ登録部(登録手段) 21 検索要求入力部(検索要求入力手段) 22 検索要求解析部(検索要求解析手段) 23 検索部(画像検索手段) 24 画像提示部(画像提示手段)
フロントページの続き (56)参考文献 特開 平6−348758(JP,A) 特開 平5−108728(JP,A) 電子情報通信学会論文誌 D−2,V ol.J79−D−2 No.4,1996年 4月,p.476−483 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】画像をキーワードと対応づけて記憶する画
    像記憶手段と、画像を入力する画像入力手段と、入力画
    像を領域分割する画像分割手段と、分割された各領域の
    画像特徴量を求める画像特徴量算出手段と、画像特徴量
    をシーン記述言語に変換するシーン記述言語変換手段
    と、状態遷移モデルを記憶する状態遷移モデル記憶手段
    と、各領域の状態を上位階層へ遷移させる処理を、各領
    域のシーン記述言語が状態遷移モデルの遷移ルールに適
    合する限り行う状態遷移手段と、上記状態遷移手段の処
    理によって状態が遷移した領域については該領域の最終
    状態をキーワードとし、状態が遷移しなかった領域につ
    いてはシーン記述言語をキーワードとして、上記入力画
    像と共に上記画像記憶手段へ記憶させる登録手段とを備
    えていることを特徴とする画像データベース装置。
  2. 【請求項2】検索者が検索要求を入力する検索要求入力
    手段と、入力された検索要求を解析して検索を実行する
    際の検索キーワードを作成する検索要求解析手段と、上
    記検索キーワードに従って画像記憶手段から画像を検索
    する画像検索手段と、検索結果の画像を検索者へ提示す
    る画像提示手段とをさらに備えると共に、 上記検索要求解析手段が、入力された検索要求が状態遷
    移モデル中に存在する状態である場合には、該状態およ
    び該状態から遷移ルールを逆行して到達可能な状態すべ
    てを検索キーワードとして上記画像検索手段へ渡す一
    方、入力された検索要求が状態遷移モデル中に状態とし
    て存在しない場合には、検索者に検索要求入力手段によ
    りシーン記述言語を検索要求として入力させ、入力され
    たシーン記述言語を検索キーワードとして上記画像検索
    手段へ渡すことを特徴とする請求項1記載の画像データ
    ベース装置。
  3. 【請求項3】シーン記述言語が、入力画像における各領
    域の位置を示す位置情報を含むと共に、上記登録手段
    が、状態遷移手段の処理によって状態が遷移した領域に
    ついては、上記最終状態に加えて上記位置情報をキーワ
    ードとして上記画像記憶手段へ記憶させることを特徴と
    する請求項1記載の画像データベース装置。
  4. 【請求項4】上記画像検索手段が検索キーワードに従っ
    て画像を検索する際に、検索キーワードが状態遷移モデ
    ル中の状態である場合には、該状態の状態遷移モデルに
    おける階層に応じて、検索キーワードと一致するキーワ
    ードを有する画像に得点を付与する一方、検索キーワー
    ドがシーン記述言語である場合には、画像記憶手段に記
    憶されている画像のキーワードから遷移ルールを逆行し
    て到達可能な状態遷移モデルの最下位階層の状態の持つ
    シーン記述言語と、上記検索キーワードとしてのシーン
    記述言語とを比較し、その一致度に応じて上記の画像記
    憶手段に記憶されている画像に得点を付与すると共に、
    上記画像提示手段が、所定の得点よりも高い得点を付与
    された画像を検索結果として提示することを特徴とする
    請求項2記載の画像データベース装置。
JP05479495A 1995-03-14 1995-03-14 画像データベース装置 Expired - Fee Related JP3199976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05479495A JP3199976B2 (ja) 1995-03-14 1995-03-14 画像データベース装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05479495A JP3199976B2 (ja) 1995-03-14 1995-03-14 画像データベース装置

Publications (2)

Publication Number Publication Date
JPH08249349A JPH08249349A (ja) 1996-09-27
JP3199976B2 true JP3199976B2 (ja) 2001-08-20

Family

ID=12980672

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05479495A Expired - Fee Related JP3199976B2 (ja) 1995-03-14 1995-03-14 画像データベース装置

Country Status (1)

Country Link
JP (1) JP3199976B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3754791B2 (ja) * 1997-03-19 2006-03-15 キヤノン株式会社 画像検索装置及び方法
JP3720538B2 (ja) * 1997-07-15 2005-11-30 キヤノン株式会社 画像検索装置及び方法
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
US6584223B1 (en) 1998-04-02 2003-06-24 Canon Kabushiki Kaisha Image search apparatus and method
JP3720573B2 (ja) * 1998-04-02 2005-11-30 キヤノン株式会社 画像検索装置及び方法
AU2034600A (en) * 1998-11-30 2000-06-19 Henry C. Yuen Search engine for video and graphics
JP3496559B2 (ja) 1999-01-06 2004-02-16 日本電気株式会社 画像特徴量生成装置、並びに画像特徴量生成方法
US6731789B1 (en) 1999-01-29 2004-05-04 Canon Kabushiki Kaisha Image processing apparatus and method, and storage medium
JP3550681B2 (ja) 1999-12-10 2004-08-04 日本電気株式会社 画像検索装置及び方法、並びに類似画像検索プログラムを格納した記憶媒体
JP2002032751A (ja) 2000-07-18 2002-01-31 Olympus Optical Co Ltd 学習型画像分類装置及び方法並びにその処理プログラムを記録した記録媒体
JP2004234228A (ja) 2003-01-29 2004-08-19 Seiko Epson Corp 画像検索装置、画像検索装置におけるキーワード付与方法、及びプログラム
JP4266695B2 (ja) 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法
JP4353503B2 (ja) 2003-04-30 2009-10-28 キヤノン株式会社 画像処理装置
JP4622290B2 (ja) * 2004-04-14 2011-02-02 カシオ計算機株式会社 写真画像処理装置およびプログラム
JP4235604B2 (ja) 2004-11-22 2009-03-11 キヤノン株式会社 画像処理装置、画像処理方法、ならびにプログラム
JP5096776B2 (ja) 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
JP4989308B2 (ja) 2007-05-16 2012-08-01 キヤノン株式会社 画像処理装置及び画像検索方法
GB2454212B (en) * 2007-10-31 2012-08-08 Sony Corp Method and apparatus of searching for images
US8385656B2 (en) 2008-10-23 2013-02-26 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
US8280196B2 (en) 2009-05-12 2012-10-02 Canon Kabushiki Kaisha Image retrieval apparatus, control method for the same, and storage medium
JP5436104B2 (ja) 2009-09-04 2014-03-05 キヤノン株式会社 画像検索装置及び画像検索方法
JP5495934B2 (ja) 2010-05-18 2014-05-21 キヤノン株式会社 画像処理装置、その処理方法及びプログラム
CN115147793A (zh) * 2022-06-30 2022-10-04 小米汽车科技有限公司 图像检索引擎的构建方法、装置、车辆及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会論文誌 D−2,Vol.J79−D−2 No.4,1996年4月,p.476−483

Also Published As

Publication number Publication date
JPH08249349A (ja) 1996-09-27

Similar Documents

Publication Publication Date Title
JP3199976B2 (ja) 画像データベース装置
US7065521B2 (en) Method for fuzzy logic rule based multimedia information retrival with text and perceptual features
JP2776295B2 (ja) 画像インデックス生成方法及び画像インデックス生成装置
US6389417B1 (en) Method and apparatus for searching a digital image
US6556710B2 (en) Image searching techniques
US6606623B1 (en) Method and apparatus for content-based image retrieval with learning function
US6950554B2 (en) Learning type image classification apparatus, method thereof and processing recording medium on which processing program is recorded
JPH0773195A (ja) 画像検索方法並びにその装置
US8379990B2 (en) Object recognition apparatus, computer readable medium storing object recognition program, and image retrieval service providing method
JPWO2009072466A1 (ja) 画像分類装置および画像分類プログラム
JP2004522228A (ja) ディジタル画像を表現し比較する方法
JP2004334594A (ja) 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
JP2002092613A (ja) 画像処理装置および画像処理方法、並びに記録媒体
JP3683758B2 (ja) 類似画像検索システム,類似画像検索方法および類似画像検索プログラムを記録した記録媒体
CN114494272A (zh) 一种基于深度学习的金属零件快速分割方法
US6522779B2 (en) Representing an image with a posterized joint histogram
JPH08202733A (ja) 画像検索方法及びその装置
JP2000082075A (ja) 直線による画像の検索装置,検索方法およびそのプログラム記録媒体
JPH07160725A (ja) 画像検索装置
JP2000132554A (ja) 画像検索装置および画像検索方法
US6671402B1 (en) Representing an image with weighted joint histogram
JP4550398B2 (ja) 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置
JP3576759B2 (ja) 画像処理装置
JPH05108728A (ja) 画像のフアイリングならびに検索方法
JP4331882B2 (ja) 検索用要素画像抽出装置、検索参照画像入力装置及びプログラムを記録した記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090615

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090615

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100615

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees