JPH11338866A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH11338866A
JPH11338866A JP10140275A JP14027598A JPH11338866A JP H11338866 A JPH11338866 A JP H11338866A JP 10140275 A JP10140275 A JP 10140275A JP 14027598 A JP14027598 A JP 14027598A JP H11338866 A JPH11338866 A JP H11338866A
Authority
JP
Japan
Prior art keywords
recognition
rule
information
segment
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10140275A
Other languages
English (en)
Inventor
Masao Sakauchi
正夫 坂内
Atsushi Ono
敦史 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP10140275A priority Critical patent/JPH11338866A/ja
Publication of JPH11338866A publication Critical patent/JPH11338866A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 情報から抽出された特徴量に基づいて索引を
自動生成するとともに、情報の検索を付与された索引に
基づいて高速かつ効率的に行う。 【解決手段】 認識する対象画像を入力部2により取り
込む。特徴量抽出部12により、対象画像に画像処理を
施し、特徴量を抽出する。特徴量抽出部12で抽出され
た特徴量を、多次元データ管理部4の管理下において、
ルールメモリ14に記憶された認識ルールとともに、特
徴量を座標軸とする多次元データ空間にマッピングす
る。認識部15が、多次元データ空間における対象画像
と認識ルールとの位置関係を検証することによって、ル
ール照合して画像認識し、索引を自動生成する。さら
に、認識ルールを多次元データ空間に部分空間としてマ
ッピングし、部分空間修正部16により、その部分空間
を修正することによって認識ルールを修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像情報などの情
報に索引を付与して蓄積するとともに、蓄積された情報
を付与された索引に基づいて検索を行う情報処理装置に
関し、特に、情報の登録に際して情報に付与する索引を
自動生成する情報処理装置に関するものである。
【0002】
【従来の技術】近年、大量に蓄積された画像情報から必
要な画像情報を効率良く検索できるデータベースへの要
求が高まっている。
【0003】従来の画像データベースでは、画像情報を
登録する際に、登録者が、その画像情報の意味的な情報
であるキーワードを手動入力によって作成して同時に登
録していた。そして、画像情報を検索する際には、検索
者によって入力された所望する画像情報のキーワードに
基づいて、このキーワードに対応する画像情報が抽出さ
れていた。しかし、すべてのキーワードが登録者によっ
て手動入力される必要があるため、非常に効率が悪かっ
た。
【0004】これに対して、画像認識や画像理解技術を
用いて、画像情報からキーワードを自動抽出して、索引
付けする種々の試みがなされている。
【0005】例えば、本発明の発明者にかかる特開平8
−249349号公報には、画像情報から抽出された特
徴量と、画像情報を認識するための認識ルール(モデ
ル)とを比較検証することにより、索引を自動生成する
手法が開示されている。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の手法では、画像情報の特徴量と認識ルールとの比較
検証が総当たりで行なわれるため、比較検証に膨大な計
算量が必要であり、効率が非常に悪いという問題があっ
た。
【0007】本発明は、上記の問題点を解決するために
なされたもので、その目的は、情報から抽出された特徴
量に基づいて索引を自動生成するとともに、情報の検索
を付与された索引に基づいて高速かつ効率的に行うこと
ができる情報処理装置を提供することにある。
【0008】
【課題を解決するための手段】請求項1の情報処理装置
は、上記の課題を解決するために、情報を表現する特徴
量を抽出する特徴量抽出手段と、上記特徴量を座標軸と
する多次元データ空間を管理する多次元データ管理手段
と、上記多次元データ管理手段の管理下で、特徴量によ
って表現された情報と該特徴量に基づいて該情報を認識
するための照合データとを上記多次元データ空間にマッ
ピングして照合することにより、該情報を認識する認識
手段とを少なくとも備えていることを特徴としている。
【0009】上記の構成により、認識する情報を表現す
る特徴量を特徴量抽出手段によって抽出する。そして、
認識手段により、多次元データ管理手段の管理下におい
て、上記特徴量によって表現された情報と該特徴量に基
づいて該情報を認識するための照合データとを上記特徴
量を座標軸とする多次元データ空間中にマッピングして
照合することにより、該情報を認識する。
【0010】これにより、情報と認識ルールとの照合
は、多次元データ空間において、情報と認識ルールとの
位置関係、すなわち距離や包含関係を検証するだけでよ
い。よって、効率的なデータ管理ができるため、ルール
照合を高速化でき、高速な認識が可能となる。したがっ
て、索引を効率的に自動生成することができる。
【0011】請求項2の情報処理装置は、上記の課題を
解決するために、請求項1の構成に加えて、上記照合デ
ータは、階層型の状態遷移ルールの形式で表現された認
識ルールであることを特徴としている。
【0012】上記の構成により、請求項1の構成による
作用に加えて、認識ルールを状態遷移ルールとすること
により、多次元データ空間中で状態をたどることができ
るとともに、データ管理が容易となる。したがって、索
引を効率的に自動生成することができる。
【0013】請求項3の情報処理装置は、上記の課題を
解決するために、請求項2の構成に加えて、上記認識ル
ールは、上記多次元データ空間に部分空間としてマッピ
ングされるとともに、該部分空間が該多次元データ空間
の部分空間を修正する部分空間修正手段によって修正さ
れることを特徴としている。
【0014】上記の構成により、請求項2の構成による
作用に加えて、認識ルールを多次元データ空間の部分空
間としてマッピングする。これにより、多次元データ空
間での情報と認識ルールとの照合は、情報を表現する点
と認識ルールを表現する部分空間との包含関係を検証す
るだけでよい。また、認識ルールを表現した部分空間
を、多次元データ空間において、部分空間修正手段によ
り修正する。
【0015】これにより、ルール照合を高速化でき、高
速な認識が可能となる。さらに、認識ルールを変更する
場合、多次元データ空間において、認識ルールを表現し
た部分空間のレンジを修正するだけでよいため、認識ル
ールを容易に変更することができる。したがって、索引
を効率的に自動生成することができる。
【0016】請求項4の情報処理装置は、上記の課題を
解決するために、請求項1の構成に加えて、上記照合デ
ータは、認識済みの情報であることを特徴としている。
【0017】上記の構成により、請求項1の構成による
作用に加えて、認識する情報を入力し、特徴量を抽出
後、多次元データ管理手段により、多次元データ空間に
マッピングし、あらかじめ照合データとして入力されて
いる認識済みの情報と比較照合する。
【0018】これにより、照合データとして認識ルール
を用いてなくても、情報を認識することができる。よっ
て、認識ルールを作成する必要がないため、認識ルール
作成の労力を省くことができる。また、容易な学習によ
り認識機構を構築することができるため、事例べースで
の認識を効率的に行うことができる。したがって、索引
を効率的に自動生成することができる。
【0019】請求項5の情報処理装置は、上記の課題を
解決するために、検索者が検索すべき情報に対する検索
要求を入力する検索要求入力手段と、上記情報を表現す
る特徴量を座標軸とする多次元データ空間を管理する多
次元データ管理手段と、上記検索要求を上記多次元デー
タ空間にマッピング可能な形式に変換する検索要求変換
手段と、上記多次元データ管理手段の管理下で、上記特
徴量によって表現された検索要求と上記特徴量によって
表現された情報とを上記多次元データ空間にマッピング
して照合することにより、該情報を検索する検索手段と
を少なくとも備えていることを特徴としている。
【0020】上記の構成により、検索要求入力手段から
入力された検索要求は、検索要求変換手段によって、多
次元データ管理手段に管理された多次元データ空間中で
検索できる形式に変換される。検索手段では、特徴量に
よって表現された情報を検索要求変換手段で変換された
検索要求とともに多次元データ空間にマッピングして照
合することにより、情報を検索する。
【0021】これにより、情報の検索は、多次元データ
空間において、情報を表現する座標と、検索要求を表現
する座標との位置関係、すなわち距離や包含関係を検証
するだけでよい。よって、効率的なデータ管理ができる
ため、情報との照合を高速化でき、高速な検索が可能と
なる。
【0022】請求項6の情報処理装置は、上記の課題を
解決するために、請求項5の構成に加えて、上記検索手
段は、上記検索要求に対応する請求項2記載の認識ルー
ルを抽出するとともに、検索した情報を、上記多次元デ
ータ管理手段の管理下で、上記認識ルールとともに上記
多次元データ空間にマッピングして照合することによ
り、該情報を検証することを特徴としている。
【0023】上記の構成により、請求項5の構成による
作用に加えて、検索手段は、検索要求に対応する認識ル
ールを抽出し、検索対象である情報に対して、認識ルー
ルとともに多次元データ空間にマッピングして照合する
ことにより、検索結果の状態を検証する。
【0024】これにより、最終的に必要とされる認識精
度を登録時に考慮する必要がなくなるとともに、検索時
に認識精度を調整することができる。すなわち、情報の
認識および登録時には適当な認識精度を保つだけで、検
索時には必要な認識精度で使用することができる。した
がって、情報の登録時の認識精度に影響されずに、効率
的に検索を行うことができる。
【0025】請求項6の情報処理装置は、上記の課題を
解決するために、請求項5の構成に加えて、上記検索手
段は、上記検索要求に対応する請求項2記載の認識ルー
ルを抽出するとともに、上記多次元データ管理手段の管
理下で、上記認識ルールと上記特徴量によって表現され
た情報とを上記多次元データ空間にマッピングして照合
することにより、該情報を検索することを特徴としてい
る。
【0026】上記の構成により、請求項5の構成による
作用に加えて、検索手段は、検索要求に対応する認識ル
ールを抽出し、未認識の情報を認識ルールとともに多次
元データ空間にマッピングして照合することにより、情
報を検索する。
【0027】これにより、情報の登録時には特徴量を抽
出するだけで、認識は行わずに多次元データ空間へ投入
しておき、検索時に認識ルールに従って認識を行いなが
ら、検索を行うことができる。よって、検索時に、使用
する認識モデルの切替えや、認識精度の調整をすること
ができる。したがって、使用目的にあった検索を柔軟か
つ効率的に行うことができる。
【0028】請求項8の情報処理装置は、上記の課題を
解決するために、請求項1から7の何れかの構成に加え
て、上記情報は、画像情報であることを特徴としてい
る。
【0029】上記の構成により、請求項1から7の何れ
かの構成による作用に加えて、上記情報処理装置によっ
て、画像情報が登録され、検索される。上記情報処理装
置は、画像情報に好適である。
【0030】
【発明の実施の形態】本発明の一実施の形態について図
1から図20に基づいて説明すれば、以下のとおりであ
る。
【0031】図1に示すように、本実施の形態にかかる
データベース装置(情報処理装置)1は、入力部2、索
引生成部3、多次元データ管理部(多次元データ管理手
段)4、索引照合部5、ユーザインタフェース6を備え
て構成されている。
【0032】上記データベース装置1は、対象情報Gか
ら特徴量を抽出し、認識ルールなどの照合データととも
に多次元データ空間にマッピングして照合することによ
り、自動的に索引付けして、データベースDに蓄積す
る。さらに、上記データベース装置1は、ユーザ(検索
者)Hが所望する情報に対する検索要求に基づき、情報
に付与された索引に従って、情報を検索する。
【0033】ここで、上記データベース装置1が扱う情
報としては、情報の特徴量を抽出できるものであればよ
く、テキスト情報、画像情報、音声情報、およびそれら
の複合されたマルチメディア情報などが考えられる。そ
して、上記データベース装置1の構成において、情報の
形態による本質的な違いはない。
【0034】そこで、以下では、上記データベース装置
1を画像情報の登録および検索を行う画像データベース
装置として、説明する。
【0035】上記の画像データベース装置であるデータ
ベース装置1では、画像情報は、各セグメントの最終認
識結果と特徴量である多次元データ空間における座標値
とによって索引付けされて登録される。
【0036】ここで、上記セグメント(segment 、領
域)とは、画像情報の中の画素値が同一もしくは類似し
ている隣接画素を統合しひとまとまりとしたものであ
る。上記多次元データ空間とは、照合データ(セグメン
トまたは認識ルール)の各特徴量を座標軸とする空間で
ある。ここで、上記認識ルールは、セグメントの特徴量
および他のセグメントとの位置関係から構成される。ま
た、あるセグメントが認識される場合に満たすべき、他
のセグメントとの空間的位置関係を表す認識ルールを、
関連ルールという。
【0037】よって、上記セグメントは上記多次元デー
タ空間中の点として表現される。また、上記認識ルール
は上記多次元データ空間中の部分空間として表現され
る。
【0038】また、データベース装置1では、登録され
ている画像情報は、検索要求に基づき、画像情報に付与
された索引に従って、検索される。ここで、上記検索要
求は、対象物名、特徴量、他の対象物との位置関係など
から構成される。なお、検索要求の表現には、自然言語
を用いてもよいし、特別な言語を規定してもよいし、そ
の他の方法を用いても構わない。
【0039】よって、登録されている画像情報の検索
は、上記検索要求に基づいて、認識結果の上記セグメン
トと上記認識ルールとを、上記多次元データ空間中にマ
ッピングして照合することにより行われる。
【0040】つづいて、図1に示した上記入力部2は、
認識する対象情報Gを取り込む入力手段である。画像デ
ータベース装置においては、スキャナなどの画像入力装
置である。
【0041】上記多次元データ管理部4は、特徴量を座
標軸とする多次元データ空間を管理する。
【0042】上記索引生成部3は、対象情報Gから特徴
量を抽出し、照合データとともに上記多次元データ管理
部4が管理する多次元データ空間にマッピングして照合
することにより、自動的に索引付けを行う。
【0043】上記索引照合部5は、ユーザHが入力した
検索要求を多次元データに変換し、上記多次元データ管
理部4が管理する多次元データ空間において、データベ
ースDに登録されている画像情報と照合することによ
り、検索を行う。
【0044】上記ユーザインタフェース6は、ユーザH
が検索要求を入力するキーボードやマウスなどの入力デ
バイスと、画像を表示するCRTや液晶表示装置などの
表示デバイスから構成されている。
【0045】なお、索引生成部3および多次元データ管
理部4から登録処理部P1が構成されている。また、索
引照合部5および多次元データ管理部4から検索処理部
P2が構成されている。
【0046】さらに、上記データベース装置1のすべて
の処理は、図示しない制御部が処理プログラムを実行す
ることによって行われる。そして、データベース装置1
の上記処理プログラムは、フロッピィーディスク、ハー
ドディスク、磁気テープ、CD−ROM/光ディスク/
光磁気ディスク/MDなどのメディア、およびROM/
RAMメモリなどの記録媒体にコンピュータで読み取り
可能に記録されている。
【0047】これにより、上記データベース装置1は、
認識する対象情報Gである画像情報が入力部2から入力
される。入力部2により入力された画像情報は、索引生
成部3によって画像処理が施され、特徴量が抽出され
る。索引生成部3により抽出された特徴量は、多次元デ
ータ管理部4の管理下の多次元データ空間中で認識ルー
ルと照合されて認識され、索引付けされる。生成された
索引は、画像情報とともに画像データベースDに登録さ
れる。
【0048】また、ユーザHによってユーザインタフェ
ース6を介して入力された検索要求は、索引照合部5に
より多次元データ空間中での部分空間、および状態リス
トに変換される。変換された検索要求は、多次元データ
管理部4の管理下において、画像データベースDに蓄積
された画像情報の索引と照合されて検索され、表示され
る。
【0049】A.索引自動生成処理 データベース装置1における索引の自動生成処理につい
て説明する。
【0050】上記登録処理部P1について説明する。登
録処理部P1は、索引生成部3および多次元データ管理
部4を備えて構成されている。
【0051】図2に示すように、上記索引生成部3は、
入力メモリ11、特徴量抽出部(特徴量抽出手段)1
2、特徴量メモリ13、ルールメモリ14、認識部(認
識手段)15、部分空間修正部(部分空間修正手段)1
6を備えて構成されている。
【0052】上記入力メモリ11は、入力部2から入力
された対象情報Gである画像情報を記憶するためのメモ
リである。
【0053】上記特徴量抽出部12は、入力メモリ11
に記憶された対象情報Gである画像情報を解析し、特徴
量を抽出する。
【0054】上記特徴量メモリ13は、特徴量抽出部1
2により抽出された画像情報の特徴量を記憶するための
メモリである。
【0055】上記ルールメモリ14は、画像情報を特徴
量に基づいて認識するため照合データとして認識ルール
を記憶するメモリである。記憶される認識ルールは、特
徴量を座標軸とする多次元データ空間にマッピング可能
な形式で表現されている。
【0056】上記認識部15は、多次元データ管理部4
の管理下において、多次元データ空間に特徴量を点とし
て、認識ルールを部分空間としてマッピングし、包含関
係を検証することにより照合して、認識を行う。
【0057】上記部分空間修正部16は、認識ルールの
変更を、多次元データ空間中の部分空間を変更すること
により行う。変更された認識ルールは多次元データ管理
部4を通してルールメモリ14に反映される。
【0058】多次元データ管理部4は、特徴量メモリ1
3に記憶された特徴量と、ルールメモリ14に記憶され
た認識ルールを、多次元データ空間において管理すると
ともに、照合する。
【0059】つぎに、図3に示すフローチャートを用い
て、登録処理部P1で行われる画像情報に対する索引の
自動生成処理の概略について説明する。
【0060】画像入力処理(ステップS21)におい
て、入力部2を介して、対象情報Gの画像情報を入力メ
モリ11に読み込む。
【0061】減色処理(ステップS22)において、画
像入力処理(S21)により入力された画像を適当な色
数に減色する。減色の結果、画素値が同一である隣接画
素がひとまとまりに統合された複数個の同一色のセグメ
ント(領域)に分割される。なお、この処理の詳細は後
述する。
【0062】領域統合処理(ステップS23)におい
て、滅色処理(S22)により分割された複数個のセグ
メントを、隣接する類似色ごとに領域統合する。
【0063】なお、本実施の形態においては、上記の滅
色処理(S22)および領域統合処理(S23)によっ
て画像の領域分割を行うが、他の手法を用いてもよい。
【0064】特徴量抽出処理(ステップS24)におい
て、領域統合処理(S23)により領域分割された各セ
グメントの特徴量を抽出する。なお、本実施の形態にお
いては、セグメントの特徴量は重心座標、色、面積、円
形度、占有率、縦横比、主軸方向などを用いるが、これ
に限定されるものではない。
【0065】正規化処理(ステップS25)において、
特徴量抽出処理(S24)により抽出された特徴量を、
多次元データ空間に投入するために正規化し、特徴量メ
モリ13に記憶する。
【0066】以上の減色処理(S22)から正規化処理
(S25)は、特徴量抽出部12によって行われる。
【0067】データ投入処理(ステップS26)におい
て、正規化処理(S25)で求めた正規化特徴量を座標
として、各セグメントを多次元データ空間に投入する。
【0068】認識処理(ステップS27)において、認
識部15により、多次元データ管理部4の管理下におい
て、多次元データ空間中で画像情報と認識ルールとのマ
ッチングを行い、認識を行う。なお、この処理の詳細は
後述する。
【0069】登録処理(ステップS28)において、多
次元データ空間で認識ルールと一致したセグメントの状
態に基づいて、画像情報に対して索引付けし、画像デー
タベースDに画像情報とともに登録する。
【0070】つづいて、図4に示すフローチャートを用
いて、前記の減色処理(図3,S22)について詳細に
説明する。
【0071】ステップS31において、入力メモリ11
から対象情報Gの画像情報を読み出す。
【0072】つぎに、分割すべき部分空間を決定するた
めに、ステップS32からステップS34の処理をすべ
ての部分空間に対して行う。
【0073】まず、ステップS32において、読み出し
た画像情報の画素値から各部分空間の色空間におけるヒ
ストグラムを生成する。
【0074】ここで、ヒストグラムの生成について、赤
(R)・緑(G)・青(B)の各要素がそれぞれが25
6階調で表現された色空間を例として、具体的に説明す
る。画像情報の各色は、RGB空間中の一辺256(0
から255)の立方体中の点として表される。この一辺
256の立方体を、一辺8(BlockSize )の立方体であ
るセルに分割する。つぎに、画像中の画素のRGB値を
求め、その画素がRGB空間中でどのセルに属するかを
求めて、その画素の属するセルの頻度値を1だけ増加さ
せる。この処理を画像中のすべての画素に対して行うこ
とにより、ヒストグラムを作成する。
【0075】すなわち、色空間をRGB空間(0≦R,
G,B≦255)とし、これをBlockSize*BlockSize*Bl
ockSize (個)のセルに分割する。そして、画素の頻度
値のカウンタをhist[256/BlockSize][256/BlockSiz
e][256/BlockSize]とする。このとき、読み出した画
像の画素は、その画素値(R,G,B)に応じたセル
[R/BlockSize][G/BlockSize][B/BlockSize]に
入る。そこで、画像中のすべての画素に対して、頻度値
を、 hist[R/BlockSize][G/BlockSize][B/BlockSiz
e]++ としてカウントすることにより、ヒストグラムが得られ
る。
【0076】つぎに、ステップS33において、ステッ
プS32により生成されたヒストグラムから主成分分析
法などを用いて、主軸を計算する。
【0077】そして、ステップS34において、ステッ
プS32により生成されたヒストグラムの成分を、ステ
ップS33により計算された主軸上に投影し、1次元ヒ
ストグラムを生成する。この1次元ヒストグラムに対
し、大津の判別分析法などを適用して、分割点およびそ
の分割点で分割した場合のクラスタ間分散を計算する。
【0078】ステップS35において、すべての部分空
間に対してステップS32からステップS34の処理を
施したことを確認し、ステップS36へ移行する。
【0079】ステップS36において、ステップS34
で計算されたクラスタ間分散が最大の部分空間を選択す
る。
【0080】ステップS37において、ステップS34
で計算された分割点により、ステップS36により選択
された部分空間を2分割する。
【0081】ステップS38において、部分空間数Nu
mを2だけ増加させる。これは、部分空間が2分割され
たためである。
【0082】ステップS39において、部分空間数Nu
mと所定の部分空間数TH Numとを比較する。ここ
で、部分空間数Numが所定の部分空間数TH Num
よりも小さければ(YES)、ステップS32に戻り、
上記の処理を繰り返す。一方、それ以外の場合は(N
O)、部分空間が規定の部分空間数TH Num以上の
数の部分空間に分割されたので、ステップS40へ移行
する。なお、所定の部分空間数TH Numは、適宜選
択することができる。
【0083】ステップS40において、分割された各部
分空間の頻度値の重心に対応する画素値をその部分空間
の代表色とする。そして、この代表色でその部分空間に
含まれる色を置換する。これにより、減色処理が行われ
る。
【0084】なお、本実施の形態では、説明の都合上、
上記の色空間を用いたが、これに限定するものではなく
他の色空間を用いてもよい。
【0085】つづいて、図5に示すフローチャートを用
いて、前記の認識処理(図3,S27)について詳細に
説明する。
【0086】ステップS41において、認識対象となる
セグメントを取り出す。
【0087】ステップS42において、多次元データ空
間中で、ステップS41で取り出されたセグメントを表
現する点を包含する部分空間として表現される認識ルー
ル(以下では、「セグメントを包含する認識ルール」と
記す。)の存在の有無を判定する。セグメントを包含す
る認識ルールがなければ(NO)、認識ルールが存在し
ないことになり、このセグメントに対する認識処理は終
了する。一方、セグメントを包含する認識ルールが存在
すれば(YES)、ステップS43へ進む。
【0088】ステップS43において、ステップS42
で存在が確認されたセグメントを包含する認識ルールが
関連ルールを持つか否かを判定する。セグメントを包含
する認識ルールが関連ルールを持たなければ(NO)、
セグメントは認識ルールを満たすこととなり、認識処理
は終了する。一方、セグメントを包含する認識ルールが
関連ルールを持つ場合には(YES)、ステップS44
へ進む。
【0089】ステップS44において、ステップS43
で存在が確認された関連ルールを満たすセグメント(関
連セグメント)を検索する。関連セグメントの検索は、
多次元データ空間における認識ルールとセグメントとの
包含関係のみを検証することにより行う。
【0090】ここで、関連セグメントの検索の結果、関
連ルールを満たすセグメントが存在すれば、認識ルール
を満たすという結果を得て認識処理を終了する。一方、
関連ルールを満たすセグメントが存在しなければ、認識
ルールを満たさないという結果を得て認識処理を終了す
る。
【0091】さらに、前記認識処理(図3,S27)に
ついて、具体例をあげて説明する。なお、簡単のため
に、多次元データ空間を2次元とする。
【0092】図16に示すように、セグメントObject1
からObject5までのセグメント、および、認識ルールRu
le1からRule3までの認識ルールが、多次元データ空間
にマッピングされているとする。また、認識ルールRule
1には、 RR1:「近傍に、認識ルールRule2を満たすセグメン
トがある」 という関連ルールがあるものとする。
【0093】まず、セグメントを一つ抽出する(S4
1)。ここでは、セグメントObject1を取り出す。そし
て、このセグメントObject1を包含する認識ルールを抽
出する(S42)。しかし、セグメントObject1を包含
する認識ルールは存在しない。これにより、セグメント
Object1に対する認識処理は終了する。
【0094】つぎに、セグメントObject2を取り出す
(S41)。このセグメントObject2を包含する認識ル
ールとして、認識ルールRule3を取り出す(S42)。
取り出された認識ルールRule3に関連ルールが存在する
か否かをチェックする(S43)。上述のように、関連
ルールを持っているのは、認識ルールRule1のみであ
る。よって、認識ルールRule3には関連ルールはない。
したがって、セグメントObject2は認識ルールRule3を
満たすこととなる。これにより、セグメントObject2に
対する認識処理は終了する。
【0095】つぎに、セグメントObject3を取り出す
(S41)。このセグメントObject3を包含する認識ル
ールとして、認識ルールRule1を取り出す(S42)。
この認識ルールRule1は、関連ルールRR1を持つ。そ
こで、この関連ルールRR1を満たす関連セグメントを
検索する(S44)。
【0096】まず、認識ルールRule2を満たすセグメン
トを検索する。認識ルールRule2には、二つのセグメン
トObject4,Object5が包含されている。しかも、認識
ルールRule2には関連ルールが存在しない。よって、セ
グメントObject4,Object5は、ともに認識ルールRule
2を満たすことになる。
【0097】つぎに、関連ルールRR1における関連を
検証する。関連ルールRR1には、関連として「近傍」
が規定されている。なお、関連ルールの関連は認識部1
5によって定義されている。そこで、多次元データ空間
における「近傍」の範囲を検索する。図16中では、セ
グメントObject3を中心とする破線の矩形が「近傍」の
範囲である。この範囲検索によりセグメントObject4が
検索される。セグメントObject4が認識ルールRule2を
満たしているので、関連ルールRR1は満たされる。よ
って、セグメントObject3は認識ルールRule1を満たす
こととなる。これにより、セグメントObject3に対する
認識処理は終了する。
【0098】そして、セグメントObject4,Object5に
ついては、すでに認識ルールRule2を満たすことが検証
されている。したがって、すべてセグメントに対する認
識処理が完了した。
【0099】このように、画像のセグメントと認識ルー
ルとを多次元データ管理部4の管理下で多次元データ空
間にマッピングする。これにより、効率的なデータ管理
が可能となり、高速な認識が可能となる。すなわち、認
識ルールを表現する部分空間に包含されるセグメントを
抽出するとともに、関連ルールを表現する部分空間に包
含されるセグメントを抽出するだけで、画像の認識が可
能であり、索引を効率的に自動生成することができる。
【0100】ここで、本実施の形態にかかる認識ルール
は、階層型の状態遷移ルールの形式でも表現することが
できる。もちろん、階層型の状態遷移ルールの形式の認
識ルールも、多次元データ管理部4の管理下で、多次元
データ空間にマッピングできる。
【0101】なお、上記状態遷移モデルとは、階層型の
認識モデルであり、認識されるセグメントは認識モデル
中のいずれかの状態を持っている。そして、セグメント
の状態が、ある状態から別の状態に遷移するためには、
それらの状態間に設定されている状態遷移ルールを満た
す必要がある。
【0102】図15を用いて、上記状態遷移モデルにつ
いて、具体的に説明する。状態遷移モデルとは、図15
に示すような状態遷移図と、状態遷移ルールとからなる
階層型の認識モデルである。例えば、“color seg",
“blue seg",“white seg"などの状態において、あ
らかじめ設定された状態遷移ルールが満たされれば、実
矢線で示すように状態が上位階層へ遷移する。この動作
を、状態遷移ルールが満たされる限り繰り返すことによ
って、後述するセグメントの状態をより上位概念に遷移
させる。なお、同図の最上段の“sky",“sea",“moun
tain" などは、後述する検索要求の対象物名であり、下
向きの破矢線で示すように、“sky seg" ,“water
seg",“cloud seg"などの状態に解析変換される。
【0103】図6に示すフローチャートを用いて、認識
ルールが階層型の状態遷移ルールである場合の前記認識
処理(図3,S27)について詳細に説明する。
【0104】ステップS51において、認識対象となる
セグメントを取り出す。
【0105】ステップS52において、多次元データ空
間中で、ステップS51で取り出されたセグメントを包
含する認識ルールの存在の有無を判定する。セグメント
を包含する認識ルールがなければ(NO)、認識ルール
が存在しないことになり、このセグメントに対する認識
処理は終了する。一方、セグメントを包含する認識ルー
ルが存在すれば(YES)、ステップS53へ進む。
【0106】ここで、認識ルールが状態遷移ルールであ
るため、セグメントの状態を遷移させるためには、状態
間に設定されている状態遷移ルールを満たす必要があ
る。すなわち、セグメントを包含する認識ルールが存在
する場合であっても、セグメントと認識ルールとの状態
が一致しなければ、その認識ルールを適用することがで
きない。
【0107】そこで、ステップS53において、セグメ
ントが現在持っている状態とセグメントを包含する認識
ルールの状態との一致を検証する。セグメントと認識ル
ールとの状態が一致しなければ(NO)、この認識ルー
ルを適用することはできないため、認識処理は終了す
る。一方、セグメントと認識ルールとの状態が一致すれ
ば(YES)、ステップS54に進む。
【0108】ステップS54において、ステップS52
で存在が確認され、ステップS53で状態の一致が確認
されたセグメントを包含する認識ルールが関連ルールを
持つか否かを判定する。セグメントを包含する認識ルー
ルが関連ルールを持たなければ(NO)、セグメントは
認識ルールを満たすこととなり、ステップS57へ進
む。一方、セグメントを包含する認識ルールが関連ルー
ルを持つ場合には(YES)、ステップS55へ進む。
【0109】ステップS55において、ステップS54
で存在が確認された関連ルールに包含され、かつ、状態
が一致するセグメント(関連セグメント)を検索する。
関連セグメントの検索は、多次元データ空間における認
識ルールとセグメントとの包含関係のみを検証すること
により行う。
【0110】ステップS56において、ステップS55
での検索の結果、関連セグメントが存在するか否かを判
定する。関連ルールに包含され、かつ、状態が一致する
セグメントが存在すれば(YES)、ステップS57へ
進む。一方、関連ルールに包含され、かつ、状態が一致
するセグメントが存在しなければ(NO)、この認識ル
ールを適用することはできないため、認識処理は終了す
る。
【0111】ステップS57において、セグメントの状
態を更新する。その後、ステップS52に戻り、状態が
遷移しなくなるまで、上記処理を繰り返す。
【0112】さらに、認識ルールが階層型の状態遷移ル
ールである場合の前記認識処理(図3,S27)につい
て、具体例をあげて説明する。なお、簡単のために、多
次元データ空間を2次元とする。
【0113】図17に示すように、セグメントObject1
からObject6までのセグメント、および、認識ルールRu
le1からRule4までの認識ルールが、多次元データ空間
にマッピングされているとする。ただし、図17に示し
ているのは認識途中の状態である。
【0114】また、認識ルールRule1からRule4の内容
は、以下のとおりである。 Rule1: color seg -> blue seg Rule2: blue seg -> sky seg Rule3: color seg -> red seg Rule4: green seg -> mountain seg
【0115】そして、認識ルールRule2には、 RR2:「下方に、状態が“mountain seg"であるセグ
メントが存在する。」 という関連ルールがあるものとする。
【0116】まず、セグメントを一つ抽出する(S5
1)。ここでは、セグメントObject1を取り出す。そし
て、このセグメントObject1を包含する認識ルールを検
索し、認識ルールRule1を取り出す(S52)。セグメ
ントObject1の持つ状態と、認識ルールRule1が表す状
態の遷移を比較する(S53)。ここで、セグメントOb
ject1の状態は“color seg"であり、認識ルールRule
1は“color seg"から“blue seg ”への遷移を表す
認識ルールである。したがって、セグメントObject1の
持つ状態と、認識ルールRule1が表す状態は一致してい
る。つぎに、認識ルールRule1に関連ルールが存在する
か否かをチェックする(S54)。上述のように、関連
ルールを持っているのは、認識ルールRule2のみであ
り、認識ルールRule1には関連ルールはない。よって、
セグメントObject1は認識ルールRule1を満たすこ
とになる。したがって、セグメントObject1の状
態を“color seg"から“blue seg ”へ変更する(S
57)。
【0117】つぎに、セグメントObject2を取り出す
(S51)。このセグメントObject2を包含する認識ル
ールを検索し、認識ルールRule1を取り出す(S5
2)。セグメントObject2の持つ状態と、認識ルールRu
le1が表す状態の遷移を比較する(S53)。ここで、
セグメントObject2の状態は“blue seg"であり、認識
ルールRule1は“color seg"から“blue seg ”への
遷移を表す認識ルールである。したがって、セグメント
Object2の持つ状態と、認識ルールRule1が表す状態は
一致していない。よって、セグメントObject2に対し
て、認識ルールRule1を適用できない。これにより、セ
グメントObject2に対する認識処理は終了する。
【0118】つぎに、セグメントObject3を取り出す
(S51)。このセグメントObject3を包含する認識ル
ールを検索し、認識ルールRule1,Rule2を取り出す
(S52)。セグメントObject3の持つ状態と、認識ル
ールRule1,Rule2が表す状態の遷移を比較する(S5
3)。ここで、セグメントObject3の状態は“blue se
g"である。これに対して、認識ルールRule1は“color
seg"から“blue seg ”への遷移を表す認識ルールで
ある。したがって、セグメントObject3の持つ状態と、
認識ルールRule1が表す状態は一致しない。よって、セ
グメントObject3に対して、認識ルールRule1を適用で
きない。一方、認識ルールRule2は“blue seg"から“sk
y seg"への遷移を表す認識ルールである。したがっ
て、セグメントObject3の持つ状態と、認識ルールRule
2が表す状態は一致している。よって、認識ルールRule
2に関連ルールが存在するか否かをチェックする(S5
4)。
【0119】このとき、関連ルールがなければ、セグメ
ントObject3は認識ルールRule2を満たすこととなり、
セグメントObject3に対する認識処理は終了する。しか
し、上述のように、認識ルールRule2には関連ルールR
R2がある。そこで、この関連ルールRR2を満たす関
連セグメントを検索する(S55)。
【0120】まず、状態“mountain seg"を認識するた
めの認識ルールには、認識ルールRule4がある。そこ
で、認識ルールRule4に包含されるセグメントを検索す
ることにより、セグメントObject4を取り出す(S5
6)。このとき、セグメントObject4の状態が関連セグ
メントの状態である“mountain seg"であれば、関連ル
ールRR2を満たすことになる。しかし、セグメントOb
ject4の状態は、“mountain seg"ではない。
【0121】ただし、セグメントObject4は、認識ルー
ルRule4に包含されていることから、その状態が“moun
tain seg"に変更される可能性がある。そこで、セグメ
ントObject4に対する認識処理を、セグメントObject3
に対する認識処理よりも先に終了させ、その結果をセグ
メントObject3の認識処理に反映させる。まず、セグメ
ントObject4の持つ状態と、認識ルールRule4が表す状
態の遷移を比較する(S53)。ここで、セグメントOb
ject4の状態は“green seg"であり、認識ルールRule
4は“green seg"から“mountain seg ”への遷移を
表す認識ルールである。したがって、セグメントObject
4の持つ状態と、認識ルールRule4が表す状態は一致し
ている。つぎに、認識ルールRule4に関連ルールが存在
するか否かをチェックする(S54)。上述のように、
認識ルールRule4には関連ルールはない。よって、セグ
メントObject4は認識ルールRule4を満たすことにな
る。したがって、セグメントObject4の状態を“green
seg"から“mountain seg”へ変更する(S57)。
【0122】これを受けて、セグメントObject3の認識
処理に戻る。セグメントObject4の状態は、関連セグメ
ントの状態となった。よって、関連ルールRR2を満た
すセグメントObject4が存在するので、セグメントObje
ct3は認識ルールRule2を満たすこととなる。したがっ
て、セグメントObject3の状態を“blue seg"から“sk
y seg ”へ変更する(S57)。
【0123】つぎに、セグメントObject5を取り出す
(S51)。そして、このセグメントObject5を包含す
る認識ルールを検索し、認識ルールRule3を取り出す
(S52)。セグメントObject5の持つ状態と、認識ル
ールRule3が表す状態の遷移を比較する(S53)。こ
こで、セグメントObject5の状態は“color seg"であ
り、認識ルールRule3は“color seg"から“red se
g ”への遷移を表す認識ルールである。したがって、セ
グメントObject5の持つ状態と、認識ルールRule3が表
す状態は一致している。つぎに、認識ルールRule3に関
連ルールが存在するか否かをチェックする(S54)。
上述のように、認識ルールRule3には関連ルールはな
い。よって、セグメントObject5は認識ルールRule3を
満たすことになる。したがって、セグメントObject5の
状態を“color seg"から“red seg”へ変更する
(S57)。
【0124】つぎに、セグメントObject6を取り出す
(S51)。そして、このセグメントObject6を包含す
る認識ルールを検索するが、該当する認識ルールは存在
しない。これにより、セグメントObject6に対する認識
処理は終了する。
【0125】以上のように、これらの一連の処理がすべ
てのセグメントの状態が更新されなくなるまで繰り返さ
れる。
【0126】このように、認識ルールとして階層型の状
態遷移ルールを用いた場合にも、認識ルールとセグメン
トとの包含関係と状態の照合のみで画像の認識が可能で
あり、索引を効率的に自動生成することができる。
【0127】前述のように認識ルールは、セグメントの
特徴量および関連ルールから構成される。そして、特徴
量は多次元データ空間における部分空間として表現さ
れ、多次元データ管理部4により管理されている。
【0128】したがって、認識ルールがこのように管理
されているため、部分空間修正部16を設けることによ
り、認識ルールの修正を部分空間の修正という簡便な操
作で行うことができる。
【0129】例えば、多次元データ空間内の認識ルール
およびデータをユーザHに分かり易い形式に変換して提
示すれば、ユーザHはそれらの空間座標から判断して、
認識ルールのパラメータ(座標軸)を調整することがで
きる。つまり、認識ルールがあるパラメータに対して厳
密過ぎればそのパラメータに対するレンジを広げれば良
いし、逆に寛容過ぎればレンジを狭めれば良い。
【0130】なお、修正された認識ルールは多次元デー
タ管理部4を介して、ルールメモリ14に伝達され、更
新される。
【0131】このように、部分空間修正部16を設け
て、認識ルールの一部である多次元データ空間における
部分空間を修正する。これにより、認識ルールが多次元
データ管理部4によって多次元データ空間にマッピング
されて管理されているため、認識ルールを変更する場合
に、多次元データ空間中の部分空間のレンジを修正する
だけでよく、認識ルールを容易に変更することができ
る。
【0132】上記の登録処理部P1を構成する索引生成
部3は、つぎのように構成することもできる。
【0133】図7に示すように、上記索引生成部3は、
入力メモリ11、特徴量抽出部(特徴量抽出手段)1
2、特徴量メモリ13、認識部(認識手段)15、ルー
ルメモリ17を備えて構成されている。これは、図2に
示したルールメモリ14および部分空間修正部16の代
わりに、ルールメモリ17を設けた構成である。
【0134】上記ルールメモリ17は、照合データであ
る認識ルールを記憶するメモリである。ルールメモリ1
7には、特徴量を座標軸とする多次元データ空間にマッ
ピング可能な形式で表現されていない認識ルールも記憶
することができる。この場合、認識部15は、ルールメ
モリ17から読み出した認識ルールの特徴量を、多次元
データ空間中での部分空間に変換して、多次元データ管
理部4に出力する。
【0135】つづいて、図8に示すフローチャートを用
いて、索引生成部3が図7の構成である場合の前記認識
処理(図3,S27)について詳細に説明する。
【0136】ステップS61において、認識ルールを一
つルールメモリ17から読み出す。
【0137】ステップS62において、ステップS61
で読み出した認識ルールの特徴量を、多次元データ空間
中での部分空間に変換する。
【0138】ステップS63において、ステップS62
で変換された部分空間に包含されるセグメントを表現す
る点を、多次元データ管理部4を介して検索する。
【0139】ステップS64において、ステップS63
での検索の結果、認識ルールの部分空間に包含されるセ
グメントが存在しなければ(NO)、認識ルールは満た
されないこととなり、ステップS68へ進む。一方、認
識ルールの部分空間に包含されるセグメントが存在すれ
ば(YES)、ステップS65へ進む。
【0140】ステップS65において、認識ルールに他
のセグメントとの関連ルールがあるか否かを判定する。
他のセグメントとの関連ルールがない場合(NO)、認
識ルールが満たされたこととなり、認識処理は終了す
る。一方、他のセグメントとの関連ルールがある場合
(YES)、ステップS66へ進む。
【0141】ステップS66において、多次元データ管
理部4により、ステップS65で存在が確認された関連
ルールを満たすセグメント(関連セグメント)を検索す
る。関連セグメントの検索は、多次元データ空間におけ
る認識ルールとセグメントとの包含関係のみを検証する
ことにより行う。
【0142】ステップS67において、ステップS66
での検索の結果、関連セグメントが存在する場合(YE
S)、認識ルールは満たされることとなり、認識処理を
終了する。一方、関連セグメントが存在しない場合(N
O)、認識ルールは満たされないこととなり、ステップ
S68へ進む。
【0143】ステップS68において、未検証の認識ル
ールの存在を判定する。ここで、未検証の認識ルールが
存在すれば(YES)、ステップS61へ戻り、未検証
の認識ルールなくなるまで、上記処理を繰り返す。一
方、未検証の認識ルールが存在しなければ(NO)、認
識処理を終了する。
【0144】さらに、索引生成部3が図7の構成である
場合の前記認識処理(図3,S27)について、具体例
をあげて説明する。なお、簡単のために、多次元データ
空間を2次元とする。
【0145】図16に示すように、セグメントObject1
からObject5までのセグメント、および、認識ルールRu
le1からRule3までの認識ルールが、多次元データ空間
にマッピングされるものとする。また、認識ルールRule
1には、 RR1:「近傍に、認識ルールRule2を満たすセグメン
トがある」 という関連ルールがあるものとする。
【0146】まず、認識ルールを一つ取り出す(S6
1)。ここでは、認識ルールRule1を取り出す。そし
て、この認識ルールRule1を多次元データ空間中での部
分空間に変換する(S62)。認識ルールRule1の部分
空間に包含されるセグメントを範囲検索する(S6
3)。認識ルールRule1の部分空間に包含されるセグメ
ントとして、セグメントObject3が存在するので(S6
4)、認識ルールRule1に関連ルールが存在するか否か
をチェックする(S65)。上述のように、認識ルール
Rule1には関連ルールRR1が存在する。
【0147】つぎに、認識ルールRule1の関連ルールR
R1である認識ルールRule2の部分空間に包含されるセ
グメントを検索する(S66)。その結果、二つのセグ
メントObject4,Object5が検索される。これらに対
し、セグメントObject3の「近傍」であるという関連を
チェックする。すなわち、多次元データ空間における
「近傍」の定義より、セグメントObject3の「近傍」
は、セグメントObject3を中心とする破線の矩形の範囲
である。したがって、二つのセグメントのうち、セグメ
ントObject4がセグメントObject3の近傍に存在するこ
とが確認できる(S67)。よって、関連ルールRR1
を満たす関連セグメント(セグメントObject4)が検索
されたので、セグメントObject3は認識ルールRule1を
満たすこととなる。これにより、認識ルールRule1によ
る認識処理は終了する。
【0148】以上の処理をすべての認識ルールに対して
行う。すなわち、認識ルールRule3についても同様にし
て、認識ルールRule3を満たすセグメントObject3を検
索する。
【0149】このように、認識する画像を入力し、特徴
量を抽出後、多次元データ管理部4により、多次元デー
タ空間にマッピングし、認識ルールの部分空間とセグメ
ントの座標の包含関係を検証するだけで、画像の認識が
可能であり、索引を効率的に自動生成することができ
る。特に、ルール照合を高速化できるため、高速な画像
認識が可能となる。
【0150】また、上記の登録処理部P1を構成する索
引生成部3は、つぎのように構成することもできる。
【0151】図9に示すように、上記索引生成部3は、
入力メモリ11、特徴量抽出部(特徴量抽出手段)1
2、特徴量メモリ13、認識部(認識手段)15、特徴
量比較部(認識手段)18を備えて構成されている。こ
れは、図2に示したルールメモリ14および部分空間修
正部16の代わりに、特徴量比較部18を設けた構成で
ある。
【0152】上記特徴量比較部18は、多次元データ管
理部4によって多次元データ空間中にマッピングされた
画像を表現する特徴量の座標と、その座標の近傍に存在
する画像の認識結果とを比較照合する。
【0153】ここで、多次元データ管理部4には、特徴
量比較部18によって入力された未認識の画像情報の特
徴量と比較照合するために、認識済みの画像が学習デー
タセット(照合データ)としてあらかじめ入力され、管
理保持されている。
【0154】これにより、認識する対象情報Gが入力部
2によって入力され、特徴量抽出部12によって画像処
理が施され、特徴量が抽出される。特徴量抽出部12に
よって抽出された特徴量は、多次元データ管理部4によ
って管理保持される。抽出された特徴量は、特徴量比較
部18によって、多次元データ管理部4にあらかじめ管
理保持されている学習データセットと比較照合され、画
像認識が行われる。
【0155】図10に示すフローチャートを用いて、索
引生成部3が図9の構成である場合の前記認識処理(図
3,S27)について詳細に説明する。
【0156】ステップS71において、認識対象となる
セグメントを取り出す。
【0157】ステップS72において、ステップS71
で取り出されたセグメントを表現する座標の近傍に存在
するセグメントを、多次元データ管理部4によって抽出
する。なお、多次元データ管理部4には、ステップS7
1で取り出されたセグメントと比較するために、認識済
みの画像が学習データセットとしてあらかじめ入力さ
れ、管理保持されている。
【0158】ステップS73において、特徴量比較部1
8で、ステップS71で取り出したセグメントの状態
と、ステップS72で抽出されたセグメントの状態とを
比較する。
【0159】ステップS74において、ステップS73
での比較の結果、対象のセグメントの状態が、その座標
の近傍に位置する学習データセットのセグメントの状態
と同一である場合には、対象のセグメントは、学習デー
タセットのセグメントと同一の状態を持つと考えられ
る。よって、一致した状態が対象のセグメントの状態で
あると最終的に決定し、画像を認識する。
【0160】さらに、索引生成部3が図9の構成である
場合の前記認識処理(図3,S27)すなわち事例ベー
スでの認識処理について、具体例をあげて説明する。な
お、簡単のために、多次元データ空間を2次元とする。
【0161】図18に示すように、四つの物体を表すセ
グメント(●,■,▲,×)、および、セグメントObje
ct1からObject5までのセグメントが、多次元データ空
間にマッピングされるものとする。
【0162】まず、セグメントを一つ取り出す(S7
1)。ここでは、セグメントObject1を取り出す。そし
て、多次元データ管理部4により、このセグメントObje
ct1の近傍に存在するセグメント(近傍セグメント)を
抽出する(S72)。ここで、近傍領域は、セグメント
を中心とする破線の丸で囲まれた部分として定義されて
いる。セグメントObject1の抽出された近傍セグメント
の認識状態をチェックする(S73)。セグメントObje
ct1の近傍セグメントは、すべて同一の物体(●)を表
している。よって、近傍セグメントが同一認識状態であ
るので、セグメントObject1も、これら近傍セグメント
(●)の認識状態と同一の状態として認識する(S7
4)。
【0163】同様にして、セグメントObject2は、セグ
メントObject2の近傍セグメント(■)の認識状態と同
一の状態として認識する。セグメントObject3は、セグ
メントObject3の近傍セグメント(▲)の認識状態と同
一の状態として認識する。セグメントObject5は、セグ
メントObject5の近傍セグメント(×)の認識状態と同
一の状態として認識する。
【0164】なお、セグメントObject4には、近傍セグ
メントとして、様々な物体(■,▲,×)を表す認識状
態が混在している。したがって、セグメントObject4の
認識は困難となり、認識を行わない。
【0165】このように、認識する画像を入力し、特徴
量を抽出後、多次元データ管理部4により、多次元デー
タ空間にマッピングし、あらかじめ入力されている学習
データセットと比較照合することにより、画像の認識が
可能であり、索引を効率的に自動生成することができ
る。さらに、認識ルールを作成する必要がないため、認
識ルール作成の労力を省けるとともに、容易な学習によ
り認識機構を構築することが可能となる。特に、事例べ
ースでの認識を効率的に行うことができる。
【0166】B.画像検索処理 データベース装置1における画像の検索について説明す
る。
【0167】図1に示した検索処理部P2について説明
する。検索処理部P2は、索引照合部5および多次元デ
ータ管理部4を備えて構成されている。
【0168】図11に示すように、上記検索処理部P2
は、検索要求入力部(検索要求入力手段)21、検索要
求解析部(検索要求変換手段)22、検索要求変換部
(検索要求変換手段)23、検索部(検索手段)24、
状態テーブル管理部25、検索結果提示部26を備えて
構成されている。
【0169】上記検索要求入力部21は、ユーザインタ
フェース6を介して、ユーザHが検索要求を入力する。
【0170】上記検索要求解析部22は、検索要求入力
部21から入力された検索要求を解析し、中間状態に変
換する。
【0171】上記検索要求変換部23は、検索要求解析
部22によって解析され、中間表現に変換された検索要
求を、多次元データ管理部4に管理された多次元データ
空間にマッピング可能な最終的な検索要求の形式に変換
する。
【0172】上記検索部24は、検索要求変換部23に
よって変換された検索要求に基づき、画像検索を行う。
検索部24は、多次元データ管理部4および状態テーブ
ル管理部25に接続されている。
【0173】ここで、多次元データ管理部4は、入力さ
れている画像情報および認識ルールを管理するととも
に、多次元データ空間にマッピングする。
【0174】また、上記状態テーブル管理部25は、各
セグメントの最終的に認識された状態を管理する。
【0175】上記検索結果提示部26は、検索部24に
より検索された結果を、ユーザインタフェース6を介し
て、ユーザ(検索者)Hに提示する。
【0176】つぎに、図12に示すフローチャートを用
いて、画像検索の概略について説明する。
【0177】検索要求入力処理(ステップS81)で
は、ユーザHからの検索要求が、ユーザインタフェース
6を介して、検索要求入力部21に入力される。
【0178】検索要求解析処理(ステップS82)は、
検索要求解析部22において、ステップS81で入力さ
れた検索要求を解析する。
【0179】中間表現変換処理(ステップS83)は、
検索要求解析部22において、ステップS82で解析さ
れた検索要求を中間表現に変換する。
【0180】検索要求変換処理(ステップS84)は、
検索要求変換部23において、ステップS82・S83
で解析変換された検索要求に基づいて、最終的な検索要
求を決定する。ここで、最終的な検索要求とは、多次元
データ空間で検索を行うための部分空間のレンジ、およ
び状態遷移モデルを用いて検索すべき状態のリスト(状
態リスト)である。
【0181】セグメント検索処理(ステップS85)
は、検索部24において、ステップS84で決定された
部分空間に包含されるセグメントを、多次元データ管理
部4によって管理された多次元データ空間中で検索す
る。これにより、特徴量を満たすセグメントの集合を生
成することができる。
【0182】状態検索処理(ステップS86)は、検索
部24において、ステップS84で決定された状態リス
ト中のいずれかの状態を持つセグメントを、状態テーブ
ル管理部25によって管理されているテーブルから抽出
して、検索結果の候補を得る。
【0183】検索結果統合処理(ステップS87)は、
検索部24において、ステップS85・S86で得られ
た検索結果の候補を統合して、検索要求に対する検索結
果を求める。
【0184】検索結果提示処理(ステップS88)は、
ステップS87で得られた検索結果を、ユーザインタフ
ェース6を介して、ユーザHに提示する。
【0185】ここで、上記の画像検索処理を、具体例を
示して説明する。本実施の形態にかかるデータベース装
置1には、対象物名、特徴量、他の対象物との位置関係
からなる検索要求が入力される。なお、検索要求は自然
言語で表現してもよいし、他の方法を用いてもよい。
【0186】例えば、つぎのような検索要求が入力され
たとする(S81)。 「上部に青い空があり、その下に山があり、右端に人が
いる」
【0187】上記検索表現は、つぎのような中間表現の
検索要求に解析変換される(S82,S83)。 (1)sky * upper blue * * (2)mountain * * * * * (3)human right * * * * (4)1 upper 2
【0188】中間表現の検索要求には、対象物を記述し
たものと対象物同士の関係を記述したものとがある。こ
の例では、検索要求(1),(2),(3)が対象物の
記述であり、検索要求(4)が対象物同士の関係を記述
したものである。そして、このように中間表現に変換さ
れた検索要求を、最終的な検索要求(多次元データ空間
中における部分空間のレンジおよび状態リスト)に変換
する(S84)。
【0189】検索要求(1)の例を説明すると、検索要
求(1)は対象物が“sky"、特徴が[*,upper,blue,*,
*]となっている。後半の特徴部分からは、多次元デー
タ空間における部分空間が生成される。前述したよう
に、多次元データ空間は特徴量を座標軸としているた
め、これらの特徴量に対応する軸が存在する。ここで、
“*"は考慮しないことを表しているので、“upper",
“blue”に対応するレンジを決定することになる。この
ように決定された部分空間に包含されるセグメントを検
索すれば、上記特徴量を満たすセグメントの集合を生成
することができる。
【0190】また、対象物である“sky"からは、状態遷
移モデルを用いて検索すべき状態リストを生成する。
【0191】ここで、図15に示す状態遷移モデルを用
いるとする。最上位概念である“sky"から下層に向かっ
て状態遷移モデルをたどっていくと、つぎのような道筋
が検出される。これが状態リストである。 sky -> sky seg -> blue seg -> color s
eg sky -> cloud seg -> white seg -> color s
eg
【0192】つまり、ここで検出されたいずれかの状態
を持つセグメントは、“sky"と認識される可能性があ
る。よって、上記状態リスト中のいずれかの状態を持つ
セグメントを、状態テーブル管理部25によって管理さ
れているテーブルから抽出することにより、検索結果の
候補が得られる(S86)。
【0193】そして、得られた検索結果の候補を統合す
ることにより、検索要求(1)に対する検索結果が求め
られる(S87)。検索要求(2),(3)に対して
も、同様の処理により検索結果が求められる。検索要求
(4)に対しては、位置関係のみの検証であるので、多
次元データ管理部4に対し、検索要求(1)の検索結果
で得られたセグメントと、検索要求(2)の検索結果で
得られたセグメントの位置関係を照会することにより、
検索結果が求められる。
【0194】すべての検索要求に対する検索結果が得ら
れれば、すべての検索結果を統合し、ユーザHに提示さ
れる(S88)。
【0195】このように、検索要求入力部21から入力
された検索要求は、検索要求解析部22によって解析さ
れ、中間表現に変換される。中間表現に変換された検索
要求は、検索要求変換部23によって、多次元データ管
理部4に管理された多次元データ空間中で検索できる形
式に変換する。検索部24では、検索要求変換部23で
変換された検索要求に基づき、階層型の状態遷移ルール
に従って、索引付けされた画像情報を画像データベース
Dから検索する。この検索結果を検索結果提示部26に
よって、検索者であるユーザHに提示する。
【0196】これにより、高速かつ効率的に画像の検索
を行うことができる。
【0197】上述した索引生成処理の結果、画像には、
各セグメントの最終認識結果および特徴量(多次元デー
タ空間における座標値)が索引として付されている。し
たがって、上記の画像検索処理では、索引付けされてい
る最終認識結果および特徴量を用いて検索を行う。
【0198】例えば、図15に示した状態遷移モデルを
用いて認識が行われて、索引付けされた画像に対して、
“sky"を検索要求として検索する場合を考える。検索要
求が“sky"であるから、最終認識結果が“sky seg",
“cloud seg"のセグメントは検索結果となる。また、
最終認識結果が“sky seg",“cloud seg"に遷移可
能である“blue seg",“white seg"であるセグメン
トは検索結果候補とされる。検索結果候補は、多次元デ
ータ空間中にマッピングされている認識ルールと照合さ
れて、認識される可能性(遷移確率)が計算される。こ
の遷移確率が規定の閾値以上であれば、このセグメント
は検索結果とされる。
【0199】なお、上記の画像検索処理では、状態リス
トを使用している。しかし、検索要求により、多次元デ
ータ空間中での検索すべき部分空間を規定することは可
能である。ただし、その部分空間内には多数の無関係な
セグメントが包含されている可能性がある。そこで、状
態リストを用いて、部分空間に包含されるセグメントか
ら、検索要求を満たす可能性があるセグメントを絞り込
むことができる。したがって、検索要求を満たす可能性
を持つ候補は、最終的に検索要求から作成された部分空
間に包含され、かつ状態リストのいずれかの状態を持つ
セグメントとなる。
【0200】つづいて、図13に示すフローチャートを
用いて、図12に示した画像検索処理の結果の認識状態
を、検索時に再検証する処理について説明する。なお、
以下の処理は、検索部24において行われる。
【0201】ステップS91において、検索結果統合処
理(図12,S87)により得られた検索結果が検索候
補として入力される。
【0202】ステップS92において、検索要求に対す
る認識ルールを抽出する。
【0203】ステップS93において、ステップS91
で入力された検索候補とステップS92で抽出された認
識ルールとの包含関係を検証する。ここで、認識ルール
が検索候補を包含すれば(YES)、ステップS94へ
進む。一方、認識ルールが検索候補を包含しなければ
(NO)、この検索候補は棄却される。
【0204】ステップS94において、ステップS92
で抽出された認識ルールの関連ルールの有無を判定す
る。ここで、認識ルールの関連ルールが存在しなれば
(NO)、ステップS91で入力された検索候補は、認
識ルールの検証が成立するため、検索結果とする。一
方、認識ルールの関連ルールが存在すれば(YES)、
ステップS95へ進む。
【0205】ステップS95において、ステップS94
で存在が確認された関連ルールの部分空間を満たす関連
セグメントを検索する。
【0206】ステップS96において、ステップS95
での範囲検索の結果を判定する。ここで、範囲検索の結
果が存在すれば(YES)、ステップS91で入力され
た検索候補は、認識ルールの検証が成立するため、検索
結果とする。一方、範囲検索の結果が存在しなければ
(NO)、ステップS91で入力された検索候補は棄却
される。
【0207】さらに、画像検索処理の結果の認識状態を
検索時に再検証する前記の処理について、具体例をあげ
て説明する。なお、簡単のために、多次元データ空間を
2次元とする。
【0208】図19に示すように、セグメントObject1
からObject8までのセグメント、および、認識ルールRu
le1およびRule2の認識ルールが、多次元データ空間に
マッピングされるものとする。また、認識ルールRule1
には、 RR1:「近傍に、認識ルールRule2を満たすセグメン
トがある」 という関連ルールがあるものとする。
【0209】上記のセグメントObject1からObject8
は、五つの画像image1からimage5を表す。すなわち、 image1:Object2 image2:Object3,Object6 image3:Object4 image4:Object5,Object7 image5:Object1,Object4,Object8
【0210】まず、検索候補を入力する(S91)。こ
こでは、セグメントObject1からObject5を検索候補と
する。そして、検索要求に対する認識ルールとして、認
識ルールRule1を抽出する(S92)。つぎに、セグメ
ントObject1からObject5と、認識ルールRule1との包
含関係をチェックする(S93)。その結果、セグメン
トObject1は認識ルールRule1に包含されないため、セ
グメントObject1を検索対象から除外する。この他のセ
グメントObject2からObject5は、認識ルールRule1に
包含されるため、認識ルールRule1の関連ルールの有無
を判定する(S94)。
【0211】上述のように、認識ルールRule1は関連ル
ールRR1をもつ。そこで、認識ルールRule1の関連ル
ールRR1である認識ルールRule2の部分空間に包含さ
れる関連セグメントを検索する(S95)。検索の結
果、セグメントObject6,Object7,Object8が認識ル
ールRule2に包含される。
【0212】以上より、検索候補とされたセグメント
(S93)と、関連ルールを満たすセグメント(S9
5)の両方にセグメントを持つ画像を検索結果とする。
したがって、画像image2およびimage4が両方にセグメ
ントを持っているので、検索結果となる。
【0213】このように、検索時に検索対象となるセグ
メントに対し、多次元データ空間中で管理されている認
識ルールを用いて、検索結果の状態を検証する。
【0214】これにより、最終的に必要とされる認識精
度を登録時に考慮する必要がなくなるとともに、検索時
に認識精度を調整することができる。すなわち、画像情
報の認識および登録時には適当な認識精度を保つだけ
で、検索時に必要な認識精度で使用することができる。
したがって、画像情報の登録時の認識精度に影響されず
に、効率的に検索を行うことができる。
【0215】さらに、図14に示すフローチャートを用
いて、検索時に認識ルールの検証を行う処理について説
明する。なお、以下の処理は、検索部24において行わ
れる。
【0216】ステップS101において、ステップS8
4(図12)により変換された最終的な検索要求である
部分空間のレンジおよび状態リストが入力される。
【0217】ステップS102において、ステップS1
01で入力された検索要求の特徴量部分に基づき、多次
元データ空間における範囲検索が行われ、候補が抽出さ
れる。
【0218】ステップS103において、ステップS1
01で入力された検索要求の対象物名に対応する認識ル
ールが抽出される。
【0219】ステップS104において、多次元データ
空間中で、ステップS103で抽出された認識ルールに
包含されるセグメントを抽出する。抽出されたセグメン
トは、ステップSl03で抽出されたルールを満たす可
能性があるセグメントの集合である。
【0220】ステップS105において、ステップS1
03で抽出された認識ルールに関連ルールがあるか否か
を判定する。関連ルールが存在する場合(YES)、ス
テップS106に進む。一方、関連ルールが存在しない
場合(NO)、ステップS107に進む。
【0221】ステップS106において、多次元データ
空間中で、ステップS105で存在が確認された関連ル
ールに対する範囲検索を行い、最終的な認識ルールの照
合を行う。これにより、ステップS103で抽出された
認識ルールを満たすセグメントの集合が抽出される。
【0222】ステップS107において、ステップS1
05で関連ルールが存在しなかった場合、ステップS1
02の結果とステップS106の結果とを統合し、検索
結果とする。また、ステップS105で関連ルールが存
在した場合、ステップS102の結果とステップS10
6の結果とを統合し、検索結果とする。
【0223】さらに、検索時に認識ルールの検証を行う
前記の処理について、具体例をあげて説明する。なお、
簡単のために、多次元データ空間を2次元とする。
【0224】図20に示すように、セグメントObject1
からObject8までのセグメント、および、認識ルールRu
le1からRule3の認識ルールが、多次元データ空間にマ
ッピングされるものとする。
【0225】また、認識ルールRule1からRule3の内容
は、以下のとおりである。 Rule1: blue seg -> sky seg Rule2: color seg -> blue seg Rule3: green seg -> mountain seg
【0226】そして、認識ルールRule1には、 RR3:「下方に、認識ルールRule3を満たすセグメン
トがある」 という関連ルールがあるものとする。
【0227】また、上記のセグメントObject1からObje
ct8は、それぞれ画像を表す。具体的には、つぎのよう
になっている。 image1:Object1 image2:Object2,Object7 image3:Object3,Object6 image4:Object4
【0228】まず、変換された最終的な検索要求の部分
空間Aのレンジおよび状態リストを入力する(S10
1)。ここでは、検索要求が“sky"であるとする。よっ
て、状態遷移モデル(図15)より、最上位概念である
“sky"からは、つぎのような状態リストが得られる。 sky seg, cloud seg ,blue seg, white seg, colo
r seg
【0229】以下では、 sky seg -> blue seg -> color seg の経路のみを考えて説明する。
【0230】上記の検索要求の部分空間Aのレンジにお
いて、範囲検索を行い候補を抽出する(S102)。こ
こでは、検索要求の部分空間Aには、セグメントObject
1からObject4が包含されており、これらが候補として
抽出される。
【0231】また、入力された状態リストに対応する認
識ルールを選択する(S103)。ここでは、認識ルー
ルRule1およびRule2が選択される。
【0232】続くステップS104からS107の処理
は、ステップS104で選択された認識ルールごとに行
う。
【0233】まず、認識ルールRule1に対して以下の処
理を行う。選択された認識ルールRule1の部分空間に包
含されるセグメントを検索する(S104)。ここで
は、セグメントObject1およびObject2が検索される。
【0234】つぎに、認識ルールRule1の関連ルールの
有無をチェックする(S105)。上述したように、認
識ルールRule1には、関連ルールRR3である認識ルー
ルRule3がある。
【0235】さらに、関連ルールRR3である認識ルー
ルRule3に対して、範囲検索を行う(S106)。ここ
では、セグメントObject6およびObject7が検索され
る。
【0236】そして、検索結果を統合する(S10
7)。すなわち、つぎの三つの範囲検索の結果、すべて
に含まれるセグメントが存在すれば、そのセグメントに
よって表される画像が検索対象である。 ・検索要求の部分空間Aのレンジにおける範囲検索(S
102) ・状態リストに対応する認識ルールの部分空間における
範囲検索(S104) ・関連ルールの部分空間における範囲検索(S106) ここでは、画像image 2のセグメントがすべての検索結
果に含まれているので、画像image 2が検索対象とな
る。
【0237】同様の処理を、認識ルールRule2に対して
行う。選択された認識ルールRule2の部分空間に包含さ
れるセグメントを検索する(S104)。ここでは、セ
グメントObject3,Object4,Object5が検索される。
【0238】つぎに、認識ルールRule2の関連ルールの
有無をチェックする(S105)。上述したように、認
識ルールRule2は関連ルールを持たない。よって、関連
ルールの部分空間における範囲検索(S106)は行わ
ない。
【0239】そして、検索結果を統合する(S10
7)。ここでは、ステップS102およびS104での
検索結果の積を取り、セグメントObject3およびObject
4が得られる。この二つのセグメントが検索結果候補で
ある。
【0240】ここで、認識ルールRule2には、さらに上
位概念である認識ルールRule1が存在する。したがっ
て、認識ルールRule2から得られた検索結果候補は、上
位概念である認識ルールRule1に対する遷移確率(満足
度)を計算し、この遷移確率が規定の閾値よりも高けれ
ば検索結果とする。
【0241】このように、情報の登録時には特徴量を抽
出するだけで、認識は行わずに多次元データ空間へ投入
する。そして、検索時には、認識ルールの検証を行う。
これにより、検索時に使用する認識モデルの切替えや認
識精度の調整を行うことができる。よって、使用目的に
あった検索を柔軟かつ効率的に行うことができる。
【0242】以上のように、本実施の形態にかかるデー
タベース装置1では、画像情報などの情報の登録時に、
入力部2により取り込まれた対象情報に対して、特徴量
抽出部12により前処理を施し、特徴量を抽出する。そ
して、認識部15により、多次元データ管理部4の管理
下において、特徴量によって表現された対象情報と特徴
量に基づいて対象情報を認識するための認識ルールと
を、特徴量を座標軸とする多次元データ空間にマッピン
グして照合し、対象情報を認識する。
【0243】これにより、情報と認識ルールとの照合
は、多次元データ空間において、情報と認識ルールとの
位置関係、すなわち距離や包含関係を検証するだけで行
うことができる。よって、効率的なデータ管理ができる
ため、ルール照合を高速化でき、高速な認識が可能とな
る。したがって、索引を効率的に自動生成し、データベ
ースに登録することができる。
【0244】また、本実施の形態にかかるデータベース
装置1では、画像情報などの情報の検索時に、検索者に
よって入力された検索すべき情報に対する検索要求を取
り込む。そして、検索要求解析部22および検索要求変
換部23により、検索要求を、上記多次元データ空間に
マッピング可能な形式に変換する。検索部24により、
多次元データ管理部4の管理下において、変換された検
索要求とデータベースに索引付けられて登録されている
情報とを、多次元データ空間にマッピングして照合し、
検索者が所望する情報を検索する。
【0245】これにより、情報の検索は、多次元データ
空間において、情報と検索要求との位置関係、すなわち
距離や包含関係を検証するだけで行うことができる。よ
って、効率的なデータ管理ができるため、情報との照合
を高速化でき、高速な検索が可能となる。
【0246】なお、本実施の形態は本発明の範囲を限定
するものではなく、本発明の範囲内で種々の変更が可能
である。
【0247】
【発明の効果】請求項1の発明の情報処理装置は、以上
のように、情報を表現する特徴量を抽出する特徴量抽出
手段と、上記特徴量を座標軸とする多次元データ空間を
管理する多次元データ管理手段と、上記多次元データ管
理手段の管理下で、特徴量によって表現された情報と該
特徴量に基づいて該情報を認識するための照合データと
を上記多次元データ空間にマッピングして照合すること
により、該情報を認識する認識手段とを少なくとも備え
ている構成である。
【0248】それゆえ、情報と認識ルールとの照合は、
多次元データ空間において、情報と認識ルールとの位置
関係、すなわち距離や包含関係を検証するだけでよい。
よって、効率的なデータ管理ができるため、ルール照合
を高速化でき、高速な認識が可能となる。したがって、
索引を効率的に自動生成することができるという効果を
奏する。
【0249】請求項2の発明の情報処理装置は、以上の
ように、請求項1の構成に加えて、上記照合データは、
階層型の状態遷移ルールの形式で表現された認識ルール
である構成である。
【0250】それゆえ、請求項1の構成による効果に加
えて、認識ルールを状態遷移ルールとすることにより、
多次元データ空間中で状態をたどることができるととも
に、データ管理が容易となる。したがって、索引を効率
的に自動生成することができるという効果を奏する。
【0251】請求項3の発明の情報処理装置は、以上の
ように、請求項2の構成に加えて、上記認識ルールは、
上記多次元データ空間に部分空間としてマッピングされ
るとともに、該部分空間が該多次元データ空間の部分空
間を修正する部分空間修正手段によって修正される構成
である。
【0252】それゆえ、請求項2の構成による効果に加
えて、ルール照合を高速化でき、高速な認識が可能とな
る。さらに、認識ルールを変更する場合、多次元データ
空間において、認識ルールを表現した部分空間のレンジ
を修正するだけでよいため、認識ルールを容易に変更す
ることができる。したがって、索引を効率的に自動生成
することができるという効果を奏する。
【0253】請求項4の発明の情報処理装置は、以上の
ように、請求項1の構成に加えて、上記照合データは、
認識済みの情報である構成である。
【0254】それゆえ、請求項1の構成による効果に加
えて、照合データとして認識ルールを用いてなくても、
情報を認識することができる。よって、認識ルールを作
成する必要がないため、認識ルール作成の労力を省くこ
とができる。また、容易な学習により認識機構を構築す
ることができるため、事例べースでの認識を効率的に行
うことができる。したがって、索引を効率的に自動生成
することができるという効果を奏する。
【0255】請求項5の発明の情報処理装置は、以上の
ように、検索者が検索すべき情報に対する検索要求を入
力する検索要求入力手段と、上記情報を表現する特徴量
を座標軸とする多次元データ空間を管理する多次元デー
タ管理手段と、上記検索要求を上記多次元データ空間に
マッピング可能な形式に変換する検索要求変換手段と、
上記多次元データ管理手段の管理下で、上記特徴量によ
って表現された検索要求と上記特徴量によって表現され
た情報とを上記多次元データ空間にマッピングして照合
することにより、該情報を検索する検索手段とを少なく
とも備えている構成である。
【0256】それゆえ、情報の検索は、多次元データ空
間において、情報を表現する座標と、検索要求を表現す
る座標との位置関係、すなわち距離や包含関係を検証す
るだけでよい。よって、効率的なデータ管理ができるた
め、情報との照合を高速化でき、高速な検索が可能とな
るという効果を奏する。
【0257】請求項6の発明の情報処理装置は、以上の
ように、請求項5の構成に加えて、上記検索手段は、上
記検索要求に対応する請求項2記載の認識ルールを抽出
するとともに、検索した情報を、上記多次元データ管理
手段の管理下で、上記認識ルールとともに上記多次元デ
ータ空間にマッピングして照合することにより、該情報
を検証する構成である。
【0258】それゆえ、請求項5の構成による効果に加
えて、最終的に必要とされる認識精度を登録時に考慮す
る必要がなくなるとともに、検索時に認識精度を調整す
ることができる。すなわち、情報の認識および登録時に
は適当な認識精度を保つだけで、検索時には必要な認識
精度で使用することができる。したがって、情報の登録
時の認識精度に影響されずに、効率的に検索を行うこと
ができるという効果を奏する。
【0259】請求項6の発明の情報処理装置は、以上の
ように、請求項5の構成に加えて、上記検索手段は、上
記検索要求に対応する請求項2記載の認識ルールを抽出
するとともに、上記多次元データ管理手段の管理下で、
上記認識ルールと上記特徴量によって表現された情報と
を上記多次元データ空間にマッピングして照合すること
により、該情報を検索する構成である。
【0260】それゆえ、請求項5の構成による効果に加
えて、情報の登録時には特徴量を抽出するだけで、認識
は行わずに多次元データ空間へ投入しておき、検索時に
認識ルールに従って認識を行いながら、検索を行うこと
ができる。よって、検索時に、使用する認識モデルの切
替えや、認識精度の調整をすることができる。したがっ
て、使用目的にあった検索を柔軟かつ効率的に行うこと
ができるという効果を奏する。
【0261】請求項8の発明の情報処理装置は、以上の
ように、請求項1から7の何れかの構成に加えて、上記
情報は、画像情報である構成である。
【0262】それゆえ、請求項1から7の何れかの構成
による効果に加えて、上記情報処理装置によって、画像
情報が登録され、検索される。上記情報処理装置は、画
像情報に好適である。
【図面の簡単な説明】
【図1】本発明の一実施の形態にかかるデータベース装
置の構成の概略を示すブロック図である。
【図2】図1に示したデータベース装置の登録処理部の
構成の概略を示すブロック図である。
【図3】図2に示したデータベース装置の登録処理部で
行われる画像情報の登録処理の概略を示すフローチャー
トである。
【図4】図3に示した画像情報の登録処理に含まれる減
色処理の手順を示すフローチャートである。
【図5】図3に示した画像情報の登録処理に含まれる認
識処理の手順を示すフローチャートである。
【図6】図3に示した画像情報の登録処理に含まれる認
識処理の他の手順を示すフローチャートである。
【図7】図1に示したデータベース装置の登録処理部の
他の構成の概略を示すブロック図である。
【図8】図7に示したデータベース装置の登録処理部で
行われる画像情報の登録処理に含まれる認識処理の手順
を示すフローチャートである。
【図9】図1に示したデータベース装置の登録処理部の
さらに他の構成の概略を示すブロック図である。
【図10】図9に示したデータベース装置の登録処理部
で行われる画像情報の登録処理に含まれる認識処理の手
順を示すフローチャートである。
【図11】図1に示したデータベース装置の検索処理部
の構成の概略を示すブロック図である。
【図12】図11に示したデータベース装置の検索処理
部で行われる画像情報の検索処理の概略を示すフローチ
ャートである。
【図13】図11に示したデータベース装置の検索処理
部で行われる画像情報の他の検索処理の概略を示すフロ
ーチャートである。
【図14】図11に示したデータベース装置の検索処理
部で行われる画像情報のさらに他の検索処理の概略を示
すフローチャートである。
【図15】図1に示したデータベース装置で用いられる
状態遷移モデルの一例を示す説明図である。
【図16】図5および図8に示した画像情報の登録処理
に含まれる認識処理の手順の具体例を示す説明図であ
る。
【図17】図6に示した画像情報の登録処理に含まれる
認識処理の他の手順の具体例を示す説明図である。
【図18】図10に示した画像情報の登録処理に含まれ
る認識処理の手順の具体例を示す説明図である。
【図19】図13に示した画像情報の他の検索処理の概
略の具体例を示す説明図である。
【図20】図14に示した画像情報のさらに他の検索処
理の概略の具体例を示す説明図である。
【符号の説明】
1 データベース装置(情報処理装置) 4 多次元データ管理部(多次元データ管理手段) 12 特徴量抽出部(特徴量抽出手段) 15 認識部(認識手段) 16 部分空間修正部(部分空間修正手段) 18 特徴量比較部(認識手段) 21 検索要求入力部(検索要求入力手段) 22 検索要求解析部(検索要求変換手段) 23 検索要求変換部(検索要求変換手段) 24 検索部(検索手段)

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】情報を表現する特徴量を抽出する特徴量抽
    出手段と、 上記特徴量を座標軸とする多次元データ空間を管理する
    多次元データ管理手段と、 上記多次元データ管理手段の管理下で、特徴量によって
    表現された情報と該特徴量に基づいて該情報を認識する
    ための照合データとを上記多次元データ空間にマッピン
    グして照合することにより、該情報を認識する認識手段
    とを少なくとも備えていることを特徴とする情報処理装
    置。
  2. 【請求項2】上記照合データは、階層型の状態遷移ルー
    ルの形式で表現された認識ルールであることを特徴とす
    る請求項1記載の情報処理装置。
  3. 【請求項3】上記認識ルールは、上記多次元データ空間
    に部分空間としてマッピングされるとともに、該部分空
    間が該多次元データ空間の部分空間を修正する部分空間
    修正手段によって修正されることを特徴とする請求項2
    記載の情報処理装置。
  4. 【請求項4】上記照合データは、認識済みの情報である
    ことを特徴とする請求項1記載の情報処理装置。
  5. 【請求項5】検索者が検索すべき情報に対する検索要求
    を入力する検索要求入力手段と、 上記情報を表現する特徴量を座標軸とする多次元データ
    空間を管理する多次元データ管理手段と、 上記検索要求を上記多次元データ空間にマッピング可能
    な形式に変換する検索要求変換手段と、 上記多次元データ管理手段の管理下で、上記特徴量によ
    って表現された検索要求と上記特徴量によって表現され
    た情報とを上記多次元データ空間にマッピングして照合
    することにより、該情報を検索する検索手段とを少なく
    とも備えていることを特徴とする情報処理装置。
  6. 【請求項6】上記検索手段は、 上記検索要求に対応する請求項2記載の認識ルールを抽
    出するとともに、 検索した情報を、上記多次元データ管理手段の管理下
    で、上記認識ルールとともに上記多次元データ空間にマ
    ッピングして照合することにより、該情報を検証するこ
    とを特徴とする請求項5記載の情報処理装置。
  7. 【請求項7】上記検索手段は、 上記検索要求に対応する請求項2記載の認識ルールを抽
    出するとともに、 上記多次元データ管理手段の管理下で、上記認識ルール
    と上記特徴量によって表現された情報とを上記多次元デ
    ータ空間にマッピングして照合することにより、該情報
    を検索することを特徴とする請求項5記載の情報処理装
    置。
  8. 【請求項8】上記情報は、画像情報であることを特徴と
    する請求項1から7の何れかに記載の情報処理装置。
JP10140275A 1998-05-21 1998-05-21 情報処理装置 Pending JPH11338866A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10140275A JPH11338866A (ja) 1998-05-21 1998-05-21 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10140275A JPH11338866A (ja) 1998-05-21 1998-05-21 情報処理装置

Publications (1)

Publication Number Publication Date
JPH11338866A true JPH11338866A (ja) 1999-12-10

Family

ID=15264996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10140275A Pending JPH11338866A (ja) 1998-05-21 1998-05-21 情報処理装置

Country Status (1)

Country Link
JP (1) JPH11338866A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128976A (ja) * 2003-09-30 2005-05-19 Toshiba Corp 機器制御装置、機器制御システム及び機器制御方法
WO2013175771A1 (ja) 2012-05-24 2013-11-28 パナソニック株式会社 画像検索システム及び画像検索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128976A (ja) * 2003-09-30 2005-05-19 Toshiba Corp 機器制御装置、機器制御システム及び機器制御方法
WO2013175771A1 (ja) 2012-05-24 2013-11-28 パナソニック株式会社 画像検索システム及び画像検索方法

Similar Documents

Publication Publication Date Title
CN111858954B (zh) 面向任务的文本生成图像网络模型
CN112101357B (zh) 一种rpa机器人智能元素定位拾取方法及系统
WO2021073417A1 (zh) 表情生成方法、装置、设备及存储介质
Hwang et al. Reading between the lines: Object localization using implicit cues from image tags
US9008446B2 (en) Interactive concept learning in image search
US9037600B1 (en) Any-image labeling engine
CN102254192B (zh) 基于模糊k近邻的三维模型半自动标注方法及系统
Liu et al. Instance-specific feature propagation for referring segmentation
CN102629275A (zh) 面向跨媒体新闻检索的人脸-人名对齐方法及系统
US20090012830A1 (en) Apparatus, method, and program for extracting work item
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
US20080037904A1 (en) Apparatus, method and program storage medium for image interpretation
JP2007310646A (ja) 検索情報管理装置、検索情報管理プログラムおよび検索情報管理方法
JP2012194691A (ja) 識別器の再学習方法、再学習のためのプログラム、及び画像認識装置
CN110580299B (zh) 生成对象的推荐语的配图的方法、系统、设备及存储介质
KR20110039900A (ko) 지능형 인식 라이브러리 및 관리 도구를 활용한 고문서 이미지 데이터 인식 및 처리 방법
CN116681382A (zh) 物料清单的数据抓取方法、系统以及可读存储介质
CN110413795A (zh) 一种数据驱动的专业知识图谱构建方法
CN111159456A (zh) 基于深度学习与传统特征的多尺度服装检索方法及系统
US20050289179A1 (en) Method and system for generating concept-specific data representation for multi-concept detection
CN113297485B (zh) 一种生成跨模态的表示向量的方法以及跨模态推荐方法
JPH11338866A (ja) 情報処理装置
US20230134218A1 (en) Continuous learning for document processing and analysis
CN115169448A (zh) 一种基于深度学习的三维描述生成和视觉定位的统一方法
Xu et al. Object-based image labeling through learning by example and multi-level segmentation