JP2001084271A - 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体 - Google Patents

情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2001084271A
JP2001084271A JP26267399A JP26267399A JP2001084271A JP 2001084271 A JP2001084271 A JP 2001084271A JP 26267399 A JP26267399 A JP 26267399A JP 26267399 A JP26267399 A JP 26267399A JP 2001084271 A JP2001084271 A JP 2001084271A
Authority
JP
Japan
Prior art keywords
information
accuracy
version
search
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP26267399A
Other languages
English (en)
Inventor
Hirotaka Shiiyama
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP26267399A priority Critical patent/JP2001084271A/ja
Publication of JP2001084271A publication Critical patent/JP2001084271A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 情報検索のアルゴリズムを効率的且つ容易に
更新可能な情報検索装置及びそのアルゴリズム更新方法
及びコンピュータ読み取り可能な記憶媒体の提供。 【解決手段】 既に登録されている画像に施したデータ
特徴量抽出処理のソフトウエアモジュールのバージョン
が、現在使用しているバージョンと異なる画像が含まれ
ている場合に、そのバージョンが異なる画像を更新対象
として選択し(S13)、その選択した画像に対して、現在
使用しているデータ特徴量抽出処理のモジュールを用い
て特徴量及びその重み情報を算出し、その算出した特徴
量等により所定のデータベースを更新する(S14-S15)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然画像データや
音声データ等の様々な形態の情報を検索する情報検索装
置及びそのアルゴリズム更新方法及びコンピュータ読み
取り可能な記憶媒体に関する。
【0002】
【従来の技術】従来より、例えば自然画像データ等のマ
ルチメディアデータの情報検索装置においては、一般
に、目的とするデータの検索を確実なものにすべく、そ
のデータに関係するキーワードをユーザが入力し、その
入力されたキーワードによる情報検索が行われている。
【0003】また、近年においては、このような情報検
索装置内に入力された画像が有する特徴を表わす特徴量
を解析し、その特徴量に基づいて情報検索する技術も提
案されているが、係る情報検索技術による画像認識の精
度は実用的とは言えない状況であり、現段階では汎用性
に欠ける。
【0004】
【発明が解決しようとする課題】上記のような従来の検
索技術においては、一般に、その技術の進歩を既存の検
索アルゴリズムに反映させるために、データによって既
に登録されているキーワード等の検索情報を再登録する
必要があり、効率的でない。
【0005】また、ユーザが入力したキーワード等の情
報を用いる情報検索と、上記のデータ特徴量に基づく情
報検索とを複合させた複合検索技術の分野においては、
日々進歩する特徴量に基づく検索技術の進歩に合わせ
て、複合検索に使用している判断アルゴリズムの変更
(更新)が必要な場合が多く、その判断アルゴリズムの
ソフトウエアモジュールの入れ替え等を、特徴量に基づ
く検索アルゴリズムを変更する度に行わなければなら
ず、情報検索装置としての運用面においても非効率であ
る。このため、データ特徴量に基づく検索技術の進歩
を、情報検索装置の検索アルゴリズムに反映させるに際
して、新たな検索アルゴリズム等のソフトウエアモジュ
ールの入れ替え等を極力少なくすることが運用面から切
望される。
【0006】そこで、本発明は、情報検索のアルゴリズ
ムを効率的且つ容易に更新可能な情報検索装置及びその
アルゴリズム更新方法及びコンピュータ読み取り可能な
記憶媒体の提供を目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る情報検索装置は、以下の構成を特徴と
する。
【0008】即ち、所定の形態を有する情報に対して所
定の処理を施すことにより、その情報の特徴を表わす第
1の情報を生成する生成手段と、前記生成手段によって
生成した第1の情報の精度情報を算出する精度算出手段
と、前記所定の形態を有する情報を記憶すると共に、前
記生成手段によって生成された第1の情報と、該記憶し
ている情報と関連付けてユーザが登録した第2の情報と
を記憶する第1の記憶手段と、前記第1の情報を生成す
るときに前記生成手段が採用したアルゴリズムのバージ
ョンと、前記精度算出手段によって算出された前記第1
の情報の精度情報とを関連付けして記憶する第2の記憶
手段と、前記第1の記憶手段に記憶している前記第1及
び/または第2の情報に基づいて、所望する情報を検索
する検索手段と、前記第2の記憶手段に記憶していると
ころの前記第1の情報を生成するときに前記生成手段が
採用したアルゴリズムのバージョンと、前記生成手段に
新たに採用すべきアルゴリズムのバージョンとが一致す
るかを判断し、前記第1の記憶手段に記憶している前記
第1の情報のうち、該判断結果によりバージョンが一致
しなかった情報だけを抽出する抽出手段と、前記抽出手
段によって抽出された情報に関連付けされている前記所
定の形態を有する情報に対して、前記生成手段に前記新
たに採用すべきアルゴリズムを用いて新たに第1の情報
を生成し、その新たに生成された第1の情報に対する精
度情報を前記精度算出手段を用いて算出すると共に、そ
の新たに生成された第1の情報の精度情報と、前記新た
に設定すべき前記生成手段のバージョンとにより、前記
第2の記憶手段に現在記憶している前記第1の情報の精
度情報と、その精度情報に関連付けされているバージョ
ンとを更新する更新手段とを備えることを特徴とする。
【0009】また、例えば前記検索手段は、前記第1及
び第2の情報を用いて検索を行うに際して、その検索結
果に、前記精度算出手段によって算出された前記第1の
情報の精度情報を反映させると良い。
【0010】また、上記の目的を達成するため、本発明
に係る情報検索装置のアルゴリズム更新方法は、以下の
構成を特徴とする。
【0011】即ち、所定の形態を有する情報に対して所
定の処理を施すことにより、その情報の特徴を表わす第
1の情報を生成する生成工程と、前記生成工程にて生成
した第1の情報の精度情報を算出する精度算出工程と、
前記所定の形態を有する情報を記憶すると共に、前記生
成工程にて生成された第1の情報と、該記憶している情
報と関連付けてユーザが登録した第2の情報とを記憶す
る第1の記憶工程と、前記第1の情報を生成するときに
前記生成工程にて採用したアルゴリズムのバージョン
と、前記精度算出工程にて算出した前記第1の情報の精
度情報とを関連付けして記憶する第2の記憶工程と、前
記生成工程にて採用するアルゴリズムを更新するに際し
て、前記第2の記憶工程にて記憶した前記第1の情報を
生成するときに前記生成工程にて採用したアルゴリズム
のバージョンと、前記生成工程に新たに採用すべきアル
ゴリズムのバージョンとが一致するかを判断し、前記第
1の記憶工程にて記憶した前記第1の情報のうち、該判
断結果によりバージョンが一致しなかった情報だけを抽
出する抽出工程と、前記抽出工程にて抽出した情報に関
連付けされている前記所定の形態を有する情報に対し
て、前記新たに採用すべきアルゴリズムを用いて新たに
第1の情報を生成し、且つその新たに生成された第1の
情報に対する精度情報を算出すると共に、その新たに生
成された第1の情報の精度情報と、前記新たに採用すべ
きアルゴリズムのバージョンとにより、現在記憶してい
る前記第1の情報の精度情報と、その精度情報に関連付
けされているアルゴリズムのバージョンとを更新する更
新工程とを有することを特徴とする。
【0012】更に、上記の情報検索装置及びそのアルゴ
リズム更新方法を、コンピュータによって実現するプロ
グラムコードが格納されている、コンピュータ読み取り
可能な記憶媒体を特徴とする。
【0013】
【発明の実施の形態】以下、本発明に係る情報検索装置
の一実施形態を、図面を参照して詳細に説明する。
【0014】図1は、本実施形態における情報検索装置
の装置構成を示すブロック図である。
【0015】同図において、101はCPUであり、本
実施形態に係る情報検索装置の各種制御を実行する。1
02はROMであり、本実施形態に係る情報検索装置の
起動時にCPU101によって実行されるブートプログ
ラムや各種データが格納されている。103はRAMで
あり、CPU101が処理する各種制御プログラムを格
納すると共に、それらの制御プログラムをCPU101
が実行する際の作業領域を提供する。104は入力装置
としてのキーボードである。105は、補助入力装置と
してのマウスである。キーボード104及びマウス10
5は、ユーザに対して当該情報検索装置への入力操作環
境を提供する。
【0016】また、106は外部記憶装置であり、ハー
ドディスクやフロッピーディスクドライブ、或いはCD
−ROM等で構成される。107はCRT等の表示器で
あり、マンマシンインタフェースとして各種情報を表示
する。108はネットワークインタフェースであり、ネ
ットワーク上の外部機器との通信を可能とする。110
は対象とする原稿画像を読み取ることにより、その原稿
画像を表わす画像データを生成する一般的なスキャナで
ある。110はインタフェースであり、スキャナ110
と当該情報検索装置とのデータの送受信を制御する。
【0017】そして、上述した各ユニットは、内部バス
111によって接続されている。尚、上記の構成におい
てスキャナ110や外部記憶装置106は、ネットワー
ク上に配置されたもので代用してもよい。
【0018】次に、当該情報検索装置への画像登録処
理、画像特徴量自動抽出処理のバージョンアップ、画像
検索処理の順に、図2を参照して説明する。
【0019】図2は、本実施形態に係る情報検索装置に
おける処理の構成を表わすシステムブロック図であり、
上述した当該情報検索装置のハードウエア構成における
CPU101が実行するソフトウエアモジュールの構成
を示す図であり、当該情報検索装置は、スキャナ110
等を介して外部記憶装置106に登録された画像(画像
データ)の特徴量に基づく検索処理と、同様に登録され
た画像にユーザによって予め付加されたキーワードを利
用した検索処理とを、何れか単独で、或いは両方の検索
処理を複合した検索処理を実行可能なソフトウエアモジ
ュール構成を備える。
【0020】キーボード104等のユーザインタフェー
ス1より画像の登録が指示されたときには、一般的な手
法(アルゴリズム)を採用した画像特徴量演算モジュー
ル2により、色ヒストグラム計算処理が行われ、対象と
する当該画像の画像特徴量が算出される。
【0021】また、モジュール3は、ユーザによって入
力されるキーワードを、算出された画像特徴量に対応す
る属性情報として当該画像特徴量に付与する(関連付け
する)。
【0022】そして、属性が付与された画像特徴量は、
データ入力モジュール4により、メモリ(RAM10
3)を介して外部記憶装置106等のデータ蓄積モジュ
ール5に格納される。
【0023】ここで、当該情報検索装置は、上述したよ
うに、登録された画像の特徴量に基づく検索処理を単独
で行うことも可能であり、この場合は、例えば、キーワ
ードの付与は後日入力可能に構成し、入手した画像デー
タに類似する他の画像データを取り急ぎ検索すべく、デ
ータ特徴量演算モジュール2によるヒストグラム計算処
理だけを行い、そのヒストグラムによって入手したデー
タを用いて、ユーザが検索指示した画像(元画像)と色
味が類似する画像(類似画像)を検索可能な検索モジュ
ール6に提供することにより、キーワードが未だ付与さ
れていない状態の画像の検索が可能である。尚、検索に
先立って行う画像の登録処理については、図3を参照し
て後述する。
【0024】また、上記の場合、ユーザは、キーワード
(属性情報)の登録を別途行うことができ、この場合に
実行される属性登録処理は、図5に示すフローチャート
になる。即ち、図5に示すように、登録された画像に対
して1対1で採番されたデータIDをユーザが指定する
(ステップS21)ことによって所望の画像を選択さ
れ、且つその指定したデータIDに対応してユーザが入
力した属性情報(ユーザが選択した画像を特定可能な所
望のキーワード等)を、データ管理DB13、並びに不
図示の属性インデックスDBに記憶する(ステップS2
2)。ここで、ユーザが入力する属性情報には、データ
IDに対応する画像データの特徴量は含まない。
【0025】<画像登録処理>次に、検索に先立って行
われる画像の登録処理について、以下に詳細に説明す
る。
【0026】図3は、本実施形態における画像登録処理
を示すフローチャートである。
【0027】同図において、ステップS1,ステップS
2:図6に示すデータ管理DBレコードに含まれるデー
タ特徴量抽出処理バージョン番号(No)のフィールド
を参照することにより、現在使用している画像登録処理
に含まれるところのデータ特徴量抽出処理(図2のモジ
ュール7)のバージョンと、データ管理DB13に既に
格納されているデータ管理DBレコードに含まれるとこ
ろのデータ特徴量抽出処理バージョンNoとが同じか否
かを判断し、YES(バージョン同一)のときにはステ
ップS3に進み、NO(異なる)ときにはステップS2
として後述する図4に示す処理を全ての画像に対して行
う。
【0028】ステップS3:データ管理DB13を参照
することにより、今回の登録対象である画像を当該情報
検索装置内で特定するデータIDとして、これまで発行
していないユニークなデータIDを発行すると共に、そ
のデータIDをキーとして別途行われる検索処理時に当
該登録対象の画像を検索可能にすべく、データ管理DB
13内に、当該登録対象の画像のデータ管理DBレコー
ドを生成する。
【0029】外部記憶装置106内の所定領域に形成さ
れているデータ管理DB11、データ特徴量バージョン
管理DB12、そしてデータ特徴量DB13には、図6
に示すフィールド構成のデータ管理DBレコード、図7
に示すフィールド構成のデータ特徴量バージョン管理D
Bレコード、そして図8に示すフィールド構成のデータ
特徴量DBレコードがそれぞれ格納され、各画像に付与
されるデータIDを仲立ちにして互いにリンクが張られ
る。データ検索モジュール6による検索結果は、データ
IDとそのデータIDの指し示す画像の検索条件との適
合度の対によって表され、これらのデータが元画像と類
似画像との適合度の降順で表示器107に表示される。
【0030】ステップS4:ユーザによって登録が指定
された画像の画像データをスキャナ110等から読み込
み、その読み込んだデータが存在することを確認する。
【0031】ステップS5:図6に示すデータ管理DB
レコードには、検索キーとなるデータIDの他に、デー
タを格納したファイル格納先へのパスを含めたファイル
名を記憶・格納しており、データIDを与えるとこのフ
ァイル格納先へのパスを含めたファイル名を返すAPI
(appplication programming interface)を有する。ま
た、データ管理DBレコードには、検索キーとして登録
日付や登録時刻等のデータ特徴量の他に、自動付与可能
なその他の属性データを記憶する。これらの登録日付や
登録時刻は、日付や時刻を範囲指定で検索可能とすべ
く、各レコードで所定の形態で登録する。
【0032】ステップS7:本ステップでは、ステップ
S1の判断において、現在使用している画像登録処理に
含まれるところのデータ特徴量抽出処理(図2のモジュ
ール7)のバージョンと、既にデータ管理DBレコード
に含まれるデータ特徴量抽出処理バージョン番号とが同
じであったので、画像特徴量演算モジュール2による色
ヒストグラム計算処理を行い、図2に示すデータ特徴量
DB11に対して、データIDをキーとしてデータ特徴
量を検索することが可能となるスキーマのレコードを生
成・登録を行なう。
【0033】ステップS8,ステップS9:ユーザが属
性を入力使用としているか否かを判断し(ステップS
8)、YES(ユーザによる属性入力あり)のときに
は、ステップS3で採番したデータIDに対応してユー
ザが入力した属性情報を、データ管理DB13、並びに
不図示の属性インデックスDBに記憶し(ステップS
9)、NOのときには画像登録処理を終了する。尚、ユ
ーザが入力する属性情報には、データIDに対応する画
像データの特徴量は含まない。
【0034】ステップS2:ステップS1の判断におい
て、現在使用しているデータ特徴量抽出処理(図2に示
すモジュール7)のバージョンと、既にデータ管理DB
レコードに含まれるデータ特徴量抽出処理バージョン番
号とが異なるときには、本ステップにおいて、データ蓄
積モジュール5に既に登録されている画像データを、現
在使用している画像登録処理に含まれるデータ特徴量抽
出処理のバージョンに対応したものに更新すべく、図4
に示すデータ再登録処理を行う。
【0035】<データ再登録処理>図4は、本実施形態
におけるデータ特徴量抽出処理のバージョンアップに伴
い、データ特徴量演算モジュールを更新する更新処理を
示すフローチャートであり、図3に示すステップS2の
詳細を表わす。
【0036】同図において、ステップS11,ステップ
S12:図3のステップS1において画像登録処理のバ
ージョンが異なると判断されたことにより、更新対象に
指定されたデータ管理DB13内のレコードのデータI
Dに対応する画像データをデータ蓄積モジュール5から
読み込むことにより、当該指定されたデータIDに対応
する画像データの存在を確認する。
【0037】ステップS13:ステップS11で指定さ
れたデータIDをキーとして、データ管理DB13の中
から更新対象となるレコード(即ち、現在使用している
データ特徴量抽出処理のバージョンとは異なるバージョ
ンのレコード)を決定し、そのレコードのデータ特徴量
自動抽出処理バージョン番号を、データ特徴量バージョ
ン管理DB12に記述する。これは、データ特徴量抽出
処理のバージョンアップに際してバージョンアップの必
要なデータ特徴量だけに対して抽出登録処理を施すため
である。更に、データ管理DB13には、データ特徴量
による検索の精度に対応する重み付け情報を格納する
(尚、重み付け情報の算出方法については後述する)。
【0038】ステップS14,ステップS15:データ
IDを指定された個々のレコードが有するデータ特徴量
抽出処理のバージョン番号を、データ特徴量バージョン
管理DB12から読み出し、その読み出したバージョン
と現在の最新バージョンとの比較を行ない(ステップS
14)、バージョン(図7に示す特徴量バージョン)が
異なるデータ特徴量のみをバージョンアップ対象とし
て、データ特徴量の更新(即ち、現在使用しているデー
タ特徴量抽出処理のモジュールを用いた特徴量の再計
算)を行なう(ステップS15)。即ち、ステップS1
5では、バージョンアップ対象の個々のデータ特徴量毎
に、現時点で最新のデータ特徴量抽出処理バージョン番
号をデータ管理DB13に記憶更新・格納する。更に、
バージョンアップ対象のデータ特徴量毎に、その精度の
向上に基づいた重み付け情報をデータ管理DB13に記
憶更新・格納する。
【0039】尚、データ特徴量全体としての1つの重み
付け情報の他に、複数のデータ特徴量を用いる場合に
は、データ特徴量毎にその精度の向上に基づいた重み付
け情報を、データ特徴量バージョン管理DB12に記憶
・格納する。これは、複数のデータ特徴量を用いた検索
処理において、その検索処理のバージョンのデータ特徴
量毎の精度を考慮した重み付けを行なうことにより、情
報検索の基本アルゴリズムは変更することなく、特徴量
抽出処理のバージョンアップに適応した検索処理に自動
適合することが可能となるからである。
【0040】尚、上記の画像登録処理においては、デー
タ特徴量以外のユーザが付与した属性情報を、全て検索
キーとして利用可能な構成としているが、入力されるキ
ーワードの部分一致や、あいまい検索等の検索を行なう
際には、特開平08−007033号,特開平09−0
16619号,特開平09−091305号,特開平0
9−259132号に提案されているインデックスファ
イルを用いた全文検索・曖昧検索を用いるとよい。
【0041】<データ検索処理>次に、上述した画像登
録処理によって当該情報検索装置内に格納された複数の
画像を用いて、ユーザが指定した所望の検索条件に応じ
た画像を検索するデータ検索処理について、図9を参照
して詳細に説明する。
【0042】図9は、本実施形態に係る情報検索装置に
よるデータ検索処理を示すフローチャートである。
【0043】同図において、ステップS31:ユーザが
入力した検索条件の指示を、ユーザインタフェース1に
より入手する。
【0044】ここで、検索条件としては、ユーザが入力
した検索クエリーによる検索処理が最も一般的である
が、本実施形態では、上述したようにデータ特徴量に基
づく検索結果と、ユーザが入力した属性情報との一致度
の総合した複合検索を、データ検索モジュール6によっ
て実行可能としているため、本ステップにおいてユーザ
が検索条件を入力するに際して、それら両方の検索処理
に重み付けを設定可能な以下に説明するマンマシンイン
タフェースを備えている。
【0045】図10は、本実施形態における重み付け指
定のGUI(グラフィカルユーザインタフェース)の一
例を示しており、同図に示すGUIは、データ特徴量
と、ユーザが付与する属性との両方が検索条件として与
えられている場合のみ表示器101に表示させる。
【0046】ユーザは、本実施形態における情報検索装
置に複合検索を実行させるに際して、図10に長方形の
塗りつぶしブロックで表わすボリュームの位置をマウス
105等を用いて左右に移動させることができ、これに
より当該ボリュームで区画される左右の帯の面積が変化
するが、当該ボリュームが「データ特徴量重視」に近い
程、データ特徴量の重みを増す複合検索が指定されたこ
となり、その場合には「データ属性重視」による検索の
重みは減少する。このように、本実施形態では、ユーザ
が直感的に指定可能なGUIとなっている。
【0047】図10に示すようなGUIにおいて、「デ
ータ特徴量重視」の検索精度の最大値を100とし、複
合検索処理を行うデータ検索モジュール6のソフトウエ
アバージョンにおける値がα(0≦α≦100)だった
とすると、デフォルトのボリュームの位置は、左から全
体の10000/(100+α)[%]の位置とし、当
該ボリュームをデフォルトに位置に戻したい場合には
「デフォルトに戻す」ボタンを押す。このように、ボリ
ュームの位置を変更することにより、ユーザの意図に基
づいた重み付け処理を行い、ユーザの意図に合った検索
結果ソートを行なうことが可能となる。
【0048】このとき、データ特徴量に基づく検索の重
みを、当該GUIによってβ(0≦β≦100)と設定
した場合には、ユーザが付与した属性情報を用いる検索
の重みは(100−β)となる。この場合の複合検索の
重み付けの一例としては、 (データ特徴量に基づく検索の総合重み)=α×β/
A, (ユーザが付与した属性情報を用いる検索の総合重み)
=(100−β)/A, とする(但し、A=α×β+(100−β)/Aとす
る)。このような処理をステップS32において行う。
【0049】さて、データ特徴量に基づく検索処理にお
いては、複数のデータ特徴量を用いて検索処理を行う場
合、そのデータ特徴量の信頼度が個々に異なることがあ
る。データ特徴量によるマッチング処理を何らかのデー
タ特徴量群間の重み付き演算で処理を行なっている場合
において、例えば、 Σ(Wi×|P1i−P2i|), 但し、Σfiは、fiからfjまでの総和を表わし(以下
同様)、 i:特徴量の識別子, k:パラメータの種類数, P1i:データ1の特徴量iの正規化パラメータ, P2i:データ2の特徴量iの正規化パラメータ, Wi:正規化パラメータiに対するアルゴリズム上の重
み, である。で表される適合度評価式cを引いている場合、
信頼性の低いデータ特徴量は重みを小さく設定し、信頼
性の大きなデータ特徴量には重みを大きく設定すること
は理にかなっており、データ特徴量抽出処理(図2に示
すモジュール7)のバージョンアップにより信頼性の高
くなったデータ特徴量に対しては重みを大きくしたい。
【0050】そこで、ステップS33では、データ特徴
量に基づく検索処理において、複数のデータ特徴量を用
いるように検索条件が指定されているか否かを判断し、
NO(指定なし)のときにはステップS35に進み、Y
ES(指定あり)のときには、データ管理DB13から
個々のデータ特徴量毎にその精度の向上に基づいた重み
付け情報を取得し、その重み情報をデータ特徴量を用い
た検索処理アルゴリズム(図2のモジュール6)で用い
ることにより、最新のデータ特徴量抽出処理に合わせた
検索処理を行なうことが可能となる。このことを数式で
表すと、次式で表せる。
【0051】Σ(Xi×Wi×|P1i−P2i|/C), C=ΣXi×Wi, 但し、i:特徴量の識別子, K:パラメータの種類数, P1i:データ1の特徴量iの正規化パラメータ, P2i:データ2の特徴量iの正規化パラメータ, Wi:正規化パラメータiに対するアルゴリズム上の重
み, Xi:正規化パラメータiに対する重み, である。
【0052】ステップS35:ユーザが指定した検索条
件の中に、ユーザが付加した属性情報を用いる検索が含
まれるか否かを判断し、NO(含まれない)のときには
ステップS37に進み、YES(含まれる)ときには、
ユーザが付加した属性情報に関する検索条件に基づいて
データ管理DB13を参照することにより、当該検索条
件と予め登録されている属性情報との適合度を算出し、
その算出した適合度をデータIDに関連付けして記憶す
る。この適合度は、予め定められた重み付け演算、或い
は図10に示すようなGUIを用いて、ユーザに(デー
タ特徴量の重み):(データ属性の重み)=b:aを設
定させる、重みをそれぞれb/(a+b),a/(a+
b)とすることによって算出すれば良い。
【0053】ステップS37:データ蓄積モジュール5
に格納されている全ての画像に対して、あるいは何らか
のプリサーチ処理を用いて総合適合度を計算するデータ
を絞り込んだ後、総合適合度の計算処理を行ない、その
結果を適合度の高い順にソートし検索結果として、例え
ば画像データのサムネール画像を、表示器101に表示
する。
【0054】以上説明したように、本実施形態によれ
ば、データ特徴量に基づく検索処理を含む既存の情報検
索システムにおいて、データ特徴量抽出処理のソフトウ
エアモジュールの必要最小限の更新により、データ特徴
量に基づく検索技術の進歩に合わせて当該システムを最
新の状態に効率良く更新することができる。
【0055】尚、上述した本実施形態においては、情報
検索処理にて扱うデータを自然画像検索を行う場合に適
用して説明したが、これに限られるものではなく、扱う
データの特徴を特徴量として定量的に表わすことができ
るデータであればどのようなデータであっても本実施形
態は適用可能である。
【0056】また、上述した図3の画像登録処理におい
ては、データ特徴量の登録の後にユーザによる属性情報
の登録を行う構成としたが、その順番を逆に構成しても
良い。
【0057】
【他の実施形態】尚、本発明は、複数の機器(例えばホ
ストコンピュータ、インタフェイス機器、リーダ、プリ
ンタ等)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機、ファクシミリ装置
等)に適用してもよい。
【0058】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
等が実際の処理の一部または全部を行い、その処理によ
って前述した実施形態の機能が実現される場合も含まれ
ることは言うまでもない。
【0059】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張カード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張カードや機能拡張ユニットに備わ
るCPU等が実際の処理の一部または全部を行い、その処
理によって前述した実施形態の機能が実現される場合も
含まれることは言うまでもない。
【0060】
【発明の効果】以上説明したように、本発明によれば、
情報検索のアルゴリズムを効率的且つ容易に更新可能な
情報検索装置及びそのアルゴリズム更新方法及びコンピ
ュータ読み取り可能な記憶媒体の提供が実現する。
【図面の簡単な説明】
【図1】本実施形態における情報検索装置の装置構成を
示すブロック図である。
【図2】本実施形態に係る情報検索装置における処理の
構成を表わすシステムブロック図である。
【図3】本実施形態における画像登録処理を示すフロー
チャートである。
【図4】本実施形態におけるデータ特徴量抽出処理のバ
ージョンアップに伴い、データ特徴量演算モジュールを
更新する更新処理を示すフローチャートである。
【図5】ユーザによる属性情報の登録処理を示すフロー
チャートである。
【図6】データ管理DBのデータのフィールド構成例を
示す図である。
【図7】データ特徴量バージョン管理DBのフィールド
構成例を示す図である。
【図8】データ特徴量DBのフィールド構成例を示す図
である。
【図9】本実施形態に係る情報検索装置によるデータ検
索処理を示すフローチャートである。
【図10】本実施形態における重み付け指定のGUI
(グラフィカルユーザインタフェース)の一例を示す図
である。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 所定の形態を有する情報に対して所定の
    処理を施すことにより、その情報の特徴を表わす第1の
    情報を生成する生成手段と、 前記生成手段によって生成した第1の情報の精度情報を
    算出する精度算出手段と、 前記所定の形態を有する情報を記憶すると共に、前記生
    成手段によって生成された第1の情報と、該記憶してい
    る情報と関連付けてユーザが登録した第2の情報とを記
    憶する第1の記憶手段と、 前記第1の情報を生成するときに前記生成手段が採用し
    たアルゴリズムのバージョンと、前記精度算出手段によ
    って算出された前記第1の情報の精度情報とを関連付け
    して記憶する第2の記憶手段と、 前記第1の記憶手段に記憶している前記第1及び/また
    は第2の情報に基づいて、所望する情報を検索する検索
    手段と、 前記第2の記憶手段に記憶しているところの前記第1の
    情報を生成するときに前記生成手段が採用したアルゴリ
    ズムのバージョンと、前記生成手段に新たに採用すべき
    アルゴリズムのバージョンとが一致するかを判断し、前
    記第1の記憶手段に記憶している前記第1の情報のう
    ち、該判断結果によりバージョンが一致しなかった情報
    だけを抽出する抽出手段と、 前記抽出手段によって抽出された情報に関連付けされて
    いる前記所定の形態を有する情報に対して、前記生成手
    段に前記新たに採用すべきアルゴリズムを用いて新たに
    第1の情報を生成し、その新たに生成された第1の情報
    に対する精度情報を前記精度算出手段を用いて算出する
    と共に、その新たに生成された第1の情報の精度情報
    と、前記新たに設定すべき前記生成手段のバージョンと
    により、前記第2の記憶手段に現在記憶している前記第
    1の情報の精度情報と、その精度情報に関連付けされて
    いるバージョンとを更新する更新手段と、を備えること
    を特徴とする情報検索装置。
  2. 【請求項2】 前記検索手段は、前記第1及び第2の情
    報を用いて検索を行うに際して、その検索結果に、前記
    精度算出手段によって算出された前記第1の情報の精度
    情報を反映させることを特徴とする請求項1記載の情報
    検索装置。
  3. 【請求項3】 前記所定の形態を有する情報は、画像デ
    ータであることを特徴とする請求項1記載の情報検索装
    置。
  4. 【請求項4】 前記生成手段は、前記画像データを表わ
    す色ヒストグラムに基づいて、該画像データの特徴量を
    算出することを特徴とする請求項3記載の情報検索装
    置。
  5. 【請求項5】 前記検索手段は、前記第1及び第2の情
    報を用いて検索を行うに際して、それら第1及び第2の
    情報の利用の度合を設定可能な設定手段を含むことを特
    徴とする請求項1記載の情報検索装置。
  6. 【請求項6】 情報検索装置のアルゴリズム更新方法で
    あって、 所定の形態を有する情報に対して所定の処理を施すこと
    により、その情報の特徴を表わす第1の情報を生成する
    生成工程と、 前記生成工程にて生成した第1の情報の精度情報を算出
    する精度算出工程と、 前記所定の形態を有する情報を記憶すると共に、前記生
    成工程にて生成された第1の情報と、該記憶している情
    報と関連付けてユーザが登録した第2の情報とを記憶す
    る第1の記憶工程と、 前記第1の情報を生成するときに前記生成工程にて採用
    したアルゴリズムのバージョンと、前記精度算出工程に
    て算出した前記第1の情報の精度情報とを関連付けして
    記憶する第2の記憶工程と、 前記生成工程にて採用するアルゴリズムを更新するに際
    して、前記第2の記憶工程にて記憶した前記第1の情報
    を生成するときに前記生成工程にて採用したアルゴリズ
    ムのバージョンと、前記生成工程に新たに採用すべきア
    ルゴリズムのバージョンとが一致するかを判断し、前記
    第1の記憶工程にて記憶した前記第1の情報のうち、該
    判断結果によりバージョンが一致しなかった情報だけを
    抽出する抽出工程と、 前記抽出工程にて抽出した情報に関連付けされている前
    記所定の形態を有する情報に対して、前記新たに採用す
    べきアルゴリズムを用いて新たに第1の情報を生成し、
    且つその新たに生成された第1の情報に対する精度情報
    を算出すると共に、その新たに生成された第1の情報の
    精度情報と、前記新たに採用すべきアルゴリズムのバー
    ジョンとにより、現在記憶している前記第1の情報の精
    度情報と、その精度情報に関連付けされているアルゴリ
    ズムのバージョンとを更新する更新工程と、を有するこ
    とを特徴とする情報検索装置のアルゴリズム更新方法。
  7. 【請求項7】 請求項1乃至請求項5の何れかに記載の
    情報検索装置としてコンピュータを動作させるプログラ
    ムコードが格納されていることを特徴とするコンピュー
    タ読み取り可能な記憶媒体。
  8. 【請求項8】 請求項6記載の情報検索装置のアルゴリ
    ズム更新方法をコンピュータによって実現可能なプログ
    ラムコードが格納されていることを特徴とするコンピュ
    ータ読み取り可能な記憶媒体。
JP26267399A 1999-09-16 1999-09-16 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体 Withdrawn JP2001084271A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26267399A JP2001084271A (ja) 1999-09-16 1999-09-16 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26267399A JP2001084271A (ja) 1999-09-16 1999-09-16 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2001084271A true JP2001084271A (ja) 2001-03-30

Family

ID=17379019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26267399A Withdrawn JP2001084271A (ja) 1999-09-16 1999-09-16 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2001084271A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280106A (ja) * 2006-04-07 2007-10-25 Seiko Epson Corp 画像データに対するキーワードの付与
US8266440B2 (en) 2007-10-05 2012-09-11 Canon Kabushiki Kaisha Information processing apparatus and authentication information migration method
JP5639319B1 (ja) * 2014-04-07 2014-12-10 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
WO2022091299A1 (ja) * 2020-10-29 2022-05-05 日本電気株式会社 検索装置、検索方法及び記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280106A (ja) * 2006-04-07 2007-10-25 Seiko Epson Corp 画像データに対するキーワードの付与
US8266440B2 (en) 2007-10-05 2012-09-11 Canon Kabushiki Kaisha Information processing apparatus and authentication information migration method
JP5639319B1 (ja) * 2014-04-07 2014-12-10 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
WO2015155820A1 (ja) * 2014-04-07 2015-10-15 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
WO2022091299A1 (ja) * 2020-10-29 2022-05-05 日本電気株式会社 検索装置、検索方法及び記録媒体

Similar Documents

Publication Publication Date Title
US7424490B2 (en) System for document management and information processing
US7844139B2 (en) Information management apparatus, information management method, and computer program product
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
US7065521B2 (en) Method for fuzzy logic rule based multimedia information retrival with text and perceptual features
US6917932B2 (en) Dynamic optimization of multi-feature queries
US20050234896A1 (en) Image retrieving apparatus, image retrieving method and image retrieving program
US20020133642A1 (en) Database processing method and apparatus using handle
US20060031211A1 (en) Information processing apparatus, document search method, program, and storage medium
US8533150B2 (en) Search index generation apparatus
JP2010282241A (ja) ファイル管理装置、ファイル管理システム、ファイル管理方法、および、プログラム
JP2001084271A (ja) 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体
US6609250B1 (en) Software generating device
US6792417B1 (en) Information processing apparatus and method for storing and managing objects together with additional information
US20020120612A1 (en) Document management system, document management method, and computer-readable storage medium including the same
JP3565117B2 (ja) 複数異種情報源アクセス方法及びクライアント装置及び複数異種情報源アクセスプログラムを格納した記憶媒体
JPH07146880A (ja) 文書検索装置及び方法
JP2001147923A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JP3245047B2 (ja) バージョン管理装置及び方法
JP2002108887A (ja) 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体
JP3530993B2 (ja) 情報処理装置及び方法
JP3772105B2 (ja) データベース管理装置、方法、プログラム及び記録媒体
JP2006106907A (ja) 構造化文書管理システム、索引構築方法及びプログラム
US6625606B1 (en) System and method for filing/searching data having a full-text function and media for recording the method
US20040049501A1 (en) Data management apparatus and data management program
JPH11312171A (ja) 画像検索装置及びその方法、コンピュータ可読メモリ

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205