JPH1040268A - データベース検索方法 - Google Patents

データベース検索方法

Info

Publication number
JPH1040268A
JPH1040268A JP9113577A JP11357797A JPH1040268A JP H1040268 A JPH1040268 A JP H1040268A JP 9113577 A JP9113577 A JP 9113577A JP 11357797 A JP11357797 A JP 11357797A JP H1040268 A JPH1040268 A JP H1040268A
Authority
JP
Japan
Prior art keywords
database
item
items
user
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9113577A
Other languages
English (en)
Other versions
JP3053003B2 (ja
Inventor
Ingemar J Cox
コックス インゲマー
Matthew L Miller
ミラー マシュー
Stephen M Omohundro
オムハンドロ スティーブン
Peter N Yianilos
イヤノロス ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPH1040268A publication Critical patent/JPH1040268A/ja
Application granted granted Critical
Publication of JP3053003B2 publication Critical patent/JP3053003B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)

Abstract

(57)【要約】 【課題】 ユーザによって指定された所望項目を、デー
タベース中の項目から短時間で見つけることができる対
話式データベース検索方法を提供する。 【解決手段】 データベース中の項目の所望項目への密
接関連確率により決まる確率分布に従ってデータベース
中の項目から複数項目のリストを生成する生成ステップ
(1010)と、複数項目のリストをユーザに表示するステッ
プ(1020)と、ユーザからの表示項目と所望項目との関係
を示す応答を獲得するステップ(1030)と、応答に従って
確率分布を再計算し、前記生成ステップに、再計算され
た確率分布に従ってデータベース中の項目から複数項目
のリストを再生成させるステップ(1060)と、応答とし
て、表示項目のうちのどれが所望項目であるかを特定す
る応答が得られるまで、前述のステップを繰り返すステ
ップ(1040)とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データベース中の
データの格納および検索の分野に関し、特に、データベ
ース中に含まれるマルチメディアデータを検索する方法
に関する。
【0002】
【従来の技術】マルチメディアデータベースは、画像
や、音楽や、映像などのディジタルデータを含むデータ
ベースであり、ビジネス上でまた娯楽としてもその用途
は絶えず増加し続けている。しかしながら、マルチメデ
ィアデータベースの広範な利用により、これらのデータ
ベースを検索するためのより効果的な方法を開発するこ
とがますます必要となってきている。
【0003】技術背景として、データベースとは関連デ
ータを収集したものである。多くの場合、データベース
におけるデータは、テーブル、フィールドおよびレコー
ドとして構造的に組織化されている。一般に、データベ
ース中の各レコードは一組の属性を有し、ユーザが、1
つ以上の属性の値に基づいてデータベースの検索を行な
うことを望む場合がある。例えば、フットボールの統計
値のデータベースにおいて、1シーズンに100回以上
のパスを成功させたすべてのクォーターバックを検索す
ることが求められる場合がある。
【0004】このような検索を行なう際に、各レコード
がいくつかの属性を有し、ユーザはある属性についてあ
る値を有するレコードを検索することを求めていると仮
定する。所望のレコードについての明細は照会(que
ry)と呼ばれ、通常、次の3種類のうちのひとつに限
定される。
【0005】a)特定の属性についての特定の値を指定
する単純な照会、例えば、THROWINGARM=L
EFT(スローイングアーム=左)あるいはTHROW
INGARM=RIGHT(スローイングアーム=
右)、 b)特定の属性の値について特定の範囲を指定する範囲
照会、例えば、WEIGHT(ウエイト)<220ある
いは180<WEIGHT<220、および c)(THROWINGARM=LEFT)AND(H
EIGHT(ハイト)>6´)AND(COMPLET
IONS(成功)>99))のような論理式(BOOL
EAN)。
【0006】残念ながら、このような照会に基づく方法
では、マルチメディアデータベースを検索することの問
題点を解消することができない。これは、(1)一般
に、マルチメディアデータはテキスト(文)として属性
の記述を用いた注釈を付されていないこと、および、
(2)ユーザの照会を記述するために必要な語彙が存在
しないか少なくともユーザに知られていないことによ
る。その結果、従来技術において、特に画像データベー
スについて、内容に基づくマルチメディア検索を開発す
ることに対する関心が高まりつつある。例えば、第7回
International Working Con
ference on Scientificand
Statistical Database Mana
gementの論文集(1994年)の252〜258
頁に掲載された「Candid:Comparison
Algorithm for Navigating
Digital Image Databases」
と題するP.M.Kellyらの論文、および第23回
AIPR Workshop on Image an
d Information Systems(199
4年10月、Washington DC)の論文集に
掲載された「Indexing Multispect
ral Images for Content−Ba
sed Retrieval」と題するJ.Barro
sらの論文を参照されたい。
【0007】従来の、内容に基づく画像検索システムの
多くは、データベースからの画像の検索を容易にするた
めに、視覚的具体例による照会形式を用いている。この
ようなシステムでは、前回の検索によって取り出された
一組の画像から次の照会が引き出される。これは、未熟
な形の適合性フィードバックであり、残念ながら適した
ものとは言えない。各回の画像検索は特定の照会にのみ
応答してのものであって、過去の検索の履歴のいずれか
あるいはすべては無視される。
【0008】このような従来システム、例えばIEEE
Computer(1995年)第28(9)巻の2
3〜32頁に掲載された「Query by Imag
eand Video Content:The QB
IC System」と題するFlicknerらの論
文や、Advances in DatabaseTe
cknology−EDBT´92(1992年、Sp
ringer−verlag,(ベルリン)に掲載され
た「Query By Visual Exampl
e,Content Based Image Ret
rieval」と題するK.Hirataらの論文に記
載されたシステムにおいては、検索能力は、もっぱら採
用される類似性メトリック(similarity m
etric)によって決定される。一般的に、このよう
な類似性メトリックは一組の特徴についての重みづけら
れた和であり、その重みはユーザによってマニュアルで
決定されることが多い。
【0009】
【発明が解決しようとする課題】従来の画像検索方法お
よびシステム、特に、内容に基づく画像検索方法および
システムは、検索レートが高くなる恐れがあり、所望の
画像を見つけるまでに、長時間を要することがある。
【0010】それ故、本発明の課題は、所望の画像を短
時間で見つけることができるデータベース検索方法を提
供することにある。
【0011】
【課題を解決するための手段】上記の問題点を解決し、
従来技術を改良するため、本発明の原理によれば、一般
的なベイズのフレームワークに基づいたPicHunt
er(ピクチャーハンター)システムおよび方法により
適合性フィードバックを用いて検索を行なう。このシス
テムは、マルチメディアデータベース内の各画像が、検
索の目標に該当する場合についての事後確率分布を保有
している。この分布はユーザに表示するべき次の画像を
選択するために用いられ、表示された画像に関連する選
択をユーザに求める。ユーザの選択は、確率的ユーザモ
デルによって事後分布に組み込まれる。ユーザの選択の
データベースからユーザモデルを構築する方法が説明さ
れる。このフレームワークの顕著な特徴は、他の適合性
フィードバック法では照会を改良しているのに対し、本
発明の方法では回答を改良していることである。
【0012】即ち、本発明によれば、ユーザによって指
定された所望の項目を、データベース中の項目から見つ
け出すための対話式方法であって、前記データベース中
の項目の前記所望の項目への密接関連確率により決まる
確率分布に従って、前記データベース中の項目から複数
項目を選び、該複数項目のリストを生成する生成ステッ
プと、前記複数項目のリストをユーザに対して表示項目
のリストとして表示する表示ステップと、前記ユーザか
らの前記表示項目と前記所望の項目との関係を示す応答
を対話式ユーザインタフェースを介して獲得する獲得ス
テップと、前記応答に従って前記確率分布を再計算し、
前記生成ステップに、この再計算された確率分布に従っ
て、前記データベース中の項目から複数項目を選ばせ、
該複数項目のリストを生成させる再計算ステップと、前
記応答として、前記表示項目のうちのどれが前記所望の
項目であるかを特定する応答が得られるまで、前記再計
算ステップ、前記生成ステップ、前記表示ステップ、及
び前記獲得ステップを繰り返すステップとを含むデータ
ベース検索方法が得られる。
【0013】更に本発明によれば、前記生成ステップ
は、高確率の複数項目のリストを、前記複数項目のリス
トとして生成することを特徴とするデータベース検索方
法が得られる。
【0014】また本発明によれば、前記生成ステップ
は、前記応答と前記所望の項目との相互情報が最も高め
られる複数項目を、前記複数項目のリストとして生成す
ることを特徴とするデータベース検索方法が得られる。
【0015】更に本発明によれば、前記表示項目のリス
トとして表示される前記複数項目のリストが、(i)当
該リストに最高確率の一項目を含ませるステップ、(i
i)前記データベース中の項目の部分集合を用いて、当
該リストに加えたときに、最高に評価される相互情報が
得られる一つの項目を見つけるステップ、(iii)前
記リストに前記一つの項目を加えること、前記リストが
前記複数項目を含むまで、前記ステップ(ii)及び前
記ステップ(iii)を繰り返すステップによって選び
出されることを特徴とするデータベース検索方法が得ら
れる。
【0016】また本発明によれば、前記相互情報が、目
標と成り得るものの完全なリストを確率の減少順に初期
化するステップと、前記リストから、同じ値だけ離れた
確率を有するサンプル目標の集合を選択するステップ
と、前記サンプル目標の各々が等しい事前確率を有する
場合に、前記サンプル目標と前記応答との間の相互情報
を計算するステップとにより評価されることを特徴とす
るデータベース検索方法が得られる。
【0017】更に本発明によれば、前記獲得ステップ
は、前記ユーザからの前記表示項目に対する応答とし
て、前記表示項目の中で前記所望の項目に最も類似する
項目を特定する応答を、獲得することを特徴とするデー
タベース検索方法が得られる。
【0018】また本発明によれば、前記獲得ステップ
は、前記ユーザからの前記表示項目に対する応答とし
て、前記表示項目及び前記所望の項目間の類似度を指示
する応答を、獲得することを特徴とするデータベース検
索方法が得られる。
【0019】更に本発明によれば、前記獲得ステップ
は、前記ユーザからの前記表示項目に対する応答とし
て、前記所望の項目に類似した前記表示項目の態様ある
いは要素を指示する応答を、獲得することを特徴とする
データベース検索方法が得られる。
【0020】また本発明によれば、前記再計算ステップ
は、ベイズの公式(Bayes' rule) およびユーザのアルゴ
リズム的モデルにしたがって、前記応答から前記データ
ベース中の項目に対する新たな確率分布を計算するステ
ップを含み、前記アルゴリズム的モデルは、前記表示項
目と前記所望の項目を条件として、応答に関する確率分
布を計算するためのものであることを特徴とするデータ
ベース検索方法が得られる。
【0021】更に本発明によれば、前記ユーザのアルゴ
リズム的モデルは、前記データベース中の項目の予め計
算された特徴の集合を用いるものであることを特徴とす
るデータベース検索方法が得られる。
【0022】また本発明によれば、前記ユーザのアルゴ
リズム的モデルは、前記データベース中の項目について
マニュアル入力された特徴の集合を用いるものであるこ
とを特徴とするデータベース検索方法が得られる。
【0023】更に本発明によれば、前記ユーザのアルゴ
リズム的モデルは、各表示項目を前記所望の項目に最も
類似するものとして特定するユーザの独立確率を割り当
て、任意の組み合わせの項目についての確率を、Sを選
択された項目の確率とし、Pを非選択項目の確率とした
とき、S=S*(1−P)として、計算することを特徴
とするデータベース検索方法が得られる。
【0024】また本発明によれば、各表示項目が、前記
所望の項目に最も類似するものとして特定される確率
は、前記ユーザが、当該表示項目が他の表示項目よりも
類似していると見なす確率の積として計算されることを
特徴とするデータベース検索方法が得られる。
【0025】更に本発明によれば、前記データベースは
画像のデータベースであり、前記予め計算された特徴の
1つは基本色のヒストグラムであることを特徴とするデ
ータベース検索方法が得られる。
【0026】また本発明によれば、前記データベースは
画像のデータベースであることを特徴とするデータベー
ス検索方法が得られる。
【0027】更に本発明によれば、前記データベースは
サウンドのデータベースであることを特徴とするデータ
ベース検索方法が得られる。
【0028】また本発明によれば、前記データベースは
ビデオクリップのデータベースであることを特徴とする
データベース検索方法が得られる。
【0029】更に本発明によれば、前記データベースは
二次元図形のデータベースであることを特徴とするデー
タベース検索方法が得られる。
【0030】また本発明によれば、前記データベースは
三次元図形のデータベースであることを特徴とするデー
タベース検索方法が得られる。
【0031】更に本発明によれば、前記データベースは
テキストのデータベースであることを特徴とするデータ
ベース検索方法が得られる。
【0032】また本発明によれば、データベース検索の
有効性を評価するための対話式方法であって、検索すべ
き目標オブジェクトを生成するステップと、前記目標オ
ブジェクトおよび候補オブジェクトの集合をユーザに対
して表示するステップと、前記目標オブジェクトを見出
だす際のユーザの困難度を表わす1つ以上のメトリック
を評価することによって、検索有効性を測定するステッ
プと、困難度の測定値を平均化しながら上記のステップ
を繰り返すステップとを含むことを特徴とする対話式方
法が得られる。
【0033】
【発明の実施の形態】以下、添付図面を参照して本発明
を詳細に説明する。
【0034】本発明の主題による、内容に基づく検索方
法および装置を詳しく説明する前に、いくつかの定義を
明確に定めることが必要である。すなわち、少なくとも
3種類の検索を以下のとおり定義する。
【0035】(1)目標検索 目標検索は、ユーザが特
定の目標画像を見つけようとする検索である。例えば、
美術史専攻の学生なら特定の絵画を見つける必要がある
であろうし、また、グラフィックデザイナーなら以前に
見たことがある特定の在庫写真を探すことがある。
【0036】(2)カテゴリー検索 カテゴリー検索
は、ユーザが「日没」、「鳥」、「特別な種類の車」あ
るいは「エッフェル塔の絵」といった一般的なカテゴリ
ーから画像を探す検索である。カテゴリー検索と目標検
索の違いは、カテゴリー検索では、画像の意味的内容を
特に重要視し、しばしば主観的な判断を必要とすること
である。
【0037】(3)自由検索[開放型走査] 自由検索
はユーザが探しているものをせいぜい漠然とした感じで
しかとらえていない場合の検索である。さらに、ユーザ
は検索中に何度も考えを変えることがある。一例とし
て、インテリアデザイナーがある室内装飾の案を頭にお
いて検索を始めても、デザインのデータベースからのい
くつかの画像を見た後では、別の案にたどりつくことも
ある。自由検索システムの究極のユーザは、何の課題も
持っていないことがある。このようなユーザは、データ
ベースを操り、遭遇したものに対応することを単純に楽
しんでいる。
【0038】上記の3種類の検索は、それぞれ、内容に
基づく検索法にとっては重要であるが、カテゴリー検索
や自由検索については正しい行動が意味することを量的
に定めることは難しい。従って、検索の有効性に対して
いくつかの明確なメトリックがある目標検索に的を絞る
ことが必要である。
【0039】2つの代表的なメトリックは、1)目標画
像を見つけるまでに要した合計時間、あるいは、2)目
標画像を見つけるまでに調べた画像の総数、である。
【0040】これらのメトリックを踏まえ、画像検索方
法およびシステムの有効性を検証する1つのテストとし
て、大きなデータベース中から1つの無作為に選択され
た目標画像を見つける際にユーザが経験する平均困難度
(数々の試行について)がある。当業者であれば、この
テストを種々変形できることが容易に理解されよう。例
えば、目標画像を、検索の間中、画像検索インタフェー
スの傍らのコンピュータモニタに表示させることができ
る。あるいは、目標画像を検索開始前の短時間のみ表示
させてもよいが、この場合にはユーザは画像を思い出し
ながら検索しなければならない。あるいは、例えば色彩
の歪みのあるハードコピーのように、データベース中に
存在する真の画像から目標画像を歪ませてもよい。後者
の手法は、どの歪み/特徴が画像検索にとって重要であ
るかを決定するのに有用である。目標画像を見つけるに
際してユーザが経験する困難は、様々なやり方で計量化
することができる。例えば、ユーザに要求される動作
(すなわち、マウスクリック、検索の繰り返し、キース
トロークなど)の時間や回数として計量化することがで
きる。
【0041】さて、ユーザが、一連の表示/動作の繰り
返しによってデータベース中の特定のデータを検索する
事例を検討してみよう。具体的には、まず、使用する参
照符号を説明する。
【0042】Iはデータベースを示す。PicHunt
erの場合には、Iは画像の集合であるが、ここで展開
される基本的フレームワークは他の種類のデータに対し
ても同様に用いられる。
【0043】It ∈Iは検索されるデータである。
【0044】Uは目標データIt を検索するユーザを示
す。
【0045】Dk は繰り返しのk回目に、システムによ
って表示される情報である。PicHunterの場合
では、これは画像の小集合であるが、追加情報が表示さ
れる場合にもこのフレームワークはそのまま適用され
る。
【0046】Aは、ユーザが各表示に応答して行ない得
る可能な動作の集合である。これはユーザインタフェー
スによって定義される。Aには、検索を終了する何らか
の動作が含まれるものとする。
【0047】ak ∈Aは繰り返しのk回目に行われる動
作である。
【0048】ここで、疑問が生じる。すなわち、「表示
/動作ペアの履歴が与えられているとき、あるデータI
i ∈Iが目標データIt と等しい確率はどの程度か
?」。この確率を見出だすために、ベイズの公式が適用
され、目標データがIi だった場合に、ユーザがある一
連の動作を行う確率として、数1で表わされる。
【0049】
【数1】 ある任意のデータが目標データである確率は、ユーザが
誰であるか、あるいは一連の表示がどんなものであった
かとは無関係であると仮定することができる。従って、
P{Ii |D1 ...Dk ,U}=P{Ii }は、単
に、Ii が目標データとして選択された事前確率であ
る。
【0050】次に、各繰り返しにおけるユーザの動作は
目標データおよび現在表示のみによる、すなわち、過去
の反復回のいずれにも無関係であると仮定する。
【0051】上記の2つの仮定から、数2が導かれる。
【0052】
【数2】 式(2)から、ユーザが行ない得る動作の各々の確率を
推定する関数がある場合には、各反復回の後、あるデー
タが目標データである確率の変化を計算できることにな
る。すなわち、数3の関数である。ここで、Kは任意の
定数である。
【0053】
【数3】 このような関数は、情報検索システム以外でも、実験的
にテストされ調節されるユーザ行動のモデルを表わすも
のである。
【0054】図1を参照して、本発明によるデータベー
スの検索/選択中のプロセスを説明するためのフローチ
ャートが示されている。すなわち、まず、ステップ10
00において、ユーザは所望の項目を指定する。通常、
データベース検索システムのユーザは所望の項目を有し
ている。この場合には、その所望の項目と一致する項目
を求めてデータベースを検索することができる。あるい
は、そして本発明によって教示されるように、「目標
の」所望の項目をユーザに対して表示してもよく、この
場合には、ユーザは、その目標と一致する対象を選択的
に見つけ出す。
【0055】次いで、プロセスはステップ1010に進
み、規則の集合、すなわち確率分布により表示項目のリ
ストを作成する。リストが確率分布によって作成される
場合には、各項目は、所望の項目と密接に関連する確率
(密接関連確率)にしたがってリストに加えられる。
【0056】項目リストが作成された後、ステップ10
20において、項目がユーザに表示される。その後、ス
テップ1030において、ユーザは、表示された項目に
対して応答する。すなわち、表示された項目のうちのど
れが所望のものであるか、あるいは所望のものが全くな
いかの確認を行なう。ステップ1040において、所望
の項目が表示されていれば、項目が見つかったのであ
り、ステップ1050においてプロセスが終了する。そ
うでなければ、ステップ1060においてユーザ応答の
結果として確率分布を再計算し、プロセスはステップ1
010へ戻る。
【0057】図2は、ユーザ行動の関数Sに基づいて構
築された適合性フィードバック法のための擬似コードの
リストである。図2に示す方法は、データベース中のデ
ータが検索の目標である確率の現在分布を保有してい
る。検索の各繰り返しにおいては、最も確率の高いN個
のデータがユーザに示され、ユーザ応答は確率分布を更
新するために用いられる。最初に、確率分布はフラット
な事前分布(定数値)で初期化される。但し、当業者で
あれば、照会に基づくシステムにおいて用いられる時の
ように、明示的な照会から計算された分布を用いても、
確率分布を容易に初期化できることが容易に理解されよ
う。
【0058】図2に示した擬似コードのリストは全く一
般的なものである。現実のプログラムにおける擬似コー
ドを具現するには、ユーザインタフェースを設計するこ
とによって可能な動作の集合Aを定義し、妥当なユーザ
モデルSを実現することだけでよい。
【0059】本発明の主題であるマルチメディア画像検
索システムでは、ユーザインタフェースを可能な限り単
純にして、ユーザによって提供される情報の賢明な利用
に重きをおくことが望ましい。このような方法は、IE
EE Computer 第28(9)巻(1995
年)の23〜32頁に掲載された「Query byI
mage and Video Content:Th
e QBIC System」と題する論文において、
M.Flicknerらによって提唱されているような
方法とは際立って対照的である。すなわちこの論文で
は、最大限に情報化された(informative)
ユーザインタフェースの設計が試みられている。
【0060】一方、PicHunterのユーザインタ
ーフェースの全体を図3に示す。検索中の任意の時点
で、4つの画像が画面上に表示され、ユーザに提示され
る。ユーザはこれらの画像をマウスでクリックすること
によって、1つ以上の表示画像を選択することができ
る。選択された画像は赤の縁取りを付して強調される。
また、もう一度クリックすることによって画像の選択を
解除することができる。
【0061】ゼロあるいはそれ以上の画像を選択した
後、ユーザは「GO」ボタンを押すことによって、次回
の4つの画像の組み合わせを呼び出す。ユーザは目標が
現れるまで画像を選択し、「GO」を押す作業を続け
る。目標が現れた時点で、その画像を選択し、「FOU
ND」ボタンを押すことによって、検索は終了する。
「ABORT」ボタンは目標画像が見つかる前に検索を
終了する場合に用いる。表示された画像に対する可能な
ユーザ応答の集合Aは20個の要素を含む。即ち、選択
された画像の可能な組み合わせが16通りと、検索終了
が4通りである。
【0062】当業者であれば、画像が目標の色彩、形
状、きめ、あるいは構造に似ているかどうかを個別に示
すために、ユーザが用いることのできるボタンなどの、
さらに充実した制御装置を追加することにより、ユーザ
インタフェースの機能を向上させることができることが
容易に理解されよう。例えば、システムをタッチ画面を
用いて実現し、布地の店に設置して、顧客が布地のデザ
インを探す手助けとしてもよい。用いられるユーザイン
タフェースにかかわらず、ここに採用したベイズのフレ
ームワークはいかなるユーザインタフェースにも適用可
能である。
【0063】ユーザモデルを展開するために、2つの単
純化された仮定がたてられる。第1に、すべてのユーザ
が全く同じであるとすれば、Uを無視することができ
る。そうでない場合は、この方法は個々のユーザあるい
は同様なユーザのクラスに適用される。第2に、ユーザ
の行動は画像特徴値の小集合と照合されるものとする。
【0064】本発明に用いられる特徴集合は有限であ
る。但し、当業者であれば、将来的には、追加の特徴を
容易に考えることができよう。下記表1には、現在用い
られている18個の特徴が挙げられている。ここで、項
目#16のコントラストは、画素の1/3が下まわるよ
うな輝度値としてY0を、画素の2/3が下まわるよう
な輝度値としてY1を有している。さらに、項目#17
の画像のエッジセル(edgel)数は、まず画像を階
調に変換し、次に単純な3×3のラプラシアンフィルタ
によるフィルタリングを行ない、その結果を20%で閾
値化することによって計算される。
【0065】
【表1】 データベース中の各画像に対し、18要素の特徴ベクト
ルを計算した後、特徴とユーザ動作の関係を特定するた
めに略式の実験を行なった。実験の各回において、被験
者(ユーザ)に対し、1つの無作為に選択された「目
標」画像と共に、4つの無作為に選択された画像を表示
する。次に、被験者に対し、目標画像に「全体的に見て
最も類似している」画像を表示から選択することを求め
る。どれも全く似ていない場合には、被験者はすべての
画像を選択しないままに残しておくことができる。2つ
以上の画像が同程度に類似している場合には、被験者
は、1つ以上の画像を選択することができる。驚くべき
ことに、非常に単純なモデルが今回および以降の実験の
結果に一致する。この単純なモデルはいくつかの高度に
簡素化するための仮定に基づいている。
【0066】1.ユーザがある画像を選択する確率は、
目標画像および現在表示されている他の画像の特徴値に
のみ依存すること。選択されたその他の画像のいずれと
も無関係であること。
【0067】2.ユーザは各画像について唯一の特徴に
のみ基づいて決定を行なうこと、および、選択された特
徴が計算された特徴の1つにまさに符合することが多い
こと。
【0068】3.ユーザがある特徴を選択する確率が一
定であること。各特徴の確率はWfとして示され、特徴
の重みと呼ばれること。
【0069】4.ユーザが画像を選択する確率は、選択
された特徴において目標からより遠いその他の表示画像
の数の線形関数であること。
【0070】これらの仮定がたてられると、ある画像が
選択される確率は数4の線形関数で表わされる。
【0071】
【数4】 ここで、Fは、画像の計算された特徴に対応する実数値
関数の集合である。説明を簡単にするため、V(Di
t ,D)を画像Dの「画像スコア」と呼ぶ。
【0072】図4は、3人の異なった被験者によって画
像が選択された選択頻度(相対頻度)を、表1に挙げた
18個の特徴およびWf =1を用いてこの方法で計算さ
れた画像スコアの関数として示す。比較のために、点線
は全く無作為の「ユーザ」の行動を示す。図4から、画
像スコアと選択頻度の相関が明らかに示される。
【0073】ユーザ間の主要な相違は彼等が画像を全く
選択しない頻度である。もし、画像が全く選択されなか
った試行をすべて無視するならば、図5に示すように、
3人の被験者の行動は著しく類似する。このことは、被
験者がまず、選択すべき画像が1つでもあるかどうかを
決定すること、および、この判断について各被験者がそ
れぞれ異なる閾値を有していることを示唆している。し
かしながら、画像を選択するという決定がいったんなさ
れてしまうと、残りの手順は式(4)によって正確にモ
デル化される。
【0074】「画像スコア」を用い、画像が全く選択さ
れない場合にはモデルが当てはまらないことを認めた上
で、図6に示した擬似コードを用いた手順によりS関数
が計算される。ユーザがどの画像も選択しない場合、こ
の手順は、その入力とは無関係に定数値に戻り、データ
ベースの確率分布はそのままになる。ユーザが1つ以上
の画像を選択する場合には、画像スコアにしたがってユ
ーザが各画像を選択する確率を見出だす手順に進み、S
を選択された画像の確率とし、Pを非選択画像の確率と
したとき、S=S*(1−P)を計算する手順に戻る。
【0075】簡素化するための仮定によれば、画像が選
択される確率はそのスコアの線形関数でなければならな
い。しかしながら、このような関数はモデルに過度の信
頼を置くことになる恐れがある。画像スコアの線形関数
を用いたならば、極大(extreme)画像スコア
は、0あるいは1で切らざるをえない確率を導くことに
なるだろう。しかしながら、残念なことにユーザは誤り
を犯す。したがって、極大確率は、正しい目標を検索か
ら完全に除去してしまうことになる恐れがある。これを
避けるために、シグモイドを実験データに適合させる
と、これは、データの範囲内ではほぼ線形であるが、極
大確率には決して到達しない。シグモイドのパラメータ
であるMおよびσは、データに対して妥当な適合度を与
えるようにマニュアルで設定される。
【0076】残る唯一のタスクは、実験データに良好に
適合するような、18個の特徴重みWf のための値を選
択することである。このステップのためにより多くのデ
ータを集めるために、すべての重みを1に設定するよう
に修正したPicHunter法のバージョンを実行す
る。次に、何回もの検索を実行し、各ユーザの行動が記
録される。PicHunterのこの修正バージョンの
性能を評価したところ、最適バージョンの性能よりもわ
ずかに劣るにすぎない。
【0077】これらの検索中のユーザの行動が図5に示
す行動と一致したことを確認した後、このデータを最初
に集めたデータと組み合わせた。
【0078】次に、記録された選択と、18個の特徴の
それぞれについてのみ計算した画像スコアとの相関係数
を決定した。そして、特徴を相関の減少順に並べ変え、
最高値の相関をもつ特徴に対する重みを1に設定し、他
の特徴に対する重みを0に初期化した。相関の減少順に
おいて連続する各特徴に対する重みを、0と2の間の1
00個の重みを試行し、表2に示すように、データとの
相関が全体として最高になるものを選択することによっ
て特定した。
【0079】
【表2】 PicHunter法をテストするために、201枚の
コンパクトディスク(CD)に20000個を超える格
納画像を含む商用データベースを取得した。4522枚
の画像を、128×192画素の解像度でハードディス
クに移し、表1に含まれる18個の特徴を予め計算し
た。
【0080】PicHunter法は、このデータベー
ス上で、数人の被験者が何回もの検索を実施することに
よってテストされた。第1の被験者は本発明の発明者の
1人であり、この第1組の結果は、最高の専門的知識を
持つユーザ、すなわち、その行動がおそらくS関数とマ
ッチすることになるユーザによって実現される成果を表
わす。第2の被験者はこのシステムの開発には関与しな
かったシステムプログラマであった。この第2組の結果
は、このシステムの使用についての特別な専門的知識を
持たないコンピュータ専門家の成果を表わす。最後に、
システムは、他の8人の被験者がそれぞれただ1回もし
くは2回の検索を実行することによって、簡単にテスト
された。この第3組の結果は、平均的なコンピュータの
知識を持つが、このシステムについてはいかなる知識も
持たない人々の成果を表わす。様々な被験者のテスト結
果を表3に示す。
【0081】
【表3】 各試験者は、下記事項のみから成る最低限の指示を与え
られた。
【0082】1.画像上でクリックすることによって、
目標に最も類似する画像を選択して下さい。選択された
画像には赤い縁取りが付されます。
【0083】2.2つ以上の画像の間で決定を下すこと
ができない場合には、複数個を選択できます。
【0084】3.目標に類似する画像が全く見当たらな
い場合、あるいは、すべてが等しく類似していると見え
る場合には、どれも選択しないで下さい。
【0085】4.どの画像が最も類似しているかについ
て気が変わった場合には、もう一度クリックすることに
よって選択を解除できます。
【0086】5.最適の画像を選択し終わったら、「G
O」ボタンをクリックして次の組の画像を呼び出して下
さい。
【0087】6.目標画像が現れた場合、それを選択
し、次に「FOUND」ボタンを押して下さい。
【0088】もちろん、これらの指示は非情報的であ
り、システムをどのように扱うのがベストかのヒントを
含むような指示も考えられる。すべてのテストの結果を
表3に示す。図7は2人のコンピュータ専門家の結果を
グラフで示しており、ある反復数の間に成功した検索の
割合を表わす。点線は、データベースが無作為に検索さ
れた場合に予測される、対応する割合を示す。
【0089】2人のコンピュータ専門家による結果は、
ユーザインタフェースの単純さと予め計算された画像特
徴にもかかわらず、このシステムが無作為検索をかなり
上回る改善であることを明らかに示すものである。概し
て、55回を越えた直後、すなわち、4522個のうち
の220個の画像を見た直後に、画像をうまく見つけら
れるようになった。ユーザインタフェースの単純さによ
り、経験を積んだユーザであれば各回に1秒〜2秒を費
やすだけでよく、その結果、平均的検索は、ほんの数分
間続けられるにすぎない。
【0090】第3組の結果はそれほど良くはなかった。
検索の半数が成功し、成功した検索の平均的長さは繰り
返しが75回であった。それでも、無作為の場合よりは
かなり良好である。
【0091】第3のグループのユーザが直面した困難の
原因として考えられるものの1つとしては、このグルー
プが、しばしば、システムが評価を行なわない特徴に集
中したことである。例えば、このユーザの1人は、フラ
ミンゴの絵を検索したが、そのフラミンゴの首のカーブ
と一致するカーブを含むかどうかに、画像の選択の基準
を置いたと報告した。ここでの特徴集合は、曲り具合に
ついての評価は一切含んでいないので、画像を見つけら
れなかったことは驚くにあたらない。より包括的な特徴
集合を用いれば、このような未熟なユーザにとっての成
果が改善されると思われる。
【0092】既に述べたように、このユーザインタフェ
ースは可能な限り単純であるように選択された。すなわ
ち、図8に示すように、システムは1組の画像(ここで
は4つ)を表示し、ユーザは選択装置すなわちマウスを
用いて画像上をクリックすることによってその部分集合
を選択する。このインタフェースはユーザにとって非常
にわかりやすいものではあるが、検索手段(サーチエン
ジン)としては、ユーザの要望についての情報はかなり
貧弱である。ユーザがより明確な情報をエンジンに提供
することが可能なより複雑なインタフェースが容易に考
えられる。
【0093】例えば、本インタフェースの単純な拡張と
しては、表示画像がユーザの目標と一致する強度(in
tensity)をユーザが指示できるようにすること
が考えられる。さらに、一致が生じる特徴をユーザが指
示できるようにするメカニズムが有用であろう。ユーザ
インタフェースをより複雑さに改良することにより、提
示された画像中の特に関連する部分をユーザが選択的に
特定することが可能となる。ユーザは関連する画像領域
上で単にクリックすれば、すなわち、マウスでそれらを
「捕え」ればよい。このような改善により、ユーザは、
複雑な照会言語や描画ツールを学ぶ必要なしに、全く明
確な特定を行なえる。
【0094】データベースの確率分布をベイズ方式で更
新することから生じるエントロピーにおける予測される
減少を最大とするような表示を選択することが望まし
い。このことは、ユーザ動作と目標画像間の相互情報を
最大化することと等価である。一例として、Tが、現時
点までに検索によって決定された分布から導かれた目標
画像であり、Aが、予測アルゴリズムによって決定され
た分布から導かれたユーザ動作とすると、数5を最大化
するDを見つけることが望ましい。
【0095】
【数5】 ある表示に対して、O(M×SN )回目における動作と
目標画像間の相互情報を計算することもできる。ここ
で、Mはデータベース中の画像の数であり、SNはN個
の画像の表示に対するユーザ動作の確率を評価すること
の複雑度である。
【0096】相互情報の計算において、検索を終了させ
る動作を含むすべての可能なユーザ動作を用いることが
重要である。目標画像が表示画像の1つである場合に
は、ユーザが対応する終了動作を行なう可能性は100
%であり、その他の動作を行なう可能性は0%である。
このことの効果は、終了動作の後のベイズ式更新により
エントロピーが0に減少すること、および、与えられた
表示から得られる相互情報が、その表示が目標画像を含
む確率を反映することである。
【0097】残念なことに、最高の相互情報を与える表
示を発見するための強力なアプローチは、O(M×SN
×(M choose N))である。そこで、MとN
がごく小さくても、強力なアプローチは使うことができ
ない(prohibitive)。
【0098】O(M choose N)no部分を縮
小するためには、「貪欲な」発見的手法が用いられる。
まず表示すべき最上の画像が1つ選択される。これは単
に、目標となる確率が最高のものということになろう。
次に、最も情報的な2画像の表示を提供するある1つの
画像が追加される。このステップは、O(M×M×
2 )の計算を必要とする。これは、データベース中の
各画像が与えられると、相互情報を計算する必要がある
からである。N個の画像を得るためにN回繰り返すと、
合計所要時間は数6で表わされる。
【0099】
【数6】 これでかなり良くなっているものの、あらゆる実利的な
データベースにおいてそうであるようにMが大きい場合
には、依然として使うことができない。
【0100】妥当な範囲の複雑度にするために、いくつ
かの画像を、表示のための候補としては無視することが
できる。一見したところ、表示のための候補は、目標画
像である確率が最も高いC画像であると思われる。ここ
で、Cは統制可能な定数である。しかしながら、最高の
C画像はしばしば互いに全く類似しており、有益な情報
を得るには、比較のために、より低い確率の1〜2個の
画像の表示が必要となる。したがって、最高のC1 画像
が用いられ、これに、残りのリスト中に等間隔に置かれ
たC2 画像が加えられる。これらの画像のみを表示用に
検討することにより、数7の複雑度が得られる。
【0101】
【数7】 これは、相互情報を評価する近似法を用いることによっ
て、さらに改良できる。その方法は2つのステージ、す
なわち、複雑度O(M log M)の初期化ステージ
と、複雑度O(K×SN )の計算ステージに分けられ
る。ここで、Kは許容可能な精度を得るために選択され
る値である。初期化ステージは、与えられたTの分布に
ついて一度だけ計算する必要がある。次に、I(T;A
|D)を、初期化をやり直すことなく、様々な可能なD
について評価することができる。
【0102】図9を参照して、本方法は、K個のサンプ
ル画像の集合を選択する。目標画像が2つの隣接したサ
ンプル、すなわち、サンプル[j]およびサンプル[j
+1]の間の画像の1つである確率は1/Kである(こ
こで「間」とは、ソートされたリストtList中での
両者の間を意味する)。ここで、1/Kより高い確率の
画像はサンプルのリストに2回以上現れる。
【0103】図10に示す計算ステージにおいて、サン
プルのリストはすべての可能な画像の完全なリストであ
り、それぞれが確率1/Kを有している。
【0104】この相互情報の近似化および上述の発見的
手法を用いると、画像の集合は、数8で表わされる時間
内に表示されるものとして選択することができる。
【0105】
【数8】 1 ,C2 およびKは、Mよりかなり小さくなるように
選択されるため、これは重要な改良である。
【0106】以上、本発明について好ましい実施例を用
いて説明してきたが、本発明の趣旨および範囲を逸脱す
ることなく種々の修正および変更が可能であることは、
当業者には明らかであろう。例えば、本発明を画像デー
タベースの検索に関してのみ説明したが、ほとんどすべ
ての概念は他の媒体にも関係する。特に、音声や映像デ
ータベースおよび三次元モデルにも関係する。従って、
本発明は請求項の範囲によってのみ限定されるものであ
る。
【0107】
【発明の効果】以上説明したように本発明によれば、所
望の画像を短時間で見つけることができるデータベース
検索方法が得られる。
【図面の簡単な説明】
【図1】本発明にしたがってデータベースから検索する
項目を選択する際に実行されるステップのフローチャー
トである。
【図2】本発明で用いる、ベイズの適合性フィードバッ
ク法に用いられる擬似コード表である。
【図3】本発明において用いられる典型的なユーザイン
タフェースの画面上に表示した中間調画像の写真であ
る。
【図4】本発明を説明するための図であり、3被験者に
ついての画像選択頻度を示すグラフである。
【図5】本発明を説明するための図であり、どの画像選
択無しも無視されない場合の3被験者の画像選択頻度を
示すグラフである。
【図6】本発明において用いられるユーザモデルのため
の擬似コード表である。
【図7】本発明を説明するための図であり、検索繰り返
し数の関数としての、検索成功の率を示すグラフであ
る。
【図8】本発明を説明するための図であり、a〜dは一
つの検索についての4回の繰り返しにおける画面上に表
示した中間調画像を示す写真である。
【図9】本発明において用いられる初期化モジュールの
ための擬似コード表である。
【図10】本発明において用いられる計算モジュールの
ための擬似コード表である。
【符号の説明】
1000 ステップ 1010 ステップ 1020 ステップ 1030 ステップ 1040 ステップ 1050 ステップ 1060 ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スティーブン オムハンドロ アメリカ合衆国,ニュージャージー 08852,モンマス ジャンクション,ヘム ロック コート 1012 (72)発明者 ピーター イヤノロス アメリカ合衆国,ニュージャージー 08540,プリンストン,アレトン ロード 215

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 ユーザによって指定された所望の項目
    を、データベース中の項目から見つけ出すための対話式
    方法であって、 前記データベース中の項目の前記所望の項目への密接関
    連確率により決まる確率分布に従って、前記データベー
    ス中の項目から複数項目を選び、該複数項目のリストを
    生成する生成ステップと、 前記複数項目のリストをユーザに対して表示項目のリス
    トとして表示する表示ステップと、 前記ユーザからの前記表示項目と前記所望の項目との関
    係を示す応答を対話式ユーザインタフェースを介して獲
    得する獲得ステップと、 前記応答に従って前記確率分布を再計算し、前記生成ス
    テップに、この再計算された確率分布に従って、前記デ
    ータベース中の項目から複数項目を選ばせ、該複数項目
    のリストを生成させる再計算ステップと、 前記応答として、前記表示項目のうちのどれが前記所望
    の項目であるかを特定する応答が得られるまで、前記再
    計算ステップ、前記生成ステップ、前記表示ステップ、
    及び前記獲得ステップを繰り返すステップとを含むデー
    タベース検索方法。
  2. 【請求項2】 前記生成ステップは、高確率の複数項目
    のリストを、前記複数項目のリストとして生成すること
    を特徴とする請求項1に記載のデータベース検索方法。
  3. 【請求項3】 前記生成ステップは、前記応答と前記所
    望の項目との相互情報が最も高められる複数項目を、前
    記複数項目のリストとして生成することを特徴とする請
    求項1に記載のデータベース検索方法。
  4. 【請求項4】 請求項3に記載のデータベース検索方法
    において、 前記表示項目のリストとして表示される前記複数項目の
    リストが、 (i)当該リストに最高確率の一項目を含ませるステッ
    プ、 (ii)前記データベース中の項目の部分集合を用い
    て、当該リストに加えたときに、最高に評価される相互
    情報が得られる一つの項目を見つけるステップ、 (iii)前記リストに前記一つの項目を加えること、 前記リストが前記複数項目を含むまで、前記ステップ
    (ii)及び前記ステップ(iii)を繰り返すステッ
    プによって選び出されることを特徴とするデータベース
    検索方法。
  5. 【請求項5】 請求項3に記載のデータベース検索方法
    において、 前記相互情報が、 目標と成り得るものの完全なリストを確率の減少順に初
    期化するステップと、 前記リストから、同じ値だけ離れた確率を有するサンプ
    ル目標の集合を選択するステップと、 前記サンプル目標の各々が等しい事前確率を有する場合
    に、前記サンプル目標と前記応答との間の相互情報を計
    算するステップとにより評価されることを特徴とするデ
    ータベース検索方法。
  6. 【請求項6】 前記獲得ステップは、前記ユーザからの
    前記表示項目に対する応答として、前記表示項目の中で
    前記所望の項目に最も類似する項目を特定する応答を、
    獲得することを特徴とする請求項1に記載のデータベー
    ス検索方法。
  7. 【請求項7】 前記獲得ステップは、前記ユーザからの
    前記表示項目に対する応答として、前記表示項目及び前
    記所望の項目間の類似度を指示する応答を、獲得するこ
    とを特徴とする請求項1に記載のデータベース検索方
    法。
  8. 【請求項8】 前記獲得ステップは、前記ユーザからの
    前記表示項目に対する応答として、前記所望の項目に類
    似した前記表示項目の態様あるいは要素を指示する応答
    を、獲得することを特徴とする請求項1に記載のデータ
    ベース検索方法。
  9. 【請求項9】 前記再計算ステップは、ベイズの公式(B
    ayes' rule) およびユーザのアルゴリズム的モデルにし
    たがって、前記応答から前記データベース中の項目に対
    する新たな確率分布を計算するステップを含み、前記ア
    ルゴリズム的モデルは、前記表示項目と前記所望の項目
    を条件として、応答に関する確率分布を計算するための
    ものであることを特徴とする請求項1に記載のデータベ
    ース検索方法。
  10. 【請求項10】 前記ユーザのアルゴリズム的モデル
    は、前記データベース中の項目の予め計算された特徴の
    集合を用いるものであることを特徴とする請求項9に記
    載のデータベース検索方法。
  11. 【請求項11】 前記ユーザのアルゴリズム的モデル
    は、前記データベース中の項目についてマニュアル入力
    された特徴の集合を用いるものであることを特徴とする
    請求項9に記載のデータベース検索方法。
  12. 【請求項12】 前記ユーザのアルゴリズム的モデル
    は、各表示項目を前記所望の項目に最も類似するものと
    して特定するユーザの独立確率を割り当て、任意の組み
    合わせの項目についての確率を、Sを選択された項目の
    確率とし、Pを非選択項目の確率としたとき、S=S*
    (1−P)として、計算することを特徴とする請求項9
    に記載のデータベース検索方法。
  13. 【請求項13】 各表示項目が、前記所望の項目に最も
    類似するものとして特定される確率は、前記ユーザが、
    当該表示項目が他の表示項目よりも類似していると見な
    す確率の積として計算されることを特徴とする請求項1
    2に記載のデータベース検索方法。
  14. 【請求項14】 前記データベースは画像のデータベー
    スであり、前記予め計算された特徴の1つは基本色のヒ
    ストグラムであることを特徴とする請求項10に記載の
    データベース検索方法。
  15. 【請求項15】 前記データベースは画像のデータベー
    スであることを特徴とする請求項1に記載のデータベー
    ス検索方法。
  16. 【請求項16】 前記データベースはサウンドのデータ
    ベースであることを特徴とする請求項1に記載のデータ
    ベース検索方法。
  17. 【請求項17】 前記データベースはビデオクリップの
    データベースであることを特徴とする請求項1に記載の
    データベース検索方法。
  18. 【請求項18】 前記データベースは二次元図形のデー
    タベースであることを特徴とする請求項1に記載のデー
    タベース検索方法。
  19. 【請求項19】 前記データベースは三次元図形のデー
    タベースであることを特徴とする請求項1に記載のデー
    タベース検索方法。
  20. 【請求項20】 前記データベースはテキストのデータ
    ベースであることを特徴とする請求項1に記載のデータ
    ベース検索方法。
  21. 【請求項21】 データベース検索の有効性を評価する
    ための対話式方法であって、 検索すべき目標オブジェクトを生成するステップと、 前記目標オブジェクトおよび候補オブジェクトの集合を
    ユーザに対して表示するステップと、 前記目標オブジェクトを見出だす際のユーザの困難度を
    表わす1つ以上のメトリックを評価することによって、
    検索有効性を測定するステップと、 困難度の測定値を平均化しながら上記のステップを繰り
    返すステップとを含むことを特徴とする対話式方法。
JP9113577A 1996-04-16 1997-04-16 データベース検索方法 Expired - Fee Related JP3053003B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/634,313 US5696964A (en) 1996-04-16 1996-04-16 Multimedia database retrieval system which maintains a posterior probability distribution that each item in the database is a target of a search
US08/634313 1996-04-16

Publications (2)

Publication Number Publication Date
JPH1040268A true JPH1040268A (ja) 1998-02-13
JP3053003B2 JP3053003B2 (ja) 2000-06-19

Family

ID=24543287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9113577A Expired - Fee Related JP3053003B2 (ja) 1996-04-16 1997-04-16 データベース検索方法

Country Status (5)

Country Link
US (1) US5696964A (ja)
EP (1) EP0802489B1 (ja)
JP (1) JP3053003B2 (ja)
CN (1) CN1094219C (ja)
DE (1) DE69723346T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004259057A (ja) * 2003-02-26 2004-09-16 Intec Web & Genome Informatics Corp 情報検索装置、情報検索方法、及び情報検索プログラム
US8898581B2 (en) 2011-02-22 2014-11-25 Sony Corporation Display control device, display control method, search device, search method, program and communication system

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
USRE46310E1 (en) 1991-12-23 2017-02-14 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
USRE48056E1 (en) 1991-12-23 2020-06-16 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
USRE47908E1 (en) 1991-12-23 2020-03-17 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5903454A (en) * 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5915250A (en) * 1996-03-29 1999-06-22 Virage, Inc. Threshold-based comparison
US6021403A (en) 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US5852823A (en) * 1996-10-16 1998-12-22 Microsoft Image classification and retrieval system using a query-by-example paradigm
US6480194B1 (en) 1996-11-12 2002-11-12 Silicon Graphics, Inc. Computer-related method, system, and program product for controlling data visualization in external dimension(s)
US5950189A (en) * 1997-01-02 1999-09-07 At&T Corp Retrieval system and method
US6373483B1 (en) 1997-01-13 2002-04-16 Silicon Graphics, Inc. Method, system and computer program product for visually approximating scattered data using color to represent values of a categorical variable
US6182058B1 (en) 1997-02-28 2001-01-30 Silicon Graphics, Inc. Bayes rule based and decision tree hybrid classifier
US6137499A (en) * 1997-03-07 2000-10-24 Silicon Graphics, Inc. Method, system, and computer program product for visualizing data using partial hierarchies
US6278464B1 (en) 1997-03-07 2001-08-21 Silicon Graphics, Inc. Method, system, and computer program product for visualizing a decision-tree classifier
US5960435A (en) * 1997-03-11 1999-09-28 Silicon Graphics, Inc. Method, system, and computer program product for computing histogram aggregations
US5930803A (en) * 1997-04-30 1999-07-27 Silicon Graphics, Inc. Method, system, and computer program product for visualizing an evidence classifier
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US6026399A (en) * 1997-05-30 2000-02-15 Silicon Graphics, Inc. System and method for selection of important attributes
US6012064A (en) * 1997-08-21 2000-01-04 Lucent Technologies Inc. Maintaining a random sample of a relation in a database in the presence of updates to the relation
US6163782A (en) 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
EP0938053B1 (en) * 1998-02-20 2003-08-20 Hewlett-Packard Company, A Delaware Corporation Methods of refining descriptors
US6405188B1 (en) * 1998-07-31 2002-06-11 Genuity Inc. Information retrieval system
US6584459B1 (en) 1998-10-08 2003-06-24 International Business Machines Corporation Database extender for storing, querying, and retrieving structured documents
US6301579B1 (en) 1998-10-20 2001-10-09 Silicon Graphics, Inc. Method, system, and computer program product for visualizing a data structure
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US7254285B1 (en) 1998-11-06 2007-08-07 Seungup Paek Image description system and method
AU1468500A (en) * 1998-11-06 2000-05-29 Trustees Of Columbia University In The City Of New York, The Systems and methods for interoperable multimedia content descriptions
US6460049B1 (en) 1998-12-22 2002-10-01 Silicon Graphics, Inc. Method system and computer program product for visualizing an evidence classifier
US7730426B2 (en) 1998-12-31 2010-06-01 Microsoft Corporation Visual thesaurus as applied to media clip searching
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US7016916B1 (en) * 1999-02-01 2006-03-21 Lg Electronics Inc. Method of searching multimedia data
US6664980B2 (en) 1999-02-26 2003-12-16 Accenture Llp Visual navigation utilizing web technology
US6347313B1 (en) 1999-03-01 2002-02-12 Hewlett-Packard Company Information embedding based on user relevance feedback for object retrieval
KR100346262B1 (ko) * 1999-08-27 2002-07-26 엘지전자주식회사 멀티미디어 데이타의 키워드 자가 생성방법
US6862713B1 (en) 1999-08-31 2005-03-01 International Business Machines Corporation Interactive process for recognition and evaluation of a partial search query and display of interactive results
US6859802B1 (en) * 1999-09-13 2005-02-22 Microsoft Corporation Image retrieval based on relevance feedback
US6539395B1 (en) * 2000-03-22 2003-03-25 Mood Logic, Inc. Method for creating a database for comparing music
JP2001282803A (ja) * 2000-03-28 2001-10-12 Pioneer Electronic Corp Av情報処理装置及びav情報処理用プログラムがコンピュータで読取り可能に記録された情報記録媒体
US6745178B1 (en) * 2000-04-28 2004-06-01 International Business Machines Corporation Internet based method for facilitating networking among persons with similar interests and for facilitating collaborative searching for information
CA2307404A1 (en) 2000-05-02 2001-11-02 Provenance Systems Inc. Computer readable electronic records automated classification system
US6785421B1 (en) * 2000-05-22 2004-08-31 Eastman Kodak Company Analyzing images to determine if one or more sets of materials correspond to the analyzed images
JP2001337995A (ja) * 2000-05-26 2001-12-07 Noritsu Koki Co Ltd 画像管理装置および方法、ならびに、画像データを管理するプログラムを記録したコンピュータ読み取り可能な記録媒体
US20010051942A1 (en) * 2000-06-12 2001-12-13 Paul Toth Information retrieval user interface method
DE10032225A1 (de) * 2000-07-03 2002-01-17 Pixfind Com Gmbh Verfahren und Vorrichtung zur automatischen Suche relevanter Bilddatensätze
JP3979009B2 (ja) 2000-07-07 2007-09-19 株式会社デンソー 制御情報出力装置及び情報システム
US6895398B2 (en) * 2000-07-18 2005-05-17 Inferscape, Inc. Decision engine and method and applications thereof
JP2002092029A (ja) * 2000-09-20 2002-03-29 Denso Corp ユーザ情報推定装置
US6804662B1 (en) * 2000-10-27 2004-10-12 Plumtree Software, Inc. Method and apparatus for query and analysis
DE10110275A1 (de) * 2001-03-02 2002-09-19 Daimler Chrysler Ag Verfahren zur Kennzeichnung von gespeicherter Information
WO2002079942A2 (en) * 2001-03-29 2002-10-10 Artmecca.Com System for visual preference determination and predictive product selection
US7200556B2 (en) * 2001-05-22 2007-04-03 Siemens Communications, Inc. Methods and apparatus for accessing and processing multimedia messages stored in a unified multimedia mailbox
IES20010724A2 (en) * 2001-07-30 2003-02-05 Univ Dublin Data processing system and method
US7260607B2 (en) * 2001-08-02 2007-08-21 Siemens Communications, Inc. Methods and apparatus for performing media/device sensitive processing of messages stored in unified multimedia and plain text mailboxes
US7266545B2 (en) * 2001-08-07 2007-09-04 International Business Machines Corporation Methods and apparatus for indexing in a database and for retrieving data from a database in accordance with queries using example sets
US7339992B2 (en) 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
WO2003060771A1 (en) * 2002-01-14 2003-07-24 Jerzy Lewak Identifier vocabulary data access method and system
EP1367505A1 (en) * 2002-05-30 2003-12-03 Thomson Licensing S.A. Method and device for creating semantic browsing options
JP3878518B2 (ja) * 2002-07-08 2007-02-07 松下電器産業株式会社 データ検索装置
WO2004102477A1 (en) * 2003-05-09 2004-11-25 Avid Technology, Inc. Watermarking
US7249263B2 (en) * 2003-07-25 2007-07-24 International Business Machines Corporation Method and system for user authentication and identification using behavioral and emotional association consistency
EP1665252B1 (en) * 2003-09-01 2008-05-21 Koninklijke Philips Electronics N.V. Media item selection
US20050123526A1 (en) * 2003-12-01 2005-06-09 Medtronic Inc. Administration of growth factors for neurogenesis and gliagenesis
US9268780B2 (en) 2004-07-01 2016-02-23 Emc Corporation Content-driven information lifecycle management
WO2006005187A1 (en) * 2004-07-09 2006-01-19 Parham Aarabi Interactive three-dimensional scene-searching, image retrieval and object localization
WO2006096612A2 (en) 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
US8126874B2 (en) 2006-05-09 2012-02-28 Google Inc. Systems and methods for generating statistics from search engine query logs
KR100785928B1 (ko) * 2006-07-04 2007-12-17 삼성전자주식회사 멀티모달 정보를 이용한 사진 검색 방법 및 사진 검색시스템
US9202184B2 (en) 2006-09-07 2015-12-01 International Business Machines Corporation Optimizing the selection, verification, and deployment of expert resources in a time of chaos
US20090287503A1 (en) * 2008-05-16 2009-11-19 International Business Machines Corporation Analysis of individual and group healthcare data in order to provide real time healthcare recommendations
US7970759B2 (en) 2007-02-26 2011-06-28 International Business Machines Corporation System and method for deriving a hierarchical event based database optimized for pharmaceutical analysis
US7853611B2 (en) 2007-02-26 2010-12-14 International Business Machines Corporation System and method for deriving a hierarchical event based database having action triggers based on inferred probabilities
US7917478B2 (en) * 2007-02-26 2011-03-29 International Business Machines Corporation System and method for quality control in healthcare settings to continuously monitor outcomes and undesirable outcomes such as infections, re-operations, excess mortality, and readmissions
JP5142736B2 (ja) * 2008-01-25 2013-02-13 株式会社デンソーアイティーラボラトリ 車両搭載機器の制御装置及び制御方法
US8190604B2 (en) * 2008-04-03 2012-05-29 Microsoft Corporation User intention modeling for interactive image retrieval
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
US8320606B1 (en) 2008-08-29 2012-11-27 Adobe Systems Incorporated Video watermarking with fast detection
US8385590B1 (en) 2008-11-05 2013-02-26 Adobe Systems Incorporated Video watermarking with temporal patterns
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
US8213673B2 (en) * 2009-06-09 2012-07-03 Avio Technology, Inc. Watermarking of motion pictures
WO2012064893A2 (en) * 2010-11-10 2012-05-18 Google Inc. Automated product attribute selection
TWI480751B (zh) 2012-12-27 2015-04-11 Ind Tech Res Inst 互動式關聯物件檢索方法與系統
US20150331908A1 (en) 2014-05-15 2015-11-19 Genetic Finance (Barbados) Limited Visual interactive search
US10102277B2 (en) 2014-05-15 2018-10-16 Sentient Technologies (Barbados) Limited Bayesian visual interactive search
US10606883B2 (en) 2014-05-15 2020-03-31 Evolv Technology Solutions, Inc. Selection of initial document collection for visual interactive search
US10475098B2 (en) 2015-08-17 2019-11-12 Adobe Inc. Content creation suggestions using keywords, similarity, and social networks
US10592548B2 (en) 2015-08-17 2020-03-17 Adobe Inc. Image search persona techniques and systems
US10366433B2 (en) 2015-08-17 2019-07-30 Adobe Inc. Methods and systems for usage based content search results
US10878021B2 (en) 2015-08-17 2020-12-29 Adobe Inc. Content search and geographical considerations
US9715714B2 (en) 2015-08-17 2017-07-25 Adobe Systems Incorporated Content creation and licensing control
US11048779B2 (en) 2015-08-17 2021-06-29 Adobe Inc. Content creation, fingerprints, and watermarks
WO2017037103A1 (en) 2015-09-01 2017-03-09 Dream It Get It Limited Pmedia unit retrieval and related processes
US9984160B2 (en) * 2015-09-30 2018-05-29 International Business Machines Corporation Determining a query answer selection
US10909459B2 (en) 2016-06-09 2021-02-02 Cognizant Technology Solutions U.S. Corporation Content embedding using deep metric learning algorithms
US11074283B2 (en) * 2017-04-28 2021-07-27 Splunk Inc. Linking data set summarizations using affinities
US11003691B2 (en) 2017-04-28 2021-05-11 Splunk Inc. Determining affinities for data set summarizations
US10755144B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US10755142B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US11574201B2 (en) 2018-02-06 2023-02-07 Cognizant Technology Solutions U.S. Corporation Enhancing evolutionary optimization in uncertain environments by allocating evaluations via multi-armed bandit algorithms
US10853983B2 (en) 2019-04-22 2020-12-01 Adobe Inc. Suggestions to enrich digital artwork
US11100145B2 (en) * 2019-09-11 2021-08-24 International Business Machines Corporation Dialog-based image retrieval with contextual information
CN110765121B (zh) * 2019-10-31 2022-09-20 上海意臣信息科技有限公司 一种大数据智能采集处理方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
EP0635797A1 (en) * 1993-07-15 1995-01-25 Siemens Corporate Research And Support, Inc. A smart image system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004259057A (ja) * 2003-02-26 2004-09-16 Intec Web & Genome Informatics Corp 情報検索装置、情報検索方法、及び情報検索プログラム
US8898581B2 (en) 2011-02-22 2014-11-25 Sony Corporation Display control device, display control method, search device, search method, program and communication system
US9430795B2 (en) 2011-02-22 2016-08-30 Sony Corporation Display control device, display control method, search device, search method, program and communication system
US9886709B2 (en) 2011-02-22 2018-02-06 Sony Corporation Display control device, display control method, search device, search method, program and communication system

Also Published As

Publication number Publication date
CN1094219C (zh) 2002-11-13
DE69723346T2 (de) 2004-06-09
US5696964A (en) 1997-12-09
JP3053003B2 (ja) 2000-06-19
EP0802489A3 (en) 1999-05-06
EP0802489A2 (en) 1997-10-22
DE69723346D1 (de) 2003-08-14
CN1173675A (zh) 1998-02-18
EP0802489B1 (en) 2003-07-09

Similar Documents

Publication Publication Date Title
JP3053003B2 (ja) データベース検索方法
Cox et al. Target testing and the PicHunter Bayesian multimedia retrieval system
Cox et al. Pichunter: Bayesian relevance feedback for image retrieval
US8369616B2 (en) Chromatic matching game
US11188831B2 (en) Artificial intelligence system for real-time visual feedback-based refinement of query results
JP4540970B2 (ja) 情報検索装置及びその方法
JP5506722B2 (ja) マルチクラス分類器をトレーニングするための方法
JP5212610B2 (ja) 代表画像又は代表画像群の表示システム、その方法、およびそのプログラム並びに、代表画像又は代表画像群の選択システム、その方法およびそのプログラム
US20020164070A1 (en) Automatic algorithm generation
JP2004133947A (ja) 反復マッチングを利用した画像検索方法及び装置
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
JP2005535952A (ja) 画像内容検索法
JP2002288219A (ja) 情報検索システムおよび方法
EP1426881A2 (en) Information storage and retrieval
CN111159431A (zh) 基于知识图谱的信息可视化方法、装置、设备及存储介质
US20040117402A1 (en) Data retrieval system
JPH11250106A (ja) 内容基盤の映像情報を利用した登録商標の自動検索方法
JP2007249600A (ja) 目的データをカテゴリに分類する方法
EP0599707A1 (fr) Méthode d'extraction de profils de statistiques, utilisation des statistiques créées par la méthode
KR100519768B1 (ko) 반복매칭을 이용한 영상 검색방법 및 장치
Liu et al. Fast video segment retrieval by Sort-Merge feature selection, boundary refinement, and lazy evaluation
JPH0573625A (ja) 類似尺度構成処理方法
JP2002207755A (ja) イベントデータに関する情報管理装置
JP4333902B2 (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JP7179033B2 (ja) コンテンツ選択装置、コンテンツ選択方法、およびプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080407

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090407

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100407

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110407

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120407

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130407

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130407

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140407

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees