JP4523413B2 - 複数のメディア参照でのサーチ不明確性の減少 - Google Patents

複数のメディア参照でのサーチ不明確性の減少 Download PDF

Info

Publication number
JP4523413B2
JP4523413B2 JP2004541419A JP2004541419A JP4523413B2 JP 4523413 B2 JP4523413 B2 JP 4523413B2 JP 2004541419 A JP2004541419 A JP 2004541419A JP 2004541419 A JP2004541419 A JP 2004541419A JP 4523413 B2 JP4523413 B2 JP 4523413B2
Authority
JP
Japan
Prior art keywords
objects
feature
media
function
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004541419A
Other languages
English (en)
Other versions
JP2006501565A (ja
Inventor
グレッグ ディー. ウィレンスキー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of JP2006501565A publication Critical patent/JP2006501565A/ja
Application granted granted Critical
Publication of JP4523413B2 publication Critical patent/JP4523413B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明はメディアオブジェクトをサーチすることに関するものである。
イメージ、オーディオファイル、ビデオ等のデジタルオブジェクトをキャプチャし、格納し、中継するための電子的技術が現在容易に入手可能である。更に、これらの技術がますます日常的に使用されることは多数の容易に取得可能なメディアオブジェクトを発生している。人々は、デジタルカメラ、ドローイングプログラム、写真管理ソフトウエアを使用してピクチャを作成する。彼等はハンドヘルドのビデオカメラでビデオファイルを作成し且つ家庭のエンターテイメントセンターでCDを焼く。その結果得られるデジタルオブジェクトは容易にコピーされ且つ格納され、且つ容易にアーカイブ中に蓄積することが可能である。それらは、又、ワールドワイドウエブ、即ちインターネット上で、例えば、電子メール又はウエブサイト上で容易に共有され、多数のメディアオブジェクトを多くの人々に入手可能なものとさせる。
メディアオブジェクトの数及びアクセス可能性が増加するに従い、それらを管理することが益々困難なものとなる場合がある。例えば、1組のイメージがより大きくなればなる程、特定の即ち所望のピクチャを見つけ出すことはより困難なものとなる場合がある。例えば、ある人は、それを作成した時間又はそれを格納したディレクトリーを思い出すことにより特定のイメージを見つけ出そうとする場合がある。同様に、オーディオファイル及びビデオファイルへのアクセスがより多ければ多い程、特定の即ち所望のソング又はムービーを見つけ出すことがより困難なものとなる場合がある。例えば、ある人は、そのタイトル、又はその主役の演技者又は役者の名前を思い出すことにより特定のオーディオ又はビデオレコーディングを見つけ出そうとする場合がある。サーチの意図を画定するためにメディアオブジェクトに関するこのような情報を使用することは問題となる場合がある。何故ならば、それを見つけ出すために特定のオブジェクトに関する詳細について人が覚えることを必要とする場合があるからである。
ある人は、単にそれと関連しているものではなく、そのオブジェクトに内在する特定の特徴又は側面に対してのメディアオブジェクトのコレクション即ち集まりをサーチする場合がある。例えば、ある人は、これらの特徴を記述するパラメータを特定することによりカラー、形状、テクスチャの特定の分布を有するイメージをサーチする場合がある。ある人は、例えば、参照イメージを提供し且つそれに類似するイメージをサーチすることによって特定のオブジェクト又は人を包含するイメージをサーチしようとする場合がある。既存のイメージサーチエンジンは、選択した参照イメージをデータベース内のイメージと比較し、且つこれらのイメージを該参照に多かれ少なかれ類似するものとしてランク付けする。このプロセスは、例えば、該データベースのより小さなサブセットをサーチするための異なる参照を使用して繰り返すことが可能である。
メディアオブジェクトに関する情報及び参照オブジェクトからの情報はデータベースをサーチするための有用な基礎を与える。然しながら、それらはサーチのために使用することが可能な基準に関して制限を課し、且つ、しばしば、サーチャーの意図を適切に特性付けるものではない。
本発明は、サーチ意図を画定する上での不明確性を減少させるために参照特徴を結合することによりサーチ基準を特定するための技術を提供する。一般的に、1つの側面においては、本発明は、サーチのための基準を表わす複合参照情報を発生するために複数個の参照オブジェクトに対するオブジェクト情報を結合するための技術を実現する方法及びコンピュータプログラムプロダクトを提供する。該複合参照情報は、メディアオブジェクトのコレクション即ち集まりにおけるメディアオブジェクトに対するオブジェクト情報と比較されてメディアオブジェクトの該集まりにおける1個又はそれ以上のメディアオブジェクトを識別する。
本方法及びコンピュータプログラムプロダクトの有益的な実現例は以下の特徴のうちの1つ又はそれ以上を包含することが可能である。メディアオブジェクトの集まりにおける1つのメディアオブジェクトは、該オブジェクト情報と該複合参照情報との比較に基づいて選択することが可能である。該複数個の参照オブジェクトはユーザ入力により特定することが可能である。該複数個の参照オブジェクトは、オーディオ、イメージ、テキスト、CD、ビデオから選択した1つのタイプを有する1つ又はそれ以上のオブジェクトを包含することが可能である。異なるタイプのオブジェクトに対するオブジェクト情報を結合することが可能である。オブジェクト情報を結合することは、参照オブジェクトに対するオブジェクト情報の交差又はユニオン即ち合体を決定することを包含することが可能である。
オブジェクト情報は、該参照オブジェクト及びメディアオブジェクトの集まりにおけるメディアオブジェクトの特徴を特性付けることが可能である。該特徴は、該特徴の相対的重要性を特定するために重み付けすることが可能である。特徴の重み付けは、特徴の相対的重要性を表わすユーザ入力を受取ることが包含することが可能である。特徴は、その特徴に対する幾つかの値の各々の相対的発生頻度により表わすことが可能である。該1組の特徴は、1つのオブジェクトにおけるカラーの相対的発生頻度を記述するカラー情報を包含することが可能である。第一オブジェクトタイプに対する特徴は第二オブジェクトタイプに対する特徴に対してマップさせることが可能である。
本技術は、複合参照情報を改定するために付加的な参照オブジェクトに対するオブジェクト情報を該複合参照情報と結合させることを包含することが可能である。該付加的な参照は、該複合参照情報をメディアオブジェクトに対するオブジェクト情報と比較することにより識別されるメディアオブジェクトとすることが可能である。改訂された複合参照情報は、メディアオブジェクトのコレクション即ち集まりにおけるメディアオブジェクトに対するオブジェクト情報と比較することが可能である。
オブジェクトの複合参照情報に対する類似度を表わす類似度値をメディアオブジェクトの集まりにおけるメディアオブジェクトの各々に対して割当てることが可能である。メディアオブジェクトの集まりにおけるメディアオブジェクトの各々の類似度値は、各参照オブジェクトに対して計算される類似値未満であるか又はそれに等しいものとすることが可能である。メディアオブジェクトは、それらの類似度値に従ってランク付けすることが可能であり、且つメディアオブジェクトはそのランクに基づいて選択することが可能である。
参照及びメディアオブジェクトの各々に対するオブジェクト情報は、コンポーネントの特徴ベクトルとして表現することが可能であり、各特徴ベクトルは対応する参照又はメディアオブジェクトの特徴を表わす1つ又はそれ以上のコンポーネントを包含する。各特徴ベクトルは対応する参照又はメディアオブジェクトと関連するメタデータを表わす1つ又はそれ以上のコンポーネントを包含することが可能である。該複数個の参照オブジェクトの特徴ベクトルは、複合参照ベクトルを発生するために結合させることが可能である。各参照オブジェクトの一部又は全ての特徴を表わすコンポーネントは、第一結合関数に従って結合させることが可能であり、且つ各参照オブジェクトの一部又は全てと関連するメタデータを表わすコンポーネントは第二結合関数に従って結合させることが可能である。
1つ又はそれ以上の特徴の相対的な重要性を特定する重み付けベクトルを定義し且つ特徴ベクトルを結合させる場合に使用することが可能である。特徴ベクトルを結合させるためにMin又はMax関数を使用することが可能である。複合参照ベクトルはメディアオブジェクトの集まりにおける複数個のメディアオブジェクトの各々の特徴ベクトルと比較することが可能である。複合参照ベクトルは、Min又はMax関数を使用して、該メディアオブジェクトの各々の特徴ベクトルと比較することが可能である。参照オブジェクトに対するオブジェクト情報は、結合関数を使用して結合することが可能であり、且つ複合参照情報は、該結合関数に基づく比較関数を使用してメディアオブジェクトに対するオブジェクト情報と比較することが可能である。
1つの実現例においては、オブジェクト情報は参照オブジェクト及びメディアオブジェクトの集まりにおけるメディアオブジェクトの特徴を特性付けることが可能であり、且つコンポーネントの特徴ベクトルとして表現することが可能であり、該複数個の参照オブジェクトの特徴ベクトルは複合参照ベクトルを発生するためにMin又はMax関数を使用して結合することが可能であり、且つ複合参照ベクトルはMin又はMax関数を使用してメディアオブジェクトの集まりにおける各メディアオブジェクトの特徴ベクトルと比較することが可能であり、且つメディアオブジェクトの特徴ベクトルの複合参照ベクトルに対する類似度を表わす類似度値をメディアオブジェクトの集まりにおける各メディアオブジェクトに割当てることが可能であり、メディアオブジェクトの集まりにおけるメディアオブジェクトの各々の類似度値は各参照オブジェクトに対して計算した類似度値未満か又はそれに等しい。
一般的に、別の側面においては、本発明は、メディアオブジェクトのコレクション即ち集まりをサーチするシステムを提供する。本システムは、サーチのための基準を表わす複合参照情報を発生するために複数個の参照オブジェクトに対するオブジェクト情報を結合するための手段、及びメディアオブジェクトの集まりにおける1つ又はそれ以上のメディアオブジェクトを識別するために該複合参照情報をメディアオブジェクトの集まりにおけるメディアオブジェクトに対するオブジェクト情報と比較する手段を包含している。
メディアオブジェクトの集まりをサーチするための本システムの有益的な実現例は以下の特徴のうちの1つ又はそれ以上を包含することが可能である。本システムは、複合参照情報に対するオブジェクトの類似度を表わす類似度値をメディアオブジェクトの集まりにおけるメディアオブジェクトの各々へ割当てる手段を包含することが可能であり、その場合に、メディアオブジェクトの集まりにおけるメディアオブジェクトの各々の類似度値は各参照オブジェクトに対して計算された類似度値未満か又はそれに等しい。
オブジェクト情報は、参照オブジェクト及びメディアオブジェクトの集まりのメディアオブジェクトの特徴を特性付けることが可能であり、且つコンポーネントの特徴ベクトルとして表現することが可能である。本システムは、複合参照ベクトルを発生するために該複数個の参照オブジェクトの特徴ベクトルを結合する手段、及び該複合参照ベクトルをメディアオブジェクトの集まりにおけるメディアオブジェクトの各々の特徴ベクトルと比較するための手段を包含することが可能である。
本発明は、以下の利点のうちの1つ又はそれ以上を実現するために実施することが可能である。ユーザは、1組のメディアオブジェクトのサーチを実施する場合にユーザのサーチ意図を反映するサーチ基準を定義することが可能である。ユーザは、その意図が参照により又はオブジェクトと関連する情報により明確に定義されるものでない場合であっても、ユーザのサーチ意図を反映するサーチ基準を定義することが可能である。サーチ基準は、1組の参照オブジェクトを選択することにより定義することが可能である。サーチ基準は、参照オブジェクトの選択が与えられると、自動的に定義することが可能である。サーチ基準は、1組のオブジェクトにおけるオブジェクト間の共通性又は交差として定義することが可能である。サーチ基準は、1組のオブジェクトにおいて包括的なもの、又は特徴のユニオン即ち合体として定義することが可能である。ユーザは、ユーザのサーチ意図に従ってサーチ基準を洗練させることが可能である。サーチ基準は、1組の参照オブジェクトに対してオブジェクトを付加することにより再提示することが可能である。サーチ基準は、1組のイメージに対する情報の結合に従って重み付けすることが可能である。ユーザはサーチ基準を定義するために異なるタイプのメディアオブジェクトを使用することが可能である。ユーザは、別のタイプのメディアオブジェクトにより定義されたサーチ基準を使用して1つのタイプのメディアオブジェクトをサーチすることが可能である。
参照オブジェクトの特徴に基づいてコレクション即ち集まりにおける1つの特定のオブジェクト又は複数のオブジェクトを識別するためにメディアオブジェクトのコレクション即ち集まりをサーチすることが可能である。メディアオブジェクトの集まりをサーチするために参照オブジェクトを使用することは、該参照オブジェクトにおける興味のある特徴が、しばしば、悪く定義されているか又はサーチのためのそれらの重要性に関して不適切にランク付けされているために、少なくとも部分的に不明確である。例えば、典型的に、参照オブジェクトのどの特徴が興味のあるものであるかが不明確である。興味のある特徴が特定された場合であっても、例えばカラー、テクスチャ、形状等のその特徴の種々の側面の相対的な重要性は、典型的に、定義されていない。更に、該参照はユーザにとって興味ある特徴又は側面を包含するものではない場合がある。
サーチ基準を特性付け且つ洗練するために複数の参照を使用することにより、サーチ基準を定義するために参照オブジェクトを使用する場合に内在する不明確性は部分的に又は完全に解消することが可能である。複数の参照オブジェクトを使用して、複合参照、及び、所望により、特徴の重み付けを作成する。複合参照及び特徴の重み付けは選択した参照オブジェクトの特徴を評価することにより、例えば、選択した参照オブジェクトの間の共通性又は差異を見つけ出すことにより定義される。複合参照及び/又は重み付けは、更に、付加的な参照オブジェクトの選択で洗練させることが可能である。このように、サーチ基準は、ユーザのサーチ意図をより良く表わすか又は反映させるために調節することが可能である。
図1は複数の参照オブジェクトの特徴に基づいてオブジェクトのコレクション即ち集まりをサーチする方法を例示している。2個又はそれ以上の参照オブジェクトが選択される(ステップ2)。該参照オブジェクトはサーチすべきオブジェクトの集まりから選択することが可能である。一方、該参照オブジェクトは例えば参照オブジェクトの予め定めた集まり等のその他の供給源から選択することが可能である。該参照オブジェクトは、又、例えば、外部供給源から所望の参照オブジェクトをインポートすることにより、又は例えばコンピュータ上でドローイング又はペインティングプログラムを使用することによって参照オブジェクトを作成することにより、ユーザにより供給させることが可能である。該参照オブジェクトは、複合参照を発生するために使用される(ステップ4)。該複合参照は、例えば、該参照オブジェクトのうちのいずれかにおいて発生する特徴又は該参照オブジェクトに共通な特徴に関しての情報を包含することが可能である。
サーチすべきオブジェクトの集まり即ち組が識別される(ステップ6)。該集まりにおける第一オブジェクトで開始して(ステップ8)、該オブジェクトは複合参照と比較される(ステップ10)。比較結果、例えば、類似度の尺度が、典型的に、保存又は格納される(ステップ11)。サーチすべきオブジェクトの集まりの中に別のオブジェクトが存在する場合には(ステップ12のYES分岐)、それは複合参照と比較される(ステップ14及び10)。本方法は、サーチすべきオブジェクトの集まりの中に更なるオブジェクトが存在しなくなるまで(ステップ12のNO分岐)進行する。
少なくとも部分的に該複合参照により定義されるサーチ基準を満足するオブジェクトの集まりの中の1つのオブジェクト又は複数個のオブジェクトを、例えば、該オブジェクトの又はオブジェクトの該複合参照に対する類似度又は非類似度に基づいて選択することが可能である(ステップ16)。オプションとして、該複合参照に対する類似度又は非類似度に従って該集まりにおけるオブジェクトの幾つか又は全てをランク付けすることが可能である。識別された1つ又は複数のオブジェクト、及びランク付けをユーザへ定義することが可能である。
図2に示したように、ここに記載するサーチ技術は、典型的に、コンピュータ環境において実現される。例えば、ユーザ50はモニタ52、スピーカー、又はその他の装置を使用してコンピュータ54から情報を受取る。該コンピュータは、例えば、パソコン又はネットワーク上のサーバーとすることが可能である。メディアオブジェクトのコレクション即ち集まり60が、例えば、ファイルシステム又はデータベースにおいてコンピュータ54上の格納部内に維持される。ユーザ50はコレクション即ち集まり60のサーチのための2個又はそれ以上のオブジェクト70,72,74を選択する。該オブジェクトは該コレクション即ち集まりから又は別の供給源からのものとすることが可能である。該オブジェクトは、例えば、イメージとすることが可能であり、且つユーザは選択したイメージ70,72,74とある特徴と共有するイメージを見つけ出すことを所望する場合がある。選択したオブジェクトの複合体76が作成される。コレクション即ち集まり60内のオブジェクトが複合体76と比較され、且つ1つ又はそれ以上のイメージ80,82が選択される。これらのイメージは、例えば、該複合体に最も類似した該コレクション即ち集まり内のオブジェクトである場合がある。次いで、該イメージがコンピュータモニタ52上でユーザ50に対して表示させることが可能である。このプロセスを繰り返すことが可能である。例えば、このサーチは、複合参照76又は初期の参照オブジェクト70,72,74のうちの1つ及び該サーチにおいて識別されたイメージ80,82のうちの1つを使用することにより洗練化させることが可能である。
一般的に、参照を使用するサーチの目的は、その参照に何らかの態様で類似しているコレクション即ち集まり内のオブジェクトを見つけ出すことである。該サーチは、該参照及びサーチするオブジェクトに対する参照の類似度へアクセスするために使用される比較関数により特定される。該参照は、単一のオブジェクト又は複合参照とすることが可能である。それは興味のある少なくとも幾つかの特徴又は側面を包含するが、興味のない特徴を包含することも可能である。該比較関数は、類似度を評価する場合に考慮される特徴のバランスを制御する重みを特定することが可能であり、且つ該サーチを制限又は調節するために使用することが可能である。該比較関数は、例えばグローバルに又はローカルに実施されるべきであるか否かのサーチの範囲を画定することが可能であり、且つそれは例えば類似であると考えられる寸法又は配向の範囲等の類似度に対する基準を特定することが可能である。該サーチにおいて、参照に対するコレクション即ち集まり内のオブジェクトの類似度が該比較関数に従って決定される。該オブジェクトはそれらの類似度値に従って該参照に対して多かれ少なかれ類似するものとしてランク付けすることが可能であり、従って、ユーザは、例えば、最も良く又は最も少なく類似するオブジェクト、又は1組の最も良く又は最も少なく類似するオブジェクトを選択することが可能である。
参照及び比較関数により画定されるサーチは、例えこのようなオブジェクトがサーチ中のオブジェクトのコレクション即ち集まりにおいて入手可能なものであっても、ユーザのサーチ意図を満足するオブジェクトを発生しない場合がある。該サーチは、以前の1つ又は複数の参照と付加的な参照に対する情報を結合することによりフォーカスさせるか又は洗練化させることが可能である。この結合は、以前に単一の基準が使用された場合には複合参照情報を生成し、且つ前に使用された複合参照情報を再提示する。参照は、例えば、それらのいずれかの特性を網羅するため、又はそれらの全てに対して共通な特性を特定するために結合することが可能である。該参照は、又、特徴の重み付けを定義するために使用することも可能であり、且つ新たな比較関数を定義するために使用することが可能である。該複合参照情報、存在する場合には重み付け、及び、存在する場合には、該新たな比較関数は新たなサーチに対する基礎を形成する新たなサーチ基準を定義する。
サーチすべきメディアオブジェクトのコレクション即ち集まりは、イメージオブジェクト又はファイル、及びオーディオオブジェクト又はファイル、テキストオブジェクト又はファイル、及び例えばイメージ、オーディオ、テキスト等のメディアタイプの結合を包含するオブジェクト又はファイルを包含することが可能である。典型的に、このようなメディアオブジェクトはデジタルデータを包含する。イメージオブジェクトは、例えば特定のオブジェクト、カラー、テクスチャ、形状等の視覚的特徴に対してサーチすることが可能である。オーディオオブジェクトは、例えば特定のサウンド又は単語、トーン、振幅、音量等のサウンド特徴に対してサーチすることが可能である。例えば電子的書籍等のテキストオブジェクトは、例えば特定の単語又は句、文書パターン、又は文法構造等の言語特徴に対してサーチすることが可能である。
結合メディアは、例えば、オーディオ、イメージ、テキストデータを網羅することが可能であり、且つ、例えば、オーディオ、イメージ、又はテキスト特徴に対してサーチすることが可能である。例えば、ビデオは特定のイメージの特徴に対して又はある人の音声の特徴に対してサーチすることが可能である。該ビデオは各フレームを別個のイメージとして取り扱い且つ各フレームを所望のイメージ特徴に対して比較することによりサーチすることが可能である。又、例えば、テキスト及びイメージの両方を包含する本はイメージに対してサーチすることが可能である。該本内の各イメージの該イメージ特徴に対する類似度を決定することが可能である。該本又はビデオはその中のイメージの類似度尺度の1つ又はそれ以上に基づいて、該イメージ特徴に対して多かれ少なかれ類似するものとして評価することが可能である。
異なるタイプのメディアを同一又は異なるタイプのメディアをサーチするために結合させることが可能である。このようなメディアの混合は、メディアオブジェクトが同様又は類似した特徴を有することを必要とする。異なるタイプのメディアオブジェクトは、例えば、例えばパターン、可変性、及び周期性等のメディアタイプにとって特定的なものでない特徴を有することが可能である。このような特徴は、オブジェクトのタイプに拘わらずにオブジェクトをサーチするために結合させ且つ使用することが可能である。1つのタイプの特徴は、又、別のタイプの特徴へ翻訳又は変換することが可能である。
図3に示したように、メディアオブジェクトの集まり又は組110は、2個又はそれ以上のメディアオブジェクト111−114を包含している。N個のメディアオブジェクトMaがメディアオブジェクトの組内に存在している場合には、{Ma}={M1,M2,...MN}である。同様に、参照オブジェクトの組120は1つ又はそれ以上のメディアオブジェクト121−123を包含している。Z個の参照オブジェクトRaが参照オブジェクトの組内に存在している場合には、{Ra}={R1,R2,...RZ}である。この場合には、N個のメディアオブジェクトをサーチするためにZ個の参照オブジェクトが結合される。
2個又はそれ以上の参照オブジェクト121−123の各々に対する情報が結合されて複合参照情報R130を作成する。該情報は、例えば、2つの参照オブジェクトの関数g(R,R)132に従って結合させることが可能である。例えばR及びR121−122等の2個の参照オブジェクトが存在するに過ぎない場合には、これら2個の参照オブジェクトの各々に対する情報がR=g(R,R)のように結合される。2個を超える参照オブジェクトは、存在する場合には、それらのオブジェクト情報は対毎のシーケンスで結合させることが可能である。例えば、参照オブジェクトR及びR121−122に対する情報は複合参照情報Rab 25を作成するために結合させることが可能であり、従ってRab=g(R,R)である。次いで、複合参照情報Rab125は例えばR123等の第三参照オブジェクトに関する情報と結合させて複合参照情報R130を作成することが可能であり、従ってR=g(Rab,R)である。
付加的なオブジェクトから又はその他の結合したオブジェクトからの情報は既存の複合参照情報へ付加することが可能であり、多くの参照オブジェクトに対する情報を結合させることを可能とする。参照オブジェクトの組120内の2個を超える参照オブジェクト121−123からの情報を結合するために1つを超える関数を使用することが可能である。参照オブジェクト情報の重み付けした和によってオブジェクト情報を結合させることが可能である。参照イメージが重要性においてランク付けされている場合には、そのランクが重みとして作用する場合がある。2つを超える参照オブジェクトに対するオブジェクト情報は、例えば、関数gの対毎の適用によるのではなく加算により直接的に結合させることが可能である。
複合参照情報130は関数g134を使用して、メディアオブジェクトの集まり又は組110内の2つ又はそれ以上のメディアオブジェクト111−114の各々に対する情報と比較される。関数Gは複合参照情報と各メディアオブジェクトに対する情報との間の類似度s141−144を決定する。類似度値141−144は、参照オブジェクト121−123から派生した複合情報Rc130に対して多かれ少なかれ類似するものとして関連するメディアオブジェクト111−114をランク付けするために使用することが可能である。
関数G134は、2つ又はそれ以上の参照オブジェクトに対する情報を結合するために使用される関数g132に対して類似しているか又は同一である要素を包含することが可能である。例えば、関数gの要素gs(Mi,Rc)は関数g132に対して類似しているか又は非類似である場合がある。このように、ユーザは、ユーザのサーチ意図に従ってその結合及び比較関数を独立的に調整することが可能である。例えば、ユーザは包含的参照を作成するために参照を結合し、次いで、該参照により厳格に類似するオブジェクトをサーチすることが可能である。又、例えば、ユーザは、例えば、結合関数の上に立つ比較関数を使用することにより結合関数を補完する比較関数を選択することが可能である。
関数Gは、重み付け要素Ws150を包含することが可能である。該重み付け要素は、例えば、関数h(Ri,Rj)152に従って2個又はそれ以上の参照オブジェクト121−123の各々に関する情報を結合することにより参照オブジェクト121−123の1つ又はそれ以上に対する情報から派生することが可能である。例えばRa及びRb121−122等の2つの参照オブジェクトが存在するに過ぎない場合には、これら2つの参照オブジェクトの各々に対する情報がWs=h(Ra,Rb)のように結合される。2つを超える参照オブジェクトが存在している場合には、それらのオブジェクト情報は、前述したように対毎のシーケンスで結合させることが可能であり、従って、例えば、Ws=h(Rab,RZ)であり、尚Rab=h(Ra,Rb)である。関数hは、典型的に、関数gと同一であり、その場合には、H(Ra,Rb)=g(Ra,Rb)であり且つRc=Wsである。
メディアオブジェクトの特徴を特性付けるために使用される情報は、1組のパラメータにより要約することが可能である。例えば、メディアオブジェクトを特性付ける情報は、「特徴ベクトル」として呼称されるベクトルにおける一連の値として要約することが可能である。特徴ベクトルは、好適には、1つ又はそれ以上の特定の分析方法でメディアオブジェクトの一部又は全部を分析することにより作成又は派生される情報を包含している。特徴ベクトルは、又、該オブジェクト又は該オブジェクトの分析と関連する情報を包含することが可能である。このような情報は、通常、メタデータと呼称される。
複数の参照に対する情報を結合し且つメディアオブジェクトの組をサーチするために特徴ベクトルを使用するサーチの一例を図4に示してある。メディアオブジェクトの組110内の各メディアオブジェクト111−114は、対応する特徴ベクトルVN211−214を有することが可能である。メディアオブジェクトの組内にN個のメディアオブジェクトMaが存在する場合には、{Ma}={M1,M2...MN}及びN個の対応する特徴ベクトルVM1,VM2...VMNである。同様に、参照オブジェクトの組120内の各メディアオブジェクト121−123は対応する特徴ベクトルVR221−223を有している。参照オブジェクトの組内にX個の参照オブジェクトRaが存在している場合には、{Ra}={R1,R2...RX}及びZ個の対応する特徴ベクトルVR1,VR2,...VRZ
である。メディアオブジェクト及び参照オブジェクトに対する特徴ベクトルは、典型的に、同一又は類似のコンポーネントを有している。
参照オブジェクト121−123の組120に対応する特徴ベクトル221−223は結合されて複合参照ベクトル250を作成する。特徴ベクトル221−223は、例えば、参照オブジェクトに関する情報について前に説明したように、例えば、対毎の態様で2つの特徴ベクトルの関数Fc(Vi,Vj)232に従って結合させることが可能である。
複合参照ベクトル230は、例えばTr[Ws*fs(Vi,Vr)]234等の関数を使用してメディアオブジェクトの集まり110内の2つ又はそれ以上のメディアオブジェクト111−114の各々に対する特徴ベクトル211−214と比較され、尚Trはベクトル[Ws*fs(Vi,Vr)]におけるコンポーネントの和を表わす。ベクトルWs,Vi,Vrの各々においてZ個のコンポーネントcが存在している場合には、Tr[Wss(Vi,r)]=Σ(c=1..Z)[Ws[c]fs(Vi[c],Vr[c])]である。例えば、[Ws*fs(Vi,Vr)]=Xであり且つXがZ個のコンポーネントを有している場合には、Tr[Ws*fs(Vi,Vr)]=TrX=X1+X2+X3...XZである。前述した関数G134に対するように、関数Tr[Ws*fs(Vi,Vr)]234は複合参照ベクトルとメディアオブジェクトi111−114に対する特徴ベクトルの間の類似度si141−144を決定する。この類似度値は、関連するメディアオブジェクト111−114を、参照オブジェクト121−123の特徴ベクトル221−223から派生した複合参照ベクトル230に多かれ少なかれ類似するものとしてランク付けするために使用することが可能である。
関数Tr[Ws*fs(Vi,Vr)]234は、関数Wc*fc(Vi,Vj)232の要素と類似するか又は同一である要素を包含することが可能である。例えば、fs(Vi,Vr)=fc(Vi,Vj)とすることが可能である。関数Tr[Ws*fs(Vi,Vr)]234は、又、重み付け要素Ws250を包含することが可能である。該重み付け要素は、参照オブジェクト121−123の1つ又はそれ以上に対する特徴ベクトル221−223から派生することが可能である。重み付け要素は、例えば、複数の参照オブジェクトに対する特徴ベクトルを結合する場合に前述したように、対毎の繰り返しの態様で適用することが可能な2つの特徴ベクトルの関数Ww*fw(Vi,Vj)252に従って派生させることが可能である。
関数Ww*fw(Vi,Vj)252は、関数Wc*fc(Vi,Vj)232又はTr[Ws*fs(Vi,Vr)]234の要素に類似するか又は同一である要素を包含することが可能である。例えば、fw(Vi,Vj)=fc(Vi,Vj)又はfw(Vi,Vj)=fs(Vi,Vr)とすることが可能である。同様に、Ww=Wc又はWs=Wcとすることが可能である。
参照メディアオブジェクトを包含するメディアオブジェクトに対する特徴ベクトルについて更に詳細に説明する。特徴ベクトルは、典型的に、コンポーネントの一次元ベクトルである。例えば、特徴ベクトルVはW個のコンポーネントの数列であり、従ってV={V1,V2,...VW}である。
図5に示したように、特徴ベクトル300,302;30,32は、コンポーネントの組310,301−314;321,330−334を包含することが可能である。特徴ベクトルのコンポーネントは、例えば、コンポーネントの情報のタイプ又はそれによってコンポーネントが作成された又は派生された方法に従って複数の組又は副組へグループ化することが可能である。例えば、特徴ベクトルの最初の1000個のコンポーネントはメディアオブジェクトの分析から派生される場合があり且つ該特徴ベクトルの最後の3個のコンポーネントは該メディアオブジェクトと関連する情報である場合がある。この例においては、最初の1000個のコンポーネントは、例えば、1000個のカラーの各々である該イメージの割合を決定することから派生することが可能であり、且つ最後の3個のコンポーネントは、例えば、該オブジェクトが作成された日付及び時間及びオブジェクトのファイル名とすることが可能である。
幾つかの組のコンポーネントはメディアオブジェクトから派生することが可能である。例えば、イメージオブジェクトに対する特徴ベクトルはテクスチャT310、カラーC311、形状S311を記述するコンポーネントの組を包含することが可能であり、それらの各々はイメージデータの幾つか又は全ての分析により派生される。又、例えば、オーディオオブジェクトに対する特徴ベクトル30,32はフーリエ変換情報F330、ウエーブレット分解情報W331、フラクタル尺度Fr322を記述するコンポーネントの組を包含することが可能であり、それらの各々はオーディオデータの幾つか又は全ての分析により派生される。特徴ベクトルは、オブジェクト内の1つを超えるタイプのメディアの分析から派生されるコンポーネントを包含することが可能である。例えば、オーディオビジュアルオブジェクトに対する特徴ベクトルは結合したオーディオ及びビジュアルの部分又はオブジェクトの側面の分析から派生されたフラクタル尺度を包含することが可能である。
その他の組のコンポーネントはイメージ又はオーディオオブジェクト又はメタデータと関連する情報を包含することが可能である。例えば、組D313,33はファイル名及び該イメージ又はオーディオオブジェクトが作成、コピー、又は格納された日付及び時間を包含することが可能であり、且つ組M314,334はその他の組におけるコンポーネントを派生するために使用した分析に関する情報を包含することが可能である。
特徴ベクトル300,30におけるコンポーネントの数は、特徴ベクトルにおけるコンポーネントの各組におけるコンポーネントの数の和である。例えば、組T,C,S,A,M内に、夫々、J,K,L,2,D個のコンポーネントが存在している場合には、特徴ベクトル300はJ+K+L+2+D個のコンポーネントを有している。即ち、V={T(i=1...J),C(i=J+1,...J+K),S(i=J+K+1...J+K+L),A(i=J+K+L+1...J+K+L+2),M(i=J+K+L+3...J+K+L+2+D)}である。同様に、組F,W,Fr,A,Mにおいて夫々U,V,W,2,D個のコンポーネントが存在している場合には、特徴ベクトル350はU+V+2+D+W個のコンポーネントを有している。
イメージオブジェクトの特徴ベクトルにおける組におけるコンポーネントを派生又は作成するために種々の数値的及び統計的方法を使用することが可能である。使用される方法は、オブジェクトにおけるデータの種類に依存する場合がある。例えば、イメージオブジェクトはラスターグラフィックス及びラスターデータ、又はベクトルグラフィックス及びベクトルデータを包含する場合がある。ベクトルデータは、例えば、イメージ内のオブジェクト又はストロークの数、又はイメージ内のある特別の効果の数を記述するコンポーネントを作成するために使用することが可能である。
ベクトルデータと異なり、ラスターデータはイメージ内のオブジェクト又は形状を識別するためにセグメント化するか又はその他の態様で分析せねばならない。形状は、例えば、ほぼ一定のカラーの領域を決定することにより定義することが可能である。矩形形状は米国特許番号第6,298,157号「埋め込まれたイメージの位置決め及び整合(Locating and aligning embedded images)」に記載されている方法を使用して見つけることが可能であり、その特許の全体を引用により本明細書に取り込む。ラスターイメージは例えば、類似したカラー及びテクスチャの領域をフラッドフィルし、交差エッジに対するペナルティを課すことによりセグメント化することが可能である。
ラスター又はベクトルイメージオブジェクトの形状組S312におけるコンポーネントは、該イメージにおける形状を見つけ出すか又は定義し、次いで各形状に対する形状特性を測定することにより作成するか又は派生することが可能である。形状特性は、例えば、対称性、楕円率、又は変調率の尺度を包含することが可能である。形状特性は、例えば、周囲のフラクタル尺度として、又は、より簡単には、該形状の周囲の曲線に沿っての点のリスト又は該周辺に沿っての正接角度のリストとして定義することが可能である。
イメージオブジェクトのカラー組C311におけるコンポーネントは、1つ又はそれ以上のカラースペース即ち色空間に従って該イメージを分析することにより作成又は派生することが可能である。カラースペースは、基本カラーコンポーネント(即ち「色素」)によるカラーの範囲に対するデータ表現を与える。特定の色素は使用されるカラーシステムに依存する。例えば、CMYKカラーシステムにおいては、カラーはシアン(C)、マゼンタ(M)、イエロー(Y)、キー(K)(通常ブラック)に対する値の結合として表現され、RGBカラーシステムにおいては、カラーはレッド(R)、グリーン(G)、ブルー(B)に対する値の結合として表現され、且つHSBカラーシステムにおいては、カラは色相(H)、飽和度(S)、輝度(B)に対する値の結合として表現される。
カラーコンポーネントは、例えば、イメージ内のカラーの平均及び標準偏差の尺度、又は支配的な又は最も共通するカラーのリストを包含することが可能である。カラーコンポーネントはカラーの頻度分布又はこのような分布のエントロピーを記述することが可能である。カラーコンポーネントはカラーと空間座標との積を包含することが可能である。例えば、コンポーネントは<rC>により定義することが可能であり、尚rはベクトル又は空間次元であり且つCはカラー次元のベクトルである。<rC>は1/RΣr=1...R(ria(r))として定義され、尚R個の位置rが存在しており且つriはrにおける空間座標のうちの1つであり且つCa(r)はrにおけるカラーに対するカラー次元のうちの1つである。このような積はより高い空間周波数を包含することが可能であり、例えば、<rrC>=1/RΣr=1...R(rija(r))又は<rrrC>である。コンポーネントは、カラーと空間座標との積に対する平均及び標準偏差を包含することが可能である。
カラーの周波数分布において、例えば、組C311におけるコンポーネントの各々p(Ci)はK個のカラーのうちの1つのイメージ内の発生頻度を表わすことが可能である。即ち、各コンポーネントはカラーCiによりカバーされるイメージの分別区域を記述することが可能である。例えば、イメージは、その5分の1が1つのカラーであり、10分の1が別のカラーであり、10分の3が3番目のカラーであり、10分の3が4番目のカラーであり、10分の1が5番目のカラーであるように5つのカラーに分割することが可能である。このようなイメージに対する組Cは{0.2,0.1,0,3,0.3,0.1}である。組Cは、図7に示したように、周波数プロット500として観察することが可能である。
ラスターデータの場合、イメージはピクセルから構成されており且つ各ピクセルrはあるカラーC(r)のものである。該カラーは、典型的に、一連のビット(「カラー値」)によって表わされ、特定のビットは、前述したように、該カラーにおいて使用される各色素の量を表わしている。値p(Ci)はピクセルの総数Rによって割られたカラーiのピクセルの数として計算することが可能である。即ち、
p(Ci)=1/RΣr=1...RΔ(Ci,C(r))
尚、
Δ(Ci,C(r))=1、C(r)がカラーCiと同じであることが分かった場合、及び
0、C(r)がカラーCiと同じであることが判明しなかった場合。
この例においては、イメージにおける全ての可能なカラーにわたってのp(Ci)の和は1であり、
Σi=1...Kp(Ci)=1。
然しながら、加算して1となる特性を有することのない関数が可能であり且つ使用することも可能である。例えば、関数p(Ci)=Σr=1...RΔ(Ci,C(r))でΣi=1...Kp(Ci)=Rを使用することが可能である。又、例えば、不完全な組の特性を使用することが可能である。例えば、カラースペースをK個のカラーに分割する場合があるが、これらのカラーのうち幾つかHのみに対しての情報を特徴ベクトル内に包含させる場合がある。即ち、Σi=1...Kp(Ci)=1である場合には、特徴ベクトルはCiのみを包含することが可能であり、尚i=1...H及びH<Kであって、Σi=1...Hp(Ci)<1である。
ベクトルデータの場合、同様のカラー分布テーブルをその他の手段によって発生することが可能である。例えば、グリッドを該データに対してマップすることが可能であり、且つ該グリッド内の各セルをカラー分布を計算するためにピクセルが取り扱われるように取り扱うことが可能である。又、例えば、イメージを一定のカラー領域に分割又は平坦化させることが可能であり、且つ対応するカラーの領域の寸法に比例してエントリをカラー分布テーブル内に配置させることが可能である。更に別の例において、イメージオブジェクトにおける個別的なベクトルオブジェクトのライン及びフィルカラーの分布からカラー分布を発生させることが可能である。
ラスター又はベクトルイメージオブジェクトのテクスチャ組T310におけるコンポーネントは、例えば、イメージデータに対するガボール(Gabor)フィルタ値の統計的モーメントを計算することにより作成又は派生させることが可能である。このような分析はイメージにおけるエッジ情報をキャプチャする。テクスチャコンポーネントはそのイメージのフラクタル尺度とすることが可能である。テクスチャコンポーネントは、又、そのイメージデータのウエーブレット分解又はフーリエ変換に対する係数、又は該係数の平均及び標準偏差とすることが可能である。2つ及びそれ以上の位置においてもカラーコンポーネント間の相関をテクスチャコンポーネントとして使用することが可能である。
イメージオブジェクトの特徴ベクトルにおけるコンポーネントを派生又は作成するために使用されるものを包含する数値的及び統計的方法は、オーディオオブジェクトの特徴ベクトル320におけるコンポーネントを派生又は作成するために使用することが可能である。特徴はオーディオトラック全体に対して、又は該トラックの2つ又はそれ以上のセグメントの各々に対して計算することが可能である。F330のコンポーネントは、例えば、オーディオデータのフーリエ変換から派生することが可能である。W331のコンポーネントは、例えば、オーディオデータのウエーブレット分解から派生することが可能である。Fr332のコンポーネントは、例えば、該データのフラクタルディメンジョン、又は該フラクタルディメンジョンの標準偏差とすることが可能である。オーディオオブジェクトの特徴ベクトルにおけるコンポーネントは、前に説明したカラーの分布と類似したオーディオ周波数のパワー分布を包含することが可能である。
図6に示したように、コンパクトディスク即ちCDのようなイメージ及びオーディオ情報の両方を有するメディアオブジェクトに対する特徴ベクトル400,401は、前に説明したように、1組のイメージコンポーネント403と1組のオーディオコンポーネント404及び該オブジェクトを完全に記述するコンポーネントを包含することが可能である。該イメージコンポーネントは、前に説明したように、コンポーネント及びイメージオブジェクトに対するものとしてのコンポーネントの組310−314を包含することが可能であり、且つオーディオコンポーネントは、前に説明したように、コンポーネント及びオーディオオブジェクトに対するものとしてのコンポーネントの組330−334を包含することが可能である。
ビデオオブジェクトに対する特徴ベクトル420,422は、複数組のイメージコンポーネント423およびオーディオコンポーネント424を包含することが可能である。例えば、該特徴ベクトルはビデオにおけるキーフレームに対する1組のイメージコンポーネントを包含することが可能である。シーン変化の数及びそれらの期間のようなイメージ間の時間的関係を記述するコンポーネントも存在することが可能である。ビデオにおける動きの量を記述するために光学的流れの尺度を使用することが可能であり、この尺度は、例えば、アクティビティのないものからアクティビティを有するサベーランステープを区別するために使用することが可能である。ビデオ用の特徴ベクトルは、又、前に説明したように、オブジェクトの一部又は全てから派生されるコンポーネント433、及び該オブジェクトの一部又は全てに対するメタデータ434を包含することが可能である。
異なるタイプのメディアオブジェクトの特徴ベクトルコンポーネント又は結合メディアオブジェクトの異なるセグメントを派生するか又は作成するために同様の方法を使用することが可能である。例えば、ローカル時間窓にわたって取られたフーリエ又はウエーブレット周波数コンポーネントを時間の関数(即ち、オーディオトラックにおける位置)としてプロットさせたケプストラム分解を、オーディオ信号の二次元「イメージ」を作成するために使用することが可能である。このような二次元オーディオオブジェクトは、イメージオブジェクトに対するようにコンポーネントで記述することが可能である。例えば、オーディオテクスチャ特徴を該二次元オーディオオブジェクト又はセグメントのウエーブレット分解により発生させることが可能であり、一方イメージテクスチャ特徴はイメージオブジェクト又はセグメントのウエーブレット分解により発生させることが可能である。次いで該オーディオオブジェクトの時間的周波数を該イメージの空間周波数上にマップさせることが可能である。スケールを適宜選択して、オーディオ及びイメージオブジェクト又はセグメントに対して作成した特徴を結合し且つ比較することが可能である。
テキストオブジェクトに対する特徴ベクトルは、テキスト全体又はその一部、例えば、章又はパラグラフを特性付けるコンポーネントを包含することが可能である。該コンポーネントは、例えば、バイグラム、トリグラム等を使用して、意味概念又は単語の同時発生確率等のテキストの部分の統計的尺度から派生することが可能である。テキストオブジェクトの特徴ベクトルにおけるコンポーネントは、前に説明したカラーの分布に類似して、単語又はその他の構成概念の頻度分布を包含することが可能である。その他のタイプのメディアの特徴ベクトルに対するコンポーネントを派生又は作成するために、前に説明したものと同様の方法を使用することが可能である。特徴ベクトルを結合し且つ比較するための関数232,234について更に詳細に説明する。これらの関数232,234は、典型的に、2つの特徴ベクトルからなる関数fを包含しているが、2つを超える特徴ベクトルから成る関数を包含することが可能である。関数fは、典型的に、特徴ベクトルの1つ又はそれ以上のコンポーネントを評価する。典型的に、該関数は2つ又はそれ以上のベクトル間のユークリッド距離を見つけ出すものではない。該関数は特徴ベクトルにより記述される特徴の結合を表わす。例えば、該関数は特徴の交差又はユニオン(合体)を近似することが可能である。該関数は特徴のその他の非ユークリッド結合を近似することも可能である。このような関数の2つの例について更に詳細に説明する。
図7に示したように、2つの特徴ベクトル500,510のコンポーネントは、例えば、それらの共同最小Min520又は共同最大Max530を決定することにより結合又は比較することが可能である。この例においては、特徴ベクトルV1500及びV2510の組Cにおけるコンポーネントは、前に説明したように、0から1の範囲にスケールされている。V1500の場合、C={0.2,0.1,0.3,0.3,0.1}であり、第一イメージの5分の1がC1であり、10分の1がC2であり、10分の3がC3であり、10分の3がC4であり、10分の1がc5であることを表わしている。該コンポーネントの和は1.0である。何故ならば、第一イメージにおける全てのカラーは集計されたからである。V2510の場合、C={0.2,0.1,0.3,0.1,0.3}であり、第二イメージの5分の1がC1であり、10分の1がC2であり、10分の3がC3であり、10分の1がC4であり、10分の3がC5であることを表わしている。該コンポーネントの和は1.0である。何故ならば、第二イメージにおける全てのカラーは集計されたからである。
Min関数は2つのベクトルにより定義される組又は関数の交差を決定する。ベクトルV1及びV2は、各コンポーネントに対して、該2つのベクトルに対しての値のうちのより小さいものを決定することにより「Min」520関数を使用して結合又は比較される。例えば、V1に対するC4の値は0.3であり且つV2に対するC4の値は0.1である。より小さな値である0.1が結果的に得られる結合又は比較ベクトルVN521において表わされる。この例においては、結合又は比較ベクトルVMIN=VNはC={0.2,0.1,0.3,0.1,0.1}を有している。非常に大きな組の場合には、Cのコンポーネントは、図8に示したように、連続関数600,610を近似する場合がある。2つのオフセットし且つほぼ正規的な関数600,610に対してのMin関数620の適用は、ピークを持った曲線621を発生し、それはこれら2つの関数のオーバーラップ領域を表わす。
Max関数は2つのベクトルにより定義される組又は関数のユニオン即ち合体を決定する。ベクトルV1及びV2は、各コンポーネントに対して、これら2つのベクトルに対する値のうちのより大きなものを決定することにより「Max」530関数を使用して結合又は比較される。例えば、V1に対するC5の値は0.1であり、且つV2に対するC5の値は0.1である。より大きな値である0.3は結果的に得られる結合又は比較ベクトル531において表わされる。この例においては、結合又は比較ベクトルVMAX=VXはC={0.2,0.1,0.3,0.3,0.3}を有している。図8に示したように、連続関数600,610を近似する非常に大きな組のコンポーネントの場合には、2つのオフセットし且つほぼ正規的な関数600,610に対してのMax関数630の適用は、二峯性即ち平坦化した曲線631を発生する。この二峯性即ち平坦化した曲線はこれら2つの関数の下での結合された区域を表わす。
Min又はMax関数は、連続的な値を有するコンポーネントを有する特徴ベクトル又は特徴ベクトルにおける組に対して適用することが可能である。即ち、このような関数の使用は、それが適用される各コンポーネントの強度がそのコンポーネントの値に関して単調的に増加又は減少する場合に意味のある結果を発生する。任意の確率分布がこの基準を満足し、従ってMin又はMax関数の適用は意味のある結果を発生する。
その他のコンポーネントがこの基準を満足する場合がある。例えば、オブジェクトが作成された日付及び時間を単一のエキストラコンポーネントとしてその特徴ベクトル内に包含させることが可能である。該コンポーネントの値が何等かの原点時間からの時間である場合には、その特徴コンポーネントはこの基準を満足する。2つのこのような特徴コンポーネントのMin関数との結合は、より先の作成時間を発生し、一方Max関数との結合はより後の作成時間を発生する。又、例えば、支配的なイメージカラーを、例えば、カラーのレッド、グリーン、ブルーコンポーネントの和等の単一の値として特徴ベクトル内に包含させることが可能である。異なる強度の2つの支配的なカラーの最小は強度が減少された同様のカラーであり、そのことは該基準を満足する。
殆ど連続的な値を有するコンポーネントは、Min又はMax等の関数の適用が該基準を満足する一連のコンポーネントへ変換することが可能である。即ち、殆どの特徴はビンニングにより分布関数へマップさせることが可能である。例えば、オブジェクトの作成時間は、年の各日に対して1つp(day)、及び多数の年の各々に対して1つp(year)のように一連のビンとして表現することが可能である。オブジェクトがday=10及びyear=20に作成された場合には、b(10)=1,p(20)=1であり、且つ全てのその他のp(day)及びp(year)の値はゼロである。同様に且つ例えば、テクスチャ尺度tに対する潜在的な値を複数のビンに分割することが可能である。tが0から1の範囲にわたる場合には、これらのビンは、例えば、以下の如くに定義することが可能である。
Figure 0004523413
各ビンは特徴ベクトルTのコンポーネントであり、且つ、例えば、t=0.3である場合に、T={0,0,1,0,0}であるように1又は0の値を取ることが可能である。この技術は、その値が有限の範囲を有する任意の特徴又は任意の組の値に対してうまく行く。その値が有限であるか又は非常に大きな範囲を有するコンポーネントはより小さな有限の範囲へ変換させることが可能である。例えば、文書における単語数nは0から数百万の範囲にわたる場合があるが、より小さな数有限の範囲を有するn′=log(n+1)として変換することが可能である。
Min又はMax関数は、異なるタイプのオブジェクトの特徴を結合又は比較するために使用することが可能である。例えば、メディアのタイプに特定的なものでない特徴は、前述したようなオブジェクトタイプに拘わらずにオブジェクトに対して結合又は比較することが可能である。1つのタイプのメディアに対して特定的な特徴は、別のタイプの特徴へ翻訳又は変換し且つ後者のタイプのオブジェクトと結合又はそれに対して比較することが可能である。例えば、オーディオオブジェクトに対する波長の周波数分布は、オーディオ波長をカラー波長へマッピングすることによりカラーの周波数分布へマップさせることが可能である。例えば、分布が同様の範囲を有するか、又は特定のオーディオ及びイメージデータに対する分布が同様の形状を有するように、一方を他方へ変換するために比例定数又は関数を使用することが可能である。オーディオ及びカラー波長分布が同様のビン構造を有している場合には、それらは意味のある態様で比較又は結合することが可能である。
サーチ中のオブジェクトと基準との間の類似度を評価するために使用される関数G[Ws,gs(Mi,Rc)]134は、前述したように、オブジェクトを結合し且つ基準を発生するために使用される関数を補完するために調節することが可能である。例えば、類似度尺度は比較関数に基づくことが可能である。Min(V1,V2)又はMax(V1,V2)のような関数は、夫々、Vmin又はVmaxのような結合ベクトルを定義する。Vminのような結合又は比較ベクトルにおけるコンポーネントの和又はトレースTrは、関連するベクトルVi及びVjの間の類似度sの表示とする事が可能である。従って、ベクトルi及びjの類似度はこれらのベクトルに適用される結合関数のトレースとして定義することが可能である。即ち、
s(Vi,Vj)=Trf(Vi,Vr
=TrVmin
であり、例えば、ベクトルV1500及びV2510のコンポーネントの各々は和が1であるが、ベクトルVn521のコンポーネントの和は0.8であり、従ってs(V1,V2)=TrVn=0.8である。この尺度は、ベクトルV1及びV2が80%類似していることを表わす。
関数fは、典型的に、そのコンポーネントの和が0と1を含んでその間にあるようにベクトルをリターンすべく選択されており、尚0は類似性がないことを表わす且つ1は完全な類似性、即ち同一であることを表わす。一般的に、1つの特徴ベクトルにおける1組のコンポーネントが、該コンポーネントの和が1であるように標準化されている場合には、Min関数の適用により派生されるベクトルはこのような特性を有している。該オブジェクトが特徴ベクトルにおける該組のコンポーネントにより特性付けられる属性において同一である場合には、Vminのコンポーネントの和は1となる。例えば、Min(V1,V1
はV1であり、且つV1におけるコンポーネントの和は1であり、ベクトルV1がそれ自身に完全に類似している、即ち同一であることを表わす。これら2つのオブジェクトが特徴ベクトルにおける該組のコンポーネントにより特性付けられるどのような態様においても類似していない場合には、Vminのコンポーネントの和はゼロと成る。従って、Min関数は、該オブジェクトの類似度に依存して、標準化された組のコンポーネントに適用された場合にコンポーネントの和が0から1の範囲にわたるベクトルを発生する。
特徴ベクトルが、和が1となるように標準化されていない場合には、Min関数は、コンポーネントの和が以下の如くに0から1の範囲にわたるベクトルを発生すべく調節することが可能である。
s(Vi,Vj)=Tr[Min(Vi,Vj)]/Min(TrVi,TrVj
この特定の形式は、以下の所望の特性を発生するために選択されており、2つのベクトルV1及びV2を結合することにより発生される参照ベクトルVrはV1及びV2の各々に対して完全に類似しているものとして定義される。例えば、複合参照ベクトルVrが、
r=Min(V1,V2
である場合には、V1に対するその類似度は、
s(Vr,V1)=Tr[Min(Vr,V1)]/Min(TrVr,TrV1
であり、それは、
s(Vr,V1)=Tr[Min(V1,V2)]/Tr[Min(V1,V2)]=1
へ還元する。
同様に、複合参照ベクトルVrとV2との間の類似度は1であり、
s(Vr,V1)=Tr[Min(V1,V2)]/Tr[Min(V1,V2)]=1
である。
この調節は、例えば、ベクトルVN521、尚C={0.2,0.1,0.3,0.1,0.1}及びTrVN=0.8、をベクトルV1500、尚C={0.2,0.1,0.3,0.3,0.1}及びTrV1=1.0、と比較することを可能とする。この場合には、Min(VN,V1)={0.2,0.1,0.3,0.1,0.1}及びTr[Min(VN,V1)]=0.8である。調節の後に、
s(V1,V2)=0.8/Min[0.8,1.0]=1
となり、結合ベクトルVNがベクトルV1と完全に類似していることを表わす。一般的に、調節特徴は、Min関数の適用により発生されるベクトルは、調節の後に、それからそれが派生された2つのベクトルのうちのいずれかに対して完全に類似しているという有用な特性を有している。即ち、
s(Vi,Vmin)=s(Vj,Vmin)=1
である。この同一性は、又、2つの特徴ベクトルVi及びVjがMin関数ではなくMax関数と結合される場合にも成立する。即ち、
s(Vi,Vmax)=s(Vj,Vmax)=1
である。この重要な特性は、サーチ基準を定義するために使用した基準オブジェクトは、それら自身、又は非常に類似したメディアオブジェクトがサーチ中のオブジェクトの集まりの中において発生する場合に、該参照に対して類似しているものとして識別されるということを確保する。即ち、各参照項目は、サーチ中のオブジェクトの集まり内に包含されている場合には、複合参照に対してオブジェクトの最も類似するものとしてランク付けされる。
2つの特徴ベクトルを比較する場合に、それらを多かれ少なかれ互いに重み付けすることによって種々の特徴又はコンポーネントを強調させるか又は強調を除去することが可能である。例えば、該1組のコンポーネントC内の5個のコンポーネントのうちの最初の3個が興味のあるものであり、一方最後の2つはそうでない場合がある。この場合には、該コンポーネントは、それらのうちの最初の3個のみが考慮されるように重み付けさせることが可能である。この特定の重み付けは、該ベクトルの最初の3個のコンポーネントに1を乗算し且つ最後の2つのコンポーネントに0を乗算することにより達成される。一般的に、結合又は比較特徴ベクトルは、例えば、Ws*Min(Vi,Vj)又は、等価的にWs*Vminを与えるために重み付けベクトルWs50により乗算させることが可能である。
重み付けベクトルの使用は前に説明した類似度特性を維持する。重み付けベクトルを使用して、それらの重み付けした和が1であるようにそれらのコンポーネントが正規化されている2つのベクトルVi及びVjの類似度は、以下の如くに、
s(Vi,Vr)=TrWs*f(Vi,Vr)=TrWs*Vmin
定義することが可能である。より一般的に且つ標準化されていない組のコンポーネントの場合には、
s(Vi,Vr)=Tr[WsMin(Vi,Vr)]/Min(Tr[Wsi],Tr[Wsr])
である。これらの関数は、Min関数の適用により発生されるベクトルは、前述したように、それからそれが派生された2つのベクトルのうちのいずれかに対して同一的に類似しているという有用な特性を維持する。
重み付けベクトルWs50,250は、前述したように、関数H(Ri,Rj)52に従って2つまたはそれ以上の参照オブジェクトのうちの各々に関する情報を結合することによって参照オブジェクト121−123のうちの1つ又はそれ以上に対する情報から派生することが可能である。該情報が特徴ベクトルとして表わされる場合には、該重み付けベクトルは関数H(Ri,Rj)=Ww*fw(Vi,Vj)に従って派生することが可能であり、尚、例えば、fw(Vi,Vj)=Min(Vi,Vj)又はfw(Vi,Vj)=Max(Vi,Vj)であり、且つWwは、例えば、ユーザの興味に従って定義される。
ビン処理即ちMin又はMax等の関数を使用して意味があるように比較することが不可能なデータ又はパラメータは特徴ベクトル内に包含させることが可能であるが、特徴を結合するか又は比較する場合に分布データとは異なって取り扱われる。例えば、特徴ベクトルVは分布組P={p(x1),p(x2),p(x3),...p(xM)}及びその他のデータD={y1,y2,y3,...yM)}を包含することが可能であり、V={P,D}である。2つの特徴ベクトルV1及びV2は2つの関数、即ちPに対して適用される1つとDに対して適用される別の1つとを使用して結合させることが可能である。例えば、D1及びD2におけるコンポーネントの平均を取りながら、コンポーネントの組P1及びP2に対してMin関数を適用することによりベクトルを結合することが可能であり、
r={Min(P1,P2),(D1+D2)/2}
である。結果的に得られる参照ベクトルVrは、2つの関数を使用してその他のメディアのベクトルに対して比較することが可能である。例えば、
s(Vi,r)=s(Pi,Pr)+K*abs(Di+Dr
であり、尚Kは類似度比較に対してDにおけるパラメータの重要性を制御する定数であり且つs(Pi,Pr)は分布に対して使用される類似度尺度Tr[W Min(P1,P2)]/Min(Tr W P1,Tr W P2)である。xが0から1の範囲にわたる場合には、Kは、典型的に、0と10との間の数字であり、例えば、1.0である。
図9は1組の参照オブジェクトにおける2つまたはそれ以上の参照オブジェクトの各々に対する結合した情報を使用してメディアオブジェクトの集まりをサーチする方法を例示している。ユーザがサーチ基準を定義するための複数個の参照オブジェクトを選択する(ステップ701)。典型的に、ユーザは、選択した参照オブジェクトに類似するメディアオブジェクトを見つけ出すことを所望する。該選択した参照オブジェクトは、特定の特徴を有している場合があり、又はユーザが他のメディアオブジェクトにおいて見つけたいと思う一般的な側面を有している場合がある。該選択した参照オブジェクトは、ユーザが他のメディアオブジェクトにおいて見つけたいと思っている特徴又は側面を共有しているか又は共有していない場合がある。ユーザは、又、サーチすべきメディアオブジェクトのコレクション即ち集まりを選択する(ステップ702)。ユーザは、典型的に、該選択した参照オブジェクトに類似するメディアオブジェクトの選択したコレクション即ち集まりにおいてオブジェクトを見つけ出すことを所望する。
本方法は、各参照オブジェクト及びサーチすべきメディアオブジェクトに関する情報を必要とする(ステップ704)。このような情報は、サーチのために使用可能であるように予め計算し且つ格納することが可能である(ステップ704のYES分岐)。例えば、特徴ベクトル用のコンポーネントを定義することが可能であり、且つ各参照オブジェクト及びサーチすべきメディアオブジェクトの各々に対する特徴ベクトルは、サーチを開始する前に派生することが可能である。各オブジェクトに対する特徴ベクトルは該オブジェクトと関連して格納することが可能である。
ユーザは、このような情報が入手可能でないか、又はユーザが使用可能な情報を使用しないことを望む場合(ステップ704のNO分岐)、参照オブジェクト又はサーチすべきメディアオブジェクトに対する情報を定義し且つ計算することが可能である(ステップ706)。例えば、ユーザは、どの組のコンポーネント及びどのコンポーネントが特徴ベクトル内に包含されるべきであるかを特定することが可能である。次いで、選択した参照オブジェクト及びメディアオブジェクトに対する特徴ベクトルを計算することが可能である。典型的に、該参照オブジェクトの各々及びサーチすべきメディアオブジェクトの各々に対する情報も同様に定義される。例えば、該参照及びサーチすべきメディアオブジェクトの特徴ベクトルは同一の系列のコンポーネントを有する。オブジェクトに対する情報は非類似又はオーバーラッピングしない場合があり、その場合には、サーチにおいて使用される情報は、典型的に、参照オブジェクト及びサーチすべきメディアオブジェクトの間で共有される情報に制限される。
本方法は、選択した参照オブジェクトを結合するための結合関数g(ri,rj)32、例えばWc*fc(Vi,Vj)232を必要とする(ステップ708)。該結合関数の一部又は全ては、それがサーチのために使用可能であるように予め定義することが可能である(ステップ708のYES分岐)。ユーザは、このような情報が使用可能でないか、又はユーザが該使用可能な情報を使用することを望まない場合(ステップ708のNO分岐)には、結合関数を定義することが可能である(ステップ710)。例えば、関数fc(Vi,Vj)を予め定義することが可能であり、一方ユーザは、例えばサーチに対する特徴の相対的な重要性に従って重み付けベクトルWcを定義する。ユーザは、又、サーチの意図に従って関数fc(Vi.Vj)を定義することが可能である。例えば、Max関数は参照オブジェクトにおける特徴の結合した組に対するサーチの意図を満足し、一方Min関数は全ての参照オブジェクトに対して共通の特徴に対するサーチの意図を満足する。
本方法は、又、比較関数G[Ws,gs(Mi,Rc)]34、例えばTr[Ws*fs(Vi,Vr)]234を必要とする(ステップ712)。該結合関数の一部又は全てを予め定義することが可能であり、又は予め定義した方法に従って計算することが可能である(ステップ712のYES分岐)。例えば、Wsは省略するか又は一様な重み付けベクトルであるように予め定義することが可能であり、従ってどの特徴も他のものより多かれ少なかれ重み付けされることはない。Wsは参照オブジェクトを比較するために使用される重み付け関数Wcと同じであるように予め定義することが可能である。一方、Wsは関数h(Ri,Rj)52、例えばWw*fw(Vi,Vj)252に従って計算することが可能であり、且つ関数h(Ri,Rj)は前もって定義することが可能である。例えば、それは定義した結合関数g(Ri,Rj)132又はWc*fc(Vi,Vj)232と同じであるように定義することが可能である。
ユーザは、それが予め定義されていないか、又はユーザが予め定義したWsを使用しないことを望む場合には、Wsを定義することが可能である(ステップ714)。例えば、ユーザは、例えば、あるタイプのフィルタ関数を特定することによって重み付けベクトルを特定することが可能である。一方、ユーザは、結合関数の定義について前に説明したように関数fw(Vi,Vj)及びベクトルWwを定義することが可能である。
サーチ用の重み付けベクトルWs及び結合参照ベクトルVrを派生するために異なる関数f(Vi,Vj)の使用は、ユーザに、両方の目的のために同一の関数を使用する場合よりもサーチ結果にわたってより大きな制御を与える。例えば、ユーザはMax関数fc(Vi,Vj)=Max(Vi,Vj)、従ってVr=Vmaxを使用して特徴を結合することが可能である。次いで、参照ベクトルをメディアオブジェクトの特徴ベクトルと比較する場合に、ユーザはMin関数fw(Vi,Vj)=Max(Vi,Vj)、従ってWs=Vminに従って特徴を重み付けすることが可能である。このように、ユーザは、サーチにおいて、参照オブジェクトにおける全ての特徴を網羅するが、サーチを行なう場合に参照オブジェクト間で共有される特徴を強調する。
重み付けベクトルWsに関しては、関数fs(Vi,Vr)は予め定義するか又は自動的に再定義することが可能であり(ステップ712のYES分岐)、又はユーザにより新たに定義することが可能である(ステップ712のNO分岐)。関数fs(Vi,Vr)は、例えば、Min(Vi,Vr)として予め定義することが可能である。関数fs(Vi,Vr)は、例えば、参照オブジェクトを結合するために使用した関数fc(Vi,Vr)と同じであるように自動的に再定義することが可能である。一方、関数fs(Vi,Vr)は、結合関数の定義について前に説明したように、ユーザのサーチ意図に従ってユーザにより新たに定義することが可能である。
参照オブジェクトに対する情報は、複合参照情報Rc30、例えばVr230を発生するために、定義した結合関数及び、存在する場合に、重み付けに従って結合される(ステップ716)。次いで、ユーザは該複合情報を使用して前に選択したメディアオブジェクトのサーチを実施するか否かを選択することが可能である(ステップ718)。そのサーチが実施される場合には(ステップ718のYES分岐)、該複合参照情報が前に定義した比較関数を使用して、メディアオブジェクトの前に選択した集まりにおけるメディアオブジェクトの各々に対する情報と比較される(ステップ720)。各比較に対して、類似度値を決定することが可能である。次いで、該類似度値は、該複合参照情報に多かれ少なかれ類似するメディアオブジェクトを識別するために使用することが可能である。
サーチを行なわない場合(ステップ718のNO分岐)又はサーチが完了した後に(ステップ720)、ユーザは、参照オブジェクトの組に対して1つの参照オブジェクトを付加するか否かを選択することが可能である(ステップ722)。そうでない場合には(ステップ722のNO分岐)、本プロセスは終了する。然しながら、ユーザは例えば、前のサーチにおいて識別されたオブジェクト等の付加的なオブジェクトの特徴又は側面を組み込むためにサーチを調節することを所望する場合がある。ユーザがそのように所望する場合には(ステップ722のYES分岐)、ユーザは付加的な参照オブジェクトを選択する(ステップ724)。
該新たに選択した参照オブジェクトがメディアオブジェクトの前に選択した集まりの中におけるオブジェクトのうちの1つでない場合には(ステップ726のNO分岐)、所望の情報を計算することが必要な場合がある(ステップ704)。そうである場合には(ステップ704のYES分岐)、ユーザは、好適には前に選択した参照オブジェクトに対するように、該新たに選択した参照オブジェクトに対する情報を作成又は派生する。該新たに選択した参照オブジェクトがメディアオブジェクトの前に選択した集まりからのものである場合には(ステップ726のNO分岐)、該所望の情報は既に作成又は派生されている。
ユーザは、次に、結合関数を新たに定義するか否かを選択することが可能である(ステップ708)。例えば、ユーザはMin関数を使用して初期的な複合ベクトルを作成しているかもしれないが、Max関数を使用して第三のベクトルを付加することを望む場合がある。このように、ユーザは、新たに選択したオブジェクトの独特の特徴を既存の複合情報内へ組込むことが可能である。
ユーザは、又、比較関数を新たに定義するか否かを選択することが可能である(ステップ712)。例えば、ユーザは、関数fsを再定義することが可能である。より典型的には、ユーザは、重み付けベクトルを再定義することを望む場合がある。該比較関数は、複数のメディアオブジェクトが選択プロセスにおいて結合されるに従い変化する場合がある。例えば、該比較関数は、該重み付けベクトルが変化する場合に、変化する。該重み付けベクトルは、通常、参照ベクトルの結合として定義される場合に、新たな選択した参照オブジェクトからの情報の付加と共に変化する。1つの実現例において、該比較関数は、複数の参照オブジェクトに対する情報が結合される場合に変化するものではなく、複合参照情報のみが変化する。そうでない場合には、ユーザは以前に存在している重み付けベクトルを維持するべく選択する場合がある。一方、ユーザは、新たな重み付けベクトルを定義することにより新たに選択した参照オブジェクトの独特の特徴を強調することを望む場合がある。
該新たに選択した参照オブジェクトに対する情報は、既存の複合情報と結合されて、新たな複合情報(ステップ716)及び、必要且つ所望される場合に、新たな重み付けベクトルを作成する。次いで、本方法は前述したように進行する。新たなサーチが行なわれる場合には(ステップ718のYES分岐)、該新たな定義された複合情報、存在する場合には、該新たな重み付けベクトル、及び存在する場合に、新たに定義された比較関数が使用される。
本発明は、デジタル電子回路において、又はコンピュータハードウエア、ファームウエア、ソフトウエアにおいて、又はそれらの結合において実現することが可能である。本発明の装置は、プログラム可能なプロセッサによる実行のために機械読取可能な格納装置においてタンジブルに具体化されたコンピュータプログラムプロダクトにおいて実現することが可能であり、且つ本発明の方法ステップは、入力データに関して動作し且つ出力を発生することにより本発明の機能を実施するための命令からなるプログラムを実行するプログラム可能なプロセッサにより実施することが可能である。本発明は、データ及び命令をデータ格納システムから受取り且つデータ及び命令をそれへ送信すべく結合されている少なくとも1個のプログラム可能なプロセッサ、少なくとも1個の入力装置、及び少なくとも1個の出力装置を包含するプログラム可能なシステム上で実行可能な1つ又はそれ以上のコンピュータプログラムにおいて有益的に実現することが可能である。各コンピュータプログラムは、ハイレベル手順又はオブジェクト指向型プログラミング言語で、又は、所望により、アッセンブリ又は機械言語で実現することが可能であり、且ついずれの場合においても、該言語はコンパイル型又はインタプリタ型の言語とすることが可能である。適宜のプロセッサは、例示として、汎用及び特別目的の両方のマイクロプロセッサを包含している。一般的に、プロセッサはリードオンリメモリ及び/又はランダムアクセスメモリから命令及びデータを受取る。コンピュータの基本的なコンポーネントは命令を実行するためのプロセッサ及びメモリである。一般的に、コンピュータはデータファイルを格納するための1つ又はそれ以上の大量格納装置を包含しており、このような装置は、内部ハードディスク及び着脱自在なディスク等の磁気ディスク、磁気−光学的ディスク、及び光学的ディスクを包含している。コンピュータプログラム命令及びデータをタンジブルに具体化するのに適した格納装置は、全ての形式の非揮発性メモリを包含しており、例示として、EPROM、EEPROM、フラッシュメモリ装置等の半導体メモリ装置、内部ハードディスク及び着脱自在なディスク等の磁気ディスク、磁気−光学的ディスク、及びCD−ROMディスクを包含している。前述したもののいずれもがASIC(応用特定集積回路)により補充されるか又はその中に組込むことが可能である。
ユーザとのインタラクションを与えるために、本発明は、ユーザに対して情報を表示するためのモニタ又はLCDスクリーン等のディスプレイ装置及びキーボード及びマウス又はトラックボール等のそれによりユーザがコンピュータシステムへ入力を供給することが可能なポインティング装置を具備するコンピュータシステム上で実現することが可能である。該コンピュータシステムは、それを介してコンピュータプログラムがユーザと相互作用を行うグラフィカルユーザインターフェースを与えるべくプログラムすることが可能である。
本発明を特定の実施例について説明した。その他の実施例は特許請求の範囲内のものである。例えば、本発明のステップは異なる順番で実施することが可能であり、尚且つ、所望の結果を達成する。複数の参照オブジェクトに対する特徴ベクトル又は情報は、一連の対毎の組み合わせではなく、単一のステップで結合することが可能である。メディアオブジェクト及び参照オブジェクトに対する情報は、モデル又は高次元行列として表現することが可能である。Min及びMax以外の非ユークリッド関数を、特徴ベクトルを結合又は比較するために使用することが可能である。
複数の参照オブジェクトを使用してサーチを行う方法を示した概略図。 コンピュータ環境においてユーザにより複数の参照オブジェクトを使用してサーチを行う方法の使用を示した概略図。 複合参照情報及びサーチメディアオブジェクトを作成するために複数のメディアオブジェクトを使用する方法を示した概略図。 参照ベクトルを作成し且つメディアオブジェクトをサーチするために複数のメディアオブジェクトの特徴ベクトルを使用するための方法を示した概略図。 イメージオブジェクトに対する特徴ベクトル及びオーディオオブジェクトに対する特徴ベクトルを示した概略図。 CDオブジェクトに対する特徴ベクトル及びビデオオブジェクトに対する特徴ベクトルを示した概略図。 2つの特徴ベクトルから1組の個別的なコンポーネントを結合又は比較するためにMin及びMax関数の適用を示した概略図。 連続的な関数を近似する2つの特徴ベクトルからコンポーネントを結合又は比較するためにMin及びMax関数の適用を示した概略図。 複数の参照オブジェクトに対する情報を結合し且つそれをいくつかのメディアオブジェクトの各々に対する同様の情報と比較するサーチ方法を示したフローチャート。

Claims (40)

  1. 異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなるメディアオブジェクトの集まりをサーチするコンピュータによって実現される方法において、コンピュータをして、
    サーチ用の基準を表わす複合参照情報を発生するために異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなり且つ前記メディアオブジェクトの集まりから選択されるか又は外部供給源から供給されるか又はコンピュータ上で作成される複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータをMin関数又はMax関数により結合する場合に、前記複数個の参照オブジェクトの内の2個の参照オブジェクトの前記各1組のパラメータを結合させて前記複合参照情報を発生し且つ残存する未だに結合させていない参照オブジェクトが存在する場合には前記残存する未だに結合させていない参照オブジェクトの前記各1組のパラメータを順次前記複合参照情報へ結合する手順、
    1つ又はそれ以上のメディアオブジェクトを識別するためにメディアオブジェクトの集まりにおける複数個のメディアオブジェクトの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される1組のパラメータに対して前記複合参照情報をMin関数又はMax関数により比較する手順、
    を実施させることを包含している方法。
  2. 請求項1において、更に、コンピュータをして、
    前記複数個の参照オブジェクトを特定するユーザ入力を受取る手順、
    を実施させることを包含している方法。
  3. 請求項1において、更に、コンピュータをして、
    前記複合参照情報と各メディアオブジェクトに対する前記第一の特徴に関する分布関数によって決定される1組のパラメータとの比較に基づいてメディアオブジェクトの前記集まりにおいて1つのメディアオブジェクトを選択する手順、
    を実施させることを包含している方法。
  4. 請求項1において、前記複数個の参照オブジェクトが、オーディオ、イメージ、テキスト又はビデオから選択した1つのタイプを有する1つ又はそれ以上のオブジェクトを包含している方法。
  5. 請求項4において、複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合することが、異なるタイプのオブジェクトに対する各1組のパラメータを結合することを包含している方法。
  6. 請求項1において、複合参照情報を発生するために複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合することが、前記参照オブジェクトに対する前記1組のパラメータの交差を決定することを包含している方法。
  7. 請求項1において、複合参照情報を発生するために複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合することが、前記参照オブジェクトに対する前記1組のパラメータの合体を決定することを包含している方法。
  8. 請求項1において、更に、コンピュータをして、
    前記サーチに対する基準を表わす付加的な複合参照情報を発生するために前記複数個の参照オブジェクトに共通の前記第一の特徴とは別の第二の特徴に関する分布関数によって決定される各1組のパラメータをMin関数又はMax関数により結合する手順、且つ
    1つ又はそれ以上のメディアオブジェクトを識別するために、メディアオブジェクトの前記集まりにおける前記複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第二の特徴に関する分布関数によって決定される各1組のパラメータに対して前記付加的な複合参照情報をMin関数又はMax関数により比較する手順、
    を実施させることを包含している方法。
  9. 請求項8において、前記第一の特徴に関する分布関数によって決定される各1組のパラメータ及び前記第二の特徴に関する分布関数によって決定される各1組のパラメータが、夫々の特徴の相対的な重要性を特定するために、重み付けされている方法。
  10. 請求項8において、更に、コンピュータをして、
    前記第一の特徴と前記第二の特徴の相対的な重要性を表わすユーザ入力を受取る手順、
    を実施させることを包含している方法。
  11. 請求項8において、前記第一の特徴及び前記第二の特徴の各特徴に関する分布関数によって決定される1組のパラメータが、該分布関数を複数個のビンに分割した夫々のビンにおける発生頻度により表わされている方法。
  12. 請求項8において、前記第一の徴及び前記第二の特徴の各特徴に関する分布関数によって決定される各1組のパラメータが、1つのオブジェクトにおけるカラーの相対的な発生頻度を記述するカラー情報を包含している方法。
  13. 請求項8において、前記第一の特徴に関する分布関数によって決定される各1組のパラメータが前記第二の特徴に関する分布関数によって決定される各1組のパラメータに対してマップされる方法。
  14. 請求項1において、更に、コンピュータをして、
    前記複合参照情報を改訂するために付加的な参照オブジェクトに対する特徴に関する分布関数によって決定される各1組のパラメータを前記複合参照情報と結合させる手順、
    を実施させることを包含している方法。
  15. 請求項14において、更に、コンピュータをして、
    前記改訂した複合参照情報を、メディアオブジェクトの前記集まりにおける改訂前の前記複合参照情報を使用して選択された第二複数個のメディアオブジェクトの各々に対する特徴にする分布関数によって決定される各1組のパラメータと比較する手順、
    を実施させることを包含している方法。
  16. 請求項1において、メディアオブジェクトの集まりにおける複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される各1組のパラメータに対して前記複合参照情報を比較することが、メディアオブジェクトの前記集まりにおける前記メディアオブジェクトの各夫々の1つに対して類似度値を割当てることを包含しており、各類似度値が前記メディアオブジェクトの各々と前記複合参照情報の類似度を表わしている方法。
  17. 請求項1において、更に、コンピュータをして、
    それらの類似度値に従って前記メディアオブジェクトをランク付けする手順、
    そのランクに基づいてメディアオブジェクトの前記集まりにおける1つ又はそれ以上のメディアオブジェクトを選択する手順、
    を実施させることを包含している方法。
  18. 請求項において、各参照及びメディアオブジェクトについて、前記第一の徴及び前記第二の特徴の各特徴に関する分布関数によって決定される1組のパラメータが特徴ベクトルの1組のコンポーネントとして表現されている方法。
  19. 異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなるメディアオブジェクトの集まりをサーチするコンピュータによって実現される方法において、コンピュータをして、
    サーチ用の基準を表わす複合参照ベクトルを発生するために異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなり且つ前記メディアオブジェクトの集まりから選択されるか又は外部供給源から供給されるか又はコンピュータ上で作成される複数個の参照オブジェクトに共通の2つ又はそれ以上の特徴を表す複数個のコンポーネントからなる特徴ベクトルを結合する場合に、前記複数個の参照オブジェクトの内の2個の参照オブジェクトの前記特徴ベクトルを結合させて前記複合参照ベクトルを発生し且つ残存する未だに結合させていない参照オブジェクトが存在する場合には前記残存する未だに結合させていない参照オブジェクトの前記特徴ベクトルを順次前記複合参照ベクトルへ結合する第1手順であって、前記複合参照ベクトルを発生するためにMin又はMax関数を使用して前記複数個の参照オブジェクトの特徴ベクトルを結合することを包含している第1手順、且つ
    前記複合参照ベクトルをメディアオブジェクトの前記集まりにおける複数個のメディアオブジェクトのうちの各夫々の1つに対する同一の特徴に関する特徴ベクトルと比較する第2手順であって、Min又はMax関数を使用してメディアオブジェクトの前記集まりにおける各メディアオブジェクトの特徴ベクトルに対して前記複合参照ベクトルを比較すること、及びメディアオブジェクトの前記集まりにおける各メディアオブジェクトに対して類似度値を割当てること、を包含しており、前記類似度値は、前記メディアオブジェクトの特徴ベクトルの前記複合参照ベクトルに対する類似度を表わしている第2手順、
    を実施させることを包含している方法。
  20. 異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなるメディアオブジェクトの集まりをサーチするためのコンピュータにより読取可能な媒体上のコンピュータプログラムにおいて、プログラム可能なプロセッサをして、
    サーチ用の基準を表わす複合参照情報を発生するために異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなり且つ前記メディアオブジェクトの集まりから選択されるか又は外部供給源から供給されるか又はコンピュータ上で作成される複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータをMin関数又はMax関数により結合する場合に、前記複数個の参照オブジェクトの内の2個の参照オブジェクトの前記各1組のパラメータを結合させて前記複合参照情報を発生し且つ残存する未だに結合させていない参照オブジェクトが存在する場合には前記残存する未だに結合させていない参照オブジェクトの前記各1組のパラメータを順次前記複合参照情報へMin関数又はMax関数により結合する手順、
    1つ又はそれ以上のメディアオブジェクトを識別するために、前記複合参照情報をメディアオブジェクトの集まりにおける複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される1組のパラメータとMin関数又はMax関数により比較する手順、
    を実施させることを包含しているコンピュータプログラム。
  21. 請求項2において、更に、プログラム可能なプロセッサをして、
    前記複数個の参照オブジェクトを特定するユーザ入力を受取らせる手順、
    を実施させることを包含しているコンピュータプログラム。
  22. 請求項2において、更に、プログラム可能なプロセッサをして、
    各メディアオブジェクトに対する前記第一の特徴に関する分布関数によって決定される1組のパラメータと前記複合参照情報との比較に基づいてメディアオブジェクトの前記集まりの中で1つのメディアオブジェクトを選択する手順、
    を実施させることを包含しているコンピュータプログラム。
  23. 請求項2において、前記複数個の参照オブジェクトが、オーディオ、イメージ、テキスト、CD、又はビデオから選択される1つのタイプを有する1つ又はそれ以上のオブジェクトを包含しているコンピュータプログラム。
  24. 請求項0において、複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合させるための手順が、異なるタイプのオブジェクトに対する各1組のパラメータを結合するための手順を包含しているコンピュータプログラム。
  25. 請求項2において、複合参照情報を発生するために複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合するための手順が、前記参照オブジェクトに対する前記1組のパラメータの交差を決定するための手順を包含しているコンピュータプログラム。
  26. 請求項2において、複合参照情報を発生するために複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータを結合するための手順が、前記参照オブジェクトに対する前記1組のパラメータの合体を決定するための手順を包含しているコンピュータプログラム。
  27. 請求項2において、更に、プログラム可能なプロセッサをして、
    サーチ用の基準を表わす付加的な複合参照情報を発生するために前記複数個の参照オブジェクトに共通の前記第一の特徴とは別の第二の特徴に関する分布関数によって決定される各1組のパラメータをMin関数又はMax関数により結合するための手順、及び
    1つ又はそれ以上のメディアオブジェクトを識別するために、前記付加的な複合参照情報をメディアオブジェクトの前記集まりにおける前記複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第二の特徴に関する分布関数によって決定される各1組のパラメータとMin関数又はMax関数により比較する手順、
    を実施させることを包含しているコンピュータプログラム。
  28. 請求項27において、前記第一の特徴に関する分布関数によって決定される各1組のパラメータ及び前記第二の特徴に関する分布関数によって決定される各1組のパラメータ夫々の特徴の相対的な重要性を特定するために重み付けされているコンピュータプログラム。
  29. 請求項27において、更に、プログラム可能なプロセッサをして、
    前記第一の特徴及び前記第二の特徴の相対的な重要性を表わすユーザ入力を受取る手順、
    を実施させることを包含しているコンピュータプログラム。
  30. 請求項27において、前記第一の特徴及び前記第二の特徴の各特徴に関する分布関数によって決定される1組のパラメータが、該分布関数を複数個のビンに分割した夫々のビンにおける発生頻度により表わされるコンピュータプログラム。
  31. 請求項27において、前記第一の徴及び前記第二の特徴の各特徴に関する分布関数によって決定される各1組のパラメータが、1つのオブジェクトにおけるカラーの相対的な発生頻度を記述するカラー情報を包含しているコンピュータプログラム。
  32. 請求項27において、前記第一の特徴に関する分布関数によって決定される各1組のパラメータが前記第二の特徴に関する分布関数によって決定される各1組のパラメータに対してマップされるコンピュータプログラム。
  33. 請求項20において、更に、プログラム可能なプロセッサをして、
    前記複合参照情報を改訂するために、付加的な参照オブジェクトに対する特徴に関する分布関数によって決定される各1組のパラメータを前記複合参照情報と結合させる手順、
    を実施させることを包含しているコンピュータプログラム。
  34. 請求項33において、更に、プログラム可能なプロセッサをして、
    前記改訂た複合参照情報をメディアオブジェクトの前記集まりにおける改訂前の前記複合参照情報を使用して選択された第二複数個のメディアオブジェクトの各々に対する特徴にする分布関数によって決定される各1組のパラメータと比較させる手順、
    を実施させることを包含しているコンピュータプログラム。
  35. 請求項20において、前記複合参照情報をメディアオブジェクトの集まりにおける複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される各1組のパラメータと比較するための手順が、メディアオブジェクトの前記集まりにおける前記メディアオブジェクトの各夫々の1つに対して類似度値を割当てるための手順を包含しており、各類似度値が前記メディアオブジェクトの各々と前記複合参照情報の類似度を表わしているコンピュータプログラム。
  36. 請求項5において、更に、プログラム可能なプロセッサをして、
    それらの類似度値に従って前記メディアオブジェクトをランク付けさせる手順、且つ
    そのランクに基づいてメディアオブジェクトの前記集まりにおける1つ又はそれ以上のメディアオブジェクトを選択させる手順、
    を実施させることを包含しているコンピュータプログラム。
  37. 請求項27において、各参照及びメディアオブジェクトに対して、前記第一の徴及び前記第二の特徴の各特徴に関する分布関数によって決定される1組のパラメータが特徴ベクトルの1組のコンポーネントとして表わされているコンピュータプログラム。
  38. 異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなるメディアオブジェクトの集まりをサーチするためのコンピュータによって読取可能な媒体上のコンピュータプログラムにおいて、プログラム可能なプロセッサをして、
    サーチ用の基準を表わす複合参照ベクトルを発生するために異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなり且つ前記メディアオブジェクトの集まりから選択されるか又は外部供給源から供給されるか又はコンピュータ上で作成される複数個の参照オブジェクトに共通の2つ又はそれ以上の特徴を表す複数個のコンポーネントからなる特徴ベクトルを結合させる場合に、前記複数個の参照オブジェクトの内の2個の参照オブジェクトの前記特徴ベクトルを結合させて前記複合参照ベクトルを発生し且つ残存する未だに結合させていない参照オブジェクトが存在する場合には前記残存する未だに結合させていない参照オブジェクトの前記特徴ベクトルを順次前記複合参照ベクトルへ結合する第1手順であって、前記複合参照ベクトルを発生するためにMin又はMax関数を使用して前記複数個の参照オブジェクトの特徴ベクトルを結合するための手順を包含している第1手順、且つ
    前記複合参照ベクトルをメディアオブジェクトの前記集まりにおける複数個の前記メディアオブジェクトのうちの各夫々の1つに対する同一の特徴に関する特徴ベクトルと比較する第2手順であって、前記複合参照ベクトルをMin又はMax関数を使用してメディアオブジェクトの前記集まりにおける各メディアオブジェクトの特徴ベクトルと比較すること及びメディアオブジェクトの前記集まりにおける各メディアオブジェクトに対して類似度値を割当てることを包含しており、前記類似度値が前記メディアオブジェクトの特徴ベクトルの前記複合参照ベクトルに対する類似度値を表わしている第2手順、
    を実施させることを包含しているコンピュータプログラム。
  39. 異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなるメディアオブジェクトの集まりをサーチするシステムにおいて、
    サーチ用の基準を表わす複合参照情報を発生するために異なるメディアタイプの内の少なくとも一つのメディアタイプのオブジェクトからなり且つ前記メディアオブジェクトの集まりから選択されるか又は外部供給源から供給されるか又はコンピュータ上で作成される複数個の参照オブジェクトに共通な第一の特徴に関する分布関数によって決定される各1組のパラメータをMin関数又はMax関数により結合する場合に、前記複数個の参照オブジェクトの内の2個の参照オブジェクトの前記各1組のパラメータを結合させて前記複合参照情報を発生し且つ残存する未だに結合させていない参照オブジェクトが存在する場合には前記残存する未だに結合させていない参照オブジェクトの前記各1組のパラメータを順次前記複合参照情報へ結合する手段、
    1つ又はそれ以上のメディアオブジェクトを識別するために、前記複合参照情報をメディアオブジェクトの集まりにおける複数個のメディアオブジェクトのうちの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される1組のパラメータとMin関数又はMax関数により比較する手段、
    を有している、システム。
  40. 請求項39において、前記複合参照情報をメディアオブジェクトの前記集まりにおける複数個のメディアオブジェクトの各夫々の1つに対する前記第一の特徴と同一の特徴に関する分布関数によって決定される1組のパラメータとMin関数又はMax関数により比較する手段が、メディアオブジェクトの前記集まりにおける前記メディアオブジェクトの各夫々の1つに対して類似度値を割り当てるための手段を包含しており、各類似度値が前記メディアオブジェクトの各々と前記複合参照情報との類似度を表わしているシステム。
JP2004541419A 2002-09-30 2002-09-30 複数のメディア参照でのサーチ不明確性の減少 Expired - Lifetime JP4523413B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2002/031258 WO2004031991A1 (en) 2002-09-30 2002-09-30 Reduction of search ambiguity with multiple media references

Publications (2)

Publication Number Publication Date
JP2006501565A JP2006501565A (ja) 2006-01-12
JP4523413B2 true JP4523413B2 (ja) 2010-08-11

Family

ID=32067656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004541419A Expired - Lifetime JP4523413B2 (ja) 2002-09-30 2002-09-30 複数のメディア参照でのサーチ不明確性の減少

Country Status (5)

Country Link
US (2) US9684675B2 (ja)
JP (1) JP4523413B2 (ja)
DE (1) DE10297802B4 (ja)
GB (1) GB2407675B (ja)
WO (1) WO2004031991A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10915571B2 (en) 2002-09-30 2021-02-09 Adobe Inc. Reduction of search ambiguity with multiple media references

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7118026B2 (en) * 2003-06-26 2006-10-10 International Business Machines Corporation Apparatus, method, and system for positively identifying an item
US7593603B1 (en) 2004-11-30 2009-09-22 Adobe Systems Incorporated Multi-behavior image correction tool
US8745055B2 (en) * 2006-09-28 2014-06-03 Symantec Operating Corporation Clustering system and method
US8004536B2 (en) 2006-12-01 2011-08-23 Adobe Systems Incorporated Coherent image selection and modification
US8175409B1 (en) 2006-12-01 2012-05-08 Adobe Systems Incorporated Coherent image selection and modification
US8799249B2 (en) * 2007-06-08 2014-08-05 Yahoo! Inc. Method and system for rendering a collection of media items
JP4433017B2 (ja) * 2007-08-31 2010-03-17 ブラザー工業株式会社 画像処理装置及び画像処理プログラム
JP4442664B2 (ja) * 2007-08-31 2010-03-31 ブラザー工業株式会社 画像処理装置、画像処理方法、画像処理プログラム
JP4793356B2 (ja) 2007-08-31 2011-10-12 ブラザー工業株式会社 画像処理装置及び画像処理プログラム
DE102007051612B4 (de) * 2007-10-24 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum automatisierten Vergleichen zweier Sätze von Messwerten
DE102007058959A1 (de) * 2007-12-07 2009-06-10 Robert Bosch Gmbh Konfigurationsmodul für ein Überwachungssystem, Überwachungssystem, Verfahren zur Konfiguration des Überwachungssystems sowie Computerprogramm
US7958130B2 (en) * 2008-05-26 2011-06-07 Microsoft Corporation Similarity-based content sampling and relevance feedback
US9355469B2 (en) 2009-01-09 2016-05-31 Adobe Systems Incorporated Mode-based graphical editing
US20100259683A1 (en) * 2009-04-08 2010-10-14 Nokia Corporation Method, Apparatus, and Computer Program Product for Vector Video Retargeting
US8831358B1 (en) * 2011-11-21 2014-09-09 Google Inc. Evaluating image similarity
US9804729B2 (en) 2013-03-15 2017-10-31 International Business Machines Corporation Presenting key differences between related content from different mediums
US9158435B2 (en) 2013-03-15 2015-10-13 International Business Machines Corporation Synchronizing progress between related content from different mediums
US9495365B2 (en) * 2013-03-15 2016-11-15 International Business Machines Corporation Identifying key differences between related content from different mediums
US9355158B2 (en) 2013-08-29 2016-05-31 Google Inc. Modifying search results based on selection of one of the search results
US9348945B2 (en) 2013-08-29 2016-05-24 Google Inc. Modifying search results based on dismissal action associated with one or more of the search results
US10296959B1 (en) * 2015-03-30 2019-05-21 Audible, Inc. Automated recommendations of audio narrations
US10223359B2 (en) * 2016-10-10 2019-03-05 The Directv Group, Inc. Determining recommended media programming from sparse consumption data
CN110209844B (zh) * 2019-05-17 2021-08-31 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据匹配方法、装置和存储介质

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR920006031B1 (ko) * 1988-05-09 1992-07-27 다떼이시 덴끼 가부시끼 가이샤 기판등의 검사장치 및 그 동작방법
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5499306A (en) * 1993-03-08 1996-03-12 Nippondenso Co., Ltd. Position-and-attitude recognition method and apparatus by use of image pickup means
US5835667A (en) * 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
DE69635101T2 (de) * 1995-11-01 2006-06-01 Canon K.K. Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät
US5911139A (en) * 1996-03-29 1999-06-08 Virage, Inc. Visual image database search engine which allows for different schema
US5983237A (en) * 1996-03-29 1999-11-09 Virage, Inc. Visual dictionary
US5915250A (en) * 1996-03-29 1999-06-22 Virage, Inc. Threshold-based comparison
CA2259411A1 (en) * 1997-05-05 1998-11-12 Shell Oil Company Visual recognition method
US6219129B1 (en) * 1997-09-11 2001-04-17 Fuji Photo Film Co., Ltd. Print system
US6035055A (en) * 1997-11-03 2000-03-07 Hewlett-Packard Company Digital image management system in a distributed data access network system
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
US6720971B1 (en) * 1998-05-29 2004-04-13 Canon Kabushiki Kaisha Image processing method and apparatus, and storage medium
US6366296B1 (en) 1998-09-11 2002-04-02 Xerox Corporation Media browser using multimodal analysis
JP3558893B2 (ja) * 1998-10-08 2004-08-25 シャープ株式会社 画像処理装置および画像処理方法
US6192150B1 (en) * 1998-11-16 2001-02-20 National University Of Singapore Invariant texture matching method for image retrieval
US6347313B1 (en) 1999-03-01 2002-02-12 Hewlett-Packard Company Information embedding based on user relevance feedback for object retrieval
US6445822B1 (en) * 1999-06-04 2002-09-03 Look Dynamics, Inc. Search method and apparatus for locating digitally stored content, such as visual images, music and sounds, text, or software, in storage devices on a computer network
US6813395B1 (en) * 1999-07-14 2004-11-02 Fuji Photo Film Co., Ltd. Image searching method and image processing method
US6751363B1 (en) * 1999-08-10 2004-06-15 Lucent Technologies Inc. Methods of imaging based on wavelet retrieval of scenes
GB9920929D0 (en) * 1999-09-03 1999-11-10 Sony Uk Ltd Video signal processor
US6243143B1 (en) * 1999-09-21 2001-06-05 Media 100 Inc. Effecting video transitions between video streams
CA2388095A1 (en) * 1999-10-22 2001-05-03 Activesky, Inc. An object oriented video system
GB2356998A (en) * 1999-12-02 2001-06-06 Sony Uk Ltd Video signal processing
WO2001043077A1 (fr) * 1999-12-06 2001-06-14 Fujitsu Limited Procede et dispositif d'affichage d'images
US20020002550A1 (en) * 2000-02-10 2002-01-03 Berman Andrew P. Process for enabling flexible and fast content-based retrieval
TWI222039B (en) * 2000-06-26 2004-10-11 Iwane Lab Ltd Information conversion system
US7337065B2 (en) * 2001-01-23 2008-02-26 Spectral Sciences, Inc. Methods for atmospheric correction of solar-wavelength hyperspectral imagery over land
FR2821947B1 (fr) * 2001-03-12 2003-05-16 Canon Kk Procede et dispositif de validation de parametres definissant une image
US7231381B2 (en) * 2001-03-13 2007-06-12 Microsoft Corporation Media content search engine incorporating text content and user log mining
US6751348B2 (en) * 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
US7197493B2 (en) * 2001-12-21 2007-03-27 Lifestory Productions, Inc. Collection management database of arbitrary schema
US7058220B2 (en) * 2002-04-29 2006-06-06 Hewlett-Packard Development Company, L.P. Method and system for processing images using histograms
US6961736B1 (en) * 2002-05-31 2005-11-01 Adobe Systems Incorporated Compact color feature vector representation
JP4523413B2 (ja) 2002-09-30 2010-08-11 アドビ システムズ, インコーポレイテッド 複数のメディア参照でのサーチ不明確性の減少
JP4251320B2 (ja) * 2003-07-11 2009-04-08 株式会社沖データ 光源推定方法およびその装置
JP4217575B2 (ja) * 2003-09-29 2009-02-04 キヤノン株式会社 画像処理装置、画像処理方法ならびにプログラム、記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10915571B2 (en) 2002-09-30 2021-02-09 Adobe Inc. Reduction of search ambiguity with multiple media references

Also Published As

Publication number Publication date
GB2407675B (en) 2006-01-04
JP2006501565A (ja) 2006-01-12
GB0503665D0 (en) 2005-03-30
GB2407675A (en) 2005-05-04
US9684675B2 (en) 2017-06-20
US20060074861A1 (en) 2006-04-06
WO2004031991A1 (en) 2004-04-15
DE10297802B4 (de) 2011-05-19
DE10297802T5 (de) 2005-09-29
US10915571B2 (en) 2021-02-09
US20170249338A1 (en) 2017-08-31

Similar Documents

Publication Publication Date Title
JP4523413B2 (ja) 複数のメディア参照でのサーチ不明確性の減少
Marques et al. Content-based image and video retrieval
US6556710B2 (en) Image searching techniques
CN1538351B (zh) 为视频序列生成视频缩略图的方法和计算机
Wong et al. Automatic semantic annotation of real-world web images
CN101755267B (zh) 组成平衡和颜色驱动的内容检索
JP5121972B2 (ja) カラー画像を表現する方法、カラー画像を表現する装置、カラー画像を表現するシステム、コンピュータによる実行可能命令からなるプログラム、及びコンピュータ読取り可能媒体
US7801893B2 (en) Similarity detection and clustering of images
US6115717A (en) System and method for open space metadata-based storage and retrieval of images in an image database
US6522782B2 (en) Image and text searching techniques
Liang et al. Objective quality prediction of image retargeting algorithms
Rubner et al. Adaptive color-image embeddings for database navigation
US20080193048A1 (en) Picture Collage Systems And Methods
US20020026449A1 (en) Method of content driven browsing in multimedia databases
Lewis et al. An integrated content and metadata based retrieval system for art
JP2014501422A (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US10891019B2 (en) Dynamic thumbnail selection for search results
US8412694B2 (en) Colorblind accessible image search
Dominguez et al. Comparing neural and attractiveness-based visual features for artwork recommendation
CN107918936B (zh) 使用标签跟踪用于分块匹配算法的高频偏移
US8478033B2 (en) Image inspection apparatus and method
US8520980B2 (en) Image searching method and apparatus
US6522779B2 (en) Representing an image with a posterized joint histogram
JP2002082985A (ja) 画像検索装置及び方法並びに画像検索プログラムを記録した記憶媒体
Zhang On the use of CBIR in Image Mosaic Generation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090121

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090210

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090820

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4523413

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130604

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130604

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term