JP4944672B2 - マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 - Google Patents

マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 Download PDF

Info

Publication number
JP4944672B2
JP4944672B2 JP2007146581A JP2007146581A JP4944672B2 JP 4944672 B2 JP4944672 B2 JP 4944672B2 JP 2007146581 A JP2007146581 A JP 2007146581A JP 2007146581 A JP2007146581 A JP 2007146581A JP 4944672 B2 JP4944672 B2 JP 4944672B2
Authority
JP
Japan
Prior art keywords
image
descriptor
coefficients
filter
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007146581A
Other languages
English (en)
Other versions
JP2008052707A (ja
Inventor
スタウダー,ユルゲン
シロ,ジョエル
マリア−アルフォンス,ジャン−エミーユ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008052707A publication Critical patent/JP2008052707A/ja
Application granted granted Critical
Publication of JP4944672B2 publication Critical patent/JP4944672B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/431Frequency domain transformation; Autocorrelation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、マルチメディアアイテム(multimedia item)の記述子を決定する方法及び装置に関する。本発明はまた、データベース内のマルチメディアアイテムを検索する装置及びデータベース内のマルチメディアアイテムを分類する装置に関する。
例えばマルチメディア資産管理など、信号処理及びデータ処理の多様な分野において、2つのアイテムを比較したり、あるアイテムと類似するデータベース内のアイテムを検索したりするために、マルチメディアアイテムのための小さなサイズであってコンパクトな記述子の算出が行われている。
一例を挙げると、データベースの画像、例えば個人の写真やビデオの画像は、データベース内の類似する画像をグループ化し、ある画像と類似する画像を検索することを簡単にする関連記述子を有することができる。
記述子はたとえ小さいサイズであっても、2つのアイテムの類似性を最大に反映していなければならないところに、記述子の課題がある。
周知で一般的に用いられる記述子の一つのタイプは、マルチメディアアイテムの信号の周波数分解に基づいている。従って、周波数帯域に対応しフィルタ処理された各信号を生成するためにフィルタバンクが用いられる。この時、各帯域でフィルタ処理された信号のパワー(power)がしばしば計算される。パワー値の総計によって記述子が構築される。フィルタバンクの使用は、例えばオーディオ処理において一般的である。また画像に関して言えば、ウェーブレットフィルタやガボールフィルタ(Gabor filter)などのフィルタバンクが、画像解析や画像検索において広く用いられている。
画像の特徴や画像の類似性を反映する記述子の能力を高めるために、下記の手段のうちのひとつが一般的に適用される。
1.フィルタの数を増やす。
2.フィルタの配置及び種類を最適化する。
3.各フィルタの精度を高める。
第1の手段は、例えば8つのフィルタの代わりに12のフィルタを用いることで実現できる。これによって、信号周波数スペクトルはより良く表される。
第2の手段は、画像の場合は、ウェーブレットフィルタをガボールフィルタに取り替えることで実現できる。ウェーブレットフィルタは、水平周波数、垂直周波数及びダイアゴナル(diagonal)周波数を考慮することによって、2次元周波数スペクトルの範囲をカバーする一方、ガボールフィルタは、より適応性があって、より多くの方向の周波数を表現することができる。これによって、画像や特に画像のテクスチャをより良く表現することができる。
第3の手段は、フィルタ、とりわけディジタルフィルタを改良し、フィルタカーネルを示すために用いられるサンプルの数を増やすことによって実現できる。例えば、16×16カーネルを32×32カーネルに置き換えると、ガボールフィルタの精度を高めることができる。
フィルタバンクにおいては、フィルタのスペクトルが重なり合い、従って周波数帯域が適切に計算されないという問題がたびたび生じる。例えば、ガボールフィルタはガウス分布スペクトルを有する。これらのスペクトルは、本質的に互いに重なり合う。この重なり合いによって、特に一つあるいはいくつかのフィルタが周波数ゼロの部分を多数含む場合において画像検索の性能が落ちる。
縞を表す2つの画像を例に挙げる。2つの画像における縞の方向と周波数は同一である。2つの画像の唯一の差異点は、空間的に一定なオフセットにある。各画像の記述子は、ガボールのサブバンドのパワーに基づいて計算される。たとえ画像が同じ種類のテクスチャを表していても、記述子の差が大きくなるにつれて、オフセットも大きくなる。
日中の異なる時間において同じ場面を表す2つの画像を別の例として挙げる。照度の違いが大きいほど、記述子の差も大きくなる。例えば、日中の車を表すある画像を用いて、車を表す画像をデータベースにおいて検索する。そのとき、夕方のようにより微光なレベルにおける車を表す画像を検出することはできない。
この効果は、特に意味的に類似するアイテムを検索する場合、データベースにおける検索の実行をより難しいものにする。例えば、あるオーディオクリップと類似するリズムを有するオーディオクリップを検索する。オーディオクリップが技術的な理由から異なる信号オフセットを有する場合、同一のリズムを有するが異なるオフセットを有するオーディオクリップのうち検出できないものもある。
また、マルチメディアアイテムを分類するためにフィルタバンクに基づく記述子を用いる場合、マイナスの影響が生じ得る。これにより、記述子は、画像にひとつあるいはいくつかのラベルを属性付けるクラシファイア(classifier)に組み込まれる。例えば、画像における屋外場面のクラシファイアは、ある画像の屋外場面を検出し、この画像に対して「屋外」というラベルを作成することができる。クラシファイアは、典型的な画像によって通常トレーニングされている。これらの画像が日中の画像のみを含む場合は、クラシファイアは例えば午前中など微光レベルにおける屋外場面を検出できない。
本発明は、前述の不利益のうち少なくとも一つを回避し、バンクフィルタを用いてマルチメディアアイテムの記述子を計算する方法を提案する。
本発明によれば、画像の記述子を決定する装置を提供する。この装置は以下の手段を含む。
第1組の係数を得るために方向フィルタの第1バンクを前記画像に適応する手段(2)と、
前記画像の平均値を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用する手段(3)と、
第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分の関連パワー(power)を計算して(S4)記述子を得ることよって前記画像を示す記述子を計算する手段(4)と、
を含む。
ここで、前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連パワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している
データベース(1)内の画像を検索する装置であって、
前記の記述子を決定する装置と、
サンプル画像の記述子と前記データベース(1)の画像の記述子とを比較する手段(5)と、
前記サンプル画像の記述子と前記データベースの記述子との差が所定の閾値より小さい前記データベース内の画像を検索する手段(6)と、
を含むことを特徴とする装置を提供する。
データベース(1)内の画像を分類する装置であって、
前記記述子を決定する装置と、
前記記述子の分類のためのクラスタリング手段(7)と、
を含むことを特徴とする装置を提供する。
前記の装置により実行する、画像の記述子を決定する方法を提供する。
ここで、前記方法は、前記手段(2)が、第1組の係数を得るために前記画像に方向フィルタの第1のバンクを適用するステップ(S1)を含み、
前記手段(3)が、低域通過フィルタで処理された画像を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用し(S2)、
前記手段(4)が、第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分に関連したパワー(power)を計算して(S4)記述子を得ることによって前記画像を示す記述子を計算し(S3)、
前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連したパワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、ことを特徴とする。
前記方向フィルタはガボール(Gabor)型フィルタであることを特徴とする。
前記フィルタの第2バンクは、低域通過フィルタであることを特徴とする。
前記フィルタの第2のバンクは、前記ガボールフィルタの検出感度の方向に垂直な線にそって平均値を計算する方位フィルタであることを特徴とする。
前記第1組の係数および第2組の係数における係数は、前記フィルタの一方向と一スケールのそれぞれに対応することを特徴とする。
本発明の他の特徴及び利点は、本発明の限定されない実施形態の説明を通して表され、添付の図面を用いて明らかにされるであろう。
本発明の実施形態は、ソフトウェア、ファームウェア、ハードウェアにおいて、または多様な技術の組み合わせによって実施されることができる。例えばある実施形態において、本発明は、コンピュータプログラム製品またはソフトウェアとして提供されることができる。コンピュータプログラム製品またはソフトウェアは、本発明に応じて処理を実行するコンピュータ(または他の電子装置)をプログラミングするために用いられ命令を記憶している機械またはコンピュータ読み取り可能な媒体を含む。他の実施形態では、本発明のステップは、ステップを実行するための配線回路を含む特別なハードウェアコンポーネントによって、またはプログラムによるコンピュータコンポーネント及びカスタムハードウェアコンポーネントの任意の組み合わせによって、実行されることができる。
従って、機械読み取り可能な媒体は、機械(例えばコンピュータ)により読み取り可能な媒体構造において情報を記憶または送信するための任意のメカニズムを含んでいてもよい。これらのメカニズムは、フロッピー(登録商標)ディスク、光ディスク、ハードディスクドライブ、ホログラフィックディスク、コンパクトディスク読み出し専用メモリ(CD−ROMs)、光磁気ディスク、読み出し専用メモリ(ROMs)、ランダムアクセスメモリ(RAM)、電気的消去可能なプログラマブル読み出し専用メモリ(EEPROM)、磁気または光カード、フラッシュメモリ、インターネットを利用した伝送、電気、光、音響信号または伝搬信号のその他の構成(例えば、搬送波、赤外線信号、ディジタル信号など)などを含むが、これらに限定されるものではない。
以下の議論から明らかであって具体的に記載されていない限り、「処理」、「コンピューティング」、「計算」、「決定」などの用語を用いた議論は、コンピュータシステムまたは類似のエレクトロニックコンピュータデバイスの動作及び処理に言及していて、これはコンピュータシステムメモリやレジスタ、その他の情報記憶装置、情報伝送装置またはディスプレイ装置などの内部において物理量として示されるデータを操作し変換すると理解される。
下記の実施形態の詳細な説明において、本発明が実施され得る具体的な実施形態を表す添付図面が参照される。図面では、いくつかの図を通して同様の番号は実質的に類似の構成要素を示す。実施形態は、当業者が本発明を実施できるように十分に詳細に記載される。その他の実施形態は活用され、構造的、論理的及び電気的な変更は本発明の範囲から逸脱することなくなされることができる。また、本発明の多様な実施形態は、たとえ異なっていても、必ずしも相互排他的ではないことを理解されたい。例えば、ある実施形態で記載された特定の特徴、構成または特性は、その他の実施形態においても含まれることができる。
図1は、本発明の実施形態のフローチャートを示す図である。
ステップS1において、マルチメディアアイテムを示す信号にフィルタバンクが適用される。
データベースにおけるインデックス付け及び画像検索を目的として画像のテクスチャを得るために、例えば垂直方向や水平方向などいくつかの方向における詳細な度数を表すステアード(steered)(または方向)フィルタがしばしば用いられる。ステアードフィルタの中でも、ガボールフィルタは、インデックス付けの効率がよいものとして知られている。
本願明細書に記載の好適な実施形態によると、フィルタバンクは、ガボール型のフィルタに基づく。エルミートフィルタ(Hermite filter)や一般的なガウスフィルタのようなその他のフィルタが用いられてもよい。ガボールフィルタは、次式によって定義される。

σ、σはガボールフィルタにおけるガウスカーネルのx及びy方向の標準偏差、Wxはx方向における周波数偏移、x及びyはピクセル座標を示す。この方程式のフーリエ変換は、次式である。

ここで、σ及びσは次式であって、Wはフィルタの中心周波数である。
ガボールフィルタの実部は、次式である。

ガボールフィルタバンクは、gmn(x,y)=a−mg(x’,y’)により生成される。ここで、a>1、m及びnは整数である。m及びnは、それぞれ具体的なスケール(scale)と具体的な方向を表す。ここで、x’=a−m(xcosθ+ysinθ)、y’=a−m(−xsinθ+ycosθ)、θは次式、Kは方向の総数であって、0≦n≦Kである。
スケールは、m(0≦m<S)によって表され、m=0は基本周波数帯域であって、Sはスケールの数である。スケールは、フィルタによって絞り込まれた詳細な度数を示す。画像に関して言うと、低いスケールは全体の画像レイアウトを捕らえ、細かいスケールは草や葉を捕らえることができる。
フィルタバンクの実部は、gRmn(x,y)=a−m(x’,y’)である。
本実施形態によると、S=4、K=6、U=0.4、U=0.05である。
は一番大きい中央周波数であり、Uは一番小さい中央周波数である。
aは、次式によって計算される。
ステップS1の間では、ガボールフィルタの実部からなるフィルタバンクが信号に適用される。それぞれのスケール及び方位に対して、S×K出力信号を得る。
ステップS2では、K方向の一つにおけるSスケールの一つに応じた信号の平均値を得るために、K×S低域通過フィルタが入力信号に適用される。
適用される低域通過フィルタは、次式である。
そして、適用される低域通過フィルタのバンクは、qmn(x,y)=a−mq(x’,y’)である。ここでa>1であって、m、nは整数である。
m及びnは、対応するガボールフィルタのm及びnに相当する。このことは、平均フィルタがガボールフィルタと同一の方向及び同一のスケールを有することを意味する。より簡素な改良型においては、スケールは一定であることができる。この場合、最も細かいスケール、すなわちm=S−1が選択されるべきである。
ステップS2の改良型では、ガボールフィルタの検出感度の方向に垂直な線にそって平均値を計算する一組の方位フィルタが用いられる。
ステップ3では、記述子が各信号に対して計算される。
記述子を計算するために、ガボールフィルタバンクで処理された信号と、低域通過フィルタによって計算された信号との差分が、マルチメディアアイテムの各ピクセルに対して計算される。S×K差分画像はこのようにして得られる。
ステップS4では、記述子を得るために、S.K差分信号のそれぞれにおけるパワーが求められる。
このため、いくつかのピクセルを含んだ二次の画像ブロックにおいて、パワーは信号値の二乗の平均によって推定される。この場合、記述子は全てのブロックのパワー値を含む。
他の実施例では、または組み合わせでは、他の統計学的モーメント、中心モーメントまたはアンセンタード(uncentred)モーメントを用いることができる。
ブロックのパワー値を計算するために、S×K差分画像は、16の二次の画像ブロックに分割される。各差分画像のLピクセルを有する各ブロックkでは、下記の方程式に従って、画像ピクセル値は二乗の総和をブロック当たりのピクセルの数によって分割される。

ここで、Dはピクセルの差分値であって、Pはブロックに対して得られたパワー値である。その結果得られた記述子{P/0≦k<16SK}は、16×S×Kの係数を有する。
他の実施形態によると、全画像に対するパワー値を推定し、または任意の形状の画像領域に対するパワー値を計算する。
図2は、本発明の好適な実施形態による装置を示す図である。この装置は、本発明による方法を優先的に実施する。
このため、好適な実施形態による装置は、ガボールフィルタ2、低域通過フィルタ3及び微分器4を含み、データベース1からマルチメディアデータを受け取る。
ガボールフィルタ2及び低域通過フィルタ3は、データベース1のマルチメディアデータを入力として受け取る。これらは、マルチメディアアイテムのそれぞれに対して、図1を参照して前述した一組のKS係数を計算する。微分器4は、ガボールフィルタによって計算された係数と、図1を参照して説明したように低域通過フィルタによって計算された係数との差を計算する。
図3に表されたクエリーのように、サンプル画像を用いたデータベース1内の画像検索に典型的に適用することができる。この場合、サンプル画像やデータベースの画像に対して係数が求められる。モジュール5は、入力としてサンプル画像の記述子とデータベース1の画像の記述子とを受け取り、サンプル画像に対して得られた記述子と、データベースの画像それぞれまたはデータベースの画像のサブセットの記述子との差を計算する。記述子は一組のSK係数からなり、各係数iの差Diはモジュール5によって計算される。その後、サンプル画像と所定の画像との間における次の差が計算される。
最小の差を有する多数のデータベースからの画像は、画像検索のモジュール6によってサンプル画像と比べて最も近い画像としてユーザに返送される。これは所定の閾値より小さい差を有する多数の画像であることができる。最先端の画像検索に応じて他の異なる式を用いることができる。
図4では、図3に記載されたモジュール4は、画像分類モジュール7に接続される。
画像分類7のようなモジュールが、画像の分類を構築する。画像は、記述子の値によって分類される。極めて近い記述子の値を有する画像が、同一のカテゴリに属するように分類される。分類は、所定のクラスタ数を用いたK平均などのクラスタリング手法によることができる。
本発明の実施形態のフローチャートを示す図である。 本発明の実施形態による装置を示す図である。 本発明の画像検索への適用を示す図である。 マルチメディア要素の分類についての本発明の実施形態を示す図である。

Claims (8)

  1. 画像の記述子を決定する装置であって、
    第1組の係数を得るために方向フィルタの第1バンクを前記画像に適応する手段(2)と、
    前記画像の平均値を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用する手段(3)と、
    第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分の関連パワー(power)を計算して(S4)記述子を得ることよって前記画像を示す記述子を計算する手段(4)と、
    を含み、
    前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連パワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、装置。
  2. データベース(1)内の画像を検索する装置であって、
    請求項に記載の記述子を決定する装置と、
    サンプル画像の記述子と前記データベース(1)の画像の記述子とを比較する手段(5)と、
    前記サンプル画像の記述子と前記データベースの記述子との差が所定の閾値より小さい前記データベース内の画像を検索する手段(6)と、
    を含むことを特徴とする装置。
  3. データベース(1)内の画像を分類する装置であって、
    請求項に記載の記述子を決定する装置と、
    前記記述子の分類のためのクラスタリング手段(7)と、
    を含むことを特徴とする装置。
  4. 請求項1〜3のいずれかに記載の装置により実行する、画像の記述子を決定する方法であって、前記手段(2)が、第1組の係数を得るために前記画像に方向フィルタの第1のバンクを適用するステップ(S1)を含み、
    前記手段(3)が、低域通過フィルタで処理された画像を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用し(S2)、
    前記手段(4)が、第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分に関連したパワー(power)を計算して(S4)記述子を得ることによって前記画像を示す記述子を計算し(S3)、
    前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連したパワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、ことを特徴とする方法。
  5. 前記方向フィルタはガボール(Gabor)型フィルタであることを特徴とする、請求項に記載の方法。
  6. 前記フィルタの第2バンクは、低域通過フィルタであることを特徴とする、請求項に記載の方法。
  7. 前記フィルタの第2のバンクは、前記ガボールフィルタの検出感度の方向に垂直な線にそって平均値を計算する方位フィルタであることを特徴とする、請求項に記載の方法。
  8. 前記第1組の係数および第2組の係数における係数は、前記フィルタの一方向と一スケールのそれぞれに対応することを特徴とする、請求項のいずれか1項に記載の方法。
JP2007146581A 2006-06-22 2007-06-01 マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 Expired - Fee Related JP4944672B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06300714A EP1870836A1 (en) 2006-06-22 2006-06-22 Method and device to determine a descriptor for a signal representing a multimedia item, device for retrieving items in a database, device for classification of multimedia items in a database
EP06300714.0 2006-06-22

Publications (2)

Publication Number Publication Date
JP2008052707A JP2008052707A (ja) 2008-03-06
JP4944672B2 true JP4944672B2 (ja) 2012-06-06

Family

ID=37398799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007146581A Expired - Fee Related JP4944672B2 (ja) 2006-06-22 2007-06-01 マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置

Country Status (5)

Country Link
US (1) US7730004B2 (ja)
EP (1) EP1870836A1 (ja)
JP (1) JP4944672B2 (ja)
CN (1) CN101093508B (ja)
DE (1) DE602007008325D1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2579189A1 (en) * 2011-10-06 2013-04-10 Thomson Licensing Method and apparatus for generating an explanation for a recommendation
CN104537604B (zh) * 2014-12-25 2018-05-15 中国科学院武汉物理与数学研究所 一种图像确定性加密双盲保密匹配方法
CN104574380B (zh) * 2014-12-25 2018-01-19 中国科学院武汉物理与数学研究所 一种图像随机加密双盲保密匹配方法
CN105100801B (zh) * 2015-07-24 2017-11-28 西安空间无线电技术研究所 一种基于大数据的大压缩比数据压缩方法
JP7327114B2 (ja) * 2019-11-26 2023-08-16 株式会社リコー 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835630A (en) * 1996-05-08 1998-11-10 Xerox Corporation Modular time-varying two-dimensional filter
JP2002536750A (ja) * 1999-02-05 2002-10-29 サムスン エレクトロニクス カンパニー リミテッド 映像テキスチャー抽出方法及びその装置
US20050216935A1 (en) * 2004-03-23 2005-09-29 Sony Corporation, A Japanese Corporation Filter criteria and results display apparatus and method
WO2006008350A1 (fr) * 2004-06-23 2006-01-26 France Telelcom Recherche automatique de similarite entre images incluant une intervention humaine
US20070220162A1 (en) * 2006-03-17 2007-09-20 Microsoft Corporation Media processing abstraction model

Also Published As

Publication number Publication date
JP2008052707A (ja) 2008-03-06
US20080086510A1 (en) 2008-04-10
EP1870836A1 (en) 2007-12-26
US7730004B2 (en) 2010-06-01
CN101093508B (zh) 2013-03-27
CN101093508A (zh) 2007-12-26
DE602007008325D1 (de) 2010-09-23

Similar Documents

Publication Publication Date Title
US11163818B2 (en) Media fingerprinting and identification system
JP5175854B2 (ja) 画像認識のための画像記述子
Wang et al. Simplicity: Semantics-sensitive integrated matching for picture libraries
US20090316993A1 (en) Image identification
US20160103900A1 (en) Data structuring and searching methods and apparatus
US20120263388A1 (en) Robust feature matching for visual search
US20020057343A1 (en) Image object ranking
JP2001067462A (ja) 周波数空間上における質感表現方法及び質感ベースの検索方法
US20120328197A1 (en) Identifying matching images
Shrivastava et al. An effective scheme for image texture classification based on binary local structure pattern
Abdullah et al. Fixed partitioning and salient points with MPEG-7 cluster correlograms for image categorization
JP4944672B2 (ja) マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置
Mondal et al. Video shot boundary detection using multiscale geometric analysis of nsct and least squares support vector machine
Seetharaman et al. Statistical framework for image retrieval based on multiresolution features and similarity method
Liu et al. Detection of JPEG double compression and identification of smartphone image source and post-capture manipulation
Acharyya et al. Extraction of features using M-band wavelet packet frame and their neuro-fuzzy evaluation for multitexture segmentation
Choudhary et al. An integrated approach for image retrieval based on content
Li et al. A local potential-based clustering algorithm for unsupervised hyperspectral band selection
EP1870837B1 (en) Method and device to determine a descriptor for a signal representing a multimedia item, device for retrieving items in a database, device for classification of multimedia items in a database
Vijayaraj et al. Overhead image statistics
Skulsujirapa et al. Development of digital image retrieval technique using autocorrelogram and wavelet based texture
Golom et al. Acoustic Scene Classification by Linear Projections for Dimensionality Reduction
An et al. Efficient Object-based Image Retrieval Method using Color Features from Salient Regions
Santanna et al. Content-based image retrieval towards the automatic characterization of soybean seed vigor
US8229156B1 (en) Using curve invariants to automatically characterize videos

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120302

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees