JP4944672B2 - マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 - Google Patents
マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 Download PDFInfo
- Publication number
- JP4944672B2 JP4944672B2 JP2007146581A JP2007146581A JP4944672B2 JP 4944672 B2 JP4944672 B2 JP 4944672B2 JP 2007146581 A JP2007146581 A JP 2007146581A JP 2007146581 A JP2007146581 A JP 2007146581A JP 4944672 B2 JP4944672 B2 JP 4944672B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- descriptor
- coefficients
- filter
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/431—Frequency domain transformation; Autocorrelation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
1.フィルタの数を増やす。
2.フィルタの配置及び種類を最適化する。
3.各フィルタの精度を高める。
前記画像の平均値を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用する手段(3)と、
第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分の関連パワー(power)を計算して(S4)記述子を得ることよって前記画像を示す記述子を計算する手段(4)と、
を含む。
前記の記述子を決定する装置と、
サンプル画像の記述子と前記データベース(1)の画像の記述子とを比較する手段(5)と、
前記サンプル画像の記述子と前記データベースの記述子との差が所定の閾値より小さい前記データベース内の画像を検索する手段(6)と、
を含むことを特徴とする装置を提供する。
前記記述子を決定する装置と、
前記記述子の分類のためのクラスタリング手段(7)と、
を含むことを特徴とする装置を提供する。
前記手段(3)が、低域通過フィルタで処理された画像を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用し(S2)、
前記手段(4)が、第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分に関連したパワー(power)を計算して(S4)記述子を得ることによって前記画像を示す記述子を計算し(S3)、
前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連したパワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、ことを特徴とする。
σx、σyはガボールフィルタにおけるガウスカーネルのx及びy方向の標準偏差、Wxはx方向における周波数偏移、x及びyはピクセル座標を示す。この方程式のフーリエ変換は、次式である。
ここで、σu及びσvは次式であって、Wはフィルタの中心周波数である。
ガボールフィルタバンクは、gmn(x,y)=a−mg(x’,y’)により生成される。ここで、a>1、m及びnは整数である。m及びnは、それぞれ具体的なスケール(scale)と具体的な方向を表す。ここで、x’=a−m(xcosθ+ysinθ)、y’=a−m(−xsinθ+ycosθ)、θは次式、Kは方向の総数であって、0≦n≦Kである。
ここで、Dはピクセルの差分値であって、Pはブロックに対して得られたパワー値である。その結果得られた記述子{Pk/0≦k<16SK}は、16×S×Kの係数を有する。
Claims (8)
- 画像の記述子を決定する装置であって、
第1組の係数を得るために方向フィルタの第1バンクを前記画像に適応する手段(2)と、
前記画像の平均値を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用する手段(3)と、
第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分の関連パワー(power)を計算して(S4)記述子を得ることよって前記画像を示す記述子を計算する手段(4)と、
を含み、
前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連パワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、装置。 - データベース(1)内の画像を検索する装置であって、
請求項1に記載の記述子を決定する装置と、
サンプル画像の記述子と前記データベース(1)の画像の記述子とを比較する手段(5)と、
前記サンプル画像の記述子と前記データベースの記述子との差が所定の閾値より小さい前記データベース内の画像を検索する手段(6)と、
を含むことを特徴とする装置。 - データベース(1)内の画像を分類する装置であって、
請求項1に記載の記述子を決定する装置と、
前記記述子の分類のためのクラスタリング手段(7)と、
を含むことを特徴とする装置。 - 請求項1〜3のいずれかに記載の装置により実行する、画像の記述子を決定する方法であって、前記手段(2)が、第1組の係数を得るために前記画像に方向フィルタの第1のバンクを適用するステップ(S1)を含み、
前記手段(3)が、低域通過フィルタで処理された画像を示す第2組の係数を得るために、フィルタの第2バンクを前記画像に適用し(S2)、
前記手段(4)が、第1に、前記第1組の係数に対応する画像と前記第2組の係数に対応する画像との差分画像を取得し、第2に、前記差分に関連したパワー(power)を計算して(S4)記述子を得ることによって前記画像を示す記述子を計算し(S3)、
前記画素値の二乗平均によって、前記差分画像の二次の画像ブロックにおいて前記関連したパワーが算出され、前記記述子は一組の値であって、それぞれの値はそれぞれの差分画像における一の画像ブロックに対応している、ことを特徴とする方法。 - 前記方向フィルタはガボール(Gabor)型フィルタであることを特徴とする、請求項4に記載の方法。
- 前記フィルタの第2バンクは、低域通過フィルタであることを特徴とする、請求項4に記載の方法。
- 前記フィルタの第2のバンクは、前記ガボールフィルタの検出感度の方向に垂直な線にそって平均値を計算する方位フィルタであることを特徴とする、請求項5に記載の方法。
- 前記第1組の係数および第2組の係数における係数は、前記フィルタの一方向と一スケールのそれぞれに対応することを特徴とする、請求項4〜7のいずれか1項に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06300714A EP1870836A1 (en) | 2006-06-22 | 2006-06-22 | Method and device to determine a descriptor for a signal representing a multimedia item, device for retrieving items in a database, device for classification of multimedia items in a database |
EP06300714.0 | 2006-06-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008052707A JP2008052707A (ja) | 2008-03-06 |
JP4944672B2 true JP4944672B2 (ja) | 2012-06-06 |
Family
ID=37398799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007146581A Expired - Fee Related JP4944672B2 (ja) | 2006-06-22 | 2007-06-01 | マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7730004B2 (ja) |
EP (1) | EP1870836A1 (ja) |
JP (1) | JP4944672B2 (ja) |
CN (1) | CN101093508B (ja) |
DE (1) | DE602007008325D1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2579189A1 (en) * | 2011-10-06 | 2013-04-10 | Thomson Licensing | Method and apparatus for generating an explanation for a recommendation |
CN104537604B (zh) * | 2014-12-25 | 2018-05-15 | 中国科学院武汉物理与数学研究所 | 一种图像确定性加密双盲保密匹配方法 |
CN104574380B (zh) * | 2014-12-25 | 2018-01-19 | 中国科学院武汉物理与数学研究所 | 一种图像随机加密双盲保密匹配方法 |
CN105100801B (zh) * | 2015-07-24 | 2017-11-28 | 西安空间无线电技术研究所 | 一种基于大数据的大压缩比数据压缩方法 |
JP7327114B2 (ja) * | 2019-11-26 | 2023-08-16 | 株式会社リコー | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5835630A (en) * | 1996-05-08 | 1998-11-10 | Xerox Corporation | Modular time-varying two-dimensional filter |
JP2002536750A (ja) * | 1999-02-05 | 2002-10-29 | サムスン エレクトロニクス カンパニー リミテッド | 映像テキスチャー抽出方法及びその装置 |
US20050216935A1 (en) * | 2004-03-23 | 2005-09-29 | Sony Corporation, A Japanese Corporation | Filter criteria and results display apparatus and method |
WO2006008350A1 (fr) * | 2004-06-23 | 2006-01-26 | France Telelcom | Recherche automatique de similarite entre images incluant une intervention humaine |
US20070220162A1 (en) * | 2006-03-17 | 2007-09-20 | Microsoft Corporation | Media processing abstraction model |
-
2006
- 2006-06-22 EP EP06300714A patent/EP1870836A1/en not_active Withdrawn
-
2007
- 2007-06-01 JP JP2007146581A patent/JP4944672B2/ja not_active Expired - Fee Related
- 2007-06-14 DE DE602007008325T patent/DE602007008325D1/de active Active
- 2007-06-22 US US11/821,436 patent/US7730004B2/en not_active Expired - Fee Related
- 2007-06-22 CN CN2007101120566A patent/CN101093508B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008052707A (ja) | 2008-03-06 |
US20080086510A1 (en) | 2008-04-10 |
EP1870836A1 (en) | 2007-12-26 |
US7730004B2 (en) | 2010-06-01 |
CN101093508B (zh) | 2013-03-27 |
CN101093508A (zh) | 2007-12-26 |
DE602007008325D1 (de) | 2010-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11163818B2 (en) | Media fingerprinting and identification system | |
JP5175854B2 (ja) | 画像認識のための画像記述子 | |
Wang et al. | Simplicity: Semantics-sensitive integrated matching for picture libraries | |
US20090316993A1 (en) | Image identification | |
US20160103900A1 (en) | Data structuring and searching methods and apparatus | |
US20120263388A1 (en) | Robust feature matching for visual search | |
US20020057343A1 (en) | Image object ranking | |
JP2001067462A (ja) | 周波数空間上における質感表現方法及び質感ベースの検索方法 | |
US20120328197A1 (en) | Identifying matching images | |
Shrivastava et al. | An effective scheme for image texture classification based on binary local structure pattern | |
Abdullah et al. | Fixed partitioning and salient points with MPEG-7 cluster correlograms for image categorization | |
JP4944672B2 (ja) | マルチメディアアイテム(multimediaitem)を示す信号の記述子を決定する方法及び装置、データベース内のアイテムを検索する装置、並びにデータベース内のマルチメディアアイテムを分類する装置 | |
Mondal et al. | Video shot boundary detection using multiscale geometric analysis of nsct and least squares support vector machine | |
Seetharaman et al. | Statistical framework for image retrieval based on multiresolution features and similarity method | |
Liu et al. | Detection of JPEG double compression and identification of smartphone image source and post-capture manipulation | |
Acharyya et al. | Extraction of features using M-band wavelet packet frame and their neuro-fuzzy evaluation for multitexture segmentation | |
Choudhary et al. | An integrated approach for image retrieval based on content | |
Li et al. | A local potential-based clustering algorithm for unsupervised hyperspectral band selection | |
EP1870837B1 (en) | Method and device to determine a descriptor for a signal representing a multimedia item, device for retrieving items in a database, device for classification of multimedia items in a database | |
Vijayaraj et al. | Overhead image statistics | |
Skulsujirapa et al. | Development of digital image retrieval technique using autocorrelogram and wavelet based texture | |
Golom et al. | Acoustic Scene Classification by Linear Projections for Dimensionality Reduction | |
An et al. | Efficient Object-based Image Retrieval Method using Color Features from Salient Regions | |
Santanna et al. | Content-based image retrieval towards the automatic characterization of soybean seed vigor | |
US8229156B1 (en) | Using curve invariants to automatically characterize videos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120302 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |