ITVI20120041A1 - Rilevazione di caratteristiche di un'immagine - Google Patents

Rilevazione di caratteristiche di un'immagine Download PDF

Info

Publication number
ITVI20120041A1
ITVI20120041A1 IT000041A ITVI20120041A ITVI20120041A1 IT VI20120041 A1 ITVI20120041 A1 IT VI20120041A1 IT 000041 A IT000041 A IT 000041A IT VI20120041 A ITVI20120041 A IT VI20120041A IT VI20120041 A1 ITVI20120041 A1 IT VI20120041A1
Authority
IT
Italy
Prior art keywords
key point
blocks
block
processing
image
Prior art date
Application number
IT000041A
Other languages
English (en)
Inventor
Arcangelo Ranieri Bruna
Danilo Pietro Pau
Original Assignee
St Microelectronics Srl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St Microelectronics Srl filed Critical St Microelectronics Srl
Priority to IT000041A priority Critical patent/ITVI20120041A1/it
Priority to US13/773,847 priority patent/US9158991B2/en
Publication of ITVI20120041A1 publication Critical patent/ITVI20120041A1/it

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Holo Graphy (AREA)
  • Photoreceptors In Electrophotography (AREA)
  • Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)

Description

DESCRIZIONE
DELL’INVENZIONE DAL TITOLO “Rivelazione di caratteristiche di un’immagineâ€
CAMPO TECNICO DELL’INVENZIONE
La presente invenzione riguarda il campo della rivelazione di dettagli caratteristici in un’immagine e, in particolare, la rivelazione di dettagli caratteristici d’immagini basata sulla localizzazione di punti chiave e sui descrittori di punti chiave.
STATO DELL’ARTE NOTA
La rivelazione di dettagli caratteristici di immagini à ̈ un compito importante in una vasta gamma di applicazioni per la visione computerizzata. Per esempio, la rivelazione di dettagli à ̈ una fase essenziale nel confronto di immagini e nel riconoscimento di oggetti. Dettagli caratteristici di immagini comprendono tipicamente bordi, spigoli, angoli, linee e chiazze puntiformi.
Attualmente, la rivelazione di dettagli caratteristici à ̈ generalmente basata sull’algoritmo SIFT (Scale Invariant Feature Transform); si veda, per esempio, “Distinctive image features from scale invariant keypoints†, di David C. Lowe, in International Journal of Computer Vision, 60, 2 (2004), pagine 91- 110. Il descrittore di dettagli caratteristici di Lowe à ̈ particolarmente vantaggioso in quanto à ̈ invariante per riscalamento e rotazione dell' immagine come pure per cambiamenti di illuminazione. L’algoritmo SIFT comprende quattro fasi di calcolo (per dettagli confrontare l’articolo citato di Lowe). La prima fase à ̈ una rivelazione di estremi nello spazio delle scale che impiega la funzione differenza di gaussiane (DoG). Lo spazio delle scale à ̈ definito dalla funzione L(x, y, σ) = G(x, y, σ) ® I(x, y) dove ® à ̈ l’operatore di convoluzione, G(x, y, σ) à ̈ una gaussiana di scala variabile e I(x, y) à ̈ l’immagine di input in considerazione.
La fase successiva à ̈ una localizzazione di punti chiave stabili ottenuta mediante il calcolo della differenza tra due immagini, una con scala k volte l’altra: D(x, y, σ) = L(x, y, kσ) - L(x, y, σ) e una rivelazione dei massimi e minimi locali di D(x, y, σ). La terza fase à ̈ l’attribuzione di una orientazione al sito di ciascun punto chiave sulla base delle direzioni locali dei gradienti dell’immagine. Attraverso l’attribuzione di una orientazione sistematica a ciascun punto chiave sulla base delle proprietà locali dell’immagine, un descrittore di punto chiave ottenuto nella quarta fase si può rappresentare relativamente alla propria orientazione. I descrittori di punto chiave generalmente impiegano un insieme di 16 istogrammi ottenuti dalle orientazioni dei gradienti dei punti di campionamento, allineati in una griglia 4x4, ciascuno con 8 intervalli di orientazione, un intervallo per ciascuna direzione corrispondente ai principali punti cardinali ed uno per ciascuno dei punti intermedi fra queste direzioni.
Tuttavia, le implementazioni attuali dell’algoritmo SIFT richiedono processori di alta potenza e vasta disponibilità di memoria. D’altra parte à ̈ altamente auspicabile la rivelazione di dettagli caratteristici in tempo reale in sistemi integrati, per esempio in dispositivi mobili di cattura di immagini quali fotocamere digitali. Così, nonostante i recenti progressi in campo ingegneristico, à ̈ ancora sentita la necessità di un metodo migliorato per la rivelazione di dettagli caratteristici, che permetta l’implementazione in dispositivi mobili di cattura di immagini con risorse computazionali limitate.
DESCRIZIONE DELL’INVENZIONE
La presente invenzione si rivolge ai bisogni suindicati e, di conseguenza, fornisce un metodo per la rivelazione di dettagli caratteristici di un’immagine comprendente
estrazione di una striscia da un’immagine digitale, comprendendo la striscia una pluralità di blocchi; elaborazione della pluralità di blocchi al fine di localizzare uno o più punti chiave; e
rivelazione di uno o più dettagli caratteristici dell’immagine sulla base dell’unico o dei molteplici punti chiave localizzati.
L’immagine può essere per esempio una foto digitale, oppure un’immagine acquisita da un sensore di immagini prima di qualunque compressione come MJPEG o H264. La striscia comprende un sottoinsieme di pixel dell’immagine digitale. La striscia può essere un estratto dell’immagine digitale orientato orizzontalmente oppure verticalmente. La striscia può consistere di un numero di blocchi disposti soltanto orizzontalmente oppure di un numero di blocchi disposti soltanto verticalmente. Ogni blocco comprende un sottoinsieme di pixel della striscia. Dimensioni tipiche di un blocco sono, per esempio, dell’ordine di 16x16, 32x32, 64x64 fino a 128x128 pixel, ma I blocchi possono essere rettangolari invece che quadrati, come per esempio 32x64. Secondo l’invenzione, data una striscia estratta dall’intera immagine in considerazione, l’elaborazione per la rivelazione di dettagli caratteristici à ̈ eseguita in base ai blocchi. Perciò, tanto i requisiti di memoria, quanto i ritardi di elaborazione come pure i tempi di elaborazione possono essere ridotti rispetto all’arte nota.
Secondo una forma di realizzazione, la fase dell’elaborazione della pluralità di blocchi comprende una trasformata dei dati dei blocchi verso il dominio della frequenza. Questo passo corrisponde alla trasformazione verso un’immagine in toni di grigio acquisita da un sistema a catena di elaborazione di immagini che legge il pattern di Bayern grezzo e lo converte in RGB per pixel, tuttavia tale passo può anche essere l’output di un post processore come un decoder video capace di eseguire un processo di riduzione del rumore e miglioramento della qualità dell'immagine. La distribuzione in frequenza del blocco trasformato (dati) costituisce una prima indicazione, per via della distribuzione di frequenze spaziali, riguardo la presenza o assenza di uno o più punti chiave nel blocco. Per esempio, se soltanto una componente continua à ̈ disponibile, ciò significa che non ci sono punti chiave disponibili, mentre una maggiore ricchezza di distribuzione di componenti in frequenza segnalerà la potenziale presenza di punti chiave. Prima di determinare se il blocco sia un possibile candidato per un punto chiave incluso nel blocco, i dati del blocco trasformati nel dominio della frequenza possono essere soggetti ad un filtraggio passa basso al fine di selezionare, per esempio, frequenze spaziali per una ulteriore elaborazione.
Secondo una forma di realizzazione del metodo inventivo l’elaborazione della pluralità di blocchi comprende ulteriormente un certo numero di filtraggi e sottocampionamenti dei dati del blocco trasformati verso il dominio della frequenza, al fine di generare un certo numero di ottave. Ciascuna ottava (compresa la prima ottenuta senza alcun sotto-campionamento dei blocchi della striscia estratta) comprende un numero di blocchi trasformati verso il dominio della frequenza. Ciascuna ottava viene elaborata per la localizzazione di punti chiave.
Prima della localizzazione di punti chiave vera e propria in un blocco che sia stato individuato come candidato a contenere un punto chiave, il metodo per la rivelazione di dettagli caratteristici può comprendere una trasformata in frequenza inversa dei dati dei blocchi dal dominio della frequenza al dominio spaziale. Successivamente, runico o la molteplicità di punti chiave vengono localizzati nel dominio spaziale sulla base dei dati dei blocchi inversamente trasformati.
In alternativa, runico o i molteplici punti chiave possono essere localizzati nel dominio della frequenza sulla base dei dati dei blocchi filtrati nel dominio della frequenza prima della trasformata inversa dei dati dei blocchi. In entrambi i casi, la localizzazione di punti chiave à ̈ basata sull’elaborazione nel dominio della frequenza invece di un’elaborazione nel dominio dei pixel, come la differenza di gaussiane impiegata nell’arte nota.
Tuttavia, come precedentemente accennato, il metodo può comprendere il passo di stabilire se un blocco comprende potenzialmente un punto chiave sulla base della distribuzione in frequenza dei dati dei blocchi cui si à ̈ applicato un filtraggio passa basso e in cui soltanto un blocco in cui si à ̈ stabilita la presenza potenziale di un punto chiave viene elaborato per la localizzazione dei punti chiave.
A seconda delle risorse computazionali, à ̈ inoltre previsto che un sotto-campionamento di un blocco della striscia al fine di generare ottave venga eseguito in parallelo all’elaborazione del blocco per la localizzazione di punti chiave nella prima ottava (o in un’ottava superiore) al fine di risparmiare tempo complessivo di calcolo sfruttando l’intrinseco parallelismo dell’algoritmo. Per la stessa ragione, l’elaborazione per la rivelazione di dettagli caratteristici si può eseguire in parallelo per un certo numero di filtri passa-banda forniti per un’ottava.
Dopo la localizzazione di un punto chiave, le forme di realizzazione descritte precedentemente del metodo per la rivelazione di dettagli caratteristici qui fornito possono inoltre comprendere l’estrazione di una patch di NxM punti di campionamento attorno al punto chiave localizzato e l’elaborazione della patch per la rivelazione di dettagli caratteristici. L’elaborazione della patch per la rivelazione di dettagli caratteristici può, in particolare, comprendere il passo di generare un istogramma di gradienti di punti di campionamento, assegnare un’orientazione a ciascun punto chiave localizzato sulla base dell’istogramma e generare un descrittore di punto chiave per ciascun punto chiave localizzato sulla base dell’orientazione assegnata.
In alternativa l’elaborazione della patch intorno al punto di interesse per la rivelazione di dettagli caratteristici può, in particolare, comprendere il passo di generare un vettore di componenti in frequenza in un blocco di dati intorno al punto di interesse senza richiedere alcuna ulteriore trasformata inversa. Tale vettore può inoltre essere soggetto ad un processo di sogliatura, quantizzazione e codificazione entropica. Per esempio si può applicare un processo di sogliatura a zero: la norma del vettore può essere elaborata così da diventare uguale a 1 , cosicché ciascun componente del vettore prenormalizzazione venga diviso dal modulo dello stesso. Tramite questa operazione ciascun elemento del descrittore SIFT prende un valore compreso tra 0 e 1. Ciascun valore inferiore ad una soglia à ̈ posto uguale a 0. Secondo la quantizzazione, si stabilisce una corrispondenza tra ciascun valore ed un valore intero rappresentato per esempio da 6 o 4 bit.
Secondo l’Adaptive Arithmetic Coding (AAC) il vettore quantizzato di valori interi viene compattato con un algoritmo di codifica aritmetica adattativa. In alternativa all’AAC, si può impiegare la codificazione di Huffman, oppure una combinazione delle due. Inoltre si può impiegare la Type Coding, o qualunque alternativa della AAC, codificazione di Huffman e Type Coding.
L’elaborazione descritta precedentemente può venire ripetuta per un numero di strisce tali da costituire l’immagine.
La presente invenzione inoltre fornisce un programma per computer che comprende uno o più mezzi leggibili da un computer aventi istruzioni eseguibili da parte di un computer al fine di eseguire i passi del metodo secondo una delle rivendicazioni precedenti.
Inoltre, si fornisce un mezzo di cattura di immagini o un mezzo di elaborazione di immagini comprendente un chipset in cui i passi del metodo secondo uno degli esempi descritti precedentemente vengano implementati.
Ulteriori vantaggi e caratteristiche della presente invenzione verranno descritte nel seguito con riferimento alle figure. Nella descrizione, si fa riferimento alle figure allegate che sono da intendersi come illustrazione delle forme di realizzazione dell’invenzione. Resta inteso che tali forme di realizzazione non rappresentano l’intero ambito dell’invenzione.
Le figure 1 e 2 mostrano un esempio del metodo inventivo per la rivelazione di dettagli caratteristici di immagine comprendente una localizzazione di punti chiave basata su blocchi nel dominio trasformato.
La figura 3 mostra un esempio del metodo inventivo per la rivelazione di dettagli caratteristici di immagini comprendente una localizzazione di punti chiave basata su blocchi nel dominio spaziale o della frequenza con risorse inferiori.
Un esempio del metodo inventivo per la rivelazione di dettagli caratteristici in un’immagine à ̈ mostrato in figura 1. Secondo l’esempio mostrato, un’immagine proveniente da un sensore d’immagine di un dispositivo di cattura di immagini viene ricevuta come input. L’immagine, per esempio, può essere una foto digitale oppure un fotogramma di un video digitale. Una striscia orizzontale viene estratta dall’immagine. La striscia ha un numero decisamente inferiore di pixel rispetto all’intera immagine. La striscia può essere immagazzinata in un registro buffer oppure in una memoria. La striscia à ̈ costituita da blocchi della stessa dimensione o di dimensione variabile. Un blocco viene letto dal registro buffer e una trasformata viene applicata così da fornire i dati del blocco nel dominio della frequenza, la trasformata può per esempio essere una Discrete Cosine Transform o una Fast Fourier Transform o qualunque altra trasformata matematica. Il blocco trasformato viene poi immagazzinato in un buffer/memoria (come parte di una prima ottava).
Come passo successivo, un filtro basato sui blocchi opera sul blocco trasformato. Il filtro basato sui blocchi può essere implementato in forma di moltiplicazione matriciale ed ha come risultato l’eliminazione delle frequenze spaziali più alte. Dopo il filtraggio basato sui blocchi, si stabilisce se il blocco comprende potenzialmente uno o più punti chiave.
Questa identificazione si esegue sulla base della distribuzione in frequenza all’interno del blocco trasformato e filtrato. Se si identifica nel blocco la possibile presenza di un punto chiave, il blocco si sottopone ad un filtraggio di scala, per esempio implementato in forma di moltiplicazione matriciale e, in seguito, ad una trasformata inversa in modo da ottenere i dati nel dominio spaziale. Il filtraggio di scala nel dominio della frequenza à ̈ uguale al filtraggio passa basso in termini di moltiplicazione matriciale, tuttavia i numeri delle matrici usati sono diversi. Così, in questa implementazione, non à ̈ più necessario generare alcuna DoG.
Il blocco così trasformato inversamente viene poi analizzato per una localizzazione dettagliata di punti chiave che fa uso della traccia del determinante della matrice hessiana. L’impiego della matrice hessiana à ̈ ben noto nello stato dell’arte (si veda, per esempio, “Distinctive Image Features from Scale-Invariant Keypoints†, di David G. Lowe, in International Journal of Computer Vision, 60, 2 (2004), pagine 91- 1 10). Uno o più punti chiave sono chiaramente localizzati e una patch di NxM pixel (punti di campionamento) viene rispettivamente estratta intorno a ciascun punto chiave localizzato per l’elaborazione SIFT convenzionale eseguita successivamente, vale a dire creazione di un istogramma di orientazioni dalle orientazioni dei gradienti dei punti di campionamento intorno ai punti chiave rivelati, attribuzione di una orientazione e produzione di descrittori di punto chiave SIFT attraverso il campionamento dei moduli e delle orientazioni dei gradienti nelle vicinanze dei punti chiave localizzati.
Tuttavia il blocco può non essere trasformato inversamente, così da costruire un vettore di componenti in frequenza e da eseguire la sogliatura, quantizzazione e codificazione entropica senza bisogno di alcuna ulteriore trasformata inversa.
L’elaborazione descritta precedentemente si può eseguire in parallelo per un una pluralità di filtri passa banda della stessa ottava. Inoltre, altre ottave da 2 a N sono calcolate attraverso un sotto-campionamento del blocco trasformato della prima ottava. Il filtro di sotto-campionamento può essere implementato da una moltiplicazione matriciale nel dominio della frequenza. Il calcolo delle altre ottave da 2 a N si può eseguire in parallelo all’elaborazione dei blocchi trasformati della prima ottava descritta precedentemente. Sia per l’omogeneizzazione delle immagini che per il sottocampionamento si possono impiegare filtri con risposta finita all’impulso con N tap.
Un’altra forma di realizzazione dell’invenzione à ̈ mostrata in figura 2. In modo simile all’esempio descritto con riferimento alla figura 1 , una striscia orizzontale viene estratta da una immagine ricevuta in input e un blocco dell’immagine viene trasformato verso il dominio della frequenza. Un filtraggio passa basso à ̈ eseguito per il blocco trasformato della prima ottava. Tuttavia, a differenza della forma di realizzazione mostrata in figura 2, in questo esempio la localizzazione di punti chiave à ̈ eseguita nel dominio della frequenza prima di trasformare inversamente il blocco verso il dominio spaziale per mezzo di una trasformata inversa. In questo esempio, un registro buffer deve immagazzinare soltanto una striscia mentre nell’esempio mostrato in figura 1 un registro buffer deve immagazzinare tutte le strisce.
In una terza forma di realizzazione mostrata in figura 3, l’intera elaborazione à ̈ eseguita in un singolo dominio, vale a dire o nel dominio spaziale, se la trasformata non à ̈ eseguita, oppure nel dominio trasformato (cioà ̈ dominio di Fourier oppure BCT). Il vantaggio, in questo caso, sta nel fatto che la trasformata inversa non à ̈ necessaria, il che permette di risparmiare una notevole quantità di tempo e risorse. Come precedentemente detto, sogliatura, quantizzazione e codificazione entropica vengono eseguite per la rivelazione di dettagli caratteristici.
Tutte le forme di realizzazione discusse precedentemente non si devono intendere come limitazioni ma servono da esempi indicanti caratteristiche e vantaggi dell’invenzione. Si deve intendere che alcune o tutte le caratteristiche precedentemente descritte si possono combinare in modi diversi.

Claims (15)

  1. Rivendicazioni 1. Metodo per la rivelazione di dettagli di immagini comprendente i seguenti passi: estrazione di una striscia da un'immagine digitale, comprendendo la striscia una pluralità di blocchi; elaborazione della pluralità di blocchi al fine di localizzare uno o più punti chiave; rivelazione di uno o più dettagli caratteristici dell'immagine sulla base dell'unico punto chiave o dei molteplici punti chiave localizzati.
  2. 2. Metodo secondo la rivendicazione 1 in cui l'elaborazione della pluralità di blocchi comprende una trasformata dei dati dei blocchi verso il dominio della frequenza.
  3. 3. Metodo secondo la rivendicazione 2 comprendente inoltre un filtraggio passa-basso dei dati dei blocchi trasformati verso il dominio della frequenza.
  4. 4. Metodo secondo una delle rivendicazioni 2 e 3 in cui l'elaborazione della pluralità di blocchi comprende inoltre un sotto-campionamento dei dati dei blocchi trasformati verso il dominio della frequenza effettuato un certo numero di volte così da generare un certo numero di ottave.
  5. 5. Metodo secondo una delle rivendicazioni da 2 a 4 comprendente inoltre una trasformata inversa dei dati dei blocchi dal dominio della frequenza al dominio spaziale.
  6. 6. Metodo secondo la rivendicazione 5 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati nel dominio della frequenza prima della trasformata inversa dei dati dei blocchi.
  7. 7. Metodo secondo la rivendicazione 5 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati nel dominio spaziale sulla base dei dati dei blocchi a cui à ̈ stata applicata la trasformata inversa.
  8. 8. Metodo secondo una delle rivendicazioni 6 e 7 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati per mezzo di una matrice hessiana.
  9. 9. Metodo secondo una delle rivendicazioni da 2 a 7 comprendente inoltre il passo di stabilire se un blocco comprende potenzialmente un punto chiave sulla base della distribuzione in frequenza dei dati dei blocchi cui si à ̈ applicato un filtraggio passa basso e in cui soltanto un blocco in cui si à ̈ stabilita la presenza potenziale di un punto chiave viene elaborato per la localizzazione dei punti chiave.
  10. 10. Metodo secondo una delle rivendicazioni in cui il sottocampionamento di un blocco della striscia viene eseguito in parallelo all'elaborazione del blocco per la localizzazione dei punti chiave.
  11. 11. Metodo secondo una delle rivendicazioni, comprendente inoltre l'estrazione di una patch di NxM punti di campionamento attorno a un punto chiave localizzato e l'elaborazione della patch per la rivelazione di dettagli caratteristici.
  12. 12. Metodo secondo la rivendicazione 10 in cui l'elaborazione per la rivelazione di dettagli caratteristici à ̈ eseguita in parallelo per un numero di filtri passa basso forniti per un'ottava.
  13. 13. Metodo secondo una delle rivendicazioni 11 e 12 comprendente inoltre i passi di: generare un istogramma dei gradienti dei punti di campionamento, attribuire una orientazione a ciascun punto chiave localizzato sulla base deiristogramma e generare un descrittore di punto chiave per ciascun punto chiave localizzato sulla base dell'orientazione attribuita.
  14. 14. Programma per computer comprendente uno o più mezzi leggibili da un computer aventi istruzioni eseguibili da parte di un computer al fine di eseguire i passi del metodo secondo una delle rivendicazioni precedenti.
  15. 15. Mezzo per la cattura di immagini o mezzo per l'elaborazione di immagini comprendenti un chispet in cui sono implementati i passi del metodo secondo una delle rivendicazioni da 1 a 13.
IT000041A 2012-02-22 2012-02-22 Rilevazione di caratteristiche di un'immagine ITVI20120041A1 (it)

Priority Applications (2)

Application Number Priority Date Filing Date Title
IT000041A ITVI20120041A1 (it) 2012-02-22 2012-02-22 Rilevazione di caratteristiche di un'immagine
US13/773,847 US9158991B2 (en) 2012-02-22 2013-02-22 Image-feature detection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000041A ITVI20120041A1 (it) 2012-02-22 2012-02-22 Rilevazione di caratteristiche di un'immagine

Publications (1)

Publication Number Publication Date
ITVI20120041A1 true ITVI20120041A1 (it) 2013-08-23

Family

ID=46022593

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000041A ITVI20120041A1 (it) 2012-02-22 2012-02-22 Rilevazione di caratteristiche di un'immagine

Country Status (2)

Country Link
US (1) US9158991B2 (it)
IT (1) ITVI20120041A1 (it)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654093B (zh) * 2015-11-25 2018-09-25 小米科技有限责任公司 特征提取方法及装置
FR3046691B1 (fr) * 2016-01-13 2019-03-29 Commissariat A L'energie Atomique Et Aux Energies Alternatives Dispositif de selection et description de points d'interets dans une sequence d'images, par exemple pour l'appariement de points d'interets
US9992467B2 (en) * 2016-06-30 2018-06-05 Apple Inc. Parallel computer vision and image scaling architecture
CN111815578B (zh) * 2020-06-23 2024-05-28 浙江大华技术股份有限公司 图像条纹检测方法、视频监控系统及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1850270A1 (en) * 2006-04-28 2007-10-31 Toyota Motor Europe NV Robust interest point detector and descriptor
US20100169576A1 (en) * 2008-12-31 2010-07-01 Yurong Chen System and method for sift implementation and optimization

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6463163B1 (en) * 1999-01-11 2002-10-08 Hewlett-Packard Company System and method for face detection using candidate image region selection
GB9919805D0 (en) * 1999-08-21 1999-10-27 Univ Manchester Video cording
GB2431717A (en) * 2005-10-31 2007-05-02 Sony Uk Ltd Scene analysis
JP4988408B2 (ja) * 2007-04-09 2012-08-01 株式会社デンソー 画像認識装置
JP4882925B2 (ja) * 2007-08-31 2012-02-22 セイコーエプソン株式会社 画像データ処理装置および画像データ処理方法
US8144947B2 (en) * 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8391615B2 (en) * 2008-12-02 2013-03-05 Intel Corporation Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device
KR20110111106A (ko) * 2010-04-02 2011-10-10 삼성테크윈 주식회사 객체추적 및 로이터링 장치 및 방법
US8488881B2 (en) * 2010-07-27 2013-07-16 International Business Machines Corporation Object segmentation at a self-checkout
JP6000954B2 (ja) * 2010-09-20 2016-10-05 クゥアルコム・インコーポレイテッドQualcomm Incorporated クラウド支援型拡張現実のための適応可能なフレームワーク
BR112013019031B1 (pt) * 2011-01-25 2021-03-09 Telecom Italia S.P.A. método e aparelho para comparar uma primeira imagem com uma segunda imagem, e, sistema para comparar imagens.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1850270A1 (en) * 2006-04-28 2007-10-31 Toyota Motor Europe NV Robust interest point detector and descriptor
US20100169576A1 (en) * 2008-12-31 2010-07-01 Yurong Chen System and method for sift implementation and optimization

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAVID G LOWE: "Distinctive Image Features from Scale-Invariant Keypoints", INTERNATIONAL JOURNAL OF COMPUTER VISION, KLUWER ACADEMIC PUBLISHERS, BO, vol. 60, no. 2, 1 November 2004 (2004-11-01), pages 91 - 110, XP019216426, ISSN: 1573-1405, DOI: 10.1023/B:VISI.0000029664.99615.94 *
HERBERT BAY ET AL: "SURF: Speeded Up Robust Features", 1 January 2006, COMPUTER VISION - ECCV 2006 : 9TH EUROPEAN CONFERENCE ON COMPUTER VISION, GRAZ, AUSTRIA, MAY 7 - 13, 2006; PROCEEDINGS; [LECTURE NOTES IN COMPUTER SCIENCE], SPRINGER, BERLIN, DE, PAGE(S) 404 - 417, ISBN: 978-3-540-33832-1, XP019036408 *
LIENHART R ED - ROSENFELD A ET AL: "VIDEO OCR: A SURVEY AND PRACTITIONER'S GUIDE", 1 January 2003, VIDEO MINING; [KLUWER INTERNATIONAL SERIES IN VIDEO VIDEO COUMPUTING], NORWELL, MA : KLUWER ACADEMIC PUBL, US, PAGE(S) 155 - 184, ISBN: 978-1-4020-7549-0, XP009046500 *

Also Published As

Publication number Publication date
US20130216097A1 (en) 2013-08-22
US9158991B2 (en) 2015-10-13

Similar Documents

Publication Publication Date Title
US8406462B2 (en) Signature derivation for images
CN109146855B (zh) 一种图像摩尔纹检测方法、终端设备及存储介质
Barannik et al. Detections of sustainable areas for steganographic embedding
Ravi et al. Compression noise based video forgery detection
US9131227B2 (en) Computing device with video analyzing function and video analyzing method
Zeng et al. Fast source camera identification using content adaptive guided image filter
US20150086067A1 (en) Methods for scene based video watermarking and devices thereof
US20130301930A1 (en) Hardware coprocessor for stripe-based interest point detection
ITVI20120041A1 (it) Rilevazione di caratteristiche di un'immagine
CN103559697A (zh) 基于fft的碎纸片纵切拼接复原算法
Kumar et al. Near lossless image compression using parallel fractal texture identification
KR102018046B1 (ko) 이미지 특징 추출 장치 및 방법
Al-Hammadi et al. Curvelet transform and local texture based image forgery detection
Georgieva et al. Wavelet transform on multi-GPU for real-time pavement distress detection
JP7255841B2 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
Jassim Semi-optimal edge detector based on simple standard deviation with adjusted thresholding
CN110177278B (zh) 一种帧间预测方法、视频编码方法及装置
Natu et al. Improved robust digital image watermarking with SVD and hybrid transform
Kunhu et al. A reversible watermarking scheme for ownership protection and authentication of medical images
Savakar et al. Copy-move image forgery detection using shannon entropy
Mohebbian et al. Increase the efficiency of DCT method for detection of copy-move forgery in complex and smooth images
TWI511545B (zh) 數位視訊的區塊雜訊偵測
CN113674130A (zh) 图像处理方法及装置、存储介质、终端
Deny et al. Survey of texture analysis using histogram in image processing
Molina-Garcia et al. Parallel image and video self-recovery scheme with high recovery capability