ITVI20120041A1 - Rilevazione di caratteristiche di un'immagine - Google Patents
Rilevazione di caratteristiche di un'immagine Download PDFInfo
- Publication number
- ITVI20120041A1 ITVI20120041A1 IT000041A ITVI20120041A ITVI20120041A1 IT VI20120041 A1 ITVI20120041 A1 IT VI20120041A1 IT 000041 A IT000041 A IT 000041A IT VI20120041 A ITVI20120041 A IT VI20120041A IT VI20120041 A1 ITVI20120041 A1 IT VI20120041A1
- Authority
- IT
- Italy
- Prior art keywords
- key point
- blocks
- block
- processing
- image
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims description 14
- 238000000034 method Methods 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000004807 localization Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000282320 Panthera leo Species 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Holo Graphy (AREA)
- Photoreceptors In Electrophotography (AREA)
- Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)
Description
DESCRIZIONE
DELL’INVENZIONE DAL TITOLO “Rivelazione di caratteristiche di un’immagineâ€
CAMPO TECNICO DELL’INVENZIONE
La presente invenzione riguarda il campo della rivelazione di dettagli caratteristici in un’immagine e, in particolare, la rivelazione di dettagli caratteristici d’immagini basata sulla localizzazione di punti chiave e sui descrittori di punti chiave.
STATO DELL’ARTE NOTA
La rivelazione di dettagli caratteristici di immagini à ̈ un compito importante in una vasta gamma di applicazioni per la visione computerizzata. Per esempio, la rivelazione di dettagli à ̈ una fase essenziale nel confronto di immagini e nel riconoscimento di oggetti. Dettagli caratteristici di immagini comprendono tipicamente bordi, spigoli, angoli, linee e chiazze puntiformi.
Attualmente, la rivelazione di dettagli caratteristici à ̈ generalmente basata sull’algoritmo SIFT (Scale Invariant Feature Transform); si veda, per esempio, “Distinctive image features from scale invariant keypoints†, di David C. Lowe, in International Journal of Computer Vision, 60, 2 (2004), pagine 91- 110. Il descrittore di dettagli caratteristici di Lowe à ̈ particolarmente vantaggioso in quanto à ̈ invariante per riscalamento e rotazione dell' immagine come pure per cambiamenti di illuminazione. L’algoritmo SIFT comprende quattro fasi di calcolo (per dettagli confrontare l’articolo citato di Lowe). La prima fase à ̈ una rivelazione di estremi nello spazio delle scale che impiega la funzione differenza di gaussiane (DoG). Lo spazio delle scale à ̈ definito dalla funzione L(x, y, σ) = G(x, y, σ) ® I(x, y) dove ® à ̈ l’operatore di convoluzione, G(x, y, σ) à ̈ una gaussiana di scala variabile e I(x, y) à ̈ l’immagine di input in considerazione.
La fase successiva à ̈ una localizzazione di punti chiave stabili ottenuta mediante il calcolo della differenza tra due immagini, una con scala k volte l’altra: D(x, y, σ) = L(x, y, kσ) - L(x, y, σ) e una rivelazione dei massimi e minimi locali di D(x, y, σ). La terza fase à ̈ l’attribuzione di una orientazione al sito di ciascun punto chiave sulla base delle direzioni locali dei gradienti dell’immagine. Attraverso l’attribuzione di una orientazione sistematica a ciascun punto chiave sulla base delle proprietà locali dell’immagine, un descrittore di punto chiave ottenuto nella quarta fase si può rappresentare relativamente alla propria orientazione. I descrittori di punto chiave generalmente impiegano un insieme di 16 istogrammi ottenuti dalle orientazioni dei gradienti dei punti di campionamento, allineati in una griglia 4x4, ciascuno con 8 intervalli di orientazione, un intervallo per ciascuna direzione corrispondente ai principali punti cardinali ed uno per ciascuno dei punti intermedi fra queste direzioni.
Tuttavia, le implementazioni attuali dell’algoritmo SIFT richiedono processori di alta potenza e vasta disponibilità di memoria. D’altra parte à ̈ altamente auspicabile la rivelazione di dettagli caratteristici in tempo reale in sistemi integrati, per esempio in dispositivi mobili di cattura di immagini quali fotocamere digitali. Così, nonostante i recenti progressi in campo ingegneristico, à ̈ ancora sentita la necessità di un metodo migliorato per la rivelazione di dettagli caratteristici, che permetta l’implementazione in dispositivi mobili di cattura di immagini con risorse computazionali limitate.
DESCRIZIONE DELL’INVENZIONE
La presente invenzione si rivolge ai bisogni suindicati e, di conseguenza, fornisce un metodo per la rivelazione di dettagli caratteristici di un’immagine comprendente
estrazione di una striscia da un’immagine digitale, comprendendo la striscia una pluralità di blocchi; elaborazione della pluralità di blocchi al fine di localizzare uno o più punti chiave; e
rivelazione di uno o più dettagli caratteristici dell’immagine sulla base dell’unico o dei molteplici punti chiave localizzati.
L’immagine può essere per esempio una foto digitale, oppure un’immagine acquisita da un sensore di immagini prima di qualunque compressione come MJPEG o H264. La striscia comprende un sottoinsieme di pixel dell’immagine digitale. La striscia può essere un estratto dell’immagine digitale orientato orizzontalmente oppure verticalmente. La striscia può consistere di un numero di blocchi disposti soltanto orizzontalmente oppure di un numero di blocchi disposti soltanto verticalmente. Ogni blocco comprende un sottoinsieme di pixel della striscia. Dimensioni tipiche di un blocco sono, per esempio, dell’ordine di 16x16, 32x32, 64x64 fino a 128x128 pixel, ma I blocchi possono essere rettangolari invece che quadrati, come per esempio 32x64. Secondo l’invenzione, data una striscia estratta dall’intera immagine in considerazione, l’elaborazione per la rivelazione di dettagli caratteristici à ̈ eseguita in base ai blocchi. Perciò, tanto i requisiti di memoria, quanto i ritardi di elaborazione come pure i tempi di elaborazione possono essere ridotti rispetto all’arte nota.
Secondo una forma di realizzazione, la fase dell’elaborazione della pluralità di blocchi comprende una trasformata dei dati dei blocchi verso il dominio della frequenza. Questo passo corrisponde alla trasformazione verso un’immagine in toni di grigio acquisita da un sistema a catena di elaborazione di immagini che legge il pattern di Bayern grezzo e lo converte in RGB per pixel, tuttavia tale passo può anche essere l’output di un post processore come un decoder video capace di eseguire un processo di riduzione del rumore e miglioramento della qualità dell'immagine. La distribuzione in frequenza del blocco trasformato (dati) costituisce una prima indicazione, per via della distribuzione di frequenze spaziali, riguardo la presenza o assenza di uno o più punti chiave nel blocco. Per esempio, se soltanto una componente continua à ̈ disponibile, ciò significa che non ci sono punti chiave disponibili, mentre una maggiore ricchezza di distribuzione di componenti in frequenza segnalerà la potenziale presenza di punti chiave. Prima di determinare se il blocco sia un possibile candidato per un punto chiave incluso nel blocco, i dati del blocco trasformati nel dominio della frequenza possono essere soggetti ad un filtraggio passa basso al fine di selezionare, per esempio, frequenze spaziali per una ulteriore elaborazione.
Secondo una forma di realizzazione del metodo inventivo l’elaborazione della pluralità di blocchi comprende ulteriormente un certo numero di filtraggi e sottocampionamenti dei dati del blocco trasformati verso il dominio della frequenza, al fine di generare un certo numero di ottave. Ciascuna ottava (compresa la prima ottenuta senza alcun sotto-campionamento dei blocchi della striscia estratta) comprende un numero di blocchi trasformati verso il dominio della frequenza. Ciascuna ottava viene elaborata per la localizzazione di punti chiave.
Prima della localizzazione di punti chiave vera e propria in un blocco che sia stato individuato come candidato a contenere un punto chiave, il metodo per la rivelazione di dettagli caratteristici può comprendere una trasformata in frequenza inversa dei dati dei blocchi dal dominio della frequenza al dominio spaziale. Successivamente, runico o la molteplicità di punti chiave vengono localizzati nel dominio spaziale sulla base dei dati dei blocchi inversamente trasformati.
In alternativa, runico o i molteplici punti chiave possono essere localizzati nel dominio della frequenza sulla base dei dati dei blocchi filtrati nel dominio della frequenza prima della trasformata inversa dei dati dei blocchi. In entrambi i casi, la localizzazione di punti chiave à ̈ basata sull’elaborazione nel dominio della frequenza invece di un’elaborazione nel dominio dei pixel, come la differenza di gaussiane impiegata nell’arte nota.
Tuttavia, come precedentemente accennato, il metodo può comprendere il passo di stabilire se un blocco comprende potenzialmente un punto chiave sulla base della distribuzione in frequenza dei dati dei blocchi cui si à ̈ applicato un filtraggio passa basso e in cui soltanto un blocco in cui si à ̈ stabilita la presenza potenziale di un punto chiave viene elaborato per la localizzazione dei punti chiave.
A seconda delle risorse computazionali, à ̈ inoltre previsto che un sotto-campionamento di un blocco della striscia al fine di generare ottave venga eseguito in parallelo all’elaborazione del blocco per la localizzazione di punti chiave nella prima ottava (o in un’ottava superiore) al fine di risparmiare tempo complessivo di calcolo sfruttando l’intrinseco parallelismo dell’algoritmo. Per la stessa ragione, l’elaborazione per la rivelazione di dettagli caratteristici si può eseguire in parallelo per un certo numero di filtri passa-banda forniti per un’ottava.
Dopo la localizzazione di un punto chiave, le forme di realizzazione descritte precedentemente del metodo per la rivelazione di dettagli caratteristici qui fornito possono inoltre comprendere l’estrazione di una patch di NxM punti di campionamento attorno al punto chiave localizzato e l’elaborazione della patch per la rivelazione di dettagli caratteristici. L’elaborazione della patch per la rivelazione di dettagli caratteristici può, in particolare, comprendere il passo di generare un istogramma di gradienti di punti di campionamento, assegnare un’orientazione a ciascun punto chiave localizzato sulla base dell’istogramma e generare un descrittore di punto chiave per ciascun punto chiave localizzato sulla base dell’orientazione assegnata.
In alternativa l’elaborazione della patch intorno al punto di interesse per la rivelazione di dettagli caratteristici può, in particolare, comprendere il passo di generare un vettore di componenti in frequenza in un blocco di dati intorno al punto di interesse senza richiedere alcuna ulteriore trasformata inversa. Tale vettore può inoltre essere soggetto ad un processo di sogliatura, quantizzazione e codificazione entropica. Per esempio si può applicare un processo di sogliatura a zero: la norma del vettore può essere elaborata così da diventare uguale a 1 , cosicché ciascun componente del vettore prenormalizzazione venga diviso dal modulo dello stesso. Tramite questa operazione ciascun elemento del descrittore SIFT prende un valore compreso tra 0 e 1. Ciascun valore inferiore ad una soglia à ̈ posto uguale a 0. Secondo la quantizzazione, si stabilisce una corrispondenza tra ciascun valore ed un valore intero rappresentato per esempio da 6 o 4 bit.
Secondo l’Adaptive Arithmetic Coding (AAC) il vettore quantizzato di valori interi viene compattato con un algoritmo di codifica aritmetica adattativa. In alternativa all’AAC, si può impiegare la codificazione di Huffman, oppure una combinazione delle due. Inoltre si può impiegare la Type Coding, o qualunque alternativa della AAC, codificazione di Huffman e Type Coding.
L’elaborazione descritta precedentemente può venire ripetuta per un numero di strisce tali da costituire l’immagine.
La presente invenzione inoltre fornisce un programma per computer che comprende uno o più mezzi leggibili da un computer aventi istruzioni eseguibili da parte di un computer al fine di eseguire i passi del metodo secondo una delle rivendicazioni precedenti.
Inoltre, si fornisce un mezzo di cattura di immagini o un mezzo di elaborazione di immagini comprendente un chipset in cui i passi del metodo secondo uno degli esempi descritti precedentemente vengano implementati.
Ulteriori vantaggi e caratteristiche della presente invenzione verranno descritte nel seguito con riferimento alle figure. Nella descrizione, si fa riferimento alle figure allegate che sono da intendersi come illustrazione delle forme di realizzazione dell’invenzione. Resta inteso che tali forme di realizzazione non rappresentano l’intero ambito dell’invenzione.
Le figure 1 e 2 mostrano un esempio del metodo inventivo per la rivelazione di dettagli caratteristici di immagine comprendente una localizzazione di punti chiave basata su blocchi nel dominio trasformato.
La figura 3 mostra un esempio del metodo inventivo per la rivelazione di dettagli caratteristici di immagini comprendente una localizzazione di punti chiave basata su blocchi nel dominio spaziale o della frequenza con risorse inferiori.
Un esempio del metodo inventivo per la rivelazione di dettagli caratteristici in un’immagine à ̈ mostrato in figura 1. Secondo l’esempio mostrato, un’immagine proveniente da un sensore d’immagine di un dispositivo di cattura di immagini viene ricevuta come input. L’immagine, per esempio, può essere una foto digitale oppure un fotogramma di un video digitale. Una striscia orizzontale viene estratta dall’immagine. La striscia ha un numero decisamente inferiore di pixel rispetto all’intera immagine. La striscia può essere immagazzinata in un registro buffer oppure in una memoria. La striscia à ̈ costituita da blocchi della stessa dimensione o di dimensione variabile. Un blocco viene letto dal registro buffer e una trasformata viene applicata così da fornire i dati del blocco nel dominio della frequenza, la trasformata può per esempio essere una Discrete Cosine Transform o una Fast Fourier Transform o qualunque altra trasformata matematica. Il blocco trasformato viene poi immagazzinato in un buffer/memoria (come parte di una prima ottava).
Come passo successivo, un filtro basato sui blocchi opera sul blocco trasformato. Il filtro basato sui blocchi può essere implementato in forma di moltiplicazione matriciale ed ha come risultato l’eliminazione delle frequenze spaziali più alte. Dopo il filtraggio basato sui blocchi, si stabilisce se il blocco comprende potenzialmente uno o più punti chiave.
Questa identificazione si esegue sulla base della distribuzione in frequenza all’interno del blocco trasformato e filtrato. Se si identifica nel blocco la possibile presenza di un punto chiave, il blocco si sottopone ad un filtraggio di scala, per esempio implementato in forma di moltiplicazione matriciale e, in seguito, ad una trasformata inversa in modo da ottenere i dati nel dominio spaziale. Il filtraggio di scala nel dominio della frequenza à ̈ uguale al filtraggio passa basso in termini di moltiplicazione matriciale, tuttavia i numeri delle matrici usati sono diversi. Così, in questa implementazione, non à ̈ più necessario generare alcuna DoG.
Il blocco così trasformato inversamente viene poi analizzato per una localizzazione dettagliata di punti chiave che fa uso della traccia del determinante della matrice hessiana. L’impiego della matrice hessiana à ̈ ben noto nello stato dell’arte (si veda, per esempio, “Distinctive Image Features from Scale-Invariant Keypoints†, di David G. Lowe, in International Journal of Computer Vision, 60, 2 (2004), pagine 91- 1 10). Uno o più punti chiave sono chiaramente localizzati e una patch di NxM pixel (punti di campionamento) viene rispettivamente estratta intorno a ciascun punto chiave localizzato per l’elaborazione SIFT convenzionale eseguita successivamente, vale a dire creazione di un istogramma di orientazioni dalle orientazioni dei gradienti dei punti di campionamento intorno ai punti chiave rivelati, attribuzione di una orientazione e produzione di descrittori di punto chiave SIFT attraverso il campionamento dei moduli e delle orientazioni dei gradienti nelle vicinanze dei punti chiave localizzati.
Tuttavia il blocco può non essere trasformato inversamente, così da costruire un vettore di componenti in frequenza e da eseguire la sogliatura, quantizzazione e codificazione entropica senza bisogno di alcuna ulteriore trasformata inversa.
L’elaborazione descritta precedentemente si può eseguire in parallelo per un una pluralità di filtri passa banda della stessa ottava. Inoltre, altre ottave da 2 a N sono calcolate attraverso un sotto-campionamento del blocco trasformato della prima ottava. Il filtro di sotto-campionamento può essere implementato da una moltiplicazione matriciale nel dominio della frequenza. Il calcolo delle altre ottave da 2 a N si può eseguire in parallelo all’elaborazione dei blocchi trasformati della prima ottava descritta precedentemente. Sia per l’omogeneizzazione delle immagini che per il sottocampionamento si possono impiegare filtri con risposta finita all’impulso con N tap.
Un’altra forma di realizzazione dell’invenzione à ̈ mostrata in figura 2. In modo simile all’esempio descritto con riferimento alla figura 1 , una striscia orizzontale viene estratta da una immagine ricevuta in input e un blocco dell’immagine viene trasformato verso il dominio della frequenza. Un filtraggio passa basso à ̈ eseguito per il blocco trasformato della prima ottava. Tuttavia, a differenza della forma di realizzazione mostrata in figura 2, in questo esempio la localizzazione di punti chiave à ̈ eseguita nel dominio della frequenza prima di trasformare inversamente il blocco verso il dominio spaziale per mezzo di una trasformata inversa. In questo esempio, un registro buffer deve immagazzinare soltanto una striscia mentre nell’esempio mostrato in figura 1 un registro buffer deve immagazzinare tutte le strisce.
In una terza forma di realizzazione mostrata in figura 3, l’intera elaborazione à ̈ eseguita in un singolo dominio, vale a dire o nel dominio spaziale, se la trasformata non à ̈ eseguita, oppure nel dominio trasformato (cioà ̈ dominio di Fourier oppure BCT). Il vantaggio, in questo caso, sta nel fatto che la trasformata inversa non à ̈ necessaria, il che permette di risparmiare una notevole quantità di tempo e risorse. Come precedentemente detto, sogliatura, quantizzazione e codificazione entropica vengono eseguite per la rivelazione di dettagli caratteristici.
Tutte le forme di realizzazione discusse precedentemente non si devono intendere come limitazioni ma servono da esempi indicanti caratteristiche e vantaggi dell’invenzione. Si deve intendere che alcune o tutte le caratteristiche precedentemente descritte si possono combinare in modi diversi.
Claims (15)
- Rivendicazioni 1. Metodo per la rivelazione di dettagli di immagini comprendente i seguenti passi: estrazione di una striscia da un'immagine digitale, comprendendo la striscia una pluralità di blocchi; elaborazione della pluralità di blocchi al fine di localizzare uno o più punti chiave; rivelazione di uno o più dettagli caratteristici dell'immagine sulla base dell'unico punto chiave o dei molteplici punti chiave localizzati.
- 2. Metodo secondo la rivendicazione 1 in cui l'elaborazione della pluralità di blocchi comprende una trasformata dei dati dei blocchi verso il dominio della frequenza.
- 3. Metodo secondo la rivendicazione 2 comprendente inoltre un filtraggio passa-basso dei dati dei blocchi trasformati verso il dominio della frequenza.
- 4. Metodo secondo una delle rivendicazioni 2 e 3 in cui l'elaborazione della pluralità di blocchi comprende inoltre un sotto-campionamento dei dati dei blocchi trasformati verso il dominio della frequenza effettuato un certo numero di volte così da generare un certo numero di ottave.
- 5. Metodo secondo una delle rivendicazioni da 2 a 4 comprendente inoltre una trasformata inversa dei dati dei blocchi dal dominio della frequenza al dominio spaziale.
- 6. Metodo secondo la rivendicazione 5 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati nel dominio della frequenza prima della trasformata inversa dei dati dei blocchi.
- 7. Metodo secondo la rivendicazione 5 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati nel dominio spaziale sulla base dei dati dei blocchi a cui à ̈ stata applicata la trasformata inversa.
- 8. Metodo secondo una delle rivendicazioni 6 e 7 in cui l'unico punto chiave o i molteplici punti chiave vengono localizzati per mezzo di una matrice hessiana.
- 9. Metodo secondo una delle rivendicazioni da 2 a 7 comprendente inoltre il passo di stabilire se un blocco comprende potenzialmente un punto chiave sulla base della distribuzione in frequenza dei dati dei blocchi cui si à ̈ applicato un filtraggio passa basso e in cui soltanto un blocco in cui si à ̈ stabilita la presenza potenziale di un punto chiave viene elaborato per la localizzazione dei punti chiave.
- 10. Metodo secondo una delle rivendicazioni in cui il sottocampionamento di un blocco della striscia viene eseguito in parallelo all'elaborazione del blocco per la localizzazione dei punti chiave.
- 11. Metodo secondo una delle rivendicazioni, comprendente inoltre l'estrazione di una patch di NxM punti di campionamento attorno a un punto chiave localizzato e l'elaborazione della patch per la rivelazione di dettagli caratteristici.
- 12. Metodo secondo la rivendicazione 10 in cui l'elaborazione per la rivelazione di dettagli caratteristici à ̈ eseguita in parallelo per un numero di filtri passa basso forniti per un'ottava.
- 13. Metodo secondo una delle rivendicazioni 11 e 12 comprendente inoltre i passi di: generare un istogramma dei gradienti dei punti di campionamento, attribuire una orientazione a ciascun punto chiave localizzato sulla base deiristogramma e generare un descrittore di punto chiave per ciascun punto chiave localizzato sulla base dell'orientazione attribuita.
- 14. Programma per computer comprendente uno o più mezzi leggibili da un computer aventi istruzioni eseguibili da parte di un computer al fine di eseguire i passi del metodo secondo una delle rivendicazioni precedenti.
- 15. Mezzo per la cattura di immagini o mezzo per l'elaborazione di immagini comprendenti un chispet in cui sono implementati i passi del metodo secondo una delle rivendicazioni da 1 a 13.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000041A ITVI20120041A1 (it) | 2012-02-22 | 2012-02-22 | Rilevazione di caratteristiche di un'immagine |
US13/773,847 US9158991B2 (en) | 2012-02-22 | 2013-02-22 | Image-feature detection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT000041A ITVI20120041A1 (it) | 2012-02-22 | 2012-02-22 | Rilevazione di caratteristiche di un'immagine |
Publications (1)
Publication Number | Publication Date |
---|---|
ITVI20120041A1 true ITVI20120041A1 (it) | 2013-08-23 |
Family
ID=46022593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
IT000041A ITVI20120041A1 (it) | 2012-02-22 | 2012-02-22 | Rilevazione di caratteristiche di un'immagine |
Country Status (2)
Country | Link |
---|---|
US (1) | US9158991B2 (it) |
IT (1) | ITVI20120041A1 (it) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654093B (zh) * | 2015-11-25 | 2018-09-25 | 小米科技有限责任公司 | 特征提取方法及装置 |
FR3046691B1 (fr) * | 2016-01-13 | 2019-03-29 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Dispositif de selection et description de points d'interets dans une sequence d'images, par exemple pour l'appariement de points d'interets |
US9992467B2 (en) * | 2016-06-30 | 2018-06-05 | Apple Inc. | Parallel computer vision and image scaling architecture |
CN111815578B (zh) * | 2020-06-23 | 2024-05-28 | 浙江大华技术股份有限公司 | 图像条纹检测方法、视频监控系统及相关装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1850270A1 (en) * | 2006-04-28 | 2007-10-31 | Toyota Motor Europe NV | Robust interest point detector and descriptor |
US20100169576A1 (en) * | 2008-12-31 | 2010-07-01 | Yurong Chen | System and method for sift implementation and optimization |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6463163B1 (en) * | 1999-01-11 | 2002-10-08 | Hewlett-Packard Company | System and method for face detection using candidate image region selection |
GB9919805D0 (en) * | 1999-08-21 | 1999-10-27 | Univ Manchester | Video cording |
GB2431717A (en) * | 2005-10-31 | 2007-05-02 | Sony Uk Ltd | Scene analysis |
JP4988408B2 (ja) * | 2007-04-09 | 2012-08-01 | 株式会社デンソー | 画像認識装置 |
JP4882925B2 (ja) * | 2007-08-31 | 2012-02-22 | セイコーエプソン株式会社 | 画像データ処理装置および画像データ処理方法 |
US8144947B2 (en) * | 2008-06-27 | 2012-03-27 | Palo Alto Research Center Incorporated | System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints |
US8391615B2 (en) * | 2008-12-02 | 2013-03-05 | Intel Corporation | Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device |
KR20110111106A (ko) * | 2010-04-02 | 2011-10-10 | 삼성테크윈 주식회사 | 객체추적 및 로이터링 장치 및 방법 |
US8488881B2 (en) * | 2010-07-27 | 2013-07-16 | International Business Machines Corporation | Object segmentation at a self-checkout |
JP6000954B2 (ja) * | 2010-09-20 | 2016-10-05 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | クラウド支援型拡張現実のための適応可能なフレームワーク |
BR112013019031B1 (pt) * | 2011-01-25 | 2021-03-09 | Telecom Italia S.P.A. | método e aparelho para comparar uma primeira imagem com uma segunda imagem, e, sistema para comparar imagens. |
-
2012
- 2012-02-22 IT IT000041A patent/ITVI20120041A1/it unknown
-
2013
- 2013-02-22 US US13/773,847 patent/US9158991B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1850270A1 (en) * | 2006-04-28 | 2007-10-31 | Toyota Motor Europe NV | Robust interest point detector and descriptor |
US20100169576A1 (en) * | 2008-12-31 | 2010-07-01 | Yurong Chen | System and method for sift implementation and optimization |
Non-Patent Citations (3)
Title |
---|
DAVID G LOWE: "Distinctive Image Features from Scale-Invariant Keypoints", INTERNATIONAL JOURNAL OF COMPUTER VISION, KLUWER ACADEMIC PUBLISHERS, BO, vol. 60, no. 2, 1 November 2004 (2004-11-01), pages 91 - 110, XP019216426, ISSN: 1573-1405, DOI: 10.1023/B:VISI.0000029664.99615.94 * |
HERBERT BAY ET AL: "SURF: Speeded Up Robust Features", 1 January 2006, COMPUTER VISION - ECCV 2006 : 9TH EUROPEAN CONFERENCE ON COMPUTER VISION, GRAZ, AUSTRIA, MAY 7 - 13, 2006; PROCEEDINGS; [LECTURE NOTES IN COMPUTER SCIENCE], SPRINGER, BERLIN, DE, PAGE(S) 404 - 417, ISBN: 978-3-540-33832-1, XP019036408 * |
LIENHART R ED - ROSENFELD A ET AL: "VIDEO OCR: A SURVEY AND PRACTITIONER'S GUIDE", 1 January 2003, VIDEO MINING; [KLUWER INTERNATIONAL SERIES IN VIDEO VIDEO COUMPUTING], NORWELL, MA : KLUWER ACADEMIC PUBL, US, PAGE(S) 155 - 184, ISBN: 978-1-4020-7549-0, XP009046500 * |
Also Published As
Publication number | Publication date |
---|---|
US20130216097A1 (en) | 2013-08-22 |
US9158991B2 (en) | 2015-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8406462B2 (en) | Signature derivation for images | |
CN109146855B (zh) | 一种图像摩尔纹检测方法、终端设备及存储介质 | |
Barannik et al. | Detections of sustainable areas for steganographic embedding | |
Ravi et al. | Compression noise based video forgery detection | |
US9131227B2 (en) | Computing device with video analyzing function and video analyzing method | |
Zeng et al. | Fast source camera identification using content adaptive guided image filter | |
US20150086067A1 (en) | Methods for scene based video watermarking and devices thereof | |
US20130301930A1 (en) | Hardware coprocessor for stripe-based interest point detection | |
ITVI20120041A1 (it) | Rilevazione di caratteristiche di un'immagine | |
CN103559697A (zh) | 基于fft的碎纸片纵切拼接复原算法 | |
Kumar et al. | Near lossless image compression using parallel fractal texture identification | |
KR102018046B1 (ko) | 이미지 특징 추출 장치 및 방법 | |
Al-Hammadi et al. | Curvelet transform and local texture based image forgery detection | |
Georgieva et al. | Wavelet transform on multi-GPU for real-time pavement distress detection | |
JP7255841B2 (ja) | 情報処理装置、情報処理システム、制御方法、及びプログラム | |
Jassim | Semi-optimal edge detector based on simple standard deviation with adjusted thresholding | |
CN110177278B (zh) | 一种帧间预测方法、视频编码方法及装置 | |
Natu et al. | Improved robust digital image watermarking with SVD and hybrid transform | |
Kunhu et al. | A reversible watermarking scheme for ownership protection and authentication of medical images | |
Savakar et al. | Copy-move image forgery detection using shannon entropy | |
Mohebbian et al. | Increase the efficiency of DCT method for detection of copy-move forgery in complex and smooth images | |
TWI511545B (zh) | 數位視訊的區塊雜訊偵測 | |
CN113674130A (zh) | 图像处理方法及装置、存储介质、终端 | |
Deny et al. | Survey of texture analysis using histogram in image processing | |
Molina-Garcia et al. | Parallel image and video self-recovery scheme with high recovery capability |