ITTO20120602A1 - Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus. - Google Patents

Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus. Download PDF

Info

Publication number
ITTO20120602A1
ITTO20120602A1 IT000602A ITTO20120602A ITTO20120602A1 IT TO20120602 A1 ITTO20120602 A1 IT TO20120602A1 IT 000602 A IT000602 A IT 000602A IT TO20120602 A ITTO20120602 A IT TO20120602A IT TO20120602 A1 ITTO20120602 A1 IT TO20120602A1
Authority
IT
Italy
Prior art keywords
histogram
gradient
elements
transformed
bins
Prior art date
Application number
IT000602A
Other languages
English (en)
Inventor
Miroslaw Bober
Stavros Paschalakis
Original Assignee
Sisvel Technology Srl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sisvel Technology Srl filed Critical Sisvel Technology Srl
Priority to IT000602A priority Critical patent/ITTO20120602A1/it
Priority to KR1020157003489A priority patent/KR102193177B1/ko
Priority to RU2015104066A priority patent/RU2661795C2/ru
Priority to JP2015520897A priority patent/JP6292454B2/ja
Priority to CN201380036654.3A priority patent/CN104428793B/zh
Priority to US14/410,768 priority patent/US9454710B2/en
Priority to ES13732573T priority patent/ES2811532T3/es
Priority to BR112014031268A priority patent/BR112014031268A2/pt
Priority to PCT/EP2013/063874 priority patent/WO2014009198A1/en
Priority to EP13732573.4A priority patent/EP2870568B1/en
Priority to CN201810356712.5A priority patent/CN108520265B/zh
Priority to EP20171298.1A priority patent/EP3702965B1/en
Priority to TW102123706A priority patent/TWI532012B/zh
Priority to ARP130102388 priority patent/AR091674A1/es
Publication of ITTO20120602A1 publication Critical patent/ITTO20120602A1/it
Priority to US15/260,764 priority patent/US10713523B2/en
Priority to JP2017154781A priority patent/JP6429134B2/ja
Priority to JP2018196276A priority patent/JP6714669B2/ja
Priority to HK19101104.0A priority patent/HK1259139A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Image Processing (AREA)

Description

“METODO PER TRASFORMARE UN DESCRITTORE DI IMMAGINE BASATO SU UN ISTOGRAMMA DI GRADIENTI E RELATIVO APPARATO DI ELABORAZIONE DI IMMAGINIâ€
DESCRIZIONE
La presente invenzione riguarda il calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti.
Più in particolare, la presente invenzione riguarda descrittori di immagine calcolati in regioni locali intorno a punti di interesse dell’immagine mediante il calcolo di istogrammi di gradienti di sottoregioni entro dette regioni locali.
I descrittori di immagine sono largamente utilizzati in molte applicazioni di visualizzazione su computer, tra cui il riconoscimento di oggetti, il reperimento di immagini in base al contenuto e la registrazione di immagini, per citarne solo alcune. Uno degli esempi più noti di questa classe di descrittori di immagine à ̈ il descrittore Scale Invariant Feature Transform (SIFT).
In breve, con il metodo SIFT si formano descrittori di immagine locali come segue: viene dapprima effettuata una ricerca tra una molteplicità di scale e posizioni dell’immagine per identificare e localizzare punti chiave stabili dell’immagine invarianti rispetto a scala e orientamento; quindi, per ogni punto chiave, si determinano uno o più orientamenti dominanti sulla base di gradienti di immagine locali, consentendo in tal modo il successivo calcolo del descrittore locale rispetto all’orientamento, alla scala e alla posizione assegnate a ciascun punto chiave, ottenendo così invarianza a queste trasformazioni.
Si formano quindi come segue descrittori di immagine locali intorno ai punti chiave: innanzitutto si calcolano l’ampiezza del gradiente e informazioni di orientamento in punti campione dell’immagine in una regione intorno al punto chiave; tali campioni vengono poi accumulati in istogrammi di orientamento che riepilogano il contenuto su nxn sottoregioni.
A puro titolo illustrativo, le Figure 1a e 1b mostrano un esempio di un descrittore di punto chiave, in cui la Figura 1a mostra una suddivisione della regione locale R in 4x4 sottoregioni SR, e la Figura 1b mostra una suddivisione del range di 360<o>degli orientamenti in otto bin h per ogni istogramma di orientamento h, in cui la lunghezza di ciascuna freccia corrisponde all’ampiezza di quel specifico dato di istogramma.
Quindi, un descrittore di immagine locale come quello illustrato in Figura 1a avrà 4x4x8 = 128 elementi. Il metodo SIFT à ̈ descritto in modo più dettagliato in David G. Lowe, "Distinctive image features from scale-invariant keypoints", International Journal of Computer Vision, 60, 2 (2004), pp. 91-110.
Esistono alcune alternative e varianti del metodo SIFT, le quali impiegano diversi meccanismi per il rilevamento di punti chiave di immagine stabili, diversi approcci alla suddivisione della regione locale intorno ai punti chiave e diversi approcci al calcolo degli istogrammi di gradienti delle sottoregioni.
Ad esempio, le Figure 2a e 2b mostrano rispettivamente le caratteristiche delle suddivisioni spaziali log-polari di altre tecniche come il Gradient Location Orientation Histogram (GLOH) descritto in K. Mikolajczyk e C. Schmid, “A performance evaluation of local descriptors†, IEEE Transactions of Pattern Analysis and Machine Intelligence 27(10):1615-1630, e l’Uncompressed Histogram of Gradients (UHoG) descritto in Chandrasekhar et al., “Compressed Histogram of Gradients: A Low-Bitrate Descriptor†, International Journal on Computer Vision, Vol. 94, No. 5, Maggio 2011, che rappresentano alternative alla suddivisione spaziale cartesiana utilizzata nel metodo SIFT.
Come ulteriore esempio, la Figura 3 mostra alcuni approcci al calcolo di istogrammi di gradienti basati su una suddivisione in bin dello spazio bidimensionale delle componenti x e y dei gradienti, caratteristica della tecnica UHoG, quale alternativa alla suddivisione in bin del range di 360<°>degli orientamenti dei gradienti, utilizzata nel metodo SIFT.
Le suddette tecniche dell’arte nota sono qui citate solamente quali esempi di tecniche che producono descrittori di immagine in base alle quali la presente invenzione à ̈ in grado di eseguire il calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti.
Sebbene tali descrittori di immagine siano largamente utilizzati in molte applicazioni di visualizzazione su computer, come precedentemente accennato, i relativi costi di memorizzazione e trasmissione, determinati dalle dimensioni in byte, sono comunemente considerati elevati in determinate aree applicative. Questo perché, nonostante la dimensione di un descrittore di immagine locale per un punto chiave in un’immagine possa essere relativamente modesta, l’intero descrittore di immagine comprende centinaia di tali punti chiave e di descrittori locali ad essi associati, il che significa che l’intero descrittore di immagine può avere una dimensione comparabile con quella di una versione compressa JPEG dell’immagine reale da cui esso viene estratto.
Una di queste aree applicative in cui una simile dimensione del descrittore à ̈ considerata problematica à ̈ la ricerca visiva tramite terminale mobile. Sebbene in questa area applicativa sia possibile impiegare diverse architetture, un’architettura tipica prevede la cattura di un’immagine di un oggetto di interesse da parte di un client di terminale mobile come un telefono cellulare, l’estrazione automatica di un descrittore di immagine da parte del client, la trasmissione del descrittore di immagine su una rete di comunicazione wireless ad un server, il quale quindi elabora il descrittore di immagine e fornisce una risposta appropriata, come l’identità o informazioni aggiuntive relative all’oggetto di interesse, e invia tale risposta al client. Appare quindi ovvio che à ̈ preferibile ridurre al minimo la quantità di informazioni trasmesse dal client al server sulla rete wireless. A beneficio di tali applicazioni si à ̈ avuto un significativo sviluppo delle tecniche di compressione di tali descrittori di immagine.
L’approccio più semplice alla compressione di un istogramma di gradienti basato su descrittori di punti chiave à ̈ rappresentato dalla quantizzazione scalare dei valori dei bin dell’istogramma, il che significa ridurre il numero di bit utilizzati nella rappresentazione di ogni singolo valore di bin. In pratica questo approccio non à ̈ comunemente impiegato perché risulta difficile ottenere tassi di compressione molto elevati senza compromettere in modo significativo la potenza discriminativa del descrittore. Ad esempio, i bin di istogramma dei descrittori SIFT sono comunemente codificati con otto bit per bin, ma ciò comporta la creazione di descrittori di immagine aventi dimensioni in byte considerate eccessive per la trasmissione su reti wireless. D’altro canto, si à ̈ rilevato che operando una quantizzazione scalare a pochi bit per bin, ad esempio uno o due soltanto, si compromette la potenza discriminativa del descrittore di immagine.
Sono quindi stati proposti schemi di compressione più complessi. Una panoramica di tali schemi à ̈ presentata in V. Chandrasekhar et al., “Survey of SIFT compression schemes†, Proceedings of International Conference on Pattern Recognition (ICPR), Istanbul, Turchia, Agosto 2010.
In breve, si sono affermati in modo particolare schemi basati sulla quantizzazione vettoriale, con cui i valori dei bin vengono quantizzati congiuntamente mappandoli su uno di un numero finito di centroidi vettoriali rappresentativi; tali schemi sono stati proposti in varie forme, ad esempio con struttura ad albero e con quantizzazione vettoriale del prodotto. Lo svantaggio di questi approcci à ̈ rappresentato dal fatto che essi prevedono una complessità computazionale relativamente elevata e requisiti di memoria significativi, da centinaia di kilobyte fino ad alcuni megabyte o più, per la memorizzazione dei centroidi, il cui numero può variare da migliaia a milioni, e la cui determinazione richiede anch’essa una fase di apprendimento computazionalmente complessa.
Sono anche stati investigati a fondo schemi basati sulla codifica di tipo, con cui i valori dei bin vengono congiuntamente quantizzati formando un reticolo uniforme di tipi entro lo spazio contenente tutti i possibili vettori di ingresso, e ogni dato vettore di ingresso viene codificato mediante l’indice del tipo ad esso più vicino. I requisiti di memoria di questi approcci sono ridotti rispetto a quelli degli approcci mediante quantizzazione vettoriale, ma si à ̈ anche rilevato che i descrittori compressi risultanti non sono all’altezza dei descrittori quantizzati vettorialmente in termini di prestazioni di riconoscimento ad alti tassi di compressione. Globalmente i costi computazionali associati alla codifica di tipo sono significativamente maggiori di quelli della semplice quantizzazione scalare.
Altri schemi di compressione applicano metodi noti di riduzione della dimensionalità, come il metodo PCA, a descrittori di punti chiave, ad esempio descrittori di punti chiave SIFT 128-dimensionali, seguiti da quantizzazione scalare delle dimensioni risultanti. Un problema fondamentale posto da tali approcci consiste nel fatto che essi richiedono un’elevata complessità computazionale e un elevato rischio di sovrapprendimento (overtraining).
Riepilogando, gli approcci esistenti alla compressione di descrittori basati su istogrammi di gradienti e alla generazione di descrittori di immagine robusti, discriminativi, scalabili e compatti presentano un certo numero di svantaggi. Un approccio più semplice, come la quantizzazione scalare degli elementi del descrittore, ha il vantaggio di presentare una modesta complessità computazionale e requisiti di memoria molto ridotti, ma compromette la potenza discriminativa dei descrittori in presenza di elevati tassi di compressione.
Approcci più complessi hanno dimostrato di garantire migliori prestazioni con elevati tassi di compressione, ma presentano diversi svantaggi. Gli approcci mediante quantizzazione vettoriale aumentano in modo significativo la complessità computazionale e i requisiti di memoria. Gli approcci mediante codifica di tipo incrementano la complessità computazionale e, sebbene non siano comunque gravati dalla complessità computazionale degli approcci mediante quantizzazione vettoriale, presentano tuttavia prestazioni inferiori rispetto a questi ultimi. Inoltre, né gli approcci mediante quantizzazione vettoriale né gli approcci mediante codifica di tipo si sono dimostrati adatti a ridurre la dimensionalità nel dominio compresso. Si sono anche utilizzati approcci basati su tecniche note di riduzione della dimensionalità, come PCA, ma questi ultimi soffrono di elevata complessità computazionale ed elevato rischio di overtraining.
È quindi uno scopo della presente invenzione indicare un metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti che permetta di ridurre la dimensione del descrittore di immagine.
Un ulteriore scopo della presente invenzione consiste nell’indicare un metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti che consenta di ridurre i costi di memorizzazione e trasmissione dello stesso, in particolare su una rete wireless in applicazioni per terminali mobili. Un ulteriore scopo della presente invenzione consiste nell’indicare un metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti che consenta di ridurre la dimensione di un descrittore di immagine costituito da una pluralità di istogrammi di gradienti relativi a sottoregioni intorno a un punto chiave dell’immagine.
Questi e altri scopi dell’invenzione sono raggiunti attraverso un metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti e un relativo apparato di elaborazione di immagini secondo le rivendicazioni allegate, che formano parte integrante della presente descrizione.
In sintesi, la presente invenzione riguarda il calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti da descrittori di immagine utilizzanti istogrammi di gradienti, basati sulla trasformazione di detti istogrammi di gradienti, in cui detta trasformazione cattura le informazioni salienti e robuste ivi contenute in termini di forma delle distribuzioni e relazione tra i relativi valori di bin. Più in particolare, la presente invenzione trasforma istogrammi di gradienti calcolando valori corrispondenti a relazioni tra bin di istogramma.
Il metodo secondo la presente invenzione riguarda anche il calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti, basato su diversi approcci alla gestione dell’istogramma di gradienti in relazione alle sottoregioni intorno a un punto chiave dell’immagine.
Ulteriori caratteristiche dell’invenzione sono specificate nelle rivendicazioni allegate, le quali devono essere considerate parte integrante della presente descrizione.
I suddetti scopi risulteranno più chiari dalla descrizione dettagliata che segue del metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti, con particolare riferimento ai disegni allegati, in cui: - le Figure 1a e 1b mostrano un esempio di un descrittore di punto chiave secondo l’arte nota;
- le Figure 2a e 2b mostrano schemi di suddivisione spaziale utilizzati, rispettivamente, nelle tecniche note GLOH e UHoG;
- la Figura 3 mostra alcuni approcci al calcolo di istogrammi di gradienti della tecnica UHoG;
- le Figure 4a e 4b illustrano un esempio di un descrittore di punto chiave secondo l’invenzione;
- le Figure da 5 a 7 mostrano modalità differenti di gestione di istogrammi di gradienti corrispondenti a sottoregioni intorno a un punto chiave dell’immagine;
- le Figure da 8 a 13 rappresentano diagrammi di flusso relativi a sei forme di realizzazione della presente invenzione;
- la Figura 14 illustra l’elaborazione di un descrittore di immagine secondo l’invenzione mediante l’utilizzo dello schema di suddivisione spaziale di Fig. 2b;
- la Figura 15 illustra l’elaborazione di un descrittore di immagine secondo l’invenzione mediante l’uso dello schema di suddivisione dell’istogramma di gradienti di Fig. 3a;
- la Figura 16 illustra un dispositivo di elaborazione di immagini atto a realizzare il metodo secondo la presente invenzione.
A titolo di esempio e senza limitazione alcuna, si descrivono qui alcuni aspetti della presente invenzione per il calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti da un descrittore di immagine, in particolare un descrittore di immagine SIFT come quello illustrato in Figura 4, in cui la Figura 4a illustra un esempio di suddivisione della regione locale R in 4x4 sottoregioni SR e la Figura 4b illustra un esempio di istogramma di gradienti a 8 bin per una sottoregione.
L’istogramma di gradienti di Figura 4b à ̈ indicato con h e comprende bin hi, in cui i à ̈ l’indice del bin i=0...n-1. Una trasformazione di un istogramma di gradienti secondo l’invenzione calcola valori vjcorrispondenti a relazioni tra i bin dell’istogramma di gradienti.
I bin tra i quali vengono calcolati valori corrispondenti a relazioni possono essere selezionati in base alla loro posizione o alla loro prossimità, che, nel caso dell’istogramma di gradienti di Figura 4b, si traduce nella relativa separazione angolare.
Quale esempio di valori corrispondenti a relazioni tra bin dell’istogramma di gradienti, le differenze tra bin confinanti, come mostrato qui di seguito in (1), catturano la forma complessiva e le posizioni estreme dell’istogramma.
v0= h0– h1
v1= h1– h2
v2= h2– h3
v3= h3– h4
v4= h4– h5(1)
v5= h5– h6
v6= h6– h7
v7= h7– h0
Le differenze tra bin che corrispondono a gradienti con una differenza angolare di 90°, come mostrato qui di seguito in (2), o, più in generale, il più possibile vicina a 90° per quanto consentito dalle caratteristiche dell’istogramma di gradienti e della granularità dei bin, catturano informazioni sulla relazione tra gradienti sostanzialmente perpendicolari tra loro.
v0= h0– h2
v1= h1– h3
v2= h2– h4
v3= h3– h5
v4= h4– h6(2)
v5= h5– h7
v6= h6– h0
v7= h7– h1
Le differenze tra bin che corrispondono a gradienti con una differenza angolare di 180°, come mostrato qui di seguito in (3), o, più in generale, il più possibile vicina a 180° per quanto consentito dalle caratteristiche dell’istogramma di gradienti e della granularità dei bin, catturano importanti informazioni di alto livello sulla relazione tra gradienti entro orientamenti, come entro l’orientamento orizzontale ed entro l’orientamento verticale.
v0= h0– h4
v1= h1– h5(3)
v2= h2– h6
v3= h3– h7
Le funzioni mostrate qui di seguito in (4) combinano più di due bin di gradienti e catturano informazioni sulla relazione tra gradienti con orientamenti specifici, come tra i gradienti orizzontali in qualsiasi direzione e i gradienti verticali in qualsiasi direzione.
v0= (h0+ h4) – (h2+ h6)
v1= (h1+ h5) – (h3+ h7) (4)
Le funzioni mostrate qui di seguito in (5) combinano tutti i bin dell’istogramma di gradienti per produrre valori discriminanti rappresentativi della forma dell’intero istogramma.
v0= (h0+ h2+ h4+ h6) – (h1+ h3+ h5+ h7)
v1= (h0+ h1+ h2+ h3) – (h4+ h5+ h6+ h7) (5)
I bin tra i quali vengono calcolati valori corrispondenti a relazioni possono anche essere selezionati in base a criteri diversi. Ad esempio, i bin tra i quali vengono calcolati valori corrispondenti a relazioni possono essere selezionati in modo tale da incrementare la potenza discriminativa dei valori risultanti. Tali funzioni, ad esempio, possono assumere la forma delle funzioni mostrate qui di seguito in (6).
v0= (h0+ h2+ h4+ h6) – (h1+ h3+ h5+ h7)
v1= (h0+ h1+ h2+ h3) – (h4+ h5+ h6+ h7)
v2= (h0+ h4) – (h2+ h6) (6)
v3= (h1+ h5) – (h3+ h7)
Come ulteriore esempio, i bin tra i quali vengono calcolati valori corrispondenti a relazioni possono essere selezionati mediante un processo di selezione casuale. Alcuni esempi di tali funzioni sono mostrati qui di seguito in (7).
v0= 2h0– h3– h6
v1= h0+ h1+ h5– 3h7(7)
Come ulteriore esempio di trasformazione di un istogramma, l’insieme di funzioni mostrato qui di seguito in (8) costituisce una trasformata invertibile in cui v7à ̈ un valore rappresentativo del conteggio totale dell’istogramma.
v0= h0– h1
v1= h1– h2
v2= h2– h3
v3= h3– h4
v4= h4– h5(8)
v5= h5– h6
v6= h6– h7
v7= h0+ h1+ h2+ h3+ h4+ h5+ h6+ h7
Le funzioni di (1)-(8) mostrano le relazioni tra bin di un istogramma di gradienti calcolate sotto forma di somme o differenze tra bin o di differenze tra somme di bin, ma ciò non à ̈ limitativo e possono essere impiegate operazioni lineari o non lineari diverse, come rapporti tra bin o rapporti tra somme di bin o rapporti tra prodotti di bin o differenze tra prodotti di bin, e così via.
In generale, un istogramma di gradienti può essere trasformato calcolando valori vjcorrispondenti a relazioni tra bin dell’istogramma di gradienti, la selezione di detti bin dell’istogramma di gradienti essendo dipendente da uno o più criteri, come la loro prossimità o la potenza discriminativa dei valori risultanti, o una combinazione di tali criteri.
Inoltre, allorquando la selezione dei bin avviene in base alla loro prossimità, un istogramma di gradienti può essere trasformato calcolando valori vjcorrispondenti a relazioni tra bin dell’istogramma di gradienti che presentano una singola separazione angolare, ad esempio in base a relazioni solamente tra bin confinanti, come in (1), o a relazioni solamente tra bin separati di 180°, come in (3), e così via. In via alternativa, un istogramma di gradienti può anche essere trasformato calcolando valori vjcorrispondenti a relazioni tra bin dell’istogramma di gradienti che presentano una pluralità di separazioni angolari, ad esempio in base ad alcune relazioni mostrate in (1), alcune relazioni mostrate in (2), e così via. Complessivamente il processo di selezione per la trasformazione à ̈ molto importante, in quanto esso bilancia la quantità di uno specifico tipo di informazione rispetto alla combinazione di diversi tipi di informazione e la dimensionalità k del descrittore trasformato risultante rispetto alla dimensionalità n dell’istogramma di gradienti, che possono essere in relazione tra loro con k=n o k<n o k>n.
In seguito, ai valori vj, con j=0...k-1, calcolati dalla trasformazione di un istogramma di gradienti h si farà riferimento in modo collettivo come al descrittore di istogramma di gradienti trasformato v di k elementi.
Come già accennato, un singolo descrittore di immagine H può comprendere più istogrammi di gradienti hp, ciascuno corrispondente a una sottoregione SR della regione locale R intorno al punto chiave KP dell’immagine. La Figura 4a illustra un esempio di suddivisione della regione locale R in 4x4 sottoregioni SR, ciascuna descritta da un istogramma di gradienti hp. Tale descrittore di immagine può essere trasformato in un nuovo descrittore di immagine V mediante trasformazione individuale dell’istogramma di gradienti di ciascuna sottoregione SR in un descrittore di istogramma di gradienti trasformato vpcome sopra descritto.
Il processo di trasformazione degli istogrammi di gradienti sopra descritto presenta numerosi vantaggi ai fini della produzione di un descrittore di immagine compatto. Un primo vantaggio consiste nel fatto che, tramite un’appropriata selezione della trasformazione, il processo sopra descritto permette di codificare caratteristiche di forma salienti e informazioni discriminative di un istogramma di gradienti utilizzando meno elementi dell’istogramma di gradienti originale, ad esempio sostituendo otto bin di gradienti con i sei elementi combinati di (3) e (4) precedentemente illustrati, ottenendo così un descrittore di immagine più piccolo che comunque riesce ancora ottimamente a stabilire o verificare corrispondenze visive e ad ottenere elevate prestazioni di riconoscimento.
Un altro vantaggio consiste nel fatto che, a differenza dell’istogramma di gradienti originale, il descrittore di istogramma di gradienti trasformato à ̈ adatto alla compressione mediante una semplice quantizzazione scalare grossolana, con la quale ciascun elemento del descrittore viene quantizzato individualmente a pochi bit, addirittura anche solo uno o due bit, il che in effetti fornisce solamente una misura grossolana della relazione tra specifici bin di gradienti o della dominanza di alcuni bin specifici su altri bin specifici. Tuttavia tale misura grossolana fornisce ancora un descrittore di immagine robusto, discriminativo e compatto in grado di stabilire o verificare con successo corrispondenze visive e di ottenere prestazioni di riconoscimento più elevate rispetto al descrittore basato sull’istogramma di gradienti originale a parità di condizioni di quantizzazione scalare e anche in presenza di schemi di compressione più complessi, come la quantizzazione vettoriale e la codifica di tipo.
Ad esempio, utilizzando la quantizzazione scalare, i valori vjsono quantizzati individualmente a q livelli, ad esempio con q=2 o q=3 o q=4, ecc., sebbene ciò non sia limitativo e possano essere utilizzati numeri diversi di livelli di quantizzazione per ottenere la compattezza desiderata nel descrittore risultante. Questa quantizzazione può essere eseguita confrontando il valore di ciascun valore vjcon una serie di soglie. Sono disponibili varie opzioni per decidere le soglie di quantizzazione. Le soglie di quantizzazione possono essere determinate, ad esempio, mediante una divisione uniforme del range dinamico di ogni vj. In alternativa, le soglie di quantizzazione possono essere impostate in modo tale da ottenere una distribuzione specifica di valori a lungo termine tra i q livelli di quantizzazione, ad esempio una distribuzione uniforme. Inoltre le soglie di quantizzazione possono essere le stesse per tutti i valori vjcalcolati in tutte le sottoregioni SR, oppure possono essere uguali per lo stesso indice j in tutte le sottoregioni SR, oppure possono essere uguali per ogni sottoregione SR per tutti gli indici j, oppure possono essere diverse per ogni sottoregione SR e ogni indice j.
Il processo di trasformazione degli istogrammi di gradienti sopra descritto elimina quindi la necessità di utilizzare schemi di compressione complessi come quelli precedentemente discussi, determinando una riduzione della complessità computazionale complessiva e dei requisiti di memoria e consentendo l’ottenimento di caratteristiche prestazionali simili o addirittura migliori.
Un terzo vantaggio ottenuto consiste nel fatto che la dimensionalità del descrittore di istogramma di gradienti trasformato à ̈ altamente scalabile non solo prima della compressione, ma anche dopo la compressione, e può essere facilmente ridotto ulteriormente, se richiesto da un’applicazione o dalle caratteristiche del canale di trasmissione, semplicemente eliminando uno o più dei suoi elementi individualmente quantizzati, il che non à ̈ di facile realizzazione con tecniche di compressione più complesse, come la quantizzazione vettoriale o la codifica di tipo.
Allo stesso tempo, il processo di trasformazione e compressione individuale dell’istogramma di gradienti di ogni sottoregione sopra descritto à ̈ fortemente vantaggioso in quanto facilita la scalabilità dell’intero descrittore di immagine trasformato, se necessaria, semplicemente eliminando uno o più degli istogrammi di sottoregione trasformati e quantizzati individualmente.
Occorre tuttavia sottolineare che il descrittore di istogramma di gradienti trasformato sopra descritto non à ̈ incompatibile con gli schemi di compressione più complessi sopra descritti o con altri schemi di compressione applicabili al descrittore basato sull’istogramma di gradienti originale, e può comunque essere eventualmente utilizzato in congiunzione con qualsiasi schema di compressione di tale tipo, se lo si desidera.
Come già detto, un singolo descrittore di immagine H basato su istogrammi di gradienti può comprendere più istogrammi di gradienti hp, ciascuno corrispondente a una sottoregione SR della regione locale R intorno al punto chiave KP dell’immagine, e un tale descrittore di immagine H può essere trasformato mediante trasformazione individuale dell’istogramma di gradienti di ciascuna sottoregione SR come precedentemente descritto. Più in particolare, ogni istogramma di gradienti di sottoregione può essere trasformato in un modo identico a quello degli altri istogrammi di gradienti delle altre sottoregioni oppure, in alternativa, almeno un istogramma di gradienti di sottoregione può essere trasformato in modo diverso rispetto ad altri istogrammi di gradienti di altre sottoregioni.
Ad esempio, in un contesto di trasformazione di alcuni istogrammi di sottoregione in modo diverso da altri istogrammi di sottoregione, nel processo di trasformazione del descrittore di immagine può essere imposto un requisito secondo il quale le funzioni di trasformazione di qualsiasi istogramma di gradienti devono differire almeno parzialmente dalle funzioni di trasformazione utilizzate in almeno alcuni degli istogrammi di gradienti spazialmente confinanti. Questa situazione à ̈ illustrata in Figura 5.
Più in particolare, la Figura 5A e la Figura 5B fanno riferimento a insiemi di funzioni di trasformazione completamente o parzialmente diversi uno dall’altro. Ad esempio, considerando come A le funzioni di (1) e come B le funzioni di (2), si avranno insiemi di funzioni completamente diversi, mentre considerando come A le funzioni di (3) e gli elementi con numerazione pari di (1) e come B le funzioni di (3) e gli elementi con numerazione dispari di (1), si avranno insiemi di funzioni parzialmente diversi. In Figura 5 le funzioni di trasformazione A e B sono applicate agli istogrammi di sottoregione in modo tale che, per ogni istogramma di sottoregione trasformato da A (o, in alternativa, da B), i quattro istogrammi orizzontali e verticali confinanti siano trasformati da B (o, in alternativa, da A). Sebbene questo utilizzo di insiemi multipli di funzioni di trasformazione aumenti lievemente la complessità realizzativa, esso presenta un vantaggio significativo rispetto all’utilizzo delle stesse funzioni di trasformazione in tutti gli istogrammi di sottoregione. Come noto agli esperti del ramo, nei descrittori SIFT, così come in altri descrittori di immagine basati su istogrammi di gradienti, gli istogrammi di gradienti vicini, in particolare collegati orizzontalmente o verticalmente, esibiscono una correlazione significativa che viene mantenuta anche nei descrittori di istogrammi di gradienti trasformati. Applicando la stessa trasformazione in tali istogrammi confinanti in combinazione con qualsiasi successiva quantizzazione grossolana si hanno maggiori probabilità che istogrammi vicini abbiano elementi identici. Questo problema à ̈ alleviato dall’utilizzo di funzioni di trasformazione diverse, come sopra descritto, il che aumenta l’entropia e, di conseguenza, la potenza discriminativa del descrittore.
Quale ulteriore esempio di trasformazione di alcuni istogrammi di sottoregione in modo diverso rispetto ad altri istogrammi di sottoregione, i descrittori di istogrammi di gradienti trasformati di alcune sottoregioni possono comprendere un numero diverso di elementi rispetto ai descrittori di istogrammi di gradienti trasformati di altre sottoregioni in base a determinati fattori decisionali, come la posizione della sottoregione rispetto al centro della regione intorno al punto chiave.
La Figura 6 illustra un esempio di questa situazione, in cui le quattro sottoregioni centrali SRc, che circondano direttamente il punto chiave KP dell’immagine, sono trasformate come sopra descritto in kcelementi, mentre le dodici sottoregioni di confine SRbsono trasformate come sopra descritto in kbelementi, con kc>kb. Ciò aumenta quindi il contenuto informativo delle sottoregioni centrali SRcrispetto al descrittore di immagine trasformato nel suo complesso, dette sottoregioni SRcessendo comunemente ritenute dagli esperti del ramo più importanti per stabilire o verificare corrispondenze visive.
Quale ulteriore esempio di trasformazione di alcuni istogrammi di sottoregione in modo diverso rispetto ad altri istogrammi di sottoregione, i descrittori di istogrammi di gradienti trasformati di alcune sottoregioni possono essere compressi diversamente rispetto ai descrittori di istogrammi di gradienti trasformati di altre sottoregioni in base a determinati fattori decisionali, come la posizione della sottoregione rispetto al centro della regione intorno al punto chiave.
La Figura 7 illustra un esempio di questa situazione, in cui le quattro sottoregioni centrali SRc, che circondano direttamente il punto chiave KP dell’immagine, sono trasformate come sopra descritto e quantizzate a qclivelli, mentre le dodici sottoregioni di confine SRbsono trasformate come sopra descritto e quantizzate a qblivelli, con qc>qb. Ciò aumenta quindi la precisione di rappresentazione delle sottoregioni centrali SRcentro il descrittore di immagine trasformato nel suo complesso, dette sottoregioni SRcessendo comunemente ritenute dagli esperti del ramo più importanti per stabilire o verificare corrispondenze visive.
Si possono poi applicare caratteristiche di compressione diverse solamente ad elementi specifici dei descrittori di istogrammi di gradienti trasformati in base a determinati fattori decisionali, come la funzione di trasformazione di tali elementi specifici o le statistiche ad essi soggiacenti.
In generale, fattori come la selezione delle funzioni di trasformazione appropriate per sottoregioni diverse e la selezione dei parametri di compressione appropriati per sottoregioni e/o elementi di sottoregioni diversi sono particolarmente importanti, in quanto essi controllano il contenuto informativo e la potenza discriminativa del descrittore rispetto alla complessità di quest’ultimo e ai relativi costi di memorizzazione/trasmissione.
Si descriveranno ora alcune forme di realizzazione della presente invenzione con riferimento alle Figure da 8 a 13.
Prima forma di realizzazione
Una prima forma di realizzazione dell’invenzione à ̈ illustrata in Figura 8, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hpin modo tale da ridurne la dimensionalità, calcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti selezionati in base alla loro prossimità.
Più in particolare, in Figura 8 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S100, p viene impostato a 0.
Quindi, al passo S110, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpdi k elementi (k=4), con k < n, da un insieme di funzioni selezionate per catturare le relazioni tra bin aventi una singola separazione angolare, ossia le funzioni di (9), che catturano le relazioni tra bin confinanti. v0= h0– h1
v1= h2– h3
v2= h4– h5(9)
v3= h6– h7
In alternativa, le funzioni di (9) possono essere sostituite da funzioni diverse in grado di catturare le relazioni tra bin aventi un’altra singola separazione angolare, come funzioni che catturano le relazioni tra bin separati di 90<o>, o funzioni che danno luogo a un descrittore vpcon un diverso numero di elementi k, dove à ̈ ancora k < n.
Al passo S120 il valore di p viene quindi esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario esso viene incrementato di 1 al passo S130 e il processo ritorna al passo S110.
Il descrittore risultante V codifica così caratteristiche di forma salienti e informazioni discriminative di H utilizzando un numero significativamente inferiore di elementi rispetto ad H, il che determina l’ottenimento di un descrittore più piccolo che à ̈ comunque ancora molto efficace nello stabilire e verificare corrispondenze visive e nel fornire elevate prestazioni di riconoscimento.
Facoltativamente, i valori dei singoli elementi di V possono essere opportunamente scalati e spostati, ad esempio per mapparli su valori non negativi e/o su un range dinamico specifico, ad esempio a 8 bit.
La successiva elaborazione dei descrittori risultanti, volta a determinare se sono stati estratti due descrittori dallo stesso punto chiave in immagini diverse e a stabilire corrispondenze visive tra le immagini, fuoriesce dall’ambito dell’invenzione e può procedere in modo analogo come previsto per i descrittori di istogrammi di gradienti originali, ad esempio come descritto in David G. Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, 60, 2 (2004), pp. 91-110, o in qualsiasi altro modo ritenuto appropriato.
Seconda forma di realizzazione
Una seconda forma di realizzazione dell’invenzione à ̈ illustrata in Figura 9, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hpin modo tale da ridurne la dimensionalità, calcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti selezionati in base a una pluralità di criteri rispetto alla loro prossimità.
Più in particolare, in Figura 9 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S200, p viene impostato a 0.
Quindi, al passo S210, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpdi k elementi (k=6), con k < n, da un insieme di funzioni selezionate per catturare le relazioni tra bin aventi una pluralità di separazioni angolari, ossia le funzioni di (10), che catturano le relazioni tra bin confinanti e le relazioni tra bin separati di 180<o>.
v0= h0– h1
v1= h2– h3
v2= h4– h5
v3= h6– h7(10)
v4= h0– h4
v5= h2– h6
In alternativa, le funzioni di (10) possono essere sostituite da funzioni diverse in grado di catturare le relazioni tra bin aventi un’altra pluralità di separazioni angolari, come funzioni che catturano le relazioni tra bin separati di 90<o>e le relazioni tra bin separati di 180<o>, o funzioni che danno luogo a un descrittore vpcon un diverso numero di elementi k, dove à ̈ ancora k < n.
Al passo S220 il valore di p viene quindi esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario esso viene incrementato di 1 al passo S230 e il processo ritorna al passo S210.
Il descrittore risultante V codifica così tipi diversi di caratteristiche di forma salienti e informazioni discriminative di H utilizzando un numero inferiore di elementi rispetto ad H, il che determina l’ottenimento di un descrittore più piccolo che à ̈ comunque ancora molto efficace nello stabilire o verificare corrispondenze visive e nel fornire elevate prestazioni di riconoscimento.
La successiva elaborazione del descrittore risultante può procedere in modo analogo come previsto per la prima forma di realizzazione.
Terza forma di realizzazione
Una terza forma di realizzazione dell’invenzione à ̈ illustrata in Figura 10, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hp, calcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti selezionati in base a una pluralità di criteri rispetto alla loro prossimità.
Più in particolare, in Figura 10 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S300, p viene impostato a 0.
Quindi, al passo S310, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpdi k elementi (k=8) da un insieme di funzioni selezionate per catturare le relazioni tra bin aventi una pluralità di separazioni angolari, ossia le funzioni di (11).
v0= h2– h6
v1= h3– h7
v2= h0– h1
v3= h2– h3
v4= h4– h5(11)
v5= h6– h7
v6= (h0+ h4) – (h2+ h6)
v7= (h0+ h2+ h4+ h6) – (h1+ h3+ h5+ h7)
In alternativa, le funzioni di (11) possono essere sostituite da funzioni diverse in grado di catturare le relazioni tra bin aventi un’altra pluralità di separazioni angolari, o funzioni che danno luogo a un descrittore vpcon un diverso numero di elementi k, con k=n o k<n o k>n.
Al passo S320, ciascun elemento del descrittore vpdi k elementi viene quantizzato individualmente a q livelli, ottenendo il descrittore quantizzato v,Ëœp. In questa forma di realizzazione si à ̈ definito q=3, sebbene ciò non sia limitativo e si possano utilizzare diversi numeri di livelli di quantizzazione per ottenere la compattezza desiderata nel descrittore risultante, ad esempio q=2, q=4, e così via. Questa quantizzazione può essere eseguita confrontando il valore di ciascun elemento vpjcon una serie di soglie. Sono disponibili numerose opzioni per decidere le soglie di quantizzazione. Le soglie di quantizzazione possono essere determinate, ad esempio, mediante divisione uniforme del range dinamico di vpj. In alternativa, le soglie di quantizzazione possono essere definite in modo da ottenere una distribuzione specifica a lungo termine di valori tra i q livelli di quantizzazione, ad esempio una distribuzione uniforme. Inoltre, le soglie di quantizzazione possono essere le stesse per tutti gli elementi vpj, oppure possono essere uguali per lo stesso indice j in tutti i p, oppure possono essere uguali per lo stesso indice p in tutti i j, oppure possono essere diverse per ogni vpj.
Al passo S330 il valore di p viene quindi esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario esso viene incrementato di 1 al passo S340 e l’elaborazione ritorna al passo S310.
Chiaramente, forme di realizzazione alternative possono presentare un diverso ordine di esecuzione o alcune operazioni differenti rispetto a Figura 10 senza tuttavia fuoriuscire dall’ambito dell’invenzione, ad esempio calcolando prima l’intero descrittore V e poi procedendo con la quantizzazione per generare il descrittore quantizzato V,<˜>.
Il descrittore risultante V,<˜>codifica così tipi diversi di caratteristiche di forma salienti e informazioni discriminative di H. La quantizzazione scalare grossolana, con la quale ogni elemento del descrittore viene individualmente quantizzato a un ridotto numero di livelli che forniscono solamente una misura grossolana della relazione tra specifici bin di gradienti o della dominanza di bin specifici su altri bin specifici, dà luogo a un descrittore di immagine robusto, discriminativo e compatto in grado di stabilire o verificare corrispondenze visive e di garantire prestazioni di riconoscimento migliori rispetto al descrittore basato su istogrammi di gradienti originale a parità di condizioni di quantizzazione scalare e anche in presenza di schemi di compressione più complessi.
L’elaborazione successiva del descrittore risultante può quindi procedere nello stesso modo previsto per le forme di realizzazione precedenti.
Quarta forma di realizzazione
Una quarta forma di realizzazione dell’invenzione à ̈ illustrata in Figura 11, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hpcon un insieme di funzioni di trasformazione che presenta alcune differenze rispetto all’insieme di funzioni di trasformazione utilizzato per l’elaborazione di alcuni degli istogrammi di gradienti confinanti con hp.
Più in particolare, in Figura 11 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S400, p viene impostato a 0.
Quindi, al passo S410, il valore di p viene esaminato per la selezione delle funzioni appropriate ai fini dell’elaborazione di hp. Questa selezione può, ad esempio, procedere lungo le linee illustrate in Figura 5, in cui si utilizzano due insiemi di trasformate, designati A e B, A essendo selezionato quando p=0,2,5,7,8,10,13,15 e B essendo selezionato quando p=1,3,4,6,9,11,12,14. Ciò non à ̈ tuttavia limitativo ed à ̈ possibile utilizzare un diverso numero di insiemi di funzioni di trasformazione, anche con una diversa disposizione spaziale, in modo tale che l’insieme di funzioni di trasformazione impiegato per l’elaborazione di un istogramma di gradienti presenti differenze rispetto agli insiemi di funzioni di trasformazione utilizzati per l’elaborazione di alcuni degli istogrammi di gradienti confinanti con detto istogramma.
Quindi, al passo S420, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpdi k elementi (k=8) utilizzando l’insieme opportunamente selezionato di funzioni di trasformazione. Gli insiemi di funzioni di trasformazione A e B possono rispettivamente essere definiti come riportato qui di seguito in (12) e (13), dove ogni insieme di funzioni à ̈ selezionato per catturare le relazioni tra bin aventi una pluralità di separazioni angolari e non ci sono funzioni comuni tra A e B.
v0= h2– h6(12)
v1= h3– h7
v2= h0– h1
v3= h2– h3
v4= h4– h5
v5= h6– h7
v6= (h0+ h4) – (h2+ h6)
v7= (h0+ h2+ h4+ h6) – (h1+ h3+ h5+ h7)
v0= h0– h4(13)
v1= h1– h5
v2= h1– h2
v3= h3– h4
v4= h5– h6
v5= h7– h0
v6= (h1+ h5) – (h3+ h7)
v7= (h0+ h1+ h2+ h3) – (h4+ h5+ h6+ h7)
In alternativa, uno qualsiasi o entrambi gli insiemi di funzioni indicati in (12) e (13) possono essere sostituiti da funzioni diverse in grado di catturare le relazioni tra bin aventi un’altra pluralità di separazioni angolari, o funzioni che danno luogo a un descrittore con un diverso numero di elementi k, con k=n o k<n o k>n. Inoltre gli insiemi di funzioni A e B possono non contenere funzioni comuni, oppure possono contenere alcune funzioni comuni. Inoltre, i bin tra i quali vengono calcolati valori corrispondenti a relazioni possono essere selezionati secondo criteri diversi per uno o entrambi gli insiemi di funzioni A e B. Tali criteri, come già descritto in precedenza, possono comprendere la selezione dei bin tra i quali devono essere calcolati valori corrispondenti a relazioni in modo tale da aumentare la potenza discriminativa dei valori risultanti oppure secondo un processo di selezione casuale. Inoltre à ̈ possibile utilizzare qualsiasi combinazione di detti criteri per la selezione di uno o di entrambi gli insiemi di funzioni A e B.
Quindi, al passo S430, ciascun elemento del descrittore vpdi k elementi viene individualmente quantizzato a q livelli, ottenendo il descrittore quantizzato v,Ëœp, in modo analogo a quello previsto per la terza forma di realizzazione.
Al passo S440 il valore di p viene quindi esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario, esso viene incrementato di 1 al passo S450 e il processo ritorna al passo S410.
Chiaramente, forme di realizzazione alternative possono presentare un diverso ordine di esecuzione o alcune operazioni differenti rispetto a Figura 11 senza tuttavia fuoriuscire dall’ambito dell’invenzione, ad esempio calcolando prima l’intero descrittore V e poi procedendo con la quantizzazione per generare il descrittore quantizzato V,<˜>.
Il descrittore risultante V,<Ëœ>codifica così informazioni discriminative di H. L’utilizzo di più insiemi di funzioni di trasformazione secondo la presente forma di realizzazione offre un vantaggio significativo rispetto all’utilizzo delle stesse funzioni di trasformazione in tutti gli istogrammi di sottoregione. Come noto agli esperti del ramo, nei descrittori di immagine basati su istogrammi di gradienti gli istogrammi di gradienti confinanti presentano una correlazione significativa, che viene mantenuta nei descrittori di istogrammi di gradienti trasformati e, in combinazione con una quantizzazione scalare grossolana, comportano maggiori probabilità che gli istogrammi trasformati confinanti abbiano elementi identici. Questo problema à ̈ alleviato dall’utilizzo di funzioni di trasformazione diverse come in questa forma di realizzazione, che aumenta l’entropia e, di conseguenza, la potenza discriminativa del descrittore.
L’elaborazione successiva del descrittore risultante può quindi procedere nello stesso modo previsto per le forme di realizzazione precedenti.
Quinta forma di realizzazione
Una quinta forma di realizzazione dell’invenzione à ̈ illustrata in Figura 12, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hp, calcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti e in modo tale che i descrittori di istogrammi di gradienti trasformati di alcune sottoregioni comprendano un diverso numero di elementi rispetto ai descrittori di istogrammi di gradienti trasformati di altre sottoregioni.
Più in particolare, in Figura 12 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S500, p viene impostato a 0.
Quindi, al passo S510, il valore di p viene esaminato per la selezione della dimensionalità appropriata ai fini dell’elaborazione di hp. Questa selezione può, ad esempio, procedere lungo le linee illustrate in Figura 6, in cui gli istogrammi delle sottoregioni centrali con p=5,6,9,10 devono essere trasformati in modo tale che i descrittori risultanti abbiano kcelementi ciascuno (kc=3) e gli istogrammi delle sottoregioni confinanti con p=0,1,2,3,4,7,8,11,12,13,14,15 devono essere trasformati in modo tale che i descrittori risultanti abbiano kbelementi ciascuno (kb=2). Ciò non à ̈ tuttavia limitativo, in quanto à ̈ comunque possibile impiegare un diverso numero di possibili dimensionalità con una differente disposizione spaziale.
Quindi, al passo S520, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpcalcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti secondo le funzioni di (14) riportate qui di seguito.
v0= h0– h4(utilizzata per le sottoregioni centrali e confinanti)
v1= h1– h5(utilizzata per le sottoregioni centrali e confinanti) (14) v2= (h1+ h5) – (h3+ h7) (utilizzata solo per le sottoregioni centrali) Chiaramente, questa forma di realizzazione può essere combinata con qualsiasi altra forma di realizzazione precedente, e le funzioni di trasformazione di (14) possono essere sostituite da funzioni di trasformazione selezionate secondo qualsiasi combinazione di criteri di selezione, come descritto in precedenza, e/o possono essere utilizzati differenti insiemi di funzioni di trasformazione per istogrammi di sottoregioni diverse.
Al passo S530, ogni elemento del descrittore vpdi k elementi viene quindi individualmente quantizzato a q livelli, ottenendo il descrittore quantizzato v,Ëœp, in modo analogo a quello previsto per la terza e la quarta forma di realizzazione.
Quindi, al passo S540, il valore di p viene esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario, esso viene incrementato di 1 al passo S550 e il processo ritorna al passo S510.
Chiaramente, forme di realizzazione alternative possono presentare un diverso ordine di esecuzione o alcune operazioni differenti rispetto a Figura 12 senza tuttavia fuoriuscire dall’ambito dell’invenzione, ad esempio calcolando prima l’intero descrittore V e poi procedendo con la quantizzazione per generare il descrittore quantizzato V,<˜>.
Il descrittore risultante V,<˜>codifica così informazioni discriminative di H in modo tale da dare maggiore rilievo a quelle parti di H che possono essere più importanti ai fini di stabilire o verificare corrispondenze visive, come gli istogrammi delle sottoregioni centrali rispetto agli istogrammi delle sottoregioni confinanti, consentendo una rappresentazione di maggiore dimensionalità per tali parti.
Sesta forma di realizzazione
Una sesta forma di realizzazione dell’invenzione à ̈ illustrata in Figura 13, in cui un descrittore basato su istogrammi di gradienti H, comprendente istogrammi di gradienti hp, ad esempio secondo Figura 4, à ̈ elaborato mediante trasformazione di ciascun istogramma di gradienti hp, calcolando valori corrispondenti a relazioni tra bin di istogramma di gradienti e in modo tale che alcuni elementi del descrittore di istogramma di gradienti trasformato siano quantizzati a un numero di livelli diverso rispetto ad altri elementi del descrittore di istogramma di gradienti trasformato.
Più in particolare, in Figura 13 viene elaborato di volta in volta ciascun istogramma hpcon p=0...N-1 (N=16). Al passo S600, p viene impostato a 0.
Quindi, al passo S610, l’istogramma hpdi n bin (n=8) viene trasformato nel descrittore vpdi k elementi (k=8) mediante un insieme di funzioni selezionate per catturare le relazioni tra bin, come mostrato qui di seguito in (15).
v0= h2– h6
v1= h3– h7
v2= h0– h1
v3= h2– h3
v4= h4– h5(15)
v5= h6– h7
v6= (h0+ h4) – (h2+ h6)
v7= (h0+ h2+ h4+ h6) – (h1+ h3+ h5+ h7)
Chiaramente, questa forma di realizzazione può essere combinata con qualsiasi forma di realizzazione precedente, e le funzioni di trasformazione di (15) possono essere sostituite da funzioni di trasformazione selezionate secondo qualsiasi combinazione di criteri di selezione, come descritto in precedenza, e/o possono essere utilizzati differenti insiemi di funzioni di trasformazione per istogrammi di sottoregioni diverse e/o possono essere utilizzate dimensionalità del descrittore trasformato differenti per istogrammi di sottoregioni diverse. Quindi, al passo S620, il valore di p viene esaminato per la selezione del numero appropriato di livelli di quantizzazione ai fini della quantizzazione di ciascun elemento vpj. Questa selezione può, ad esempio, procedere lungo le linee illustrate in Figura 7, in cui i descrittori delle sottoregioni centrali con p=5,6,9,10 devono essere quantizzati a qclivelli (qc=4) e i descrittori delle regioni confinanti con p=0,1,2,3,4,7,8,11,12,13,14,15 devono essere quantizzati a qblivelli (qb=2). Ciò non à ̈ tuttavia limitativo, in quanto à ̈ comunque possibile impiegare un diverso numero di possibili livelli di quantizzazione con una differente disposizione spaziale. Inoltre, sebbene ciò non sia mostrato in Figura 13, il numero di livelli di quantizzazione per ciascun elemento vpjpuò essere determinato in base al valore di j, ossia in base al tipo specifico di elemento di descrittore, in alternativa o in aggiunta al valore di p, ossia la posizione della sottoregione dell’elemento.
Quindi, al passo S630, ciascun elemento del descrittore vpdi k elementi viene individualmente quantizzato al numero appropriato di livelli di quantizzazione, ottenendo il descrittore quantizzato v,Ëœp, in modo analogo a quello previsto per la terza, la quarta e la quinta forma di realizzazione.
Quindi, al passo S640, il valore di p viene esaminato e, se à ̈ uguale all’indice dell’ultimo istogramma in H, il processo termina; in caso contrario, esso viene incrementato di 1 al passo S650 e il processo ritorna al passo S610.
Chiaramente, forme di realizzazione alternative possono presentare un diverso ordine di esecuzione o alcune operazioni differenti rispetto a Figura 13 senza tuttavia fuoriuscire dall’ambito dell’invenzione, ad esempio calcolando prima l’intero descrittore V e poi procedendo con la quantizzazione per generare il descrittore quantizzato V,<˜>.
Il descrittore risultante V,<˜>codifica così informazioni discriminative di H in modo tale da garantire una maggiore precisione di rappresentazione di quelle parti di H o quegli elementi di V che possono essere più importanti per stabilire o verificare corrispondenze visive.
Sebbene si siano qui descritti in dettaglio aspetti e forme di realizzazione della presente invenzione volti al calcolo di descrittori di immagine robusti, discriminativi, scalabili e compatti da un descrittore di immagine SIFT come quello illustrato in Figura 4, l’invenzione à ̈ comunque applicabile ad altri descrittori di immagine basati su istogrammi di gradienti. Ad esempio, la Figura 14 illustra l’elaborazione di un descrittore basato su istogrammi di gradienti che utilizza una suddivisione spaziale log-polare ottenuta mediante trasformazione di ciascuno dei suoi istogrammi di gradienti con un insieme di funzioni di trasformazione che presentano alcune differenze rispetto agli insiemi di funzioni di trasformazione utilizzati nell’elaborazione dei suoi istogrammi di gradienti confinanti, in modo analogo alla quarta forma di realizzazione dell’invenzione, i simboli A, B e C riportati in Figura 14 corrispondendo a detti insiemi di funzioni di trasformazione. Quale ulteriore esempio, relativo a un istogramma di gradienti basato su una suddivisione in bin dello spazio bidimensionale delle componenti x e y dei gradienti come quello illustrato in Figura 15, un insieme di funzioni di trasformazione idoneo à ̈ il seguente, in analogia a forme di realizzazione precedenti dell’invenzione: v0= h0– h1
v1= h1– h2
v2= h2– h3
v3= h3– h4
v4= h4– h5(16)
v5= h5– h6
v6= h6– h7
v7= h7– h0
v8= h8– (h0+ h1+ h2+ h3+ h4+ h5+ h6+ h7)
L’invenzione à ̈ inoltre applicabile a descrittori di immagine basati su istogrammi di gradienti appropriatamente elaborati. Tale appropriata elaborazione può prevedere, ad esempio, la combinazione di istogrammi di gradienti di sottoregioni prima dell’elaborazione secondo l’invenzione.
A puro titolo illustrativo, con riferimento alla Figura 4a, per il descrittore di istogrammi di gradienti H comprendente istogrammi di sottoregione hpcon p=0…15, gli istogrammi con p=0,1,4,5 possono essere combinati in un singolo istogramma di sottoregione facendo la media dei valori dei relativi bin, e una combinazione analoga può essere realizzata per gli istogrammi con p=2,3,6,7 e p=8,9,12,13 e p=10,11,14,15, ottenendo un descrittore di istogrammi di gradienti con ridotta dimensionalità che può poi essere elaborato secondo qualsiasi forma di realizzazione precedente dell’invenzione. Gli istogrammi di gradienti possono anche essere combinati applicando una funzione alternativa ai valori dei rispettivi bin, come la somma.
In alternativa o in aggiunta, una tale appropriata elaborazione può prevedere, ad esempio, la fusione di bin all’interno di istogrammi di gradienti di sottoregione. A titolo illustrativo, con riferimento alla Figura 4b, per l’istogramma di gradienti h, i bin confinanti possono essere fusi in un unico bin calcolando la media, la somma o la mediana oppure applicando qualsiasi altra funzione idonea, ottenendo un descrittore di istogramma di gradienti con ridotta dimensionalità che può poi essere elaborato secondo qualsiasi forma di realizzazione precedente dell’invenzione.
A puro titolo di esempio, la Figura 16 illustra un apparato di elaborazione concettuale per la realizzazione del metodo secondo la presente invenzione. Più in particolare, l’apparato di elaborazione 1100 riceve un ingresso, che può comprendere dati visivi, come dati di immagine o dati video, descrittori pre-calcolati basati su istogrammi di gradienti, descrittori compatti pre-calcolati secondo il metodo della presente invenzione, istruzioni di programmazione o comandi utente, da un apparato di ingresso 1000, che può assumere la forma di un apparato utente di ingresso, un lettore di media o un ricevitore di segnali trasmessi. L’apparato di elaborazione 1100 comprende i principali blocchi di elaborazione di un’unità di elaborazione centrale 1110 che controlla le operazioni degli altri blocchi di elaborazione, una memoria volatile 1120, una memoria non volatile 1130, un blocco estrattore di descrittori opzionale 1140 atto a generare descrittori basati su istogrammi di gradienti, un blocco estrattore di descrittori compatti 1150 atto ad eseguire il metodo secondo la presente invenzione, e facoltativamente un blocco processore di descrittori compatti 1160 atto ad elaborare detti descrittori compatti, ad esempio per stabilire o verificare corrispondenze visive. L’apparato di elaborazione 1100 à ̈ collegato a un apparato di uscita 1900, che può assumere la forma di un’unità di visualizzazione, un dispositivo di scrittura su media o un trasmettitore di segnali, il quale fornisce un’uscita che può comprendere dati visivi annotati, come dati di immagine o dati video, informazioni di elaborazione, come corrispondenze visive stabilite o verificate, o descrittori compatti calcolati secondo il metodo della presente invenzione. Si deve notare che i blocchi di elaborazione e l’architettura mostrata in Figura 16 sono puramente concettuali e potrebbero non corrispondere esattamente ad ogni apparato realizzante il metodo secondo l’invenzione.
Numerose sono le varianti possibili al metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti e al relativo apparato di elaborazione di immagini qui descritti a titolo di esempio, senza per questo uscire dai principi di novità insiti nell’idea inventiva, così come à ̈ chiaro che nella sua attuazione pratica le forme dei dettagli illustrati potranno essere diverse, e gli stessi potranno essere sostituiti con altri elementi tecnicamente equivalenti.
Si può quindi facilmente comprendere come la presente invenzione non sia limitata a un metodo per trasformare un descrittore di immagine basato su un istogramma di gradienti e ad un relativo apparato di elaborazione di immagini, ma può essere soggetta a numerose modifiche, miglioramenti o sostituzioni di parti ed elementi equivalenti senza fuoriuscire dall’idea inventiva, come chiaramente specificato nelle rivendicazioni allegate.

Claims (19)

  1. RIVENDICAZIONI 1. Metodo per trasformare un descrittore di immagine, basato su un istogramma di gradienti (h) comprendente una pluralità di bin di istogramma (hi), in un descrittore di istogramma di gradienti trasformato (v) comprendente un insieme di valori (vj), in cui à ̈ previsto il passo di applicare almeno un criterio per calcolare detto insieme di valori (vj), detto almeno un criterio comprendendo un criterio di posizione di detti bin di istogramma (hi).
  2. 2. Metodo secondo la rivendicazione 1, in cui detto criterio di posizione prevede il calcolo di valori (vj) tra bin dell’istogramma di gradienti (hi) che presentano una singola separazione angolare.
  3. 3. Metodo secondo la rivendicazione 1, in cui detto criterio di posizione prevede il calcolo di valori (vj) tra bin dell’istogramma di gradienti (hi) che presentano una pluralità di separazioni angolari.
  4. 4. Metodo secondo la rivendicazione 2 o 3, in cui almeno uno di detti valori (vj) Ã ̈ calcolato tra bin di istogramma adiacenti (hi).
  5. 5. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 4, in cui detti valori (vj) sono individualmente quantizzati a una pluralità di livelli (q), in cui detta pluralità di livelli può essere uguale per ciascun valore (vj) oppure differente per almeno due valori (vj).
  6. 6. Metodo secondo una delle rivendicazioni da 1 a 5, in cui detti valori (vj) sono calcolati secondo una o più delle operazioni seguenti: somme o differenze tra bin di istogramma (hi); differenze tra somme di bin di istogramma (hi); operazioni lineari o non lineari tra bin di istogramma (hi); rapporti tra bin di istogramma (hi); rapporti tra somme di bin di istogramma (hi); rapporti tra prodotti di bin di istogramma (hi); differenze tra prodotti di bin di istogramma (hi).
  7. 7. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 6, in cui detto istogramma di gradienti (h) ha una dimensionalità di un primo numero (n) di elementi, detto insieme di valori (vj) ha una dimensionalità di un secondo numero (k) di elementi, e detto primo numero (n) di elementi à ̈ uguale a detto secondo numero (k) di elementi.
  8. 8. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 6, in cui detto istogramma di gradienti (h) ha una dimensionalità di un primo numero (n) di elementi, detto insieme di valori (vj) ha una dimensionalità di un secondo numero (k) di elementi, e detto primo numero (n) di elementi à ̈ maggiore di detto secondo numero (k) di elementi.
  9. 9. Metodo secondo una qualsiasi delle rivendicazioni da 1 a 6, in cui detto istogramma di gradienti (h) ha una dimensionalità di un primo numero (n) di elementi, detto insieme di valori (vj) ha una dimensionalità di un secondo numero (k) di elementi, e detto primo numero (n) di elementi à ̈ minore di detto secondo numero (k) di elementi.
  10. 10. Metodo per trasformare un descrittore di immagine (H) basato su una pluralità di istogrammi di gradienti (hp) in un descrittore di immagine trasformato (V), in cui ciascuno di detta pluralità di istogrammi di gradienti (hp) à ̈ relativo a una sottoregione (SR) di una regione locale (R) intorno a un punto chiave (KP) dell’immagine, e in cui ciascuno di detti istogrammi di gradienti (hp) comprende una pluralità di bin di istogramma (hi) trasformati in un descrittore di istogramma di gradienti trasformato (V) secondo una delle rivendicazioni da 1 a 9.
  11. 11. Metodo secondo la rivendicazione 10, in cui almeno un istogramma di gradienti di sottoregione à ̈ trasformato in modo diverso rispetto ad altri istogrammi di gradienti di sottoregione.
  12. 12. Metodo secondo la rivendicazione 11, in cui una pluralità di istogrammi di gradienti di sottoregione sono combinati in un singolo istogramma di sottoregione, in particolare sommando o facendo la media dei valori dei relativi bin.
  13. 13. Metodo secondo la rivendicazione 11, in cui le operazioni eseguite per ottenere detto almeno un istogramma di gradienti di sottoregione trasformato differiscono almeno parzialmente dalle operazioni eseguite per ottenere gli istogrammi di gradienti di sottoregione trasformati di almeno una delle relative sottoregioni confinanti.
  14. 14. Metodo secondo la rivendicazione 11, in cui detto almeno un istogramma di gradienti di sottoregione trasformato comprende un diverso numero di elementi rispetto agli istogrammi di gradienti di sottoregione trasformati di almeno una delle relative sottoregioni confinanti.
  15. 15. Metodo secondo la rivendicazione 14, in cui gli istogrammi di gradienti di sottoregione trasformati relativi alle sottoregioni (SRc) che si trovano immediatamente intorno a detto punto chiave (KP) dell’immagine comprendono più elementi (kc) rispetto agli elementi (kb) degli istogrammi di gradienti trasformati delle rimanenti sottoregioni (SRb).
  16. 16. Metodo secondo la rivendicazione 15, in cui gli elementi di detti istogrammi di gradienti trasformati delle sottoregioni (SRc) che si trovano immediatamente intorno a detto punto chiave (KP) dell’immagine sono quantizzati con un numero di livelli (qc) maggiore rispetto al numero di livelli (qb) con cui sono quantizzati gli istogrammi di gradienti trasformati delle rimanenti sottoregioni (SRb).
  17. 17. Metodo secondo la rivendicazione 16, in cui detta quantizzazione à ̈ applicata soltanto a specifici elementi di detti istogrammi di gradienti di sottoregione.
  18. 18. Metodo secondo la rivendicazione 10, in cui detto descrittore di immagine trasformato (V) à ̈ sottoposto a un processo di quantizzazione allo scopo di generare un descrittore di immagine trasformato quantizzato ( V,Ëœ).
  19. 19. Apparato di elaborazione di immagini comprendente mezzi per la realizzazione delle rivendicazioni da 1 a 18.
IT000602A 2012-07-09 2012-07-09 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus. ITTO20120602A1 (it)

Priority Applications (18)

Application Number Priority Date Filing Date Title
IT000602A ITTO20120602A1 (it) 2012-07-09 2012-07-09 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.
EP13732573.4A EP2870568B1 (en) 2012-07-09 2013-07-01 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus
CN201810356712.5A CN108520265B (zh) 2012-07-09 2013-07-01 用于转换图像描述符的方法和相关图像处理设备
JP2015520897A JP6292454B2 (ja) 2012-07-09 2013-07-01 勾配ヒストグラムに基づいて画像記述子を変換する方法および関連する画像処理装置
CN201380036654.3A CN104428793B (zh) 2012-07-09 2013-07-01 用于转换基于梯度直方图的图像描述符的方法和相关图像处理设备
US14/410,768 US9454710B2 (en) 2012-07-09 2013-07-01 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus
ES13732573T ES2811532T3 (es) 2012-07-09 2013-07-01 Método para transformar un descriptor de imágenes con base en un histograma de gradientes y un aparato de procesamiento de imágenes relativo
BR112014031268A BR112014031268A2 (pt) 2012-07-09 2013-07-01 método para transformar um descritor de imagem baseada em um histograma de gradiente e aparelho de processamento de imagem relacionado
PCT/EP2013/063874 WO2014009198A1 (en) 2012-07-09 2013-07-01 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus
KR1020157003489A KR102193177B1 (ko) 2012-07-09 2013-07-01 그라디언트 히스토그램에 기초하여 이미지 기술자를 변환하기 위한 방법 및 관련된 이미지 프로세싱 장치
RU2015104066A RU2661795C2 (ru) 2012-07-09 2013-07-01 Способ преобразования дескриптора изображения на основе гистограммы градиентов и соответствующее устройство обработки изображений
EP20171298.1A EP3702965B1 (en) 2012-07-09 2013-07-01 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus
TW102123706A TWI532012B (zh) 2012-07-09 2013-07-02 基於梯度直方圖轉換圖像描述符之方法及相對的圖像處理裝置
ARP130102388 AR091674A1 (es) 2012-07-09 2013-07-04 Metodo para transformar un descriptor de imagen basado en un histograma de gradiente y aparato de procesamiento de imagenes relacionado
US15/260,764 US10713523B2 (en) 2012-07-09 2016-09-09 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus
JP2017154781A JP6429134B2 (ja) 2012-07-09 2017-08-09 勾配ヒストグラムに基づいて画像記述子を変換する方法および関連する画像処理装置
JP2018196276A JP6714669B2 (ja) 2012-07-09 2018-10-18 勾配ヒストグラムに基づいて画像記述子を変換する方法および関連する画像処理装置
HK19101104.0A HK1259139A1 (zh) 2012-07-09 2019-01-22 用於轉換圖像描述符的方法和相關圖像處理設備

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000602A ITTO20120602A1 (it) 2012-07-09 2012-07-09 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.

Publications (1)

Publication Number Publication Date
ITTO20120602A1 true ITTO20120602A1 (it) 2014-01-10

Family

ID=46833121

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000602A ITTO20120602A1 (it) 2012-07-09 2012-07-09 Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.

Country Status (13)

Country Link
US (2) US9454710B2 (it)
EP (2) EP2870568B1 (it)
JP (3) JP6292454B2 (it)
KR (1) KR102193177B1 (it)
CN (2) CN108520265B (it)
AR (1) AR091674A1 (it)
BR (1) BR112014031268A2 (it)
ES (1) ES2811532T3 (it)
HK (1) HK1259139A1 (it)
IT (1) ITTO20120602A1 (it)
RU (1) RU2661795C2 (it)
TW (1) TWI532012B (it)
WO (1) WO2014009198A1 (it)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015011612A1 (en) 2013-07-24 2015-01-29 Sisvel Technology S.R.L. Image processing apparatus and method for encoding an image descriptor based on a gradient histogram
CN114331925A (zh) * 2022-03-15 2022-04-12 北京锐影医疗技术有限公司 一种多尺度相对梯度直方图均衡化方法及装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014111136A1 (en) * 2013-01-16 2014-07-24 Huawei Technologies Co., Ltd. Context based histogram map coding for visual search
CN109923528B (zh) * 2017-09-25 2021-04-09 华为技术有限公司 一种数据访问的方法和装置
JP7087695B2 (ja) * 2018-06-07 2022-06-21 株式会社リコー 学習装置および学習方法
KR20230017549A (ko) * 2021-07-28 2023-02-06 주식회사 넥스트칩 특징점에 대한 기술자를 생성하기 위한 전자 장치 및 그 동작 방법
CN117981319A (zh) * 2021-09-15 2024-05-03 北京达佳互联信息技术有限公司 用于基于块的视频编解码的符号预测

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61239376A (ja) 1985-04-16 1986-10-24 Fujitsu Ltd 画像間の角度差検出装置
JP2000187731A (ja) * 1998-12-21 2000-07-04 Ricoh Co Ltd 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
GB2352076B (en) 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
JP3550681B2 (ja) * 1999-12-10 2004-08-04 日本電気株式会社 画像検索装置及び方法、並びに類似画像検索プログラムを格納した記憶媒体
US6865295B2 (en) 2001-05-11 2005-03-08 Koninklijke Philips Electronics N.V. Palette-based histogram matching with recursive histogram vector generation
JP2003150965A (ja) * 2001-11-14 2003-05-23 Sanyo Electric Co Ltd 形状認識方法及びその装置
KR100959053B1 (ko) * 2003-01-13 2010-05-20 한국전자통신연구원 복수의 이미지 프레임을 갖는 비디오 시퀀스 검색을 위한비선형 양자화 및 유사도 매칭 방법
US7840081B2 (en) * 2004-09-23 2010-11-23 Mitsubishi Denki Kabushiki Kaisha Methods of representing and analysing images
US7715623B2 (en) * 2005-11-14 2010-05-11 Siemens Medical Solutions Usa, Inc. Diffusion distance for histogram comparison
CN100530239C (zh) * 2007-01-25 2009-08-19 复旦大学 基于特征匹配与跟踪的视频稳定方法
JP4629740B2 (ja) * 2008-01-16 2011-02-09 富士フイルム株式会社 撮像装置および方法並びにプログラム
WO2009133856A1 (ja) 2008-04-28 2009-11-05 公立大学法人大阪府立大学 物体認識用画像データベースの作成方法、処理装置および処理用プログラム
DE112008000017T5 (de) 2008-05-09 2009-11-05 Hankuk University of Foreign Studies Research and Industry-University Cooperation Foundation, Yongin Abbilden von Bildern mit Gestaltbeschreibern
US8625861B2 (en) * 2008-05-15 2014-01-07 International Business Machines Corporation Fingerprint representation using gradient histograms
JP4547639B2 (ja) * 2008-08-26 2010-09-22 ソニー株式会社 画像処理装置および方法、並びにプログラム
US8625921B1 (en) * 2008-09-26 2014-01-07 Google Inc. Method for image processing using local statistics convolution
KR101323439B1 (ko) * 2008-11-12 2013-10-29 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티 특징 디스크립터를 표현하고 식별하는 방법, 장치 및 컴퓨터 판독가능 저장 매체
CN101739397A (zh) * 2008-11-17 2010-06-16 新疆亚奥数码科技有限公司 基于mpeg-7的图像检索系统
CN101493891B (zh) * 2009-02-27 2011-08-31 天津大学 基于sift的具有镜面翻转不变性的特征提取和描述方法
JP4877374B2 (ja) * 2009-09-02 2012-02-15 株式会社豊田中央研究所 画像処理装置及びプログラム
WO2011071467A1 (en) 2009-12-09 2011-06-16 Thomson Licensing Method for distinguishing a 3d image from a 2d image and for identifying the presence of a 3d image format by feature correspondence determination
US8582889B2 (en) 2010-01-08 2013-11-12 Qualcomm Incorporated Scale space normalization technique for improved feature detection in uniform and non-uniform illumination changes
CN101794395B (zh) 2010-03-11 2012-04-25 合肥金诺数码科技股份有限公司 一种基于Sift算法的图像匹配定位方法
US9530073B2 (en) * 2010-04-20 2016-12-27 Qualcomm Incorporated Efficient descriptor extraction over multiple levels of an image scale space
US8625902B2 (en) * 2010-07-30 2014-01-07 Qualcomm Incorporated Object recognition using incremental feature extraction
US8428397B1 (en) * 2010-08-26 2013-04-23 Adobe Systems Incorporated Systems and methods for large scale, high-dimensional searches
US8538164B2 (en) * 2010-10-25 2013-09-17 Microsoft Corporation Image patch descriptors
JP5289412B2 (ja) * 2010-11-05 2013-09-11 株式会社デンソーアイティーラボラトリ 局所特徴量算出装置及び方法、並びに対応点探索装置及び方法
KR101127793B1 (ko) * 2011-01-04 2012-03-23 위드로봇 주식회사 이미지 인식 시스템 및 그 제공방법
CN102306383B (zh) * 2011-07-01 2013-05-29 北京交通大学 适用于宽基线图像密集匹配的描述符的构建方法
JP2013097583A (ja) * 2011-11-01 2013-05-20 Nec Corp 特徴量生成装置、方法及びプログラム
EP2783312A4 (en) * 2011-11-21 2015-04-08 Nokia Corp METHOD FOR PROCESSING IMAGES AND CORRESPONDING APPARATUS
US9412037B2 (en) * 2012-01-02 2016-08-09 Telecom Italia S.P.A. Method and system for image analysis based upon correlation relationships of sub-arrays of a descriptor array

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MA R ET AL: "MI-SIFT: Mirror and Inversion Invariant Generalization for SIFT Descriptor", CIVR, ACM, US, 5 July 2010 (2010-07-05), pages 228 - 235, XP007918135, ISBN: 978-1-4503-0117-6 *
MANJUNATH B S ET AL: "Color and Texture Descriptors", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 11, no. 6, 1 June 2001 (2001-06-01), XP011014212, ISSN: 1051-8215, DOI: 10.1109/76.927424 *
MEHMET FIRAT VURAL ET AL: "Registration of multispectral satellite images with Orientation-Restricted SIFT", GEOSCIENCE AND REMOTE SENSING SYMPOSIUM,2009 IEEE INTERNATIONAL,IGARSS 2009, IEEE, PISCATAWAY, NJ, USA, 12 July 2009 (2009-07-12), pages III - 243, XP031631200, ISBN: 978-1-4244-3394-0 *
PASCHOS G ET AL: "Histogram ratio features for color texture classification", PATTERN RECOGNITION LETTERS, ELSEVIER, AMSTERDAM, NL, vol. 24, no. 1-3, 1 January 2003 (2003-01-01), pages 309 - 314, XP004391177, ISSN: 0167-8655, DOI: 10.1016/S0167-8655(02)00244-1 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015011612A1 (en) 2013-07-24 2015-01-29 Sisvel Technology S.R.L. Image processing apparatus and method for encoding an image descriptor based on a gradient histogram
CN114331925A (zh) * 2022-03-15 2022-04-12 北京锐影医疗技术有限公司 一种多尺度相对梯度直方图均衡化方法及装置
CN114331925B (zh) * 2022-03-15 2022-07-19 北京锐影医疗技术有限公司 一种多尺度相对梯度直方图均衡化方法及装置

Also Published As

Publication number Publication date
TW201407542A (zh) 2014-02-16
US20150332116A1 (en) 2015-11-19
BR112014031268A2 (pt) 2017-06-27
EP3702965B1 (en) 2021-08-04
EP3702965A1 (en) 2020-09-02
JP2015522194A (ja) 2015-08-03
KR20150031333A (ko) 2015-03-23
RU2015104066A (ru) 2016-08-27
ES2811532T3 (es) 2021-03-12
RU2661795C2 (ru) 2018-07-19
HK1259139A1 (zh) 2019-11-29
EP2870568A1 (en) 2015-05-13
US10713523B2 (en) 2020-07-14
US9454710B2 (en) 2016-09-27
TWI532012B (zh) 2016-05-01
WO2014009198A1 (en) 2014-01-16
EP2870568B1 (en) 2020-06-24
JP6429134B2 (ja) 2018-11-28
CN108520265A (zh) 2018-09-11
CN104428793A (zh) 2015-03-18
CN108520265B (zh) 2021-09-07
JP2017224337A (ja) 2017-12-21
CN104428793B (zh) 2018-05-08
AR091674A1 (es) 2015-02-18
KR102193177B1 (ko) 2020-12-21
JP6292454B2 (ja) 2018-03-14
JP6714669B2 (ja) 2020-06-24
JP2019040612A (ja) 2019-03-14
US20170300775A1 (en) 2017-10-19

Similar Documents

Publication Publication Date Title
ITTO20120602A1 (it) Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.
Tsai et al. Location coding for mobile image retrieval
CN108182421B (zh) 视频分割方法和装置
CN108682007B (zh) 基于深度随机森林的jpeg图像重采样自动检测方法
US20100114871A1 (en) Distance Quantization in Computing Distance in High Dimensional Space
Xie et al. Bag-of-words feature representation for blind image quality assessment with local quantized pattern
Kumar et al. Near lossless image compression using parallel fractal texture identification
Hoffmann et al. Discrete Green’s functions for harmonic and biharmonic inpainting with sparse atoms
Redondi et al. Low bitrate coding schemes for local image descriptors
US9595113B2 (en) Image transmission system, image processing apparatus, image storage apparatus, and control methods thereof
Hassan et al. Spatial domain lossless image data compression method
EP3025274A1 (en) Image processing apparatus and method for encoding an image descriptor based on a gradient histogram
Thepade et al. Feature extraction with ordered mean values for content based image classification
Zhang et al. Blind image quality assessment based on local quantized pattern
CN110728217A (zh) Sar图像识别方法、装置、设备和存储介质
Ricordel et al. Analysis of Mojette Transform Projections using Z3 lattice versus A3 lattice
KR20150073409A (ko) 동영상의 근복사 검출 방법 및 시스템
Divya et al. PERFORMANCE ANALYSISOFDISTANCE METRIC FOR CONTENT BASED IMAGE RETRIEVAL
Kim et al. A novel image retrieval scheme using DCT filter-bank of weighted color components
Gemelli et al. Structure Matters: Analyzing Videos Via Graph Neural Networks for Social Media Platform Attribution
Jin et al. An accurate and efficient nonlinear depth quantization scheme
KR20200075190A (ko) Gpu를 기반으로 한 결정 트리를 이용한 대응점 탐색 방법
Zhang et al. Near Duplicate Image Pairs Detection Using Double-Channel Convolutional Neural Networks
Pham KS entropy of images
Thepade et al. Research Article Feature Extraction with Ordered Mean Values for Content Based Image Classification