ITTO20120986A1

ITTO20120986A1 - Procedimento per l'estrazione di informazioni distintive da un flusso di frame video digitali, sistema e prodotto informatico relativi

Info

Publication number: ITTO20120986A1
Application number: IT000986A
Authority: IT
Inventors: Danilo Pietro Pau
Original assignee: St Microelectronics Srl
Priority date: 2012-11-14
Filing date: 2012-11-14
Publication date: 2014-05-15
Also published as: US9986240B2; US9571398B2; US20170111638A1; US20140133310A1

Description

â€œProcedimento per lâ€™estrazione di informazioni distintive da un flusso di frame video digitali, sistema e prodotto informatico relativiâ€

TESTO DELLA DESCRIZIONE

Campo tecnico

La presente descrizione si riferisce alle tecniche per estrarre informazioni distintive (feature) da un flusso di immagini (frame) video digitali.

Varie forme di attuazione possano applicarsi al trattamento di immagini, ad esempio nell'ambito di processi di matching (ricerca degli abbinamenti o corrispondenza) e/o di retrieval (ricerca e recupero) di immagini.

Sfondo tecnologico

Documenti quali il documento ISO/IEC JTC1/SC29/WG11/W12929, July 2012, Stockholm, SE, Test Model 3: Compact Descriptors For Visual Search descrivono tecniche di elaborazione (ad esempio con architettura pipeline) basate sull'impiego di descrittori compatti utilizzabili per funzioni di matching e retrieval di immagini.

Il documento in questione non prende peraltro in considerazione il fatto che l'uso di tali descrittori, ad esempio per operazioni di abbinamento o recupero da parte di un server, puÃ² essere soggetto a vincoli in termini di larghezza di banda o bitrate disponibile. Questa situazione puÃ² derivare, ad esempio, da limitazioni della larghezza banda disponibile su un collegamento, della variabilitÃ della velocitÃ di trasmissione dati, da fenomeni di congestione di rete o da considerazioni di varia natura legate alle prestazioni computazionali del server.

Scopo e sintesi

Varie forme di attuazione si prefiggono lo scopo di superare questa carenza.

Varie forme di attuazione permettono di conseguire tale scopo grazie a un procedimento avente le caratteristiche richiamate nelle rivendicazioni che seguono.

Varie forme di attuazione possono riferirsi ad un corrispondente sistema nonchÃ© ad un prodotto informatico caricabile nella memoria di almeno un elaboratore e comprendente parti di codice software suscettibili di realizzare le fasi del procedimento quando il prodotto Ã ̈ eseguito su almeno un elaboratore. CosÃ¬ come qui utilizzato, il riferimento ad un tale prodotto informatico Ã ̈ inteso essere equivalente al riferimento ad un mezzo leggibile da elaboratore contenente istruzioni per il controllo del sistema di elaborazione per coordinare lâ€™attuazione del procedimento secondo l'invenzione. Il riferimento ad "almeno ad un elaboratore" Ã ̈ evidentemente inteso a mettere in luce la possibilitÃ che la presente invenzione sia attuata in forma modulare e/o distribuita.

Le rivendicazioni formano parte integrante dell'insegnamento tecnico qui somministrato in relazione allâ€™invenzione.

Varie forme di attuazione permettono di fissare il numero di informazioni distintive o feature selezionato per ciascuna frame in funzione di un valore obiettivo (target) di bitrate con la conseguente possibilitÃ di sfruttare in modo ottimale e dinamico le risorse disponibili in termini di bitrate per lâ€™utilizzazione dei relativi descrittori.

Varie forme di attuazione permettono di codificare e inviare verso un server descrittori compatti cosÃ¬ da poter migliorare le prestazioni in termini di precisione e di occupazione di canale (e di risorse, in generale) ad esempio da parte di un bitstream di richieste (o query).

Breve descrizione delle figure

Varie forme di attuazione saranno ora descritte, a puro titolo di esempio non limitativo, con riferimento alle figure annesse, in cui:

- le figure 1 e 2 sono schemi a blocchi funzionali che illustrano possibili funzioni di trattamento di immagini basate sulla estrazione di informazioni distintive (feature),

- la figura 3 Ã ̈ uno schema a blocchi funzionale che illustra possibili modalitÃ di estrazione di feature,

- la figura 4 Ã ̈ uno schema a blocchi genericamente illustrativo di un possibile contesto di applicazione di forme di attuazione,

- la figura 5 Ã ̈ uno schema a blocchi rappresentativo della generale architettura di esempi di attuazione, e

- la figura 6 Ã ̈ uno schema a blocchi che illustra esempi di attuazione con diretto riferimento allo schema della figura 3.

Descrizione particolareggiata

Nella seguente descrizione sono illustrati vari dettagli specifici finalizzati ad unâ€™approfondita comprensione di vari esempi di forme di attuazione. Le forme di attuazione possono essere realizzate senza uno o piÃ¹ dei dettagli specifici, o con altri metodi componenti materiali, etc. In altri casi, strutture, materiali o operazioni noti non sono mostrati o descritti in dettaglio per evitare di rendere oscuri i vari aspetti delle forme di attuazione.

Il riferimento ad â€œuna forma di attuazioneâ€ nellâ€™ambito di questa descrizione sta ad indicare che una particolare configurazione, struttura o caratteristica descritta in relazione alla forma di attuazione Ã ̈ compresa in almeno una forma di attuazione. Quindi, frasi come â€œin una forma di attuazioneâ€ , eventualmente presenti in diversi luoghi di questa descrizione non sono necessariamente riferite alla stessa forma di attuazione. Inoltre, particolari conformazioni, strutture o caratteristiche possono essere combinate in ogni modo adeguato in una o piÃ¹ forme di attuazione.

I riferimenti qui utilizzati sono soltanto per comoditÃ del lettore e non definiscono dunque lâ€™ambito di tutela o la portata delle forme di attuazione.

Le figure 1 a 3 sono desunte dal documento ISO/IEC JTC1/SC29/WG11/W12929, giÃ in precedenza citato, ed in particolare dal capitolo 1. Introduction e dal capitolo 2. Compact descriptor extraction del documento in questione, che, al successivo capitolo 5. Software Architecture and implementation details illustra esempi di implementazione di una architettura per la selezione delle informazioni distintive piÃ¹ significative da comprimere in ciascuna frame video digitale considerata.

In particolare, gli schemi delle figure 1 e 2 illustrano a livello di schema a blocchi esempi di architetture funzionali utilizzabili per svolgere una funzione di calcolo degli abbinamenti o corrispondenza (matching) M o di reperimento o ricerca (search o retrieval) S di frame video, ossia di immagini, digitali.

Nel primo caso (azione di matching M della figura 1) Ã ̈ possibile verificare in modo automatizzato (ad esempio tramite un computer) se due immagini rappresentano gli stessi oggetti o la stessa scena. CiÃ² avviene operando su su una immagine di interrogazione (Query Image) QI e su una immagine di riferimento (Reference Image) RI.

A tal fine, entrambe le immagini possono essere sottoposte ad un'operazione di estrazione di descrittori (genericamente indicata con 10) e ad un operazione di confronto condotta in M operando appunto sui descrittori ed informazioni distintive in 10 e diretta a rilevare l'eventuale adattamento o matching. Il risultato dell'elaborazione, indicato con R, indica se l'immagine di interrogazione o Query Image QI rappresenta oppure no gli stessi oggetti o la stessa scena, ossia si adatta o corrisponde a (â€œmatchesâ€ ) l'immagine di riferimento RI.

La funzione di retrieval cui fa schematicamente riferimento la figura 2 opera fondamentalmente secondo gli stessi criteri con la differenza data dal fatto che, nel caso della figura 2, il confronto in S Ã ̈ fatto con piÃ¹ immagini di riferimento RIiestratte da una base dati o database DB. In questo modo Ã ̈ possibile ricercare e reperire, nell'ambito del database DB, una o piÃ¹ immagini che riproducono gli stessi oggetti o la stessa scena dell'immagine di interrogazione QI.

Varie architetture e tecnologie di componenti suscettibili di realizzare le funzioni illustrate con riferimento alle figure 1 e 2 sono definite nel cosiddetto Test Model 3.0 (TM3) for Compact Descriptors for Visual Search (noto anche con l'acronimo di CDVS): il modello TM3 implementa le funzionalitÃ richieste per l'estrazione e il confronto di descrittori compatti limitati ad un insieme di lunghezze di descrittore (Descriptor Length) predeterminate.

Lo schema a blocchi della figura 3 illustra un possibile schema a blocchi di un sistema di elaborazione (ad esempio strutturata come pipeline) per l'estrazione di informazioni distintive o feature da frame video.

In varie forme di attuazione, un descrittore compatto di unâ€™immagine I (che, in termini piÃ¹ generali, puÃ² essere vista sotto forma di trame o frame video digitali), puÃ² comprendere, oltre ad un certo numero di descrittori locali, anche un singolo descrittore globale suscettibile di rappresentare l'immagine nel suo insieme.

Lo schema della figura 3 illustra un esempio di architettura che permette di produrre un descrittore compatto di un'immagine/frame secondo il modello TM3 attraverso una sequenza di passi di elaborazione.

Nello schema della figura 3, il riferimento 12 illustra una funzione/modulo di identificazione di punti di interesse o punti chiave (interest points o keypoints) in unâ€™immagine basata su una rappresentazione multiscala e suscettibile di essere realizzata, ad esempio, con una tecnica di differenze gaussiane (Differences-of-Gaussians o DoG).

Nello schema esemplificativo della figura 3, la funzione/modulo DoG 12 Ã ̈ seguita da una funzione/modulo 14 in cui i cosiddetti feature point sono descritti, ad esempio, con una trasformata invariante rispetto alla scala (Scale Invariant Feature Transform o SIFT).

Nello schema esemplificativo della figura 3, i risultati dell'azione di trasformata realizzata in 14 vengono alimentati ad una funzione/modulo 16 di selezione dei punti di interesse o keypoint e descrittori locali associati, destinata a svolgere una funzione di selezione delle informazioni distintive o feature.

Ad esempio, in varie forme di attuazione, la funzione/modulo 16 puÃ² assegnare un valore positivo a ciascun tratto in funzione delle sue caratteristiche DOG, del relativo vettore SIFT e delle sue coordinate.

Ad esempio, nel caso in cui la n-esima feature di un'immagine sia indicata con sn(con una connotazione che incorpora le caratteristiche DoG, il vettore SIFT e le relative coordinate), Ã ̈ possibile indicare con r una grandezza indicativa della rilevanza del punto di interesse (key point relevance); in questo modo, ad un determinato tratto o feature Ã ̈ possibile associare un valore r(sn), ed i suddetti valori di rilevanza possono essere ordinati in una scala decrescente facendo sÃ¬ che, ad esempio, soltanto le prime L feature n1, â€¦, nLsiano mantenute, cosÃ¬ da poter mantenere la lunghezza media della sequenza entro un certo limite di lunghezza.

Il risultato della elaborazione svolta in 16 (ossia la selezione di un numero limitato di punti chiave in grado di massimizzare una misura della qualitÃ attesa in funzione dell'uso previsto - ad esempio per azioni di matching o search, cosÃ¬ come esemplificate nelle figure 1 e 2) puÃ² essere sottoposto nellâ€™ambito di una funzione/modulo 18 ad una compressione dei descrittori locali, ossia una quantizzazione scalare o vettoriale delle feature selezionate in 16.

Il risultato dell'elaborazione svolta in 18 Ã ̈ poi trasmesso ad una funzione/modulo 20 di compressione delle coordinate che comprime le coordinate dei punti di interesse selezionati cosÃ¬ da generare in uscita i descrittori locali LD.

Il risultato della elaborazione svolta in 16 puÃ² poi essere inviato anche ad una funzione/modulo 22 che svolge una funzione di aggregazione delle feature (ad esempio SIFT) cosÃ¬ da formare un descrittore globale GD.

Possibili criteri dâ€™implementazione dello schema esemplificato nella figura 3 sono descritti in dettaglio nel documento ISO/IEC JTC1/SC29/WG11/W12929, giÃ piÃ¹ volte citato, anche alla luce dell'articolo di D.G. Lowe: "Distinctive Image Features from Scale-Invariant Keypointsâ€ , International Journal of Computer Vision, 60, 91-110 (2004). Per motivi di brevitÃ , la relativa descrizione di dettaglio non viene quindi ripetuta in questa sede, anche perchÃ© di per sÃ© non essenziale ai fini della comprensione delle forme di attuazione.

Lo schema della figura 4 fa riferimento ad una possibile applicazione di elaborazione e trattamento di frame video digitali (ad esempio quali funzioni di matching o di search/retrieval, cosÃ¬ come descritte in precedenza) attuata su un flusso di frame video in cui possono essere identificabili una prima frame Fied una seconda frame Fi+1qui considerate per semplicitÃ separate da un intervallo di tempo 1/fps dove fps Ã ̈ il numero di frame per secondo nel flusso di frame video considerato: si apprezzerÃ peraltro che, in varie forme di attuazione, le frame Fie Fi+1possono anche non essere lâ€™una consecutiva all'altra nel flusso e cioÃ ̈ essere separate per multipli di 1/fps.

In varie forme di attuazione, una funzione di matching come qui considerata puÃ² trovare applicazione anche in una tecnica di codifica di un flusso di frame video digitali cosÃ¬ come descritta in una domanda di brevetto per invenzione industriale depositato in pari data dalla stessa richiedente.

Rifacendosi a quanto detto in precedenza con riferimento alle figure 1 a 3 (ed alla illustrazione di dettaglio fornita nei documenti ISO/IEC JTC1/SC29/WG11/W12929 e Lowe in precedenza citati), l'estrazione dei descrittori attuata nellâ€™architettura descritta a titolo di esempio con riferimento alla figura 3 puÃ² essere ricondotta ad una generazione di rispettive sequenze (ad es. le sequenze utilizzate in M e S per confrontate le immagini di â€œqueryâ€ QI con le immagini di riferimento RI e RIi) comprendenti un insieme di coppie [KP1i, D1i], [KP2i, D2i,], â€¦â€¦, [Kmi, Dmi] in cui ai punti di interesse KP1i, KP2i,â€¦â€¦ KPmisono associati i relativi descrittori D1i, D2i, â€¦â€¦, Dmi.

Una tale sequenza puÃ² essere compressa ad un numero limitato di bit limitando il numero delle coppie comprese nella sequenza. Ad esempio, il numero m delle coppie puÃ² essere limitato ad un valore di soglia Tiper ciascuna frame, ossia m = 1, â€¦, Tiper la frame Ficon il numero di bit relativi limitato ad un valore num_bitsi, con la soglia Tiche identifica in pratica il numero di coppie punti di interesse/descrittori raggiunto il quale ogni ulteriore coppia, anche se rilevante, non contribuirebbe a generare bit in una sequenza corrispondente o, in alternativa, sarebbe compressa a 0 bit.

CosÃ¬ come illustrato nella figura 5, in varie forme di attuazione, il risultato dellâ€™azione di estrazione, ossia la sequenza di coppie di punti di interesse e relativi descrittori [KP1i, D1i], [KP2i, D2i,], â€¦â€¦, [KPmi, Dmi] puÃ² essere inviato dal modulo estrattore 10 verso un server 24 destinato ad utilizzare le suddette sequenze per una funzione di elaborazione.

Come esempio, rifacendosi alle figure 1 e 2, si puÃ² pensare a contesti di impiego le sequenze [KP1i, D1i], [KP2i, D2i,], â€¦â€¦, [KPmi, Dmi] estratte dalle immagini di query QI siano inviate verso un server 24 che svolge le funzioni di matching M o retrieval S operando su sequenze omologhe inerenti alle immagini di riferimento RI o Rii, ad esempio residenti presso il server 24 stesso.

La trasmissione delle sequenze di query [KP1i, D1i], [KP2i, D2i,], â€¦â€¦, [KPmi, Dmi] puÃ² avvenire su un canale di trasmissione costituito, ad esempio, da un canale reale o virtuale nell'ambito di una rete N, con una banda o bitrate disponibile non costante, ma variabile nel tempo, ad esempio, per fenomeni di congestione della rete N e/o per il variare del rapporto segnale/rumore o segnale/interferenza sul canale di trasmissione (caso tipico delle reti wireless). Di conseguenza, il bitrate di cui il server 24 puÃ² disporre per lâ€™elaborazione puÃ² variare e risultare limitato in modo diverso nel tempo.

Sempre a titolo di esempio, in aggiunta o in alternativa, possono determinarsi situazioni in cui il bitrate di cui il server 24 puÃ² disporre per lâ€™elaborazione puÃ² variare per fenomeni legati al server stesso, ad esempio di eccessivo sovraccarico computazionale, perchÃ© il server 24 opera in multitasking ed il bitrate allocabile allâ€™elaborazione delle query ricevute puÃ² variare nel tempo secondo il carico e la schedulazione dei task.

La figura 5 esemplifica il fatto che, in varie forme di attuazione, il valore corrente di bitrate disponibile al server 24 (indicato con Target_bitrate) Ã ̈ trasmesso dal server 24 verso l'estrattore 10.

CosÃ¬ come schematicamente illustrato nella figura 6 (in cui parti e componenti identici o equivalenti a quelli giÃ descritti con riferimento alla figura 3 sono indicati con gli stessi riferimenti che compaiono nella figura 3), in varie forme di attuazione il valore Target_bitrate puÃ² essere utilizzato in una funzione/modulo 26 per calcolare il valore di soglia di selezione Ti utilizzato dallâ€™estrattore 10, ad esempio in 16, per selezionare i punti chiave e limitare il numero m = 1, â€¦, Tidelle coppie [KP1i, D1i], [KP2i, D2i,], â€¦â€¦, [KPmi, Dmi] estratte per la generica frame FicosÃ¬ da limitare in modo corrispondente al valore num_bitsiil numero di bit relativi

In varie forme di attuazione, il calcolo puÃ² essere quindi svolto in modo adattivo, limitando superiormente il numero di coppie punto di interesse/descrittore generate dallâ€™estrattore 10 in funzione del valore Target_bitrate: questo valore identifica la capacitÃ da parte del server 24 di ricevere ed elaborare tali sequenze. In varie forme di attuazione, la suddetta azione di limitazione permette di evitare di impegnare lâ€™estrattore 10 nella estrazione di coppie punto di interesse/descrittore che al momento il server 24 non potrebbe ricevere o, anche ricevendole, non riuscirebbe ad elaborare.

In varie forme di attuazione, la funzione/modulo 26 puÃ² essere configurata per generare il suddetto valore di soglia Ti in funzione del valore di bitrate Target_bitrate indicato come disponibile dal server 24 (valore che si assume essere variabile nel tempo, idealmente da frame a frame, anche se le relative variazioni sono di solito piÃ¹ lente) tenendo in conto anche due altri parametri, ossia: - il parametro fps, ossia il numero di frame per secondo nel flusso di frame in ingresso al blocco 12, e - il numero di bit num_bitsiutilizzato per comprimere le coppie punto di interesse/descrittore, rilevato, ad esempio, da un contatore di bit 28 in grado di â€œsentire" i descrittori LD e GD.

In varie forme di attuazione, il modulo 26 puÃ² operare secondo i seguenti criteri.

Partendo dal numero bit num_bitsiutilizzato per â€œcodificareâ€ (ossia per esprimere) le coppie punto di interesse/descrittore per la frame FiÃ ̈ possibile determinare un numero di bit medio average_bit_couplei: il numero di bit utilizzato per ciascuna coppia puÃ² infatti essere diverso da coppia a coppia, ad esempio in funzione delle caratteristiche del singolo descrittore.

Per il suddetto numero medio average_bit_coupleipuÃ² valere la seguente espressione:

average_bit_couplei= num bitsi/Ti.

Partendo dalla grandezza Target_bitrate ricevuta dal server 24 Ã ̈ altresÃ¬ possibile calcolare un valore di bit obiettivo (target) per ciascuna frame Target_Fi, esprimibile come:

Target_Fi= Target_bitrate/fps.

Ãˆ poi possibile calcolare, con riferimento alla generica frame Fi, la differenza:

Î ́i= Target_Fi- num_bitsi

ossia la differenza (con segno) fra il valore di bit obiettivo (target) per la frame i-esima ed il numero effettivo di bit effettivamente utilizzati per â€œcodificareâ€ la frame in questione.

Il valore assoluto della differenza Î ́iindica di quanto lâ€™azione di estrazione svolta dallâ€™estrattore 10 si discosta dalla capacitÃ di ricezione/elaborazione del server 24 ed il segno identifica il verso dello scarto:

- positivo, se il server 24 puÃ² ricevere/elaborare piÃ¹ di quanto lâ€™estrattore 10 gli manda;

- negativo, se il server 24 non Ã ̈ in grado di ricevere/elaborare quanto lâ€™estrattore 10 gli manda.

In funzione della differenza Î ́iÃ ̈ allora possibile stabilire un valore obiettivo Target_Fi+1definito come:

Target_Fi+1= Target_Fi+ Î ́i

ossia aggiungendo o sottraendo dal processo di codifica cosÃ¬ come al momento attuato dallâ€™estrattore 10 un numero di bit pari a Î ́i, ad esempio calcolando un nuovo valore di soglia Ti+1per il numero di coppie punto di interesse/descrittore da utilizzare per la frame successiva Fi+1, ad esempio sulla base della relazione:

Ti+1=target_Fi+1/average_bit_couplei.

In varie forme di attuazione, il parametro average_bit_couple potrebbe essere stimato per la frame i+1 con un primo tentativo di codifica per poi essere applicato in un secondo passo reale di codifica.

Naturalmente, fermo restando il principio dell'invenzione, i particolari di realizzazione e le forme di attuazione potranno variare, anche in modo significativo, rispetto a quanto qui illustrato a puro titolo di esempio non limitativo senza per questo uscire dall'ambito di protezione. Tale ambito di protezione Ã ̈ definito dalle rivendicazioni annesse.

Claims

RIVENDICAZIONI 1. Procedimento per estrarre informazioni distintive o feature da frame video digitali (Fi, Fi+1) in un flusso, il procedimento comprendendo: - estrarre con un estrattore (10) da dette frame video (Fi, Fi+1) rispettive sequenze di coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) limitando (16) ad un valore di soglia (Ti) il numero (m) di coppie estratte per ciascuna frame, - inviare le sequenze di coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte con lâ€™estrattore (10) verso un server (24) per lâ€™elaborazione con un bitrate avente un valore che varia nel tempo, - ricevere detto valore di bitrate variabile nel tempo allâ€™estrattore (10) come bitrate obiettivo (Target_bitrate) per lâ€™estrazione, - limitare (16) ad un valore di soglia (Ti) variabile nel tempo in funzione di detto bitrate obiettivo (Target_bitrate) il numero (m) di coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte dallâ€™estrattore (10).
2. Procedimento secondo la rivendicazione 1, in cui detta elaborazione al server (24) comprende un'elaborazione compresa fra un abbinamento o corrispondenza (matching - M) ed un reperimento o ricerca (search o retrieval - S).
3. Procedimento secondo la rivendicazione 1 o la rivendicazione 2, comprendente: - determinare, in funzione di detto bitrate obiettivo (Target_bitrate), un numero di bit obiettivo (Target_Fi) disponibile per le coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per una certa frame (Fi), - determinare, per detta frame (Fi), una differenza con segno (Î ́i) fra il suddetto numero di bit obiettivo (Target_Fi) disponibile per le coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per una certa frame (Fi) ed il numero di bit (num_bitsi) compreso nelle coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per la stessa frame (Fi), e - determinare un numero di bit obiettivo (Target_Fi+1) disponibile per le coppie di punti di interesse/descrittori da estrarre per una frame (Fi+1) successiva nel flusso aggiungendo detta differenza con segno (Î ́i) al suddetto numero di bit obiettivo (Target_Fi) disponibile per le coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per detta certa frame (Fi).
4. Procedimento secondo la rivendicazione 3, comprendente: - determinare un numero medio di bit (average_bit_couplei) compreso nelle coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per detta certa frame (Fi), e - determinare detto valore di soglia (Ti+1) per le coppie di punti di interesse/descrittori da estrarre per una frame (Fi+1) successiva nel flusso quale rapporto fra il numero di bit obiettivo (Target_Fi+1) disponibile per le coppie di punti di interesse/descrittori da estrarre per detta frame (Fi+1) successiva nel flusso e detto numero medio di bit (average_bit_couplei) compreso nelle coppie di punti di interesse/descrittori ([KP1i, D1i], [KP2i, D2i], â€¦, [KPmi, Dmi]) estratte per detta certa frame (Fi).
5. Sistema per estrarre informazioni distintive o feature da un flusso di video frame digitali, il sistema comprendendo un estrattore (10) configurato per operare con il procedimento secondo una qualsiasi delle rivendicazioni 1 a 4.
6. Prodotto informatico caricabile nella memoria di almeno un elaboratore e comprendente porzioni di codice software per attuare le fasi del procedimento secondo una qualsiasi delle rivendicazioni 1 a 4.