IT202000029336A1 - Metodo di riproduzione di un segnale audio - Google Patents

Metodo di riproduzione di un segnale audio Download PDF

Info

Publication number
IT202000029336A1
IT202000029336A1 IT102020000029336A IT202000029336A IT202000029336A1 IT 202000029336 A1 IT202000029336 A1 IT 202000029336A1 IT 102020000029336 A IT102020000029336 A IT 102020000029336A IT 202000029336 A IT202000029336 A IT 202000029336A IT 202000029336 A1 IT202000029336 A1 IT 202000029336A1
Authority
IT
Italy
Prior art keywords
user
processing
hrtf
array
audio signal
Prior art date
Application number
IT102020000029336A
Other languages
English (en)
Inventor
Luca Brayda
Luca Giuliani
Federico Traverso
Original Assignee
Acoesis S R L
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Acoesis S R L filed Critical Acoesis S R L
Priority to IT102020000029336A priority Critical patent/IT202000029336A1/it
Priority to EP21830500.1A priority patent/EP4256803A1/en
Priority to PCT/IB2021/061130 priority patent/WO2022118192A1/en
Priority to US18/255,097 priority patent/US20240015463A1/en
Publication of IT202000029336A1 publication Critical patent/IT202000029336A1/it

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • GPHYSICS
    • G02OPTICS
    • G02CSPECTACLES; SUNGLASSES OR GOGGLES INSOFAR AS THEY HAVE THE SAME FEATURES AS SPECTACLES; CONTACT LENSES
    • G02C11/00Non-optical adjuncts; Attachment thereof
    • G02C11/06Hearing aids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • H04R5/0335Earpiece support, e.g. headbands or neckrests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Description

DESCRIZIONE dell'Invenzione Industriale dal titolo: ?Metodo di riproduzione di un segnale audio?
DESCRIZIONE
La presente invenzione ha per oggetto un metodo di riproduzione di un segnale audio comprendete i seguenti passi:
a) acquisizione di un segnale audio di ingresso, la quale acquisizione avviene attraverso uno o pi? sensori disposti in un punto di acquisizione dello spazio previsto in corrispondenza del corpo di un utente,
b) elaborazione di detto segnale audio di ingresso,
c) generazione di un segnale audio di uscita. Quella appena descritta ? la comune metodologia utilizzata per riprodurre un segnale audio che viene utilizzata ad esempio in dispositivi di ausilio per utenti ipoudenti, quali ad esempio apparecchi acustici e simili.
Le persone sentono i suoni in modo diverso. Ogni suono emesso da una sorgente viene infatti modificato sia dal percorso necessario per raggiungere le nostre orecchie sia dalla specifica conformazione del corpo degli utenti. Se il percorso seguito dal suono pu? essere controllato e fissato, lo stesso non si pu? dire per le caratteristiche anatomiche dei padiglioni auricolari o per le dimensioni della testa, che variano individualmente. Tali caratteristiche consentono, tra l'altro, di distinguere la direzione di arrivo di un'ambulanza o di concentrarci su una voce circondata dal rumore del cocktail party di un ristorante.
Questo effetto pu? essere rappresentato attraverso una funzione di trasferimento che viene comunemente chiamata Head Related Transfer Function (HRTF). L'HRTF ? caratterizzato da variazioni sia nelle frequenze che nella direzione di arrivo del suono. L'HRTF pu? essere misurato raccogliendo il suono come all'ingresso di entrambi i canali uditivi.
Di conseguenza l'HRTF ? soggetto alla presenza di testa, spalle e padiglione auricolare. Queste caratteristiche uniche, diverse per ogni singola persona, influenzano il suono che si sente al punto che, se rimosse, si ha la sensazione che i rumori, le voci ed eventuali altri segnali acustici non siano pi? "naturali".
Questa privazione pu? avvenire se un utente ascolta i suoni per mezzo di un dispositivo che si trova tra l'utente e la sorgente: ? il caso dei suoni registrati, ad esempio, da un microfono nello spazio libero. Essendo un microfono diverso dal nostro sistema acustico, qualsiasi suono registrato non ? soggetto all'effetto di un HRTF. Pertanto, qualsiasi suono registrato da un microfono in questa condizione non mantiene le caratteristiche di una scena acustica naturale ed ? percepito come distorto. Lo stesso processo si verifica per una serie di microfoni, o un singolo microfono direzionale, progettato per puntare (per costruzione o tramite beamforming) verso direzioni specifiche.
Tuttavia, spesso i vantaggi della potenza direzionale di tali soluzioni sono maggiori dell'inconveniente dovuto alla minore naturalezza della scena acustica.
In particolare, la presente invenzione si rivolge ad una metodologia di elaborazione di un segnale audio, utilizzabile su qualsivoglia dispositivo di ausilio, sia esso un apparecchio acustico o un qualsivoglia dispositivo indossabile.
Allo stato dell?arte sono noti occhiali che presentano sulla montatura schiere di microfoni atti ad acquisire un segnale audio che viene elaborato in modo da attenuare tutti i suoni che non provengono dalla direzione di puntamento della schiera di microfoni, ossia dalla direzione in cui guarda l?utente.
Una schiera di microfoni include una pluralit? di sensori acustici passivi posizionati in uno spazio tridimensionale.
Il suono che viene rilevato da un sensore acustico ? caratterizzato dalla scena acustica che circonda la schiera di microfoni.
La scena acustica rilevata dai sensori dipende dai percorsi di propagazione dalle sorgenti ai ricevitori (i microfoni) e pu? variare in base all'ambiente in cui si trova la schiera di microfoni.
Ad esempio, la propagazione del suono ? diversa in uno spazio aperto rispetto ad uno spazio chiuso e pu? variare ulteriormente in base alla geometria della stanza o in base a ostacoli che provocano distorsioni del segnale audio ricevuto.
Inoltre, la posizione dei sensori acustici in prossimit? di un oggetto di distorsione (ad esempio una parte del corpo dell?utente, come ad esempio la testa) pu? contribuire a generare ulteriori effetti di distorsione, come riflessioni e rifrazioni di onde sonore.
Di conseguenza, se una schiera di microfoni si trova sul lato della testa umana, allora ? soggetta ad acquisire distorsioni dovute alla presenza del corpo dell?utente e, in particolare nel caso citato degli occhiali, agli effetti di mascheramento della testa e delle spalle.
A causa delle distorsioni, il suono registrato all?ingresso del canale auricolare, cio? quello elaborato dall'orecchio interno, non pu? essere lo stesso di quello registrato all'esterno del padiglione auricolare.
Tali distorsioni caratterizzano ogni soggetto a seconda dei parametri antropometrici e sono differenti tra i lati della testa.
Una funzione di trasferimento della schiera (ATF) caratterizza il modo in cui la schiera di microfoni elabora il suono ricevuto dalla fase di acquisizione alla generazione del segnale di uscita. Una schiera di microfoni pu? essere associato a diverse funzioni di trasferimento che possono variare a seconda dell'elaborazione desiderata.
Il guadagno della schiera ? il guadagno specifico fornito da un array rispetto ad un particolare rumore acustico.
Il guadagno di una schiera di microfoni, qualunque sia l'uso del microfono, viene misurato mediante mezzi appositi volti a rilevare il guadagno di detta schiera, come ad esempio la Direttivit? ovvero il guadagno dell?array in dipendenza dalla frequenza all?interno di un campo di rumore spazialmente isotropo.
Un insieme omogeneo di sensori acustici condivide la stessa risposta in frequenza nonch? statistiche sulle imperfezioni di fase e guadagno.
La robustezza di una schiera di microfoni a tali imperfezioni, qualunque sia l'uso del microfono, viene misurata mediante il White-Noise Gain (WNG), ovvero il guadagno della schiera dipendente dalla frequenza rispetto ad uno campo di rumore spazialmente bianco.
I parametri citati, Direttivit? e WNG, vengono utilizzati e modificati anche negli occhiali descritti in precedenza, ossia per migliorare la percezione della scena acustica.
Sono infatti presenti diverse soluzioni allo stato dell?arte che propongono peculiari elaborazioni e regolazioni di tali parametri.
Le soluzioni note che si basano sul beamforming, ossia un filtro spaziale, che ? una tecnica di elaborazione del segnale utilizzata nelle schiere di sensori per la trasmissione o la ricezione del segnale in maniera direzionale. In base a tale filtro, i segnali, provenienti da direzioni di arrivo indesiderate, vengano attenuati mentre altri, provenienti da direzioni di interesse, non vengano alterati. Il beamforming pu? essere utilizzato sia sul trasmettitore che sul ricevitore per ottenere la selettivit? spaziale.
Un beamformer ovvero l?elaborazione che implementa il beamforming mira a fornire un filtraggio spaziale utilizzato per preservare i segnali provenienti dalla direzione verso cui ? rivolto l?utente, nella banda di frequenza desiderata.
Ci? si ottiene massimizzando la riduzione dei contributi che non provengono dalla direzione di interesse, ad esempio, nel caso dei microfoni previsti sugli occhiali, dalla direzione dello sguardo, abbassando l'effetto dovuto ai lobi laterali restringendo la larghezza del lobo principale del segnale audio di ingresso.
Tale effetto si pu? ottenere impiegando una finestra di ponderazione agli elementi della schiera.
Qualsiasi array dotato di un beamformer fornisce una Direttivit? della schiera pari al guadagno direzionale rispetto all'uso di un singolo sensore omnidirezionale. Quando la direttivit? della schiera ? maggiore di quella ottenuta dalla stessa schiera con elementi equidistanti e una finestra di ponderazione uniforme, la schiera si dice superdirettiva.
Allo stato dell?arte sono note soluzioni non particolarmente formalizzate per un'applicazione incorporata su occhiali o altri dispositivi indossabili. Queste applicazioni spesso si riferiscono ad apparecchi acustici (HA).
Gli apparecchi acustici HA, sia in configurazione retro-auricolare (BTE) che in-the-ear (ITE), sfruttano la posizione di uno o pi? microfoni vicina o interna al padiglione auricolare e quindi beneficiano di una naturale inclusione degli effetti della Head Related Transfer Function (HRTF) sui suoni ricevuti. Tuttavia, il loro vantaggio nell'avere una posizione sul corpo dell?utente quasi ideale per la ricezione del suono ? associato alle loro ridotte dimensioni, con microfoni molto vicini tra loro. Ci? limita il potenziale guadagno di una schiera, con il conseguente ottenimento di una Direttivit? dell?array particolarmente bassa.
Il filtraggio HRTF, in generale, ? finalizzato a limitare gli effetti dovuti alla presenza del corpo di un ascoltatore all'interno di suoni che vengono ricevuti da un dispositivo dotato di trasduttori acustici passivi.
Il filtraggio HRTF ? una soluzione spesso adottata per consentire l'ascolto dei suoni, ricevuti tramite un microfono o un insieme di microfoni, come se fossero stati raccolti all'ingresso del condotto uditivo.
Questa procedura considera quindi gli effetti dovuti alla presenza del corpo di un ascoltatore nei suoni che vengono ricevuti da un dispositivo dotato di trasduttori acustici passivi.
Pertanto, l'efficacia di tale metodo di misurazione ? tanto forte quanto i segnali ricevuti sono paragonabili a quelli che sarebbero ricevuti in spazio libero. Pi? questa condizione non ? verificata, pi? vengono introdotte distorsioni nei segnali ricevuti e la successiva elaborazione non ? in grado di rimuoverle e pu?, in alcuni casi, amplificare il loro effetto indesiderato.
Nonostante all?interno dei dispositivi di ausilio acustici la Direttivit? dei microfoni sia un parametro di fondamentale importanza, non tiene conto, come descritto in precedenza, della naturalezza del suono che riveste un aspetto rilevante principalmente in due applicazioni.
Il primo ? il caso peculiare delle persone con ipoacusia parziale. In questo caso ? fondamentale unire il vantaggio del filtraggio spaziale con la possibilit? di mantenere il suono naturale, cio? senza distorsioni.
Il secondo ? il caso pi? generale di dispositivi indossabili che vengono utilizzati per registrare i suoni e riprodurre gli stessi suoni all'interno del condotto uditivo.
Per quanto riguarda la direzionalit?, l'utilizzo di schiere di microfoni in grado di fornire un guadagno sensibile su tutto lo spettro della voce non ? raggiungibile dagli apparecchi acustici in quanto limitati dalle loro piccole dimensioni e conseguentemente da un numero limitato di microfoni.
Per quanto riguarda la naturalezza, gli apparecchi acustici affrontano efficacemente il problema con diverse tecniche: in primo luogo, modulano la loro risposta acustica in base alle peculiari capacit? di ascolto del soggetto; in secondo luogo, grazie alle loro ridotte dimensioni, registrano suoni in una posizione privilegiata all'interno del padiglione auricolare (ITE) o molto vicino ad esso (BTE). Pertanto, i segnali acquisiti dagli apparecchi acustici mantengono la maggior parte (ma non tutti) gli effetti spettrali dell'HRTF. Questa specificit? va in parte persa nei dispositivi indossabili, come ad esempio gli occhiali, dotati di microfoni posizionati lontano dal padiglione auricolare, in quanto non consentono di preservare nel suono le caratteristiche spettrali dell'HRTF.
Da un punto di vista generale, sembra che una tecnologia sia direzionale e non possa essere completamente naturale, a causa della sua posizione al di fuori del padiglione auricolare, oppure sia naturale, ma non possa essere completamente direzionale, a causa delle ridotte dimensioni dei dispositivi.
In linea di principio, questi due obiettivi sembrano contraddittori. Infatti, il raggiungimento della superdirettivit? richiede un filtraggio spaziale che riduce notevolmente i contributi dei segnali acustici dalle direzioni esterne al lobo principale, e generalmente questo risultato si ottiene sacrificando l'uniformit? della frequenza o la robustezza ad errori, come imperfezioni nella risposta dei microfoni o nella loro disposizione all'interno della schiera. Queste privazioni sono in contrasto con la possibilit? di recuperare le caratteristiche spettrali dell'HRTF.
Dunque le soluzioni note allo stato dell?arte non forniscono metodologie che consentano di elaborare un segnale audio in ingresso in modo da rendere chiaro tale segnale all?utente che lo ascolta, mantenendo la naturalezza del suono.
Esiste dunque una necessit? non soddisfatta dai metodi noti allo stato dell?arte di realizzare un metodo che consenta di risolvere il problema tecnico di garantire direzionalit? e naturalezza allo stesso tempo di un suono acquisito da sensori acustici al di fuori del condotto uditivo.
Il metodo dell'invenzione si basa sulla combinazione dei vantaggi del beamforming superdirettivo con la conservazione degli effetti dello HRTF.
Nel metodo proposto l'obiettivo ? ottenere sia la direzionalit? della ricezione che la naturalit? del segnale riprodotto, in modo da ottenere un beneficio per mezzo del filtraggio spaziale e preservare il naturale HRTF del soggetto.
La presente invenzione consegue gli scopi di cui sopra realizzando un metodo come descritto in precedenza, in cui il passo di elaborazione del segnale di ingresso prevede la realizzazione di un modello acustico del distretto anatomico in corrispondenza del punto di acquisizione, volto a eliminare dal detto segnale audio di ingresso le distorsioni causate dal corpo dell?utente.
Il passo di elaborazione inoltre comprende una prima ed una seconda elaborazione del segnale audio di ingresso.
La prima elaborazione comprende un beamforming acustico volto ad attenuare i suoni che non provengono dalla direzione verso cui ? rivolto l?utente, mentre la seconda elaborazione prevede un secondo filtraggio che recupera la Head Related Transfer Function (HRTF) sulla base del detto punto di acquisizione.
Per ottenere il risultato della combinazione di entrambi i requisiti, ossia direttivit? e naturalezza, nel metodo oggetto della presente invenzione, viene implementata una procedura basata su due percorsi paralleli, che sfruttano la stessa configurazione dei microfoni per eseguire due fasi di elaborazione distinte e complementari. I passaggi vengono poi integrati per restituire un segnale acustico sia con alta Direttivit? della schiera che comprensivo delle principali caratteristiche dell'HRTF.
Nella presente invenzione, le distorsioni indesiderate generate dalla presenza del corpo dell?utente, che vanno distinte dallo HRTF che invece si desidera recuperare nel segnale riprodotto, vengono innanzitutto rimosse allo scopo di ottenere un segnale cos? come ? stato ricevuto dai sensori di acquisizione in spazio libero. Ci? equivale a modificare il segnale come se il corpo dell?utente non fosse presente. In secondo luogo, per personalizzare completamente il segnale, si applica una fase di post-elaborazione per recuperare in seguito i segnali naturali HRTF, che vengono inclusi nel segnale.
Questa mitigazione viene eseguita applicando una fase di preelaborazione ai segnali acquisiti da ciascun sensore di acquisizione, che calcola un suono equivalente a quello ricevuto in assenza del corpo dell?utente, cio? in spazio libero.
Il calcolo si basa sull'utilizzo di un modello semplificato del corpo dell?utente, o del segmento corporeo di interesse, per rimuovere i suoi effetti dal segnale audio di ingresso.
Il metodo proposto si concentra sulla possibilit? di aumentare la capacit? di ascolto nella direzione desiderata mantenendo le naturali capacit? di ascolto dell?utente.
L'invenzione ? utile in scenari in cui il risultato atteso ? fornire un segnale acustico pi? chiaro in contesti rumorosi o in caso di suoni provenienti da posizioni lontane.
Il metodo oggetto della presente invenzione si pone l?obiettivo di ridurre il rumore ed in generale i segnali acustici da posizioni al di fuori della direzione di interesse, mantenendo le caratteristiche originarie dei suoni senza introdurre distorsioni o alterare le capacit? di ascolto dell?utente.
Come anticipato, la sola Direttivit? non ? sufficiente a garantire lo scopo prefissato, in quanto i segnali in ingresso non vengono acquisiti nello spazio libero e sono quindi soggetti a riflessioni, ritardi ed effetti di attenuazione (distorsioni), dovuti alla presenza dell'utente, che determinano una distorsione nella prestazione nominale del filtraggio spaziale.
Nel metodo proposto, tale distorsione viene evitata considerando la presenza del corpo dell?utente in fase di pre-condizionamento mediante un modello acustico semplificato che mitiga tali effetti. In assenza di questa disposizione, i segnali che verrebbero elaborati includerebbero tali effetti che altererebbero l'efficacia del processo di filtraggio spaziale.
A questo punto i segnali in uscita dal filtraggio spaziale sono equivalenti a quelli che si otterrebbero se i segnali di ingresso fossero acquisiti nello spazio libero, in assenza di effetti di riflessione, ritardo ed attenuazione non dovuti alla configurazione dei sensori di acquisizione.
Tuttavia, questo scenario non ? quello desiderato perch?, avendo l'obiettivo di mantenere inalterata la capacit? di ascolto dell'utente come se stesse ascoltando i suoni in assenza dei sensori di acquisizione e quindi all'ingresso del condotto uditivo, non permette di preservare gli effetti dell'HRTF, compresi quelli del padiglione auricolare.
Il metodo proposto applica quindi un ulteriore passaggio per l'elaborazione dei segnali acquisiti, che consente di recuperare le caratteristiche dell'HRTF.
L?esecuzione di questa elaborazione deve comunque essere effettuata tenendo conto della posizione in cui vengono ricevuti i segnali, cio? esternamente al padiglione auricolare. Infatti, se l'elaborazione fosse applicata direttamente ai segnali acquisiti, ci? si aggiungerebbe agli effetti che questi segnali gi? includono, in quanto soggetti a distorsioni dovute alla presenza del corpo dell?utente, che non sono rappresentativi dell'intero HRTF, quindi non graditi.
Ne risulterebbe un segnale che include un doppio effetto cumulativo: quello desiderato dovuto all'elaborazione che restituisce i benefici dell'HRTF e quello indesiderato dovuto alla posizione dei sensori di acquisizione.
Il metodo proposto prevede invece una fase di pre-condizionamento, del tutto equivalente a quella utilizzata in preparazione al filtraggio spaziale, che consente prima di rimuovere gli effetti spuri dovuti alla posizione dei sensori di acquisizione e successivamente, attraverso un filtraggio, permette di recuperare il HRTF dell?utente come se i suoni fossero stati ricevuti all'interno del padiglione auricolare.
Come verr? descritto successivamente, attraverso l?illustrazione di alcuni esempi esecutivi, secondo una forma esecutiva preferita, l?invenzione prevede l?utilizzo di una schiera di microfoni posizionato sulla stanghetta di un occhiale, per acquisire il segnale audio di ingresso.
In questo caso il metodo proposto si basa su un sistema di acquisizione maggiormente direttivo rispetto agli apparecchi acustici alle basse frequenze.
Secondo una variante esecutiva del metodo oggetto della presente invenzione, che prevede l?utilizzo di due schiere di microfoni posizionate sulle stanghette di un paio di occhiali, i suoni ambientali vengono acquisiti attraverso un insieme di microfoni disposti su due schiere lineari posizionate ai lati della testa. In questa configurazione i suoni ricevuti sono soggetti a distorsioni e ritardi che dipendono dalla direzione di arrivo, che a loro volta sono differenti per ogni schiera e per ogni singolo microfono di ogni schiera.
Si specifica che per "distorto" si intende qualsiasi segnale acquisito in una posizione diversa dal condotto uditivo interno. Queste distorsioni sono dovute all'effetto della testa, ma i segnali acquisiti perdono alcune delle caratteristiche spettrali distintive dell'HRTF.
Da quanto precedentemente descritto, risulta evidente come il metodo oggetto della presente invenzione possa essere applicato ad un qualsivoglia numero di schiere di microfoni, siano una, due o pi? schiere, senza modificare i passi di metodo test? descritti.
Questi ed ulteriori scopi della presente invenzione sono raggiunti mediante un metodo secondo le rivendicazioni indipendenti allegate e le sottorivendicazioni.
Queste ed altre caratteristiche e vantaggi della presente invenzione risulteranno pi? chiaramente dalla seguente descrizione di alcuni esempi esecutivi illustrati nei disegni allegati in cui:
la figura 1 illustra il flusso di elaborazione principale dell'invenzione;
la figura 2 mostra come il flusso di elaborazione venga suddiviso attraverso l'insieme di schiere di sensori, definendo singoli percorsi di flusso;
la figura 3 rappresenta i dettagli della fase di elaborazione all'interno di un?unica schiera di microfoni;
la figura 4 rappresenta i dettagli della fase di filtraggio spaziale all'interno di una singola schiera;
la figura 5 rappresenta i dettagli della fase di filtraggio HRTF all'interno di una singola schiera.
Si specifica che le figure allegate alla presente domanda di brevetto riportano alcune forme esecutive del metodo oggetto della presente invenzione per meglio comprenderne i vantaggi e le caratteristiche specifiche.
Tali forme esecutive sono dunque da intendersi a scopo esplicativo e non limitativo al concetto inventivo della presente invenzione, ossia quello di realizzare un metodo di riproduzione di segnali audio, utilizzato preferibilmente da dispositivi di ausilio acustico, che consenta di riprodurre il suono acquisito, aumentando la pulizia e la chiarezza dello stesso e mantenendone inalterata la naturalezza.
In particolare, le figure illustrano il metodo oggetto della presente invenzione nel caso in cui il segnale audio di ingresso sia acquisito da due array di microfoni posti sulle stanghette di un occhiale.
Da quanto descritto in precedenza, risulta evidente come il metodo oggetto della presente invenzione possa essere utilizzato con qualsivoglia sistema di acquisizione, preferibilmente un sistema di acquisizione indossabile o posto in corrispondenza del corpo di un utente.
Con particolare riferimento alle figure da 1 a 5, l'invenzione comprende un metodo per filtrare spazialmente le onde sonore che si propagano in una scena acustica tridimensionale.
Le onde sonore circondano una serie di schiere di microfoni situati ai lati della testa di un utente in prossimit? del padiglione auricolare dell?utente.
Le schiere vengono utilizzate per acquisire i segnali audio di ingresso che vengono acquisiti da una serie di microfoni situati in posizioni predeterminate.
I segnali audio di ingresso vengono utilizzati per alimentare un beamformer al fine di ridurre il rumore di fondo e fornire una sensazione naturale dei suoni.
I microfoni che compongono le schiere sono trasduttori passivi omnidirezionali o direzionali e possono essere influenzati da imperfezioni nella risposta del trasduttore, cio? da distorsioni di guadagno e di fase sia nel dominio spaziale che in quello della frequenza.
Le schiere di microfoni utilizzate per l?esecuzione del metodo oggetto della presente invenzione, sono composti da pi? di un elemento e la posizione degli elementi pu? essere soggetta a imperfezioni nelle loro posizioni reciproche, che si traducono in errori di dislocamento tridimensionale lungo l'asse della schiera.
L'elaborazione della schiera viene eseguita da entrambi le schiere situate ai lati della testa dell?utente, ossia le schiere posizionate sulle stanghette dell?occhiale indossato dall?utente.
Il passo di elaborazione, che verr? descritto in dettaglio successivamente, fornisce una raccolta sonora direttiva tridimensionale della scena acustica e preserva le caratteristiche naturali dei suoni acquisiti.
La posizione delle schiere ? progettata per adattarsi naturalmente alla testa dell?utente e i microfoni sono posizionati in prossimit? dei padiglioni auricolari per acquisire i segnali audio di ingresso il pi? vicino possibile al punto di acquisizione naturale, in cui i segnali audio vengono condizionati dalla presenza della testa dell?utente.
In figura 1 viene illustrata una prima forma esecutiva del metodo oggetto della presente invenzione.
Una volta che i segnali sono acquisiti, passo 10, dalle schiere di microfoni, tali segnali vengono sottoposti a due filtraggi secondo percorsi paralleli, lato destro e lato sinistro di figura 1.
Nel primo percorso, ramo destro del diagramma, viene previsto un filtraggio spaziale attraverso una procedura di beamforming, passo 11, in modo da attenuare tutte le onde sonore provenienti da direzioni diverse da quella di puntamento, ossia tutte le onde sonore provenienti da direzioni differenti rispetto alla direzione di osservazione dell?utente. L'effetto di filtraggio spaziale si verifica anche per lunghezze d'onda maggiori dell'apertura dell?array di microfoni ed ? finalizzato ad ottenere la superdirettivit? della schiera.
Il passo 11 pu? avvenire secondo due modalit? differenti.
Nel primo modo, le caratteristiche spettrali del segnale proveniente da tutte le direzioni vengono preservate applicando un filtro del tipo invariante in frequenza, mantenendo cos? un profilo costante nella banda di interesse.
Nel secondo caso si prevede di ottenere la massima attenuazione possibile per ciascuna frequenza applicando un filtro del tipo variante in frequenza.
Il secondo percorso, ossia il percorso di sinistra con riferimento alla figura 1, prevede di ricostruire quella parte di segnale percepita naturalmente dall?utente durante un ascolto, utilizzando un diverso beamformer: questa volta si prevede un passo 12, relativo al filtraggio che riproduce le caratteristiche dell?Head Related Transfer Function (HRTF) sulla base del punto di acquisizione.
Il target dell?HRTF pu? essere misurato durante una fase separata o precaricato con metodi noti allo stato dell?arte, ad esempio selezionando da un database precompilato l'HRTF che pi? si avvicina a quello dell?utente che indossa gli occhiali.
I database noti allo stato dell?arte raccolgono generalmente diversi HRTF, che variano in base alle caratteristiche antropometriche dell?utente, come ad esempio le dimensioni della testa e le forme dei padiglioni auricolari.
Sono altres? disponibili modelli di HRTF che considerano valori medi nei parametri antropometrici della popolazione di soggetti considerati.
Eventuali deviazioni nella posizione assoluta dei microfoni rispetto a quella progettata e le variazioni reciproche della risposta in frequenza, sia in fase che in guadagno, saranno mitigate dalla robustezza dei beamformer rispetto al rumore bianco spazialmente indipendente (cio? White-Noise Gain WGN).
Le uscite dei due percorsi vengono combinate per ottenere un unico segnale, passo 13, che unisce le caratteristiche di direzionalit? e conservazione dell'HRTF dell?utente.
Si specifica che nel metodo oggetto della presente invenzione, l'utilizzo di due schiere di microfoni posizionati ai lati della testa, in prossimit? dei padiglioni auricolari, consente di mantenere la ricezione binaurale del suono ricevuto e quindi di preservare la capacit? dell'ascoltatore di determinare la direzione di arrivo del segnale di ingresso.
Inoltre in figura 1 sono illustrati due passi fondamentali del metodo oggetto della presente invenzione, in particolare realizzazione di un modello acustico della testa, passo 14, volto a eliminare dal segnale audio di ingresso le distorsioni causate dalla testa dell?utente.
Successivamente, con particolare riferimento alle figure 4 e 5, tali passi verranno illustrati in dettaglio.
Come illustrato in figura 2, nel caso in cui il metodo sia utilizzato in combinazione ad un occhiale con una schiera di microfoni su ogni stanghetta, ? fondamentale prevedere due processi di beamforming descritti in figura 1: un primo processo relativo all?orecchio destro, un secondo processo relativo all'orecchio sinistro.
Con particolare riferimento alla figura 2, il ramo di destra indica i passi relativi alla schiera di microfoni di destra, mentre il ramo di sinistra indica i passi relativi alle schiere di microfoni di sinistra.
Come descritto per la figura 1, ogni ramo prevede una fase di acquisizione 21, 22 e una fase di elaborazione 23, 24, che avvengono in maniera del tutto simile a quanto descritto per la figura 1 e, al termine di tali fasi, i contributi di destra e di sinistra in uscita dai due processi, vengono uniti nel passo 25.
I due processi non sono identici.
Ciascun processo (relativo alla schiera di destra e alla schiera di sinistra) esegue una elaborazione separata che dipende essenzialmente dal fatto che la HRTF differisce se misurata a destra o a sinistra e quindi il filtraggio HRTF sar? diverso. Il filtraggio spaziale invece sar? lo stesso o meno a seconda di scelte progettuali.
Poich? le schiere acquisiscono i suoni ad una distanza reciproca, viene mantenuta costante la differenza di livello inter-aurale (ITD), mentre per ottenere una differenza di tempo inter-aurale (ITD) ?naturale?, il suono andrebbe ricevuto all?ingresso del canale auricolare.
Nel metodo oggetto della presente invenzione tale aspetto ? soddisfatto grazie al filtraggio con HRTF, preferibilmente previa rimozione degli effetti ?indesiderati? con il precondizionamento, in modo da recuperare due caratteristiche che consentono all?utente di distinguere le direzioni di arrivo dei suoni
La figura 3 illustra una possibile forma esecutiva del metodo oggetto della presente invenzione e illustra i passi di metodo che avvengono in una delle due schiere di microfoni.
I passi di metodo che verranno descritti relativi alla figura 3, saranno poi ripetuti per tutti le schiere di microfoni presenti, nel caso specifico, nell?altra schiera di microfoni.
Viene acquisito, passo 30, un segnale audio di ingresso da parte di una schiera di microfoni e tale segnale viene elaborato secondo due processi contemporanei, in modo da ottenere un filtraggio spaziale 31 e il recupero HRTF 32 in modo simultaneo.
A differenza di quanto descritto in figura 1, la realizzazione delle condizioni pari a quelle in spazio libero, ossia l?eliminazione degli effetti della testa sul segnale audio di ingresso (passi 14 e 15 di figura 1) vengono eseguiti internamente ai passi 31 e 32, secondo modalit? che verranno descritte successivamente.
L'apertura della schiera di microfoni ovvero le sue dimensioni fisiche nello spazio tridimensionale ? confrontabile con la dimensione della testa per i valori medi dei parametri antropometrici umani.
Il posizionamento reciproco degli elementi della schiera ? progettato per essere conforme al limite di campionamento spaziale d ? ? /2, dove d ? la spaziatura tra gli elementi e ? ? la lunghezza d'onda del segnale.
Il banco filtri cui ? applicata la finestra di ponderazione che implementa il beamformer sulla schiera di microfoni ovvero il filter-and-sum beamforming ? progettato per elaborare segnali acquisiti con una frequenza di campionamento conforme al limite di Nyquist ? ? 1/2 ?fmax, dove ? ? il periodo di campionamento e fmax ? la frequenza massima di interesse per l'invenzione.
Le figure 4 e 5 illustrano in dettaglio le due elaborazioni che vengono eseguite sul segnale audio di ingresso, in particolare la figura 4 ? relativa alla elaborazione del filtraggio spaziale, mentre la figura 4 al filtraggio HRTF.
Come precedentemente anticipato, con riferimento al caso specifico di una schiera di microfoni, ? previsto un passo di acquisizione di un segnale audio di ingresso 40, un passo di elaborazione 41 ed un passo di generazione di un segnale di uscita 43.
Il passo di elaborazione 41 comprende il filtraggio spaziale del segnale 410, nonch? l?eliminazione delle distorsioni del segnale dovute alla presenza della testa 411, grazie alla realizzazione di un modello acustico della testa 412.
La progettazione del filtro utilizzato nel passo di elaborazione 41 viene illustrata qui di seguito.
La risposta in frequenza del filtro n-esimo ? Hn(f), dove f ? la frequenza in Hz e wn,l rappresenta il coefficiente l-esimo del filtro.
Il sensore che alimenta il filtro acquisisce i segnali con uno specifico ritardo di tempo dipendente dalla propria posizione e dalla direzione di arrivo del segnale.
Il contributo del segnale che colpisce il sensore n-esimo ?
Considerando queste funzioni preliminari ? possibile definire il Beam Pattern della sciera ovvero la sua risposta nel dominio della frequenza e delle direzioni di arrivo:
dove w ? un vettore contenente i coefficienti dei filtri.
Le prestazioni dell?array sono generalmente misurate dalla risposta della schiera ovvero dal Beam Pettern. Tuttavia, una volta richiesta un'analisi dettagliata, ? pi? appropriato definire diversi metodi di valutazione. Il guadagno dell'array (AG) indica il miglioramento del rapporto segnale-rumore fornito dall'array, come un singolo sensore omnidirezionale, rispetto a una specifica sorgente di rumore:
Al fine di valutare le prestazioni di un filterand-sum beamforming applicato a un array superdirettivo, ? importante determinare la capacit? del sistema di ridurre il rumore isotropico, cio? il rumore distribuito uniformemente su una sfera, e il rumore spazialmente bianco, cio? il rumore non correlato tra i microfoni della schiera. Il guadagno della schiera nei due casi ? definito come: Direttivit? e WNG. Direttivit? e WNG svolgono un ruolo centrale nella progettazione di una schiera superdirettiva ed esiste un compromesso tra i loro valori.
La Direttivit? della schiera rappresenta la capacit? del filtro spaziale di attenuare i segnali provenienti da tutte le direzioni tranne quella di interesse. Ci? ? essenziale soprattutto per il sistema acustico che lavora in un ambiente in cui convivono sorgenti differenti, che mira a selezionare o isolare una particolare fonte.
La Direttivit? della schiera in funzione della frequenza G(f) di una schiera lineare ? definita come il rapporto tra l'ampiezza al quadrato, cio? la potenza del Beam Pattern nella direzione di interesse ?m e la potenza dell'uscita della schiera con rumore isotropico come segnale di ingresso.
Considerando un sistema di filter-and-sum beamforming, ? possibile sostituire i termini al numeratore e al denominatore con i corrispondenti per il Beam Pattern. A seconda della geometria della schiera, la Direttivit? della schiera pu? essere espressa come funzione della distanza reciproca tra gli elementi della schiera.
Ad esempio, per una schiera lineare con elementi uniformemente distanziati (ULA), la direttivit? della schiera pu? essere espressa come segue:
dove M = N, l'apice denota il complesso coniugato e sinc( ?) ? definito come sin( ?) / ?.
L?equazione collega la risposta dei filtri alla capacit? di una schiera di discriminare la direzione di arrivo del segnale.
Il WNG indica il miglioramento del rapporto segnale/rumore fornito dalla schiera, rispetto ad un singolo sensore omnidirezionale, per il rumore non correlato tra i sensori, definito come rumore spazialmente bianco. Nel caso di una struttura di filter-and-sum beamformer, il valore WNG rispetto alla frequenza, Gw(f), pu? essere definito come segue:
In maniera simile a quanto discusso in merito alla direttivit? dell'array, anche il WNG dipende dalle risposte dei filtri Hn(f).
Un caso speciale di finestra di ponderazione ? la pesatura uniforme, cio? wn = 1 /N.
Ad esempio, in un ULA, utilizzando questa finestra di ponderazione, la Direttivit? della schiere ? massimizzata quando d = ? /2 ed ? uguale al valore limite G(f) = N. Poich? la pesatura uniforme massimizza la Direttivit? della schiera per d = ? /2, ne consegue che la superdirettivit? ? efficiente nel migliorare le prestazioni della schiere soprattutto per quelle frequenze le cui lunghezze d'onda sono sufficientemente lontano dalla condizione d = ? /2, cio? ? > > 2 ?d o in generale d < ?.
La ponderazione uniforme massimizza il WNG di un ULA e Gw(f) = N senza dipendenza dalla distanza reciproca tra gli elementi d.
Pertanto, il WNG rappresenta anche una misura della robustezza del beamformer rispetto alle imperfezioni dell'array.
Poich? il beampattern superdirettivo ? noto per essere molto sensibile al rumore non correlato tra i sensori, la robustezza diventa un punto cruciale e, di conseguenza, una diminuzione eccessiva del valore WNG non pu? essere accettata.
Il WNG indica il miglioramento del rapporto segnale/rumore fornito dalla schiera, rispetto a un singolo sensore omnidirezionale, relativamente al rumore spazialmente bianco. Il rumore relativo ai sensori e le imperfezioni che di solito influenzano le caratteristiche delle schiere (cio? le posizioni degli elementi e le risposte dei sensori) non sono correlati tra gli elementi e possono essere pensati come un rumore spazialmente bianco.
Considerando la geometria di una schiera lineare e assumendo il beamformer funzione delle imperfezioni della schiera, la risposta reale del filtro n-esimo e la posizione reale dell'elemento n-esimo possono essere modellate come segue:
dove ? la risposta in frequenza perturbata del filtro n-esimo, Hn(f) ? la risposta in frequenza nominale del filtro n-esimo, ?gn(f) e ??n(f) sono variabili casuali che rappresentano il guadagno e le deviazioni di fase della risposta del n-esimo trasduttore, rispettivamente, ? la posizione reale dell'elemento n-esimo dell?array, pn ? la sua posizione nominale e ?pn ? una variabile casuale che rappresenta l'errore di posizione.
? generalmente accettabile considerare tali errori come variabili casuali gaussiane a media nulla, statisticamente indipendenti tra loro e tra gli elementi (sensori), e le distorsioni della risposta del sensore come dipendenti dalla frequenza.
Il reciproco del WNG, chiamato funzione di sensitivit?, indica la sensitivit? del beamformer alle imperfezioni della schiera. Di conseguenza, un'eccessiva diminuzione del WNG ? indice di un'insufficiente robustezza a questi errori.
L'elaborazione del processo filter-and-sum applicata nella figura 4 per il filtraggio spaziale e nella figura 5 per il filtraggio HRTF viene eseguita con un banco di filtri a bassa sensitivit? progettando attentamente Hn(f) nell?equazione 1, dove con il termine ?bassa sensitivit?? si intende che il banco di filtri ? robusto rispetto al rumore spazialmente bianco. In particolare, la bassa sensitivit? si ottiene rispetto agli errori nel posizionamento reciproco degli elementi lungo la schiera e l'errore nella risposta dei trasduttori, cio? guadagno e fase. La robustezza del beamformer pu? essere ottenuta applicando un filtraggio invariante in frequenza o un filtraggio variante in frequenza.
Ne consegue che i filtri sintetizzati nei passi 41 e 51, risultano robusti contro il rumore spazialmente bianco, cio? con WNG superiore a 0 dB per gran parte della banda di frequenza di lavoro del beamformer.
Cos? come descritto in figura 1, passi 13 e 14, anche le figure 4 e 5 prevedono la realizzazione di un modello acustico della testa e di una eliminazione dei contributi che la testa dell?utente ha sul segnale, passi 412, 413, 512, 513.
In dettaglio queste fasi avvengono innanzitutto con un filtro di beamforming progettato per rimuovere l'effetto di ?head shadowing? dovuto alla posizione delle schiere di microfoni e per ottenere un segnale come quello elaborato dalla stessa funzione di filtraggio spaziale in assenza della testa, ovvero un filtraggio spaziale in spazio libero. Ci? si ottiene agendo sul contributo dei segnali che interferiscono con i sensori della schiera, cio? i termini
nell'equazione (1).
Come dettagliato nella figura 1, le distorsioni del segnale causate dalla testa vengono prese in considerazione emulando la relativa funzione di trasferimento di frequenza di un modello di testa standard, cio? un modello sferico.
Tale funzione di trasferimento ? incorporata nella funzione di trasferimento del beamformer, dalla misura di Hn(f) nell?equazione (1), per ridurre i riflessi e gli effetti di rifrazione della presenza della testa nel campo sonoro raccolto dai microfoni.
Vantaggiosamente la rimozione dell'effetto della testa fa parte della modellazione matematica del beamformer: non ? una fase di pre-elaborazione, n? di post-elaborazione.
Tale approccio viene utilizzato sia per ottenere lo stadio di filtraggio spaziale in spazio libero che lo stadio di filtraggio HRTF in spazio libero in figura 3.
Ogni singolo percorso di figura 3 ? dedicato ad un filtraggio spaziale eseguito tramite un beamformer superdirettivo che permette di ottenere un'elevata Direttivit? della schiera anche a basse frequenze.
Cos? facendo si ottengono due vantaggi: da un lato il filtraggio spaziale permette di ridurre il contributo di segnali indesiderati provenienti da direzioni fuori dalle direzioni di osservazione dell?utente, dall'altro l'uscita di questo primo stadio ? un segnale acustico privo degli effetti di distorsione causati dalla presenza della testa.
Entrambi gli effetti si ottengono usando una scelta opportuna di e nell'equazione (1).
L'ATF dello stadio di filtraggio spaziale pu? essere rappresentato dal filtraggio spaziale
dove ? ? la direzione di arrivo misurata in gradi e f ? la frequenza misurata in Hz.
Con particolare riferimento alla figura 5, ogni segnale acquisito dalle schiere viene ulteriormente elaborato da un filtro HRTF che ricostruisce i segnali spettrali correlati alla presenza della testa ottenuti registrando il campo sonoro nella posizione del padiglione auricolare.
L'HRTF naturale si ottiene filtrando i segnali acquisiti dai microfoni con un approccio basato su beamforming, ovvero con un insieme ad-hoc di Hn(f) nell'equazione (1), che replica la funzione di trasferimento relativa alla testa misurata in prossimit? del padiglione auricolare.
L'HRTF obiettivo viene misurato dal microfono pi? vicino alla posizione del padiglione auricolare per un campo sonoro nella banda di frequenza di interesse del metodo oggetto della presente invenzione. La funzione di trasferimento HRTF sintetizzata pu? essere ridotta in complessit? sottocampionando i punti di frequenza ottenuti dalle misurazioni.
Il filtraggio HRTF viene elaborato da un beamformer con beampattern nominale che replica l'ampiezza dell'HRTF misurato (ovvero, l'HRTF obiettivo) e ha una fase lineare.
I segnali filtrati HRTF non sono soggetti a distorsioni di fase e conservano il loro ritardo naturale rispetto al lato opposto, ovvero il segnale HRTF filtrato dall'altro array, posizionato sul lato opposto della testa.
L'ATF del processo di filtraggio HRTF pu? essere rappresentato dal beampattern correlato alla testa HRBP( ?,f), dove ? ? la direzione di arrivo misurata in gradi e f ? la frequenza misurata in Hz.
Una volta terminate le elaborazioni descritte, i segnali in uscita da tali processi di elaborazione devono essere combinati.
Di conseguenza i segnali in uscita dal filtraggio spaziale e i segnali che portano la ricostruita HRTF vengono combinati per ottenere una coppia di segnali direzionali con inalterate caratteristiche di naturalezza, che vengono utilizzati per alimentare i trasduttori acustici attivi dell'invenzione.
Come rappresentato nella figura 3, i segnali binaurali elaborati dall'insieme di schiere possono essere combinati, passo 33, per arricchire le peculiarit? acustiche dei segnali acquisiti dai microfoni in termini di caratteristiche spaziali e di frequenza.
Il segnale elaborato dal beamformer dedicato al filtraggio superdirettivo, in cui tutte le direzioni esterne a quella di interesse vengono attenuate, viene combinato con il segnale elaborato dal beamformer dedicato al calcolo dell?HRTF.
Il risultato di questa operazione ? un segnale monofonico che include sia la direttivit? della schiera fornita dal filtraggio spaziale sia la fedelt? fornita dal filtraggio HRTF.
L'ATF dello stadio monoaurale completo (cio? un singolo percorso della figura 2) pu? essere rappresentato dal beampattern monoaurale
dove Q ? la funzione di combinazione, ? ? la direzione di arrivo misurata in gradi e f ? la frequenza misurata in Hz.
I due modelli di fascio monoaurale possono essere ulteriormente combinati per sfruttare la loro rappresentazione della scena acustica in un modello di beam pattern (vedi Figura 2) per il lato destro BRBP ( ?,f) e per il lato sinistro BLBP ( ?,f)):
dove K e U sono le funzioni di combinazione rispettivamente per il lato destro e sinistro, MBPright ? il beam pattern monoaurale del lato destro MBPleft ? il beam pattern monoaurale del lato sinistro, ? ? la direzione di arrivo misurata in gradi e f ? la frequenza misurata in Hz.
Mentre l?invenzione ? suscettibile di varie modifiche e costruzioni alternative, alcune forme di realizzazione preferite sono state mostrate nei disegni e descritte in dettaglio.
Si deve intendere, comunque, che non vi ? alcuna intenzione di limitare l?invenzione alla specifica forma di realizzazione illustrata, ma, al contrario, essa intende coprire tutte le modifiche, costruzioni alternative, ed equivalenti che ricadano nell?ambito dell?invenzione come definito nelle rivendicazioni.
L?uso di ?ad esempio?, ?ecc.?, ?oppure? indica alternative non esclusive senza limitazione a meno che non altrimenti indicato.
L?uso di ?include? significa ?include, ma non limitato a? a meno che non altrimenti indicato.

Claims (10)

RIVENDICAZIONI
1. Metodo di riproduzione di un segnale audio comprendete i seguenti passi:
a) acquisizione di un segnale audio di ingresso, la quale acquisizione avviene attraverso uno o pi? sensori disposti in un punto di acquisizione dello spazio previsto in corrispondenza del corpo di un utente,
b) elaborazione di detto segnale audio di ingresso,
c) generazione di un segnale audio di uscita caratterizzato dal fatto che
il passo b) prevede la realizzazione di un modello acustico del distretto anatomico in corrispondenza del punto di acquisizione, volto a eliminare dal detto segnale audio di ingresso le distorsioni causate dal corpo dell?utente,
comprendendo il passo b) una prima ed una seconda elaborazione del segnale audio di ingresso,
la prima elaborazione comprendendo un filtraggio nello spazio volto ad attenuare i suoni che non provengono dalla direzione verso cui ? rivolto l?utente,
la seconda elaborazione prevedendo comprendendo un filtraggio nello spazio volto a preservare la Head Related Transfer Function (HRTF) sulla base del detto punto di acquisizione.
2. Metodo secondo la rivendicazione 1, in cui la detta prima elaborazione e la detta seconda elaborazione avvengono contemporaneamente e in maniera indipendente, sullo stesso segnale audio di ingresso e con gli stessi uno o pi? sensori,
il passo c) prevedendo l?unione dei segnali risultanti dalla prima e dalla seconda elaborazione.
3. Metodo secondo la rivendicazione 1 o la rivendicazione 2, in cui il passo di realizzazione del modello acustico del distretto anatomico in corrispondenza del punto di acquisizione viene previsto sia durante la prima elaborazione che durante la seconda elaborazione.
4. Metodo secondo una o pi? delle precedenti rivendicazioni, in cui la prima elaborazione prevede l?utilizzo di un filtraggio del tipo variante in frequenza.
5. Metodo secondo una o pi? delle rivendicazioni da 1 a 3, in cui la prima elaborazione prevede l?utilizzo di un filtraggio del tipo invariante in frequenza.
6. Metodo secondo una o pi? delle precedenti rivendicazioni, in cui il calcolo della Head Related Transfer Function (HRTF) viene eseguito precedentemente al passo di b) di elaborazione sulla base delle caratteristiche antropometriche dell?utente.
7. Metodo secondo una o pi? delle precedenti rivendicazioni, in cui il passo a) di acquisizione viene effettuato da almeno un array di microfoni posti al di sopra dell?orecchio dell?utente, prevedendo il passo di realizzazione del modello acustico del distretto anatomico la realizzazione del modello acustico della testa dell?utente.
8. Metodo secondo la rivendicazione 7, in cui il passo a) di acquisizione viene effettuato da due array di microfoni posti ai lati della testa dell?utente, essendo i passi b) e c) eseguiti separatamente per i segnali audio di ingresso acquisiti da ogni array di microfoni.
9. Metodo secondo la rivendicazione 7 o la rivendicazione 8, in cui il calcolo della Head Related Transfer Function (HRTF) avviene sulla base del microfono pi? prossimo al padiglione auricolare dell?utente.
10. Metodo secondo la rivendicazione 9, in cui il calcolo della Head Related Transfer Function (HRTF) prevede un sottocampionamento dei punti di frequenza ottenuti da misurazioni effettuate sul corpo dell?utente.
IT102020000029336A 2020-12-01 2020-12-01 Metodo di riproduzione di un segnale audio IT202000029336A1 (it)

Priority Applications (4)

Application Number Priority Date Filing Date Title
IT102020000029336A IT202000029336A1 (it) 2020-12-01 2020-12-01 Metodo di riproduzione di un segnale audio
EP21830500.1A EP4256803A1 (en) 2020-12-01 2021-11-30 Method for reproducing an audio signal
PCT/IB2021/061130 WO2022118192A1 (en) 2020-12-01 2021-11-30 Method for reproducing an audio signal
US18/255,097 US20240015463A1 (en) 2020-12-01 2021-11-30 Method for reproducing an audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT102020000029336A IT202000029336A1 (it) 2020-12-01 2020-12-01 Metodo di riproduzione di un segnale audio

Publications (1)

Publication Number Publication Date
IT202000029336A1 true IT202000029336A1 (it) 2022-06-01

Family

ID=74669293

Family Applications (1)

Application Number Title Priority Date Filing Date
IT102020000029336A IT202000029336A1 (it) 2020-12-01 2020-12-01 Metodo di riproduzione di un segnale audio

Country Status (4)

Country Link
US (1) US20240015463A1 (it)
EP (1) EP4256803A1 (it)
IT (1) IT202000029336A1 (it)
WO (1) WO2022118192A1 (it)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004028203A2 (en) * 2002-09-18 2004-04-01 Stichting Voor De Technische Wetenschappen Spectacle hearing aid
US9838785B2 (en) * 2014-05-26 2017-12-05 Insight Acoustic Ltd. Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US20200327877A1 (en) * 2019-04-09 2020-10-15 Facebook Technologies, Llc Acoustic transfer function personalization using sound scene analysis and beamforming

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004028203A2 (en) * 2002-09-18 2004-04-01 Stichting Voor De Technische Wetenschappen Spectacle hearing aid
US9838785B2 (en) * 2014-05-26 2017-12-05 Insight Acoustic Ltd. Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US20200327877A1 (en) * 2019-04-09 2020-10-15 Facebook Technologies, Llc Acoustic transfer function personalization using sound scene analysis and beamforming

Also Published As

Publication number Publication date
EP4256803A1 (en) 2023-10-11
WO2022118192A1 (en) 2022-06-09
US20240015463A1 (en) 2024-01-11

Similar Documents

Publication Publication Date Title
AU2010346387B2 (en) Device and method for direction dependent spatial noise reduction
Desloge et al. Microphone-array hearing aids with binaural output. I. Fixed-processing systems
US9613610B2 (en) Directional sound masking
CN103222187B (zh) 对于通过扬声器的音频的频谱不着色的优化串扰消除
US20190014422A1 (en) Direction of arrival estimation in miniature devices using a sound sensor array
EP2208361B1 (en) Microphone arrangement, having two pressure gradient transducers
CN107426660B (zh) 包括定向传声器系统的助听器
DK3147904T3 (en) PROCEDURE FOR DETERMINING OBJECTIVE PERCEPTUAL QUANTITIES OF NOISE SPEECH SIGNALS
Oreinos et al. Objective analysis of ambisonics for hearing aid applications: Effect of listener's head, room reverberation, and directional microphones
CN112492445B (zh) 利用罩耳式耳机实现信号均衡的方法及处理器
Yousefian et al. A coherence-based noise reduction algorithm for binaural hearing aids
Kates et al. Externalization of remote microphone signals using a structural binaural model of the head and pinna
CN110636423B (zh) 用于增强听力设备中的信号方向性的方法
Lobato et al. Worst-Case-Optimization Robust-MVDR beamformer for stereo noise reduction in hearing aids
IT202000029336A1 (it) Metodo di riproduzione di un segnale audio
CN111970612B (zh) 一种骨传导耳机的串声消除方法及系统
Rasumow et al. The impact of the white noise gain (WNG) of a virtual artificial head on the appraisal of binaural sound reproduction
US10959026B2 (en) Partial HRTF compensation or prediction for in-ear microphone arrays
Puder Adaptive signal processing for interference cancellation in hearing aids
Oreinos et al. Effect of higher-order ambisonics on evaluating beamformer benefit in realistic acoustic environments
Denk Characterizing and conserving the transmission properties of the external ear with hearing devices
Maillou et al. Measuring the Performance of the Hearing Aids Adaptive Directivity and Noise Reduction Algorithms through SNR Values
JP2019520769A (ja) 補聴器の強度及び位相の補正
Ayllón et al. Optimum microphone array for monaural and binaural in-the-canal hearing aids
Khayeri Binaural Beamforming Robust to Errors in Direction of Arrival Estimates