ITRM20120173A1 - Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute - Google Patents

Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute Download PDF

Info

Publication number
ITRM20120173A1
ITRM20120173A1 IT000173A ITRM20120173A ITRM20120173A1 IT RM20120173 A1 ITRM20120173 A1 IT RM20120173A1 IT 000173 A IT000173 A IT 000173A IT RM20120173 A ITRM20120173 A IT RM20120173A IT RM20120173 A1 ITRM20120173 A1 IT RM20120173A1
Authority
IT
Italy
Prior art keywords
voice
values
analysis
intervals
acoustic parameters
Prior art date
Application number
IT000173A
Other languages
English (en)
Inventor
Varsha Vinod Alaspure
Monali D Bobade
Santosh Bothe
Giovanni Saggio
Original Assignee
Uni Degli Studi Di Roma To R Vergata
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uni Degli Studi Di Roma To R Vergata filed Critical Uni Degli Studi Di Roma To R Vergata
Priority to IT000173A priority Critical patent/ITRM20120173A1/it
Publication of ITRM20120173A1 publication Critical patent/ITRM20120173A1/it

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Description

PROCESSO DI ANALISI DI CAMPIONI DI VOCE DI UN INDIVIDUO PER VERIFICARE IL SUO STATO DI SALUTE
* ;Campo dell’invenzione ;La presente invenzione si riferisce ad un processo di analisi della voce di un individuo per indagare sul suo stato di salute, in particolare per facilitare la diagnosi di malattie e/o disturbi, sia potenziali che conclamati. ;Stato della tecnica ;Oggi la popolazione à ̈ esposta a nuovi disturbi fisici, malanni e malattie. Alcuni di questi possono essere anche letali, come l’AIDS, le meningiti, la sclerosi multipla, il cancro, l’epatite, le conseguenze dell’antrace, di attacchi di cuore, aterosclerosi, enfisemi e molte altre potrebbero essere aggiunte alla lista. ;Se queste malattie sono diagnosticate in uno stato embrionale, quando ancora senza sintomaticità evidente, e/o nella prima fase della loro evoluzione, le probabilità di positivo effetto della cura aumentano significativamente. ;Attualmente esistono tecniche di rilevazione e diagnosi delle differenti malattie, ma à ̈ impraticabile chiedere ad ogni singola persona di sottoporsi al controllo per ognuna di queste potenziali malattie. ;Ci sono inoltre diversi test per ogni malattia, ma chiedere ad ogni individuo di sottoporsi a tutti i controlli regolarmente non à ̈ una soluzione praticabile, sia da un punto di vista tecnico che economico. ;Inoltre il paziente può anche non avere o non considerare adeguatamente le sintomaticità di una malattia in divenire nel suo corpo. Si può avere effettiva coscienza del malanno solo quando sintomi importanti sono già manifesti ed in tal caso può essere tardi per intervenire con un trattamento terapeutico adeguatamente efficace. ;Infine, in taluni casi l’espressione del sintomo può essere avvertito troppo tardi od essere troppo poco evidente perché l’individuo se ne possa curare adeguatamente. ;E’ sentita pertanto l’esigenza di un processo innovativo, semplice ed economico, che possa essere di ausilio al personale medico per la diagnosi precoce di una determinata malattia o disturbo, senza la necessità di sottoporre il paziente a numerose e costose tecniche di rilevazione e diagnosi. ;Sommario dell’invenzione ;Scopo primario della presente invenzione à ̈ quello di realizzare un processo di analisi della voce di un individuo per indagare sul suo stato di salute, in particolare da usare come ausilio per la diagnosi di malattie e/o disturbi, in stato embrionale quando ancora di scarsa sintomaticità, di media sintomaticità, o in stato conclamato. ;Un altro scopo dell’invenzione à ̈ quello di realizzare un unico processo che consenta senza alcun intervento invasivo sul paziente di determinare variazioni del suo stato di salute mediante l’analisi del suono emesso dalla bocca del paziente. ;La presente invenzione, pertanto, si propone di raggiungere gli scopi sopra discussi realizzando un processo di analisi della voce di un individuo che, conformemente alla rivendicazione 1, comprende almeno i seguenti stadi: ;a) prevedere un database di confronto contenente ;- valori standard di una pluralità di canali audio, in cui sono stati suddivisi primi campioni di voce di un gruppo di individui in salute o dello stesso individuo sotto esame, e, per ciascun canale audio, primi intervalli di valori di una pluralità di parametri acustici di detti primi campioni di voce, ;- e/o secondi intervalli di valori di una pluralità di parametri acustici, detti secondi intervalli essendo associati ad almeno una rispettiva malattia; ;- e/o grafici relativi ad una analisi di primi campioni di voce di un gruppo di individui in salute o almeno un grafico relativo ad una precedente analisi di un primo campione di voce dello stesso individuo sotto esame; ;b) acquisizione di un secondo campione di voce dell’individuo sotto esame; ;c) suddivisione di detto secondo campione di voce dell’individuo sotto esame in una rispettiva pluralità di canali audio, ed estrazione da ciascun canale audio di una rispettiva pluralità di parametri acustici; ;d) analisi dei canali audio e dei rispettivi parametri acustici, ad essi associati, dell’individuo sotto esame mediante confronto numerico con i valori standard dei canali audio ed i primi intervalli dei parametri acustici dei primi campioni di voce, e/o mediante confronto numerico con i secondi intervalli di valori dei parametri acustici associati ad almeno una rispettiva malattia, e/o mediante confronto grafico di almeno un grafico relativo alla attuale situazione di salute dell’individuo sotto esame con detti grafici relativi ad una analisi dei primi campioni di voce di un gruppo di individui in salute o con almeno un grafico relativo ad una precedente analisi di un primo campione di voce dello stesso individuo sotto esame. ;La voce umana à ̈ il prodotto della coordinazione di sistemi e sotto-sistemi del corpo umano ed à ̈ funzione dello stato di salute dell’individuo. L’esame del suono prodotto dalla voce à ̈ quindi un metodo nuovo di fare diagnosi successivo, parallelo e/o alternativo alla ispezione visiva o tramite strumenti. La voce à ̈ rappresentativa della condizione di determinati organi interni. Per esempio coloro affetti da una malattia polmonare, avendo una ridotta “capacità vitale†dei polmoni, spesso producono una vocalità breve ed acuta. Ciò à ̈ probabilmente dovuto alla riduzione del volume di risonanza del sistema respiratorio, ragione della maggior frequenza di risonanza della voce, che à ̈ misurabile. ;La diagnosi di malattie che riguardano la cassa toracica à ̈ facilitata da una auscultazione polmonare per mezzo di uno stetoscopio. Ma l’auscultazione per mezzo dello stetoscopio ha molti limiti: ;- à ̈ un processo soggettivo che dipende dall’individuo, dalle sue capacità uditive, dalla sua esperienza, dalla sua abilità nel differenziare tra tipologie di suoni diversi; ;- non à ̈ agevole produrre misure quantitative o produrre registrazioni permanenti di un esame in forma documentale; ;- à ̈ difficile il monitoraggio a lungo termine o la correlazione del suono della respirazione con altri segnali fisiologici; ;- lo stetoscopio ha una risposta in frequenza che attenua le componenti del segnale polmonare al di sopra di circa 120Hz; ;- l’orecchio umano non à ̈ molto sensibile alle frequenze che rimangono nella banda inferiore a circa 30Hz e superiore a circa 17.000Hz ;Negli ultimi 30 anni, metodi computerizzati per la registrazione e l’analisi dei suoni della respirazione hanno superato molte delle limitazioni della semplice auscultazione. L’analisi del suono vocale può ora fornire quantitativamente gli elementi di cambiamento nel suono polmonare. Produrre registrazioni permanenti delle misure eseguite ed eventualmente produrre rappresentazioni grafiche può agevolare, secondo il processo dell’invenzione, nella diagnostica e nel trattamento del paziente. ;In particolare la voce si compone di una molteplicità di elementi registrabili tramite una pluralità di canali audio, ognuno dei quali misurato da una pluralità di differenti parametri acustici, come la lunghezza d’onda, l’ampiezza, la frequenza, le armoniche, il tono ecc.. La combinazione tra canali audio e valori dei parametri di ciascun canale dipende dalle condizioni biologiche della persona, individuate dallo stato di salute di organi specifici. ;Esiste una significativa variazione dei parametri rispetto allo stato normale o alterato di un organo. Potendo contare, ad esempio, su 24 canali audio e 12 parametri per ciascun canale, si ha la permutazione di P(24,12)= 1295295050649600 valori ed una combinazione di C(24,12)= 2704156 valori, numeri così grandi da poter dare indicazioni accurate sulla relativa condizione di salute di ciascun organo interno umano e del corpo nella sua interezza. Questo metodo può dunque fornire un supporto valido per allertare un paziente agli stadi iniziali di una malattia, anche senza sintomaticità evidente, per aiutare a redigere diagnosi in caso di malanno conclamato ed assistere i medici. ;Lo stato della salute di ognuno à ̈ determinabile dalla condizione della sua voce. Quindi, elaborando e sviluppando uno strumento di analisi della voce, i medici possono essere in grado di diagnosticare un male semplicemente dai campioni sonori della voce, del parlato. I campioni sonori registrati dal paziente possono essere analizzati per determinarne vari parametri come SINAD (Signal-to-noise and distortion ratio), IMD (Intermodulation Distortion), THD (Total Harmonic Distortion), Rumore, frequenza di picco della armonica fondamentale e delle subarmoniche, ampiezza di picco, ecc.. così da diagnosticare il problema di salute. I valori misurati sono poi confrontati con quelli dell’individuo sano che devono risultare in un certo intervallo di valori, ed intervalli di valori possono essere definiti per ciascun tipo di malanno. ;E’ stato dimostrato che esiste una associazione misurabile tra la voce con gli organi del corpo e la loro funzione. Quindi proponiamo un sistema capace di tracciare il malanno o la disfunzione delle varie parti del corpo umano, analizzandone i corrispondenti valori dei parametri della voce. ;Le variazioni della voce non sono tutte rilevabili dall’orecchio umano, la cui sensibilità à ̈ molto bassa confrontata alla complessità di suoni prodotti dalla voce umana. ;È notorio come il suono della voce indica uno stato emotivo, spirituale e fisico di un paziente. Ma tale suono à ̈ prodotto da una diretta e coordinata combinazione di diversi elementi del corpo umano, quali polmoni, laringe, epiglottide, lingua, denti, labbra, naso, ecc.. Quando il suono della voce di un individuo cambia, il motivo può essere dovuto a stress, disturbo, malattia. ;In particolare, la voce prodotta da un individuo malato cambia rispetto a quella di un individuo sano, ed il cambiamento à ̈ funzione del o degli organi con malattia in fase iniziale di sviluppo oppure in fase conclamata. Il cambiamento può non essere rilevabile da orecchio umano, ma può essere rilevato da strumentazione. Il processo secondo l’invenzione prevede una registrazione audio della voce del paziente per un predeterminato tempo (tipicamente una trentina di secondi) in presenza del medico oppure anche da remoto, ad esempio mediante una comunicazione telefonica (anche se quest’ultima può avere una larghezza di banda in frequenze ridotta rispetto alla voce naturale). ;E’ possibile, ad esempio, programmare temporalmente delle registrazioni della voce del paziente ed averne un controllo da remoto. Con il consenso del paziente si può registrare la sua voce ed analizzarla, per esempio, mediante un server centrale predisposto. ;Se si riscontra qualcosa di sospetto in seguito al processo di analisi della voce, si può invitare il paziente a fare una specifica visita di controllo dal proprio medico specialista. ;L’invenzione può essere implementata all’interno di un sistema di telemedicina. Oggi si hanno a disposizione tutte le infrastrutture utili allo scopo, come i mezzi di trasmissione, dispositivi compatibili, spettro e larghezze di banda sufficienti, e le necessarie piattaforme hardware e software. ;I campioni audio di base per la diagnosi di malattie e/o disfunzioni sono un mezzo ottimale di implementazione di un sistema di telemedicina. Ci potranno essere benefici e soluzioni percorribili per gli utenti di tutte le classi. ;Il monitoraggio della salute di ogni individuo e la registrazione dei dati può essere molto semplice, potendo diventare la “spina dorsale†di un nuovo concetto di “medicina personalizzata†. Ne potrà beneficiare l’intera società velocizzando i processi di diagnosi. La soluzione dell’invenzione à ̈ conveniente sia da un punto di vista tecnico che economico. Non richiede nessun tipo di trattamento del paziente. Una analisi completa può essere fatta semplicemente raccogliendo parametri della voce. Non si prevedono coinvolgimenti di reazioni chimiche o qualunque altra cosa potenzialmente nociva, quindi né l’operatore, né i medici coinvolti né il paziente stesso vengono messi in nessun tipo di pericolo o in una situazione potenzialmente dannosa. ;Le rivendicazioni dipendenti descrivono forme di realizzazione preferite dell’invenzione. ;Breve descrizione delle figure ;Ulteriori caratteristiche e vantaggi dell’invenzione risulteranno maggiormente evidenti alla luce della descrizione dettagliata di una forma di realizzazione preferita, ma non esclusiva, di un processo di analisi della voce di un individuo, illustrato a titolo esemplificativo e non limitativo, con l’ausilio dell’ unita tavola di disegno in cui: ;la Fig.1 rappresenta un diagramma a blocchi del processo secondo l’invenzione. Descrizione in dettaglio di una forma di realizzazione preferita dell’invenzione Con riferimento alla Figura 1 à ̈ rappresentata una prima forma di realizzazione di un processo di analisi della voce di un individuo per indagare sul suo stato di salute. ;Un primo blocco del processo riguarda l’acquisizione audio del campione vocale; un secondo blocco del processo riguarda l’analisi di parametri acustici della voce dell’individuo sotto esame ed il loro confronto con intervalli di valori standard di parametri di voce di individui in salute presenti in un database di confronto e/o con intervalli di valori di parametri della voce associati a rispettive malattie; un terzo blocco del processo riguarda la rappresentazione dei risultati del processo di analisi utilizzabili dal medico per la sua diagnosi. ;Il database di confronto contiene valori standard di parametri acustici della voce che corrispondono a intervalli di valori medi calcolati a partire dai valori ottenuti analizzando campioni di voce di un determinato numero di individui in salute, che non presentavano anormalità patologiche. ;La determinazione di questi valori standard di parametri acustici della voce à ̈ stata ottenuta mediante le seguenti fasi. ;1) Registrazione di un campione di voce di ciascun individuo in salute, ad esempio disponendo l’individuo in una posizione seduta in un ambiente tranquillo, mediante un microfono disposto ad una distanza fissa dalla bocca dell’individuo, preferibilmente 6-10 cm, ad esempio circa 8 cm, e con una predeterminata angolazione rispetto alla bocca, preferibilmente 40-50°, ad esempio circa 45°, al fine di ridurre il rumore “aerodinamico†dalla bocca. L’individuo viene istruito a parlare pronunciando due volte specifici toni di ampiezza costante. Per standardizzare l’ampiezza di input, il segnale può venire normalizzato ad un livello predeterminato specifico. Questa variante può consentire confronti preliminari. 2) Analisi del campione di voce di ciascun individuo in salute mediante un apposito software configurato per estrarre un predeterminato numero di variabili acustiche, fino ad esempio a 12 variabili o parametri per ciascun canale audio in cui à ̈ suddiviso il campione vocale mediante una scheda sonora multicanale. A ciascun canale audio corrisponde ad esempio un determinato intervallo di frequenza oppure di altra idonea grandezza. ;Le 12 variabili acustiche possono essere ampiezza di picco (Peak Amplitude), frequenza di picco (Peak Frequency), SINAD (Signal-to-Noise-And-Distortion), Distorsione Armonica Totale (THD), rapporto segnale rumore (SNR), rumore (Noise), distorsione di intermodulazione (IMD), distorsione armonica totale rumore (THD+N), jitter, passo di campionamento (passo con il quale vengono prese le misurazioni di segnale analogico), bit depth (ad esempio 8-bit, 16-bit, 24-bit, 32-bit), accuratezza/sincronizzazione del campione (dispositivi digitali audio indipendenti hanno ciascuno una frequenza definita da oscillatori interni, ma se gli oscillatori non sono perfetti si avrà un sample-rate che varia leggermente. Nel tempo ciò comporta uno shift. Quindi se un dispositivo digitale à ̈ utilizzato per controllo temporale, occorrerà periodicamente risincronizzare il tutto). ;Può essere eseguito anche uno “spettrogramma†con tools noti. Gli spettrogrammi possono essere generati solitamente in due modalità: con una serie di filtri passabanda (usati solitamente con campioni analogici di voce), oppure calcolati dal segnale nel tempo utilizzando la Short-Time Fourier Transform (STFT). ;3) I valori delle variabili acustiche, ottenuti dai diversi individui, vengono analizzati usando software statistici noti. Il metodo della regressione lineare multipla ad esempio à ̈ utilizzato per identificare associazioni statisticamente significative tra i parametri o variabili acustiche e le variabili indipendenti di sesso, età, peso e temperatura corporea. Intervalli di valori medi di ciascun parametro acustico vengono calcolati e definiscono i valori standard del database di confronto. ;Nella seguente tabella sono indicati i valori di alcune delle 12 variabili acustiche ottenute dall’analisi della voce di individui normali, ossia in salute. ;;Pazienti con diverse patologie sono stati coinvolti nello studio. ;La voce normale deve essere armoniosa, relativamente “soffice†, chiara, né troppo “bassa†né troppo “acuta†. La voce normale à ̈ spesso paragonata al suono di una campana, ed i polmoni paragonati alla stessa campana. Quando la campana à ̈ intatta il suo suono à ̈ “chiaro†. In modo simile, quando i polmoni non sono ostruiti da muco, la voce à ̈ “chiara†, il tono “melodioso†. ;La determinazione degli intervalli di valori dei diversi parametri acustici, a cui à ̈ associata una particolare malattia che si vuole provare a diagnosticare con il processo dell’invenzione, à ̈ stata ottenuta verificando differenze significative nei valori di parametri della voce tra un gruppo di pazienti aventi detta malattia ed un gruppo di individui di controllo, ossia individui in salute, mediante ad esempio analisi di varianza o altra idonea tipologia di analisi statistica. ;Sono stati sottoposti ad esame pazienti di alcuni ospedali . Dei pazienti si sono chiesti dati demografici compresi sesso ed età. ;La determinazione di differenze statistiche significative nei valori variabili della voce tra gruppo di pazienti di controllo e gruppo di pazienti sotto esame à ̈ stata ottenuta per mezzo del modello dell’analisi di varianza “1-way†. Se una differenza statistica significativa era verificata, un valore di soglia veniva assegnato come limite superiore del 95% dell’intervallo di confidenza (media 1,96 * SD, con SD= deviazione standard) del valore del gruppo di controllo.
Tale valore di soglia viene quindi utilizzato per assegnare un significato statistico alla distribuzione dei dati.
In particolare, la determinazione degli intervalli di valori dei diversi parametri acustici, a cui à ̈ associata una particolare malattia che si vuole provare a diagnosticare con il processo dell’invenzione, à ̈ stata ottenuta eseguendo le fasi 1), 2) e 3) similari a quelle appena descritte, per ogni malattia già nota che si volesse provare a diagnosticare con il processo dell’invenzione: 1) registrazione di un campione di voce di individui avente una determinata malattia; 2) analisi del campione di voce di ciascun individuo avente detta determinata malattia mediante un apposito software configurato per estrarre un predeterminato numero di variabili acustiche, fino ad esempio a 12 variabili per ciascun canale audio; 3) i valori delle variabili acustiche, ottenuti dai diversi individui aventi detta determinata malattia, vengono analizzati usando un noto software statistico ed intervalli di valori medi di ciascun parametro acustico vengono calcolati in modo da definire gli intervalli di valori a cui corrisponde la determinata malattia.
Il processo, oggetto della presente invenzione, comprende i seguenti stadi:
- prevedere un database di confronto contenente valori standard di una pluralità di canali audio (ad esempio intervalli di frequenza dei canali audio) e, per ciascun canale audio, primi intervalli di valori di una pluralità di parametri acustici della voce di individui in salute;
- definire secondi intervalli di valori di detti parametri acustici, detti secondi intervalli essendo associati ad almeno una rispettiva malattia;
- acquisizione di un campione di voce dell’individuo sotto esame mediante un sistema di acquisizione;
- suddivisione del campione di voce dell’individuo sotto esame in una pluralità di canali audio, ciascun canale audio essendo misurato da una rispettiva pluralità di parametri acustici estratti mediante software;
- analisi dei canali audio e dei parametri acustici, ad essi associati, dell’individuo sotto esame mediante confronto numerico con i valori standard dei canali audio ed i primi intervalli dei parametri acustici della voce degli individui in salute, presenti nel database di confronto, e/o confronto numerico con i secondi intervalli dei parametri acustici associati ad almeno una rispettiva malattia;
- emissione di un report dei risultati dell’analisi con correlazione tra valori dei parametri acustici dell’individuo sotto esame ed eventuale malattia diagnosticata. Sarà poi cura del medico confermare, e/o verificare, e/o stabilire l’esatta condizione del paziente sotto esame.
L’acquisizione audio di campioni di voce del paziente à ̈ realizzata mediante un sistema di acquisizione comprendente un sensore di acquisizione, ad esempio un microfono, ed una scheda sonora multicanale configurata per estrarre le predeterminate variabili acustiche.
Il sistema o modulo di acquisizione 1 include sia hardware (processori, memorie) che software, capaci di estrarre le variabili acustiche dei campioni della voce.
Il sensore di acquisizione può essere un microfono in campo libero oppure, preferibilmente, un microfono con alloggiamento in accoppiamento con aria.
Un sensore ideale dovrebbe avere massa minima, una larghezza di banda più ampia possibile, ed essere relativamente insensibile al rumore ambientale. Vettori (array) di tali sensori possono essere uniti per consentire una mappa acustica adeguata della parete toracica.
Un microfono a sei canali può essere utilizzato, ad esempio, per registrare campioni vocali del paziente. Microfoni laser, membrane piezoelettriche e microfoni direzionali possono fornire metodi più efficienti di cattura del suono. Il problema del rumore ambientale à ̈ di particolare importanza nei normali ambienti clinici. Chiaramente, questo rumore può essere ridotto il più possibile schermando acusticamente l’ambiente tramite opportuni pannelli fono-assorbenti.
Alcune specifiche tecniche per ottenere buoni risultati sono, a titolo esemplificativo, riportate di seguito.
Sistema operativo: 32 bit Microsoft Windows professional XP o versioni Windows successive, oppure sistemi operativi equivalenti.
Processore : Pentium(R) 4 CPU 3.00 GHz o altri processori equivalenti.
RAM : almeno 2GB
Categorie di software: Playing, Recording, Audio analysis
Plug-in: Si
Import files: ad3 e Wave files
Export files: ad3 e Wave files.
Un modulo di analisi e confronto 2, provvisto del software appositamente realizzato per il processo dell’invenzione, permette di valutare i parametri acustici acquisiti dal sistema di acquisizione ed esegue un’analisi statistica mediante confronto con i corrispondenti primi intervalli di valori del database di confronto e/o con i secondi intervalli di valori associati alle rispettive malattie, per tutti i canali audio.
Il software può essere eseguito da postazione remota su server dedicato, oppure in locale, ad esempio con opportune routines interne ad un dispositivo mobile (esempio smartphone, tablet, ecc..), oppure essere “ibrido†, per esempio con database in remoto e algoritmo di analisi in locale, ecc..
Il software prevede: una barra di menù che include i comandi play, pausa, next, prev, record, save; un database con tabelle per “diseased†, “normal†, “sintomi†, dottori, pazienti, campioni, utenti; un database analitico con tabelle per dati dei pazienti (nome, id, età, sesso, frequenza di picco, ampiezza di picco, SINAD, THD, SNR, IMD, Noise, peso, temperatura); un database con tabelle di sintomi del disturbo/malattia (suo id, nome, sintomatologia); un database con i dati per i medici (id, nome, designazione, nome ospedale); un database con tabelle per i pazienti (id, nome, sesso, età, dottore di riferimento, sintomi, malattia, indirizzo, numero di contatto, ospedale); ecc..
Un modulo di rappresentazione e reporting 3 dei risultati dell’analisi e del confronto e confronto agisce come un generatore di report. Esso verifica la proposta di diagnosi con l’aiuto del database di confronto e/o dei valori di confronto e genera un report basato sull’outcome ottenuto dal modulo di analisi e confronto 2.
Tale report può essere stampato in diversi formati su richiesta dell’operatore.
Una seconda forma di realizzazione del processo dell’invenzione prevede in alternativa al processo di analisi sopra descritto, che prevede un confronto di tipo numerico, di eseguire un’analisi e, di conseguenza, individuare una determinata malattia mediate un confronto grafico tra almeno un grafico relativo alla situazione attuale di salute dell’individuo sotto esame ed un database di grafici relativi ad un campione di individui in salute oppure un database di grafici relativi a precedenti analisi dello stesso individuo sotto esame in condizioni di buona salute.
Ad esempio questi grafici possono essere nella forma di spettrogrammi ottenuti mediante filtri passa-banda oppure mediante calcolo usando la trasformata di Fourier a breve termine (STFT), a partire da campioni di voce dell’individuo sotto esame e campioni di voce di un campione di individui in salute.
Il filtraggio mediante filtri passa banda può essere eseguito, ad esempio, in modo analogico. L’intervallo di frequenza del segnale audio, nell’intervallo 20-20000Hz, può essere suddiviso in sezioni lineari (0-100, 100-200, 200-300, ... Hz) oppure logaritmiche (10-100, 100-1000, 1000-10000, ...Hz). Il segnale quindi à ̈ inviato al filtro corrispondente, il quale rimuove la parte di segnale che non rientra nell’intervallo di frequenze prescelto (a meno di residui causa di non idealità dei filtri, che possono comprendere una certa sovrapposizione tra segnali agli estremi di bande adiacenti). L’ampiezza di ciascun segnale in uscita dal rispettivo filtro viene registrata nel tempo. Ciascuna registrazione corrisponde quindi ad una linea orizzontale, l’insieme di tali linee forma una immagine, che da conto delle ampiezze nel tempo di ciascuna banda di frequenza.
Il calcolo dello spettrogramma tramite la STFT viene usualmente fatto tramite processo digitale. Il segnale viene campionato nel tempo, suddiviso in blocchi adiacenti (solitamente con sovrapposizioni), e trasformati con Fourier per determinarne l’ampiezza in frequenza di ciascun blocco. Ogni blocco corrisponde ad una linea verticale di una immagine, misura della ampiezza rispetto alla frequenza di uno specifico istante temporale.
Gli spettrogrammi sono un metodo di visualizzazione della traccia e del rumore che possono esistere in un segnale audio. Lo spettrogramma può essere visualizzato mediante il modulo di analisi e confronto 2 selezionando la porzione di traccia audio da utilizzare, ossia à ̈ il risultato di calcoli sullo spettro di frequenza di parti “finestrate†del segnale audio. È un diagramma tridimensionale della variazione temporale del segnale audio in energia e frequenza.
Una terza forma di realizzazione del processo dell’invenzione prevede invece sia la possibilità di un confronto numerico, come descritto per la prima forma di realizzazione, sia di un confronto grafico, ad esempio mediante spettrogrammi, come descritto per la seconda forma di realizzazione.
Come nella seconda forma di realizzazione, che può prevedere il confronto grafico tra un grafico relativo alla situazione attuale di salute dell’individuo sotto esame ed un database di grafici relativi a precedenti analisi dello stesso individuo sotto esame in condizioni di buona salute, anche la prima forma di realizzazione del processo dell’invenzione può prevedere in alternativa un confronto numerico tra i valori di parametri acustici relativi alla situazione attuale di salute dell’individuo sotto esame ed un database di confronto contenente valori standard di una pluralità di canali audio, in cui sono stati suddivisi campioni di voce dello stesso individuo sotto esame in condizioni di buona salute, e contenente per ciascun canale audio intervalli di valori di una pluralità di parametri acustici di detti campioni di voce.
In tutte le varianti del processo dell’invenzione il software installato nel modulo di analisi e confronto 2 permette di ottenere una misura di analisi vocale oggettiva, riproducibile e non invasiva, estraendo fino ad esempio a dodici variabili acustiche da ciascuna analisi vocale e confrontando dette variabili numericamente e/o graficamente con un database normativo integrato.
Tale software riproduce un player, ad esempio scritto in Visual Basic 6 con l’ausilio di Windows MCI & API. L’analisi vocale assistita dal computer rappresenta un importante avanzamento diagnostico in quanto fornisce misure acustiche oggettive, ed à ̈ ben tollerato dai pazienti. È un pacchetto software di processamento vocale e/o analisi spettrografica altamente versatile, idealmente costruito per utilizzo ospedaliero.
I databases di confronto sono inclusi nel software al fine anche di immagazzinare le informazioni relative al paziente ed i dettagli forniti dal dottore, utili per lo staff medico relativo.
Il software à ̈ configurato per identificare anormalità vocali e, quindi, malattie o disturbi. A tal fine, il database normalizzato à ̈ stato utilizzato per confronto con profili acustici di pazienti la cui voce veniva modificata a causa di differenti malanni utilizzando uno studio comparativo. Il processo dell’invenzione sostanzialmente valuta la relazione tra valori standard (normali di soggetti in salute) e valori “malati†(corrispondenti ad uno stato di malattia) confrontando le misurazioni acustiche fatte durante lo stato di malattia e lo stato normale di differenti individui. I campioni di voce raccolti da tutti questi individui sono stati confrontati ed un metodo statistico basato sull’analisi della varianza (ANOVA) à ̈ stato utilizzato per valutare in modo ottimale questi campioni di voce.
Il software consente registrazioni ed analisi dati audio con una interfaccia semplice ed intuitiva. Sono previsti centinaia di effetti e possibilità di analisi di diversi parametri come ampiezza, frequenza di picco, distorsione armonica totale, ecc. Il sistema di I/O consente di cambiare il dispositivo di playback e di registrazione. Tipicamente i settaggi di default possono anche andar bene per la maggior parte dei casi. I settaggi di canale possono essere cambiati da “mono†a qualunque numero di canali che il sistema à ̈ in grado di supportare. E’ prevista anche un’opzione per suonare una traccia audio mentre se ne registra un’altra.

Claims (10)

  1. RIVENDICAZIONI 1. Processo di analisi di un campione di voce di un individuo di cui valutare lo stato di salute, il processo di analisi comprendente almeno i seguenti stadi: a) prevedere un database di confronto contenente - valori standard di una pluralità di canali audio, in cui sono stati suddivisi primi campioni di voce di un gruppo di individui in salute o dello stesso individuo sotto esame, e, per ciascun canale audio, primi intervalli di valori di una pluralità di parametri acustici di detti primi campioni di voce, - e/o secondi intervalli di valori di una pluralità di parametri acustici, detti secondi intervalli essendo associati ad almeno una rispettiva malattia; - e/o grafici relativi ad una analisi di primi campioni di voce di un gruppo di individui in salute o almeno un grafico relativo ad una precedente analisi di un primo campione di voce dello stesso individuo sotto esame; b) acquisizione di un secondo campione di voce dell’individuo sotto esame; c) suddivisione di detto secondo campione di voce dell’individuo sotto esame in una rispettiva pluralità di canali audio, ed estrazione da ciascun canale audio di una rispettiva pluralità di parametri acustici; d) analisi dei canali audio e dei rispettivi parametri acustici, ad essi associati, dell’individuo sotto esame mediante confronto numerico con i valori standard dei canali audio ed i primi intervalli dei parametri acustici dei primi campioni di voce, e/o mediante confronto numerico con i secondi intervalli di valori dei parametri acustici associati ad almeno una rispettiva malattia, e/o mediante confronto grafico di almeno un grafico relativo alla attuale situazione di salute dell’individuo sotto esame con detti grafici relativi ad una analisi dei primi campioni di voce di un gruppo di individui in salute o con almeno un grafico relativo ad una precedente analisi di un primo campione di voce dello stesso individuo sotto esame.
  2. 2. Processo secondo la rivendicazione 1, in cui à ̈ previsto uno stadio e) di emissione di un report dei risultati dell’analisi con correlazione tra valori dei parametri acustici dell’individuo sotto esame ed eventuale malattia diagnosticata.
  3. 3. Processo secondo la rivendicazione 1, in cui nello stadio b) l’acquisizione audio del secondo campione di voce à ̈ realizzata mediante un sistema di acquisizione comprendente un sensore di acquisizione ed una scheda sonora multicanale configurata per suddividere detto secondo campione nei rispettivi canali audio ed estrarre i corrispondenti parametri acustici per ciascun canale audio.
  4. 4. Processo secondo la rivendicazione 1, in cui detti valori standard di una pluralità di canali audio sono intervalli di frequenza.
  5. 5. Processo secondo la rivendicazione 1, in cui detti grafici sono spettrogrammi ottenuti a partire dal campione di voce dell’individuo sotto esame e detti primi campioni di voce.
  6. 6. Processo secondo la rivendicazione 5, in cui detti spettrogrammi sono ottenuti mediante filtri passa-banda oppure mediante calcolo usando la trasformata di Fourier a breve termine (STFT).
  7. 7. Processo secondo una qualsiasi delle rivendicazioni precedenti, in cui detta pluralità di parametri acustici può comprendere almeno due dei seguenti parametri: ampiezza di picco, frequenza di picco, SINAD (Signal-to-Noise-And-Distortion), Distorsione Armonica Totale (THD), rapporto segnale rumore (SNR), rumore, distorsione di intermodulazione (IMD), distorsione armonica totale rumore (THD+N), jitter, passo di campionamento, bit depth, accuratezza/sincronizzazione del campione.
  8. 8. Processo secondo una qualsiasi delle rivendicazioni precedenti, in cui la determinazione dei valori standard à ̈ ottenuta mediante le seguenti fasi: 1) registrazione di un campione di voce di ciascun individuo in salute, 2) analisi del campione di voce di ciascun individuo in salute mediante un apposito software configurato per estrarre un predeterminato numero di parametri acustici per ciascun canale audio in cui à ̈ suddiviso il campione vocale mediante una scheda sonora multicanale; 3) analisi dei valori dei parametri acustici, ottenuti dai diversi individui, usando software statistici basati sul metodo della regressione lineare multipla e calcolo dei primi intervalli di valori di ciascun parametro acustico che definiscono i valori standard del database di confronto.
  9. 9. Processo secondo una qualsiasi delle rivendicazioni precedenti, in cui la determinazione dei secondi intervalli di valori dei parametri acustici, detti secondi intervalli essendo associati ad almeno una predeterminata malattia, Ã ̈ ottenuta verificando differenze significative nei valori di parametri della voce tra un gruppo di individui aventi detta predeterminata malattia ed un gruppo di individui di controllo, ossia individui in salute, mediante analisi di varianza o altra idonea tipologia di analisi statistica.
  10. 10. Processo secondo la rivendicazione 9, in cui la determinazione di detti secondi intervalli di valori à ̈ ottenuta eseguendo le seguenti fasi: 1) registrazione di un campione di voce di individui avente la predeterminata malattia; 2) analisi del campione di voce di ciascun individuo avente detta predeterminata malattia mediante un apposito software configurato per estrarre un predeterminato numero di parametri acustici; 3) analisi dei valori dei parametri acustici, ottenuti dai diversi individui aventi detta predeterminata malattia, usando un software statistico e calcolo di intervalli di valori medi di ciascun parametro acustico in modo da definire detti secondi intervalli di valori a cui corrisponde la predeterminata malattia.
IT000173A 2012-04-23 2012-04-23 Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute ITRM20120173A1 (it)

Priority Applications (1)

Application Number Priority Date Filing Date Title
IT000173A ITRM20120173A1 (it) 2012-04-23 2012-04-23 Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT000173A ITRM20120173A1 (it) 2012-04-23 2012-04-23 Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute

Publications (1)

Publication Number Publication Date
ITRM20120173A1 true ITRM20120173A1 (it) 2013-10-24

Family

ID=46321324

Family Applications (1)

Application Number Title Priority Date Filing Date
IT000173A ITRM20120173A1 (it) 2012-04-23 2012-04-23 Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute

Country Status (1)

Country Link
IT (1) ITRM20120173A1 (it)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090163779A1 (en) * 2007-12-20 2009-06-25 Dean Enterprises, Llc Detection of conditions from sound

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090163779A1 (en) * 2007-12-20 2009-06-25 Dean Enterprises, Llc Detection of conditions from sound

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BOYAN BOYANOV ET AL: "A Voice Analysis System for the Screening of Laryngeal Diseases", IEEE ENGINEERING IN MEDICINE AND BIOLOGY MAGAZINE, IEEE SERVICE CENTER, PISACATAWAY, NJ, US, vol. 16, no. 4, 1 July 1997 (1997-07-01), pages 74 - 82, XP011084811, ISSN: 0739-5175, DOI: 10.1109/51.603651 *
GELZINIS A ET AL: "Automated speech analysis applied to laryngeal disease categorization", COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE, ELSEVIER, AMSTERDAM, NL, vol. 91, no. 1, 1 July 2008 (2008-07-01), pages 36 - 47, XP022688341, ISSN: 0169-2607, [retrieved on 20080317], DOI: 10.1016/J.CMPB.2008.01.008 *
ZHANG ET AL: "Acoustic Analyses of Sustained and Running Voices From Patients With Laryngeal Pathologies", JOURNAL OF VOICE, ELSEVIER SCIENCE, US, vol. 22, no. 1, 29 December 2007 (2007-12-29), pages 1 - 9, XP022403856, ISSN: 0892-1997, DOI: 10.1016/J.JVOICE.2006.08.003 *

Similar Documents

Publication Publication Date Title
CN109273085B (zh) 病理呼吸音库的建立方法、呼吸疾病的检测系统及处理呼吸音的方法
CA2872785C (en) Sound-based spirometric devices, systems, and methods
US20170265776A1 (en) Spirometer system and methods of data analysis
US10506969B2 (en) Acoustic upper airway assessment system and method, and sleep apnea assessment system and method relying thereon
CA2464029A1 (en) Non-invasive ventilation monitor
JP2005065904A (ja) 睡眠時無呼吸症候群診断装置、並びに、信号解析装置及びその方法
Alsmadi et al. Design of a DSP-based instrument for real-time classification of pulmonary sounds
JP2013123494A (ja) 情報解析装置、情報解析方法、制御プログラム、および、記録媒体
US20180177432A1 (en) Apparatus and method for detection of breathing abnormalities
WO2015063834A1 (ja) 信号処理装置及び方法、並びにコンピュータプログラム及び記録媒体
Ellington et al. Developing a reference of normal lung sounds in healthy Peruvian children
US20240057964A1 (en) Deriving insights into health through analysis of audio data generated by digital stethoscopes
JP2005066044A (ja) 呼吸音データ処理装置及びプログラム
JP2009233103A (ja) 咳嗽検出装置及び咳嗽検出装置のプログラム
WO2015178439A2 (ja) 睡眠時無呼吸の中枢型/閉塞型診断支援装置および診断支援方法、ならびに睡眠時無呼吸の中枢型/閉塞型診断支援プログラムを記録したコンピュータ読み取り可能な記録媒体
CN102149317A (zh) 用于呼吸道声音的定量检测的方法和系统
CN107949322A (zh) 用于测量icp的系统和方法
JP2012024527A (ja) 腹式呼吸習熟度判定装置
ITRM20120173A1 (it) Processo di analisi di campioni di voce di un individuo per verificare il suo stato di salute
KR102345884B1 (ko) 수치 데이터를 이용한 수면무호흡증 예측 모델의 생성 방법 및 이 모델을 이용한 수면무호흡증 예측 방법
Zhdanov et al. Short review of devices for detection of human breath sounds and heart tones
KR102179511B1 (ko) 연하 진단 장치 및 프로그램
Curran et al. Using acoustic sensors to discriminate between nasal and mouth breathing
CN103417241B (zh) 一种肺音自动分析仪
Skalicky et al. Respiratory sounds as a source of information in asthma diagnosis