IT201900017000A1 - Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali - Google Patents

Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali Download PDF

Info

Publication number
IT201900017000A1
IT201900017000A1 IT102019000017000A IT201900017000A IT201900017000A1 IT 201900017000 A1 IT201900017000 A1 IT 201900017000A1 IT 102019000017000 A IT102019000017000 A IT 102019000017000A IT 201900017000 A IT201900017000 A IT 201900017000A IT 201900017000 A1 IT201900017000 A1 IT 201900017000A1
Authority
IT
Italy
Prior art keywords
request
processing means
signal
user
query
Prior art date
Application number
IT102019000017000A
Other languages
English (en)
Inventor
Leonardo Sergi
Original Assignee
Candy Spa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Candy Spa filed Critical Candy Spa
Priority to IT102019000017000A priority Critical patent/IT201900017000A1/it
Priority to EP20197172.8A priority patent/EP3796310B1/en
Priority to ES20197172T priority patent/ES2960291T3/es
Publication of IT201900017000A1 publication Critical patent/IT201900017000A1/it

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06FLAUNDERING, DRYING, IRONING, PRESSING OR FOLDING TEXTILE ARTICLES
    • D06F34/00Details of control systems for washing machines, washer-dryers or laundry dryers
    • D06F34/04Signal transfer or data transmission arrangements
    • D06F34/05Signal transfer or data transmission arrangements for wireless communication between components, e.g. for remote monitoring or control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Selective Calling Equipment (AREA)

Description

“Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali”
DESCRIZIONE
SFONDO TECNOLOGICO DELL’INVENZIONE
Campo di applicazione.
La presente invenzione riguarda in generale il campo tecnico del controllo vocale per elettrodomestici.
In particolare, l’invenzione si riferisce ad un metodo e un sistema per controllare un elettrodomestico e/o comunicare con esso mediante comandi vocali e con visualizzazioni testuali.
Descrizione dell’arte nota.
Nell’ambito tecnico degli elettrodomestici dotati di interfaccia utente avanzata, sono note numerose soluzioni che permettono di controllare l’elettrodomestico e/o comunicare con esso mediante comandi vocali.
Tipicamente, la comunicazione vocale viene attivata mediante una parola chiave, o parola di attivazione.
Una volta attivata, la comunicazione vocale consente di interagire con l’elettrodomestico, ad esempio per fornire comandi, mediante input vocali da parte dell’utente, che vengono opportunamente riconosciuti mediante diverse possibili tecnologie di riconoscimento vocale, di per sé note.
Il riconoscimento vocale, benché sia ormai una tecnologia ben sviluppata, non assicura con certezza che un comando o una richiesta vengano correttamente interpretati, specie in presenza di input vocali articolati, non limitati a prestabilite parole di comando.
Per questo, viene di solito permesso all’utente di operare un controllo sulla risposta fornita dal sistema di controllo basato su input vocale.
Nonostante ciò, nell’ambito tecnico considerato, è fortemente sentita l’esigenza di migliorare le garanzie di accuratezza del comando mediante input vocale, ed in particolare di fornire all’utente un riscontro circa il fatto che l’input vocale, riferito ad esempio a una richiesta, o ad un comando, o ad una domanda, sia stato correttamente interpretato.
In altri termini, il miglioramento costante delle tecniche di riconoscimento vocale non sostituisce L’esigenza di disporre di un riscontro per l’utente circa la corretta interpretazione del comando o richiesta vocale.
Tale esigenza non è completamente soddisfatta dalle soluzioni ad oggi note.
SOMMARIO DELL’INVENZIONE
È scopo della presente invenzione quello di fornire un metodo per controllare e/o comunicare con un elettrodomestico mediante comando vocale, che consenta di ovviare almeno parzialmente agli inconvenienti qui sopra lamentati con riferimento alla tecnica nota, e di rispondere alle summenzionate esigenze particolarmente avvertite nel settore tecnico considerato. Tale scopo è raggiunto mediante un metodo in accordo alla rivendicazione 1.
Ulteriori forme di realizzazione di tale metodo sono definite dalle rivendicazioni 2-11.
È inoltre scopo della presente invenzione fornire un sistema per controllare e/o comunicare con un elettrodomestico mediante comando vocale, in grado di eseguire il suddetto metodo. Tale sistema è definito nella rivendicazione 12.
Ulteriori forme di realizzazione del sistema sono definite dalle rivendicazioni 13-21.
Forma altresì oggetto della presente invenzione un elettrodomestico atto ad essere controllato mediante comando vocale in accordo con il suddetto metodo. Tale elettrodomestico è definito nella rivendicazione 22.
BREVE DESCRIZIONE DEI DISEGNI
Ulteriori caratteristiche e vantaggi del metodo e del sistema secondo l’invenzione risulteranno dalla descrizione di seguito riportata di esempi preferiti di realizzazione, dati a titolo indicativo e non limitativo, con riferimento all’annessa figura, in cui:
- le figure 1 e 2 illustrano, mediante rispettivi schemi a blocchi semplificati, un sistema per controllare e/o comunicare con un elettrodomestico mediante comando vocale, in accordo con due rispettive forme di realizzazione secondo l’invenzione;
- la figura 3 illustra esempio di visualizzazione testuale prevista in una forma di realizzazione del sistema e del metodo secondo l’invenzione;
- la figura 4 illustra una forma di realizzazione di un elettrodomestico secondo l’invenzione.
DESCRIZIONE DETTAGLIATA
Con riferimento alla figura 1, viene descritto un metodo per controllare e/o comunicare con un elettrodomestico 100 mediante comando vocale e con visualizzazione testuale.
Tale metodo comprende le fasi di ricevere un segnale acustico vocale SV, corrispondente ad un’espressione vocale di interrogazione e/o richiesta pronunciata da un utente, e generare un corrispondente primo segnale elettrico SE rappresentativo del segnale acustico vocale SV, da parte di mezzi di ricezione vocale 2 integrati nell’elettrodomestico 100.
Il metodo prevede quindi di generare un segnale elettrico di interrogazione e/o richiesta SR, sulla base del suddetto primo segnale elettrico SE ricevuto, rappresentativo del segnale acustico vocale SV, da parte di primi mezzi di elaborazione 3 integrati nell’elettrodomestico 100, operativamente collegati ai suddetti mezzi di ricezione vocale 2. Il metodo prevede poi di trasmettere il suddetto segnale elettrico di interrogazione e/o richiesta SR a secondi mezzi di elaborazione 4.
Il metodo comprende quindi la fase di elaborare il suddetto segnale elettrico di interrogazione e/o richiesta SR, da parte dei secondi mezzi di elaborazione 4, per identificare un’interrogazione e/o richiesta d’utente.
Tale interrogazione e/o richiesta d’utente, dunque l’intento dell’utente, può anche essere definita, nel campo tecnico considerato, con il termine inglese “utterance”.
Il metodo prevede poi le seguenti fasi, ad opera dei secondi mezzi di elaborazione 4: generare una prima stringa di caratteri di testo C1 corrispondente all’interrogazione e/o richiesta d’utente identificata nella fase di elaborare; determinare una risposta da fornire all’utente, sulla base dell’interrogazione e/o richiesta d’utente identificata; e generare una seconda stringa di caratteri di testo C2 corrispondente alla risposta determinata, da parte dei secondi mezzi di elaborazione 4.
Il metodo comprende infine le fasi di trasmettere la prima stringa di caratteri di testo C1 e la seconda stringa di caratteri di testo C2 ai primi mezzi di elaborazione 3 dell’elettrodomestico; e di visualizzare sia la prima stringa di caratteri di testo C1 sia la seconda stringa di caratteri di testo C2, mediante un’interfaccia visuale 5 compresa nell’elettrodomestico 100, in modo che l’utente possa leggere sia l’interrogazione e/o richiesta d’utente, come identificata dai secondi mezzi di elaborazione 4, sia la risposta determinata dai secondi mezzi di elaborazione 4.
Con riferimento alla figura 2, verranno qui di seguito descritte ulteriori forme di realizzazione del metodo.
Secondo una forma di realizzazione, il metodo, prima della fase di ricevere un segnale acustico vocale SV, comprende le fasi di ricevere una parola di attivazione PA pronunciata dall’utente, generare un rispettivo segnale elettrico di parola di attivazione SA, da parte dei mezzi di ricezione vocale 2 integrati nell’elettrodomestico, ed effettuare un riconoscimento della parola di attivazione, da parte dei primi mezzi di elaborazione 3.
In caso di esito positivo del riconoscimento della parola di attivazione, il metodo prevede di procedere con l’esecuzione della suddetta fase di ricevere un segnale acustico vocale SV corrispondente ad un’espressione vocale di interrogazione e/o richiesta e delle fasi successive precedentemente descritte.
Tale successione di fasi viene schematicamente illustrata nella figura 2, segnalando la fase di ricezione della parola di attivazione come passo “A” e la successiva fase di ricezione del segnale acustico vocale corrispondente ad un’espressione di interrogazione e/o richiesta come passo “B”.
Secondo una forma di realizzazione del metodo, la fase di generare un segnale elettrico di interrogazione e/o richiesta SR comprende generare un rispettivo segnale di stream audio di interrogazione e/o richiesta SR, rappresentativo del segnale acustico vocale SV. La forma di stream audio può essere infatti conveniente per la trasmissione e l’agevole ricezione da parte dei secondi mezzi di elaborazione 4.
In accordo con un’opzione implementativa del metodo, la suddetta fase di generare una prima stringa di caratteri di testo C1 comprende generare una stringa di testo esattamente corrispondente alla frase pronunciata dall’utente, come identificata da parte dei secondi mezzi di elaborazione 4.
Secondo una forma di realizzazione del metodo, la suddetta fase di elaborare il segnale elettrico di interrogazione e/o richiesta SR comprende riconoscere se l’interrogazione e/o richiesta è chiusa o aperta.
Un’interrogazione e/o richiesta è riconosciuta come chiusa se corrisponde ad una interrogazione e/o richiesta determinata, tale per cui i secondi mezzi di elaborazione 4 sono in grado di fornire una risposta univoca predeterminata in relazione alla interrogazione e/o richiesta, sulla base di informazioni e/o di stati dell’elettrodomestico accessibili ai secondi mezzi di elaborazione 4.
Un’interrogazione e/o richiesta è riconosciuta come aperta in tutti i casi in cui tale interrogazione e/o richiesta non viene riconosciuta come chiusa.
Secondo un’opzione implementativa del metodo, nel caso in cui l’interrogazione e/o richiesta viene riconosciuta come chiusa, la fase di identificare l’interrogazione e/o richiesta d’utente comprende identificare come interrogazione e/o richiesta d’utente l’interrogazione e/o richiesta chiusa riconosciuta.
In tal caso, la fase di determinare una risposta da fornire all’utente comprende determinare come risposta la suddetta risposta univoca predeterminata in relazione alla interrogazione e/o richiesta chiusa.
Secondo un’opzione implementativa del metodo, nel caso in cui l’interrogazione e/o richiesta viene riconosciuta come aperta, la fase di identificare l’interrogazione e/o richiesta d’utente comprende interpretare l’interrogazione e/o richiesta aperta come un’interrogazione e/o richiesta parziale.
In tal caso, il metodo comprende le ulteriori fasi di determinare e inviare all’utente una risposta interlocutoria, comprendente una richiesta di ulteriori precisazioni; impostare uno stato di attesa, predisposto alla ricezione di un’ulteriore espressione vocale di completamento della richiesta e/o interrogazione da parte dell’utente; e generare nel contempo, e trasmettere all’utente, una prima stringa di caratteri di testo C1 corrispondente all’interrogazione e/o richiesta parziale.
Secondo altre possibili varianti implementative, nel caso in cui una richiesta viene riconosciuta come aperta, il metodo prevede di individuare un’interrogazione e/o richiesta standard, considerata simile alla richiesta aperta, tra una pluralità di interrogazioni e/o richieste standard memorizzate, in accordo con criteri di similitudine predefiniti, e identificare come interrogazione e/o richiesta d’utente l’interrogazione e/o richiesta standard individuata.
Secondo una forma di realizzazione del metodo, la fase di elaborare il segnale elettrico di interrogazione e/o richiesta SR, per identificare un’interrogazione e/o richiesta d’utente comprende interpretare l’interrogazione e/o richiesta d’utente come un comando e/o un’azione di controllo e/o una domanda.
In tal caso, il metodo comprende inoltre le seguenti fasi.
Se l’interrogazione e/o richiesta d’utente è interpretata come un comando, il metodo prevede di trasmettere un segnale di comando corrispondente al comando ai primi mezzi di elaborazione 3 dell’elettrodomestico, da parte dei secondi mezzi di elaborazione 4.
Se l’interrogazione e/o richiesta d’utente è interpretata come un’azione di controllo, il metodo prevede di consultare, da parte dei secondi mezzi di elaborazione 4, mezzi di memorizzazione 6 in cui viene memorizzato periodicamente lo stato dell’elettrodomestico 100, per definire l’azione da eseguire e la modalità di esecuzione.
Se l’interrogazione e/o richiesta d’utente è interpretata come una domanda pertinente, tale per cui i secondi mezzi di elaborazione 4 sono in grado di fornire una risposta univoca, generare tale risposta univoca alla domanda, da parte dei secondi mezzi di elaborazione 4.
Se l’interrogazione e/o richiesta d’utente è interpretata come una domanda non pertinente, tale per cui i secondi mezzi di elaborazione 4 non sono in grado di fornire una risposta univoca, il metodo prevede di generare una risposta interlocutoria di richiesta di ulteriori informazioni, da parte dei secondi mezzi di elaborazione 4.
In accordo con una forma di realizzazione del metodo, la fase di effettuare un riconoscimento della parola di attivazione PA, da parte di primi mezzi di elaborazione 3, e la fase di elaborare il segnale elettrico di interrogazione e/o richiesta SR, da parte dei secondi mezzi di elaborazione 4, comprendono eseguire almeno un algoritmo e/o procedura di riconoscimento vocale.
Secondo diverse possibili opzioni implementative, l’algoritmo e/o procedura di riconoscimento vocale è scelto tra diversi possibili tipi di algoritmi e/o procedura di riconoscimento vocale di per sé noti.
Secondo un’opzione implementativa, vengono utilizzate procedure basate su tecniche computazionali di tipo “machine learning”.
In accordo con una forma di realizzazione del metodo, la fase di generare una prima stringa di caratteri di testo C1 e la fase di generare una seconda stringa di caratteri di testo C2 comprendono eseguire almeno un algoritmo e/o procedura di trasformazione in testo di un comando vocale.
Secondo diverse possibili opzioni implementative, l’algoritmo e/o procedura di trasformazione in testo di un comando vocale è scelto tra diversi possibili tipi di algoritmi e/o di trasformazione in testo di un comando vocale di per sé noti.
Secondo un’opzione implementativa, vengono utilizzate, per trasformare in testo un comando vocale, procedure basate su tecniche computazionali di tipo “machine learning”.
In accordo con una forma di realizzazione del metodo (illustrata ad esempio nella figura 3), la fase di visualizzare la prima stringa di caratteri di caratteri di testo e seconda stringa di caratteri di testo comprende visualizzare la prima stringa di caratteri di caratteri di testo C1 e la seconda stringa di caratteri di testo C2 come pop-up, su uno schermo 5 compreso nell’elettrodomestico.
Secondo una forma di realizzazione, il metodo comprende, dopo la fase di determinare una risposta al comando e/o azione di controllo, le ulteriori fasi di generare un segnale audio di risposta SAR, corrispondente alla risposta determinata, da parte dei secondi mezzi di elaborazione 4; poi, trasmettere il suddetto segnale audio di risposta SAR ai primi mezzi di elaborazione 3 dell’elettrodomestico; infine, riprodurre il segnale audio di risposta SAR per generare un output vocale di risposta, da parte di mezzi di generazione di output vocale 7 compresi nell’elettrodomestico.
Con riferimento alla figura 1, viene qui di seguito descritto un sistema 1 per controllare e/o interagire con un elettrodomestico 100 mediante controllo vocale, e con visualizzazione testuale.
Tale sistema 1 comprende mezzi di ricezione vocale 2 integrati nell’elettrodomestico 100, primi mezzi di elaborazione 3 integrati dell’elettrodomestico 100, un’interfaccia visuale 5 compresa nell’elettrodomestico 100, ed inoltre secondi mezzi di elaborazione 4.
I mezzi di ricezione vocale 2 integrati nell’elettrodomestico 100 sono configurati per ricevere un segnale acustico vocale SV, corrispondente ad una espressione vocale di interrogazione e/o richiesta pronunciata dall’utente, e trasformarlo in un corrispondente primo segnale elettrico SE rappresentativo del segnale acustico vocale SV.
I primi mezzi di elaborazione 3 integrati dell’elettrodomestico 100 sono operativamente collegati ai suddetti mezzi di ricezione vocale 2 per ricevere il suddetto primo segnale elettrico SE.
I primi mezzi di elaborazione 3 sono configurati per generare un segnale elettrico di interrogazione e/o richiesta SR sulla base del suddetto primo segnale elettrico SE, rappresentativo del segnale acustico vocale SV.
I secondi mezzi di elaborazione 4 sono operativamente collegati ai suddetti primi mezzi di elaborazione 3.
I secondi mezzi di elaborazione 4 sono configurati per ricevere dai primi mezzi di elaborazione 3 il segnale elettrico di interrogazione e/o richiesta SR, elaborare tale segnale elettrico di interrogazione e/o richiesta SR, per identificare una interrogazione e/o richiesta d’utente; generare una prima stringa di caratteri di testo C1 corrispondente all’interrogazione e/o richiesta d’utente identificata nella fase di elaborare; determinare una risposta da fornire all’utente, sulla base dell’interrogazione e/o richiesta d’utente identificata, e generare una seconda stringa di caratteri di testo C2 corrispondente alla risposta determinata; trasmettere le suddette prima stringa di caratteri di testo C1 e seconda stringa di caratteri di testo C2 ai primi mezzi di elaborazione 2 dell’elettrodomestico.
L’interfaccia visuale 5 compresa nell’elettrodomestico 100 è operativamente collegata ai suddetti primi mezzi di elaborazione 3.
L’interfaccia visuale 5 è configurata per visualizzare le suddette prima stringa di caratteri di testo C1 e seconda stringa di caratteri di testo C2, in modo che l’utente possa leggere sia l’interrogazione e/o richiesta d’utente, come identificata dai secondi mezzi di elaborazione 4, sia la risposta determinata dai secondi mezzi di elaborazione 4.
Con riferimento alle figure 1 e 2, vengono descritte ulteriori forme di realizzazione del sistema 1.
Secondo una forma di realizzazione del sistema, i mezzi di ricezione vocale 2 sono ulteriormente configurati per ricevere una parola di attivazione PA pronunciata da un utente, e per generare un rispettivo segnale elettrico di parola di attivazione SA.
I primi mezzi di elaborazione 3 sono inoltre configurati per effettuare un riconoscimento della parola di attivazione, e, in caso di esito positivo del riconoscimento della parola di attivazione, per procedere con l’esecuzione della suddetta fase di generare un segnale elettrico di interrogazione e/o richiesta SR.
Secondo una forma di realizzazione del sistema, i primi mezzi di elaborazione 3 sono inoltre configurati per generare, come segnale elettrico di interrogazione e/o richiesta SR, un segnale di stream audio di interrogazione e/o richiesta SR, rappresentativo del segnale acustico vocale SV.
Secondo diverse possibili forme di realizzazione del sistema, i primi mezzi di elaborazione 3 e i secondi mezzi di elaborazione 4 sono inoltre configurati per eseguire un metodo secondo una qualsiasi delle forme di realizzazione precedentemente illustrate.
In accordo con una forma di realizzazione del sistema, l’interfaccia visuale 5 comprende uno schermo 5, integrato nell’elettrodomestico, configurato per visualizzare la prima stringa di caratteri di testo C1 e la seconda stringa di caratteri di testo C2 sotto forma di pop-up (come ad esempio illustrato nella figura 3).
Secondo un esempio di implementazione, il suddetto schermo 5 comprende un display a cristalli liquidi o altro tipo di display di per sé noto, già previsto nell’elettrodomestico oppure aggiunto allo scopo di fornire la funzione di interfaccia visuale.
Secondo un’opzione implementativa, l’interfaccia visuale 5 è configurata per visualizzare un simbolo indicante la fase di ascolto o attesa di ascolto dell’input vocale da parte dell’utente (come mostrato nella parte superiore della figura 3) oppure per visualizzare i pop-up contenenti la domanda e la risposta (come mostrato nella parte inferiore della figura 3).
Secondo una forma di realizzazione del sistema, i secondi mezzi di elaborazione 4 sono ulteriormente configurati per generare un segnale di stream audio di risposta SAR, corrispondente alla risposta determinata, e per trasmettere tale segnale di stream audio di risposta SAR ai primi mezzi di elaborazione 2.
In tal caso, il sistema 1 comprende inoltre mezzi di generazione di output vocale 7, integrati nell’elettrodomestico 100 e configurati per riprodurre il segnale di stream audio di risposta SAR per generare un output vocale di risposta.
Secondo un’opzione implementativa, i mezzi di ricezione vocale 2 comprendono uno o più microfoni.
Secondo un’opzione implementativa, i mezzi di generazione di output vocale 7 comprendono un altoparlante o uno speaker o altri mezzi di riproduzione sonora 7 atti a fornire la risposta audio.
Secondo un’opzione implementativa, i primi mezzi di elaborazione 3 comprendono uno o più circuiti di elaborazione elettronica, e/o uno o più processori elettronici.
Secondo un’opzione implementativa, il sistema 1 comprende inoltre mezzi di rice-trasmissione 8 configurati per trasmettere il suddetto segnale elettrico di interrogazione o richiesta SR.
Secondo un’opzione implementativa, i mezzi di ricetrasmissione 8 sono inoltre configurati per ricevere le suddette prima stringa di caratteri di testo C1 e seconda stringa di caratteri di testo C2 e/o per ricevere il suddetto segnale audio di risposta SAR.
In accordo con una forma di realizzazione del sistema 1, i suddetti mezzi di ricezione vocale 2, primi mezzi di elaborazione 3 e mezzi di trasmissione 8 sono integrati in un modulo di riconoscimento vocale 30 incorporato nell’elettrodomestico 100.
In accordo con una forma di realizzazione del sistema 1, i secondi mezzi di elaborazione 4 comprendono uno o più circuiti di elaborazione elettronica, e/o uno o più processori elettronici, disposti remotamente rispetto all’elettrodomestico 100.
In tal caso, il sistema 1 comprende inoltre mezzi di telecomunicazione 9 configurati per collegare i mezzi di trasmissione 8 dell’elettrodomestico con i secondi mezzi di elaborazione 4.
Secondo un’opzione implementativa, i secondi mezzi di elaborazione 4 sono realizzati in un’infrastruttura cloud 20.
Secondo un’opzione implementativa, i mezzi di telecomunicazione 9 comprendono mezzi di comunicazione wireless, un router e un’infrastruttura di telecomunicazioni verso l’infrastruttura cloud 20.
Con riferimento alle figure 1, 2 e 4, viene ora descritto un elettrodomestico 100 secondo l’invenzione.
L’elettrodomestico 100 comprende una prima porzione 10 di un sistema 1 comprendente almeno i suddetti mezzi di ricezione vocale 2, primi mezzi di elaborazione 3 e interfaccia visuale 5 (secondo una qualsiasi delle opzioni implementative precedentemente descritte).
L’elettrodomestico 100 è operativamente collegato ad una seconda porzione 20 di un sistema 1 comprendente almeno i suddetti secondi mezzi di elaborazione 4 (secondo una qualsiasi delle opzioni implementative precedentemente descritte).
Nell’esempio illustrato in figura 4, l’elettrodomestico è una macchina lavatrice. Nella figura 4 sono evidenziati l’interfaccia visuale, cioè lo schermo 5, il modulo di riconoscimento vocale 30 e i mezzi di riproduzione sonora 7.
Come si può constatare, lo scopo della presente invenzione è pienamente raggiunto dal metodo e dal sistema sopra illustrati, in virtù delle loro caratteristiche funzionali e strutturali.
Infatti, il metodo e il sistema per controllare e/o comunicare con un elettrodomestico sopra descritti sono in grado di fornire all’utente una visualizzazione testuale, sotto forma di pop-up di testo, sia della interrogazione e/o richiesta d’utente sia della risposta elaborata dal sistema di controllo.
Tale caratteristica offre quindi all’utente un riscontro preciso su come il sistema di controllo a comando vocale ha interpretato la richiesta e/o interrogazione, cioè la “utterance” dell’utente, consentendo all’utente il pieno controllo della situazione.
Tali proprietà e capacità del metodo e del sistema secondo l’invenzione sono particolarmente utili in presenza di input vocali articolati, e non limitati a prestabilite parole di comando.
Alle forme di realizzazione del metodo e del sistema sopra descritti, un tecnico del ramo, per soddisfare esigenze contingenti, potrà apportare modifiche, adattamenti e sostituzioni di elementi con altri funzionalmente equivalenti, senza uscire dall'ambito delle seguenti rivendicazioni. Ognuna delle caratteristiche descritte come appartenente ad una possibile forma di realizzazione può essere realizzata indipendentemente dalle altre forme di realizzazione descritte.

Claims (22)

  1. RIVENDICAZIONI 1. Metodo per controllare e/o comunicare con un elettrodomestico (100) mediante comando vocale e con visualizzazione testuale, comprendente le fasi di: - ricevere un segnale acustico vocale (SV), corrispondente ad un’espressione vocale di interrogazione e/o richiesta pronunciata da un utente, e generare un corrispondente primo segnale elettrico (SE) rappresentativo del segnale acustico vocale (SV), da parte di mezzi di ricezione vocale (2) integrati nell’elettrodomestico (100); - generare un segnale elettrico di interrogazione e/o richiesta (SR), sulla base di detto primo segnale elettrico (SE) ricevuto, rappresentativo del segnale acustico vocale (SV), da parte di primi mezzi di elaborazione (3) integrati nell’elettrodomestico (10) operativamente collegati a detti mezzi di ricezione vocale (2); - trasmettere detto segnale elettrico di interrogazione e/o richiesta (SR) a secondi mezzi di elaborazione (4); - elaborare detto segnale elettrico di interrogazione e/o richiesta (SR), da parte dei secondi mezzi di elaborazione (4), per identificare un’interrogazione e/o richiesta d’utente; - generare una prima stringa di caratteri di testo (C1) corrispondente all’interrogazione e/o richiesta d’utente identificata nella fase di elaborare, da parte dei secondi mezzi di elaborazione; - determinare una risposta da fornire all’utente, sulla base dell’interrogazione e/o richiesta d’utente identificata, da parte dei secondi mezzi di elaborazione (4); - generare una seconda stringa di caratteri di testo (C2) corrispondente alla risposta determinata, da parte dei secondi mezzi di elaborazione (4); - trasmettere dette prima stringa di caratteri di testo (C1) e seconda stringa di caratteri di testo (C2) ai primi mezzi di elaborazione (3) dell’elettrodomestico; - visualizzare sia la prima stringa di caratteri di testo (C1) sia la seconda stringa di caratteri di testo (C2), mediante un’interfaccia visuale (5) compresa nell’elettrodomestico (100), in modo che l’utente possa leggere sia l’interrogazione e/o richiesta d’utente, come identificata dai secondi mezzi di elaborazione (4), sia la risposta determinata dai secondi mezzi di elaborazione (4).
  2. 2. Metodo secondo la rivendicazione 1, comprendente, prima di detta fase di ricevere un segnale acustico vocale (SV), la fase di: - ricevere una parola di attivazione (PA) pronunciata dall’utente, e generare un rispettivo segnale elettrico di parola di attivazione (SA), da parte di detti mezzi di ricezione vocale (2) integrati nell’elettrodomestico; - effettuare un riconoscimento della parola di attivazione (PA), da parte di detti primi mezzi di elaborazione (3); - in caso di esito positivo del riconoscimento della parola di attivazione, procedere con l’esecuzione di detta fase di ricevere un segnale acustico vocale (SV) corrispondente ad un’espressione vocale di interrogazione e/o richiesta e delle fasi successive definite nella rivendicazione 1.
  3. 3. Metodo secondo la rivendicazione 1 o la rivendicazione 2, in cui la fase di generare un segnale elettrico di interrogazione e/o richiesta (SR) comprende: - generare un rispettivo segnale di stream audio di interrogazione e/o richiesta (SR), rappresentativo del segnale acustico vocale (SV).
  4. 4. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detta fase di generare una prima stringa di caratteri di testo (C1) comprende generare una stringa di testo esattamente corrispondente alla frase pronunciata dall’utente, come identificata da parte dei secondi mezzi di elaborazione (4).
  5. 5. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui detta fase di elaborare il segnale elettrico di interrogazione e/o richiesta (SR) comprende riconoscere se l’interrogazione e/o richiesta è chiusa o aperta, in cui un’interrogazione e/o richiesta è riconosciuta come chiusa se corrisponde ad una interrogazione e/o richiesta determinata, tale per cui i secondi mezzi di elaborazione (4) sono in grado di fornire una risposta univoca predeterminata in relazione alla interrogazione e/o richiesta, sulla base di informazioni e/o di stati dell’elettrodomestico accessibili ai secondi mezzi di elaborazione (4), ed in cui un’interrogazione e/o richiesta è riconosciuta come aperta in tutti i casi in cui detta interrogazione e/o richiesta non viene riconosciuta come chiusa.
  6. 6. Metodo secondo la rivendicazione 5, in cui: se l’interrogazione e/o richiesta è chiusa: - la fase di identificare l’interrogazione e/o richiesta d’utente comprende identificare come interrogazione e/o richiesta d’utente l’interrogazione e/o richiesta chiusa riconosciuta; - la fase di determinare una risposta da fornire all’utente comprende determinare come risposta detta risposta univoca predeterminata in relazione alla interrogazione e/o richiesta chiusa; se l’interrogazione e/o richiesta è aperta: - la fase di identificare l’interrogazione e/o richiesta d’utente comprende interpretare l’interrogazione e/o richiesta aperta come un’interrogazione e/o richiesta parziale, e il metodo comprende le ulteriori fasi di: - determinare e inviare all’utente una risposta interlocutoria, comprendente una richiesta di ulteriori precisazioni; - impostare uno stato di attesa, predisposto alla ricezione di un’ulteriore espressione vocale di completamento della richiesta e/o interrogazione da parte dell’utente; - generare nel contempo, e trasmettere all’utente, una prima stringa di caratteri di testo (C1) corrispondente all’interrogazione e/o richiesta parziale.
  7. 7. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui la fase di elaborare il segnale elettrico di interrogazione e/o richiesta (SR), per identificare un’interrogazione e/o richiesta d’utente comprende: - interpretare l’interrogazione e/o richiesta d’utente come un comando e/o un’azione di controllo e/o una domanda; ed in cui il metodo comprende inoltre le fasi di: se l’interrogazione e/o richiesta d’utente è interpretata come un comando, trasmettere un segnale di comando corrispondente al comando ai primi mezzi di elaborazione (3) dell’elettrodomestico, da parte dei secondi mezzi di elaborazione (4); se l’interrogazione e/o richiesta d’utente è interpretata come un’azione di controllo, consultare, da parte dei secondi mezzi di elaborazione (4), mezzi di memorizzazione (6) in cui viene memorizzato periodicamente lo stato dell’elettrodomestico (100), per definire l’azione da eseguire e la modalità di esecuzione; se l’interrogazione e/o richiesta d’utente è interpretata come una domanda pertinente, tale per cui i secondi mezzi di elaborazione (4) sono in grado di fornire una risposta univoca, generare detta risposta univoca alla domanda, da parte dei secondi mezzi di elaborazione (4); se l’interrogazione e/o richiesta d’utente è interpretata come una domanda non pertinente, tale per cui i secondi mezzi di elaborazione (4) non sono in grado di fornire una risposta univoca, generare una risposta interlocutoria di richiesta di ulteriori informazioni, da parte dei secondi mezzi di elaborazione (4).
  8. 8. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui la fase di effettuare un riconoscimento della parola di attivazione, da parte di primi mezzi di elaborazione (3), e la fase di elaborare il segnale elettrico di interrogazione e/o richiesta (SR), da parte dei secondi mezzi di elaborazione (4), comprendono: - eseguire almeno un algoritmo e/o procedura di riconoscimento vocale.
  9. 9. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui la fase di generare una prima stringa di caratteri di testo (C1) e la fase di generare una seconda stringa di caratteri di testo (C2) comprendono: - eseguire almeno un algoritmo e/o procedura di trasformazione in testo di un comando vocale.
  10. 10. Metodo secondo una qualsiasi delle rivendicazioni precedenti, in cui la fase di visualizzare la prima stringa di caratteri di caratteri di testo e seconda stringa di caratteri di testo comprende: visualizzare la prima stringa di caratteri di caratteri di testo (C1) e seconda stringa di caratteri di testo (C2) come pop-up, su uno schermo (5) compreso nell’elettrodomestico.
  11. 11. Metodo secondo una qualsiasi delle rivendicazioni precedenti, comprendente dopo la fase di determinare una risposta al comando e/o azione di controllo, l’ulteriore fase di: - generare un segnale audio di risposta (SAR), corrispondente alla risposta determinata, da parte dei secondi mezzi di elaborazione (4); - trasmettere detto segnale audio di risposta (SAR) ai primi mezzi di elaborazione (3) dell’elettrodomestico; - riprodurre il segnale audio di risposta (SAR) per generare un output vocale di risposta, da parte di mezzi di generazione di output vocale (7) compresi nell’elettrodomestico.
  12. 12. Sistema (1) per controllare e/o interagire con un elettrodomestico (100) mediante controllo vocale, e con visualizzazione testuale, comprendente: - mezzi di ricezione vocale (2) integrati nell’elettrodomestico (100), configurati per ricevere un segnale acustico vocale (SV), corrispondente ad una espressione vocale di interrogazione e/o richiesta pronunciata dall’utente, e trasformarlo in un corrispondente primo segnale elettrico (SE) rappresentativo del segnale acustico vocale (SV); - primi mezzi di elaborazione (3) integrati dell’elettrodomestico (100) operativamente collegati a detti mezzi di ricezione vocale (2) per ricevere detto primo segnale elettrico (SE), detti primi mezzi di elaborazione (3) essendo configurati per: generare un segnale elettrico di interrogazione e/o richiesta (SR) sulla base di detto primo segnale elettrico (SE), rappresentativo del segnale acustico vocale (SV); - secondi mezzi di elaborazione (4), operativamente collegati a detti primi mezzi di elaborazione (3), detti secondi mezzi di elaborazione (4) essendo configurati per: ricevere dai primi mezzi di elaborazione (3) detto segnale elettrico di interrogazione e/o richiesta (SR); elaborare detto segnale elettrico di interrogazione e/o richiesta (SR), per identificare una interrogazione e/o richiesta d’utente; generare una prima stringa di caratteri di testo (C1) corrispondente all’interrogazione e/o richiesta d’utente identificata nella fase di elaborare; determinare una risposta da fornire all’utente, sulla base dell’interrogazione e/o richiesta d’utente identificata, e generare una seconda stringa di caratteri di testo (C2) corrispondente alla risposta determinata; - trasmettere dette prima stringa di caratteri di testo (C1) e seconda stringa di caratteri di testo (C2) ai primi mezzi di elaborazione (2) dell’elettrodomestico; - un’interfaccia visuale (5) compresa nell’elettrodomestico (100), operativamente collegata a detti primi mezzi di elaborazione (3), detta interfaccia visuale (5) essendo configurata per visualizzare dette prima stringa di caratteri di testo (C1) e seconda stringa di caratteri di testo (C2), in modo che l’utente possa leggere sia l’interrogazione e/o richiesta d’utente, come identificata dai secondi mezzi di elaborazione (4), sia la risposta determinata dai secondi mezzi di elaborazione (4).
  13. 13. Sistema (1) secondo la rivendicazione 12, in cui mezzi di ricezione vocale (2) sono ulteriormente configurati per ricevere una parola di attivazione pronunciata da un utente, e per generare un rispettivo segnale elettrico di parola di attivazione (SA), ed in cui i primi mezzi di elaborazione (3) sono inoltre configurati per effettuare un riconoscimento della parola di attivazione, e, in caso di esito positivo del riconoscimento della parola di attivazione, per procedere con l’esecuzione di detta fase di generare un segnale elettrico di interrogazione e/o richiesta (SR).
  14. 14. Sistema (1) secondo una delle rivendicazioni 12 o 13, in cui i primi mezzi di elaborazione (3) sono inoltre configurati per generare, come segnale elettrico di interrogazione e/o richiesta (SR), un segnale di stream audio di interrogazione e/o richiesta (SR), rappresentativo del segnale acustico vocale (SV).
  15. 15. Sistema (1) secondo una qualsiasi delle rivendicazioni 12-14, in cui i primi mezzi di elaborazione (3) e i secondi mezzi di elaborazione (4) sono inoltre configurati per eseguire un metodo secondo una qualsiasi delle rivendicazioni 4-11.
  16. 16. Sistema (1) secondo una qualsiasi delle rivendicazioni 12-15, in cui l’interfaccia visuale (5) comprende uno schermo (5) integrato nell’elettrodomestico configurato per visualizzare la prima stringa di caratteri di testo (C1) e la seconda stringa di caratteri di testo (C2) sotto forma di pop-up.
  17. 17. Sistema (1) secondo una qualsiasi delle rivendicazioni 12-16, in cui i secondi mezzi di elaborazione (4) sono ulteriormente configurati per generare un segnale di stream audio di risposta (SAR), corrispondente alla risposta determinata, e trasmettere detto segnale di stream audio di risposta (SAR) ai primi mezzi di elaborazione (2); in cui il sistema (1) comprende inoltre mezzi di generazione di output vocale (7) integrati nell’elettrodomestico (100) e configurati per riprodurre il segnale di stream audio di risposta (SAR) per generare un output vocale di risposta.
  18. 18. Sistema secondo una qualsiasi delle rivendicazioni 12-17, in cui: - i mezzi di ricezione vocale (2) comprendono uno o più microfoni; - i primi mezzi di elaborazione (3) comprendono uno o più circuiti di elaborazione elettronica, e/o uno o più processori elettronici; ed in cui il sistema (1) comprende inoltre mezzi di rice-trasmissione (8) configurati per trasmettere detto segnale elettrico di interrogazione o richiesta (SR).
  19. 19. Sistema (1) secondo la rivendicazione 18, in cui detti mezzi di ricezione vocale (2), detti primi mezzi di elaborazione (3) e detti mezzi di trasmissione (8) sono integrati in un modulo di riconoscimento vocale (30) incorporato nell’elettrodomestico (100).
  20. 20. Sistema (1) secondo una qualsiasi delle rivendicazioni 12-19, in cui i secondi mezzi di elaborazione (4) comprendono uno o più circuiti di elaborazione elettronica, e/o uno o più processori elettronici, disposti remotamente rispetto all’elettrodomestico (100), ed in cui il sistema (1) comprende inoltre mezzi di telecomunicazione (9) configurati per collegare i mezzi di trasmissione (8) dell’elettrodomestico con i secondi mezzi di elaborazione (4).
  21. 21. Sistema (1) secondo la rivendicazione 14, in cui i secondi mezzi di elaborazione (4) sono realizzati in un’infrastruttura cloud (20), ed in cui i mezzi di telecomunicazione (9) comprendono mezzi di comunicazione wireless, un router e un’infrastruttura di telecomunicazioni verso l’infrastruttura cloud (20).
  22. 22. Elettrodomestico (100) comprendente una prima porzione (10) di un sistema (1) secondo una qualsiasi delle rivendicazioni 12-21, comprendente almeno detti mezzi di ricezione vocale (2), primi mezzi di elaborazione (3) e interfaccia visuale (5), detto elettrodomestico (100) essendo operativamente collegato ad una seconda porzione (20) di un sistema (1) secondo una qualsiasi delle rivendicazioni 12-21 comprendente almeno detti secondi mezzi di elaborazione (4).
IT102019000017000A 2019-09-23 2019-09-23 Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali IT201900017000A1 (it)

Priority Applications (3)

Application Number Priority Date Filing Date Title
IT102019000017000A IT201900017000A1 (it) 2019-09-23 2019-09-23 Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali
EP20197172.8A EP3796310B1 (en) 2019-09-23 2020-09-21 Method and system for controlling and/or communicating with a domestic appliance by means of voice commands and text displays
ES20197172T ES2960291T3 (es) 2019-09-23 2020-09-21 Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT102019000017000A IT201900017000A1 (it) 2019-09-23 2019-09-23 Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali

Publications (1)

Publication Number Publication Date
IT201900017000A1 true IT201900017000A1 (it) 2021-03-23

Family

ID=69469016

Family Applications (1)

Application Number Title Priority Date Filing Date
IT102019000017000A IT201900017000A1 (it) 2019-09-23 2019-09-23 Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali

Country Status (3)

Country Link
EP (1) EP3796310B1 (it)
ES (1) ES2960291T3 (it)
IT (1) IT201900017000A1 (it)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170004828A1 (en) * 2013-12-11 2017-01-05 Lg Electronics Inc. Smart home appliances, operating method of thereof, and voice recognition system using the smart home appliances
EP3413304A2 (en) * 2017-05-19 2018-12-12 LG Electronics Inc. Method for operating home appliance and voice recognition server system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170004828A1 (en) * 2013-12-11 2017-01-05 Lg Electronics Inc. Smart home appliances, operating method of thereof, and voice recognition system using the smart home appliances
EP3413304A2 (en) * 2017-05-19 2018-12-12 LG Electronics Inc. Method for operating home appliance and voice recognition server system

Also Published As

Publication number Publication date
EP3796310B1 (en) 2023-08-16
ES2960291T3 (es) 2024-03-04
EP3796310A1 (en) 2021-03-24

Similar Documents

Publication Publication Date Title
US10055190B2 (en) Attribute-based audio channel arbitration
US9293134B1 (en) Source-specific speech interactions
US11762629B2 (en) System and method for providing a response to a user query using a visual assistant
KR102097710B1 (ko) 대화 분리 장치 및 이에서의 대화 분리 방법
JP2018124425A (ja) 音声対話装置及び音声対話方法
EP3180786A1 (en) Voice application architecture
JP6296821B2 (ja) 業務支援システム
JP6783339B2 (ja) 音声を処理する方法及び装置
KR101548907B1 (ko) 다중언어의 대화시스템 및 그 제어방법
US10216732B2 (en) Information presentation method, non-transitory recording medium storing thereon computer program, and information presentation system
CN111445906A (zh) 基于大数据的语音生成方法、装置、设备及介质
JP2016057508A (ja) 音声対話装置、音声対話装置の制御方法、および制御プログラム
EP3113175A1 (en) Method for converting text to individual speech, and apparatus for converting text to individual speech
IT201900017000A1 (it) Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali
US7451086B2 (en) Method and apparatus for voice recognition
CN102196100A (zh) 通话即时翻译系统及方法
JP2015100054A (ja) 音声通信システム、音声通信方法及びプログラム
CN109213466B (zh) 庭审信息的显示方法及装置
US20210304750A1 (en) Open Smart Speaker
WO2021253779A1 (zh) 一种语音识别方法以及系统
CN110534084B (zh) 一种基于FreeSWITCH的智能语音控制方法及系统
KR102376552B1 (ko) 음성 합성 장치 및 음성 합성 방법
JP2016186646A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
KR20200081925A (ko) 음성인식 교감형 로봇, 교감형 로봇 음성인식 시스템 및 그 방법
JP2015118307A (ja) 音声認識装置及び音声認識プログラム