DE102017129920A1 - Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper - Google Patents

Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper Download PDF

Info

Publication number
DE102017129920A1
DE102017129920A1 DE102017129920.3A DE102017129920A DE102017129920A1 DE 102017129920 A1 DE102017129920 A1 DE 102017129920A1 DE 102017129920 A DE102017129920 A DE 102017129920A DE 102017129920 A1 DE102017129920 A1 DE 102017129920A1
Authority
DE
Germany
Prior art keywords
voice
electronic device
electronic
devices
implementations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102017129920.3A
Other languages
English (en)
Inventor
Frédéric Heckmann
Yau-Shing Lee
Robert Rose
Jun Hou
Patanjali Peri
Phanindraja Ancha
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE102017129920A1 publication Critical patent/DE102017129920A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/203Cooling means for portable computers, e.g. for laptops
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • H04M1/0274Details of the structure or mounting of specific components for an electrical connector module
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • H04M1/0277Details of the structure or mounting of specific components for a printed circuit board assembly
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/03Constructional features of telephone transmitters or receivers, e.g. telephone hand-sets
    • H04M1/035Improving the acoustic characteristics by means of constructional features of the housing, e.g. ribs, walls, resonating chambers or cavities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/34Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
    • H04R1/345Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R9/00Transducers of moving-coil, moving-strip, or moving-wire type
    • H04R9/02Details
    • H04R9/022Cooling arrangements
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20009Modifications to facilitate cooling, ventilating, or heating using a gaseous coolant in electronic enclosures
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20009Modifications to facilitate cooling, ventilating, or heating using a gaseous coolant in electronic enclosures
    • H05K7/20136Forced ventilation, e.g. by fans
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/003Digital PA systems using, e.g. LAN or internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/005Audio distribution systems for home, i.e. multi-room use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K1/00Printed circuits
    • H05K1/02Details

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Otolaryngology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Thermal Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • Computer Hardware Design (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

Diese Anmeldung ist auf eine kompakte sprachaktivierte elektronische Vorrichtung mit Lautsprechern und elektronischen Komponenten und einer doppelten Wellenleiter/Kühlkörper-Struktur, die konfiguriert ist, um den Schall von den Lautsprechern zur Außenseite der Vorrichtung zu leiten und die Wärme von den elektronischen Komponenten zur Außenseite der Vorrichtung abzuführen, gerichtet.

Description

  • VERWANDTE ANMELDUNGEN
  • Diese Anmeldung beansprucht die Priorität der vorläufigen US-Patentanmeldung Nr. 62/441.144 mit dem Titel „Design for Compact Home Assistant with Combined Acoustic Waveguide and Heat Sink“, eingereicht am 30. Dezember 2016, die hier durch Bezugnahme vollständig mit aufgenommen ist.
  • TECHNISCHES GEBIET
  • Diese Anmeldung bezieht sich im Allgemeinen auf die Computertechnik einschließlich Verfahren und Systemen zum Schaffen einer sprachaktivierten elektronischen Vorrichtung, die als eine Anwenderschnittstelle in einer Smart-Home- oder Medienumgebung verwendet wird, aber nicht eingeschränkt auf diese Verfahren und Systeme.
  • HINTERGRUND
  • Mit Mikrophonen integrierte elektronische Vorrichtungen sind umfassend verwendet worden, um Spracheingaben von Anwendern zu sammeln und verschiedene sprachaktivierte Funktionen gemäß den Spracheingaben zu implementieren. Viele Mobilvorrichtungen des Standes der Technik enthalten z. B. ein Sprachassistentensystem (z. B. Siri und der Google Assistant), das konfiguriert ist, um Spracheingaben zu verwenden, um einen Telephonanruf einzuleiten, eine Restaurantsuche auszuführen, die Routenplanung auf einer Karte zu starten, Kalenderereignisse zu erzeugen, einen Beitrag zu einem sozialen Netz hinzuzufügen, ein Lied zu erkennen oder viele andere Aufgaben abzuschließen. Die Mobilvorrichtungen enthalten oft Anzeigeschirme, die es den Anwendern, die die Spracheingaben bereitstellen, erlauben, den Status der über die Spracheingaben angeforderten Aufgaben zu überprüfen.
  • In vielen Betriebsumgebungen ist es jedoch erwünschter/zweckmäßiger (oder sogar notwendig), dass ein Anwender anstelle der auf einer Anzeige gezeigten visuellen Informationen hörbare Antworten auf seine Spracheingaben empfängt. Dies kann der Fall sein, wenn eine elektronische Vorrichtung, die die Anwenderunterstützung bereitstellt, keinen Anzeigeschirm aufweist (wie es bei dem sprachaktivierten Lautsprecher von Google Home der Fall ist, der durch den Google Assistant mit Energie versorgt wird), oder wenn ein Anwender nicht mit einem Anzeigeschirm in Wechselwirkung treten kann (wie es in vielen Heimumgebungen der Fall ist, wo ein Anwender mit einer sprachaktivierten Assistentenvorrichtung in Wechselwirkung tritt, die sich nicht in der Nähe befindet, oder wo ein Anwender auf eine spezielle Aufgabe konzentriert ist).
  • Für derartige Betriebsumgebungen ist es hilfreich, eine elektronische Vorrichtung mit einem Lautsprechersystem zu schaffen, das Schall mit ausreichender Klarheit und Lautstärke erzeugt, um effektive hörbare Antworten auf die Anwenderanforderungen für eine Unterstützung zu schaffen. Derartige elektronische Vorrichtungen erfordern außerdem eine bordeigene Unterstützungselektronik, wie z. B. eines oder mehrere des Folgenden: Funkempfänger, -sender und -antennen, um drahtlose Kommunikationen zu unterstützen; eine Leistungsschaltungsanordnung und -verbinder; Prozessoren und Träger-Chips für die Verarbeitung in der Vorrichtung; und Datenverbinder. In Abhängigkeit von der Heim-/Betriebsumgebung, in der derartige elektronische Assistentenvorrichtungen eingesetzt werden, können die Assistentenvorrichtungen außerdem mit verschiedenen Aussehen und/oder Formfaktoren entworfen sein. Wo ein kompakter Formfaktor erwünscht ist, stellt er insbesondere eine Herausforderung dar, um die oben angegebenen Komponenten zu kombinieren, um die durch die Elektronik erzeugte Wärme effektiv abzuführen, während außerdem ein ausreichender Luftraum für den effektiven Betrieb des Lautsprechersystems geschaffen wird. Diese Herausforderung wird erhöht, wenn es erwünscht ist, dass die elektronische Vorrichtung eine relativ einfache Struktur besitzt und bei geringen Kosten hergestellt werden kann, während die sprachaktivierten Funktionen ähnlich zu jenen, die durch Mobilvorrichtungen ausgeführt werden können, implementiert werden.
  • Folglich gibt es einen Bedarf an kompakten Bauformen für elektronische Sprachassistentenvorrichtungen, die eine effektive hörbare Ausgabe und eine effektive Wärmeableitung bereitstellen.
  • ZUSAMMENFASSUNG
  • Es werden elektronische sprachaktivierte Vorrichtungen offenbart, die Sprachassistentenfähigkeiten in einem kleinen Formfaktor bereitstellen, die es den Anwendern ermöglichen, einen Bereich von Aktivitäten durch Sprachbefehle in natürlicher Sprache auszuführen, einschließlich eines oder mehrerer des: Steuerns lokaler und entfernter elektronischer Vorrichtungen, Ausgebens von Anforderungen für Dienste und Informationen an entfernte Server und/oder Sendens von Medieninformationen an andere elektronische Vorrichtungen für den Konsum durch den Anwender oder andere Anwender. In einigen Implementierungen enthalten die elektronischen sprachaktivierten Vorrichtungen sichtbare Indikatoren, wie z. B. eine oder mehrere Vollfarben-LEDs, die verwendet werden, um den Status der einer gesprochenen Anwenderanforderung zugeordneten Sprachverarbeitung anzugeben. In einigen Implementierungen enthalten die elektronischen sprachaktivierten Vorrichtungen einen oder mehrere Lautsprecher, die verwendet werden können, um hörbare Informationen zu einem Anwender weiterzuleiten, um eine Antwort auf eine Anwenderanforderung bereitzustellen (wie z. B. eine Suchabfrage oder eine Anforderung für einen Basketballspielstand), einen gesprochenen Status einer Sprachverarbeitungsoperation bereitzustellen, eine Musikauswahl abzuspielen und/oder eine Auswahl der aktuellen Nachrichten oder die aktuelle Wettervorhersage zu lesen. In Anbetracht dessen, dass die Spracheingaben für die Anwender zweckmäßig sind, erlauben es einige Implementierungen einem Anwender Spracheingaben zu verwenden, um zusätzlich zu dem Anfordern internetbasierter Dienste und Funktionen von entfernten Servern und Mobilvorrichtungen andere elektronische Vorrichtungen zu steuern, die für den Anwender zugänglich sind.
  • Entsprechend sind hier Implementierungen elektronischer Vorrichtungen beschrieben, die eine Sprachschnittstelle, bei der die Augen und die Hände frei sind, schaffen, um es den Anwendern zu ermöglichen, die sprachaktivierten Funktionen in zugeordneten Medienspielervorrichtungen zu aktivieren, Informationsanforderungen an entfernte Server auszugeben, hörbare Informationen oder Medien zu konsumieren und/oder Smart-Home- oder Smart-Medien-Vorrichtungen zu steuern, die innerhalb der sprachaktivierten elektronischen Vorrichtungen in einer Smart-Medien- oder Smart-Home-Umgebung gekoppelt sind. In verschiedenen hier beschriebenen Implementierungen enthält eine Smart-Medien-Umgebung eine oder mehrere sprachaktivierte elektronische Vorrichtungen und mehrere Medienanzeigevorrichtungen, wobei jede an einem eigenen Ort angeordnet ist. In einigen Implementierungen sind diese Vorrichtungen an eine Cast-Vorrichtung (z. B. eine Set-Top-Box, eine Google-Chromecast™-Vorrichtung oder ein Smart-TV) gekoppelt. Diese Vorrichtungen können über Sprachanforderungen gesteuert werden, die zu einer sprachaktivierten Vorrichtung ausgegeben werden, um die durch einen Anwender mündlich identifizierten Medienelemente abzuspielen.
  • Diese netzverbundenen und sprachaktivierten elektronischen Vorrichtungen sind normalerweise auf Oberflächen an verschiedenen Orten der Smart-Home-Umgebung angeordnet. In einigen Implementierungen sind die elektronischen Sprachassistentenvorrichtungen als solche konfiguriert, so dass sie einen Formfaktor und ein Aussehen aufweisen, die mit der gesamten Smart-Home-Umgebung zusammenpassen und/oder mit mehreren kompatiblen Oberflächen und Vorrichtungen überall in der Umgebung integriert sein können. In einigen Implementierungen enthält eine sprachaktivierte elektronische Vorrichtung z. B. eine abtrennbare Basis, die ersetzt werden kann, um eine bessere Anpassung an die Oberflächenausführungen in verschiedenen Heimumgebungen zu ermöglichen. In einigen Implementierungen sind die abtrennbaren Basen abtrennbare Gitter mit verschiedenen Aussehen der Oberfläche, wie z. B. Stoff, Leder, metallisch und glatt. In einigen Implementierungen ist die Basis über eine magnetische Anziehung mit einem oberen Abschnitt einer elektronischen Vorrichtung verbunden, was es ermöglicht, dass die Basis und der obere Abschnitt einer elektronischen Vorrichtung sicher, aber unter Verwendung einer manuellen Beeinflussung durch den Anwender trennbar befestigt sind. In einigen Implementierungen können die Basis und der obere Abschnitt unter Verwendung einer Verdrehungsbewegung, gefolgt von einer Trennungsbewegung getrennt werden, während in einigen Implementierungen die Basis und der obere Abschnitt nur unter Verwendung einer Trennungsbewegung getrennt werden können. In einigen Implementierungen enthält die elektronische Vorrichtung einen oberen Abschnitt, der als ein Lautsprechergitter dient, das die Übertragung von Schall von einem oder mehreren Lautsprechern, die innerhalb der elektronischen Vorrichtung enthalten sind, zur Außenseite der Vorrichtung erlaubt. In einigen Implementierungen kann der obere Abschnitt/das Lautsprechergitter mit verschiedenen Oberflächenausführungen konfiguriert sein und/oder kann sicher, aber trennbar an dem Basisabschnitt befestigt sein, wie oben beschrieben worden ist.
  • In einigen Implementierungen ist die elektronische Vorrichtung eine kompakte Vorrichtung, die einen oder mehrere Lautsprecher und mehrere elektronische Komponenten enthält, einschließlich eines oder mehreren des Folgenden: Mikroprozessoren, eines Speichers, Träger-Chips, drahtloser Empfänger und Sender, Antennen, einer Leistungsversorgungsschaltungsanordnung, einer oder mehrerer Kameras, Leistungs- und/oder Datenverbindern usw., von denen einige an einer oder mehreren Leiterplatten angebracht sind. Die Lautsprecher können für irgendeinen Tonausgabezweck verwendet werden, einschließlich der Ausgabe hörbarer Antworten auf mündliche Anwendereingaben, der Wiedergabe von Tonspuren des Medieninhalts und der Erzeugung hörbarer Alarme (einschließlich Pieptönen, Alarmen, Sirenen usw.). In einigen Implementierungen sind der eine oder die mehreren Lautsprecher innerhalb der elektronischen Vorrichtung angebracht, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher erzeugten Schalls zur Außenseite der Vorrichtung gibt. In derartigen Implementierungen ist ein Wellenleiter innerhalb der elektronischen Vorrichtung vorgesehen, um die Tonausgabe durch den einen oder die mehreren Lautsprechern aus dem Inneren zur Außenseite der Vorrichtung umzuleiten, um einen effektiven Lautsprecherbetrieb (einschließlich der effektiven Übertragung der Tonausgabe durch die Lautsprecher zur Außenseite der Vorrichtung) zu fördern. In einigen Implementierungen ist der Wellenleiter konfiguriert, um den Schall zu einem Lautsprechergitter umzuleiten, das an einer Außenfläche der elektronischen Vorrichtung vorgesehen ist.
  • In einigen Implementierungen ist der Wellenleiter außerdem konfiguriert, um als ein Kühlkörper zu wirken, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite der Vorrichtung abzuführen, wobei er in der Nähe wenigstens einiger der elektronischen Komponenten angebracht ist.
  • In einigen Implementierungen sind der eine oder die mehreren Lautsprecher in einem Basisabschnitt der elektronischen Vorrichtung angebracht, wobei sie eine Hauptschallabstrahlungsrichtung aufweisen, die innerhalb der Vorrichtung zu einem gebogenen Abschnitt des Doppelzweck-Wellenleiters/Kühlkörpers nach oben gewandt ist. Der gebogene Abschnitt ist entworfen, um den Schall von dem einen oder den mehreren Lautsprechern zur Außenseite der elektronischen Vorrichtung umzuleiten. Die wärmeerzeugenden elektronischen Komponenten und/oder die eine oder die mehreren Leiterplatten, die die elektronischen Komponenten tragen, sind direkt an einem zweiten Abschnitt des Doppelzweck-Wellenleiters/Kühlkörpers befestigt (oder unter Verwendung eines Wärmeleitungsweges indirekt daran gekoppelt), um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zu dem Kühlkörper zu übertragen. Der Kühlkörper ist konfiguriert, um die von den befestigten elektronischen Komponenten zu ihm übertragene Wärme zur Außenseite der elektronischen Vorrichtung zu bewegen. In einigen Implementierungen ist der Kühlkörper aus Materialien hergestellt, die im hohen Grade effektive Wärmeleitungseigenschaften aufweisen, um die Bewegung der Wärme aus dem Innern der Vorrichtung zur Außenseite der Vorrichtung zu fördern. In einigen Implementierungen ist der gebogene Abschnitt eine Unterseite des Doppelzweck-Wellenleiters/Kühlkörpers (z. B. eine Oberfläche, die zu dem einen oder den mehreren Lautsprechern nach unten gewandt ist), wobei der zweite Abschnitt eine Oberseite des Doppelzweck-Wellenleiters/Kühlkörpers ist, die der Unterseite des Doppelzweck-Wellenleiters/Kühlkörpers gegenüberliegt (z. B. eine Oberfläche, die nach oben gewandt ist, an der die elektronischen Komponenten befestigt sind). In einigen Implementierungen sind die Positionen der elektronischen Komponenten und des einen oder der mehreren Lautsprecher ausgetauscht, so dass sich der eine oder die mehreren Lautsprecher in einem oberen Abschnitt der elektronischen Vorrichtung befinden und zu einer oberen (gebogenen) Oberfläche des Doppelzweck-Wellenleiters/Kühlkörper nach unten abstrahlen, wobei die elektronischen Komponenten an einem Basisabschnitt der elektronischen Vorrichtung und dem Wellenleiter/Kühlkörper in dem unteren Abschnitt angebracht sind.
  • Figurenliste
  • Für ein besseres Verständnis der verschiedenen beschriebenen Implementierungen sollte auf die Beschreibung der Implementierungen im Folgenden im Zusammenhang mit den folgenden Zeichnungen, in denen gleiche Bezugszeichen überall in den Figuren auf entsprechende Teile verweisen, Bezug genommen werden.
    • 1 veranschaulicht eine beispielhafte Betriebsumgebung gemäß einigen Implementierungen.
    • 2 veranschaulicht eine beispielhafte sprachaktivierte elektronische Vorrichtung gemäß einigen Implementierungen.
    • 3 veranschaulicht ein beispielhaftes Sprachunterstützungs-Server-System gemäß einigen Implementierungen.
    • 4A, 4B und 4C sind eine Vorderansicht, eine Seitenansicht bzw. eine Rückansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung gemäß einigen Implementierungen.
    • 4D ist eine perspektivische Ansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung gemäß einigen Implementierungen.
    • 4E ist eine Schnittansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung, die einen Doppelzweck-Wellenleiter/Kühlkörper gemäß einigen Implementierungen zeigt.
    • 4F ist eine Explosionsansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung gemäß einigen Implementierungen.
  • Gleiche Bezugszeichen beziehen sich überall in den mehreren Ansichten der Zeichnungen auf entsprechende Teile.
  • BESCHREIBUNG DER IMPLEMENTIERUNGEN
  • Die digitale Revolution hat viele Vorteile geschaffen, die vom Ermöglichen des offenen Teilens von Informationen bis zur Wahrnehmung einer globalen Gemeinschaft reichen. Entstehende neue Techniken verursachen jedoch oft Verwirrung, Skepsis und Furcht unter den Verbrauchern, was es verhindert, dass die Verbraucher von der Technik profitieren. Die elektronischen Vorrichtungen werden in geeigneter Weise als Sprachschnittstellen verwendet, um Spracheingaben von Anwendern zu empfangen und sprachaktivierte Funktionen einzuleiten, wobei sie dadurch Lösungen, bei denen die Augen und die Hände frei sind, bieten, um eine einfache und produktive Anwenderwechselwirkung sowohl mit einer vorhandenen als auch mit einer entstehenden Technik zu ermöglichen. Spezifisch können die an einer elektronischen Vorrichtung mit sprachaktivierten Merkmalen empfangenen Spracheingaben Anweisungen und Informationen übertragen, selbst wenn die Sichtlinie eines Anwenders verdeckt ist und seine oder ihre Hände voll sind. Um eine Erfahrung, bei der die Augen und die Hände frei sind, zu ermöglichen, „hört“ eine sprachaktivierte elektronische Vorrichtung gemäß der vorliegenden Erfindung ständig oder nur dann, wenn sie ausgelöst ist, dies zu tun (z. B. über eine Anwenderäußerung eines „Hotwords“, um den Betrieb der elektronischen Vorrichtung auszulösen), auf die Umgebung (d. h., sie verarbeitet ständig die von der Umgebung gesammelten Audiosignale). Andererseits sind die Anwenderidentitäten mit der Stimme eines Anwenders und einer durch den Anwender verwendeten Sprache verknüpft. Um die Anwenderidentitäten zu schützen, werden diese sprachaktivierten elektronischen Vorrichtungen normalerweise an nichtöffentlichen Plätzen verwendet, die geschützte, kontrollierte und vertraute Räume (z. B. die Wohnung und das Auto) sind.
  • Spezifisch schafft in einigen Implementierungen eine elektronische Vorrichtung eine Sprachschnittstelle, bei der die Augen und die Hände frei sind, um die sprachaktivierten Funktionen in anderen Medienabspielvorrichtungen oder Smart-Home-Vorrichtungen, die innerhalb einer Smart-Medien- oder -Home-Umgebung gekoppelt sind, zu aktivieren. Die Smart-Medien-Umgebung enthält eine oder mehrere sprachaktivierte elektronische Vorrichtungen und mehrere Medienanzeigevorrichtungen, die jede an einem eigenen Ort angeordnet sind. Einige der elektronischen Vorrichtungen sind an eine Cast-Vorrichtung (z. B. eine Set-Top-Box) gekoppelt. Jede sprachaktivierte Vorrichtung ist konfiguriert, um eine Sprachnachricht aufzuzeichnen, aus der ein Cloud-Cast-Dienst-Server eine Anwendersprachanforderung (z. B. eine Medienabspielanforderung, eine Medienübertragungsanforderung oder eine Einleitungsanforderung für geschlossene Untertitel) bestimmt. Der Cloud-Cast-Dienst-Server leitet dann die Anwendersprachanforderung zu einer Ziel-Cast-Vorrichtung, wie sie durch die Sprachnachricht angegeben ist. Eine ähnliche Anordnung könnte verwendet werden, um Smart-Home-Vorrichtungen zu steuern, um sprachaktivierte Funktionen in einer Smart-Home-Umgebung zu implementieren. Derartige Verfahren ergänzen oder ersetzen optional herkömmliche Verfahren, die es erfordern, dass ein Anwender eine Fernsteuerung oder eine Client-Vorrichtung verwendet, um die Medienvorrichtungen oder die Smart-Home-Vorrichtungen in einer Smart-Medien- oder -Home-Umgebung zu steuern.
  • Gemäß verschiedenen Implementierungen dieser Anmeldung sind netzverbundene und sprachaktivierte elektronische Vorrichtungen normalerweise auf Oberflächen an unterschiedlichen Orten der Smart-Home-Umgebung angeordnet. Jede sprachaktivierte elektronische Vorrichtung ist konfiguriert, so dass sie einen Formfaktor aufweist, der mit der gesamten Smart-Home-Umgebung zusammenpasst. Jede sprachaktivierte elektronische Vorrichtung enthält z. B. eine Basis, die mit verschiedenen Typen von Oberflächen einschließlich eines Schreibtisches, einer Möbeloberfläche, einer Docking-Station, einer Medienspielervorrichtung oder anderen Oberflächen zusammenpassen und in Kontakt kommen könnte. Eine derartige sprachaktivierte elektronische Vorrichtung ist konfiguriert, um in einer kompakten und robusten Weise an ihre Basis gekoppelt zu sein, wobei sie dadurch in verschiedenen Heimumgebungen natürlich verschmilzt.
  • In einigen Implementierungen ist die elektronische Vorrichtung eine kompakte Vorrichtung, die einen oder mehrere Lautsprecher und mehrere elektronische Komponenten einschließlich eines oder mehreren des Folgenden enthält: Mikroprozessoren, eines Speichers, Träger-Chips, drahtloser Empfänger und Sender, Antennen, einer Leistungsversorgungsschaltungsanordnung, einer oder mehrerer Kameras, Leistungs- und/oder Datenverbindern usw., von denen einige an einer oder mehreren Leiterplatten angebracht sind. Die Lautsprecher können für irgendeinen Audioausgabezweck verwendet werden, einschließlich der Ausgabe hörbarer Antworten auf mündliche Anwendereingaben, der Wiedergabe von Tonspuren des Medieninhalts und der Erzeugung hörbarer Alarme (einschließlich Pieptönen, Alarmen, Sirenen usw.). In einigen Implementierungen sind der eine oder die mehreren Lautsprecher innerhalb der elektronischen Vorrichtung angebracht, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher erzeugten Schalls zur Außenseite der Vorrichtung gibt. Um einen effektiven Lautsprecherbetrieb (einschließlich der effektiven Übertragung der Schallausgabe durch den Lautsprecher zur Außenseite der Vorrichtung) zu fördern, ist in derartigen Implementierungen ein Wellenleiter innerhalb der elektronischen Vorrichtung vorgesehen, um den durch den einen oder die mehreren Lautsprecher ausgegebenen Schall von der Innenseite zur Außenseite der Vorrichtung umzuleiten. In einigen Implementierungen ist der Wellenleiter konfiguriert, um den Schall zu einem Lautsprechergitter umzuleiten, das an einer Außenfläche der elektronischen Vorrichtung vorgesehen ist. In einigen Implementierungen ist der Wellenleiter außerdem konfiguriert, um als ein Kühlkörper zu dienen, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite der elektronischen Vorrichtung abzuführen, wobei er in der Nähe wenigstens einiger der elektronischen Komponenten angebracht ist.
  • Nun wird ausführlich auf die Implementierungen Bezug genommen, deren Beispiele in den beigefügten Zeichnungen veranschaulicht sind. In der folgenden ausführlichen Beschreibung sind zahlreiche spezifische Einzelheiten dargelegt, um ein umfassendes Verständnis der verschiedenen beschriebenen Implementierungen bereitzustellen. Es ist jedoch für einen Durchschnittsfachmann auf dem Gebiet offensichtlich, dass die verschiedenen beschriebenen Implementierungen ohne diese spezifischen Einzelheiten praktiziert werden können. In anderen Fällen sind wohlbekannte Verfahren, Prozeduren, Komponenten, Schaltungen und Netze nicht ausführlich beschrieben worden, um die Aspekte der Implementierungen nicht unnötigerweise zu verbergen.
  • Eine Sprachassistenten-Betriebsumgebung
  • 1 ist eine beispielhafte Betriebsumgebung gemäß einigen Implementierungen. Die Betriebsumgebung 100 enthält eine oder mehrere sprachaktivierte elektronische Vorrichtungen 104 (z. B. die sprachaktivierten elektronischen Vorrichtungen 104-1 bis 104-N, im Folgenden die „sprachaktivierten Vorrichtung(en)“). Die eine oder die mehreren sprachaktivierten Vorrichtungen 104 können sich an einem oder mehreren Orten (z. B. alle in einem Zimmer oder Raum einer Struktur, überall in mehreren Räumen innerhalb einer Struktur oder überall in mehreren Strukturen verteilt (z. B. eine in einem Haus und eine im Auto des Anwenders)) befinden.
  • Die Umgebung 100 enthält außerdem eine oder mehrere steuerbare elektronische Vorrichtungen 106 (z. B. die elektronische Vorrichtung 106-1 bis 106-N, im Folgenden die „steuerbaren Vorrichtung(en)“). Beispiele der steuerbaren Vorrichtungen 106 enthalten Medienvorrichtungen (intelligente Fernsehgeräte, Lautsprechersysteme, drahtlose Lautsprecher, Set-Top-Boxes, Medien-Streaming-Vorrichtungen, Cast-Vorrichtungen) und Smart-Home-Vorrichtungen (z. B. eine intelligente Kamera, einen intelligenten Thermostaten, eine intelligente Leuchte, einen intelligenten Gefahrendetektor, ein intelligentes Türschloss).
  • Die sprachaktivierten Vorrichtungen 104 und die steuerbaren Vorrichtungen 106 sind durch die Kommunikationsnetze 110 kommunikationstechnisch an einen Sprachassistentendienst 140 (z. B. an ein Sprachunterstützungs-Server-System 112 des Sprachassistentendienstes 140) gekoppelt. In einigen Implementierungen sind eine oder mehrere der sprachaktivierten Vorrichtungen 104 und der steuerbaren Vorrichtungen 106 kommunikationstechnisch an ein lokales Netz 108 gekoppelt, das kommunikationstechnisch an die Kommunikationsnetze 110 gekoppelt ist; die sprachaktivierte(n) Vorrichtung(en) 104 und/oder die steuerbare(n) Vorrichtung(en) 106 sind über das lokale Netz 108 kommunikationstechnisch an das (die) Kommunikationsnetz(e) 110 (und durch die Kommunikationsnetze 110 an das Sprachunterstützungs-Server-System 112) gekoppelt. In einigen Implementierungen ist das lokale Netz 108 ein lokales Netz, das an einer Netzschnittstelle (z. B. einem Router) implementiert ist. Die sprachaktivierten Vorrichtungen 104 und die steuerbaren Vorrichtungen 106, die kommunikationstechnisch an das lokale Netz 108 gekoppelt sind, können außerdem durch das lokale Netz 108 miteinander kommunizieren.
  • Optional sind eine oder mehrere der sprachaktivierten Vorrichtungen 104 kommunikationstechnisch an die Kommunikationsnetze 110 gekoppelt und befinden sich nicht in dem lokalen Netz 108. Diese sprachaktivierten Vorrichtungen befinden sich z. B. nicht in dem Wi-Fi-Netz, das dem lokalen Netz 108 entspricht, sondern sind durch eine Zellenverbindung mit den Kommunikationsnetzen 110 verbunden. In einigen Implementierungen wird die Kommunikation zwischen den sprachaktivierten Vorrichtungen 104, die sich in dem lokalen Netz 108 befinden, und den sprachaktivierten Vorrichtungen 104, die sich nicht in dem lokalen Netz befinden, durch das Sprachunterstützungs-Server-System 112 ausgeführt. Die sprachaktivierten Vorrichtungen 104 (ob sie sich in dem lokalen Netz 108 oder in dem Netz 110 befinden) sind in einer Vorrichtungs-Registry 118 des Sprachassistentendienstes 140 registriert und folglich dem Sprachunterstützungs-Server-System 112 bekannt. Ähnlich können die sprachaktivierten Vorrichtungen 104, die sich nicht in dem lokalen Netz 108 befinden, durch das Sprachassistenten-Server-System 112 mit den steuerbaren Vorrichtungen 106 kommunizieren. Die steuerbaren Vorrichtungen 106 (ob sie sich in dem lokalen Netz 108 oder in dem Netz 110 befinden) sind außerdem in der Vorrichtungs-Registry 118 registriert. In einigen Implementierungen gehen die Kommunikationen zwischen den sprachaktivierten Vorrichtungen 104 und den steuerbaren Vorrichtungen 106 durch das Sprachunterstützungs-Server-System 112.
  • In einigen Implementierungen enthält die Umgebung 100 außerdem einen oder mehrere Inhalts-Hosts 114. Ein Inhalts-Host 114 kann eine entfernte Inhaltsquelle sein, von der der Inhalt in Übereinstimmung mit einer in einer Anwenderspracheingabe oder einem Anwendersprachbefehl enthaltenen Anforderung gestreamt oder anderweitig erhalten wird. Ein Inhalts-Host 114 kann eine Informationsquelle sein, von der das Sprachunterstützungs-Server-System 112 Informationen in Übereinstimmung mit einer Anwendersprachanforderung wiedergewinnt.
  • In einigen Implementierungen können die steuerbaren Vorrichtungen 106 Befehle oder Anforderungen (z. B. von einer sprachaktivierten Vorrichtung 104 und/oder dem Sprachunterstützungs-Server-System 112) empfangen, um spezifische Operationen auszuführen oder zu spezifischen Zuständen überzugehen und um die Operationen oder die Übergangszustände in Übereinstimmung mit den empfangenen Befehlen oder Anforderungen auszuführen.
  • In einigen Implementierungen sind eine oder mehrere der steuerbaren Vorrichtungen 106 Medienvorrichtungen, die in der Betriebsumgebung 100 angeordnet sind, um einem oder mehreren Anwendern Medieninhalt, Nachrichten und/oder andere Informationen bereitzustellen. In einigen Implementierungen wird der durch die Medienvorrichtungen bereitgestellte Inhalt in einer örtlichen Inhaltsquelle gespeichert, von einer entfernten Inhaltsquelle (z. B. dem (den) Inhalt-Host(s) 114) gestreamt oder lokal (z. B. durch einen lokalen Text-zu-Sprache-Prozessor, der eine kundenspezifische Nachrichteninformierung, E-Mails, Texte, einen lokalen Wetterbericht usw. für einen oder mehrere Insassen der Betriebsumgebung 100 liest) erzeugt. In einigen Implementierungen enthalten die Medienvorrichtungen Medienausgabevorrichtungen, die den Medieninhalt direkt an ein Publikum (z. B. ein oder mehrere Anwender) ausgeben, und Cast-Vorrichtungen, die vernetzt sind, um den Medieninhalt zu den Medienausgabevorrichtungen zu streamen. Beispiele der Medienausgabevorrichtungen enthalten Fernseh-Anzeigevorrichtungen (TV-Anzeigevorrichtungen) und Musikspieler, sind aber nicht darauf eingeschränkt. Beispiele der Cast-Vorrichtungen enthalten Set-Top-Boxes (STBs), DVD-Spieler, TV-Boxes und Medien-Streaming-Vorrichtungen, wie z. B. Googles Chromecast™-Medien-Streaming-Vorrichtung, sind aber nicht darauf eingeschränkt.
  • In einigen Implementierungen ist eine steuerbare Vorrichtung 106 außerdem eine sprachaktivierte Vorrichtung 104. In einigen Implementierungen ist eine sprachaktivierte Vorrichtung 104 außerdem eine steuerbare Vorrichtung 106. Eine steuerbare Vorrichtung 106 kann z. B. eine Sprachschnittstelle zu dem Sprachunterstützungsdienst 140 enthalten (z. B. eine Medienvorrichtung, die außerdem die Anwenderspracheingaben empfangen, verarbeiten und darauf reagieren kann). Als ein weiteres Beispiel kann eine sprachaktivierte Vorrichtung 104 außerdem in Übereinstimmung mit den Anforderungen oder Befehlen in den Spracheingaben spezielle Operationen ausführen und zu speziellen Zuständen übergehen (z. B. eine Sprachschnittstellenvorrichtung, die außerdem Streaming-Musik abspielen kann).
  • In einigen Implementierungen sind die sprachaktivierten Vorrichtungen 104 und die steuerbaren Vorrichtungen 106 einem Anwender, der ein entsprechendes Konto aufweist, oder mehreren Anwendern (z. B. einer Gruppe in Beziehung stehender Anwender, wie z. B. die Anwender in einer Familie oder in einer Organisation; allgemeiner einem Hauptanwender und einem oder mehreren berechtigten zusätzlichen Anwendern), die jeweilige Anwenderkonten aufweisen, in einem Anwenderbereich zugeordnet. Ein Anwender kann Spracheingaben oder Sprachbefehle in die sprachaktivierte Vorrichtung 104 ausführen. Die sprachaktivierte Vorrichtung 104 empfängt diese Spracheingaben von dem Anwender (z. B. dem Anwender 102), wobei die sprachaktivierte Vorrichtung 104 und/oder das Sprachunterstützungs-Server-System 112 fortfährt, um eine Anforderung in der Spracheingabe zu bestimmen und eine Antwort auf die Anforderung zu erzeugen.
  • In einigen Implementierungen ist die in einer Spracheingabe enthaltene Anforderung ein Befehl oder eine Anforderung an eine steuerbare Vorrichtung 106, um eine Operationen auszuführen (z. B. Medien abzuspielen, die Medien zu unterbrechen, die Medien vorzuspulen oder zurückzuspulen, die Lautstärke zu ändern, die Bildschirmhelligkeit verändern, die Lichthelligkeit zu ändern) oder zu einem anderen Zustand überzugehen (z. B. den Betriebsmodus zu ändern, ein- oder auszuschalten, in einen Schlafmodus zu gehen oder aus einem Schlafmodus zu erwachen).
  • In einigen Implementierungen antwortet eine sprachaktivierte elektronische Vorrichtung 104 auf die Spracheingabe durch: das Erzeugen und Bereitstellen einer gesprochenen Antwort auf einen Sprachbefehl (z. B. das Sprechen des aktuellen Zeitpunkts in Reaktion auf die Frage „wie spät ist es?“); das Streaming des durch einen Anwender angeforderten Medieninhalts (z. B. „spiele ein Lied von den Beach Boys ab“); das Lesen eines Nachrichtenbeitrags oder einer für den Anwender vorbereiteten Informierung über die täglichen Nachrichten; das Abspielen eines in der persönlichen Assistentenvorrichtung oder in dem lokalen Netz gespeicherten Medienelements; das Ändern eines Zustands oder das Betreiben einer oder mehrerer anderer angeschlossener Vorrichtungen innerhalb der Betriebsumgebung 100 (z. B. das Ein-/Ausschalten von Leuchten, Haushaltsgeräten oder Medienvorrichtungen, das Verriegeln/Entriegeln eines Schlosses, das Öffnen der Fenster usw.); oder das Ausgeben einer entsprechenden Anforderung über ein Netz 110 an einen Server.
  • In einigen Implementierungen sind die eine oder die mehreren sprachaktivierten Vorrichtungen 104 in der Betriebsumgebung 100 angeordnet, um Audioeingaben zum Einleiten verschiedener Funktionen (z. B. Medienabspielfunktionen der Medienvorrichtungen) zu sammeln. In einigen Implementierungen sind diese sprachaktivierten Vorrichtungen 104 (z. B. die Vorrichtungen 104-1 bis 104-N) in der Nähe einer steuerbaren Vorrichtung 104 (z. B. einer Medienvorrichtung) z. B. in demselben Zimmer mit den Cast-Vorrichtungen und den Medienausgabevorrichtungen angeordnet. Alternativ ist in einigen Implementierungen eine sprachaktivierte Vorrichtung 104 in einer Struktur angeordnet, die eine oder mehrere Smart-Home-Vorrichtungen, aber keine Medienvorrichtung aufweist. Alternativ ist in einigen Implementierungen eine sprachaktivierte Vorrichtung 104 in einer Struktur angeordnet, die eine oder mehrere Smart-Home-Vorrichtungen und eine oder mehrere Medienvorrichtungen aufweist. Alternativ ist in einigen Implementierungen eine sprachaktivierte Vorrichtung 104 an einem Ort angeordnet, der keine vernetzte elektronische Vorrichtung aufweist. Ferner kann in einigen Implementierungen ein Zimmer oder ein Raum in der Struktur mehrere sprachaktivierte Vorrichtungen 104 aufweisen.
  • In einigen Implementierungen enthält die sprachaktivierte Vorrichtung 104 wenigstens ein oder mehrere Mikrophone, einen Lautsprecher, einen Prozessor und einen Speicher, der wenigstens ein Programm zur Ausführung durch den Prozessor speichert. Der Lautsprecher ist konfiguriert, um es der sprachaktivierten Vorrichtung 104 zu ermöglichen, Sprachnachrichten und anderen Ton (z. B. hörbare Töne) an einen Ort zu liefern, wo sich die sprachaktivierte Vorrichtung 104 in der Betriebsumgebung 100 befindet und dadurch Musik zu übertragen, einen Zustand einer Audioeingabeverarbeitung zu melden, eine Unterhaltung mit einem Anwender der sprachaktivierten Vorrichtung 104 zu haben oder einem Anwender der sprachaktivierten Vorrichtung 104 Anweisungen zu geben. Als eine Alternative zu den Sprachnachrichten könnten außerdem sichtbare Signale verwendet werden, um dem Anwender der sprachaktivierten Vorrichtung 104 eine Rückkopplung hinsichtlich des Zustands der Audioeingabeverarbeitung bereitzustellen. Wenn die sprachaktivierte Vorrichtung 104 eine Mobilvorrichtung (z. B. ein Mobiltelephon oder ein Tablet-Computer) ist, ist ihr Anzeigeschirm konfiguriert, um eine Benachrichtigung hinsichtlich des Zustands der Audioeingabeverarbeitung anzuzeigen.
  • In einigen Implementierungen ist die sprachaktivierte Vorrichtung 104 eine Sprachschnittstellenvorrichtung, die mit einem Netz verbunden ist, um Spracherkennungsfunktionen mit der Hilfe eines Sprachunterstützungs-Server-Systems 112 bereitzustellen. Die sprachaktivierte Vorrichtung 104 enthält z. B. einen intelligenten Lautsprecher, der einem Anwender Musik bereitstellt, und ermöglicht einen Zugriff, bei dem die Augen und die Hände frei sind, auf einen Sprachassistentendienst (z. B. Google Assistant). Optional ist die sprachaktivierte Vorrichtung 104 eines von einem Desktop- oder Laptop-Computer, einem Tablet, einem Mobiltelephon, das ein Mikrophon enthält, einer Cast-Vorrichtung, die ein Mikrophon und optional einen Lautsprecher enthält, einem Audiosystem (z. B. einem Stereosystem, einem Lautsprechersystem, einem tragbaren Lautsprecher), das ein Mikrophon und einen Lautsprecher enthält, einem Fernsehgerät, das ein Mikrophon und einen Lautsprecher enthält, und einem Anwenderschnittstellensystem in einem Kraftfahrzeug, das ein Mikrophon und einen Lautsprecher und optional eine Anzeige enthält. Optional ist die sprachaktivierte Vorrichtung 104 eine einfache und preiswerte Sprachschnittstellenvorrichtung. Im Allgemeinen kann die sprachaktivierte Vorrichtung 104 irgendeine Vorrichtung sein, die zu einer Netzverbindung imstande ist und die ein Mikrophon, einen Lautsprecher und Programme, Module und Daten zum Wechselwirken mit einem Sprachassistentendienst enthält. In Anbetracht der Einfachheit und der geringen Kosten der sprachaktivierten Vorrichtung 104 enthält die sprachaktivierte Vorrichtung 104 eine Anordnung von Leuchtdioden (LEDs) anstatt eines vollständigen Anzeigeschirms, wobei sie ein sichtbares Muster auf den LEDs anzeigt, um den Zustand der Audioeingabeverarbeitung anzugeben. In einigen Implementierungen sind die LEDs Vollfarben-LEDs, wobei die Farben der LEDs als ein Teil des sichtbaren Musters, das auf den LEDs angezeigt wird, verwendet werden können. Mehrere Beispiele der Verwendung von LEDs, um sichtbare Muster anzuzeigen, um Informationen oder den Vorrichtungsstatus zu übermitteln, sind in der provisorischen US-Patentanmeldung Nr. 62/336.566 mit dem Titel „LED Design Language for Visual Affordance of Voice User Interfaces“, eingereicht am 13. Mai 2016, beschrieben, die in ihrer Gesamtheit durch Bezugnahme aufgenommen ist. In einigen Implementierungen werden sichtbare Muster, die den Zustand der Sprachverarbeitungsoperationen angeben, unter Verwendung charakteristischer Bilder angezeigt, die auf herkömmlichen Anzeigen gezeigt werden, die den sprachaktivierten Vorrichtungen zugeordnet sind, die die Sprachverarbeitungsoperationen ausführen.
  • In einigen Implementierungen werden LEDs oder andere visuelle Anzeigen verwendet, um einen gemeinsamen Sprachverarbeitungszustand mehrerer teilnehmender elektronischer Vorrichtungen zu übermitteln. In einer Betriebsumgebung, in der es z. B. mehrere Sprachverarbeitungs- oder Sprachschnittstellenvorrichtungen (z. B. mehrere elektronische Vorrichtungen 400, wie in 4A der '566-Anmeldung gezeigt ist; mehrere sprachaktivierte Vorrichtungen 104) gibt, können Gruppen von Farb-LEDs (z. B. die LEDs 404, wie in 4A der '566-Anmeldung gezeigt ist), die jeweiligen elektronischen Vorrichtungen zugeordnet sind, verwendet werden, um zu übermitteln, welche der elektronischen Vorrichtungen auf einen Anwender hört und welche der hörenden Vorrichtungen der Anführer ist (wobei die „Anführer“-Vorrichtung im Allgemeinen die Führung beim Antworten auf eine durch den Anwender ausgegebene gesprochene Anforderung übernimmt).
  • Allgemeiner beschreibt die '566-Anmeldung (siehe die Absätze [0087]-[0100] eine „LED-Entwurfssprache“, um unter Verwendung einer Sammlung von LEDs verschiedene Sprachverarbeitungszustände einer elektronischen Vorrichtung, wie z. B. einen „Hotword-Detektionszustand und -Hörzustand“, einen „Denkmodus oder einen Arbeitsmodus“ und einen „Antwortmodus oder Sprechmodus“ sichtbar anzugeben. In einigen Implementierungen werden die eindeutigen Zustände der Sprachverarbeitungsoperationen, die hier beschrieben sind, unter Verwendung einer Gruppe von LEDs in Übereinstimmung mit einem oder mehreren Aspekten der „LED-Entwurfssprache“ in der '566-Anmeldung dargestellt. Diese sichtbaren Indikatoren können außerdem mit einem oder mehreren hörbaren Indikatoren kombiniert werden, die durch die elektronischen Vorrichtungen erzeugt werden, die die Sprachverarbeitungsoperationen ausführen. Die resultierenden Ton- und/oder sichtbaren Indikatoren ermöglichen es den Anwendern in einer sprachinteraktiven Umgebung, den Zustand verschiedener elektronischer Sprachverarbeitungsvorrichtungen in der Umgebung zu verstehen und mit diesen Vorrichtungen in einer natürlichen, intuitiven Weise effektiv in Wechselwirkung zu treten.
  • Wenn in einigen Implementierungen die Spracheingaben in die sprachaktivierte Vorrichtung 104 verwendet werden, um die Medienausgabevorrichtungen über die Cast-Vorrichtungen zu steuern, ermöglicht die sprachaktivierte Vorrichtung 104 effektiv ein neues Niveau der Steuerung der cast-fähigen Medienvorrichtungen. In einem spezifischen Beispiel enthält die sprachaktivierte Vorrichtung 104 einen Lautsprecher zum zwanglosen Vergnügen mit einem Fernfeld-Sprachzugriff und Funktionen als eine Sprachschnittstellenvorrichtung für den Sprachassistentendienst. Die sprachaktivierte Vorrichtung 104 könnte in irgendeinem Bereich in der Betriebsumgebung 100 angeordnet sein. Wenn mehrere sprachaktivierte Vorrichtungen 104 in mehreren Zimmern verteilt sind, werden sie Cast-Audioempfänger, die synchronisiert sind, um die Spracheingaben aus diesen Zimmern bereitzustellen.
  • Spezifisch enthält in einigen Implementierungen die sprachaktivierte Vorrichtung 104 einen Wi-Fi-Lautsprecher mit einem Mikrophon, der mit einem sprachaktivierten Sprachassistentendienst (z. B. Google Assistant) verbunden ist. Ein Anwender kann eine Medienabspielanforderung über das Mikrophon der sprachaktivierten Vorrichtung 104 ausgeben und den Sprachassistentendienst auffordern, den Medieninhalt in der sprachaktivierten Vorrichtung 104 selbst oder in einer weiteren angeschlossenen Medienausgabevorrichtung abzuspielen. Der Anwender kann z. B. eine Medienabspielanforderung ausgeben, dem er dem Wi-Fi-Lautsprecher sagt „O. K. Google, spiele Katzenvideos auf dem Fernsehgerät in meinem Wohnzimmer“ ab. Der Sprachassistentendienst erfüllt dann die Medienabspielanforderung durch das Abspielen des angeforderten Medieninhalts in der angeforderten Vorrichtung unter Verwendung einer vorgegebenen oder bezeichneten Medienanwendung.
  • In einigen Implementierungen kann ein Anwender eine Sprachanforderung über das Mikrophon der sprachaktivierten Vorrichtung 104 hinsichtlich des Medieninhalts ausgeben, der bereits abgespielt worden ist oder der auf einer Anzeigevorrichtung abgespielt wird, (der Anwender kann z. B. nach Informationen über den Medieninhalt fragen, den Medieninhalt durch ein Online-Geschäft kaufen und einen sozialen Beitrag über den Medieninhalt verfassen und ausgeben).
  • In einigen Implementierungen kann ein Anwender wünschen, eine aktuelle Mediensitzung mit sich zu nehmen, wenn er sich durch das Haus bewegt, wobei er einen derartigen Dienst von einer oder mehreren der sprachaktivierten Vorrichtungen 104 anfordern kann. Dies erfordert, dass der Sprachassistentendienst 140 die aktuelle Mediensitzung von einer ersten Cast-Vorrichtung zu einer zweiten Cast-Vorrichtung, die nicht direkt mit der ersten Cast-Vorrichtung verbunden ist oder keine Kenntnis des Vorhandenseins der ersten Cast-Vorrichtung hat, überträgt. Anschließend an die Medieninhaltsübertragung fährt eine zweite Ausgabevorrichtung, die an die zweite Cast-Vorrichtung gekoppelt ist, fort, den Medieninhalt, den eine erste Ausgabevorrichtung, die an die erste Cast-Vorrichtung gekoppelt ist, [abgespielt hat], von dem exakten Punkt innerhalb einer Musikspur oder eines Video-Clips, wo das Abspielen des Medieninhalts in der ersten Ausgabevorrichtung aufgegeben wurde, abzuspielen. In einigen Implementierungen kann die sprachaktivierte Vorrichtung 104, die die Anforderung empfängt, um die Mediensitzung zu übertragen, der Anforderung genügen. In einigen Implementierungen leitet die sprachaktivierte Vorrichtung 104, die die Anforderung empfängt, um die Mediensitzung zu übertragen, die Anforderung zu einer weiteren Vorrichtung oder einem weiteren System (z. B. dem Sprachunterstützungs-Server-System 112) zur Behandlung weiter.
  • Ferner kann ein Anwender in einigen Implementierungen über das Mikrophon der sprachaktivierten Vorrichtung 104 eine Anforderung für Informationen oder für die Ausführung einer Handlung oder einer Operation ausgeben. Die angeforderten Informationen können persönlich (z. B. die E-Mails des Anwenders, die Kalenderereignisse des Anwenders, die Fluginformationen des Anwenders usw.), nicht persönlich (z. B. Sportspielstände, Nachrichtenbeiträge usw.) oder irgendwo dazwischen (z. B. Spielstände für die durch den Anwender bevorzugten Mannschaften oder Sportarten, Nachrichtenbeiträge aus den vom Anwender bevorzugten Quellen usw.) sein. Die angeforderten Informationen oder die angeforderte Handlung/Operation können den Zugriff auf persönliche Informationen (z. B. das Kaufen eines digitalen Medienelements mit den durch den Anwender bereitgestellten Bezahlungsinformationen, das Kaufen einer physischen Ware) einbeziehen. Die sprachaktivierte Vorrichtung 104 antwortet auf die Anforderung mit Sprachnachrichtenantworten für den Anwender, wobei die Antwort z. B. Anforderungen für zusätzliche Informationen, um die Anforderung zu erfüllen, eine Bestätigung, dass die Anforderung erfüllt worden ist, eine Mitteilung, dass die Anforderung nicht erfüllt werden kann, usw. enthalten.
  • In einigen Implementierungen kann die Betriebsumgebung 100 zusätzlich zu den sprachaktivierten Vorrichtungen 104 und den Medienvorrichtungen unter den steuerbaren Vorrichtungen 106 außerdem eine oder mehrere Smart-Home-Vorrichtungen unter den steuerbaren Vorrichtungen 106 enthalten. Die integrierten Smart-Home-Vorrichtungen enthalten intelligente, mehrfach abtastendende, netzverbundene Vorrichtungen, die in einem Smart-Home-Netz nahtlos miteinander und/oder mit einem zentralen Server oder einem Cloud-Computing-System integriert sind, um verschiedene nützliche Smart-Home-Funktionen bereitzustellen. In einigen Implementierungen ist eine Smart-Home-Vorrichtung an demselben Ort der Betriebsumgebung 100 wie eine Cast-Vorrichtung und/oder eine Ausgabevorrichtung angeordnet, wobei sie sich deshalb in der Nähe oder innerhalb eines bekannten Abstands bezüglich der Cast-Vorrichtung und der Ausgabevorrichtung befindet.
  • Die Smart-Home-Vorrichtungen in der Betriebsumgebung 100 können einen oder mehrere intelligente, mehrfachabtastende, netzverbundene Thermostate, einen oder mehrere intelligente, netzverbundene, mehrfachabtastende Gefahrendetektoren, eine oder mehrere intelligente, mehrfachabtastende, netzverbundene Zugangsweg-Schnittstellenvorrichtungen (die im Folgenden als „intelligente Türklingeln“ und „intelligente Türschlösser“ bezeichnet werden), ein oder mehrere intelligente, mehrfachabtastende, netzverbundene Alarmsysteme, ein oder mehrere intelligente, mehrfachabtastende, netzverbundene Kamerasysteme, einen oder mehrere intelligente, mehrfachabtastende, netzverbundene Wandschalter, eine oder mehrere intelligente, mehrfachabtastende, netzverbundene Steckdosen und eine oder mehrere intelligente, mehrfachabtastende, netzverbundene Leuchten enthalten, sind aber nicht darauf eingeschränkt. In einigen Implementierungen enthalten die Smart-Home-Vorrichtungen in der Betriebsumgebung 100 nach 1 mehrere intelligente, mehrfachabtastende, netzverbundene Haushaltsgeräte (die im Folgenden als „intelligente Haushaltsgeräte“ bezeichnet werden), wie z. B. Kühlschränke, Herde, Öfen, Fernsehgeräte, Waschmaschinen, Trockner, Leuchten, Stereoanlagen, Gegensprechanlagensysteme, Garagentüröffner, Bodenventilatoren, Deckenventilatoren, Wandklimaanlagen, Poolheizungen, Bewässerungssysteme, Sicherheitssysteme, Raumheizkörper, Fenster-AC-Einheiten, motorisierte Entlüftungskanäle usw. In einigen Implementierungen können irgendwelche dieser Smart-Home-Vorrichtungstypen mit Mikrophonen und einer oder mehreren Sprachverarbeitungsfähigkeiten ausgerüstet sein, wie hier beschrieben ist, um ganz oder teilweise auf die Sprachanforderungen von einem Insassen und einem Anwender zu antworten.
  • In einigen Implementierungen ist jede der steuerbaren Vorrichtungen 104 und der sprachaktivierten Vorrichtungen 104 zur Datenkommunikation und zum Teilen von Informationen mit anderen steuerbaren Vorrichtungen 106, sprachaktivierten elektronischen Vorrichtungen 104, einem zentralen Server oder einem Cloud-Computing-System und/oder anderen Vorrichtungen (z. B. einer Client-Vorrichtung), die mit einem Netz verbunden sind, imstande. Die Datenkommunikationen können unter Verwendung verschiedener kundenspezifischer oder standardisierter drahtloser Protokolle (z. B. IEEE 802.15.4, Wi-Fi, ZigBee, 6LoWPAN, Thread, Z-Wave Bluetooth Smart, ISA100.11a, WirelessHART, MiWi usw.) und/oder irgendeines verschiedener kundenspezifischer oder standardisierter verdrahteter Protokolle (z. B. Ethernet, HomePlug usw.) oder irgendeines anderen geeigneten Kommunikationsprotokolls, einschließlich der Kommunikationsprotokolle, die zum Datum des Einreichens dieses Dokuments noch nicht entwickelt worden sind, ausgeführt werden.
  • Durch die Kommunikationsnetze (z. B. das Internet) 110 können die steuerbaren Vorrichtungen 106 und die sprachaktivierten Vorrichtungen 104 mit einem Server-System (das hier außerdem als ein zentrales Server-System und/oder ein Cloud-Computing-System bezeichnet wird) kommunizieren. Optional kann das Server-System einem Hersteller, einer Unterstützungs-Entität oder einem Diensteanbieter zugeordnet sein, der den steuerbaren Vorrichtungen und dem dem Anwender angezeigten Medieninhalt zugeordnet ist. Entsprechend enthält das Server-System den Sprachunterstützungsserver 112, der die durch die sprachaktivierten Vorrichtungen 104 gesammelten Audioeingaben verarbeitet, einen oder mehrere Inhalts-Hosts 114, die den angezeigten Medieninhalt bereitstellen, optional einen Cloud-Cast-Dienst-Server, der basierend auf den verteilten Vorrichtungsendgeräten einen virtuellen Anwenderbereich erzeugt, und die Vorrichtungs-Registry 118, die einen Datensatz der verteilten Vorrichtungsendgeräte in der virtuellen Anwenderumgebung hält. Beispiele der verteilten Vorrichtungsendgeräte enthalten die steuerbaren Vorrichtungen 106, die sprachaktivierten Vorrichtungen 104 und die Medienausgabevorrichtungen, sind aber nicht darauf eingeschränkt. In einigen Implementierungen sind diese verteilten Vorrichtungsendgeräte mit einem Anwenderkonto (z. B. einem Google-Anwenderkonto) in dem virtuellen Anwenderbereich verknüpft. Es sollte erkannt werden, dass die Verarbeitung der durch die sprachaktivierten Vorrichtungen 104 gesammelten Audioeingaben lokal in einer sprachaktivierten Vorrichtung 104, in einem Sprachunterstützungs-Server 112, in einer weiteren Smart-Home-Vorrichtung (z. B. einer Hub-Vorrichtung) oder in irgendeiner Kombination aus allem oder einer Teilmenge des Obigen ausgeführt werden kann.
  • Es wird erkannt, dass in einigen Implementierungen die sprachaktivierte(n) Vorrichtung(en) 104 außerdem in einer Umgebung ohne Smart-Home-Vorrichtungen funktionieren. Eine sprachaktivierte Vorrichtung 104 kann z. B. sogar beim Fehlen von Smart-Home-Vorrichtungen auf Anwenderanforderungen für Informationen oder die Ausführung einer Handlung antworten und/oder verschiedene Medienabspielfunktionen einleiten oder steuern. Eine sprachaktivierte Vorrichtung 104 kann außerdem in einem umfassenden Bereich von Umgebungen, einschließlich und ohne Einschränkung eines Fahrzeugs, eines Schiffs, eines Unternehmens oder einer Fertigungsumgebung, funktionieren.
  • In einigen Implementierungen wird eine sprachaktivierte Vorrichtung 104 durch eine Spracheingabe, die ein Hotword (das außerdem als ein „Weckwort“ bezeichnet wird) enthält, „geweckt“ (z. B. um eine Schnittstelle für den Sprachassistentendienst in der sprachaktivierten Vorrichtung 104 zu aktivieren, um die sprachaktivierte Vorrichtung 104 in einen Zustand zu setzen, in dem die sprachaktivierte Vorrichtung 104 bereit ist, um die Sprachanforderungen für den Sprachassistentendienst zu empfangen). In einigen Implementierungen erfordert die sprachaktivierte Vorrichtung 104 das Wecken, falls die sprachaktivierte Vorrichtung 104 bezüglich des Empfangs von Spracheingaben während wenigstens eines vorgegebenen Zeitraums (z. B. 5 Minuten) unbenutzt gewesen ist; wobei der vorgegebene Zeitraum einem erlaubten Leerlaufzeitraum entspricht, bevor eine Sprachschnittstellensitzung oder eine Unterhaltung abläuft. Das Hotword kann ein Wort oder eine Redewendung sein und kann eine vorgegebene Vorgabe sein und/oder kann durch einen Anwender kundenspezifisch angepasst werden (ein Anwender kann z. B. einen Spitznamen für eine spezielle sprachaktivierte Vorrichtung 104 als das Hotword der Vorrichtung festlegen). In einigen Implementierungen kann es mehrere Hotwords geben, die eine sprachaktivierte Vorrichtung 104 wecken können. Ein Anwender kann das Hotword sprechen, auf eine Quittungsantwort von der sprachaktivierten Vorrichtung 104 warten (die sprachaktivierte Vorrichtung 104 gibt z. B. einen Gruß aus) und dann eine erste Sprachanforderung ausführen. Alternativ kann der Anwender das Hotword und die erste Sprachanforderung in einer Spracheingabe kombinieren (die Spracheingabe enthält z. B. das Hotword, gefolgt von der Sprachanforderung).
  • In einigen Implementierungen tritt eine sprachaktivierte Vorrichtung 104 mit einer steuerbaren Vorrichtung 106 (z. B. einer Medienvorrichtung, einer Smart-Home-Vorrichtung), einer Client-Vorrichtung oder einem Server-System in einer Betriebsumgebung 100 gemäß einigen Implementierungen in Wechselwirkung. Die sprachaktivierte Vorrichtung 104 ist konfiguriert, um die Audioeingaben von einer Umgebung in der Nähe der sprachaktivierten Vorrichtung 104 zu empfangen. Optional speichert die sprachaktivierte Vorrichtung 104 die Audioeingaben, wobei sie die Audioeingaben wenigstens teilweise lokal verarbeitet. Optional überträgt die sprachaktivierte Vorrichtung 104 die empfangenen Audioeingaben oder die teilweise verarbeiteten Audioeingaben über die Kommunikationsnetze 110 für die weitere Verarbeitung zu einem Sprachunterstützungs-Server-System 112. Die sprachaktivierte Vorrichtung 104 oder das Sprachunterstützungs-Server-System 112 bestimmt, ob es eine Anforderung in der Audioeingabe gibt und was die Anforderung ist, bestimmt und erzeugt eine Antwort auf die Anforderung und überträgt die Anforderung zu einer oder mehreren steuerbaren Vorrichtungen 106. Die steuerbare(n) Vorrichtung(en) 106, die die Antwort empfängt (empfangen), ist (sind) konfiguriert, um in Übereinstimmung mit der Antwort die Operationen auszuführen oder die Zustände zu ändern. Eine Medienvorrichtung ist z. B. konfiguriert, um einen Medieninhalt oder einen Internetinhalt von einem oder mehreren Inhalts-Hosts 114 für die Anzeige auf einer an die Medienvorrichtung gekoppelten Ausgabevorrichtung in Übereinstimmung mit einer Antwort auf eine Anforderung in der Audioeingabe zu erhalten.
  • In einigen Implementierungen sind die steuerbare(n) Vorrichtung(en) 106 und die sprachaktivierte(n) Vorrichtung(en) 104 in einem Anwenderbereich miteinander verknüpft und spezifischer über ein Anwenderkonto im Anwenderbereich einander zugeordnet. Die Informationen in der steuerbaren Vorrichtung 106 (ob im lokalen Netz 108 oder im Netz 110) und der sprachaktivierten Vorrichtung 104 (ob im lokalen Netz 108 oder im Netz 110) sind in der Vorrichtungs-Registry 118 in Verbindung mit dem Anwenderkonto gespeichert. In einigen Implementierungen gibt es eine Vorrichtungs-Registry für die steuerbaren Vorrichtungen 106 und eine Vorrichtungs-Registry für die sprachaktivierten Vorrichtungen 104. Die Registry der steuerbaren Vorrichtungen kann auf die Vorrichtungen in der Registry der sprachaktivierten Vorrichtungen, die dem Anwenderbereich zugeordnet sind, Bezug nehmen und umgekehrt.
  • In einigen Implementierungen sind eine oder mehrere der sprachaktivierten Vorrichtungen 104 (und eine oder mehrere Cast-Vorrichtungen) und eine oder mehrere der steuerbaren Vorrichtungen 106 über eine Client-Vorrichtung 103 für den Sprachassistentendienst 140 bevollmächtigt. In einigen Implementierungen enthält die sprachaktivierte Vorrichtung 104 keinen Anzeigeschirm, wobei sie auf die Client-Vorrichtung 103 angewiesen ist, um während eines Bevollmächtigungsprozesses eine Anwenderschnittstelle zu schaffen, und ebenso ähnlich für eine steuerbare Vorrichtung 106. Spezifisch ist die Client-Vorrichtung 103 mit einer Anwendung installiert, die es einer Anwenderschnittstelle ermöglicht, die Bevollmächtigung einer neuen sprachaktivierten Vorrichtung 104 und/oder einer neuen steuerbaren Vorrichtung 106, die in der Nähe der Client-Vorrichtung angeordnet ist, zu fördern. Ein Anwender kann eine Anforderung an die Anwenderschnittstelle der Client-Vorrichtung 103 senden, um einen Bevollmächtigungsprozess für eine neue elektronische Vorrichtung 104/106 einzuleiten, die bevollmächtigt werden muss. Nach dem Empfangen der Bevollmächtigungsanforderung baut die Client-Vorrichtung 103 eine Kurzstrecken-Kommunikationsverbindung mit der neuen elektronischen Vorrichtung 104/103 auf, die bevollmächtigt werden muss. Optional wird die Kurzstrecken-Kommunikationsverbindung basierend auf einer Nahfeldkommunikation (NFC), Bluetooth, Bluetooth Low Energy (BLE) und dergleichen aufgebaut. Die Client-Vorrichtung 103 übermittelt dann die Daten der drahtlosen Konfiguration, die einem drahtlosen lokalen Netz (WLAN) (z. B. dem lokalen Netz 108) zugeordnet sind, zu der neuen elektronischen Vorrichtung 104/106. Die Daten der drahtlosen Konfiguration enthalten wenigstens einen WLAN-Sicherheitscode (d. h., das Kennwort der Dienstmengenkennung (SSID)) und enthalten optional eine SSID, eine Internetprotokolladresse (IP-Adresse), eine Proxy-Konfiguration und eine Gateway-Konfiguration. Nach dem Empfangen der Daten der drahtlosen Konfiguration über die Kurzstrecken-Kommunikationsverbindung decodiert die neue elektronische Vorrichtung 104/106 die Daten der drahtlosen Konfiguration und gewinnt die neue elektronische Vorrichtung 104/106 die Daten der drahtlosen Konfiguration wieder, wobei sie basierend auf den Daten der drahtlosen Konfiguration dem WLAN beitritt.
  • In einigen Implementierungen werden zusätzliche Anwenderbereichsinformationen in die auf der Client-Vorrichtung 103 angezeigte Anwenderschnittstelle eingegeben und verwendet, um die neue elektronische Vorrichtung 104/106 mit einem Konto im Anwenderbereich zu verknüpfen. Optional werden die zusätzlichen Anwenderbereichsinformationen zusammen mit den Daten der drahtlosen Konfiguration über die Kurzstrecken-Kommunikationsverbindung zu der neuen elektronischen Vorrichtung 104/106 übermittelt. Optional werden die zusätzlichen Anwenderbereichsinformationen über das WLAN zu der neuen elektronischen Vorrichtung 104/106 übermittelt, nachdem die neue Vorrichtung dem WLAN beigetreten ist.
  • Sobald die elektronische Vorrichtung 104/106 in dem Anwenderbereich bevollmächtigt worden ist, können andere Vorrichtungen und ihre zugeordneten Aktivitäten über mehrere Steuerwege gesteuert werden. In Übereinstimmung mit einem Steuerweg wird eine in der Client-Vorrichtung 103 installierte Anwendung verwendet, um die andere Vorrichtung und ihre zugeordneten Aktivitäten (z. B. die Medienabspielaktivitäten) zu steuern. Alternativ wird in Übereinstimmung mit einem weiteren Steuerweg die elektronische Vorrichtung 104/106 verwendet, um eine Steuerung, bei der die Augen und die Hände frei sind, der anderen Vorrichtung und ihrer zugeordneten Aktivitäten zu ermöglichen.
  • In einigen Implementierungen können den sprachaktivierten Vorrichtungen 104 und den steuerbaren Vorrichtungen 106 durch einen Anwender (z. B. durch den Hauptanwender, dem die Vorrichtungen im Anwenderbereich zugeordnet sind) Spitznamen zugewiesen werden. Einer Lautsprechervorrichtung im Wohnzimmer kann z. B. ein Spitzname „Wohnzimmerlautsprecher“ zugewiesen sein. In dieser Weise kann sich der Anwender durch das Sprechen des Spitznamens der Vorrichtung leichter in eine Spracheingabe auf eine Vorrichtung beziehen. In einigen Implementierungen sind die Vorrichtungsspitznamen und die Abbildungen auf die entsprechenden Vorrichtungen in einer sprachaktivierten Vorrichtung 104 (die die Spitznamen nur der Vorrichtungen, die demselben Anwender wie die sprachaktivierte Vorrichtung zugeordnet ist, speichern würde) und/oder einem Sprachunterstützungs-Server-System 112 (das die Vorrichtungsspitznamen der verschiedenen Anwendern zugeordneten Vorrichtungen speichern würde) gespeichert. Das Sprachunterstützungs-Server-System 112 speichert z. B. viele Vorrichtungsspitznamen und Abbildungen über verschiedene Vorrichtungen und Anwender, wobei die sprachaktivierten Vorrichtungen 104, die einem speziellen Anwender zugeordnet sind, die Spitznamen und die Abbildungen für die Vorrichtungen, die dem speziellen Anwender zugeordnet sind, für die lokale Speicherung herunterladen.
  • In einigen Implementierungen kann ein Anwender eine oder mehrere sprachaktivierte Vorrichtungen 104 und/oder steuerbare Vorrichtungen 106 in einer durch den Anwender erzeugten Gruppe von Vorrichtungen gruppieren. Der Gruppe kann ein Name gegeben werden, wobei auf die Gruppe von Vorrichtungen ähnlich zu dem Bezugnehmen auf die einzelnen Vorrichtungen durch den Spitznamen durch den Gruppennamen Bezug genommen werden kann. Ähnlich zu den Vorrichtungsspitznamen können die Vorrichtungsgruppen und die Gruppennamen in einer sprachaktivierten Vorrichtung 104 und/oder dem Sprachunterstützungs-Server-System 112 gespeichert sein.
  • Eine Spracheingabe von dem Anwender kann eine steuerbare Zielvorrichtung 106 oder eine Zielgruppe von Vorrichtungen für die Anforderung in der Spracheingabe explizit spezifizieren. Ein Anwender kann z. B. eine Spracheingabe „spiele klassische Musik auf dem Wohnzimmerlautsprecher ab“ aussprechen. Die Zielvorrichtung in der Spracheingabe ist der „Wohnzimmerlautsprecher“; die Anforderung in der Spracheingabe ist eine Anforderung, dass der „Wohnzimmerlautsprecher“ klassische Musik abspielt. Als ein weiteres Beispiel kann der Anwender eine Spracheingabe „spiele klassische Musik auf den Hauslautsprechern ab“ aussprechen, wobei „Hauslautsprecher“ ein Name einer Gruppe von Vorrichtungen ist. Die Zielvorrichtungsgruppe in der Spracheingabe sind die „Hauslautsprecher“; die Anforderung in der Spracheingabe ist eine Anforderung, dass die Vorrichtungen in der Gruppe „Hauslautsprecher“ klassische Musik abspielen.
  • Eine Spracheingabe von dem Anwender kann keine explizite Spezifikation einer Zielvorrichtung oder einer Zielvorrichtungsgruppe aufweisen; wobei eine Bezugnahme auf eine Zielvorrichtung oder eine Zielvorrichtungsgruppe durch den Namen in der Spracheingabe fehlt. Nach der obigen beispielhaften Spracheingabe „spiele klassische Musik auf dem Wohnzimmerlautsprecher ab“ kann der Anwender z. B. eine anschließende Spracheingabe „Pause“ aussprechen. Die Spracheingabe enthält keine Spezifikation einer Zielvorrichtung für die Anforderung für einen Pausenbetrieb. In einigen Implementierungen kann die Spezifikation der Zielvorrichtung in der Spracheingabe mehrdeutig sein. Der Anwender kann z. B. den Vorrichtungsnamen unvollständig ausgesprochen haben. In einigen Implementierungen kann eine Zielvorrichtung oder eine Zielvorrichtungsgruppe der Spracheingabe zugeordnet werden, wo eine explizite Spezifikation der Zielvorrichtung fehlt oder die Spezifikation der Zielvorrichtung mehrdeutig ist, wie im Folgenden beschrieben wird.
  • Wenn in einigen Implementierungen eine sprachaktivierte Vorrichtung 104 eine Spracheingabe mit einer expliziten Spezifikation einer Zielvorrichtung oder eine Zielvorrichtungsgruppe empfängt, baut die sprachaktivierte Vorrichtung 104 eine Fokussitzung bezüglich der spezifizierten Zielvorrichtung oder Zielvorrichtungsgruppe auf. In einigen Implementierungen speichert die sprachaktivierte Vorrichtung 104 für die Fokussitzung einen Sitzungsstartzeitpunkt (z. B. den Zeitstempel der Spracheingabe, auf der basierend die Fokussitzung gestartet wurde) und als die Vorrichtung im Fokus für die Fokussitzung die spezifizierte Zielvorrichtung oder Zielvorrichtungsgruppe. In einigen Implementierungen protokolliert die sprachaktivierte Vorrichtung 104 außerdem die anschließenden Spracheingaben in der Fokussitzung. Die sprachaktivierte Vorrichtung 104 protokolliert wenigstens die neueste Spracheingabe in der Fokussitzung und protokolliert und bewahrt optional ebenso die vorhergehenden Spracheingaben innerhalb der Fokussitzung. In einigen Implementierungen baut das Sprachunterstützungs-Server-System 112 die Fokussitzung auf. In einigen Implementierungen kann die Fokussitzung durch eine Spracheingabe beendet werden, die eine andere Zielvorrichtung oder Zielvorrichtungsgruppe explizit spezifiziert.
  • Während eine Fokussitzung bezüglich einer Vorrichtung aktiv ist und die sprachaktivierte Vorrichtung eine Spracheingabe empfängt, führt die sprachaktivierte Vorrichtung 104 eine oder mehrere Bestimmungen bezüglich der Spracheingabe aus. In einigen Implementierungen enthalten die Bestimmungen: ob die Spracheingaben eine explizite Spezifikation einer Zielvorrichtung enthalten, ob die Anforderung in der Spracheingabe eine ist, die durch die Vorrichtung im Fokus erfüllt werden kann, und einen Zeitpunkt der Spracheingabe im Vergleich zu dem Zeitpunkt der letzten Spracheingabe in der Fokussitzung und/oder dem Sitzungsstartzeitpunkt. Wenn die Spracheingabe keine explizite Spezifikation einer Zielvorrichtung enthält, eine Anforderung enthält, die durch die Vorrichtung im Fokus erfüllt werden kann, und bezüglich des Zeitpunkts der letzten Spracheingabe in die Fokussitzung und/oder des Sitzungsstartzeitpunkts den vorgegebenen Zeitkriterien entspricht, dann wird die Vorrichtung im Fokus als die Zielvorrichtung für die Spracheingabe zugeordnet. Weitere Einzelheiten hinsichtlich der Fokussitzungen werden im Folgenden beschrieben.
  • Die Vorrichtungen in der Betriebsumgebung
  • 2 ist ein Blockschaltplan, der eine beispielhafte sprachaktivierte Vorrichtung 104 veranschaulicht, die als eine Sprachschnittstelle angewendet wird, um Anwendersprachbefehle in einer Betriebsumgebung (z. B. der Betriebsumgebung 100) gemäß einigen Implementierungen zu sammeln. Die sprachaktivierte Vorrichtung 104 enthält typischerweise eine oder mehrere Verarbeitungseinheiten (CPUs) 202, eine oder mehrere Netzschnittstellen 204, einen Speicher 206 und einen oder mehrere Kommunikationsbusse 208, um diese Komponenten miteinander zu verbinden, (der manchmal als ein Chipsatz bezeichnet wird). Die sprachaktivierte Vorrichtung 104 enthält eine oder mehrere Eingabevorrichtungen 210, die eine Anwendereingabe fördern, wie z. B. eine Taste 212, eine Berührungsabtastanordnung 214 und ein oder mehrere Mikrophone 216. Die sprachaktivierte Vorrichtung 104 enthält außerdem eine oder mehrere Ausgabevorrichtungen 218 einschließlich eines oder mehrerer Lautsprecher 220, optional eine Anordnung von LEDs 222 und optional eine Anzeige 224. In einigen Implementierungen ist die Anordnung der LEDs 222 eine Anordnung von Vollfarben-LEDs. In einigen Implementierungen weist eine sprachaktivierte Vorrichtung 104 in Abhängigkeit von dem Typ der Vorrichtung entweder die Anordnung der LEDs 222 oder die Anzeige 224 oder beides auf. In einigen Implementierungen enthält die sprachaktivierte Vorrichtung 104 außerdem eine Ortsdetektionsvorrichtung 226 (z. B. ein GPS-Modul) und einen oder mehrere Sensoren 228 (z. B. einen Beschleunigungsmesser, ein Gyroskop, einen Lichtsensor usw.).
  • Der Speicher 206 enthält einen Hochgeschwindigkeits-Schreib-LeseSpeicher, wie z. B. einen DRAM, einen SRAM, einen DDR-RAM oder andere Schreib-Lese-Halbleiterspeichervorrichtungen; und enthält optional einen nichtflüchtigen Speicher, wie z. B. eine oder mehrere Magnetplatten-Speichervorrichtungen, eine oder mehrere Speichervorrichtungen optischer Platten, eine oder mehrere Flash-Speichervorrichtungen oder eine oder mehrere andere nichtflüchtige Halbleiterspeichervorrichtungen. Der Speicher 206 enthält optional eine oder mehrere Speichervorrichtungen, die sich entfernt von der einen oder den mehreren Verarbeitungseinheiten 202 befinden. Der Speicher 206 oder alternativ der nichtflüchtige Speicher innerhalb des Speichers 206 enthält ein nichttransitorisches computerlesbares Speichermedium. In einigen Implementierungen speichert der Speicher 206 oder das nichttransitorische computerlesbare Speichermedium des Speichers 206 die folgenden Programme, Module und Datenstrukturen oder eine Teilmenge oder eine Obermenge davon:
    • • ein Betriebssystem 232, das Prozeduren zur Handhabung verschiedener grundlegender Systemdienste und zum Ausführen hardware-abhängiger Aufgaben enthält;
    • • ein Netzkommunikationsmodul 234 zum Verbinden der sprachaktivierten Vorrichtung 104 mit anderen Vorrichtungen (z. B. dem Sprachunterstützungsdienst 140, einer oder mehreren steuerbaren Vorrichtungen 106, einer oder mehreren Client-Vorrichtungen 103 und einer anderen sprachaktivierten Vorrichtung(en) 104) über eine oder mehrere (verdrahtete oder drahtlose) Netzschnittstellen 204 und ein oder mehrere Netze 110, wie z. B. das Internet, andere Weitbereichsnetze, lokale Netze (z. B. das lokale Netz 108), Stadtbereichsnetze usw.;
    • • ein Eingabe/Ausgabe-Steuermodul 236 zum Empfangen von Eingaben über eine oder mehrere Eingabevorrichtungen und zum Ermöglichen der Darstellung von Informationen auf der sprachaktivierten Vorrichtung 104 über eine oder mehrere Ausgabevorrichtungen 218, einschließlich:
      • ○ eines Sprachverarbeitungsmoduls 238 zum Verarbeiten von Audioeingaben oder Sprachnachrichten, die in einer die sprachaktivierte Vorrichtung 104 umgebenden Umgebung gesammelt werden, oder zum Vorbereiten der gesammelten Audioeingaben oder Sprachnachrichten für die Verarbeitung in einem Sprachunterstützungs-Server-System 112;
      • ○ eines LED-Steuermoduls 240 zum Erzeugen sichtbarer Muster auf den LEDs 222 gemäß den Vorrichtungszuständen der sprachaktivierten Vorrichtung 104; und
      • ○ eines Berührungsabtastmoduls 242 zum Abtasten von Berührungsereignissen auf einer Oberseite (z. B. einer Berührungssensoranordnung 214) der sprachaktivierten Vorrichtung 104;
    • • sprachaktivierte Vorrichtungsdaten 224 zum Speichern wenigstens der Daten, die der sprachaktivierten Vorrichtung 104 zugeordnet sind, einschließlich:
      • ○ der Sprachvorrichtungseinstellungen 246 zum Speichern von Informationen, die der sprachaktivierten Vorrichtung 104 selbst zugeordnet sind, einschließlich der gemeinsamen Vorrichtungseinstellungen (z. B. des Dienstrangs, des Vorrichtungsmodells, der Speicherkapazität, der Verarbeitungsfähigkeiten, der Kommunikationsfähigkeiten usw.), der Informationen eines oder mehrerer Anwenderkonten in einem Anwenderbereich, der Vorrichtungsspitznamen und der Vorrichtungsgruppen, der Einstellungen hinsichtlich der Einschränkungen, wenn mit einem nicht registrierten Anwender umgegangen wird, und der Anzeigespezifikationen, die einem oder mehreren durch die LEDs 222 angezeigten sichtbaren Mustern zugeordnet sind; und
      • ○ der Sprachsteuerdaten 248 zum Speichern von Audiosignalen, Sprachnachrichten, Antwortnachrichten und anderen auf die Sprachschnittstellenfunktionen der sprachaktivierten Vorrichtung 104 bezogenen Daten;
    • • ein Antwortmodul 250 zum Ausführen von Anweisungen, die in den Sprachanforderungsantworten enthalten sind, die durch das Sprachunterstützungs-Server-System 112 erzeugt werden, und in einigen Implementierungen zum Erzeugen von Antworten auf bestimmte Spracheingaben; und
    • • ein Fokussitzungsmodul 252 zum Aufbauen, Managen und Beenden von Fokussitzungen bezüglich der Vorrichtungen.
  • In einigen Implementierungen enthält das Sprachverarbeitungsmodul 238 die folgenden (nicht gezeigten) Module):
    • • ein Anwenderidentifikationsmodul zum Identifizieren und Eindeutigmachen der Anwender, die der sprachaktivierten Vorrichtung 104 Spracheingaben bereitstellen;
    • • ein Hotword-Erkennungsmodul zum Bestimmen, ob die Spracheingaben ein Hotword zum Aufwecken der sprachaktivierten Vorrichtung 104 enthalten, und zum Erkennen eines solchen in den Spracheingaben; und
    • • ein Anforderungserkennungsmodul zum Bestimmen einer in einer Spracheingabe enthaltenen Anwenderanforderung.
  • In einigen Implementierungen speichert der Speicher 206 außerdem die Fokussitzungsdaten 254 für eine ausstehende Fokussitzung einschließlich des Folgenden:
    • • der Vorrichtung(en) 256 im Fokus der Sitzung zum Speichern einer Kennung der Vorrichtung oder der Vorrichtungsgruppe im Fokus in einer ausstehenden Fokussitzung (z. B. den Vorrichtungsspitznamen, den Vorrichtungsgruppennamen, die MAC-Adresse(en) der Vorrichtung(en));
    • • eines Sitzungsstartzeitpunkts 258 zum Speichern eines Zeitstempels für den Start der ausstehenden Fokussitzung; und
    • • einer Sitzungsbefehlshistorie 206 zum Speichern eines Protokolls früherer Anforderungen oder Befehle in der Fokussitzung einschließlich wenigstens der neuesten Anforderung/des neuesten Befehls. Das Protokoll enthält wenigstens den (die) Zeitstempel der protokollierten früheren Anforderung(en)/des protokollierten früheren Befehls (der protokollierten früheren Befehle).
  • Jedes der oben identifizierten Elemente kann in einer oder mehreren der vorher erwähnten Speichervorrichtungen gespeichert sein und entspricht einem Satz von Anweisungen zum Ausführen einer oben beschriebenen Funktion. Die oben identifizierten Module oder Programme (d. h., die Sätze von Anweisungen) müssen nicht als separate Software-Programme, Prozeduren, Module oder Datenstrukturen implementiert sein, wobei folglich verschiedene Teilmengen dieser Module in verschiedenen Implementierungen kombiniert oder anderweitig umgeordnet sein können. In einigen Implementierungen speichert der Speicher 206 optional eine Teilmenge der oben identifizierten Module und Datenstrukturen. Weiterhin speichert der Speicher 206 optional zusätzliche Module und Datenstrukturen, die oben nicht beschrieben worden sind. In einigen Implementierungen kann eine Teilmenge der Programme, Module und/oder Daten, die in dem Speicher 206 gespeichert sind, in dem Sprachunterstützungs-Server-System 112 gespeichert sein und/oder durch das Sprachunterstützungs-Server-System ausgeführt werden.
  • In einigen Implementierungen sind ein oder mehrere der oben beschriebenen Module im Speicher 206 Teil einer Sprachverarbeitungsbibliothek der Module. Die Sprachverarbeitungsbibliothek kann in einer umfassenden Vielfalt von Vorrichtungen implementiert und eingebettet sein. Ein Beispiel einer Sprachverarbeitungsbibliothek ist in der provisorischen US-Patentanmeldung Nr. 62/334.434 mit dem Titel „Implementations for Voice Assistant Devices“, eingereicht am 10. Mai 2016, beschrieben, die in ihrer Gesamtheit hier durch Bezugnahme aufgenommen ist.
  • 3 ist ein Blockschaltplan, der ein beispielhaftes Sprachunterstützungs-Server-System 112 eines Sprachassistentendienstes 140 einer Betriebsumgebung (z. B. der Betriebsumgebung 100) gemäß einigen Implementierungen veranschaulicht. Das Server-System 112 enthält typischerweise eine oder mehrere Verarbeitungseinheiten (CPUs) 302, eine oder mehrere Netzschnittstellen 304, einen Speicher 306 und einen oder mehrere Kommunikationsbusse 308, um diese Komponenten miteinander zu verbinden, (der manchmal als ein Chipsatz bezeichnet wird). Das Server-System 112 kann eine oder mehrere Eingabevorrichtungen 310 enthalten, die eine Anwendereingabe fördern, wie z. B. eine Tastatur, eine Maus, eine Sprachbefehlseingabeeinheit oder ein Mikrophon, eine Berührungsschirmanzeige, ein berührungsempfindliches Eingabefeld, eine Gestenerfassungskamera oder andere Eingabetasten oder Steuerelemente. Weiterhin kann das Server-System 112 ein Mikrophon und Spracherkennung oder eine Kamera und Gestenerkennung verwenden, um die Tastatur zu ergänzen oder zu ersetzen. In einigen Implementierungen enthält das Server-System 112 eine oder mehrere Kameras, einen oder mehrere Scanner oder eine oder mehrere Photosensoreinheiten zum Aufnehmen von Bildern, z. B. der auf die elektronischen Vorrichtungen gedruckten graphischen Seriencodes. Das Server-System 112 kann außerdem eine oder mehrere Ausgabevorrichtungen 312 enthalten, die eine Darstellung der Anwenderschnittstellen und des Anzeigeinhalts ermöglichen, einschließlich eines oder mehrerer Lautsprecher und/oder einer oder mehrerer sichtbarer Anzeigen.
  • Der Speicher 306 enthält einen Hochgeschwindigkeits-Schreib-LeseSpeicher, wie z. B. einen DRAM, einen SRAM, einen DDR-RAM oder andere Schreib-Lese-Halbleiterspeichervorrichtungen; und enthält optional einen nichtflüchtigen Speicher, wie z. B. eine oder mehrere Magnetplatten-Speichervorrichtungen, eine oder mehrere Speichervorrichtungen optischer Platten, eine oder mehrere Flash-Speichervorrichtungen oder eine oder mehrere andere nichtflüchtige Halbleiterspeichervorrichtungen. Der Speicher 306 enthält optional eine oder mehrere Speichervorrichtungen, die sich entfernt von einer oder mehreren Verarbeitungseinheiten 302 befinden. Der Speicher 306 oder alternativ der nichtflüchtige Speicher innerhalb des Speichers 306 enthält ein nichttransitorisches computerlesbares Speichermedium. In einigen Implementierungen speichert der Speicher 306 oder das nichttransitorische computerlesbare Speichermedium des Speichers 306 die folgenden Programme, Module und Datenstrukturen oder eine Teilmenge oder eine Obermenge davon:
    • • ein Betriebssystem 316, das Prozeduren zur Handhabung verschiedener grundlegender Systemdienste und zum Ausführen hardware-abhängiger Aufgaben enthält;
    • • ein Netzkommunikationsmodul 318 zum Verbinden des Server-Systems 112 über eine oder mehrere (verdrahtete oder drahtlose) Netzschnittstellen 304 und ein oder mehrere Netze 110, wie z. B. das Internet, andere Weitbereichsnetze, lokale Netze, Stadtbereichsnetze usw., mit anderen Vorrichtungen (z. B. den Client-Vorrichtungen 103, den steuerbaren Vorrichtungen 106, den sprachaktivierten Vorrichtungen 104);
    • • ein Anwenderschnittstellenmodul 320 zum Ermöglichen der Darstellung von Informationen (z. B. eine graphische Anwenderschnittstelle zum Darstellen von einer Anwendung(en) 322-328, Widgets, Web-Sites und deren Web-Seiten und/oder Spielen, Audio- und/oder Videoinhalt, Text usw.) an einer Client-Vorrichtung;
    • • ein Befehlsausführungsmodul 321 für die Ausführung auf der Server-Seite (z. B. Spiele, Anwendungen sozialer Netze, Smart-Home-Anwendungen und/oder andere web- oder nicht web-basierte Anwendungen zum Steuern einer Client-Vorrichtung 103, einer steuerbaren Vorrichtung 106, einer sprachaktivierten Vorrichtung 104 und Smart-Home-Vorrichtungen und zum Überprüfen der durch derartige Vorrichtungen erfassten Daten) einschließlich eines oder mehrerer des Folgenden:
      • o einer Cast-Vorrichtungs-Anwendung 322, die ausgeführt wird, um die Funktionalitäten auf der Server-Seite für die Vorrichtungsbereitstellung, die Vorrichtungssteuerung und das Anwenderkontenmanagement, die der Cast-Vorrichtung (den Cast-Vorrichtungen) zugeordnet sind, bereitzustellen;
      • ○ einer oder mehreren Medienspieleranwendungen 324, die ausgeführt werden, um die Funktionalitäten auf der Server-Seite für die Medienanzeige und das Anwenderkontenmanagement, die den entsprechenden Medienquellen zugeordnet sind, bereitzustellen;
      • ○ einer oder mehreren Smart-Home-Vorrichtungsanwendungen 326, die ausgeführt werden, um die Funktionalitäten auf der Server-Seite für die Vorrichtungsbereitstellung, die Vorrichtungssteuerung, die Datenverarbeitung und die Datenüberprüfung der entsprechenden Smart-Home-Vorrichtungen bereitzustellen; und
      • ○ einer Sprachunterstützungsanwendung 328, die ausgeführt wird, um die Sprachverarbeitung einer von der sprachaktivierten Vorrichtung 104 empfangenen Sprachnachricht zu veranlassen oder die Sprachnachricht direkt zu verarbeiten, um einen Anwendersprachbefehl und einen oder mehrere Parameter für den Anwendersprachbefehl (z. B. eine Bezeichnung einer Cast-Vorrichtung oder einer weiteren sprachaktivierten Vorrichtung 104) zu extrahieren; und
    • • Server-Systemdaten 330, die wenigstens Daten, die der automatischen Steuerung der Medienanzeige (z. B. in einem automatischen Medienausgabemodus und einem Fortsetzungsmodus) zugeordnet sind, und andere Daten speichern, die eines oder mehreres des Folgenden enthalten:
      • ○ die Client-Vorrichtungs-Einstellungen 332 zum Speichen von Informationen, die einer oder mehreren Client-Vorrichtungen zugeordnet sind, einschließlich der gemeinsamen Vorrichtungseinstellungen (z. B. des Dienstrangs, des Vorrichtungsmodells, der Speicherkapazität, der Verarbeitungsfähigkeiten, der Kommunikationsfähigkeiten usw.) und der Informationen für die automatische Medienanzeigesteuerung;
      • ○ die Cast-Vorrichtungseinstellungen 334 zum Speichern von Informationen, die den Anwenderkonten der Cast-Vorrichtungs-Anwendung 322 zugeordnet sind, einschließlich eines oder mehrerer der Kontenzugangsinformationen, der Informationen für die Vorrichtungseinstellungen (z. B. des Dienstrangs, des Vorrichtungsmodells, der Speicherkapazität, der Verarbeitungsfähigkeiten, der Kommunikationsfähigkeiten usw.) und der Informationen für die automatische Medienanzeigesteuerung;
      • ○ die Medienspieler-Anwendungseinstellungen 336 zum Speichern der Informationen, die den Anwenderkonten einer oder mehrerer Medienspieleranwendungen 324 zugeordnet sind, einschließlich einer oder mehrerer der Kontenzugangsinformationen, der Anwendervorlieben der Medieninhaltstypen, der Überprüfungshistoriendaten und der Informationen für die automatische Medienanzeigesteuerung;
      • ○ die Smart-Home-Vorrichtungseinstellungen 338 zum Speichern von Informationen, die den Anwenderkonten der Smart-Home-Anwendungen 326 zugeordnet sind, einschließlich einer oder mehrerer der Kontenzugangsinformationen, der Informationen für eine oder mehrere Smart-Home-Vorrichtungen (z. B. des Dienstrangs, des Vorrichtungsmodells, der Speicherkapazität, der Verarbeitungsfähigkeiten, der Kommunikationsfähigkeiten usw.);
      • ○ die Sprachunterstützungsdaten 340 zum Speichern von Informationen, die den Anwenderkonten der Sprachunterstützungsanwendung 328 zugeordnet sind, einschließlich einer oder mehrerer der Kontenzugangsinformationen, der Informationen für eine oder mehrere sprachaktivierte Vorrichtungen 104 (z. B. des Dienstrangs, des Vorrichtungsmodells, der Speicherkapazität, der Verarbeitungsfähigkeiten, der Kommunikationsfähigkeiten usw.);
      • ○ die Anwenderdaten 342 zum Speichern von Informationen, die den Anwendern im Anwenderbereich zugeordnet sind, einschließlich der Abonnements der Anwender (z. B. der Musik-Streaming-Dienst-Abonnements, der Video-Streaming-Dienst-Abonnements, der Newsletter-Abonnements), der Anwendervorrichtungen (z. B. der Vorrichtungen, die in der Vorrichtungs-Registry 118 registriert sind, die den jeweiligen Anwendern zugeordnet sind, der Vorrichtungsspitznamen, der Vorrichtungsgruppen), der Anwenderkonten (z. B. der E-Mail-Konten, der Kalenderkonten, der Finanzkonten der Anwender) und anderer Anwenderdaten;
      • ○ die Anwendersprachprofile 344 zum Speichern der Sprachprofile der Anwender im Anwenderbereich einschließlich z. B. der Sprachmodelle oder der Sprachfingerabdrücke der Anwender und der Schwellenwerte der angenehmen Lautstärkepegel der Anwender; und
      • ○ die Fokussitzungsdaten 346 zum Speichern der Fokussitzungsdaten für mehrere Vorrichtungen.
    • • ein Vorrichtungsregistrierungsmodul 348 zum Managen der Vorrichtungs-Registry 118;
    • • ein Sprachverarbeitungsmodul 350 zum Verarbeiten der Audioeingaben oder der Sprachnachrichten, die in einer die elektronische Vorrichtung 104 umgebenden Umgebung gesammelt werden; und
    • • ein Fokussitzungsmodul 352 zum Aufbauen, Managen und Beenden von Fokussitzungen bezüglich der Vorrichtungen.
  • In einigen Implementierungen speichert der Speicher 306 außerdem Fokussitzungsdaten 346 für eine oder mehrere ausstehende Fokussitzungen 3462-1 bis 3462-M einschließlich des Folgenden:
    • • einer Sitzungsquellvorrichtung 3464 zum Speichern einer Kennung der Vorrichtung, in der eine Fokussitzung aufgebaut wird;
    • • der Vorrichtung(en) 256 im Fokus der Sitzung zum Speichern einer Kennung der Vorrichtung oder der Vorrichtungsgruppe im Fokus in einer ausstehenden Fokussitzung (z. B. des Vorrichtungsspitznamens, des Vorrichtungsgruppennamens, der MAC-Adresse(en) der Vorrichtung(en));
    • • eines Sitzungsstartzeitpunkts 3468 zum Speichern eines Zeitstempels für den Start der ausstehenden Fokussitzung; und
    • • einer Sitzungsbefehlshistorie 3470 zum Speichern eines Protokolls früherer Anforderungen oder Befehle in der Fokussitzung einschließlich wenigstens der neuesten Anforderung/des neuesten Befehls.
  • In einigen Implementierungen ist das Sprachunterstützungs-Server-System 112 hauptsächlich für die Verarbeitung der Spracheingaben verantwortlich, wobei folglich eines oder mehrere der Programme, Module und Datenstrukturen im Speicher 206, die oben bezüglich 2 beschrieben worden sind, in den jeweiligen Modulen im Speicher 306 enthalten sind (wobei z. B. die Programme, Module und Datenstrukturen, die in dem Sprachverarbeitungsmodul 238 enthalten sind, in dem Sprachverarbeitungsmodul 350 enthalten sind). Die sprachaktivierte Vorrichtung 104 überträgt entweder die erfassten Videoeingaben zu dem Sprachunterstützungs-Server-System 112 für die Verarbeitung oder führt zuerst eine Vorverarbeitung der Spracheingaben aus und überträgt die vorverarbeiteten Spracheingaben zur Verarbeitung zu dem Sprachunterstützungs-Server-System 112. In einigen Implementierungen weisen das Sprachunterstützungs-Server-System 112 und die sprachaktivierte Vorrichtung 104 einige gemeinsam benutzte und einige geteilte Verantwortlichkeiten hinsichtlich der Verarbeitung der Spracheingaben auf, wobei die in 2 gezeigten Programme, Module und Datenstrukturen in beiden enthalten sein können oder unter dem Sprachunterstützungs-Server-System 112 und der sprachaktivierten Vorrichtung 104 aufgeteilt sein können. Andere Programme, Module und Datenstrukturen, die in 2 gezeigt sind, oder deren Analoga können außerdem in dem Sprachunterstützungs-Server-System 112 enthalten sein.
  • Jedes der oben identifizierten Elemente kann in einer oder mehreren der vorher erwähnten Speichervorrichtungen gespeichert sein, wobei es einem Satz von Anweisungen zum Ausführen einer oben beschriebenen Funktion entspricht. Die oben identifizierten Module oder Programme (d. h., die Sätze von Anweisungen) müssen nicht als separate Software-Programme, Prozeduren, Module oder Datenstrukturen implementiert sein, wobei folglich verschiedene Teilmengen dieser Module in verschiedenen Implementierungen kombiniert oder anderweitig umgeordnet sein können. In einigen Implementierungen speichert der Speicher 306 optional eine Teilmenge der oben identifizierten Module und Datenstrukturen. Weiterhin speichert der Speicher 306 optional zusätzliche Module und Datenstrukturen, die oben beschrieben nicht worden sind.
  • Der Entwurf für einen kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper
  • Die 4A, 4B und 4C sind eine Vorderansicht, eine Seitenansicht bzw. eine Rückansicht einer beispielhaften kompakten sprachaktivierten elektronischen Vorrichtung 404 gemäß einigen Implementierungen. Die elektronische Vorrichtung 404 enthält ein Gesamtäußeres einschließlich eines oberen Abschnitts 406 und eines Basisabschnitts 408 und elektronische Komponenten und einen oder mehrere Lautsprecher, die in dem Gesamtäußeren enthalten sind. Die elektronische Vorrichtung 404 ist kompakt und passt natürlich in viele Bereiche eines Hauses. Die elektronische Vorrichtung 404 enthält ein oder mehrere Mikrophone 216 und enthält optional eine (nicht gezeigte) Anordnung von Vollfarben-LEDs. Die Vollfarben-LEDs (z. B. die LEDs 222 in 2) könnten unter einer Oberseite der elektronischen Vorrichtung 404 verborgen sein und für den Anwender unsichtbar sein, wenn sie nicht leuchten. Die Rückseite der elektronischen Vorrichtung 404 enthält optional eine Leistungsversorgungsverbinder 410, der konfiguriert ist, um eine Leistungsversorgung anzukoppeln, wobei die Vorderseite optional einen Leistungsschalter 412 enthält.
  • In einigen Implementierungen stellt die elektronische Vorrichtung 404 ein reines Aussehen, das keine sichtbare Taste aufweist, dar, wobei die Wechselwirkung mit der elektronischen Vorrichtung 404 auf Sprache und Berührungsgesten basiert. Alternativ enthält in einigen Implementierungen die elektronische Vorrichtung 404 eine begrenzte Anzahl physischer Tasten, wobei die Wechselwirkung mit der elektronischen Vorrichtung 404 zusätzlich zu der Sprache und den Berührungsgesten ferner auf einen Druck auf die Taste basiert.
  • 4D ist eine perspektivische Ansicht der sprachaktivierten elektronischen Vorrichtung 404. Ein oder mehrere (nicht gezeigte) Lautsprecher sind in der elektronischen Vorrichtung 404 angeordnet und verborgen und strahlen Schall durch eine poröse Wand des Vorrichtungsäußeren ab, um es zu ermöglichen, dass die von dem Lautsprecher erzeugten Schallwellen zur Außenseite der Vorrichtung durchdringen.
  • 4E ist eine Schnittansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung 404, die einen Doppelzweck-Wellenleiter/Kühlkörper gemäß einigen Implementierungen zeigt. In einigen Implementierungen ist die elektronische Vorrichtung 404 eine kompakte Vorrichtung, die einen oder mehrere Lautsprecher 436 und mehrere elektronische Komponenten enthält, die eines oder mehrere des Folgenden enthält: Mikroprozessoren, einen Speicher, Träger-Chips, drahtlose Empfänger und Sender, Antennen, eine Leistungsversorgungsschaltungsanordnung, eine oder mehrere Kameras, Leistungs- und Datenverbinder usw., von denen einige an einer oder mehreren Leiterplatten 432 angebracht sind. Die Lautsprecher (die „Lautsprecheranordnung“) 436 können (kann) für irgendeinen Audioausgabezweck verwendet werden, einschließlich der Ausgabe hörbarer Antworten auf mündliche Anwendereingaben, der Wiedergabe von Tonspuren des Medieninhalts und der Erzeugung hörbarer Alarme (einschließlich Pieptönen, Alarmen, Sirenen usw.). In einigen Implementierungen sind der eine oder die mehreren Lautsprecher 436 innerhalb der elektronischen Vorrichtung 404 angebracht, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher 436 erzeugten Tons zur Außenseite der Vorrichtung gibt. Um einen effektiven Lautsprecherbetrieb (einschließlich der effektiven Übertragung der Tonausgabe durch den Lautsprecher 436 zur Außenseite der Vorrichtung) zu fördern, ist in derartigen Implementierungen ein Schallwellenleiter 434 innerhalb der elektronischen Vorrichtung 404 vorgesehen, um den durch den einen oder die mehreren Lautsprecher 436 ausgegebenen Schall von der Innenseite zur Außenseite der Vorrichtung umzuleiten.
  • In einigen Implementierungen enthält die elektronische Vorrichtung einen oberen Abschnitt 406, der als ein Lautsprechergitter dient, das die Übertragung des Schalls von einem oder mehreren Lautsprechern 436, die innerhalb der elektronischen Vorrichtung 404 enthalten sind, zur Außenseite der Vorrichtung ermöglicht. In einigen Implementierungen ist der Wellenleiter 434 konfiguriert, um den Schall zu einem Lautsprechergitter umzuleiten, das an einer Außenseite der elektronischen Vorrichtung vorgesehen ist. In einigen Implementierungen kann der obere Abschnitt/das Lautsprechergitter mit unterschiedlichen Oberflächenausführungen konfiguriert sein und/oder kann sicher, aber trennbar an dem Basisabschnitt befestigt sein, wie in der provisorischen Patentanmeldung 62/403.681 mit dem Titel „VOICE-ACTIVATED ELECTRONIC DEVICE ASSEMBLY WITH SEPARABLE BASE“, deren Inhalte in ihrer Gesamtheit durch Bezugnahme hier aufgenommen sind, beschrieben ist. Der obere Abschnitt weist z. B. eine erste Innenfläche, die eine erste Befestigungsstruktur aufweist, und eine erste Außenfläche, die sich in einer Richtung entgegengesetzt zur ersten Befestigungsstruktur über die erste Innenfläche hinaus erstreckt, auf, wobei der Basisabschnitt eine zweite Innenfläche aufweist, die eine zweite Befestigungsstruktur und eine kreisförmige Öffnung aufweist. Die erste und die zweite Innenfläche weisen kompatible Formen auf, die es erlauben, dass der obere und der Basisabschnitt durch eine Bewegung der ersten Innenfläche durch die kreisförmige Öffnung des unteren Abschnitts aus einer getrennten Position zu einer verbundenen Position bewegt werden, so dass, wenn sich der obere Abschnitt und der Basisabschnitt an der verbundenen Position befinden, die erste und die zweite Innenfläche eine verschachtelte Anordnung bilden, die die Wechselwirkung zwischen der ersten und der zweite Befestigungsstruktur erlaubt, wobei der verlängerte Abschnitt gegen den Basisabschnitt anstößt. Die erste und die zweite Befestigungsstruktur sind konfiguriert, um über eine magnetische Anziehung eine sichere, aber trennbare Verbindung miteinander zu bilden, wenn sich der erste und der zweite Abschnitt an der verbundenen Position befinden. Der obere Abschnitt und der Basisabschnitt sind konfiguriert, um durch eine manuelle menschliche Handhabung des oberen Abschnitts und/oder des Basisabschnitts, um den oberen und den Basisabschnitt zwischen der getrennten und der verbundenen Position zu bewegen, sicher verbunden und getrennt zu werden.
  • In einigen Implementierungen ist eine Oberfläche außerhalb der elektronischen Vorrichtung konfiguriert, um elektrische Kontakte bereitzustellen, um auf einen externen Leistungs- und/oder Datenverbinder zuzugreifen, der Teil einer selbstständigen Docking-Station, eines Schalters, eines Möbelstücks (z. B. eines TV-Gestells) oder eines Geräts (z. B. eines Medienspielers) ist. In einigen Implementierungen ist eine Unterseite des oberen Abschnitts konfiguriert, um elektrische Kontakte bereitzustellen, um auf einen externen Leistungs- und/oder Datenverbinder zuzugreifen, der Teil einer selbstständigen Docking-Station, eines Schalters, eines Möbelstücks oder eines Geräts ist. Die elektronische Vorrichtung kann mit dem oder ohne den unteren Abschnitt auf der Docking-Station, dem Schalter, dem Möbelstück oder dem Gerät angeordnet sein.
  • In einigen Implementierungen ist der Schallwellenleiter 434 außerdem konfiguriert, um als ein Kühlkörper zu dienen, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite der elektronischen Vorrichtung abzuführen, wobei er in der Nähe wenigstens einiger der elektronischen Komponenten (z. B. der an der PCB 432 oder der Leiterplatte 432 angebrachten Komponenten) angebracht ist.
  • In einigen Implementierungen sind der eine oder die mehreren Lautsprecher 436 in einem Basisabschnitt 408 (z. B. im „unteren Gehäuse“) der elektronischen Vorrichtung 404 angebracht, wobei sie eine Hauptschallabstrahlungsrichtung aufweisen, die innerhalb der Vorrichtung zu einem gebogenen Abschnitt des Doppelzweck-Wellenleiters/Kühlkörpers 434 nach oben gewandt ist. Der gebogene Abschnitt ist dafür ausgelegt, um den Schall von dem einen oder den mehreren Lautsprechern 436 zur Außenseite der elektronischen Vorrichtung 404 umzuleiten. Die wärmeerzeugenden elektronischen Komponenten und/oder die eine oder die mehreren Leiterplatten 432, die die elektronischen Komponenten tragen, sind direkt an einem zweiten Abschnitt des Doppelzweck-Wellenleiters/Kühlkörpers 434 befestigt (oder unter Verwendung eines Wärmeleitungswegs indirekt daran gekoppelt), um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zu dem Kühlkörper zu übertragen. Der Kühlkörper 434 ist konfiguriert, um die von den befestigten elektronischen Komponenten zu ihm übertragene Wärme zur Außenseite der elektronischen Vorrichtung zu bewegen. In einigen Implementierungen ist der Kühlkörper 434 aus Materialien hergestellt, die im hohen Grade effektive Wärmeleitungseigenschaften aufweisen, um die Bewegung der Wärme aus dem Innern der Vorrichtung zur Außenseite der Vorrichtung zu fördern. In einigen Implementierungen ist der gebogene Abschnitt eine Unterseite des Doppelzweck-Wellenleiters/Kühlkörpers 434 (z. B. eine Oberfläche, die zu dem einen oder den mehreren Lautsprechern 436 nach unten gewandt ist), während der zweite Abschnitt eine Oberseite des Doppelzweck-Wellenleiters/Kühlkörpers 434, die der Unterseite des Doppelzweck-Wellenleiters/Kühlkörpers 434 gegenüberliegt, (z. B. eine Oberfläche, die nach oben gewandt ist, an der die elektronischen Komponenten befestigt sind) ist. Andere Gestalten und Formen der oberen und unteren Abschnitte des Wellenleiters/Kühlkörpers 434 können verwendet werden, wie sie für einen Fachmann auf dem Gebiet offensichtlich sein würden.
  • In einigen Implementierungen sind die Positionen der elektronischen Komponenten und des einen oder der mehreren Lautsprecher 436 vertauscht, so dass sich der eine oder die mehreren Lautsprecher 436 in einem oberen Abschnitt 406 der elektronischen Vorrichtung 404 befinden und zu einer oberen (gebogenen) Oberfläche des Doppelzweck-Wellenleiters/Kühlkörpers nach unten abstrahlen, während die elektronischen Komponenten in einem Basisabschnitt 408 der elektronischen Vorrichtung 404 angebracht sind und der Wellenleiter/Kühlkörper 404 im unteren Abschnitt (z. B. im „unteren Gehäuse“) angebracht ist.
  • In einigen Implementierungen kanalisiert die Bauform des Schallwellenleiters den Schall von dem Lautsprecher 436 zu den gewünschten Ausgabeöffnungen, wobei er thermisch an der PCB 432 befestigt ist, um es zu ermöglichen, dass der Wellenleiter 434 außerdem als ein Kühlkörper/Verteiler arbeitet. Das Wickeln des Wellenleiters/Kühlkörpers 434 in das Innere des Gehäuses ermöglicht eine größere thermisch wirksame Masse und eine größere Oberfläche für die Wärmestrahlung. In einigen Implementierungen vergrößert ein ausgeschnittenes Muster in einem gewickelten Abschnitt des Wellenleiters den thermischen Wirkungsgrad, wobei er es ermöglicht, dass der Schall nach außen übertragen wird. In einigen Implementierungen treiben die Schallwellen während der Lautsprecherfunktion außerdem Luft über den Wellenleiter/Kühlkörper 434, wobei sie die thermische Leistung zum Zeitpunkt der größten Wärmeerzeugung weiter vergrößern.
  • In einigen Implementierungen leitet der Kegel des Wellenleiters/Kühlkörpers den Schall von dem nach oben zeigenden Lautsprecher 436 zur Seite um, wie in 4E gezeigt ist. Weil sich die PCB 432 direkt oben auf dem Wellenleiter 434 befindet, wird sie außerdem als ein Kühlkörper verwendet. Ein Wellenleiter 434 kann aus irgendeinem Material bestehen, wobei aber ein Kühlkörper aus einem im hohen Grade wärmeleitfähigen Material bestehen sollte. In einigen Implementierungen ist das Wellenleitermaterial ein Metall (z. B. Aluminium oder Kupfer), wobei aber der Wellenleiter/Kühlkörper 434 außerdem aus anderen Materialien als einem Metall hergestellt sein kann.
  • 4F ist eine Explosionsansicht einer beispielhaften sprachaktivierten elektronischen Vorrichtung gemäß einigen Implementierungen. Diese zeigt einen perforierten oberen Abschnitt 406, um die Übertragung von Schallwellen zu ermöglichen, die PCB 432, den Schallwellenleiter/Kühlkörper 434, den unteren Abschnitt der Wellenleiter- und Lautsprecheranordnung 436 und den Basisabschnitt 408.
  • Eine beispielhafte Implementierung ist auf eine kompakte sprachaktivierte elektronische Vorrichtung mit Lautsprechern und elektronischen Komponenten und einer doppelten Wellenleiter/Kühlkörper-Struktur, die konfiguriert ist, um den Schall von den Lautsprechern zur Außenseite der Vorrichtung zu leiten und um die Wärme von den elektronischen Komponenten zur Außenseite der Vorrichtung abzuführen, gerichtet.
  • Die in der Beschreibung der verschiedenen beschriebenen Implementierungen verwendete Terminologie ist nur für den Zweck des Beschreibens spezieller Implementierungen und ist nicht vorgesehen, um einschränkend zu sein. Es ist vorgesehen, dass die Einzahlformen „ein“, „eine“ und „der/die/das“, wie sie in der Beschreibung der verschiedenen beschriebenen Implementierungen und den beigefügten Ansprüchen verwendet werden, ebenso die Mehrzahlformen enthalten, wenn es der Kontext nicht deutlich anders angibt. Es wird außerdem erkannt, dass sich der Begriff „und/oder“, wie er hier verwendet wird, auf irgendeine und alle möglichen Kombinationen eines oder mehrerer der zugeordneten aufgelisteten Elemente bezieht und diese umfasst. Es wird ferner erkannt, dass die Begriffe „enthält“, „enthaltend“, „umfasst“ und/oder „umfassend“, wenn sie in dieser Beschreibung verwendet werden, das Vorhandensein der dargelegten Merkmale, ganzen Zahlen, Schritte, Operationen, Elemente und/oder Komponenten spezifizieren, aber das Vorhandensein oder die Ergänzung eines oder mehrerer anderer Merkmale, ganzer Zahlen, Schritte, Operationen, Elemente, Komponenten und/oder Gruppen daraus nicht ausschließt.
  • Der Begriff „falls“, wie er hier verwendet wird, wird abhängig vom Kontext optional ausgelegt, so dass er „wenn“ oder „bei“ oder „in Reaktion auf das Bestimmen“ oder „in Reaktion auf das Detektieren“ oder „in Übereinstimmung mit einer Bestimmung, dass“ bedeutet. Ähnlich wird in Abhängigkeit vom Kontext die Redewendung „falls bestimmt wird“ oder „falls [eine dargelegte Bedingung oder ein dargelegtes Ereignis] detektiert wird“, optional ausgelegt, so dass sie „beim Bestimmen“ oder „in Reaktion auf das Bestimmen“ oder „beim Detektieren [der dargelegten Bedingung oder des dargelegten Ereignisses]“ oder „in Reaktion auf das Detektieren [der dargelegten Bedingung oder des dargelegten Ereignisses]“ oder „in Übereinstimmung mit einer Bestimmung, dass [eine dargelegte Bedingung oder ein dargelegtes Ereignis] detektiert wird“ bedeutet.
  • Es wird erkannt, dass sich „intelligente Medienumgebungen“ auf intelligente Umgebungen für Häuser, wie z. B. Einfamilienhäuser, beziehen kann, wobei aber der Schutzumfang der vorliegenden Lehren nicht so eingeschränkt ist. Die vorliegenden Lehren sind außerdem ohne Einschränkung auf Zweifamilienhäuser, Reihenhäuser, Mehrfamilienhäuser mit mehreren Einheiten, Hotels, Ladengeschäfte, Bürogebäude, Industriegebäude und allgemeiner irgendeinen Wohnraum oder Arbeitsraum anwendbar.
  • Es wird außerdem erkannt, dass, während die Begriffe Anwender, Kunde, Installateur, Hauseigentümer, Insasse, Gast, Mieter, Vermieter, Servicetechniker und dergleichen verwendet werden können, um auf die Person oder die Personen zu verweisen, die im Kontext irgendwelcher hier beschriebenen speziellen Situationen wirken, diese Bezugnahmen den Schutzumfang der vorliegenden Lehren bezüglich der Person oder der Personen, die derartige Handlungen ausführen, nicht einschränken. Die Begriffe Anwender, Kunde, Käufer, Installateur, Abonnent und Hauseigentümer können sich folglich z. B. oft auf dieselbe Person in dem Fall eines Einfamilienhauses beziehen, weil der Haushaltsvorstand oft die Person ist, die die Kaufentscheidung trifft, die Einheit kauft und die Einheit installiert und konfiguriert, und außerdem einer der Anwender der Einheit ist. In anderen Szenarien, wie z. B. einer Vermieter-Mieter-Umgebung, kann der Kunde der Vermieter bezüglich des Kaufs der Einheit sein, kann der Installateur ein Betreuer der örtlichen Wohnung sein, kann ein erster Anwender der Mieter sein und kann ein zweiter Anwender abermals der Vermieter bezüglich der Fernsteuerungsfunktionalität sein. Während die Identität der Person, die die Handlung ausführt, für einen durch eine oder mehrere der Implementierungen bereitgestellten speziellen Vorteil relevant sein kann, ist es wichtig, dass eine derartige Identität nicht in den folgenden Beschreibungen so ausgelegt werden sollte, dass sie notwendigerweise den Schutzumfang der vorliegenden Lehren auf jene speziellen Einzelpersonen einschränken, die diese speziellen Identitäten aufweisen.
  • Obwohl verschiedene Zeichnungen eine Anzahl logischer Zustände in einer speziellen Reihenfolge veranschaulichen, können die Stufen, die nicht von der Reihenfolge abhängig sind, umgeordnet werden, wobei andere Stufen kombiniert oder herausgebrochen werden können. Während irgendeine Umordnung oder andere Gruppierungen spezifisch erwähnt worden sind, sind andere für die Durchschnittsfachleute auf dem Gebiet offensichtlich, so dass die hier dargestellte Ordnung und die hier dargestellten Gruppierungen keine vollständige Liste der Alternativen sind. Überdies sollte erkannt werden, dass die Stufen in Hardware, Firmware, Software oder irgendeiner Kombination daraus implementiert sein können.
  • Die vorhergehende Beschreibung ist zum Zweck der Erklärung unter Bezugnahme auf spezifische Implementierungen beschrieben worden. Es ist jedoch nicht vorgesehen, dass die obigen veranschaulichenden Erörterungen vollständig sind oder den Schutzumfang der Ansprüche auf die genauen offenbarten Formen einschränken. Im Hinblick auf die obigen Lehren sind viele Modifikationen und Variationen möglich. Die Implementierungen wurden gewählt, um die den Ansprüchen zu Grunde liegenden Prinzipien und deren praktische Anwendungen am besten zu erklären, um es dadurch anderen Fachleuten auf dem Gebiet zu ermöglichen, die Implementierungen mit verschiedenen Modifikationen am besten zu verwenden, wie sie für die betrachteten speziellen Verwendungen geeignet sind.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 62/441144 [0001]
    • US 62336566 [0033]
    • US 62334434 [0063]

Claims (20)

  1. Elektronische Vorrichtung, die umfasst: ein Gesamtäußeres, das einen oberen Abschnitt und einen Basisabschnitt enthält; elektronische Komponenten, die innerhalb des Gesamtäußeren enthalten sind, wobei die elektronischen Komponenten einen ersten elektrischen Verbinder enthalten, der konfiguriert ist, um Leistung und/oder Daten den elektronischen Komponenten zuzuführen und/oder Datensignale von den elektronischen Komponenten auszugeben, wenn der erste elektrische Verbinder mit einem externen Leistungs- und/oder Datenverbinder verbunden ist; einen oder mehrere Lautsprecher, wobei der eine oder die mehreren Lautsprecher innerhalb der elektronischen Vorrichtung angebracht sind, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher erzeugten Schalls zur Außenseite der elektronischen Vorrichtung gibt; einen Wellenleiter, der innerhalb der elektronischen Vorrichtung vorgesehen ist, um den durch den einen oder die mehreren Lautsprecher erzeugten Schall aus dem Inneren zur Außenseite der elektronischen Vorrichtung umzuleiten, wobei der Wellenleiter außerdem konfiguriert ist, um als ein Kühlkörper zu dienen, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite der elektronischen Vorrichtung abzuführen.
  2. Elektronische Vorrichtung nach Anspruch 1, wobei eine Teilmenge der elektronischen Komponenten an einer Leiterplatte (PCB) angebracht ist und die PCB in der Nähe einer Oberfläche des Wellenleiters thermisch befestigt oder angebracht ist, was es ermöglicht, dass der Wellenleiter die durch den Betrieb der elektronischen Komponenten erzeugte Wärme abführt.
  3. Elektronische Vorrichtung nach Anspruch 1 oder 2, wobei der eine oder die mehreren Lautsprecher im Basisabschnitt der elektronischen Vorrichtung angebracht sind und eine Hauptschallabstrahlungsrichtung aufweisen, die innerhalb der elektronischen Vorrichtung nach oben gewandt ist.
  4. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 3, wobei der eine oder die mehreren Lautsprecher im oberen Abschnitt der elektronischen Vorrichtung angebracht sind und eine Hauptschallabstrahlungsrichtung aufweisen, die innerhalb der elektronischen Vorrichtung nach unten gewandt ist.
  5. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 4, wobei der Wellenleiter in ein Inneres des Gesamtäußeren gewickelt ist, so dass das Gesamtäußere eine zusätzliche thermisch wirksame Masse und Wärmeabführungsfläche für die Wärmestrahlung der durch den Betrieb der elektronischen Komponenten erzeugten Wärme schafft.
  6. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 5, wobei der obere Abschnitt ein Lautsprechergitter an einer Außenfläche des oberen Abschnitts enthält und das Lautsprechergitter konfiguriert ist, um den Schall von dem einen oder den mehreren Lautsprechern zur Außenseite der elektronischen Vorrichtung zu übertragen.
  7. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 6, wobei eine Rückseite der elektronischen Vorrichtung einen Leistungsversorgungsverbinder enthält, der konfiguriert ist, um an eine Leistungsversorgung gekoppelt zu werden.
  8. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 7, wobei eine Vorderseite der elektronischen Vorrichtung einen Leistungsschalter und/oder eine Steuertaste enthält.
  9. Elektronische Vorrichtung nach einem der Ansprüche 1 bis 8, wobei die elektronische Vorrichtung ein reines Aussehen darstellt, das keine sichtbare Taste aufweist.
  10. Elektronische Vorrichtung nach Anspruch 9, wobei die elektronische Vorrichtung konfiguriert ist, um entweder basierend auf Sprache oder basierend auf Berührungsgesten gesteuert zu werden.
  11. Sprachschnittstellenvorrichtung, die umfasst: ein Gesamtäußeres, das einen oberen Abschnitt und einen Basisabschnitt enthält; elektronische Komponenten, die innerhalb des Gesamtäußeren enthalten sind, wobei die elektronischen Komponenten einen ersten elektrischen Verbinder enthalten, der konfiguriert ist, um Leistung und/oder Daten den elektronischen Komponenten zuzuführen und/oder Datensignale von den elektronischen Komponenten auszugeben, wenn der erste elektrische Verbinder mit einem externen Leistungs- und/oder Datenverbinder verbunden ist; einen oder mehrere Lautsprecher, wobei der eine oder die mehreren Lautsprecher innerhalb der Sprachschnittstellenvorrichtung angebracht sind, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher erzeugten Schalls zur Außenseite der Sprachschnittstellenvorrichtung gibt; einen Wellenleiter, der innerhalb der Sprachschnittstellenvorrichtung vorgesehen ist, um den durch den einen oder die mehreren Lautsprecher erzeugten Schall aus dem Inneren zur Außenseite der Sprachschnittstellenvorrichtung umzuleiten, wobei der Wellenleiter außerdem konfiguriert ist, um als ein Kühlkörper zu dienen, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite der Sprachschnittstellenvorrichtung abzuführen.
  12. Sprachschnittstellenvorrichtung nach Anspruch 11, die ferner sichtbare Indikatoren umfasst, die verwendet werden, um einen Status der Sprachverarbeitung, die einer gesprochenen Anwenderanforderung zugeordnet ist, anzugeben.
  13. Sprachschnittstellenvorrichtung nach Anspruch 11 oder 12, die ferner ein Mikrophon umfasst, das mit einem sprachaktivierten Sprachassistentendienst verbunden ist.
  14. Sprachschnittstellenvorrichtung nach einem der Ansprüche 11 bis 13, wobei der eine oder die mehreren Lautsprecher in der Sprachschnittstellenvorrichtung verborgen sind und konfiguriert sind, den Schall durch eine poröse Wand des Gesamtäußeren abzustrahlen, um es zu ermöglichen, dass die von dem einen oder den mehreren Lautsprecher erzeugten Schallwellen zur Außenseite der Sprachschnittstellenvorrichtung durchdringen.
  15. Sprachschnittstellenvorrichtung nach einem der Ansprüche 11 bis 14, wobei der eine oder die mehreren Lautsprecher konfiguriert sind, um hörbare Antworten auf mündliche Anwendereingaben auszugeben, Audiospuren des Medieninhalts abzuspielen und hörbare Alarme zu erzeugen.
  16. Elektronisches System, das umfasst: elektronische Komponenten, wobei die elektronischen Komponenten einen ersten elektrischen Verbinder enthalten, der konfiguriert ist, um Leistung und/oder Daten den elektronischen Komponenten zuzuführen und/oder Datensignale von den elektronischen Komponenten auszugeben, wenn der erste elektrische Verbinder mit einem externen Leistungs- und/oder Datenverbinder verbunden ist; einen oder mehrere Lautsprecher, wobei der eine oder die mehreren Lautsprecher innerhalb des elektronischen Systems angebracht sind, so dass es keinen direkten Weg für die Übertragung des durch den einen oder die mehreren Lautsprecher erzeugten Schalls zur Außenseite des elektronischen Systems gibt; einen Wellenleiter, der innerhalb des elektronischen Systems vorgesehen ist, um den durch den einen oder die mehreren Lautsprecher erzeugten Schall aus dem Inneren zur Außenseite des elektronischen Systems umzuleiten, wobei der Wellenleiter außerdem konfiguriert ist, um als ein Kühlkörper zu dienen, um die durch den Betrieb der elektronischen Komponenten erzeugte Wärme zur Außenseite des elektronischen Systems abzuführen.
  17. Elektronisches System nach Anspruch 16, wobei der eine oder die mehreren Lautsprecher eine Hauptschallabstrahlungsrichtung aufweisen, die zu einem gebogenen Abschnitt des Wellenleiters nach oben gewandt ist, und der gebogene Abschnitt eine erste Oberfläche des Wellenleiters ist.
  18. Elektronisches System nach Anspruch 17, wobei die erste Oberfläche des Wellenleiters einer zweiten Oberfläche des Wellenleiters gegenüberliegt, an der eine Teilmenge der PCB befestigt oder in der Nähe angebracht ist.
  19. Elektronisches System nach einem der Ansprüche 16 bis 18, wobei die elektronischen Komponenten ferner eines oder mehrere des Folgenden enthalten: Mikroprozessoren, einen Speicher, Träger-Chips, drahtlose Empfänger und Sender, Antennen, eine Leistungsversorgungsschaltungsanordnung und eine oder mehrere Kameras.
  20. Elektronisches System nach einem der Ansprüche 16 bis 19, wobei der Wellenleiter ein ausgeschnittenes Muster enthält, um den Schall des einen oder der mehreren Lautsprecher nach außen zu übertragen.
DE102017129920.3A 2016-12-30 2017-12-14 Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper Pending DE102017129920A1 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662441144P 2016-12-30 2016-12-30
US62/441,144 2016-12-30
US15/840,844 US10290302B2 (en) 2016-12-30 2017-12-13 Compact home assistant with combined acoustic waveguide and heat sink
US15/840,844 2017-12-13

Publications (1)

Publication Number Publication Date
DE102017129920A1 true DE102017129920A1 (de) 2018-07-05

Family

ID=61006330

Family Applications (2)

Application Number Title Priority Date Filing Date
DE202017107611.3U Active DE202017107611U1 (de) 2016-12-30 2017-12-14 Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper
DE102017129920.3A Pending DE102017129920A1 (de) 2016-12-30 2017-12-14 Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE202017107611.3U Active DE202017107611U1 (de) 2016-12-30 2017-12-14 Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper

Country Status (8)

Country Link
US (3) US10290302B2 (de)
EP (2) EP3563560B1 (de)
JP (3) JP6995860B2 (de)
KR (5) KR20230132638A (de)
CN (5) CN116360283A (de)
DE (2) DE202017107611U1 (de)
GB (1) GB2559476B (de)
WO (1) WO2018125632A1 (de)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10735479B2 (en) * 2017-03-30 2020-08-04 Intel Corporation Methods, systems and apparatus to enable voice assistant device communication
KR102412039B1 (ko) * 2017-07-12 2022-06-23 삼성전자주식회사 음향 장치를 이용한 방열 구조를 포함하는 전자 장치
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
KR102421255B1 (ko) * 2017-10-17 2022-07-18 삼성전자주식회사 음성 신호를 제어하기 위한 전자 장치 및 방법
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US20210366270A1 (en) * 2018-01-18 2021-11-25 Hewlett-Packard Development Company, L.P. Learned quiet times for digital assistants
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10659855B2 (en) * 2018-06-20 2020-05-19 Amazon Technologies, Inc. Voice activated device with integrated heatsink and speaker
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
CN109005383A (zh) * 2018-07-06 2018-12-14 杭州涂鸦信息技术有限公司 一种随处播放iot监控视频流的方法
CN108566322A (zh) * 2018-07-24 2018-09-21 珠海格力电器股份有限公司 通话方法及装置、存储介质、电子装置
US11373640B1 (en) * 2018-08-01 2022-06-28 Amazon Technologies, Inc. Intelligent device grouping
KR102489873B1 (ko) * 2018-08-08 2023-01-18 삼성전자주식회사 방열 구조를 포함하는 전자 장치
JP7154063B2 (ja) * 2018-08-10 2022-10-17 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7032265B2 (ja) * 2018-08-21 2022-03-08 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
CN111316193B (zh) 2018-09-18 2023-09-15 谷歌有限责任公司 显示助理设备
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
EP3782005A1 (de) 2018-10-08 2021-02-24 Google LLC Lautsprecheranordnung in einer anzeigehilfsvorrichtung
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (de) 2018-11-15 2020-05-20 Snips Erweiterte konvolutionen und takt zur effizienten schlüsselwortauffindung
US10694281B1 (en) * 2018-11-30 2020-06-23 Bose Corporation Coaxial waveguide
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
KR20200074690A (ko) * 2018-12-17 2020-06-25 삼성전자주식회사 전자 장치 및 이의 제어 방법
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) * 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11079875B2 (en) * 2019-07-24 2021-08-03 Google Llc Compact home assistant having touch sensitive housing
US11553265B2 (en) 2019-07-24 2023-01-10 Google Llc Compact home assistant having a controlled sound path
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
USD938382S1 (en) 2019-09-20 2021-12-14 Google Llc Speaker device with lights
KR102544672B1 (ko) * 2019-09-26 2023-06-16 구글 엘엘씨 액세스 포인트 장치
KR102429408B1 (ko) * 2019-09-26 2022-08-05 구글 엘엘씨 레인지 익스텐더 장치
GB2586084B (en) 2019-09-30 2021-08-18 Kano Computing Ltd Touch sensitive audio-visual input/output device and method
US20210098137A1 (en) * 2019-09-30 2021-04-01 Arris Enterprises Llc Smart media device
US11812583B2 (en) 2020-10-06 2023-11-07 Google Llc Passive thermal-control system of a mesh network device and associated mesh network devices
US11997781B2 (en) 2019-10-11 2024-05-28 Google Llc Thermal-control system of a mesh network device and associated mesh network devices
US11521909B2 (en) * 2019-10-14 2022-12-06 Google Llc Passive thermal-control system of an electronic speaker device and associated electronic speaker devices
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11449114B2 (en) * 2020-03-25 2022-09-20 Amazon Technologies, Inc. Voice activated device with integrated heatsink and speaker
US11514906B2 (en) * 2020-03-26 2022-11-29 Amazon Technologies, Inc. Voice activated device with integrated heatsink and speaker
CN111600782B (zh) * 2020-04-28 2021-05-18 百度在线网络技术(北京)有限公司 智能语音设备的控制方法、装置、电子设备和存储介质
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
CN115698873A (zh) * 2020-05-26 2023-02-03 华为技术有限公司 智能电器及控制方法
CN111692702B (zh) * 2020-06-23 2021-06-22 广东台德智联科技有限公司 一种空调嵌入式智能语音交互模块
US11212940B1 (en) 2020-06-29 2021-12-28 Google Llc Passive thermal-control structure for speakers and associated apparatuses and methods
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11568862B2 (en) * 2020-09-29 2023-01-31 Cisco Technology, Inc. Natural language understanding model with context resolver
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
KR20230019649A (ko) * 2021-08-02 2023-02-09 삼성전자주식회사 다공성 시트를 포함하는 스피커 및 이를 포함하는 전자 장치
US11611818B1 (en) 2021-08-27 2023-03-21 Oakwood Metal Fabricating Co. Metallic audio speaker cover with a multi-color cloth-like appearance and method of manufacturing

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02211796A (ja) 1989-02-10 1990-08-23 Nec Corp 同報時刻設定処理方式
JPH03211796A (ja) * 1990-01-17 1991-09-17 Hitachi Ltd 放熱構造
US6157312A (en) * 1999-02-01 2000-12-05 Sun Microsystems, Inc. Appliance for integrating multiple forms of communication
GB2355128B (en) * 1999-10-08 2003-04-09 Nokia Mobile Phones Ltd Portable electronics device
US6327144B1 (en) 1999-12-21 2001-12-04 Hewlett-Packard Company Computing device with improved heat dissipation
TWI267315B (en) * 2002-07-01 2006-11-21 Sony Ericsson Mobile Comm Ab Communication terminal
US6991289B2 (en) * 2002-07-31 2006-01-31 Harman International Industries, Incorporated Seatback audio system
JP4482291B2 (ja) 2003-06-19 2010-06-16 富士通テン株式会社 スピーカ装置
US7604378B2 (en) * 2003-07-02 2009-10-20 S.C. Johnson & Son, Inc. Color changing outdoor lights with active ingredient and sound emission
US7463744B2 (en) * 2003-10-31 2008-12-09 Bose Corporation Porting
USD537072S1 (en) * 2005-07-18 2007-02-20 Samsung Electronics Co., Ltd. Speaker
US7518860B2 (en) 2005-10-14 2009-04-14 Oqo, Inc. Combined outflow portal for acoustic and thermal energy
US8299903B2 (en) * 2006-03-23 2012-10-30 Edward H Haase Screw-in LED light and sound bulb
US8042961B2 (en) * 2007-12-02 2011-10-25 Andrew Massara Audio lamp
USD596159S1 (en) * 2008-02-19 2009-07-14 Sony Corporation Speaker
JP4565357B2 (ja) 2008-06-16 2010-10-20 ソニー株式会社 スピーカ装置
US20120039491A1 (en) * 2009-04-01 2012-02-16 Robert Katz inertial type acoustic transducer
WO2010134057A1 (en) * 2009-05-22 2010-11-25 Solaredge Technologies Ltd. Electrically isolated heat dissipating junction box
US8131386B2 (en) * 2009-06-15 2012-03-06 Elbex Video Ltd. Method and apparatus for simplified interconnection and control of audio components of an home automation system
FR2955447B1 (fr) * 2010-01-15 2012-08-03 Phl Audio Transducteur electrodynamique comprenant un guide d'ondes acoustiques assurant une dissipation thermique
DE102010021879A1 (de) 2010-05-28 2011-12-01 Frank Held Lautsprechervorrichtung mit umlaufender, trichterförmiger Schallaustrittsöffnung
CN102300133B (zh) * 2010-06-23 2015-02-04 深圳市三诺数字科技有限公司 无线照明音箱系统
USD636760S1 (en) * 2010-06-24 2011-04-26 Cheng Uei Precision Indsutry Co., Ltd. Portable speaker
JP4977239B2 (ja) 2010-06-30 2012-07-18 株式会社東芝 無線通信装置
USD643022S1 (en) * 2010-08-30 2011-08-09 Cheng Uei Precision Industry Co., Ltd. Speaker
US8855349B2 (en) * 2011-07-27 2014-10-07 Htc Corporation Portable speaker
USD676423S1 (en) * 2011-08-18 2013-02-19 Sdi Technologies, Inc. Bluetooth speaker system
JP2014210341A (ja) 2011-08-30 2014-11-13 パナソニック株式会社 外装体およびその製造方法
GB2504723A (en) 2012-08-07 2014-02-12 Entangle Ltd Waveguide housing for a portable device with built-in passive amplification of the loudspeaker
USD725078S1 (en) * 2012-12-06 2015-03-24 Koninklijke Philips N.V. Speaker
US9363592B2 (en) * 2013-08-01 2016-06-07 Zhejiang Shenghui Lighting Co., Ltd LED lighting device and speaker
CN103139673A (zh) * 2013-02-04 2013-06-05 珠海雷克斯电子科技有限公司 一种蓝牙小音箱
US9361885B2 (en) * 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9304736B1 (en) * 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
US20140355806A1 (en) * 2013-06-03 2014-12-04 Allen T. Graff Portable Loudspeaker
JP6004190B2 (ja) 2013-09-05 2016-10-05 ヤマハ株式会社 スピーカ装置
USD756955S1 (en) * 2013-09-21 2016-05-24 Baby Stars Gmbh Combined audio player and recorder
US20150003629A1 (en) * 2013-11-07 2015-01-01 Jambanz LLC Portable wireless speaker system
CN104735949B (zh) * 2013-12-19 2019-02-05 中兴通讯股份有限公司 喇叭振膜线圈的驱动装置、散热装置、方法及移动终端
US9668039B2 (en) * 2014-01-03 2017-05-30 Fugoo Corporation Shock absorbent speaker system
US20160044394A1 (en) * 2014-08-07 2016-02-11 Nxp B.V. Low-power environment monitoring and activation triggering for mobile devices through ultrasound echo analysis
WO2016045120A1 (en) * 2014-09-28 2016-03-31 Intel Corporation Passive radiator cooling for electronic devices
US9720464B2 (en) * 2014-12-22 2017-08-01 Intel Corporation Dynamic thermal platform operating point for electronic devices
JP1535209S (de) * 2015-02-26 2015-10-19
KR102348672B1 (ko) * 2015-03-20 2022-01-10 삼성전자주식회사 전자 장치 및 그 제어 방법
USD778871S1 (en) * 2015-05-04 2017-02-14 Ningbo Prosound Electronics Co., Ltd. Portable speaker
USD778875S1 (en) * 2015-05-19 2017-02-14 Logitech Europe S.A. Speaker
US10083688B2 (en) * 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
USD795728S1 (en) * 2015-09-16 2017-08-29 Novar Ed&S Limited Door chime
CN204965800U (zh) * 2015-09-23 2016-01-13 嘉兴职业技术学院 一种用于口语练习的英语学习机
USD828330S1 (en) * 2015-10-26 2018-09-11 Microsoft Corporation Portable speaker
USD795220S1 (en) * 2015-11-09 2017-08-22 Miworld Accessories Llc Speaker ball
USD797704S1 (en) * 2015-12-31 2017-09-19 Harman International Industries, Incorporated Portable audio speaker
US9712902B1 (en) * 2016-01-14 2017-07-18 Miworld Accessories Llc Speaker ball with anti-roll feature
CN205788067U (zh) * 2016-05-04 2016-12-07 中兴通讯股份有限公司 移动终端
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink

Also Published As

Publication number Publication date
JP7351890B2 (ja) 2023-09-27
KR102578660B1 (ko) 2023-09-13
CN111123721A (zh) 2020-05-08
KR20210057227A (ko) 2021-05-20
US11942088B2 (en) 2024-03-26
GB201720862D0 (en) 2018-01-31
KR20190072620A (ko) 2019-06-25
CN116360283A (zh) 2023-06-30
CN207937781U (zh) 2018-10-02
US11011168B2 (en) 2021-05-18
JP2023175816A (ja) 2023-12-12
JP2022046553A (ja) 2022-03-23
KR102403709B1 (ko) 2022-05-30
CN108267963A (zh) 2018-07-10
CN108267963B (zh) 2023-04-18
JP2020503783A (ja) 2020-01-30
WO2018125632A1 (en) 2018-07-05
JP6995860B2 (ja) 2022-01-17
EP3873071A1 (de) 2021-09-01
KR102198200B1 (ko) 2021-01-05
KR102254021B1 (ko) 2021-05-18
KR20230132638A (ko) 2023-09-15
US10290302B2 (en) 2019-05-14
US20190259385A1 (en) 2019-08-22
EP3563560A1 (de) 2019-11-06
DE202017107611U1 (de) 2018-03-28
CN209400877U (zh) 2019-09-17
CN111123721B (zh) 2024-04-26
EP3563560B1 (de) 2021-05-26
US20210233531A1 (en) 2021-07-29
GB2559476B (en) 2020-09-16
KR20200145869A (ko) 2020-12-30
US20180190285A1 (en) 2018-07-05
GB2559476A (en) 2018-08-08
KR20220075452A (ko) 2022-06-08

Similar Documents

Publication Publication Date Title
DE102017129920A1 (de) Bauform für kompakten Heimassistenten mit kombiniertem Schallwellenleiter und Kühlkörper
US10861461B2 (en) LED design language for visual affordance of voice user interfaces
US11521469B2 (en) Server-provided visual output at a voice interface device
DE202017107614U1 (de) Gesprächsbewusste proaktive Benachrichtigungen für eine Sprachschnittstellenvorrichtung
DE202018101233U1 (de) Systeme und Vorrichtungen zur Aktivitätsüberwachung über einen Home-Assistant

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: MAIKOWSKI & NINNEMANN PATENTANWAELTE PARTNERSC, DE