DE102013003273A1 - Kleinleistungs-Audiodetektion - Google Patents

Kleinleistungs-Audiodetektion Download PDF

Info

Publication number
DE102013003273A1
DE102013003273A1 DE102013003273A DE102013003273A DE102013003273A1 DE 102013003273 A1 DE102013003273 A1 DE 102013003273A1 DE 102013003273 A DE102013003273 A DE 102013003273A DE 102013003273 A DE102013003273 A DE 102013003273A DE 102013003273 A1 DE102013003273 A1 DE 102013003273A1
Authority
DE
Germany
Prior art keywords
audio
predetermined
audio signal
power mode
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102013003273A
Other languages
English (en)
Inventor
Steven Mark Singer
Harith Haboubi
Peter Williams
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Technologies International Ltd
Original Assignee
Cambridge Silicon Radio Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cambridge Silicon Radio Ltd filed Critical Cambridge Silicon Radio Ltd
Publication of DE102013003273A1 publication Critical patent/DE102013003273A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/03Aspects of the reduction of energy consumption in hearing devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Electric Clocks (AREA)

Abstract

Es werden Vorrichtungen und Verfahren zum Detektieren eines vorbestimmten Audiosignals in Audiosignalen bereitgestellt. Eine Vorrichtung umfasst einen mit einem Taktsignalgenerator gekoppelten Prozessor, eine Leistungssteuerung und einen Audiodetektor. Die Leistungssteuerung steuert eine dem Prozessor durch den Taktsignalgenerator zugeführte Taktrate, um die Vorrichtung zu steuern, in einem Kleinleistungsmodus, der einen relativ niedrigen Stromverbrauch aufweist, oder in einem Normalleistungsmodus, der einen relativ hohen Stromverbrauch aufweist, zu arbeiten. Der Audiodetektor empfängt Audiosignale und detektiert im Kleinleistungsmodus eine wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals in den Audiosignalen. Die Leistungssteuerung steuert die Vorrichtung, in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals durch den Audiodetektor vom Kleinleistungsmodus in den Normalleistungsmodus umzuschalten.

Description

  • VERWEIS AUF VERWANDTE ANMELDUNGEN
  • Die vorliegende Anmeldung beansprucht Priorität über die vorläufige US-Anmeldung, laufende Nr. 61/603,717 mit dem Titel ”LOW POWER AUDIO DETECTION”, eingereicht am 27.2.2012, die hiermit durch Bezugnahme voll aufgenommen wird.
  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft allgemein die Verringerung des Stromverbrauchs in Vorrichtungen und insbesondere Vorrichtungen und Verfahren zum Detektieren der wahrscheinlichen Anwesenheit eines vorbestimmten Audiosignals in Audiosignalen, während der Stromverbrauch in einer Vorrichtung verringert wird.
  • HINTERGRUND DER ERFINDUNG
  • Verschiedene Vorrichtungen verfügen über begrenzte Energieversorgung, wie etwa diejenigen, die batteriebetrieben sind. Es gibt gewisse Vorrichtungen, die auf Sprachbefehle oder andere gelegentliche vorbestimmte Klänge (hier allgemein als interessierendes Audio (Schall) bezeichnet) reagieren können. Im Allgemeinen können Vorrichtungen ein Audiosignal verarbeiten, um etwaiges interessierendes Audio zu detektieren. Die meiste Zeit ist jedoch kein interessierendes Audio im Audiosignal anwesend. Ferner kann Verarbeitung des Audiosignals bewirken, dass die Vorrichtung Strom verbraucht, um dadurch einen Stromverbrauch in der Vorrichtung zu vergrößern. Die Audiosignalverarbeitung kann somit eine Batterielebensdauer (insbesondere eine Standby-Zeit) der Vorrichtung begrenzen.
  • KURZFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung wird in Vorrichtungen und Verfahren zum Detektieren eines vorbestimmten Audiosignals in Audiosignalen realisiert. Eine Vorrichtung umfasst einen Prozessor, der mit einem Taktsignalgenerator gekoppelt ist, eine Leistungssteuerung und einen Audiodetektor. Die Leistungssteuerung ist ausgelegt, eine durch den Taktsignalgenerator dem Prozessor zugeführte Taktrate zu steuern, um die Vorrichtung zu steuern, in einem Kleinleistungsmodus mit einem relativ niedrigen Stromverbrauch oder in einem Normalleistungsmodus mit einem relativ hohen Stromverbrauch zu arbeiten. Der Audiodetektor ist mit der Leistungssteuerung gekoppelt. Der Audiodetektor ist ausgelegt, Audiosignale zu empfangen und im Kleinleistungsmodus eine wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals in den Audiosignalen zu detektieren. Die Leistungssteuerung steuert die Vorrichtung, um in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals durch den Audiodetektor vom Kleinleistungsmodus in den Normalleistungsmodus umzuschalten.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung kann aus der folgenden ausführlichen Beschreibung in Verbindung mit den beigefügten Zeichnungen verstanden werden. Es wird gemäß der üblichen Praxis betont, dass verschiedene Merkmale der Zeichnung nicht maßstabsgetreu sein müssen. Stattdessen können die Abmessungen verschiedener Merkmale der Klarheit halber willkürlich vergrößert oder verkleinert sein. Darüber hinaus werden in der Zeichnung gemeinsame Bezugszahlen verwendet, um gleiche Merkmale zu bezeichnen. Die Zeichnung umfasst die folgenden Figuren:
  • 1A ist ein Funktionsblockdiagramm einer Vorrichtung, die ein vorbestimmtes Audiosignal detektiert, gemäß einer Ausführungsform der vorliegenden Erfindung;
  • 1B ist ein Funktionsblockdiagramm einer Vorrichtung, die ein vorbestimmtes Audiosignal detektiert, gemäß einer anderen Ausführungsform der vorliegenden Erfindung;
  • 2 ist ein Funktionsblockdiagramm eines Audiodetektors der in 1A und 1B gezeigten Vorrichtungen gemäß einer anderen Ausführungsform der vorliegenden Erfindung;
  • 3 ist ein Funktionsblockdiagramm eines Komparators des in 2 gezeigten Audiodetektors gemäß einer Ausführungsform der vorliegenden Erfindung; und
  • 4 ist ein Flussdiagramm eines Verfahrens zum Detektieren eines vorbestimmten Audiosignals gemäß einer Ausführungsform der vorliegenden Erfindung.
  • AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
  • Wie oben besprochen, können herkömmliche Vorrichtungen ein Audiosignal verarbeiten, um interessierendes Audio zu detektieren. Vorrichtungen können zum Beispiel herkömmliche Spracherkennungstechniken verwenden, um das Audiosignal kontinuierlich auf interessierendes Audio hin zu verarbeiten. Diese Techniken können jedoch zu relativ hohem Stromverbrauch führen. Eine alternative Technik kann sein, periodisch einen kleinen Audio-Burst zu verarbeiten. Zum Beispiel können 10 ms Audio alle 100 ms abgetastet werden, um zu bestimmen, ob irgendwelches interessierendes Audio anwesend ist.
  • Andere Techniken, die verwendet werden können, um den Start von interessierendem Audio anzuzeigen, wären direkte Eingabe durch einen Benutzer in eine Eingabekomponente der Vorrichtung, wie etwa eine Taste. Dies kann jedoch erfordern, dass die Vorrichtung einem Benutzer zugänglich ist und dass sie mit einer geeigneten Eingabekomponente ausgestattet ist. Ferner können Tastenbetätigungen ein reibungsloses Benutzererlebnis unterbrechen. Als ein anderes Beispiel können gewisse Vorrichtungen eine einfache elektronische Schwellendetektion (d. h. ein Noise-Gate) verwenden, um den Start von interessierendem Audio anzuzeigen. Ein einfaches Noise-Gate kann jedoch in geräuschvollen Umgebungen zu viele falsche positive Ergebnisse und in stillen Umgebungen zu viele falsche negative Ergebnisse geben.
  • Verschiedene Vorrichtungen können einen Kleinleistungsmodus und einen Normalleistungsmodus umfassen. Im Kleinleistungsmodus wird der Energieverbrauch typischerweise (verglichen mit dem Normalleistungsmodus) durch Sperren gewisser der Funktionen der Vorrichtung verringert. Der Kleinleistungsmodus kann zum Beispiel für batteriebetriebene Vorrichtungen nützlich sein.
  • Eine Audiodetektionstechnik (wie etwa Spracherkennung oder periodische Verarbeitung kleiner Audio-Bursts) kann eine Normalleistungsmodus-Verarbeitungsfähigkeit des Systems benutzen. Zum Beispiel umfassen Spracherkennungstechniken typischerweise einen digitalen Signalprozessor (DSP), der Schlüsselwörter in einem Audiosignal identifizieren kann. Fortgesetzte Verwendung des DSP kann zu höherem Stromverbrauch in der Vorrichtung führen. Periodische Verarbeitung von kleinen Audio-Bursts kann auch zum Aufwachen signifikanter Teile des Systems führen, die nicht an der Audioverarbeitung beteiligt sind, wie zum Beispiel ein oder mehrere Anwendungsprozessoren, ein Vielzweck-Direktzugriffsspeicher (RAM) oder verdrahtete Kommunikationshardware (wie etwa ein Universal Asynchronous Receiver-Transmitter (UART), ein Universal Serial Bus (USB), ein Secure Digital Input Output (SDIO) usw.). Diese Komponenten verbrauchen Strom, während die Audioverarbeitung stattfindet.
  • Eine mobile Vorrichtung kann Audioaktivität selbst während eines Leerlaufmodus (in dem die Vorrichtung nicht aktiv irgendeine Anwendung in Reaktion auf manuelle Eingabe des Benutzers ausführt) mit Unterbrechungen oder kontinuierlich detektieren. Die Vorrichtung kann die Protokollierung eines Audiosignals auf der Basis detektierter Audioaktivität automatisch starten und beenden. Die Genauigkeit eines Analog-Digital-Umsetzers (ADC) kann (durch Ändern der Abtastfrequenz des ADC) gesteuert werden, so dass der ADC während eines passiven Audioüberwachungszustands eine niedrigere Genauigkeit und für einen aktiven Audioprotokollierungszustand eine höhere Genauigkeit aufweist, um den Stromverbrauch oder die Speicherbenutzung zu verringern.
  • Aspekte von Ausführungsformen der vorliegenden Erfindung betreffen Vorrichtungen und Verfahren zum Detektieren wahrscheinlicher Anwesenheit eines vorbestimmten Audiosignals (d. h. interessierendem Audio) in Audiosignalen. Eine beispielhafte Vorrichtung umfasst einen Prozessor, der mit einem Taktsignalgenerator gekoppelt ist, eine Leistungssteuerung und einen Audiodetektor. Die Leistungssteuerung kann ausgelegt sein, eine durch den Taktsignalgenerator dem Prozessor zugeführte Taktrate zu steuern, um die Vorrichtung zu steuern, in einem Kleinleistungsmodus mit relativ geringem Stromverbrauch oder in einem Normalleistungsmodus mit einem relativ hohen Stromverbrauch zu arbeiten. Der Audiodetektor ist ausgelegt, Audiosignale zu empfangen und im Kleinleistungsmodus wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals in den Audiosignalen zu detektieren. Die Leistungssteuerung steuert die Vorrichtung, um in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals durch den Audiodetektor vom Kleinleistungsmodus in den Normalleistungsmodus umzuschalten.
  • Beispielhafte Vorrichtungen und Verfahren, die die vorliegende Erfindung realisieren, umfassen Audiodetektion in einem Kleinleistungsmodus. Unter dem Kleinleistungsmodus ist eine einem Prozessor der Vorrichtung zugeführte Taktrate kleiner als während eines Normalleistungsmodus. Die kleinere Taktrate kann anderen Peripheriekomponenten der Vorrichtung sowie dem Audiodetektor zugeführt werden. Ein beispielhafter Audiodetektor kann die wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals auf der Basis gewisser Aspekte des Audiosignals detektieren. Beispielhafte Ausführungsformen eines Audiodetektors können eine kompliziertere Verarbeitung als ein einfaches Noise-Gate umfassen. Beispielhafte Ausführungsformen des Audiodetektors können auch begrenztere Verarbeitung als herkömmliche Audioerkennungstechniken (wie etwa Identifikation eines Schlüsselworts) umfassen. Da beispielhafte Audiodetektoren möglicherweise nicht alle Aspekte des vorbestimmten Audiosignals identifizieren, können sie im Vergleich mit während eines Normalleistungsmodus ausgeführter Audioverarbeitung eine verringerte Detektionsgenauigkeit aufweisen.
  • Gemäß einer beispielhaften Ausführungsform kann die Vorrichtung mehr als eine Ebene der Audioverarbeitung bereitstellen, wobei der Audiodetektor im Kleinleistungsmodus die wahrscheinliche Anwesenheit des vorbestimmten Signals detektiert und ein DSP im Normalleistungsmodus das vorbestimmte Signal detektiert. Somit kann der Audiodetektor Detektion mit einer geringeren Genauigkeit mit verringertem Stromverbrauch (unter dem Kleinleistungsmodus) ausführen, während der DSP genauere Detektion mit höherem Stromverbrauch (unter dem Normalleistungsmodus) in Reaktion auf den Audiodetektor ausführen kann.
  • Ein Unterschied zwischen Audiodetektion der vorliegenden Erfindung und herkömmlicher voller Verarbeitung von Audio besteht darin, dass bei der vorliegenden Erfindung, wenn sich die Vorrichtung in einem Leerlaufzustand befindet (das heißt, vor einem Start von interessierendem Audio), sich die Vorrichtung in einem Kleinleistungsmodus befinden kann. Ein Unterschied zwischen Kleinleistungs-Audiodetektion und anderen Techniken (wie etwa Noisegating) zum Markieren des Anfangs von interessierendem Audio besteht darin, dass Kleinleistungs-Audiodetektion bessere Selektivität (d. h. bessere Detektionsgenauigkeit) für Trigger gewährleisten kann, während sie in einem Kleinleistungsmodus läuft. Im Allgemeinen können beispielhafte Audiodetektoren signifikant weniger Leistung (wenigstens eine Größenordnung) als andere Audiodetektoren verwenden und können Trigger weniger wahrscheinlich als Noise-Gates verpassen.
  • Ein Audiodetektionssystem umfasst ein drahtloses Headset und ein Mobiltelefon. Das System kann direkte Benutzereingaben (eine Tastenbetätigung) an dem drahtlosen Headset verwenden, um Detektion von Sprachbefehlen einzuleiten. Nachdem die Benutzereingaben empfangen sind, kann Audio von dem Headset zur Sprachverarbeitung zum Mobiltelefon geroutet werden. Wenn Sprachbefehle durch dieses herkömmliche System unter Verwendung von Sprachaktivierung (anstelle von direkter Benutzereingabe) zu erkennen wären, bestünde eine Methode hierfür darin, eine volle drahtlose Verbindung (wie etwa BluetoothTM) einzuleiten, alles Audio zum Mobiltelefon zu routen und Sprachverarbeitung auf dem Telefon auszuführen. Dies verbraucht nicht nur Strom in einem Anwendungsprozessor auf dem Mobiltelefon und in ADC im Headset, sondern verbraucht auch Strom im Bluetooth-Chip auf dem Telefon und dem Bluetooth-Chip auf dem Headset. Folglich kann diese Technik insbesondere auf dem Headset zu schlechter Batterielebensdauer führen.
  • Falls dagegen die Schlüsselwortdetektion durch das Headset (in einem Normalleistungsmodus) ausgeführt wird, kann das Mobiltelefon völlig einschlafen und das Headset kann seine Bluetooth-Verbindung in einen Kleinleistungsmodus versetzen, bis das Schlüsselwort detektiert wird. Falls der Hauptprozessor des Headset die Schlüsselwortdetektion im Normalleistungsmodus ausführt, produziert der Stromverbrauch jedoch immer noch keine angemessene Standby-Zeit auf dem Headset. Falls jedoch Kleinleistungs-Audiodetektionstechniken durch das Headset (gemäß Aspekten der vorliegenden Erfindung) ausgeführt werden, kann der Stromverbrauch des Headset verringert und somit die Standby-Zeit des Headset vergrößert werden.
  • Mit Bezug auf 1A ist ein Funktionsblockdiagramm einer beispielhaften Vorrichtung 100 gezeigt. Die Vorrichtung 100 kann ein Mikrofon 102, einen Audiodetektor 104, einen allgemeinen Prozessor 106, einen digitalen Signalprozessor (DSP) 110, eine Leistungssteuerung 112, einen Taktsignalgenerator 114 und eine Speichervorrichtung 122 umfassen. Die Vorrichtung 100 kann andere Funktionskomponenten umfassen, wie etwa, aber ohne Beschränkung darauf, einen optionalen Sender 124, einen optionalen Empfänger 126 und eine optionale Antenne 128. Der allgemeine Prozessor 106 und die Speichervorrichtung 122 können über einen (nicht gezeigten) Daten- und Steuerbus mit dem Audiodetektor 104, dem DSP 110, der Leistungssteuerung 112, dem Taktsignalgenerator 114, dem optionalen Sender 124, dem optionalen Empfänger 126 und/oder einer optionalen Antenne 128 gekoppelt sein.
  • Die Vorrichtung 100 kann eine beliebige Vorrichtung mit begrenzter Stromversorgung mit der Fähigkeit zum Detektieren eines vorbestimmten Audiosignals umfassen. Beispiele für die Vorrichtung 100 können, aber ohne Beschränkung darauf, ein drahtloses Headset, ein Mobiltelefon, ein Personal Digital Assistant (PDA), einen Computer, einen Fernseher, eine Fernbedienung, eine Unterhaltungskonsole im Auto, ein AM/FM-Radio, eine Uhr oder eine Armbanduhr umfassen.
  • Die Vorrichtung 100 kann ausgelegt sein, auf der Basis einer Taktrate des Taktsignalgenerators 114 in einem Kleinleistungsmodus oder in einem Normalleistungsmodus zu arbeiten. Die Auswahl eines Leistungsmodus kann durch die Leistungssteuerung 112 gemäß Detektion eines vorbestimmten Audiosignals in Audiosignalen 130 durch den Audiodetektor 104 gesteuert werden. Das vorbestimmte Audiosignal kann zum Beispiel ein vorbestimmtes Sprachsignal oder ein vorbestimmtes Nicht-Sprach-Audiosignal (z. B. ein Pfeifen, ein Klatschen, ein Klicken usw.) umfassen.
  • Im Betrieb kann der Audiodetektor 104 Audiodetektion an Audiosignalen 130 ausführen, während sich die Vorrichtung 100 im Kleinleistungsmodus befindet.
  • Wenn wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals (d. h. interessierendem Audio) detektiert wird, kann die Leistungssteuerung 112 die Vorrichtung 100 umschalten, um im Normalleistungsmodus zu arbeiten. Im Allgemeinen kann Audioverarbeitung durch den Audiodetektor 104 im Kleinleistungsmodus bewirken, dass die Vorrichtung 100 weniger Strom verbraucht, als wenn die Vorrichtung 100 im Normalleistungsmodus arbeiten würde.
  • Das Mikrofon 102 kann Audiosignale 130 aus einer umgebenden Umgebung erfassen. Gemäß einer Ausführungsform kann das Mikrofon 102 ein analoges Mikrofon umfassen, so dass Audiosignale 130 ein Analogsignal repräsentieren können. Gemäß einer anderen Ausführungsform kann das Mikrofon 102 ein digitales Mikrofon umfassen, so dass die Audiosignale 130 ein digitales Signal repräsentieren können. Zum Beispiel kann das Mikrofon 102 einen (nicht gezeigten) Analog-Digital-Umsetzer (ADC) umfassen, um das digitale Signal zu produzieren. Die Audiosignale 130 können dem Audiodetektor 104 und/oder dem allgemeinen Prozessor 106 und/oder dem DSP 110 zugeführt werden. Die Audiosignale 130 können auch in der Speichervorrichtung 122, die später beschrieben wird, gespeichert werden.
  • Der Audiodetektor 104 kann die Audiosignale 130 empfangen und das vorbestimmte Audiosignal in den Audiosignalen 130 detektieren, um das Detektionssignal 132 zu erzeugen. Das Detektionssignal 132 kann der Leistungssteuerung 112 zugeführt werden. Der Audiodetektor 104 kann Audiodetektion ausführen, während sich die Vorrichtung 100 im Kleinleistungsmodus befindet. Audiodetektion kann während des Kleinleistungsmodus kontinuierlich oder periodisch ausgeführt werden. Der Audiodetektor 104 wird nachfolgend mit Bezug auf 2 und 3 beschrieben. Der Audiodetektor 104 kann zum Beispiel eine Logikschaltung, einen digitalen Signalprozessor oder einen Mikroprozessor umfassen.
  • Im Allgemeinen kann der Audiodetektor 104 einige Audioverarbeitung der Audiosignale 130 auf der Basis eines Vergleichs der Audiosignale 130 mit einem vorbestimmten Audiosignal ausführen. Der Audiodetektor 104 kann mehr Verarbeitungsfähigkeit als ein Noise-Gate bereitstellen, kann aber die Detektionsgenauigkeit von unter dem Normalleistungsmodus ausgeführter Verarbeitung (die zum Beispiel durch den DSP 110 ausgeführt werden kann) nicht bereitstellen.
  • Die Detektionsgenauigkeit des Audiodetektors 104 kann auf der Basis einer Taktrate des dem Audiodetektor 104 (später beschrieben) zugeführten Taktsignals 136 gesteuert werden. Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 ausreichende Genauigkeit aufweisen, um wahrscheinliche Anwesenheit des vorbestimmten Audiosignals in den Audiosignalen 130 zu detektieren. Der Audiodetektor 104 kann jedoch nicht in der Lage sein, alle Aspekte des vorbestimmten Audiosignals zu detektieren. Zum Beispiel kann der Audiodetektor 104 die wahrscheinliche Anwesenheit eines Sprachsignals detektieren, aber nicht in der Lage sein, Schlüsselwörter im Sprachsignal zu identifizieren.
  • Der Audiodetektor 104 kann ein analoges Signal und/oder ein digitales Signal verarbeiten. Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 ein digitales Signal (z. B. von dem als ein digitales Mikrofon konfigurierten Mikrofon 102) verarbeiten, das die Stimme eines Benutzers umfasst. Die Taktrate (z. B. 32 kHz) des dem Audiodetektor 104 im Kleinleistungsmodus zugeführten Taktsignals 136 kann für volle Sprachrekonstruktion des digitalen Signals zu niedrig sein. Der Audiodetektor 104 kann jedoch immer noch Aspekte der Audiosignale 130, die zum Bestimmen der wahrscheinlichen Anwesenheit der Stimme des Benutzers nützlich sein können, wiedergewinnen.
  • Der allgemeine Prozessor 106 kann allgemeine Funktionen in Bezug auf den Betrieb der Vorrichtung 100 ausführen. Der allgemeine Prozessor 106 kann für Stromverbrauch beim Ausführen irgendeiner bestimmten Aufgabe (wie etwa Audiosignalverarbeitung) nicht optimiert sein. Anders ausgedrückt, kann der allgemeine Prozessor 106 einige Audiosignalverarbeitungsfähigkeiten (einschließlich Fähigkeiten von mehr als einem Noise-Gate) aufweisen, aber nicht für Signalverarbeitung (wie etwa der DSP 110) optimiert sein. Der allgemeine Prozessor 106 kann auch ausgelegt sein, Audiosignalverarbeitung mit einer kleineren Taktrate (während des Kleinleistungsmodus) auszuführen. Der allgemeine Prozessor 106 kann den Betrieb des Mikrofons 102 und/oder des Audiodetektors 104 und/oder des DSP 110 und/oder der Leistungssteuerung 112 und/oder der Taktschaltung 114 und/oder der Speichervorrichtung 122 und/oder des optionalen Senders 124 und/oder des optionalen Empfängers 126 und/oder der optionalen Antenne 128 steuern. Der allgemeine Prozessor 106 kann zum Beispiel eine Logikschaltung, einen digitalen Signalprozessor, einen Mikrocontroller oder einen Mikroprozessor umfassen. Gemäß einer beispielhaften Ausführungsform kann der allgemeine Prozessor 106, ohne Beschränkung darauf, einen Intel-8051-Prozessor umfassen.
  • Im Gegensatz zum allgemeinen Prozessor 106 kann der DSP 110 für eine spezifische Aufgabe (wie etwa Audiosignalverarbeitung) optimiert sein und diese Optimierung kann den Stromverbrauch zum Ausführen dieser Aufgabe (im Vergleich zum allgemeinen Prozessor 106) verringern. Der DSP 110 kann einen beliebigen geeigneten digitalen Signalprozessor umfassen, der Audiosignalverarbeitung ausführen kann. Der DSP 110 kann im Allgemeinen ein Spektrum der Audiosignale 130 analysieren, um zu bestimmen, ob das vorbestimmte Audiosignal anwesend ist. Der DSP 100 kann eine beliebige geeignete Audioerkennungstechnik (wie etwa Spracherkennung unter Verwendung von Hidden-Markov-Modellen (HMM)) oder neuronalen Netzwerken) ausführen, wie Fachleuten bekannt ist. Gemäß einer beispielhaften Ausführungsform kann eine Detektionsgenauigkeit des DSP 110 ausgelegt werden, höher als eine Detektionsgenauigkeit des Audiodetektors 104 zu sein.
  • Gemäß einer beispielhaften Ausführungsform kann der DSP 110 nachfolgende Verarbeitung der Audiosignale 130 (z. B. mit höherer Genauigkeit) ausführen, nachdem der Audiodetektor 104 die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals (im Kleinleistungsmodus) detektiert. Nachfolgende Detektion des vorbestimmten Audiosignals durch den DSP 110 (nach anfänglicher Detektion durch den Audiodetektor 104) kann von der Leistungssteuerung 112 verwendet werden, um die Vorrichtung 100 im Normalleistungsmodus voll heraufzufahren. Auf diese Weise kann die Vorrichtung 100 mehrere Ebenen der Verarbeitung der Audiosignale 130 bereitstellen, um das vorbestimmte Audiosignal zu detektieren und um den Stromverbrauch in der Vorrichtung 100 zu steuern.
  • Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 eine von dem allgemeinen Prozessor 106 getrennte Komponente sein. Gemäß einer anderen beispielhaften Ausführungsform kann der Audiodetektor 104 Teil des allgemeinen Prozessors 106 (z. B. als auf dem allgemeinen Prozessor 106 laufende Software implementiert) sein, wie durch den gestrichelten Kasten 108 angegeben.
  • Die Leistungssteuerung 112 kann das Detektionssignal 132 von dem Audiodetektor 104 empfangen und kann dem Taktsignalgenerator 114 das Steuersignal 134 zuführen. Das Steuersignal 134 der Leistungssteuerung 112 wird verwendet, um den Betrieb der Vorrichtung 100 zwischen dem Kleinleistungsmodus und dem Normalleistungsmodus umzuschalten.
  • Der Taktsignalgenerator 114 ist ausgelegt, einen ersten Takt 118 und einen zweiten Takt 120 zu produzieren. Er kann auch einen Schalter 116 umfassen. Der erste Takt 118 ist ein Taktsignal relativ höherer Genauigkeit (mit einer höheren Taktrate), während der zweite Takt 120 ein Taktsignal niedrigerer Genauigkeit (mit einer kleineren Taktrate) ist, das bewirkt, dass die Vorrichtungen, an die es angelegt wird, weniger Strom als der erste Takt 120 verbrauchen. In Reaktion auf das Steuersignal 134 von der Leistungssteuerung 112 führt der Taktsignalgenerator 114 das Taktsignal 136 dem Audiodetektor 104, dem allgemeinen Prozessor 106, dem DSP 110, dem optionalen Sender 124 und dem optionalen Empfänger 126 zu.
  • Da der erste Takt 118 eine höhere Genauigkeit als der zweite Takt 120 aufweist, kann das Laufenlassen des Audiodetektors 104 (sowie des allgemeinen Prozessors 106) mit dem zweiten Takt 120 (im Kleinleistungsmodus) weniger genaue Audiodetektionsergebnisse als Laufenlassen des DSP 110 mit dem ersten Takt 118 (im Normalleistungsmodus) bereitstellen. Der erste und zweite Takt 118 und 120 können auf verschiedene Weisen konfiguriert werden. Als ein Beispiel kann der erste Takt 118 von einem Kristalloszillator betrieben werden und der zweite Takt 120 kann von einem Oszillator auf Silizium (z. B. einem astablilen Multivibrator oder einem Pufferringoszillator) betrieben werden.
  • Die Leistungssteuerung 112 führt dem Taktsignalgenerator 114 das Steuersignal 134 zu, um so zu steuern, welcher der Takte 118 und 120 zu einem beliebigen Zeitpunkt verwendet wird. Die Leistungssteuerung 134 ist so ausgelegt, dass, wenn sich die Vorrichtung 100 im Kleinleistungsmodus befindet, das Taktsignal kleinerer Leistung (der zweite Takt 120) verwendet wird. Wenn sich die Vorrichtung 100 im Normalleistungsmodus befindet, wird das Taktsignal höherer Leistung (der erste Takt 118) verwendet.
  • Im Normalleistungsmodus können alle Komponenten der Vorrichtung 100 aktiv sein und der Schalter 116 kann so gesetzt werden, dass der erste Takt 118 aktiv ist. Im Kleinleistungsmodus kann die Leistungssteuerung 112 den Schalter 116 so setzen, dass der zweite Takt 120 aktiv ist. Die Leistungssteuerung 112 kann auch verschiedene Komponenten der Vorrichtung 100 im Kleinleistungsmodus deaktivieren, wie etwa den DSP 110.
  • Die Vorrichtung 100 kann auch eine Speichervorrichtung 122 umfassen. Die Speichervorrichtung 122 kann wenigstens einen Teil der Audiosignale 130 speichern. Die Speichervorrichtung 122 kann auch ein oder mehrere vorbestimmte Audiosignale 214 (2), eine oder mehrere Werte von dem Audiodetektor 104, dem allgemeinen Prozessor 106, dem DSP 110, der Leistungssteuerung 112, dem optionalen Sender 124, dem optionalen Empfänger 126 und/oder der optionalen Antenne 128 speichern. Die Speichervorrichtung 122 kann zum Beispiel ein RAM, flüchtigen Speicher, nichtflüchtigen Speicher, einen magnetischen Datenträger, einen optischen Datenträger, Flash-Speicher oder eine Festplatte umfassen. Posten wie Nachschlagetabellen können im Flash-Speicher oder Nurlesespeicher (ROM) gespeichert werden. Diese können eingebettete oder Kleinleistungsversionen sein, die diesem Zweck gewidmet sind. Ähnlich kann gewisse flüchtige, aber Kleinleistungshardware, möglicherweise Flipflops, zur Speicherung in diesem Modus verwendet werden.
  • Gemäß einer beispielhaften Ausführungsform kann die Speichervorrichtung 122 einen Teil der Audiosignale 130 (die von dem Audiodetektor 104 zur anfänglichen Detektion verwendet werden) speichern. Der gespeicherte Teil kann von wenigstens einer nachfolgenden Verarbeitungsstufe (wie etwa dem DSP 110 oder einer späteren Verarbeitungsstufe des Audiodetektors 104) verwendet werden. Wenn die nachfolgende Stufe schnell herauffährt, kann die Speicherungsmenge klein genug sein, um sowohl leistungs- als auch kosteneffizient zu sein. Falls zum Beispiel die nachfolgende Stufe in 10 ms herauffährt, können 160 Abtastwerte Speicherung verwendet werden, um ein 8-kHz-Audiosignal 130 zu speichern.
  • Da die Audiosignale 130 einer nachfolgenden Stufe bzw. nachfolgenden Stufen (über die Speichervorrichtung 122) verfügbar sein können, muss wenigstens eine der früheren Verarbeitungsstufen möglicherweise nicht extrem selektiv sein (d. h. mit einer hohen Detektionsgenauigkeit). Zum Beispiel kann eine mäßige Falschpositiv-Detektionsrate (z. B. durch den Audiodetektor 104) in einer späteren Stufe (wie etwa durch den DSP 110) herausgefiltert werden.
  • Die Speicherung von Audiosignalen 130 kann zum Beispiel auch einer späteren Stufe bzw. späteren Stufen erlauben, zwischen mehreren Detektionstriggern zu unterscheiden, während gleichzeitig einer früheren Stufe bzw. früheren Stufen erlaubt wird, nicht zwischen diesen Triggern zu unterscheiden. Zum Beispiel kann eine frühe Stufe (wie etwa der Audiodetektor 104) identifizieren, dass Sprache detektiert wurde, und eine spätere Stufe (wie etwa der DSP 110) kann dieselben Daten untersuchen, um zu bestimmen, dass ein bestimmtes Wort gesprochen wurde.
  • Die Vorrichtung 100 kann einen oder mehrere optionale Sender 124, die Signale in ein für Übertragung von der optionalen Antenne 128 geeignetes Format umsetzen, oder optionale Empfänger 126, die Funksignale in ein von der optionalen Antenne 128 empfangenes geeignetes Format umsetzen, umfassen.
  • Die Vorrichtung 100 kann (nicht gezeigte) andere Funktionskomponenten umfassen, wie etwa eine Stromversorgung, einen Verstärker und/oder ein Filter. Diese Komponenten können im Kleinleistungsmodus im Vergleich mit dem Normalleistungsmodus auch andere Betriebseigenschaften aufweisen. Zum Beispiel könnten Verstärker im Kleinleistungsmodus in einem Modus mit geringerem Stromverbrauch betrieben werden. Gemäß einem anderen Beispiel können Taktreferenzen im Kleinleistungsmodus lockerere Toleranzen aufweisen (zum Beispiel kann ein R-C-Takt im Kleinleistungsmodus ausreichen, so dass die Kristalle heruntergefahren werden können). Beispiele für diese Techniken werden in der US-Patentanmeldung, Pub. Nr. US 2011/0065413 für Singer beschrieben.
  • Mit Bezug auf 1B ist ein Funktionsblockdiagramm einer beispielhaften Vorrichtung 100' gemäß einer anderen Ausführungsform der vorliegenden Erfindung gezeigt. Die Vorrichtung 100' ist der Vorrichtung 100 (1A) ähnlich, mit der Ausnahme, dass der Audiodetektor 104 in der Vorrichtung 100' durch das Taktsignal 142 des Hilfstaktsignalgenerators 140 getaktet wird. Somit kann in der Vorrichtung 100' der Audiodetektor 104 separat vom Rest der Komponenten der Vorrichtung 100' getaktet werden. Der Audiodetektor 104 kann auch unabhängig von den anderen Komponenten der Vorrichtung 100' versorgt werden. Somit kann der Audiodetektor 104 die Verarbeitungsleistung, die von anderen Komponenten der Vorrichtung 100' gefordert wird und somit deren Stromverbrauch verringern.
  • Mit Bezug auf 1A und 1B versteht sich, dass Komponenten des Audiodetektors 104, des allgemeinen Prozessors 106, der Leistungssteuerung 112, des Taktsignalgenerators 114 und/oder des Hilfstaktsignalgenerators 140 in Hardware oder in einer Kombination von Hardware und Software implementiert werden können. Obwohl das Mikrofon 102, der Audiodetektor 104, der allgemeine Prozessor 106, der DSP 110, die Leistungssteuerung 112, der Taktsignalgenerator 114, die Speicherungseinrichtung 122, der optionale Sender 124, der optionale Empfänger 126, die optionale Antenne 118 und der Hilfstaktsignalgenerator 140 als Teil eines Systems (das zum Beispiel auf einem einzigen Chip gebildet ist) dargestellt sind, können verschiedene Komponenten der Vorrichtung 100 (und der Vorrichtung 100') separat gebildet werden.
  • Es versteht sich, dass Hardware- und/oder Softwarekomponenten der Vorrichtungen 100, 100' gemäß zahlreichen Faktoren ausgewählt werden können, wie etwa einem gewünschten Stromverbrauch und/oder gewünschten Materialkosten.
  • Falls zum Beispiel Aspekte der vorliegenden Erfindung auf existierender Hardware implementiert werden, die bereits einen Mikroprozessor (d. h. allgemeinen Prozessor 106) mit kleiner Leistung (d. h. kleiner Taktrate) umfasst, müssen zusätzliche Komponenten (wie etwa der Audiodetektor 104 und die Leistungssteuerung 112) möglicherweise (wie etwa aus diskreten Komponenten) zur Hardware hinzugefügt werden. Dies kann die Anzahl der Komponenten und eine erforderliche Fläche einer Leiterplatte (PCB) vergrößern.
  • Falls dagegen Aspekte der vorliegenden Erfindung als Teil einer neuen anwendungsspezifischen integrierten Schaltung (ASIC) implementiert werden, kann eine Zunahme der Kosten zum Hinzufügen zum Beispiel einiger analoger Verarbeitungskomponenten marginal sein. Diese analogen Komponenten können zum Beispiel etwas einfache Verarbeitung (wie etwa ein Noise-Gate) mit niedrigerem Stromverbrauch als Verarbeitung durch einen Mikroprozessor bereitstellen. Als ein anderes Beispiel können die analogen Komponenten eine kleinere Chipfläche einnehmen als die Chipfläche, die zur Unterstützung von zusätzlichem ROM und/oder RAM verwendet wird, um Programm und Speicherung des Mikroprozessors (zur Ausführung der Audiodetektionsverarbeitung) zu erweitern.
  • Ähnlich kann ein ADC beträchtlich viel Strom verbrauchen. Ein Noise-Gate, das in einem Mikroprozessor auf einem existierenden System implementiert wird, kann auch kontinuierliche Benutzung eines ADC erfordern. Im Gegensatz dazu kann ein mit analogen Komponenten implementiertes Noise-Gate erlauben, den ADC auszuschalten, bis bestimmt wird, dass die Eingaben interessant genug (d. h. über einer Schwelle) sind.
  • Nunmehr mit Bezug auf 2 ist ein Funktionsblockdiagramm des Audiodetektors 104 gezeigt. Der Audiodetektor 104 kann einen Komparator 208 umfassen. Der Audiodetektor 104 kann auch eine oder mehrere optionale Komponenten umfassen, wie etwa einen Analog-Digital-Umsetzer (ADC) 202, ein Filter 204 (das hier auch als Filter 204 bezeichnet wird) und/oder einen Pegel-Trigger 206.
  • Gemäß einer beispielhaften Ausführungsform kann der Komparator 208 Audiosignale 130 empfangen und das Detektionssignal 132 erzeugen. Im Allgemeinen kann der Komparator 208 Audiosignale 130 mit einem vorbestimmten Audiosignal 214 (hier auch als vorbestimmtes Audiosignal bzw. vorbestimmte Audiosignale 214 bezeichnet) vergleichen, um das Detektionssignal 132 zu erzeugen. Zum Beispiel kann der Komparator 208 Frequenzkomponenten der Audiosignale 130 mit dem vorbestimmten Audiosignal bzw. den vorbestimmten Audiosignalen 214 vergleichen, um die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals bzw. der vorbestimmten Audiosignale 214 zu detektieren. Der Komparator 208 wird später mit Bezug auf 3 beschrieben.
  • Wie oben besprochen, können die Audiosignale 130 ein analoges Signal oder ein digitales Signal umfassen. Somit kann der Komparator 208 ausgelegt sein, Audiosignale 130 in der analogen Domäne und/oder in der digitalen Domäne zu verarbeiten.
  • Obwohl in 2 ein einziger Komparator 208 gezeigt ist, kann der Audiodetektor 104 zwei oder mehr Komparatoren 208 umfassen. Gemäß einer beispielhaften Ausführungsform kann jeder Komparator 208 eine andere Detektionsgenauigkeit bereitstellen. Gemäß einer anderen beispielhaften Ausführungsform kann jeder Komparator 208 verschiedene Grade des Vergleichs bereitstellen. Vergleichsbeispiele können umfassen: ob das Audiosignal verglichen mit Nicht-Sprach-Signalen Sprachsignale enthält; ob das Audio verglichen mit anderen Stimmen die Stimme eines Benutzers (oder eine einer Menge von Stimmen von Benutzern) enthält; oder ob das Audio verglichen mit anderen durch den Benutzer produzierten Geräuschen spezifische Schlüsselwörter enthält. Wie oben besprochen, kann das vorbestimmte Audiosignal bzw. können die vorbestimmten Audiosignale 214 auch vorbestimmte Nicht-Sprachsignale umfassen, wie zum Beispiel, aber ohne Beschränkung darauf, ein Pfeifen, ein Klatschen oder ein Klicken.
  • Der Audiodetektor 104 kann einen optionalen ADC 202 umfassen. Der optionale ADC 202 kann die Audiosignale 130 als ein analoges Signal empfangen und kann die Audiosignale 130 in ein digitales Signal umsetzen. Der ADC 202 kann dem Komparator 208 (oder dem optionalen Filter bzw. den optionalen Filtern 204 oder dem optionalen Pegel-Trigger 206) ein digitales Signal zuführen. Bei einer beispielhaften Ausführungsform kann der ADC 202 im Kleinleistungsmodus mit einem weniger genauen Takt (wie etwa Verwendung des in 1A gezeigten zweiten Takts 120) oder mit einer kleineren Frequenz als während des Normalleistungsmodus arbeiten.
  • Der Audiodetektor 104 kann ein optionales Filter bzw. optionale Filter 204 umfassen. Das bzw. die Filter 204 können die Audiosignale 130 (oder ein digitalisiertes Signal von dem optionalen ADC 202) empfangen und dem Komparator 208 (oder dem optionalen Pegel-Trigger 206) ein gefiltertes Signal zuführen. Das optionale Filter bzw. die optionalen Filter 204 können mit Filterparameter(n) 210 konfiguriert werden. Das optionale Filter bzw. die optionalen Filter 204 können beliebige geeignete Filter im analogen Bereich oder Frequenzbereich umfassen, wie etwa Tiefpassfilter, Hochpassfilter, Bandpassfilter, Kerbfilter oder eine beliebige Kombination davon.
  • Gemäß einer beispielhaften Ausführungsform können das optionale Filter bzw. die optionalen Filter 204 ein Hochpassfilter umfassen, um eine Gleichstrom-(DC-)Komponente zu dämpfen, um falsche positive Audiodetektion zu verringern.
  • Gemäß einer anderen beispielhaften Ausführungsform können das optionale Filter bzw. die optionalen Filter 204 ein Bandpassfilter umfassen, um einen Bereich von Frequenzen, der Sprache entspricht (zum Beispiel zwischen etwa 50 Hz und etwa 4 kHz) durchzulassen.
  • Der Audiodetektor 104 kann einen optionalen Pegel-Trigger 206 umfassen. Der optionale Pegel-Trigger 206 kann die Audiosignale 130 (oder ein digitalisiertes Signal vom optionalen ADC 202 oder ein gefiltertes Signal vom optionalen Filter bzw. von den optionalen Filtern 204) empfangen und kann dem Komparator 208 ein Triggersignal zuführen. Der optionale Pegel-Trigger 206 kann einen Pegel der Audiosignale 130 mit einer optionalen Noise-Gate-Schwelle 212 vergleichen. Falls der Pegel der Audiosignale 130 größer als eine optionale Noise-Gate-Schwelle 212 ist, kann der optionale Pegel-Trigger 206 den Komparator 208 triggern, die Audiosignale 130 zu analysieren. Andernfalls kann der Komparator 208 die Audiosignale 130 nicht analysieren. Somit kann der optionale Pegel-Trigger 206 als ein Noise-Gate arbeiten.
  • Gemäß einer beispielhaften Ausführungsform kann der optionale Pegel-Trigger 206 das analoge Signal empfangen und ein mit Noise-Gate behandeltes Signal erzeugen. Das mit Noise-Gate behandelte Signal kann zur Analyse dem Komparator 208 zugeführt werden. Somit kann der Komparator 208 in der Lage sein, zur Verarbeitung effektiv ein Audiosignal mit einem Bit pro Abtastwert zu erhalten.
  • Wie oben mit Bezug auf 1A besprochen, kann die Vorrichtung 100 eine Speichervorrichtung 122 umfassen, die wenigstens einen Teil der Audiosignale 130 speichern kann. Die Speicherung von Audiosignalen 130 kann in verschiedenen Stufen des Audiodetektors 104 gesteuert werden. Zum Beispiel kann Speicherung nichtflüchtig sein und kann nur dann aktiv sein, wenn der optionale Pegel-Trigger 206 dem Komparator 208 ein Triggersignal zuführt. Dies könnte erlauben, die Speichervorrichtung 122 (1A) für den größten Teil der Lebensdauer der Vorrichtung 100 (im Kleinleistungsmodus) herunterzufahren.
  • Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 einen Mikroprozessor umfassen, der die Verarbeitung im Kleinleistungsmodus (mit Kleinleistungskomponenten) ausführen kann. Es kann wünschenswert sein, den Audiodetektor 104 unabhängig von dem allgemeinen Prozessor 106 (1A) der Vorrichtung laufen zu lassen. Im Kleinleistungsmodus kann der allgemeine Prozessor 106 (1A) in einen Zustand mit geringem Leckstrom versetzt werden, indem seine RAM in einem Niederspannungs-Datenretentionszustand versetzt werden. In diesem Zustand kann nicht auf die RAM des allgemeinen Prozessors 106 (1A) zugegriffen werden. Dementsprechend kann der Audiodetektor 104 (z. B. ein Mikroprozessor) (nicht gezeigten) RAM umfassen, der von dem RAM des allgemeinen Prozessors 106 (1A) separat ist. In bestimmten Fällen kann der allgemeine Prozessor 106 (1A) völlig heruntergefahren werden (wodurch er seinen RAM-Inhalt verliert, aber Strom spart). Der allgemeine Prozessor 106 (1A) kann auch nichtflüchtigen RAM (NVRAM) umfassen, um seinen Inhalt im heruntergefahrenen Zustand zu behalten.
  • Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 aus passiven Komponenten gebildet werden. Gemäß einer anderen beispielhaften Ausführungsform können eine oder mehrere Komponenten des Audiodetektors justiert werden. Zum Beispiel kann wenigstens eine Komponente in Reaktion auf Änderungen der Umgebungsgeräuschbedingungen justiert (angepasst) werden. Gemäß einer anderen beispielhaften Ausführungsform können eine oder mehrere Komponenten des Audiodetektors trainiert werden, das vorbestimmte Audiosignal bzw. die vorbestimmten Audiosignale 214 unter verschiedenen Geräuschbedingungen zu detektieren. Gemäß einer weiteren beispielhaften Ausführungsform können eine oder mehrere Komponenten des Audiodetektors in der Lage sein, ein neues vorbestimmtes Audiosignal bzw. neue vorbestimmte Audiosignale 214 und/oder neue Geräuschbedingungen zu lernen.
  • Die Justierung des optionalen Filterparameters bzw. der optionalen Filterparameter 210, der optionalen Noise-Gate-Schwelle 212, des vorbestimmten Audiosignals bzw. der vorbestimmten Audiosignale 214 und/oder des Komparators 208 wird im Allgemeinen durch jeweilige optionale Steuersignale 216-1, 216-2, 216-3 und 216-4 angegeben. Die Steuersignale 216 können zum Beispiel durch den allgemeinen Prozessor 106 (1A) bereitgestellt werden.
  • Zum Beispiel kann während des Trainings der Audiodetektor 104 versuchen, Filterbankparameter 312 (3) des Komparators 208 (über das Steuersignal 216-4) zu finden, die verschiedene Teile eines Schlüsselworts mit guter Selektivität identifizieren. Um mit Umgebungsgeräuschen fertig zu werden, kann der Audiodetektor 104 (über das Steuersignal 216-1) den optionalen Filterparameter bzw. die optionalen Filterparameter 210 von idealen Einstellungen für eine geräuschfreie Umgebung weg ändern, um die Geräuschverschlechterung der Audiosignale 130 zu verringern. Als ein anderes Beispiel kann der Audiodetektor 104 (über das Steuersignal 216-2) die optionale Noise-Gate-Schwelle 212 von idealen Einstellungen für die geräuschfreie Umgebung weg ändern, um falsche positive Triggerung durch den optionalen Pegel-Trigger 206 zu verringern.
  • Die Anpassbarkeit des Audiodetektors 104 kann ausgewählt werden, um auf ein bestimmtes Verhältnis von Wake-Ups (d. h. Umschalten in den Normalleistungsmodus), die wahre Positive sind, oder eine bestimmte minimale Wake-Up-Rate bei Verwendung von nichtidealen Einstellungen (z. B. für geräuschbehaftete Umgebungen) abzuzielen.
  • Gemäß einer beispielhaften Ausführungsform kann der Audiodetektor 104 ausgelegt sein, auf falsche Positive zu reagieren. Gemäß einer anderen beispielhaften Ausführungsform kann der Audiodetektor 104 ausgelegt sein, falsche Positive und falsche Negative zu kompensieren. Zum Beispiel kann der Audiodetektor 104 Schwellen und/oder andere Parameter ändern, um falsche Positive zu verringern. Mit der Zeit kann der Audiodetektor 104 leider die Anzahl falscher Positiver verringern, während er allmählich gegenüber wahren Positiven weniger empfindlich wird. Bei einem mehrstufigen Audiodetektor kann, falls die erste Stufe zu viele Signale zurückweist, keine Möglichkeit bestehen, falsche Negative ohne Benutzerinteraktion zu identifizieren. Falls jedoch die erste Stufe (wie etwa der optionale Pegel-Trigger 206 oder eine Stufe des Komparators 208) einige falsche Positive durchlässt, können spätere Stufen diese falschen Positive benutzen, um sicherzustellen, dass der Audiodetektor 104 nicht gegenüber wahren Positiven unempfindlich wird. Der Audiodetektor 104 kann auch gewisse Zielniveaus falscher Positive erlauben, um keine oder wenige falsche Negative sicherzustellen.
  • Gemäß einer beispielhaften Ausführungsform können zur Umgebungsanpassung eine oder mehrere Komponenten des Audiodetektors 104 (oder der Vorrichtung 100 von 1A) periodisch aufwachen, um das Hintergrundgeräusch abzutasten und/oder um Filterparameter oder andere Parameter des Audiodetektors 104 zu justieren. Zum Beispiel kann die Vorrichtung 100 den Hintergrundgeräuschpegel bestimmen und die Noise-Gate-Schwelle 212 so justieren, dass sie gerade oberhalb des Hintergrundgeräuschpegels liegt, wodurch effektiv eine laufende Mittelwertschätzung des aktuellen Hintergrundgeräuschpegels erzeugt wird.
  • Obwohl periodisches Aufwachen von Komponenten der Vorrichtung 100 (1A) im Hinblick auf Strom kostspielig sein kann, kann es möglich sein, das Aufwachen zu unterdrücken, wenn bekannt ist, dass die Umgebung ruhig ist. Zum Beispiel könnte der Benutzer typischerweise die Vorrichtung 100 nachts in einem ruhigen Bereich lassen. Die Vorrichtung 100 kann die Noise-Gate-Schwelle 212 auf einen relativ kleinen Wert einstellen und periodische Umgebungsgeräuschanpassung ausschalten. Die Vorrichtung 100 kann somit zuversichtlich sein, dass jede Änderung der Umgebung bewirken kann, dass der optionale Pegel-Trigger 206 ein Triggersignal zur anfänglichen Audiodetektion bereitstellt.
  • Im obigen Beispiel versteht sich, dass der Audiodetektor 104 die volle Vorrichtung 100 (1A) in Reaktion auf den Trigger eines Benutzers aufwecken kann; und auch die volle Vorrichtung 100 in Reaktion auf Umgebungsänderung aufwecken kann. Diese doppelte Triggerung kann verallgemeinert werden. In bestimmten Fällen, insbesondere bei konstanten oder nahezu konstanten Umgebungen (wie etwa beim Fahren) können die Hochleistungsmoduskomponenten der Vorrichtung 100 den Kleinleistungsmoduskomponenten lehren, um sie entweder bei einem Trigger oder bei einer Änderung der Umgebung aufzuwecken.
  • Die Anpassbarkeit des Audiodetektors 104 kann durch Speichern von Audiosignalen 130 (wie etwa in der Speichervorrichtung 122 von 1A) während des Betriebs im Kleinleistungsmodus unterstützt werden. Dadurch kann die volle Vorrichtung 100 (1A) im Normalleistungsmodus das genaue Signal bestimmen, das die Triggerung des Audiodetektors 104 (im Kleinleistungsmodus) verursachte. Zum Beispiel kann dieses Signal auf ein Modell der Kleinleistungsschaltung mit variierenden Parametern angewandt werden, um neue Parameter für den Audiodetektor 104 zu bestimmen.
  • Gemäß einer beispielhaften Ausführungsform können Parameter des Audiodetektors 104 konstant gehalten werden, wenn sich die Vorrichtung 100 (1A) im Kleinleistungsmodus befindet. Falls Anpassung erwünscht ist, kann die Vorrichtung 100 in den Normalleistungsmodus gebracht werden. Die Vorrichtung 100 (1A) (im Normalleistungsmodus) kann dann neue Parameter bestimmen, diese in den Audiodetektor 104 laden und zum Kleinleistungsmodus zurückkehren.
  • Gemäß einer anderen beispielhaften Ausführungsform können ausreichend komplizierte Komponenten des Audiodetektors 104 in der Lage sein, angepasst zu werden, während sie im Kleinleistungsmodus bleiben (d. h. ohne wie oben beschrieben in den Normalleistungsmodus umzuschalten). Zum Beispiel kann der Audiodetektor 104 zu in der Lage sein, eine anfängliche Noise-Gate-Schwelle 212 anzupassen, während er im Kleinleistungsmodus bleibt, kann aber in den Normalleistungsmodus umschalten, um ein persistentes Hintergrundgeräusch zu identifizieren und Einstellungen für Komponenten des Audiodetektors 104 zu berechnen, die das Hintergrundgeräusch unterdrücken können.
  • Der Audiodetektor 104 kann in der Lage sein, gemäß anderen Techniken angepasst zu werden. Zum Beispiel kann der Audiodetektor 104 einen neuen Teil der Audiosignale 130 untersuchen, nachdem der Komparator 208 durch den optionalen Pegel-Trigger 206 getriggert wird, um Parameter des Audiodetektors 104 zu justieren.
  • Zum Beispiel kann die Vorrichtung 100 (1A) annehmen, dass der neue Teil der Audiosignale 130 dem Signal, das die Triggerung des Pegel-Triggers 206 verursachte, ähnlich ist. Die Speichervorrichtung 122 (1A) kann ausgelegt sein, 10 ms Audio zu speichern. Diese Audiomenge kann eine ausreichende Länge zwischen der Triggerung durch den Pegel-Trigger 206 aufweisen, bis die nächste Stufe (Komparator 208) bereit ist, dieses Audio zu verarbeiten. Dementsprechend kann der Komparator 208 (zum Beispiel) erwarten, dass ein Sprachsignal dem Trigger folgt. Falls das Sprachsignal nicht detektiert wird, kann der Audiodetektor bestimmen, ob die Audiosignale 130 kontinuierlich über der Noise-Gate-Schwelle 212 liegen (d. h. ob die Noise-Gate-Schwelle 212 falsche Positive produziert). Falls dem so ist, kann die Noise-Gate-Schwelle 212 justiert werden (oder der optionale Filterparameter bzw. die optionalen Filterparameter 210 können justiert werden).
  • Im Allgemeinen können 10 ms Speicherung keine ausreichende Dauer sein, um einen Ganz-Schlüsselwort-Trigger zu speichern. Für ein ganzes Schlüsselwort kann es wünschenswert sein, etwa 1 bis 2 Sekunden der Audiosignale 130 zu speichern. Im Allgemeinen kann es wünschenswert sein, zwischen etwa 10 ms bis etwa 2 Sekunden der Audiosignale 130 zu speichern. Besonders bevorzugt kann es wünschenswert sein, etwa 100 ms der Audiosignale 130 zu speichern. Zum Beispiel kann eine Dauer von 100 ms ausreichend sein, um zu detektieren, dass der Benutzer spricht, aber nicht das spezifische Wort. Eine Dauer von 100 ms kann lang genug sein, um ein Phonem zu identifizieren, oder genauer, dass der Benutzer wahrscheinlich das erste Phonem eines Schlüsselworts spricht. Wenn die Vorrichtung 100 (1A) zum Beispiel während dieser Zeit 8-Bit-Abtastwerte mit 4 kHz aufzeichnet, können nur 800 Byte Speicherung notwendig sein. Mit 1 kB Speicherung kann die Vorrichtung 100 in der Lage sein, die Abtastung beliebiger ADC bis zu 16-Bit-Abtastwerten mit 16 kHz zu vergrößern, während eine nächste Stufe bereit für die Audiodetektion wird.
  • Nunmehr mit Bezug auf 3 ist ein Funktionsblockdiagramm des Komparators 208 gezeigt. Der Komparator 208 kann eine Filterbank 302, einen Breitband-Signaldetektor 304, einen Schmalband-Signaldetektor 306, eine Speichervorrichtung 308 und einen Musterkomparator 310 umfassen.
  • Die Filterbank 302 kann die Audiosignale 130 empfangen und kann eine Vielzahl von Filtern auf die Audiosignale 130 gemäß einem oder mehreren Filterbankparametern 312 (hier als Filterbankparameter 312 bezeichnet) anwenden. Die Filterbank 302 kann beliebige geeignete Filter im analogen Bereich oder im Frequenzbereich umfassen, wie zum Beispiel Tiefpassfilter, Hochpassfilter, Bandpassfilter, Kerbfilter oder eine beliebige Kombination davon.
  • Zum Beispiel kann die Filterbank 302 die Audiosignale 130 in drei Frequenzbänder auffiltern, wie etwa ein Niederfrequenzband, ein Mittelfrequenzband und ein Hochfrequenzband, entsprechend Frequenzen, die mit der Stimme eines Benutzers (interessierendem Audio) assoziiert sind. Im Allgemeinen können der Filterbankparameter bzw. die Filterbankparameter 312 der Filterbank 302 Frequenzen repräsentieren, die eine wahrscheinliche Anwesenheit des vorbestimmten Audiosignals bzw. der vorbestimmten Audiosignale 214 in den Audiosignalen 130 angeben.
  • Der bzw. die Filterbankparameter 312 können Filterparameter für Filterbanken repräsentieren, die einer Anzahl verschiedener vorbestimmter Audiosignale 214 entsprechen. Die Auswahl des Filterbankparameters bzw. der Filterbankparameter 312 kann zum Beispiel durch das Steuersignal 314-1 gesteuert werden. Somit kann die Filterbank 302 justiert werden, um eine Anzahl verschiedener vorbestimmter Audiosignale 214 (wie etwa eine Anzahl verschiedener Stimmen) zu detektieren.
  • Eine Vielzahl gefilterter Signale aus der Filterbank 302 kann dem Breitband-Signaldetektor 304 und dem Schmalband-Signaldetektor 306 zugeführt werden. Der Breitband-Signaldetektor 304 kann eine Variation in den gefilterten Signalen über einen großen Umfang von Frequenzen analysieren, während der Schmalband-Signaldetektor 306 eine Variation in den gefilterten Signalen über einen schmalen Umfang von Frequenzen analysieren kann. Jeder Detektor 304, 306 kann die analysierten Signale mit einer jeweiligen (Breitband- oder Schmalband-)detektionsschwelle vergleichen. Falls die analysierten Signale größer als die jeweilige Detektionsschwelle sind, kann der entsprechende Detektor eine jeweilige Detektionsindikation ausgeben.
  • Zum Beispiel kann Sprache eine Mischung von Konsonanten und Vokalen enthalten. Vokale sind typischerweise ein Signal schmaler Bandbreite (ein kleiner Umfang von Frequenzen), während Konsonanten ein Signal großer Bandbreite (ein großer Umfang von Frequenzen) sind. Jeder Detektor 304, 306 kann gleichzeitig die jeweilige Analyse mit der Zeit ausführen. Dementsprechend können die Ausgaben der Detektoren 304 und 306 mit der Zeit ein Muster von Breitband- und Schmalbandsignalen angeben.
  • Die Detektionsschwellen und andere Parameter des Breitband-Signaldetektors 304 und des Schmalband-Signaldetektors 306 können zum Beispiel durch jeweilige Steuersignale 314-2 und 314-3 justiert werden. Zum Beispiel können die Detektoren 304 und 306 justiert werden, um einer Anzahl verschiedener vorbestimmter Audiosignale 214 zu entsprechen.
  • Obwohl der Breitband-Signaldetektor 304 und der Schmalband-Signaldetektor 306 in 3 gezeigt sind, kann im Allgemeinen eine beliebige geeignete Anzahl von Detektoren verwendet werden, um eine Variation mit der Zeit in den gefilterten Signalen (aus der Filterbank 302) über eines oder mehrere Frequenzbänder zu detektieren. Zum Beispiel kann eine Anzahl von Schmalband-Signaldetektoren 306 eine Variation der Leistung in verschiedenen Frequenzbändern mit der Zeit analysieren.
  • Im Allgemeinen können die Detektoren 304 und 306 die Frequenzanalyse unter Verwendung einer beliebigen geeigneten Technik ausführen, wie zum Beispiel, aber ohne Beschränkung darauf, einer schnellen Fouriertransformation (FFT) im Frequenzbereich oder von Techniken im analogen Bereich. Es können Variationen in spezifischen Frequenzen verwendet werden, um zu identifizieren, ob es wahrscheinlich ist, dass ein vorbestimmtes Audiosignal bzw. vorbestimmte Audiosignale 214 in den Audiosignalen 130 vorliegen.
  • Die Speichervorrichtung 308 kann die Detektionsergebnisse von den Detektoren 304 und 306 über einen Zeitraum als ein detektiertes Muster empfangen und speichern. Die Speichervorrichtung 308 kann zum Beispiel ein Schieberegister, einen Direktzugriffsspeicher (RAM), einen magnetischen Datenträger, einen optischen Datenträger, Flash-Speicher oder eine Festplatte umfassen.
  • Der Musterkomparator 310 kann das in der Speichervorrichtung 308 gespeicherte detektierte Muster empfangen. Das detektierte Muster kann mit einem vorbestimmten Audiosignal bzw. vorbestimmten Audiosignalen 214 verglichen werden. Falls das detektierte Muster im Wesentlichen dem vorbestimmten Audiosignal bzw. den vorbestimmten Audiosignalen 214 ähnlich ist, kann der Musterkomparator 310 die detektierte Anwesenheit des vorbestimmten Audiosignals 214 durch das Detektionssignal 132 angeben.
  • Zum Beispiel kann der Musterkomparator 310 eine Mischung aus Breitband- und Schmalbandsignalen (aus dem detektierten Muster) in mit vorbestimmten gesprochenen Wörtern vereinbaren Zeitintervallen analysieren. Es versteht sich, dass eine sorgfältige Wahl von Schlüsselwörtern (wie etwa mehrsilbigen Schlüsselwörtern) zum Aufwecken der Vorrichtung 100 (1A) die Audiodetektionsgenauigkeit verbessern kann.
  • Parameter des Musterkomparators 310 können zum Beispiel durch das Steuersignal 314-4 justiert werden. Zum Beispiel kann eine Detektionsgenauigkeit des Musterkomparators 310 justiert werden.
  • Wie oben mit Bezug auf 2 besprochen, können eine oder mehrere Komponenten des Komparators 208 zum Beispiel in Reaktion auf Änderungen von Umgebungsgeräuschbedingungen justiert werden. Gemäß einer anderen beispielhaften Ausführungsform können eine oder mehrere Komponenten des Komparators 208 trainiert werden, das vorbestimmte Audiosignal bzw. die vorbestimmten Audiosignale 214 unter verschiedenen Geräuschbedingungen zu detektieren. Gemäß einer weiteren beispielhaften Ausführungsform können eine oder mehrere Komponenten des Komparators 208 in der Lage sein, ein neues vorbestimmtes Audiosignal bzw. neue vorbestimmte Audiosignale 214 und/oder neue Geräuschbedingungen zu lernen. Die Justierung des Komparators 208 wird im Allgemeinen durch jeweilige optionale Steuersignale 314-1, 314-2, 314-3 und 314-4 angegeben. Die Steuersignale 314 können zum Beispiel durch den allgemeinen Prozessor 106 (1A) bereitgestellt werden.
  • Zum Beispiel kann der Audiodetektor 104 (2) ausgelegt werden, neue Schlüsselwörter zu lernen. Ein Benutzer kann gebeten werden, ein neues Schlüsselwort zu wiederholen, so dass der Audiodetektor 104 das neue Schlüsselwort lernen und speichern kann. Wiederholte erfolglose Versuche, das neue Schlüsselwort zu lernen, können bewirken, dass der Komparator 208 (und/oder andere optionale Komponenten des Audiodetektors 104) einen oder mehrere ihrer Parameter justiert.
  • Nunmehr mit Bezug auf 4 ist ein Flussdiagramm eines beispielhaften Verfahrens zum Detektieren eines vorbestimmten Audiosignals gezeigt. Im Schritt 400 wird die Vorrichtung 100 (1A) in einem Kleinleistungsmodus gehalten. Zum Beispiel kann die Leistungssteuerung 112 (1A) den Taktsignalgenerator 114 steuern, den zweiten Takt 120 (einen weniger genauen Takt) zu verwenden, um das Taktsignal 136 Komponenten der Vorrichtung 100, einschließlich des allgemeinen Prozessors 106, zuzuführen.
  • Im optionalen Schritt 402 können die Audiosignale 130 zum Beispiel durch wenigstens ein Filter 204 des Audiodetektors 104 (2) gefiltert werden. Im optionalen Schritt 404 kann ein Pegel der Audiosignale 130 zum Beispiel durch den Pegel-Trigger 206 des Audiodetektors 104 (2) bestimmt werden. Im optionalen Schritt 406 wird bestimmt, ob der Pegel der Audiosignale 130 größer als die Noise-Gate-Schwelle 212 ist, zum Beispiel durch den Pegel-Trigger 206 des Audiodetektors 104 (2).
  • Falls im optionalen Schritt 406 bestimmt wird, dass der Pegel der Audiosignale 130 größer als die Noise-Gate-Schwelle 212 ist, kann der optionale Schritt 406 zum optionalen Schritt 408 voranschreiten. Im optionalen Schritt 408 können eine oder mehrere zusätzliche Komponenten des Audiodetektors 104 (2) heraufgefahren werden. Zum Beispiel kann der Audiodetektor 104 den Komparator 208 (2) herauffahren. Der optionale Schritt 408 kann zum Schritt 410 voranschreiten.
  • Falls im optionalen Schritt 406 bestimmt wird, dass der Pegel der Audiosignale 130 kleiner oder gleich der Noise-Gate-Schwelle 212 ist, kann der optionale Schritt 406 zum Schritt 400 voranschreiten. Eine oder mehrere der optionalen Schritte 402408 können wiederholt werden.
  • Im Schritt 410 werden die Audiosignale 130 analysiert, um eine wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals 214 in den Audiosignalen 130 zum Beispiel durch den Komparator 208 des Audiodetektors 104 (2) zu detektieren. Im Schritt 412 wird bestimmt, ob die Anwesenheit des vorbestimmten Audiosignals 214 zum Beispiel durch den Komparator 208 des Audiodetektors 104 (2) detektiert wird.
  • Falls im Schritt 412 bestimmt wird, dass das vorbestimmte Audiosignal 214 detektiert wird, kann Schritt 412 zum optionalen Schritt 414 voranschreiten. Im optionalen Schritt 414 kann der DSP 110 der Vorrichtung 100 (1A) heraufgefahren werden. Der DSP 110 kann heraufgefahren und mit einer verringerten Taktrate betrieben werden, wie etwa durch den zweiten Takt 120 des Taktsignalgenerators 114 (1A). Der optionale Schritt 414 kann zum optionalen Schritt 416 voranschreiten. Gemäß einer anderen beispielhaften Ausführungsform können bei Detektion des vorbestimmten Audiosignals 214 (Schritt 412) die Audiosignale 130 (zum Beispiel in der Speichervorrichtung 122 (1A)) gespeichert werden oder das vorbestimmte Audiosignal 214 kann durch den Benutzer wiederholt werden (um zu bestätigen, dass das vorbestimmte Audiosignal 214 tatsächlich angegeben wurde).
  • Falls im Schritt 412 bestimmt wird, dass das vorbestimmte Audiosignal 214 nicht detektiert wird, kann Schritt 412 zum Schritt 400 voranschreiten.
  • Im optionalen Schritt 416 werden die Audiosignale 130 analysiert, um die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals 214 in den Audiosignalen 130 zum Beispiel durch den DSP 110 mit einer verringerten Taktrate (1A) zu detektieren. Im optionalen Schritt 418 wird bestimmt, ob das vorbestimmte Audiosignal 214 zum Beispiel durch den DSP 110 der Vorrichtung 100 (1A) detektiert wird.
  • Falls im optionalen Schritt 418 bestimmt wird, dass das vorbestimmte Audiosignal 214 detektiert wird, kann der optionale Schritt 418 zum optionalen Schritt 420 voranschreiten. Im optionalen Schritt 420 kann der DSP 110 der Vorrichtung 100 (1A) heraufgefahren und mit einer höheren Taktrate, wie etwa durch den ersten Takt 118 des Taktsignalgenerators 114, betrieben werden. Der optionale Schritt 420 kann zum optionalen Schritt 422 voranschreiten.
  • Falls im optionalen Schritt 418 bestimmt wird, dass das vorbestimmte Audiosignal 214 nicht detektiert wird, kann der optionale Schritt 418 zum Schritt 400 voranschreiten.
  • Im optionalen Schritt 422 werden die Audiosignale 130 analysiert, um die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals 214 in den Audiosignalen 130 zum Beispiel durch den DSP 110 mit der höheren Taktrate (1A) zu detektieren. Im optionalen Schritt 424 wird bestimmt, ob das vorbestimmte Audiosignal 214 zum Beispiel durch den DSP 110 der Vorrichtung 100 (1A) detektiert wird.
  • Falls im optionalen Schritt 424 bestimmt wird, dass das vorbestimmte Audiosignal 214 detektiert wird, kann der optionale Schritt 424 zum Schritt 426 voranschreiten.
  • Im Schritt 426 kann die Vorrichtung 100 in den Normalleistungsmodus umgeschaltet werden. Zum Beispiel kann die Leistungssteuerung 112 (1A) den Taktsignalgenerator 114 steuern, einen ersten Takt 118 (einen genaueren Takt) zu verwenden, um Komponenten der Vorrichtung 100, einschließlich des allgemeinen Prozessors 106, das Taktsignal 136 zuzuführen.
  • Falls im optionalen Schritt 424 bestimmt wird, dass das vorbestimmte Audiosignal 214 nicht detektiert wird, kann der optionale Schritt 424 zum Schritt 400 voranschreiten.
  • Die Schritte 400424 können kontinuierlich periodisch wiederholt werden, bis das vorbestimmte Audiosignal 214 detektiert ist. Im Allgemeinen können die Schritte 410412 (fortschrittlichere Audioverarbeitungsfähigkeit) kombiniert mit den optionalen Schritten 402408 (verringerte Audioverarbeitungsfähigkeit) und/oder den optionalen Schritten 414424 (fortschrittlichste Audioverarbeitungsfähigkeit, wie etwa Spracherkennungsverarbeitung mit HMM) verwendet werden, um einen Kompromiss zwischen Stromverbrauch und Audioverarbeitungsfähigkeit zu finden.
  • Obwohl die Erfindung im Hinblick auf Vorrichtungen und Verfahren zum Detektieren der wahrscheinlichen Anwesenheit eines vorbestimmten Audiosignals beschrieben wurde, wird in Betracht gezogen, dass ein oder mehrere Produkte in Software auf Mikroprozessoren/Vielzweckcomputern (nicht gezeigt) implementiert werden können. Bei dieser Ausführungsform können eine oder mehrere der Funktionen der verschiedenen Komponenten in Software implementiert werden, die einen Vielzweckcomputer steuert. Diese Software kann auf einem nichtflüchtigen computerlesbaren Medium, zum Beispiel RAM, einem magnetischen oder optischen Datenträger oder einer Speicherkarte realisiert werden.
  • Obwohl die Erfindung hier mit Bezug auf spezifische Ausführungsformen dargestellt und beschrieben wird, soll die Erfindung nicht auf die gezeigten Einzelheiten beschränkt werden. Stattdessen können verschiedene Modifikationen der Einzelheiten innerhalb des Schutzumfangs und Äquivalenzbereichs der Ansprüche und ohne von der Erfindung abzuweichen, vorgenommen werden.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 2011/0065413 [0046]

Claims (27)

  1. Verfahren zum Detektieren eines vorbestimmten Audiosignals in Audiosignalen einer Vorrichtung, wobei die Vorrichtung einen Prozessor umfasst, wobei das Verfahren die Schritte umfasst: Steuern einer dem Prozessor zugeführten Taktrate, um die Vorrichtung in einem Kleinleistungsmodus zu betreiben, der einen relativ niedrigen Stromverbrauch aufweist; Detektieren einer wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals in den Audiosignalen im Kleinleistungsmodus; und Umschalten der Vorrichtung vom Kleinleistungsmodus in einen Normalleistungsmodus in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals durch Justieren der dem Prozessor zugeführten Taktrate, wobei der Normalleistungsmodus einen relativ hohen Stromverbrauch aufweist.
  2. Verfahren nach Anspruch 1, wobei das vorbestimmte Audiosignal ein Sprachsignal oder ein vorbestimmtes Nicht-Sprach-Audiosignal umfasst.
  3. Verfahren nach Anspruch 1, wobei die Taktrate eine erste Taktrate, die dem Kleinleistungsmodus entspricht, und eine zweite Taktrate, die dem Normalleistungsmodus entspricht, umfasst, wobei die zweite Taktrate eine höhere Genauigkeit als die erste Taktrate aufweist.
  4. Verfahren nach Anspruch 1, wobei das Verfahren ferner ein Speichern wenigstens eines Teils der Audiosignale in Reaktion auf das Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals umfasst.
  5. Verfahren nach Anspruch 1, wobei das Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals mit einer ersten Detektionsgenauigkeit ausgeführt wird, wobei das Verfahren ferner in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals umfasst: weiteres Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals mit einer zweiten Detektionsgenauigkeit, die höher als die erste Detektionsgenauigkeit ist, wobei die Vorrichtung in Reaktion auf die weitere detektierte Anwesenheit des vorbestimmten Audiosignals umgeschaltet wird.
  6. Verfahren nach Anspruch 5, wobei das weitere Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals im Kleinleistungsmodus ausgeführt wird.
  7. Verfahren nach Anspruch 5, wobei das weitere Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals mit einer höheren Taktrate als der Taktrate des Kleinleistungsmodus ausgeführt wird.
  8. Verfahren nach Anspruch 1, wobei das Verfahren ferner vor dem Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals das Anwenden wenigstens eines Filters, das eine vorbestimmte Filterkurve aufweist, auf die Audiosignale umfasst.
  9. Verfahren nach Anspruch 1, wobei das Verfahren vor dem Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals ferner umfasst: Bestimmen eines Pegels der Audiosignale; Vergleichen des Pegels der Audiosignale mit einer vorbestimmten Schwelle; und wenn der Pegel der Audiosignale größer als die vorbestimmte Schwelle ist, Ausführen der Detektion der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals.
  10. Verfahren nach Anspruch 1, wobei das Detektieren der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals umfasst: Detektieren eines Musters in den Audiosignalen; und Vergleichen des detektierten Musters mit dem vorbestimmten Audiosignal.
  11. Verfahren nach Anspruch 10, wobei das Detektieren des Musters in den Audiosignalen das Überwachen einer Variation in wenigstens einer vorbestimmten Frequenz der Audiosignale mit der Zeit umfasst, wobei die wenigstens eine vorbestimmte Frequenz mit dem vorbestimmten Audiosignal assoziiert ist.
  12. Verfahren nach Anspruch 1, wobei das Verfahren ferner umfasst: Bestimmen einer Detektionsgenauigkeit eines Detektionsergebnisses des Detektierens der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals; und Justieren wenigstens eines Parameters zum Ausführen des Detektierens der wahrscheinlichen Anwesenheit des vorbestimmten Audiosignals in Reaktion auf die Detektionsgenauigkeit.
  13. Vorrichtung, umfassend: einen mit einem Taktsignalgenerator gekoppelten Prozessor; eine Leistungssteuerung, die ausgelegt ist, eine dem Prozessor durch den Taktsignalgenerator zugeführte Taktrate zu steuern, um die Vorrichtung zu steuern, in einem Kleinleistungsmodus, der einen relativ niedrigen Stromverbrauch aufweist, oder in einem Normalleistungsmodus, der einen relativ hohen Stromverbrauch aufweist, zu arbeiten; und einen mit der Leistungssteuerung gekoppelten Audiodetektor, wobei der Audiodetektor ausgelegt ist, Audiosignale zu empfangen und im Kleinleistungsmodus eine wahrscheinliche Anwesenheit eines vorbestimmten Audiosignals in den Audiosignalen zu detektieren, wobei die Leistungssteuerung die Vorrichtung steuert, in Reaktion auf die detektierte Anwesenheit des vorbestimmten Audiosignals durch den Audiodetektor vom Kleinleistungsmodus in den Normalleistungsmodus umzuschalten.
  14. Vorrichtung nach Anspruch 13, wobei das vorbestimmte Audiosignal ein Sprachsignal oder ein vorbestimmtes Nicht-Sprach-Audiosignal umfasst.
  15. Vorrichtung nach Anspruch 13, wobei die Taktrate eine erste Taktrate, die dem Kleinleistungsmodus entspricht, und eine zweite Taktrate, die dem Normalleistungsmodus entspricht, umfasst, wobei die zweite Taktrate eine höhere Genauigkeit als die erste Taktrate aufweist.
  16. Vorrichtung nach Anspruch 13, die ferner eine Speichervorrichtung zum Speichern wenigstens eines Teils der Audiosignale umfasst.
  17. Vorrichtung nach Anspruch 13, wobei der Audiodetektor ausgelegt ist, die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals mit zwei oder mehr verschiedenen Detektionsgenauigkeiten zu detektieren.
  18. Vorrichtung nach Anspruch 13, wobei der Audiodetektor in dem Prozessor enthalten ist.
  19. Vorrichtung nach Anspruch 13, wobei der Audiodetektor vom Prozessor getrennt ist.
  20. Vorrichtung nach Anspruch 13, die ferner einen mit dem Taktsignalgenerator gekoppelten digitalen Signalprozessor (DSP) umfasst, wobei der DSP ausgelegt ist, die wahrscheinliche Anwesenheit des vorbestimmten Audiosignals weiter mit einer höheren Detektionsgenauigkeit als der Audiodetektor zu detektieren.
  21. Vorrichtung nach Anspruch 13, wobei der Audiodetektor wenigstens ein Filter umfasst, das eine vorbestimmte Filterkurve aufweist, um die Audiosignale zu filtern.
  22. Vorrichtung nach Anspruch 13, wobei der Audiodetektor einen Pegel-Trigger umfasst, um einen Pegel der Audiosignale mit einer vorbestimmten Schwelle zu vergleichen.
  23. Vorrichtung nach Anspruch 13, wobei der Audiodetektor einen Komparator umfasst, der ausgelegt ist, ein Muster in den Audiosignalen zu detektieren und das detektierte Muster mit dem vorbestimmten Audiosignal zu vergleichen.
  24. Vorrichtung nach Anspruch 23, wobei der Komparator ausgelegt ist, eine Variation in wenigstens einer vorbestimmten Frequenz der Audiosignale mit der Zeit zu überwachen, wobei die wenigstens eine vorbestimmte Frequenz mit dem vorbestimmten Audiosignal assoziiert ist.
  25. Vorrichtung nach Anspruch 13, die ferner ein Mikrofon umfasst, das ausgelegt ist, die Audiosignale zu erfassen.
  26. Vorrichtung nach Anspruch 13, wobei die Vorrichtung ausgelegt ist, wenigstens einen Parameter des Audiodetektors zu justieren.
  27. Vorrichtung nach Anspruch 26, wobei der wenigstens eine Parameter in Reaktion auf eine Detektionsgenauigkeit eines Detektionsergebnisses des Audiodetektors und/oder eine Geräuschbedingung und/oder ein neues vorbestimmtes Audiosignal justiert wird.
DE102013003273A 2012-02-27 2013-02-27 Kleinleistungs-Audiodetektion Withdrawn DE102013003273A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261603717P 2012-02-27 2012-02-27
US61/603,717 2012-02-27

Publications (1)

Publication Number Publication Date
DE102013003273A1 true DE102013003273A1 (de) 2013-08-29

Family

ID=48092201

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102013003273A Withdrawn DE102013003273A1 (de) 2012-02-27 2013-02-27 Kleinleistungs-Audiodetektion

Country Status (3)

Country Link
US (1) US9838810B2 (de)
DE (1) DE102013003273A1 (de)
GB (1) GB2501367B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014216654A1 (de) * 2014-08-21 2016-02-25 Robert Bosch Gmbh Signalverarbeitungsschaltung für ein digitales Mikrofon
DE112019001297B4 (de) 2018-03-12 2023-02-02 Cypress Semiconductor Corporation Systeme und verfahren zur erfassung von geräuschen zur mustererkennungsverarbeitung

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873770B2 (en) * 2012-10-11 2014-10-28 Cochlear Limited Audio processing pipeline for auditory prosthesis having a common, and two or more stimulator-specific, frequency-analysis stages
US10395651B2 (en) * 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9349386B2 (en) * 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9467785B2 (en) 2013-03-28 2016-10-11 Knowles Electronics, Llc MEMS apparatus with increased back volume
US9503814B2 (en) 2013-04-10 2016-11-22 Knowles Electronics, Llc Differential outputs in multiple motor MEMS devices
US20140343949A1 (en) * 2013-05-17 2014-11-20 Fortemedia, Inc. Smart microphone device
US10028054B2 (en) 2013-10-21 2018-07-17 Knowles Electronics, Llc Apparatus and method for frequency detection
US10020008B2 (en) 2013-05-23 2018-07-10 Knowles Electronics, Llc Microphone and corresponding digital interface
US9633655B1 (en) 2013-05-23 2017-04-25 Knowles Electronics, Llc Voice sensing and keyword analysis
US9711166B2 (en) 2013-05-23 2017-07-18 Knowles Electronics, Llc Decimation synchronization in a microphone
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
EP3575924B1 (de) 2013-05-23 2022-10-19 Knowles Electronics, LLC Vad-erkennungsmikrofon
GB2515526B (en) * 2013-06-26 2017-11-08 Cirrus Logic Int Semiconductor Ltd Analog-to-digital convertor
GB2553472B (en) * 2013-06-26 2018-05-02 Cirrus Logic Int Semiconductor Ltd Analog-to-digital converter
US9747899B2 (en) * 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
US10070211B2 (en) * 2013-06-28 2018-09-04 Kopin Corporation Digital voice processing method and system for headset computer
US9386370B2 (en) 2013-09-04 2016-07-05 Knowles Electronics, Llc Slew rate control apparatus for digital microphones
US9502028B2 (en) 2013-10-18 2016-11-22 Knowles Electronics, Llc Acoustic activity detection apparatus and method
US9147397B2 (en) 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
US10079019B2 (en) 2013-11-12 2018-09-18 Apple Inc. Always-on audio control for mobile device
KR101483669B1 (ko) * 2013-11-20 2015-01-16 주식회사 사운들리 저전력 음파 수신 방법 및 이를 이용한 모바일 기기
US20150160707A1 (en) * 2013-12-06 2015-06-11 Htc Corporation Portable electronic device
US10720153B2 (en) * 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
EP3084760A4 (de) * 2013-12-20 2017-08-16 Intel Corporation Übergang von einem niedrigleistungs-dauereinschaltmodus zu einem hochleistungs-spracherkennungsmodus
US9460735B2 (en) * 2013-12-28 2016-10-04 Intel Corporation Intelligent ancillary electronic device
US9652532B2 (en) * 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
US9406313B2 (en) * 2014-03-21 2016-08-02 Intel Corporation Adaptive microphone sampling rate techniques
EP3126929B1 (de) * 2014-03-31 2020-11-18 Intel Corporation Ortsbewusstes leistungsverwaltungsschema für always-on-always-listen-spracherkennungssystem
US9998850B2 (en) * 2014-07-02 2018-06-12 Sonetyics Holdings, Inc. Multiple communication mode headset
US9153106B1 (en) * 2014-07-10 2015-10-06 Google Inc. Automatically activated visual indicators on computing device
US9831844B2 (en) 2014-09-19 2017-11-28 Knowles Electronics, Llc Digital microphone with adjustable gain control
US9712915B2 (en) 2014-11-25 2017-07-18 Knowles Electronics, Llc Reference microphone for non-linear and time variant echo cancellation
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10575117B2 (en) 2014-12-08 2020-02-25 Harman International Industries, Incorporated Directional sound modification
FR3030177B1 (fr) * 2014-12-16 2016-12-30 Stmicroelectronics Rousset Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US9830080B2 (en) 2015-01-21 2017-11-28 Knowles Electronics, Llc Low power voice trigger for acoustic apparatus and method
US9653079B2 (en) * 2015-02-12 2017-05-16 Apple Inc. Clock switching in always-on component
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
KR102346302B1 (ko) * 2015-02-16 2022-01-03 삼성전자 주식회사 전자 장치 및 음성 인식 기능 운용 방법
US9866938B2 (en) 2015-02-19 2018-01-09 Knowles Electronics, Llc Interface for microphone-to-microphone communications
US9799349B2 (en) * 2015-04-24 2017-10-24 Cirrus Logic, Inc. Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems
CN107534818B (zh) 2015-05-14 2020-06-23 美商楼氏电子有限公司 麦克风
US10291973B2 (en) 2015-05-14 2019-05-14 Knowles Electronics, Llc Sensor device with ingress protection
EP3096534A1 (de) * 2015-05-22 2016-11-23 Nxp B.V. Mikrofonregler zur energieeinsparung
US9478234B1 (en) 2015-07-13 2016-10-25 Knowles Electronics, Llc Microphone apparatus and method with catch-up buffer
US10045104B2 (en) 2015-08-24 2018-08-07 Knowles Electronics, Llc Audio calibration using a microphone
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105307097A (zh) * 2015-10-09 2016-02-03 湖南康通电子科技有限公司 音频功放在线监测方法及其系统
US10779099B2 (en) * 2015-11-23 2020-09-15 Essence Smartcare Ltd. Analog and digital microphone
US9894437B2 (en) * 2016-02-09 2018-02-13 Knowles Electronics, Llc Microphone assembly with pulse density modulated signal
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US10715922B2 (en) * 2016-02-29 2020-07-14 Vesper Technologies Inc. Piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10678494B2 (en) 2016-06-27 2020-06-09 Qualcomm Incorporated Controlling data streams in universal serial bus (USB) systems
US10628172B2 (en) * 2016-06-27 2020-04-21 Qualcomm Incorporated Systems and methods for using distributed universal serial bus (USB) host drivers
US10499150B2 (en) 2016-07-05 2019-12-03 Knowles Electronics, Llc Microphone assembly with digital feedback loop
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10257616B2 (en) 2016-07-22 2019-04-09 Knowles Electronics, Llc Digital microphone assembly with improved frequency response and noise characteristics
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
CN110024281B (zh) 2016-10-28 2024-05-07 三星电子株式会社 换能器组件和方法
DE112017006684T5 (de) 2016-12-30 2019-10-17 Knowles Electronics, Llc Mikrofonanordnung mit authentifizierung
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US11025356B2 (en) 2017-09-08 2021-06-01 Knowles Electronics, Llc Clock synchronization in a master-slave communication system
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11061642B2 (en) 2017-09-29 2021-07-13 Knowles Electronics, Llc Multi-core audio processor with flexible memory allocation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US11341987B2 (en) * 2018-04-19 2022-05-24 Semiconductor Components Industries, Llc Computationally efficient speech classifier and related methods
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
WO2020055923A1 (en) 2018-09-11 2020-03-19 Knowles Electronics, Llc Digital microphone with reduced processing noise
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US10908880B2 (en) 2018-10-19 2021-02-02 Knowles Electronics, Llc Audio signal circuit with in-place bit-reversal
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
CN109545192B (zh) * 2018-12-18 2022-03-08 百度在线网络技术(北京)有限公司 用于生成模型的方法和装置
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
GB201821048D0 (en) 2018-12-21 2019-02-06 Sae Hearing As System for monitoring sound
KR20210141549A (ko) 2019-03-14 2021-11-23 베스퍼 테크놀로지스 인코포레이티드 상이한 전력 소비 수준에서 결정된 디지털 출력을 갖는 마이크로폰
CN114175681A (zh) * 2019-03-14 2022-03-11 韦斯伯技术公司 用于声学刺激检测的具有自适应阈值的压电mems装置
CN113424256B (zh) 2019-04-01 2024-06-18 谷歌有限责任公司 在可再充电设备上的播送请求和/或用户输入的自适应管理
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US20210005181A1 (en) * 2019-06-10 2021-01-07 Knowles Electronics, Llc Audible keyword detection and method
CN110220589A (zh) * 2019-06-20 2019-09-10 华电重工股份有限公司 一种噪音在线检测装置及系统
US11726105B2 (en) 2019-06-26 2023-08-15 Qualcomm Incorporated Piezoelectric accelerometer with wake function
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
WO2022047808A1 (zh) * 2020-09-07 2022-03-10 华为技术有限公司 一种图像处理装置、电子设备及图像处理方法
CN112423195B (zh) * 2020-11-03 2021-11-23 广东公信智能会议股份有限公司 音频传输的自检装置及其方法
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
CN216145422U (zh) * 2021-01-13 2022-03-29 神盾股份有限公司 语音助理系统
CN114828170B (zh) * 2021-01-27 2024-07-16 华为技术有限公司 一种提升通信装置续航时间的方法及装置
WO2022193056A1 (zh) * 2021-03-15 2022-09-22 华为技术有限公司 一种媒体处理装置及方法
CN113726467B (zh) * 2021-07-29 2024-06-14 黎兴荣 电子产品数据传输方法、系统、存储介质及程序产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110065413A1 (en) 2008-01-28 2011-03-17 Cambridge Silicon Radio Limited Power-Saving Receiver

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
AU3408995A (en) 1995-08-21 1997-03-12 Trevor S. Mathurin Audio controlled and activated wristwatch memory aid device
JP2003202888A (ja) 2002-01-07 2003-07-18 Toshiba Corp 無線通信機能付きヘッドセットおよびこれを用いた音声処理システム
GB2391673B (en) 2002-08-06 2005-01-19 Motorola Inc Wireless audio monitor
US7151838B2 (en) * 2002-08-21 2006-12-19 Galler Bernard A Digital hearing aid battery conservation method and apparatus
US20090110206A1 (en) * 2003-01-09 2009-04-30 Aerielle Technologies, Inc. Method and apparatus for sensing a signal absence of audio and automatically entering low power mode
US7418392B1 (en) * 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
US20050141741A1 (en) * 2003-12-30 2005-06-30 Van Oerle Gerard Method to optimize energy consumption in a hearing device as well as a hearing device
US8194865B2 (en) * 2007-02-22 2012-06-05 Personics Holdings Inc. Method and device for sound detection and audio control
WO2008119866A1 (en) 2007-03-30 2008-10-09 Savox Communications Oy Ab (Ltd) A radio communication device
US8498678B2 (en) 2007-07-10 2013-07-30 Texas Instruments Incorporated System and method for reducing power consumption in a wireless device
GB2458499A (en) 2008-03-20 2009-09-23 Cambridge Silicon Radio Ltd Sharing access to a data store by a host processor and a signal processor in a mobile phone
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US8804988B2 (en) * 2010-04-13 2014-08-12 Starkey Laboratories, Inc. Control of low power or standby modes of a hearing assistance device
KR101192813B1 (ko) 2010-12-14 2012-10-26 (주)이엔엠시스템 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110065413A1 (en) 2008-01-28 2011-03-17 Cambridge Silicon Radio Limited Power-Saving Receiver

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014216654A1 (de) * 2014-08-21 2016-02-25 Robert Bosch Gmbh Signalverarbeitungsschaltung für ein digitales Mikrofon
DE112019001297B4 (de) 2018-03-12 2023-02-02 Cypress Semiconductor Corporation Systeme und verfahren zur erfassung von geräuschen zur mustererkennungsverarbeitung

Also Published As

Publication number Publication date
US9838810B2 (en) 2017-12-05
US20130223635A1 (en) 2013-08-29
GB2501367B (en) 2018-01-03
GB2501367A (en) 2013-10-23
GB201303502D0 (en) 2013-04-10

Similar Documents

Publication Publication Date Title
DE102013003273A1 (de) Kleinleistungs-Audiodetektion
DE102018010463B3 (de) Tragbare Vorrichtung, computerlesbares Speicherungsmedium, Verfahren und Einrichtung für energieeffiziente und leistungsarme verteilte automatische Spracherkennung
DE112017006411T5 (de) Ständig aufnahmebereite sprachbefehlserkennung und -erfassung mit niedriger leistungsaufnahme
DE112019001297B4 (de) Systeme und verfahren zur erfassung von geräuschen zur mustererkennungsverarbeitung
DE69926851T2 (de) Verfahren und Vorrichtung zur Sprachaktivitätsdetektion
DE69523531T2 (de) Verfahren und Vorrichtung zur Analyse von Audioeingabevorgängen in einem Spracherkennungssystem
DE112018006101T5 (de) Dynamische Anmeldung einer benutzerdefinierten Aufweck-Schlüsselphrase für ein sprachfähiges Computersystem
DE112014004951T5 (de) VAD-Detektions-Vorrichtung und Verfahren zum Betreiben derselben
DE102015203372A1 (de) Begriffsklärung dynamischer befehle
DE69918635T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE60212725T2 (de) Verfahren zur automatischen spracherkennung
EP3386215B1 (de) Verfahren zum betrieb einer hörvorrichtung und hörvorrichtung
DE102016125104A1 (de) Dynamisches umschalten von akustischen modellen zur verbesserung der erkennung verrauschter sprachsignale
DE102017129484A1 (de) Spracherkennung ohne unterbrechen der audiowiedergabe
DE102012214601B4 (de) Verfahren zum Detektieren der Anwesenheit einer oder mehrerer Anwenderidentifikationsvorrichtungen
DE102019131228A1 (de) Eingabesteuerung unter verwendung von finderabdrücken
DE69922769T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE102017213249A1 (de) Verfahren und System zum Erzeugen einer auditiven Meldung in einem Innenraum eines Fahrzeugs
DE69130294T2 (de) Vorrichtung zur Verarbeitung eines Sprachsignals
DE102018132160A1 (de) System und verfahren zum verstehen von standardsprache und dialekten
DE102023102037A1 (de) Auf mehreren Indizien basierende Sprachaktivitätsdetektion (VAD)
DE112018001230B4 (de) Elektronisches Musikinstrument und Verfahren zum automatischen Abschalten eines elektronischen Musikinstruments
DE102006045719B4 (de) Medizinisches System mit einer Spracheingabevorrichtung
DE102013218291A1 (de) Verfahren zur automatischen Lautstärkeregelung für Lieblingssongs bei der Wiedergabe
DE19705471C2 (de) Verfahren und Schaltungsanordnung zur Spracherkennung und zur Sprachsteuerung von Vorrichtungen

Legal Events

Date Code Title Description
R081 Change of applicant/patentee

Owner name: QUALCOMM TECHNOLOGIES INTERNATIONAL, LTD., GB

Free format text: FORMER OWNER: CAMBRIDGE SILICON RADIO LIMITED, CAMBRIDGE, GB

R082 Change of representative

Representative=s name: MAUCHER JENKINS, DE

Representative=s name: OLSWANG GERMANY LLP, DE

Representative=s name: MAUCHER JENKINS PATENTANWAELTE & RECHTSANWAELT, DE

R082 Change of representative

Representative=s name: MAUCHER JENKINS, DE

Representative=s name: MAUCHER JENKINS PATENTANWAELTE & RECHTSANWAELT, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee