DE112014005087B4 - Mikrofon-Einrichtung und Verfahren in einem Mikrofon - Google Patents

Mikrofon-Einrichtung und Verfahren in einem Mikrofon Download PDF

Info

Publication number
DE112014005087B4
DE112014005087B4 DE112014005087.3T DE112014005087T DE112014005087B4 DE 112014005087 B4 DE112014005087 B4 DE 112014005087B4 DE 112014005087 T DE112014005087 T DE 112014005087T DE 112014005087 B4 DE112014005087 B4 DE 112014005087B4
Authority
DE
Germany
Prior art keywords
microphone
device interface
external device
data
clock signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112014005087.3T
Other languages
English (en)
Other versions
DE112014005087T5 (de
Inventor
Weiwen Dai
Robert A. Popper
Dibyendu Nandy
Yang Li
Sarmad Qutub
Claus Erdmann Furst
Henrik Thomsen
Thibault Kassir
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Knowles Electronics LLC
Original Assignee
Knowles Electronics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/282,101 external-priority patent/US9712923B2/en
Priority claimed from US14/533,690 external-priority patent/US9711166B2/en
Priority claimed from US14/533,652 external-priority patent/US10020008B2/en
Priority claimed from US14/533,674 external-priority patent/US9111548B2/en
Application filed by Knowles Electronics LLC filed Critical Knowles Electronics LLC
Publication of DE112014005087T5 publication Critical patent/DE112014005087T5/de
Application granted granted Critical
Publication of DE112014005087B4 publication Critical patent/DE112014005087B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Abstract

Verfahren in einem Mikrofon (100), wobei das Verfahren umfasst:Erzeugen analoger Signale unter Verwendung eines akustischen Sensors (102) des Mikrofons (100);Umwandlung der analogen Signale zu digitalisierten Daten unter Verwendung eines Analog-zu-Digital-Wandlers (106) des Mikrofons (100);Ermitteln innerhalb der digitalisierten Daten, ob akustische Aktivität vorliegt, unter Verwendung eines Sprach-Aktivitäts-Detektors (108) des Mikrofons (100);nach Detektion akustischer Aktivität, Bereitstellen eines Hinweises auf akustische Aktivität bei einem äußeren Vorrichtungs-Interface (119) des Mikrofons (100), wobei das äußere Vorrichtungs-Interface (119) standardisiert ist zur Kompatibilität mit einer Mehrzahl von Vorrichtungen unterschiedlicher Hersteller;vor Detektieren von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem ersten Modus durch Takten mindestens eines Teils des Mikrofons (100) mit einem inneren Takt-Signal, basierend auf einem lokalen Oszillator des Mikrofons (100) während des Ermittelns, ob akustische Aktivität vorliegt;nach Detektieren von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem zweiten Modus durch Bereitstellen digitalisierter Daten bei dem äußeren Vorrichtungs-Interface (119), wobei digitalisierte Daten bei dem äußeren Vorrichtungs-Interface (119) in dem ersten Modus nicht vorgesehen sind;Bereitstellen digitaler Daten auf dem äußeren Vorrichtungs-Interface (119) des Mikrofons (100) für einen ausgewiesenen Zeitraum nach Ermitteln, dass Sprach-Aktivität nicht mehr vorliegt, vor Abbruch des Bereitstellens digitaler Daten auf dem äußeren Vorrichtungs-Interface (119).

Description

  • Diese Anmeldung beansprucht gemäß 35 U.S. C. § 119 (e) die Priorität der Provisorischen US-Patentanmeldung Nr. 61/901,832 mit dem Titel „Microphone and Corresponding Digital Interface“, eingereicht am 8. November 2013, deren Inhalt durch diesen Hinweis in seiner Gesamtheit in die vorliegende Beschreibung aufgenommen wird. Diese Anmeldung ist eine Continuation-in-part-Anmeldung der US-Anmeldung Nr. 14/282,101 mit dem Titel „VAD Detection Microphone and Method of Operating the Same“, eingereicht am 20. Mai 2014, welche die Priorität der Provisorischen US-Patentanmeldung Nr. 61/826,587 mit dem Titel „VAD Detection Microphone and Method of Operating the Same“, eingereicht am 23. Mai 2013, beansprucht, deren Inhalt durch diesen Hinweis in seiner Gesamtheit in die vorliegende Beschreibung aufgenommen wird.
  • Diese Anmeldung betrifft akustische Aktivitäts-Detektions (AAD)-Lösungsansätze und Sprach-Aktivitäts-Detektions (VAD)-Lösungsansätze und deren Kopplung mit anderen Arten von elektronischen Vorrichtungen.
  • Sprach-Aktivitäts-Detektions (VAD)-Lösungsansätze sind wichtige Komponenten von Sprach-Erkennungs-Software und -Hardware. Zum Beispiel tastet Erkennungs-Software das Audio-Signal von einem Mikrofon konstant auf der Suche nach Sprach-Aktivität gewöhnlich mit einem MIPS-intensiven Algorithmus ab. Da der Algorithmus ständig läuft, ist die bei diesem Sprach-Detektions-Lösungsansatz verwendete Leistung wesentlich.
  • Mikrofone sind auch in mobilen Vorrichtungs-Produkten, wie Mobiltelefonen, angeordnet. Diese Verbraucher-Vorrichtungen haben ein standardisiertes Interface. Wenn das Mikrofon mit diesem Interface nicht kompatibel ist, kann es nicht mit dem mobilen Vorrichtungs-Produkt verwendet werden.
  • Viele mobile Vorrichtungs-Produkte weisen Sprach-Erkennung auf, die in der mobilen Vorrichtung enthalten ist. Jedoch ist der Leistungsverbrauch bei Nutzung der Algorithmen für die Batterie bzw. den Akku hoch, so dass das Merkmal oft nur eingeschaltet wird, nachdem der Anwender einen Knopf drückt oder die Vorrichtung aufwacht. Um dieses Merkmal jederzeit zu ermöglichen, muss der Leistungs-Verbrauch der Gesamt-Lösung ausreichend gering sein, damit ein minimaler Einfluss auf die Gesamtstandzeit der Batterie der Vorrichtung ausgeübt wird. Wie erwähnt, gibt es dies bei existierenden Vorrichtungen nicht.
  • Auf Grund der vorstehend erwähnten Probleme ist bei einigen Anwendern mit den vorliegenden Lösungsansätzen Unzufriedenheit aufgekommen.
  • In der WO 2014 / 189 931 A1 ist ein Mikrofon beschrieben, bei welchem unter Verwendung eines akustischen Sensors analoge Signale erzeugt werden, die zu digitalisierten Daten umgewandelt werden, basierend auf welchen ermittelt wird, ob eine akustische Aktivität vorliegt.
  • In der US 2013 / 0 029 684 A1 ist ein Sensornetzwerksystem beschrieben, welches mehrere Mikrofone aufweist, um Sprachdaten mit hoher Qualität aufnehmen zu können.
  • Gemäß der Erfindung werden Verfahren in einem Mikrofon, und eine Mikrofon-Einrichtung gemäß den Gegenständen der unabhängigen Ansprüche zur Verfügung gestellt. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
  • Figurenliste
  • Für ein besseres Verstehen der Offenbarung wird auf die nachstehende Beschreibung im Einzelnen und die beigefügten Zeichnungen verwiesen, wobei:
    • 1A ein Block-Schema von einem akustischen System mit akustischer Aktivitäts-Detektion (AAD) gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung umfasst;
    • 1B ein Block-Schema von einem anderen akustischen System mit akustischer Aktivitäts-Detektion (AAD) gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung umfasst;
    • 2 ein Timing- bzw. Taktungs-Schema umfasst, das einen Aspekt des Vorgangs von dem System von 1 gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung zeigt;
    • 3 ein Timing- bzw. Taktungs-Schema umfasst, das einen anderen Aspekt des Vorgangs von dem System von 1 gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung zeigt;
    • 4 ein Zustands-Übergangs-Schema umfasst, das Zustände des Vorgangs von dem System von 1 gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung zeigt;
    • 5 eine Tabelle umfasst, die die Bedingungen für Übergänge zwischen den in dem Zustands-Schema von 4 gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung gezeigten Zustände zeigt;
    • 6 ein Block-Schema von einer Multi-Mikrofon-Anordnung gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung umfasst;
    • 7 ein Block-Schema von einem Beispiel eines Takt-Detektors gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung umfasst.
  • Der Durchschnittsfachmann wird erkennen, dass Elemente in den Figuren bezüglich Einfachheit und Deutlichkeit veranschaulicht worden sind. Es wird zudem Wert darauf gelegt, dass bestimmte Handlungen und/oder Schritte in einer bestimmten Reihenfolge ihres Auftretens beschrieben und abgebildet sein können, wobei der Durchschnittsfachmann verstehen wird, dass eine solche Genauigkeit bezüglich der Reihenfolge nicht unbedingt erforderlich ist. Es ist auch selbstverständlich, dass die hierin verwendeten Begriffe und Ausdrücke die übliche Bedeutung aufweisen, die solchen Begriffen und Ausdrücken bezüglich ihrer entsprechenden jeweiligen Untersuchungs- und Studiengebiete zukommen, ausgenommen, wenn spezielle Bedeutungen anderweitig hierin angeführt wurden.
  • Beschreibung im Einzelnen
  • Hierin werden Lösungsansätze beschrieben, die Sprach-Aktivitäts-Detektions (VAD)- oder akustische Aktivitäts-Detektions (AAD)-Lösungsansätze in Mikrofone integrieren. Mindestens einige der Mikrofon-Komponenten (z.B. VAD oder AAD-Module) sind bei oder an einem Anwendungs-spezifischen Schaltkreis (ASIC) oder anderer integrierter Vorrichtung angeordnet. Die Integration von Komponenten, wie die VAD- oder AAD-Module, vermindern deutlich die Leistungs-Anforderungen des Systems, wodurch die Zufriedenheit der Anwender mit dem System ansteigt. Auch ein Interface wird zwischen Mikrofon und Schaltkreis in einer elektronischen Vorrichtung (z.B. Mobiltelefon oder Personal-Computer) bereitgestellt, in welcher das Mikrofon angeordnet ist. Das Interface ist so standardisiert, dass seine Konfiguration in den meisten, wenn nicht allen elektronischen Vorrichtungen (z.B. Mobiltelefonen) den Austausch des Mikrofons erlaubt. Das Mikrofon arbeitet in Mehrfach-Modi, einschließlich eines Modus geringer Leistung, der aber immer noch akustische Ereignisse, wie Sprach-Signale, detektiert.
  • Bei vielen von diesen Ausführungsformen werden bei einem Mikrofon analoge Signale von einem Schall-Wandler empfangen. Die analogen Signale werden in digitalisierte Daten umgewandelt. Eine Ermittlung wird ausgeführt, ob Sprach-Aktivität innerhalb des digitalisierten Signals vorliegt. Nach der Detektion von Sprach-Aktivität wird ein Hinweis auf Sprach-Aktivität an eine Verarbeitungs-Vorrichtung gesendet. Der Hinweis wird über ein Standard-Interface gesendet und das Standard-Interface ist so ausgelegt, dass es kompatibel ist, um mit einer Mehrzahl von Vorrichtungen möglicherweise unterschiedlicher Hersteller gekoppelt zu werden.
  • In anderen Aspekten wird das Mikrofon in mehreren Betriebs-Modi betrieben, so dass das Mikrofon selektiv in einem ersten Mikrofon-Abtast-Modus und einem zweiten Mikrofon-Abtast-Modus betrieben und dazwischen bewegt wird, basierend auf einem von mehreren, ob ein äußerer Takt von einer Verarbeitungs-Vorrichtung empfangen wird oder ob dem Mikrofon Leistung zugeführt wird. Innerhalb des ersten Mikrofon-Abtast-Modus nutzt das Mikrofon einen inneren Takt, empfängt erste Analog-Signale von einem Schall-Wandler, wandelt die ersten analogen Signale in erste digitalisierte Daten um, ermittelt, ob Sprach-Aktivität innerhalb des ersten digitalisierten Signals vorliegt, und sendet nach der Detektion von Sprach-Aktivität einen Hinweis auf Sprach-Aktivität zu der Verarbeitungs-Vorrichtung und schaltet anschließend von der Verwendung des inneren Takts um und empfängt einen äußeren Takt. Innerhalb des zweiten Mikrofon-Abtast-Modus empfängt das Mikrofon zweite analoge Signale von einem Schall-Wandler, wandelt die zweiten analogen Signale in zweite digitalisierte Daten um, ermittelt, ob Sprach-Aktivität innerhalb der zweiten digitalisierten Signale vorliegt, und sendet nach der Detektion von Sprach-Aktivität einen Hinweis auf Sprach-Aktivität zu der Verarbeitungs-Vorrichtung und verwendet den von der Verarbeitungs-Vorrichtung zugeführten äußeren Takt.
  • In einigen Beispielen umfasst der Hinweis ein Signal, das anzeigt, dass Sprach-Aktivität detektiert wurde oder ein digitalisiertes Signal. In anderen Beispielen umfasst der Wandler eines von einem mikroelektromechanischen System-(MEMS)-Bauelement, einem piezoelektrischen Bauelement oder einem Lautsprecher.
  • In einigen Aspekten werden der Empfang, die Umwandlung, das Ermitteln und das Senden bei einem integrierten Schaltkreis ausgeführt. In anderen Aspekten ist der integrierte Schaltkreis bei einem von einem Mobiltelefon, einem Smartphone, einem Personal-Computer, einer tragbaren elektronischen Vorrichtung oder einem Tablet angeordnet. In einigen Beispielen werden der Empfang, die Umwandlung, das Ermitteln und das Senden ausgeführt, wenn in einem Einzel-Betriebs-Modus gearbeitet wird.
  • In einigen Beispielen ist der Einzel-Modus ein Energie-Spar-Modus. In anderen Beispielen umfassen die digitalisierten Daten PDM-Daten oder PCM-Daten. In einigen anderen Beispielen umfasst der Hinweis ein Takt-Signal. In noch anderen Beispielen umfasst der Hinweis eine oder mehrere Gleichstrom-Spannungs-Ebenen.
  • In einigen Beispielen wird anschließend an das Senden des Hinweises ein Takt-Signal an dem Mikrofon empfangen. In einigen Aspekten wird das Takt-Signal zum Synchronisieren der Daten-Bewegung zwischen dem Mikrofon und einem äußeren Prozessor genutzt. In anderen Beispielen ist eine erste Frequenz von dem empfangenen Takt dieselbe wie eine zweite Frequenz von einem an dem Mikrofon angeordneten inneren Takt. In noch anderen Beispielen ist eine erste Frequenz von dem empfangenen Takt verschieden von einer zweiten Frequenz von einem bei dem Mikrofon angeordneten inneren Taktgeber.
  • In einigen Beispielen ist vor dem Empfang des Takts das Mikrofon in einem ersten Betriebs-Modus und der Empfang des Takts ist wirksam zum Veranlassen, dass das Mikrofon in einen zweiten Betriebs-Modus gelangt. In anderen Beispielen ist das Standard-Interface mit beliebiger Kombination des PDM-Protokolls, des I2S-Protokolls oder des I2C-Protokolls kompatibel.
  • In anderen von diesen Ausführungsformen schließt eine Einrichtung eine Analog-zu-Digital-Umwandlungs-Schaltung ein, wobei die Analog-zu-Digital-Umwandlungs-Schaltung zum Empfang von analogen Signalen von einem Schall-Wandler und Umwandeln der analogen Signale zu digitalisierten Daten ausgelegt ist. Die Einrichtung enthält auch ein Standard-Interface und eine Verarbeitungs-Vorrichtung. Die Verarbeitungs-Vorrichtung ist an die Analog-zu-Digital-Umwandlungs-Schaltung und das Standard-Interface gekoppelt. Die Verarbeitungs-Vorrichtung ist zur Ermittlung, ob Sprach-Aktivität innerhalb des digitalisierten Signals vorliegt, und nach der Detektion von Sprach-Aktivität zum Senden eines Hinweises auf Sprach-Aktivität zu einer äußeren Verarbeitungs-Vorrichtung ausgelegt. Der Hinweis wird über das Standard-Interface gesendet und das Standard-Interface ist so ausgelegt, dass es kompatibel ist, um mit einer Mehrzahl von Vorrichtungen möglicherweise unterschiedlicher Hersteller gekoppelt zu werden.
  • In vielen von diesen Ausführungsformen werden erste analoge Signale von einem ersten Mikrofon empfangen, die ersten analogen Signale werden in erste digitale Daten umgewandelt und die ersten digitalen Daten werden in einem ersten Puffer unter Verwendung eines ersten inneren Takts gespeichert. Zweite analoge Signale werden von einem zweiten Mikrofon gemäß einem zweiten inneren Takt empfangen, wobei das zweite analoge Signal in zweite digitale Daten umgewandelt wird und die zweiten digitalen Daten in einem zweiten Puffer gespeichert werden. Die ersten digitalen Daten in dem ersten Puffer werden nicht unbedingt in Echtzeit mit den zweiten digitalen Daten in dem zweiten Puffer synchronisiert, wobei ermittelt wird, ob Sprach-Aktivität bei einem ersten Modul zur Detektion akustischer Aktivität (AAD), basierend auf den ersten digitalen Daten, stattgefunden hat. Wenn Sprach-Aktivität ermittelt wird, wird ein Sprach-Aktivität-Detektions-Signal zu einem äußeren Prozessor übermittelt, und der äußere Prozessor stellt in Antwort ein äußeres Takt-Signal nach Empfang des Sprach-Aktivität-Detektions-Signals bereit. Die ersten digitalen Daten von dem ersten Puffer und die zweiten digitalen Daten von dem zweiten Puffer werden unter Verwendung des äußeren Takts zum Bereitstellen dezimierter Output-Daten dezimiert und die dezimierten Output-Daten weisen die ersten digitalen Daten und die zweiten digitalen Daten in Echtzeit abgeglichen auf.
  • In anderen Aspekten wird der äußere Takt bei dem ersten Mikrofon und dem zweiten Mikrofon empfangen und der Vorgang von dem ersten Mikrofon und dem zweiten Mikrofon wird mit dem äußeren Takt synchronisiert. In einigen anderen Aspekten wird anschließend an das Dezimieren der ersten digitalen Daten und der zweiten digitalen Daten mit den dezimierten Output-Daten von dem ersten Mikrofon und dem zweiten Mikrofon Zwei-Kanal-Sprach-Signal-Verstärkung ausgeführt.
  • In einigen Beispielen umfasst Umwandlung des ersten analogen Signals zu einem ersten digitalen Signal Umwandlung des ersten analogen Signals zu PDM-Daten und dann in PCM-Daten. In anderen Beispielen wird das zweite Mikrofon und nicht das erste Mikrofon bei einer niederen Leistung oder im Schlaf-Modus gehalten bis durch den äußeren Prozessor ein äußerer Takt angelegt wird.
  • In einigen Aspekten enthält der äußere Prozessor einen Decimator und der Decimator ist zum Dezimieren bzw. Downsampling von zwei oder mehr Kanälen unter Verwendung desselben Takts und desselben Sample-Synchronisations-Signals oder Wort-Abtast-Impulses (WS) ausgelegt. In einigen anderen Beispielen sind das erste Mikrofon, das zweite Mikrofon und eine Vielfalt von zusätzlichen Mikrofonen über eine gemeinsame Takt-Leitung und mehrere serielle PDM-Daten-Leitungen an den äußeren Prozessor angeschlossen.
  • In einigen Aspekten enthält das erste Mikrofon einen ersten Puffer und das erste Mikrofon wird in einem Abtast-Modus gehalten, wobei das erste AAD-Modul und der erste Puffer aktiv sind. In anderen Aspekten wird das zweite Mikrofon und beliebige zusätzliche Mikrofone und nicht das erste Mikrofon bei einer niederen Leistung oder im Schlaf-Modus gehalten bis ein äußerer Takt durch den äußeren Prozessor angelegt wird. In anderen Beispielen wird anschließend an das Dezimieren der digitalen Daten von dem ersten Mikrofon, dem zweiten Mikrofon und einer Vielfalt von zusätzlichen Mikrofonen mit den dezimierten Output-Daten von dem ersten Mikrofon, dem zweiten Mikrofon und dem dritten Mikrofon Mehr-Kanal-Sprach-Signal-Verstärkung ausgeführt.
  • In anderen von diesen Ausführungsformen enthält eine Einrichtung einen äußeren Prozessor; einen ersten Puffer gekoppelt an den äußeren Prozessor; einen zweiten Puffer gekoppelt an den äußeren Prozessor; und einen ersten Analog-zu-Digital-Wandler gekoppelt an den ersten Puffer. Der erste Analog-zu-Digital-Wandler ist zum Empfang erster analoger Signale von einem ersten Mikrofon, Umwandeln der ersten analogen Signale in erste digitale Daten und Speichern der ersten digitalen Daten in einen ersten Puffer ausgelegt. Die Einrichtung enthält auch ein erstes Modul zur Detektion akustischer Aktivität (AAD), gekoppelt an den ersten Analog-zu-Digital-Wandler. Das erste Modul zur akustischen Aktivitäts-Detektion ist zur Ermittlung ausgelegt, ob Sprach-Aktivität, basierend auf den ersten digitalen Daten, stattgefunden hat und wenn Sprach-Aktivität ermittelt wird, wird ein Sprach-Aktivität-Detektions-Signal zu dem äußeren Prozessor übertragen. Der äußere Prozessor liefert in Antwort ein äußeres Takt-Signal nach Empfang des Sprach-Aktivität-Detektions-Signals. Die Einrichtung enthält auch einen zweiten Analog-zu-Digital-Wandler gekoppelt an den zweiten Puffer. Der zweite Analog-zu-Digital-Wandler ist zum Empfang eines zweiten analogen Signals von einem zweiten Mikrofon gemäß dem äußeren Takt, Umwandeln des zweiten analogen Signals in zweite digitale Daten und Speichern der zweiten digitalen Daten in einem zweiten Puffer ausgelegt. Die ersten digitalen Daten in dem ersten Puffer werden nicht unbedingt in Echtzeit mit den zweiten digitalen Daten in dem zweiten Puffer synchronisiert. Der erste Puffer, der erste Analog-zu-Digital-Wandler und das erste Modul zur akustischen Aktivitäts-Detektion sind bei einem ersten Mikrofon angeordnet und wobei der zweite Puffer und der zweite Analog-zu-Digital-Wandler bei einem zweiten Mikrofon angeordnet sind. Der äußere Prozessor ist zum Dezimieren der ersten digitalen Daten von dem ersten Puffer und der zweiten digitalen Daten von dem zweiten Puffer unter Verwendung des äußeren Takts zum Bereitstellen dezimierter Output-Daten ausgelegt. Die dezimierten Output-Daten weisen die ersten digitalen Daten und die zweiten digitalen Daten abgeglichen in Echtzeit auf.
  • In einigen Beispielen wird der äußere Takt bei dem ersten Mikrofon und dem zweiten Mikrofon empfangen und der Vorgang von dem ersten Mikrofon und dem zweiten Mikrofon wird mit dem äußeren Takt synchronisiert. In anderen Beispielen wird anschließend an das Dezimieren der ersten digitalen Daten und der zweiten digitalen Daten Zwei-Kanal-Sprach-Signal-Verstärkung mit den dezimierten Output-Daten von dem ersten Mikrofon und dem zweiten Mikrofon ausgeführt.
  • In einigen Beispielen wird das erste analoge Signal zu PDM-Daten und dann zu PCM-Daten umgewandelt. In anderen Beispielen werden das zweite Mikrofon und nicht das erste Mikrofon in einem Schlaf-Modus bei niederer Leistung gehalten, bis durch den äußeren Prozessor ein äußerer Takt angelegt wird.
  • In anderen Beispielen enthält der äußere Prozessor einen Decimator und der Decimator ist zum Dezimieren von zwei oder mehr Kanälen unter Verwendung desselben Takts und gleichen Sample-Synchronisations-Signals oder Wort-Abtast-Impulses (WS) ausgelegt.
  • In anderen Aspekten sind das erste Mikrofon, das zweite Mikrofon und eine Vielfalt von zusätzlichen Mikrofonen über eine gemeinsame Takt-Leitung und mehrere serielle PDM-Daten-Leitungen an den äußeren Prozessor angeschlossen. In anderen Beispielen wird das erste Mikrofon im Abtast-Modus gehalten, wobei das erste AAD-Modul und der erste Puffer aktiv ist. In noch anderen Beispielen werden das zweite Mikrofon und beliebige zusätzliche Mikrofone und nicht das erste Mikrofon in einem Schlaf-Modus bei niederer Leistung gehalten bis durch den äußeren Prozessor ein äußerer Takt angelegt wird. In anderen Aspekten wird anschließend zum Dezimieren der digitalen Daten von dem ersten Mikrofon, dem zweiten Mikrofon und einer Vielfalt von zusätzlichen Mikrofonen mit den dezimierten Output-Daten von dem ersten Mikrofon, dem zweiten Mikrofon und dem dritten Mikrofon Mehr-Kanal-Sprach-Signal-Verstärkung ausgeführt.
  • Bei vielen von diesen Ausführungsformen wird ein äußeres Takt-Signal mit einer ersten Frequenz empfangen. Eine automatische Bestimmung für ein Teilungs-Verhältnis wird, basierend zumindest zum Teil auf einer zweiten Frequenz von einem inneren Takt, ausgeführt, wobei die zweite Frequenz größer als die erste Frequenz ist. Ein Dezimierungs-Faktor wird automatisch ermittelt, basierend zumindest zum Teil auf der ersten Frequenz des äußeren Takt-Signals, der zweiten Frequenz des inneren Takt-Signals und einer vorher bestimmten gewünschten Sampling-Frequenz. Das Teilungs-Verhältnis wird an das innere Takt-Signal zum Vermindern der ersten Frequenz auf eine verminderte dritte Frequenz angelegt. Der Dezimierungs-Faktor wird an die verminderte dritte Frequenz zum Bereitstellen der vorher bestimmten gewünschten Sampling-Frequenz angelegt. Daten werden an einen Puffer unter Verwendung der vorher bestimmten gewünschten Sampling-Frequenz getaktet.
  • In anderen Aspekten wird das äußere Takt-Signal anschließend entfernt. In anderen Beispielen umfasst die vorher bestimmte gewünschte Sampling-Frequenz eine Frequenz-Rate von etwa 16kHz.
  • In anderen von diesen Ausführungsformen enthält eine Einrichtung eine Interface-Schaltung, die einen Input und Output aufweist, und der Input ist zum Empfang eines äußeren Takt-Signals mit einer ersten Frequenz ausgelegt. Die Einrichtung enthält auch eine Verarbeitungs-Schaltung und die Verarbeitungs-Schaltung ist an die Interface-Schaltung gekoppelt und ist zum automatischen Ermitteln eines Teilungs-Verhältnisses, basierend zumindest zum Teil auf einer zweiten Frequenz von einem inneren Takt, ausgelegt, wobei die zweite Frequenz größer als die erste Frequenz ist. Die Verarbeitungs-Schaltung ist weiterhin zum automatischen Ermitteln eines Dezimierungs-Faktors ausgelegt, basierend zumindest zum Teil auf der ersten Frequenz von dem äußeren Takt-Signal, der zweiten Frequenz von dem inneren Takt-Signal und einer vorher bestimmten gewünschten Sampling-Frequenz. Die Verarbeitungs-Schaltung ist weiterhin ausgelegt zum Anwenden des Teilungs-Verhältnisses auf das innere Takt-Signal zum Vermindern der ersten Frequenz auf eine verminderte dritte Frequenz und zum Anwenden des Dezimierungs-Faktors auf die verminderte dritte Frequenz zum Bereitstellen der vorher bestimmten gewünschten Sampling-Frequenz. Die Verarbeitungs-Schaltung ist weiterhin ausgelegt zum Takten der Daten zu einem Puffer über den Output unter Verwendung der vorher bestimmten gewünschten Sampling-Frequenz.
  • Bezugnehmend nun auf 1A enthält eine Mikrofon-Einrichtung 100 eine Ladungspumpe 101, einen kapazitiven mikroelektromechanischen System (MEMS)-Sensor 102, einen Takt-Detektor 104, einen Sigma-Delta-Modulator 106, ein akustisches Aktivitäts-Detektion (AAD)-Modul 108, einen Puffer 110 und ein Steuerungs-Modul 112. Es wird Wert darauf gelegt, dass diese Elemente als verschiedene Kombinationen von Hardware und programmierter Software implementiert sein können und zumindest einige von diesen Komponenten können auf einem ASIC angeordnet sein.
  • Die Ladungspumpe 101 liefert eine Spannung zum Aufladen und Vorspannen einer Membran des kapazitiven MEMS-Sensors 102. Für einige Anwendungen (z.B., wenn eine piezoelektrische Vorrichtung als Sensor eingesetzt wird) kann die Ladungspumpe gegen eine Stromquelle ersetzt werden, die extern zum Mikrofon sein kann. Eine Sprache oder anderes akustisches Signal bewegt die Membran, die Kapazität des kapazitiven MEMS-Sensors 102 ändert sich und Spannungen werden erzeugt, die zu einem elektrischen Signal werden. In einem Aspekt sind die Ladungspumpe 101 und der MEMS-Sensor 102 nicht auf dem ASIC angeordnet (aber in anderen Aspekten können sie auf dem ASIC angeordnet sein). Es wird Wert darauf gelegt, dass der MEMS-Sensor 102 alternativ ein piezoelektrischer Sensor, ein Lautsprecher oder ein beliebiger anderer Typ von Fühlelement oder Anordnung sein kann.
  • Der Takt-Detektor 104 steuert, welcher Takt zu dem Sigma-Delta-Modulator 106 geht und synchronisiert den Digitalabschnitt von dem ASIC. Wenn äußerer Takt vorliegt, verwendet der Takt-Detektor 104 den Takt; wenn kein äußeres Takt-Signal vorliegt, dann wendet der Takt-Detektor 104 einen inneren Oszillator 103 für Daten-Timing/Takting-Zwecke an.
  • Der Sigma-Delta-Modulator 106 wandelt das analoge Signal in ein Digital-Signal um. Der Output des Sigma-Delta-Modulators 106 ist in einem Aspekt ein serieller Ein-Bit-Strom. Alternativ kann der Sigma-Delta-Modulator 106 eine beliebige Art von Analog-zu-Digital-Wandler sein.
  • Der Puffer 110 speichert Daten und baut eine laufende Speicherung von letzten Daten auf. Während akustische Aktivität detektiert wird, werden diese letzten zusätzlichen Daten in dem Puffer 110 gespeichert. In anderen Worten speichert der Puffer 110 eine Historie von der letzten Audio-Aktivität. Wenn ein Audio-Ereignis stattgefunden hat (z.B. ein Trigger-Wort detektiert ist), weist das Steuerungs-Modul 112 den Puffer 110 an, Daten von dem Puffer 110 auszuspulen. In einem Beispiel speichert der Puffer 110 die vorangegangenen etwa 180 ms von Daten, die vor der detektierten Aktivität erzeugt wurden. Wurde die Aktivität einmal detektiert, überträgt das Mikrofon 100 die gepufferten Daten zu dem Host (z.B. elektronischer Schaltkreis in einer Verbraucher-Vorrichtung, wie ein Mobiltelefon).
  • Das akustische Aktivitäts-Detektion (AAD)-Modul 108 detektiert akustische Aktivität. Verschiedene Lösungsansätze können verwendet werden, um solche Ereignisse, wie das Auftreten von einem Trigger-Wort, Trigger-Ausdruck, speziellem Geräusch oder Ton und so weiter, zu detektieren. In einem Aspekt verfolgt das Modul 108 die ankommenden akustischen Signale, die nach einer Sprache-artigen Signatur suchen (oder verfolgt andere geeigneten Merkmale oder Schwellenwerte). Nach der Detektion akustischer Aktivität, die die Trigger-Erfordernisse erfüllt, überträgt das Mikrofon 100 einen Puls-Dichte-Modulations-(PDM)-Strom, um den Rest der Systemkette zum Vervollständigen des gesamten Sprach-Erkennungs-Prozesses aufzuwecken. Andere Daten-Typen könnten auch verwendet werden.
  • Das Steuerungs-Modul 112 steuert bzw. kontrolliert, wenn die Daten von dem Puffer übertragen werden. Wie hierin anderswo erörtert, werden, wenn Aktivität durch das AAD-Modul 108 detektiert wurde, dann die Daten über ein Interface 119, das einen VDD-Pin 120, einen Takt-Pin 122, einen Auswahl-Pin 124, einen Daten-Pin 126 und einen Basis-Pin 128 enthält, ausgetaktet. Die Pins 120-128 bilden das Interface 119, das beim Vorgang mit verschiedenen Typen von elektronischen Schaltkreisen erkennbar und kompatibel ist, zum Beispiel jene Typen von Schaltkreisen, die in Mobiltelefonen verwendet werden. In einem Aspekt verwendet das Mikrofon 100 das Interface 119, um mit dem Schaltkreis in einem Mobiltelefon zu kommunizieren. Da das Interface 119 zwischen Mobiltelefonen standardisiert ist, kann das Mikrofon 100 in einem beliebigen Telefon, das das Standard-Interface nutzt, eingesetzt oder angeordnet werden. Das Interface 119 verbindet übergangslos zu einem kompatiblen Schaltkreis in dem Mobiltelefon. Andere Interfaces mit anderen Pin-Ausgängen sind möglich. Für Interrupts könnten auch unterschiedliche Pins verwendet werden.
  • Beim Einsatz arbeitet das Mikrofon 100 in einer Vielzahl von unterschiedlichen Modi und verschiedenen Zuständen, die diese Modi abdecken. Wenn zum Beispiel ein Takt-Signal (mit einer Frequenz, die in einen vorher bestimmten Bereich fällt) dem Mikrofon 100 zugeführt wird, wird das Mikrofon 100 in einem Standard-Betriebs-Modus betrieben. Wenn die Frequenz nicht innerhalb des Bereichs liegt, wird das Mikrofon 100 innerhalb eines Abtast-Modus betrieben. In dem Abtast-Modus wird der innere Oszillator 103 von dem Mikrofon 100 verwendet und nach Detektion von einem akustischen Ereignis werden DatenÜbertragungen mit der Anstiegs-Takt-Flanke abgeglichen, wenn der Takt der innere Takt ist.
  • Bezugnehmend nun auf 1B wird ein anderes Beispiel von einem Mikrofon 100 beschrieben. Dieses Beispiel enthält dieselben Elemente wie jene, die in 1A gezeigt werden, und diese Elemente werden unter Verwendung derselben Bezugsziffern wie jene, die in 1A gezeigt werden, nummeriert.
  • Zusätzlich enthält das Mikrofon 100 von 1B einen Tief-Pass-Filter 140, eine Referenz 142, ein Dezimierungs/Kompressions-Modul 144, ein Dekompression PDM Modul 146 und einen Vorverstärker 148.
  • Die Funktion des Tief-Pass-Filters 140 entfernt höhere Frequenz von der Ladungspumpe. Die Funktion der Referenz 142 ist eine Spannung oder andere Referenz, die von Komponenten innerhalb des Systems als passender Referenz-Wert verwendet werden. Die Funktion von dem Dezimierungs/Kompressions-Modul 144 ist, die Puffergröße zu minimieren, die Daten aufzunehmen oder zu komprimieren und sie dann zu speichern. Die Funktion des Dekompressions-PDM-Moduls 146 besteht darin, die Daten für das SteuerModul auseinanderzuziehen. Die Funktion des Vorverstärkers 148 besteht darin, das Sensor-Output-Signal auf einen brauchbaren Spannungs-Pegel zu bringen.
  • Die durch die Bezugsziffer 100 in 1A und 1B ausgewiesenen Komponenten können auf einem einzigen Anwendungs-spezifischen integrierten Schaltkreis (ASIC) oder einer anderen integrierten Vorrichtung angeordnet sein. Jedoch ist die Ladungspumpe 101 nicht auf dem ASIC 160 in 1A angeordnet und ist auf dem ASIC in dem System von 1B. Diese Elemente können auf dem ASIC in einer besonderen Implementierung angeordnet sein oder nicht. Es wird Wert darauf gelegt, dass das ASIC andere Funktionen, wie Signal-Verarbeitungs-Funktionen, aufweisen kann.
  • Bezugnehmend nun auf 2, 3, 4 und 5 arbeitet ein Mikrofon (z.B. das Mikrofon 100 von 1) in einem Standard-Leistungs-Modus und einem Abtast-Modus und diese werden durch die Takt-Frequenz ermittelt. Im Standard-Leistungs-Modus wirkt das Mikrofon als ein Standard-Mikrofon, in welchem es Daten wie empfangen austaktet. Der zum Veranlassen des Mikrofons in dem Standard-Modus betrieben zu werden erforderliche Frequenz-Bereich kann definiert oder in dem Datenblatt für den infrage kommenden Teil ausgewiesen oder vom Hersteller des Mikrofons anderweitig zugeführt werden.
  • Im Abtast-Modus ist der Output des Mikrofons in drei Zuständen und ein innerer Takt wird angelegt, um den Schaltkreis abzutasten. Triggert das AAD-Modul einmal (z.B. sendet ein Trigger-Signal, das anzeigt, dass ein akustisches Ereignis stattgefunden hat), überträgt das Mikrofon gepufferte PDM-Daten auf den Mikrofon-Daten-Pin (z.B. Daten-Pin 126) synchronisiert mit dem inneren Takt (z.B. ein 512kHz Takt). Dieser innere Takt wird dem Auswahl-Pin (z.B. Auswahl-Pin 124) als Output während dieses Modus zugeführt. In diesem Modus werden die Daten an der Anstiegs-Flanke von dem inneren erzeugten Takt gültig (Output auf den Auswahl-Pin). Dieser Vorgang sichert die Kompatibilität mit existierenden I2S-komaptiblen Hardware-Blöcken. Der Takt-Pin (z.B. Takt-Pin 122) und der Daten-Pin (z.B. Daten-Pin 126) werden den Output von Daten stoppen, nachdem eine eingestellte Zeit keine Aktivität mehr detektiert wurde. Die Frequenz für diesen Modus wird in dem Datenblatt für den infrage kommenden Teil detektiert. In einem anderen Beispiel ist das Interface mit dem PDM-Protokoll oder dem I2C-Protokoll kompatibel. Andere Beispiele sind möglich.
  • Der Vorgang des vorstehend beschriebenen Mikrofons wird in 2 gezeigt. Der Auswahl-Pin (z.B. Auswahl-Pin 124) ist die obere Linie, der Daten-Pin (z.B. Daten-Pin 126) ist die zweite Linie von oben und der Takt-Pin (z.B. Takt-Pin 122) ist die untere Linie auf der Kurve. Es kann ersichtlich werden, dass wenn einmal akustische Aktivität detektiert ist, Daten an der Anstiegs-Flanke des inneren Takts übertragen werden. Wie erwähnt, sichert dieser Vorgang die Kompatibilität mit existierenden I2S-kompatiblen Hardware-Blöcken.
  • Für die Kompatibilität zu den DMIC-konformen Interfaces im Abtast-Modus kann der Takt-Pin (z.B. Takt-Pin 122) zum Austakten der Mikrofon-Daten betrieben werden. Der Takt muss die Abtast-Modus-Erfordernisse für die Frequenz (z.B. 512kHz) erfüllen. Wenn ein äußeres Takt-Signal auf dem Takt-Pin (z.B. Takt-Pin 122) detektiert wird, werden in einem Beispiel die auf dem Daten-Pin (z.B. Daten-Pin 126) betriebenen Daten mit dem äußeren Takt innerhalb zweier Zyklen synchronisiert. Andere Beispiele sind möglich. In diesem Modus wird der äußere Takt entfernt, wenn für das Mikrofon nicht mehr Aktivität detektiert wird, um zu dem niedrigsten Leistungs-Modus zurückzukehren. Aktivitäts-Detektion in diesem Modus kann der Auswahl-Pin (z.B. Auswahl-Pin 124) zur Ermittlung, wenn Aktivität nicht mehr abgetastet wird, anwenden. Andere Pins können auch verwendet werden.
  • Dieser Vorgang wird in 3 gezeigt. Der Select-Pin (z.B. Select -Pin 124) ist die obere Linie, der Daten-Pin (z.B. Daten-Pin 126) ist die zweite Linie von oben und der Takt-Pin (z.B. Takt-Pin 122) ist die untere Linie auf der Kurve. Es kann ersichtlich werden, dass wenn in einem Beispiel einmal akustische Aktivität detektiert worden ist, die Daten, die auf dem Daten-Pin (z.B. Daten-Pin 126) betrieben werden, mit dem äußeren Takt innerhalb zweier Zyklen synchronisiert werden. Andere Beispiele sind möglich. Daten werden auf der fallenden Flanke des äußeren Takts synchronisiert. Daten können ebenfalls unter Verwendung anderer Takt-Flanken synchronisiert werden. Weiterhin wird der äußere Takt entfernt, wenn für das Mikrofon nicht mehr Aktivität detektiert wird, um zu dem niedrigsten Leistungs-Modus zurückzukehren.
  • Bezugnehmend nun auf 4 und 5 werden ein Zustands-Übergangs-Diagramm 400 (4) und Übergangs-Bedingungs-Tabelle 500 (5) beschrieben. Die verschiedenen in 4 aufgelisteten Übergänge kommen unter den in der Tabelle von 5 aufgelisteten Bedingungen vor. Zum Beispiel findet Übergang A 1 statt, wenn Vdd angelegt wird und kein Takt auf dem Takt-Input-Pin vorliegt. Es wird verständlich sein, dass die Tabelle von 5 Frequenz-Werte angibt (welche angenähert sind) und dass andere Frequenz-Werte möglich sind. Der Begriff „OTP“ bedeutet einmaliges Programmieren.
  • Das Zustands-Übergangs-Diagramm von 4 enthält einen Mikrofon-Off-Zustand 402, einen Normal-Modus-Zustand 404, einen Mikrofon-Abtast-Modus mit äußerem Takt-Zustand 406, einen Mikrofon-Abtast-Modus mit inneren-Takt-Zustand 408 und einen Abtast-Modus mit Output-Zustand 410.
  • Der Mikrofon-Off-Zustand 402 ist, wenn das Mikrofon 400 deaktiviert ist. Der Normal-Modus-Zustand 404 ist der Zustand während des normalen Betriebs-Modus, wenn der äußere Takt angelegt wird (wenn der äußere Takt innerhalb eines vorher bestimmten Bereichs liegt). Der Mikrofon-Abtast-Modus mit äußerem Takt-Zustand 406 ist, wenn der Modus zu dem äußeren Takt schaltet, wie in 3 gezeigt. Der Mikrofon-Abtast-Modus-mit inneren-Takt-Zustand 408 ist, wenn kein äußerer Takt verwendet wird, wie in 2 gezeigt. Der Abtast-Modus mit Output-Zustand 410 ist, wenn kein äußerer Takt verwendet wird und wenn Daten ausgegeben werden, wie auch in 2 gezeigt.
  • Wie erwähnt, basieren Übergänge zwischen diesen Zuständen auf Ereignissen und werden durch sie ausgelöst bzw. getriggert. Um ein Beispiel zu nehmen, wenn das Mikrofon in normalem Betriebs-Zustand 404 (z.B. bei einer Taktrate höher als 512 kHz) betrieben wird, und das Steuerungs-Modul, das den Takt-Pin detektiert, etwa 512 kHz ist, dann geht die Steuerung zu dem Mikrofon-Abtast-Modus mit äußerem Takt-Zustand 406. In dem äußeren Takt-Zustand 406, wenn das Steuerungs-Modul dann keinen Takt an dem Takt-Pin detektiert, geht die Steuerung zu dem Mikrofon-Abtast-Modus mit inneren-Takt-Zustand 408. Wenn in dem Mikrofon-Abtast-Modus mit inneren-Takt-Zustand 408 und ein akustisches Ereignis detektiert wird, geht die Steuerung zu dem Abtast-Modus mit Output-Zustand 410. Wenn in dem Abtast-Modus mit Output-Zustand 410, kann ein Takt von größer als etwa 1 MHz die Steuerung veranlassen zu Zustand 404 zurückzukehren. Der Takt kann weniger als 1 MHz (z.B. dieselbe Frequenz wie der innere Oszillator) sein und wird verwendet, um Daten, die von dem Mikrofon zu einem äußeren Prozessor ausgegeben werden, zu synchronisieren. Keine akustische Aktivität für eine OTP-programmierte Zeitmenge veranlasst andererseits die Steuerung, zu Zustand 406 zurückzukehren.
  • Es wird Wert darauf gelegt, dass die anderen in 5 ausgewiesenen Ereignisse Übergänge zwischen den Zuständen veranlassen werden, wie in dem Zustands-Übergangs-Diagramm von 4 gezeigt.
  • Bezugnehmend nun auf 6 enthält ein akustischer Schaltkreis oder System 600 ein erstes Mikrofon 615, ein zweites Mikrofon 625 und einen äußeren System-Chip (oder Vorrichtung) 640.
  • Das erste Mikrofon 615 enthält ein erstes Wandler-Element 601, eine erste Ladungspumpe 603, einen ersten Abwärtswandler 602, einen ersten Puffer (oder Arbeitsspeicher (RAM)) 604, einen ersten Aufwärtswandler 606 (mit Output SD01), einen ersten Sigma-Delta-Wandler 608, einen ersten akustischen Aktivitäts-Detektor 610, einen ersten Controller 612, einen ersten inneren Taktgeber 613 und ein erstes Takt-Detektions-Modul 614. Diese Elemente umfassen das erste Mikrofon 615. Das erste Mikrofon 615 kann als ein Abtast-Mikrofon durch Verbinden des SELECT-Pins 650 als Output mit einem System-Chip (oder anderer äußerer Vorrichtung) 640, die in der Lage ist, ein Indikator-Signal an diesen Pin zu detektieren und durch Ausschalten eines äußeren Takts oder eines für niederen Leistungs-Modus ausgelegten äußeren Takts ausgelegt sein.
  • Das zweite Mikrofon 625 enthält ein zweites Wandler-Element 621, eine zweite Ladungspumpe 623, einen zweiten Abwärtswandler 622, einen zweiten Puffer (oder Arbeitsspeicher (RAM)) 624, einen zweiten Aufwärtswandler 626 (mit Output SD02), einen zweiten Sigma-Delta-Wandler 628, einen zweiten akustischen Aktivitäts-Detektor (AAD) 630, einen zweiten Controller 632, einen zweiten inneren Taktgeber 633 und ein zweites Takt-Detektions-Modul 634. Diese Elemente umfassen das zweite Mikrofon 625. Eine SELECT-Leitung 653 von dem zweiten Mikrofon 625 kann mit Vdd verbunden oder geerdet werden. Diese Leitung wird verwendet, um das Mikrofon 625 in ein Mikrofon niederer Leistung unter Verwendung des Audio-Puffers und inneren Takts 633 zu konfigurieren, so lange wie der äußere Takt ausgeschaltet ist. Der AAD-Schaltkreis 630 wird durch die Konfiguration von SELECT-Pin 653 ausgeschaltet.
  • Die zwei inneren Takt-Module 614 und 634 werden als oder in zwei unabhängigen Vorrichtungen angeordnet und haben in einem Aspekt keine Mittel, synchronisiert zu werden. Das erste Wandler-Element 601 und zweite Wandler-Element 621 können MEMS-Sensoren, piezoelektrische Sensoren, Lautsprecher oder ein beliebiger anderer Typ von Fühlelement sein. Die erste Ladungspumpe 603 und zweite Ladungspumpe 623 stellen Spannungen zum Aufladen und Vorspannen der Membranen der Wandler-Elemente 601 und 621 bereit.
  • Der erste Sigma-Delta-Modulator 608 wird verwendet, um den analogen Output von dem ersten Wandler-Element 601 zu ersten Digital-Pulse-Dichte-modulierten (PDM) Signalen umzuwandeln. Der zweite Sigma-Delta-Modulator 628 wird verwendet, um den analogen Output von dem Wandler-Element 621 zu zweiten Digital-Pulse-Dichte-modulierten (PDM) Signalen umzuwandeln.
  • Der erste Abwärtswandler 602 wird verwendet, um die ersten PDM-Signale zu einem ersten Pulse-Code-modulierten (PCM)-Signal umzuwandeln und zweiter Abwärtswandler 622 wird verwendet, um das zweite PDM-Signal zu einem zweiten PCM-Signal umzuwandeln. Die Umwandlungen basieren auf asynchronen Takten in jedem Mikrofon 615 und 625. Als eine erste Annäherung kann angenommen werden, dass die zwei inneren Takte bei derselben Rate betrieben werden. Außerdem wird in einigen Aspekten eine bekannte Anzahl von Bits von dem PDM-Signal bei der inneren Taktrate zu einer PCM-Sample bei jeder festen Zahl von Takten umgewandelt. In anderen Aspekten wird die Umwandlung unter Verwendung von Mitteln bewirkt, die nicht die Anzahl von PDM-Bits, die umgewandelt wurden, begrenzen, sondern die PCM-Samples werden bei jeder festen Zahl von Takten erzeugt. Für Mehr-Kanal-Audio-Daten wird dies gewöhnlich auch ein Wort-Abtastungs-(WS)-Signal synchronisiert. Jedoch können das Start- und End-Takt-Bit der PCM-Samples-Umwandlung nicht synchronisiert werden, da die zwei Wandler ein Mittel nicht teilen, um ein gemeinsames Start-Takt-Bit oder WS zu definieren. Wenn hierin verwendet, werden zwei Gruppen von Datenbits, entsprechend zwei PCM-Samples, „synchronisiert“, wenn das erste Bit von jeder Datengruppe rechtzeitig mit derselben Takt-Flanke von demselben Taktzyklus abgeglichen wird.
  • Der erste Puffer 604 und zweite Puffer 624 speichern von den Abwärtswandlern 602 bzw. 622 empfangene Daten. Diese PCM-Audio-Samples sind asynchron und haben eine Zeitunterschieds-Messunsicherheit, definiert durch die Dezimierungsrate D und die innere Takt-Frequenz fclk. D / ( 2 × f clk ) < Δ t < D / ( 2 × f clk )
    Figure DE112014005087B4_0001
  • Das PCM-Signal von dem ersten Abwärtswandler 602 wird für den AAD-Schaltkreis 610 zur Detektion von akustischer Aktivität bereitgestellt. Verschiedene Lösungsansätze können verwendet werden, um Aktivität zu detektieren, wie das Auftreten von einem Trigger-Wort, Trigger-Ausdruck, spezifischem Geräusch oder spezifischen Tönen. Nach Detektion weist das AAD-Modul 610 das Steuerungs-Modul 612 zum Senden einer Kommunikation zu dem System-Chip 640 an, dass es Sprach-Aktivität (z.B. wird ein Interrupt gesendet) über die SELECT-Leitung 650 gibt.
  • Wie erwähnt und in einem Beispiel kann die SELECT-Leitung 650 verwendet werden, die Detektion von Sprach-Aktivität anzuzeigen. Der erste Aufwärtswandler 606 kann dann verwendet werden, um das PCM-Signal in den Audio-Puffer zu einem PDM-Signal umzuwandeln, das bei der inneren Taktrate fclk ausgetaktet wird.
  • Der äußere System-Chip (oder eine andere Vorrichtung) 640 kann einen Stereo-Decimator 642, ein System Steuerungs-Modul 641 und eine Prozesseinheit 643 enthalten. Der System-Chip 640 kann das Indikator-Signal von der SELECT-Leitung 650 anwenden, um einen äußeren Takt 651 zu Mikrofonen 615 und 625 zu starten. Bei Empfang synchronisiert der äußere Takt 651 von dem System-Chip 640 den Steuer-Block 612 in dem ersten Mikrofon 615 und den Steuer-Block 632 in dem zweiten Mikrofon 625 auf denselben äußeren Takt fext_clk, der durch das System-Steuerungs-Modul 641 bereitgestellt wird.
  • Der erste Controller 612 und der zweite Controller 632 weisen die Puffer 604 und 624 an, Daten zu geeigneten Zeiten unter Verwendung des ersten Aufwärtswandlers 606 und des zweiten Aufwärtswandlers 626 auszuspulen. Der erste Aufwärtswandler 606 und zweiter Aufwärtswandler 626 wandeln die PCM-Signale von den Puffern 604 bzw. 624 zu PDM-Signalen SD01 bzw. SD02 um. In einem Aspekt wird das PCM-Audio, gespeichert in 604 und 624, nicht synchronisiert. Jedoch entfernt der Aufkonvertierungs-Prozess die Signal-Sample-Takt-Flanken an jeder PCM-Signal-Sample und entfernt somit die implizite Zeit-Messunsicherheit der PCM-Signale, gespeichert in den zwei Puffern 604 und 624.
  • In einem anderen Aspekt des Vorgangs von dem Schaltkreis 600 wird das erste Mikrofon 615 zum Empfang von Ton-Energie aktiviert. Nach der Umwandlung des Signals von einem analogen Signal zu einem digitalen Signal durch den Sigma-Delta-Wandler 608 und durch den Abwärtswandler 602 werden die Daten in dem Puffer 604 gespeichert. Nachdem die Sprach-Aktivität durch das erste AAD 610 detektiert ist, wird die SELECT-Leitung 650 verwendet, um die Detektion von dieser Sprach-Aktivität anzuzeigen. Der System-Chip 640 empfängt den Hinweis und kann dieses Indikator-Signal von der SELECT-Leitung 650 anzeigen, um einen äußeren Takt 651 zu Mikrofonen 615 und 625 zu starten. Der Takt 651 wird zu dem zweiten Mikrofon 625 gespeist, welches zum Empfang von Ton-Energie aktiviert ist. Der Takt aktiviert das Takt-Detektions-Modul 634. Die Aktivierung des Takt-Detektions-Moduls 634 aktiviert den Controller 632, die zweite Ladungspumpe 623, den Sigma-Delta-Modulator 628 und den Abwärtswandler 622, und zum Takten des zweiten Puffers 624. Dies erlaubt, das zweite Mikrofon 625 zu aktivieren und Daten zu dem zweiten Puffer 624 zu senden, um im PCM-Format gespeichert zu werden. In diesem Aspekt werden auch die PCM-Audio-Daten, gespeichert in 604 und 624, nicht synchronisiert.
  • In diesen beiden Beispielen werden die Signale SD01 und SD02 an derselben physikalischen seriellen Daten-Leitung mit Mikrofon 615 unter Verwendung von entweder der Anstiegs-Flanke oder der fallenden Flanke und Mikrofon 625 unter Verwendung von entweder der fallenden Flanke oder Anstiegs-Flanke gemultiplext, um die Daten zu takten. In anderen Aspekten können das Takt-Signal 651 und die Signale SD01 und SD02 an getrennten Leitungen vorliegen.
  • Die erhaltenen Outputs von dem ersten Puffer 604 und dem zweiten Puffer 624 werden wiederum aufkonvertiert zu PDM-Signalen SD01 durch 606 und SD02 durch 626. Der Aufkonvertierungs-Prozess entfernt die Signal-Sample-Takt-Flanken an jeder PCM-Signal-Sample und entfernt somit die implizite Zeit-Messunsicherheit der PCM-Signale, gespeichert in den zwei Puffern 604 und 624.
  • Der System-Chip 640 empfängt den PDM-Daten-Strom und kann diese Daten in den Stereo-Decimator 642 takten. Dieser Decimator 642 wird durch den Takt, erzeugt durch das System-Steuerungs-Modul 641, betrieben und de-multiplext die PDM-Daten in zwei Ströme. Weiterhin wird der Stereo-Decimator 642 durch ein gemeinsames Wort-Abtastungs-Signal für jeden Strom betrieben und erzeugt einen Strom von zwei PCM-Signal-Samples, welche an derselben Bit-Takt-Flanke beginnen und enden und somit synchronisiert sind.
  • Die zwei synchronisierten Ströme sind nun zur Zwei-Mikrofon-Signal-Verstärkungs-Algorithmus-Verarbeitung zum Vermindern von Hintergrund-Geräusch und Verbessern von Sprach-Erkennung geeignet. Weiteres Verarbeiten zur Zwei-Mikrofon-Signal-Verstärkung kann durch eine Prozesseinheit 643, gefolgt von Schlüssel-Phrase-Erkennung ausgeführt werden.
  • Es wird Wert darauf gelegt, dass mehr als zwei Mikrofone mit einer ähnlichen Struktur und Fähigkeit in einem ähnlichen Modus betrieben werden können, wobei die inneren PCM-Daten in inneren Puffern von jedem Mikrofon in einer implizit asynchronen Weise, auf Grund der Unfähigkeit, eine gemeinsame Wort-Abtastung aufzuweisen, gespeichert werden können. Durch Bereitstellen eines äußeren Takts werden die PCM-Daten aufkonvertiert und können auf einer Vielfalt von PDM-seriellen Daten-Leitungen zu dem System-Chip 640 bereitgestellt werden. Eine Bank von Decimatoren an dem System-Chip 640, der bei demselbem Takt betrieben wird, und Wort-Abtastung können zum Dezimieren der PDM-Daten von jedem von diesen Mikrofonen verwendet werden und erhalten Mehrfach-Kanäle von synchronen PDM-Daten zur Sprach- und Audio-Verstärkung in einer Prozesseinheit zum Verarbeiten digitaler Signale.
  • Es wird Wert darauf gelegt, dass solche Signal-Verstärkung zum Verbessern der Sprach-Qualität für Sprach-Erkennung vor einer beliebigen Erkennungs-Phase in der Verarbeitungskette ausgeführt werden kann. Beide von diesen Algorithmen oder Lösungsansätzen können implementiert oder in der Prozesseinheit 643 ausgeführt werden.
  • In einem Aspekt, um übermäßigen Leistungs-Zug bzw. Stromverbrauch zu vermeiden, ist es auch möglich, einen Schlüssel-Trigger-Ausdruck unter Verwendung von robusten Erkennungs-Algorithmen in der Prozesseinheit 643 unter Verwendung nur der Daten aus dem ersten Mikrofon 615 zu detektieren. In einem solchen Lösungsansatz wird das zweite Mikrofon 625 inaktiviert gehalten bis zu einem solchen Zeitpunkt, wenn der Schlüssel-Trigger-Ausdruck erkannt wird. Bei der Erkennung des Trigger-Ausdrucks wird das zweite Mikrofon 625, wie vorstehend beschrieben, durch Starten des äußeren Takts 651 aktiviert. Anschließend kann das empfangene Audiosignal von zwei oder mehr Mikros durch Aktivieren solcher Algorithmen in der Prozesseinheit 643 verstärkt werden. Dies wird den Leistungs-Verbrauch vermindern, wenn Signal-Verstärkung an multiplen Mikrofon-Daten nur, nachdem die Schlüssel-Phrase erkannt ist, ausgeführt wird und allgemeines natürliches Sprach-Verstehen in möglicherweise geräuschvollen Umgebungen erforderlich ist.
  • Es wird Wert darauf gelegt, dass die verschiedenen Elemente von 6 unter Verwendung verschiedener Kombinationen von Hardware und Software implementiert werden können. Zum Beispiel können einige der Elemente unter Verwendung von Computer-Anweisungen implementiert werden, die an einer Verarbeitungs-Vorrichtung, wie einem Mikroprozessor, ausgeführt werden.
  • Bezugnehmend nun auf 7 enthält das Takt-Modul 700 einen Takt-Detekt-Block 702, einen inneren Takt 704, einen programmierbaren Dividierer bzw. Teiler 706 und einen Decimator 708. Ein äußerer Takt 710 koppelt an den Takt-Detekt-Block 702. Eine Ladungspumpe 714 koppelt an ein Mikrofon 713, welches an einen Sigma-Delta-Wandler 712 koppelt, welcher an den Decimator 708 koppelt. Der Decimator 708 koppelt an einen Puffer 716.
  • Es wird Wert darauf gelegt, dass das Takt-Modul 700 das Takt-Detektor-Modul 104 von 1A oder 1B in einem Beispiel sein kann. Es wird auch verständlich sein, dass die Elemente von dem Takt-Modul unter Verwendung einer beliebigen Kombination von Hardware- und/oder Software-Elementen implementiert sein können. In einem Beispiel können die Elemente unter Verwendung von Computer-Anweisungen, implementiert auf beliebigem Typ von Verarbeitungs-Vorrichtung (z.B. einem Mikroprozessor), implementiert werden.
  • Der Takt-Detekt-Block 702 empfängt den äußeren Takt und berechnet ein Teilungs-Verhältnis 720 und einen Dezimierungs-Faktor 722, wie nachstehend beschrieben. Der innere Takt 704 stellt ein Hoch-Frequenz-Signal bereit, während der äußere Takt 710 ein Nieder-Frequenz-Signal bereitstellt. Der programmierbare Dividierer 706 vermindert die Frequenz von dem inneren Takt 704. Der Decimator 708 wandelt 1 Bit PDM-Daten zu PCM-Daten mit einer Frequenz, ermittelt durch den Dezimierungs-Faktor, um. Der Decimator 708 kann einen oder mehrere Filter einschließen.
  • Die Ladungspumpe 714 liefert Spannung für das Mikrofon 713. Das Mikrofon 713 kann MEMS-Sensoren, piezoelektrischer Sensor oder beliebiger anderer Typ von Fühlelement sein. Der Sigma-Delta-Wandler 712 wandelt das Analog-Signal von dem Mikrofon 714 in ein Digital-Signal zur Verwendung durch den Decimator 708 um.
  • In einem Beispiel des Vorgangs von dem Takt-Modul 700 liefert der innere Takt 704 ein 12,288 MHz inneres Takt-Signal. Der Takt-Detekt-Block 702 enthält in einem Aspekt einen Zähler, der innere Takt-Pulse zählt. Wenn ein Signal von dem äußeren Takt 710 an den Takt-Detekt-Block 702 angelegt wird, wird der Zähler zählen, wie viele innere Takte innerhalb eines äußeren Takt-Impulses pulsen. Der innere Takt 704 muss höhere Frequenz als der äußere Takt 710 aufweisen. In diesem Beispiel ist der äußere Takt 710 ein 512kHz Takt und wird an den äußeren Takt-Pin von dem Takt-Modul 700 angelegt.
  • Der Takt-Detekt-Block 702 zählt nun, wie viele innere Takt-Pulse innerhalb eines äußeren Takt-Zyklus vorliegen. In diesem Fall 12 288 000 / 512 000 = 24 Takte. Ist es einmal bestätigt, dass das Herunter-Dividier-Verhältnis tatsächlich 24 ist, wird der programmierbare Dividierer 706 mit der Zahl 24 programmiert. An diesem Punkt ist das innere Takt-Signal nun 512 000 Hz. Dieses innere Takt-Signal, wenn modifiziert durch den programmierbaren Dividierer 706, wird den Decimator 708 takten.
  • Basierend auf der gewünschten Output-Daten-Rate (die vorher bestimmte gewünschte Sampling-Frequenz) und um ein Beispiel zu nehmen, werden 16kHz Daten bei 16 Bits (jedoch wird Wert darauf gelegt, dass dies eine beliebige andere Frequenz und Bit-Länge sein könnte) benötigt, um die nächste Stufe des Systems bei dem Puffer 716 zu speisen.
  • Der Takt-Detekt-Block 702 nimmt das innere Takt-Signal und die vorher bestimmte gewünschte Sampling-Frequenz zur Ermittlung des Dezimierungs-Faktors (Verhältnis) 722 von dem Decimator 708. In einem Beispiel ist eine 16 000 Hz Sample-Rate erforderlich und der Takt-Detekt-Block 702 wird 512 000 / 16 000 dividieren, um einen Dezimierungs-Faktor von 32 zu erhalten.
  • Der Takt-Detekt-Block 702 programmiert den Decimator 708 mit einem 32x Dezimierungs-Faktor (Verhältnis) 722 und stellt Filter innerhalb des Decimators 708 zum Bereitstellen von Daten bei einer 16kHz Rate ein.
  • Bevorzugte Ausführungsformen von dieser Erfindung werden hierin beschrieben, einschließlich der besten den Erfindern bekannten Art zum Ausführen der Erfindung. Es sollte verständlich sein, dass die erläuterten Ausführungsformen nur beispielhaft sind und nicht als für den Umfang der Erfindung begrenzend angenommen werden sollten.

Claims (20)

  1. Verfahren in einem Mikrofon (100), wobei das Verfahren umfasst: Erzeugen analoger Signale unter Verwendung eines akustischen Sensors (102) des Mikrofons (100); Umwandlung der analogen Signale zu digitalisierten Daten unter Verwendung eines Analog-zu-Digital-Wandlers (106) des Mikrofons (100); Ermitteln innerhalb der digitalisierten Daten, ob akustische Aktivität vorliegt, unter Verwendung eines Sprach-Aktivitäts-Detektors (108) des Mikrofons (100); nach Detektion akustischer Aktivität, Bereitstellen eines Hinweises auf akustische Aktivität bei einem äußeren Vorrichtungs-Interface (119) des Mikrofons (100), wobei das äußere Vorrichtungs-Interface (119) standardisiert ist zur Kompatibilität mit einer Mehrzahl von Vorrichtungen unterschiedlicher Hersteller; vor Detektieren von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem ersten Modus durch Takten mindestens eines Teils des Mikrofons (100) mit einem inneren Takt-Signal, basierend auf einem lokalen Oszillator des Mikrofons (100) während des Ermittelns, ob akustische Aktivität vorliegt; nach Detektieren von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem zweiten Modus durch Bereitstellen digitalisierter Daten bei dem äußeren Vorrichtungs-Interface (119), wobei digitalisierte Daten bei dem äußeren Vorrichtungs-Interface (119) in dem ersten Modus nicht vorgesehen sind; Bereitstellen digitaler Daten auf dem äußeren Vorrichtungs-Interface (119) des Mikrofons (100) für einen ausgewiesenen Zeitraum nach Ermitteln, dass Sprach-Aktivität nicht mehr vorliegt, vor Abbruch des Bereitstellens digitaler Daten auf dem äußeren Vorrichtungs-Interface (119).
  2. Verfahren nach Anspruch 1, wobei das Betreiben des Mikrofons (100) in dem zweiten Modus das Synchronisieren der digitalisierten Daten bei dem äußeren Vorrichtungs-Interface (119) mit entweder dem inneren Takt-Signal oder einem äußeren Takt-Signal, empfangen bei dem äußeren Vorrichtungs-Interface (119), einschließt.
  3. Verfahren nach Anspruch 1, weiterhin umfassend: Empfang eines äußeren Takt-Signals an dem äußeren Vorrichtungs-Interface (119) in Antwort auf das Bereitstellen des Hinweises auf akustische Aktivität bei dem äußeren Vorrichtungs-Interface (119), wobei digitalisierte Daten bereitgestellt bei dem äußeren Vorrichtungs-Interface (119) mit dem äußeren Takt-Signal synchronisiert werden, wenn das äußere Takt-Signal an dem äußeren Vorrichtungs-Interface (119) vorliegt.
  4. Verfahren nach Anspruch 3, weiterhin umfassend: Überführen des Mikrofons (100) vom Betreiben im zweiten Modus zum Betreiben im ersten Modus nachdem akustische Aktivität nicht mehr detektiert wurde, wobei der erste Modus einen geringeren Leistungs-Verbrauch aufweist als der zweite Modus.
  5. Verfahren nach Anspruch 1, weiterhin umfassend: Bereitstellen eines Hinweises auf akustische Aktivität bei dem äußeren Vorrichtungs-Interface (119) durch Bereitstellen des inneren Takt-Signals bei dem äußeren Vorrichtungs-Interface (119), wobei das Betreiben des Mikrofons (100) in dem zweiten Modus ein Synchronisieren digitalisierter Daten, bereitgestellt bei dem äußeren Vorrichtungs-Interface (119), mit dem inneren Takt-Signal einschließt, Empfang eines äußeren Takt-Signals bei dem äußeren Vorrichtungs-Interface (119) in Antwort auf das Bereitstellen des inneren Takt-Signals, Synchronisieren digitalisierter Daten, bereitgestellt bei dem äußeren Vorrichtungs-Interface (119), mit dem äußeren Takt-Signal nach Empfang des äußeren Takt-Signals bei dem äußeren Vorrichtungs-Interface (119).
  6. Verfahren in einem Mikrofon (100), wobei das Verfahren umfasst: Erzeugen eines analogen Signals in Antwort auf akustischen Input bei einem akustischen Sensor (102) des Mikrofons (100); Umwandlung des analogen Signals zu digitalen Daten; Ermitteln, ob Sprach-Aktivität vorliegt, durch Ausführen von Sprach-Aktivitäts-Detektion an den digitalen Daten; dem Detektieren vor von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem ersten Modus durch Ausführen von Sprach-Aktivitäts-Detektion unter Verwendung eines inneren Takt-Signals, erzeugt von einem lokalen Oszillator des Mikrofons (100); nach dem Detektieren von Sprach-Aktivität, Betreiben des Mikrofons (100) in einem zweiten Modus durch Bereitstellen digitaler Daten an einem äußeren Vorrichtungs-Interface (119) des Mikrofons (100), wobei das äußere Vorrichtungs-Interface (119) standardisiert ist zur Kompatibilität mit Vorrichtungen unterschiedlicher Hersteller, wobei das äußere Vorrichtungs-Interface (119) des Mikrofons (100) in dem ersten Modus frei von digitalen Daten ist; Bereitstellen digitaler Daten auf dem äußeren Vorrichtungs-Interface (119) des Mikrofons (100) für einen ausgewiesenen Zeitraum nach Ermitteln, dass Sprach-Aktivität nicht mehr vorliegt, vor Abbruch des Bereitstellens digitaler Daten auf dem äußeren Vorrichtungs-Interface (119).
  7. Verfahren nach Anspruch 6, wobei das äußere Vorrichtungs-Interface (119) eine Takt-Verbindung, eine Select-Verbindung und eine Daten-Verbindung enthält, Empfang eines äußeren Takt-Signals auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) in Antwort auf das Bereitstellen eines Signals auf der Select-Verbindung des äußeren Vorrichtungs-Interface (119) nach dem Detektieren von Sprach-Aktivität, Bereitstellen digitaler Daten auf der Daten-Verbindung des äußeren Vorrichtungs-Interface (119) unter Verwendung des äußeren Takt-Signals nach Empfang des äußeren Takt-Signals.
  8. Verfahren nach Anspruch 7, weiterhin umfassend: Überführen des Mikrofons (100) von Betreiben in dem zweiten Modus zum Betreiben in dem ersten Modus, wenn das äußere Takt-Signal nicht mehr auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) empfangen wird.
  9. Verfahren nach Anspruch 6, weiterhin umfassend Puffern digitaler Daten während des Ausführens von Sprach-Aktivitäts-Detektion an den digitalen Daten, Bereitstellen mindestens einiger der gepufferten digitalen Daten auf dem äußeren Vorrichtungs-Interface (119) des Mikrofons (100) nach Detektieren von Sprach-Aktivität.
  10. Verfahren nach Anspruch 6, wobei das äußere Vorrichtungs-Interface (119) eine Daten-Verbindung und eine Select-Verbindung enthält, Bereitstellen digitaler Daten auf der Daten-Verbindung des äußeren Vorrichtungs-Interface (119) und Bereitstellen des inneren Takt-Signals auf der Select-Verbindung des äußeren Vorrichtungs-Interface (119) nach dem Detektieren von Sprach-Aktivität.
  11. Verfahren nach Anspruch 10, weiterhin umfassend: Empfang eines äußeren Takt-Signals auf dem äußeren Vorrichtungs-Interface (119) während des Bereitstellens digitaler Daten bei dem äußeren Vorrichtungs-Interface (119) unter Verwendung des inneren Takt-Signals, Synchronisieren digitaler Daten, bereitgestellt auf dem äußeren Vorrichtungs-Interface (119), mit dem äußeren Takt-Signal nach Empfang des äußeren Takt-Signals auf dem äußeren Vorrichtungs-Interface (119).
  12. Mikrofon-Einrichtung (100), umfassend: einen akustischen Sensor (102) mit einem Output, wobei ein analoges Signal auf dem akustischen Sensor-Output in Antwort auf einen akustischen Input bei dem akustischen Sensor (102) erzeugt wird; einen Analog-zu-Digital-Wandler (106), gekoppelt an den akustischen Sensor-Output, wobei der Analog-zu-Digital-Wandler (106) einen Output mit digitalen Daten aufweist, wobei die digitalen Daten auf dem analogen Signal bei dem akustischen Sensor-Output basieren; einen Sprach-Aktivitäts-Detektor (108), gekoppelt an den Output des Analog-zu-Digital-Wandlers (106); einen Controller (112) mit einem Input und einem Output, wobei der Input des Controllers (112) an den Output des Analog-zu-Digital-Wandlers (106) gekoppelt ist, einen lokalen Oszillator; ein äußeres Vorrichtungs-Interface (119), standardisiert zur Kompatibilität mit Vorrichtungen von unterschiedlichen Herstellern, wobei das äußere Vorrichtungs-Interface (119) an den Controller-Output gekoppelt ist, wobei das Mikrofon (100) einen ersten Betriebs-Modus aufweist, bevor Sprach-Aktivität detektiert wird, mindestens ein Teil des Mikrofons (100) durch ein inneres Takt-Signal des lokalen Oszillators getaktet wird, während der Sprach-Aktivitäts-Detektion in dem ersten Betriebs-Modus, wobei das Mikrofon (100) einen zweiten Betriebs-Modus aufweist, nachdem Sprach-Aktivität detektiert wurde, der Controller-Output an das äußere Vorrichtungs-Interface (119) gekoppelt ist, wobei digitale Daten auf dem Controller-Output bei dem äußeren Vorrichtungs-Interface (119) in dem zweiten Betriebs-Modus bereitgestellt werden, wobei das äußere Vorrichtungs-Interface (119) in dem ersten Betriebs-Modus frei von digitalen Daten ist; wobei digitale Daten auf dem äußeren Vorrichtungs-Interface (119) des Mikrofons (100) für einen ausgewiesenen Zeitraum nach einem Ermitteln, dass Sprach-Aktivität nicht mehr vorliegt, vor Abbruch des Bereitstellens digitaler Daten auf dem äußeren Vorrichtungs-Interface (119) bereitgestellt werden.
  13. Mikrofon-Einrichtung (100) nach Anspruch 12, wobei das äußere Vorrichtungs-Interface (119) eine Takt-Verbindung, eine Select-Verbindung und eine Daten-Verbindung enthält, der Controller-Output an die Select-Verbindung des äußeren Vorrichtungs-Interface (119) gekoppelt ist, nachdem Sprach-Aktivität detektiert wird, wobei ein Signal an dem Controller-Output auf der Select-Verbindung des äußeren Vorrichtungs-Interface (119) bereitgestellt wird, in dem zweiten Betriebs-Modus, der Controller-Output an die Daten-Verbindung des äußeren Vorrichtungs-Interface (119) gekoppelt ist, wobei digitale Daten auf dem Controller-Output auf der Daten-Verbindung bereitgestellt werden, und wobei digitale Daten auf der Daten-Verbindung des äußeren Vorrichtungs-Interface (119) mit einem äußeren Takt-Signal auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) synchronisiert werden.
  14. Mikrofon-Einrichtung (100) nach Anspruch 13, wobei der Controller-Output an die Select-Verbindung des äußeren Vorrichtungs-Interface (119) gekoppelt ist, nachdem Sprach-Aktivität detektiert wurde, wobei ein Signal auf dem Controller-Output bei der Select-Verbindung des äußeren Vorrichtungs-Interface (119) bereitgestellt wird und wobei das äußere Takt-Signal auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) in Antwort auf das Signal auf der Select-Verbindung bereitgestellt wird.
  15. Mikrofon-Einrichtung (100) nach Anspruch 13, wobei das Mikrofon (100) von dem zweiten zu dem ersten Betriebs-Modus überführt wird, wenn das äußere Takt-Signal von der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) entfernt ist.
  16. Mikrofon-Einrichtung (100) nach Anspruch 12, weiterhin umfassend: einen Puffer (110) mit einem Input und einem Output, wobei der Puffer-Input an den Output des Analog-zu-Digital-Wandlers (106) gekoppelt ist, der Puffer-Output an den Controller-Input gekoppelt ist, wobei digitale Daten in dem Puffer (110) während Sprach-Aktivitäts-Detektion gepuffert werden, in dem zweiten Modus, gepufferte digitale Daten auf dem Controller-Output bei dem äußeren Vorrichtungs-Interface (119) bereitgestellt werden, nachdem Sprach-Aktivität detektiert wird.
  17. Mikrofon-Einrichtung (100) nach Anspruch 12, wobei das äußere Vorrichtungs-Interface (119) eine Daten-Verbindung und eine Select-Verbindung enthält, in dem zweiten Modus, der Controller-Output an die Select-Verbindung gekoppelt ist, nachdem Sprach-Aktivität detektiert worden ist, wobei das innere Takt-Signal auf der Select-Verbindung des äußeren Vorrichtungs-Interface (119) bereitgestellt wird, die digitalen Daten bei dem äußeren Vorrichtungs-Interface (119) mit dem inneren Takt-Signal synchronisiert werden.
  18. Mikrofon-Einrichtung (100) nach Anspruch 17, wobei das äußere Vorrichtungs-Interface (119) eine Takt-Verbindung enthält, in dem zweiten Modus, digitale Daten auf der Daten-Verbindung des äußeren Vorrichtungs-Interface (119) mit einem äußeren Takt-Signal synchronisiert werden, bereitgestellt auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) in Antwort auf das Signal auf der Select-Verbindung des äußeren Vorrichtungs-Interface (119).
  19. Mikrofon-Einrichtung (100) nach Anspruch 18, weiterhin umfassend: Synchronisation der digitalen Daten mit dem inneren Takt-Signal, überführt zu dem äußeren Takt-Signal, wenn das äußere Takt-Signal auf der Takt-Verbindung des äußeren Vorrichtungs-Interface (119) vorliegt.
  20. Mikrofon-Einrichtung (100) nach Anspruch 12, wobei das äußere Vorrichtungs-Interface (119) mit mindestens einem von einem PDM-Protokoll, einem IIS-Protokoll, oder einem 12C Protokoll kompatibel ist.
DE112014005087.3T 2013-11-08 2014-11-06 Mikrofon-Einrichtung und Verfahren in einem Mikrofon Active DE112014005087B4 (de)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201361901832P 2013-11-08 2013-11-08
US61/901,832 2013-11-08
US14/282,101 2014-05-20
US14/282,101 US9712923B2 (en) 2013-05-23 2014-05-20 VAD detection microphone and method of operating the same
US14/533,674 2014-11-05
US14/533,690 2014-11-05
US14/533,690 US9711166B2 (en) 2013-05-23 2014-11-05 Decimation synchronization in a microphone
US14/533,652 US10020008B2 (en) 2013-05-23 2014-11-05 Microphone and corresponding digital interface
US14/533,674 US9111548B2 (en) 2013-05-23 2014-11-05 Synchronization of buffered data in multiple microphones
US14/533,652 2014-11-05
PCT/US2014/064324 WO2015069878A1 (en) 2013-11-08 2014-11-06 Microphone and corresponding digital interface

Publications (2)

Publication Number Publication Date
DE112014005087T5 DE112014005087T5 (de) 2016-07-28
DE112014005087B4 true DE112014005087B4 (de) 2021-04-22

Family

ID=53042070

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112014005087.3T Active DE112014005087B4 (de) 2013-11-08 2014-11-06 Mikrofon-Einrichtung und Verfahren in einem Mikrofon

Country Status (4)

Country Link
KR (1) KR20160083904A (de)
CN (1) CN106104686B (de)
DE (1) DE112014005087B4 (de)
WO (1) WO2015069878A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101718214B1 (ko) * 2015-06-09 2017-03-20 한국과학기술원 사물인터넷용 초저전력 유연압전 음성인식 센서
KR20210056278A (ko) 2019-11-08 2021-05-18 한국전기연구원 음성-음향 신호 감지 장치
US11862189B2 (en) 2020-04-01 2024-01-02 Qualcomm Incorporated Method and apparatus for target sound detection

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130029684A1 (en) * 2011-07-28 2013-01-31 Hiroshi Kawaguchi Sensor network system for acuiring high quality speech signals and communication method therefor
WO2014189931A1 (en) * 2013-05-23 2014-11-27 Knowles Electronics, Llc Vad detection microphone and method of operating the same

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8910981D0 (en) * 1989-05-12 1989-06-28 Hi Med Instr Limited Digital waveform encoder and generator
GB2296170A (en) * 1994-12-16 1996-06-19 Ibm Audio communication apparatus
DE19546168C1 (de) * 1995-12-11 1997-02-20 Siemens Ag Digitale Signalprozessor-Anordnung zum Vergleich von Merkmalsvektoren und deren Verwendung sowie zugehöriges Betriebsverfahren
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
US6934682B2 (en) * 2001-03-01 2005-08-23 International Business Machines Corporation Processing speech recognition errors in an embedded speech recognition system
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US20050078841A1 (en) * 2003-10-14 2005-04-14 Boor Steven E. Method and apparatus for resetting a buffer amplifier
EP2359361B1 (de) * 2008-10-30 2018-07-04 Telefonaktiebolaget LM Ericsson (publ) Telefonieinhaltssignalunterscheidung
US8626498B2 (en) * 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
CN102568480A (zh) * 2010-12-27 2012-07-11 深圳富泰宏精密工业有限公司 双模手机语音传输系统
CN102983868B (zh) * 2012-11-02 2015-01-28 小米科技有限责任公司 信号处理方法、装置及系统
CN103117065B (zh) * 2013-01-09 2015-09-30 上海大唐移动通信设备有限公司 平均意见评分语音测试装置及其控制方法、语音测试方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130029684A1 (en) * 2011-07-28 2013-01-31 Hiroshi Kawaguchi Sensor network system for acuiring high quality speech signals and communication method therefor
WO2014189931A1 (en) * 2013-05-23 2014-11-27 Knowles Electronics, Llc Vad detection microphone and method of operating the same

Also Published As

Publication number Publication date
CN106104686B (zh) 2019-12-31
CN106104686A (zh) 2016-11-09
DE112014005087T5 (de) 2016-07-28
WO2015069878A1 (en) 2015-05-14
KR20160083904A (ko) 2016-07-12

Similar Documents

Publication Publication Date Title
US9111548B2 (en) Synchronization of buffered data in multiple microphones
US10332544B2 (en) Microphone and corresponding digital interface
EP2392148B1 (de) Mikrofonbauelement und verfahren zum betreiben eines solchen
US9711166B2 (en) Decimation synchronization in a microphone
DE102015103419A1 (de) System und Verfahren für ein Wandlersystem mit Aufweckdetektion
DE112014005087B4 (de) Mikrofon-Einrichtung und Verfahren in einem Mikrofon
KR101412824B1 (ko) 데이터버스를 구비한 2-부품 eeg 모니터와, 부품들 간의 통신 방법
DE112019000884T5 (de) Systeme und verfahren für einen geringen stromverbrauch durch ein drahtloses sensorgerät
DE112017006411T5 (de) Ständig aufnahmebereite sprachbefehlserkennung und -erfassung mit niedriger leistungsaufnahme
CN103702404B (zh) 功耗模式切换方法及装置
WO2004012132A3 (en) A patient medical parameter acquisition and distribution system
WO2009109642A1 (de) Notrufsystem
DE102014217597A1 (de) Unterwasser-Kommunikationssystem und entsprechende Kommunikationsverfahren und Geräte
WO2016026316A1 (zh) 一种语音唤醒方法及设备
EP1926343A1 (de) Hörvorrichtung mit automatischer Ausschaltung und entsprechendes Verfahren
US9961440B2 (en) Systems and methods for using electrostatic microphone
CN111426115A (zh) 一种冰箱食材管理装置及方法
CN203233539U (zh) 一种助听器上的无线动态接收显示系统
DE102019218616A1 (de) Verfahren zum Betrieb eines Hörsystems, Hörsystem und Computerprogrammprodukt
DE102014217085A1 (de) Hörhilfegerät sowie Verfahren zum Betrieb des Hörhilfegeräts mit einer Kommunikationsvorrichtung
EP3319337A1 (de) Verfahren zur takterkennung mittels eines hörgerätes
EP3668105B1 (de) Synchronisation in einem sensornetzwerk
CN107181998A (zh) 音响音量控制系统和方法
WO2007077090A1 (de) Drahtlose kommunikationsvorrichtung
CN110310635B (zh) 语音处理电路及电子设备

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final