DE102020208206A1 - Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität - Google Patents

Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität Download PDF

Info

Publication number
DE102020208206A1
DE102020208206A1 DE102020208206.5A DE102020208206A DE102020208206A1 DE 102020208206 A1 DE102020208206 A1 DE 102020208206A1 DE 102020208206 A DE102020208206 A DE 102020208206A DE 102020208206 A1 DE102020208206 A1 DE 102020208206A1
Authority
DE
Germany
Prior art keywords
signal
criterion
sensor unit
voice activity
inertial sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020208206.5A
Other languages
English (en)
Inventor
Sergej Scheiermann
Rainer Dorsch
Omar Elrhoul
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102020208206.5A priority Critical patent/DE102020208206A1/de
Priority to US17/340,404 priority patent/US20220005495A1/en
Priority to CN202110743348.XA priority patent/CN113884176A/zh
Publication of DE102020208206A1 publication Critical patent/DE102020208206A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H1/00Measuring characteristics of vibrations in solids by using direct conduction to the detector
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P15/00Measuring acceleration; Measuring deceleration; Measuring shock, i.e. sudden change of acceleration
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P15/00Measuring acceleration; Measuring deceleration; Measuring shock, i.e. sudden change of acceleration
    • G01P15/18Measuring acceleration; Measuring deceleration; Measuring shock, i.e. sudden change of acceleration in two or more dimensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P3/00Measuring linear or angular speed; Measuring differences of linear or angular speeds
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

Die Erfindung betrifft eine Inertialsensoreinheit, mindestens umfassend ein Sensorelement zum Erfassen und Umwandeln von Bewegungen und Vibrationen in ein elektrisches Sensorsignal, Signalverarbeitungsmittel zur Auswertung des Sensorsignals, insbesondere mit dem Ziel der Detektion von Vibrationen, die durch eine Sprachaktivität hervorgerufen werden, und eine Schnittstelle zum Signalisieren einer detektierten Sprachaktivität, wobei die Signalverarbeitungsmittel eine erste Verarbeitungsstufe und eine zweite Verarbeitungsstufe für das Sensorsignal umfassen, wobei die erste Verarbeitungsstufe dafür ausgelegt ist, ein erstes Kriterium für das Vorliegen einer Sprachaktivität zu prüfen und die zweite Verarbeitungsstufe dafür ausgelegt ist, mindestens ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität zu prüfen, wobei die zweite Verarbeitungsstufe nur durchlaufen wird, wenn das Sensorsignal die erste Verarbeitungsstufe durchlaufen hat und das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, und wobei die Signalverarbeitungsmittel dafür ausgelegt sind, die Schnittstelle nur dann zum Signalisieren einer Sprachaktivität anzusteuern, wenn das Sensorsignal die zweite Verarbeitungsstufe durchlaufen hat und das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.

Description

  • Die Erfindung betrifft eine Inertialsensoreinheit und ein Verfahren zum Detektieren einer Sprachaktivität mit Hilfe einer Inertialsensoreinheit. Insbesondere betrifft die Erfindung eine Inertialsensoreinheit für ein am Kopf tragbares Gerät.
  • Stand der Technik
  • Beschleunigungssensoren (Akzelerometer) können bei der Sprachaktivitätserkennung zum Einsatz kommen, um die Qualität der Spracherkennung zu verbessern. Die Signale der Beschleunigungssensoren können etwa verwendet werden, um das Signal-zu-Rauschverhältnis zu verbessern oder um eine automatische Verstärkungsregelung durchzuführen.
  • Aus der US 2017/263267 A1 sind ein System und ein Verfahren zur Durchführung einer automatischen Verstärkungsregelung unter Verwendung eines Beschleunigungssensors in einem Kopfhörer bekannt. Hierbei wird ein Sprachsignal durch die Auswertung der Beschleunigungssignale des Beschleunigungssensors detektiert. In einem ersten Schritt erfolgt dabei eine Signalvorverarbeitung mittels Hochpass- und Tiefpassfilter. In einem zweiten Schritt erfolgt die Auswertung des Beschleunigungssignals durch einen Schwellenvergleich der absoluten Amplitude bzw. extrahierten Hüllkurve. Die Spracherkennung kann durch Schwellenvergleich der Korrelation der Beschleunigungssignale bezüglich zweier Achsen über ein kurzes Zeitfenster erfolgen.
  • Die US 2013/196715 A1 betrifft eine angepasste Rauschunterdrückung für eine Sprachaktivitätserkennung.
  • Aus der US 10397687 B2 ist eine Signalverarbeitungsvorrichtung zur Ohrhörer-Spracherkennung bekannt. Hierbei werden Sprachcharakteristika auf Basis von Signalen von Beschleunigungssensoren ermittelt. Ein Mikrofonsignal wird anhand der ermittelten Sprachcharakteristika angesteuert, etwa durch Verwenden von Kalmanfiltern, durch Signal-zu-Rausch-Verhältnis-Schätzung und dergleichen.
  • Die US 2014/093091 A1 bezieht sich auf ein System zur Erkennung der Sprachaktivität eines Benutzers unter Verwendung eines Beschleunigungssensors. Sowohl die Signale von Beschleunigungssensoren als auch die Signale von Mikrofonen werden bei der Sprachaktivitätserkennung berücksichtigt.
  • US 2017/365249 A1 betrifft ein System zur Durchführung automatischer Spracherkennung unter Verwendung von Endpunktmarkierungen, die mit Hilfe eines auf einem Beschleunigungssensor basierenden Sprachaktivitätsdetektors erzeugt werden. Die Sprachaktivitätserkennung erfolgt anhand von Signalen von Beschleunigungssensoren sowie von Signalen von Mikrofonen.
  • Bei batterie- bzw. akkubetriebenen Geräten, etwa Ohrhörern, erfordern mikrofonbasierte Systeme, welche zur Schlüsselworterkennung oder Spracherkennung dauerhaft Audiodaten erfassen, einen hohen Energieaufwand, welcher zur Datenerfassung und Sprachverarbeitung benötigt wird. Die Spracherkennungsalgorithmen laufen hierbei normalerweise auf externen digitalen Signalprozessoren (englisch: digital signal processor, DSP), welche Signale von Mikrofonen und Beschleunigungssensoren kombinieren.
  • Weiter kommt hinzu, dass auf Mikrofonen basierende Sprachaktivitätserkennung aufgrund der bestehenden Störgeräusche insbesondere in lauten Umgebungen anfällig für fehlerhafte Spracherkennung ist.
  • Offenbarung der Erfindung
  • Die Erfindung betrifft eine Inertialsensoreinheit und ein Verfahren zum Detektieren einer Sprachaktivität mit Hilfe einer Inertialsensoreinheit mit den Merkmalen der unabhängigen Patentansprüche.
  • Bevorzugte Ausführungsformen sind Gegenstand der jeweiligen Unteransprüche.
  • Gemäß einem ersten Aspekt betrifft die Erfindung demnach eine Inertialsensoreinheit. Die Inertialsensoreinheit umfasst ein Sensorelement zum Erfassen und Umwandeln von Bewegungen und Vibrationen in ein elektrisches Sensorsignal. Die Inertialsensoreinheit umfasst weiter Signalverarbeitungsmittel zur Auswertung des Sensorsignals, insbesondere mit dem Ziel der Detektion von Vibrationen, die durch eine Sprachaktivität hervorgerufen werden. Weiter umfasst die Inertialsensoreinheit eine Schnittstelle zum Signalisieren einer detektierten Sprachaktivität. Die Signalverarbeitungsmittel umfassen eine erste Verarbeitungsstufe und eine zweite Verarbeitungsstufe für das Sensorsignal, wobei die erste Verarbeitungsstufe dafür ausgelegt ist, ein erstes Kriterium für das Vorliegen einer Sprachaktivität zu prüfen, und die zweite Verarbeitungsstufe dafür ausgelegt ist, mindestens ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität zu prüfen. Die zweite Verarbeitungsstufe wird nur durchlaufen, wenn das Sensorsignal die erste Verarbeitungsstufe durchlaufen hat und das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist. Die Signalverarbeitungsmittel sind dafür ausgelegt, die Schnittstelle nur dann zum Signalisieren einer Sprachaktivität anzusteuern, wenn das Sensorsignal die zweite Verarbeitungsstufe durchlaufen hat und das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  • Gemäß einem zweiten Aspekt betrifft die Erfindung demnach ein Verfahren zum Detektieren einer Sprachaktivität mit Hilfe einer Inertialsensoreinheit, die mindestens ein Sensorelement, Signalverarbeitungsmittel und eine Schnittstelle zum Signalisieren einer detektierten Sprachaktivität umfasst. Bewegungen und Vibrationen werden von dem mindestens einen Sensorelement erfasst und in mindestens ein elektrisches Sensorsignal umgewandelt. Das Sensorsignal wird mit Hilfe der Signalverarbeitungsmittel ausgewertet. Ein erstes Kriterium für das Vorliegen einer Sprachaktivität wird geprüft. Nur dann, wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, wird mindestens ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität geprüft. Die Schnittstelle wird nur dann zum Signalisieren einer Sprachaktivität angesteuert, wenn das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  • Vorteile der Erfindung
  • Die Erfindung stellt eine besonders stromsparende Inertialsensoreinheit bereit. Die Auswertung der von dem Sensorelement generierten Sensorsignale erfolgt zweistufig. Im ersten Schritt erfolgt durch die erste Verarbeitungsstufe eine Auswertung basierend auf den aktuellen Messdaten. Hierbei handelt es sich um eine einfache Auswertung, etwa durch den Schwellenvergleich des aktuellen Messpunktes. Erst falls das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, wird in einem zweiten Schritt durch die zweite Verarbeitungsstufe eine komplexere Auswertungsmethode angewandt. Hierbei können etwa gespeicherte Werte aus einem Buffer berücksichtigt werden.
  • Erfindungsgemäß werden demnach mindestens zwei Auswertungsmethoden zeitvariabel verwendet. Die erste Auswertungsmethode kann auf dem aktuellen Datenpunkt basieren, die zweite auf mehreren Datenpunkten im Buffer. Die Speicherung und die Auswertung der Daten im Buffer erfolgt erst nach Erfüllung des ersten Kriteriums der ersten Auswertungsmethode.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit sind mindestens zwei Sensorelemente für das Erfassen von Bewegungen und Vibrationen in unterschiedlichen Raumrichtungen vorgesehen. Insbesondere kann die Inertialsensoreinheit Sensorelemente umfassen, welche Beschleunigungen bzw. Drehungen entlang bzw. um verschiedene Achsen erfassen.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit sind mindestens ein Beschleunigungssensorelement (Akzelerometer) und/oder mindestens ein Drehratensensorelement vorgesehen. Die Inertialsensoreinheit kann 2-Achsen- oder 3-Achsen-Akzelerometer und/oder Drehratensensoren umfassen.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit umfassen die Signalverarbeitungsmittel ferner mindestens einen Signalfilter zur Vorverarbeitung des Sensorsignals, insbesondere einen Hochpassfilter und/oder einen Bandpassfilter, und mindestens einen Analog/Digital-Wandler für das Sensorsignal. Der Signalfilter kann variable Filterparameter aufweisen. Der Analog/Digital-Wandler kann eine variable Abtastrate aufweisen. Der Signalfilter kann ausgebildet sein, Beschleunigungssignale zu unterdrücken bzw. zu filtern, welche nicht durch die Sprachaktivität sondern durch die Bewegung des Benutzers entstehen.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit sind unterschiedliche Betriebsmodi realisierbar, indem einzelne Komponenten der Inertialsensoreinheit wahlweise aktivierbar bzw. abschaltbar sind und/oder in unterschiedlichen Betriebsmodi betreibbar sind. Beispielsweise können Sensorkomponenten achsenweise aktivierbar bzw. abschaltbar sein oder die zweite Verarbeitungsstufe kann aktivierbar bzw. abschaltbar sein. Zusätzlich oder alternativ kann beispielsweise der Analog/Digital-Wandler in unterschiedlichen Betriebsmodi betreibbar sein. Im ersten Betriebsmodus wird die Inertialsensoreinheit somit besonders stromsparend betrieben. Gemäß einer Ausführungsform der Inertialsensoreinheit kann dies durch eine niedrige Datenrate, eine niedrige Überabtastungsrate (englisch: Over-Sampling-Rate, OSR) oder durch die Messung nur unter Verwendung einer einzelnen Achse erreicht werden. Sobald das erste Kriterium erfüllt ist, kann die Inertialsensoreinheit automatisch in den zweiten Betriebsmodus übergehen. Erst dann speichert die Inertialsensoreinheit Messdaten in einen Buffer und sobald eine vordefinierte Anzahl der Messdatenpunkte gespeichert ist, erfolgt eine komplexere Auswertung des Buffer-Inhaltes. Ist das zweite Kriterium erfüllt, wird ein Signal über die Sprachdetektion erzeugt.
  • Eine stromsparende Implementierung wird dadurch gewährleistet, dass die Inertialsensoreinheit automatisch zwischen zwei Betriebsmodi umschaltet und somit eine variable, stromsparende Auswertung ermöglicht, die wenige Rechenoperationen erfordert aber auch durch die Abschaltung einzelnen Achsen oder durch die Konfiguration der Over-Sampling-Rate erreicht werden kann.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit wird in einem ersten Betriebsmodus die erste Verarbeitungsstufe der Signalverarbeitungsmittel im ersten Betriebsmodus betrieben und die zweite Verarbeitungsstufe abgeschaltet. In einem zweiten Betriebsmodus wird die erste Verarbeitungsstufe der Signalverarbeitungsmittel im zweiten Betriebsmodus betrieben und die zweite Verarbeitungsstufe ist aktiviert. Die Signalverarbeitungsmittel sind dafür ausgelegt, automatisch, in Abhängigkeit davon, ob das erste und/oder das zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt sind, zwischen dem ersten Betriebsmodus und dem zweiten Betriebsmodus umzuschalten.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit ist der Stromverbrach im ersten Betriebsmodus geringer als im zweiten Betriebsmodus. Im ersten Betriebsmodus kann mindestens ein Parameter wie folgt konfiguriert bzw. optimiert werden:
    • • Die Datenrate wird im Vergleich zum zweiten Betriebsmodus niedrig gewählt, etwa 2 kHz.
    • • Im Vergleich zum zweiten Betriebsmodus werden ein höheres Rauschniveau und eine kleinere Überabtastungsrate eingestellt.
    • • Nur eine aktive Achse des Sensorelements wird zur Auswertung herangezogen. Hierzu kann im Analog-Digital-Wandler nur ein Kanal aktiviert sein oder es kann nur ein Analog-Digital-Wandler aktiviert sein.
  • Im zweiten Betriebsmodus kann mindestens ein Parameter wie folgt konfiguriert bzw. optimiert werden:
    • • Die Datenrate wird im Vergleich zum ersten Betriebsmodus höher gewählt, etwa 4kHz oder 8kHz.
    • • Die Daten werden in einem aktivierten First-in-first-out-Speicher (FIFO) gespeichert.
    • • Mehrere Achsen des Sensorelements sind aktiviert. Beispielweise können zwei Achsen aktiviert sein, etwa X und Z, oder es können drei Achsen aktiviert sein, d. h. X, Y und Z.
    • • Im Vergleich zum ersten Betriebsmodus werden ein niedrigeres Rauschniveau und eine höhere Überabtastungsrate eingestellt. Die Konvertierungsrate kann im Vergleich zum ersten Betriebsmodus erhöht sein.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit umfasst die erste Verarbeitungsstufe zumindest einen Vergleicher, der die aktuelle Signalamplitude des Sensorsignals mit mindestens einem Schwellwert vergleicht, um zu bestimmen, ob das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist. Dadurch kann die Sprachaktivität von anderen Bewegungen des Benutzers unterschieden werden.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit umfasst die zweite Verarbeitungsstufe der Signalverarbeitungsmittel einen Buffer zum Zwischenspeichern einer definierten Anzahl von aufeinanderfolgenden Abtastwerten des Sensorsignals und Signalanalysemittel zum Ermitteln mindestens einer Signaleigenschaft auf Basis der zwischengespeicherten Abtastwerte und zum Vergleichen dieser mindestens einen Signaleigenschaft mit dem mindestens einen weiteren, zweiten Kriterium für das Vorliegen einer Sprachaktivität. Dadurch kann stromsparend erkannt werden, ob tatsächlich eine Sprachaktivität vorliegt.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit sind die Signalanalysemittel dafür ausgelegt, mindestens eine ermittelte Signaleigenschaft mit mindestens einem weiteren, dritten Kriterium zu vergleichen, um mindestens eine weitere Ursache für das Sensorsignal zu erkennen. Dadurch können weitere Ursachen, etwa Erschütterungen, Antippen des Gerätes durch Anwender oder Kratzbewegungen ausgeschlossen werden.
  • Gemäß einer weiteren Ausführungsform der Inertialsensoreinheit kann die Sprachaktivität einem externen System signalisiert werden. Dies kann etwa mittels eines Interruptverfahrens erfolgen. Beispielweise kann ein digitaler Signalprozessor (DSP) aufgeweckt werden. Die Inertialsensoreinheit kann dadurch das Gesamtsystem aufwecken, um den erforderlichen Datenverkehr zwischen DSP und einem Host-CPU zu verringern, indem sich etwa das DSP standardmäßig in einem Sleep-Modus befindet. Indem das Detektieren der Sprachaktivität in die Inertialsensoreinheit integriert wird, kann der Stromverbrauch reduziert werden. Weiter muss das Gesamtsystem nur dann aufgeweckt werden, falls eine Sprachaktivität detektiert wird.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität wird das Sensorsignal mit Hilfe der Signalverarbeitungsmittel vorverarbeitet und die Vorverarbeitung des Sensorsignals umfasst eine Signalfilterung, insbesondere eine Hochpassfilterung und/oder eine Bandpassfilterung, und eine Analog/Digital-Wandlung, bei der das analoge Sensorsignal abgetastet und digitalisiert wird, so dass das digitalisierte
  • Sensorsignal in Form einer Folge von Abtastwerten vorliegt.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität wird das erste Kriterium für das Vorliegen einer Sprachaktivität geprüft, indem die aktuelle Signalamplitude bzw. der aktuelle Abtastwert des Sensorsignals mit mindestens einem Schwellwert verglichen wird.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität wird als erstes Kriterium für das Vorliegen einer Sprachaktivität geprüft, ob die aktuelle Signalamplitude bzw. der aktuelle Abtastwert des Sensorsignals für eine vorgegebene Dauer größer als ein erster Schwellwert und/oder kleiner als ein zweiter Schwellwert sind.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität werden, wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, eine vorgegebene Anzahl N von aufeinanderfolgenden Abtastwerten des Sensorsignals in einem Buffer der Signalverarbeitungsmittel zwischengespeichert, mindestens eine Signaleigenschaft auf Basis der zwischengespeicherten Abtastwerte ermittelt und die mindestens eine Signaleigenschaft mit dem mindestens einen weiteren, zweiten Kriterium für das Vorliegen einer Sprachaktivität verglichen.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität wird, wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, mindestens eine ermittelte Signaleigenschaft mit mindestens einem weiteren, dritten Kriterium verglichen, um mindestens eine weitere Ursache für das Sensorsignal zu erkennen.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität wird die Inertialsensoreinheit in einem ersten Betriebsmodus betrieben, solange nur das erste Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, wobei die Inertialsensoreinheit in einem zweiten Betriebsmodus betrieben wird, wenn das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, und wobei automatisch, in Abhängigkeit davon, ob das erste und/ oder das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, zwischen dem ersten
  • Betriebsmodus und dem zweiten Betriebsmodus umgeschaltet wird.
  • Gemäß einer weiteren Ausführungsform des Verfahrens zum Detektieren einer Sprachaktivität werden die unterschiedlichen Betriebsmodi der Inertialsensoreinheit realisiert, indem einzelne Komponenten der Inertialsensoreinheit wahlweise aktiviert bzw. abgeschaltet werden und/oder in unterschiedlichen Betriebsmodi betreiben werden.
  • Figurenliste
  • Es zeigen:
    • 1 ein schematisches Blockschaltbild einer Inertialsensoreinheit gemäß einer Ausführungsform der Erfindung;
    • 2 eine schematische Darstellung zweier Betriebsmodi;
    • 3 eine schematische Abbildung von Beschleunigungssignalen, welche von einer Inertialsensoreinheit gemäß einer Ausführungsform der Erfindung erfasst werden;
    • 4 ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit gemäß einer Ausführungsform der Erfindung;
    • 5 ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit gemäß einer weiteren Ausführungsform der Erfindung; und
    • 6 ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit gemäß einer weiteren Ausführungsform der Erfindung.
  • Beschreibung der Ausführungsbeispiele
  • 1 zeigt ein schematisches Blockschaltbild einer Inertialsensoreinheit 1, welche beispielsweise in einem tragbaren Gerät, insbesondere einem Ohrhörer, Kopfhörer, Helm oder einer Smartbrille zum Einsatz kommen kann.
  • Die Inertialsensoreinheit 1 umfasst eine Vorrichtung 5 zur Energieverwaltung, einen Taktgeber 6 und eine Steuerungslogik 7. Weiter umfasst die Inertialsensoreinheit 1 eine Schnittstelle 4 zum Signalisieren einer detektierten Sprachaktivität. Die Inertialsensoreinheit 1 umfasst weiter mindestens ein Sensorelement 2 zum Erfassen und Umwandeln von Bewegungen und Vibrationen in ein elektrisches Sensorsignal. Beispielweise können Beschleunigungssensorelemente 2 zur Messung von Beschleunigungen entlang zueinander senkrechter Achsen X, Y und Z vorgesehen sein. Weiter können auch Drehratensensorelemente zum Messen von Drehungen um zueinander senkrechte Achsen X', Y', und Z' vorgesehen sein, wobei die Achsen zur Messung der Beschleunigungen und zur Messung der Drehungen identisch sein können. Es können somit Bewegungen und Vibrationen vorzugsweise in unterschiedlichen Raumrichtungen erfasst werden.
  • Die Inertialsensoreinheit 1 umfasst weiter Signalverarbeitungsmittel 3 zur Auswertung des Sensorsignals, insbesondere um Vibrationen zu detektieren, die durch eine Sprachaktivität hervorgerufen werden. Die Signalverarbeitungsmittel 3 umfassen einen Analog/Digital-Wandler 34, welcher die Sensorsignale des mindestens einen Sensorelement 2 digitalisiert. Der Analog/Digital-Wandler 34 kann eine variable Abtastrate aufweisen. Die von dem Analog-Digital-Wandler 34 ausgegebenen Signale werden durch einen Signalfilter 33 vorverarbeitet. Der Signalfilter 33 kann variable Filterparameter aufweisen. Der Signalfilter 33 kann einen Hochpassfilter und/oder einen Bandpassfilter umfassen.
  • Die Signalverarbeitungsmittel 3 umfassen eine erste Verarbeitungsstufe 31 und eine zweite Verarbeitungsstufe 32 für das Sensorsignal. Die erste Verarbeitungsstufe 31 prüft ein erstes Kriterium für das Vorliegen einer Sprachaktivität. Die zweite Verarbeitungsstufe 32 prüft ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität. Die zweite Verarbeitungsstufe 32 wird nur durchlaufen, wenn das Sensorsignal die erste Verarbeitungsstufe 31 durchlaufen hat und das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist. Die erste Verarbeitungsstufe 31 kann beispielsweise mittels eines Vergleichers feststellen, ob die aktuelle Signalamplitude des Sensorsignals einen Schwellenwert überschreitet. Ist dies der Fall, ist das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt.
  • Die Signalverarbeitungsmittel 3 sind dafür ausgelegt, die Schnittstelle 4 nur dann zum Signalisieren einer Sprachaktivität anzusteuern, wenn das Sensorsignal die zweite Verarbeitungsstufe 32 durchlaufen hat und das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  • Die zweite Verarbeitungsstufe 32 der Signalverarbeitungsmittel 3 umfasst einen Buffer 35 zum Zwischenspeichern einer definierten Anzahl von aufeinanderfolgenden Abtastwerten des Sensorsignals und Signalanalysemittel 36 zum Ermitteln mindestens einer Signaleigenschaft auf Basis der zwischengespeicherten Abtastwerte und zum Vergleichen dieser mindestens einen Signaleigenschaft mit dem mindestens einen weiteren, zweiten Kriterium für das Vorliegen einer Sprachaktivität. Die Signalanalysemittel 36 können weiter eine ermittelte Signaleigenschaft mit mindestens einem weiteren, dritten Kriterium vergleichen, um mindestens eine weitere Ursache für das Sensorsignal zu erkennen. Dadurch können weitere Ursachen, etwa Erschütterungen oder Kratzbewegungen ausgeschlossen werden. Die Signalanalysemittel 36 und die erste Verarbeitungsstufe 31 sind Teil einer Sprachaktivitätserfassungseinheit 37. Diese kann den Status der Sprachaktivität (detektiert/nicht detektiert) in Registern 8 speichern oder über eine Interrupt-Logik 9 ausgeben.
  • 2 zeigt eine schematische Darstellung zweier Betriebsmodi M1, M2 in welchen die Inertialsensoreinheit 1 betrieben werden kann. Hierbei können einzelne Komponenten der Inertialsensoreinheit 1 aktiviert, abgeschaltet oder in unterschiedlichen Betriebsmodi betrieben werden. Beispielsweise können Sensorelemente 2 achsenweise aktivierbar bzw. abschaltbar sein oder die zweite Verarbeitungsstufe 32 kann aktivierbar bzw. abschaltbar sein. Zusätzlich oder alternativ kann beispielsweise der Analog/Digital-Wandler 34 in unterschiedlichen Betriebsmodi M1, M2 betreibbar sein.
  • In dem ersten Betriebsmodus M1 kann die erste Verarbeitungsstufe 31 der Signalverarbeitungsmittel im ersten Betriebsmodus M1 betrieben und die zweite Verarbeitungsstufe 32 abgeschaltet werden. In einem zweiten Betriebsmodus M2 wird die erste Verarbeitungsstufe 31 der Signalverarbeitungsmittel 3 im zweiten Betriebsmodus M2 betrieben und die zweite Verarbeitungsstufe 32 wird aktiviert. Die Signalverarbeitungsmittel 3 schalten automatisch, in Abhängigkeit davon, ob das erste und/oder das zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt sind, zwischen dem ersten Betriebsmodus M1 und dem zweiten Betriebsmodus M2.
  • Im ersten Betriebsmodus M1 kann beispielsweise die Messung mit niedrigen Datenraten erfolgen, eine niedrige Over-Sampling-Rate des Signals verwendet werden oder die Messung nur mittels einer einzelnen Achse (die restlichen AD-Wandler-Kanäle sind ausgeschaltet) erfolgen. Der zweite Betriebsmodus M2 ist ausgelegt, möglichst genau und schnell die Erfassung der Daten auszuführen. Der zweite Betriebsmodus M2 kann beispielsweise durch eine höhere Datenrate, höhere Over-Sampling-Rate und/oder durch Messung aller Achsen (zwei oder drei) implementiert werden.
  • 3 zeigt eine schematische Abbildung von Beschleunigungssignalen, welche von der Inertialsensoreinheit 1 erfasst werden. Oben in 3 ist die von dem Sensorelement 2 gemessene Beschleunigung a in der Einheit Isb (englisch: least significant bit) für Zeiten t (in Sekunden s) in einem gewissen Zeitraum und für drei verschiedene Achsen x, y, z illustriert. In der Mitte in 3 sind die entsprechenden Daten nach Durchlaufen des Hochpass-Filters 33 illustriert. Ein Rahmen R zeigt den Bereich, in welchem Sprachsignale auftreten. Unten in 3 sind die mittlere Amplitude magx, magz für die x- und die z-Richtung illustriert, wobei ein erster Schwellenwert T1 und ein zweiter Schwellenwert T2 eingezeichnet sind. Ein Kriterium für das Vorliegen einer Sprachaktivität kann erfüllt sein, falls die mittleren Amplituden magx, magz zwischen dem ersten Schwellenwert T1 und dem zweiten Schwellenwert T2 liegen.
  • 4 zeigt ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit, insbesondere mittels einer oben beschriebenen Inertialsensoreinheit 1. Umgekehrt auch kann auch die Inertialsensoreinheit 1 dazu ausgebildet sein, eines der im Folgenden beschriebenen Verfahren durchzuführen. Die Inertialsensoreinheit 1 umfasst ein Sensorelement 2, Signalverarbeitungsmittel 3 und eine Schnittstelle 4 zum Signalisieren einer detektierten Sprachaktivität.
  • In einem ersten Verfahrensschritt S11 werden Bewegungen und Vibrationen von dem Sensorelement 2 erfasst und in ein elektrisches Sensorsignal umgewandelt. In einem zweiten Verfahrensschritt S12 erfolgt eine Vorverarbeitung des Sensorsignals, etwa mittels eines Hochpass- und/oder Tiefpassfilters, um die Signalanteile, welche zu typischen Bewegungen des Anwenders korrespondieren, zu entfernen. Beispielweise kann ein Bandpassfilter eingesetzt werden, welcher einen Frequenzbereich zwischen 250 Hz und 2 kHz durchlässt.
  • In einem Verfahrensschritt S13 wird überprüft, ob ein erstes Kriterium erfüllt ist. Hierbei handelt es sich um eine Bedingung zur Überprüfung, ob es sich um ein Sprachsignal handeln kann. Insbesondere kann überprüft werden, ob ein Absolutwert des vorverarbeiteten Sensorsignals zwischen einem ersten Schwellenwert und einem zweiten Schwellenwert liegt. Ist dies nicht der Fall, wird das Verfahren abgebrochen oder wiederholt.
  • Andernfalls werden in einem Verfahrensschritt S14 Daten in einem Buffer 35 zwischengespeichert, welcher eine Größe N aufweist, mit einer ganzen Zahl N.
  • In einem Verfahrensschritt S15 werden Merkmale aus den in dem Buffer 35 gespeicherten Daten extrahiert. Beispielsweise können eine durchschnittliche Amplitude, eine Nulldurchgangsrate und dergleichen extrahiert werden.
  • In einem weiteren Verfahrensschritt S16 wird anhand eines zweiten Kriteriums ausgewertet, ob die extrahierten Merkmale die Bedingungen für eine Sprachaktivität erfüllen. Gegebenenfalls wird eine Sprachaktivität detektiert. Die Schnittstelle 4 wird zum Signalisieren einer Sprachaktivität angesteuert.
  • 5 zeigt ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit, insbesondere mittels einer oben beschriebenen Inertialsensoreinheit 1. Die Inertialsensoreinheit 1 umfasst ein Sensorelement 2, Signalverarbeitungsmittel 3 und eine Schnittstelle 4 zum Signalisieren einer detektierten Sprachaktivität.
  • In einem ersten Verfahrensschritt S21 werden wiederum Bewegungen und Vibrationen von dem Sensorelement 2 erfasst und in ein elektrisches Sensorsignal umgewandelt. In einem zweiten Verfahrensschritt S22 erfolgt eine Vorverarbeitung des Sensorsignals, wie oben beschrieben.
  • In einem Verfahrensschritt S23 wird, wie oben beschrieben, überprüft, ob ein Absolutwert des vorverarbeiteten Sensorsignals zwischen einem ersten Schwellenwert in einem zweiten Schwellenwert liegt. Ist dies nicht der Fall, wird das Verfahren abgebrochen oder wiederholt.
  • Andernfalls werden in einem Verfahrensschritt S24 Daten in einem Buffer 35 zwischengespeichert.
  • In einem Verfahrensschritt S25 werden, wie oben beschrieben, Merkmale aus den in dem Buffer 35 gespeicherten Daten extrahiert.
  • In einem Verfahrensschritt S26 werden die Daten ausgewertet, um andere Nutzeraktionen zu erkennen. Beispielweise können Erschütterungen, Antippen, Anfassen oder Bedienung des Gerätes durch den Anwender erkannt werden. Dies kann erkannt werden, falls einer oder mehrere Datenpunkte in dem Buffer 35 Werte oberhalb eines maximalen Schwellenwertes aufweisen. Zur Erkennung der anderen Nutzeraktionen können Verfahren wie Fourieranalyse, Spektrumanalyse oder Wavelet-Analyse eingesetzt werden.
  • In einem Verfahrensschritt S27 wird ausgewertet, ob eine derartige andere Nutzeraktion erkannt wurde. Ist dies der Fall, handelt es sich nicht um eine Sprachaktivität und das Verfahren wird abgebrochen oder wiederholt.
  • Andernfalls wird in einem Verfahrensschritt S26 anhand eines zweiten Kriteriums ausgewertet, ob die extrahierten Merkmale die Bedingungen für eine Sprachaktivität erfüllen, wie oben beschrieben. Gegebenenfalls wird eine Sprachaktivität detektiert. Die Schnittstelle 4 wird zum Signalisieren einer Sprachaktivität angesteuert.
  • Während der Verfahrensschritte S21 bis S23 wird die Inertialsensoreinheit 1 in dem ersten Betriebsmodus M1 betrieben. Während der Verfahrensschritte S24 bis S28 wird die Inertialsensoreinheit 2 in dem zweiten Betriebsmodus M2 betrieben.
  • 6 zeigt ein Flussdiagramm eines Verfahrens zum Detektieren einer Sprachaktivität mithilfe einer Inertialsensoreinheit, insbesondere mittels einer oben beschriebenen Inertialsensoreinheit 1. Die Inertialsensoreinheit 1 umfasst ein Sensorelement 2, Signalverarbeitungsmittel 3 und eine Schnittstelle 4 zum Signalisieren einer detektierten Sprachaktivität.
  • In einem ersten Verfahrensschritt S31 werden, wie oben beschrieben, Bewegungen und Vibrationen von dem Sensorelement 2 erfasst und in ein elektrisches Sensorsignal umgewandelt. In einem zweiten Verfahrensschritt S32 erfolgt eine Vorverarbeitung des Sensorsignals, wie oben beschrieben.
  • In einem Verfahrensschritt S33 wird das Sensorsignal, d.h. die erfassten Werte in dem Buffer 35 gespeichert.
  • In einem Verfahrensschritt S34 wird überprüft, ob ein Absolutwert des vorverarbeiteten Sensorsignals zwischen einem ersten Schwellenwert und einem zweiten Schwellenwert liegt. Ist dies nicht der Fall, wird Verfahrensschritt S31 erneut durchgeführt.
  • Andernfalls wird in einem Verfahrensschritt S35 überprüft, ob der Buffer mit N neuen Werten gefüllt ist. Ist dies nicht der Fall, wird Verfahrensschritt S31 erneut durchgeführt.
  • In einem Verfahrensschritt S36 werden, wie oben beschrieben, Merkmale aus den in dem Buffer 35 gespeicherten Daten extrahiert.
  • In einem Verfahrensschritt S37 wird anhand eines zweiten Kriteriums ausgewertet, ob die extrahierten Merkmale die Bedingungen für eine Sprachaktivität erfüllen, wie oben beschrieben. Gegebenenfalls wird eine Sprachaktivität detektiert. Die Schnittstelle 4 wird zum Signalisieren einer Sprachaktivität angesteuert.
  • Die Verfahrensschritte S31 bis S35 werden somit stets ausgeführt, M1, während die Verfahrensschritte S36 bis S37 nur ausgeführt werden, falls die Auswertungen S34, S35 erfolgreich waren, M2.
  • Dieses Verfahren ermöglicht eine variable Auswertung der gespeicherten Daten im Buffer 35, wobei die Auswertung des Buffer 35 erst erfolgt, nachdem das Kriterium 1 (einfacher Schwellenvergleich) erfüllt ist, und eine vordefinierte Anzahl der Messdaten nach der Erfüllung des Kriteriums 1 zusätzlich gespeichert ist.
  • Gemäß dieser Ausführung werden die Messdaten aus dem Buffer 35 für die Auswertung so zusammengestellt, dass die Messdaten vor und nach der Überprüfung des Kriteriums im Auswertungsfenster beinhaltet sind. Dadurch wird eine stromsparende Detektion einer Sprachaktivität ermöglicht. Die Detektion ist sehr präzise, da auch die Signale vor dem Kriterium berücksichtigt werden, und schnell, da die Latenzzeit kurz ist.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 2017263267 A1 [0003]
    • US 2013196715 A1 [0004]
    • US 10397687 B2 [0005]
    • US 2014093091 A1 [0006]
    • US 2017365249 A1 [0007]

Claims (18)

  1. Inertialsensoreinheit (1), mindestens umfassend: a. ein Sensorelement (2) zum Erfassen und Umwandeln von Bewegungen und Vibrationen in ein elektrisches Sensorsignal, b. Signalverarbeitungsmittel (3) zur Auswertung des Sensorsignals, insbesondere mit dem Ziel der Detektion von Vibrationen, die durch eine Sprachaktivität hervorgerufen werden, und c. eine Schnittstelle (4) zum Signalisieren einer detektierten Sprachaktivität, dadurch gekennzeichnet, • dass die Signalverarbeitungsmittel (3) eine erste Verarbeitungsstufe (31) und eine zweite Verarbeitungsstufe (32) für das Sensorsignal umfassen, wobei die erste Verarbeitungsstufe (31) dafür ausgelegt ist, ein erstes Kriterium für das Vorliegen einer Sprachaktivität zu prüfen und die zweite Verarbeitungsstufe (32) dafür ausgelegt ist, mindestens ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität zu prüfen, • dass die zweite Verarbeitungsstufe (32) nur durchlaufen wird, wenn das Sensorsignal die erste Verarbeitungsstufe (31) durchlaufen hat und das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, • und dass die Signalverarbeitungsmittel (3) dafür ausgelegt sind, die Schnittstelle (4) nur dann zum Signalisieren einer Sprachaktivität anzusteuern, wenn das Sensorsignal die zweite Verarbeitungsstufe (32) durchlaufen hat und das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  2. Inertialsensoreinheit (1) nach Anspruch 1, dadurch gekennzeichnet, dass mindestens zwei Sensorelemente (2) für das Erfassen von Bewegungen und Vibrationen in unterschiedlichen Raumrichtungen vorgesehen sind.
  3. Inertialsensoreinheit (1) nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass mindestens ein Beschleunigungssensorelement (2) und/oder mindestens ein Drehratensensorelement (2) vorgesehen sind.
  4. Inertialsensoreinheit (1) nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Signalverarbeitungsmittel (3) ferner umfassen: • mindestens einen Signalfilter (33) zur Vorverarbeitung des Sensorsignals, insbesondere einen Hochpassfilter und/oder einen Bandpassfilter, und • mindestens einen Analog/Digital-Wandler (34) für das Sensorsignal.
  5. Inertialsensoreinheit (1) nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass unterschiedliche Betriebsmodi realisierbar sind, indem einzelne Komponenten der Inertialsensoreinheit (1) wahlweise aktivierbar bzw. abschaltbar sind und/oder in unterschiedlichen Betriebsmodi betreibbar sind.
  6. Inertialsensoreinheit (1) nach Anspruch 5, dadurch gekennzeichnet, dass in einem ersten Betriebsmodus die erste Verarbeitungsstufe (31) der Signalverarbeitungsmittel (3) im ersten Betriebsmodus betrieben wird und die zweite Verarbeitungsstufe (32) abgeschaltet ist, dass in einem zweiten Betriebsmodus die erste Verarbeitungsstufe (31) der Signalverarbeitungsmittel (3) im zweiten Betriebsmodus betrieben wird und die zweite Verarbeitungsstufe (32) aktiviert ist, und dass die Signalverarbeitungsmittel (3) dafür ausgelegt sind, automatisch, in Abhängigkeit davon, ob das erste und/ oder das zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt sind, zwischen dem ersten Betriebsmodus und dem zweiten Betriebsmodus umzuschalten.
  7. Inertialsensoreinheit (1) nach Anspruch 6, dadurch gekennzeichnet, dass der Stromverbrach im ersten Betriebsmodus geringer ist als im zweiten Betriebsmodus.
  8. Inertialsensoreinheit (1) nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass die erste Verarbeitungsstufe (31) zumindest einen Vergleicher umfasst, der die aktuelle Signalamplitude des Sensorsignals mit mindestens einem Schwellwert vergleicht, um zu bestimmen, ob das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  9. Inertialsensoreinheit (1) nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass die zweite Verarbeitungsstufe (32) der Signalverarbeitungsmittel (3) mindestens umfasst: • einen Buffer (35) zum Zwischenspeichern einer definierten Anzahl von aufeinanderfolgenden Abtastwerten des Sensorsignals und • Signalanalysemittel (36) zum Ermitteln mindestens einer Signaleigenschaft auf Basis der zwischengespeicherten Abtastwerte und zum Vergleichen dieser mindestens einen Signaleigenschaft mit dem mindestens einen weiteren, zweiten Kriterium für das Vorliegen einer Sprachaktivität.
  10. Inertialsensoreinheit (1) nach Anspruch 9, dadurch gekennzeichnet, dass die Signalanalysemittel (36) dafür ausgelegt sind, mindestens eine ermittelte Signaleigenschaft mit mindestens einem weiteren, dritten Kriterium zu vergleichen, um mindestens eine weitere Ursache für das Sensorsignal zu erkennen.
  11. Verfahren zum Detektieren einer Sprachaktivität mit Hilfe einer Inertialsensoreinheit (1), die mindestens ein Sensorelement (2), Signalverarbeitungsmittel (3) und eine Schnittstelle (4) zum Signalisieren einer detektierten Sprachaktivität umfasst, • bei dem Bewegungen und Vibrationen von dem mindestens einen Sensorelement (2) erfasst werden und in mindestens ein elektrisches Sensorsignal umgewandelt werden, und • bei dem das Sensorsignal mit Hilfe der Signalverarbeitungsmittel (3) ausgewertet wird, dadurch gekennzeichnet, dass ein erstes Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, dass nur dann, wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, mindestens ein weiteres, zweites Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, und dass die Schnittstelle (4) nur dann zum Signalisieren einer Sprachaktivität angesteuert wird, wenn das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist.
  12. Verfahren nach Anspruch 11, bei dem das Sensorsignal mit Hilfe der Signalverarbeitungsmittel (3) vorverarbeitet wird und die Vorverarbeitung des Sensorsignals mindestens umfasst: • eine Signalfilterung, insbesondere eine Hochpassfilterung und/oder eine Bandpassfilterung, und • eine Analog/Digital-Wandlung, bei der das analoge Sensorsignal abgetastet und digitalisiert wird, so dass das digitalisierte Sensorsignal in Form einer Folge von Abtastwerten vorliegt.
  13. Verfahren nach einem der Ansprüche 11 oder 12, bei dem das erste Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, indem die aktuelle Signalamplitude bzw. der aktuelle Abtastwert des Sensorsignals mit mindestens einem Schwellwert verglichen wird.
  14. Verfahren nach einem der Ansprüche 11 bis 13, dadurch gekennzeichnet, dass als erstes Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, ob die aktuelle Signalamplitude bzw. der aktuelle Abtastwert des Sensorsignals für eine vorgegebene Dauer größer als ein erster Schwellwert und/oder kleiner als ein zweiter Schwellwert sind.
  15. Verfahren nach einem der Ansprüche 12 bis 14, dadurch gekennzeichnet, dass wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, • eine vorgegebene Anzahl N von aufeinanderfolgenden Abtastwerten des Sensorsignals in einem Buffer (35) der Signalverarbeitungsmittel (3) zwischengespeichert wird, • mindestens eine Signaleigenschaft auf Basis der zwischengespeicherten Abtastwerte ermittelt wird und • die mindestens eine Signaleigenschaft mit dem mindestens einen weiteren, zweiten Kriterium für das Vorliegen einer Sprachaktivität verglichen wird.
  16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass wenn das erste Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, mindestens eine ermittelte Signaleigenschaft mit mindestens einem weiteren, dritten Kriterium verglichen wird, um mindestens eine weitere Ursache für das Sensorsignal zu erkennen.
  17. Verfahren nach einem der Ansprüche 11 bis 16, dadurch gekennzeichnet, dass die Inertialsensoreinheit (1) in einem ersten Betriebsmodus betrieben wird, solange nur das erste Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, dass die Inertialsensoreinheit (1) in einem zweiten Betriebsmodus betrieben wird, wenn das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität geprüft wird, und dass automatisch, in Abhängigkeit davon, ob das erste und/ oder das mindestens eine weitere, zweite Kriterium für das Vorliegen einer Sprachaktivität erfüllt ist, zwischen dem ersten Betriebsmodus und dem zweiten Betriebsmodus umgeschaltet wird.
  18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die unterschiedlichen Betriebsmodi der Inertialsensoreinheit (1) realisiert werden, indem einzelne Komponenten der Inertialsensoreinheit (1) wahlweise aktiviert bzw. abgeschaltet werden und/oder in unterschiedlichen Betriebsmodi betreiben werden.
DE102020208206.5A 2020-07-01 2020-07-01 Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität Pending DE102020208206A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102020208206.5A DE102020208206A1 (de) 2020-07-01 2020-07-01 Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität
US17/340,404 US20220005495A1 (en) 2020-07-01 2021-06-07 Inertial sensor unit and method for detecting a speech activity
CN202110743348.XA CN113884176A (zh) 2020-07-01 2021-07-01 惯性传感器单元和用于探测语言活动的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020208206.5A DE102020208206A1 (de) 2020-07-01 2020-07-01 Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität

Publications (1)

Publication Number Publication Date
DE102020208206A1 true DE102020208206A1 (de) 2022-01-05

Family

ID=79010378

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020208206.5A Pending DE102020208206A1 (de) 2020-07-01 2020-07-01 Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität

Country Status (3)

Country Link
US (1) US20220005495A1 (de)
CN (1) CN113884176A (de)
DE (1) DE102020208206A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11942107B2 (en) * 2021-02-23 2024-03-26 Stmicroelectronics S.R.L. Voice activity detection with low-power accelerometer

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130196715A1 (en) 2012-01-30 2013-08-01 Research In Motion Limited Adjusted noise suppression and voice activity detection
US20140093091A1 (en) 2012-09-28 2014-04-03 Sorin V. Dusan System and method of detecting a user's voice activity using an accelerometer
US20170263267A1 (en) 2016-03-14 2017-09-14 Apple Inc. System and method for performing automatic gain control using an accelerometer in a headset
US20170365249A1 (en) 2016-06-21 2017-12-21 Apple Inc. System and method of performing automatic speech recognition using end-pointing markers generated using accelerometer-based voice activity detector
US10397687B2 (en) 2017-06-16 2019-08-27 Cirrus Logic, Inc. Earbud speech estimation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010044725A1 (en) * 1996-11-19 2001-11-22 Koichi Matsuda Information processing apparatus, an information processing method, and a medium for use in a three-dimensional virtual reality space sharing system
US20090027229A1 (en) * 2007-07-11 2009-01-29 Fortson Frederick O Smart armor
KR101643617B1 (ko) * 2010-07-28 2016-08-10 삼성전자주식회사 디지털 촬영 장치 및 그의 슬립 모드 제어 방법
US9140590B2 (en) * 2011-02-09 2015-09-22 Texas Instruments Incorporated System and method of power-saving in MEMS sensor applications
US9146605B2 (en) * 2013-01-31 2015-09-29 Salutron, Inc. Ultra low power actigraphy based on dynamic threshold
KR102250094B1 (ko) * 2013-12-23 2021-05-10 삼성전자주식회사 모바일 장치의 기능 수행 방법 및 모바일 장치
KR20150086032A (ko) * 2014-01-17 2015-07-27 엘지전자 주식회사 이동 단말기 및 이의 제어방법
US10310593B2 (en) * 2015-04-01 2019-06-04 Koninklijke Philips N.V. Electronic mobile device
US10515623B1 (en) * 2016-12-23 2019-12-24 Amazon Technologies, Inc. Non-speech input to speech processing system
US10313782B2 (en) * 2017-05-04 2019-06-04 Apple Inc. Automatic speech recognition triggering system
US10874947B2 (en) * 2018-03-23 2020-12-29 Sony Interactive Entertainment LLC Connecting a player to expert help in real-time during game play of a gaming application
US11698314B2 (en) * 2018-06-08 2023-07-11 Orbis Intelligent Systems, Inc. Detection device for a fluid conduit or fluid dispensing device
EP3684074A1 (de) * 2019-03-29 2020-07-22 Sonova AG Hörgerät zur eigenen spracherkennung und verfahren zum betrieb des hörgeräts
EP3959867A1 (de) * 2019-04-23 2022-03-02 Google LLC Personalisierter sprechdetektor für elektronische vorrichtung
US11087747B2 (en) * 2019-05-29 2021-08-10 Honeywell International Inc. Aircraft systems and methods for retrospective audio analysis
US11537917B1 (en) * 2019-07-23 2022-12-27 BlueOwl, LLC Smart ring system for measuring driver impairment levels and using machine learning techniques to predict high risk driving behavior
US11948561B2 (en) * 2019-10-28 2024-04-02 Apple Inc. Automatic speech recognition imposter rejection on a headphone with an accelerometer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130196715A1 (en) 2012-01-30 2013-08-01 Research In Motion Limited Adjusted noise suppression and voice activity detection
US20140093091A1 (en) 2012-09-28 2014-04-03 Sorin V. Dusan System and method of detecting a user's voice activity using an accelerometer
US20170263267A1 (en) 2016-03-14 2017-09-14 Apple Inc. System and method for performing automatic gain control using an accelerometer in a headset
US20170365249A1 (en) 2016-06-21 2017-12-21 Apple Inc. System and method of performing automatic speech recognition using end-pointing markers generated using accelerometer-based voice activity detector
US10397687B2 (en) 2017-06-16 2019-08-27 Cirrus Logic, Inc. Earbud speech estimation

Also Published As

Publication number Publication date
CN113884176A (zh) 2022-01-04
US20220005495A1 (en) 2022-01-06

Similar Documents

Publication Publication Date Title
DE69208791T2 (de) Anordnung und Verfahren zur Erkennung von Tremor, insbesondere bei Parkinsonismus
DE112014004951T5 (de) VAD-Detektions-Vorrichtung und Verfahren zum Betreiben derselben
US20210272580A1 (en) System and method for offline embedded abnormal sound fault detection
US9477640B2 (en) Neural signal processing and/or interface methods, architectures, apparatuses, and devices
CN113009566B (zh) 现地地震动预测模型及其构建方法
DE102014012184A1 (de) Vorrichtung und Verfahren zur automatischen Erkennung und Klassifizierung von akustischen Signalen in einem Überwachungsbereich
US20170296081A1 (en) Frame based spike detection module
DE102017205652B3 (de) Verfahren zum Betrieb einer Hörvorrichtung und Hörvorrichtung
DE102013213104A1 (de) Vorrichtung und Verfahren zum Ermitteln eines Schließzustands einer Haustür oder eines Hausfensters
DE102020208206A1 (de) Inertialsensoreinheit und Verfahren zum Detektieren einer Sprachaktivität
US11170760B2 (en) Detecting speech activity in real-time in audio signal
DE102019201456B3 (de) Verfahren für eine individualisierte Signalverarbeitung eines Audiosignals eines Hörgerätes
US8838445B1 (en) Method of removing contamination in acoustic noise measurements
US6983199B2 (en) Vibration measurement and recording system and method
DE102018220936A1 (de) Verfahren zur Überprüfung eines Sensorwertes eines MEMS-Sensors
EP3754622A1 (de) Anordnung und verfahren zur akustischen überwachung von umgebungen
CN112394402A (zh) 基于同步挤压小波变换检测微地震信号的方法和系统
CN115293205A (zh) 一种异常检测方法、自编码器模型训练方法和电子设备
WO2022028765A1 (de) Vorrichtung und verfahren zum erkennen von kopfgesten
EP3690839A2 (de) Videokamera
CN202075033U (zh) 基于虚拟仪器的爆震音频识别系统
WO2016128729A1 (en) Audio signal processing apparatus, client device, system and method
CN110598617A (zh) 煤矿安全监控系统瓦斯异常数据辨识与重构方法
EP3682447B1 (de) Verfahren und vorrichtung zum verarbeiten eines signals
JP2023529674A (ja) 被験者音声におけるイベント検出

Legal Events

Date Code Title Description
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0015240000

Ipc: G10L0025780000

R163 Identified publications notified