DE102008030086A1 - Automatisierte Rückmeldung über eine Sprachqualtität - Google Patents

Automatisierte Rückmeldung über eine Sprachqualtität Download PDF

Info

Publication number
DE102008030086A1
DE102008030086A1 DE200810030086 DE102008030086A DE102008030086A1 DE 102008030086 A1 DE102008030086 A1 DE 102008030086A1 DE 200810030086 DE200810030086 DE 200810030086 DE 102008030086 A DE102008030086 A DE 102008030086A DE 102008030086 A1 DE102008030086 A1 DE 102008030086A1
Authority
DE
Germany
Prior art keywords
speech
signal
speaker
speech signal
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200810030086
Other languages
English (en)
Inventor
Georg Dr. Stemmer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE200810030086 priority Critical patent/DE102008030086A1/de
Publication of DE102008030086A1 publication Critical patent/DE102008030086A1/de
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Bei Lautsprecherdurchsagen kann es aufgrund einer undeutlichen Aussprache, einer Störung des Übertragungskanals oder an einem Defekt der Ein- und Ausgabegeräte zu einer nicht verständlichen Vermittlung des Sprachsignals kommen. Auch bei derartigen Anwendungen besteht folglich ein Bedürfnis, dem Sprecher eine unmittelbare Rückmeldung zur Verfügung zu stellen, die ihn über die beim Empfänger angekommene Sprachqualität informiert. Gemäß der Erfindung wird auf der Empfängerseite ein Spracherkennungssystem installiert, das automatisch die Sprachqualität bewertet, indem es jeder Äußerung ein Konfidenzmaß zuweist. Die so ermittelte Bewertung der Sprachqualität wird mit einem separaten Übertragungskanal an den Sprecher übermittelt.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur automatisierten Rückmeldung über eine Sprachqualität eines Sprachsignals an einen nicht in Hörweite befindlichen Sprecher.
  • In vielen Situationen des Alltags kann es bei der sprachlichen Kommunikation leicht durch äußere Umstände zu Missverständnissen zwischen Kommunikationsteilnehmern kommen. Hierbei erhält der Sprecher jedoch schnell eine unmittelbare Rückmeldung durch seine Zuhörer und kann somit aktiv zu einer erfolgreichen Kommunikation beitragen.
  • Es existieren jedoch auch einseitige Formen von Kommunikation, bei denen der Sprecher weder optisch noch akustisch die Möglichkeit hat, sich über die Verständlichkeit seiner Mitteilung zu vergewissern. Dies ist beispielsweise regelmäßig bei Lautsprecherdurchsagen der Fall, bei denen es aufgrund einer undeutlichen Aussprache, einer Störung des Übertragungskanals oder an einem Defekt der Ein- und Ausgabegeräte zu einer nicht verständlichen Vermittlung des Sprachsignals kommen kann. Auch bei derartigen Anwendungen besteht folglich ein Bedürfnis, dem Sprecher eine unmittelbare Rückmeldung zur Verfügung zu stellen, die ihn über die beim Empfänger angekommene Sprachqualität informiert.
  • Dies ist beispielsweise besonders wichtig in einem Gebäude mit einer Lautsprecheranlage, bei der ein Sprecher wichtige Informationen über einen eingetretenen Notfall durchgibt. Kommt es hierbei zu vorübergehenden Störungen des Übertragungskanals, etwa durch Lärm auf der Empfängerseite, erfährt der Sprecher üblicherweise nichts davon und somit auch nicht seine Adressaten. In sicherheitsrelevanten Anwendungen wird das Problem dadurch gelöst, dass alle Äußerungen von der Gegenseite noch einmal von der Gegenseite bestätigt werden.
  • Diese Lösung ist jedoch für das oben beschriebene Szenario oder auch bei zeitkritischen Informationen nicht einsetzbar.
  • Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, ein Verfahren anzugeben, mit dem ein nicht in Hörweite befindlicher Sprecher eine Rückmeldung über die Sprachqualität eines von ihm ausgehenden Sprachsignals erhält.
  • Diese Aufgabe wird mit den in den Ansprüchen 1 und 15 angegebenen Merkmalen gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind in den abhängigen Ansprüchen angegeben.
  • Erfindungsgemäß wird in einem Verfahren zur automatisierten Rückmeldung über eine Sprachqualität eines Sprachsignals an einen nicht in Hörweite befindlichen Sprecher ein Sprachsignal über ein Ausgabemedium ausgegeben. Das ausgegebene Sprachsignal wird zumindest teilweise erfasst und aus dem erfassten Sprachsignal wird durch eine Spracherkennung ein Spracherkennungssignal ermittelt. Aus dem Spracherkennungssignal wird laufend ein Konfidenzmaß ermittelt, wobei bei Über- oder Unterschreiten einer vorgebbaren Konfidenzschwelle durch das Konfidenzmaß eine Rückmeldung über die Sprachqualität an den Sprecher erfolgt. Ein Konfidenzmaß ist ein Maß für die Sicherheit eines durch ein Spracherkennungssystem ermittelten Erkennungsergebnisses, so dass durch ein Konfidenzmaß eine Einteilung in Kategorien für die Sicherheit eines Erkennungsergebnisses vorgenommen werden kann. Typischerweise wären diese Kategorien ”Sicher erkannt” oder ”Nicht erkannt”. Darüber hinaus besteht die Möglichkeit, im Rahmen der Ermittlung der Konfidenzmaße einzelne Sprachparameter des Sprachsignals zu analysieren, wie beispielsweise eine Sprechgeschwindigkeit oder ein Signal-zu-Rausch-Abstand.
  • Gemäß möglichen Ausgestaltungen der vorliegenden Erfindung kann die Rückmeldung über die Sprachqualität optisch und/oder akustisch erfolgen. So ist es beispielsweise möglich, dass dem Sprecher in Form einer Ampel eine kurze Rückmeldung über die Sprachqualität signalisiert wird. Ebenfalls ist es mög lich, dass dem Sprecher mit Hilfe eines Sprachsynthesesystems eine Rückmeldung über die empfangene Sprachqualität übermittelt wird. Hierbei wäre es beispielsweise denkbar, dass das im Spracherkennungssystem erkannte Sprachsignal über das Sprachsynthesesystem zumindest teilweise ausgegeben wird.
  • Gemäß einer vorteilhaften Ausgestaltung der Erfindung wird eine auf die Wiedereinhaltung des für das jeweilige Konfidenzmaß festgelegten Wertebereichs individualisierte Nachricht an den Sprecher ausgegeben. Dies hat die vorteilhafte Wirkung, dass nach Entdecken eines Fehlers der Benutzer nicht nur dazu aufgefordert wird, seine Eingabe zu wiederholen, sondern dass der Sprecher gezielt auf eine Möglichkeit zur Korrektur des Fehlers hingewiesen wird.
  • Die erfindungsgemäße Vorrichtung zur automatisierten Rückmeldung über eine Sprachqualität eines empfangenen Sprachsignals an einen nicht in Hörweite befindlichen Sprecher weist mindestens eine Einrichtung zum Verarbeiten digitalisierter Daten eines Sprachsignals auf. Hierbei ist eine Einrichtung zur Spracherkennung mit Analyse und Überwachung eines Konfidenzmaßes des Sprachsignals vorgesehen und eine Einrichtung zum Feststellen einer Überschreitung oder Unterschreitung einer Konfidenzschwelle durch das ermittelte Konfidenzmaß. Weiterhin umfasst die Vorrichtung eine Einrichtung zur Erzeugung und Ausgabe eines in Abhängigkeit von der Überschreitung oder Unterschreitung der Konfidenzschwelle für das Konfidenzmaß generierten Hinweises in digitaler oder analoger Form und eine Einrichtung zur Ermittlung des Hinweises an den das Sprachsignal erzeugenden Sprecher.
  • Die vorliegende Erfindung wird nachfolgend an Ausführungsbeispielen anhand der Figur erläutert. Es zeigt
  • 1 in einer schematischen Darstellung einen Ablauf des erfindungsgemäßen Verfahrens.
  • Gemäß der Erfindung wird auf der Empfängerseite ein Spracherkennungssystem installiert, das automatisch die Sprachqualität bewertet, indem es jeder Äußerung ein Konfidenzmaß zuweist. Die so ermittelte Bewertung der Sprachqualität wird mit einem separaten Übertragungskanal an den Sprecher übermittelt, beispielsweise in Form einer Ampel, die mit Rot signalisiert, die Äußerungen zu wiederholen, deutlicher zu sprechen oder sich anderer Übertragungskanäle zu bedienen.
  • Die Erfindung zeichnet sich demnach durch die Verwendung eines automatischen Bewertungssystems für die beim Empfänger angekommene Sprachqualität und eine automatisierte Rückmeldung der ermittelten Sprachqualität an den Sprecher.
  • Die 1 zeigt ein Ablaufdiagramm der vorliegenden Erfindung. In Schritt S1 wird ei Sprachsignal über ein Ausgabemedium ausgegeben. Dies ist beispielsweise eine Lautsprecheranlage in einem Gebäude, bei dem der Sprecher sich nicht in Hörweite befindet und somit die Sprachqualität nicht einschätzen kann. Der Sprecher sitzt beispielsweise in einer Leitzentrale und gibt das Sprachsignal über ein Mikrofon ein.
  • In Schritt S2 wird das ausgegebene Sprachsignal zumindest teilweise erfasst und aus dem erfassten Sprachsignal durch eine Spracherkennung ein Spracherkennungssignal ermittelt. Zur Erfassung des Sprachsignals dient beispielsweise ein Mikrofon, das in geeigneter Weise mit einem Spracherkennungssystem verschaltet ist.
  • In Schritt S3 wird laufend ein Konfidenzmaß aus dem ermittelten Spracherkennungssignal ermittelt. Durch das Konfidenzmaß wird im Wesentlichen unterschieden, ob das ausgegebene Sprachsignal durch das Spracherkennungssystem sicher erkannt worden ist oder nicht. Hierzu sind unterschiedliche, in der Literatur beschriebene, Algorithmen zur Berechnung eines Konfidenzmaßes anwendbar.
  • Wird das Sprachsignal sicher erkannt, erfolgt in Schritt S4 keine oder eine positive Rückmeldung an den Sprecher. Bei Über- und/oder Unterschreiten einer vorgebbaren Konfidenzschwelle durch das ermittelte Konfidenzmaß wird jedoch in Schritt S5 eine Rückmeldung über die Sprachqualität an den Sprecher vorgenommen. Wird also das ausgegebene Sprachsignal durch das Spracherkennungssignal nicht sicher erkannt, erfolgt über einen – vorzugsweise separaten – Übertragungskanal eine Rückmeldung an den Sprecher.
  • Die Rückmeldung wird beispielsweise in Form einer roten Signalleuchte oder durch Ausgabe eines akustischen Signaltons übermittelt.
  • Weiterhin ist es möglich, durch Analyse von Sprachparametern des ausgegebenen Sprachsignals eine gezielte Rückmeldung über eine mögliche Ursache der schlechten Sprachqualität an den Sprecher zu übermitteln. Beispielsweise können Sprachparameter wie Sprechgeschwindigkeit, Signal-Rausch-Abstand oder Lautstärke überwacht werden und bei Bedarf ein Hinweis zur Korrektur durch den Sprecher in der Rückmeldung übermittelt werden.
  • Entscheidend für die Erfindung ist in jedem Fall, dass der Sprecher in bisherigen Systemen keine unmittelbare Möglichkeit zur Bewertung des von ihm erzeugten Sprachsignals am Ort der Ausgabe des Sprachsignals hat. Hierzu bietet die Erfindung eine Lösung, in dem bekannte Methoden aus der Spracherkennung für eine automatisierte Bewertung des ausgegebenen Sprachsignals herangezogen werden.

Claims (15)

  1. Verfahren zur automatisierten Rückmeldung über eine Sprachqualität eines Sprachsignals an einen nicht in Hörweite befindlichen Sprecher, bei dem – ein Sprachsignal über ein Ausgabemedium ausgegeben wird, – das ausgegebene Sprachsignal zumindest teilweise erfasst wird und aus dem erfassten Sprachsignal durch eine Spracherkennung ein Spracherkennungssignal ermittelt wird, – laufend ein Konfidenzmaß aus dem Spracherkennungssignal ermittelt wird, dadurch gekennzeichnet, dass – bei Über- oder Unterschreiten einer vorgebbaren Konfidenzschwelle durch das Konfidenzmaß eine Rückmeldung über die Sprachqualität an den Sprecher erfolgt.
  2. Verfahren nach Anspruch 1, bei dem die Konfidenzschwelle zur Klassifikation von Erkennungsergebnissen in Kategorien ausgebildet ist.
  3. Verfahren nach Anspruch 2, bei dem die Kategorien eine Kategorie enthalten, in der eine zu erkennende Äußerung sicher erkannt ist, eine Kategorie, in der eine zu erkennende Äußerung unsicher erkannt ist und/oder eine Kategorie, in der erkannt wird, dass eine Äußerung nicht zu einem zu erkennenden Vokabular gehört.
  4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Konfidenzmaß ein Signal-Rausch-Abstand (SNR) des ausgegebenen Sprachsignals überwacht wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Konfidenzmaß die Einhaltung eines bestimmten Bereichs des Frequenzspektrums des ausgegebenen Sprachsignals überwacht wird.
  6. Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Konfidenzmaß die Sprechgeschwindigkeit innerhalb des ausgegebenen Sprachsignals überwacht wird.
  7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Konfidenzmaß die Lautstärke des ausgegebenen Sprachsignals überwacht wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche 4 bis 7, bei dem als Konfidenzmaß mehrere Sprachparameter gleichzeitig überwacht werden.
  9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Überwachung jedes der Sprachparameter in dem ausgegebenen Sprachsignal in digitalisierter Form vorgenommen wird.
  10. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Rückmeldung über die Sprachqualität akustisch in Form eines gesprochenen kurzen Satzes über eine Sprachsyntheseeinrichtung ausgegeben wird.
  11. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Rückmeldung über die Sprachqualität optisch über eine Anzeigevorrichtung ausgegeben wird.
  12. Verfahren nach einem der vorhergehenden Ansprüche, bei dem eine auf die Wiedereinhaltung des für das jeweilige Konfidenzmaß festgelegten Wertebereichs individualisierte Nachricht ausgegeben wird.
  13. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Konfidenzmaß in Echtzeit aus dem ausgegebenen und verarbeiteten Sprachsignal bestimmt wird.
  14. Programmprodukt für eine Datenverarbeitungsanlage, das Codeabschnitte enthält, mit denen ein Verfahren nach einem der Ansprüche 1 bis 13 auf der Datenverarbeitungsanlage ausführbar ist.
  15. Vorrichtung zur automatisierten Rückmeldung über eine Sprachqualität eines empfangenen Sprachsignals an einen nicht in Hörweite befindlichen Sprecher mit mindestens einer Einrichtung zum Verarbeiten digitalisierter Daten eines Sprachsignals, insbesondere nach einem der Ansprüche 1 bis 13, mit – einer Einrichtung zur Spracherkennung mit Analyse und Überwachung eines Konfidenzmaßes des Sprachsignals, – einer Einrichtung zum Feststellen einer Überschreitung oder Unterschreitung einer Konfidenzschwelle durch das Konfidenzmaß und – einer Einrichtung zur Erzeugung und Ausgabe eines in Abhängigkeit von der Überschreitung oder Unterschreitung der Konfidenzschwelle für das Konfidenzmaß generierten Hinweises in digitaler oder analoger Form, – einer Einrichtung zur Übermittelung des Hinweises an den das Sprachsignal erzeugenden Sprecher.
DE200810030086 2008-06-25 2008-06-25 Automatisierte Rückmeldung über eine Sprachqualtität Ceased DE102008030086A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200810030086 DE102008030086A1 (de) 2008-06-25 2008-06-25 Automatisierte Rückmeldung über eine Sprachqualtität

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200810030086 DE102008030086A1 (de) 2008-06-25 2008-06-25 Automatisierte Rückmeldung über eine Sprachqualtität

Publications (1)

Publication Number Publication Date
DE102008030086A1 true DE102008030086A1 (de) 2010-01-14

Family

ID=41412494

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200810030086 Ceased DE102008030086A1 (de) 2008-06-25 2008-06-25 Automatisierte Rückmeldung über eine Sprachqualtität

Country Status (1)

Country Link
DE (1) DE102008030086A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60029453T2 (de) * 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60029453T2 (de) * 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz

Similar Documents

Publication Publication Date Title
DE69517325T2 (de) Tonqualitätsanalyse
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE69938374T2 (de) Verfahren und Vorrichtung zur Spracherkennung mittels sowohl eines neuralen Netzwerks als auch verborgener Markov-Modelle
DE69432943T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
Kleinschmidt et al. A Bayesian belief updating model of phonetic recalibration and selective adaptation
DE3216800C2 (de)
DE2626793C3 (de) Elektrische Schaltungsanordnung zum Bestimmen des stimmhaften oder stimmlosen Zustandes eines Sprachsignals
DE60313706T2 (de) Spracherkennungs- und -antwortsystem, Spracherkennungs- und -antwortprogramm und zugehöriges Aufzeichnungsmedium
EP1081683B1 (de) Verfahren und Anordnung zur Spracherkennung
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
DE69529223T2 (de) Testverfahren
DE102006057159A1 (de) Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen
DE10046359A1 (de) Dialogsystem
DE112006000322T5 (de) Audioerkennungssystem zur Erzeugung von Antwort-Audio unter Verwendung extrahierter Audiodaten
EP1563487B1 (de) Verfahren zur ermittlung akustischer merkmale von schallsignalen fuer die analyse unbekannter schallsignale und modifikation einer schallerzeugung
EP3430615B1 (de) Fortbewegungsmittel, system und verfahren zur anpassung einer länge einer erlaubten sprechpause im rahmen einer spracheingabe
DE60128372T2 (de) Verfahren und system zur verbesserung der genauigkeit in einem spracherkennungssystem
EP3693960B1 (de) Verfahren für eine individualisierte signalverarbeitung eines audiosignals eines hörgeräts
DE4010028C2 (de) Spracherkennungsverfahren
DE2021126A1 (de) Spracherkennungsvorrichtung
EP1723636A1 (de) Benutzer- und vokabularadaptive bestimmung von konfidenz- und rückweisungsschwellen
DE102019133133A1 (de) Assistenzsystem, durch welches in einem Raum die Ausgabe von zumindest einem Medieninhalt gesteuert wird, Kraftfahrzeug und Betriebsverfahren für das Assistenzsystem
DE102008030086A1 (de) Automatisierte Rückmeldung über eine Sprachqualtität
DE3875894T2 (de) Adaptive multivariable analyseeinrichtung.
WO2021148392A1 (de) Verfahren und vorrichtung zur objektidentifikation basierend auf sensordaten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection