DE19840548A1 - Verfahren zur instrumentellen ("objektiven") Sprachqualitätsbestimmung - Google Patents

Verfahren zur instrumentellen ("objektiven") Sprachqualitätsbestimmung

Info

Publication number
DE19840548A1
DE19840548A1 DE19840548A DE19840548A DE19840548A1 DE 19840548 A1 DE19840548 A1 DE 19840548A1 DE 19840548 A DE19840548 A DE 19840548A DE 19840548 A DE19840548 A DE 19840548A DE 19840548 A1 DE19840548 A1 DE 19840548A1
Authority
DE
Germany
Prior art keywords
spectral
evaluated
calculated
signal
speech signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19840548A
Other languages
English (en)
Other versions
DE19840548C2 (de
Inventor
Jens Berger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to DE19840548A priority Critical patent/DE19840548C2/de
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to AT99942871T priority patent/ATE253765T1/de
Priority to CA002305652A priority patent/CA2305652A1/en
Priority to PCT/EP1999/005972 priority patent/WO2000013173A1/de
Priority to DE59907623T priority patent/DE59907623D1/de
Priority to EP99942871A priority patent/EP1048025B1/de
Priority to US09/530,389 priority patent/US7013266B1/en
Publication of DE19840548A1 publication Critical patent/DE19840548A1/de
Application granted granted Critical
Publication of DE19840548C2 publication Critical patent/DE19840548C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Machine Translation (AREA)

Abstract

Bekannte Verfahren zur instrumentellen Sprachqualitätsbestimmung auf der Basis eines Vergleichs von Signalintensitäten des zu bewertenden Sprachsignals mit einem Referenzsprachsignal bewerten spektrale Verformungen des zu bewertenden Sprachsignals nicht optimal, so daß die Qualitätsbewertung unsicher ist. Des weiteren werden durch die Integration der Signalintensität in Frequenzbändern mit konstanten Bandgrenzen bestimmte Verfälschungen des zu bewertenden Sprachsignals, wie sie z. B. durch Codiersysteme niederer Bitraten hervorgerufen werden, fehlerhaft bewertet. DOLLAR A Um die Aussagesicherheit der berechneten Qualitätskennwerte zu erhöhen, werden zum einen Verformungen der mittleren spektralen Einhüllenden vor einem Vergleich der spektralen Eigenschaften mit einer Wichtungsfunktion W¶T¶(f) weitgehend korrigiert. Zum anderen werden die festen Bandgrenzen zur Integration der spektralen Leistungsdichte aufgehoben und statt dessen in einem vorgegebenen Optimierungsbereich Bandgrenzen gesucht, bei denen die sich ergebenden spektralen Intensitätsabbildungen von zu bewertenden Sprachsignal und Referenzsprachsignal eine maximale Ähnlichkeit aufweisen. DOLLAR A Die beschriebenen Lösungen können bekannte Verfahren erweitern und zu deren Struktur hinzugefügt werden.

Description

Vorbemerkung
Die Erfindung bezieht sich auf ein Verfahren zur instrumentellen ("objektiven") Sprachqualitätsbestimmung, bei dem durch Vergleich von Eigenschaften eines zu be­ wertenden Sprachsignals mit Eigenschaften eines Referenzsprachsignals (ungestörtes Signal) Kennwerte zur Bestimmung der Sprachqualität (Sprachgüte) abgeleitet werden.
Sprachqualitätsbestimmungen von Sprachsignalen werden in der Regel mittels auditiver ("subjektiver") Untersuchungen mit Versuchspersonen vorgenommen.
Das Ziel von instrumentellen ("objektiven") Verfahren zur Sprachqualitätsbestimmung ist es, aus Eigenschaften des zu bewertenden Sprachsignals mittels geeigneter Rechen­ verfahren Kennwerte zu ermitteln, die die Sprachqualität des zu bewertenden Sprachsignals beschreiben, ohne auf Urteile von Versuchspersonen zurückgreifen zu müssen.
Die berechneten Kennwerte und das zugrunde gelegte Verfahren zur instrumentellen Sprachqualitätsbestimmung gelten als anerkannt, wenn eine hohe Korrelation zu Ergeb­ nissen auditiver Vergleichsuntersuchungen erreicht wird. Die mittels auditiver Untersuchungen gewonnenen Sprachqualitätswerte stellen somit die Zielwerte dar, die durch instrumentelle Verfahren erreicht werden sollen.
Stand der Technik
Bekannte Verfahren zur instrumentellen Sprachqualitätsbestimmung beruhen auf einem Vergleich eines Referenzsprachsignals mit dem zu bewertenden Sprachsignal. Dabei werden das Referenzsprachsignal und das zu bewertendes Sprachsignal in kurze Zeitabschnitte segmentiert. In diesen Segmenten werden die spektralen Eigenschaften der beiden Signale verglichen.
Für die Berechnung der spektralen Kurzzeiteigenschaften kommen verschiedene Ansätze und Modelle zur Anwendung. In der Regel erfolgt die Berechnung der Signal­ intensität in Frequenzbändern, deren Breite mit zunehmender Mittenfrequenz größer wird. Beispiele für solche Frequenzbänder sind die bekannten Terzbänder oder Fre­ quenzgruppen nach Zwicker (veröffentlicht in Zwicker, E.: "Psychoakustik", Berlin: Springer-Verlag, 1982).
Die derart berechnete spektrale Intensitätsabbildung für jeden betrachteten Zeitabschnitt läßt sich als Reihe von Zahlenwerten auffassen, in der die Anzahl der Einzelwerte der Anzahl der verwendeten Frequenzbänder entspricht, die Zahlenwerte selbst die berechneten Intensitätswerte darstellen und ein fortlaufender Index der Frequenzbänder die Reihenfolge der Zahlenwerte beschreibt.
Bei den derzeit bekannten Verfahren zur instrumentellen Sprachqualitätsbestimmung werden die Grenzen der benutzten Frequenzbänder auf der Frequenzachse konstant gehalten.
In jedem betrachteten Zeitsegment werden die berechneten Intensitäten von zu bewertenden Sprachsignal und Referenzsprachsignal in jedem Band miteinander ver­ glichen. Die Differenz beider Werte, bzw. die Ähnlichkeit der beiden entstehenden spektralen Intensitätsabbildungen, stellt die Grundlage für die Berechnung eines Quali­ tätswertes dar (Fig. 1).
Solche Verfahren wurden insbesondere für die qualitative Bewertung der Sprache in der Telefonieanwendung entwickelt. Beispiele hierfür sind die Veröffentlichungen:
"A perceptual speech-quality measure based on a psychacoustic sound representation" (Beerends, J. G.; Stemerdink, J. A., J. Audio Eng. Soc. 42 (1994) 3, S. 115-123).
"Auditory distortion measure for speech coding" (Wang, S. Sekey, A.; Gersho, A.: IEEE Proc. Int. Confacoust., speech and signalprocessing (1991), S. 493-496).
Der derzeit gültige ITU-T Standard P.861 beschreibt ebenfalls ein derartiges Verfahren: "Objective quality measurement of telephone-band speech codecs" (ITU-T Rec. P.861, Genf 1996).
Nachteile bekannter instrumenteller Sprachqualitätsmeßverfahren
Der Einsatz von bekannten Verfahren zur instrumentellen Sprachqualitätsbestimmung scheitert an der Zuverlässigkeit der berechneten Qualitätswerte für bestimmte zu bewertende Signaleigenschaften. Insbesondere bei Beeinträchtigungen im zu bewertenden Sprachsignal, wie sie z. B. durch Sprachcodierverfahren mit niedrigen Bitraten oder Kombinationen von unterschiedlichen Störungen hervorgerufen werden, liefern derzeit bekannte Verfahren nur unsichere Qualitätswerte.
Nachteilig bei den heute bekannten Verfahren ist in solchen Fällen, daß bei einem Vergleich zwischen dem zu bewertenden Sprachsignal mit einem Referenzsprachsignal Unterschiede zwischen beiden Signalabschnitten in der gewählten Darstellungsebene in den zu berechnenden Qualitätskennwert einfließen, die nicht oder kaum zu einer - auch im auditiven Test wahrnehmbaren - qualitativen Beeinträchtigung führen.
Im Rahmen der hier betrachteten Sprachübertragung in Telefonanwendungen tragen Frequenzbandbegrenzungen und spektrale Verformungen des zu bewertenden Sprachsignals (z. B. hervorgerufen durch Filtereigenschaften des Telefongerätes oder des Übertragungskanals) nur begrenzt zu einer empfundenen qualitativen Beeinträchtigung bei.
Um diese Mängel teilweise zu vermeiden, wird in einem anderen Ansatz versucht, die linearen Verzerrungen (Frequenzgang) durch ein Korrekturfilter bzw. eine Leistungs­ übertragungsfunktion zu kompensieren (veröffentlicht in: "A new approach to objective quality-measures based on attribute-matching", Halka, U.; Heute, U., Speech communication, 11 (1992) 1, S. 15-30). Die Anwendung dieses Verfahrens ist jedoch bei nichtlinearer und zeitinvarianter Übertragung nachteilig, da die so berechnete Kompen­ sationsfunktion nicht mehr ausschließlich die spektralen Verformungen des zu bewertenden Signals beschreibt.
Verschiebungen spektraler Kurzzeit-Maxima ("Formantverschiebungen") im zu testenden Signal gegenüber dem Referenzsprachsignal, z. B. verursacht durch Codiersysteme mit niedriger Bitrate, führen bei bekannten Verfahren zu großen Unterschieden in den spektralen Intensitätsabbildungen und gehen damit stark in den berechneten Qualitätswert ein. Untersuchungen haben ergeben, daß in einer auditiven Sprachqualitätsuntersuchung diese Verschiebungen spektraler Kurzzeit-Maxima jedoch nur begrenzten Einfluß auf das Qualitätsurteil haben.
Aufgabe
Die Erfindung stellt sich die Aufgabe, den Einfluß von spektralen Begrenzungen und Verformungen des zu bewertenden Sprachsignals sowie von Verschiebungen spektraler Kurzzeit-Maxima vor dem Vergleich der spektralen Eigenschaften eines zu testenden Signals mit einem Referenzsprachsignal und der Berechnung eines Qualitätswertes in instrumentellen Verfahren zu reduzieren.
Lösung
Im Gegensatz zu bekannten Ansätzen wird in der hier beschriebenen Erfindung eine spektrale Wichtungsfunktion generiert, die auf mittleren spektralen Einhüllenden, z. B. der mittleren spektralen Leistungsdichte, von zu bewertendem Sprachsignal und Referenzsprachsignal beruht. Dies ermöglicht den Einsatz des Verfahrens ebenfalls bei nichtlinearer und zeitvarianter Übertragung.
Die spektrale Wichtungsfunktion wird aus den Quotienten der Stützwerte der mittleren spektralen Leistungsdichte des zu bewertenden Signals PhiY(f) und der des Eingangssignals des Übertragungssystems PhiX(f) derart berechnet, daß die Wichtungs­ funktion über
WT(f) = a(f).(PhiY(f)/PhiX(f))
zu beschreiben ist. Die Bewertungsfunktion a(f) kann die Wichtungsfunktion WT(f) an über den Wirkungsbereich unterschiedlich gewichten, sie ist im einfachsten Falle konstant 1.
Die derart berechnete spektrale Wichtungsfunktion WT(f) nähert die mittleren spektralen Einhüllenden von zu bewertenden Sprachsignal und Referenzsprachsignal einander an, so daß Unterschiede der beiden spektralen Einhüllenden nur noch vermindert in den berechneten Qualitätswert einfließen.
Die spektrale Wichtungsfunktion WT(f) kann zum einen auf das Referenzsprachsignal angewendet werden. Dabei wird das Referenzsprachsignal in seiner mittleren spektralen Leistungsdichte dem zu bewertenden Signal angenähert (Fig. 2a).
Zum anderen kann die spektrale Wichtungsfunktion invertiert auf das zu bewertende Signal angewendet werden. Dieses wird dadurch entzerrt und, hinsichtlich seiner mittleren spektralen Leistungsdichte, an das Referenzsprachsignal angenähert (Fig. 2b).
Ein weiterer Teil der Erfindung bezieht sich auf die Korrektur von Verschiebungen spektraler Kurzzeit-Maxima, die durch die Übertragungssysteme verursacht werden.
Die Intensität wird für jeden Zeitabschnitt in Frequenzbändern integriert. Resultat ist eine Reihe von Intensitätswerten für jede spektrale Darstellung eines Signalabschnitts, wobei jeder Einzelwert die Intensität in einem Frequenzband repräsentiert. Die Verschiebungen spektraler Kurzzeit-Maxima können hierbei zu abweichenden berechneten Intensitäten in den Frequenzbändern von Referenzsprachsignal und zu bewertenden Sprachsignal führen.
Diese Abweichungen in den spektralen Intensitätsabbildungen - verursacht Verschiebungen spektraler Kurzzeit-Maxima - können durch eine variable Anordnung der Frequenzbänder auf der Frequenzachse reduziert werden. Im Gegensatz zu den konstanten Bandgrenzen bei bekannten Verfahren werden die Bandgrenzen auf der Frequenzachse verschoben. Die Zahl der Frequenzbänder und deren Index bleibt aber konstant. In einer Optimierungsschleife werden dann diejenigen Bandgrenzen akzep­ tiert, bei denen die beiden entstehenden spektralen Abbildungen von zu bewertenden Sprachsignal und Referenzsprachsignal maximale Ähnlichkeit aufweisen bzw. deren Abstand minimal ist. Diese Optimierung wird für alle Bänder in allen betrachteten Zeit­ segmenten durchgeführt.
Der Einsatz variabler Bandgrenzen zur Berechnung der spektralen Intensitätsabbildung ist nicht nur auf das Signal, in dem auch die beschriebene spektrale Wichtungsfunktion WT(f) zum Einsatz kommt, beschränkt, sondern kann auch auf das jeweils andere Signal und sogar auf beide Signale angewendet werden. (vgl. Fig. 2a und 2b).
Ausführungsbeispiel
Ein spezielles Ausführungsbeispiel zeigt eine Realisierung gemäß Fig. 3, die als TOSQA (Telecommunication Objective Speech Quality Assessment) bezeichnet wird. Hierbei erfolgt eine erweiterte Vorverarbeitung des Referenzsprachsignals.
In Spezifikation der allgemeinen Realisierungen nach Fig. 2a und 2b werden hier Sprachpausen mittels eines Sprachpausenerkenners erkannt und gehen nicht in das Qualitätsmaß ein. Ebenfalls erfolgt eine Filterung von Referenzsprachsignal und zu bewertendem Sprachsignal mit einem Bandpaß 300 . . . 3400 Hz sowie eine Filterung auf den Frequenzgang eines Telefonhandapparates. Die Integration der spektralen Leistungsdichte erfolgt in Frequenzgruppen, die die Basis für die Berechnung der spezifischen Lautheit darstellen.
Die Integration in Frequenzgruppen erfolgt jedoch nicht in festen Frequenz­ gruppengrenzen, sondern mit den in dieser Erfindung beschriebenen variablen Frequenzgruppengrenzen. Die berechneten Signalleistungen in den so modifizierten Frequenzgruppen bilden die Basis für die Intensitätsberechnung. Hier wurde auf ein Modell zur Berechnung der spezifischen Lautheit nach Zwicker, einer gehörrichtigen Intensitätsabbildung, zurückgegriffen (veröffentlicht in Zwicker, E.: "Psychoakustik", Berlin: Springer-Verlag, 1982).
Die berechneten Lautheitsmuster werden in Ergänzung des allgemeinen Ansatzes noch durch eine Fehlerbewertungsfunktion ergänzt. Der berechnete Qualitätswert wird über einen Mittelwert der Korrelationskoeffizienten der spezifischen Lautheiten für jedes betrachtete kurze Zeitsegment über die Zahl der ausgewerteten Sprachsegmente gebildet.

Claims (6)

1. Verfahren zur instrumentellen Sprachqualitätsbestimmung, bei dem durch Vergleich von spektralen Kurzzeiteigenschaften eines zu bewertenden Sprachsignals mit einem Referenzsprachsignal Kennwerte zur Bestimmung der Sprachqualität berechnet werden, dadurch gekennzeichnet, daß vor dem Vergleich der Eigenschaften der Sprachsignale, Unterschiede in mittleren spektralen Einhüllenden verringert werden, indem aus diesen zuerst eine spektrale Wichtungsfunktion berechnet wird, mit der die spektralen Kurzzeit­ eigenschaften der Sprachsignale in allen betrachteten Zeitsegmenten gewichtet werden, so daß die Unterschiede in den mittleren spektralen Einhüllenden dadurch nur begrenzt in den zu berechnenden Qualitätskennwert einfließen, und daß für die Berechnung der Signalintensität die Grenzen der benutzten Frequenz­ bänder variabel gestaltet werden, so daß für jeden betrachteten Signalabschnitt in jeweils allen ausgewerteten Frequenzbändern die berechneten Intensitäten von Referenzsprachsignal und zu bewertendem Signal zueinander möglichst geringe Unterschiede aufweisen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zuerst die mittleren spektralen Einhüllenden von zu bewertenden Sprachsignal und Referenzsprachsignal in Form eines mittleren Leistungsdichtespektrums berechnet werden und aus dem Quotienten beider Spektren eine spektrale Wichtungsfunktion WT(f) berechnet wird, mit der die Kurzzeit-Leistungsdichtespektren des Referenzsprachsignals vor der Berechnung eines Qualitätskennwertes gewichtet werden.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß die zu berechnende Wichtungsfunktion WT(f) nur aus Teilbereichen der berechneten mittleren spektralen Einhüllenden von zu bewertenden Sprachsignal und Referenzsprachsignal berechnet wird und damit die Unterschiede in mittleren spektralen Einhüllenden zwischen beiden Signalen nur in spektralen Teilbereichen verringert werden.
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß vor Berechnung der Qualitätskennwerte eine Integration der Signalintensität für jeden ausgewerteten kurzen Zeitabschnitt in Frequenzgruppen erfolgt, wobei die Grenzen der Frequenzgruppen auf der Frequenzachse variabel sind, aber die Breite der Frequenzgruppen auf der Tonheitskala konstant bleibt, und daß aus den Signal­ intensitäten in den Frequenzgruppen eine Berechnung der spezifischen Lautheit erfolgt, wobei die Grenzen der Frequenzgruppen benutzt werden, bei denen die berechneten Unterschiede in der spezifischen Lautheit zwischen dem zu bewertenden Signal und dem Referenzsprachsignal im jeweils betrachteten Band und Zeitsegment den geringsten Unterschied aufweisen.
5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß der Qualitäts­ kennwert aus der Ähnlichkeit der spektralen Darstellungen in jedem betrachteten Zeitabschnitt berechnet wird, wobei die Ähnlichkeit einen über alle betrachteten Zeitabschnitte gemittelten Korrelationskoeffizienten zwischen der spektralen Darstellung des zu bewertenden Sprachsignals und der spektralen Darstellung des Referenzsprachsignals im jeweiligen Zeitsegment darstellt.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß der Korrelations­ koeffizient zwischen der spektralen Darstellung des zu bewertenden Sprachsignals und der spektralen Darstellung des Referenzsprachsignals im jeweiligen Zeitsegment nur von einem Teilbereich der spektralen Darstellung berechnet wird, d. h. für die Berechnung des Qualitätskennwertes nicht alle berechneten Spektralwerte berücksichtigt werden.
DE19840548A 1998-08-27 1998-08-27 Verfahren zur instrumentellen Sprachqualitätsbestimmung Expired - Fee Related DE19840548C2 (de)

Priority Applications (7)

Application Number Priority Date Filing Date Title
DE19840548A DE19840548C2 (de) 1998-08-27 1998-08-27 Verfahren zur instrumentellen Sprachqualitätsbestimmung
CA002305652A CA2305652A1 (en) 1998-08-27 1999-08-14 Method for instrumental voice quality evaluation
PCT/EP1999/005972 WO2000013173A1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung
DE59907623T DE59907623D1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung
AT99942871T ATE253765T1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung
EP99942871A EP1048025B1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung
US09/530,389 US7013266B1 (en) 1998-08-27 1999-08-14 Method for determining speech quality by comparison of signal properties

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19840548A DE19840548C2 (de) 1998-08-27 1998-08-27 Verfahren zur instrumentellen Sprachqualitätsbestimmung

Publications (2)

Publication Number Publication Date
DE19840548A1 true DE19840548A1 (de) 2000-03-02
DE19840548C2 DE19840548C2 (de) 2001-02-15

Family

ID=7879918

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19840548A Expired - Fee Related DE19840548C2 (de) 1998-08-27 1998-08-27 Verfahren zur instrumentellen Sprachqualitätsbestimmung
DE59907623T Expired - Lifetime DE59907623D1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE59907623T Expired - Lifetime DE59907623D1 (de) 1998-08-27 1999-08-14 Verfahren zur instrumentellen sprachqualitätsbestimmung

Country Status (6)

Country Link
US (1) US7013266B1 (de)
EP (1) EP1048025B1 (de)
AT (1) ATE253765T1 (de)
CA (1) CA2305652A1 (de)
DE (2) DE19840548C2 (de)
WO (1) WO2000013173A1 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001065543A1 (en) * 2000-02-29 2001-09-07 Telefonaktiebolaget Lm Ericsson (Publ) Compensation for linear filtering using frequency weighting factors
EP1492085A2 (de) * 2003-06-25 2004-12-29 Lucent Technologies Inc. Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität
EP2388779A1 (de) * 2010-05-21 2011-11-23 SwissQual License AG Verfahren zur Schätzung der Sprachqualität
CN112233693A (zh) * 2020-10-14 2021-01-15 腾讯音乐娱乐科技(深圳)有限公司 一种音质评估方法、装置和设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1241663A1 (de) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Verfahren und Vorrichtung zur Sprachqualitätsbestimmung
EP1292036B1 (de) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Verfahren und Vorrichtung zur Decodierung von digitalen Signalen
DE10142846A1 (de) * 2001-08-29 2003-03-20 Deutsche Telekom Ag Verfahren zur Korrektur von gemessenen Sprachqualitätswerten
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
EP1492084B1 (de) * 2003-06-25 2006-05-17 Psytechnics Ltd Vorrichtung und Verfahren zur binauralen Qualitätsbeurteilung
ES2313413T3 (es) * 2004-09-20 2009-03-01 Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno Compensacion en frecuencia para el analisis de precepcion de habla.
EP2249333B1 (de) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Verfahren und Vorrichtung zur Schätzung einer Grundfrequenz eines Sprachsignals
EP2828853B1 (de) * 2012-03-23 2018-09-12 Dolby Laboratories Licensing Corporation Verfahren und system zur biaskorrektur von sprachpegelmessungen

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3708002A1 (de) * 1987-03-12 1988-09-22 Telefonbau & Normalzeit Gmbh Messverfahren zum beurteilen der guete von sprachcodierern und/oder uebertragungsstrecken
EP0727767A2 (de) * 1995-02-14 1996-08-21 Telia Ab Verfahren und Vorrichtung zur Sprachqualitätsbewertung
EP0809236A1 (de) * 1996-05-21 1997-11-26 Koninklijke KPN N.V. Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4860360A (en) * 1987-04-06 1989-08-22 Gte Laboratories Incorporated Method of evaluating speech
GB9213459D0 (en) 1992-06-24 1992-08-05 British Telecomm Characterisation of communications systems using a speech-like test stimulus
NL9500512A (nl) * 1995-03-15 1996-10-01 Nederland Ptt Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3708002A1 (de) * 1987-03-12 1988-09-22 Telefonbau & Normalzeit Gmbh Messverfahren zum beurteilen der guete von sprachcodierern und/oder uebertragungsstrecken
EP0727767A2 (de) * 1995-02-14 1996-08-21 Telia Ab Verfahren und Vorrichtung zur Sprachqualitätsbewertung
EP0809236A1 (de) * 1996-05-21 1997-11-26 Koninklijke KPN N.V. Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001065543A1 (en) * 2000-02-29 2001-09-07 Telefonaktiebolaget Lm Ericsson (Publ) Compensation for linear filtering using frequency weighting factors
EP1492085A2 (de) * 2003-06-25 2004-12-29 Lucent Technologies Inc. Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität
EP1492085A3 (de) * 2003-06-25 2005-02-16 Lucent Technologies Inc. Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität
US7305341B2 (en) 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment
EP2388779A1 (de) * 2010-05-21 2011-11-23 SwissQual License AG Verfahren zur Schätzung der Sprachqualität
EP2474975A1 (de) * 2010-05-21 2012-07-11 SwissQual License AG Verfahren zur Schätzung der Sprachqualität
CN112233693A (zh) * 2020-10-14 2021-01-15 腾讯音乐娱乐科技(深圳)有限公司 一种音质评估方法、装置和设备
CN112233693B (zh) * 2020-10-14 2023-12-01 腾讯音乐娱乐科技(深圳)有限公司 一种音质评估方法、装置和设备

Also Published As

Publication number Publication date
DE19840548C2 (de) 2001-02-15
EP1048025B1 (de) 2003-11-05
EP1048025A1 (de) 2000-11-02
DE59907623D1 (de) 2003-12-11
WO2000013173A1 (de) 2000-03-09
CA2305652A1 (en) 2000-03-09
US7013266B1 (en) 2006-03-14
ATE253765T1 (de) 2003-11-15

Similar Documents

Publication Publication Date Title
DE69836785T2 (de) Audiosignalkompression, Sprachsignalkompression und Spracherkennung
DE3306730C2 (de)
DE60031432T2 (de) System, verfahren und hergestellter gegenstand zur detektion von emotionen in sprachsignalen mittels statistischer analyse von sprachsignalparametern
DE19840548C2 (de) Verfahren zur instrumentellen Sprachqualitätsbestimmung
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
EP0296588A2 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE19952538A1 (de) Automatische Verstärkungsregelung in einem Spracherkennungssystem
DE2636032B2 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE69922769T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE2021126C3 (de) Spracherkennungs anordnung
DE3143372A1 (de) Verfahren zum elektronischen auswerten der bei der blutdruckmessung nach der methode riva-rocci auftretenden korotkoff-geraeusche
EP1382034B1 (de) Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen
DE60110541T2 (de) Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz
EP0916206B1 (de) Verfahren und anordnung zum beurteilen der qualität eines übertragenen sprachsignals
DE60200932T2 (de) Vorrichtung und verfahren zur analyse eines sprachsignals
DE602004011292T2 (de) Vorrichtung zur Sprachdetektion
DE2431458A1 (de) Verfahren zur automatischen sprechererkennung
DE4437287C2 (de) Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
DE2312356A1 (de) Verfahren und vorrichtung zur bestimmung der grundfrequenz von sprachsignalen
DE4124493C1 (de)
DE10026872A1 (de) Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
DE3009204C2 (de)
DE2506771C2 (de) Verfahren zur Verbesserung der Sprechererkennung
EP1288914B1 (de) Verfahren zur Korrektur von gemessenen Sprachqualitätswerten

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee