DE19840548A1 - Verfahren zur instrumentellen ("objektiven") Sprachqualitätsbestimmung - Google Patents
Verfahren zur instrumentellen ("objektiven") SprachqualitätsbestimmungInfo
- Publication number
- DE19840548A1 DE19840548A1 DE19840548A DE19840548A DE19840548A1 DE 19840548 A1 DE19840548 A1 DE 19840548A1 DE 19840548 A DE19840548 A DE 19840548A DE 19840548 A DE19840548 A DE 19840548A DE 19840548 A1 DE19840548 A1 DE 19840548A1
- Authority
- DE
- Germany
- Prior art keywords
- spectral
- evaluated
- calculated
- signal
- speech signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000003595 spectral effect Effects 0.000 claims abstract description 55
- 230000010354 integration Effects 0.000 claims abstract description 3
- 238000001228 spectrum Methods 0.000 claims 3
- 238000005457 optimization Methods 0.000 abstract description 3
- 238000013441 quality evaluation Methods 0.000 abstract 2
- 239000013589 supplement Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000006735 deficit Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Machine Translation (AREA)
Abstract
Bekannte Verfahren zur instrumentellen Sprachqualitätsbestimmung auf der Basis eines Vergleichs von Signalintensitäten des zu bewertenden Sprachsignals mit einem Referenzsprachsignal bewerten spektrale Verformungen des zu bewertenden Sprachsignals nicht optimal, so daß die Qualitätsbewertung unsicher ist. Des weiteren werden durch die Integration der Signalintensität in Frequenzbändern mit konstanten Bandgrenzen bestimmte Verfälschungen des zu bewertenden Sprachsignals, wie sie z. B. durch Codiersysteme niederer Bitraten hervorgerufen werden, fehlerhaft bewertet. DOLLAR A Um die Aussagesicherheit der berechneten Qualitätskennwerte zu erhöhen, werden zum einen Verformungen der mittleren spektralen Einhüllenden vor einem Vergleich der spektralen Eigenschaften mit einer Wichtungsfunktion W¶T¶(f) weitgehend korrigiert. Zum anderen werden die festen Bandgrenzen zur Integration der spektralen Leistungsdichte aufgehoben und statt dessen in einem vorgegebenen Optimierungsbereich Bandgrenzen gesucht, bei denen die sich ergebenden spektralen Intensitätsabbildungen von zu bewertenden Sprachsignal und Referenzsprachsignal eine maximale Ähnlichkeit aufweisen. DOLLAR A Die beschriebenen Lösungen können bekannte Verfahren erweitern und zu deren Struktur hinzugefügt werden.
Description
Die Erfindung bezieht sich auf ein Verfahren zur instrumentellen ("objektiven")
Sprachqualitätsbestimmung, bei dem durch Vergleich von Eigenschaften eines zu be
wertenden Sprachsignals mit Eigenschaften eines Referenzsprachsignals (ungestörtes
Signal) Kennwerte zur Bestimmung der Sprachqualität (Sprachgüte) abgeleitet werden.
Sprachqualitätsbestimmungen von Sprachsignalen werden in der Regel mittels auditiver
("subjektiver") Untersuchungen mit Versuchspersonen vorgenommen.
Das Ziel von instrumentellen ("objektiven") Verfahren zur Sprachqualitätsbestimmung
ist es, aus Eigenschaften des zu bewertenden Sprachsignals mittels geeigneter Rechen
verfahren Kennwerte zu ermitteln, die die Sprachqualität des zu bewertenden
Sprachsignals beschreiben, ohne auf Urteile von Versuchspersonen zurückgreifen zu
müssen.
Die berechneten Kennwerte und das zugrunde gelegte Verfahren zur instrumentellen
Sprachqualitätsbestimmung gelten als anerkannt, wenn eine hohe Korrelation zu Ergeb
nissen auditiver Vergleichsuntersuchungen erreicht wird. Die mittels auditiver
Untersuchungen gewonnenen Sprachqualitätswerte stellen somit die Zielwerte dar, die
durch instrumentelle Verfahren erreicht werden sollen.
Bekannte Verfahren zur instrumentellen Sprachqualitätsbestimmung beruhen auf einem
Vergleich eines Referenzsprachsignals mit dem zu bewertenden Sprachsignal. Dabei
werden das Referenzsprachsignal und das zu bewertendes Sprachsignal in kurze
Zeitabschnitte segmentiert. In diesen Segmenten werden die spektralen Eigenschaften
der beiden Signale verglichen.
Für die Berechnung der spektralen Kurzzeiteigenschaften kommen verschiedene
Ansätze und Modelle zur Anwendung. In der Regel erfolgt die Berechnung der Signal
intensität in Frequenzbändern, deren Breite mit zunehmender Mittenfrequenz größer
wird. Beispiele für solche Frequenzbänder sind die bekannten Terzbänder oder Fre
quenzgruppen nach Zwicker (veröffentlicht in Zwicker, E.: "Psychoakustik", Berlin:
Springer-Verlag, 1982).
Die derart berechnete spektrale Intensitätsabbildung für jeden betrachteten Zeitabschnitt
läßt sich als Reihe von Zahlenwerten auffassen, in der die Anzahl der Einzelwerte der
Anzahl der verwendeten Frequenzbänder entspricht, die Zahlenwerte selbst die
berechneten Intensitätswerte darstellen und ein fortlaufender Index der Frequenzbänder
die Reihenfolge der Zahlenwerte beschreibt.
Bei den derzeit bekannten Verfahren zur instrumentellen Sprachqualitätsbestimmung
werden die Grenzen der benutzten Frequenzbänder auf der Frequenzachse konstant
gehalten.
In jedem betrachteten Zeitsegment werden die berechneten Intensitäten von zu
bewertenden Sprachsignal und Referenzsprachsignal in jedem Band miteinander ver
glichen. Die Differenz beider Werte, bzw. die Ähnlichkeit der beiden entstehenden
spektralen Intensitätsabbildungen, stellt die Grundlage für die Berechnung eines Quali
tätswertes dar (Fig. 1).
Solche Verfahren wurden insbesondere für die qualitative Bewertung der Sprache in der
Telefonieanwendung entwickelt. Beispiele hierfür sind die Veröffentlichungen:
"A perceptual speech-quality measure based on a psychacoustic sound representation" (Beerends, J. G.; Stemerdink, J. A., J. Audio Eng. Soc. 42 (1994) 3, S. 115-123).
"Auditory distortion measure for speech coding" (Wang, S. Sekey, A.; Gersho, A.: IEEE Proc. Int. Confacoust., speech and signalprocessing (1991), S. 493-496).
"A perceptual speech-quality measure based on a psychacoustic sound representation" (Beerends, J. G.; Stemerdink, J. A., J. Audio Eng. Soc. 42 (1994) 3, S. 115-123).
"Auditory distortion measure for speech coding" (Wang, S. Sekey, A.; Gersho, A.: IEEE Proc. Int. Confacoust., speech and signalprocessing (1991), S. 493-496).
Der derzeit gültige ITU-T Standard P.861 beschreibt ebenfalls ein derartiges Verfahren:
"Objective quality measurement of telephone-band speech codecs" (ITU-T Rec. P.861,
Genf 1996).
Der Einsatz von bekannten Verfahren zur instrumentellen Sprachqualitätsbestimmung
scheitert an der Zuverlässigkeit der berechneten Qualitätswerte für bestimmte zu
bewertende Signaleigenschaften. Insbesondere bei Beeinträchtigungen im zu
bewertenden Sprachsignal, wie sie z. B. durch Sprachcodierverfahren mit niedrigen
Bitraten oder Kombinationen von unterschiedlichen Störungen hervorgerufen werden,
liefern derzeit bekannte Verfahren nur unsichere Qualitätswerte.
Nachteilig bei den heute bekannten Verfahren ist in solchen Fällen, daß bei einem
Vergleich zwischen dem zu bewertenden Sprachsignal mit einem Referenzsprachsignal
Unterschiede zwischen beiden Signalabschnitten in der gewählten Darstellungsebene in
den zu berechnenden Qualitätskennwert einfließen, die nicht oder kaum zu einer - auch
im auditiven Test wahrnehmbaren - qualitativen Beeinträchtigung führen.
Im Rahmen der hier betrachteten Sprachübertragung in Telefonanwendungen tragen
Frequenzbandbegrenzungen und spektrale Verformungen des zu bewertenden
Sprachsignals (z. B. hervorgerufen durch Filtereigenschaften des Telefongerätes oder des
Übertragungskanals) nur begrenzt zu einer empfundenen qualitativen Beeinträchtigung
bei.
Um diese Mängel teilweise zu vermeiden, wird in einem anderen Ansatz versucht, die
linearen Verzerrungen (Frequenzgang) durch ein Korrekturfilter bzw. eine Leistungs
übertragungsfunktion zu kompensieren (veröffentlicht in: "A new approach to objective
quality-measures based on attribute-matching", Halka, U.; Heute, U., Speech
communication, 11 (1992) 1, S. 15-30). Die Anwendung dieses Verfahrens ist jedoch bei
nichtlinearer und zeitinvarianter Übertragung nachteilig, da die so berechnete Kompen
sationsfunktion nicht mehr ausschließlich die spektralen Verformungen des zu
bewertenden Signals beschreibt.
Verschiebungen spektraler Kurzzeit-Maxima ("Formantverschiebungen") im zu
testenden Signal gegenüber dem Referenzsprachsignal, z. B. verursacht durch
Codiersysteme mit niedriger Bitrate, führen bei bekannten Verfahren zu großen
Unterschieden in den spektralen Intensitätsabbildungen und gehen damit stark in den
berechneten Qualitätswert ein. Untersuchungen haben ergeben, daß in einer auditiven
Sprachqualitätsuntersuchung diese Verschiebungen spektraler Kurzzeit-Maxima jedoch
nur begrenzten Einfluß auf das Qualitätsurteil haben.
Die Erfindung stellt sich die Aufgabe, den Einfluß von spektralen Begrenzungen und
Verformungen des zu bewertenden Sprachsignals sowie von Verschiebungen spektraler
Kurzzeit-Maxima vor dem Vergleich der spektralen Eigenschaften eines zu testenden
Signals mit einem Referenzsprachsignal und der Berechnung eines Qualitätswertes in
instrumentellen Verfahren zu reduzieren.
Im Gegensatz zu bekannten Ansätzen wird in der hier beschriebenen Erfindung eine
spektrale Wichtungsfunktion generiert, die auf mittleren spektralen Einhüllenden, z. B.
der mittleren spektralen Leistungsdichte, von zu bewertendem Sprachsignal und
Referenzsprachsignal beruht. Dies ermöglicht den Einsatz des Verfahrens ebenfalls bei
nichtlinearer und zeitvarianter Übertragung.
Die spektrale Wichtungsfunktion wird aus den Quotienten der Stützwerte der mittleren
spektralen Leistungsdichte des zu bewertenden Signals PhiY(f) und der des
Eingangssignals des Übertragungssystems PhiX(f) derart berechnet, daß die Wichtungs
funktion über
WT(f) = a(f).(PhiY(f)/PhiX(f))
zu beschreiben ist. Die Bewertungsfunktion a(f) kann die Wichtungsfunktion WT(f) an
über den Wirkungsbereich unterschiedlich gewichten, sie ist im einfachsten Falle
konstant 1.
Die derart berechnete spektrale Wichtungsfunktion WT(f) nähert die mittleren spektralen
Einhüllenden von zu bewertenden Sprachsignal und Referenzsprachsignal einander an,
so daß Unterschiede der beiden spektralen Einhüllenden nur noch vermindert in den
berechneten Qualitätswert einfließen.
Die spektrale Wichtungsfunktion WT(f) kann zum einen auf das Referenzsprachsignal
angewendet werden. Dabei wird das Referenzsprachsignal in seiner mittleren spektralen
Leistungsdichte dem zu bewertenden Signal angenähert (Fig. 2a).
Zum anderen kann die spektrale Wichtungsfunktion invertiert auf das zu bewertende
Signal angewendet werden. Dieses wird dadurch entzerrt und, hinsichtlich seiner
mittleren spektralen Leistungsdichte, an das Referenzsprachsignal angenähert (Fig. 2b).
Ein weiterer Teil der Erfindung bezieht sich auf die Korrektur von Verschiebungen
spektraler Kurzzeit-Maxima, die durch die Übertragungssysteme verursacht werden.
Die Intensität wird für jeden Zeitabschnitt in Frequenzbändern integriert. Resultat ist
eine Reihe von Intensitätswerten für jede spektrale Darstellung eines Signalabschnitts,
wobei jeder Einzelwert die Intensität in einem Frequenzband repräsentiert. Die
Verschiebungen spektraler Kurzzeit-Maxima können hierbei zu abweichenden
berechneten Intensitäten in den Frequenzbändern von Referenzsprachsignal und zu
bewertenden Sprachsignal führen.
Diese Abweichungen in den spektralen Intensitätsabbildungen - verursacht
Verschiebungen spektraler Kurzzeit-Maxima - können durch eine variable Anordnung
der Frequenzbänder auf der Frequenzachse reduziert werden. Im Gegensatz zu den
konstanten Bandgrenzen bei bekannten Verfahren werden die Bandgrenzen auf der
Frequenzachse verschoben. Die Zahl der Frequenzbänder und deren Index bleibt aber
konstant. In einer Optimierungsschleife werden dann diejenigen Bandgrenzen akzep
tiert, bei denen die beiden entstehenden spektralen Abbildungen von zu bewertenden
Sprachsignal und Referenzsprachsignal maximale Ähnlichkeit aufweisen bzw. deren
Abstand minimal ist. Diese Optimierung wird für alle Bänder in allen betrachteten Zeit
segmenten durchgeführt.
Der Einsatz variabler Bandgrenzen zur Berechnung der spektralen Intensitätsabbildung
ist nicht nur auf das Signal, in dem auch die beschriebene spektrale Wichtungsfunktion
WT(f) zum Einsatz kommt, beschränkt, sondern kann auch auf das jeweils andere Signal
und sogar auf beide Signale angewendet werden. (vgl. Fig. 2a und 2b).
Ein spezielles Ausführungsbeispiel zeigt eine Realisierung gemäß Fig. 3, die als
TOSQA (Telecommunication Objective Speech Quality Assessment) bezeichnet wird.
Hierbei erfolgt eine erweiterte Vorverarbeitung des Referenzsprachsignals.
In Spezifikation der allgemeinen Realisierungen nach Fig. 2a und 2b werden hier
Sprachpausen mittels eines Sprachpausenerkenners erkannt und gehen nicht in das
Qualitätsmaß ein. Ebenfalls erfolgt eine Filterung von Referenzsprachsignal und zu
bewertendem Sprachsignal mit einem Bandpaß 300 . . . 3400 Hz sowie eine Filterung auf
den Frequenzgang eines Telefonhandapparates. Die Integration der spektralen
Leistungsdichte erfolgt in Frequenzgruppen, die die Basis für die Berechnung der
spezifischen Lautheit darstellen.
Die Integration in Frequenzgruppen erfolgt jedoch nicht in festen Frequenz
gruppengrenzen, sondern mit den in dieser Erfindung beschriebenen variablen
Frequenzgruppengrenzen. Die berechneten Signalleistungen in den so modifizierten
Frequenzgruppen bilden die Basis für die Intensitätsberechnung. Hier wurde auf ein
Modell zur Berechnung der spezifischen Lautheit nach Zwicker, einer gehörrichtigen
Intensitätsabbildung, zurückgegriffen (veröffentlicht in Zwicker, E.: "Psychoakustik",
Berlin: Springer-Verlag, 1982).
Die berechneten Lautheitsmuster werden in Ergänzung des allgemeinen Ansatzes noch
durch eine Fehlerbewertungsfunktion ergänzt. Der berechnete Qualitätswert wird über
einen Mittelwert der Korrelationskoeffizienten der spezifischen Lautheiten für jedes
betrachtete kurze Zeitsegment über die Zahl der ausgewerteten Sprachsegmente
gebildet.
Claims (6)
1. Verfahren zur instrumentellen Sprachqualitätsbestimmung, bei dem durch
Vergleich von spektralen Kurzzeiteigenschaften eines zu bewertenden
Sprachsignals mit einem Referenzsprachsignal Kennwerte zur Bestimmung der
Sprachqualität berechnet werden, dadurch gekennzeichnet,
daß vor dem Vergleich der Eigenschaften der Sprachsignale, Unterschiede in
mittleren spektralen Einhüllenden verringert werden, indem aus diesen zuerst eine
spektrale Wichtungsfunktion berechnet wird, mit der die spektralen Kurzzeit
eigenschaften der Sprachsignale in allen betrachteten Zeitsegmenten gewichtet
werden, so daß die Unterschiede in den mittleren spektralen Einhüllenden dadurch
nur begrenzt in den zu berechnenden Qualitätskennwert einfließen, und
daß für die Berechnung der Signalintensität die Grenzen der benutzten Frequenz
bänder variabel gestaltet werden, so daß für jeden betrachteten Signalabschnitt in
jeweils allen ausgewerteten Frequenzbändern die berechneten Intensitäten von
Referenzsprachsignal und zu bewertendem Signal zueinander möglichst geringe
Unterschiede aufweisen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zuerst die mittleren
spektralen Einhüllenden von zu bewertenden Sprachsignal und
Referenzsprachsignal in Form eines mittleren Leistungsdichtespektrums berechnet
werden und aus dem Quotienten beider Spektren eine spektrale Wichtungsfunktion
WT(f) berechnet wird, mit der die Kurzzeit-Leistungsdichtespektren des
Referenzsprachsignals vor der Berechnung eines Qualitätskennwertes gewichtet
werden.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß die zu
berechnende Wichtungsfunktion WT(f) nur aus Teilbereichen der berechneten
mittleren spektralen Einhüllenden von zu bewertenden Sprachsignal und
Referenzsprachsignal berechnet wird und damit die Unterschiede in mittleren
spektralen Einhüllenden zwischen beiden Signalen nur in spektralen Teilbereichen
verringert werden.
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß vor Berechnung der
Qualitätskennwerte eine Integration der Signalintensität für jeden ausgewerteten
kurzen Zeitabschnitt in Frequenzgruppen erfolgt, wobei die Grenzen der
Frequenzgruppen auf der Frequenzachse variabel sind, aber die Breite der
Frequenzgruppen auf der Tonheitskala konstant bleibt, und daß aus den Signal
intensitäten in den Frequenzgruppen eine Berechnung der spezifischen Lautheit
erfolgt, wobei die Grenzen der Frequenzgruppen benutzt werden, bei denen die
berechneten Unterschiede in der spezifischen Lautheit zwischen dem zu
bewertenden Signal und dem Referenzsprachsignal im jeweils betrachteten Band
und Zeitsegment den geringsten Unterschied aufweisen.
5. Verfahren nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß der Qualitäts
kennwert aus der Ähnlichkeit der spektralen Darstellungen in jedem betrachteten
Zeitabschnitt berechnet wird, wobei die Ähnlichkeit einen über alle betrachteten
Zeitabschnitte gemittelten Korrelationskoeffizienten zwischen der spektralen
Darstellung des zu bewertenden Sprachsignals und der spektralen Darstellung des
Referenzsprachsignals im jeweiligen Zeitsegment darstellt.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß der Korrelations
koeffizient zwischen der spektralen Darstellung des zu bewertenden Sprachsignals
und der spektralen Darstellung des Referenzsprachsignals im jeweiligen
Zeitsegment nur von einem Teilbereich der spektralen Darstellung berechnet wird,
d. h. für die Berechnung des Qualitätskennwertes nicht alle berechneten
Spektralwerte berücksichtigt werden.
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19840548A DE19840548C2 (de) | 1998-08-27 | 1998-08-27 | Verfahren zur instrumentellen Sprachqualitätsbestimmung |
CA002305652A CA2305652A1 (en) | 1998-08-27 | 1999-08-14 | Method for instrumental voice quality evaluation |
PCT/EP1999/005972 WO2000013173A1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
DE59907623T DE59907623D1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
AT99942871T ATE253765T1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
EP99942871A EP1048025B1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
US09/530,389 US7013266B1 (en) | 1998-08-27 | 1999-08-14 | Method for determining speech quality by comparison of signal properties |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19840548A DE19840548C2 (de) | 1998-08-27 | 1998-08-27 | Verfahren zur instrumentellen Sprachqualitätsbestimmung |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19840548A1 true DE19840548A1 (de) | 2000-03-02 |
DE19840548C2 DE19840548C2 (de) | 2001-02-15 |
Family
ID=7879918
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19840548A Expired - Fee Related DE19840548C2 (de) | 1998-08-27 | 1998-08-27 | Verfahren zur instrumentellen Sprachqualitätsbestimmung |
DE59907623T Expired - Lifetime DE59907623D1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE59907623T Expired - Lifetime DE59907623D1 (de) | 1998-08-27 | 1999-08-14 | Verfahren zur instrumentellen sprachqualitätsbestimmung |
Country Status (6)
Country | Link |
---|---|
US (1) | US7013266B1 (de) |
EP (1) | EP1048025B1 (de) |
AT (1) | ATE253765T1 (de) |
CA (1) | CA2305652A1 (de) |
DE (2) | DE19840548C2 (de) |
WO (1) | WO2000013173A1 (de) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001065543A1 (en) * | 2000-02-29 | 2001-09-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Compensation for linear filtering using frequency weighting factors |
EP1492085A2 (de) * | 2003-06-25 | 2004-12-29 | Lucent Technologies Inc. | Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität |
EP2388779A1 (de) * | 2010-05-21 | 2011-11-23 | SwissQual License AG | Verfahren zur Schätzung der Sprachqualität |
CN112233693A (zh) * | 2020-10-14 | 2021-01-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音质评估方法、装置和设备 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1241663A1 (de) * | 2001-03-13 | 2002-09-18 | Koninklijke KPN N.V. | Verfahren und Vorrichtung zur Sprachqualitätsbestimmung |
EP1292036B1 (de) * | 2001-08-23 | 2012-08-01 | Nippon Telegraph And Telephone Corporation | Verfahren und Vorrichtung zur Decodierung von digitalen Signalen |
DE10142846A1 (de) * | 2001-08-29 | 2003-03-20 | Deutsche Telekom Ag | Verfahren zur Korrektur von gemessenen Sprachqualitätswerten |
DE10150519B4 (de) * | 2001-10-12 | 2014-01-09 | Hewlett-Packard Development Co., L.P. | Verfahren und Anordnung zur Sprachverarbeitung |
EP1492084B1 (de) * | 2003-06-25 | 2006-05-17 | Psytechnics Ltd | Vorrichtung und Verfahren zur binauralen Qualitätsbeurteilung |
ES2313413T3 (es) * | 2004-09-20 | 2009-03-01 | Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno | Compensacion en frecuencia para el analisis de precepcion de habla. |
EP2249333B1 (de) * | 2009-05-06 | 2014-08-27 | Nuance Communications, Inc. | Verfahren und Vorrichtung zur Schätzung einer Grundfrequenz eines Sprachsignals |
EP2828853B1 (de) * | 2012-03-23 | 2018-09-12 | Dolby Laboratories Licensing Corporation | Verfahren und system zur biaskorrektur von sprachpegelmessungen |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3708002A1 (de) * | 1987-03-12 | 1988-09-22 | Telefonbau & Normalzeit Gmbh | Messverfahren zum beurteilen der guete von sprachcodierern und/oder uebertragungsstrecken |
EP0727767A2 (de) * | 1995-02-14 | 1996-08-21 | Telia Ab | Verfahren und Vorrichtung zur Sprachqualitätsbewertung |
EP0809236A1 (de) * | 1996-05-21 | 1997-11-26 | Koninklijke KPN N.V. | Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4860360A (en) * | 1987-04-06 | 1989-08-22 | Gte Laboratories Incorporated | Method of evaluating speech |
GB9213459D0 (en) | 1992-06-24 | 1992-08-05 | British Telecomm | Characterisation of communications systems using a speech-like test stimulus |
NL9500512A (nl) * | 1995-03-15 | 1996-10-01 | Nederland Ptt | Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal. |
-
1998
- 1998-08-27 DE DE19840548A patent/DE19840548C2/de not_active Expired - Fee Related
-
1999
- 1999-08-14 WO PCT/EP1999/005972 patent/WO2000013173A1/de active IP Right Grant
- 1999-08-14 EP EP99942871A patent/EP1048025B1/de not_active Expired - Lifetime
- 1999-08-14 AT AT99942871T patent/ATE253765T1/de active
- 1999-08-14 DE DE59907623T patent/DE59907623D1/de not_active Expired - Lifetime
- 1999-08-14 US US09/530,389 patent/US7013266B1/en not_active Expired - Lifetime
- 1999-08-14 CA CA002305652A patent/CA2305652A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3708002A1 (de) * | 1987-03-12 | 1988-09-22 | Telefonbau & Normalzeit Gmbh | Messverfahren zum beurteilen der guete von sprachcodierern und/oder uebertragungsstrecken |
EP0727767A2 (de) * | 1995-02-14 | 1996-08-21 | Telia Ab | Verfahren und Vorrichtung zur Sprachqualitätsbewertung |
EP0809236A1 (de) * | 1996-05-21 | 1997-11-26 | Koninklijke KPN N.V. | Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001065543A1 (en) * | 2000-02-29 | 2001-09-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Compensation for linear filtering using frequency weighting factors |
EP1492085A2 (de) * | 2003-06-25 | 2004-12-29 | Lucent Technologies Inc. | Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität |
EP1492085A3 (de) * | 2003-06-25 | 2005-02-16 | Lucent Technologies Inc. | Verfahren zur Darstellung der zeitlichen/sprachlichen Verzerrung für die objektive Bewertung der Sprachqualität |
US7305341B2 (en) | 2003-06-25 | 2007-12-04 | Lucent Technologies Inc. | Method of reflecting time/language distortion in objective speech quality assessment |
EP2388779A1 (de) * | 2010-05-21 | 2011-11-23 | SwissQual License AG | Verfahren zur Schätzung der Sprachqualität |
EP2474975A1 (de) * | 2010-05-21 | 2012-07-11 | SwissQual License AG | Verfahren zur Schätzung der Sprachqualität |
CN112233693A (zh) * | 2020-10-14 | 2021-01-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音质评估方法、装置和设备 |
CN112233693B (zh) * | 2020-10-14 | 2023-12-01 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音质评估方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
DE19840548C2 (de) | 2001-02-15 |
EP1048025B1 (de) | 2003-11-05 |
EP1048025A1 (de) | 2000-11-02 |
DE59907623D1 (de) | 2003-12-11 |
WO2000013173A1 (de) | 2000-03-09 |
CA2305652A1 (en) | 2000-03-09 |
US7013266B1 (en) | 2006-03-14 |
ATE253765T1 (de) | 2003-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69836785T2 (de) | Audiosignalkompression, Sprachsignalkompression und Spracherkennung | |
DE3306730C2 (de) | ||
DE60031432T2 (de) | System, verfahren und hergestellter gegenstand zur detektion von emotionen in sprachsignalen mittels statistischer analyse von sprachsignalparametern | |
DE19840548C2 (de) | Verfahren zur instrumentellen Sprachqualitätsbestimmung | |
DE69730721T2 (de) | Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form | |
DE60122751T2 (de) | Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal | |
EP0296588A2 (de) | Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen | |
DE19952538A1 (de) | Automatische Verstärkungsregelung in einem Spracherkennungssystem | |
DE2636032B2 (de) | Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal | |
DE69922769T2 (de) | Vorrichtung und Verfahren zur Sprachverarbeitung | |
DE2021126C3 (de) | Spracherkennungs anordnung | |
DE3143372A1 (de) | Verfahren zum elektronischen auswerten der bei der blutdruckmessung nach der methode riva-rocci auftretenden korotkoff-geraeusche | |
EP1382034B1 (de) | Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen | |
DE60110541T2 (de) | Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz | |
EP0916206B1 (de) | Verfahren und anordnung zum beurteilen der qualität eines übertragenen sprachsignals | |
DE60200932T2 (de) | Vorrichtung und verfahren zur analyse eines sprachsignals | |
DE602004011292T2 (de) | Vorrichtung zur Sprachdetektion | |
DE2431458A1 (de) | Verfahren zur automatischen sprechererkennung | |
DE4437287C2 (de) | Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale | |
DE2312356A1 (de) | Verfahren und vorrichtung zur bestimmung der grundfrequenz von sprachsignalen | |
DE4124493C1 (de) | ||
DE10026872A1 (de) | Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector) | |
DE3009204C2 (de) | ||
DE2506771C2 (de) | Verfahren zur Verbesserung der Sprechererkennung | |
EP1288914B1 (de) | Verfahren zur Korrektur von gemessenen Sprachqualitätswerten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |