DE60311754T2 - Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals - Google Patents

Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals Download PDF

Info

Publication number
DE60311754T2
DE60311754T2 DE60311754T DE60311754T DE60311754T2 DE 60311754 T2 DE60311754 T2 DE 60311754T2 DE 60311754 T DE60311754 T DE 60311754T DE 60311754 T DE60311754 T DE 60311754T DE 60311754 T2 DE60311754 T2 DE 60311754T2
Authority
DE
Germany
Prior art keywords
quality
impairment
delay
interaction
measuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60311754T
Other languages
English (en)
Other versions
DE60311754D1 (de
Inventor
Akira Musashino Takahashi
Jun Musashino Okamoto
Ginga Musashino Kawaguti
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of DE60311754D1 publication Critical patent/DE60311754D1/de
Application granted granted Critical
Publication of DE60311754T2 publication Critical patent/DE60311754T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • Die vorliegende Erfindung betrifft ein Verfahren zum Abschätzen der Sprachqualität in Fernmeldediensten und insbesondere ein Gesamt-Konversationssprachqualitätsschätzverfahren und eine Vorrichtung zum Schätzen der subjektiven Konversationssprachqualität aus gemessenen Größen physikalischer Merkmale eines zu testenden Systems ohne Durchführung von subjektiven Bewertungstests zum Bewerten der tatsächlichen Konversationssprachqualität bei IP-Telefonie; die Erfindung betrifft ferner ein Programm zum Implementieren des Verfahrens und ein Aufzeichnungsmedium mit dem darauf gespeicherten Programm.
  • STAND DER TECHNIK
  • In den letzten Jahren haben "IP-Telefoniedienste" (VoIP: Voice over IP (Internet Protokoll)), die unter Verwendung von IP-Technologie implementiert werden, das Interesse der Industrie auf sich gezogen. Da die IP-Telefoniedienste Echtzeitfernmeldedienste über Systeme sind, die nicht notwendigerweise Konversationssprachqualität garantieren, sind der qualitätsorientierte Entwurf von IP-Telefonie vor und Qualitätsmanagement nach Inbetriebnahme ihrer Dienste für einen stabilen Betrieb erforderlich. Hierfür ist es wichtig, ein einfaches und effizientes Qualitätsbewertungsschema zu entwickeln, das in der Lage ist, die Sprachqualität, die die Benutzer genießen, geeignet zu beschreiben.
  • Die Grundbewertung der Sprachqualität in IP-Telefoniediensten ist die subjektive Bewertung, die quantitativ die tatsächliche subjektive Qualität bewertet, die Benutzer in psychologischen Experimenten während IP-Telefonieanwendungen wahrnehmen. Für die subjektive Bewertung wird weithin der in ITU-T-Empfehlung P.800 definierte Meinungstest verwendet. Bei diesem Verfahren wird die auf einer Skala von 1 bis 5 beurteilte tatsächliche subjektive Qualität als ein Mittelwert angegeben, der als MOS(Mean Opinion Score), mittlerer Meinungswert) bezeichnet wird. Unter diesen MOS-Werten gibt es zum Beispiel einen Konversations-MOS, der eine Gesamtsprachqualitätsschätzung einschließlich eines Gesprächsqualitätsfaktors ist, und einen Zuhör-MOS, der nur auf der Hörqualität basiert.
  • Da der Meinungstest die Sprachqualität letztlich durch Menschen beurteilt, werden die MOS-Werte als die geeignetsten Beurteilungen der Sprachqualität angesehen, die von Benutzern während der Inanspruchnahme der entsprechenden Dienste gefühlt wird. Wegen der subjektiven Bewertung erfordert der Meinungstest jedoch viel Arbeit und Zeit und spezielles Bewertungsgerät, und daher ist das Schema nicht notwendigerweise einfach zu implementieren und ist insbesondere für das Qualitätsmanagement der IP-Telefonie nach Inbetriebnahme schwer zu verwenden. Daher finden Untersuchungen eines Schemas statt, das physikalische Größen von Telekommunikationsmerkmalen verwendet, um MOS-Werte zu schätzen, die durch die Meinungsbewertung erhältlich sind.
  • Dieses Schema wird im Gegensatz zu dem subjektiven Bewertungsverfahren als ein "objektives Bewertungsverfahren" bezeichnet, und je nach Ziel und Ansatz werden diverse Abwandlungen für dieses objektive Bewertungsverfahren vorgeschlagen.
  • Das in ITU-T-Empfehlung P.862 definierte PESQ-(Perceptual Evaluation of Speech Quality, Wahrnehmungsbewertung von Sprachqualität)-Verfahren ist ein objektives Bewertungsverfahren, das auf der physikalischen Messung eines tatsächlichen Sprachsignals basiert; unter bestimmten Bedingungen ist dieses Verfahren in der Lage, die subjektive Sprachqualität mit einem Schätzfehler zu schätzen, der ungefähr genauso groß wie das statistische Konfidenzintervall der subjektiven Bewertung ist. Das PESQ-Verfahren ist effektiv zum Schätzen des Zuhör-MOS, es ist aber prinzipiell nicht in der Lage, Konversationsqualitätsfaktoren wie etwa Verzögerung und Echo zu schätzen.
  • Andererseits ist das in ITU-T-Empfehlung G.107 definierte E-Modell eine Gesamt-Kommunikationssprachqualitätsschätztechnik, die die Konversationsqualitätsfaktoren beinhaltet. Das E-Modell drückt Beeinträchtigungen durch individuelle Qualitätsfaktoren wie etwa Zuhörqualität, Verzögerung und Echo auf der psychologischen Skala aus und addiert diese Beeinträchtigungen zusammen, und das Modell ist ausgedrückt durch die folgende Gleichung. R = Ro – Is – Id – Ie, eff + A (1)
  • Ein grundlegendes Signal-/Rauschverhältnis Ro stellt die subjektive Qualitätsbeeinträchtigung durch Schaltungsrauschen, Sender/Empfänger-Raumgeräusch und Teilnehmerleitungsrauschen dar. Ein Simultanbeeinträchtigungsfaktor-Bewertungswert Is stellt die subjektive Qualitätsbeeinträchtigung aufgrund von Lautheit, Nebengeräusch und Quantisierungsverzerrung dar. Ein verzögerungsbezogener Beeinträchtigungsfaktor-Schätzwert ID stellt die subjektive Beeinträchtigung aufgrund von Sprecherecho, Zuhörerecho und reiner Verzögerung dar. Ein Gerätebeeinträchtigungsfaktor-Bewertungswert Ie, eff stellt die subjektive Qualitätsbeeinträchtigung aufgrund von CODEC mit niedriger Bitrate und Paket-/Zellenverlust dar. Ein Vorteilsfaktor-Bewertungswert A ergänzt den Einfluss des Vorteils etwa von Mobilkommunikationen auf die subjektive Qualität (Zufriedenheitspegel).
  • Das E-Modell basiert auf der Hypothese, dass diese Qualitätsbeeinträchtigungen auf der psychologischen Skala einfach zusammenaddiert werden können. Falls die Schätzung der Gesamtsprachqualität Einbußefaktoren enthält, die einen mit den vom E-Modell angenommenen einfachen additiven Modell unerklärbaren Effekt haben, können die E-Modell-Schätzungen manchmal von der von den Benutzern wahrgenommenen tatsächlichen subjektiven Qualität abweichen.
  • Ein weiteres Beispiel eines bekannten Verfahrens zum Schätzen von Sprachqualität in Telefoniediensten ist offenbart in Rix et al., „Perceptual Analysis Measurement System for Robust End-To-End Speech Quality Assessment", ICASSP 2000, Istanbul, Türkei, 05.-09. Juni 2000, Seiten 1515 bis 1518.
  • KURZBESCHREIBUNG DER ERFINDUNG
  • Ein Ziel der vorliegenden Erfindung ist daher, ein Verfahren und eine Vorrichtung anzugeben, die das Problem der verringerten Schätzgenauigkeit bei einem Versagen der Hypothese des existierenden E-Modells beseitigen und die Implementierung einer hochgenauen Schätzung der Gesamtsprachqualität ermöglichen.
  • Gemäß der vorliegenden Erfindung umfasst ein Verfahren zum Schätzen der Sprachqualität eines zu prüfenden Systems, das eine Mehrzahl von Qualitätseinbußefaktoren hat, die Schritte:
    • (a) Messen von primären Bewertungswerten der Qualitätseinbußefaktoren des Systems basierend auf einem von dem System empfangenen Signal;
    • (b) Transformieren der primären Bewertungswerte der Qualitätseinbußefaktoren in psychologische Beeinträchtigungen (Werte auf der psychologischen Skala);
    • (c) Berechnen des Ausmaßes der Wechselwirkung zwischen den psychologischen Beeinträchtigungen durch wenigstens zwei der mehreren Qualitätseinbußefaktoren;
    • (d) Berechnen der Summe der psychologischen Beeinträchtigungen und des Ausmaßes der Wechselwirkung als eine Gesamtbeeinträchtigung; und
    • (e) Transformieren der Gesamtbeeinträchtigung in einen subjektiven Qualitätsbewertungswert.
  • Gemäß der vorliegenden Erfindung umfasst eine Gesamt-Sprachqualitätsschätzvorrichtung zum Schätzen der Sprachqualität eines zu prüfenden Systems, das eine Mehrzahl von Qualitätseinbußefaktoren hat,
    Qualitätsmessmittel zum Messen von primären Bewertungswerten der Qualitätseinbußefaktoren des Systems basierend auf einem von dem System empfangenen Signal;
    Transformationsmittel zum Transformieren der primären Bewertungswerte der Qualitätseinbußefaktoren in psychologische Beeinträchtigungen (Werte auf der psychologischen Skala);
    Wechselwirkungsausmaß-Berechnungsmittel zum Berechnen des Ausmaßes der Wechselwirkung zwischen den psychologischen Beeinträchtigungen durch die Mehrzahl von Qualitätseinbußefaktoren aus dem Ausgabewert der Transformationsmittel;
    Addiermittel zum Addieren der primären Bewertungswerte und des Ausmaßes der Wechselwirkung, um eine Gesamtbeeinträchtigung zu erhalten; und
    Gesamtsprachqualitätsbewertungsmittel zum Transformieren der Gesamtbeeinträchtigung in einen subjektiven Qualitätsbewertungswert.
  • Durch Berücksichtigen der Wechselwirkung zwischen wenigstens zwei Qualitätseinbußefaktoren wie oben beschrieben ist es möglich, eine erhöhte Schätzgenauigkeit der Gesamtsprachqualität zu liefern.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockdiagramm, das die Konfiguration einer ersten Ausgestaltung der Gesamtsprachqualitätsschätzvorrichtung gemäß der vorliegenden Erfindung zeigt;
  • 2 ist ein Diagramm, das Messwerte der Gesamtbeeinträchtigung unter Berücksichtigung einer Wechselwirkung zwischen verzögerungsbezogener Beeinträchtigung und Zuhörqualitätsbeeinträchtigung gemäß der vorliegenden Erfindung zeigt;
  • 3 ist ein Konzeptdiagramm basierend auf einer Gleichung, die die Gesamtbeeinträchtigung einschließlich der Wechselwirkung ausdrückt;
  • 4 ist ein Graph, der die Wirkung der Ausgestaltung der vorliegenden Erfindung zeigt;
  • 5 ist ein Flussdiagramm, das die Grundprozedur des Gesamtsprachqualitätsschätzverfahrens gemäß der vorliegenden Erfindung zeigt; und
  • 6 ist ein Blockdiagramm, das eine zweite Ausgestaltung der vorliegenden Erfindung zeigt.
  • DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSGESTALTUNG
  • Ausgestaltung 1
  • 1 ist ein Blockdiagramm, das die Vorrichtungskonfiguration zum Implementieren des Gesamtsprachqualitätsschätzverfahrens gemäß der vorliegenden Erfindung zeigt. Die vorliegende Erfindung ist anwendbar auf die Schätzung der Sprachqualität in einem zu testenden System 100, zum Beispiel in festen oder IP-Telefoniediensten. Diese Ausgestaltung handhabt als Qualitätsfaktoren für die Schätzung der Sprachqualität Verzögerung und Zuhörqualität, die stark die Qualitätsauslegung des Systems 100 beeinflussen, und die Bewertungsausgabe ist eine Schätzung der Gesamtsprachqualität in dem Fall, dass diese Faktoren vermischt werden.
  • In 1 bezeichnet Bezugszeichen 1 allgemein eine Ausgestaltung der Gesamtsprachqualitätsbewertungsvorrichtung gemäß der vorliegenden Erfindung. Die Bewertungsvorrichtung 10 umfasst: ein Messschnittstellenteil 101, das Testsignale über das zu schätzende System 100 sendet und empfängt; ein Verzögerungszeitmessteil 102 und ein Zuhörqualitätsmessteil 103, die basierend auf von dem System 100 empfangenen Signalen primäre Bewertungswerte von Qualitätsfaktoren messen, das heißt, die eine Übertragungsverzögerungszeit und einen Zuhörqualitätsbeeinträchtigungs- oder -einbußefaktor des Systems als primäre Bewertungswerte messen; ein Transformationsteil für verzögerungsbezogene Beeinträchtigungsbewertungswerte 104 und ein Transformationsteil 105 für Zuhörqualitätsbewertungswerte, die die gemessenen Ausgaben der Messteile 102 und 103 in eine verzögerungsbezogene Beeinträchtigung Idd und eine Zuhörqualitätsbeeinträchtigung Ie, eff umwandeln, die Maße oder Indizes sind, die psychologische Abstände angeben, die zusammenaddiert werden können; ein Wechselwirkungswertrechenteil 106, das den Wert einer Wechselwirkung Iint zwischen der verzögerungsbezogenen Beeinträchtigung Idd und der Zuhörqualitätseinbuße Ie, eff berechnet; ein Addierteil 107, das einen Gesamtsprachqualitätsindex LQd durch Zusammenaddieren der Verzögerungsbeeinträchtigung Idd, der Sprachqualitätsbeeinträchtigung Ie, eff und des Wechselwirkungswertes Iint berechnet; und ein Gesamtsprachqualitätsschätzteil 108, das den Ausgabeindex LQd von dem Addierteil in einen subjektiven Sprachqualitätsbewertungswert (zum Beispiel einen durch einen subjektiven Bewertungstest erhältlichen mittleren Meinungswert) umwandelt.
  • Gemäß dem tatsächlich zum Messen von Verzögerungszeit und Zuhörqualität verwendeten Verfahren wird das Testsignal für die Messung durch ein Testsignalerzeugungsteil in der Gesamtsprachqualitätsschätzvorrichtung 10 oder durch einen Testsignalgenerator 210 erzeugt, der mit dem System 100 außerhalb der Qualitätsschätzvorrichtung 10 verbunden ist.
  • Erstes Verzögerungszeitmessverfahren: Das Verzögerungszeitmessteil 102 berechnet eine von dem System 100 verursachte Einwegverzögerungszeit Ta durch Vergleichen eines in Steuerinformation (zum Beispiel einem RTP-Header in VoIP) enthaltenen Zeitstempels des Sprachsignals, welches das Messschnittstellenteil 101 vom Testsignalgenerator 210 empfangen hat, mit der tatsächlichen Empfangszeit. Dieses Verfahren erfordert eine zeitliche Synchronisation zwischen Sender- und Empfängerseite.
  • Zweites Verzögerungszeitmessverfahren: Wenn keine zeitliche Synchronisation erreicht wird, verwendet das Verzögerungszeitmessteil 102 RTCP (RTP control protocol: ein Protokoll zum Steuern von RTP-Übertragung), um eine Hin- und Zurück-Verzögerungszeit Td zwischen ihm und einem mit dem System 100 verbundenen willkürlichen Empfangsgerät (nicht dargestellt) zu berechnen, und erhält die Einwegverzögerungszeit Ta = Td/2.
  • Drittes Verzögerungszeitmessverfahren: Alternativ berechnet das Verzögerungszeitmessteil 102 die Hin-und-Zurück-Verzögerungszeit Td zwischen der Empfängerseite und der Senderseite durch Senden eines Ping (Packet InterNet Groper) von ersterem zu letzterem und erhält die Einwegverzögerungszeit Ta = Td/2.
  • Das Transformationsteil für die verzögerungsbezogene Beeinträchtigungsbewertung 104 folgt vorgegebenen Regeln, um die Beeinträchtigung durch Verzögerung, das heißt, die verzögerungsbezogene Beeinträchtigung Idd aus der von dem Verzögerungszeitmessteil 102 gemessenen Einwegverzögerungszeit Ta zu erhalten. Genauer gesagt ist in dem in ITU-T-Empfehlung G.107 definierten E-Modell die verzögerungsbezogene Beeinträchtigung definiert durch die folgenden Gleichungen basierend auf der Beziehung zwischen einer durch Experimente erhaltenen Sprachverzögerungszeit und dem entsprechenden subjektiven Sprachbewertungswert (mittlerer Meinungswert MOS, definiert in ITU-T-Empfehlung P.800). Idd = 0 für Ta ≤ 100 ms (2) Idd = 25{(1 + X6)1/6 – 3(1 + [X/3]6]1/6 + 2} für Ta > 100 ms (3)wobei X = Ig(Ta/100)/Ig2.
  • Alternativ kann die folgende Gleichung anstelle von Gleichungen (2) und (3) verwendet werden. Idd = b1Ta2 + b2Ta (4)wobei b1 und b2 Konstanten sind.
  • Im Folgenden werden eine Beschreibung der Messung des Zuhörqualitätseinbußefaktors durch das Zuhörqualitätsmessteil 103 und drei Abwandlungen des Verfahrens zum Erhalten der Zuhörqualitätsbeeinträchtigung Ie, eff aus dem gemessenen Zuhörqualitätseinbußefaktor durch das ZuhörqualitätsbewertungsTransformationsteil 105 gegeben (ein Zuhörqualitätsbewertungsverfahren).
  • Erstes Zuhörqualitätsbewertungsverfahren:
  • In dem in ITU-T-Empfehlung G.107 definierten E-Modell ist die Qualitätsbeeinträchtigung Ie, eff wie folgt formuliert:
    Figure 00060001
    wobei Ie eine Qualitätsbeeinträchtigung durch Sprachcodierung, PpI die Paketverlustwahrscheinlichkeit und BpI die Paketverlust-Robustheit des Codiersystems ist. Als Sprachcodiersystem stehen zum Beispiel PCM, ADPCM, A-CELP (Algebraic Code Linear Excited Prediction), MP-MLQ (MultiPulse Maximum Likelihood Quantization), CS-ACELP (Conjugated Structure Algebraic Code Linear Excited Prediction)-Codiersysteme zur Verfügung. Mit Bezug auf diese Codiersysteme zeigt ITU-T-Empfehlung G.113 Anhang I Qualitätsbeeinträchtigungen Ie durch Codierung und die Paketverlust-Robustheitswerte BPL der Codiersysteme. Bei dem ersten Zuhörqualitätsbewertungsverfahren misst das Zuhörqualitätsmessteil 103 die Paketverlustwahrscheinlichkeit PpI des empfangenen Signals als einen Zuhörqualitätseinbußefaktor und bestimmt die Werte Ie und BpI unter Bezugnahme auf den oben erwähnten Anhang I von ITU-T-Empfehlung G.113 entsprechend dem a priori erhaltenen Typ des Codiersystems, und das Zuhörqualitätsbewertungswert-Transformationsteil 105 berechnet die Zuhörqualitätsbeeinträchtigung Ie, eff nach Gleichung (5).
  • Zweites Zuhörqualitätsbewertungsverfahren:
  • In ITU-T-Empfehlung P.862 ist gezeigt, wie der PESQ-(Perceptual Evaluation of Speech Quality)-Wert erhalten wird. Die Grundprozedur beginnt mit der Messung von Spektren eines beeinträchtigten Sprachsignals, das das zu messende System durchlaufen hat, und der ursprünglichen Sprache, die das System nicht durchlaufen hat, gefolgt vom Erhalten einer Differenz zwischen den gemessenen Spektra und dann gefolgt von dem Erhalten, als PESQ-Wert, des Wertes, der dem Ausmaß der Verzerrung entspricht, aus dem Differenzspektrum. Bei der tatsächlichen Prozedur zum Erhalten des PESQ nach der oben erwähnten Empfehlung P.862 werden die Daten diversen anderen Verarbeitungen unterzogen, doch wird in dieser Beschreibung keine Darstellung von diesen geliefert, und die Gesamtprozedur wird im Folgenden als ein PESQ-Algorithmus bezeichnet.
  • Das durch das Messschnittstellenteil 101 vom Testsignalgenerator 210 über das System 100 empfangene Sprachsignal wird als ein beeinträchtigtes Sprachsignal an das Zuhörqualitätsmessteil 103 angelegt, und gleichzeitig wird das ursprüngliche Sprachsignal direkt daran angelegt, wie durch die gestrichelte Linie dargestellt. Das Zuhörqualitätsmessteil 103 berechnet den Sprachqualitätsbeurteilungswert PESQ als einen Sprachqualitätseinbußefaktor aus den zwei Sprachsignalen durch den PESQ-Algorithmus. Bei einer tatsächlichen Messung werden zum Beispiel Paare von kurzen Sätzen (vier), die von wenigstens zwei männlichen und zwei weiblichen Sprechern gesprochen werden, mehrere Male vom Testsignalerzeugungsteil 210 über das System 100 ausgesandt und direkt zum Qualitätsmessteil 103 gesandt, welches den PESQ-Wert mehrere Male aus mehreren empfangenen Sprachsignalen erhält und deren Mittelwert als endgültigen Sprachqualitätsbeurteilungswert PRSQ ausgibt. Das Zuhörqualitätsbewertungswert-Transformationsteil 105 wandelt den PESQ-Wert in einen Wert auf der R-Wert-Achse nach der folgenden in ITU-T-Empfehlung G.107 Anhang I definierten Gleichung um.
  • Figure 00070001
  • Der durch Gleichung (6) erhaltene R-Wert wird von dem Referenzwert subtrahiert, um den Zuhörqualitätseinbußefaktorwert Ie, eff zu erhalten. Genauer gesagt wird die folgende Gleichung berechnet, wobei als Referenzwert ein Wert (87,7) verwendet wird, der erhalten wird, indem in Gleichung (6) der Mittelwert von PESQ-Werten für das nach ITU-T-Empfehlung G.711 codierte Signal eingesetzt wird, das eine von Sprachproben ist, die in ITU-T P-Reihe Empfehlung Ergänzung 23 angegeben sind. Ie, eff = 87,7 – R(target) (7)
  • Drittes Zuhörqualitätsbewertungsverfahren
  • Bei dem oben beschriebenen zweiten Zuhörqualitätsbewertungsverfahren muss das ursprüngliche Sprachsignal vom Testsignalerzeugungsteil 210 direkt in das Zuhörqualitätsmessteil 103 eingegeben werden, doch das dritte Zuhörqualitätsbewertungsverfahren bewertet die Zuhörqualität des Sprachsignals durch Erhalten eines Bewertungswertes nur aus dem über das System 100 empfangenen Signal in derselben Weise wie zum Beispiel in Tetsuro YAMAZAKI und Hiroshi IRII, „Proposal of Objective Assessment Method for Telecommunication Speech Quality Using Pattern Recognition Technique", IEICE SP92-94, Nov. 1992, Seiten 17 bis 34 offenbart. In diesem Fall wird die subjektive Bewertung von verzerrter Sprache vorab vorgenommen, um die Frequenzverteilung der Meinungsbewertung zu erhalten. Außerdem werden auch Referenzmuster von akustischen Para metern, die die verzerrten Sprachmerkmale darstellen, wie etwa LPC-Cepstrum, erzeugt. Die Sprachqualität wird geschätzt durch Verwendung des Grades von Likelihood zwischen den Referenzmustern und desjenigen der zu bewertenden Sprache und der Verteilung von Meinungsbewertungspunkten der Sprache, an der die Referenzmuster erzeugt wurden.
  • Bei diesem Verfahren wird das zu bewertende Sprachsignal, das von dem Messschnittstellenteil 101 empfangen wird, in dem Zuhörqualitätsmessteil 103 einer LPC-Analyse unterzogen, um akustische Muster des LPC-Cepstrums als Zuhörqualitätseinbußefaktor zu erhalten. Die Anpassung (Matching) zwischen den so erhaltenen akustischen Mustern und den Referenzmustern wird berechnet, um über das Referenzmuster mit dem höchsten Grad von Likelihood zu entscheiden. Dann wird der MOS-Wert der diesem Referenzmuster entsprechenden Meinungsbewertungspunkte erhalten.
  • Als Nächstes verwendet das ZuhörqualitätsbewertungsTransformationsteil 105 den MOS-Wert als PESQ-Wert zum Berechnen von Gleichungen (6) und (7), um die Zuhörqualitätsbeeinträchtigung Ie, eff zu erhalten, wie im Falle des oben beschriebenen zweiten Zuhörqualitätsbewertungsverfahrens.
  • Anschließend folgt das für die vorliegende Erfindung charakteristische Wechselwirkungsberechnungsteil 106 vorgegebenen Regeln, um die Wechselwirkungswerte Iint zwischen der verzögerungsbezogenen Beeinträchtigung Idd und der Zuhörqualitätsbeeinträchtigung Ie, eff zu berechnen. Die Wechselwirkung wird später im Detail beschrieben. Das Addierteil 106 addiert die verzögerungsbezogene Beeinträchtigung Idd, die Zuhörqualitätsbeeinträchtigung Ie, eff und den Wechselwirkungswert Iint zusammen und gibt das Additionsergebnis als Gesamtbeeinträchtigung LQd aus. Das Gesamtsprachqualitätsschätzteil 108 empfängt die Gesamtbeeinträchtigung LQd von dem Addierteil 107, subtrahiert sie dann von dem Referenzwert, um den psychologischen Messwert (R-Wert) zu erhalten, berechnet dann den MOS-Wert nach der folgenden Beziehung zwischen dem R-Wert und dem MOS-Wert, wie in ITU-T-Empfehlung G.107 Anhang B gezeigt, und gibt den berechneten MOS-Wert als subjektiven Bewertungswert aus. MOS = 1 für R > 0 MOS = 1 + 0,035R + R(R – 60)(100 – R)7×10–6 für 0 < R < 100 MOD = 4,5 für R > 100
  • Nachfolgend wird eine konkrete Beschreibung der in die vorliegende Erfindung eingeführten Wechselwirkung gegeben.
  • Im Stand der Technik wird die Gesamtbeeinträchtigung durch die verzögerungsbezogene Einbuße und die Sprachqualitätseinbuße ausgedrückt als Summe der zwei Beeinträchtigungen, wie durch Gleichung (1) gegeben, doch zeigen subjektive Bewertungstests, dass in einem Bereich, wo sowohl die verzögerungsbezogene Beeinträchtigung als auch die Zuhörqualitätsbeeinträchtigung groß ist, die Gesamtbeeinträchtigung manchmal kleiner sein kann als die Summe der einfachen Addition beider Beeinträchtigungen. Diese Tendenz kann dem Effekt zugeschrieben werden, dass in dem Bereich, wo die eine Qualitätseinbuße stark ist, die andere Qualitätseinbuße psychologisch maskiert ist, was dazu führt, dass die Gesamtbeeinträchtigung kleiner als die Summe der zwei Beeinträchtigungen wird.
  • 2 zeigt quantitativ gemessene Werte des obigen Effekts basierend auf subjektiven Bewertungstests. Die Zuhörqualitätsbeeinträchtigung X und die Verzögerungsbeeinträchtigung Y sind psychologische Beeinträchtigungen, die aus subjektiven Bewertungsergebnissen unter Verwendung nur der Zuhörqualität und der Verzögerung als Parameter erhalten sind. Die Gesamtbeeinträchtigung Z ist die aus subjektiven Bewertungsergebnissen für den Fall erhaltene psychologische Beeinträchtigung, dass die Zuhörqualität und die verzögerungsbezogene Qualität gleichzeitig beeinträchtigt waren. Die „psychologische Beeinträchtigung" ist definiert durch einen Wert, der erhalten wird durch Subtrahieren des psychologischen Messwerts (R-Wert), in den der in ITU-T-Empfehlung P.800 definierte mittlere Meinungswert (MOS) durch die oben erwähnte, in ITU-T-Empfehlung G.107 Anhang 1 erwähnte Transformationsgleichung (6) umgewandelt wurde, von einem Referenzwert. Der Referenzwert ist der R-Wert, der erhalten wurde, wenn der MOS-Wert für den Zustand ohne verzögerungsbezogene Einbuße und Zuhörqualitätseinbuße für ein variables PESQ in Gleichung (6) eingesetzt wurde. Jede Beeinträchtigung wurde mit dem Maximalwert der durch die beiden subjektiven Bewertungstests erhaltenen Beeinträchtigungen normiert. Zum Vergleich ist eine Z = X + Y-Ebene als Gesamtbeeinträchtigung nach einem herkömmlichen Verfahren dargestellt.
  • In dem Bereich, in dem X und Y beide klein genug sind, gibt es im wesentlichen keinen Unterschied zwischen der Gesamtbeeinträchtigung Z nach dem herkömmlichen Verfahren und der Gesamtbeeinträchtigung Z durch das Verfahren nach dieser Erfindung, das die Wechselwirkung berücksichtigt. In dem Bereich, wo X und Y beide groß sind, ist die Gesamtbeeinträchtigung nach diesem Verfahren kleiner als die Gesamtbeeinträchtigung nach dem herkömmlichen Verfahren. Dies bedeutet, dass die verzögerungsbezogene Beeinträchtigung und die Zuhörqualitätsbeeinträchtigung nicht in Form einer einfachen Addition zur Gesamtbeeinträchtigung beitragen, sondern einander maskieren.
  • Eine Beschreibung der Prozedur zum Formulieren der Wechselwirkung wird gegeben.
  • Der erste Schritt ist, eine Mehrzahl von experimentellen Bedingungen mit unterschiedlichen Zuhörqualitätsbeeinträchtigungen und unterschiedlichen verzögerungsbezogenen Qualitätsbeeinträchtigungen zu setzen, wonach der in ITU-T-Empfehlung P-800 definierte Konversations-Meinungstest für jede der unterschiedlichen Bedingungen durchgeführt wird. Die Zuhörqualitätsbeeinträchtigung wird zum Beispiel durch ein Verfahren gesteuert, das den Q-Wert in MNRU (Modulated Noise Reference Unit), definiert in ITU-T-Empfehlung T.810 verändert. Die verzögerungsbezogene Qualitätsbeeinträchtigung kann gesteuert werden durch Einfügen einer Verzögerungserzeugungsvorrichtung in das Experimentsystem und Verändern von dessen Verzögerung. Es wird angenommen, dass für jede Q-Wert-Bedingung die Null-Verzögerungsbedingung hinzugefügt wird.
  • Als Nächstes wird die Zuhörqualitätsbeeinträchtigung der MNRU-Bedingung bestimmt. Genauer gesagt wird der MOS-Wert, der mit den oben erwähnten Konversations-Meinungstests für diejenigen Q-Bedingungen erhalten wird, die keine verzögerungsbezogene Beeinträchtigung haben (das heißt unter der Bedingung, dass die Beeinträchtigung Null ist) durch die oben erwähnte, in ITU-T- Empfehlung G.107, Anhang 1 definierte Gleichung (6) umgewandelt. Durch Subtrahieren von Beeinträchtigungen (zum Beispiel einer Echobeeinträchtigung und einer Nebentonbeeinträchtigung, die von der Zuhörqualitätsbeeinträchtigung verschieden sind, von dem R-Wert wird die Zuhörqualitätsbeeinträchtigung für jeden Q-Wert-Zustand in MNRU bestimmt.
  • Ferner wird die folgende Prozedur verfolgt, um die Wechselwirkung zwischen der verzögerungsbezogenen Beeinträchtigung und der Zuhörqualitätsbeeinträchtigung zu quantifizieren.
    • (a ) Transformieren von MOS-Werten für alle experimentellen Bedingungen in R-Werte nach dem oben beschriebenen Verfahren.
    • (b) Berechnen der „Gesamtbeeinträchtigung der Zuhörqualitätsbeeinträchtigung und der verzögerungsbezogenen Beeinträchtigung" (das heißt die Summe der jeder Q-Wert-Bedingung entsprechenden Zuhörqualitätsbeeinträchtigung und der jeder Verzögerungszeitbedingung entsprechenden verzögerungsbezogenen Beeinträchtigung), die basierend auf dem E-Modell berechnet ist.
    • (c) Verwenden des R-Werts (92,486), der der Bedingung entspricht, dass die Verzögerung Null ist und der Q-Wert unendlich ist (das heißt der Zustand ohne Zuhörqualitätsbeeinträchtigung) als Referenz und Subtrahieren des in (a) erhaltenen Werts von dem R-Wert, um die „Gesamtbeeinträchtigung der Zuhörqualitätsbeeinträchtigung und der verzögerungsbezogenen Beeinträchtigung" einschließlich der Wechselwirkung zu erhalten.
    • (d) Subtrahieren des Werts in (c) von dem Wert in (b), um das Ausmaß der Wechselwirkung entsprechend jeder experimentellen Bedingung zu erhalten.
    • (e) Durchführung einer Regressionsanalyse unter Verwendung der „Zuhörqualitätsbeeinträchtigung (X)" und der „verzögerungsbezogenen Qualitätsbeeinträchtigung (Y)" als erläuternde Variabeln und der Gesamtbeeinträchtigung (Z) in (d) als Zielvariable. In dieser Ausgestaltung ist Z durch eine quadratische Funktion mit zwei Unbekannten angenähert, um die folgende Gleichung zu erhalten.
    Z = X + Y + XY(C1 – C2X – C3Y + C4XY) (8)wobei C1, C2, C3 und C4 Konstanten sind. Durch Setzen der Gesamtbeeinträchtigung Z = LQd, der verzögerungsbezogenen Beeinträchtigung Idd = X und der Zuhörqualitätsbeeinträchtigung Y = Ie, eff in Gleichung (8) wird die Gesamtbeeinträchtigung LQd formuliert. Die Wechselwirkung Iint ist gegeben durch die folgende Gleichung Iint = XY(C1 – C2X – C3Y + C4XY) (9)
  • Wie aus 8 zu sehen ist, ist, wenn im wesentlichen keine Zuhörqualitätsbeeinträchtigung X vorliegt, die Gesamtbeeinträchtigung Z gegeben als die Summe der Zuhörqualitätsbeeinträchtigung A und der verzögerungsbezogenen Beeinträchtigung X, doch nimmt der Effekt der Wechselwirkung mit einer Zunahme der Zuhörqualitätsbeeinträchtigung X stark zu. Das gleiche gilt für die verzöge rungsbezogene Beeinträchtigung. Für ein besseres Verständnis der oben mit Bezug auf 4 beschriebenen Wechselwirkung sind in 3 ein berechneter Wert der Gesamtbeeinträchtigung Z nach Gleichung (8) unter Berücksichtigung der Wechselwirkung und der Gesamtbeeinträchtigung Z = X + Y nach dem herkömmlichen Verfahren gezeigt. Im Falle der aus den Messergebnissen berechneten Konstanten C1, C2, C3 und C4 in Gleichung (8) wird in der Region, wo die Werte X und Y beide groß sind, die Gesamtbeeinträchtigung Z nach der vorliegenden Erfindung kleiner als die Gesamtbeeinträchtigung Z = X + Y nach dem herkömmlichen Verfahren, da der Wechselwirkungswert Iint von Gleichung (9) negativ ist.
  • 4 ist ein Graph, der die Wirkung der Steigerung der Qualitätsschätzgenauigkeit durch die vorliegende Erfindung zeigt. Die Abszisse stellt durch subjektive Bewertungstests erhaltene gemessene Bewertungswerte dar, und die Ordinate stellt geschätzte Bewertungswerte dar. Die Messpunkte anzeigenden Quadrate sind die mit dem E-Modell ohne Rücksicht auf die Wechselwirkung erhaltenen Ergebnisse, und die Kreise sind die nach der vorliegenden Erfindung erhaltenen Ergebnisse. Aus 4 ist zu sehen, dass die Bewertungswerte nach der vorliegenden Erfindung in der Region, wo die Qualitätsbeeinträchtigung groß ist, eine höhere Genauigkeit haben als die Bewertungswerte nach dem herkömmlichen Verfahren.
  • Während bei der Ausgestaltung der 1 die Gewinnung der Gesamtqualitätsbewertung aus Verzögerung und Zuhörqualität beschrieben wurde, ist es auch möglich, die Gesamtsprachqualität anderer Qualitätsfaktoren wie etwa Echo und Lautheit unter Berücksichtigung einer ähnlichen Wechselwirkung zwischen diesen zu schätzen.
  • 5 zeigt die Prozedur des Gesamtsprachqualitätsschätzverfahrens nach der oben beschriebenen vorliegenden Erfindung.
  • Schritt S1: Messen der primären Bewertungswerte einer Mehrzahl von Qualitätseinbußefaktoren, zum Beispiel Verzögerungszeit und Zuhörqualität, durch Qualitätsmessmittel (Verzögerungszeitmessteil 102 und Zuhörqualitätsmessteil 103).
  • Schritt S2: Transformieren der gemessenen primären Bewertungswerte in psychologische Beeinträchtigungen, zum Beispiel der verzögerungsbezogenen Beeinträchtigung und der Zuhörqualitätsbeeinträchtigung, durch Transformationsmittel (das verzögerungsbezogene Beeinträchtigungsbewertungswerttransformationssteil 104 und das Zuhörqualitätsbewertungswerttransformationssteil 105).
  • Schritt S3: Berechnen des Ausmaßes der Wechselwirkung zwischen zwei psychologischen Beeinträchtigungen (der verzögerungsbezogenen Beeinträchtigung und der Zuhörqualitätsbeeinträchtigung) durch das Wechselwirkungsrechenmittel (das Wechselwirkungsberechnungsteil 106).
  • Schritt S4: Addieren der psychologischen Beeinträchtigungen und des Ausmaßes der Wechselwirkung durch Addiermittel (den Addierer 107), um die Gesamtbeeinträchtigung zu erhalten.
  • Schritt S5: Transformieren der Gesamtbeeinträchtigung in den subjektiven Qualitätsbewertungswert durch das Gesamtsprachqualitätsschätzmittel (das Gesamtsprachqualitätsschätzteil 108).
  • Wie oben beschrieben, ist es möglich, die Sprachqualität mit hoher Genauigkeit zu schätzen, indem die Wechselwirkung zwischen psychologischen Beeinträchtigungen unterschiedlicher Qualitätseinbußefaktoren berücksichtigt wird.
  • Ausgestaltung 2
  • 6 ist ein Blockdiagramm, das die Vorrichtungskonfiguration einer zweiten Ausgestaltung zum Implementieren des Gesamtsprachqualitätsschätzverfahrens gemäß der vorliegenden Erfindung zeigt. Diese Ausgestaltung unterscheidet sich von Ausgestaltung 1 darin, dass die Rechengleichung in dem Wechselwirkungsberechnungsteil 106 basierend auf dem aus dem tatsächlichen Sprachsignal beobachteten Merkmal adaptiv angepasst wird. Teile, die solchen von 1 entsprechen, sind mit den gleichen Bezugszeichen bezeichnet.
  • Es sei angenommen, dass das Verzögerungszeitmessteil 102 als Empfangssignal in dem ersten oben in Ausgestaltung 1 beschriebenen Verzögerungszeitmessverfahren ein von einem beliebigen (nicht dargestellten) an das zu testende System 100 angeschlossenen Kommunikationsendgerät gesendetes Signal anstelle des vom Testsignalgenerator 210 gesendeten Signals verwendet. Es ist auch möglich, das zweite oder dritte oben mit Bezug auf die Ausgestaltung von 1 beschriebene Zeitmessverfahren zu verwenden. Das Zuhörqualitätsmessteil 103 und das Zuhörqualitätsbewertungswerttransformationssteil 105 führen eine Verarbeitung nach dem ersten oder dritten oben mit Bezug auf die Ausgestaltung der 1 beschriebenen Zuhörqualitätsbewertungsverfahren aus.
  • Ein Konversationsmerkmalmessteil 120 vergleicht die zeitlichen Konfigurationen von Konversationssprachsignalen in jeweiligen Kanälen (Uplink- und Downlink-Sprachkanäle) und legt dadurch ein objektives Maß fest, das den Grad von Interaktivität in der betreffenden Kommunikation darstellt. Als konkretes Schema kann zum Beispiel ein in Kenzo ITOH und Nobuhiku KITAWAKI, „Delay-Related Quality Evaluation Method Using Temporal Features of Conversational Speech", Journal of the Society of Acoustics Engineers of Japan, Band 34, Nr. 11, April 1987, Seiten 851 bis 857 vorgeschlagenes objektives Bewertungsmaß Od verwendet werden. In dem obigen Dokument werden, da der verzögerungsbezogene Beeinträchtigungsbewertungswert und der Zuhörqualitätsbewertungswert durch die Äußerung, Pause, Antwortgeschwindigkeit und Antworthäufigkeit der Konversation beeinflusst wird, diese quantitativ analysiert, und das objektive Bewertungsmaß Od ist durch die folgende Gleichung anhand der mittleren Äußerungszeitlänge Tp, deren Standardabweichung Tps und der Konversationsaustauschhäufigkeit Rn definiert. Od = Tp + TpsW1 + (1/Rn)W2 (10)wobei W1 und W2 Gewichtungskoeffizienten sind.
  • Das Konversationsmerkmalmessteil 120 misst Tp, Tps und Rn aus der über das im Test befindliche System 100 empfangenen Konversationssprache und berechnet das objektive Maß Od nach Gleichung (10). Eine Wechselwirkungsberechnungsgleichung und eine verzögerungsbezogene Beeinträchtigungbewertungs-Transformationsgleichung, die vorab entsprechend der Größe des objektiven Maßes Od optimiert ist, sind wie folgt vorgegeben:
    Figure 00130001
  • Die Sätze von Konstanten (C11, ..., C14), (C21, ..., C24), ... (Cn1, ..., Cn4) sind vorab entsprechend dem objektiven Maß Od optimiert. Entsprechend ist eine Mehrzahl von verzögerungsbezogenen Beeinträchtigungsbewertungswert-Transformationsgleichungen f1(Ta, ..., fnTa) vorgegeben, zum Beispiel durch Optimieren des Satzes von Konstanten (b1, b2) von Gleichung (4) entsprechend dem objektiven Maß Od. Die Beziehungen zwischen dem objektiven Maß Od und den Wechselwirkungsberechnungs- und verzögerungsbezogenen Beeinträchtigungsbewertungswert-Transformationsgleichungen sind in einer Tabelle 123 in einem Berechnungsgleichungs-Datenbankteil 122 vorabgespeichert. Ein Berechnungsgleichungsbestimmungsteil 121 greift auf die Tabelle 123 in dem Berechnungsgleichungs-Datenbankteil 122 basierend auf dem von dem Konversationsmerkmalmessteil 120 gelieferten objektiven Maß Od zu, wählt dann die Wechselwirkungsberechnungsgleichung Iint und die verzögerungsbezogene Beeinträchtigungsbewertungswert-Transformationsgleichung Idd entsprechend dem objektiven Maß Od und setzt diese in dem Wechselwirkungsberechnungsteil 106 und dem verzögerungsbezogenen Beeinträchtigungsbewertungswert-Transformationsteil 104. Das Wechselwirkungsberechnungsteil 106, das Addierteil 107 und das Gesamtsprachqualitätsschätzteil 109 arbeiten in derselben Weise wie bei der Ausgestaltung der 1. In der Ausgestaltung der 6 ist es auch möglich, das von Wechselwirkungsberechnungsteil und verzögerungsbezogenem Beeinträchtigungsbewertungs-Transformationsteil eines immer eine vorgegebene Gleichung verwendet, während das andere selektiv eine Gleichung entsprechend dem objektiven Maß Od verwendet.
  • Die Prozeduren der oben mit Bezug auf Ausgestaltungen 1 und 2 der vorliegenden Erfindung beschriebenen Gesamtsprachqualitätsschätzverfahren können als durch Computer ausführbare Programme beschrieben werden, um es diesem zu ermöglichen, die vorliegende Erfindung auszuführen. Außerdem können die Programme auf einem durch den Computer lesbaren und zur Ausführung nach Bedarf gelesenen Medium voraufgezeichnet sein.
  • WIRKUNG DER ERFINDUNG
  • Wie oben beschrieben, ist gemäß dem Gesamtsprachqualitätsschätzverfahren der vorliegenden Erfindung möglich, eine Gesamtsprachqualitätsschätzung zu machen, die die „Wechselwirkung zwischen Qualitätsfaktoren" wiederspiegelt, die im Stand der Technik nicht berücksichtigt worden ist, so dass die Erfindung folglich eine verbesserte Genauigkeit bei der Sprachqualitätsschätzung liefert.

Claims (19)

  1. Verfahren zum Schätzen der Sprachqualität eines im Test befindlichen Systems, das eine Mehrzahl von Qualitätseinbußefaktoren hat, mit den Schritten: (a) Messen von primären Bewertungswerten der Qualitätseinbußefaktoren des Systems basierend auf einem von dem System empfangenen Signal; (b) Transformieren der primären Bewertungswerte der Qualitätseinbußefaktoren in psychologische Beeinträchtigungen; (c) Berechnen des Ausmaßes der Wechselwirkung zwischen den psychologischen Beeinträchtigungen durch wenigstens zwei der mehreren Qualitätseinbußefaktoren; (d) Berechnen der Summe der psychologischen Beeinträchtigungen und des Ausmaßes der Wechselwirkung als eine Gesamtbeeinträchtigung; und (e) Transformieren der Gesamtbeeinträchtigung in einen subjektiven Qualitätsbewertungswert.
  2. Verfahren nach Anspruch 1, bei dem die Qualitätseinbußefaktoren wenigstens zwei unter Verzögerung, Zuhörqualität, Echo und Lautheit sind.
  3. Verfahren nach Anspruch 1, bei dem Schritt (c) einen Schritt des Erhaltens des Ausmaßes der Wechselwirkung durch Ausführen einer Regressionsanalyse unter Verwendung von quadratischen Funktionen mit zwei Unbekannten einer Zuhörqualitätsbeeinträchtigung und einer verzögerungsbezogenen Beeinträchtigung umfasst.
  4. Verfahren nach Anspruch 1, bei dem Schritt (a) einen Schritt des Sendens und Empfangens von Testsignalen über das im Test befindliche System und das Messen von Qualitätseinbußefaktoren umfasst.
  5. Verfahren nach Anspruch 1, bei dem das im Test befindliche System ein IP-Telefonkommunikationsweg ist.
  6. Verfahren nach Anspruch 1, bei dem Schritt (a) einen Schritt des Messens der Qualitätseinbußefaktoren an einem tatsächlichen über das im Test befindliche System empfangenen Sprachsignal umfasst.
  7. Verfahren nach Anspruch 6, bei dem: Schritt (a) einen Schritt des Messens, als einen der primären Bewertungswerte, der Verzögerung umfasst, die einer der Qualitätseinbußefaktoren ist; Schritt (c) einen Schritt des Messens eines Konversationssprachmerkmals aus dem tatsächlichen Sprachsignal ist; und Schritt (b) einen Schritt des Auswählens einer Transformationsgleichung entsprechend dem gemessenen Konversationssprachmerkmal aus einer Mehrzahl von entsprechend Konversationssprachmerkmalen vorgegebenen Transformationsgleichungen und des Berechnens einer verzögerungsbezogenen Beeinträchtigung als eine der psychologischen Beeinträchtigungen umfasst.
  8. Verfahren nach Anspruch 6 oder 7, bei dem Schritt (c) einen Schritt des adaptiven Änderns des Ausmaßes der Wechselwirkung basierend auf dem an dem tatsächlichen Sprachsignal gemessenen Konversationssprachmerkmal umfasst.
  9. Gesamtsprachqualitätsschätzvorrichtung zum Schätzen der Sprachqualität eines im Test befindlichen Systems, das eine Mehrzahl von Qualitätseinbußefaktoren hat, wobei die Vorrichtung umfasst: Qualitätsmessmittel zum Messen von primären Bewertungswerten der Qualitätseinbußefaktoren des Systems basierend auf einem von dem System empfangenen Signal; Transformationsmittel zum Transformieren der primären Bewertungswerte der Qualitätseinbußefaktoren in psychologische Beeinträchtigungen; Wechselwirkungsausmaß-Rechenmittel zum Berechnen des Ausmaßes der Wechselwirkung zwischen den psychologischen Beeinträchtigungen durch die Mehrzahl von Qualitätseinbußefaktoren aus dem Ausgabewert der Transformationsmittel; Addiermittel zum Addieren der primären Bewertungswerte und des Ausmaßes der Wechselwirkung, um eine Gesamtbeeinträchtigung zu erhalten; und Gesamtsprachqualitätsschätzmittel zum Transformieren der Gesamtbeeinträchtigung in einen subjektiven Qualitätsbewertungswert.
  10. Vorrichtung nach Anspruch 9, bei der das Qualitätsmessmittel ein Verzögerungszeitmessteil zum Messen einer Übertragungsverzögerungszeit des im Test befindlichen Systems basierend auf einem von dem im Test befindlichen System empfangenen Signal und ein Zuhörqualitätsmessteil zum Messen der Zuhörqualität des im Test befindlichen Systems umfasst.
  11. Vorrichtung nach Anspruch 10, bei der das Transformationsmittel ein verzögerungsbezogenes Beeinträchtigungsbewertungs-Transformationsteil und ein Tonbewertungswert-Transformationsteil zum Transformieren der von dem Verzögerungszeitmessteil und dem Zuhörqualitätsmessteil in eine verzögerungsbezogene Beeinträchtigung und eine Zuhörqualitätsbeeinträchtigung auf jeweils dem gleichen Qualitätsmaß umfasst.
  12. Vorrichtung nach Anspruch 9, bei der die Mehrzahl von Qualitätseinbußefaktoren wenigstens zwei von Verzögerungszeit, Zuhörqualität, Echo und Lautheit umfasst.
  13. Vorrichtung nach Anspruch 11, bei der das Wechselwirkungsberechnungsmittel Mittel zum Erhalten des Ausmaßes der Wechselwirkung durch Ausführen einer Regressionsanalyse unter Verwendung von quadratischen Funktionen mit zwei Unbekannten der Zuhörqualitätsbeeinträchtigung und der verzögerungsbezogenen Beeinträchtigung umfasst.
  14. Vorrichtung nach Anspruch 9, bei der das im Test befindliche System ein IP-Telefonie-Kommunikationsweg ist.
  15. Vorrichtung nach Anspruch 1, die ferner ein Konversationssprachmerkmalmessteil zum Messen von Konversationssprachmerkmalen basierend auf über das im Test befindliche System gesendeten und empfangenen Konversationssprachsignalen, eine Datenbank zum Vorabspeichern einer Mehrzahl von verzögerungsbezogenen Beeinträchtigungsbewertungswert-Transformationsgleichungen in Entsprechung zu Konversationssprachmerkmalen und ein Rechengleichungsfestlegungsteil zum Auswählen derjenigen der mehreren der verzögerungsbezogenen Beeinträchtigungsbewertungs-Transformationsgleichungen in den Daten, die dem gemessenen Konversationssprachmerkmal entspricht, umfasst, wobei das Qualitätsmessmittel ein Verzögerungsmessteil zum Messen eines Verzögerungsbetrags als eines der Qualitätseinbußefaktoren umfasst und das Transformationsmittel die gemessene verzögerungsbezogene Beeinträchtigung als eine der psychologischen Beeinträchtigungen durch die ausgewählte verzögerungsbezogene Beeinträchtigungsbewertungs-Transformationsgleichung errechnet.
  16. Vorrichtung nach Anspruch 15, bei der die Datenbank eine Mehrzahl von Wechselwirkungsausmaß-Rechengleichungen umfasst, die entsprechend den Konversationssprachmerkmalen vorgegeben sind, und das Rechengleichungsauswahlteil diejenige der mehreren Wechselwirkungsausmaßrechengleichungen auswählt, die dem gemessenen Konversationssprachmerkmal entspricht, und die ausgewählte Rechengleichung in dem Wechselwirkungsrechenmittel setzt.
  17. Vorrichtung nach Anspruch 9, ferner mit: einem Konversationssprachmerkmalmessteil zum Messen eines Konversationssprachmerkmals basierend auf einem über das im Test befindliche System gesendeten und empfangenen Konversationssprachsignal; einer Datenbank zum Speichern einer Mehrzahl von vorgegebenen Wechselwirkungsrechengleichungen in Entsprechung zu Konversationssprachmerkmalen; und einem Rechengleichungsfestlegungsteil zum Auswählen derjenigen der in der Datenbank gespeicherten Wechselwirkungsrechengleichungen, die dem gemessenen Konversationssprachmerkmal entspricht, und zum Setzen der ausgewählten Rechengleichung in dem Wechselwirkungsrechenmittel.
  18. Programm, in welchem das Verfahren nach einem der Ansprüche 1 bis 8 in einer durch einen Computer, wenn das Programm in den Computer geladen ist, ausführbaren Weise beschrieben ist.
  19. Computerlesbares Aufzeichnungsmedium, auf dem ein das Verfahren nach einem der Ansprüche 1 bis 8 implementierendes Programm aufgezeichnet ist.
DE60311754T 2002-12-25 2003-12-23 Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals Expired - Lifetime DE60311754T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002373930 2002-12-25
JP2002373930 2002-12-25

Publications (2)

Publication Number Publication Date
DE60311754D1 DE60311754D1 (de) 2007-03-29
DE60311754T2 true DE60311754T2 (de) 2007-11-22

Family

ID=32463531

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60311754T Expired - Lifetime DE60311754T2 (de) 2002-12-25 2003-12-23 Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals

Country Status (4)

Country Link
US (1) US7499856B2 (de)
EP (1) EP1434197B1 (de)
CN (1) CN100463465C (de)
DE (1) DE60311754T2 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308517B1 (en) 2003-12-29 2007-12-11 Apple Inc. Gap count analysis for a high speed serialized bus
CN100353796C (zh) * 2004-08-27 2007-12-05 华为技术有限公司 语音质量的测试系统及方法
CN100488216C (zh) * 2004-11-10 2009-05-13 华为技术有限公司 一种ip电话语音质量的测试方法及测试仪
CN100364354C (zh) * 2005-01-05 2008-01-23 华为技术有限公司 一种网络延时测试方法
US8005675B2 (en) * 2005-03-17 2011-08-23 Nice Systems, Ltd. Apparatus and method for audio analysis
US8054946B1 (en) * 2005-12-12 2011-11-08 Spirent Communications, Inc. Method and system for one-way delay measurement in communication network
CN101459934B (zh) * 2007-12-14 2010-12-08 上海华为技术有限公司 语音质量损耗估算方法及相关装置
EP2194525A1 (de) * 2008-12-05 2010-06-09 Alcatel, Lucent Subjektives Sprachqualitätsprüfwerkzeug
US8296131B2 (en) * 2008-12-30 2012-10-23 Audiocodes Ltd. Method and apparatus of providing a quality measure for an output voice signal generated to reproduce an input voice signal
US8655651B2 (en) * 2009-07-24 2014-02-18 Telefonaktiebolaget L M Ericsson (Publ) Method, computer, computer program and computer program product for speech quality estimation
US8983845B1 (en) 2010-03-26 2015-03-17 Google Inc. Third-party audio subsystem enhancement
DE102010044727B4 (de) * 2010-09-08 2014-05-15 Fachhochschule Flensburg EIP-Modell für den VoIP-Dienst
CN103077727A (zh) * 2013-01-04 2013-05-01 华为技术有限公司 一种用于语音质量监测和提示的方法和装置
US11343301B2 (en) 2017-11-30 2022-05-24 Goto Group, Inc. Managing jitter buffer length for improved audio quality
US10504536B2 (en) * 2017-11-30 2019-12-10 Logmein, Inc. Audio quality in real-time communications over a network
CN110530653B (zh) * 2019-08-29 2021-04-06 重庆长安汽车股份有限公司 一种汽车声品质的主观评价方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195039A (ja) 1992-12-24 1994-07-15 Nippon Mechatronics:Kk 表示装置
JP2953238B2 (ja) 1993-02-09 1999-09-27 日本電気株式会社 音質主観評価予測方式
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US6370120B1 (en) * 1998-12-24 2002-04-09 Mci Worldcom, Inc. Method and system for evaluating the quality of packet-switched voice signals
CN1145928C (zh) * 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP3579334B2 (ja) 2000-08-17 2004-10-20 日本電信電話株式会社 主観品質推定方法、主観品質推定装置、揺らぎ吸収許容時間推定方法、および揺らぎ吸収許容時間推定装置
EP1187100A1 (de) 2000-09-06 2002-03-13 Koninklijke KPN N.V. Verfahren und Vorrichtung für die objektive Bewertung der Sprachqualität ohne Referenzsignal
US7076316B2 (en) * 2001-02-02 2006-07-11 Nortel Networks Limited Method and apparatus for controlling an operative setting of a communications link
WO2002098030A1 (en) 2001-05-30 2002-12-05 Worldcom, Inc. Determining the effects of new types of impairments on perceived quality of a voice service
US6965597B1 (en) * 2001-10-05 2005-11-15 Verizon Laboratories Inc. Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters
CN1123864C (zh) * 2001-11-02 2003-10-08 北京阜国数字技术有限公司 音频数据小波包编码器中子带滤波延迟估计和修正的方法

Also Published As

Publication number Publication date
EP1434197B1 (de) 2007-02-14
US20040186731A1 (en) 2004-09-23
DE60311754D1 (de) 2007-03-29
CN1523856A (zh) 2004-08-25
EP1434197A1 (de) 2004-06-30
CN100463465C (zh) 2009-02-18
US7499856B2 (en) 2009-03-03

Similar Documents

Publication Publication Date Title
DE60311754T2 (de) Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE60029453T2 (de) Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz
DE60125219T2 (de) Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
DE69535121T2 (de) Echokompensator und dessen lernverfahren
DE60205232T2 (de) Verfahren und vorrichtung zur bestimmung der qualität eines sprachsignals
DE602004010634T2 (de) Verfahren und system zur sprachqualitätsvorhersage eines audioübertragungssystems
DE60308336T2 (de) Verfahren und system zur messung der übertragungsqualität eines systems
DE2636032A1 (de) Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
DE60021049T2 (de) Akustischer Echokompensator unter Verwendung von linearer Prädiktionskodierung
DE60222770T2 (de) Verbessertes verfahren zur ermittlung der qualität eines sprachsignals
DE60026058T2 (de) Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität
DE60211826T2 (de) Wahrscheinlichkeitsschätzung der Abwesenheit eines Sprachsignals und Geräuschunterdrückung
EP1634277B1 (de) Extrahierung von testsignalabschnitten zur qualitätsmessung eines audiosignals
EP2064898B1 (de) Vorrichtung zum bestimmen von informationen zur zeitlichen ausrichtung zweier informationssignale
DE10000009A1 (de) Verfahren zur koordinierten Echo- und/oder Geräuschabsenkung
EP1382034B1 (de) Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen
DE60305306T2 (de) Vorrichtung und Verfahren zur binauralen Qualitätsbeurteilung
DE60110541T2 (de) Verfahren zur Spracherkennung mit geräuschabhängiger Normalisierung der Varianz
DE60225505T2 (de) Verfahren und Vorrichtung zur Analyse von Prädiktionsparametern
DE602004004577T2 (de) Verfahren und Vorrichtung zur Feststellung der Sprachlatenzzeit durch ein Netzwerkelement eines Kommunikationsnetzwerkes
EP0946015A1 (de) Verfahren und Vorrichtung zur Beurteilung der Übertragungsqualität

Legal Events

Date Code Title Description
8381 Inventor (new situation)

Inventor name: TAKAHASHI, AKIRA, MUSASHINO, TOKYO, JP

Inventor name: OKAMOTO, JUN, MUSASHINO, TOKYO, JP

Inventor name: KAWAGUTI, GINGA, MUSASHINO, TOKYO, JP

8364 No opposition during term of opposition