DE60004403T2 - Vorrichtung und verfahren zur signalqualitätserfassung - Google Patents

Vorrichtung und verfahren zur signalqualitätserfassung Download PDF

Info

Publication number
DE60004403T2
DE60004403T2 DE60004403T DE60004403T DE60004403T2 DE 60004403 T2 DE60004403 T2 DE 60004403T2 DE 60004403 T DE60004403 T DE 60004403T DE 60004403 T DE60004403 T DE 60004403T DE 60004403 T2 DE60004403 T2 DE 60004403T2
Authority
DE
Germany
Prior art keywords
signal
averaging
time
quality
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60004403T
Other languages
English (en)
Other versions
DE60004403D1 (de
Inventor
Pieter Andries HEKSTRA
Gerard John BEERENDS
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke KPN NV
Original Assignee
Koninklijke KPN NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke KPN NV filed Critical Koninklijke KPN NV
Publication of DE60004403D1 publication Critical patent/DE60004403D1/de
Application granted granted Critical
Publication of DE60004403T2 publication Critical patent/DE60004403T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

  • A. TECHNISCHER HINTERGRUND DER ERFINDUNG
  • Die Erfindung betrifft das Gebiet der Qualitätsmessung von Tonsignalen, wie Audio- und Sprachsignalen. Insbesondere betrifft sie ein Verfahren und eine Vorrichtung, um die Qualität eines Ausgangssignals aus einem Signalbearbeitungssystem in Bezug auf ein Referenzsignal gemäss einer objektiven Messtechnik zu bestimmen und dies gemäss dem Oberbegriff des Anspruchs 1 und des Anspruchs 7. Ein Verfahren und eine Vorrichtung eines solchen Typs sind beispielsweise aus den Druckschriften [1] bis [6] bekannt (für weitere bibliografische Informationen über diese Druckschriften siehe unter C. Druckschriften). Gemäss der vorliegenden, bekannten Technik wird ein Ausgangssignal von einem Audio- oder Sprach-Signal-Verarbeitungs- und/oder Transportsystem, dessen Signalqualität zu bestimmen ist, und ein Referenzsignal auf Darstellungssignale gemäss einem psycho-physikalischen Erfassungsmodell des menschlichen Gehörs abgebildet. Als ein Referenzsignal kann ein Eingangssignal des Systems, welches mit dem Ausgangssignal erhalten worden ist, angewandt werden, wie dies in den Druckschriften [1] bis [5] beschrieben worden ist. Aber als ein Referenzsignal, wie es beispielsweise in der Druckschrift [6] beschrieben worden ist, kann auch ein Schätzwert des originalen Eingangssignals angewandt werden, welches aus dem Ausgangssignal rekonstruiert worden ist. Nachfolgend wird ein Differenzsignal als Funktion der Zeit aus den besagten Darstellungssignalen bestimmt, welche gemäss dem verwendeten Modell für andauernde Störungen repräsentativ ist, die das System in dem Ausgangssignal erhalten hat. Das zeitabhängige Differenzsignal, welches im Nachhinein als Störungssignal bezeichnet wird, kann ein Differenzsignal oder ein Verhältnissignal sein, oder eine Kombination beider Signale, und bildet einen zeitabhängigen Ausdruck für das Ausmass, gemäss dem nach einem Darstellungsmodell das Ausgangssignal von dem Referenzsignal abweicht. Schliesslich wird das Störungssignal über die Zeit gemittelt, so dass ein zeitunabhängiges Qualitätssignal erhalten wird, welches ein Mass für die Qualität der auditiven Erfassung des Ausgangssignals ist.
  • Es ist ein bekanntes Phänomen, dass, wenn einem Audiosignal zugehört wird, eine kleine Störung bereits einen wesentlichen Einfluss auf das Qualitätsempfinden des gesamten Signals hat. Dies wirkt sich nicht nur auf gesprochene Worte oder Musik aus, sondern allgemein auf die Reproduktion von Tonsignalen. Durch Anwendung der gebräuchlichen bekannten linearen Zeitmittelung besteht in solchen Fällen eine schlechte Korrelation zwischen der menschlichen Qualitätserfassung und dem durch die besagte Messtechnik erhaltenen Qualitätssignal. Die Anwendung des "quadratischen Mittelwertes" als Zeitmittelfunktion liefert zugegebenermassen eine gewisse Verbesserung, aber selbst dann ist die Korrelation noch zu gering für eine gute Arbeitsweise des objektiven Verfahrens.
  • B. ZUSAMMENFASSUNG DER ERFINDUNG
  • Das Ziel der vorliegenden Erfindung ist es, unter anderem, ein Verfahren und eine Vorrichtung des oben genannten Typs anzugeben, mit dem und mit der eine hohe Korrelation zwischen einer menschlichen Qualitätswahrnehmung eines Ausgangssignals und einem Qualitätssignal erreicht werden kann, welches durch die Messtechnik erhalten worden ist, insbesondere in Fällen, wo das oben angesprochene Phänomen auftritt. Die Betrachtungen, auf denen die Erfindung basiert, sind die Folgenden. Die lineare Zeit mittelung, die oben erwähnt worden ist, und das „quadratische Mittel" sind tatsächlich Spezialfälle der Lebesgue'schen p-mittelnden Funktion oder Lebesgue p-Norm (Lp-Norm) für p=1 beziehungsweise p=2. Für diese Normfunktion gilt, dass für ein sich erhöhendes p der Wert der Norm sich immer mehr dem Maximum der Funktion f innerhalb des Intervalls anpasst. Der Effekt des Anwendens der Lp-Norm als mittelnde Funktion auf das Störungssignal ist daher dergestalt, dass im Falle von ansteigendem p die höheren Signalwerte des Störungssignals über dem zeitgemittelten Intervall in noch dominanterer Weise in dem gemittelten Ergebnis eingehen.
  • Bei der vorliegenden Qualitätsmesstechnik ist es üblich, Testsignale von gesprochenen Sätzen aus zwei Sätzen oder Teilen davon und 10 Sekunden davon zunehmen. Hier kann festgestellt werden, dass im Falle von gesprochenen Worten eine Silbe (mit einer mittleren Dauer von ungefähr 0,3 Sekunden) nicht verständlich ist, wenn in dem Sprachsignal ein Teil der Silbe gestört ist. Dies bedeutet, dass in einem Störungssignal, welches einen Signalteil umfasst, der eine Darstellung eines Störungssignals von solch einer gestörten Silbe ausbildet, solch ein Signalteil lokal durch einen gemittelten Signalwert ersetzt werden kann, der einen Signalwert überschreitet, der durch eine lineare Mittelung erhalten worden ist, um Informationen zu extrahieren, die sich auf die Qualitätsbestimmung beziehen. Der besagte höhere mittlere Signalwert kann beispielsweise durch Anwenden einer Lp-Norm mit einem relativ hohen p-Wert auf dem besagten Signalteil erhalten werden. Auf dem Niveau der Sätze bleibt ein zweiter Satz oder Teil davon unverständlich, falls die Verständlichkeit eines vorangegangenen ersten Satzes oder Teiles davon durch die Störung in solch einer Weise beeinflusst ist, dass für die Zeitmittelung eine Mittelungsfunktion entsprechend zu oder mindestens weniger abweichend von der linearen Mittelung angewendet werden kann, beispielsweise mit einer Lp-Norm mit einem relativ geringen p, beispielsweise p=1 oder p=2.
  • Die tatsächliche erfinderische Idee, die auch im Allgemeineren auf willkürlich ausgewählte Audiosignale anwendbar ist, umfasst nun die Anwendung von, anstatt der bekannten singulären Zeitmittelung, einer dualen oder zwei-stufigen Zeitmittelung. Die besagte 2-stufige Zeitmittelung umfasst zwei Unterschritte: Ein erster Unterschritt, in dem das zeitabhängige Störungssignal, welches in dem Kombinationsschritt erhalten worden ist, zuerst im lokalen Bereich, d.h. über relative kleine Zeitintervalle einer ersten Mittelungsfunktion unterworfen wird, wobei ein Mittelwert für das erste Zeitintervall erhalten wird; und ein, zweiter Unterschritt, in dem Mittelwerte, die in dem ersten Unterschritt erhalten worden sind, einer zweiten mittelnden Funktion über die gesamte Signaldauer unterworfen werden. Die erste Mittelungsfunktion unterscheidet sich von der zweiten Mittelungsfunktion und weicht daher in grösserem Masse von der linearen Mittelung ab als die zweite mittelnde Funktion.
  • Gemäss der Erfindung haben das Verfahren und die Vorrichtung der oben genannten Art daher die Merkmale des Anspruchs 1 bzw. des Anspruchs 6.
  • In den ersten bevorzugten Ausführungsbeispielen des Verfahrens und der Vorrichtung werden Mittelungsfunktionen angewandt, die auf einer Lp-Norm basieren, insbesondere in dem ersten Unterschritt auf einer Lp-Norm, die einen relativ hohen p-Wert aufweist, und in dem zweiten Unterschritt auf einer Lp-Norm basieren, die einen relativ geringen p-Wert aufweist. Zu diesem Zweck sind das Verfahren und die Vorrichtung vorzugsweise gemäss Ansprüchen 3 und 7 ausgebildet.
  • Weitere bevorzugte Ausführungsbeispiele des Verfahrens und der Vorrichtung gemäss der Erfindung sind in den Unteransprüchen gekennzeichnet.
  • C. DRUCKSCHRIFTEN
    • [1] Beerends J.G., Stemerding J.A., "A perceptual audio quality measure based on a psychoacoustic sound representation", J. Audio Eng. Soc., Band 40, Nr. 12, Dezember 1992, Seiten 963 bis 978;
    • [2] WO-A-96/28950;
    • [3] WO-A-96/28952;
    • [4] WO-A-96/28953;
    • [5] WO-A-97/44779;
    • [6] WO-A-96/06496.
  • D. KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die Erfindung wird nun in grösserem Detail unter Bezugnahme auf die Beschreibung eines beispielhaften Ausführungsbeispieles beschrieben, wobei auf eine Zeichnung Bezug genommen wird, die die folgenden Figuren umfasst:
  • 1 eine schematische Darstellung einer bekannten Vorrichtung zur Bestimmung der Qualität eines Tonsignals;
  • 2 in den Teilen (a), (b) und (c) grafische Darstellungen zur Erläuterung des zeitmittelnden Schrittes in dem Verfahren gemäss der Erfindung: in Teil (a), eine grafische Darstellung mit einem Beispiel eines Störungssignals als Funktion der Zeit, unterteilt in Untersignale je Intervall; in Teil (b), eine grafische Darstellung eines gemittelten Signalwerts der Untersignale je Intervall, die im ersten Unterschritt des zeitmittelnden Schrittes er halten worden ist; und in Teil (c), eine grafische Darstellung von verschiedenen Qualitätssignalwerten, die in einem zweiten Unterschritt des zeitmittelnden Schrittes erhalten worden sind; und
  • 3 eine schematische Darstellung einer zeitmittelnden Vorrichtung, die gemäss der Erfindung zur Anwendung in einer Vorrichtung nach 1 modifiziert worden ist.
  • E. BESCHREIBUNG EINES BEISPIELHAFTEN AUSFÜHRUNGSBEISPIELS
  • 1 zeigt in schematischer Weise eine bekannte Messvorrichtung zur Bestimmung der Qualität eines Tonsignals. Die Messvorrichtung umfasst einen Signalprozessor 10 mit Signaleingängen 11 und 12 und weist Signalausgänge auf, die über die Signalverbindungen 13 und 14 mit Signaleingängen einer Kombiniervorrichtung 15 verbunden sind. Die Kombiniervorrichtung 15 ist mit einem Signalausgang versehen, der über eine Signalverbindung 16 mit einem Signaleingang einer zeitmittelnden Vorrichtung 17 verbunden ist. Die zeitmittelnde Vorrichtung 17 ist mit einem Signalausgang 18 versehen, der zusätzlich den Ausgang der Messvorrichtung bildet.
  • Dieses besagte Messvorrichtung arbeitet im Grossen und Ganzen wie folgt. An den Signaleingängen 11 und 12 des Signalprozessors 10 liegen ein Eingangssignal X(t), von dem die Signalqualität zu bestimmen ist, und ein Referenzsignal Y(t) an. Das Eingangssignal X(t) ist ein Ausgangssignal eines Ton- oder Sprachsignalbearbeitungs- und/oder -Transportsystems (nicht dargestellt), dessen Signalverarbeitungs- und/oder Transportqualität festzustellen ist. Der Signalprozessor 10 verarbeitet die Signale X(t) und Y(t) und erzeugt Darstellungen der Signale R(X) und R(Y), die Darstellungen der anliegenden und angebotenen Signale X(t) und Y(t) gemäss einem Auffassungsmodell des menschlichen Hörens ausformen, welches (in der Hardware und/oder in der Software) des Signalprozessors niedergelegt ist. In den meisten Fällen sind die Darstellungsfunktionen Funktionen von Zeit und Frequenz (Hz-Skala oder Bark-Skala). Die Darstellungssignale R(X) und R(Y) werden von dem Signalprozessor 10 über die Signalverbindungen 13 und 14 jeweils zu der Verbindungseinrichtung 15 durchgelassen. In dieser Verbindungseinrichtung 15 wird mit der Ausführung von verschiedenen Tätigkeiten auf den Darstellungssignalen wie Vergleichen, Skalieren, Bestimmung eines Verhältnissignals oder eines absoluten Differenzsignales, und der Integration über die Frequenz, ein zeitabhängiges Störungssignal D(t) erzeugt, welches durch die Signalverbindung 16 der zeitmittelnden Vorrichtung 17 zugeleitet wird. In der zeitmittelnden Vorrichtung wird das Störungssignal D(t) durch Ausführen einer Integration gemäss der Zeit über die Zeitdauer des Signals über die Zeit gemittelt, wobei das Ergebnis der besagten Zeitmittelung als Qualitätssignal Q an dem Signalausgang 18 der zeitmittelnden Vorrichtung verfügbar wird. Das zeitunabhängige Qualitätssignal Q bildet ein Mass für die Qualität der auditiven Erfassung des Signals X(t). Als Zeitmittelung ist die lineare Zeitmittelung üblich, d.h. die Integration des Störungssignals D(t) über die Zeit geteilt durch die gesamte Zeitdauer des Signals (siehe beispielsweise Anhang F der Druckschrift [1], Seiten 977 und 978). Durch solch eine Zeitmittelung werden kurze Störungen in einem Tonsignal, die eine signifikante Wirkung auf die Qualitätsempfindung des gesamten Signals haben, ausgemittelt. In tatsächlich auftretenden Fällen kann eine schlechte Korrelation zwischen der menschlichen Qualitätserfassung und dem Qualitätssignal vorliegen, welches durch die besagte Messtechnik erzeugt wird. Im Falle des Anwendens eines "quadratischen Mittels" als zeitmittelnde Funktion, kann eine Korrelation erhalten werden, die immer noch zu gering ist für eine gute Wirkungsweise des objektiven Verfahrens.
  • Die lineare Zeitmittelung und die "quadratische Mittelung" sind tatsächlich spezifische Fälle der Lebesgue'schen p-mittelnden Funktion oder Lebesgue'schen p-Norm (Lp-Norm):
    Figure 00080001
    für eine Funktion f, die über ein spezifisches Intervall (a, b) mit einem Mass μ integrierbar ist, und:
    Figure 00080002
    für eine Funktion f, die in n einzelnen Punkten xi (i–1, ..., n) in dem Intervall (a, b) für p=1 und p=2 definiert ist. Für die besagte Norm steht fest, dass für sich erhöhendes p der Wert der Norm sich immer mehr dem Maximum fmax der Funktion f innerhalb des Intervalls angleicht, und dass in dem Übergang für p→∞ L∞(f) = fmax ist. Die Wirkung des Anwendens solch einer Normfunktion als mittelnde Funktion als (Teil eines) Störungssignals ist es daher, dass für ansteigende p die höheren Signalwerte des Störungssignals über das mittlere Intervall noch dominierender in das gemittelte Ergebnis eingeht. In der Lp-Norm wird allgemein angewandt, dass p ∈ aus
    Figure 00080003
    ist. Im Kontext der vorliegenden Erfindung ist p ∈ aus
    Figure 00080004
    eine genauere Wahl.
  • Um das Ausmitteln des Einflusses von relativ kurzen Störungen in dem schlussendlichen Qualitätssignal zu verhindern, wird der zeitmittelnde Schritt in zwei Unterschritten ausgeführt, die unter Bezugnahme auf die 2 beschrieben werden. In den besagten zwei Unterschritten werden zwei verschiedene Mittelungsfunk tionen auf das Störungssignal eine nach der anderen angewandt, die in solch einer Weise ausgewählt worden sind, dass die erste Mittelungsfunktion in dem ersten Unterschritt höhere (Signal)Werte des Störungssignals über ein gemitteltes Intervall in dominierenderer Weise in das mittelnde Ergebnis als die zweite Mittelungsfunktion eingeht. Im Allgemeinen können solche Paare von mittelnden Funktionen durch die einzelne Auswahl, beispielsweise durch Simulationen, bestimmt werden. Wenn die Lp-Norm als eine mittelnde Funktion angewandt wird, ist es nur notwendig, in dem ersten Unterschritt eine Lp-Norm zu wählen, die einen p-Wert aufweist, der beispielsweise eine gewisse Anzahl von Malen grösser ist als der p-Wert der Lp-Norm, die in dem zweiten Unterschritt angewandt wird. Da die Lp-Norm auf einer spezifischen Form von konvexen Funktionen basiert, insbesondere auf den Funktionen g(χ) = |χ|p für p=1, 2, ..., mit der inversen Funktion g–1(x) = |x|1/p, kann erwartet werden, dass in der allgemeinen Klasse von konvexen Funktionen andere geeignete Paare zu finden sind. Die folgenden, allgemeineren Formen der Formeln (1) und (2) für die mittelnde Funktion oder Norm sind zugeordnet:
    Figure 00090001
    und
    Figure 00090002
  • Geeignete Funktionen, auf denen die mittelnden Funktionen in den ersten und zweiten mittelnden Unterschritten basiert sein können, sind beispielsweise g1(x) = exp(px) mit p=1, 2, ..., wobei die inverse Funktion g1 –1(x) = p–11n(x) im ersten Schritt in Kombination mit in dem zweiten Schritt g2(x) = |x| von der Funktion g2(x) = |x|2. Es ist festzustellen, dass obwohl in der weiteren Beschreibung zur Vereinfachung nur von der Lp-Norm als mittelnde Funktion ausgegangen wird, dies nicht notwendigerweise bedeutet, dass die Erfindung auf diesen Zweck beschränkt sein sollte.
  • Im Teil (a) der 2 wird ein Beispiel eines Störungssignals D(t) als Funktion der Zeit dargestellt, wobei die Zeit entlang der horizontalen Achse aufgetragen ist und (die Intensität des) Signals D(t) entlang der vertikalen Achse aufgetragen ist. In einem ersten Unterschritt wird die Gesamtzeit Ttot des Signals D(t) zuerst in n-Intervalle Ti (mit i=1, ..., n) von vorzugsweise in der Zeitdauer gleichen Tint zerlegt und das Signal D(t) wird in geeigneter Weise in Signalteile zerlegt, die einen Signalteil Di(t) je Intervall Ti aufweisen. Nachfolgend kann in jedem Intervall Ti (mit i=1, ..., n) eine Zeitmittelung in Übereinstimmung mit der Lp-Norm (siehe Formel {1}) des Signalteils Di(t) mit einem ersten, relativ hohen p-Wert pi, (beispielsweise pi=6) bestimmt werden. In diesem Zusammenhang ist festzustellen, dass nur als das Beispiel das Störungssignal D(t) als kontinuierliche Funktion dargestellt ist. Es ist üblich, dass das Signal D(t) als in der Zeit diskrete Funktion am Ausgang der Kombiniervorrichtung 15 in der Gestalt einer zeitsequentiellen Reihe von Werten, beispielsweise zwanzig je Zeitintervall verfügbar wird, was als einzelne Punkte einer kontinuierlichen Funktion interpretiert werden kann. In diesem Fall wird die Lp-Norm durch Formel {2} berechnet. Die Werte dieser zeitgemittelten Lp1(Di) für i=1, ..., n, sind für jedes Intervall Ti in Teil (b) der 2 dargestellt und durch den kurzen, horizontalen Strich 21 bezeichnet. Zur Vereinfachung des Vergleichs werden in jedem Intervall die Werte auch durch die Zeitmittelungen für p1=1 und p1=∞, d.h. L1 (Di) und L(Di) dargestellt, die jeweils durch eine lange horizontale Linie 22 und durch einen Punkt 23 bezeichnet werden.
  • In einem zweiten Unterschritt wird die Lp-Norm des Wertes LP1(Di) durch das Intervall Ti über die gesamte Zeitdauer Ttot gemäss der Formel {2} mit einem zweiten, relativ geringwertigen p-Wert p2 < 1 (d.h. p2=1 oder 2) bestimmt, was sich in dem Qualitätssignal Q äussert. Teil (c) der 2 zeigt den durchschnittlichen Wert über n-Intervalle gemäss der Norm Lp2 für p2=1 der Werte Lp1(Di), L1(Di) und L(Di), die jeweils durch eine kurze, horizontale Linie 24 durch eine lange horizontale Linie 25 und durch einen Punkt 26 bezeichnet werden. Der Wert von Q, wie er durch die Linie 25 bezeichnet ist, und daher durch eine 2-stufige Mittelung mit p-Werten p1=p2=1 erhalten werden kann, entspricht im Wesentlichen dem Wert, der durch die bekannte singuläre Zeitmittelung erhalten wird, bei der die L1-Norm angewandt wird. Dies bedeutet, dass die Verbesserung der Korrelation, die durch die Erfindung erreicht werden kann, nur erreicht wird, falls p1 > p2.
  • Wenn es in dem ersten Unterschritt einfach ist, das Maximum der Signalteile Di(t) in jedem Intervall Ti zu bestimmen, wird beispielsweise pi=_ gewählt. Im zweiten Unterschritt ist die Wahl von p2=1 die einfachste Wahl.
  • Es ist wohlverstanden, dass, wenn solch ein 2-Schritt-Zeitmittelungsverfahren eingesetzt wird, die Wirkung von kurzen Störungen auf das eventuelle Qualitätssignal weiterhin signifikant bleibt. Für Testsignale bei gesprochenen Worten ist die Gesamtzeit Ttot von ungefähr 10 Sekunden ein Hinweis darauf, wobei es möglich ist, für Tint anzunehmen, dass die durchschnittliche Dauer einer gesprochenen Silbe beispielsweise 0,3 Sekunden beträgt.
  • Abgesehen von der Änderung des p-Wertes, insbesondere im ersten Unterschritt, kann die Wirkung von kurzen Störungen auch durch eine geeignete Wahl der Dauer des Zeitintervalls Ti manipuliert werden, beispielsweise als Funktion der Art des Signals, beispielsweise von gesprochenen Worten oder Musik, oder von der Art des Signals, langsam oder schnell, aber auch als Funktion der Art der Ton- oder Sprachverarbeitungs- und/oder Transportsysteme, von denen X(t) das Ausgangssignal ist. Es ist bereits oben erwähnt worden, dass im Falle eines Testsignals mit gesprochenen Worten, die durchschnittliche Dauer einer Silbe ungefähr 0,3 Sekunden ist. Von diesem besagten Mittelwert kann es jedoch im Falle von absichtlich langsam oder schnell gesprochenen Sätzen beträchtliche Abweichungen geben. Das gleiche kann für Musiksignale gelten, die einen langsamen oder einen schnellen Rhythmus aufweisen.
  • Eine andere Möglichkeit der Bearbeitung der Wirkung von kurzen Störungen liegt darin, sich überlappende Intervalle auszuwählen, womit im Ergebnis die Wirkung von kurzen Störungen, die exakt auf den Intervallgrenzen vorliegen, besser in Betracht gezogen werden können. Solch eine Überlappung ist beispielsweise 10%, das nächste Intervall Ti+1 beginnt bei 0,9 des Intervalls Ti oder auch 50%, wobei dieses nächste Intervall Ti+1 bereits zur Hälfte beim Intervall Ti beginnt.
  • Wenn einem Tonsignal zugehört wird, hat der Teil des Tonsignals, der am kürzesten zurückliegt, im Allgemeinen eine grössere Wirkung auf die Qualitätsempfindung als die zuerst gehörten Teile. Damit solch eine Wirkung auch besser in dem Qualitätssignal ausgedrückt wird, kann in dem zweiten Unterschritt eine gewichtete Mittelung eingesetzt werden, indem eine Gewichtungsfunktion w(t) eingesetzt wird, die diskret oder nicht sein kann, wie eine monotone Erhöhung bei irgendeiner Steigung ohne abzunehmen in der Funktion mit Werten zwischen 0 und 1 über die gesamte Signaldauer Ttot, für was beispielsweise gilt:
    0 ≤ w(t) ≤ ½ für t ≤ ½ Ttot, und
    ½ ≤ w(t) ≤ 1 für ½ Ttot ≤t ≤ Ttot,
    wobei für jedes Intervall T1 ein Gewicht wi, welches beispielsweise zu dem Maximum von w(t) in dem Intervall Ti gleich ist, zugeordnet ist. In diesem Zusammenhang kann die Normfunktion der Formel {2} eingestellt werden auf:
    Figure 00130001
  • Die zeitmittelnde Vorrichtung 17, wie sie in der 3 dargestellt ist, bezieht sich gemäss der Erfindung auf zwei mittelnde Elemente 31 und 32. Ein erstes mittelndes Element 31 empfängt über die Signalverbindung 16 das Störungssignal D(t) von der Kombiniervorrichtung 15 und verarbeitet das besagte, empfangene Signal gemäss dem ersten oben beschriebenen Unterschritt. Dabei wird zuerst das Signal D(t) in n Intervalle Ti unterteilt mit i=1, ..., n der Gesamtsignaldauer Ttot des Signals D(t) in n-Untersignale Di(t), die nachfolgend in einer in der Zeit aufeinander folgenden Reihe von zeitgemittelten Signalwerten LP1(Di) gewandelt werden, was durch das Zeitintervall Ti unter Einsatz einer Lp-Norm bestimmt wird, die einen relativ hohen p-Wert p1 aufweist. Die besagte Reihe an Signalwerten LP1(Di) wird über eine Signalverbindung 33 dem zweiten mittelnden Element 32 übermittelt. Das zweite mittelnde Element bestimmt aus der besagten Zeile der gemittelten Signalwerte LP1(Di) einen gemittelten Signalwert LP2(LP1(Di)) gemäss einer Lp-Norm mit einem relativ geringen p-Wert p2 gemäss der Formel {2} oder {2'}. Der durchschnittliche Signalwert Lp2(Lp1(D)) wird nachfolgend durch das zweite mittelnde Element 32 als das bestimmte Qualitätssignal Q an den Signalausgang 18 der zeitmittelnden Vorrichtung abgegeben.

Claims (9)

  1. Verfahren, um die Qualität eines Ausgangssignals (X(t)) aus einem Signalbearbeitungssystem in Bezug auf ein Referenzsignal (Y(t)) gemäss einer objektiven Messtechnik zu bestimmen, wobei das Verfahren die folgenden Hauptschritte umfasst: – Verarbeiten des Ausgangssignals (X(t)) und Erzeugen eines ersten Darstellungssignals (R(x)), – Verarbeiten des Referenzsignals (Y(t)) und Erzeugen eines zweiten Darstellungssignals (R(y)), und – Kombinieren der ersten (R(x)) und der zweiten (R(y)) Darstellungssignale, um ein zeitunabhängiges Qualitätssignal (Q) auszubilden, wobei der Hauptschritt des Kombinierens die folgenden Schritte umfasst – Bestimmen eines Differenzsignals (D(t)) als Funktion der Zeit, und – Mitteln des Differenzsignals (D(t)) über die Zeit, und Erzeugen des zeitunabhängigen Qualitätssignals (Q), dadurch gekennzeichnet, dass der Schritt des Mittelns über die Zeit umfasst: – einen ersten Unterschritt, in dem in jedem Zeitintervall (Ti) einer Abfolge von aufeinanderfolgenden Zeitintervallen (T1–Tn) über die Zeitdauer (Ttot) des Differenzsignals (D (t)) erste Signalmittelwerte Lp1(D)) des Differenzsignals (D(t)) gemäss einer ersten Mittelungsfunktion bestimmt werden, und – einen zweiten Unterschritt, in dem über die besagte Zeitdauer (Ttot) ein zweiter Signalmittelwert aus den ersten Signalmittelwerten (Lp1(D)) gemäss einer zweiten Mittelungsfunktion, die sich von der ersten Mittelungsfunktion unterscheidet, bestimmt wird, wobei das Qualitätssignal (Q) den zweiten Signalmittelwert umfasst.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die erste Mittelungsfunktion eine Mittelungsfunktion ist, bei der grössere Signalwerte in dominierender Weise in das gemittelte Ergebnis als bei der zweiten Mittelungsfunktion eingehen.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die ersten und zweiten Mittelungsfunktionen Funktionen gemäss Lebesgue'schen p-mittelnden Lp sind, die zueinander unterschiedliche p-Werte p1 beziehungsweise p2 aufweisen, wobei p1 > p2.
  4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass p1=∞ und p2=1 ist.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Zeitintervalle (T1–n) in dem ersten Unterschritt Intervalle sind, die einander überlappen.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die zweite Mittelungsfunktion des zweiten Unterschrittes eine gewichtete Mittelung umfasst.
  7. Vorrichtung, um die Qualität eines Ausgangssignals (X(t)) aus einem Signalbearbeitungssystem in Bezug auf ein Referenzsignal (Y(t)) gemäss einer objektiven Messtechnik zu bestimmen, wobei die Vorrichtung umfasst: – eine erste Signalverarbeitungseinrichtung (10), um das Ausgangssignal (X(t)) zu verarbeiten und ein erstes Darstellungssignal (R(x)) zu erzeugen, – eine zweite Signalverarbeitungseinrichtung (10), um das Referenzsignal (Y(t)) zu verarbeiten und um ein zweites Darstel lungssignal (R(y)) zu erzeugen, und – ein Kombinationsschaltkreis (6), um die ersten (R(x)) und die zweiten (R(y)) Darstellungssignale zu kombinieren und um ein zeitunabhängiges Qualitätssignal (Q) auszubilden, wobei der Kombinationsschaltkreis (6) eine Differentialeinrichtung (15), um ein Differenzsignal (D(t)) als Funktion der Zeit zu bestimmen, und eine Zeitmittelungseinrichtung (17) aufweist, um das zeitunabhängige Qualitätssignal (Q) zu erzeugen, dadurch gekennzeichnet, dass die Zeitmittelungseinrichtung (17) ein erstes mittelndes Element (31), um in jedem Zeitintervall (Ti) einer Abfolge von aufeinanderfolgenden Zeitintervallen (T1–Tn) über die Zeitdauer (Ttot) des Differenzsignals (D (t)) erste Signalmittelwerte (Lp1(D)) des Differenzsignals (D(t)) gemäss einer ersten Mittelungsfunktion zu bestimmen, und ein zweites mittelndes Element (32) aufweist, um über die besagte Zeitdauer (Ttot) einen zweiten Signalmittelwert aus den ersten Signalmittelwerten (Lp1(D)) gemäss einer zweiten Mittelungsfunktion zu bestimmen, die sich von der ersten Mittelungsfunktion unterscheidet, wobei das Qualitätssignal (Q) den zweiten Signalmittelwert umfasst.
  8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass die ersten (31) und die zweiten (32) mittelnden Elemente so angeordnet sind, um mittelnde Funktionen gemäss Lebesgue'schen p-mittelnden Lp auszuführen, die zueinander unterschiedliche Exponenten p1 beziehungsweise p2 aufweisen, wobei p1 > p2.
  9. Vorrichtung nach Anspruch 8, dadurch gekennzeichnet, dass p1=∞ und p2=1 ist.
DE60004403T 2000-01-13 2000-12-11 Vorrichtung und verfahren zur signalqualitätserfassung Expired - Lifetime DE60004403T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL1014075 2000-01-13
NL1014075A NL1014075C2 (nl) 2000-01-13 2000-01-13 Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
PCT/EP2000/012535 WO2001052600A1 (en) 2000-01-13 2000-12-11 Method and device for determining the quality of a signal

Publications (2)

Publication Number Publication Date
DE60004403D1 DE60004403D1 (de) 2003-09-11
DE60004403T2 true DE60004403T2 (de) 2004-06-24

Family

ID=19770596

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60004403T Expired - Lifetime DE60004403T2 (de) 2000-01-13 2000-12-11 Vorrichtung und verfahren zur signalqualitätserfassung

Country Status (11)

Country Link
US (1) US7016814B2 (de)
EP (1) EP1250830B1 (de)
JP (1) JP3982797B2 (de)
AT (1) ATE246868T1 (de)
AU (1) AU2001220080A1 (de)
CA (1) CA2396455C (de)
DE (1) DE60004403T2 (de)
DK (1) DK1250830T3 (de)
ES (1) ES2204730T3 (de)
NL (1) NL1014075C2 (de)
WO (1) WO2001052600A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000507788A (ja) * 1996-12-13 2000-06-20 コニンクリジケ ケーピーエヌ エヌブィー 信号特性決定のための装置および方法
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
EP1241663A1 (de) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Verfahren und Vorrichtung zur Sprachqualitätsbestimmung
EP1298646B1 (de) * 2001-10-01 2006-01-11 Koninklijke KPN N.V. Verbessertes Verfahren zur Ermittlung der Qualität eines Sprachsignals
FR2835125B1 (fr) * 2002-01-24 2004-06-18 Telediffusion De France Tdf Procede d'evaluation d'un signal audio numerique
DE112005002929A5 (de) * 2004-09-21 2007-08-30 Imedos Gmbh Verfahren und Vorrichtung zur retalinen Gefässanalyse anhand digitaler Bilder
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
US8374234B2 (en) * 2006-09-29 2013-02-12 Francis S. J. Munoz Digital scaling
EP2438591B1 (de) * 2009-06-04 2013-08-21 Telefonaktiebolaget LM Ericsson (publ) Verfahren und anordnung zur schätzung der qualitätsverschlechterung eines verarbeiteten signals
JP2013500498A (ja) * 2009-07-24 2013-01-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声品質の評価のための方法、コンピュータ、コンピュータプログラム、およびコンピュータプログラム製品
JP5606764B2 (ja) 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4662222A (en) * 1984-12-21 1987-05-05 Johnson Steven A Apparatus and method for acoustic imaging using inverse scattering techniques
US5268834A (en) * 1991-06-24 1993-12-07 Massachusetts Institute Of Technology Stable adaptive neural network controller
US5991459A (en) * 1992-01-22 1999-11-23 Eastman Kodak Company Method of modifying a time-varying image sequence by estimation of velocity vector fields
US5862262A (en) * 1992-03-30 1999-01-19 The United States Of America As Represented By The Secretary Of The Navy Method of encoding a digital image using adaptive partitioning in an iterated transformation system
GB9213459D0 (en) * 1992-06-24 1992-08-05 British Telecomm Characterisation of communications systems using a speech-like test stimulus
SG47542A1 (en) * 1993-06-21 1998-04-17 British Telecomm Testing telecommunications apparatus
AU683183B2 (en) * 1994-08-18 1997-10-30 British Telecommunications Public Limited Company Analysis of audio quality
NL9500512A (nl) * 1995-03-15 1996-10-01 Nederland Ptt Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal.
DE69614829T2 (de) * 1996-05-21 2002-04-04 Koninklijke Kpn N.V., Groningen Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
JPH10285616A (ja) * 1997-04-04 1998-10-23 Tektronix Inc ビデオ品質自動測定方法及び装置
US5914685A (en) * 1997-04-25 1999-06-22 Magellan Corporation Relative position measuring techniques using both GPS and GLONASS carrier phase measurements
DE69803830T2 (de) * 1998-03-02 2002-09-12 Koninklijke Kpn N.V., Groningen Verfahren, Vorrichtung, ASIC und deren Benutzung zur objektiven Videoqualitätbewertung
AUPP686598A0 (en) * 1998-10-30 1998-11-26 Canon Kabushiki Kaisha A method and apparatus for representing a digital image to provide a coded representation
US6349309B1 (en) * 1999-05-24 2002-02-19 International Business Machines Corporation System and method for detecting clusters of information with application to e-commerce
US6499009B1 (en) * 1999-10-29 2002-12-24 Telefonaktiebolaget Lm Ericsson Handling variable delay in objective speech quality assessment
GB2356455A (en) * 1999-11-16 2001-05-23 Geco Prakla Determination of fast and slow shear wave polarisation directions
US6609092B1 (en) * 1999-12-16 2003-08-19 Lucent Technologies Inc. Method and apparatus for estimating subjective audio signal quality from objective distortion measures
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.

Also Published As

Publication number Publication date
ES2204730T3 (es) 2004-05-01
CA2396455C (en) 2006-10-17
NL1014075C2 (nl) 2001-07-16
EP1250830B1 (de) 2003-08-06
DE60004403D1 (de) 2003-09-11
DK1250830T3 (da) 2003-12-01
JP2003519816A (ja) 2003-06-24
WO2001052600A1 (en) 2001-07-19
CA2396455A1 (en) 2001-07-19
JP3982797B2 (ja) 2007-09-26
ATE246868T1 (de) 2003-08-15
US7016814B2 (en) 2006-03-21
AU2001220080A1 (en) 2001-07-24
US20030055608A1 (en) 2003-03-20
EP1250830A1 (de) 2002-10-23

Similar Documents

Publication Publication Date Title
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE60205232T2 (de) Verfahren und vorrichtung zur bestimmung der qualität eines sprachsignals
DE68917980T2 (de) Anmessung von Hörgeräten mit Hilfe von Vektoren.
DE69517325T2 (de) Tonqualitätsanalyse
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
DE69509555T2 (de) Verfahren zur veränderung eines sprachsignales mittels grundfrequenzmanipulation
DE69520067T2 (de) Verfahren und Einrichtung zur Kennzeichnung eines Eingangssignales
DE4328620C1 (de) Verfahren zur Simulation eines Raum- und/oder Klangeindrucks
DE69325478T2 (de) Einrichtung zum Vergleich von subjektiver Gesprächsqualität für mobile Telefonsysteme
DE60214358T2 (de) Zeitskalenmodifikation von signalen mit spezifischem verfahren je nach ermitteltem signaltyp
DE69334139T2 (de) Testen von Nachrichtenübertragungsgerät
DE69626115T2 (de) Signalqualitätsbewertung
EP0938831B1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
DE60308336T2 (de) Verfahren und system zur messung der übertragungsqualität eines systems
DE60004403T2 (de) Vorrichtung und verfahren zur signalqualitätserfassung
EP1088300A1 (de) Verfahren zur durchführung einer maschinengestützten beurteilung der übertragungsqualität von audiosignalen
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
EP1247425B1 (de) Verfahren zum betrieb eines hörgerätes und ein hörgerät
DE602004010634T2 (de) Verfahren und system zur sprachqualitätsvorhersage eines audioübertragungssystems
DE60118922T2 (de) Messung der wahrgenommenen sprachqualität während des betriebs durch messen von objektiver fehlerparamter
DE3806915A1 (de) Reverb- (nachhall-) generator
DE10318191A1 (de) Verfahren zur Erzeugung und Verwendung einer Übertragungsfunktion
CH709862A1 (de) Hörsystem mit anwenderspezifischer Programmierung.
DE69629736T2 (de) Verfahren und Vorrichtung zur Sprachqualitätsbewertung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition