DE60026058T2 - Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität - Google Patents

Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität Download PDF

Info

Publication number
DE60026058T2
DE60026058T2 DE60026058T DE60026058T DE60026058T2 DE 60026058 T2 DE60026058 T2 DE 60026058T2 DE 60026058 T DE60026058 T DE 60026058T DE 60026058 T DE60026058 T DE 60026058T DE 60026058 T2 DE60026058 T2 DE 60026058T2
Authority
DE
Germany
Prior art keywords
speech signal
sync point
delay variation
sync
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60026058T
Other languages
English (en)
Other versions
DE60026058D1 (de
Inventor
Anders Karlsson
Jonas Lundberg
Arne Steinarson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE60026058D1 publication Critical patent/DE60026058D1/de
Publication of DE60026058T2 publication Critical patent/DE60026058T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/24Testing correct operation
    • H04L1/242Testing correct operation by comparing a transmitted test signal with a locally generated replica

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf das Gebiet der Telekommunikation. Im genaueren bezieht sich die vorliegende Erfindung auf das Berechnen der Qualität eines Sprachsignals.
  • Hintergrund
  • In einem konventionellen Telekommunikationssystem kann die Übertragungskette, über die ein Sprachsignal (z. B. ein Signal, das einen gesprochenen Satz transportiert) übergeben werden muss, Sprach-Codierer, Sprach-Decoder, eine Luft-Schnittstelle, öffentlich geschaltete Telefonnetz (PSTN) Verbindungen, Computernetzverbindungen, Empfangs-Pufferung, Signalbearbeitungslogik und/oder Playbackausrüstung enthalten. Der Fachmann versteht leicht, dass jedes dieser Elemente, die die Übertragungskette bilden, das Sprachsignal verzerren kann. Das Berechnen der Qualität von Sprachsignalen ist wichtig, um zu Gewährleisten, dass die Sprachqualität einen minimal akzeptablen Standard übersteigt, so dass Sprachsignale durch den Hörer gehört und verstanden werden können.
  • Typischerweise beinhaltet das Berechnen von Sprachqualität die Übertragung eines Referenz-Sprachsignals (hier bezeichnet als „Referenzsignal") über eine Übertragungskette zu einer Empfangseinheit. Das empfangene Signal, das durch die verschiedenen Elemente verzerrt wurde, die die Übertragungskette bilden, wird hier als das Testsignal bezeichnet. Das Testsignal und das originale Referenzsignal werden dann zu einem Sprachqualitätsrechnungsalgorithmus weitergeleitet.
  • Es gibt eine Anzahl von konventionellen Sprachqualitätsberechnungsalgorithmen. Meistens wird jedoch die selbe grundlegende Technik, die in 1 dargestellt ist, verwendet. Wie gezeigt, werden ein Referenzsignal 105 und ein Testsignal 110 in N von Kurzzeitrahmen (z. B. jeweils 20 msec.) aufgeteilt. Eine neue Darstellung, so wie eine Frequenz-Darstellung, wird dann für jeden der N Zeitrahmen, die mit dem Referenzsignal 105 verbunden sind, und jeden der N Zeitrahmen, die mit dem Testsignal 110 verbunden sind, abgeleitet. Ein Differenz-Vektor, der N Zeitrahmen umfasst, wird dann abgeleitet durch Vergleichen der Darstellungen, die mit jedem der N Zeitrahmen des Referenzsignals 105 verbunden sind, mit der entsprechenden Darstellung, die mit dem Testsignal 110 verbunden ist. Der Vergleich könnte durchgeführt werden durch Subtrahieren der entsprechenden Darstellungen auf einer Rahmen-für-Rahmen Basis. Für jeden Rahmen kann die Differenz zwischen den entsprechenden Darstellungen aufsummiert werden, so dass eine einzelne Verzerrungs-Metrik jeder der N Zeitrahmen abgeleitet wird. Die N Verzerrungs-Metriken können dann gemittelt werden, wobei der Mittelwert verwendet werden kann als die Messung einer Gesamtsignalverzerrung oder Sprachqualität.
  • Ein Problem mit der oben bezeichneten Sprachqualitätsrechnungstechnik ist, dass diese hochsensibel bezüglich Zeitverschiebungen ist, (z. B. Übertragungsverzögerungen); umso größer die Zeitverschiebung wird, desto unzuverlässiger ist die Sprachqualitätsberechnung. In einem Ansatz um dieses Problem zu vermeiden, gleichen konventionelle Sprachqualitätsberechnungsalgorithmen das Referenzsignal und das Testsignal an, bevor die Sprachqualitätsberechnung durchgeführt wird, wie in 2 dargestellt. Natürlich gibt es genau wie es eine Anzahl von konventionellen Ansätzen der Berechnung von Sprachqualität gibt, auch eine Anzahl von konventionellen Techniken zum Abgleichen eines Referenzsignals und eines Testsignals.
  • Wie in 2 dargestellt verwendet eine solche Technik zum Abgleichen eines Referenzsignals und eines Testsignals einen bekannten, berechneten „globalen" Verzögerungsfaktor. In Übereinstimmung mit dieser Technik wird das Testsignal oder das Referenzsignal in der Zeit-Domäne durch einen Betrag verschoben, der äquivalent ist mit einer berechneten globalen Verzögerung. Danach können die zwei Signale in den Sprachqualitätsberechnungsalgorithmus eingespeist werden. Eine andere gut bekannte Technik zum Abgleichen eines Referenzsignals und eines Testsignals bezieht iteratives Abgleichen der zwei Signale in der Zeit-Domäne ein, bis eine Kreuz-Korrelationsmessung oder andere vergleichbare Metriken maximiert sind. Eine weitere andere Technik bezieht das Übertragen eines Referenzsignals und zusätzlich Informationen ein, die einen oder mehrere Teile des Signals identifizieren durch z. B. Einfügen von sinusförmigen Signalen oder Chirps (Zirpen) in das Referenzsignal. Demzufolge können diese eine oder mehrere Anteile des Testsignals einfacher erkannt und mit den entsprechenden Teilen des Referenzsignals abgeglichen werden.
  • Jede der oben bezeichneten Techniken zum Abgleichen eines Referenzsignals und eines Testsignals setzen jedoch voraus, dass die Verzögerung, die durch die verschiedenen Komponenten eingeführt wird, die die Übertragungskette aufbauen, eine feste Verzögerung ist, oder eine Verzögerung ist, die sich langsam mit der Zeit verändert, so dass periodische Resynchronisation möglich ist. In anderen Worten wird vorausgesetzt, dass eine konstante Zeitverschiebung zwischen dem Referenzsignal und dem Testsignal existiert. Ein Beispiel ist beschrieben in Tallack et. al. „Time delay Estimation for Objective Quality Evaluation of Low Bit-Rate Coded Speech with Noisy Channel Conitions", ASILOMAR Conf. 1993, Seite 1216–1219. Während dies zutreffen kann für leitungsvermittelte Netze, sind Übertragungsverzögerungen selten fest oder konstant in paketvermittelten Netzen, z. B. Internetprotokoll (IP) basierten Netzen. Z. B. variieren in virtuellen, komplett paketgeschalteten Netzszenarien die Übertragungsverzögerungen mit der Verkehrsauslastung (d. h. dem Grad der Blockierung in dem Netz). Da sich die Verkehrsauslastung im Allgemeinen auf einer kontinuierlichen Basis verändert, kann sich die Übertragungsverzögerung, die durch ein einzelnes Sprachsignal, das das Netzwerk durchläuft, erfahren wird, verändern. Wenn diese variablen Übertragungsverzögerungen unentdeckt bleiben, können das Referenzsignal und das Testsignal nicht genau abgeglichen werden, und der Sprachqualitätsberechnungsalgorithmus kann möglicherweise eine genaue Sprachqualitätsberechnung nicht durchführen. Des weiteren kann die Verwendung von kostengünstigen Personalcomputersystemen als Kommunikationsvorrichtungen zu einem Sprachsignal beisteuern, das variable Verzögerungen erfährt.
  • Zusammenfassung der Erfindung
  • Die vorliegende Erfindung bindet eine Sprachqualitätsberechnungstechnik ein, die die Verwendung eines beliebigen Sprachqualitätsberechnungsalgorithmus erlaubt. Im Allgemeinen analysiert die vorliegende Erfindung das Referenzsignal und das Testsignal und identifiziert basierend auf dieser Analyse Verzögerungsvariationen und/oder Unstetigkeiten im Testsignal, so denn welche vorhanden sind. Diese Teile des Testsignals werden dann entfernt, so dass das Referenzsignal und das Testsignal bezüglich der Zeit gleich skaliert sind. Das Referenzsignal und das Testsignal werden dann zu einem Standardqualitätsberechnungsalgorithmus weitergeleitet. Die resultierende Sprachqualitätsberechnung wird dann basierend auf einer Analyse der Teile des Testsignals, die zuvor entfernt wurden, eingestellt.
  • Es ist demzufolge eine Ziel der vorliegenden Erfindung, eine Sprachqualitätsberechnungstechnik bereitzustellen, die in der Lage ist, Sprachqualität trotz der Präsenz von variablen Übertragungsverzögerungen, die kontinuierliche und intermittierende variable Übertragungsverzögerungen beinhalten, zu bewerten.
  • Es ist ein anderes Ziel der vorliegenden Erfindung, die Verhinderung der Verwendung von Standardsprachqualitätsberechnungsalgorithmen aufgrund der Präsenz von variablen Übertragungsverzögerungen zu verhindern.
  • In Übereinstimmung mit dem ersten Ziel der vorliegenden Erfindung wird das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität erreicht. Das Verfahren bindet das Identifizieren von Teilen eines ersten Sprachsignals ein, das durch Übertragungsverzögerungen verursachte Verzerrungen aufweist. Die identifizierten Teile werden dann aus dem Sprachsignal entfernt und das erste Sprachsignal wird mit einem zweiten Sprachsignal verglichen. Eine Sprachqualitätsberechnung wird dann basierend auf dem Vergleich des ersten Sprachsignals mit dem zweiten Sprachsignal erzeugt.
  • In Übereinstimmung mit einem zweiten Aspekt der vorliegenden Erfindung werden das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität in einem Telekommunikationsnetz erreicht, wobei ein erstes Sprachsignal über eine Übertragungskette zu einer empfangenden Einheit transportiert wird. Das Verfahren involviert an der empfangenen Einheit das Ausrichten jedes einer Anzahl von Synchronisationspunkten entlang des ersten Sprachsignals mit einem entsprechenden einer Anzahl von Synchronisationspunkten entlang des Referenzsprachsignals. Dann wird eine Ermittlung durchgeführt, ob irgendwelche Teile des ersten Sprachsignals eine intermittierende Verzögerungsvariation basierend auf der Ausrichtung der Synchronisationspunkte entlang des ersten Sprachsignals und des Referenzsprachsignals reflektiert. Dann wird der Grad der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist, ermittelt, und dann wird das erste Sprachsignal oder der Referenzsignal angepasst, um den Grad der von dem ersten Sprachsignal aufgewiesenen kontinuierlichen Verzögerungsvariation als auch für jeden Teil des ersten Sprachsignals, der eine intermittierende Verzögerungsvariation reflektiert, zu berücksichtigen. Das erste Sprachsignal wird dann mit dem Referenzsignal verglichen, und darauf basierend wird die Sprachqualität berechnet.
  • In Übereinstimmung mit einem dritten Aspekt der vorliegenden Erfindung werden das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität in einem paketgeschalteten Telekommunikationsnetz erreicht, wobei Sprachsignale über eine Übertragungskette zu einer Empfangseinheit transportiert werden. Das Verfahren involviert das Ausrichten jedes einer Anzahl von Syric-Punkt-Segmenten entlang eines ersten Sprachsignals mit einem entsprechenden Sync-Puls-Segment entlang eines Referenzsprachsignals, wobei das erste Sprachsignal über die Übertragungskette zu der Empfangseinheit transportiert wurde, und wobei das Referenzsignal mit dem ersten Sprachsignal identisch ist, bevor das erste Sprachsignal über die Übertragungskette transportiert wurde. Nach dem Ausrichten der Sync-Punkt-Segmente entlang des ersten Sprachsignals und der Sync-Puls-Segmente entlang des Referenzsprachsignals wird eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals identifiziert, unter der Annahme dass eine existiert. Als nächstes wird der Standort und Größe von jeder identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals als auch jeder Grad von kontinuierlicher Verzögerungsvariation, die das erste Sprachsignal aufweist, ermittelt. Das erste Sprachsignal oder das Referenzsprachsignal wird dann angepasst, um die Präsenz von einer intermittierenden Verzögerungsvariation und des Grades von kontinuierlicher Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen. Das erste Sprachsignal wird dann mit dem Referenzsignal verglichen und die Sprachqualität wird basierend auf den Vergleich des ersten Sprachsignals mit dem Referenzsignal berechnet. Schließlich wird die berechnete Sprachqualität angepasst, um eine anerkannte Sprachqualität zu erreichen, wobei die Anpassung der berechneten Sprachqualität, wenn überhaupt, auf den intermittierenden Verzögerungsvariationen basiert und dem Grad der kontinuierlichen Verzögerungsvariation.
  • Kurze Beschreibung der Figuren
  • Die Ziele und Vorteile der vorliegenden Erfindung werden verständlich durch Lesen der folgenden detaillierten Beschreibung in Verbindung mit den Zeichnungen in denen:
  • 1 die grundlegende Technik darstellt, die durch konventionelle Sprachqualitätsberechnungsalgorithmen angewendet wird;
  • 2 eine Technik zum Anpassen eines Referenzsignals und eines Testsignals vor der Durchführung von Sprachqualitätsberechnung in Übereinstimmung mit konventionellen Sprachqualitätsberechnungsalgorithmen darstellt;
  • 3 einen Überblick über die Sprachqualitätsberechnungstechnik in Übereinstimmung mit exemplarischen Ausführungsformen der vorliegenden Erfindung bereitstellt;
  • 4 einen Überblick eines exemplarischen Synchronisationsalgorithmus bereitstellt;
  • 5 ein Flussdiagramm ist, das die grundlegenden Schritte, die mit den oben erwähnten exemplarischen Synchronisationsalgorithmus verbunden sind, darstellt;
  • 6 eine Abbildung zwischen jedem der sieben exemplarischen Sync-Puls-Segmente entlang eines Referenzsignals und eines verbundenen von sieben Sync-Punkt-Segmenten entlang eines Testsignals darstellt;
  • 7 die elementaren funktionalen Elemente des Entscheidungsalgorithmus in Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellt;
  • 8 eine Abbildung zwischen jedem der 10 Sync-Puls-Segmente entlang eines Referenzsignals und jedes der 10 verbundnen Sync-Punkt-Segmente entlang eines Testsignals darstellt;
  • 9 den kontinuierlichen Verzögerungsvariationsberechnungsalgorithmus in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung darstellt;
  • 10 eine Technik zum Implementieren des Verzögerungsvariationsberechnungsalgorithmus in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung darstellt;
  • 11 eine exemplarische Prozedur zum Voraussagen des Ortes von Sync-Punkt-Segmenten entlang des Testsignals darstellt;
  • 12 die Transfer-Funktion T darstellt;
  • 13 eine Anzahl von Diagrammen zeigt, die zusammen die Berechnung des Ortes L und der Größe S einer Signal-Unstetigkeit entlang eines Abschnitts des Testsignals darstellt; und
  • 14 eine exemplarische Technik zum Berechnen der Größe S der Signal-Unstetigkeit darstellt;
  • Detaillierte Beschreibung der Erfindung
  • Die vorliegende Erfindung bezieht eine Technik zum Berechnen der Qualität von Sprachsignalen in einem paketgeschalteten Netzwerk (z. B. ein IP basiertes Netz) ein. Die vorliegende Erfindung erreicht dies trotz der Präsenz von variablen Übertragungsverzögerungen, die in paketgeschalteten Netzen üblich sind. Darüber hinaus ist die vorliegende Erfindung in der Lage, einen beliebigen sprachbasierten Algorithmus einzusetzen, um die Sprachqualitätsberechnung durchzuführen.
  • 3 stellt einen Überblick über die Sprachqualitätsberechnungstechnik in Übereinstimmung mit exemplarischen Ausführungsformen der vorliegenden Erfindung dar. Wie in 3 dargestellt werden das Referenzsignal und das Testsignal zu einem Mehrfach-Puls-Synchronisationsalgorithmus 305 weitergeleitet. Der Mehrfach-Puls-Synchronisationsalgorithmus 305, der weiter unten detaillierter beschrieben wird, analysiert das Referenzsignal und das Testsignal, und identifiziert basierend darauf N Sync-Pulse Pr1, Pr2...PRN entlang des Referenzsignals und N Sync-Positionen Pt1, Pt2...PtN entlang des Testsignals, wobei jede der N Sync-Positionen Pt1, Pt2...PtN entlang des Testsignals verbunden ist mit einem entsprechenden der Sync-Pulse Pr1, Pr2...PrN entlang des Referenzsignals. Für jeden Sync-Puls, Sync-Positions-Paar, erzeugt der Mehrfach-Puls-Synchronisationsalgorithmus 305 auch einen Synchronisationsqualitätsfaktor q1, q2...qN, der eine Anzeige hinsichtlich der Qualität der Synchronisation zwischen dem entsprechenden Sync-Puls, Sync-Positions-Paar bereitstellt. Basierend auf der Synchronisationsinformation {(Pr1, Pt1, q1); (Pr2, Pt2, q2)...(PrN, PtN, qN)}, die durch den Mehrfach-Puls Synchronisationsalgorithmus 305 erzeugt wird, identifiziert ein Verzögerungsberechnungsentscheidungsalgorithmus 310 Segmente entlang des Testsignals, die den Anschein erwecken, durch variable Übertragungsverzögerungen beeinflusst worden zu sein. Ein Vor-Bearbeitungsalgorithums 315 gleicht dann das Referenz- und/oder Testsignal basierend auf irgendeiner identifizierten Übertragungsverzögerung ab, so dass das Referenzsignal und das Testsignal bezüglich der Zeit-Domäne gleich skaliert sind. Die Technik kann dann einen Standardsprachqualitätsberechnungsalgorithmus 320 einsetzen, um eine Sprachqualitätsberechnung basierend auf dem eingestellten Referenz- und/oder Testsignalen abzuleiten. Schließlich wird die Signalqualitätsberechnung, die abgeleitet ist durch den Standardsprachqualitätsberechnungsalgorithmus 320, wiederum eingestellt basierend auf der Art der Segmente, die durch den Verzögerungsberechnungsentscheidungsalgorithmus 310 identifiziert wurden. Diese Segmente des Testsignals werden bei der Berechnung der Gesamt-Sprachqualität berücksichtigt, die schließlich in einer genaueren Signalqualitätsberechnung resultiert. Jeder der oben beschriebenen Algorithmen wird weiter unten detaillierter beschrieben.
  • Der Mehrfach-Synchronisationsalgorithmus 305 stellt wichtige Informationen bereit, auf der die Sprachqualitätsberechnung schließlich basiert. Im Genaueren passt der Mehrfach-Synchronisationsalgorithmus 305 jedes der N Segmente, die hier als Sync-Puls-Segmente bezeichnet werden, die entlang des Referenzsignals angeordnet sind, mit einem entsprechenden Segment, das hier als Sync-Puls-Segment bezeichnet wird, das entlang des Testsignals angeordnet ist, an. Der Mehrfach-Synchronisationsalgorithmus 305 erreicht dies trotz der Tatsache, dass Teile des Testsignals mehr oder weniger Information beinhalten kann als das Referenzsignal, aufgrund von intermittierenden und/oder kontinuierlichen, variablen Übertragungsverzögerungen.
  • Jeder einer Anzahl von Signalsynchronisationsalgorithmen könnte verwendet werden, um die Funktionalität des Mehrfach-Synchronisationsalgorithmuses 305 bereitzustellen. Ein exemplarischer Synchronisationsalgorithmus ist in der mit-anhängigen US Patentanmeldung 09/430,246, die am 29. Oktober 1999 eingereicht wurde, beschrieben. 4 stellt einen Überblick über diesen exemplarischen Synchronisationsalgorithmus bereit. Wie gezeigt empfängt der Synchronisationsalgorithmus sowohl ein Referenzsignal r(n) als auch ein Testsignal t(n) und erzeugt daraus N von Dreifach-Werten {(Pr1, Pt1, q1); (Pr2, Pt2, q2)...(PrN, PtN, qN)}, wobei Pr1, Pr2...PrN die N Sync-Puls-Segmente repräsentiert, die entlang des Referenzsignals r(n) identifiziert wurden, Pt1, Pt2...PtN repräsentiert die entsprechenden N Sync-Punkt-Segmente entlang des Testsignals t(n) und q1, q2...qN repräsentiert die zuvor erwähnten Sprachqualitätsfaktoren, die verbunden sind mit jedem der Sync-Puls-Segmente, Sync-Punkt-Segmentpaare.
  • 5 ist ein Flussdiagramm, das die vier grundlegenden Schritte darstellt, die mit dem in der US Patentanmeldung 09/430,246 beschriebenen Synchronisationsalgorithmus verbunden sind. Wie gezeigt bezieht der erste Schritt den Ausfall von N Sync-Puls-Segmenten Pr1, Pr2...PrN entlang des Referenzsignals r(n) ein. Während eines zweiten Schritts führt der Synchronisationsalgorithmus eine grobe oder grob-gradige Synchronisationsprozedur aus, wobei N Sync-Punkt-Segmente Pt1, Pt2...PtN entlang des Testsignals t(n) identifiziert sind, ein entsprechender der N Sync-Puls-Segmente {Pr1, Pr2...PrN} entlang des Referenzsignals r(n). Während dieses zweiten Schritts wird ein vorläufiger Synchronisationsqualitätsfaktor q1, q2...qN für jedes Sync-Puls-Segment, Sync-Punkt-Segmentpaar, erzeugt. Der zweite Schritt gibt N Dreifach-Werte {(Pr1, Pt1, q1); (Pr2, Pt2, q2)...(PrN, PtN, qN)} aus, wobei jeder Dreifach-Wert ein Sync-Puls-Segment Pri einen entsprechenden aber geschätzten Sync-Punk-Segment Pti und einen vorläufigen Synchronisationsqualitätsfaktor qi enthält. In einem dritten Schritt wird eine Amplituden-Skalierungs-Berechnung SG erzeugt. Dann wird in einem vierten Schritt eine fein-gradige Synchronisation ausgeführt, wobei die fein-gradige Synchronisationsprozedur in der Erzeugung einer zweiten Anzahl N von Dreifach-Werten {(Pr1, Pt1, q1); (Pr2, Pt2, q2)...(PrN, PtN, qN)} resultiert, wobei die Sync-Punkt-Segmente Pt1, Pt2...PtN und die Synchronisationsqualitätsfaktoren q1, q2...qN, die mit jedem der Dreifach-Werte verbunden sind, mit einer größeren Präzision definiert sind verglichen mit denen, die in den Dreifach-Werten definiert sind, die durch den zweiten oben beschriebenen Schritt erzeugt wurden.
  • Wie bereits gesagt ist der in der mit-anhängigen US Patentanmeldung 09/430,246 beschriebene Synchronisationsalgorithmus exemplarisch. Für den Fachmann ist es leicht ersichtlich, dass andere Signalsynchronisationsalgorithmen verwendet werden könnten, um die Funktionalität des Mehrfach-Synchronisationsalgorithmus 305 bereitzustellen.
  • 6 zeigt eine Abbildung zwischen jeden der sieben exemplarischen Sync-Puls-Segemente Pr1, Pr2...Pr7, die entlang des Referenzsignals angeordnet sind, und einen entsprechenden der sieben Sync-Punkt-Segment Pt1, Pt2...Pt7, die entlang des Testsignals angeordnet sind, wobei die Abbildung basiert auf der Information, die in den sieben Dreifach-Werten enthalten ist, die durch den Mehrfach-Synchronisationsalgorithmus 305 erzeugt wurden. In diesem Beispiel ist N gleich sieben. Es ist wichtig anzumerken, dass während die Abstände zwischen angrenzenden Sync-Puls-Segmenten konstant oder annähernd konstant bleibt, die Abstände zwischen angrenzenden Sync-Punkt-Segmenten im Allgemeinen stetig größer werden mit Ausnahme des Abstandes zwischen den Sync-Punkt-Segmenten Pt5 und Pt6. Der stetige Zuwachs in dem Abstand zwischen angrenzenden Sync-Punkt-Segmenten könnte anzeigen, dass die Bit-Rate, die mit dem Testsignal verbunden ist, größer sein könnte als die Bit-Rate des Referenzsignals, oder dass die Daten-Pakete, die mit dem Testsignal verbunden sind, zugeordnet sein sollten zu einer stetig steigenden Übertragungsverzögerung. Im Vergleich dazu ist der Abstand zwischen den Sync-Punkt-Segmenten Pt5 und Pt6 signifikant groß verglichen mit dem Abstand zwischen den anderen Sync-Punkt-Segmenten entlang des Testsignals, und zeigt somit die Präsenz einer Signal-Unstetigkeit (d. h. intermittierende Verzögerung) an. Dem gemäß stellt 6 dar, wie die in den N Dreifach-Werten enthaltene Information, die durch den Mehrfach-Synchronisationsalgorithmus 305 erzeugt werden, verwendet werden können für den Zweck des Detektierens und Identifizierens der Segmente entlang des Testsignals, das kontinuierliche und intermittierende, variable Übertragungsverzögerungen reflektiert.
  • Wie in 3 dargestellt werden die N Dreifach-Werte (Pr2, Pt2, q2)...(PrN, PtN, qN)}, die durch (Pr1, Pt1, q1) den Mehrfach-Synchronisationsalgorithmus 305 erzeugt werden, zu einem Verzögerungsberechnungsentscheidungsalgorithmus 310 geleitet, der hier bezeichnet wird als Entscheidungsalgorithmus. Im Allgemeinen analysiert der Entscheidungsalgorithmus 310 die N Dreifach-Werte und eliminiert Sync-Pulse, Sync-Punkte-Segmentpaare, die nicht den Anschein machen, richtig synchronisiert worden zu sein. Zusätzlich klassifiziert der Entscheidungsalgorithmus 310 jede Verzerrung des Testsignals bezogen zu sein, oder reflektierend zu sein von einer kontinuierlichen oder intermittierenden variablen Verzögerung. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung umfasst der Entscheidungsalgorithmus 310 vier primäre Funktionselemente, wie in 7 dargestellt.
  • Das erste funktionelle Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist ein Signal-Unstetigkeits-Identifikationsalgorithmus 705. Der Signal-Unstetigkeits-Identifikationsalgorithmus 705 analysiert die Abstände zwischen jedem Paar von angrenzenden Sync-Punkt-Segmenten entlang des Testsignals und bestimmt basierend auf dieser Analyse, ob die Länge des Testsignals zwischen jedem gegebenen Paar von angrenzenden Sync-Punkt-Segmenten besonders groß oder klein ist. Eine Bestimmung, dass eine bestimmte Länge des Testsignals besonders groß oder klein ist, tendiert anzuzeigen, dass der entsprechende Teil des Testsignals eine Signal-Unstetigkeit reflektiert (d. h. eine intermittierende Verzögerung). Der Signal-Unstetigkeits-Identifikationsalgorithmus 705 kann implementiert werden durch Vergleichen der Länge des Testsignals zwischen jedem Paar von angrenzenden Sync-Punkt-Segmenten mit einem Grenzwert, wobei der Grenzwert beispielsweise eine Funktion des mittleren oder gewichteten mittleren Abstands zwischen angrenzenden Sync-Punkt-Segmenten ist.
  • Das folgende Beispiel soll betrachtet werden, um eine mögliche Implementierung des Signal-Unstetigkeits-Identifikationsalgorithmus 705 weiter zu illustrieren. In diesem Beispiel ist N gleich 20. Somit gibt es 20 Sync-Puls-Segmente, Sync-Punkt-Segmentpaare. Zuerst wird eine Differenz δ zwischen der Position von jeden Sync-Punkt-Segment entlang des Testsignals und eines entsprechenden Sync-Puls-Segments des Referenzsignals bestimmt. Z. B. kann die Differenz δ zwischen der Position jedes der 20 Sync-Punkt-Segmente und der entsprechenden Sync-Puls-Segmente gegeben sein durch Ausdrücke einer Anzahl von Samplen, wie folgt: δ1 = 5160, δ2 = 5187, δ3 = 5347, δ4 = 5347, δ5 = 5347, δ6 = 5347, δ7 = 5027, δ8 = 5027, δ9 = 5027, δ10 = 5027, δ11 = 5027, δ12 = 4867, δ13 = 4867, δ14 = 4867, δ15 = 4867, δ16 = 4867, δ17 = 4867, δ18 = 4867, δ19 = 4867, δ20 = 4867. Zweitens werden N – 1 Delta-Werte Δ, die die Veränderung in den Differenz-Werten Δ darstellen, abgeleitet. Wenn die N – 1 Delta-Werte Δ abgeleitet werden gemäß der folgenden Beziehung Δi = (δi + 1) – δ1 (1)dann würden die N – 1 Delta-Werte Δ für die oben identifizierten Differnz-Werte Δ wie folgt gegeben sein:
    Δ1 = 27, Δ2 = 160, Δ3 = 0, Δ4 = 0, Δ5 = 0, Δ6 = –320, Δ7 = 0, Δ8 = 0, Δ9 = 0, Δ10 = 0, Δ11 = –160, Δ12 = 0, Δ13 = 0, Δ14 = 0, Δ15 = 0, Δ16 = 0, Δ17 = 0, Δ18 = 0, Δ19 = 0. Drittens werden die N – 1 Delta-Werte Δ mit dem Grenzwert verglichen (z. B. ± 40 Sample), was zu dem folgenden führt: Δ1 – 0, Δ2 – 1, Δ3 – 0, Δ4 – 0, Δ5 – 0, Δ6 – 1, Δ7 – 0, Δ8 – 0, Δ9 – 0, Δ10 – 0, Δ11 – 1, Δ12 – 0, Δ13 – 0, Δ14 – 0, Δ15 – 0, Δ16 – 0, Δ17 – 0, Δ18 – 0, Δ19 – 0, wobei eine „1" anzeigt, dass der Delta-Wert Δ den Grenzwert übersteigt und die Präsenz einer möglichen Signal-Unstetigkeit.
  • Jede Signal-Unstetigkeit, die durch den Signal-Unstetigkeits-Identifikationsalgorithmus 705 identifiziert wird, wird zu dem zweiten funktionalen Element weitergeleitet, das mit dem Entscheidungsalgorithmus 310 verbunden ist. Das zweite funktionale Element ist wie in 7 angedeutet der „Ausreißer"-Idenifikations- und Entfernungsalgorithmus 710. Der Ausreißer-Idenifikations- und Entfernungsalgorithmus 710 bestimmt, ob eins der Signale, die durch den Signal-Unstetigkeits-Identifikationsalgorithmus 705 identifiziert wurden, wie oben beschrieben richtige Unstetigkeiten sind oder falsche Alarme sind.
  • Man beachte das folgende Beispiel, um eine exemplarische Ausführungsform des Ausreißer-Identifikations- und Entfernungsalgorithmus 710 besser darzustellen. 8 zeigt eine Abbildung zwischen jedem der 10 Sync-Puls-Segmente entlang eines
  • Referenzsignals und jedes einer Anzahl von entsprechenden
  • Sync-Punkt-Segmenten entlang eines Testsignals. Der Abstand zwischen den Sync-Puls-Segmenten wird als konstant angenommen, weil der Abstand zwischen den Sync-Punkt-Segmenten linear ansteigt, aber für die Abstände die dem Sync-Punkt-Segment Pt6 und dem Sync-Punkt-Segment Pt10 vorausgehen. Es wird ferner angenommen, dass die Abstände, die den Sync-Punkt-Segmenten Pt6 und Sync-Punkt-Segment Pt10 vorangehen, identifiziert wurden als Signal-Unstetigkeiten durch den Signal-Unstetigkeit-Identifikationsalgorithmus 705. Zuerst identifiziert der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 einen „Puls-Satz", der mit dem Abstand entlang des zu evaluierenden Testsignals verbunden ist. Wenn beispielsweise der Abstand entlang des zu evaluierenden Testsignals der Abstand ist, der den Sync-Punkt-Segment Pt6 vorangeht, könnte der Puls-Satz die Sync-Punkt-Segmente Pt6, Pt7, Pt7 und Pt9 umfassen. Es ist jedoch verständlich, dass eine Untersuchung, ob eine Signal-Unstetigkeit wahrscheinlich existiert, Puls-Segmente enthalten muss, wovon einige dem zu evaluierenden Abstand vorausgehen und einige, die dem zu evaluierenden Abstand folgen. Wenn alle Puls-Segmente von Anfang bis zum Rahmen-Slip separat evaluiert werden, wird der Fachmann erkennen, dass es genug ist, Pulse zu evaluieren, die der Signal-Unstetigkeit folgen, um zu entscheiden, ob eine Unstetigkeit voraussichtlich existiert. Sobald der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 den Puls-Satz identifiziert, werden nichts desto trotz die Pulse, die den Puls-Satz aufbauen, analysiert, um zu bestimmen, ob irgendeine der Bedingungen erfüllt ist. Beispielsweise könnte eine Bedingung sein, ob mindestens ein Synchronisations-Qualitäts-Faktor qi, der mit jedem der Sync-Punkt-Segmente die den Puls-Satz aufbauen, verbunden ist, größer ist als eine erste minimale Synchronisations-Qualitäts-Grenze. Die Erfüllung einer solchen Bedingung würde anzeigen, dass die Länge des entsprechenden Abstands zuverlässig ist. Eine zweite Bedingung könnte sein, ob mindestens zwei Synchronisation-Qualitäts-Faktoren, die mit jedem der zwei der Sync-Punkt-Segmente, die den Puls-Satz aufbauen, verbunden sind, größer sind als eine zweite minimale Synchronisations-Qualitäts-Grenze, wobei die zweite minimale Synchronisations-Qualitäts-Grenze verstanden wird, niedriger zu sein als die erste minimale Synchronisations-Qualitäts-Grenze, und ob die Anzahl von Sync-Punkt-Segmenten, die den Puls-Satz aufbauen, größer ist als eine minimale Anzahl von Sync-Punkt-Segmenten. Eine weitere dritte Bedingung könnte sein, ob mindestens ein Synchronisations-Qualitäts-Faktor, der mit einem der Sync-Punkt-Segmente, die den Puls-Satz aufbauen, verbunden ist, größer ist als eine dritte minimale Synchronisations-Qualitätsfaktor-Grenze, und ob die Anzahl von Sync-Punkt-Segmenten, die den Puls-Satz aufbauen, größer ist als die zuvor erwähnte minimale Anzahl von Sync-Punkt-Segmenten, wobei die dritte minimale Synchronisations-Qualitäts-Grenze verstanden wird, kleiner zu sein als die erste minimale Sync-Qualitäts-Grenze aber größer zu sein als die zweite minimale Sync-Qualitäts-Grenze. Wenn eine der Bedingungen erfüllt ist, bestimmt der Ausreißer-Identifikations- und Entfernungsalgorithmus 710, das die Länge des zu evaluierenden Testsignals reflektierend ist für eine echte Signal-Unstetigkeit (d. h. eine intermittierende Verzögerung). Wenn der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 feststellt, dass eine Länge des Testsignals reflektierend ist für eine echte Signal-Unstetigkeit, z. B. die Länge des Testsignals, das Pt6 in 8 vorausgeht, wird das entsprechende Sync-Punkt-Segment Pt6 als ein „Ausreißer" identifiziert. Der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 entfernt dann alle der Sync-Punkt-Segmente, die als „Ausreißer" identifiziert wurden (d. h. falsche Signal-Unstetigkeiten) unter den N Sync-Punkt-Segmenten Pt1, Pt2...PtN, die durch den Mehrfach-Puls-Synchronisationsalgorithmus 305 identifiziert wurden. Die übrigen M Sync-Punkt-Segmente Pt1, Pt2...PtM werden aufbewahrt und zu den dritten funktionalen Element des Entscheidungs-Algorithmus 310 weitergeleitet, wobei verstanden wird, das M durch die folgende Beziehung definiert ist: M = N – O – TD – Q (2)wobei die Variable O die Anzahl von Sync-Punkt-Segmenten, die als "Ausreißer" durch den Ausreißer-Identifikations- und Entfernungsalgorithmus 710 identifiziert wurden, repräsentiert; TD die Anzahl von "echten" Unstetigkeiten repräsentiert; und Q die Anzahl von Sync-Pulsen repräsentiert, die eine niedrigere Sync-Qualität aufweisen.
  • Das dritte funktionale Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715. Der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 berechnet den Grad der kontinuierlichen Verzögerungsvariation Δf, der von den übrig gebliebenen M Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals aufgewiesen ist wie mit dem Ort der entsprechenden Sync-Puls-Segmente Pr1, Pr2...PrM entlag des Referenzsignals verglichen. Im Allgemeinen ist der Grad der kontinuierlichen Verzögerungsvariation Δf eine Funktion der Sync-Punkt-Segmentfrequenz ft (d. h. die Frequenz der Sync-Punkt-Segmente entlang des Testsignals) und der Sync-Puls-Segment-Frequenz fr (d. h. der Frequenz der Sync-Puls-Segmente entlang des Referenzsignals). In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung wird der Grad der kontinuierlichen Verzögerungsvariation Δf definiert durch die folgende Beziehung: Δf = (ft·fr –1) – 1 (3)wobei ein Grad der kontinuierlichen Verzögerungsvariation Δf gleich Null (0) anzeigt, dass es keine kontinuierliche Verzögerungsvariation gibt, was geschieht, wenn die Sync-Puls-Segment-Frequenz fr und die Sync-Punkt-Segment-Frequenz ft gleiche Werte sind, wie der Fachmann leicht erkennt.
  • Der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 wird nun detailliert beschrieben. 9 stellt eine exemplarische Ausführungsform zum Implementieren des kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715 dar. Wie gezeigt ist der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 in zwei funktionale Komponenten geteilt: ein Verzögerungs-Variations-Detektionsalgorithmus 905 und ein Grad der Verzögerungs-Variations-Berechnungsalgorithmus 910. Im Allgemeinen analysiert der Verzögerungs-Variations-Detektionsalgorithmus 905 den Ort der M Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals verglichen mit dem Ort der entsprechenden Sync-Puls-Segmente Pr1, Pr2...PrM entlang des Referenzsignals und bestimmt daraus, ob es wahrscheinlicher ist oder nicht, dass der Ort der M Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals eine kontinuierliche Verzögerungsvariation reflektiert. Im Gegensatz dazu bestimmt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsvariation. wenn überhaupt, und verwendet die durch den Verzögerungs-Variations-Bestimmungsalgorithmus 905 gemachte Bestimmung um eine „Fitness"-Grenze zu setzen, wobei die Fitness-Grenze als ein Kriterium zum Bestimmen, ob die kontinuierliche Verzögerungs-Variations-Berechnung akzeptiert oder abgelehnt werden soll, dient. Sowohl der Verzögerungs-Variations-Detektionsalgorithmus 905 als auch der Verzögerungs-Variations-Berechnungsalgorithmus 910 werden hier weiter unten detaillierter beschrieben.
  • Wie gesagt bestimmt der Verzögerungs-Variations-Detektionsalgorithmus 905 ob eine Verzögerungsvariation wahrscheinlich existiert, mit gegebenem Ort der M Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung macht der Verzögerungs-Variations-Detektionsalgorithmus 905 diese Bestimmung basierend auf einem Gesamt-Sync-Punkt-Segment-Positionsfehler E und einer Varianz V. Der Gesamt-Sync-Punkt-Segment-Positionsfehler E kann beispielsweise abgeleitet werden unter Verwendung der folgenden Gleichung:
    Figure 00210001
    wobei P(derivate)i eine Delta-Funktion ist, die auf dem Abstand zwischen zwei angrenzenden Sync-Punkt-Segmenten entlang des Testsignals und des Abstandes zwischen zwei entsprechenden Sync-Puls-Segmenten entlang des Referenzsignals basiert. Wenn beispielsweise „i" gleich ist mit „1", könnte P(derivate)i wie folgt definiert sein. P(derivate)i = ((Pt2 – Pt1) – (Pr2 – Pr1))·(Pr2 – Pr1)–1 (5)
  • Im Gegensatz dazu könnte Δfest beispielsweise der gewichtete Median-Wert der Delta-Funktion Pderivate sein. Ein anderes Verfahren könnte das Iterieren durch einen Bereich von unterschiedlichen Δfest-Werten beinhalten und das Auswählen des einen Wertes, der die Summe E minimiert.
  • Die Variable V repräsentiert die Varianz des gewichteten Medians Δfest. Im Genaueren ist die Variable V eine Funktion des gewichteten Medianwertes Δfest und der Delta-Funktion P(derivate)i-Wert, der direkt kleiner ist als der gewichtete Medianwert und die Delta-Funktion P(derivate)i-Wert, der direkt größer ist als der gewichtete Medianwert. Die Variable V kann somit in Übereinstimmung mit der folgenden Beziehung definiert werden: V = Varianz Wmedian–1, Wmedian, Wmedian+1) (6)Wobei Wmedian äquivalent ist mit den gewichteten Medianwert von Pderivate, Wmedian–1 ist äquivalent mit Pderivate, der gerade kleiner ist Wmedium und Wmedian+1 ist äquivalent mit Pderivate, der gerade größer ist als Wmedium.
  • Nachdem der Verzögerungs-Variations-Detektionsalgorithmus 905 den Gesamt-Sync-Punkt-Positionsfehler E und die Varianz V wie oben beschrieben ableitet, vergleicht der Verzögerungs-Variations-Detektionsalgorithmus 905 den Gesamt-Sync-Punkt-Positionsfehler E mit einer Gesamt-Sync-Punkt-Positionsfehlergrenze TE. Er vergleicht auch die Varianz V mit einer Varianzgrenze TV. Man erkennt leicht, dass der Ist-Wert der Gesamt-Sync-Punkt-Positionsfehlergrenze TE und der Ist-Wert der Varianzgrenze TV empirisch abgeleitet werden können. Durch Vergleichen des Gesamt-Sync-Punkt-Positionsfehlers E mit der Gesamt-Sync-Punkt-Positionsfehlergrenze TE und durch Vergleichen der Varianz V mit der Varianzgrenze TV ist der Verzögerungs-Variations-Detektionsalgorithmus 905 in der Lage zu bestimmen, ob der Gesamt-Sync-Punkt-Positionsfehler E und/oder die Varianz V relativ klein sind. Wenn der Verzögerungs-Variations-Detektionsalgorithmus 905 bestimmt, das sowohl der Gesamt-Sync-Punkt-Positionsfehler E und die Varianz V relativ klein sind (d. h. E ist kleiner als TE und V ist kleiner als TV), setzt der Verzögerungs-Variations-Detektionsalgorithmus 905 ein Detektions-Flag gleich einem „TRUE", das wiederum anzeigt, dass eine kontinuierliche Verzögerungsvariation wahrscheinlich existiert, das den Ort der M Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals angibt.
  • Wie zuvor erwähnt berechnet der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsvariation Δf. Im Allgemeinen führt der Verzögerungs-Variations-Berechnungsalgorithmus 910 dies aus durch Berechnen eines vorhergesagten Ortes für die M Sync-Punkt-Segmente Pt1(pred), Pt2(pred)...PtM(pred) entlang des Testsignals für jeden einer Anzahl von Sync-Punkt-Segmentfrequenzen. Dann vergleicht für jede Sync-Punkt-Segmentfrequenz der Verzögerungs-Variations-Berechnungsalgorithmus 910 die Abstände zwischen angrenzenden, vorhergesagten Sync-Punkt-Segmenten Pt1(pred), Pt2(pred)...PtM(pred) mit den Abständen zwischen den Ist-Orten der Sync-Punkt-Segmente Pt1, Pt2...PtM, die durch den Mehrfach-Puls-Synchronisationsalgorithmus 305 abgeleitet wurden. Ein „Fitness"-Wert Dfitness wird dann basierend auf diesem Vergleich erzeugt. Ein maximaler Fitness-Wert Dfitness(max) wird eventuell abgeleitet und verglichen mit einer ersten Fitness-Grenze oder einer zweiten Fitness-Grenze davon abhängig, ob das Detektions-Flag gleich dem „TRUE"-Zustand durch den Verzögerungs-Variations-Detektionsalgorithmus 905 wie oben beschrieben gesetzt wurde. Wenn der Verzögerungs-Variations-Berechnungsalgorithmus 910 bestimmt, dass der maximale Fitness-Wert Dfitness(max) größer ist als die Fitness-Grenze, mit der dieser verglichen wird, setzt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsberechnung Δf gleich mit einem Wert in Übereinstimmung mit Gleichung (3), wobei ft die Sync-Punkt-Segmentfrequenz ist, die den maximalen Fitness-Wert Dfitness(max) entspricht, und wobei fr die Sync-Punkt-Segmentfrequenz ist. Wenn jedoch der Verzögerungs-Variations-Berechnungsalgorithmus 910 feststellt, dass der maximale Fitness-Wert Dfitness(max) kleiner ist oder gleich der Fitness-Grenze, setzt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsberechnung Δf gleich Null (0), was anzeigt, dass eine kontinuierliche Verzögerungsvariation durch die Sync-Punkt-Segmente entlang des Testsignals nicht vorliegt.
  • 10 stellt eine Technik zum Implementieren des Verzögerungs-Variations-Berechnungsalgorithmus 910 in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung detaillierter dar. Wie in Block 1005 gezeigt beginnt die Technik mit der Initiierung des Fitness-Wertes Dfitness auf Null (0). Wie oben erwähnt wird der Fitness-Wert Dfitness abgeleitet für jede der Sync-Punkt-Segmentfrequenzen, und der maximale Fitness-Wert Dfitness(max) wird verwendet, um eine Sync-Punkt-Segmentfrequenz zu identifizieren, die am genauesten die Frequenz der Ist-Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals reflektiert.
  • In Übereinstimmung mit Block 1010 wird eine erste von mehreren Sync-Punkt-Segmentfrequenzen ft ausgewählt. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung decken die mehrere Sync-Punkt-Segmentfrequenzen einen Bereich von Frequenzen ab, die die Sync-Puls-Segmentfrequenz fr beinhaltet. Wenn beispielsweise die Sync-Puls-Segmentfrequenz fr 8000 Hz ist, können die mehreren Sync-Punkt-Segmentfrequenzen ft von 7950 Hz bis 8050 Hz reichen. In diesem Beispiel würde die Sync-Punkt-Segmentfrequenz ft initialisiert werden auf eine Frequenz von 7950 Hz bei Block 1010.
  • Wie in Block 1015 gezeigt wird ein vorausgesagter Ort entlang des Testsignals für jedes der Sync-Punk-Segmente Pt(pred), Pt2(pred)...PtM(pred) abgeleitet . Die vorausgesagten Orte könnten abgeleitet werden als eine Funktion der bekannten Orte der Sync-Puls-Segmente Pr1, Pr2...PrM entlang des Referenzsignals und der aktuellen Sync-Punkt-Segmentfrequenz ft (z. B. 7950 Hz).
  • 11 stellt eine exemplarische Prozedur zum Ableiten der vorausgesagten Orte der Sync-Punkt-Segmente Pt1(pred), Pt2(pred)...PtM(pred) entlang des Testsignals mit größerer Klarheit, basierend auf den bekannten Orten der Sync-Puls-Segmente Pr1, Pr2...PrM entlang des Referenzsignals, die bekannten Abstände ak zwischen angrenzenden Sync-Puls-Segmenten entlang des Referenzsignals, wobei k von „1" bis „M–1" erreicht ein Skalierungs-Faktor s und die aktuelle Sync-Punkt-Segmentfrequenz ft. Wie in 11 gezeigt kann der vorausgesagte Ort für jedes Sync-Punkt-Segment, z. B. der vorausgesagte Ort für Sync-Punkt-Segment Ptk+1, bestimmt werden in Übereinstimmung mit der folgenden Beziehung: Ptk+1(pred) = Ptk(pred) + aks (7) Wobei aks den Abstand zwischen zwei angrenzenden vorausgesagten Sync-Punkt-Segmenten Ptk(pred) und Ptk+1(pred) repräsentiert, wobei ak den bekannten Abstand zwischen den entsprechenden Sync-Puls-Segmenten Prk und Prk+1 repräsentiert und wobei der Wert des Skalierungs-Faktors s abgeleitet ist durch Bestimmen des Skalierungs-Faktor-Werts der, wenn mit jeden der Abstände ak multipliziert, in einer Sync-Punkt-Segmentfrequenz resultiert, die am genauesten der aktuellen Sync-Punkt-Segmentfrequenz ft gleich kommt (z. B. 7950 Hz).
  • Dann werden in Übereinstimmung mit Block 1020 die vorausgesagten Orte der Sync-Punkt-Segmente Pt1(pred), Pt2(pred)...PtM(pred) mit den Ist-Orten der Sync-Punkt-Segmente Pt1, Pt2...PtM verglichen. Genauer werden die vorausgesagten Abstände aks zwischen den vorausgesagten Sync-Punkt-Segmentorten Pt1(pred), Pt2(pred)...PtM(pred) verglichen mit den Abständen bk zwischen den Ist-Sync-Punkt-Segmentorten Pt1, Pt2...PtM. Bei einem solchen Vorgehen kann ein vorausgesagter Ortsfehler ek beispielsweise in Übereinstimmung mit Gleichung (8) berechnet werden. ek = |aks – bk| (8)
  • Dann wird wie in Block 1025 gezeigt der Fitness-Wert Dfitness aktualisiert. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung wird der aktualisierte Fitness-Wert Dfitness abgeleitet als eine Funktion des vorausgesagten Ortsfehlers ek, wie durch die untere Gleichung (9) gezeigt:
    Figure 00260001
    wobei T eine Transferfunktion ist, die Dfitnessdazu bringt, zwischen einem Wert von "0" und "1" wie in 12 gezeigt zu variieren, und wobei ein Fitness-Wert gleich „1" eine präzise Übereinstimmung zwischen den vorausgesagten Sync-Punkt-Segmentorten Pt1(pred), Pt2(pred)...PtM(pred) und die Ist-Sync-Punkt-Segmentorte Pt1, Pt2...PtM anzeigt.
  • Da die Sync-Punkt-Segmentfrequenz ft während jeder Iteration der in 10 dargestellten Technik erhöht wird, wird der Fitness-Wert Dfitness initial erhöht. Dieser wird maximal, wenn die Sync-Punkt-Segmentfrequenz ft gleich ist oder annähernd gleich ist mit der Sync-Puls-Segmentfrequenz fr. Danach wird der Fitness-Wert Dfitness abnehmen. Demzufolge kann der maximale Fitness-Wert Dfitness(max) identifiziert werden durch Bestimmen wenn der Fitness-Wert Dfitness maximal wird. Dies ist der Zweck es Entscheidungs-Blocks 1030. Im Genaueren ist der aktualisierte Fitness-Wert Dfitness in Übereinstimmung mit dem Entscheidungs-Block 1030 verglichen mit dem vorherigen Fitness-Werten, wobei eine Bestimmung durchgeführt wird, ob der aktualisierte Fitness-Wert kleiner ist als die vorherigen Fitness-Werte.
  • Wenn der aktualisierte Fitness-Wert Dfitness nicht kleiner ist als der vorgehende Fitness-Wert in Übereinstimmung mit dem „NO" Pfad aus dem Entscheidungs-Block 1030, der anzeigt, dass der vorherige Fitness-Wert nicht der maximale Fitness-Wert ist, wird die Sync-Punkt-Segmentfrequenz ft z. B. von 7950 Hz auf 7951 Hz wie in Block 1035 gezeigt erhöht. Dann wird eine Bestimmung durchgeführt, ob alle der Sync-Punkt-Segmentfrequenzen, z. B. alle der Frequenzen von 7950 Hz bis 8050 Hz, in Übereinstimmung mit dem Entscheidungs-Block 1040 evaluiert wurden. Wenn in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungs-Blocks 1040 alle der Sync-Punkt-Segmentfrequenzen nicht evaluiert wurden, werden die vorausgesagten Orte der Sync-Punkt-Segmente Pt1(pred), Pt2(pred)...PtM(pred) erneut berechnet basierend auf der neuen Sync-Punkt-Segmentfrequenz, die während der Ausführung des Blocks 1035 wie oben beschrieben erhöht wurde.
  • Ferner werden in Übereinstimmung mit der in 10 dargestellten Technik die prozeduralen Schritte, die mit den Blöcken 1015 bis 1040 verbunden sind, wiederholt ausgeführt bis der maximale Fitness-Wert Dfitness(max) identifiziert wurde, was passiert, wenn ein aktualisierter Fitness-Wert kleiner ist als der vorherige Fitness-Wert, in Übereinstimmung mit dem „JA"-Pfad des Entscheidungs-Blocks 1030, oder bis die Sync-Punkt-Segmentfrequenz ft die maximale Sync-Punkt-Segmentfrequenz ft(max) übersteigt, z. B. 8050 Hz in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungs-Block 1040. In jeden der Fälle wurde der maximale Fitness-Wert Dfitness(max) identifiziert.
  • Dann wird in Übereinstimmung mit dem Entscheidungs-Block 1045 eine Bestimmung durchgeführt, ob das Detektions-Flag auf den Zustand „JA" durch den Verzögerungs-Variations-Detektionsalgorithmus 905 gesetzt wurde. Wie zuvor erklärt wurde, wird das Detektions-Flag auf den Zustand „JA" gesetzt, wenn der Verzögerungs-Variations-Detektioinsalgorithmus 905 feststellt, dass der Gesamt-Sync-Punkt-Positionsfehler E kleiner ist als die Gesamt-Sync-Punkt-Positionsfehlergrenze TE und die Varianz V kleiner ist als die Varianz-Grenze TV. Wenn das Detektions-Flag in den „JA"-Zustand gesetzt wird, wird in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungsblock 1045 der maximale Fitness-Wert Dfitness(max) verglichen mit einer relativ niedrigen Fitness-Wert-Grenze TFL (z. B. 0,7). Wenn jedoch das Detektions-Flag nicht in den „JA"-Zustand gesetzt wird, wird in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungsblock 1045 der maximale Fitness-Wert Dfitness(max) verglichen mit einer relativ hohen Fitness-Wert-Grenze TFH (z. B. 0,9). Es ist verständlich, dass die Fitness-Wert-Grenzen TFL und TFH empirisch abgeleitet wurden.
  • Wenn festgestellt wurde, dass der maximale Fitness-Wert Dfitness(max) größer ist als die Fitness-Wert-Grenze TFL oder TFH, wird in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungs-Block 950 bzw. dem Entscheidungs-Block 960 der Grad der kontinuierlichen Verzögerungsvariation Δf, den die Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals aufweisen, wie in Block 1055 gezeigt, berechnet als eine Funktion der Sync-Punkt-Segmentfrequenz ft, die dem maximalen Fitness-Wert Dfitness(max) und der Sync-Puls-Segmentfrequenz fr wie in Gleichung (3) angedeutet berechnet. Wenn alternativ festgestellt wird, dass der maximale Fitness-Wert Dfitness(max) nicht größer ist als die Fitness-Wert-Grenze, wird in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungs-Block 1050 oder dem Entscheidungs-Block 1060 die kontinuierliche Verzögerungs-Variation Δf auf Null (0) gesetzt, womit die Wahrscheinlichkeit angezeigt wird, dass die kontinuierliche variable Verzögerung durch die Sync-Punkt-Segmente Pt1, Pt2...PtM entlang des Testsignals aufgewiesen werden.
  • Das vierte funktionale Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist ein Unstetigkeits-Berechnungsalgorithmus 720. Der Unstetigkeits-Berechnungsalgorithmus 720 berechnet den Ort einer Unstetigkeit beispielsweise entlang einer gegebenen Länge des Testsignals zwischen zwei Sync-Punkt-Segmenten als auch die Größe er Unstetigkeit.
  • In Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung beginnt der Unstetigkeits-Berechnungsalgorithmus 720 den Prozess der Berechnung des Orts und der Zeit einer Unstetigkeit zuerst durch Identifizieren eines Abschnitts des Testsignals, der einem Sync-Punkt-Segment vorausgeht, das identifiziert wurde als eine Unstetigkeit durch den Ausreißer-Identifikations- und Entfernungsalgorithmus 710, wie oben beschrieben. Beispielsweise kann der Unstetigkeits-Berechnungsalgorithmus 310 einen Abschnitt Ai des Testsignals identifizieren eine Unstetigkeit zu enthalten, wobei Ai begrenzt ist durch die Sync-Punkt-Segmente Pti und Pti+1, und wobei das Sync-Punkt-Segment Pti+1 identifiziert wurde als eine Unstetigkeit durch den Ausreißer-Identifikations- und Entfernungsalgorithmus. Als nächstes wird jede kontinuierliche Verzögerungsvariation Δf, die mit dem Abschnitt Ai verbunden ist, und die durch den kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715 bestimmt wurden, entfernt.
  • Das Sync-Punkt-Segment Pti, das dem Abschnitt Ai vorausgeht, wird dann mit dem Sync-Punkt-Segment Pri ausgerichtet, das einen entsprechenden Abschnitt ai in dem Referenzsignal vorausgeht, und ein spektraler Abstand zwischen dem Abschnitt Ai des Testsignals und dem Abschnitt ai des Referenzsignals wird erzeugt. 13 zeigt ein Diagramm B, das den spektralen Abstand zwischen einem Abschnitt Ai des Testsignals und einem entsprechenden Abschnitt ai des Referenzsignals repräsentiert, wobei die zwei Abschnitte Ai und ai wie oben beschrieben ausgerichtet wurden. Es ist von besonderer Wichtigkeit anzumerken, dass der spektrale Abstand anfangs klein ist, da der Abschnitt Ai des Testsignals und der Abschnitt ai des Referenzsignals an diesem Punkt synchronisiert sind. Dann macht der spektrale Abstand einen Übergang von relativ kleinen Werten zu relativ großen Werten wie gezeigt durch, wobei dieser Übergang zusammenfällt mit dem Auftreten einer Unstetigkeit. Der spektrale Abstand vergrößert sich an diesem Punkt, da der Abschnitt Ai des Testsignals und der Abschnitt ai des Referenzsignals aufgrund der Präsenz der Unstetigkeit nicht mehr synchronisiert sind.
  • Das Sync-Punkt-Segment Pti+1, das dem Abschnitt Ai folgt, wird dann mit dem Sync-Puls-Segment Pri+1 ausgerichtet, das dem entsprechendem Abschnitt ai folgt, und der spektrale Abstand zwischen dem Abschnitt ai des Testsignals und dem Abstand ai des Referenzsignals wird noch einmal erzeugt. 13 zeigt auch einen Graphen B, wobei der Graph B den spektralen Abstand zwischen einem Abschnitt Ai des Testsignals und einem entsprechenden Abschnitt ai des Referenzsignals repräsentiert, wobei die zwei Abschnitte Ai und ai mit Bezug auf das Sync-Punkt-Segment Pti+1 und dem Sync-Puls-Segment Pri+1 ausgerichtet wurden. Im Gegensatz zu dem Graph A sind die spektralen Abstandswerte in Graph B anfangs groß, da der Abschnitt Ai des Testsignals und der Abschnitt ai des Referenzsignals noch nicht synchronisiert sind, aufgrund der Präsenz der Unstetigkeit und aufgrund der Tatsache, dass der Abschnitt Ai des Testsignals und der Abschnitt ai des Referenzsignals ausgerichtet sind mit Bezug auf das Sync-Punkt-Segment Pti+1 und das Sync-Puls-Segment Pri+1. Dann durchläuft der spektrale Abstand wie gezeigt den Übergang zu einem relativ kleinen Wert, wobei der Übergang in diesem Beispiel zusammenfällt mit dem Ende der Unstetigkeit. Der spektrale Abstand bleibt dann ein relativ kleiner Wert, da der Abstand Ai des Testsignals und der Abstand ai des Referenzsignals nun synchronisiert sind.
  • Der Unstetigkeits-Berechnungsalgorithmus 720 kann dann den berechneten Ort L der Unstetigkeit entlang des Abschnitts Ai des Testsignals beispielsweise in Form einer Anzahl von Daten-Rahmen feststellen durch Berechnen der Differenz zwischen den spektralen Abstandswerten, die mit dem Graph A und den spektralen Abstandswerten, die mit dem Graph B, dem Graph C wie in 13 gezeigt verbunden sind. Die resultierende Differenz sollte dann einer Stufen-Funktion gleichen, wobei eine Region in der Nähe zu einem Null-Kreuzungspunkt den berechneten Ort L der Unstetigkeit entlang des Abschnitts Ai des Testsignals repräsentiert.
  • Der Unstetigkeits-Berechnungsalgorithmus 720 kann auch die berechnete Größe S der Unstetigkeit entlang des Abschnitts Ai bestimmen, z. B. in Form einer Anzahl von Daten-Rahmen durch Berechnen der Anzahl von Rahmen zwischen dem Auftreten der Unstetigkeit wie in Graph A gezeigt und dem Ende der Unstetigkeit wie in Graph B gezeigt. Die Größe S der Unstetigkeit ist in 13, Graph D, dargestellt.
  • 14 stellt detaillierter eine Technik dar, die verwendet werden kann zum Berechnen der Größe S der in 13 durch Graph D dargestellten Unstetigkeit. In 14 existiert eine Unstetigkeit zwischen den Sync-Punkt-Segmenten Pt1 und Pt2. Die Länge S der Unstetigkeit, die repräsentiert sein kann durch eine Anzahl von Samplen, kann berechnet werden durch Bestimmen der Differenz zwischen der Länge Dt entlang des Testsignals und der Länge Dt entlang des Referenzsignals. Natürlich sollte die Länge S eingestellt werden um jegliche kontinuierliche variable Verzögerung zu kompensieren.
  • Der Unstetigkeits-Berechnungsalgorithmus 720 kann natürlich den Ort L und die Größe S jeder Unstetigkeit berechnen. Demzufolge ist die Ausgabe des Unstetigkeits-Berechnungsalgorithmus 720 ein Vektor {(L1, S1); L2, S2)...} wobei jedes Vektorelement einen Unstetigkeits-Ort L und eine Unstetigkeits-Größe S enthält.
  • Wie oben erwähnt stellt das Vor-Bearbeitungsmodul 315 das Referenz- und/oder Testsignal so ein, dass sie in der Zeit-Domäne gleich skaliert sind. Das Vor-Bearbeitungsmodul 315 erreicht dies durch Entfernen aus dem Testsignal und/oder des Referenzsignals jedes Abschnitts, der mit einer intermittierenden Verzögerung verbunden ist (d. h. einer Unstetigkeit). Natürlich bildet das Vor-Bearbeitungsmodul 315 die Grundlage zum Entfernen von speziellen Abschnitten des Test- und/oder Referenzsignals, die mit einer intermittierenden Verzögerung verbunden sind, auf der Vektorinformation {(L1, S1); L2, S2)...}, die durch den Entscheidungsalgorithmus 310 und im Genaueren durch den Unstetigkeits-Berechnungsalgorithmus 720 produziert wurde. Des weiteren eliminiert das Vor-Bearbeitungsmodul 315 von dem Test- und/oder Referenzsignals jede kontinuierliche Verzögerungsvariation Δf, wobei die kontinuierliche Verzögerungsvariation Δf abgeleitet ist durch den kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715. Ein Standardsprach-Qualitäts-Berechnungsalgorithmus 320 kann dann eingesetzt werden, um eine genaue Sprachqualitätsberechnung basierend auf dem eingestellten Referenz- und/oder Testsignal abzuleiten.
  • Der Auswertungs-Einstellungsalgorithmus 325 erzeugt eine Messung von erkannter Sprachqualität. Der Auswertungs-Einstellungsalgorithmus 325 erzeugt diese erkannte Sprachqualitätsmessung durch Einstellen der Sprachqualitätsberechnung, die durch den Standardsprach-Qualitäts-Berechnungsalgorithmus 320 produziert wurde. Der Auswertungs-Einstellungsalgorithmus 325 stellt die Sprachqualitätsberechnung basierend auf jeder einen oder mehreren Variablen ein, die abgeleitet sind aus der kontinuierlichen und/oder intermittierenden Verzögerungsinformation, die durch den Entscheidungsalgorithmus 310 erzeugt wurden. Beispielsweise kann der Auswertungs-Einstellungsalgorithmus 325 die Sprachqualitätsberechnung einstellen basierend auf der Anzahl von Unstetigkeiten, die identifiziert wurden, der Länge jeder einen oder mehreren identifizierten Unstetigkeiten, dem Inhalt der Daten-Rahmen, die mit einer Unstetigkeit zusammenfallen oder dem Grad von kontinuierlicher variabler Verzögerung.
  • Es ist anzumerken, dass die vorliegende Erfindung beschrieben wurde in Übereinstimmung mit exemplarischen Ausführungsformen, die in allen Aspekten darstellend aber nicht begrenzend sind. Somit ist die vorliegende Erfindung in vielen Variationen mit detaillierten Ausführungsformen möglich, die abgeleitet werden können aus der Beschreibung, die hier durch einen Fachmann enthalten sind. All solche Variationen sind innerhalb des Bereichs der vorliegenden Erfindung, die lediglich durch die folgenden Ansprüche limitiert ist.

Claims (32)

  1. Ein Verfahren zum Berechnen von Sprachqualität, umfassend die Schritte: Identifizieren von Teilen eines ersten Sprachsignals, das durch Übertragungsverzögerungen verursachte Verzerrungen aufweist; Entfernen der identifizierten Teile von dem ersten Sprachsignal; Vergleichen des ersten Sprachsignals mit einem zweiten Sprachsignal, nachdem die identifizierten Teile von dem ersten Sprachsignal entfernt wurden; und Erzeugen einer Sprachqualitätsberechnung basierend auf dem Vergleich des ersten Sprachsignals mit dem zweiten Sprachsignal.
  2. Das Verfahren nach Anspruch 1 ferner umfassend die Schritte: Analysieren der identifizierten Teile des ersten Sprachsignals; und Anpassen der Sprachqualitätsberechnung basierend auf der Analyse der identifizierten Teile des ersten Sprachsignals.
  3. Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln, wie viele Teile des ersten Sprachsignals durch Übertragungsverzögerung verursachte Verzerrungen aufweisen.
  4. Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln der Größe der identifizierten Teile des ersten Sprachsignals.
  5. Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln des Sprachinhalts der identifizierten Teile des ersten Sprachsignals.
  6. Das Verfahren nach Anspruch 1, wobei das zweite Sprachsignal ein Referenzsprachsignal ist, und wobei das Referenzsprachsignal das erste Sprachsignal vor der Übertragung des ersten Sprachsignals reflektiert.
  7. Das Verfahren nach Anspruch 1 für ein Telekommunikationsnetz, in dessen Netz das erste Sprachsignal über eine Übertragungskette zu einer empfangenden Einheit transportiert wird, wobei das zweite Sprachsignal ein Referenzsignal ist, wobei der Schritt des Identifizieren umfasst: Ausrichten jedes einer Anzahl von Synchronisationspunkten entlang des ersten Sprachsignals mit einem entsprechenden einer Anzahl von Synchronisationspunkten entlang des Referenzsprachsignals an der empfangenden Einheit; Ermitteln, basierend auf der Ausrichtung der Synchronisationspunkte entlang des ersten Sprachsignals und den Synchronisationspunkte entlang des Referenzsprachsignals, ob Teile des ersten Sprachsignals eine intermittierende Verzögerungsvariation reflektieren; Ermitteln eines Grades der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist; wobei der Schritt zum Entfernen umfasst: Anpassen des ersten Sprachsignals oder des Referenzsprachsignals, um den Grad der von dem ersten Sprachsignal aufgewiesenen kontinuierlichen Verzögerungsvariation und einen Teil des ersten Sprachsignals, der eine intermittierende Verzögerungsvariation reflektiert, zu berücksichtigen.
  8. Das Verfahren nach Anspruch 7, ferner umfassend den Schritt: Anpassen der berechneten Sprachqualität basierend auf dem Grad der kontinuierlichen Verzögerungsvariation.
  9. Das Verfahren nach Anspruch 7, ferner umfassend die Schritte: Analysieren von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektiert; und Anpassen der berechneten Sprachqualität basierend auf der Analyse der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
  10. Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst: Ermitteln der Zahl von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
  11. Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst Ermitteln der Länge der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
  12. Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst: Ermitteln des Sprachinhalts der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
  13. Das Verfahren nach Anspruch 7, wobei das erste Sprachsignal ein Testsignal ist, und wobei das erste Sprachsignal vor der Übertragung mit dem Referenzsprachsignal identisch ist.
  14. Das Verfahren nach Anspruch 1 für ein paketgeschaltetes Telekommunikationsnetz, wobei Sprachsignale über eine Übertragungskette zu einer Empf angseinheit transportiert werden, wobei das zweite Signal ein Referenzsignal ist, wobei der Schritt des Identifizierens umfasst: Ausrichten jedes einer Anzahl von Sync-Punkt-Segmenten entlang eines ersten Sprachsignals mit einem entsprechenden Sync-Puls-Segment entlang des Referenzsprachsignals, wobei das erste Sprachsignal über die Übertragungskette zu der Empfangseinheit transportiert wurde, und wobei das Referenzsignal mit dem ersten Sprachsignal identisch ist, bevor das erste Sprachsignal über die Übertragungskette transportiert wurde; Identifizieren, ob eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals existiert; Ermitteln eines Standortes und Größe von jeder identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals; Ermitteln eines Grades von kontinuierlicher Verzögerungsvariation, die das erste Sprachsignal aufweist; wobei der Schritt des Entfernens umfasst: Anpassen des ersten Sprachsignals oder des Referenzsprachsignals, um die Präsenz von einer intermittierenden Verzögerungsvariation und des Grades von kontinuierlicher Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen; und dessen Verfahren ferner den Schritt umfasst: Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erreichen, wobei die Anpassung der berechneten Sprachqualität, wenn überhaupt, auf den intermittierenden Verzögerungsvariationen basiert und dem Grad der kontinuierlichen Verzögerungsvariation.
  15. Das Verfahren nach Anspruch 14, wobei der Schritt des Identifizierens, ob eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals existiert, die Schritte umfasst: Bewerten der Länge des ersten Sprachsignals zwischen jedem Paar angrenzender Sync-Punkt-Segmente; Ermitteln, ob die Länge des ersten Sprachsignals zwischen einem Paar von angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist; und Einrichten, dass eine intermittierende Verzögerungsvariation entlang des ersten Sprachsignals, zwischen zwei angrenzenden Sync-Punkt-Segmenten, vorhanden ist, wenn ermittelt ist, dass die Länge zwischen zwei angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist.
  16. Das Verfahren nach Anspruch 15, wobei der Schritt des Ermittelns, ob die Länge des ersten Sprachsignals zwischen einem Paar von angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist die Schritte umfasst: Ermitteln der Differenz zwischen der Länge des ersten Sprachsignals zwischen jedem Paar von angrenzenden Sync-Punk-Segmenten und der Länge des Referenzsprachsignals zwischen jedem entsprechenden Paar von angrenzenden Sync-Punkt-Segmenten; und Vergleichen jedes Differenzwertes zu dem Schwellenwert.
  17. Das Verfahren nach Anspruch 16, wobei der Schwellenwert auf einen gewichteten Median der Differenzwerte basiert.
  18. Das Verfahren nach Anspruch 16, wobei der Schwellenwert empirisch abgeleitet ist.
  19. Das Verfahren nach Anspruch 14, wobei der Schritt des Ermittelns eines Standortes und Größe einer identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals die Schritte umfasst: Ausrichten einer Länge des ersten Sprachsignals zwischen zwei angrenzenden Sync-Punkt-Segmenten, das identifiziert wurde, eine intermittierende Verzögerung aufzuweisen, mit einer Länge entlang des Referenzsignals zwischen zwei entsprechenden angrenzenden Sync-Punkt-Segmenten, wobei beim Ausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten und der Länge des Referenzsprachsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten ein erstes der zwei angrenzenden Sync-Punkt-Segmente mit einem entsprechenden der beiden Sync-Punkt-Segmente ausgerichtet wird; Ableiten einer ersten Serie von spektralen Abstandswerten basierend auf der Ausrichtung der Länge des ersten Sprachsignals und der Länge entlang des Referenzsignals; Nachausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten mit der Länge entlang des Referenzsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten, wobei beim Nachausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten und der Länge des Referenzsprachsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten eine zweite der zwei angrenzenden Sync-Punkt-Segmenten mit einer zweiten der zwei entsprechenden Sync-Punkt-Segmenten nachträglich ausgerichtet wird; und Ableiten einer zweiten Serie von spektralen Abstandswerten basierend auf dem Nachausrichten der Länge des ersten Sprachsignals und der Länge entlang des Referenzsignals.
  20. Das Verfahren nach Anspruch 19, wobei der Schritt des Ermittelns des Standortes und Größe einer identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals ferner die Schritte umfasst: Vergleichen der ersten Serie der spektralen Abstandwerte mit der zweiten Serie der spektralen Abstandwerte; und Messen eines Abstandes zwischen einem mit der ersten Serie von spektralen Abstandswerten verbundenen Übergang und einem mit der zweiten Serie von spektralen Abstandswerten verbundenen Übergang, wobei der gemessene Abstand die Größe einer entsprechenden intermittierenden Verzögerungsvariation darstellt.
  21. Das Verfahren nach Anspruch 19, wobei der Schritt des Ermittelns des Standortes und Größe einer identifizierten Verzögerungsvariation entlang des ersten Sprachsignals ferner die Schritte umfasst: Ableiten einer Serie von Differenzwerten durch Berechnen der Differenz zwischen jedem der Werte, die mit der ersten Serie von spektralen Abstandswerten verbunden ist, und einem entsprechenden Wert, der mit der zweiten Serie von spektralen Abstandswerten verbunden ist; und Ermitteln des Standortes einer entsprechenden intermittierenden Verzögerungsvariation basierend auf einem Übergang, der mit der Serie von Differentwerten verbunden ist.
  22. Das Verfahren nach Anspruch 14, wobei der Schritt des Ermittelns des Grades der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist, die Schritte umfasst: Auswählen einer Anzahl von Sync-Punkt-Frequenzen, die mit den Sync-Punkt-Segmenten entlang des ersten Sprachsignals verbunden sind, wobei die selektierte Anzahl von Sync-Punkt-Frequenzen Frequenzen beinhaltet, die kleiner sind als eine mit den Sync-Puls-Segmenten entlang des Referenzsignals verbundenen Sync-Puls-Frequenz, und Frequenzen, die größer sind als die Sync-Puls-Frequenz; für jede der ausgewählten Sync-Punkt-Frequenzen, Vorausberechen eines Standortes für jedes Sync-Punkt-Segment entlang des ersten Sprachsignals als eine Funktion der ausgewählten Sync-Punkt-Frequenz und bekannten Standortes der Sync-Puls-Segmente entlang des Referenzsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Vergleichen des vorausberechneten Standortes von jedem Sync-Punkt-Segment entlang des ersten Sprachsignals mit einem tatsächlichen Standort des Sync-Punkt-Segmentes entlang des ersten Sprachsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Vergleichen des vorausberechneten Standortes für jedes Sync-Punkt-Segment entlang des ersten Sprachsignals mit einem tatsächlichen Standort des Sync-Punkt-Segmentes entlang des ersten Sprachsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Ableiten eines Tauglichkeitswertes, wobei der Tauglichkeitswert auf einen Betrag des Standortfehlers zwischen dem vorhergesagten Standort jedes Sync-Punkt-Segmentes und dem tatsächlichen Standort des Sync-Punkt-Segmentes basiert; Identifizieren eines maximalen Tauglichkeitswertes unter den Tauglichkeitswerten, die für jede der selektierten Sync-Punkt-Frequenzen abgeleitet wurde; Ermitteln, ob der maximale Tauglichkeitswert einen Schwellenwert überschreitet; und Ermitteln des Grades der kontinuierlichen Verzögerungsvariationen als eine Funktion der ausgewählten Sync-Punkt-Frequenzen, die mit dem maximalen Tauglichkeitsswert und der Sync-Puls-Frequenz verbunden sind.
  23. Das Verfahren nach Anspruch 22, ferner den Schritt umfassend: Bestimmen des Grades der kontinuierlichen Verzögerungsvariation zu Null, wenn der maximale Tauglichkeitswert den Schwellenwert überschreitet.
  24. Das Verfahren nach Anspruch 22, ferner den Schritt umfassend: vor Auswählen der Anzahl von Sync-Punkt-Frequenzen Ermitteln, ob es am wahrscheinlichsten ist, dass das erste Sprachsignal eine kontinuierliche Verzögerungsvariation aufweist.
  25. Das Verfahren nach Anspruch 24, wobei der Schritt des Ermittelns, ob der maximale Tauglichkeitswert den Schwellenwert überschreitet, den Schritt umfasst: Vergleichen des maximalen Tauglichkeitswertes mit einem ersten Schwellenwert, wenn ermittelt wurde, dass das erste Sprachsignal am wahrscheinlichsten eine kontinuierlich Verzögerungsvariation aufweist, und mit einem zweiten Schwellenwert, wenn ermittelt wurde, dass das erste Sprachsignal unwahrscheinlich eine kontinuierliche Verzögerungsvariation aufweisen wird, wobei der erste Schwellenwert kleiner ist als der zweite Schwellenwert.
  26. Das Verfahren nach Anspruch 14, ferner den Schritt umfassend: Identifizieren einer Anzahl von Sync-Punkt-Segmenten, wobei jedes, das einer Länge entlang des ersten Sprachsignals folgt, am wahrscheinlichsten eine intermittierende Verzögerungsvariation reflektiert.
  27. Das Verfahren nach Anspruch 26, wobei der Schritt des Ermittelns des Grades der kontinuierlichen Verzögerungsvariation, die das ersten Sprachsignal aufweist, auf einem Standort von jedem Sync-Punkt-Segment entlang des ersten Sprachsignals basiert, ausschließlich der Sync-Punkt-Segmente, die identifiziert wurden, einer Länge entlang des ersten Sprachsignals, das am wahrscheinlichsten eine intermittierende Verzögerungsvariation reflektiert, zu folgen.
  28. Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der abgeschätzten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, die Schritte umfasst: Ermitteln der Anzahl der intermittierenden Verzögerungsvariationen, die das erste Sprachsignal aufweist; und Anpassen der abgeschätzten Sprachqualität als eine Funktion der Anzahl der intermittierenden Verzögerungsvariationen, die das erste Sprachsignal aufweist.
  29. Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion der Größe von jeder intermittierenden Verzögerungsvariation.
  30. Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion des mit jeder Verzögerungsvariation verbundenen Sprachinhaltes.
  31. Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion des Ausmaßes und der Art der kontinuierlichen Verzögerungsvariation.
  32. Das Verfahren nach Anspruch 14, wobei der Schritt des Anpassens des ersten Sprachsignals oder des Referenzsprachsignals, um die Präsenz einer intermittierenden Verzögerungsvariation und des Grades der kontinuierlichen Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen, den Schritt umfasst: Skalieren des ersten Sprachsignals oder des Referenzsprachsignals, so dass das erste Sprachsignal und das Referenzsprachsignal gleichermaßen in dem Zeitbereich skaliert sind.
DE60026058T 1999-10-29 2000-10-24 Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität Expired - Lifetime DE60026058T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16215399P 1999-10-29 1999-10-29
US162153P 1999-10-29
US512750 2000-02-25
US09/512,750 US6499009B1 (en) 1999-10-29 2000-02-25 Handling variable delay in objective speech quality assessment
PCT/SE2000/002068 WO2001031638A1 (en) 1999-10-29 2000-10-24 Handling variable delay in objective speech quality assessment

Publications (2)

Publication Number Publication Date
DE60026058D1 DE60026058D1 (de) 2006-04-20
DE60026058T2 true DE60026058T2 (de) 2006-09-28

Family

ID=26858488

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60026058T Expired - Lifetime DE60026058T2 (de) 1999-10-29 2000-10-24 Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität

Country Status (5)

Country Link
US (1) US6499009B1 (de)
EP (1) EP1226577B1 (de)
AU (1) AU1319801A (de)
DE (1) DE60026058T2 (de)
WO (1) WO2001031638A1 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
GB2359216B (en) * 2000-02-11 2003-10-29 Purple Voice Ltd A method of synchronising the replay of audio data in a network of computers
AU2003212540A1 (en) * 2002-03-22 2003-10-08 British Telecommunications Public Limited Company Anomaly recognition method for data streams
DE60303138T2 (de) 2002-03-22 2006-08-31 British Telecommunications P.L.C. Vergleichen von mustern
GB0229625D0 (en) 2002-12-19 2003-01-22 British Telecomm Searching images
GB0328326D0 (en) 2003-12-05 2004-01-07 British Telecomm Image processing
DE602005008993D1 (de) 2004-09-17 2008-09-25 British Telecomm Public Ltd Co Analyse von mustern
EP1732030A1 (de) 2005-06-10 2006-12-13 BRITISH TELECOMMUNICATIONS public limited company Mustervergleich
CN101248457B (zh) * 2005-07-28 2011-07-27 英国电讯有限公司 图像分析方法
EP1798961A1 (de) * 2005-12-19 2007-06-20 BRITISH TELECOMMUNICATIONS public limited company Fokussierungsverfahren
US8243599B2 (en) * 2006-11-01 2012-08-14 Cisco Technology, Inc. Method and apparatus for high resolution passive network latency measurement
EP1918909B1 (de) 2006-11-03 2010-07-07 Psytechnics Ltd Abtastfehlerkompensation
DE102009030318B4 (de) 2009-06-24 2012-09-06 Opticom Dipl.-Ing. Michael Keyhl Gmbh Vorrichtung und Verfahren zur Bestimmung eines Abtastratenunterschiedes
CN107978324B (zh) * 2016-10-25 2020-10-09 中国移动通信集团广东有限公司 一种无线语音质量评估方法及装置
CN109903752B (zh) * 2018-05-28 2021-04-20 华为技术有限公司 对齐语音的方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890104A (en) * 1992-06-24 1999-03-30 British Telecommunications Public Limited Company Method and apparatus for testing telecommunications equipment using a reduced redundancy test signal
CH686752A8 (de) 1993-09-22 1996-08-15 Ascom Tech Ag Berner Technopark Verfahren zum Beurteilen der Übertragungsqualität einer Sprach-Übertragungsstrecke
NL9500512A (nl) * 1995-03-15 1996-10-01 Nederland Ptt Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal.
CA2148340C (en) * 1995-05-01 2004-12-07 Gianni Di Pietro Method and apparatus for automatically and reproducibly rating the transmission quality of a speech transmission system
US5682384A (en) * 1995-10-31 1997-10-28 Panagiotis N. Zarros Apparatus and methods achieving multiparty synchronization for real-time network application
US5912701A (en) * 1997-05-09 1999-06-15 At&T Corp. Arrangement for measuring and controlling temporal relationships between channels of a multimedia communication system
EP0946015B1 (de) 1998-03-27 2007-10-17 Ascom (Schweiz) AG Verfahren und Vorrichtung zur Beurteilung der Übertragungsqualität
US6349286B2 (en) * 1998-09-03 2002-02-19 Siemens Information And Communications Network, Inc. System and method for automatic synchronization for multimedia presentations
US6259677B1 (en) * 1998-09-30 2001-07-10 Cisco Technology, Inc. Clock synchronization and dynamic jitter management for voice over IP and real-time data

Also Published As

Publication number Publication date
DE60026058D1 (de) 2006-04-20
WO2001031638A1 (en) 2001-05-03
AU1319801A (en) 2001-05-08
EP1226577A1 (de) 2002-07-31
US6499009B1 (en) 2002-12-24
EP1226577B1 (de) 2006-02-15

Similar Documents

Publication Publication Date Title
DE60026058T2 (de) Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität
DE69913262T2 (de) Vorrichtung und verfahren zur anpassung der rauschschwelle zur sprachaktivitätsdetektion in einer nichtstationären geräuschumgebung
DE69831288T2 (de) An Umgebungsgeräusche angepasste Sprachverarbeitung
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE3101851C2 (de) Vorrichtung zum Erkennen von Sprache
DE68910859T2 (de) Detektion für die Anwesenheit eines Sprachsignals.
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE60126274T2 (de) Dynamische dienstqualität überwachung
DE60035705T2 (de) Verfahren und vorrichtung zur messung von dienstgüte (qos)
DE60125219T2 (de) Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder
DE4126902A1 (de) Sprachintervall - feststelleinheit
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69920461T2 (de) Verfahren und Vorrichtung zur robusten Merkmalsextraktion für die Spracherkennung
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE60122751T2 (de) Verfahren und vorrichtung für die objektive bewertung der sprachqualität ohne referenzsignal
DE60205232T2 (de) Verfahren und vorrichtung zur bestimmung der qualität eines sprachsignals
DE2919085A1 (de) Vorverarbeitungsverfahren und -vorrichtung fuer eine spracherkennungsvorrichtung
WO2010037713A1 (de) Verfahren zur fehlerverdeckung bei fehlerhafter übertragung von sprachdaten
DE602004010634T2 (de) Verfahren und system zur sprachqualitätsvorhersage eines audioübertragungssystems
DE60311754T2 (de) Verfahren und Vorrichtung zur Schätzung der Gesamtgüte eines Sprachsignals
DE2636032A1 (de) Schaltungsanordnung zum extrahieren der grundfrequenz aus einem sprachsignal
DE60222770T2 (de) Verbessertes verfahren zur ermittlung der qualität eines sprachsignals
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
EP2064898B1 (de) Vorrichtung zum bestimmen von informationen zur zeitlichen ausrichtung zweier informationssignale
DE60300267T2 (de) Verfahren und Vorrichtung zur multi-referenz Korrektur der durch ein Kommunikationsnetzwerk verursachten spektralen Sprachverzerrungen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition