DE60026058T2

DE60026058T2 - Verarbeitung von variabler verzögerung für objektives ermitteln der sprachqualität

Info

Publication number: DE60026058T2
Application number: DE60026058T
Authority: DE
Inventors: Anders Karlsson; Jonas Lundberg; Arne Steinarson
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 1999-10-29
Filing date: 2000-10-24
Publication date: 2006-09-28
Anticipated expiration: 2020-10-25
Also published as: DE60026058D1; WO2001031638A1; AU1319801A; EP1226577A1; US6499009B1; EP1226577B1

Description

Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf das Gebiet der Telekommunikation. Im genaueren bezieht sich die vorliegende Erfindung auf das Berechnen der Qualität eines Sprachsignals.
Hintergrund
In einem konventionellen Telekommunikationssystem kann die Übertragungskette, über die ein Sprachsignal (z. B. ein Signal, das einen gesprochenen Satz transportiert) übergeben werden muss, Sprach-Codierer, Sprach-Decoder, eine Luft-Schnittstelle, öffentlich geschaltete Telefonnetz (PSTN) Verbindungen, Computernetzverbindungen, Empfangs-Pufferung, Signalbearbeitungslogik und/oder Playbackausrüstung enthalten. Der Fachmann versteht leicht, dass jedes dieser Elemente, die die Übertragungskette bilden, das Sprachsignal verzerren kann. Das Berechnen der Qualität von Sprachsignalen ist wichtig, um zu Gewährleisten, dass die Sprachqualität einen minimal akzeptablen Standard übersteigt, so dass Sprachsignale durch den Hörer gehört und verstanden werden können.
Typischerweise beinhaltet das Berechnen von Sprachqualität die Übertragung eines Referenz-Sprachsignals (hier bezeichnet als „Referenzsignal") über eine Übertragungskette zu einer Empfangseinheit. Das empfangene Signal, das durch die verschiedenen Elemente verzerrt wurde, die die Übertragungskette bilden, wird hier als das Testsignal bezeichnet. Das Testsignal und das originale Referenzsignal werden dann zu einem Sprachqualitätsrechnungsalgorithmus weitergeleitet.
Es gibt eine Anzahl von konventionellen Sprachqualitätsberechnungsalgorithmen. Meistens wird jedoch die selbe grundlegende Technik, die in 1 dargestellt ist, verwendet. Wie gezeigt, werden ein Referenzsignal 105 und ein Testsignal 110 in N von Kurzzeitrahmen (z. B. jeweils 20 msec.) aufgeteilt. Eine neue Darstellung, so wie eine Frequenz-Darstellung, wird dann für jeden der N Zeitrahmen, die mit dem Referenzsignal 105 verbunden sind, und jeden der N Zeitrahmen, die mit dem Testsignal 110 verbunden sind, abgeleitet. Ein Differenz-Vektor, der N Zeitrahmen umfasst, wird dann abgeleitet durch Vergleichen der Darstellungen, die mit jedem der N Zeitrahmen des Referenzsignals 105 verbunden sind, mit der entsprechenden Darstellung, die mit dem Testsignal 110 verbunden ist. Der Vergleich könnte durchgeführt werden durch Subtrahieren der entsprechenden Darstellungen auf einer Rahmen-für-Rahmen Basis. Für jeden Rahmen kann die Differenz zwischen den entsprechenden Darstellungen aufsummiert werden, so dass eine einzelne Verzerrungs-Metrik jeder der N Zeitrahmen abgeleitet wird. Die N Verzerrungs-Metriken können dann gemittelt werden, wobei der Mittelwert verwendet werden kann als die Messung einer Gesamtsignalverzerrung oder Sprachqualität.
Ein Problem mit der oben bezeichneten Sprachqualitätsrechnungstechnik ist, dass diese hochsensibel bezüglich Zeitverschiebungen ist, (z. B. Übertragungsverzögerungen); umso größer die Zeitverschiebung wird, desto unzuverlässiger ist die Sprachqualitätsberechnung. In einem Ansatz um dieses Problem zu vermeiden, gleichen konventionelle Sprachqualitätsberechnungsalgorithmen das Referenzsignal und das Testsignal an, bevor die Sprachqualitätsberechnung durchgeführt wird, wie in 2 dargestellt. Natürlich gibt es genau wie es eine Anzahl von konventionellen Ansätzen der Berechnung von Sprachqualität gibt, auch eine Anzahl von konventionellen Techniken zum Abgleichen eines Referenzsignals und eines Testsignals.
Wie in 2 dargestellt verwendet eine solche Technik zum Abgleichen eines Referenzsignals und eines Testsignals einen bekannten, berechneten „globalen" Verzögerungsfaktor. In Übereinstimmung mit dieser Technik wird das Testsignal oder das Referenzsignal in der Zeit-Domäne durch einen Betrag verschoben, der äquivalent ist mit einer berechneten globalen Verzögerung. Danach können die zwei Signale in den Sprachqualitätsberechnungsalgorithmus eingespeist werden. Eine andere gut bekannte Technik zum Abgleichen eines Referenzsignals und eines Testsignals bezieht iteratives Abgleichen der zwei Signale in der Zeit-Domäne ein, bis eine Kreuz-Korrelationsmessung oder andere vergleichbare Metriken maximiert sind. Eine weitere andere Technik bezieht das Übertragen eines Referenzsignals und zusätzlich Informationen ein, die einen oder mehrere Teile des Signals identifizieren durch z. B. Einfügen von sinusförmigen Signalen oder Chirps (Zirpen) in das Referenzsignal. Demzufolge können diese eine oder mehrere Anteile des Testsignals einfacher erkannt und mit den entsprechenden Teilen des Referenzsignals abgeglichen werden.
Jede der oben bezeichneten Techniken zum Abgleichen eines Referenzsignals und eines Testsignals setzen jedoch voraus, dass die Verzögerung, die durch die verschiedenen Komponenten eingeführt wird, die die Übertragungskette aufbauen, eine feste Verzögerung ist, oder eine Verzögerung ist, die sich langsam mit der Zeit verändert, so dass periodische Resynchronisation möglich ist. In anderen Worten wird vorausgesetzt, dass eine konstante Zeitverschiebung zwischen dem Referenzsignal und dem Testsignal existiert. Ein Beispiel ist beschrieben in Tallack et. al. „Time delay Estimation for Objective Quality Evaluation of Low Bit-Rate Coded Speech with Noisy Channel Conitions", ASILOMAR Conf. 1993, Seite 1216–1219. Während dies zutreffen kann für leitungsvermittelte Netze, sind Übertragungsverzögerungen selten fest oder konstant in paketvermittelten Netzen, z. B. Internetprotokoll (IP) basierten Netzen. Z. B. variieren in virtuellen, komplett paketgeschalteten Netzszenarien die Übertragungsverzögerungen mit der Verkehrsauslastung (d. h. dem Grad der Blockierung in dem Netz). Da sich die Verkehrsauslastung im Allgemeinen auf einer kontinuierlichen Basis verändert, kann sich die Übertragungsverzögerung, die durch ein einzelnes Sprachsignal, das das Netzwerk durchläuft, erfahren wird, verändern. Wenn diese variablen Übertragungsverzögerungen unentdeckt bleiben, können das Referenzsignal und das Testsignal nicht genau abgeglichen werden, und der Sprachqualitätsberechnungsalgorithmus kann möglicherweise eine genaue Sprachqualitätsberechnung nicht durchführen. Des weiteren kann die Verwendung von kostengünstigen Personalcomputersystemen als Kommunikationsvorrichtungen zu einem Sprachsignal beisteuern, das variable Verzögerungen erfährt.
Zusammenfassung der Erfindung
Die vorliegende Erfindung bindet eine Sprachqualitätsberechnungstechnik ein, die die Verwendung eines beliebigen Sprachqualitätsberechnungsalgorithmus erlaubt. Im Allgemeinen analysiert die vorliegende Erfindung das Referenzsignal und das Testsignal und identifiziert basierend auf dieser Analyse Verzögerungsvariationen und/oder Unstetigkeiten im Testsignal, so denn welche vorhanden sind. Diese Teile des Testsignals werden dann entfernt, so dass das Referenzsignal und das Testsignal bezüglich der Zeit gleich skaliert sind. Das Referenzsignal und das Testsignal werden dann zu einem Standardqualitätsberechnungsalgorithmus weitergeleitet. Die resultierende Sprachqualitätsberechnung wird dann basierend auf einer Analyse der Teile des Testsignals, die zuvor entfernt wurden, eingestellt.
Es ist demzufolge eine Ziel der vorliegenden Erfindung, eine Sprachqualitätsberechnungstechnik bereitzustellen, die in der Lage ist, Sprachqualität trotz der Präsenz von variablen Übertragungsverzögerungen, die kontinuierliche und intermittierende variable Übertragungsverzögerungen beinhalten, zu bewerten.
Es ist ein anderes Ziel der vorliegenden Erfindung, die Verhinderung der Verwendung von Standardsprachqualitätsberechnungsalgorithmen aufgrund der Präsenz von variablen Übertragungsverzögerungen zu verhindern.
In Übereinstimmung mit dem ersten Ziel der vorliegenden Erfindung wird das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität erreicht. Das Verfahren bindet das Identifizieren von Teilen eines ersten Sprachsignals ein, das durch Übertragungsverzögerungen verursachte Verzerrungen aufweist. Die identifizierten Teile werden dann aus dem Sprachsignal entfernt und das erste Sprachsignal wird mit einem zweiten Sprachsignal verglichen. Eine Sprachqualitätsberechnung wird dann basierend auf dem Vergleich des ersten Sprachsignals mit dem zweiten Sprachsignal erzeugt.
In Übereinstimmung mit einem zweiten Aspekt der vorliegenden Erfindung werden das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität in einem Telekommunikationsnetz erreicht, wobei ein erstes Sprachsignal über eine Übertragungskette zu einer empfangenden Einheit transportiert wird. Das Verfahren involviert an der empfangenen Einheit das Ausrichten jedes einer Anzahl von Synchronisationspunkten entlang des ersten Sprachsignals mit einem entsprechenden einer Anzahl von Synchronisationspunkten entlang des Referenzsprachsignals. Dann wird eine Ermittlung durchgeführt, ob irgendwelche Teile des ersten Sprachsignals eine intermittierende Verzögerungsvariation basierend auf der Ausrichtung der Synchronisationspunkte entlang des ersten Sprachsignals und des Referenzsprachsignals reflektiert. Dann wird der Grad der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist, ermittelt, und dann wird das erste Sprachsignal oder der Referenzsignal angepasst, um den Grad der von dem ersten Sprachsignal aufgewiesenen kontinuierlichen Verzögerungsvariation als auch für jeden Teil des ersten Sprachsignals, der eine intermittierende Verzögerungsvariation reflektiert, zu berücksichtigen. Das erste Sprachsignal wird dann mit dem Referenzsignal verglichen, und darauf basierend wird die Sprachqualität berechnet.
In Übereinstimmung mit einem dritten Aspekt der vorliegenden Erfindung werden das oben beschriebene und andere Ziele durch ein Verfahren zur Berechnung der Sprachqualität in einem paketgeschalteten Telekommunikationsnetz erreicht, wobei Sprachsignale über eine Übertragungskette zu einer Empfangseinheit transportiert werden. Das Verfahren involviert das Ausrichten jedes einer Anzahl von Syric-Punkt-Segmenten entlang eines ersten Sprachsignals mit einem entsprechenden Sync-Puls-Segment entlang eines Referenzsprachsignals, wobei das erste Sprachsignal über die Übertragungskette zu der Empfangseinheit transportiert wurde, und wobei das Referenzsignal mit dem ersten Sprachsignal identisch ist, bevor das erste Sprachsignal über die Übertragungskette transportiert wurde. Nach dem Ausrichten der Sync-Punkt-Segmente entlang des ersten Sprachsignals und der Sync-Puls-Segmente entlang des Referenzsprachsignals wird eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals identifiziert, unter der Annahme dass eine existiert. Als nächstes wird der Standort und Größe von jeder identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals als auch jeder Grad von kontinuierlicher Verzögerungsvariation, die das erste Sprachsignal aufweist, ermittelt. Das erste Sprachsignal oder das Referenzsprachsignal wird dann angepasst, um die Präsenz von einer intermittierenden Verzögerungsvariation und des Grades von kontinuierlicher Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen. Das erste Sprachsignal wird dann mit dem Referenzsignal verglichen und die Sprachqualität wird basierend auf den Vergleich des ersten Sprachsignals mit dem Referenzsignal berechnet. Schließlich wird die berechnete Sprachqualität angepasst, um eine anerkannte Sprachqualität zu erreichen, wobei die Anpassung der berechneten Sprachqualität, wenn überhaupt, auf den intermittierenden Verzögerungsvariationen basiert und dem Grad der kontinuierlichen Verzögerungsvariation.
Kurze Beschreibung der Figuren
Die Ziele und Vorteile der vorliegenden Erfindung werden verständlich durch Lesen der folgenden detaillierten Beschreibung in Verbindung mit den Zeichnungen in denen:
1 die grundlegende Technik darstellt, die durch konventionelle Sprachqualitätsberechnungsalgorithmen angewendet wird;
2 eine Technik zum Anpassen eines Referenzsignals und eines Testsignals vor der Durchführung von Sprachqualitätsberechnung in Übereinstimmung mit konventionellen Sprachqualitätsberechnungsalgorithmen darstellt;
3 einen Überblick über die Sprachqualitätsberechnungstechnik in Übereinstimmung mit exemplarischen Ausführungsformen der vorliegenden Erfindung bereitstellt;
4 einen Überblick eines exemplarischen Synchronisationsalgorithmus bereitstellt;
5 ein Flussdiagramm ist, das die grundlegenden Schritte, die mit den oben erwähnten exemplarischen Synchronisationsalgorithmus verbunden sind, darstellt;
6 eine Abbildung zwischen jedem der sieben exemplarischen Sync-Puls-Segmente entlang eines Referenzsignals und eines verbundenen von sieben Sync-Punkt-Segmenten entlang eines Testsignals darstellt;
7 die elementaren funktionalen Elemente des Entscheidungsalgorithmus in Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellt;
8 eine Abbildung zwischen jedem der 10 Sync-Puls-Segmente entlang eines Referenzsignals und jedes der 10 verbundnen Sync-Punkt-Segmente entlang eines Testsignals darstellt;
9 den kontinuierlichen Verzögerungsvariationsberechnungsalgorithmus in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung darstellt;
10 eine Technik zum Implementieren des Verzögerungsvariationsberechnungsalgorithmus in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung darstellt;
11 eine exemplarische Prozedur zum Voraussagen des Ortes von Sync-Punkt-Segmenten entlang des Testsignals darstellt;
12 die Transfer-Funktion T darstellt;
13 eine Anzahl von Diagrammen zeigt, die zusammen die Berechnung des Ortes L und der Größe S einer Signal-Unstetigkeit entlang eines Abschnitts des Testsignals darstellt; und
14 eine exemplarische Technik zum Berechnen der Größe S der Signal-Unstetigkeit darstellt;
Detaillierte Beschreibung der Erfindung
Die vorliegende Erfindung bezieht eine Technik zum Berechnen der Qualität von Sprachsignalen in einem paketgeschalteten Netzwerk (z. B. ein IP basiertes Netz) ein. Die vorliegende Erfindung erreicht dies trotz der Präsenz von variablen Übertragungsverzögerungen, die in paketgeschalteten Netzen üblich sind. Darüber hinaus ist die vorliegende Erfindung in der Lage, einen beliebigen sprachbasierten Algorithmus einzusetzen, um die Sprachqualitätsberechnung durchzuführen.
3 stellt einen Überblick über die Sprachqualitätsberechnungstechnik in Übereinstimmung mit exemplarischen Ausführungsformen der vorliegenden Erfindung dar. Wie in 3 dargestellt werden das Referenzsignal und das Testsignal zu einem Mehrfach-Puls-Synchronisationsalgorithmus 305 weitergeleitet. Der Mehrfach-Puls-Synchronisationsalgorithmus 305, der weiter unten detaillierter beschrieben wird, analysiert das Referenzsignal und das Testsignal, und identifiziert basierend darauf N Sync-Pulse Pr₁, Pr₂...P_RN entlang des Referenzsignals und N Sync-Positionen Pt₁, Pt₂...P_tN entlang des Testsignals, wobei jede der N Sync-Positionen Pt₁, Pt₂...P_tN entlang des Testsignals verbunden ist mit einem entsprechenden der Sync-Pulse Pr₁, Pr₂...P_rN entlang des Referenzsignals. Für jeden Sync-Puls, Sync-Positions-Paar, erzeugt der Mehrfach-Puls-Synchronisationsalgorithmus 305 auch einen Synchronisationsqualitätsfaktor q₁, q₂...q_N, der eine Anzeige hinsichtlich der Qualität der Synchronisation zwischen dem entsprechenden Sync-Puls, Sync-Positions-Paar bereitstellt. Basierend auf der Synchronisationsinformation {(Pr₁, Pt₁, q₁); (Pr₂, Pt₂, q₂)...(Pr_N, Pt_N, q_N)}, die durch den Mehrfach-Puls Synchronisationsalgorithmus 305 erzeugt wird, identifiziert ein Verzögerungsberechnungsentscheidungsalgorithmus 310 Segmente entlang des Testsignals, die den Anschein erwecken, durch variable Übertragungsverzögerungen beeinflusst worden zu sein. Ein Vor-Bearbeitungsalgorithums 315 gleicht dann das Referenz- und/oder Testsignal basierend auf irgendeiner identifizierten Übertragungsverzögerung ab, so dass das Referenzsignal und das Testsignal bezüglich der Zeit-Domäne gleich skaliert sind. Die Technik kann dann einen Standardsprachqualitätsberechnungsalgorithmus 320 einsetzen, um eine Sprachqualitätsberechnung basierend auf dem eingestellten Referenz- und/oder Testsignalen abzuleiten. Schließlich wird die Signalqualitätsberechnung, die abgeleitet ist durch den Standardsprachqualitätsberechnungsalgorithmus 320, wiederum eingestellt basierend auf der Art der Segmente, die durch den Verzögerungsberechnungsentscheidungsalgorithmus 310 identifiziert wurden. Diese Segmente des Testsignals werden bei der Berechnung der Gesamt-Sprachqualität berücksichtigt, die schließlich in einer genaueren Signalqualitätsberechnung resultiert. Jeder der oben beschriebenen Algorithmen wird weiter unten detaillierter beschrieben.
Der Mehrfach-Synchronisationsalgorithmus 305 stellt wichtige Informationen bereit, auf der die Sprachqualitätsberechnung schließlich basiert. Im Genaueren passt der Mehrfach-Synchronisationsalgorithmus 305 jedes der N Segmente, die hier als Sync-Puls-Segmente bezeichnet werden, die entlang des Referenzsignals angeordnet sind, mit einem entsprechenden Segment, das hier als Sync-Puls-Segment bezeichnet wird, das entlang des Testsignals angeordnet ist, an. Der Mehrfach-Synchronisationsalgorithmus 305 erreicht dies trotz der Tatsache, dass Teile des Testsignals mehr oder weniger Information beinhalten kann als das Referenzsignal, aufgrund von intermittierenden und/oder kontinuierlichen, variablen Übertragungsverzögerungen.
Jeder einer Anzahl von Signalsynchronisationsalgorithmen könnte verwendet werden, um die Funktionalität des Mehrfach-Synchronisationsalgorithmuses 305 bereitzustellen. Ein exemplarischer Synchronisationsalgorithmus ist in der mit-anhängigen US Patentanmeldung 09/430,246, die am 29. Oktober 1999 eingereicht wurde, beschrieben. 4 stellt einen Überblick über diesen exemplarischen Synchronisationsalgorithmus bereit. Wie gezeigt empfängt der Synchronisationsalgorithmus sowohl ein Referenzsignal r(n) als auch ein Testsignal t(n) und erzeugt daraus N von Dreifach-Werten {(Pr₁, Pt₁, q₁); (Pr₂, Pt₂, q₂)...(Pr_N, Pt_N, q_N)}, wobei Pr₁, Pr₂...Pr_N die N Sync-Puls-Segmente repräsentiert, die entlang des Referenzsignals r(n) identifiziert wurden, Pt₁, Pt₂...Pt_N repräsentiert die entsprechenden N Sync-Punkt-Segmente entlang des Testsignals t(n) und q₁, q₂...q_N repräsentiert die zuvor erwähnten Sprachqualitätsfaktoren, die verbunden sind mit jedem der Sync-Puls-Segmente, Sync-Punkt-Segmentpaare.
5 ist ein Flussdiagramm, das die vier grundlegenden Schritte darstellt, die mit dem in der US Patentanmeldung 09/430,246 beschriebenen Synchronisationsalgorithmus verbunden sind. Wie gezeigt bezieht der erste Schritt den Ausfall von N Sync-Puls-Segmenten Pr₁, Pr₂...Pr_N entlang des Referenzsignals r(n) ein. Während eines zweiten Schritts führt der Synchronisationsalgorithmus eine grobe oder grob-gradige Synchronisationsprozedur aus, wobei N Sync-Punkt-Segmente Pt₁, Pt₂...Pt_N entlang des Testsignals t(n) identifiziert sind, ein entsprechender der N Sync-Puls-Segmente {Pr₁, Pr₂...Pr_N} entlang des Referenzsignals r(n). Während dieses zweiten Schritts wird ein vorläufiger Synchronisationsqualitätsfaktor q₁, q₂...q_N für jedes Sync-Puls-Segment, Sync-Punkt-Segmentpaar, erzeugt. Der zweite Schritt gibt N Dreifach-Werte {(Pr₁, Pt₁, q₁); (Pr₂, Pt₂, q₂)...(Pr_N, Pt_N, q_N)} aus, wobei jeder Dreifach-Wert ein Sync-Puls-Segment Pr_i einen entsprechenden aber geschätzten Sync-Punk-Segment Pt_i und einen vorläufigen Synchronisationsqualitätsfaktor q_i enthält. In einem dritten Schritt wird eine Amplituden-Skalierungs-Berechnung S_G erzeugt. Dann wird in einem vierten Schritt eine fein-gradige Synchronisation ausgeführt, wobei die fein-gradige Synchronisationsprozedur in der Erzeugung einer zweiten Anzahl N von Dreifach-Werten {(Pr₁, Pt₁, q₁); (Pr₂, Pt₂, q₂)...(Pr_N, Pt_N, q_N)} resultiert, wobei die Sync-Punkt-Segmente Pt₁, Pt₂...Pt_N und die Synchronisationsqualitätsfaktoren q₁, q₂...q_N, die mit jedem der Dreifach-Werte verbunden sind, mit einer größeren Präzision definiert sind verglichen mit denen, die in den Dreifach-Werten definiert sind, die durch den zweiten oben beschriebenen Schritt erzeugt wurden.
Wie bereits gesagt ist der in der mit-anhängigen US Patentanmeldung 09/430,246 beschriebene Synchronisationsalgorithmus exemplarisch. Für den Fachmann ist es leicht ersichtlich, dass andere Signalsynchronisationsalgorithmen verwendet werden könnten, um die Funktionalität des Mehrfach-Synchronisationsalgorithmus 305 bereitzustellen.
6 zeigt eine Abbildung zwischen jeden der sieben exemplarischen Sync-Puls-Segemente Pr₁, Pr₂...Pr₇, die entlang des Referenzsignals angeordnet sind, und einen entsprechenden der sieben Sync-Punkt-Segment Pt₁, Pt₂...Pt₇, die entlang des Testsignals angeordnet sind, wobei die Abbildung basiert auf der Information, die in den sieben Dreifach-Werten enthalten ist, die durch den Mehrfach-Synchronisationsalgorithmus 305 erzeugt wurden. In diesem Beispiel ist N gleich sieben. Es ist wichtig anzumerken, dass während die Abstände zwischen angrenzenden Sync-Puls-Segmenten konstant oder annähernd konstant bleibt, die Abstände zwischen angrenzenden Sync-Punkt-Segmenten im Allgemeinen stetig größer werden mit Ausnahme des Abstandes zwischen den Sync-Punkt-Segmenten Pt₅ und Pt₆. Der stetige Zuwachs in dem Abstand zwischen angrenzenden Sync-Punkt-Segmenten könnte anzeigen, dass die Bit-Rate, die mit dem Testsignal verbunden ist, größer sein könnte als die Bit-Rate des Referenzsignals, oder dass die Daten-Pakete, die mit dem Testsignal verbunden sind, zugeordnet sein sollten zu einer stetig steigenden Übertragungsverzögerung. Im Vergleich dazu ist der Abstand zwischen den Sync-Punkt-Segmenten Pt₅ und Pt₆ signifikant groß verglichen mit dem Abstand zwischen den anderen Sync-Punkt-Segmenten entlang des Testsignals, und zeigt somit die Präsenz einer Signal-Unstetigkeit (d. h. intermittierende Verzögerung) an. Dem gemäß stellt 6 dar, wie die in den N Dreifach-Werten enthaltene Information, die durch den Mehrfach-Synchronisationsalgorithmus 305 erzeugt werden, verwendet werden können für den Zweck des Detektierens und Identifizierens der Segmente entlang des Testsignals, das kontinuierliche und intermittierende, variable Übertragungsverzögerungen reflektiert.
Wie in 3 dargestellt werden die N Dreifach-Werte (Pr₂, Pt₂, q₂)...(Pr_N, Pt_N, q_N)}, die durch (Pr₁, Pt₁, q₁) den Mehrfach-Synchronisationsalgorithmus 305 erzeugt werden, zu einem Verzögerungsberechnungsentscheidungsalgorithmus 310 geleitet, der hier bezeichnet wird als Entscheidungsalgorithmus. Im Allgemeinen analysiert der Entscheidungsalgorithmus 310 die N Dreifach-Werte und eliminiert Sync-Pulse, Sync-Punkte-Segmentpaare, die nicht den Anschein machen, richtig synchronisiert worden zu sein. Zusätzlich klassifiziert der Entscheidungsalgorithmus 310 jede Verzerrung des Testsignals bezogen zu sein, oder reflektierend zu sein von einer kontinuierlichen oder intermittierenden variablen Verzögerung. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung umfasst der Entscheidungsalgorithmus 310 vier primäre Funktionselemente, wie in 7 dargestellt.
Das erste funktionelle Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist ein Signal-Unstetigkeits-Identifikationsalgorithmus 705. Der Signal-Unstetigkeits-Identifikationsalgorithmus 705 analysiert die Abstände zwischen jedem Paar von angrenzenden Sync-Punkt-Segmenten entlang des Testsignals und bestimmt basierend auf dieser Analyse, ob die Länge des Testsignals zwischen jedem gegebenen Paar von angrenzenden Sync-Punkt-Segmenten besonders groß oder klein ist. Eine Bestimmung, dass eine bestimmte Länge des Testsignals besonders groß oder klein ist, tendiert anzuzeigen, dass der entsprechende Teil des Testsignals eine Signal-Unstetigkeit reflektiert (d. h. eine intermittierende Verzögerung). Der Signal-Unstetigkeits-Identifikationsalgorithmus 705 kann implementiert werden durch Vergleichen der Länge des Testsignals zwischen jedem Paar von angrenzenden Sync-Punkt-Segmenten mit einem Grenzwert, wobei der Grenzwert beispielsweise eine Funktion des mittleren oder gewichteten mittleren Abstands zwischen angrenzenden Sync-Punkt-Segmenten ist.
Das folgende Beispiel soll betrachtet werden, um eine mögliche Implementierung des Signal-Unstetigkeits-Identifikationsalgorithmus 705 weiter zu illustrieren. In diesem Beispiel ist N gleich 20. Somit gibt es 20 Sync-Puls-Segmente, Sync-Punkt-Segmentpaare. Zuerst wird eine Differenz δ zwischen der Position von jeden Sync-Punkt-Segment entlang des Testsignals und eines entsprechenden Sync-Puls-Segments des Referenzsignals bestimmt. Z. B. kann die Differenz δ zwischen der Position jedes der 20 Sync-Punkt-Segmente und der entsprechenden Sync-Puls-Segmente gegeben sein durch Ausdrücke einer Anzahl von Samplen, wie folgt: δ₁ = 5160, δ₂ = 5187, δ₃ = 5347, δ₄ = 5347, δ₅ = 5347, δ₆ = 5347, δ₇ = 5027, δ₈ = 5027, δ₉ = 5027, δ₁₀ = 5027, δ₁₁ = 5027, δ₁₂ = 4867, δ₁₃ = 4867, δ₁₄ = 4867, δ₁₅ = 4867, δ₁₆ = 4867, δ₁₇ = 4867, δ₁₈ = 4867, δ₁₉ = 4867, δ₂₀ = 4867. Zweitens werden N – 1 Delta-Werte Δ, die die Veränderung in den Differenz-Werten Δ darstellen, abgeleitet. Wenn die N – 1 Delta-Werte Δ abgeleitet werden gemäß der folgenden Beziehung Δi = (δi + 1) – δ1 (1)dann würden die N – 1 Delta-Werte Δ für die oben identifizierten Differnz-Werte Δ wie folgt gegeben sein:
Δ₁ = 27, Δ₂ = 160, Δ₃ = 0, Δ₄ = 0, Δ₅ = 0, Δ₆ = –320, Δ₇ = 0, Δ₈ = 0, Δ₉ = 0, Δ₁₀ = 0, Δ₁₁ = –160, Δ₁₂ = 0, Δ₁₃ = 0, Δ₁₄ = 0, Δ₁₅ = 0, Δ₁₆ = 0, Δ₁₇ = 0, Δ₁₈ = 0, Δ₁₉ = 0. Drittens werden die N – 1 Delta-Werte Δ mit dem Grenzwert verglichen (z. B. ± 40 Sample), was zu dem folgenden führt: Δ₁ – 0, Δ₂ – 1, Δ₃ – 0, Δ₄ – 0, Δ₅ – 0, Δ₆ – 1, Δ₇ – 0, Δ₈ – 0, Δ₉ – 0, Δ₁₀ – 0, Δ₁₁ – 1, Δ₁₂ – 0, Δ₁₃ – 0, Δ₁₄ – 0, Δ₁₅ – 0, Δ₁₆ – 0, Δ₁₇ – 0, Δ₁₈ – 0, Δ₁₉ – 0, wobei eine „1" anzeigt, dass der Delta-Wert Δ den Grenzwert übersteigt und die Präsenz einer möglichen Signal-Unstetigkeit.
Jede Signal-Unstetigkeit, die durch den Signal-Unstetigkeits-Identifikationsalgorithmus 705 identifiziert wird, wird zu dem zweiten funktionalen Element weitergeleitet, das mit dem Entscheidungsalgorithmus 310 verbunden ist. Das zweite funktionale Element ist wie in 7 angedeutet der „Ausreißer"-Idenifikations- und Entfernungsalgorithmus 710. Der Ausreißer-Idenifikations- und Entfernungsalgorithmus 710 bestimmt, ob eins der Signale, die durch den Signal-Unstetigkeits-Identifikationsalgorithmus 705 identifiziert wurden, wie oben beschrieben richtige Unstetigkeiten sind oder falsche Alarme sind.
Man beachte das folgende Beispiel, um eine exemplarische Ausführungsform des Ausreißer-Identifikations- und Entfernungsalgorithmus 710 besser darzustellen. 8 zeigt eine Abbildung zwischen jedem der 10 Sync-Puls-Segmente entlang eines
Referenzsignals und jedes einer Anzahl von entsprechenden
Sync-Punkt-Segmenten entlang eines Testsignals. Der Abstand zwischen den Sync-Puls-Segmenten wird als konstant angenommen, weil der Abstand zwischen den Sync-Punkt-Segmenten linear ansteigt, aber für die Abstände die dem Sync-Punkt-Segment Pt₆ und dem Sync-Punkt-Segment Pt₁₀ vorausgehen. Es wird ferner angenommen, dass die Abstände, die den Sync-Punkt-Segmenten Pt₆ und Sync-Punkt-Segment Pt₁₀ vorangehen, identifiziert wurden als Signal-Unstetigkeiten durch den Signal-Unstetigkeit-Identifikationsalgorithmus 705. Zuerst identifiziert der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 einen „Puls-Satz", der mit dem Abstand entlang des zu evaluierenden Testsignals verbunden ist. Wenn beispielsweise der Abstand entlang des zu evaluierenden Testsignals der Abstand ist, der den Sync-Punkt-Segment Pt₆ vorangeht, könnte der Puls-Satz die Sync-Punkt-Segmente Pt₆, Pt₇, Pt₇ und Pt₉ umfassen. Es ist jedoch verständlich, dass eine Untersuchung, ob eine Signal-Unstetigkeit wahrscheinlich existiert, Puls-Segmente enthalten muss, wovon einige dem zu evaluierenden Abstand vorausgehen und einige, die dem zu evaluierenden Abstand folgen. Wenn alle Puls-Segmente von Anfang bis zum Rahmen-Slip separat evaluiert werden, wird der Fachmann erkennen, dass es genug ist, Pulse zu evaluieren, die der Signal-Unstetigkeit folgen, um zu entscheiden, ob eine Unstetigkeit voraussichtlich existiert. Sobald der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 den Puls-Satz identifiziert, werden nichts desto trotz die Pulse, die den Puls-Satz aufbauen, analysiert, um zu bestimmen, ob irgendeine der Bedingungen erfüllt ist. Beispielsweise könnte eine Bedingung sein, ob mindestens ein Synchronisations-Qualitäts-Faktor q_i, der mit jedem der Sync-Punkt-Segmente die den Puls-Satz aufbauen, verbunden ist, größer ist als eine erste minimale Synchronisations-Qualitäts-Grenze. Die Erfüllung einer solchen Bedingung würde anzeigen, dass die Länge des entsprechenden Abstands zuverlässig ist. Eine zweite Bedingung könnte sein, ob mindestens zwei Synchronisation-Qualitäts-Faktoren, die mit jedem der zwei der Sync-Punkt-Segmente, die den Puls-Satz aufbauen, verbunden sind, größer sind als eine zweite minimale Synchronisations-Qualitäts-Grenze, wobei die zweite minimale Synchronisations-Qualitäts-Grenze verstanden wird, niedriger zu sein als die erste minimale Synchronisations-Qualitäts-Grenze, und ob die Anzahl von Sync-Punkt-Segmenten, die den Puls-Satz aufbauen, größer ist als eine minimale Anzahl von Sync-Punkt-Segmenten. Eine weitere dritte Bedingung könnte sein, ob mindestens ein Synchronisations-Qualitäts-Faktor, der mit einem der Sync-Punkt-Segmente, die den Puls-Satz aufbauen, verbunden ist, größer ist als eine dritte minimale Synchronisations-Qualitätsfaktor-Grenze, und ob die Anzahl von Sync-Punkt-Segmenten, die den Puls-Satz aufbauen, größer ist als die zuvor erwähnte minimale Anzahl von Sync-Punkt-Segmenten, wobei die dritte minimale Synchronisations-Qualitäts-Grenze verstanden wird, kleiner zu sein als die erste minimale Sync-Qualitäts-Grenze aber größer zu sein als die zweite minimale Sync-Qualitäts-Grenze. Wenn eine der Bedingungen erfüllt ist, bestimmt der Ausreißer-Identifikations- und Entfernungsalgorithmus 710, das die Länge des zu evaluierenden Testsignals reflektierend ist für eine echte Signal-Unstetigkeit (d. h. eine intermittierende Verzögerung). Wenn der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 feststellt, dass eine Länge des Testsignals reflektierend ist für eine echte Signal-Unstetigkeit, z. B. die Länge des Testsignals, das Pt₆ in 8 vorausgeht, wird das entsprechende Sync-Punkt-Segment Pt₆ als ein „Ausreißer" identifiziert. Der Ausreißer-Identifikations- und Entfernungsalgorithmus 710 entfernt dann alle der Sync-Punkt-Segmente, die als „Ausreißer" identifiziert wurden (d. h. falsche Signal-Unstetigkeiten) unter den N Sync-Punkt-Segmenten Pt₁, Pt₂...Pt_N, die durch den Mehrfach-Puls-Synchronisationsalgorithmus 305 identifiziert wurden. Die übrigen M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M werden aufbewahrt und zu den dritten funktionalen Element des Entscheidungs-Algorithmus 310 weitergeleitet, wobei verstanden wird, das M durch die folgende Beziehung definiert ist: M = N – O – TD – Q (2)wobei die Variable O die Anzahl von Sync-Punkt-Segmenten, die als "Ausreißer" durch den Ausreißer-Identifikations- und Entfernungsalgorithmus 710 identifiziert wurden, repräsentiert; TD die Anzahl von "echten" Unstetigkeiten repräsentiert; und Q die Anzahl von Sync-Pulsen repräsentiert, die eine niedrigere Sync-Qualität aufweisen.
Das dritte funktionale Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715. Der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 berechnet den Grad der kontinuierlichen Verzögerungsvariation Δf, der von den übrig gebliebenen M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals aufgewiesen ist wie mit dem Ort der entsprechenden Sync-Puls-Segmente Pr₁, Pr₂...Pr_M entlag des Referenzsignals verglichen. Im Allgemeinen ist der Grad der kontinuierlichen Verzögerungsvariation Δf eine Funktion der Sync-Punkt-Segmentfrequenz f_t (d. h. die Frequenz der Sync-Punkt-Segmente entlang des Testsignals) und der Sync-Puls-Segment-Frequenz f_r (d. h. der Frequenz der Sync-Puls-Segmente entlang des Referenzsignals). In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung wird der Grad der kontinuierlichen Verzögerungsvariation Δf definiert durch die folgende Beziehung: Δf = (ft·fr –1) – 1 (3)wobei ein Grad der kontinuierlichen Verzögerungsvariation Δf gleich Null (0) anzeigt, dass es keine kontinuierliche Verzögerungsvariation gibt, was geschieht, wenn die Sync-Puls-Segment-Frequenz f_r und die Sync-Punkt-Segment-Frequenz f_t gleiche Werte sind, wie der Fachmann leicht erkennt.
Der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 wird nun detailliert beschrieben. 9 stellt eine exemplarische Ausführungsform zum Implementieren des kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715 dar. Wie gezeigt ist der kontinuierliche Verzögerungs-Variations-Berechnungsalgorithmus 715 in zwei funktionale Komponenten geteilt: ein Verzögerungs-Variations-Detektionsalgorithmus 905 und ein Grad der Verzögerungs-Variations-Berechnungsalgorithmus 910. Im Allgemeinen analysiert der Verzögerungs-Variations-Detektionsalgorithmus 905 den Ort der M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals verglichen mit dem Ort der entsprechenden Sync-Puls-Segmente Pr₁, Pr₂...Pr_M entlang des Referenzsignals und bestimmt daraus, ob es wahrscheinlicher ist oder nicht, dass der Ort der M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals eine kontinuierliche Verzögerungsvariation reflektiert. Im Gegensatz dazu bestimmt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsvariation. wenn überhaupt, und verwendet die durch den Verzögerungs-Variations-Bestimmungsalgorithmus 905 gemachte Bestimmung um eine „Fitness"-Grenze zu setzen, wobei die Fitness-Grenze als ein Kriterium zum Bestimmen, ob die kontinuierliche Verzögerungs-Variations-Berechnung akzeptiert oder abgelehnt werden soll, dient. Sowohl der Verzögerungs-Variations-Detektionsalgorithmus 905 als auch der Verzögerungs-Variations-Berechnungsalgorithmus 910 werden hier weiter unten detaillierter beschrieben.
Wie gesagt bestimmt der Verzögerungs-Variations-Detektionsalgorithmus 905 ob eine Verzögerungsvariation wahrscheinlich existiert, mit gegebenem Ort der M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung macht der Verzögerungs-Variations-Detektionsalgorithmus 905 diese Bestimmung basierend auf einem Gesamt-Sync-Punkt-Segment-Positionsfehler E und einer Varianz V. Der Gesamt-Sync-Punkt-Segment-Positionsfehler E kann beispielsweise abgeleitet werden unter Verwendung der folgenden Gleichung:
wobei P_(derivate)i eine Delta-Funktion ist, die auf dem Abstand zwischen zwei angrenzenden Sync-Punkt-Segmenten entlang des Testsignals und des Abstandes zwischen zwei entsprechenden Sync-Puls-Segmenten entlang des Referenzsignals basiert. Wenn beispielsweise „i" gleich ist mit „1", könnte P_(derivate)i wie folgt definiert sein. P(derivate)i = ((Pt2 – Pt1) – (Pr2 – Pr1))·(Pr2 – Pr1)–1 (5)
Im Gegensatz dazu könnte Δf_est beispielsweise der gewichtete Median-Wert der Delta-Funktion P_derivate sein. Ein anderes Verfahren könnte das Iterieren durch einen Bereich von unterschiedlichen Δf_est-Werten beinhalten und das Auswählen des einen Wertes, der die Summe E minimiert.
Die Variable V repräsentiert die Varianz des gewichteten Medians Δfest. Im Genaueren ist die Variable V eine Funktion des gewichteten Medianwertes Δf_est und der Delta-Funktion P_(derivate)i-Wert, der direkt kleiner ist als der gewichtete Medianwert und die Delta-Funktion P_(derivate)i-Wert, der direkt größer ist als der gewichtete Medianwert. Die Variable V kann somit in Übereinstimmung mit der folgenden Beziehung definiert werden: V = Varianz Wmedian–1, Wmedian, Wmedian+1) (6)Wobei W_median äquivalent ist mit den gewichteten Medianwert von P_derivate, W_median–1 ist äquivalent mit P_derivate, der gerade kleiner ist W_medium und W_median+1 ist äquivalent mit P_derivate, der gerade größer ist als W_medium.
Nachdem der Verzögerungs-Variations-Detektionsalgorithmus 905 den Gesamt-Sync-Punkt-Positionsfehler E und die Varianz V wie oben beschrieben ableitet, vergleicht der Verzögerungs-Variations-Detektionsalgorithmus 905 den Gesamt-Sync-Punkt-Positionsfehler E mit einer Gesamt-Sync-Punkt-Positionsfehlergrenze T_E. Er vergleicht auch die Varianz V mit einer Varianzgrenze T_V. Man erkennt leicht, dass der Ist-Wert der Gesamt-Sync-Punkt-Positionsfehlergrenze T_E und der Ist-Wert der Varianzgrenze T_V empirisch abgeleitet werden können. Durch Vergleichen des Gesamt-Sync-Punkt-Positionsfehlers E mit der Gesamt-Sync-Punkt-Positionsfehlergrenze T_E und durch Vergleichen der Varianz V mit der Varianzgrenze T_V ist der Verzögerungs-Variations-Detektionsalgorithmus 905 in der Lage zu bestimmen, ob der Gesamt-Sync-Punkt-Positionsfehler E und/oder die Varianz V relativ klein sind. Wenn der Verzögerungs-Variations-Detektionsalgorithmus 905 bestimmt, das sowohl der Gesamt-Sync-Punkt-Positionsfehler E und die Varianz V relativ klein sind (d. h. E ist kleiner als T_E und V ist kleiner als T_V), setzt der Verzögerungs-Variations-Detektionsalgorithmus 905 ein Detektions-Flag gleich einem „TRUE", das wiederum anzeigt, dass eine kontinuierliche Verzögerungsvariation wahrscheinlich existiert, das den Ort der M Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals angibt.
Wie zuvor erwähnt berechnet der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsvariation Δf. Im Allgemeinen führt der Verzögerungs-Variations-Berechnungsalgorithmus 910 dies aus durch Berechnen eines vorhergesagten Ortes für die M Sync-Punkt-Segmente Pt_1(pred), Pt_2(pred)...Pt_M(pred) entlang des Testsignals für jeden einer Anzahl von Sync-Punkt-Segmentfrequenzen. Dann vergleicht für jede Sync-Punkt-Segmentfrequenz der Verzögerungs-Variations-Berechnungsalgorithmus 910 die Abstände zwischen angrenzenden, vorhergesagten Sync-Punkt-Segmenten Pt_1(pred), Pt_2(pred)...Pt_M(pred) mit den Abständen zwischen den Ist-Orten der Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M, die durch den Mehrfach-Puls-Synchronisationsalgorithmus 305 abgeleitet wurden. Ein „Fitness"-Wert D_fitness wird dann basierend auf diesem Vergleich erzeugt. Ein maximaler Fitness-Wert D_fitness(max) wird eventuell abgeleitet und verglichen mit einer ersten Fitness-Grenze oder einer zweiten Fitness-Grenze davon abhängig, ob das Detektions-Flag gleich dem „TRUE"-Zustand durch den Verzögerungs-Variations-Detektionsalgorithmus 905 wie oben beschrieben gesetzt wurde. Wenn der Verzögerungs-Variations-Berechnungsalgorithmus 910 bestimmt, dass der maximale Fitness-Wert D_fitness(max) größer ist als die Fitness-Grenze, mit der dieser verglichen wird, setzt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsberechnung Δf gleich mit einem Wert in Übereinstimmung mit Gleichung (3), wobei f_t die Sync-Punkt-Segmentfrequenz ist, die den maximalen Fitness-Wert D_fitness(max) entspricht, und wobei f_r die Sync-Punkt-Segmentfrequenz ist. Wenn jedoch der Verzögerungs-Variations-Berechnungsalgorithmus 910 feststellt, dass der maximale Fitness-Wert D_fitness(max) kleiner ist oder gleich der Fitness-Grenze, setzt der Verzögerungs-Variations-Berechnungsalgorithmus 910 die kontinuierliche Verzögerungsberechnung Δf gleich Null (0), was anzeigt, dass eine kontinuierliche Verzögerungsvariation durch die Sync-Punkt-Segmente entlang des Testsignals nicht vorliegt.
10 stellt eine Technik zum Implementieren des Verzögerungs-Variations-Berechnungsalgorithmus 910 in Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung detaillierter dar. Wie in Block 1005 gezeigt beginnt die Technik mit der Initiierung des Fitness-Wertes D_fitness auf Null (0). Wie oben erwähnt wird der Fitness-Wert D_fitness abgeleitet für jede der Sync-Punkt-Segmentfrequenzen, und der maximale Fitness-Wert D_fitness(max) wird verwendet, um eine Sync-Punkt-Segmentfrequenz zu identifizieren, die am genauesten die Frequenz der Ist-Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals reflektiert.
In Übereinstimmung mit Block 1010 wird eine erste von mehreren Sync-Punkt-Segmentfrequenzen f_t ausgewählt. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung decken die mehrere Sync-Punkt-Segmentfrequenzen einen Bereich von Frequenzen ab, die die Sync-Puls-Segmentfrequenz f_r beinhaltet. Wenn beispielsweise die Sync-Puls-Segmentfrequenz f_r 8000 Hz ist, können die mehreren Sync-Punkt-Segmentfrequenzen f_t von 7950 Hz bis 8050 Hz reichen. In diesem Beispiel würde die Sync-Punkt-Segmentfrequenz ft initialisiert werden auf eine Frequenz von 7950 Hz bei Block 1010.
Wie in Block 1015 gezeigt wird ein vorausgesagter Ort entlang des Testsignals für jedes der Sync-Punk-Segmente Pt_(pred), Pt_2(pred)...Pt_M(pred) abgeleitet . Die vorausgesagten Orte könnten abgeleitet werden als eine Funktion der bekannten Orte der Sync-Puls-Segmente Pr₁, Pr₂...Pr_M entlang des Referenzsignals und der aktuellen Sync-Punkt-Segmentfrequenz f_t (z. B. 7950 Hz).
11 stellt eine exemplarische Prozedur zum Ableiten der vorausgesagten Orte der Sync-Punkt-Segmente Pt_1(pred), Pt_2(pred)...Pt_M(pred) entlang des Testsignals mit größerer Klarheit, basierend auf den bekannten Orten der Sync-Puls-Segmente Pr₁, Pr₂...Pr_M entlang des Referenzsignals, die bekannten Abstände a_k zwischen angrenzenden Sync-Puls-Segmenten entlang des Referenzsignals, wobei k von „1" bis „M–1" erreicht ein Skalierungs-Faktor s und die aktuelle Sync-Punkt-Segmentfrequenz f_t. Wie in 11 gezeigt kann der vorausgesagte Ort für jedes Sync-Punkt-Segment, z. B. der vorausgesagte Ort für Sync-Punkt-Segment Pt_k+1, bestimmt werden in Übereinstimmung mit der folgenden Beziehung: Ptk+1(pred) = Ptk(pred) + aks (7) Wobei a_ks den Abstand zwischen zwei angrenzenden vorausgesagten Sync-Punkt-Segmenten Pt_k(pred) und Pt_k+1(pred) repräsentiert, wobei a_k den bekannten Abstand zwischen den entsprechenden Sync-Puls-Segmenten Pr_k und Pr_k+1 repräsentiert und wobei der Wert des Skalierungs-Faktors s abgeleitet ist durch Bestimmen des Skalierungs-Faktor-Werts der, wenn mit jeden der Abstände a_k multipliziert, in einer Sync-Punkt-Segmentfrequenz resultiert, die am genauesten der aktuellen Sync-Punkt-Segmentfrequenz f_t gleich kommt (z. B. 7950 Hz).
Dann werden in Übereinstimmung mit Block 1020 die vorausgesagten Orte der Sync-Punkt-Segmente Pt_1(pred), Pt_2(pred)...Pt_M(pred) mit den Ist-Orten der Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M verglichen. Genauer werden die vorausgesagten Abstände a_ks zwischen den vorausgesagten Sync-Punkt-Segmentorten Pt_1(pred), Pt_2(pred)...Pt_M(pred) verglichen mit den Abständen b_k zwischen den Ist-Sync-Punkt-Segmentorten Pt₁, Pt₂...Pt_M. Bei einem solchen Vorgehen kann ein vorausgesagter Ortsfehler e_k beispielsweise in Übereinstimmung mit Gleichung (8) berechnet werden. ek = |aks – bk| (8)
Dann wird wie in Block 1025 gezeigt der Fitness-Wert D_fitness aktualisiert. In Übereinstimmung mit einer bevorzugten Ausführungsform der vorliegenden Erfindung wird der aktualisierte Fitness-Wert D_fitness abgeleitet als eine Funktion des vorausgesagten Ortsfehlers e_k, wie durch die untere Gleichung (9) gezeigt:
wobei T eine Transferfunktion ist, die D_fitnessdazu bringt, zwischen einem Wert von "0" und "1" wie in 12 gezeigt zu variieren, und wobei ein Fitness-Wert gleich „1" eine präzise Übereinstimmung zwischen den vorausgesagten Sync-Punkt-Segmentorten Pt_1(pred), Pt_2(pred)...Pt_M(pred) und die Ist-Sync-Punkt-Segmentorte Pt₁, Pt₂...Pt_M anzeigt.
Da die Sync-Punkt-Segmentfrequenz f_t während jeder Iteration der in 10 dargestellten Technik erhöht wird, wird der Fitness-Wert D_fitness initial erhöht. Dieser wird maximal, wenn die Sync-Punkt-Segmentfrequenz f_t gleich ist oder annähernd gleich ist mit der Sync-Puls-Segmentfrequenz f_r. Danach wird der Fitness-Wert D_fitness abnehmen. Demzufolge kann der maximale Fitness-Wert D_fitness(max) identifiziert werden durch Bestimmen wenn der Fitness-Wert D_fitness maximal wird. Dies ist der Zweck es Entscheidungs-Blocks 1030. Im Genaueren ist der aktualisierte Fitness-Wert D_fitness in Übereinstimmung mit dem Entscheidungs-Block 1030 verglichen mit dem vorherigen Fitness-Werten, wobei eine Bestimmung durchgeführt wird, ob der aktualisierte Fitness-Wert kleiner ist als die vorherigen Fitness-Werte.
Wenn der aktualisierte Fitness-Wert D_fitness nicht kleiner ist als der vorgehende Fitness-Wert in Übereinstimmung mit dem „NO" Pfad aus dem Entscheidungs-Block 1030, der anzeigt, dass der vorherige Fitness-Wert nicht der maximale Fitness-Wert ist, wird die Sync-Punkt-Segmentfrequenz f_t z. B. von 7950 Hz auf 7951 Hz wie in Block 1035 gezeigt erhöht. Dann wird eine Bestimmung durchgeführt, ob alle der Sync-Punkt-Segmentfrequenzen, z. B. alle der Frequenzen von 7950 Hz bis 8050 Hz, in Übereinstimmung mit dem Entscheidungs-Block 1040 evaluiert wurden. Wenn in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungs-Blocks 1040 alle der Sync-Punkt-Segmentfrequenzen nicht evaluiert wurden, werden die vorausgesagten Orte der Sync-Punkt-Segmente Pt_1(pred), Pt_2(pred)...Pt_M(pred) erneut berechnet basierend auf der neuen Sync-Punkt-Segmentfrequenz, die während der Ausführung des Blocks 1035 wie oben beschrieben erhöht wurde.
Ferner werden in Übereinstimmung mit der in 10 dargestellten Technik die prozeduralen Schritte, die mit den Blöcken 1015 bis 1040 verbunden sind, wiederholt ausgeführt bis der maximale Fitness-Wert D_fitness(max) identifiziert wurde, was passiert, wenn ein aktualisierter Fitness-Wert kleiner ist als der vorherige Fitness-Wert, in Übereinstimmung mit dem „JA"-Pfad des Entscheidungs-Blocks 1030, oder bis die Sync-Punkt-Segmentfrequenz f_t die maximale Sync-Punkt-Segmentfrequenz f_t(max) übersteigt, z. B. 8050 Hz in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungs-Block 1040. In jeden der Fälle wurde der maximale Fitness-Wert D_fitness(max) identifiziert.
Dann wird in Übereinstimmung mit dem Entscheidungs-Block 1045 eine Bestimmung durchgeführt, ob das Detektions-Flag auf den Zustand „JA" durch den Verzögerungs-Variations-Detektionsalgorithmus 905 gesetzt wurde. Wie zuvor erklärt wurde, wird das Detektions-Flag auf den Zustand „JA" gesetzt, wenn der Verzögerungs-Variations-Detektioinsalgorithmus 905 feststellt, dass der Gesamt-Sync-Punkt-Positionsfehler E kleiner ist als die Gesamt-Sync-Punkt-Positionsfehlergrenze T_E und die Varianz V kleiner ist als die Varianz-Grenze T_V. Wenn das Detektions-Flag in den „JA"-Zustand gesetzt wird, wird in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungsblock 1045 der maximale Fitness-Wert D_fitness(max) verglichen mit einer relativ niedrigen Fitness-Wert-Grenze T_FL (z. B. 0,7). Wenn jedoch das Detektions-Flag nicht in den „JA"-Zustand gesetzt wird, wird in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungsblock 1045 der maximale Fitness-Wert D_fitness(max) verglichen mit einer relativ hohen Fitness-Wert-Grenze T_FH (z. B. 0,9). Es ist verständlich, dass die Fitness-Wert-Grenzen T_FL und T_FH empirisch abgeleitet wurden.
Wenn festgestellt wurde, dass der maximale Fitness-Wert D_fitness(max) größer ist als die Fitness-Wert-Grenze T_FL oder T_FH, wird in Übereinstimmung mit dem „JA"-Pfad aus dem Entscheidungs-Block 950 bzw. dem Entscheidungs-Block 960 der Grad der kontinuierlichen Verzögerungsvariation Δf, den die Sync-Punkt-Segmente P_t1, P_t2...Pt_M entlang des Testsignals aufweisen, wie in Block 1055 gezeigt, berechnet als eine Funktion der Sync-Punkt-Segmentfrequenz f_t, die dem maximalen Fitness-Wert D_fitness(max) und der Sync-Puls-Segmentfrequenz f_r wie in Gleichung (3) angedeutet berechnet. Wenn alternativ festgestellt wird, dass der maximale Fitness-Wert D_fitness(max) nicht größer ist als die Fitness-Wert-Grenze, wird in Übereinstimmung mit dem „NEIN"-Pfad aus dem Entscheidungs-Block 1050 oder dem Entscheidungs-Block 1060 die kontinuierliche Verzögerungs-Variation Δf auf Null (0) gesetzt, womit die Wahrscheinlichkeit angezeigt wird, dass die kontinuierliche variable Verzögerung durch die Sync-Punkt-Segmente Pt₁, Pt₂...Pt_M entlang des Testsignals aufgewiesen werden.
Das vierte funktionale Element, das mit dem Entscheidungsalgorithmus 310 verbunden ist, ist ein Unstetigkeits-Berechnungsalgorithmus 720. Der Unstetigkeits-Berechnungsalgorithmus 720 berechnet den Ort einer Unstetigkeit beispielsweise entlang einer gegebenen Länge des Testsignals zwischen zwei Sync-Punkt-Segmenten als auch die Größe er Unstetigkeit.
In Übereinstimmung mit einer exemplarischen Ausführungsform der vorliegenden Erfindung beginnt der Unstetigkeits-Berechnungsalgorithmus 720 den Prozess der Berechnung des Orts und der Zeit einer Unstetigkeit zuerst durch Identifizieren eines Abschnitts des Testsignals, der einem Sync-Punkt-Segment vorausgeht, das identifiziert wurde als eine Unstetigkeit durch den Ausreißer-Identifikations- und Entfernungsalgorithmus 710, wie oben beschrieben. Beispielsweise kann der Unstetigkeits-Berechnungsalgorithmus 310 einen Abschnitt A_i des Testsignals identifizieren eine Unstetigkeit zu enthalten, wobei A_i begrenzt ist durch die Sync-Punkt-Segmente Pt_i und Pt_i+1, und wobei das Sync-Punkt-Segment Pt_i+1 identifiziert wurde als eine Unstetigkeit durch den Ausreißer-Identifikations- und Entfernungsalgorithmus. Als nächstes wird jede kontinuierliche Verzögerungsvariation Δf, die mit dem Abschnitt A_i verbunden ist, und die durch den kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715 bestimmt wurden, entfernt.
Das Sync-Punkt-Segment Pt_i, das dem Abschnitt A_i vorausgeht, wird dann mit dem Sync-Punkt-Segment Pr_i ausgerichtet, das einen entsprechenden Abschnitt a_i in dem Referenzsignal vorausgeht, und ein spektraler Abstand zwischen dem Abschnitt A_i des Testsignals und dem Abschnitt a_i des Referenzsignals wird erzeugt. 13 zeigt ein Diagramm B, das den spektralen Abstand zwischen einem Abschnitt A_i des Testsignals und einem entsprechenden Abschnitt a_i des Referenzsignals repräsentiert, wobei die zwei Abschnitte A_i und a_i wie oben beschrieben ausgerichtet wurden. Es ist von besonderer Wichtigkeit anzumerken, dass der spektrale Abstand anfangs klein ist, da der Abschnitt A_i des Testsignals und der Abschnitt a_i des Referenzsignals an diesem Punkt synchronisiert sind. Dann macht der spektrale Abstand einen Übergang von relativ kleinen Werten zu relativ großen Werten wie gezeigt durch, wobei dieser Übergang zusammenfällt mit dem Auftreten einer Unstetigkeit. Der spektrale Abstand vergrößert sich an diesem Punkt, da der Abschnitt A_i des Testsignals und der Abschnitt a_i des Referenzsignals aufgrund der Präsenz der Unstetigkeit nicht mehr synchronisiert sind.
Das Sync-Punkt-Segment Pt_i+1, das dem Abschnitt A_i folgt, wird dann mit dem Sync-Puls-Segment Pr_i+1 ausgerichtet, das dem entsprechendem Abschnitt a_i folgt, und der spektrale Abstand zwischen dem Abschnitt a_i des Testsignals und dem Abstand a_i des Referenzsignals wird noch einmal erzeugt. 13 zeigt auch einen Graphen B, wobei der Graph B den spektralen Abstand zwischen einem Abschnitt A_i des Testsignals und einem entsprechenden Abschnitt a_i des Referenzsignals repräsentiert, wobei die zwei Abschnitte A_i und a_i mit Bezug auf das Sync-Punkt-Segment Pt_i+1 und dem Sync-Puls-Segment Pr_i+1 ausgerichtet wurden. Im Gegensatz zu dem Graph A sind die spektralen Abstandswerte in Graph B anfangs groß, da der Abschnitt A_i des Testsignals und der Abschnitt a_i des Referenzsignals noch nicht synchronisiert sind, aufgrund der Präsenz der Unstetigkeit und aufgrund der Tatsache, dass der Abschnitt A_i des Testsignals und der Abschnitt a_i des Referenzsignals ausgerichtet sind mit Bezug auf das Sync-Punkt-Segment Pt_i+1 und das Sync-Puls-Segment Pr_i+1. Dann durchläuft der spektrale Abstand wie gezeigt den Übergang zu einem relativ kleinen Wert, wobei der Übergang in diesem Beispiel zusammenfällt mit dem Ende der Unstetigkeit. Der spektrale Abstand bleibt dann ein relativ kleiner Wert, da der Abstand A_i des Testsignals und der Abstand a_i des Referenzsignals nun synchronisiert sind.
Der Unstetigkeits-Berechnungsalgorithmus 720 kann dann den berechneten Ort L der Unstetigkeit entlang des Abschnitts A_i des Testsignals beispielsweise in Form einer Anzahl von Daten-Rahmen feststellen durch Berechnen der Differenz zwischen den spektralen Abstandswerten, die mit dem Graph A und den spektralen Abstandswerten, die mit dem Graph B, dem Graph C wie in 13 gezeigt verbunden sind. Die resultierende Differenz sollte dann einer Stufen-Funktion gleichen, wobei eine Region in der Nähe zu einem Null-Kreuzungspunkt den berechneten Ort L der Unstetigkeit entlang des Abschnitts A_i des Testsignals repräsentiert.
Der Unstetigkeits-Berechnungsalgorithmus 720 kann auch die berechnete Größe S der Unstetigkeit entlang des Abschnitts A_i bestimmen, z. B. in Form einer Anzahl von Daten-Rahmen durch Berechnen der Anzahl von Rahmen zwischen dem Auftreten der Unstetigkeit wie in Graph A gezeigt und dem Ende der Unstetigkeit wie in Graph B gezeigt. Die Größe S der Unstetigkeit ist in 13, Graph D, dargestellt.
14 stellt detaillierter eine Technik dar, die verwendet werden kann zum Berechnen der Größe S der in 13 durch Graph D dargestellten Unstetigkeit. In 14 existiert eine Unstetigkeit zwischen den Sync-Punkt-Segmenten Pt₁ und Pt₂. Die Länge S der Unstetigkeit, die repräsentiert sein kann durch eine Anzahl von Samplen, kann berechnet werden durch Bestimmen der Differenz zwischen der Länge D_t entlang des Testsignals und der Länge D_t entlang des Referenzsignals. Natürlich sollte die Länge S eingestellt werden um jegliche kontinuierliche variable Verzögerung zu kompensieren.
Der Unstetigkeits-Berechnungsalgorithmus 720 kann natürlich den Ort L und die Größe S jeder Unstetigkeit berechnen. Demzufolge ist die Ausgabe des Unstetigkeits-Berechnungsalgorithmus 720 ein Vektor {(L₁, S₁); L₂, S₂)...} wobei jedes Vektorelement einen Unstetigkeits-Ort L und eine Unstetigkeits-Größe S enthält.
Wie oben erwähnt stellt das Vor-Bearbeitungsmodul 315 das Referenz- und/oder Testsignal so ein, dass sie in der Zeit-Domäne gleich skaliert sind. Das Vor-Bearbeitungsmodul 315 erreicht dies durch Entfernen aus dem Testsignal und/oder des Referenzsignals jedes Abschnitts, der mit einer intermittierenden Verzögerung verbunden ist (d. h. einer Unstetigkeit). Natürlich bildet das Vor-Bearbeitungsmodul 315 die Grundlage zum Entfernen von speziellen Abschnitten des Test- und/oder Referenzsignals, die mit einer intermittierenden Verzögerung verbunden sind, auf der Vektorinformation {(L₁, S₁); L₂, S₂)...}, die durch den Entscheidungsalgorithmus 310 und im Genaueren durch den Unstetigkeits-Berechnungsalgorithmus 720 produziert wurde. Des weiteren eliminiert das Vor-Bearbeitungsmodul 315 von dem Test- und/oder Referenzsignals jede kontinuierliche Verzögerungsvariation Δf, wobei die kontinuierliche Verzögerungsvariation Δf abgeleitet ist durch den kontinuierlichen Verzögerungs-Variations-Berechnungsalgorithmus 715. Ein Standardsprach-Qualitäts-Berechnungsalgorithmus 320 kann dann eingesetzt werden, um eine genaue Sprachqualitätsberechnung basierend auf dem eingestellten Referenz- und/oder Testsignal abzuleiten.
Der Auswertungs-Einstellungsalgorithmus 325 erzeugt eine Messung von erkannter Sprachqualität. Der Auswertungs-Einstellungsalgorithmus 325 erzeugt diese erkannte Sprachqualitätsmessung durch Einstellen der Sprachqualitätsberechnung, die durch den Standardsprach-Qualitäts-Berechnungsalgorithmus 320 produziert wurde. Der Auswertungs-Einstellungsalgorithmus 325 stellt die Sprachqualitätsberechnung basierend auf jeder einen oder mehreren Variablen ein, die abgeleitet sind aus der kontinuierlichen und/oder intermittierenden Verzögerungsinformation, die durch den Entscheidungsalgorithmus 310 erzeugt wurden. Beispielsweise kann der Auswertungs-Einstellungsalgorithmus 325 die Sprachqualitätsberechnung einstellen basierend auf der Anzahl von Unstetigkeiten, die identifiziert wurden, der Länge jeder einen oder mehreren identifizierten Unstetigkeiten, dem Inhalt der Daten-Rahmen, die mit einer Unstetigkeit zusammenfallen oder dem Grad von kontinuierlicher variabler Verzögerung.
Es ist anzumerken, dass die vorliegende Erfindung beschrieben wurde in Übereinstimmung mit exemplarischen Ausführungsformen, die in allen Aspekten darstellend aber nicht begrenzend sind. Somit ist die vorliegende Erfindung in vielen Variationen mit detaillierten Ausführungsformen möglich, die abgeleitet werden können aus der Beschreibung, die hier durch einen Fachmann enthalten sind. All solche Variationen sind innerhalb des Bereichs der vorliegenden Erfindung, die lediglich durch die folgenden Ansprüche limitiert ist.

Claims

Ein Verfahren zum Berechnen von Sprachqualität, umfassend die Schritte: Identifizieren von Teilen eines ersten Sprachsignals, das durch Übertragungsverzögerungen verursachte Verzerrungen aufweist; Entfernen der identifizierten Teile von dem ersten Sprachsignal; Vergleichen des ersten Sprachsignals mit einem zweiten Sprachsignal, nachdem die identifizierten Teile von dem ersten Sprachsignal entfernt wurden; und Erzeugen einer Sprachqualitätsberechnung basierend auf dem Vergleich des ersten Sprachsignals mit dem zweiten Sprachsignal.
Das Verfahren nach Anspruch 1 ferner umfassend die Schritte: Analysieren der identifizierten Teile des ersten Sprachsignals; und Anpassen der Sprachqualitätsberechnung basierend auf der Analyse der identifizierten Teile des ersten Sprachsignals.
Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln, wie viele Teile des ersten Sprachsignals durch Übertragungsverzögerung verursachte Verzerrungen aufweisen.
Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln der Größe der identifizierten Teile des ersten Sprachsignals.
Das Verfahren nach Anspruch 2, wobei der Schritt zum Analysieren der identifizierten Teile des ersten Sprachsignals den Schritt umfasst: Ermitteln des Sprachinhalts der identifizierten Teile des ersten Sprachsignals.
Das Verfahren nach Anspruch 1, wobei das zweite Sprachsignal ein Referenzsprachsignal ist, und wobei das Referenzsprachsignal das erste Sprachsignal vor der Übertragung des ersten Sprachsignals reflektiert.
Das Verfahren nach Anspruch 1 für ein Telekommunikationsnetz, in dessen Netz das erste Sprachsignal über eine Übertragungskette zu einer empfangenden Einheit transportiert wird, wobei das zweite Sprachsignal ein Referenzsignal ist, wobei der Schritt des Identifizieren umfasst: Ausrichten jedes einer Anzahl von Synchronisationspunkten entlang des ersten Sprachsignals mit einem entsprechenden einer Anzahl von Synchronisationspunkten entlang des Referenzsprachsignals an der empfangenden Einheit; Ermitteln, basierend auf der Ausrichtung der Synchronisationspunkte entlang des ersten Sprachsignals und den Synchronisationspunkte entlang des Referenzsprachsignals, ob Teile des ersten Sprachsignals eine intermittierende Verzögerungsvariation reflektieren; Ermitteln eines Grades der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist; wobei der Schritt zum Entfernen umfasst: Anpassen des ersten Sprachsignals oder des Referenzsprachsignals, um den Grad der von dem ersten Sprachsignal aufgewiesenen kontinuierlichen Verzögerungsvariation und einen Teil des ersten Sprachsignals, der eine intermittierende Verzögerungsvariation reflektiert, zu berücksichtigen.
Das Verfahren nach Anspruch 7, ferner umfassend den Schritt: Anpassen der berechneten Sprachqualität basierend auf dem Grad der kontinuierlichen Verzögerungsvariation.
Das Verfahren nach Anspruch 7, ferner umfassend die Schritte: Analysieren von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektiert; und Anpassen der berechneten Sprachqualität basierend auf der Analyse der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst: Ermitteln der Zahl von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst Ermitteln der Länge der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
Das Verfahren nach Anspruch 9, wobei der Schritt des Analysierens von Teilen des ersten Sprachsignals, die eine intermittierende Verzögerung reflektieren, den Schritt umfasst: Ermitteln des Sprachinhalts der Teile des ersten Sprachsignals, die eine intermittierende Verzögerungsvariation reflektieren.
Das Verfahren nach Anspruch 7, wobei das erste Sprachsignal ein Testsignal ist, und wobei das erste Sprachsignal vor der Übertragung mit dem Referenzsprachsignal identisch ist.
Das Verfahren nach Anspruch 1 für ein paketgeschaltetes Telekommunikationsnetz, wobei Sprachsignale über eine Übertragungskette zu einer Empf angseinheit transportiert werden, wobei das zweite Signal ein Referenzsignal ist, wobei der Schritt des Identifizierens umfasst: Ausrichten jedes einer Anzahl von Sync-Punkt-Segmenten entlang eines ersten Sprachsignals mit einem entsprechenden Sync-Puls-Segment entlang des Referenzsprachsignals, wobei das erste Sprachsignal über die Übertragungskette zu der Empfangseinheit transportiert wurde, und wobei das Referenzsignal mit dem ersten Sprachsignal identisch ist, bevor das erste Sprachsignal über die Übertragungskette transportiert wurde; Identifizieren, ob eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals existiert; Ermitteln eines Standortes und Größe von jeder identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals; Ermitteln eines Grades von kontinuierlicher Verzögerungsvariation, die das erste Sprachsignal aufweist; wobei der Schritt des Entfernens umfasst: Anpassen des ersten Sprachsignals oder des Referenzsprachsignals, um die Präsenz von einer intermittierenden Verzögerungsvariation und des Grades von kontinuierlicher Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen; und dessen Verfahren ferner den Schritt umfasst: Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erreichen, wobei die Anpassung der berechneten Sprachqualität, wenn überhaupt, auf den intermittierenden Verzögerungsvariationen basiert und dem Grad der kontinuierlichen Verzögerungsvariation.
Das Verfahren nach Anspruch 14, wobei der Schritt des Identifizierens, ob eine intermittierende Verzögerungsvariation zwischen angrenzenden Sync-Punkt-Segmenten entlang des ersten Sprachsignals existiert, die Schritte umfasst: Bewerten der Länge des ersten Sprachsignals zwischen jedem Paar angrenzender Sync-Punkt-Segmente; Ermitteln, ob die Länge des ersten Sprachsignals zwischen einem Paar von angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist; und Einrichten, dass eine intermittierende Verzögerungsvariation entlang des ersten Sprachsignals, zwischen zwei angrenzenden Sync-Punkt-Segmenten, vorhanden ist, wenn ermittelt ist, dass die Länge zwischen zwei angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist.
Das Verfahren nach Anspruch 15, wobei der Schritt des Ermittelns, ob die Länge des ersten Sprachsignals zwischen einem Paar von angrenzenden Sync-Punkt-Segmenten ungewöhnlich ist die Schritte umfasst: Ermitteln der Differenz zwischen der Länge des ersten Sprachsignals zwischen jedem Paar von angrenzenden Sync-Punk-Segmenten und der Länge des Referenzsprachsignals zwischen jedem entsprechenden Paar von angrenzenden Sync-Punkt-Segmenten; und Vergleichen jedes Differenzwertes zu dem Schwellenwert.
Das Verfahren nach Anspruch 16, wobei der Schwellenwert auf einen gewichteten Median der Differenzwerte basiert.
Das Verfahren nach Anspruch 16, wobei der Schwellenwert empirisch abgeleitet ist.
Das Verfahren nach Anspruch 14, wobei der Schritt des Ermittelns eines Standortes und Größe einer identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals die Schritte umfasst: Ausrichten einer Länge des ersten Sprachsignals zwischen zwei angrenzenden Sync-Punkt-Segmenten, das identifiziert wurde, eine intermittierende Verzögerung aufzuweisen, mit einer Länge entlang des Referenzsignals zwischen zwei entsprechenden angrenzenden Sync-Punkt-Segmenten, wobei beim Ausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten und der Länge des Referenzsprachsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten ein erstes der zwei angrenzenden Sync-Punkt-Segmente mit einem entsprechenden der beiden Sync-Punkt-Segmente ausgerichtet wird; Ableiten einer ersten Serie von spektralen Abstandswerten basierend auf der Ausrichtung der Länge des ersten Sprachsignals und der Länge entlang des Referenzsignals; Nachausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten mit der Länge entlang des Referenzsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten, wobei beim Nachausrichten der Länge des ersten Sprachsignals zwischen den zwei angrenzenden Sync-Punkt-Segmenten und der Länge des Referenzsprachsignals zwischen den zwei entsprechenden Sync-Punkt-Segmenten eine zweite der zwei angrenzenden Sync-Punkt-Segmenten mit einer zweiten der zwei entsprechenden Sync-Punkt-Segmenten nachträglich ausgerichtet wird; und Ableiten einer zweiten Serie von spektralen Abstandswerten basierend auf dem Nachausrichten der Länge des ersten Sprachsignals und der Länge entlang des Referenzsignals.
Das Verfahren nach Anspruch 19, wobei der Schritt des Ermittelns des Standortes und Größe einer identifizierten intermittierenden Verzögerungsvariation entlang des ersten Sprachsignals ferner die Schritte umfasst: Vergleichen der ersten Serie der spektralen Abstandwerte mit der zweiten Serie der spektralen Abstandwerte; und Messen eines Abstandes zwischen einem mit der ersten Serie von spektralen Abstandswerten verbundenen Übergang und einem mit der zweiten Serie von spektralen Abstandswerten verbundenen Übergang, wobei der gemessene Abstand die Größe einer entsprechenden intermittierenden Verzögerungsvariation darstellt.
Das Verfahren nach Anspruch 19, wobei der Schritt des Ermittelns des Standortes und Größe einer identifizierten Verzögerungsvariation entlang des ersten Sprachsignals ferner die Schritte umfasst: Ableiten einer Serie von Differenzwerten durch Berechnen der Differenz zwischen jedem der Werte, die mit der ersten Serie von spektralen Abstandswerten verbunden ist, und einem entsprechenden Wert, der mit der zweiten Serie von spektralen Abstandswerten verbunden ist; und Ermitteln des Standortes einer entsprechenden intermittierenden Verzögerungsvariation basierend auf einem Übergang, der mit der Serie von Differentwerten verbunden ist.
Das Verfahren nach Anspruch 14, wobei der Schritt des Ermittelns des Grades der kontinuierlichen Verzögerungsvariation, die das erste Sprachsignal aufweist, die Schritte umfasst: Auswählen einer Anzahl von Sync-Punkt-Frequenzen, die mit den Sync-Punkt-Segmenten entlang des ersten Sprachsignals verbunden sind, wobei die selektierte Anzahl von Sync-Punkt-Frequenzen Frequenzen beinhaltet, die kleiner sind als eine mit den Sync-Puls-Segmenten entlang des Referenzsignals verbundenen Sync-Puls-Frequenz, und Frequenzen, die größer sind als die Sync-Puls-Frequenz; für jede der ausgewählten Sync-Punkt-Frequenzen, Vorausberechen eines Standortes für jedes Sync-Punkt-Segment entlang des ersten Sprachsignals als eine Funktion der ausgewählten Sync-Punkt-Frequenz und bekannten Standortes der Sync-Puls-Segmente entlang des Referenzsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Vergleichen des vorausberechneten Standortes von jedem Sync-Punkt-Segment entlang des ersten Sprachsignals mit einem tatsächlichen Standort des Sync-Punkt-Segmentes entlang des ersten Sprachsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Vergleichen des vorausberechneten Standortes für jedes Sync-Punkt-Segment entlang des ersten Sprachsignals mit einem tatsächlichen Standort des Sync-Punkt-Segmentes entlang des ersten Sprachsignals; für jede der ausgewählten Sync-Punkt-Frequenzen, Ableiten eines Tauglichkeitswertes, wobei der Tauglichkeitswert auf einen Betrag des Standortfehlers zwischen dem vorhergesagten Standort jedes Sync-Punkt-Segmentes und dem tatsächlichen Standort des Sync-Punkt-Segmentes basiert; Identifizieren eines maximalen Tauglichkeitswertes unter den Tauglichkeitswerten, die für jede der selektierten Sync-Punkt-Frequenzen abgeleitet wurde; Ermitteln, ob der maximale Tauglichkeitswert einen Schwellenwert überschreitet; und Ermitteln des Grades der kontinuierlichen Verzögerungsvariationen als eine Funktion der ausgewählten Sync-Punkt-Frequenzen, die mit dem maximalen Tauglichkeitsswert und der Sync-Puls-Frequenz verbunden sind.
Das Verfahren nach Anspruch 22, ferner den Schritt umfassend: Bestimmen des Grades der kontinuierlichen Verzögerungsvariation zu Null, wenn der maximale Tauglichkeitswert den Schwellenwert überschreitet.
Das Verfahren nach Anspruch 22, ferner den Schritt umfassend: vor Auswählen der Anzahl von Sync-Punkt-Frequenzen Ermitteln, ob es am wahrscheinlichsten ist, dass das erste Sprachsignal eine kontinuierliche Verzögerungsvariation aufweist.
Das Verfahren nach Anspruch 24, wobei der Schritt des Ermittelns, ob der maximale Tauglichkeitswert den Schwellenwert überschreitet, den Schritt umfasst: Vergleichen des maximalen Tauglichkeitswertes mit einem ersten Schwellenwert, wenn ermittelt wurde, dass das erste Sprachsignal am wahrscheinlichsten eine kontinuierlich Verzögerungsvariation aufweist, und mit einem zweiten Schwellenwert, wenn ermittelt wurde, dass das erste Sprachsignal unwahrscheinlich eine kontinuierliche Verzögerungsvariation aufweisen wird, wobei der erste Schwellenwert kleiner ist als der zweite Schwellenwert.
Das Verfahren nach Anspruch 14, ferner den Schritt umfassend: Identifizieren einer Anzahl von Sync-Punkt-Segmenten, wobei jedes, das einer Länge entlang des ersten Sprachsignals folgt, am wahrscheinlichsten eine intermittierende Verzögerungsvariation reflektiert.
Das Verfahren nach Anspruch 26, wobei der Schritt des Ermittelns des Grades der kontinuierlichen Verzögerungsvariation, die das ersten Sprachsignal aufweist, auf einem Standort von jedem Sync-Punkt-Segment entlang des ersten Sprachsignals basiert, ausschließlich der Sync-Punkt-Segmente, die identifiziert wurden, einer Länge entlang des ersten Sprachsignals, das am wahrscheinlichsten eine intermittierende Verzögerungsvariation reflektiert, zu folgen.
Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der abgeschätzten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, die Schritte umfasst: Ermitteln der Anzahl der intermittierenden Verzögerungsvariationen, die das erste Sprachsignal aufweist; und Anpassen der abgeschätzten Sprachqualität als eine Funktion der Anzahl der intermittierenden Verzögerungsvariationen, die das erste Sprachsignal aufweist.
Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion der Größe von jeder intermittierenden Verzögerungsvariation.
Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion des mit jeder Verzögerungsvariation verbundenen Sprachinhaltes.
Das Verfahren nach Anspruch 14, wobei der Schritt zum Anpassen der berechneten Sprachqualität, um eine anerkannte Sprachqualität zu erzielen, den Schritt umfasst: Anpassen der berechneten Sprachqualität als eine Funktion des Ausmaßes und der Art der kontinuierlichen Verzögerungsvariation.
Das Verfahren nach Anspruch 14, wobei der Schritt des Anpassens des ersten Sprachsignals oder des Referenzsprachsignals, um die Präsenz einer intermittierenden Verzögerungsvariation und des Grades der kontinuierlichen Verzögerungsvariation entlang des ersten Sprachsignals zu berücksichtigen, den Schritt umfasst: Skalieren des ersten Sprachsignals oder des Referenzsprachsignals, so dass das erste Sprachsignal und das Referenzsprachsignal gleichermaßen in dem Zeitbereich skaliert sind.