-
Diese
Erfindung bezieht sich auf die Einschätzung der Qualität von Kommunikationssystemen.
-
Im
zunehmend liberalisierten Telekommunikationsmarkt ist die Differenzierung
durch Qualität ein
wichtiger Faktor. Die weit verbreitete Installation von Kodierungseinrichtungen
in den letzten Jahren hat die Notwendigkeit einer neuen Generation
von Schätzverfahren
hervorgebracht. Die herkömmliche Analyse
nimmt an, dass das System linear und zeitlich invariant ist, und
beschreibt es auf der Basis von Verzögerung, Frequenzantwort, Rauschpegel
und Rauschspektrum. Moderne Netzwerke zeigen bei weitem komplexere
Effekte und enthalten Elemente, wie etwa Sprachvermittlungen und
Kompressionscodecs, die hochgradig nichtlinear sind und zeitlich
variieren.
-
In
der Industrie werden zwei Hauptverfahren verwendet, um die subjektive
Qualität
von Netzwerken und ihren Komponenten zu überprüfen. In Hörprüfungen hört ein Runde von Versuchspersonen eine
Reihe von Geräuschabschnitten,
die simulierte Netzwerkbedingungen durchlaufen haben. Konversationsprüfungen erfordern
Paare von Versuchspersonen, um über
verschiedene simulierte Telefonverbindungen zu kommunizieren. In
beiden Fällen
werden die Versuchspersonen gewöhnlich
gebeten, aus einer fünf
Punkte umfassenden Skala von „ausgezeichnet" bis „schlecht" auszuwählen. Mittelwertbildung über alle
Versuchspersonen ergibt einen mittleren Meinungswert (MOS, mean
opinion score) für jede
Zustandsgröße, die
die subjektive Qualität
des Netzwerks widerspiegelt, während
zufällige
Fehler verringert werden, die bei einer subjektiven Abstimmung auftreten.
-
Die
Notwendigkeit, eine Anzahl von Versuchspersonen für diese
Art von Abschätzung
zu verwenden, macht das Verfahren teuer, und erschwert oder verhindert
seine Anwendung in dem „Live"- Telefonnetzwerk. Es ist deshalb wünschenswert,
eine Prüfeinrichtung
aufzubauen, die die Qualität
auf der gleichen Skala automatisch misst, und die die gleichen Werte,
wie den Mittelwert von verschiedenen herkömmlichen subjektiven Tests,
im Rahmen des experimentellen Fehlers und der subjektiven Erwartung
erzeugt. Wie später
diskutiert wird, sind Schätzeinrichtungen
entwickelt worden, die die Hörqualität von Sprache
voraussagen können,
die einer Richtung durch das Telefonnetzwerk läuft, und die erweitert worden
sind, indem veränderliche
Sprachpegel verwendet werden, um die Qualität der Konversation einer Hin-
und Rückverbindung
zu schätzen.
-
Der
aktuelle Stand der Forschung in diesem Gebiet ist, eine Anzahl von
Messungen mit dem zu prüfenden
Kommunikationssystem, wie etwa Echo, Verzögerung oder Sprachverschlechterung
auszuführen,
und die Qualität
des Systems aus diesen Messungen vorherzusagen. Diese Prüfungen vernachlässigen jedoch
die Reaktionen von Benutzern auf das Verhalten des Systems, das
wiederum die Art und Weise beeinflussen kann, wie das System seine Leistung
erbringt.
-
Telekommunikationsunternehmen
haben beträchtliche
Erfahrung, menschliche Versuchsperson zu verwenden, um die subjektive
Qualität
eines Kommunikationsnetzwerkes zu abschätzen. Dieses Wissen ist durch
internationale Gruppen aufgebaut wurden, wie etwa ETSI und ETU:
siehe z. B. Methods for subjective determination of transmission
quality: ITU-T Recommendation P.800. Subjektives Schätzen verwendet
eine Runde von Versuchsperson, die über eine Anzahl von Netzwerkbedingungen
als Kandidaten abstimmt. Ihre Wahlergebnisse werden gemittelt und
untersucht, und ergeben Informationen über die subjektive Qualität des Netzwerks.
Dieses Verfahren wird geschätzt,
weil die Werte direkt mit der Meinung der Leute zur Qualität im Zusammenhang
stehen. Im Gegensatz dazu korrelieren herkömm liche technische Größen wie
Signal-Rausch-Abstand im allgemeinen nicht gut mit der Sprachqualität. Die subjektiven
Prüfungen,
die für
die vorliegende Erfindung relevant sind, können folgendermaßen klassifiziert
werden:
-
Hören, wobei
die Versuchspersonen Abschnitte von Sprache hören, die durch Testnetzwerke geleitet
wurden, und darüber
abstimmen, was sie hören,
und
-
Konversation,
wobei zwei Versuchspersonen miteinander über zu prüfende Netzwerkverbindungen
sprechen, und über
die Sprachqualität
in jeder Konversation abstimmen.
-
Verschiedene
Fragen fordern die Versuchspersonen auf, über verschiedene Aspekte ihrer Wahrnehmung
des Netzwerkes abzustimmen, wie etwa Anstrengung oder Qualität.
-
Es
sind Methoden entwickelt worden (Models for predicting transmission
quality from objektive measurements: ITU-T P series recommendations: Supplement
3), um die Konversationsqualität
eines herkömmlichen,
linearen Netzwerks mit klassischen Größen der Signalverarbeitung
wie etwa Echo, Verzögerung
und Pegel abzuschätzen.
Diese Messungen beruhen auf der Analyse des Netzwerks mit künstlichen
Signalen – gewöhnlich Sinuswellen
oder Rauschpulse – die
nicht von einem Kommunikationsnetzwerk weitergeleitet werden können, das
für Sprache
entworfen ist.
-
Modelle
der menschlichen Wahrnehmung erlauben eine anspruchsvollere Analyse
der Sprachqualität,
die durch das Netzwerk übertragen
wird. Schlüsselmerkmale
der menschlichen Sinne, wie etwa Maskierung und Hörschwelle,
werden verwendet, um abzuleiten, ob Fehler in der Übertragung
hörbar
sind, und ihre Subjektivität
abzuschätzen. „Wahrnehmungsmässige" Verarbeitung auf
höherem
Niveau berücksichtigt
weiter den Umfang und die Verteilung von Fehlern und ihren Zusammenhang
mit gewissen Teilen der Sprache. Diese Berechnung ermöglicht die
Voraussage des subjektiven mittleren Meinungswertes, der sich durch
eine Reihe von subjektiven Prüfungen
ergäbe.
Solche Modelle sind in ITU-T Recommendation P.861: „Objektive
quality measurement of telephone-band (300–3400 Hz) speech codecs" und in den internationalen
Patentanmeldungen WO94/00922 und WO95/15035 beschrieben.
-
Die
oben beschriebenen Verfahren zur Konversationseinschätzung können verwendet
werden, um auf Wahrnehmung beruhende Qualitätsmessungen zu gewichten, um
wahrnehmungsbasierte Schätzungen
für den
Konversationswert abzuleiten. In einer ebenfalls angemeldeten internationalen
Patentanmeldung des Anmelders der vorliegenden Anmeldung (mit dem
gleichen Anmeldetag, die Priorität
aus den zwei selben Anmeldungen wie die vorliegende Anmeldung beansprucht),
die die Pegel der Sprache variiert, bis ein Gleichgewicht erreicht
wird, wobei die Anstrengung beim Zuhören geschätzt wird, und dann eine konversationsbezogene
Gewichtung verwendet, die auf Echo und Verzögerung basiert, um die Qualität der Verbindung
bezüglich
der Sprache in der Konversation abzuschätzen.
-
Es
gibt gute Gründe,
künstlich
erzeugte sprachähnliche
Signale statt Aufnahmen von menschlichen Sprechern zu verwenden,
um ein Netzwerk zu prüfen,
das dazu entworfen ist, Sprache zu übertragen. Insbesondere kann
künstliche
Sprache dazu gezwungen werden, präzise definierte Phoneme zu
enthalten, und ist leichter reproduzierbar, um den Vergleich der
Ergebnisse zu ermöglichen. Künstliche
Sprache, die für
die Konversationsprüfung geeignet
ist, ist in den interna tionalen Patentanmeldungen WO94/00922 und
WO095/01011 beschrieben.
-
Eine
dynamische Konversationprüfeinrichtung
kann die Änderung
verschiedener Eigenschaften der Sprache unter extremen Bedingungen
berücksichtigen.
Eine Beschreibung dieser Eigenschaften wird in der internationalen
Patentanmeldung WO096/06495 gegeben.
-
Zu
Beginn eines Anrufs, während
dem die Netzwerkqualität
geschätzt
werden soll, ist Wissen über
bestimmte Eigenschaften des Netzwerks, wie etwa Verzögerung und
Echo, nicht verfügbar.
Diese Eigenschaften beeinflussen jedoch den Ablauf der Konversation.
Darüber
hinaus berücksichtigt
ein fester Konversationsablauf nicht die menschliche Reaktion auf
Verluste in der Leitung, wie etwa Rauschen, Verzögerung oder Einfrieren (bei
Verlust eines Signals, z. B. wegen Kapazitätsproblemen im Netzwerk, oder
Verzögerungen
als Reaktion auf den Beginn des Signals), die ihrem Wesen nach zufällig sein
können.
-
Nach
der Erfindung wird ein Verfahren zum Prüfen eines Kommunikationssystems
bereitgestellt, bei dem eine erste Messeinrichtung einen Anruf durch
das System, das sie prüft,
zu wenigstens einer zweiten Messeinrichtung tätigt, und die Einrichtungen
sich mit vorher festgelegten Sprachsignalen unterhalten, und wenigstens
eine der Einrichtungen Messungen des Schalls durchführt, den
es von der anderen Einrichtung oder den Einrichtungen empfängt, um
einen oder mehrere Parameter zu berechnen, die Aspekte der empfangenen
Signalqualität
beschreiben, dadurch gekennzeichnet, dass die vorher festgelegten
Sprachsignale von jeder Einrichtung als Reaktion auf die Signale,
die von den Einrichtungen empfangen werden, dynamisch erzeugt werden,
um Aspekte von Konversation über
eine nicht-perfekte Verbindung
im Kommunikationssystem zu reproduzieren.
-
Dies
erlaubt eine dynamische Antwort auf Ereignisse, wie etwa Verlust
von Sprache, wobei das Verhalten von Menschen nachgeahmt wird, die
unter denselben Bedingungen kommunizieren. Verhalten wie etwa Abgeschnittensein
und Wiedergewinnung nach dem Verlust, die später beschrieben werden, können auch
eingebunden sein. Dies ermöglicht, dass
die Telekommunikationsverbindung auf repräsentative Weise als vorher
ausgewertet wird. Die Signale können
mit einer Anzahl von Verfahren eingeschätzt werden, um Messergebnisse
zu erhalten, die die Konversationsqualität des Systems genauer wiedergeben.
Insbesondere kann die Qualität
der Verbindung in dem Kommunikationssystem entsprechend dem Informationsgehalt
und/oder der Qualität des
empfangenen Antwortsignals und dem tatsächlichen Fortschritt der simulierten
Konversation bestimmt werden.
-
In
einer bevorzugten Anordnung antwortet eine Einrichtung, die ein
erwartetes Signal von einer anderen Einrichtung nicht klar empfängt, indem
sie ein festgelegtes Antwortsignal sendet, das, wenn es von der
anderen Einrichtung nicht verschlechtert empfangen wird, die andere
Einrichtung veranlasst, das erwartete Signal zu wiederholen. (Natürlich kann diese
Antwort selbst bei der Übertragung
verschlechtert werden, was die andere Einrichtung wiederum veranlasst,
auf andere Weise zu antworten, als auf diese Absicht).
-
Manche
der Signale, die zum Senden als Antwort auf die Eingangssignale
erzeugt werden, können
entsprechend der Qualität
der empfangenen Signal ausgewählt
werden, und manche können
Signale sein, die die Wiederholung eines empfangenen Signal anfragen,
die als Reaktion auf schlechte Qualität des empfangenen Signals ausgewählt werden können.
-
Eigenschaften
wie etwa Umfang oder Geschwindigkeit der Antwortsignale, die erzeugt
werden sollen, können
entsprechend der Qualität
des empfangenen Signals ausgewählt
werden.
-
Die
einzelnen Einrichtungen können
einrichtungsspezifische Identifikationssignale senden und erkennen,
die einen Teil der erzeugten Sprache bilden können, wie etwa gesprochene
Wörter,
was es folglich ermöglicht,
den einzelnen zu prüfenden
Pfad zu identifizieren.
-
Das
Verfahren kann einen Prozess zur Berechnung der Systemverzögerung enthalten,
bei dem ein erstes Signal von einer ersten Einrichtung an eine zweite
Einrichtung gesendet wird, wobei die zweite Einrichtung das erste
Signal empfängt,
und, nach einer vorher festgelegten Verzögerung ein Antwortsignal an
die erste Einrichtung sendet, und die Systemverzögerung aus der Übertragungszeit
des ersten Signals, dem Zeitpunkt des Empfangs des zweiten Signals
und der vorher festgelegten Verzögerung
bestimmt wird. Dieser Prozess misst die Umlaufverzögerung.
Es ist auch möglich,
die Verzögerungen
in eine Richtung zwischen zwei der Einrichtungen mit synchronisierten
Uhren zu messen, wobei eine der Einrichtungen ein Signal zu einer
anderen Einrichtung sendet, das die aktuelle Zeit anzeigt, und Verzögerung im
zu prüfenden
Systemen wird aus dem Vergleich des empfangenen Signals, das die
Zeit anzeigt, mit dem Empfangszeitpunkt bestimmt.
-
Die
verwendeten Signale können
vorher aufgenommene Muster menschlicher Sprache oder künstlich
erzeugte Sprachmuster sein, die mehrere verschiedene Sprecher darstellen.
-
In
einer bevorzugten Anordnung kann eine der Einrichtungen ein Signal
senden, wobei gleichzeitig ein anderes Signal von der gleichen Einrichtung
empfangen wird, derart, dass die Verschlechterung von dem einem
oder dem anderen der Signale an ihren jeweiligen Empfangsorten erfasst
werden kann.
-
Die
Erfindung kann verwendet werden, um die Konversationsqualität von Telefon-
und Telefonkonferenznetzwerken zu schätzen. Sie kann in Labormodellen
für Netzwerke
verwendet werden, z. B. bei der Entwicklung neuer Ausrüstung oder
bei der Planung von neuen Netzwerken, oder für die Beurteilung eines „Live"-Netzwerks, die entweder
in den Räumlichkeiten
des Kunden, in den örtlichen
Vermittlungen, oder, über
digitale Kommunikationsverbindungen, in der zentralen objektiven
Messstation installiert sind. Schließlich würde das Einbinden eines Modells
für den
Zustand der Konversation in das Übertragungssystem
des Netzwerks dem Netzwerk ermöglichen,
bezüglich
der Konversation optimierte Sprache unter Vorgaben wie etwa einer
begrenzten Bitrate zu liefern.
-
Im
Falle der Einschätzung
im Labor oder bei der Planung werden die Qualitätsvorhersagen verwendet, um
Entscheidungen bezüglich
der Auslegung zu treffen, wahrscheinlich in Verbindung mit einer
begrenzten Anzahl von subjektiven Prüfungen. Ausrüstung zum
Schätzen,
die in dem Netzwerk installiert ist, kann dazu verwendet werden,
Prüfanrufe durchzuführen, um
die Qualität
des Kernnetzwerks zu überwachen,
um die Qualität
des Netzwerks eines Wettbewerbers oder irgend eines anderen verbundenen
Netzwerks einzuschätzen,
oder die Qualität
der Anrufe zu garantieren, die einem Kunden geliefert werden. Eine
solche Ausrüstung
würde Ergebnisse an
einen zentralen Überwachungsstandort
senden; im Falle von Fehlfunktion könnte sie Alarm geben und Diagnoseinformationen
bereitstellen, um bei der Behebung der Fehler zu helfen.
-
Anwendungen
der Konversationseinschätzung
sind nicht auf herkömmliche
Telefonie beschränkt.
Die gleichen Verfahren können
auf andere Sprachübertragungssysteme
angewendet werden, wie etwa Internettelefone oder Audiokonferenzsysteme.
Außerdem
können
die Verfahren eingesetzt werden, um in der Audiokomponente von Bildtelefonen, audiovisuellen
Telefonkonferenzsystemen, oder gemeinschaftlichen Kommunikationsumgebungen,
wie etwa virtuellen Welten, zu arbeiten.
-
Man
kann sich vorstellen, dass ein Zustandsmodell der Konversation von
zwei menschlichen Sprechern in der Infrastruktur zur Bereitstellung
von Netzwerken verwendet werden kann, um sicherzustellen, dass unter
Vorgaben wie einer begrenzten Datenrate die Konversationsqualität für eine Anzahl von
Kunden optimiert werden kann.
-
Nach
einem anderen Aspekt wird eine Einrichtung zur Simulation einer
Konversation über
ein Kommunikationssystem zur Verfügung gestellt, mit:
einem
Speicher zum Speichern mehrerer Signale, die eine Konversation bilden,
einem
Empfänger
zum Empfangen von Signalen von einem oder mehreren komplementären Einrichtungen,
einer
Sendeeinrichtung zum Senden eines Signals an die komplementäre Einrichtung
oder die komplementären
Einrichtungen,
und eine Vergleichseinrichtung zum Vergleichen
von Signalen, die von dem Empfänger
empfangen wurden, in dessen Speicher Signale gespeichert sind;
gekennzeichnet
durch eine Auswahleinrichtung, die auf die Vergleichseinrichtung
reagiert, um ein Signal zum Senden an die komplementäre Einrichtung
oder die komplementären
Einrichtungen aus dem Speicher auszuwählen.
-
Ein
Messsystem kann aus einer Anzahl solcher Einrichtungen aufgebaut
sein. Um eine simulierte Konversation mit zwei Parteien über ein
Netzwerk zu erzeugen, können
zwei Einrichtungen verwendet werden. Um eine Konferenzschaltung
zu simulieren, können
drei oder mehr verwendet werden. Unter Laborbedingungen ist es für eine einzelne
solche Einrichtung möglich,
als beide/alle Enden der Konversation zu wirken, indem sie an/alle
Enden der zu prüfenden
Ausrüstung
angeschlossen wird. Unter diesen Umständen wirkt die Einrichtung
als ihre eigene „komplementäre Einrichtung" in dem oben verwendeten
Sinne.
-
Eine
der Einrichtungen hat eine Einrichtung zur Konversationseinleitung
zum Erzeugen eines Anfangssignals zum Senden durch die Sendeeinrichtung.
Eine oder mehrere der Einrichtungen haben eine Verarbeitungseinrichtung
zum Messen der Konversationsqualität des Kommunikationssystems.
Die Verarbeitungseinrichtungen können
Einrichtungen zum Überwachen
des Betriebs der Auswahleinrichtung enthalten, um den Fortschritt
einer Konversation abzuschätzen,
und/oder Einrichtungen zum Überwachen
der Qualität
von Signalen, die von den komplementären Einrichtungen durch die
Empfangseinrichtungen empfangen werden.
-
Die
Auswahleinrichtung hat vorzugsweise eine Einrichtung, um verschiedene
Signale zur Übertragung
auszuwählen,
dementsprechend, welches der vorher festgelegten Signale empfangen
wird, und ent sprechend der Qualität des empfangenen Signals.
Diese Einrichtung kann dazu eingerichtet sein, ein Signal auszuwählen, das
die Wiederholung eines empfangenen Signals als Antwort auf schlechte
Qualität
des empfangenen Signals anfragt.
-
Die
Auswahleinrichtung kann auch eine Einrichtung haben, um Eigenschaften
des Signals, das übertragen
werden soll, entsprechend der Qualität des empfangenen Signals auszuwählen.
-
Die
Verarbeitungseinrichtung kann eine Einrichtung enthalten, um den
Fortschritt der simulierten Konversation zu überwachen und dadurch die Qualität der Verbindung
durch das Kommunikationssystem zu bestimmen.
-
Eine
der Einrichtungen kann eine Berechnungseinrichtung für die Verzögerung enthalten,
die eine Einrichtung zur Bestimmung des Zeitpunkts umfasst, zu dem
ein erstes Signal an eine komplementäre Einrichtung gesendet wird,
eine Einrichtung zum Bestimmen des Zeitpunkts, zu dem ein festgelegtes Antwortsignal
von der komplementären
Einrichtung empfangen wird, eine Einrichtung zum Abrufen des Wertes
einer vorher festgelegten Verzögerung
in der komplementären
Einrichtung zwischen dem Empfang des ersten Signals und dem Senden
des Antwortsignals aus dem Speicher, und eine Einrichtung, um daraus
die zusätzliche
Verzögerung
zu bestimmen, die von dem zu prüfenden
System verursacht wird.
-
Zwei
oder mehr der Einrichtungen können synchronisierte
Uhren haben, wobei wenigstens eine der Einrichtungen eine Einrichtung
zum Senden eines Signals aufweist, das die aktuelle Zeit anzeigt, und
wenigstens eine andere der Einrichtungen eine Einrichtung zum Bestimmen
der Verzögerung
in dem zu prüfenden
System aufweist, in dem das empfangene Signal, das die Zeit anzeigt,
mit dem Empfangszeitpunkt verglichen wird.
-
Die
Einrichtungen können
Einrichtungen für das
gleichzeitige Senden und Empfangen von vorher festgelegten Signalen
und Einrichtungen aufweisen, um zu bestimmen, ob die vorher festgelegten
empfangenen Signale durch die Anwesenheit des gesendeten Signals
verschlechtert wurden.
-
Die
Schlüsselmessung,
die mit dem zu prüfenden
Netzwerk durchgeführt
werden soll, ist die Messung der Qualität von Sprache in der Konversation.
Diese Messung hängt
von einer Anzahl von verschiedenen Faktoren ab, wie etwa:
Subjektive
Sprachqualität;
Eigenecho
(die absichtlich eingebrachte elektrische Kopplung, die normalerweise
zwischen der Sprechteil und der Hörteil eines Telefons bereitgestellt
wird)
Verschlechterung der Sprache wegen Filtern und Kodieren
in jeder Richtung;
Schwierigkeiten bei der Kommunikation, die
von Netzwerkeigenschaften erzeugt werden, wie etwa:
Echo des
Sprechers (die ungewollte Rückkehr
eines Signale zu seinem Ursprungspunkt wegen elektrischer Fehlabstimmung
in dem System oder akustische Rückkopplung
bei einem Handgerät
am anderen Ende),
Echo des Hörenden (Vielfache Ankunft des
gleichen Signals mit zeitlichen Abständen)
Einfrieren (Fehlschlagen
des Sendens eines Teils eines Signals wegen Nichtverfügbarkeit
des Kanals, verzögertes
Ansprechen von Sprachaktivitätsdetektoren,
usw.).
-
Das
Einschätzen
dieser Netzwerkeigenschaften erfordert zwei Schritte; erstens das
Senden von Sprache über
das Netzwerk, und zweitens das Empfangen der Sprachsignale an jedem
Ende und Bestimmen der subjektiven Auswirkungen der beobachteten
Verschlechterungen in dem empfangenen Signal.
-
In
dieser Erfindung wird die Sprache, die über das Netzwerk gesendet wird,
als Reaktion auf empfangenen Signale mit einem Konversationsmodell
dynamisch variiert.
-
Weil
jedoch beide Einrichtungen einen vorher festgelegten Satz von Antworten
auf jedes Signal haben (die auszuwählende Antwort ist davon abhängig, welches
Signal empfangen wird, und von der Qualität dieses Signals), zeigen die
Antworten, die von einer Einrichtung empfangen werden, die Signalqualität an, die
von der anderen empfangen wurde, und die Konversation wird erzwungen,
sodass Vergleichsmessungen möglich
sind.
-
Spezialisiertere
Messungen können
gleichzeitig ausgeführt
werden, damit verschiedene Verschlechterungen für die Netzwerkdiagnose charakterisiert
werden können.
Die Aufnahmen empfangener Sprache, Wissen über die Sprache, die gesendet wurde,
(das auch in dem Konversationsmodell verfügbar ist), sind ausreichend
für diese
Messungen, die Folgendes enthalten:
Echos von dem lokalen und
dem anderen Ende der Verbindung, oder von irgendwelchen Zwischenpunkten;
Verschlechterungen
wegen der (zeitlich variierenden) Betriebsweise der Echokompensatoren;
Verlust
oder Verstärkung
der Lautstärke
der Sprache, und Variationen dieses Verlustes mit der Zeit und dem
Sprachpegel;
Einfrieren (auch als Aussetzfehler bekannt) wegen augenblicklicher Überlast
auf verschiedenen Kanälen – ein besonderes
Beispiel wird beobachtet, wenn Intervalle zwischen Sprache verwendet
werden, um Datenpakete zu transportieren: der Beginn einer Äußerung kann
verloren gehen, da das System die Übertragung eines Paketes vollendet;
Rauschen,
das wegen elektrischer Quellen oder Kreuzkopplung mit Daten oder
Sprachsignalen bestehen kann;
Unfähigkeit des Systems, mit „Doppelsprechen" (die Übertragung
von Sprache in beide Richtungen gleichzeitig) umzugehen.
-
Das
zu prüfende
Netzwerk enthält
wahrscheinlich Elemente, die speziell entworfen sind, um mit Sprache
zu arbeiten. Zum Beispiel sind Sprachcodecs darauf trainiert, die
verschiedenen Teile der Sprache gut zu kodieren, können sich
aber erratisch verhalten, wenn nichtsprachliche Signale, wie etwa Töne oder
weißes
Rauschen, sie durchlaufen. Ein weiterer bemerkenswerter Punkt ist,
dass die Anwesenheit von nichtsprachlichen Signalen, wie etwa Tönen, die
Eigenschaften des Systems verändern
kann In extremen Fällen
können
gewisse Töne
Echokompensatoren ausschalten oder das System veranlassen, den Kanal
für Datenverkehr
freizumachen.
-
Es
ist deshalb vorteilhaft, dass ein System zum Einschätzen der
Qualität
eines solchen Netzwerkes zur Durchleitung von Sprache nur Sprach- oder
sprachähnliche
Signale bei seinen Prüfungen verwendet.
Das heißt
nicht, dass das Netzwerk nicht nach seiner Fähigkeit eingeschätzt werden
soll, Töne (wie
etwa DMTF-Ziffern) und Daten zu übertragen, sondern
bloß,
dass dies ein separates Problem ist.
-
Gewisse
Eigenschaften von Sprache in der Konversation hängen von der Qualität des Übertragungsnetzwerks
ab. Sprachpegel und Sprachton ändern
sich als Reaktion auf Pegel oder Verschlechterung der empfangenen
Sprache. Das Konversationsmuster wird durch Eigenschaften wie etwa
Verzögerungen
beeinflusst, das in Verhalten wie etwa erhöhter Wahrscheinlichkeit von
Doppelsprechen und „Fehlstarts" resultiert, die
auftreten, wenn beide Parteien ungefähr zur gleichen Zeit anfangen
zu sprechen, und eine oder beide von ihnen aufhören, wenn ihnen klar wird,
dass der andere auch spricht. Menschliche Sprecher durchlaufen Prozesse
der Resynchronisation, nachdem Sprache verloren gegangen ist, oder
ein Fehlstart gemacht wurde. Diese Eigenschaften können in
das Konversationsmodell eingeschlossen werden, um sicherzustellen,
dass das künstliche
Prüfen
des Netzwerks auf repräsentative Weise
ausgeführt
wird.
-
Andere
veränderliche
Aspekte der Sprache sind dadurch bedeutsam, dass sie verschiedenes Verhalten
in dem Netzwerk herbeiführen
können,
und folglich bei der Übertragung
verschieden verschlechtert werden. Aspekte der Kultur und von Eigenschaften
des Sprechers können
auch Veränderungen
der Systemleistung verursachen. Obwohl diese Effekte komplexer als
die oben aufgelisteten sind, macht es ihr Einfluss auf die subjektive
Qualität
wert, sie zu betrachten. Beispieleffekte umfassen: Geschlecht des Sprechers;
Sprache, Grammatik und Vokabular; formelle oder informelle Sprache;
Informationsgehalt – ob
es wichtig ist, dass die Sprache richtig verstanden wird; und die
Bestimmtheit des Sprechers – Bestimmen
des Wesens der Veränderung
des Sprachpegels mit dem empfangenen Pegel.
-
Diese
Klassen der Veränderlichkeit
können berücksichtigt
werden, indem mehrere verschiedene Konversationsmodelle verwendet
werden, um verschiedene Sprecher und Sprachen zu simulieren, um eine
Gesamtqualitätseinschätzung zu
gewinnen.
-
Eine
Anzahl von Netzwerkeigenschaften, die oben beschrieben wurden, können mit
der Zeit variieren. Zum Beispiel können Echokompensatoren eine gewisse
Zeitdauer zum Trainieren benötigen,
während
dieser Trainingsdauer können
unerwartete und verwirrende Geräusche
gehört
werden, und diese zeitliche Veränderlichkeit
und die Auswirkungen auf höheren
Ebenen der Wahrnehmung davon, wo in dem Konversationsmuster die
Verschlechterungen auftreten, müssen
berücksichtigt
werden.
-
Eine
Ausführung
der Erfindung wird nun mit Bezug auf die Figuren beschrieben, in
denen:
-
1 eine schematische Darstellung
eines Qualitätsschätzsystems
ist,
-
2 eine schematische Darstellung
einer allgemeinen Anordnung einer Schätzeinrichtung für Konversation
nach der Erfindung ist,
-
die 3 und 4 Flussdiagramme sind, die den Prozess
darstellen, der jeweils von zwei solcher Vorrichtungen ausgeführt wird,
die eine Konversation simulieren,
-
5 eine solchen Konversation
unter idealen Bedingungen darstellt,
-
6 den Fortschritt einer
solchen Konversation in Gegenwart von verschiedenen Umständen der
Verschlechterung der Leitung darstellt.
-
Ein
Abriss der Strukturen eines Qualitätsschätz (QA, quality assessment)
systems mit zwei Einrichtungen ist in 1 gezeigt.
Wie in 1 gezeigt ist
an jedem Ende 21 und 22 des zu prüfenden Netzwerks 20 ein
Messgerät
oder ein Prüfer
angeordnet. Eine Einrichtung (der „Urheber") 21 baut einen Anruf auf angemessene
Weise auf und leitet eine Konversation mit einem oder mehreren Empfangseinrichtungen
(„Ziele") 22 (nur
eines gezeigt) ein; die Einschätzung
einer Audiokonferenzverbindung würde
eine solche Einrichtung für
jede Partei in dem Anruf erfordern. Wenn die Konversation einmal
eingeleitet ist, verhalten sich alle Einrichtungen 21, 22 usw. auf ähnliche
Weise.
-
Während des
Anrufs kommunizieren die Einrichtungen 21 und 22 über das
Netzwerk 20 mit sprachähnlichen
Signalen. Die Signale, die von jeder Einrichtung gesendet werden,
werden durch ein Konversationsmodell bestimmt, das bestimmt, was „gesprochen" wird, auf Basis
davon, was empfangen wurde und durch einen zu Grunde liegenden Zustand,
der den gewünschten
Inhalt („Konversationsabsicht") des Anrufs kodiert.
Die Qualitätseinschätzung wird
von wenigstens einer Einrichtung, und vorzugsweise von allen von
ihnen ausgeführt,
basierend auf der ankommenden Sprache und auf Wissen über die Signale,
die von der anderen Einrichtung oder den anderen Einrichtungen gesendet
worden wären. Es
ist möglich,
aber nicht notwendig, dass diese Einschätzung in Echtzeit ausgeführt wird,
wenn die Sprache empfangen wird, aber die empfangene Sprache kann
aufgenommen und nachfolgend beurteilt werden. Um eine umfassende
Einschätzung
der Qualität
der Verbindung als Ganzes zu erhalten, können die Ergebnisse der Einschätzung, die
von jeder Einrichtung ausgeführt
wurde, zu jedem anderen oder einem Netzwerkverwaltungszentrum 23 gesendet
werden, um die verschiedenen Messungen zusammenzufassen. Das Netzwerkverwaltungszentrum
kann die Qualitätsmessungen
einem Mitarbeiter anzeigen, oder kann dazu eingerichtet sein, auf
die Messungen hin automatisch zu handeln, z. B. die Leitweglenkung
für einen
Anruf erneut durchzuführen,
bei dem geringe Qualität
festgestellt wurde, oder das Wartungspersonal zu alarmieren.
-
Jede
Einrichtung 21 und 22 in einer Konversation hat
ihren eigenen Zustand: d. h. ein vorher festgelegter Satz von Antworten
auf vorgegebene Stimuli, die dementsprechend variieren, welche Stimuli
empfangen werden, und entsprechend der wahrgenommen Qualität dieser
Stimuli. Wie in 2 gezeigt
ist, hat jede Einrichtung 21 und 22 Wissen über den
Zustand (51, 61) von sich selbst und der anderen
Einrichtung oder den anderen Einrichtungen. Während einer perfekten Konversation
(ohne Verlust oder Verzögerung)
würde jede
Einrichtung 21 und 22 eine vorher festgelegte
Abfolge von Sätzen
oder Wörtern
als Antwort auf Sätze
sprechen, die von der anderen Einrichtung empfangen wird. Der Zustand wird
genauer definiert, um darzustellen, ob die Einrichtung hört, und
die Sprache, die sie unter verschiedenen Umständen erzeugt. Nach Verlusten
in der Leitung unternimmt die Einrichtung Schritte zur Wiederherstellung,
indem eine gesprochene Resynchronisation mit den anderen Einrichtungen
aus geführt wird.
Die Veränderung
des Zustands („Zustandsbahn") wird durch einen
Vergleich zwischen dem, was empfangen wurde, und dem erwarteten
Signal, und durch eine vorher festgelegte gewünschte Abfolge von Sprache
bestimmt, die zwischen den Einrichtungen weitergegeben werden soll
(„Absicht
der Konversation").
Das Modell ist deshalb in zwei Teile abstrahiert, einen Zustand
(die aktuelle Aktion) und einen Prozessor, der die Übergänge der
Zustände
bestimmt.
-
Der
Vergleich zwischen empfangener und erwarteter Sprache wird mit einer Ähnlichkeitsanalyse
durchgeführt,
wie etwa den oben beschriebenen Wahrnehmungsmodellen, die Faktoren
wie Echo, Rauschen und Filterung des Signals berücksichtigen. Wenn die Sprache
die erwartete Abfolge von Geräuschen
mit weniger als einer definierten Menge von Verlusten enthält, beginnt
die Einrichtung entweder zu sprechen oder fährt in Abhängigkeit der vorher festgelegten
Absicht der Konversation fort, zuzuhören.
-
Wenn
etwas Unerwartetes gehört
wird (wie etwa Verzerrung, Sprachverlust, oder ein vorher festgelegtes
Wiederherstellungssignal von einer anderen Einrichtung oder anderen
Einrichtungen), wird das Wiedergewinnungsverhalten eingeleitet,
wobei wieder eine vorher festgelegte Abfolge von Geräuschen verwendet
wird. Das Wiedergewinnungsverhalten kann rekursiv sein, wobei es
während
einem andauernden Verlust der Signalqualität fortgesetzt wird. Die Tatsache,
dass die Wiedergewinnung ausgeführt
wurde, kann gewisse Merkmale des zukünftigen Inhalts der Konversion
des Anrufs verändern. Die
Merkmale der empfangenen Sprache bestimmen auch bestimmte Parameter
der erzeugten Sprache (wie etwa Sprachpegel und Ton).
-
Um
bei der Handhabung bei der Verarbeitung von ankommenden Signale
zu helfen, kann die Sprache, die von jeder Einrichtung kom muniziert wird,
mit einer bestimmten Identität
markiert werden, genauso wie menschliche Sprecher durch ihre Sprache
identifiziert werden können.
Einrichtungen können
sich selbst auch klar durch einen Namen oder eine erkannte Identitätssequenz
identifizieren.
-
Ein
Modell des Konversationszustands, wie es gerade beschrieben wurde,
kann bei der Einschätzung
der Konversationsqualität
eines Netzwerkes wie folgt angewendet werden. Eine oder mehrere Einrichtungen
bauen einen Anruf auf, durch den sie miteinander kommunizieren können. Jede
hat eine verschiedene Abfolge von Informationen zum Senden an die
anderen Einrichtungen, und hat vorab das Wissen, was sie als Antwort
hören sollte.
Die Einrichtungen unterhalten sich, wobei sie ein Modell des Konversationszustands
verwenden, das es ihnen erlaubt, diese Informationen zu kommunizieren,
und auf Rauschen, Echos oder Leitungsverluste auf vorher festgelegte
Weise zu reagieren, die für
menschliche Sprecher repräsentativ
ist. Die Kernerfindung in diesem Verfahren ist die dynamische Veränderung der
Sprache, die es dem empfangenen Signal ermöglicht, zu ändern, was als Antwort erzeugt
werden soll. Dies ermöglicht
es, eine Netzwerkverbindung, realistisch nachzubilden, um zu bestimmen,
ob sie die Konversation beeinträchtigt,
und sie entsprechend zu bewerten.
-
Die
Information (oder gewünschte
Sprachsequenz), die kommuniziert werden soll, bildet ein idealisiertes
Konversationsmuster für
jeden Sprecher. Dieses sollte einer repräsentatives Muster von verschiedenen
Teilen der Sprache enthalten, und die zeitliche Struktur und den
Inhalt einer typischen Konversation reproduzieren. Diese Sequenz
sollte Merkmale der Konversation nachbilden, wie etwa Unterbrechung,
Doppelsprechen und Übergabe
(der korrekte Austausch von Hör-
und Sprechfunktionen zwischen den zwei Benutzern). Bisher bekanntes
Wissen über
die Qualität
der Leitung kann in die zu kom munizierenden Informationen eingeschlossen
werden, wie in dem ausgeführten
Beispiel veranschaulicht wird. Schließlich sollte der Umfang des
zu verwendenden gesprochenen Materials auch repräsentativ sein.
-
Jede
Einrichtung benutzt ihren eigenen Konversationszustand, und Wissen über den
Konversationszustand der anderen Einrichtung wird während der
Konversation erworben, um festzustellen, welche Signale gesendet
werden sollen. Die Konversation bildet deshalb das zu prüfende System
auf eine Weise nach, die für
das zu prüfende
System repräsentativ
ist. Die oben beschriebenen Messungen werden ausgeführt, wobei
objektive Vorhersagen von subjektiven Parametern wie etwa Qualität, als auch
eine Anzahl von anderen objektiven Größen, wie etwa Echocharakterisierung,
berechnet werden.
-
Eine
Funktionsdiagramm einer solchen Einrichtung ist in 2 angegeben, wobei eine schichtweise
Form verwendet wird, die das algorithmische Modell 30 von
den Netzwerkschnittstellenfunktionen 40 zur Verbindung
mit einem Netzwerk 49 separiert, das Zwei- oder Vierdraht-Telefonie,
ein digitales Übertragungssystem
wie etwa ISDN oder T1 oder irgendein anderes geeignetes System sein
kann. Die Schlüsselelemente
der Einrichtungen sind:
die Modelle der Sprecher 50 und
anderer Sprecher 60, die Modelle für den Konversationszustand 51 und 61 enthalten,
die den Prozess der Spracherzeugung 52 und 62 steuern;
Wahrnehmungsanalyse
der empfangenen Sprache 70, die im Vergleich zu gesendeter
und erwarteter empfangener Sprache gemessen wird,
ein Konversationsprozessor 80,
der die Konversationszustände 51 und 61 steuert,
um die Zustandsbahn zu bestimmen und wendet sowohl die Absicht der
Konversation (Sprache, die durch normale Konversation kommuniziert
werden soll) als auch das Wiederherstellungsverhalten nach Verlusten,
Doppelsprechen oder anderen unerwarteten Ereignissen auf der Leitung
an.
-
Um 2 detaillierter zu diskutieren,
umfasst das algorithmische Modell 30 die Sprechermodelle 50 und 60,
die den Konversationszustand jedes Sprechers in dem System (Konversationszustandseinheiten 51, 61)
modellieren, um die Sprache zum Senden (Spracherzeugereinheit 52)
und die Sprache zu erzeugen, von der erwartet wird, dass es sie
von dem Benutzer am anderen Ende empfängt (Spracherzeugereinheit 62).
Die Sprache, die von der Spracherzeugereinheit 52 erzeugt
wird, wird über eine
Sprachkanaleinheit 31 zu der Netzwerkschnittstelle 40,
und über
eine entsprechende Sprachkanaleinheit 41 zum Senden an
den Benutzer am anderen Ende gesendet. Signale, die von dem Benutzer
am anderen Ende empfangen werden, werden von der Netzwerkschnittstelle 40 empfangen
und über
den Sprachkanal 31 als empfangene Sprache empfangen, und
von der Wahrnehmungsanalyseeinheit 70 verarbeitet, wie
auch von einer Einheit 32, die herkömmliche Kanalmessungen wie
etwa Echoerfassung ausführt.
In der Wahrnehmungsanalyseeinheit 70 wird die empfangene
Sprache mit der erwarteten Sprache verglichen, die von der Einheit 52 erzeugt wird,
um die Qualität
der empfangenen Sprache zu analysieren, wobei deren Ergebnisse durch
den Konversationsprozessor 80 verarbeitet werden, welcher wiederum
die Konversationszustände 51 und 61 in den
Sprechermodellen 50 und 60 aktualisiert. Der Konversationsprozessor 80 und
andere Kanalmessungen 32 steuern eine Meldeeinrichtung
der Anrufverwaltung 33, die andere Funktionen wie etwa Fax-
oder Modemprüfanrufe
(Modul 34) und die einleitenden Wähl- und Aufbaufunktionen für Sprachanrufe 35 ausführt, die
mit dem Netzwerk über
eine Anwendungsprozessorschnittstelle 36 kommunizieren.
-
Die
Netzwerkschnittstelle 40 hat eine direkte Sprachkanalschnittstelle 41 zum
Empfang von Signalen von dem Sprachkanal 31 in dem Prozessor 30, und
einen Datenhandler 46 für
die Anrufsignalisierung und das Datenprotokoll, um mit der Anwendungsprozessorschnittstelle 36 zu
kommunizieren. Diese Schnittstellen 41 und 46 kooperieren
mit einem maschinennahen Softwaretreiber 47 und folglich
mit der physikalischen Verbindung 48 mit der Netzwerkschnittstelle 49.
-
Ein
einfaches Beispiel der Konversationseinschätzung einer Verbindung zwischen
zwei Einrichtungen wird nun mit Bezug auf die 3, 4, 5 und 6 beschrieben. Die 3 und 4 sind
vereinfachte Flussdiagramme, die zeigen, wie die Konversation unter
verschiedenen Umständen
fortschreiten würde, wie
es von der Urhebereinheit 21 beziehungsweise der Empfangseinheit 22 gesehen
wird. Diese Flussdiagramme stellen nur die eingesetzten Prinzipien dar,
und sind demgegenüber
sehr vereinfacht worden, was tatsächlich erforderlich wäre, um alle
möglichen
Fehlerbedingungen realistisch zu emulieren. Insbesondere zeigt jeder
Schritt nur zwei mögliche Ergebnisse,
aber in der Praxis kann es mehrere geben.
-
3 zeigt die Prozesse, die
von der Einrichtung 21 ausgeführt werden, und 4 zeigt die Prozesse, dem
von dem Einrichtung 22 ausgeführt werden, wenn sie miteinander
interagieren. Wie man sehen kann, nimmt die Konversation verschiedene Verläufe entsprechend
der Qualität
der Signale, die von jeder Einrichtung von der anderen empfangen werden.
Gewisse Schritte, die fett umrandet sind, bezeichnen Stellen, an
denen Qualitätsmessungen durchgeführt wer den
können.
Es soll jedoch bemerkt werden, dass alle empfangenen Nachrichten
auch generell bezüglich
der Signalqualität überwacht
werden können.
-
Wie
in 3 gezeigt ist, leitet
die Einrichtung 21 (die das gesprochene Identifikationssignal „Smith" hat) einen Anruf
(Schritt 100) zu der Einrichtung 22 (die das gesprochene
Identifikationssignal „Jones" hat) ein. Die Einrichtung 21 wartet
dann, um eine erwartete Nachricht 1 von der Einrichtung 22 zu
empfangen. Wenn die erwartete Nachricht nicht korrekt empfangen
wird, wird im nächsten
Schritt, Schritt 101, eine Nachricht 12 gesendet, um die
Einrichtung am anderen Ende 22 aufzufordern, die Nachricht
erneut zu senden. Wenn die Nachricht 1 korrekt empfangen wurde,
sendet die Einrichtung 21 eine zweite Nachricht 2 (Schritt 103)
und erwartet eine Antwort von der Einrichtung 22 am anderen
Ende. Die Einrichtung 21 erwartet eine von zwei Antworten
(Nachrichten 3/13) von der Einrichtung am anderen Ende 22.
Die zwei Nachrichten zeigen die Signalqualität an, die von der Einrichtung 22 am
anderen Ende empfangen wurde. Wenn diese Nachricht empfangen wird
(Schritt 104), wird die Signalqualität der Nachricht beurteilt (Schritt 105).
Es sei bemerkt, dass dieser Schritt die Qualität des Signals misst, das von
der Einrichtung 32 empfangen wurde, unabhängig von seinem
Inhalt. Der Inhalt des Signals (d. h. ob es Signal 3 oder Signal
13 ist) zeigt die Qualität
an, die von der Einrichtung 22 am anderen Ende empfangen wurde.
Dies kann auch an der Einrichtung 21 überwacht werden, indem bestimmt
wird, welches der zwei Signale 3/13 tatsächlich empfangen wird.
-
Als
Reaktion auf die gemessene Signalqualität wird eine Nachricht 4 oder
14 dementsprechend gesendet (Schritte 106, 107),
ob die Signalqualität, die
in Schritt 105 wahrgenommen wird, gut oder schlecht ist.
Dies ist dazu eingerichtet, Nachricht 3 zu unterbrechen. Dies er laubt,
die Reaktion des Systems auf "Doppelsprechen" – beide Parteien sprechen gleichzeitig – zu überwachen.
Eine weitere Nachricht wird dann von der Einheit 22 am
anderen Ende (Nachricht 5, Schritt 108) empfangen, wobei
die Einheit 21 als Reaktion auf diese eine weitere Nachricht
6 sendet (Schritt 109). In der nächsten Stufe wird eine weitere
Nachricht 7/15 empfangen (Schritt 110). Ihre Qualität wird dann
auf ähnliche
Weise wie im schon beschriebenen Schritt 105 gemessen (Schritt 111),
und eine Nachricht 16 wird gesendet (Schritt 112), wenn
die Qualität
der Nachricht 7/15, die in Schritt 110 empfangen wurde,
schlecht ist. Nach der Übertragung
von Nachricht 16 kehrt die Einrichtung zu Schritt 108 zurück, um eine
Wiederholung der Nachricht 5 abzuwarten. Wenn jedoch die Qualität des im
Schritt 110 empfangenen Signals (wie in Schritt 111 geschätzt) gut
ist, dann wird ein weiterer Schritt (113) ausgeführt, um
zu beurteilen, welche der Nachrichten 7 oder 15 in Schritt 110 empfangen wurde.
Wenn die empfangene Nachricht Nachricht 15 war, kehrt der Prozess
zu Schritt 109 zurück,
dem Senden von Nachricht 6. Wenn jedoch die im Schritt 113 empfangene
Nachricht Nachricht 7 ist, dann pausiert das System (Schritt 114),
bevor eine weitere Nachricht 8 (Schritt 115) gesendet wird
und eine komplementäre
Nachricht 8 von dem anderen System 22 empfangen wird (Schritt 116).
Wenn keine solche Nachricht empfangen wird, erwartet das System
das Geräusch
des auflegenden anderen Systems (Schritt 117), bevor es
selbst auflegt (Schritt 118). Wenn jedoch Nachricht 8 in
Schritt 116 empfangen wird, findet der Auflegeprozess sofort
statt.
-
4 zeigt den komplementären Prozess, der
in der Einrichtung 22 stattfindet. Die Einrichtung 23 empfängt zu Anfang
die Einleitung des Anrufes von der Einrichtung 21 (Schritt 200),
als Reaktion worauf es die Nachricht 1 überträgt (Schritt 201),
und als Antwort entweder Nachricht 2 oder Nachricht 12 von der Einrichtung 21 emp fängt (Schritt 202).
Der Inhalt des Signals (2/12) zeigt die von der Einrichtung 21 am
anderen Ende empfangene Qualität
an. Dies kann an der Einrichtung 22 überwacht werden, indem bestimmt
wird, welche der zwei Nachrichten 2 oder 12 tatsächlich empfangen wurde.
-
Wenn
Nachrichten 12 empfangen wurde, sendet die Einrichtung 22 Nachricht
1 erneut (Schritt 201). Wenn jedoch Nachricht 2 empfangen
wird, wird die Signalqualität
beurteilt (Schritt 203) und entsprechend der empfangenen
Qualität
entweder eine Nachricht 3 (Schritt 204) oder Nachricht
13 (Schritt 205) gesendet. Einrichtung 22 empfängt dann
von der Einrichtung 21 eine Nachricht 4 oder 14, die von den
obigen Schritten 106 oder 107 erzeugt wird (Schritt 206).
Das System pausiert dann (Schritt 207), bevor es eine weitere
Nachricht 5 sendet (Schritt 208), und die Einrichtung 22 empfängt dann
von der Einrichtung 21 eine von zwei Nachrichten 6 oder
16 (Schritt 209). Wenn die empfangenden Nachricht Nachricht
16 ist, dann kehrt die Einrichtung zu Schritt 208 zurück, um Nachricht
5 erneut zu senden. Wenn jedoch die empfangenen Nachricht Nachricht
6 ist, wird eine Qualitätsbeurteilung
(Schritt 210) durchgeführt.
Wenn die Qualität
als schlecht beurteilt wird, sendet die Einrichtung 22 eine
Nachricht 15 (Schritt 211), bevor es zu Schritt 209 zurückkehrt,
um auf Nachricht 6 oder 16, je nachdem, was angemessen ist, von
Einrichtung 21 zu warten. Wenn doch die im Schritt 210 gemessene
Qualität
als gut beurteilt wird, sendet die Einrichtung 22 eine
Nachricht 7 an die Einrichtung 21 (Schritt 212)
und pausiert dann (Schritt 214), bevor eine Prozessanalyse
wie oben beschrieben ausgeführt
wird, um die Konversation abzuschließen (Schritte 215, 216, 217, 218,
die den Schritten 115, 116, 117 und 118 entsprechen).
-
In
der folgenden Diskussion des Prozesses wird der Urheber 21,
mit dem Namen Smith, durch fetten Text bezeichnet, und die Zieleinrich tung 22, Jones,
durch kursiven Text. Die zu kommunizierende Information – die erwartete
Konversation für
eine perfekte Verbindung – ist
in 5 gezeigt und wird
wie folgt zusammengefasst: diese Schritte werden durch Doppelpfeile
in 3 und 4 gezeigt:
Smith macht den Anruf
(Schritt 100).
Jones antwortet. Hallo, hier Jones
(Nachricht 1).
Hallo Jones, hier spricht Smith. Wie klar ist
die Leitung? (Nachricht 2)
Für mich ausgezeichnet (Nachricht
3).
(Smith unterbricht zu Beginn von „mich") und für mich sehr gut (Nachricht
4).
(Pause.) (Schritt 207) Wieviel Uhr ist es? (Nachrichten)
14
Uhr 15 Minuten und 10,3 Sekunden (Nachricht 6).
Danke, das
war's (Nachricht
7).
(Pause.) (Schritt 114/214)
(Gleichzeitig)
Auf Wiederhören,
Smith, auf Wiederhören,
Jones (Nachricht 8).
-
Für eine klare,
unmittelbare Verbindung wäre die
Konversation wie oben beschrieben. Im Falle einer Leitung mit schlechterer
Qualität, mit
Verzögerung
und schweren Verlusten, kann das Konversationsmodell eine Konversation
liefern, die dem folgenden Beispiel ähnlich ist, wie in 6 dargestellt ist: Sprachverlust
durch den Kanal (gesendet, aber nicht empfangen) wird unten durch
Durchstreichen und durch „x" in 6 markiert:
Smith macht einen Anruf.
(Schritt 100)
Jones antwortet.
Hallo, hier Jones. (Nachricht 1)
(Smith
antwortet auf den Verlust) Entschuldigung, ich konnte Ihren Namen
nicht verstehen. (Nachricht 12)
Hier Jones (Nachricht 1 wiederholt)
Hallo
Jones, hier spricht Smith. Wie
gut ist die Verständlichkeit
der Leitung? (Nachricht 2)
Für mich schlecht. (Nachricht 13)
(Smith's Unterbrechung zu
Beginn von „schlecht" verursacht dessen
Verlust) und schlecht für
mich (Nachricht 14).
(Pause.) (Schritt 207) Wieviel
Uhr ist es? (Nachricht 5)
vierzehn Uhr
fünfzehn...
(Nachricht 6)
(Jones unterbricht)
Wieviel Uhr? (Nachricht 15: Doppelsprechen
verursacht den Verlust des Beginns der Nachricht)
Wie bitte?
(Nachricht 16)
(Jones wiederholt die Frage.) Wieviel Uhr ist
es? (Nachricht 5)
Vierzehn Uhr fünfzehn Minuten und 10,3 Sekunden. (Nachricht 6)
Danke,
das war's. (Nachricht
7)
(Pause.) (Schritte 114/214)
Auf wiederhören, Smith.
(Nachricht 8) Auf wiederhören, Jones
(Verzögerung zwischen
den zwei Einrichtungen und Verhalten des Netzwerks bei Doppelsprechen
verursachte Verluste).
Smith legt zuerst auf (Schritt 118);
-
Jones
hört das
(Schritt 217) statt der erwarteten Nachricht 8 („Auf wiederhören, Jones),
und legt dann auch auf (Schritt 218).
-
Dieses
Beispiel stellt die prinzipiellen Aspekte der dynamischen Konversationsprüfung dar.
Der Verlust von Schlüsselinformationen
leitet eine Wiedergewinnung ein. Das erste Mal, wenn dies geschieht
(Nachricht 1: „Jones" wurde durch den
Kanal verloren), bekommt die Wiedergewinnung (Schritt 102)
die erwarteten Informationen. Das zweite Mal, wenn dies geschieht
(„Vierzehn") (Schritt 209),
wird der einlei tende Wiedergewinnungssatz 15 selbst durcheinander
gebracht und der Konversationszustand wird zurückgesetzt (Schritt 111),
was zu einer Wiederholung der ursprünglichen Frage (Nachricht 5: Schritt 208)
führt.
Mehrere nicht-essenzielle Teile der Sprache gehen auch verloren;
diese leiten keine Wiedergewinnung ein, werden aber bei der Gesamtbeurteilung
der Signalqualität
berücksichtigt.
-
Die
Einrichtung 21 beginnt die Übertragung von Nachricht 4
(Schritt 106/7), bevor die Nachricht 3/13 (Schritt 104)
vollendet ist. Dies ermöglicht
der Einrichtung, zu bestimmen, ob die Qualität des Restes der Nachricht
3/13 von dem Doppelsprechen beeinflusst wird. „Doppelsprechen" tritt auch im Schritt 211 auf,
wenn Einrichtung 22 (Nachricht 15) Nachricht 6 unterbricht;
dieses Mal ist es der Beginn der neuen Nachricht 6, der beeinträchtigt wird.
Schließlich
verursacht die Netzwerkverzögerung
und das resultierende Verhalten bei Doppelsprechen des Netzwerks,
dass Smith's „Auf wiederhören, Jones" (Nachricht 8: Schritt 114)
verloren geht; Smith legt auf (Schritt 117), nachdem er
das erwartete „Auf
wiederhören,
Smith" hört (Schritte 215),
aber Jones hört
nur, dass die Leitung unterbrochen wird (Schritt 210).
Da die Möglichkeit
der Wiedergewinnung nicht weiter besteht, legt Jones auch auf (Schritt 217).
-
Ebenso
wie Messungen der Sprachqualität und
von Verlusten während
der Konversation können beide
Einrichtungen andere Eigenschaften des Kanals berechnen. Echo des
Sprechers, und der Betrieb von Echokompensatoren in der Leitung
würden berechnet,
indem die gesprochenen und empfangenen Signale verglichen werden,
wenn jede Einrichtung spricht. Die Verzögerung kann aus dem Anstieg der
Zeit berechnet werden, die benötigt
wird, damit eine Antwort nach einer Zeit für eine verzögerungsfreien Verbindung gehört wird;
zusätzlich
kann Jones mit synchronisierten Uhren die Einwegverzöge rung vom
Sprechen bis zum Empfang mit dem Zeitpunkt, wie er von Smith gesprochen
wird, messen, wenn auch die Verarbeitung davon stattfindet, nachdem
die Konversation beendet wurde.