DE69823817T2

DE69823817T2 - Prüfung von telekommunikationseinrichtungen

Info

Publication number: DE69823817T2
Application number: DE69823817T
Authority: DE
Inventors: Peter Michael Kesgrave HOLLIER; John Richard Ipswich REYNOLDS; William Antony RIX
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1997-05-16
Filing date: 1998-05-06
Publication date: 2005-04-14
Anticipated expiration: 2018-05-07
Also published as: DE69823817D1; IL132172A; EP0981888A1; EP0981887A1; IL132171A0; DE69842181D1; WO1998053590A1; EP0981887B1; US6389111B1; AU7342698A; IL132172A0; US6304634B1; AU7342798A; EP0981888B1; WO1998053589A1

Description

Diese Erfindung bezieht sich auf die Einschätzung der Qualität von Kommunikationssystemen.
Im zunehmend liberalisierten Telekommunikationsmarkt ist die Differenzierung durch Qualität ein wichtiger Faktor. Die weit verbreitete Installation von Kodierungseinrichtungen in den letzten Jahren hat die Notwendigkeit einer neuen Generation von Schätzverfahren hervorgebracht. Die herkömmliche Analyse nimmt an, dass das System linear und zeitlich invariant ist, und beschreibt es auf der Basis von Verzögerung, Frequenzantwort, Rauschpegel und Rauschspektrum. Moderne Netzwerke zeigen bei weitem komplexere Effekte und enthalten Elemente, wie etwa Sprachvermittlungen und Kompressionscodecs, die hochgradig nichtlinear sind und zeitlich variieren.
In der Industrie werden zwei Hauptverfahren verwendet, um die subjektive Qualität von Netzwerken und ihren Komponenten zu überprüfen. In Hörprüfungen hört ein Runde von Versuchspersonen eine Reihe von Geräuschabschnitten, die simulierte Netzwerkbedingungen durchlaufen haben. Konversationsprüfungen erfordern Paare von Versuchspersonen, um über verschiedene simulierte Telefonverbindungen zu kommunizieren. In beiden Fällen werden die Versuchspersonen gewöhnlich gebeten, aus einer fünf Punkte umfassenden Skala von „ausgezeichnet" bis „schlecht" auszuwählen. Mittelwertbildung über alle Versuchspersonen ergibt einen mittleren Meinungswert (MOS, mean opinion score) für jede Zustandsgröße, die die subjektive Qualität des Netzwerks widerspiegelt, während zufällige Fehler verringert werden, die bei einer subjektiven Abstimmung auftreten.
Die Notwendigkeit, eine Anzahl von Versuchspersonen für diese Art von Abschätzung zu verwenden, macht das Verfahren teuer, und erschwert oder verhindert seine Anwendung in dem „Live"- Telefonnetzwerk. Es ist deshalb wünschenswert, eine Prüfeinrichtung aufzubauen, die die Qualität auf der gleichen Skala automatisch misst, und die die gleichen Werte, wie den Mittelwert von verschiedenen herkömmlichen subjektiven Tests, im Rahmen des experimentellen Fehlers und der subjektiven Erwartung erzeugt. Wie später diskutiert wird, sind Schätzeinrichtungen entwickelt worden, die die Hörqualität von Sprache voraussagen können, die einer Richtung durch das Telefonnetzwerk läuft, und die erweitert worden sind, indem veränderliche Sprachpegel verwendet werden, um die Qualität der Konversation einer Hin- und Rückverbindung zu schätzen.
Der aktuelle Stand der Forschung in diesem Gebiet ist, eine Anzahl von Messungen mit dem zu prüfenden Kommunikationssystem, wie etwa Echo, Verzögerung oder Sprachverschlechterung auszuführen, und die Qualität des Systems aus diesen Messungen vorherzusagen. Diese Prüfungen vernachlässigen jedoch die Reaktionen von Benutzern auf das Verhalten des Systems, das wiederum die Art und Weise beeinflussen kann, wie das System seine Leistung erbringt.
Telekommunikationsunternehmen haben beträchtliche Erfahrung, menschliche Versuchsperson zu verwenden, um die subjektive Qualität eines Kommunikationsnetzwerkes zu abschätzen. Dieses Wissen ist durch internationale Gruppen aufgebaut wurden, wie etwa ETSI und ETU: siehe z. B. Methods for subjective determination of transmission quality: ITU-T Recommendation P.800. Subjektives Schätzen verwendet eine Runde von Versuchsperson, die über eine Anzahl von Netzwerkbedingungen als Kandidaten abstimmt. Ihre Wahlergebnisse werden gemittelt und untersucht, und ergeben Informationen über die subjektive Qualität des Netzwerks. Dieses Verfahren wird geschätzt, weil die Werte direkt mit der Meinung der Leute zur Qualität im Zusammenhang stehen. Im Gegensatz dazu korrelieren herkömm liche technische Größen wie Signal-Rausch-Abstand im allgemeinen nicht gut mit der Sprachqualität. Die subjektiven Prüfungen, die für die vorliegende Erfindung relevant sind, können folgendermaßen klassifiziert werden:
Hören, wobei die Versuchspersonen Abschnitte von Sprache hören, die durch Testnetzwerke geleitet wurden, und darüber abstimmen, was sie hören, und
Konversation, wobei zwei Versuchspersonen miteinander über zu prüfende Netzwerkverbindungen sprechen, und über die Sprachqualität in jeder Konversation abstimmen.
Verschiedene Fragen fordern die Versuchspersonen auf, über verschiedene Aspekte ihrer Wahrnehmung des Netzwerkes abzustimmen, wie etwa Anstrengung oder Qualität.
Es sind Methoden entwickelt worden (Models for predicting transmission quality from objektive measurements: ITU-T P series recommendations: Supplement 3), um die Konversationsqualität eines herkömmlichen, linearen Netzwerks mit klassischen Größen der Signalverarbeitung wie etwa Echo, Verzögerung und Pegel abzuschätzen. Diese Messungen beruhen auf der Analyse des Netzwerks mit künstlichen Signalen – gewöhnlich Sinuswellen oder Rauschpulse – die nicht von einem Kommunikationsnetzwerk weitergeleitet werden können, das für Sprache entworfen ist.
Modelle der menschlichen Wahrnehmung erlauben eine anspruchsvollere Analyse der Sprachqualität, die durch das Netzwerk übertragen wird. Schlüsselmerkmale der menschlichen Sinne, wie etwa Maskierung und Hörschwelle, werden verwendet, um abzuleiten, ob Fehler in der Übertragung hörbar sind, und ihre Subjektivität abzuschätzen. „Wahrnehmungsmässige" Verarbeitung auf höherem Niveau berücksichtigt weiter den Umfang und die Verteilung von Fehlern und ihren Zusammenhang mit gewissen Teilen der Sprache. Diese Berechnung ermöglicht die Voraussage des subjektiven mittleren Meinungswertes, der sich durch eine Reihe von subjektiven Prüfungen ergäbe. Solche Modelle sind in ITU-T Recommendation P.861: „Objektive quality measurement of telephone-band (300–3400 Hz) speech codecs" und in den internationalen Patentanmeldungen WO94/00922 und WO95/15035 beschrieben.
Die oben beschriebenen Verfahren zur Konversationseinschätzung können verwendet werden, um auf Wahrnehmung beruhende Qualitätsmessungen zu gewichten, um wahrnehmungsbasierte Schätzungen für den Konversationswert abzuleiten. In einer ebenfalls angemeldeten internationalen Patentanmeldung des Anmelders der vorliegenden Anmeldung (mit dem gleichen Anmeldetag, die Priorität aus den zwei selben Anmeldungen wie die vorliegende Anmeldung beansprucht), die die Pegel der Sprache variiert, bis ein Gleichgewicht erreicht wird, wobei die Anstrengung beim Zuhören geschätzt wird, und dann eine konversationsbezogene Gewichtung verwendet, die auf Echo und Verzögerung basiert, um die Qualität der Verbindung bezüglich der Sprache in der Konversation abzuschätzen.
Es gibt gute Gründe, künstlich erzeugte sprachähnliche Signale statt Aufnahmen von menschlichen Sprechern zu verwenden, um ein Netzwerk zu prüfen, das dazu entworfen ist, Sprache zu übertragen. Insbesondere kann künstliche Sprache dazu gezwungen werden, präzise definierte Phoneme zu enthalten, und ist leichter reproduzierbar, um den Vergleich der Ergebnisse zu ermöglichen. Künstliche Sprache, die für die Konversationsprüfung geeignet ist, ist in den interna tionalen Patentanmeldungen WO94/00922 und WO095/01011 beschrieben.
Eine dynamische Konversationprüfeinrichtung kann die Änderung verschiedener Eigenschaften der Sprache unter extremen Bedingungen berücksichtigen. Eine Beschreibung dieser Eigenschaften wird in der internationalen Patentanmeldung WO096/06495 gegeben.
Zu Beginn eines Anrufs, während dem die Netzwerkqualität geschätzt werden soll, ist Wissen über bestimmte Eigenschaften des Netzwerks, wie etwa Verzögerung und Echo, nicht verfügbar. Diese Eigenschaften beeinflussen jedoch den Ablauf der Konversation. Darüber hinaus berücksichtigt ein fester Konversationsablauf nicht die menschliche Reaktion auf Verluste in der Leitung, wie etwa Rauschen, Verzögerung oder Einfrieren (bei Verlust eines Signals, z. B. wegen Kapazitätsproblemen im Netzwerk, oder Verzögerungen als Reaktion auf den Beginn des Signals), die ihrem Wesen nach zufällig sein können.
Nach der Erfindung wird ein Verfahren zum Prüfen eines Kommunikationssystems bereitgestellt, bei dem eine erste Messeinrichtung einen Anruf durch das System, das sie prüft, zu wenigstens einer zweiten Messeinrichtung tätigt, und die Einrichtungen sich mit vorher festgelegten Sprachsignalen unterhalten, und wenigstens eine der Einrichtungen Messungen des Schalls durchführt, den es von der anderen Einrichtung oder den Einrichtungen empfängt, um einen oder mehrere Parameter zu berechnen, die Aspekte der empfangenen Signalqualität beschreiben, dadurch gekennzeichnet, dass die vorher festgelegten Sprachsignale von jeder Einrichtung als Reaktion auf die Signale, die von den Einrichtungen empfangen werden, dynamisch erzeugt werden, um Aspekte von Konversation über eine nicht-perfekte Verbindung im Kommunikationssystem zu reproduzieren.
Dies erlaubt eine dynamische Antwort auf Ereignisse, wie etwa Verlust von Sprache, wobei das Verhalten von Menschen nachgeahmt wird, die unter denselben Bedingungen kommunizieren. Verhalten wie etwa Abgeschnittensein und Wiedergewinnung nach dem Verlust, die später beschrieben werden, können auch eingebunden sein. Dies ermöglicht, dass die Telekommunikationsverbindung auf repräsentative Weise als vorher ausgewertet wird. Die Signale können mit einer Anzahl von Verfahren eingeschätzt werden, um Messergebnisse zu erhalten, die die Konversationsqualität des Systems genauer wiedergeben. Insbesondere kann die Qualität der Verbindung in dem Kommunikationssystem entsprechend dem Informationsgehalt und/oder der Qualität des empfangenen Antwortsignals und dem tatsächlichen Fortschritt der simulierten Konversation bestimmt werden.
In einer bevorzugten Anordnung antwortet eine Einrichtung, die ein erwartetes Signal von einer anderen Einrichtung nicht klar empfängt, indem sie ein festgelegtes Antwortsignal sendet, das, wenn es von der anderen Einrichtung nicht verschlechtert empfangen wird, die andere Einrichtung veranlasst, das erwartete Signal zu wiederholen. (Natürlich kann diese Antwort selbst bei der Übertragung verschlechtert werden, was die andere Einrichtung wiederum veranlasst, auf andere Weise zu antworten, als auf diese Absicht).
Manche der Signale, die zum Senden als Antwort auf die Eingangssignale erzeugt werden, können entsprechend der Qualität der empfangenen Signal ausgewählt werden, und manche können Signale sein, die die Wiederholung eines empfangenen Signal anfragen, die als Reaktion auf schlechte Qualität des empfangenen Signals ausgewählt werden können.
Eigenschaften wie etwa Umfang oder Geschwindigkeit der Antwortsignale, die erzeugt werden sollen, können entsprechend der Qualität des empfangenen Signals ausgewählt werden.
Die einzelnen Einrichtungen können einrichtungsspezifische Identifikationssignale senden und erkennen, die einen Teil der erzeugten Sprache bilden können, wie etwa gesprochene Wörter, was es folglich ermöglicht, den einzelnen zu prüfenden Pfad zu identifizieren.
Das Verfahren kann einen Prozess zur Berechnung der Systemverzögerung enthalten, bei dem ein erstes Signal von einer ersten Einrichtung an eine zweite Einrichtung gesendet wird, wobei die zweite Einrichtung das erste Signal empfängt, und, nach einer vorher festgelegten Verzögerung ein Antwortsignal an die erste Einrichtung sendet, und die Systemverzögerung aus der Übertragungszeit des ersten Signals, dem Zeitpunkt des Empfangs des zweiten Signals und der vorher festgelegten Verzögerung bestimmt wird. Dieser Prozess misst die Umlaufverzögerung. Es ist auch möglich, die Verzögerungen in eine Richtung zwischen zwei der Einrichtungen mit synchronisierten Uhren zu messen, wobei eine der Einrichtungen ein Signal zu einer anderen Einrichtung sendet, das die aktuelle Zeit anzeigt, und Verzögerung im zu prüfenden Systemen wird aus dem Vergleich des empfangenen Signals, das die Zeit anzeigt, mit dem Empfangszeitpunkt bestimmt.
Die verwendeten Signale können vorher aufgenommene Muster menschlicher Sprache oder künstlich erzeugte Sprachmuster sein, die mehrere verschiedene Sprecher darstellen.
In einer bevorzugten Anordnung kann eine der Einrichtungen ein Signal senden, wobei gleichzeitig ein anderes Signal von der gleichen Einrichtung empfangen wird, derart, dass die Verschlechterung von dem einem oder dem anderen der Signale an ihren jeweiligen Empfangsorten erfasst werden kann.
Die Erfindung kann verwendet werden, um die Konversationsqualität von Telefon- und Telefonkonferenznetzwerken zu schätzen. Sie kann in Labormodellen für Netzwerke verwendet werden, z. B. bei der Entwicklung neuer Ausrüstung oder bei der Planung von neuen Netzwerken, oder für die Beurteilung eines „Live"-Netzwerks, die entweder in den Räumlichkeiten des Kunden, in den örtlichen Vermittlungen, oder, über digitale Kommunikationsverbindungen, in der zentralen objektiven Messstation installiert sind. Schließlich würde das Einbinden eines Modells für den Zustand der Konversation in das Übertragungssystem des Netzwerks dem Netzwerk ermöglichen, bezüglich der Konversation optimierte Sprache unter Vorgaben wie etwa einer begrenzten Bitrate zu liefern.
Im Falle der Einschätzung im Labor oder bei der Planung werden die Qualitätsvorhersagen verwendet, um Entscheidungen bezüglich der Auslegung zu treffen, wahrscheinlich in Verbindung mit einer begrenzten Anzahl von subjektiven Prüfungen. Ausrüstung zum Schätzen, die in dem Netzwerk installiert ist, kann dazu verwendet werden, Prüfanrufe durchzuführen, um die Qualität des Kernnetzwerks zu überwachen, um die Qualität des Netzwerks eines Wettbewerbers oder irgend eines anderen verbundenen Netzwerks einzuschätzen, oder die Qualität der Anrufe zu garantieren, die einem Kunden geliefert werden. Eine solche Ausrüstung würde Ergebnisse an einen zentralen Überwachungsstandort senden; im Falle von Fehlfunktion könnte sie Alarm geben und Diagnoseinformationen bereitstellen, um bei der Behebung der Fehler zu helfen.
Anwendungen der Konversationseinschätzung sind nicht auf herkömmliche Telefonie beschränkt. Die gleichen Verfahren können auf andere Sprachübertragungssysteme angewendet werden, wie etwa Internettelefone oder Audiokonferenzsysteme. Außerdem können die Verfahren eingesetzt werden, um in der Audiokomponente von Bildtelefonen, audiovisuellen Telefonkonferenzsystemen, oder gemeinschaftlichen Kommunikationsumgebungen, wie etwa virtuellen Welten, zu arbeiten.
Man kann sich vorstellen, dass ein Zustandsmodell der Konversation von zwei menschlichen Sprechern in der Infrastruktur zur Bereitstellung von Netzwerken verwendet werden kann, um sicherzustellen, dass unter Vorgaben wie einer begrenzten Datenrate die Konversationsqualität für eine Anzahl von Kunden optimiert werden kann.
Nach einem anderen Aspekt wird eine Einrichtung zur Simulation einer Konversation über ein Kommunikationssystem zur Verfügung gestellt, mit:
einem Speicher zum Speichern mehrerer Signale, die eine Konversation bilden,
einem Empfänger zum Empfangen von Signalen von einem oder mehreren komplementären Einrichtungen,
einer Sendeeinrichtung zum Senden eines Signals an die komplementäre Einrichtung oder die komplementären Einrichtungen,
und eine Vergleichseinrichtung zum Vergleichen von Signalen, die von dem Empfänger empfangen wurden, in dessen Speicher Signale gespeichert sind;
gekennzeichnet durch eine Auswahleinrichtung, die auf die Vergleichseinrichtung reagiert, um ein Signal zum Senden an die komplementäre Einrichtung oder die komplementären Einrichtungen aus dem Speicher auszuwählen.
Ein Messsystem kann aus einer Anzahl solcher Einrichtungen aufgebaut sein. Um eine simulierte Konversation mit zwei Parteien über ein Netzwerk zu erzeugen, können zwei Einrichtungen verwendet werden. Um eine Konferenzschaltung zu simulieren, können drei oder mehr verwendet werden. Unter Laborbedingungen ist es für eine einzelne solche Einrichtung möglich, als beide/alle Enden der Konversation zu wirken, indem sie an/alle Enden der zu prüfenden Ausrüstung angeschlossen wird. Unter diesen Umständen wirkt die Einrichtung als ihre eigene „komplementäre Einrichtung" in dem oben verwendeten Sinne.
Eine der Einrichtungen hat eine Einrichtung zur Konversationseinleitung zum Erzeugen eines Anfangssignals zum Senden durch die Sendeeinrichtung. Eine oder mehrere der Einrichtungen haben eine Verarbeitungseinrichtung zum Messen der Konversationsqualität des Kommunikationssystems. Die Verarbeitungseinrichtungen können Einrichtungen zum Überwachen des Betriebs der Auswahleinrichtung enthalten, um den Fortschritt einer Konversation abzuschätzen, und/oder Einrichtungen zum Überwachen der Qualität von Signalen, die von den komplementären Einrichtungen durch die Empfangseinrichtungen empfangen werden.
Die Auswahleinrichtung hat vorzugsweise eine Einrichtung, um verschiedene Signale zur Übertragung auszuwählen, dementsprechend, welches der vorher festgelegten Signale empfangen wird, und ent sprechend der Qualität des empfangenen Signals. Diese Einrichtung kann dazu eingerichtet sein, ein Signal auszuwählen, das die Wiederholung eines empfangenen Signals als Antwort auf schlechte Qualität des empfangenen Signals anfragt.
Die Auswahleinrichtung kann auch eine Einrichtung haben, um Eigenschaften des Signals, das übertragen werden soll, entsprechend der Qualität des empfangenen Signals auszuwählen.
Die Verarbeitungseinrichtung kann eine Einrichtung enthalten, um den Fortschritt der simulierten Konversation zu überwachen und dadurch die Qualität der Verbindung durch das Kommunikationssystem zu bestimmen.
Eine der Einrichtungen kann eine Berechnungseinrichtung für die Verzögerung enthalten, die eine Einrichtung zur Bestimmung des Zeitpunkts umfasst, zu dem ein erstes Signal an eine komplementäre Einrichtung gesendet wird, eine Einrichtung zum Bestimmen des Zeitpunkts, zu dem ein festgelegtes Antwortsignal von der komplementären Einrichtung empfangen wird, eine Einrichtung zum Abrufen des Wertes einer vorher festgelegten Verzögerung in der komplementären Einrichtung zwischen dem Empfang des ersten Signals und dem Senden des Antwortsignals aus dem Speicher, und eine Einrichtung, um daraus die zusätzliche Verzögerung zu bestimmen, die von dem zu prüfenden System verursacht wird.
Zwei oder mehr der Einrichtungen können synchronisierte Uhren haben, wobei wenigstens eine der Einrichtungen eine Einrichtung zum Senden eines Signals aufweist, das die aktuelle Zeit anzeigt, und wenigstens eine andere der Einrichtungen eine Einrichtung zum Bestimmen der Verzögerung in dem zu prüfenden System aufweist, in dem das empfangene Signal, das die Zeit anzeigt, mit dem Empfangszeitpunkt verglichen wird.
Die Einrichtungen können Einrichtungen für das gleichzeitige Senden und Empfangen von vorher festgelegten Signalen und Einrichtungen aufweisen, um zu bestimmen, ob die vorher festgelegten empfangenen Signale durch die Anwesenheit des gesendeten Signals verschlechtert wurden.
Die Schlüsselmessung, die mit dem zu prüfenden Netzwerk durchgeführt werden soll, ist die Messung der Qualität von Sprache in der Konversation. Diese Messung hängt von einer Anzahl von verschiedenen Faktoren ab, wie etwa:
Subjektive Sprachqualität;
Eigenecho (die absichtlich eingebrachte elektrische Kopplung, die normalerweise zwischen der Sprechteil und der Hörteil eines Telefons bereitgestellt wird)
Verschlechterung der Sprache wegen Filtern und Kodieren in jeder Richtung;
Schwierigkeiten bei der Kommunikation, die von Netzwerkeigenschaften erzeugt werden, wie etwa:
Echo des Sprechers (die ungewollte Rückkehr eines Signale zu seinem Ursprungspunkt wegen elektrischer Fehlabstimmung in dem System oder akustische Rückkopplung bei einem Handgerät am anderen Ende),
Echo des Hörenden (Vielfache Ankunft des gleichen Signals mit zeitlichen Abständen)
Einfrieren (Fehlschlagen des Sendens eines Teils eines Signals wegen Nichtverfügbarkeit des Kanals, verzögertes Ansprechen von Sprachaktivitätsdetektoren, usw.).
Das Einschätzen dieser Netzwerkeigenschaften erfordert zwei Schritte; erstens das Senden von Sprache über das Netzwerk, und zweitens das Empfangen der Sprachsignale an jedem Ende und Bestimmen der subjektiven Auswirkungen der beobachteten Verschlechterungen in dem empfangenen Signal.
In dieser Erfindung wird die Sprache, die über das Netzwerk gesendet wird, als Reaktion auf empfangenen Signale mit einem Konversationsmodell dynamisch variiert.
Weil jedoch beide Einrichtungen einen vorher festgelegten Satz von Antworten auf jedes Signal haben (die auszuwählende Antwort ist davon abhängig, welches Signal empfangen wird, und von der Qualität dieses Signals), zeigen die Antworten, die von einer Einrichtung empfangen werden, die Signalqualität an, die von der anderen empfangen wurde, und die Konversation wird erzwungen, sodass Vergleichsmessungen möglich sind.
Spezialisiertere Messungen können gleichzeitig ausgeführt werden, damit verschiedene Verschlechterungen für die Netzwerkdiagnose charakterisiert werden können. Die Aufnahmen empfangener Sprache, Wissen über die Sprache, die gesendet wurde, (das auch in dem Konversationsmodell verfügbar ist), sind ausreichend für diese Messungen, die Folgendes enthalten:
Echos von dem lokalen und dem anderen Ende der Verbindung, oder von irgendwelchen Zwischenpunkten;
Verschlechterungen wegen der (zeitlich variierenden) Betriebsweise der Echokompensatoren;
Verlust oder Verstärkung der Lautstärke der Sprache, und Variationen dieses Verlustes mit der Zeit und dem Sprachpegel;
Einfrieren (auch als Aussetzfehler bekannt) wegen augenblicklicher Überlast auf verschiedenen Kanälen – ein besonderes Beispiel wird beobachtet, wenn Intervalle zwischen Sprache verwendet werden, um Datenpakete zu transportieren: der Beginn einer Äußerung kann verloren gehen, da das System die Übertragung eines Paketes vollendet;
Rauschen, das wegen elektrischer Quellen oder Kreuzkopplung mit Daten oder Sprachsignalen bestehen kann;
Unfähigkeit des Systems, mit „Doppelsprechen" (die Übertragung von Sprache in beide Richtungen gleichzeitig) umzugehen.
Das zu prüfende Netzwerk enthält wahrscheinlich Elemente, die speziell entworfen sind, um mit Sprache zu arbeiten. Zum Beispiel sind Sprachcodecs darauf trainiert, die verschiedenen Teile der Sprache gut zu kodieren, können sich aber erratisch verhalten, wenn nichtsprachliche Signale, wie etwa Töne oder weißes Rauschen, sie durchlaufen. Ein weiterer bemerkenswerter Punkt ist, dass die Anwesenheit von nichtsprachlichen Signalen, wie etwa Tönen, die Eigenschaften des Systems verändern kann In extremen Fällen können gewisse Töne Echokompensatoren ausschalten oder das System veranlassen, den Kanal für Datenverkehr freizumachen.
Es ist deshalb vorteilhaft, dass ein System zum Einschätzen der Qualität eines solchen Netzwerkes zur Durchleitung von Sprache nur Sprach- oder sprachähnliche Signale bei seinen Prüfungen verwendet. Das heißt nicht, dass das Netzwerk nicht nach seiner Fähigkeit eingeschätzt werden soll, Töne (wie etwa DMTF-Ziffern) und Daten zu übertragen, sondern bloß, dass dies ein separates Problem ist.
Gewisse Eigenschaften von Sprache in der Konversation hängen von der Qualität des Übertragungsnetzwerks ab. Sprachpegel und Sprachton ändern sich als Reaktion auf Pegel oder Verschlechterung der empfangenen Sprache. Das Konversationsmuster wird durch Eigenschaften wie etwa Verzögerungen beeinflusst, das in Verhalten wie etwa erhöhter Wahrscheinlichkeit von Doppelsprechen und „Fehlstarts" resultiert, die auftreten, wenn beide Parteien ungefähr zur gleichen Zeit anfangen zu sprechen, und eine oder beide von ihnen aufhören, wenn ihnen klar wird, dass der andere auch spricht. Menschliche Sprecher durchlaufen Prozesse der Resynchronisation, nachdem Sprache verloren gegangen ist, oder ein Fehlstart gemacht wurde. Diese Eigenschaften können in das Konversationsmodell eingeschlossen werden, um sicherzustellen, dass das künstliche Prüfen des Netzwerks auf repräsentative Weise ausgeführt wird.
Andere veränderliche Aspekte der Sprache sind dadurch bedeutsam, dass sie verschiedenes Verhalten in dem Netzwerk herbeiführen können, und folglich bei der Übertragung verschieden verschlechtert werden. Aspekte der Kultur und von Eigenschaften des Sprechers können auch Veränderungen der Systemleistung verursachen. Obwohl diese Effekte komplexer als die oben aufgelisteten sind, macht es ihr Einfluss auf die subjektive Qualität wert, sie zu betrachten. Beispieleffekte umfassen: Geschlecht des Sprechers; Sprache, Grammatik und Vokabular; formelle oder informelle Sprache; Informationsgehalt – ob es wichtig ist, dass die Sprache richtig verstanden wird; und die Bestimmtheit des Sprechers – Bestimmen des Wesens der Veränderung des Sprachpegels mit dem empfangenen Pegel.
Diese Klassen der Veränderlichkeit können berücksichtigt werden, indem mehrere verschiedene Konversationsmodelle verwendet werden, um verschiedene Sprecher und Sprachen zu simulieren, um eine Gesamtqualitätseinschätzung zu gewinnen.
Eine Anzahl von Netzwerkeigenschaften, die oben beschrieben wurden, können mit der Zeit variieren. Zum Beispiel können Echokompensatoren eine gewisse Zeitdauer zum Trainieren benötigen, während dieser Trainingsdauer können unerwartete und verwirrende Geräusche gehört werden, und diese zeitliche Veränderlichkeit und die Auswirkungen auf höheren Ebenen der Wahrnehmung davon, wo in dem Konversationsmuster die Verschlechterungen auftreten, müssen berücksichtigt werden.
Eine Ausführung der Erfindung wird nun mit Bezug auf die Figuren beschrieben, in denen:
1 eine schematische Darstellung eines Qualitätsschätzsystems ist,
2 eine schematische Darstellung einer allgemeinen Anordnung einer Schätzeinrichtung für Konversation nach der Erfindung ist,
die 3 und 4 Flussdiagramme sind, die den Prozess darstellen, der jeweils von zwei solcher Vorrichtungen ausgeführt wird, die eine Konversation simulieren,
5 eine solchen Konversation unter idealen Bedingungen darstellt,
6 den Fortschritt einer solchen Konversation in Gegenwart von verschiedenen Umständen der Verschlechterung der Leitung darstellt.
Ein Abriss der Strukturen eines Qualitätsschätz (QA, quality assessment) systems mit zwei Einrichtungen ist in 1 gezeigt. Wie in 1 gezeigt ist an jedem Ende 21 und 22 des zu prüfenden Netzwerks 20 ein Messgerät oder ein Prüfer angeordnet. Eine Einrichtung (der „Urheber") 21 baut einen Anruf auf angemessene Weise auf und leitet eine Konversation mit einem oder mehreren Empfangseinrichtungen („Ziele") 22 (nur eines gezeigt) ein; die Einschätzung einer Audiokonferenzverbindung würde eine solche Einrichtung für jede Partei in dem Anruf erfordern. Wenn die Konversation einmal eingeleitet ist, verhalten sich alle Einrichtungen 21, 22 usw. auf ähnliche Weise.
Während des Anrufs kommunizieren die Einrichtungen 21 und 22 über das Netzwerk 20 mit sprachähnlichen Signalen. Die Signale, die von jeder Einrichtung gesendet werden, werden durch ein Konversationsmodell bestimmt, das bestimmt, was „gesprochen" wird, auf Basis davon, was empfangen wurde und durch einen zu Grunde liegenden Zustand, der den gewünschten Inhalt („Konversationsabsicht") des Anrufs kodiert. Die Qualitätseinschätzung wird von wenigstens einer Einrichtung, und vorzugsweise von allen von ihnen ausgeführt, basierend auf der ankommenden Sprache und auf Wissen über die Signale, die von der anderen Einrichtung oder den anderen Einrichtungen gesendet worden wären. Es ist möglich, aber nicht notwendig, dass diese Einschätzung in Echtzeit ausgeführt wird, wenn die Sprache empfangen wird, aber die empfangene Sprache kann aufgenommen und nachfolgend beurteilt werden. Um eine umfassende Einschätzung der Qualität der Verbindung als Ganzes zu erhalten, können die Ergebnisse der Einschätzung, die von jeder Einrichtung ausgeführt wurde, zu jedem anderen oder einem Netzwerkverwaltungszentrum 23 gesendet werden, um die verschiedenen Messungen zusammenzufassen. Das Netzwerkverwaltungszentrum kann die Qualitätsmessungen einem Mitarbeiter anzeigen, oder kann dazu eingerichtet sein, auf die Messungen hin automatisch zu handeln, z. B. die Leitweglenkung für einen Anruf erneut durchzuführen, bei dem geringe Qualität festgestellt wurde, oder das Wartungspersonal zu alarmieren.
Jede Einrichtung 21 und 22 in einer Konversation hat ihren eigenen Zustand: d. h. ein vorher festgelegter Satz von Antworten auf vorgegebene Stimuli, die dementsprechend variieren, welche Stimuli empfangen werden, und entsprechend der wahrgenommen Qualität dieser Stimuli. Wie in 2 gezeigt ist, hat jede Einrichtung 21 und 22 Wissen über den Zustand (51, 61) von sich selbst und der anderen Einrichtung oder den anderen Einrichtungen. Während einer perfekten Konversation (ohne Verlust oder Verzögerung) würde jede Einrichtung 21 und 22 eine vorher festgelegte Abfolge von Sätzen oder Wörtern als Antwort auf Sätze sprechen, die von der anderen Einrichtung empfangen wird. Der Zustand wird genauer definiert, um darzustellen, ob die Einrichtung hört, und die Sprache, die sie unter verschiedenen Umständen erzeugt. Nach Verlusten in der Leitung unternimmt die Einrichtung Schritte zur Wiederherstellung, indem eine gesprochene Resynchronisation mit den anderen Einrichtungen aus geführt wird. Die Veränderung des Zustands („Zustandsbahn") wird durch einen Vergleich zwischen dem, was empfangen wurde, und dem erwarteten Signal, und durch eine vorher festgelegte gewünschte Abfolge von Sprache bestimmt, die zwischen den Einrichtungen weitergegeben werden soll („Absicht der Konversation"). Das Modell ist deshalb in zwei Teile abstrahiert, einen Zustand (die aktuelle Aktion) und einen Prozessor, der die Übergänge der Zustände bestimmt.
Der Vergleich zwischen empfangener und erwarteter Sprache wird mit einer Ähnlichkeitsanalyse durchgeführt, wie etwa den oben beschriebenen Wahrnehmungsmodellen, die Faktoren wie Echo, Rauschen und Filterung des Signals berücksichtigen. Wenn die Sprache die erwartete Abfolge von Geräuschen mit weniger als einer definierten Menge von Verlusten enthält, beginnt die Einrichtung entweder zu sprechen oder fährt in Abhängigkeit der vorher festgelegten Absicht der Konversation fort, zuzuhören.
Wenn etwas Unerwartetes gehört wird (wie etwa Verzerrung, Sprachverlust, oder ein vorher festgelegtes Wiederherstellungssignal von einer anderen Einrichtung oder anderen Einrichtungen), wird das Wiedergewinnungsverhalten eingeleitet, wobei wieder eine vorher festgelegte Abfolge von Geräuschen verwendet wird. Das Wiedergewinnungsverhalten kann rekursiv sein, wobei es während einem andauernden Verlust der Signalqualität fortgesetzt wird. Die Tatsache, dass die Wiedergewinnung ausgeführt wurde, kann gewisse Merkmale des zukünftigen Inhalts der Konversion des Anrufs verändern. Die Merkmale der empfangenen Sprache bestimmen auch bestimmte Parameter der erzeugten Sprache (wie etwa Sprachpegel und Ton).
Um bei der Handhabung bei der Verarbeitung von ankommenden Signale zu helfen, kann die Sprache, die von jeder Einrichtung kom muniziert wird, mit einer bestimmten Identität markiert werden, genauso wie menschliche Sprecher durch ihre Sprache identifiziert werden können. Einrichtungen können sich selbst auch klar durch einen Namen oder eine erkannte Identitätssequenz identifizieren.
Ein Modell des Konversationszustands, wie es gerade beschrieben wurde, kann bei der Einschätzung der Konversationsqualität eines Netzwerkes wie folgt angewendet werden. Eine oder mehrere Einrichtungen bauen einen Anruf auf, durch den sie miteinander kommunizieren können. Jede hat eine verschiedene Abfolge von Informationen zum Senden an die anderen Einrichtungen, und hat vorab das Wissen, was sie als Antwort hören sollte. Die Einrichtungen unterhalten sich, wobei sie ein Modell des Konversationszustands verwenden, das es ihnen erlaubt, diese Informationen zu kommunizieren, und auf Rauschen, Echos oder Leitungsverluste auf vorher festgelegte Weise zu reagieren, die für menschliche Sprecher repräsentativ ist. Die Kernerfindung in diesem Verfahren ist die dynamische Veränderung der Sprache, die es dem empfangenen Signal ermöglicht, zu ändern, was als Antwort erzeugt werden soll. Dies ermöglicht es, eine Netzwerkverbindung, realistisch nachzubilden, um zu bestimmen, ob sie die Konversation beeinträchtigt, und sie entsprechend zu bewerten.
Die Information (oder gewünschte Sprachsequenz), die kommuniziert werden soll, bildet ein idealisiertes Konversationsmuster für jeden Sprecher. Dieses sollte einer repräsentatives Muster von verschiedenen Teilen der Sprache enthalten, und die zeitliche Struktur und den Inhalt einer typischen Konversation reproduzieren. Diese Sequenz sollte Merkmale der Konversation nachbilden, wie etwa Unterbrechung, Doppelsprechen und Übergabe (der korrekte Austausch von Hör- und Sprechfunktionen zwischen den zwei Benutzern). Bisher bekanntes Wissen über die Qualität der Leitung kann in die zu kom munizierenden Informationen eingeschlossen werden, wie in dem ausgeführten Beispiel veranschaulicht wird. Schließlich sollte der Umfang des zu verwendenden gesprochenen Materials auch repräsentativ sein.
Jede Einrichtung benutzt ihren eigenen Konversationszustand, und Wissen über den Konversationszustand der anderen Einrichtung wird während der Konversation erworben, um festzustellen, welche Signale gesendet werden sollen. Die Konversation bildet deshalb das zu prüfende System auf eine Weise nach, die für das zu prüfende System repräsentativ ist. Die oben beschriebenen Messungen werden ausgeführt, wobei objektive Vorhersagen von subjektiven Parametern wie etwa Qualität, als auch eine Anzahl von anderen objektiven Größen, wie etwa Echocharakterisierung, berechnet werden.
Eine Funktionsdiagramm einer solchen Einrichtung ist in 2 angegeben, wobei eine schichtweise Form verwendet wird, die das algorithmische Modell 30 von den Netzwerkschnittstellenfunktionen 40 zur Verbindung mit einem Netzwerk 49 separiert, das Zwei- oder Vierdraht-Telefonie, ein digitales Übertragungssystem wie etwa ISDN oder T1 oder irgendein anderes geeignetes System sein kann. Die Schlüsselelemente der Einrichtungen sind:
die Modelle der Sprecher 50 und anderer Sprecher 60, die Modelle für den Konversationszustand 51 und 61 enthalten, die den Prozess der Spracherzeugung 52 und 62 steuern;
Wahrnehmungsanalyse der empfangenen Sprache 70, die im Vergleich zu gesendeter und erwarteter empfangener Sprache gemessen wird,
ein Konversationsprozessor 80, der die Konversationszustände 51 und 61 steuert, um die Zustandsbahn zu bestimmen und wendet sowohl die Absicht der Konversation (Sprache, die durch normale Konversation kommuniziert werden soll) als auch das Wiederherstellungsverhalten nach Verlusten, Doppelsprechen oder anderen unerwarteten Ereignissen auf der Leitung an.
Um 2 detaillierter zu diskutieren, umfasst das algorithmische Modell 30 die Sprechermodelle 50 und 60, die den Konversationszustand jedes Sprechers in dem System (Konversationszustandseinheiten 51, 61) modellieren, um die Sprache zum Senden (Spracherzeugereinheit 52) und die Sprache zu erzeugen, von der erwartet wird, dass es sie von dem Benutzer am anderen Ende empfängt (Spracherzeugereinheit 62). Die Sprache, die von der Spracherzeugereinheit 52 erzeugt wird, wird über eine Sprachkanaleinheit 31 zu der Netzwerkschnittstelle 40, und über eine entsprechende Sprachkanaleinheit 41 zum Senden an den Benutzer am anderen Ende gesendet. Signale, die von dem Benutzer am anderen Ende empfangen werden, werden von der Netzwerkschnittstelle 40 empfangen und über den Sprachkanal 31 als empfangene Sprache empfangen, und von der Wahrnehmungsanalyseeinheit 70 verarbeitet, wie auch von einer Einheit 32, die herkömmliche Kanalmessungen wie etwa Echoerfassung ausführt. In der Wahrnehmungsanalyseeinheit 70 wird die empfangene Sprache mit der erwarteten Sprache verglichen, die von der Einheit 52 erzeugt wird, um die Qualität der empfangenen Sprache zu analysieren, wobei deren Ergebnisse durch den Konversationsprozessor 80 verarbeitet werden, welcher wiederum die Konversationszustände 51 und 61 in den Sprechermodellen 50 und 60 aktualisiert. Der Konversationsprozessor 80 und andere Kanalmessungen 32 steuern eine Meldeeinrichtung der Anrufverwaltung 33, die andere Funktionen wie etwa Fax- oder Modemprüfanrufe (Modul 34) und die einleitenden Wähl- und Aufbaufunktionen für Sprachanrufe 35 ausführt, die mit dem Netzwerk über eine Anwendungsprozessorschnittstelle 36 kommunizieren.
Die Netzwerkschnittstelle 40 hat eine direkte Sprachkanalschnittstelle 41 zum Empfang von Signalen von dem Sprachkanal 31 in dem Prozessor 30, und einen Datenhandler 46 für die Anrufsignalisierung und das Datenprotokoll, um mit der Anwendungsprozessorschnittstelle 36 zu kommunizieren. Diese Schnittstellen 41 und 46 kooperieren mit einem maschinennahen Softwaretreiber 47 und folglich mit der physikalischen Verbindung 48 mit der Netzwerkschnittstelle 49.
Ein einfaches Beispiel der Konversationseinschätzung einer Verbindung zwischen zwei Einrichtungen wird nun mit Bezug auf die 3, 4, 5 und 6 beschrieben. Die 3 und 4 sind vereinfachte Flussdiagramme, die zeigen, wie die Konversation unter verschiedenen Umständen fortschreiten würde, wie es von der Urhebereinheit 21 beziehungsweise der Empfangseinheit 22 gesehen wird. Diese Flussdiagramme stellen nur die eingesetzten Prinzipien dar, und sind demgegenüber sehr vereinfacht worden, was tatsächlich erforderlich wäre, um alle möglichen Fehlerbedingungen realistisch zu emulieren. Insbesondere zeigt jeder Schritt nur zwei mögliche Ergebnisse, aber in der Praxis kann es mehrere geben.
3 zeigt die Prozesse, die von der Einrichtung 21 ausgeführt werden, und 4 zeigt die Prozesse, dem von dem Einrichtung 22 ausgeführt werden, wenn sie miteinander interagieren. Wie man sehen kann, nimmt die Konversation verschiedene Verläufe entsprechend der Qualität der Signale, die von jeder Einrichtung von der anderen empfangen werden. Gewisse Schritte, die fett umrandet sind, bezeichnen Stellen, an denen Qualitätsmessungen durchgeführt wer den können. Es soll jedoch bemerkt werden, dass alle empfangenen Nachrichten auch generell bezüglich der Signalqualität überwacht werden können.
Wie in 3 gezeigt ist, leitet die Einrichtung 21 (die das gesprochene Identifikationssignal „Smith" hat) einen Anruf (Schritt 100) zu der Einrichtung 22 (die das gesprochene Identifikationssignal „Jones" hat) ein. Die Einrichtung 21 wartet dann, um eine erwartete Nachricht 1 von der Einrichtung 22 zu empfangen. Wenn die erwartete Nachricht nicht korrekt empfangen wird, wird im nächsten Schritt, Schritt 101, eine Nachricht 12 gesendet, um die Einrichtung am anderen Ende 22 aufzufordern, die Nachricht erneut zu senden. Wenn die Nachricht 1 korrekt empfangen wurde, sendet die Einrichtung 21 eine zweite Nachricht 2 (Schritt 103) und erwartet eine Antwort von der Einrichtung 22 am anderen Ende. Die Einrichtung 21 erwartet eine von zwei Antworten (Nachrichten 3/13) von der Einrichtung am anderen Ende 22. Die zwei Nachrichten zeigen die Signalqualität an, die von der Einrichtung 22 am anderen Ende empfangen wurde. Wenn diese Nachricht empfangen wird (Schritt 104), wird die Signalqualität der Nachricht beurteilt (Schritt 105). Es sei bemerkt, dass dieser Schritt die Qualität des Signals misst, das von der Einrichtung 32 empfangen wurde, unabhängig von seinem Inhalt. Der Inhalt des Signals (d. h. ob es Signal 3 oder Signal 13 ist) zeigt die Qualität an, die von der Einrichtung 22 am anderen Ende empfangen wurde. Dies kann auch an der Einrichtung 21 überwacht werden, indem bestimmt wird, welches der zwei Signale 3/13 tatsächlich empfangen wird.
Als Reaktion auf die gemessene Signalqualität wird eine Nachricht 4 oder 14 dementsprechend gesendet (Schritte 106, 107), ob die Signalqualität, die in Schritt 105 wahrgenommen wird, gut oder schlecht ist. Dies ist dazu eingerichtet, Nachricht 3 zu unterbrechen. Dies er laubt, die Reaktion des Systems auf "Doppelsprechen" – beide Parteien sprechen gleichzeitig – zu überwachen. Eine weitere Nachricht wird dann von der Einheit 22 am anderen Ende (Nachricht 5, Schritt 108) empfangen, wobei die Einheit 21 als Reaktion auf diese eine weitere Nachricht 6 sendet (Schritt 109). In der nächsten Stufe wird eine weitere Nachricht 7/15 empfangen (Schritt 110). Ihre Qualität wird dann auf ähnliche Weise wie im schon beschriebenen Schritt 105 gemessen (Schritt 111), und eine Nachricht 16 wird gesendet (Schritt 112), wenn die Qualität der Nachricht 7/15, die in Schritt 110 empfangen wurde, schlecht ist. Nach der Übertragung von Nachricht 16 kehrt die Einrichtung zu Schritt 108 zurück, um eine Wiederholung der Nachricht 5 abzuwarten. Wenn jedoch die Qualität des im Schritt 110 empfangenen Signals (wie in Schritt 111 geschätzt) gut ist, dann wird ein weiterer Schritt (113) ausgeführt, um zu beurteilen, welche der Nachrichten 7 oder 15 in Schritt 110 empfangen wurde. Wenn die empfangene Nachricht Nachricht 15 war, kehrt der Prozess zu Schritt 109 zurück, dem Senden von Nachricht 6. Wenn jedoch die im Schritt 113 empfangene Nachricht Nachricht 7 ist, dann pausiert das System (Schritt 114), bevor eine weitere Nachricht 8 (Schritt 115) gesendet wird und eine komplementäre Nachricht 8 von dem anderen System 22 empfangen wird (Schritt 116). Wenn keine solche Nachricht empfangen wird, erwartet das System das Geräusch des auflegenden anderen Systems (Schritt 117), bevor es selbst auflegt (Schritt 118). Wenn jedoch Nachricht 8 in Schritt 116 empfangen wird, findet der Auflegeprozess sofort statt.
4 zeigt den komplementären Prozess, der in der Einrichtung 22 stattfindet. Die Einrichtung 23 empfängt zu Anfang die Einleitung des Anrufes von der Einrichtung 21 (Schritt 200), als Reaktion worauf es die Nachricht 1 überträgt (Schritt 201), und als Antwort entweder Nachricht 2 oder Nachricht 12 von der Einrichtung 21 emp fängt (Schritt 202). Der Inhalt des Signals (2/12) zeigt die von der Einrichtung 21 am anderen Ende empfangene Qualität an. Dies kann an der Einrichtung 22 überwacht werden, indem bestimmt wird, welche der zwei Nachrichten 2 oder 12 tatsächlich empfangen wurde.
Wenn Nachrichten 12 empfangen wurde, sendet die Einrichtung 22 Nachricht 1 erneut (Schritt 201). Wenn jedoch Nachricht 2 empfangen wird, wird die Signalqualität beurteilt (Schritt 203) und entsprechend der empfangenen Qualität entweder eine Nachricht 3 (Schritt 204) oder Nachricht 13 (Schritt 205) gesendet. Einrichtung 22 empfängt dann von der Einrichtung 21 eine Nachricht 4 oder 14, die von den obigen Schritten 106 oder 107 erzeugt wird (Schritt 206). Das System pausiert dann (Schritt 207), bevor es eine weitere Nachricht 5 sendet (Schritt 208), und die Einrichtung 22 empfängt dann von der Einrichtung 21 eine von zwei Nachrichten 6 oder 16 (Schritt 209). Wenn die empfangenden Nachricht Nachricht 16 ist, dann kehrt die Einrichtung zu Schritt 208 zurück, um Nachricht 5 erneut zu senden. Wenn jedoch die empfangenen Nachricht Nachricht 6 ist, wird eine Qualitätsbeurteilung (Schritt 210) durchgeführt. Wenn die Qualität als schlecht beurteilt wird, sendet die Einrichtung 22 eine Nachricht 15 (Schritt 211), bevor es zu Schritt 209 zurückkehrt, um auf Nachricht 6 oder 16, je nachdem, was angemessen ist, von Einrichtung 21 zu warten. Wenn doch die im Schritt 210 gemessene Qualität als gut beurteilt wird, sendet die Einrichtung 22 eine Nachricht 7 an die Einrichtung 21 (Schritt 212) und pausiert dann (Schritt 214), bevor eine Prozessanalyse wie oben beschrieben ausgeführt wird, um die Konversation abzuschließen (Schritte 215, 216, 217, 218, die den Schritten 115, 116, 117 und 118 entsprechen).
In der folgenden Diskussion des Prozesses wird der Urheber 21, mit dem Namen Smith, durch fetten Text bezeichnet, und die Zieleinrich tung 22, Jones, durch kursiven Text. Die zu kommunizierende Information – die erwartete Konversation für eine perfekte Verbindung – ist in 5 gezeigt und wird wie folgt zusammengefasst: diese Schritte werden durch Doppelpfeile in 3 und 4 gezeigt:
Smith macht den Anruf (Schritt 100).
Jones antwortet. Hallo, hier Jones (Nachricht 1).
Hallo Jones, hier spricht Smith. Wie klar ist die Leitung? (Nachricht 2)
Für mich ausgezeichnet (Nachricht 3).
(Smith unterbricht zu Beginn von „mich") und für mich sehr gut (Nachricht 4).
(Pause.) (Schritt 207) Wieviel Uhr ist es? (Nachrichten) 14 Uhr 15 Minuten und 10,3 Sekunden (Nachricht 6).
Danke, das war's (Nachricht 7).
(Pause.) (Schritt 114/214)
(Gleichzeitig) Auf Wiederhören, Smith, auf Wiederhören, Jones (Nachricht 8).
Für eine klare, unmittelbare Verbindung wäre die Konversation wie oben beschrieben. Im Falle einer Leitung mit schlechterer Qualität, mit Verzögerung und schweren Verlusten, kann das Konversationsmodell eine Konversation liefern, die dem folgenden Beispiel ähnlich ist, wie in 6 dargestellt ist: Sprachverlust durch den Kanal (gesendet, aber nicht empfangen) wird unten durch Durchstreichen und durch „x" in 6 markiert:
Smith macht einen Anruf. (Schritt 100)
Jones antwortet.
Hallo, hier Jones. (Nachricht 1)
(Smith antwortet auf den Verlust) Entschuldigung, ich konnte Ihren Namen nicht verstehen. (Nachricht 12)
Hier Jones (Nachricht 1 wiederholt)
Hallo Jones, hier spricht Smith. Wie gut ist die Verständlichkeit der Leitung? (Nachricht 2)
Für mich schlecht. (Nachricht 13)
(Smith's Unterbrechung zu Beginn von „schlecht" verursacht dessen Verlust) und schlecht für mich (Nachricht 14).
(Pause.) (Schritt 207) Wieviel Uhr ist es? (Nachricht 5)
vierzehn Uhr fünfzehn... (Nachricht 6)
(Jones unterbricht)
Wieviel Uhr? (Nachricht 15: Doppelsprechen verursacht den Verlust des Beginns der Nachricht)
Wie bitte? (Nachricht 16)
(Jones wiederholt die Frage.) Wieviel Uhr ist es? (Nachricht 5)
Vierzehn Uhr fünfzehn Minuten und 10,3 Sekunden. (Nachricht 6)
Danke, das war's. (Nachricht 7)
(Pause.) (Schritte 114/214)
Auf wiederhören, Smith. (Nachricht 8) Auf wiederhören, Jones
(Verzögerung zwischen den zwei Einrichtungen und Verhalten des Netzwerks bei Doppelsprechen verursachte Verluste).
Smith legt zuerst auf (Schritt 118);
Jones hört das (Schritt 217) statt der erwarteten Nachricht 8 („Auf wiederhören, Jones), und legt dann auch auf (Schritt 218).
Dieses Beispiel stellt die prinzipiellen Aspekte der dynamischen Konversationsprüfung dar. Der Verlust von Schlüsselinformationen leitet eine Wiedergewinnung ein. Das erste Mal, wenn dies geschieht (Nachricht 1: „Jones" wurde durch den Kanal verloren), bekommt die Wiedergewinnung (Schritt 102) die erwarteten Informationen. Das zweite Mal, wenn dies geschieht („Vierzehn") (Schritt 209), wird der einlei tende Wiedergewinnungssatz 15 selbst durcheinander gebracht und der Konversationszustand wird zurückgesetzt (Schritt 111), was zu einer Wiederholung der ursprünglichen Frage (Nachricht 5: Schritt 208) führt. Mehrere nicht-essenzielle Teile der Sprache gehen auch verloren; diese leiten keine Wiedergewinnung ein, werden aber bei der Gesamtbeurteilung der Signalqualität berücksichtigt.
Die Einrichtung 21 beginnt die Übertragung von Nachricht 4 (Schritt 106/7), bevor die Nachricht 3/13 (Schritt 104) vollendet ist. Dies ermöglicht der Einrichtung, zu bestimmen, ob die Qualität des Restes der Nachricht 3/13 von dem Doppelsprechen beeinflusst wird. „Doppelsprechen" tritt auch im Schritt 211 auf, wenn Einrichtung 22 (Nachricht 15) Nachricht 6 unterbricht; dieses Mal ist es der Beginn der neuen Nachricht 6, der beeinträchtigt wird. Schließlich verursacht die Netzwerkverzögerung und das resultierende Verhalten bei Doppelsprechen des Netzwerks, dass Smith's „Auf wiederhören, Jones" (Nachricht 8: Schritt 114) verloren geht; Smith legt auf (Schritt 117), nachdem er das erwartete „Auf wiederhören, Smith" hört (Schritte 215), aber Jones hört nur, dass die Leitung unterbrochen wird (Schritt 210). Da die Möglichkeit der Wiedergewinnung nicht weiter besteht, legt Jones auch auf (Schritt 217).
Ebenso wie Messungen der Sprachqualität und von Verlusten während der Konversation können beide Einrichtungen andere Eigenschaften des Kanals berechnen. Echo des Sprechers, und der Betrieb von Echokompensatoren in der Leitung würden berechnet, indem die gesprochenen und empfangenen Signale verglichen werden, wenn jede Einrichtung spricht. Die Verzögerung kann aus dem Anstieg der Zeit berechnet werden, die benötigt wird, damit eine Antwort nach einer Zeit für eine verzögerungsfreien Verbindung gehört wird; zusätzlich kann Jones mit synchronisierten Uhren die Einwegverzöge rung vom Sprechen bis zum Empfang mit dem Zeitpunkt, wie er von Smith gesprochen wird, messen, wenn auch die Verarbeitung davon stattfindet, nachdem die Konversation beendet wurde.

Claims

Verfahren zum Prüfen eines Telekommunikationssystems (20), bei dem eine erste Messeinrichtung (21) einen Anruf durch das System, das sie prüft, zu wenigstens einer zweiten Messeinrichtung (22) tätigt, und die Einrichtungen (21, 22) sich mit vorher festgelegten Sprachsignalen unterhalten, und wenigstens eine der Einrichtungen (21) Messungen der Geräusche durchführt, die es von der anderen Einrichtung (22) oder Einrichtungen empfängt, um einen oder mehrere Parameter zu berechnen, die Aspekte der empfangenen Signalqualität beschreiben, dadurch gekennzeichnet, dass die vorher festgelegten Sprachsignale von jeder Einrichtung (21, 22) als Reaktion auf die Signale, die von den Einrichtungen empfangen werden, dynamisch erzeugt werden, um Aspekte von Konversation über eine nicht-perfekte Verbindung im Kommunikationssystem zu simulieren.
Verfahren nach Anspruch 1, bei dem eine der Einrichtungen (22) auf das Versagen, ein erwartetes Signal von einer anderen der Einrichtungen (21) klar zu empfangen, reagiert, indem sie ein vorher festgelegtes Antwortsignal mit der Absicht überträgt, die andere Einrichtung (21) zu veranlassen, das erwartete Signal zu wiederholen.
Verfahren nach Anspruch 1 oder 2, bei dem wenigstens einige der Signale, die für die Übertragung als Reaktion auf die eingegebenen Signale erzeugt werden sollen, entsprechend der Qualität der empfangenen Signale ausgewählt werden.
Verfahren nach Anspruch 3, bei dem wenigstens eines der auswählbaren Antwortsignale ein Signal ist, das die Wiederholung des empfangenen Signals anfragt, wobei es als Reaktion auf schlechte Qualität des empfangenen Signals ausgewählt werden kann.
Verfahren nach Anspruch 3 oder 4, bei dem die Eigenschaften des zu erzeugenden Antwortsignals entsprechend der Qualität des empfangenen Signal ausgewählt werden.
Verfahren nach Anspruch 3, 4 oder 5, bei dem die Qualität der Verbindung im Kommunikationssystem (20) entsprechend dem Fortschritt der simulierten Konversation bestimmt wird.
Verfahren nach Anspruch 6, bei dem die Qualität der Verbindung im Telekommunikationssystem (20) entsprechend dem Informationsgehalt und/oder der Qualität der empfangenen Antwortsignale bestimmt wird.
Verfahren nach einem der Ansprüche 1 bis 7, bei dem die Einrichtungen (21, 22) einrichtungsspezifische Identifikationssignale senden und erkennen, die einen Teil der erzeugten Sprache bilden.
Verfahren nach einem der Ansprüche 1 bis 8, das einen Berechnungsprozess für die Systemverzögerung enthält, bei dem ein erstes Signal von einer ersten Einrichtung (21) zu einer zweiten Einrichtung (22) übertragen wird, wobei die zweite Einrichtung das Signal empfängt und, nach einer vorher festgelegten Verzögerung, ein Antwortsignal an die erste Einrichtung sendet, und die Systemverzögerung aus dem Sendezeitpunkt des ersten Signals, dem Empfangszeitpunkt des zweiten Signals und der vorher festgelegten über Verzögerungszeit bestimmt wird.
Verfahren nach einem der Ansprüche 1 bis 9, das einen Berechnungsprozess für die Systemverzögerung enthält, bei dem zwei oder mehr Einrichtungen (21, 22) synchronisierte Uhren aufweisen, wobei eine der Einrichtungen ein Signal zu der anderen Einrichtung sendet, das die aktuelle Zeit anzeigt, und die Verzögerung in dem zu prüfenden System bestimmt wird, indem das empfangene Signal, das die Zeit anzeigt, mit den Empfangszeitpunkt verglichen wird.
Verfahren nach einem der Ansprüche 1 bis 10, bei dem die verwendeten Signale vorher aufgenommene Beispiele von menschlicher Sprache sind.
Verfahren nach einem der Ansprüche 1 bis 10, bei dem die verwendeten Signale künstliche Beispiele von menschlicher Sprache sind.
Verfahren nach Anspruch 11 oder 12, bei dem verwendeten Signale eine Mehrzahl verschiedener Sprecher darstellen.
Verfahren nach einem der vorangehenden Ansprüche, bei dem die ausgeführten Messungen verwendet werden, um den Betrieb des Kommunikationssystems (20) zu steuern.
Verfahren nach einem der vorangehenden Ansprüche, bei dem eine oder mehrere der Einrichtungen (21) ein Signal gleichzeitig mit einem anderen Signal senden, das von der gleichen Einrichtung empfangen wird, sodass Korruption von dem einen oder dem anderen der Signale an ihrem jeweiligen Empfangsort erkannt werden kann.
Einrichtung (21) zur Simulation einer Konversation über ein Kommunikationssystem, mit: einem Speicher (50, 60) zum Speichern einer Mehrzahl von Signale, die eine Konversation bilden, einem Empfänger (41) zum Empfangen von Signalen von einer oder mehreren komplementären Einrichtungen, einer Sendeeinrichtung (52) zum Senden eines Signals zu der komplementären Einrichtung oder den komplementären Einrichtungen und einer Vergleichseinrichtung (70) zum Vergleichen von Signalen, die von dem Empfänger empfangen werden, mit Signalen, die in dem Speicher gespeichert sind; gekennzeichnet durch eine Auswahleinrichtung (80), die auf die Vergleichseinrichtung (70) reagiert, um ein Signal zum Senden an die komplementäre Einrichtung oder die komplementären Einrichtungen aus dem Speicher (50) auszuwählen.
Einrichtung nach Anspruch 16 mit einer Konversationseinleitungseinrichtung (33) zum Erzeugen eines Einleitungssignals zum Senden durch die Sendeeinrichtung (52).
Einrichtung nach Anspruch 16 oder 17 mit einer Verarbeitungseinrichtung (80) zum Messen der Konversationsqualität des Kommunikationssystems.
Einrichtung nach Anspruch 18, bei der die Verarbeitungseinrichtung (80) eine Einrichtung zum Überwachen des Betriebs der Auswahleinrichtung enthält, um den Fortschritt einer Konversation zu schätzen.
Einrichtung nach Anspruch 18 oder 19, bei der die Verarbeitungseinrichtung (80) eine Einrichtung zum Überwachen der Qualität von Signalen enthält, die von den komplementären Einrichtungen von der Empfangseinrichtung (41) empfangen werden.
Einrichtung nach Anspruch 18, 19 oder 20, bei der die Verarbeitungseinrichtung (80) eine Einrichtung zum Überwachen des Fortschritts der simulierten Konversation enthält, und dadurch die Qualität der Verbindung im Kommunikationssystem bestimmt.
Einrichtung nach einem der Ansprüche 16 bis 21, bei der die Auswahleinrichtung (80) eine Einrichtung aufweist, um verschiedene Signale zum Senden entsprechend der Qualität der empfangenen Signale auszuwählen.
Einrichtung nach Anspruch 22, bei der die Auswahleinrichtung (80) eine Einrichtung aufweist, um ein Signal auszuwählen, das die Wiederholung eines empfangenen Signals als Reaktion auf schlechte Qualität des empfangenen Signals anfragt.
Einrichtung nach Anspruch 20, 21, 22 oder 23, bei der Auswahleinrichtung (80) eine Einrichtung aufweist, um Eigenschaften des zu sendenden Signals entsprechend der Qualität des empfangenen Signals auszuwählen.
Einrichtung nach einem der Ansprüche 16 bis 24, bei der die Auswahleinrichtung (80) eine Einrichtung aufweist, um verschie dene Signale danach auszuwählen, welches der vorher festgelegten Signale empfangen wird.
Einrichtung nach Anspruch 25, bei der die Auswahleinrichtung (80) eine Einrichtung zum Antworten auf ein vorher festgelegtes empfangenes Signal aufweist, indem sie das zuvor von dem Sender gesendete Signal erneut auswählt.
Einrichtung nach einem der Ansprüche 16 bis 26, bei der die Einrichtung (21) eine Einrichtung zum Senden eines Identifikationssignals als Teil der erzeugten Sprache aufweist.
Einrichtung nach einem der Ansprüche 16 bis 27, bei der die Einrichtung eine Einrichtung (32) zum Erkennen von Identifikationssignalen aufweist, die für den individuellen Zugehörigen zu einer Mehrzahl von komplementären Einrichtungen spezifisch sind, die die Sprache senden, die von dem Empfänger empfangen wird.
Einrichtung nach Anspruch 27 oder 28, bei der die Identifikationssignale gesprochene Worte sind.
Einrichtung nach einem der Ansprüche 16 bis 29 mit einer Einrichtung (41) zum gleichzeitigen Senden und Empfangen vorher festgelegter Signale, und einer Einrichtung (70) zum Bestimmen, ob das vorher festgelegte empfangene Signal durch die Anwesenheit des gesendeten Signals korrumpiert wird.
Einrichtung nach einem der Ansprüche 16 bis 30 mit einer Verzögerungsberechnungseinrichtung mit einer Einrichtung zum Bestimmen des Zeitpunkts, zu dem ein erstes Signal an eine komplementäre Einrichtung gesendet wurde, einer Einrichtung zum Bestimmen ist des Zeitpunkts, zu dem ein vorher festgelegtes Antwortsignal von der komplementären Einrichtung empfangen wird, einer Einrichtung zum Abrufen aus dem Speicher des Wertes einer vorher festgelegten Verzögerung bei der komplementären Einrichtung zwischen dem Empfang des ersten Signals und dem Senden des Antwortsignals, und einer Einrichtung, um daraus die zusätzliche Verzögerung zu bestimmen, die von dem zu prüfenden System bewirkt wird.
Messsystem zum Schätzen der Qualität eines Kommunikationssystems (20) durch Simulieren einer Konversation zwischen menschlichen Sprechern, wobei das System aus zwei oder mehr Einrichtungen (21, 22) besteht, die an das zu prüfende System angeeigneten Stellen zum Einleiten eines Anrufs und zur Übertragung von Sprache angeschlossen sind; wobei die Einrichtungen eine Einrichtung (52) zum Erzeugen von vorher festgelegten Konversationsmustern aufweisen und wenigstens eine der Einrichtungen eine Verarbeitungseinrichtung (70) aufweist, um eine Anzahl von verschiedenen Qualitätsparametern aus den empfangenen Signalen zu extrahieren, dadurch gekennzeichnet, dass die vorher festgelegten Konversationsmuster dynamisch auf eine Weise variieren, die für menschliche Sprache repräsentativ ist, sodass die Sprache, die an jeder Einrichtung erzeugt wird, dynamisch als Reaktion auf die Signale variiert, die an dieser Einrichtung empfangen werden.
Messsystem nach Anspruch 32, das wenigstens zwei Einrichtungen (21, 22) umfasst, die jeweils einem der Ansprüche 16 bis 31 entsprechen.
Messsystem nach Anspruch 32 oder 33, bei dem zwei oder mehr der Einrichtungen synchronisierte Uhren aufweisen, bei denen wenigstens eine der Einrichtungen eine Einrichtung zum Senden eines Signals aufweist, das die aktuelle Zeit anzeigt, und wenigstens eine andere der Einrichtungen eine Einrichtung für die Bestimmung der Verzögerung in dem zu prüfenden Systemen aufweist, indem das empfangene Signal, das die Zeit anzeigt, mit dem Empfangszeitpunkt verglichen wird.