DE19803081A1 - Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens - Google Patents

Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens

Info

Publication number
DE19803081A1
DE19803081A1 DE19803081A DE19803081A DE19803081A1 DE 19803081 A1 DE19803081 A1 DE 19803081A1 DE 19803081 A DE19803081 A DE 19803081A DE 19803081 A DE19803081 A DE 19803081A DE 19803081 A1 DE19803081 A1 DE 19803081A1
Authority
DE
Germany
Prior art keywords
procedure
carrying
devices
voice transmission
procedure according
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19803081A
Other languages
English (en)
Inventor
Estebanez Eva Garcia
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19803081A priority Critical patent/DE19803081A1/de
Publication of DE19803081A1 publication Critical patent/DE19803081A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/253Telephone sets using digital voice transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Sprachübermittlung nach dem Ober­ begriff des Hauptanspruchs. Die Erfindung gibt ein Verfahren an, welches es ermöglicht, insbesondere Sprachübermittlung mit sehr geringem Verbrauch an Leitungsressourcen hinsichtlich des Übermittlungsaufwands der Informations­ einheiten in der Zeiteinheit durchzuführen. Die Erfindung macht es sich somit zur Aufgabe, insbesondere Sprache mit einfachen Mitteln zum Gebrauch als Telefon o. ä. zu übertragen.
Geräte dieser Gattung sind in ihrer Möglichkeit, günstige Gebührentarife der drahtgebundenen und der Funknetze zu nutzen, begrenzt. Sprachübermittlung in analogen Systemen (Telefonie o. ä.) benötigen in den Übertragungskanälen eine relativ große Bandbreite oder aber in digitalen Systemen verursacht sie eine entsprechend große Datenflut in Bits/s. Bekannte Kompressionsverfahren und Verfahren zur Aufteilung der Kanäle auf mehrere Teilnehmer reduzieren zwar den Leitungsaufwand, jedoch immer noch auf relativ sehr hohem Niveau.
Erfindungsgemäß wird diese Aufgabe durch die im kennzeichnenden Teil des Hauptanspruchs genannten Merkmale gelöst. Die Unteransprüche geben vor­ teilhafte Ausgestaltungen einer derartigen Einrichtung an. Um diesem bekannten Übelstand abzuhelfen und die Übertragungskosten dra­ stisch zu senken, wird erfindungsgemäß vorgeschlagen, die Sprachübertragung grundsätzlich etwa folgendermaßen durchzuführen:
Ein Spracheingabegerät empfängt die akustischen Informationen. Ein Wand­ ler formt die akustischen Signale in einen (einfachen) symbolischen Code (z. B. ASCII-Code). Dieser Code benötigt bei der Übertragung auch über große Strecken sehr wenig Bandbreite resp. Bits/s. Auf der Empfangsseite befindet sich ein weiterer Wandler zur Rückformung des symbolischen Codes in aku­ stisch verständliche Sprache. Es ist an sich bekannt, Spracheingabegeräte zur Erzeugung eines symbolischen Codes zu verwenden, wie z. B. das von der Fa. IBM vertriebene Produkt "Via Voice". Weiterhin ist es Stand der Technik, Texte, die im symbolischen Code vorliegen, in akustisch verständliche Sprache zurückzuverwandeln (z. B. Produkt der Fa. Eltex, Ffm.).
Im Vergleich zur Übertragung von symbolischen Codes (z. B. Schriftzeichen des ASCII-Codes) ist der Bedarf an Kanalbelegung oder Bandbreite auf dem Übertragungsweg für Sprachtelefonie jedoch etwa 1000 mal größer.
Die Erfindung wird anhand der Fig. 1, die ein schematisches Blockschaltbild mit Sinnbildern darstellt, erläutert.
Die Erfindung geht von der Erkenntnis aus, daß die Liberalisierung der Tele­ kommunikationsmärkte in Deutschland und in Europa den Betreibern von Kommunikationsnetzen die Möglichkeit eröffnet, an der Telekommunikation massiv teilzuhaben. Die interessanteste Anwendung für die Kabelnetzbetreiber wird wohl die öffentliche Sprachtelefonie sein. Es sind verschiedene Übertra­ gungsprotokolle bekannt geworden, von denen z. B. das Motorola CACS-Pro­ tokoll weitere Verbreitung gefunden hat. Ein interessantes Netz zur Übertra­ gung von Sprachtelefonie kann das Internet sein. Das Internet ist aus ökonomi­ schen Gründen besonders interessant, da die Übertragung netzintern auch über sehr große Entfernungen sehr preisgünstig ist und ein Privathaushalt nur die Gebühren für ein Nahbereichsgespräch bis zum nächsten PoP (Point of Presens) des Netproviders zu entrichten hat. Der Internetzugang per TV-Kabel ist in Deutschland sogar schon heute (1997) möglich, wenngleich es bislang nur einige wenige Kabelinseln sind.
Da mehrere technische Herausforderungen zu überwinden sind, sind in die­ sem Unterfangen einige Aufgaben zu lösen. Eine der Hürden stellt beispiels­ weise die Sprachqualität des Telefondienstes dar. Sie muß in bezug auf Rau­ schen, Störeinstrahlungen und Echos mindestens den traditionellen Festnetzan­ schlüssen entsprechen.
Würde jedoch mit den heute üblichen Methoden Sprachtelefonie im großem Umfang über das Internet durchgeführt werden, wäre dieses Netz in Kürze hoffnungslos überlastet. Ganz zu schweigen von der noch recht schlechten Übertragungsqualität bisher.
Die erfindungsgemäße Anordnung entsprechend dem schematischen Beispiel der Fig. 1 löst diese Aufgaben wie folgt: Die anrufende Person IA benutzt ein Telefon 1B, welches die akustischen Signale in analoge elektrische Signale umformt und an einen Analog/Digitalwandler 1D, z. B. einen marktüblichen PC weiterleitet. Dieser Wandler, vorzugsweise hard- und/oder softwaremäßig in einen PC integriert, formt die analogen Signale, die ja äquivalent zu den akustischen Signalen der menschlichen Sprache sind, in einen symbolischen Code um. Dieser symbolische Code wird hinsichtlich der semantischen und semiasiologischen Beziehung kontextsensitiv vorzugsweise in Form einer ASCII-Zeichenkette erzeugt. Bisher existieren schon ein Reihe von Soft- und Hardwarelösungen für diese Aufgabe (z. B. von der Fa. IBM das Produkt "Via Voice"). Weiterhin existieren neben Softwarelösungen auch solche, die diese Aufgabe unter Zuhilfenahme einer speziellen Hardware lösen. Dieser nunmehr extrem kompakte symbolische Code von digitalen Signalen kann, wie oben an­ gegeben, (an sich mittels jeder bekannten Übertragungsstrecke z. B. Glasfaser­ kabelnetze, Koaxialkabelnetze, Satellitenfunk 2A, Telefon1eitungen 2B oder) über Internet weltweit äußerst preisgünstig übertragen werden. Auf der Emp­ fangsseite wird das symbolisch codierte Signal 3A in einem geeigneten A/D-Wandler 3B in analogische elektrische Impulse 3C, 3D und in vernehmbare, natürliche Sprache für die Empfangsperson 3E zurückverwandelt. Für die Wandlung eines symbolischen Codes in eine natürliche Sprache stehen entspre­ chende Softwarelösungen (z. B. von der Fa. Eltex, Frankfurt) zur Verfügung.
Neben dem o.g., bekannten ASCII-Code wird für die Erfindung in abgewan­ delter Form ein weiteres Kompressionsverfahren vorgeschlagen, das eine Ver­ kleinerung der zu übertragenden Datenmenge bewirkt, soweit nicht eine gewisse Redundanz sinnvoll und im Sinne der Störungssicherheit vorzuziehen ist. In ei­ ner sinnvollen Ergänzung dieser Kompressionseinrichtung ist die Versendung von Datenpaketen möglich. Diese Datenpakete sind so groß, daß gerade noch der Eindruck einer Echtzeitübertragung erhalten bleibt.
In der Regel ist ein Vollduplexbetrieb vorgesehen, so daß die Fig. 1 in der Richtung - hin wie zurück - gleichzusetzen ist.
In einer bevorzugten Durchbildung der Erfindung wird für die Hin-Wandler 1D und/oder Zurück-Wandler 3B ein PC verwendet. Neben der akustischen Ausgabe der Sprache wird das Gesprochene zusätzlich (zu Kontrollzwecken) auf dem Bildschirm dargestellt und ist (zu Kontrollzwecken) speicher- und aus­ druckbar.
Eine weiterführende Ausführungsform verfügt über eine Sprechmusterüber­ tragung, bei der der Sprecher vor der eigentlichen Übertragung sein individuel­ les Sprechmuster an die Gegenstelle übersendet, aus dem diese Gegenstelle dann das originäre Sprechmuster regenerieren kann für den darauffolgende Übertragung des symbolischen Codes ohne jedes Sprechmuster. Hierzu sind verschiedene Strategien geeignet. Erfindungsgemaß wird vorgeschlagen, daß jeder Sprecher einen Standardtext aufspricht, der als individuelles Sprechmuster verwendet wird. Dieses Muster wird dann zu Beginn eines jeden Gespräches an die jeweilige Gegenstelle versandt. Diese Muster sind vorzugsweise sogenannte Wave-Dateien im (komprimierten) AVI-Format angefertigt, die von den heute üblichen Soundkarten handelsüblicher PCs problemlos verarbeitet werden kön­ nen. Weiterhin können individuelle Kennungen erzeugt werden, die ein mehr­ faches Versenden der Sprechmuster an die gleiche Gegenstelle erübrigt. Hierzu besitzt die Weiterführung der Erfindung eine Speichereinrichtung, die eine ge­ wisse Anzahl von Sprechmustern speichern kann. Dieses ist insbesondere sinn­ voll, wenn mit einer begrenzten Zahl von Personen regelmäßig kommuniziert wird. Eine Weiterbildung der Erfindung sieht vor, daß eine automatisch wir­ kende Erkenneinrichtung unterschiedliche Benutzer diskriminiert und die ver­ schiedenen Sprechmuster entsprechend zuordnet. Mittels dieser Maßnahme ist die erfindungsgemäße Telefonie von der gewöhnlichen nicht mehr zu unter­ scheiden, es sei denn auf Grund der besseren Übertragungsqualität.
Zur Vereinfachung der Übertragung kann bei Fehlen eines Sprechmusters oder aus anderen Gründen auf einen Standardsprecher bzw. eine Standardspre­ cherin (z. B. je noch Art der Stimme wie z. B. männlich/weiblich) zurückge­ griffen werden. Mit einer einfachen Zusatzschaltung auf der Empfangsseite ist es dem Benutzer möglich, von dem individuellen Sprechmuster des Anrufers auf das Standardsprechmuster des Standardsprechers umzuschalten und damit auch Verständigungsprobleme, hervorgerufen z. B. durch Dialekte oder Akzente, zu eliminieren. Eine Erweiterung stellt die Übertragung verschiedener Sprechmu­ ster hinsichtlich der Emphase der Sprechperson dar. Auf der Eingabeseite wird die mit dem Sprechakt verbundene Emphase detektiert und entsprechend der Gegenstelle übermittelt, die daraus die Ausgabe sinnvoll modifiziert. Hiermit ist es möglich, auch unterschiedliche Gefühlstönungen in der Stimmlage nachzu­ empfinden (seien es zärtliche Zuneigungsbekundungen auf der einen Seite der Skala, Freude, Erstaunen, Trauer oder etwa Wutausbrüche auf der anderen).
In einer vorteilhaften Ausgestaltung des Gegenstandes der Erfindung ist das eingangsseitige Sprecherkennungssystem auf einen speziellen Sprecher einstell­ bar, mit der Folge daß, Nebengeräusche durch Worte, Wortfetzen oder wort­ ähnliche Töne, die nicht von dem gewünschten Sprecher stammen unberücksichtigt bleiben und nicht mit übertragen werden.
Eine weitergehende Ausführungsform verwendet ein Sprachkontrollpro­ gramm, welches kontextsensitiv die Korrektheit der Eingabe bzw. der Ausgabe kontrolliert und ggf. automatische Korrekturen herbeiführt. Solche Korrekturen wurden somit die Störungen (Rauschen, Störeinstrahlungen und Echos) auf dem Übertragungsweg in großem Maße eliminieren. Diese Korrektureinrichtung ist allen anderen bekannten Korrektureinrichtungen bei weitem Überlegen, da die Korrektur auf einem sehr hohen Niveau stattfindet. Das Fehlen ganzer Textpassagen kann z. B. ausgeglichen werden durch automatische, sinnfällige Einfügungen.
Eines der herausragenden Merkmale der Erfindung liegt in der sehr deutlichen Übertragung der Nutzsignale und der völligen oder fast völligen Unterdrückung von Störsignalen. Auch Nebengeräusche, soweit diese nicht die Aufnahme gänzlich behindern, werden nach Belieben vollständig ausgefiltert. Die Verständigung wird stark erleichtert.

Claims (12)

1. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens, da­ durch gekennzeichnet, daß ein Telekommunikationsendgerät mit angeschlossenem Wandler, der analoge akustischen Signale in einen symbolischen Code (vorzugsweise ASCII-Code oder einen noch weiter komprimierten Code) der natürlichen Sprache um­ formt mit einer Fernübertragungsstrecke zur Übertragung dieses Codes verbunden ist und daß auf einer Empfangsseite am anderen Ende der Fernübertragungsstrecke Telekommu­ nikationssendgerät mit angeschlossenem Wandler angeschlossen ist, der den symbolischen Code in akustisch wahrnehmbare Sprache zurückverwandelt.
2. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach Anspruch 1, dadurch gekennzeichnet, daß wesentliche Teile der Einrichtung hard- und/oder softwaremäßig in einem handelsüblichen Personal-Computer integriert sind.
3. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet daß, zumindest ein Teil der Übertra­ gungsstrecke das sogen. Internet bildet oder ein vergleichbares Netz.
4. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet daß, eine Erkennungseinrichtung mit kontextsensitive Wandlung in einen symbolischen Code ermöglicht.
5. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet daß, die Daten des symbolischen Codes in komprimierter Form übermittelt werden.
6. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet daß, die Daten in Datenpaketen ge­ bündelt übertragen werden.
7. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet, daß die gesprochenen Zeichen als druckbarer und speicherbarer Text auf einem geeigneten Endgerät ausgegeben werden.
8. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet daß, eine Einrichtung in Form von Hard- und/oder Software zur Übertragung individueller Sprechmuster an die jeweilige Gegenstelle zur der dortigen Benutzung vorhanden ist.
8.1. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach dem vorangegangenen Anspruch, dadurch gekennzeichnet daß, Sprechmuster speicherbar sind und durch einfache Kennung aktiviert werden können.
9. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet, daß Standardsprechmuster vorhanden sind, die nach weiblichen oder männlichen Sprechmerkmalen unterscheiden können.
10. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet, daß ein Korrekturprogramm Übertra­ gungsfehler ausgleicht.
11. Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens nach einem der o.g. Ansprüche, dadurch gekennzeichnet, daß eine Einrichtung in Form von Hard- und/oder Software zur Variation bei der Übertragung individueller Sprechmuster hinsichtlich der Emphase des Sprechers ermöglicht.
DE19803081A 1998-01-28 1998-01-28 Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens Withdrawn DE19803081A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19803081A DE19803081A1 (de) 1998-01-28 1998-01-28 Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19803081A DE19803081A1 (de) 1998-01-28 1998-01-28 Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens

Publications (1)

Publication Number Publication Date
DE19803081A1 true DE19803081A1 (de) 1999-07-29

Family

ID=7855814

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19803081A Withdrawn DE19803081A1 (de) 1998-01-28 1998-01-28 Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens

Country Status (1)

Country Link
DE (1) DE19803081A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19922068A1 (de) * 1999-05-14 2000-11-23 Petra Schuetze Verfahren zum Übermitteln von Symbolen von einem Sender zu einem Empfänger
US7272419B1 (en) 1999-05-14 2007-09-18 Freie Erfindungskünstler GmbH Method for transmitting symbols and/or information from a sender to a recipient

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19922068A1 (de) * 1999-05-14 2000-11-23 Petra Schuetze Verfahren zum Übermitteln von Symbolen von einem Sender zu einem Empfänger
DE19922068C2 (de) * 1999-05-14 2002-09-12 Freie Erfindungskuenstler Gmbh Verfahren und System zum Übermitteln von Symbolen von einem Sender zu einem Empfänger
US7272419B1 (en) 1999-05-14 2007-09-18 Freie Erfindungskünstler GmbH Method for transmitting symbols and/or information from a sender to a recipient

Similar Documents

Publication Publication Date Title
DE69923346T2 (de) Vorrichtung und verfahren zur ip kommunikation mit sprachgeneriertem text
DE69132460T2 (de) ISDN-Schnittstellenschaltung
DE69823817T2 (de) Prüfung von telekommunikationseinrichtungen
DE3780487T2 (de) Personal-computer als schnittstelle zwischen einem fernsprechgeraet und einem buero-kommunikationssystem.
EP0356568B1 (de) Verfahren und Anordnung zur Sprechererkennung in einer Fernsprechvermittlungsanlage
EP2245620B1 (de) Verfahren und mittel zur enkodierung von hintergrundrauschinformationen
DE69827545T2 (de) Vorrichtung zur Erzeugung von Hintergrundrauschen
DE60018349T2 (de) Erzeugung von einem Namenwörterbuch aus aufgezeichneten telephonischen Grüssen für die Spracherkennung
EP1454464B1 (de) System zur umsetzung von textdaten in eine sprachausgabe
DE19803081A1 (de) Verfahren zur Sprachübermittlung o. ä. und Geräte zur Durchführung des Verfahrens
EP1762040B1 (de) Verfahren und vorrichtung zur statusanzeige in einem datenübertragungssystem
DE19958111B4 (de) Verfahren zur Datenübertragung über mehrere parallele Datenübertragungsverbindungen
DE69317951T2 (de) Telephonvorrichtung und Verfahren
EP0856976B1 (de) Kommunikationssystem für Hörbehinderte, Telefon und Verfahren zum Telefonieren mit einem derartigen Kommunikationssystem
DE602004000759T2 (de) Verfahren zur Bereitstellung von verbesserter Audioqualität zu einer Kommunikationssitzung und entsprechendes Endgerät und maschinenlesbares Speichermedium
DE3328059C2 (de) Verfahren zur empfangsseitigen Auswahl von über eine Vermittlungsstelle einer Fernmelde- bzw. Fernsprechanlage laufende Daten- bzw. Sprechverbindungen
WO2014023308A1 (de) Verfahren und system zum bereitstellen einer übersetzung eines sprachinhalts aus einem ersten audiosignal
EP1976292B1 (de) Verfahren und Videokommunikationssystem zur Einspeisung von Avatar-Informationen in einen Videodatenstrom
DE102008053349A1 (de) Telefonsysteme und Kommunikationsendgeräte für eine Verwendung in solchen Telefonsystemen
DE69830373T2 (de) Verfahren zur Herstellung einer Kommunikation zwischen einem Internet Endgerät und einem Telefon und Telefon zur Ausführung dieses Verfahrens
DE2115709A1 (de) Endgerät für datenverarbeitende Anlagen
DE10348149B4 (de) Verfahren zur Durchführung einer Telefonkonferenz
EP1148756A1 (de) Verfahren zur Abgabe von Daten in einem Telekommunikationssystem sowie Vermittlungszentrale
DE2845831C2 (de) Schaltungsanordnung zum Einstellen von Betriebszuständen bei einem Bildschirmtextteilnehmer
DE19940940A1 (de) Talking Web

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
OR8 Request for search as to paragraph 43 lit. 1 sentence 1 patent law
8105 Search report available
8139 Disposal/non-payment of the annual fee