DE3513243A1 - Verfahren zur sprachuebertragung und sprachspeicherung - Google Patents

Verfahren zur sprachuebertragung und sprachspeicherung

Info

Publication number
DE3513243A1
DE3513243A1 DE19853513243 DE3513243A DE3513243A1 DE 3513243 A1 DE3513243 A1 DE 3513243A1 DE 19853513243 DE19853513243 DE 19853513243 DE 3513243 A DE3513243 A DE 3513243A DE 3513243 A1 DE3513243 A1 DE 3513243A1
Authority
DE
Germany
Prior art keywords
speech
language
memory
element memory
ssy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19853513243
Other languages
English (en)
Other versions
DE3513243C2 (de
Inventor
Erhard Dipl.-Ing. 6368 Bad Vilbel Reitz
Joachim Dipl.-Ing. 6000 Frankfurt Zinke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telenorma GmbH
Original Assignee
Telefonbau und Normalzeit GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonbau und Normalzeit GmbH filed Critical Telefonbau und Normalzeit GmbH
Priority to DE19853513243 priority Critical patent/DE3513243A1/de
Publication of DE3513243A1 publication Critical patent/DE3513243A1/de
Application granted granted Critical
Publication of DE3513243C2 publication Critical patent/DE3513243C2/de
Granted legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Description

  • Verfahren zur Sprachübertragung und Sprachspeicherung
  • Die Erfindung betrifft ein Verfahren zur Sprachübertragung und Sprachspeicherung nach dem Oberbegriff des Patentanspruches 1.
  • Aus der DE-PS 24 35 654 ist ein Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache bekannt, wobei die Sprachanalyse mit einer elektrischen Nachbildung desmenschlichen Vokaltraktes erfolgt, indem dort Parameter für die Wiedergewinnung der Sprache darstellende Signale gewonnen werden. Diese Signale werden zur Sprachsyntheseeinrichtung übertragen, wo sie decodiert und zur Ansteuerung eines Vokaltraktmodells verwendet werden. Danach folgt eine Digital/Analog-Wandlung und die akustische Ausgabe der Sprache. Wie aus der Zeichnung und der Beschreibung hervor geht, ist die gesamte Anordnung relativ kompliziert und aufwendig. Gegenüber dem in dieser Patentschrift genannten Stand der'Technik wird der Aufgabe entsprechend eine Reduzierung des Rechenaufwandes erreicht und auch eine gegenüber einer direkten Digitalisierung der Sprache, beispielsweise in PCM geringere Übertragungsrate. Diese Übertragungsrate ist aber mit ca. 4.000 Bit/Sek, wie dies in Spalte 10 von Zeile 40 bis 46 angegeben ist, immer noch relativ hoch.
  • Ein Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und eine Schaltungsanordnung zur Durchführung des Verfahrens ist aus der EP-OS 0058130 bekannt. Dabei werden die von Schriftzeichen oder Tastenbetätigungen erzeugten digitalen Signale und Signalfolgen so umgesetzt, daß die Syntheseinrichtung einen Lautelementespeicher ansteuern kann. In diesem Lautelementespeicher sind die Charakteristika von ca. 40 bis 100 Lautelementen abgelegt, womit eine verständliche Sprache produziertwird, wenn diese Lautelemente in einer entsprechenden Folge aneinandergereiht werden. Um dies zu erreichen, werden Schriftzeichen oder andere Eingangsignale in sogenannte Lautschriftzeichenfolgen umgewandelt, wozu ein sogenanntes Transkriptionssystem dient. Damit wird auch ungeübten Benutzern die Anwendung erleichtert, weil Texte mit üblichen Schriftzeichen eingebbar sind. Bei diesem Verfahren wird davon ausgegangen, daß den einzugebenden Signalfolgen bereits eine vorbestimmte Bedeutung zugeordnet ist und diese Bedeutung sprachlich ausgegeben wird. Eine Spracherkennung und eine daraus resultierende Wiedergabe von Sprache ist bei dieser Anordnung nicht vorgesehen.
  • Die Aufgabe der Erfindung besteht darin, ein Verfahren zur Sprachübertragung und zur Sprachspeicherung anzugeben, wobei die Sprachübertragung mit einer sehr niedrigen Bitrate durchgeführt werden kann und bei einer Sprachspeicherung in Halbleiterspeichern eine extrem niedrige Speicherkapazität benötigt wird. Diese Aufgabe wird durch eine Merkmalskombination gelöst, wie sie im Patentanspruch 1 angegeben ist.
  • Damit wird in vorteilhafter Weise erreicht, daß nur noch Adressen übertragen oder gespeichert werden müssen, mit denen Sprachelementespeicher angesteuert werden können, worin die zur Erzeugung künstlicher Sprache notwendigen Angaben für jedes einzelene Sprachelement digital abgelegt sind. Ein derartiges Ubertragungs- und Speicherverfahren eignet sich auch zur Anwendung in digital durchschaltenden Vermittlungsanlagen. Allerdings ist es dann nicht mehr möglich, den Gesprächspartner an seiner Stimme zu erkennen.
  • Mit den in den Unteransprüchen angegebenen Weiterbildungen der Erfindung wird u.a. erreicht, daß die Möglichkeit einer einfachen Sprachverschlüsselung besteht, um das unbefugte Abhören von Nachrichten nahezu unmöglich zu machen. -Ein Ausführungsbeispiel der Erfindung wird nachfolgend anhand von Zeichnungen näher erläutert.
  • Es zeigt: Fig. 1 das Prinzipschaltbild einer Anordnung zur Durchführung des Verfahrens, Fig. 2 eine erweiterte Anordnung zur Übertragung zusätzlicher Signale, Fig. 3 das Prinzipschaltbild einer nach 2 verschiedenen Verfahren arbeitenden Sprachsyntheseeinrichtung.
  • Die am Eingang E erscheinenden Sprachsignale werden einer Analyseeinrichtung ANA zugeführt, die nach einem bekannten Spracherkennungsprinzip arbeitet und für jedes erkannte Sprachelement eine digitale Beschreibung ausgibt. Die dabei entstehenden Bitmuster und -folgen werden einem Vergleicher VG angeboten. Gleichzeitig wird ein Adressengenerator ADG gestartet, der in einem beliebigen Zyklus den Sprachelementespeicher SESPE der Erkennungseinrichung adressiert. In diesem Sprachelementespeicher SESPE ist für jedes Sprachelement eine Speicherzelle oder ein Speicherbereich vorgesehen, worin Bitmuster und Bitmusterfolgen nach den gleichen Regeln abgelegt sind, wie sie von der Analyseeinrichtung ANA ausgegeben werden. Wird beim zyklischen Adressieren des Sprachelementespeichers SESPE einBitmuster oder eine Bitmusterfolge ausgelesen, die den von der Analpeeinrichtung ANA erzeugten signalen ährlich sind, so stellt der Vergleicher VG dies fest, und der Adreßgenerator ADG wird angehalten.
  • Außerdem wird durch das Erkennungssignal des Vergleichers VG ein UND-Gatter geöffnet, so daß die am Ausgang des Adreßgenerators ADG parallel anstehende Adresse durch einen Parallel/Seriell-Wandler PSW seriell gewandelt auf die Übertragungsleitung UeL gegeben werden kann. Die von der Spracherkennungseinrichtung SPE auf diese Weise erzeugte Adreßinformation wird mit einer sehr niedrigen Bitrate weitergegeben, und kann entweder für eine direkte Wiedergabe zur Steuerung einer Sprachsyntheseeinrichtung SSY benutzt werden oder in einen Sprachinformationsspeicher SPISP für eine spätere Wiedergabe eingespeichert werden.
  • Für die Wiedergewinnung der Sprache werden die von der Übertragungsleitung UeL ankommenden seriellen Signalfolgen in einem Seriell/Parallel-Wandler SPW zunächt in eine parallele Form gebracht und dienen zur Ansteuerung des in der Sprachsyntheseeinrichtung SSY befindlichen Sprachelementespeichers SESPS. Die nacheinander ankommenden Adreßinformationen führen dazu, daß der jeweilige Inhalt einer ein Lautelement beschreibenden Speicherzelle zur Synthesesteuerung SYN geben wird. Damit werden in bekannter Weise die entsprechenden Frequenzgeneratoren nacheinander angesteuert, so daß das Sprachsignal in einer analogen Form über einen Verstärker V einem elektroakustischem Wandler EAW zugeführt werden kann.
  • In der Fig. 2 sind zusätzlich zu den in der Fig. 1 dargestellten und bereits beschriebenen Einrichtungen weitere Komponenten vorgesehen, womit die für die Wiedergabe der Sprache notwendige Information so erweitert wird, daß die Sprachqualität und die Verständlichkeit wesentlich gesteigert werden kann. Der Vergleicher VG ist so ausgelegt, daß er nicht nur wie bereits beschrieben ein positives Signal J ausgibt, wenn eine Bitkombination im Sprachelementespeicher SESPE gefunden wurde, sondern auch ein negatives Signal N erscheint, wenn von der Analyseeinrichtung ANA eine Bitmusterfolge erzeugt wurde, die in ähnlicher Form im Sprachelementespeicher SESPE nicht vorgefunden werden kann.
  • Mit diesem Negativ-Signal N wird ein Multiplexer MUX umgeschaltet. Ein von der Sprachanalyse-Einrichtung ANA ermitteltes Korrelationsergebnis gelangt zu einer Sprachcodiereinrichtung SCE. Es wird in einem Direktcode-Zwischenspeicher DCSP vorübergehend gepuffert und gelangt über einen Parallel-Seriell-Wandler PSW zu dem inzwischen umgeschalteten Multiplexer MUX. Die nun auf der Übertragungsleitung UeL gesendete Information stellt keine Adresse sondern eine verschlüsselte Sprachprobe dar. Mit einem besonderen Code, der dieser verschlüsselten Sprachprobe vorangestellt wird, erfolgt eine Umschaltung des in der Sprachsyntheseeinrichtung SSY befindlichen Demultiplexers DEMUX. Von dort aus wird ein zusätzliches Umschaltemittel U in seine Arbeitslage gesteuert, so daß nicht der Inhalt des in der Sprachsyntheseeinrichtung SSY befindlichen Sprachelementespeichers SESPS zur Synthesesteuerung SYN gelangt, sondern diese direkt mit dem Demultiplexer DEMUX verbunden wird. In diesem Fall wird dann der Direktcode unmittelbar von der Synthesesteuerung SYN in ein analoges Sprachelemente verwandelt, das wie vorher beschrieben über einen Verstärker V an den elektroakustischen Wandler EAW gelangt.
  • Es ist außerdem vorgesehen, daß die Sprachanalyseeinheit ANA Zusatzinformationen ZI erzeugt, die seriell direkt über die Übertragungsleitung UeL zur Synthesesteuerung SYN gelangen, wobei Multiplexer MUX und Demultiplexer DEMUX entsprechend umgeschaltet werden. Mit dieser Zusatzinformation ist es möglich, die Wiedergewinnung der Sprache so zu beeinflussen, daß sprachliche Eigenheiten, die die Verständlichkeit erhöhen,wie beispielsweise Tonhöhe, berücksichtigt werden können.
  • Bei der in Fig. 3 dargestellten Sprachsyntheseeinrichtung SSY ist vorgesehen, daß die Spracherzeugung nach zwei verschiedenen Prinzipien geschieht. Je nach der ankommenden Signalkategorie wird der Demultiplexer DEMUX so geschaltet, daß die Information zu den entsprechenden Einrichtungen gelangt. Handelt es sich um Adreßinformationen, so wird wie bereits beschrieben, ein in der Sprachsyntheseeinrichtung SSY vorhandener Sprachelementespeicher SESPS damit angesteuert.
  • Die nachgeschaltete Vollsynthesesteuerung VSY erzeugt aus dem Sprachelemente beschreibenden Inhalt des Sprachelementespeichers SESPS analoge Sprachsignale, die über einen Verstärker V einem elektroakustischen Wandler EAW zugeführt werden. Dabei können wie bereits beschrieben Zusatzinfortriationen ZI berücksichtigt werden, so daß die bei der Spracherkennung festgestellten Charakteristika der Sprache wiedergegeben werden können. Der Demultiplexer DEMUX kann jedoch auch so geschaltet werden, daß die ankommende Insormation direkt zu einer Decodiereinrichtunz DvC gelangt, womit auf direktem Wege Sprachsignale darstellende Frequenzen erzeugt werden können, die wie vorher beschrieben ausgegeben werden.
  • - Leerseite -

Claims (7)

  1. Verfahren zur Sprachübertragung und Sprachspeicherung Patentansprüche 1. Verfahren zur Sprachübertragung und Sprachspeicherung, wobei die ankommenden Sprachsignale von einer Spracherkennungseinrichtung erkannt werden und die auszugebende Sprache von einer Sprachsyntheseeinrichtung erzeugt wird, dadurch gekennzeichnet, daß die Spracherkennung von einer nach dem Prinzip der Sprachelementeerkennung arbeitenden Spracherkennungseinrichtung (SPE) durchgeführt wird, wobei die ankommenden Sprachsignale durch einen Vergleicher (VG) mit vorgegebenen, in einem Sprachelementespeicher (SESPE) vorhandenen Informationen über die Beschaffenheit der Sprachelemente und deren Varianten verglichen werden, und daß die beim Auffinden der betreffenden Speicherzellen entstehenden Adressen direkt zum Ansteuern jeweils einer Speicherzelle eines in der Sprachsyntheseeinrichtung (SSY) befindlichen Sprachelementespeichers (SESPS) dienen, worin die Information über das betreffende Sprachelement abgelegt ist.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei von der Spracherkennungseinrichtung (SPE) nicht eindeutig erkannten Sprachelementen ein Direktcode gebildet wird, der die betreffende Sprachprobe unmittelbar beschreibt und zur Sprachsyntheseeinrichtung (SSY) gegeben wird, wobei diese umgeschaltet wird und dann nach einem der Analyse entsprechenden Syntheseverfahren (z.B. LPC Linear Predictive Coding) arbeitet.
  3. 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die direkt-codierten Sprachproben nicht so codiert sind, wie die im Sprachelementespeicher (SESPE) abgelegten Sprachelemente beschrieben sind.
  4. 4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Verfahren in digitalen Nachrichtensystemen als Alternative zur dort angewandten Codierung (z.B. PCM) angewendet und dann lediglich der Adreßcode übertragen wird, wenn eine Sprechererkenn q ausgeschlossen sein soll.
  5. 5. Verfahren nach einem der Ansprüche 1 oder 4, dadurch gekennzeichnet, daß das Schema der Adressierung der Sprachelementespeicher (SESPE,SESPS) änderbar ist, so daß verschlüsselte Nachrichten übertragen werden können.
  6. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß das Schema der Adressierung der Sprachelementespeicher (SESPE, SESPS) zur Verschlüsselung in programmierbaren Festwertspeichern abgelegt ist, wovon vereinbarungsgemäß jeweils gleichartige bei der Spracherkennungeinrichtung (SPE) und bei der Sprachsyntheseeinrichtung (SSY) eingesetzt werden müssen.
  7. 7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zusätzlich zu den Adreßdaten für die Ansteuerung des Sprachelementespeichers (SESPS) der Sprachsyntheseeinrichtung (SSY) Zusatzinformationen (ZI) übertragen werden, womit bei derSyntheseModifizierungen der ausgegebenen Sprache (Tonhöhe etc.) möglich sind.
DE19853513243 1985-04-13 1985-04-13 Verfahren zur sprachuebertragung und sprachspeicherung Granted DE3513243A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19853513243 DE3513243A1 (de) 1985-04-13 1985-04-13 Verfahren zur sprachuebertragung und sprachspeicherung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19853513243 DE3513243A1 (de) 1985-04-13 1985-04-13 Verfahren zur sprachuebertragung und sprachspeicherung

Publications (2)

Publication Number Publication Date
DE3513243A1 true DE3513243A1 (de) 1986-10-16
DE3513243C2 DE3513243C2 (de) 1993-03-11

Family

ID=6267899

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19853513243 Granted DE3513243A1 (de) 1985-04-13 1985-04-13 Verfahren zur sprachuebertragung und sprachspeicherung

Country Status (1)

Country Link
DE (1) DE3513243A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19860133A1 (de) * 1998-12-17 2001-07-12 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1120469C (zh) 1998-02-03 2003-09-03 西门子公司 传输语音数据的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0071716A2 (de) * 1981-08-03 1983-02-16 Texas Instruments Incorporated Allophonvokoder
DE2435654C2 (de) * 1974-07-24 1983-11-17 Gretag AG, 8105 Regensdorf, Zürich Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
EP0058130B1 (de) * 1981-02-11 1986-07-16 Eberhard Dr.-Ing. Grossmann Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und Schaltungsanordnung zur Durchführung des Verfahrens

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2435654C2 (de) * 1974-07-24 1983-11-17 Gretag AG, 8105 Regensdorf, Zürich Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
EP0058130B1 (de) * 1981-02-11 1986-07-16 Eberhard Dr.-Ing. Grossmann Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und Schaltungsanordnung zur Durchführung des Verfahrens
EP0071716A2 (de) * 1981-08-03 1983-02-16 Texas Instruments Incorporated Allophonvokoder

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19860133A1 (de) * 1998-12-17 2001-07-12 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression
DE19860133C2 (de) * 1998-12-17 2001-11-22 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression

Also Published As

Publication number Publication date
DE3513243C2 (de) 1993-03-11

Similar Documents

Publication Publication Date Title
AT390685B (de) System zur textverarbeitung
DE3041423C1 (de) Verfahren und Vorrichtung zur Verarbeitung eines Sprachsignals
DE60004420T2 (de) Erkennung von Bereichen überlappender Elemente für ein konkatenatives Sprachsynthesesystem
DE2918533A1 (de) Spracherkennungssystem
DE10054583C2 (de) Verfahren und Vorrichtung zum Aufzeichnen, Suchen und Wiedergeben von Notizen
EP1273003B1 (de) Verfahren und vorrichtung zum bestimmen prosodischer markierungen
DE1965480A1 (de) Geraet fuer kuenstliche Erzeugung von Worten durch Umwandlung eines in Buchstaben gedruckten Textes in Aussprache
EP1105867B1 (de) Verfahren und vorrichtungen zur koartikulationsgerechten konkatenation von audiosegmenten
DE2840596A1 (de) Sprachsynthesizer
DE2736082A1 (de) Elektronisches geraet zur phonetischen synthetisierung menschlicher sprache (sprach-synthesizer)
EP1058235B1 (de) Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen
DE2917161A1 (de) Elektronisches lernhilfegeraet
DE60021666T2 (de) Inkrementales Trainieren eines Spracherkenners für eine neue Sprache
DE3513243C2 (de)
EP0058130B1 (de) Verfahren zur Synthese von Sprache mit unbegrenztem Wortschatz und Schaltungsanordnung zur Durchführung des Verfahrens
DE4111781A1 (de) Computersystem zur spracherkennung
DE4441906C2 (de) Anordnung und Verfahren für Sprachsynthese
DE3232835C2 (de)
DE2826570C2 (de)
DE1547002A1 (de) Vorrichtung,die auf gesprochene Informationen anspricht,insbesondere phonetische Schreibmaschine
DE19837661C2 (de) Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten
DE2335818B2 (de) Elektrische Anordnung zur automatischen Erzeugung von gesprochenen Sätzen
EP0094681B1 (de) Schaltungsanordnung zur elektronischen Sprachsynthese

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: TELENORMA TELEFONBAU UND NORMALZEIT GMBH, 6000 FRA

8110 Request for examination paragraph 44
8127 New person/name/address of the applicant

Owner name: TELENORMA GMBH, 6000 FRANKFURT, DE

D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee