DE1803621A1 - Facility for synthesizing human speech - Google Patents

Facility for synthesizing human speech

Info

Publication number
DE1803621A1
DE1803621A1 DE19681803621 DE1803621A DE1803621A1 DE 1803621 A1 DE1803621 A1 DE 1803621A1 DE 19681803621 DE19681803621 DE 19681803621 DE 1803621 A DE1803621 A DE 1803621A DE 1803621 A1 DE1803621 A1 DE 1803621A1
Authority
DE
Germany
Prior art keywords
phonemes
phoneme
memory
signals
drum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19681803621
Other languages
German (de)
Inventor
Martin Thomas Brooks
Schanne Joseph Francis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RCA Corp
Original Assignee
RCA Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RCA Corp filed Critical RCA Corp
Publication of DE1803621A1 publication Critical patent/DE1803621A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Recording Or Reproducing By Magnetic Means (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

1,263,523. Speech synthesis. RCA CORPORATION. 12 Feb., 1969 [26 Feb., 1968 (2)], No. 7608/69. Heading H4R. A speech synthesizer has a library of phonemes stored at selected locations of a data store to be read out in any desired sequence to synthesize desired audible information. Each phoneme is truncated at the beginning and/or the end to provide continuity of formants across the junctions between the phonemes in the desired sequence. The phonemes are read out in sequence as determined manually, by punched card, paper, or magnetic tape, or computer output. Each phoneme to be reproduced is represented by three numbers, one defining the position of the phoneme in the library and the other two the beginning and end respectively of the desired portion of the phoneme. Preferably the phonemes are stored in digital, i.e. pcm, form on a magnetic drum with core memories used as an intermediate store during reading in and reading out of the stores. Fig. 9 shows a system used for recording phonemes the analogue waveforms of which are fed as 7 bit pcm signals into a core memory A. The core memory can store 4096 seven bit signals which represent one phoneme. The signals are fed into the core memory in defined locations commencing when a record command pulse 707 is received. When the core memory is full, flip-flop 709 is tripped and further storage ceases. After an index pulse is received from the drum 21 the core memory is read out in predetermined sequence to store on the drum 21, in locations defined by the sector pulses permanently recorded on the drum, the digital signals defining the phoneme. Further phonemes are recorded in further tracks of the drum. Fig. 10 shows apparatus for reading phonemes from the drum 821 under manual, 831, or paper tape, 833, control. The phenomes requested by the manual or paper tape control are read alternately into the core memories 17 and 827 and while one phoneme is being read into one core memory the desired portion of the previous phoneme, as defined by the second and third numbers read out of the manual or paper tape control, is read out from the other core memory, functions of the core memories being interchanged as soon as the phoneme has been read out of the core store for reproduction. Reading in from the drum to the core store takes place faster than reading out providing allowance for the truncation of the reproduced phoneme. It is suggested that the phoneme might be recorded in analogue fashion on the drum.

Description

6682-68/Dr.ν.Β/Ε6682-68 / Dr.ν.Β / Ε

RCA 59,488/593694RCA 59,488 / 593694

U.S.Serial Nos. 709,323/708,389U.S. Serial Nos. 709,323 / 708,389

Piled February 26, 1968Piled February 26, 1968

Radio Corporation of America New York N.Y. (V.St.A.)Radio Corporation of America New York N.Y. (V.St.A.)

Einrichtung zur Synthetisierung der menschlichen Sprache Facility for the synthesis of human language

Die vorliegende Erfindung betrifft eine Einrichtung zur Synthetisierung der menschlichen Sprache oder anderer Aud i ο-Inf ormat i on.The present invention relates to an apparatus for synthesizing human speech or others Aud i ο information.

Die menschliche Sprache ist eine Audio-Information, welche eine Reihe komplexer Laute enthält, die durch den Kehlkopf, die Zunge, Mund- und Nasenräume sowie die Atmungsstärke gesteuert und bestimmt werden. Infolge der erlernten Fähigkeiten zu sprechen und Sprache zu verstehen, werden die dabei mitspielenden schwierigen Probleme leicht unterschätzt. Bei der künstlichen Erzeugung von Sprache müssen alle Faktoren, so nebensächlich sie auch erscheinen mögen, in Betracht gezogen werden, so weit sie zur Erzeugung verständlicher gesprochener Wörter beitragen. Human speech is audio information that contains a series of complex sounds that pass through the larynx, the tongue, mouth and nasal spaces as well as the breathing strength can be controlled and determined. As a result of the skills learned speaking and understanding language, the difficult problems involved are easily underestimated. In the artificial generation of language, all factors must be so minor they may appear should be taken into account in so far as they contribute to the production of intelligible spoken words.

Die Aufzeichnung von Sprache erfolgt ebenso wie die von Musik normalerweise analog. Die kontinuierlichen Änderungen der Amplitude und Frequenz der Audio-Information werden also auf dem Speichermedium beibehalten. Die Wiedergabe der Sprache kann dann einfach durch Zurückverwandeln der aufgezeichnetenThe recording of speech, like that of music, is usually analogue. The continuous changes the amplitude and frequency of the audio information are thus retained on the storage medium. The reproduction of the language can then simply by converting back the recorded

909836/0785909836/0785

*· ο —* · Ο -

Signale in hörbare Toninformation erfolgen.Signals take place in audible sound information.

Bei der Synthese von Audiο-Information, insbesondere Sprache, wird mehr als eine einfache Wiedergabe angestrebt. Der Zweck einer synthetischen Spracherzeugung besteht vielmehr darin, abstrakte Tatsachen oder gespeicherte Information in verständliche Sprache umzusetzen, um die Tatsachen oder Information einer Person mitteilen zu können, die sie wissen möchte.When synthesizing audio information, in particular Speech, more than simple reproduction is sought. Rather, the purpose of synthetic speech generation is in translating abstract facts or stored information into understandable language to convey the facts or information to be able to tell someone they want to know.

Es sind verschiedene Lösungen dieses Problems bekannt. Die naheliegendste Lösung besteht darin, alle in einem bestimmten Anwendungsbereich möglichen Sätze, die der Benutzer wünschen oder benötigen könnte, zu speichern. Hierfür wird jedoch selbst bei einer kleinen Anzahl von Tatsachen die für die Speicherung aller Permutationen und Kombinationen der Tatsachen erforderliche Speicherkapazität untragbar groß.Various solutions to this problem are known. The most obvious solution is to have them all in one certain scope possible sentences that the user might want or need to be saved. For this, however, even with a small number of facts, those for storing all permutations and combinations of facts required storage capacity prohibitively large.

Um die Speicherkapazität zu verringern, ist es bekannt, statt ganzen Sätzen nur Satzteile zu speichern. Auch hier für wird noch eine relativ große Speicherkapazität benötigt. Eine weitere Verringerung der Speicherkapazität ist dadurch möglich, daß man nur einzelne Wörter speichert und diese zu Sätzen zusammensetzt. Diese bekannte Maßnahme hat jedoch den Nachteil, daß der Wortschatz verhältnismäßig beschränkt bleibt. Ähnliche Schwierigkeiten ergeben sich auch bei der Verwendung von Silben.In order to reduce the storage capacity, it is known to save only parts of sentences instead of whole sentences. Here too for a relatively large storage capacity is still required. A further reduction in storage capacity is possible as a result, that you only save single words and put them together in sentences. However, this known measure has the disadvantage that the vocabulary remains relatively limited. Similar difficulties arise when using syllables.

Der erfolgreichste Lösungsweg, mit dem sich ein großer Wortschatz erreichen läßt, ohne daß große Speicherkapazitäten benötigt werden, besteht in der Verwendung der kleinsten sprachlichen Einheiten, der sogenannten Phoneme.The most successful solution, with which a large vocabulary can be achieved without large storage capacities required consists in the use of the smallest linguistic units, the so-called phonemes.

Ein Phonem ist eine Gruppe von gleichen oder verwandten Lauten, die sich unter verschiedenen phonetischen Be- . dingungen ändern. In der englischen Sprache gibt es 40 Phoneme, die in sieben Gruppen eingeteilt werden können.A phoneme is a group of the same or related sounds that fall under different phonetic behaviors. change conditions. There are 40 phonemes in the English language, which can be divided into seven groups.

Die ersten drei Gruppen umfassen die Vokale. Die erste Gruppe enthält die zehn einfachen Vokale; die zweite Gruppe die sechs Diphtonge und die dritte Gruppe die vier Halbvokale und Liquida.The first three groups comprise the vowels. The first group contains the ten simple vowels; the second Group the six diphtongs and the third group the four semi-vowels and liquids.

909836/0785909836/0785

Die vierte Gruppe enthält die sechs Spreng- oder Explosivlaute.The fourth group contains the six explosive sounds.

Die fünfte Gruppe enthält die drei Nasalkonsonanten,The fifth group contains the three nasal consonants,

Die sechste Gruppe enthält neun Prikative oder Spiranten, die durch ein reibendes Geräusch des Atmens an einem Teil des Mundraumes gekennzeichnet sind.The sixth group contains nine pricatives or spirants, created by a rubbing sound of breathing on one Part of the oral cavity are marked.

Die sinbte Gruppe enthält die zwei Affrikaten. Dies sind Verschluß- oder Explosivlaute, denen eine langsame Trennung der lautbildenden Organe folgt, so daß der letzte Teil ein Prikativ oder Spirant mit entsprechender Organstellung ist.The lower group contains the two affricates. this are plosive or explosive sounds, followed by a slow separation of the sound-forming organs, so that the last part is a Pricative or Spirant with a corresponding organ position.

In der folgenden Tabelle I sind die oben aufgeführten Phoneme gruppenweise angegeben. Jedes Phonem ist mittels eines einfachen typischen Wortes dargestellt und zur Kennzeichnung unterstrichen.The phonemes listed above are given in groups in Table I below. Each phoneme is means a simple typical word and underlined for identification.

Tabelle ITable I.

Elementarlaute (Phoneme) der englischen SpracheElementary sounds (phonemes) of the English language

einfache Vokalesimple vowels

(D(D fitfit (2)(2) feetfeet (3)(3) letlet (Ί)(Ί) batasked (5)(5) butbut (6)(6) n£tn £ t (7)(7) lawlaw (8)(8th) bookbook (9)(9) bootboat (10)(10) birdbird

II. Diphtonge II. Diphtongs

(1) pain(1) pain

(2) go(2) go

(3) house (H) toe (3) hous e (H) toe

(5) boy,(5) boy,

(6) few(6) few

III. Halbvokale und Liquida III. Half vowels and liquids

(1) y_ou(1) y_ou

(2) we(2) we

(3) late rate(3) late rate

909836/0785909836/0785

IV.IV. (D(D V.V. (D(D ExplosivlauteExplosive sounds (2)(2) (2)(2) badbath (3)(3) (3)(3) divedive (4)(4) givegive (5)(5) jpotjpot (6)(6) toytoy £at£ at Nasal-KonsonantenNasal consonants maymay nownow singsing

VI,VI,

PrikativePricatives

VIIVII

(D(D jz er οjz he ο (2)(2) visionvision (3)(3) veryvery (4)(4) thatthat (5)(5) hatHas (6)(6) fatfat (7)(7) thingthing (8)(8th) shedshed (9)(9) satsat AffrikatenAffricates

churchchurch

(D
(2)
(D
(2)

Zur künstlichen Spracherzeugung reicht es jedoch nicht aus, einfach eine Folge von aufgezeichneten Phonemen wiederzugeben. Um eine natürlich klingende künstliche Sprache aus Phonemen zu erzeugen, müssen vielmehr noch drei Bedingungen erfüllt sein:However, for the artificial generation of speech it is not sufficient to simply use a sequence of recorded phonemes to reproduce. In order to generate a natural-sounding artificial language from phonemes, three more conditions have to be met be fulfilled:

1. Die Kontinuität der Sprachschwingung muß an den übergängen zwischen den Phonemen gewährleistet sein;1. The continuity of the speech oscillation must be guaranteed at the transitions between the phonemes;

2. Die Kontinuität der Tonhöhe muß an den Phonemgrenzen gewährleistet sein und2. The continuity of the pitch must be guaranteed at the phoneme boundaries and

3· Die Kontinuität der Frequenzkomponenten der Phoneme muß an den übergängen zwischen den Phonemen gewährleistet sein.3 · The continuity of the frequency components of the phonemes must be ensured at the transitions between the phonemes be.

Als Frequenzbestandteile eines Phoneme können die vorherrschenden Frequenzen angesehen werden, die als Formanten bezeichnet werden sollen. Bekanntlich kann jede komplizierte periodische Schwingung aus einer Kombination von Sinusschwingungen geeigneter Frequenzen, Amplituden und Phasenlagen zusammengesetzt werden. Der charakteristische Klang eines Phonems kann durch die Kombination von nicht mehr als drei Formanten, die sich jeweils zeitlich ändern können oder nicht, erkennbar wiedergege-The predominant frequencies, the formants, can be viewed as frequency components of a phoneme should be designated. As is well known, every complicated periodic oscillation can be made up of a combination of sinusoidal oscillations suitable frequencies, amplitudes and phase positions are put together. The characteristic sound of a phoneme can through the combination of no more than three formants, each of which may or may not change over time, recognizable

909836/0785909836/0785

ben werden.be practiced.

Die Synthetisierung von Sprache (oder anderer Klassen von Audio-Information) aus Phonemen erfordert also die Wahl einer entsprechenden Phonemfolge und eine Verschmelzung der Pormanten der jeweiligen Phoneme an ihren Verbindungsstellen, so daß de resultierende Sprache keine Unterbrechungen aufweist.Synthesizing speech (or other classes of audio information) from phonemes thus requires choice a corresponding phoneme sequence and a merging of the pormants of the respective phonemes at their junctures, so that the resulting speech has no breaks.

Es sind bereits verschiedene Möglichkeiten bekannt, einen stetigen Übergang zwischen Phonemen zu erreichen (USA-Patentschriften 2 771 509; 2 860 187; 3 158 685). Bei den bekannten Eiösungen werden die Übergänge zwischen den Phonemen durch spezielle Schaltungen hergestellt, die die erforderliche Stetigkeit am Übergang bewirken, oder es werden jeweils von einem Phonem verschiedene Formen gespeichert, so daß man ein Phonem auswählen kann, welches einen gleichmäßigen Übergang ergibt.Various possibilities are already known achieve a smooth transition between phonemes (U.S. Patents 2,771,509; 2,860,187; 3,158,685). With the known Solutions are made through the transitions between the phonemes special circuits produced, which bring about the necessary continuity at the transition, or there are each of one Phoneme different forms are stored so that one can choose a phoneme which gives a smooth transition.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, eine Einrichtung zur Synthetisierung der menschlichen Sprache anzugeben, die sich durch eine bisher unerreichte Sprach qualität auszeichnet, ohne daß große Speicherkapazitäten benötigt werden oder Einschränkungen des Vokabulars in Kauf genommen werden müssen. Die künstliche Sprache kann durch Steuersignale erzeugt werden, die die zu übertragende Information bestimmen. Einrichtungen der vorliegenden Art eignen sich z.B. für die Umsetzung der von einer elektronischen Datenverarbeitung anlage oder einem anderen Gerät gelieferten Ausgangsdaten in verständliche Sprache.The present invention is based on the object of a device for synthesizing the human Specify language that is characterized by a previously unattainable language quality without requiring large storage capacities or restrictions of the vocabulary have to be accepted. The artificial speech can through control signals which determine the information to be transmitted. Devices of the present type are suitable e.g. for converting the output data supplied by an electronic data processing system or another device into understandable language.

Gemäß der Erfindung ist eine Einrichtung zur Synthetisierung der menschlichen Sprache gekennzeichnet durch einen Speicher zur Speicherung von codierten Phonemen, eine Steuereinrichtung zum Entnehmen der codierten Phoneme in einer gewünschten Reihenfolge aus dem Speicher, und einer Umsetzvorrichtung zum Umwandeln der entnommenen Phoneme in kontinuierliche elektrische Signale.According to the invention is a device for synthesizing the human language characterized by a memory for storing coded phonemes, a Control device for extracting the coded phonemes in a desired order from the memory, and a conversion device to convert the extracted phonemes into continuous electrical signals.

Gemäß einer VJe it er bildung der Erfindung kann die Steuereinrichtung beim Entnehmen eines Phonems an einem Spei-According to a VJe it formation of the invention, the control device can when removing a phoneme from a memory

909836/0785909836/0785

ΘΑΟ OKJüINALΘΑΟ OKJüINAL

ί t * 1 it it ί t * 1 it it

—6——6—

cherplatz beginnen, der vom Anfang des gespeicherten Phonems verschieden ist, und an einem bestimmten Speicherplatz enden, der vom Ende des gespeicherten Phonems verschieden ist. Die örter, an denen begonnen und geendet wird, werden so vorgegeben, daß sich die gewünschte Kontinuität der Sprache mit dem jeweils vorangehenden und folgenden Phonem ergibt.begin at a different location from the beginning of the stored phoneme and end at a specific location, which is different from the end of the stored phoneme. The places where the beginning and end are given in such a way that that the desired continuity of language results with the preceding and following phoneme.

Gemäß einer anderen Weiterbildung der Erfindung sind Vorkehrungen getroffen, um gesprochene Phoneme in elektrische Signale für die Speicherung im Speicher umzusetzen. Für eine digitale Speicherung der Phoneme kann ein Abtast- oder Umsetzerkreis vorgesehen sein.According to another development of the invention, precautions have been taken to convert spoken phonemes into electrical To convert signals for storage in memory. For a digital storage of the phonemes a sampling or Be provided converter circuit.

Die Erfindung wird im folgenden anhand der Zeichnung näher erläutert, es zeigen:The invention is explained in more detail below with reference to the drawing, which show:

Fig. 1 eine graphische Darstellung des ungefähren zeitlichen Verlaufes der Formanten des gesprochenen Wortes "WED";Fig. 1 is a graphical representation of the approximate time course of the formants of the spoken word "WED";

Fig. 2 eine graphische Darstellung des ungefähren zeitlichen Verlaufes der Formanten des gesprochenen Wortes "WADE";2 shows a graphical representation of the approximate course over time of the formants of the spoken word "CALF";

Fig. 3 eine graphische Darstellung, aus der entnommen werden kann, wie ein Übergang bestimmt wird, um die Kontinuität der Formanten zwischen Phonemen zu gewähr3a.sten;Fig. 3 is a graph taken from how a transition is determined to ensure continuity of formants between phonemes can be determined;

Fig. 4 eine graphische Darstellung des zeitlichen Verlaufes zweier ineinander übergehender Phoneme gemäß Fig. 3;FIG. 4 shows a graphical representation of the course over time of two mutually merging phonemes according to FIG. 3; FIG.

Fig. 5 eine graphische Darstellung, in der zwei Perioden einer typischen komplexen Schwingung dargestellt sind, wie sie in der Sprache vorkommen;5 is a graph showing two periods of a typical complex oscillation are as they appear in language;

Fig. 6 eine graphische Darstellung der Impulse, die bei einer periodischen Antastung der in Fig. .5 dargestellten Schwingung erhalten werden;FIG. 6 is a graphical representation of the pulses generated during a periodic sampling of the one shown in FIG Vibration to be obtained;

Fig. 7 ein Blockschaltbild eines Ausführungsbeispieles der Erfindung, das mit digitaler Speicherung arbeitet;Figure 7 is a block diagram of an embodiment of the invention employing digital storage;

909836/0785909836/0785

-7--7-

Pig. 8 einBlockschaltbild eines Ausführungsbeispiels der Erfindung, das mit analoger Speicherung arbeitet, undPig. 8 is a block diagram of an embodiment of the invention using analog storage; and

Fig. 9 und 10 Blockschaltbilder weiterer Ausführungsbeispiele der Erfindung.9 and 10 are block diagrams of further exemplary embodiments the invention.

In Fig. 1 sind die Formanten 103, 107 und 109 für das gesprochene Wort "WED" dargestellt, wie sie z.B. auf einem Spektrogramm erscheinen; die ausgezogenen Linien geben dabei die Mitte der vorhandenen Frquenzbänder an. Die niederfrequenteren Formanten 107 und 109 zwischen demNullpunkt und dem Abszissenwert 101 bilden das Phonem /W/, das im Wort "WED" aus zwei Frequenzen besteht, die beide im Zeitintervall 115 ansteigen. Der Vokallaut des Phonems /EH/ besteht aus drei Formanten 103, 107 und 109 zwischen den Abszissenwerten 101 und 105. Der Endkonsonant /D/ tritt nach einer kurzen Pause anschließend an den Vokal auf. Für eine gleichmäßige verständliche Sprache ist es erforderlich, daß die Formanten zweier aneinander angrenzender Phoneme an den Verbindungen zwischen den Phonemen kontinuierlich ineinander übergehen. Die gestrichelte Linie 101 in Fig. 1 bezeichnet einen solchen übergang, nämlich den übergang zwischen den Phonemen /W/ und /EH/, die Formanten 107 und 109 gehen dort stetig ineinander über und setzen sich über die Verbindungestelle ohne Unterbrechung fort.In Fig. 1, formants 103, 107 and 109 are for the spoken word "WED" is represented as it would appear on, for example, a spectrogram; the solid lines give it the middle of the existing frequency bands. The lower frequency formants 107 and 109 between the zero point and the abscissa value 101 form the phoneme / W /, which in the word "WED" consists of two frequencies, both of which rise in the time interval 115. The vowel sound of the phoneme / EH / consists of three formants 103, 107 and 109 between the abscissa values 101 and 105. The Final consonant / D / occurs after the vowel after a short pause. For even understandable language is it is necessary that the formants of two adjacent phonemes at the junctions between the phonemes be continuous merge. The dashed line 101 in FIG. 1 denotes such a transition, namely the transition between the phonemes / W / and / EH /, the formants 107 and 109 continuously merge into one another and are placed over the junction continued without interruption.

Fig. 2 ist eine ähnliche Darstellung eines Spektrogrammes des gesprochenen Wortes "WADE". Das Phonem /W/ besteht aus zwei niederfrequenteren Formanten 207 und 209 im Zeitintervall 215 zwischen dem Ursprung und einer ordinatenparallelen gestrichelten Linie 201. Das Phonem /AY/ besteht aus den drei Formanten 203, 207 und 209 zwischen den gestrichelten Linien 201 und 205. Die Formanten der Phoneme /W/ und /AY/ gehen an der durch die Linie 201 bezeichneten Verbindungsstelle stetig ineinander über. Ein Vergleich der Figuren 1 und 2 zeigt, daß das Phonem /W/ im Wort "WED" eine Zeitspanne 115 einnimmt, die länger iet als die Zeitspanne 215 , die das Phonem /W/ im Wort "WADE" dauert. In Fig. 1 liegen außerdem die beiden unteren For-Figure 2 is a similar representation of a spectrogram of the spoken word "WADE". The phoneme / W / consists of two lower frequency formants 207 and 209 in the time interval 215 between the origin and a dashed line 201 parallel to the ordinate. The phoneme / AY / consists of the three formants 203, 207 and 209 between dashed lines 201 and 205. The formants of the phonemes / W / and / AY / go at the junction indicated by the line 201 continuously merge into one another. A comparison of Figures 1 and 2 shows that the phoneme / W / in the word "WED" occupies a time span 115 which is longer than the time span 215 which the phoneme / W / in the word "WADE" lasts. In Fig. 1, the two lower shapes are also

909 836/0785909 836/0785

manten 107 und 109 des Phonems /EH/ bei höheren Frequenzen als die beiden unteren.Formanten 207 und 209 des Phonems /AY/ in Fig. 2. Die Formanten des Phonems /W/ im Wort "WADE" gemäß Fig. 2 sind ähnlich den Formanten des Phonems /W/ im Wort "WED" gemäß Fig. I, wenn man die gleiche Zeitspanne betrachtet. Der wesentliche Unterschied zwischen den beiden Phonemen /W/ besteht darin λ daß dieses Phonem in Fig. 2 früher endet als in Fig. 1.manten 107 and 109 of the phoneme / EH / at higher frequencies than the two lower formants 207 and 209 of the phoneme / AY / in Fig. 2. The formants of the phoneme / W / in the word "WADE" according to Fig. 2 are similar to the Formants of the phoneme / W / in the word "WED" according to FIG. I if one considers the same period of time. The main difference between the two phonemes / W / λ is that this phoneme in Fig. 2 ends earlier than in FIG. 1.

Fig. 3 zeigt zwei Phoneme, die nicht miteinander verbunden sondern durch ein Zeitintervall getrennt sind. Der in Fig. 3 dargestellte Laut besteht also aus zwei vollständigen Phonemen, die für sich und getrennt ausgesprochen werden.Fig. 3 shows two phonemes which are not connected to one another but separated by a time interval. The in The sound shown in Fig. 3 thus consists of two complete phonemes, which are pronounced for themselves and separately.

Wenn die beiden Phoneme, die in Fig. 3 dargestellt sind, bei der künstlichen Spracherzeugung verbunden werden sollen, ergäbe sich offensichtlich eine Unstetigkeit an der Verbindungsstelle, wenn man das zeitliche Ende 311 des ersten Phonemes mit dem Beginn 312 des zweiten Phonemes zusammenfallen ließe. Die Formanten 303, 307 und 309 des ersten Phonems würden plötzlich enden und die Formanten 313> 317 und 319 würden unmittelbar darauf bei Frequenzen, die sich von denen der ersten Formanten unterscheiden , beginnen. Solche Frequenzsprünge würden Verzerrungen ergeben, durch die die Verständlichkeit der künstlich erzeugten Sprache stark leiden würde.If the two phonemes shown in Fig. 3 are to be connected in the artificial speech generation, there would obviously be a discontinuity at the junction, if the temporal end 311 of the first phoneme were allowed to coincide with the beginning 312 of the second phoneme. The formants 303, 307 and 309 of the first phoneme would end suddenly and the formants 313> 317 and 319 would follow immediately at frequencies different from those of the first formants distinguish, begin. Such frequency hops would create distortions which would severely affect the intelligibility of the artificially generated speech.

Verlängert man in Fig. 3 die Formanten am Anfang des zweiten Phonems durch Linien 327 und 329, so schneiden diese Linien die Formanten 307 und 309 des ersten Phonems. Der den Schnittpunkten entsprechende Zeitpunkt 321 ist ein Punkt, an dem das erste Phonem abgebrochen werden kann, um einen stetigen übergang der Formanten des ersten Phonems in die des zweiten Phonems zu erreichen. Wenn die Schnittpunkte der jeweiligen Formanten nicht zeitlich zusammenfallen, wird der Beginn des zweiten Phonems so geändert, daß sie es tun. Kleinere Unstetigkeiten sind zulässig, so daß die Schnittpunkte zeitlich nicht ganz genau zusammenfallen müssen.If the formants at the beginning of the second phoneme in FIG. 3 are lengthened by lines 327 and 329, these intersect Lines formants 307 and 309 of the first phoneme. The den Point in time 321 corresponding to intersection points is a point at which the first phoneme can be broken off by a continuous one transition of the formants of the first phoneme into those of the second phoneme to reach. If the points of intersection of the respective formants do not coincide in time, the beginning of the second Phonems changed to do it. Smaller discontinuities are permissible, so that the points of intersection are not exactly timed have to coincide.

Wenn das erste Phonem· in Fig..3 im Zeitpunkt 321,If the first phoneme in Fig. 3 at time 321,

909836/0785909836/0785

der dem beschriebenen Schnittpunkt entspricht, abgebrochen wird und man diesen Zeitpunkt mit dem Beginn 312 des zweiten Phonems zusammenfallen läßt, ergibt sich ein stetiger übergang der Formanten. Dies ist in Pig. 4 dargestellt, in der die Formanten 407 und 409 am übergang 421 stetig verlaufen, die kombinierten Phoneme in einem Zeitpunkt 401 beginnen, der dem Zeitpunkt 301 des Beginnes des ersten Phonemes in Fig. 3 entspricht, und die kombinierten Phoneme im Zeitpunkt 405 enden, der zeitlich vor dem Ende 305 des zweiten Phonems in Fig. 3 liegt.which corresponds to the described point of intersection, is aborted and this point in time with the beginning 312 of the second If phonems can coincide, there is a steady transition of the formants. This is in Pig. 4, in which the formants 407 and 409 run steadily at transition 421, the combined Phonemes begin at a point in time 401, which corresponds to the point in time 301 of the start of the first phoneme in FIG. 3, and the combined phonemes end at point in time 405, which is earlier than the end 305 of the second phoneme in FIG. 3.

Man kann eine kontinuierliche Folge von Phonemen in der oben beschriebenen Weise in paarweisen Gruppen zusammensetzen, um künstliche Sprache zu erzeugen. Eine Möglichkeit, solch eine Folge von Phonemen zu erzeugen,besteht darin, einzelne Phoneme auf einem Magnetband zu speichern, den Beginn und das Ende jedes Phonemes abzuschneiden und die dabei erhaltenen Bandstücke in einer gewünschten Reihenfolge zusammenzusetzen. Beim Abspielen eines solchen Bandes erhält man dann eine verständliche Sprache.A continuous sequence of phonemes can be put together in paired groups in the manner described above, to generate artificial speech. One way of creating such a sequence of phonemes is to use individual To store phonemes on a magnetic tape, cut off the beginning and the end of each phoneme and the resulting ones Assemble pieces of tape in a desired order. When you play such a tape you get an understandable one Language.

Ein anderes Verfahren zur Realisierung dieser Technik besteht darin, die einzelnen Phoneme so zu speichern, daß ein Zugriff zu einem gewünschten Phonem, ein Beschneiden des Phonems und eine Wiedergabe in einer vorbestimmten Reihenfolge möglich ist, beispielsweise unter Steuerung durch eine programm gesteuerte Rechenanlage, um eine gewünschte gesprochene Information zu erzeugen. Another method of implementing this technique is to store the individual phonemes in such a way that access to a desired phoneme, clipping of the phoneme, and playback in a predetermined order is possible, for example under the control of a program-controlled computer system, in order to generate the desired spoken information.

Bei einem Ausführungsbeispiel der vorliegenden Erfindung werden die Phoneme digital gespeichert, indem periodisch? Proben der Amplitude der die einzelnen Phoneme darstellenden Schwingungen abgegriffen und die Amplitudenwerte dieser Proben in Binärzahlen umgesetzt werden. Die erhaltenen Binärzahlen werden dann für jedes Phonem der Reihe nach gespeichert.In one embodiment of the present invention are the phonemes stored digitally by periodically? Samples the amplitude of the phonemes representing each Vibrations are picked up and the amplitude values of these samples are converted into binary numbers. The binary numbers obtained are then stored in sequence for each phoneme.

Fig. 5 zeigt zwei Perioden einer typischen Schwin- mnv,. Die Linie 501 gibt den zeitlichen Verlauf der Amplitude der Schwingung zwischen dem Ursprung und dem Ende 503 der er-Fig. 5 shows two periods of a typical Schwin- mnv ,. The line 501 shows the time course of the amplitude of the oscillation between the origin and the end 503 of the

909836/0786909836/0786

ßAD ORiGlNALßAD ORiGlNAL

-lO-sten Periode an. Vom Ende 503 der ersten Periode des zum Ende 505 der zweiten Periode hat die Linie 501 dann wieder den gleichen Verlauf. Wenn die Amplitude einer solchen Schwingung mit einer entsprechend hohen Frequenz periodisch abgetastet wird, kann man eine Zahlenfolge gewinnen, die eine sehr gute Näherung des Amplitudenverlaufes der urpsürnglichen Schwingung ergibt. Je mehr Abtastungen während einer Schwingungsperiode \orgenommen werden, umso genauer ist die Wiedergabe.-10th period. From the end of 503 to the end of the first period 505 of the second period, line 501 then has the same again Course. If the amplitude of such an oscillation is sampled periodically with a correspondingly high frequency, a sequence of numbers can be obtained which gives a very good approximation of the amplitude curve of the original oscillation. The more samples are taken during an oscillation period, the more accurate the reproduction.

Fig. 6 zeigt ein Beispiel des Ergebnisses einer Abtastung der in Fig. 5 dargestellten Schwingung. Jede Probe 6OI entspricht einem Momentanwert der sich kontinuierlich ändernden Amplitude der Linie 501 in Fig. 5 zu einem entsprechenden Zeitpunkt.FIG. 6 shows an example of the result of scanning the vibration shown in FIG. 5. Each sample 6OI corresponds to an instantaneous value of the continuously changing amplitude of line 501 in FIG. 5 to a corresponding one Time.

Fig. 7 zeigt ein Ausführungsbeispiel, das nach dem oben erläuterten Verfahren arbeitet. Ein Phonem wird in ein Mikrophon 701 gesprochen und das erhaltene elektrische Signal wird mittels eines Verstärkers 703 verstärkt. Das Ausgangssignal des Verstärkers 703 wird dem Eingang einer Torschaltung 705 zugeführt, die durch einen Oszillator 711 periodisch aufgetastet wird. Das Ausgangssignal der Torschaltung 705 besteht aus einer Reihe von Impulsen, deren zeitlicher Abstand umgekehrt proportional zur Schwingungsfrequenz des Oszillators ist und deren Amplitude dem jeweiligen Momentanwert des Ausgangssignales des Verstärkers 703 entspricht.7 shows an exemplary embodiment which operates according to the method explained above. A phoneme goes into a microphone 701 spoken and the received electrical signal is amplified by means of an amplifier 703. The output of amplifier 703 is the input of a gate circuit 705, which is periodically gated by an oscillator 711 will. The output signal of the gate circuit 705 consists of a series of pulses whose time interval is reversed is proportional to the oscillation frequency of the oscillator and its amplitude to the respective instantaneous value of the output signal of amplifier 703 corresponds.

Die in Fig. 6 dargestellte Impulsfolge würde also dem Ausgangssignal der Torschaltung 705 entsprechen, wenn das Ausgangssignal des Verstärkers 703 den in Fig. 5 dargestellten Verlauf hätte.The pulse sequence shown in FIG. 6 would therefore correspond to the output signal of the gate circuit 705 if the The output of the amplifier 703 is that shown in FIG Course would have.

Bei dem vorliegenden Ausführungsbeispiel beträgt die Oszillatorfrequenz 14 kHz. Die Periode der Ausgangsimpulse der Torschaltung 705 beträgt daher etwa 71,5 ps. Jedem Phonem sind 4096 Speicherplätze zugeordnet. Die maximal zulässige Länge eines Phonems beträgt daher 292,8 ms. Phoneme, die eine größere Dauer als dieser Maximalwert haben, sind angehaltene Laute,In the present exemplary embodiment, the oscillator frequency is 14 kHz. The period of the output pulses gate circuit 705 is therefore about 71.5 ps. Any phoneme 4096 memory locations are assigned. The maximum allowable length of a phoneme is therefore 292.8 ms. Phonemes that have a duration longer than this maximum value are paused sounds,

909836/0785909836/0785

also periodisch, und können erforderlichenfalls mehrmals abgefragt werden. Alle aperiodischen Phoneme sind kürzer als der oben angegebene Maximalwert.thus periodically, and can be queried several times if necessary will. All aperiodic phonemes are shorter than the maximum value given above.

Das Ausgangesignal des Verstärkers 703 wird ferner durch eine Diode 712 gleichgerichtet, durch ein Tiefpaßfilter 709 zu einem Gleichstrom geglättet und einer Folge- Steuereinrichtung 715 zugeführt. Die Steuereinrichtung 715 weist einen Schalter 725 auf. Wenn sich der Schalter 725 in der dargestellten Eingabe-Stellung befindet, bewirkt das Fehlen eines Gleichstromausgangssignals vom Tiefpaßfilter 709, daß die Steuereinrichtung 715 einem Speicheradressenregister 714 eines digitalen Speichers 710 die Adresse für den Anfang des nächsten Phonems zuführt. Die Anfangsadresse und die Endadresse werden von einer Lesevorrichtung 719 geliefert, die aus irgend einer bekannten Vorrichtung bestehen kann, z.B. einem Lochstreifenlesegerät, Kartenlesegerät, Magnetbandlesegerät usw. Man kann ferner auch einen Elektronenrechner oder eine andere kompliziertere Steuereinrichtung verwenden. Die Endadresse wird in einem Register in der Steuereinrichtung 715 gespeichert.The output of amplifier 703 also becomes rectified by a diode 712, smoothed to a direct current by a low-pass filter 709 and a follower control device 715 supplied. The control device 715 has a switch 725. When the switch 725 is in the illustrated INPUT position, the lack of a DC output signal from the low pass filter 709 causes the controller 715 to a memory address register 714 of a digital Store 710 supplies the address for the beginning of the next phoneme. The start address and the end address are from a Reading device 719 is provided which is known from any known Device can exist, e.g. a punched tape reader, card reader, magnetic tape reader, etc. One can also use an electronic calculator or other more complicated control device. The end address is in a register stored in the controller 715.

Das Speicheradressenregister 714 besteht aus Registern, die durch das Ausgangssignal des Oszillators 711 auf die aufeinanderfolgenden Adressen eingestellt werden können. Das AusgangBsignal des Oszillators 711 wird den Registern über eine Torschaltung 727 zugeführt, die während der Speicherung eines Phonems durch die Steuereinrichtung 715 aufgetastet wird.The memory address register 714 consists of registers which can be set to the successive addresses by the output signal of the oscillator 711. The output signal of the oscillator 711 is fed to the registers via a gate circuit 727, which is gated on by the control device 715 while a phoneme is being stored.

Das Ausgangssignal der Torschaltung 705 wird durch einen Analog/Digital-Umsetzer 707 in eine Binärzahl umgesetzt. Die Amplituden der Impulse können dabei beispielsweise in 128 Abschnitte unterteilt werden. Jeder Amplitudenwert kann dann durch eine Binärzahl aus sieben Bits dargestellt werden; diese Binärzahlen beginnen mit dem Wert 0 (0000000) und enden mit dem Maximalwert (1111111). Der Wechselspannungs-Nullwert des Ausgangssignales des Verstärkers 703 ist dementsprechend 64 (lOOOOGQThe output of the gate circuit 705 is through an analog-to-digital converter 707 is converted into a binary number. The amplitudes of the pulses can, for example, in 128 Sections are divided. Each amplitude value can then be represented by a binary number of seven bits; these Binary numbers start with the value 0 (0000000) and end with the Maximum value (1111111). The AC voltage zero value of the output signal of the amplifier 703 is accordingly 64 (10000OGQ

909836/0 785909836/0 785

In der Praxis wird der Wechselspannung-Nullwert als um ungefähr 5 % versetzt angenommen. Die Richtung hängt von der Anzahl der Phasenumkehrungen im Verstärker ab. Der Grund für diese Versetzung besteht darin, daß die Amplitude der Tonschwingungen, die durch das Ausstoßen des Atems verursacht werden, größer ist als die, welche durch die Wirkungen der Muskien im Kehlkopf verursacht werden.In practice, the AC voltage zero value is assumed to be offset by approximately 5%. The direction depends on the number of phase reversals in the amplifier. The reason for this offset is that the amplitude of the sound vibrations caused by the expulsion of breath is greater than that caused by the effects of the muscles in the larynx.

Die siebenstellige Binärzahl vom Umsetzer 707 \d.rd in einem Speicher-Ausgangsregister 713 gespeichert, um durch Rückspeicherung in den Speicher eingespeichert zu werden, was durch ein Taktsignal erfolgt, welches vom Oszillator 711 über die Torschaltung 727 zugeführt wird. Wenn das Phonem in allen ihm zugeordneten Plätzen des Speichers in Form einer solchen Folge von digital codierten Signalen gespeichert worden ist, wird die Speicherung des laufenden Phonems als beendet angesehen. Die Beendigung des Speicherns wird durch eine Vergleichsschaltung 717 bestimmt, die ein entsprechendes Signal an die Steuereinrichtung 715 liefert, wenn sie feststellt, daß die in der Steuereinrichtung 715 gespeicherte Endadresse mit der Adresse im Speicheradressenregister 714 übereinstimmt.The seven-digit binary number from the converter 707 \ d.rd stored in a memory output register 713 to be stored by restoring into memory what takes place by a clock signal which is fed from the oscillator 711 via the gate circuit 727. If the phoneme in all it has been stored in the memory locations assigned to it in the form of such a sequence of digitally coded signals, the storage of the current phoneme is considered finished. The termination of the storage is indicated by a comparison circuit 717 determined, which supplies a corresponding signal to the control device 715 if it determines that the in the Control device 715 stored end address matches the address in the memory address register 714.

Wenn alle für die Wiedergabe der Sprache erforderlichen Phoneme im Speicher gespeichert worden.sind, wird der Schalter 725 in die in Fig. 7 untere Wiedergabe-Stellu-ng umgelegt.When all the phonemes necessary to reproduce the speech have been stored in memory, will the switch 725 in the lower playback position in FIG. 7 knocked down.

Zur künstlichen Erzeugung von Sprache wird ein entsprechend vorbereiteter Aufzeichnungsträger in die Lesevorrichtung 719 eingesetzt. Der Aufzeichnungsträger enthält für jedes gewünschte Phonem zwei Binärzahlen, von denen die erste die Anfangsadresse und die zweite die Endadresse des Phonems im Speicher angibt. Die Anfangs- und Endadressen sind nicht notwendigerweise die erste und die letzte Speicherplatzadresse des betreffenden gespeicherten Phonems. Für jedes benötigte Phonem erscheinen zwei solche Adressen und die Phoneme folgen so aufeinander, daß sich die gewünschte Sprachinformation ergibt.A correspondingly prepared recording medium is inserted into the reading device for the artificial generation of speech 719 used. The record carrier contains two binary numbers for each desired phoneme, the first of which is the starting address and the second indicates the ending address of the phoneme in memory. The starting and ending addresses are not required the first and the last memory location address of the relevant stored phoneme. For each phoneme needed two such addresses appear and the phonemes follow one another in such a way that the desired language information results.

909836/0785909836/0785

Die Anfangs- und Endadressen werden so gewählt,The start and end addresses are chosen so

1. die im Speicher gespeicherte Binärzahl den Wert 1000000 hat und daß1. the binary number stored in memory the value 1000000 and that

2. die Formanten im Phonem bei Frequenzen liegen, die bei der Anfangsadresse einen stetigen Übergang mit den Frequenzen am Ende des vorangehenden Phonems und bei der Endadresse einen stetigen Übergang mit den Frequenzen des folgenden Phonemes gewährleisten.2. The formants in the phoneme are at frequencies that have a continuous transition with the frequencies at the start address at the end of the preceding phoneme and at the end address there is a continuous transition with the frequencies of the following phoneme guarantee.

Die Lesevorrichtung 719 kann eine programmgesteuerte digitale Datenverarbeitungsanlage sein und-die Adressen können das Ergebnis von Rechnungen in der Datenverarbeitungsanlage bilden, so daß die resultierende Sprache Information über das Ergebnis der Rechnungen in der Datenverarbeitungsanlage liefert.The reading device 719 can be a program-controlled digital data processing system and the addresses can form the result of calculations in the data processing system, so that the resulting language information about delivers the result of the invoices in the data processing system.

Unter Steuerung durch ein Kommando werden der Folge-Steuereinrichtung 715 die ersten beiden Adressen von der Lesevorrichtung 719 zugeführt. Die Anfangsadresse wird im Adressenrefcister 714 gespeichert.The slave controller will be under control of a command 715 the first two addresses supplied by the reading device 719. The start address is in the address register 714 saved.

Die adressierte Phoneminformation wird aus dem Speicher herausgelesen und im Ausgangsregister 713 gespeichert. An das Ausgangsregister ist ein Digital/Analog-Umsetzer 721 angeschlossen, der eine Ausgangsspannung liefert, deren Amplitude durch den Wert der seinem Eingang zugeführten Binärzahl bestimmt wird.The addressed phoneme information is read out of the memory and stored in the output register 713. A digital / analog converter 721 is connected to the output register and supplies an output voltage and its amplitude determined by the value of the binary number fed to its input will.

Das Speicheradressenregister 714 wird dann durch die vom Oszillator 711 über die Torschaltung 727 zugeführten Impulse schrittweise weitergeschaltet und dementsprechend werden die folgenden Binärzahlen aus dem Speicher 710 herausgelesen und dem Eingang des Digital/Analog-Umsetzers 721 zugeführt.Die Amplitude der Ausgangsspannunjs des Umsetzers 721 ändert sich kontinuierlich entsprechend den V/erten der dem Eingang des Umsetzern zugeführten Binärzahlen und sie wird einem elektroakustischen VJandler, z.B. einem Lautsprecher 723 zugeführt, derThe memory address register 714 is then through the pulses supplied by the oscillator 711 via the gate circuit 727 are incremented and switched accordingly the following binary numbers are read out from the memory 710 and fed to the input of the digital / analog converter 721 The amplitude of the output voltage of the converter 721 changes continuously according to the values of the binary numbers fed to the input of the converter and it becomes an electroacoustic VJandler, e.g. fed to a loudspeaker 723, the

909836/0785909836/0785

SAD OFUGiMALSAD OFUGiMAL

hörbare Laute erzeugt.produces audible sounds.

Das Speicheradressenregister JIk wird solange weitergeschaltet, bis es die zweite Adresse erreicht hat, also die Endadresse, die in der Steuereinrichtung 715 gespeichert worden war. Die Übereinstimmung dieser Adressen wird durch die Vergleichsschaltung 717 festgestellt, die dabei ein entsprechendes Steuersignal an die Steuereinrichtung 715 liefert.The memory address register JIk is switched on until it has reached the second address, that is to say the end address that was stored in the control device 715. The match between these addresses is determined by the comparison circuit 717, which supplies a corresponding control signal to the control device 715.

Wenn das Steuersignal, das das Erreichen der Endadresse anzeigt, eintrifft, nimmt die Steuereinrichtung 715 sofort die nächsten beiden Adressen von der Lesevorrichtung 719 auf. Das durch diese neuen Adressen bezeichnete Phonem wird dann aus dem Speicher herausgelesen und in der beschriebenen Weise in einen hörbaren Laut umgesetzt.When the control signal that reaching the end address indicates arrives, the control device 715 immediately takes the next two addresses from the reading device 719 on. The phoneme identified by these new addresses is then read out of the memory and written to in the Way converted into an audible sound.

Die aufeinanderfolgenden Phoneme werden in der beschriebenen Weise verarbeitet, bis die Steuereinrichtung 715 von der Lesevorrichtung 719 oder einer anderen äußeren Quelle ein Halt-Signal erhält.The successive phonemes are processed in the manner described until the control device 715 receives a halt signal from reader 719 or other external source.

Fig. 8 zeigt ein Ausführungsbeispiel der Erfindung, bei dem keine digitale Speichervorrichtung benötigt wird.Fig. 8 shows an embodiment of the invention in which no digital storage device is required.

Die Einrichtung nach Fig. 8 enthält eine Trommel 801, auf der die verschiedenen Phoneme jeweils auf getrennten Spuren analog gespeichert sind. Jeder Spur ist ein kombinierter Lese/Sprechkopf 803 zugeordnet. Die Trommel enthält ferner eine Takt spur, der/eh eigener Kopf 805 zugeordnet ist.The device of Fig. 8 includes a drum 801 on which the various phonemes are each on separate Tracks are stored in analog form. A combined reading / speaking head 803 is assigned to each track. The drum also contains a clock track that is assigned to its own head 805 anyway.

Bei der synthetischen Erzeugung von Sprache liefert eine Lesevorrichtung 809 zwei Adressen an eine Steuereinrichtung 807. Die Adressen werden in der Steuereinrichtung decodiert und der Ausgang eines entsprechenden Kopfes 803 wird über einen Verstärker in der Einrichtung 307 mifc einem Sprechkopf 313 verbunden, der zur Aufzeichnung von Analoginformation auf einem Magnetband 821 dient.In the synthetic generation of speech, a reading device 809 supplies two addresses to a control device 807. The addresses are decoded in the control device and the output of a corresponding header 803 is via an amplifier in device 307 with a headset 313 connected, which is used to record analog information on a magnetic tape 821.

Durch Verwendung einer Inde::marke und der der Steuereinrichtung 807 vom Taktspurkopf 805 zugefL'hpten TaktimpulseBy using an Inde :: mark and that of the control device 807 from the clock track head 805 supplied clock pulses

C B Ϊ ?, S / t;C B Ϊ?, S / t;

BAD ORIGINALBATH ORIGINAL

wird die richtige Anfangsstelle des adressierten Phonems auf der Trommel 801 bestimmt.becomes the correct starting position of the addressed phoneme of the drum 801 is determined.

Bei der Peststellung der Anfangsstelle wird ein Antriebsmotor 811 für das Band 821 durch die Steuereinrichtung 807 eingeschaltet. Die Steuereinrichtung 807 bewirkt dann die Übertragung der Information zum Sprechkopf 813, so daß der ausgewählte Teil des adressierten Phonems auf dem sich nun bewegenden Band 821 aufgezeichnet wird. Wenn die Endadresse durch die Steuereinrichtung 807 mit Hilfe der Taktimpulse vom Kopf 805 wahrgenommen wird, werden der Motor 811 und damit das Band angehalten. Die Übertragung des Signales vom gewählten Kopf zum Sprechkopf 813 wird außerdem gesperrt.When the starting point is set, a drive motor 811 for the tape 821 is operated by the control device 807 switched on. The control device 807 then effects the transmission of the information to the headset 813 so that the selected Part of the addressed phoneme is recorded on the tape 821 now moving. If the ending address is replaced by the Control device 807 is perceived with the help of the clock pulses from head 805, the motor 811 and thus the tape stopped. The transmission of the signal from the selected head to the speaking head 813 is also blocked.

Anschließend werden die nächsten beiden Adressen von der Lesevorrichtung 809 abgerufen und das nächste Phonem wird in entsprechender Weise verarbeitet.Then the next two addresses are fetched from the reading device 809 and the next phoneme is processed in a corresponding manner.

Wenn das letzte Phonem verarbeitet worden ist, wird das Band 821 durch ein Signal von der Lesevorrichtung 809 oder einer äußeren Quelle in seine Anfangslage zurückgespult. Anschließend wird das Band wieder in Vorwärtsrichtung angetrieben, die aufgezeichneten Sprachsignale werden durch einen Lesekopf 815 abgetastet, in einem Verstärker 817 verstärkt und durch einen Lautsprecher 819 oder dgl. wiedergegeben.When the last phoneme has been processed, the tape 821 is read by a signal from the reading device 809 or from an outside source. Then the belt is driven in the forward direction again, the recorded speech signals are scanned by a reading head 815, amplified in an amplifier 817 and transmitted through a speaker 819 or the like.

Das als letztes beschriebene Ausführungsbeispiel läßt sich in verschiedener V/eise verfeinern. So kann z.B. die Drehrichtung der Trommel 801 umgekehrt und die Phoneme in umgekehrter Reihenfolge abgerufen werden. Bei der Wiedergabe braucht damdas Band nicht zurückgespult zu werden. Außerdem kann das Abfragen der Phoneme von der Trommel und deren Aufzeichnung auf dem Band mit einer doe spätere Abspielgeschwindigkeit übersteigenden Geschv/indigkeit erfolgen.The last embodiment described can be refined in various ways. For example, the The direction of rotation of the drum 801 is reversed and the phonemes are retrieved in the reverse order. When playing needs then the tape does not get rewound. Besides that, it can Query the phonemes from the drum and record them on the tape at a later playback speed exceeding Speed.

Die Fig. 9 und 10 zeigen eine weitere Anlage, bei der die Erfindung angewendet v/erden kann. Als erstes soll die Beschickung der Anlage beschrieben werden.FIGS. 9 and 10 show a further installation in which the invention can be applied. The first thing to do is Loading of the system are described.

9 0 9 8 3 6/07859 0 9 8 3 6/0785

BAD OBlGTMALBATHROOM OBlGTMAL

Die in Pig. 9 dargestellte Einrichtung enthält eine Audio-Signalquelle 701', die an einen Eingang eines Analog/Digital-Umsetzers 703' angeschlossen ist. Der andere Eingang dieses Umsetzers ist an eine Taktsignalquelle 705' angeschlossen und das Ausgangssignal des Umsetzers gibt dementsprechend die Momentanwerte der Amplitude des Audio-Signals zum Zeitpunkt der Taktimpulse wieder. Die Impulsamplituden können beispielsweise in 128 Abschnitte unterteilt sein. Jeder Größenwert kann durch eine siebenstellige Binärzahl wiedergegeben werden, die von dem Minimalwert 0000000 bis zum Maximalwert 1111111 gehen. Die Wechselspannungsache entspricht dem Dezimalwert 64 oder der Binärzahl 1000000. In der Praxis ist der Bezugspegel, wie oben bereits erläutert wurde, um 5 % versetzt.The one in Pig. The device shown in FIG. 9 contains an audio signal source 701 'which is connected to an input of an analog / digital converter 703'. The other input of this converter is connected to a clock signal source 705 'and the output signal of the converter accordingly reproduces the instantaneous values of the amplitude of the audio signal at the time of the clock pulses. The pulse amplitudes can be divided into 128 sections, for example. Each size value can be represented by a seven-digit binary number that goes from the minimum value 0000000 to the maximum value 1111111. The AC voltage factor corresponds to the decimal value 64 or the binary number 1000000. In practice, the reference level, as already explained above, is offset by 5%.

Das Signal von der Taksignalquelle 705' bewirkt unter Steuerung durch eine bistabile Schaltung 709'* die ihrerseits durch Speicherkommandoimpulse von einer Quelle 707' getastet wird, erstens das Weiterschalten eines- tastbaren Adressenzählers 711' über eine Torschaltung 713' und zweitens daß einem Kernspeicher 17 über eine Torschaltung 215' Speicherkommandosignale zugeführt werden. Jeder Impuls von der Taktsignalquelle 705' schaltet den Adressenzähler 711 um die Adresse eines Speicherplatzes weiter, bewirkt daß das Ausgangssignal des Umsetzers 703' dem Kernspeicher 17 zugeführt wird und liefert einen SpeicherkommandoimpuT^über die Torschaltung 715} der bewirkt, daß das Ausgangssignal des Umsetzers 703' in dem durch den Adressenzähler 711' bezeichneten Speicherplatz des Kernspeichers 17 gespeichert wird.The signal from the clock signal source 705 'causes, under the control of a bistable circuit 709' * which in turn is gated by memory command pulses from a source 707 ', firstly the switching of a tactile address counter 711' via a gate circuit 713 'and secondly that a core memory 17 via a gate circuit 215 'are supplied with memory command signals. Each pulse from the clock signal source 705 'advances the address counter 711 by the address of a memory location, causes the output signal of the converter 703' to be fed to the core memory 17 and delivers a memory command pulse via the gate circuit 715} which causes the output signal of the converter 703 'is stored in the memory location of the core memory 17 designated by the address counter 711'.

Auf diese Weise werden im Kernspeicher, beginnend mit der niedrigsten Speicheradresse, aufeinanderfolgende digitale Signale gespeichert, die das zu speichernde Phonem darstellen. Wenn der Adressenzähler 711' auf die höchste Adresse im Speicher schaltet, was anzeigt, daß das Passungsvermögen des Speichers erschöpft ist, wird die bistabile Schaltung 709' erneut umgeschaltet. Die Torschaltung 713' wird dadurch gesperrtIn this way, consecutive digital Signals are stored that represent the phoneme to be stored. When the address counter 711 'is at the highest address switches in memory, indicating that the memory capacity is exhausted, the bistable circuit 709 'is again switched. The gate circuit 713 'is blocked

90 9836/078590 9836/0785

-17--17-

und verhindert ein Weiterschalten des Adressenzählers 711'. Die Torschaltung 715' wird ebenfalls gesperrt, so daß dem Kernspeicher 17 keine weiteren Speieherkommandos mehr zugeführt werden. Der Zustand der bistabilen Schaltung 709' nach der beschriebenen zweiten Umschaltung ermöglicht das Umschalten einer zweiten bistabilen Schaltung 719'. Die zweite bistabile Schaltung 719' wird umgeschaltet, nachdem sie durch den ersten Indeximpuls von einer Speichertrommel 21 ansprechbereit gemacht worden ist. Durch die Umschaltung der zweiten bistabilen Schaltung 719' wird eine Torschaltung 723' durchlaßbereit gemacht, an deren anderem Eingang ein Sektortaktsignal von der Trommel 21 liegt. Für jedes auf der Trommel 21 zu speichernde digitale Signal tritt ein Sektortaktsignal auf. Jedes der im Kernspeicher 17 gespeicherten digitalen Signale besteht bei dem vorliegenden Ausführungsbeispiel aus sieben Binärziffern. Die sieben Binärziffern jedes Signales werden parallel, d.h. gleichzeitig im Kernspeicher 17 gespeichert bzw. aus diesem herausgelesen. Auf der Trommel 21 werden die sieben Binärziffern jedes Signales serienmäßig, d.h. nacheinander gespeichert. Das Sektortaktsignal von der Trommel 21 schaltet den Adressenzähler 711' um einen Speicherplatz weiter und liefert ein Steuersignal (Lesekommando), das den Kernspeicher 17 veranlaßt, ein digitales Signal an einen Parallel/ Serien-Umsetzer 725' abzugeben. Diese beiden Punktionen des Sektortaktsignals werden nur dann durchgeführt, wenn die Torschaltung 723' durch die zweite bistabile Schaltung 719' durchlaßfähig gemacht worden ist. Eine weitere Punktion des impulsförmigen Oektortaktsignales besteht darin, das aus dem Kernspeicher 17 herausgelesene Signal zum Parallel/Serien-Umsetzer 725' durchzuschleusen. and prevents the address counter 711 'from advancing. the Gate circuit 715 'is also disabled, so that the core memory 17 no further spear commands can be supplied. The state of the bistable circuit 709 'after the described second switchover enables a second bistable to be switched over Circuit 719 '. The second bistable circuit 719 'is toggled after being through the first index pulse of a storage drum 21 has been made responsive. By switching over the second bistable circuit 719 ', a Gate circuit 723 'made ready to pass at the other input a sector clock signal from drum 21 is present. A sector clock signal occurs for each digital signal to be stored on the drum 21 on. Each of the digital signals stored in the core memory 17 exists in the present embodiment from seven binary digits. The seven binary digits each Signals are stored in parallel, i.e. at the same time, in the core memory 17 or read from it. On the drum 21 the seven binary digits of each signal are serialized, i.e. saved one after the other. The sector clock signal from the drum 21 advances the address counter 711 'by one memory location and supplies a control signal (read command) which causes the core memory 17 to send a digital signal to a parallel / Serial converter 725 'to be delivered. These two punctures of the sector clock signal are only carried out if the gate circuit 723 'is permeable through the second bistable circuit 719' has been made. Another puncture of the pulse-shaped Oektortaktsignales consists of the one from the core memory 17 to pass the signal read out to the parallel / serial converter 725 '.

Der Parallel/Serien-Umsetzer 725' besteht lediglich aus einem siebenstufigen Schieberegister, in das das Ausgangssignal des Kernspeichers 17 parallel eingespeichert wird, während das Ausgancssignal von der letzten Stufe, in die die gespeicherten Signale der Reihe nach verschoben werden, abgenommen wird. Für jedes Bit, das vom Umsetzer 725' auf die Trommel 21The parallel / serial converter 725 'only exists from a seven-stage shift register into which the output signal of the core memory 17 is stored in parallel, while the output signal from the last stage in which the stored Signals are shifted in sequence, is picked up. For every bit that is transferred from the converter 725 'to the drum 21

909836/0785909836/0785

BAD CRIGfNALBAD CRIGfNAL

-18--18-

übertragen wird, liefert die Trommel 21 einen Taktimpuls. Für jedes digitale Signal, das aus dem Speicher 17 herausgelesen wird j sind sieben Taktimpulse von der Trommel 21 erforderlich, um die sieben Binärziffern nacheinander auf der Trommel 21 zu speichern. Für jeweils sieben Taktimpulse tritt ein impulsförmiges Sektortaktsignal auf.is transmitted, the drum 21 delivers a clock pulse. For each digital signal that is read out from the memory 17 if j seven clock pulses are required from drum 21, in order to store the seven binary digits one after the other on the drum 21. For every seven clock pulses a pulse occurs Sector clock signal.

Der bei dem vorliegenden Ausführungsbeispiel verwendete Adressenzähler 711' arbeitet modulo 4096." Das heißt, daß der Adressensähler 711 von der Dezimalzahl 4095 (entsprechend der Binärzahl 111111111111) auf 0 ( in Binärziffern 000000000000) schaltet. Die Beschickung des Kernspeichers 17 ist beendet, x^enn der Adressenzähler 711' den Zählwert 4095 erreicht hat. Das erste Sektortaktsignal von der Torschaltung 723' schaltet dann den Adressenzähler 711» auf O, so daß die Entnahme der aufeinanderfolgenden digitalen Signale bei der ersten Adresse des Kernspeichers 17 beginnt.Die Zahl der digitalen Signale, die vom Kernspeicher 17 über den Umsetzer 725' auf die Trommel 21 übertragen wird, kann kleiner als 4096 sein. Es ist daher erforderlich, den Adressenzähler 711' durch den Speicherkommandoimpuls von der Quelle 707f vor der Beschickung des Kernspeichers 17 zurückzustellen.The address counter 711 'used in the present embodiment works modulo 4096. "This means that the address counter 711 switches from the decimal number 4095 (corresponding to the binary number 111111111111) to 0 (in binary digits 000000000000). The loading of the core memory 17 is finished, x ^ When the address counter 711 'has reached the count value 4095. The first sector clock signal from the gate circuit 723' then switches the address counter 711 'to 0, so that the extraction of the successive digital signals begins at the first address of the core memory 17. The number of digital signals that from the core memory 17 via the converter 725 'is transferred to the drum 21, may be smaller than the 4096th It is therefore necessary to address counter 711' f by the storage command pulse from the source 707 reset prior to the loading of the core memory 17th

Die übertragung vom Kernspeicher 17 auf die Trommel 21 setzt sich solange fort, bis ein weiterer Indeximpuls von der Trommel 21, der anzeigt, daß die Trommel eine vollständige Umdrehung ausgeführt hat, die zweite bistabile Schaltung 719' umschaltet. Die Torschaltung 723' wird dadurch gesperrt und verhindert ein Weiterschalten des Adressenzählers und die Zuführung weiterer Kommandosignale zum Kernspeicher 17.The transfer from the core memory 17 to the drum 21 continues until a further index pulse from drum 21, indicating that the drum is a complete Has carried out rotation, the second bistable circuit 719 'switches over. The gate circuit 723 'is blocked and prevents the address counter from advancing and further command signals from being fed to core memory 17.

Die jeweils aus sieben Binärziffern bestehenden digitalen Signale, die ein Phonem darstellen, werden also serienmäßig auf einer Spur der Trommel 21 aufgezeichnet, während diese eine Umdrehung vollführt. Weitere Phoneme werden auf anderen Spuren der Trommel 21 mit anderen Köpfen3 die in Axialrichtung längs der Trommeloberflache verteilt sind, gespeichert. Bei dem vorliegenden Λυ v^ührungsl"*eli.oiel sind 128The digital signals, each consisting of seven binary digits and representing a phoneme, are thus recorded in series on a track of the drum 21 while it is making one revolution. Further phonemes are stored on other tracks of the drum 21 with other heads 3 which are distributed in the axial direction along the drum surface. In the present example there are 128

BAD CRlGiNALBAD CRlGiNAL

solcher Datenspuren vorhanden. Die Index-Sektor- und Taktimpulse sind jeweils sind jeweils auf einer getrennten Spur aufgezeichnet. Zwischen den SektorSignalen treten jeweils sieben Taktsignale auf und zwischen den während jeder Umdrehung einmal auftretenden Indeximpulsen liegen etwa 4000 Sektorimpulse. Jede Spur enthält ein einzelnes Phonem. Während der Beschickung können die Spuren von Hand ausgewählt werden, beispielsweise mit Hilfe von Schaltern. Durch Wahl eines der Datenköpfe kann das zugehörige Phonem aufgezeichnet und später wiedergewonnen werden. such data tracks exist. The index sector and clock pulses are each recorded on a separate track. There are seven clock signals between the sector signals on and between the index pulses, which occur once during each revolution, there are approximately 4000 sector pulses. Every Track contains a single phoneme. During loading, the tracks can be selected manually, for example with Help from switches. By selecting one of the data heads, the associated phoneme can be recorded and later retrieved.

Nachdem alle zu verwendenden Phoneme aufgezeichnet worden sind, kann eine gewünschte Folge von Phonemen zur synthetischen Spracherzeugung von der Trommel abgelesen und abwechselnd einem von zwei Kernspeichern zugeführt werden. Die Phoneme werden dann aus den Kernspeichern in der gleichen Reihen folge entnommen, beschnitten, um einen stetigen übergang der Laute zu gewährleisten, und in hörbare Laute umgesetzt. Die übertragung eines Phonems von der Trommel in den einen Kernspeicher und die Entnahme eines Phonems aus dem anderen Kernspeicher zur Umsetzung in einen hörbaren Laut erfolgt gleichzeitig. Wie dies im einzelnen geschieht, soll nun anhand von Fig. 10 erläutert werden.After all the phonemes to be used have been recorded, a desired sequence of phonemes can be added to the synthetic Speech generation can be read from the drum and alternately fed to one of two core stores. the Phonemes are then extracted from the core memories in the same order, clipped to make a steady transition from the Ensure sounds, and translate them into audible sounds. The transfer of a phoneme from the drum to a core memory and the removal of a phoneme from the other core memory for conversion into an audible sound takes place at the same time. How this is done in detail will now be explained with reference to FIG.

Jedem wiederzugebenden Phonem shd drei Zahlen zugeordnet. Die erste Zahl gibt an, welche Spur der Trommel 21 abgelesen, also welches Phonem gewählt werden soll. Die zweite Zahl gibt die Anfangsstelle und die dritte Zahl die Endstelle an. Die zweite und dritte Zahl, die zugeführt werden, um die Anfangsstelle und die Endstelle des gewählten Phonems anzugeben, werden verzögert, bis das gewählte Phonem in der unten noch zu beschreibenden Weise von der Trommel abgelesen worden ist. Diese Zahlen können bei dem dargestellten Ausführungsbeispiel durch eine von Hand steuerbare Vorrichtung 831 oder durch ein Lochstreifenlesegerät 333 eingegeben werden. Selbstverständlich können diese Zahlen auch durch eine kompliziertere Eirndchtuns geliefert werden, z.B. durch eine digitale Daten-Each phoneme to be reproduced is assigned three numbers. The first number indicates which track of the drum 21 read, i.e. which phoneme should be selected. The second number gives the starting point and the third number the end point at. The second and third digits supplied to indicate the beginning and the end of the selected phoneme, are delayed until the selected phoneme has been read from the drum in the manner to be described below is. In the embodiment shown, these numbers can be controlled by a manually controllable device 831 or by a punched tape reader 333 can be entered. Of course these numbers can also be supplied by a more complicated arrangement, e.g. by a digital data

909836/0785909836/0785

BAD ORIGINALBATH ORIGINAL

verarbeitungsanlage. Anfangs- und Endstelle werden so gewählt, daß die dadurch bewirkte Beschneidung des jeweiligen Phonems einen stetigen Übergang mit dem vorangehenden bzw. folgenden Phonem gewährleistet♦ Die Anfangs- und Endadressen werden so gewählt, daßprocessing plant. The start and end points are chosen so that the resulting clipping of the respective phoneme ensures a steady transition with the preceding or following phoneme ♦ The start and end addresses are like this chosen that

(1) der Wert der Binärzahl höchstens 5% von 64 (1000000) abweicht, und daß(1) the value of the binary number deviates by no more than 5% from 64 (1000000), and that

(2) die Pormanten im Phonem Frequenzen aufweisen, die bei der Anfangsadresse stetig in die am Ende des vorangehenden Phonems übergehen, und an der Endadresse stetig in die am Anfang des folgenden Phonems übergehen.(2) the pormants in the phoneme have frequencies that at the beginning address continuously into those at the end of the preceding one Phonems, and at the end address they continuously change to the one at the beginning of the following phoneme.

Die erste Zahl wird von der Handsteuervorrichtung 831 oder dem Papierstreifen- bzw. Lochstreifenlesegerät 833 einem Phonemwahlregister 835 zugeführt. Die zweite Zahl wird über ein Anfangsstellen-Zwischenregister 839 einem Lesezähler 837 zugeführt. Die dritte Zahl wird einem Halte- oder Endstellen register 841 zugeführt.The first number is obtained from the hand control device 831 or the paper tape or punch tape reader 833 a phoneme selection register 835 supplied. The second number becomes a read counter via a starting position intermediate register 839 837 supplied. The third number is fed to a stop or end point register 841.

Das der Anfangs- und Endstellenzahl in den Registern 839 und 84l zugeordnete Phonem wird von der Trommel 21 abgelesen und in einem der beiden Kernspeicher 17 oder 827 gespeichert. The phoneme assigned to the number of start and end positions in registers 839 and 841 is read by drum 21 read and stored in one of the two core memories 17 or 827.

Zwei Vorgänge laufen gleichzeitig ab: Erstens wird ein Phonem von der Trommel 21 in den Kernspeicher 17 oder 827 übertragen und zweitens wird das Phonem aus dem jeweils anderen Kernspeicher herausgelesen und in einen hörbaren Laut umgesetzt. Welches Register bei der ersten und welches bei der zweiten Operation mitwirkt, wird durch eine bistabile Schaltung 843 bestimmt. Zur Erläuterung sei angenommen, daß der A-Ausgang 847 der bistabilen Schaltung 843 positiv ("richtig") und der B-Ausgang 845 negativ ("falsch") ist. Pur die zu beschreibenden Operationen spielt es keine Rolle, welcher Ausgang zuerst positiv (richtig) ist.Two processes take place at the same time: First, is one phoneme is transferred from the drum 21 to the core memory 17 or 827 and, secondly, the phoneme is made from the other Core memory read out and converted into an audible sound. Which register for the first and which for the second operation is involved is determined by a bistable circuit 843. For explanation it is assumed that the A output 847 of the bistable circuit 843 is positive ("correct") and the B output 845 is negative ("incorrect"). Purely the operations to be described it doesn't matter which outcome is positive (correct) first.

Die erste Operation, bei der ein Phonem von der Trommel 821 in den einen Kernspeicher übertragen wird, verläuft folgendermaßen. Die zu lesende Spur der Trommel 821 wird durchThe first operation in which a phoneme is transferred from the drum 821 to the one core memory is in progress as follows. The track to be read of the drum 821 is through

909836/0785909836/0785

das Phonemwahlregister 835 bestimmt. Ein Indeximpuls von der Trommel 21 stellt einen Schreibzähler 811 auf O. Die Binärziffern des Phonemsignals von dem gewählten Kopf der Trommel 21 werden mit Hilfe der Taktimpulsspur in einen Serien/Parallel-Umsetzer 849 geleitet. Das parallele Ausgangssignal des Umsetzers 849 tritt auf sieben Ausgangsleitungen auf, die mit den Kernspeichern 17 und 827 verbunden sind. Der positive A-Ausgang 847 der bistabilen Schaltung 843 bewirkt, daß die Binärziffern vom Umsetzer 849 im B-Speicher 827 gespeichert werden, in dem Torschaltungen 851 und 853, die zur Speicherung im Speicher 827 dienen, durchlaßbereit gemacht v/erden. Die Adresse für die Speicherung der jeweils aus sieben Binärziffern bestehenden Zeichen wird dem Kernspeicher 827 vom Zähler SU über eine geöffnete Torschaltung 851 zugeführt. Jeweils sieben Taktimpulse von der Trommel 21 sind zeitlich von einem Sektortaktsignal begleitet, das dem Kernspeicher 827 durch eine geöffnete Torschaltung 853 zugeführt v/erden, um die Speicherung der sieben Binärziffern vom Umsetzer 859 zu bewirken, außerdem wird der Zähler 811 durch das Sektorsignal um einen Schritt weitergeschaltet. Die aufeinanderfolgenden siebenstelligen binären Phonemsignale werden also von der Trommel 21 über den Umsetzer 849 in den Kernspeicher 827 eingespeichert. Der Zähler 8II schaltet von 4095 auf 0 zurück, so daß maximal 4096 Zeichen übertragen werden können. Wenn die Trommel 21 eine vollständige Umdrehung ausgeführt hat, sind alle Zeichen, die ein vollständiges Phonem darstellen, in den B-Speicher 327 übertragen. Der Zähler 811 wird durch einen Indeximpuls auf 0 zurückgestellt und, wenn sich der Zustand .der bistabilen Schaltung 343 nicht ändert, wird dieselbe Folge von Zeichen erneut übertragen, ohne daß dadurch der Inhalt des B-Speichers 827 geändert wird.the phoneme selection register 835 is determined. An index pulse from the Drum 21 sets a write counter 811 to O. The binary digits of the phoneme signal from the selected head of the drum 21 are fed into a serial / parallel converter with the aid of the clock pulse track 849 headed. The parallel output of converter 849 appears on seven output lines that connect to the core memories 17 and 827 are connected. The positive A output 847 of the bistable circuit 843 causes the binary digits from the converter 849 are stored in the B-memory 827, in the gate circuits 851 and 853, which are used for storage in the memory 827, made ready for passage. The address for storing each character consisting of seven binary digits is the core memory 827 from the counter SU via an open gate circuit 851 supplied. Each seven clock pulses from the drum 21 are temporally accompanied by a sector clock signal that the Core memory 827 is fed through an open gate circuit 853 to the storage of the seven binary digits from the converter 859, the counter 811 is also activated by the sector signal moved one step further. The successive seven-digit binary phoneme signals are thus from of the drum 21 is stored in the core memory 827 via the converter 849. The counter 8II switches back from 4095 to 0, so that a maximum of 4096 characters can be transmitted. When the drum 21 has made one complete revolution, they are all Characters representing a complete phoneme are transferred to the B-memory 327. The counter 811 is activated by an index pulse is reset to 0 and, if the state of the bistable circuit 343 does not change, the same sequence of characters retransmitted without changing the contents of the B-memory 827.

Die mit der oben beschriebenen ersten Operation Clcichzeitic ablaufende zweite Operation, bei der die Signale auο dem anderen Kernspeieher herausgelesen und in einen hörbaren Laut umgesetzt werden, verläuft wie folgt:The second operation running with the above-described first operation Clcichzeitic, in which the signals auο read out the other core spreader and into an audible one To be implemented aloud, proceeds as follows:

Der positive Λ-Ausgang 047 der bistabilen Schaltung 343 macht außerdem Torschaltungen 855, 357 und 859 durch-The positive Λ output 047 of the bistable circuit 343 also makes gates 855, 357 and 859 through

909836/0785909836/0785

BADBATH

laßbereit, die für das Herauslesen aus dem A-Kernspebher 17 vorgesehen sind. Die Adresse, von der die Zeichen aus dem Kernspeicher 17 herausgelesen werden sollen, wird durch den Lesezähler 837 über die geöffnete Torschaltung 855 geliefert. Die ursprüngliche Einstellung der Zählers 837 erfolgte von außen, entweder mittels der Handsteuervorrichtung 831 oder des Lochstreifenlesegerätes 833. Die Taktimpulse für das Herauslesen aus dem A-Kernspeicher 17 werden von einem 14-kHz-Oszillator 861 über das geöffnete Gatter 859 geliefert. Die Taktimpulse schalten außerdem jeweils den Lesezähler 837 um einen Platz weiter. Das Ausgangssignal des Kernspeichers 17 ist ein siebenstelliges Binärzeichen, das dem Eingang eines Digital/Analog-Umsetzers 863 über die geöffnete Torschaltung 857 zugeführt wird. Das Ausgangssignal des Digital/Analog-Ümsetzers 863 ist ein sich kontinuierlich änderndes elektrisches Signal, dessen Amplitude durch das digitale Eingangssignal bestimmt wird. Das sich kontinuierlich ändernde Ausgangssignal des Umsetzers 863 wird durch einen Verstärker 865 verstärkt und durch einen Wandler, z.B. einen Lautsprecher 867, in einen hörbaren Laut umgesetzt. Aus dem Kernspeicher 17 werden nacheinander Phonemsignale herausgelesen, bis die Zahl im Lesezähler 837 gleich der Zahl im Endstellenregister 841 ist. Die Übereinstimmung dieser Zahlen wird durch eine Vergleichsschaltung 869 festgestellt, deren Ausgangssignal die bistabile Schaltung 843 umschaltet und das Lesegerät 833 veranlaßt, die zweite und dritte Zahl für das Phonem, das gerade von der Trommel 21 in den B-Kernspeicher 827 übertragen wird sowie die erste Zahl für das als nächstes so zu übertragende Phonem zu liefern.ready to leave, those for reading out of the A-Kernspebher 17 are provided. The address from which the characters are to be read out of the core memory 17 is determined by the read counter 837 via the opened gate circuit 855. The original setting of the 837 counter was made from the outside, either by means of the manual control device 831 or the paper tape reader 833. The clock pulses for reading out from the A-core memory 17 are provided by a 14 kHz oscillator 861 is supplied via the opened gate 859. The clock pulses also switch the read counter 837 by one place Further. The output signal of the core memory 17 is a seven-digit binary character that is sent to the input of a digital / analog converter 863 is supplied via the opened gate circuit 857. The output of the digital-to-analog converter 863 is a continuously changing electrical signal, the amplitude of which is determined by the digital input signal. That continuously changing output signal of converter 863 is amplified by an amplifier 865 and converted into an audible sound by a transducer, e.g. a loudspeaker 867. Phoneme signals are read out one after the other from the core memory 17 until the number in the read counter 837 equals the Number in the terminal register is 841. The agreement of these numbers is determined by a comparison circuit 869, the output signal of which the bistable circuit 843 switches over and causes reader 833 to read the second and third numbers for the phoneme that has just been transferred from drum 21 to B-core memory 827 is transmitted and to supply the first number for the next phoneme to be transmitted in this way.

Durch die Umschaltung der bistabilen Schaltung 843 wird der B-Ausgang 845, der vorher negativ ("falsch") war, positiv ("richtig") und der A-Ausgang 347» der vorher positiv war, negativ.By switching the bistable circuit 843, the B output 845 , which was previously negative (“false”), becomes positive (“correct”) and the A output 347, which was previously positive, becomes negative.

Die durch das Phonemwahlregister 035 gewählte Spur der Trommel 21 wird nun abgelesen, das abgelesene Signal wird dem Serien/Paralle.1.--Umsetzer 849 eL^preul -..--■:I del obenThe track of the drum 21 selected by the phoneme selection register 035 is now read, the signal read becomes the series / parallel. 1st - converter 849 eL ^ preul - .. - ■: I del above

O ft O w '"- "~ -'■ ft ''i Q c-O ft O w '"-" ~ -' ■ ft '' i Q c-

ÖAD ORiGfNALÖAD ORiGfNAL

beschriebenen zeitlichen Steuerung zugeführt , und das Ausgangssignal des Umsetzers 849 wird beiden Speichern zugeführt. Der positive B-Ausgang 845 der bistabilen Schaltung 843 öffnet die Gatter 871 und 873, die für das Speichern im A-Kernspeicher 17 vorgesehen sind. Genauer gesagt, werden die Sektortaktimpulse über das geöffnete Gatter 871 und die Adresse über das geöffnete Gatter 873 vom Speicherzähler 8II zugeführt. Die entsprechenden Gatter 835 und 851 des D-Kernspeichers 827 sind nun gesperrt, da der A-Ausgang 847 der bistabilen Schaltung 843 negativ ist. Die erste Operation wird also nun mit dem anderen Kernspeicher durchgeführt.timing control described above, and the output signal of the converter 849 is fed to both memories. Of the positive B output 845 of the bistable circuit 843 opens the Gates 871 and 873, which are provided for storage in the A-core memory 17. More specifically, the sector clock pulses supplied via the open gate 871 and the address via the open gate 873 from the memory counter 8II. The corresponding Gates 835 and 851 of the D-core memory 827 are now blocked because the A output 847 of the bistable circuit 843 is negative. The first operation is now carried out with the other core memory.

Die zweite Operation wird ebenfalls mit einem anderen Kernspeicher wie vorher durchgeführt, da der positive B-Ausgang 845 der bistabilen Schaltung 843 die Torschaltungen 875, 377 und 879, die zum Abfragen des B-Kernspeichers 327 dienen, öffnet. Dem Speicher 827 werden die Taktimpulse vom Oszillator 861 über die geöffnete Torschaltung 875 und die Adresse vom Lesezähler 337 über die geöffnete Torschaltung 377 zugeführt . wehrend das Ausgangssignal des Kernspeichers 827 dem Eingang des Digital/Analog-Umsetzers 863 über die geöffnete Schaltung 879 zugeführt wird. Die entsprechenden Torschaltungen 855, 859 und 857 des A-Kernspeichers 17 sind gesperrt, da der A-Ausgang 847 der bistabilen Schaltung 843 nun negativ ist.The second operation is also carried out with a different core memory as before, since the positive B output 845 of the bistable circuit 843 opens the gate circuits 875, 377 and 879, which are used to query the B core memory 327. The memory 827 receives the clock pulses from the oscillator 861 via the open gate circuit 875 and the address from the read counter 337 via the opened gate circuit 377. while the output signal of the core memory 827 is fed to the input of the digital / analog converter 863 via the open circuit 879. The corresponding gate circuits 855 , 859 and 857 of the A core memory 17 are blocked because the A output 847 of the bistable circuit 843 is now negative.

Das abwechselnde Abfragen und Speichern wird mit den beiden Kernspeichern fortgesetzt, bis alle gewünschten Phoneme . die gewählt worden sind, in hörbare Laute umgesetzt worden sind. Bei dem beschriebenen Ausführungsbeispiel läuft die Trommel 21 mit einer Drehzahl von 1300 U/min. Für die Übertragung eines ganzen Phonems ist eine Umdrehung der Trommel erforderlich. Für die Übertragung eines Phonems von der Trommel in den Kernspeicher v/erden daher ungefähr 34 ms benötigt. Außerden ist eine Latenzzeit , also eine Viarteperiode für den Indeximpuls vorgesehen, die annähernd 34 ms beträgt. Die Frequenz, mit der die Information aus dem anderen Kernspeicher herausgelesen wird, beträgt 14 kKz, so daß in jeweils 7I35 ein ZeichenThe alternating querying and saving is continued with the two core memories until all the desired phonemes. that have been chosen have been converted into audible sounds. In the embodiment described, the drum 21 runs at a speed of 1300 rpm. One revolution of the drum is required to transmit an entire phoneme. The transfer of a phoneme from the drum to the core memory therefore takes approximately 34 ms. In addition, a latency period, that is to say a viarte period, is provided for the index pulse, which is approximately 34 ms . The frequency with which the information is read out from the other core memory is 14 kKz, so that in each 7I 3 5 one character

909836/0785909836/0785

BAD ORIGINALBATH ORIGINAL

herausgelesen wird. Die übertragung eines Phonems in einen Kernspeicher erfordert also eine Zeitspanne, in der etwa 950 Zeichen aus dem anderen Kernspeicher herausgelesen werden können. Das maximale Fassungsvermögen der Kernspeicher beträgt jeweils 4096 Zeichen, aber so viele Zeichen werden niemals abgefragt, da das Phonem am Anfang und am Ende beschnitten wird. Die Anzahl der herausgelesenen Zeichen überschreitet jedoch immer das Minimum, das erforderlich ist, um den anderen Kernspeicher von der Trommel zu beschicken. Die für die Einstellung einer neuen Anfangsstelle erforderliche Zeitspanne ist so kurz, daß keine Unstetigkeit in dem erzeugten Laut wahrgenommen werden kann. Das Ausgangssignal des Digital/Analog-Umsetzers 863 wird solange aufredfcerhalten, daß kleinere Unstetigkeiten vermieden werden, die sonst unter Umständen eintreten könnten.is read out. The transfer of a phoneme into a core memory thus requires a period of time in which about 950 characters can be read from the other core memory. That The maximum capacity of the core memory is 4096 characters each, but that many characters are never queried because the Phoneme at the beginning and at the end is trimmed. However, the number of characters read out always exceeds the minimum, that is necessary to feed the other core storage from the drum. The period of time required for setting a new starting point is so short that there is no discontinuity can be perceived in the sound produced. The output signal of the digital / analog converter 863 is retained as long as that minor discontinuities that could otherwise occur under certain circumstances are avoided.

Die vom Lochstreifenlesegerät 833 oder einer entsprechenden Steuervorrichtung, wie einer digitalen Rechenanlage 9 gelieferten Zahlen werden so gewählt, daß die für die künstlich zu erzeugende Sprache erzeugenden Phoneme in der richtigen Reihen folge ausgewählt und für eine optimale Verständlichkeit in der beschriebenen Weise beschnitten werden.The numbers supplied by the punched tape reader 833 or a corresponding control device, such as a digital computer system 9 , are selected so that the phonemes generating the artificially generated speech are selected in the correct order and trimmed in the manner described for optimal understanding.

Bei einem weiteren möglichen Ausführungsbeispiel der Erfindung, das nur einen Kernspeicher enthält, wird von der Trommel jeweils nur derjenige Teil der verschiedenen Phoneme abgelesen, der wiederzugeben ist, und alle abgelesenen Phonemteile werden serienmäßig in einem großen Kernspeicher gespeichert. Die Abfrage von der Trommel und die übertragung in den Kernspeicher beginnt dann bei der ersten oder niedrigsten Kernspeicheradresse. Wenn die letzte oder höchste Kernspeicheradresse erreicht ist, beginnt die übertragung wieder mit der ersten Adresse. Das Heraus lesen der in Analogsignale umzusetzenden digitalen Signale aus dem Kernspeicher beginnt mit der ersten Adresse und setzt sich bis zur letzten Adresse fdrt, worauf das Herauslesen wieder bei der ersten Adresse beginnt. Eine geeignete Anordnung, die ein Ablesen eines Phonems von der Trommel für eine bestimmte AnzahlIn a further possible embodiment of the invention that contains only one core memory, the Drum read only that part of the various phonemes that is to be reproduced, and all the phoneme parts read off are stored in a large core memory as standard. The query from the drum and the transfer to the core memory then starts at the first or lowest core memory address. When the last or highest core memory address is reached, the transmission starts again with the first address. Reading out the digital signals to be converted into analog signals the core memory starts with the first address and continues up to the last address, whereupon the reading out starts again the first address begins. A suitable arrangement allowing reading of a phoneme from the drum for a certain number

von Trommelumdrehungen verhindert, gewährleistet die richtigen Zeitbeziehungen. prevented by drum revolutions, ensures the correct time relationships.

909836/0785909836/0785

Claims (9)

PatentansprücheClaims 1. Einrichtung zur Synthetisierung von Audio-Information, insbesondere der menschlichen Sprache, gekennzeichnet durch einen Speicher (710., 801 s 21) zur Speicherung von codierten Phonemen, eine Steuereinrichtung (715, 807) zum Entnehmen der codierten Phoneme in einer gewünschten Reihenfolge aus dem Speicher, und einer Umsetzvorrichtung (721; 815, 863) der entnommenen Phoneme in kontinuierliche elektrische Signale.1. A device for synthesizing audio information, in particular human speech, characterized by a memory (710., 801 s 21) for storing coded phonemes, a control device (715, 807) for extracting the coded phonemes in a desired order the memory, and a device (721; 815, 863) converting the extracted phonemes into continuous electrical signals. 2. Einrichtung nach Anspruch I5 dadurch gekennzeichnet, daß die Phoneme im Speicher als digital codierte Signale gespeichert werden.2. Device according to claim I 5, characterized in that the phonemes are stored in the memory as digitally coded signals. 3. Einrichtung nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Steuereinrichtung beim Herauslesen der einzelnen Phoneme oder Teilen von diesen jeweils die Anfangs- und Endstellen des betreffenden Teiles des jeweiligen Phonems im Speicher bezeichnet, welche Stellen eine Stetigkeit der Sprache mit den vorher und nachher aus den .Speicher entnommenen Phonemen gewähr leisten.3. Device according to claim 1 or 2, characterized in that the control device when reading out the individual phonemes or parts of these, the respective start and end positions of the relevant Part of the respective phoneme in the memory denotes which places a continuity of the language with the before and after Ensure phonemes removed from the memory. 1L Einrichtung nach Ansprich 1, 2 oder 3, d a ·- durch gekennzeichnet, daß die Umsetzvorrichtuni; einen zweiten Speicher zur zeitweiligen Speicherung von mehr als einem entnommenen codierten Phonem enthält und daß die Steuereinrichtung das Lesen der im zweiten Speicher gespeicherten Phoneme zur Umsetzung in kontinuierliche elektrische Signale bewirkt. 1 L device according to claim 1, 2 or 3, there · - characterized in that the Umsetzvorrichtuni; a second memory for the temporary storage of more than one extracted coded phoneme and that the control device causes the reading of the phonemes stored in the second memory for conversion into continuous electrical signals. 5. Einrichtung nach Anspruch 4, dadurch gekennzeichnet, daß der zweite Speicher zwei Speichereinheiten (17, <°>27) enth/ilt, die jeweils Signale, die ein vollständigen Phonem bilden., zu speichern vermögen, und daß die steuereinrichtung (3^3) die übertragung von gewünschten Folgen, von Signalen, die vollständige Phoneme darstellen und von5. Device according to claim 4, characterized characterized in that the second memory has two Storage units (17, <°> 27) contain / ilts the respective signals that form a complete phoneme., able to store, and that the control device (3 ^ 3) the transmission of desired sequences, of signals representing complete phonemes and of 909836/0785909836/0785 BAD ORIGINALBATH ORIGINAL dem ersten Speicher (821) entnommen worden sind, abwechselnd in die erste und zweite Speichereinheit (17» 327) bewirkt und' daß die Steuereinrichtung weiterhin bewirkt, daß von den beiden Speichereinheiten abwechselnd digital codierte Signale der Phoneme in der Reihenfolge, in der die Phoneme aus dem ersten Speicher entnommen wurden, herausgelesen werden.have been removed from the first memory (821), alternately in the first and second storage units (17 »327) and ' that the control device also causes the two memory units to alternately receive digitally encoded phoneme signals in the order in which the phonemes were extracted from the first memory. 6. Einrichtung nach Anspruch 3, dadurch gekennzeichnet, daß zur Speicherung von Phonemen im ersten Speicher ein zweiter Umsetzer zur Gewinnung von elektrischen Signalen aus Lautphonemen vorgesehen ist und daß die Steuereinrichtung unmittelbar bewirkt, daß die gewonnenen Signale im Speicher in sequentieller Ordnung und in Gruppen, die als einzelne Phoneme adressierbar sind, gespeichert werden, wobei die Speicherung der Gruppen in irgend einer vorgegebenen Reihenfolge erfolgt.6. Device according to claim 3, characterized in that a second converter is provided for the storage of phonemes in the first memory for obtaining electrical signals from phonemes and that the control device directly causes the signals obtained in the memory in sequential order and in groups, which can be addressed as individual phonemes, are stored, the groups being stored in any predetermined order. 7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet, daß die zweite Unisetzvorrichtung eine Torschaltung (705) zum Abtasten der Amplitude eines aus Lautphonemen gewonnenen kontinuierlichen elektrischen Signals in geeigneten Zeitintervallen und eine Codiervorrichtung (707) zur Umwandlung der bei der Abtastung gewonnenen periodischen Amplitudenproben in digital codierte Signale zur Speicherung im Speicher (710) enthält.7. Device according to claim 6, characterized in that the second unisetting device a gate circuit (705) for sampling the amplitude of a continuous electrical signal obtained from phonemes at suitable time intervals and a coding device (707) for converting the periodic values obtained during the sampling Amplitude samples in digitally encoded signals for storage in memory (710). 8. Verfahren zur synthetischen Erzeugung von Audio-Information, insbesondere von menschlicher Sprache, dadurch gekennzeichnet, daß Signale gewonnen werden, die Phoneme darstellen, welche in der künst.lich zu erzeugenden Audio-Information vorkommen, daß die die einzelnen Phoneme darstellenden Signale in Plätzen eines Speichermediums so gespeichert werden, daß eine Entnahme dieser Signale möglich ist, wobei an irgend einem vorgegebenen Platz begonnen und an irgend einem nachfolgenden vorbestimmten Platz geendet wird, daß von dem Speichermedium bestimmte PgI.-.o" von Signalen entnommen werden, die eine gewünschte Folge vor* honeinen dar-8. A method for the synthetic generation of audio information, in particular human speech, characterized in that signals are obtained represent the phonemes which occur in the artificially generated audio information that the individual Signals representing phonemes are stored in locations on a storage medium in such a way that these signals can be extracted is possible, starting at any given place and ending at any subsequent predetermined place that from the storage medium determined PgI .-. o "of signals can be taken, which show a desired sequence in front of you. 909836/0?909836/0? BAD ORlGiN1ALBAD ORlGiN 1 AL -27--27- stellen, wobei die Gwinnung der die einzelnen Phoneme darstellenden Signale an speziellen Stellen beginnt und endet, welche eine Kontinuität der Pormanten über die Verbindungsstellen zwischen aufeinanderfolgenden Phonemen in der Folge gewährleisten, und daß die entnommenen Phoneme in hörbare Laute umgesetzt werden. represent, whereby the gain of the individual phonemes representing Signals begins and ends at special points, which a continuity of the pormanten over the junctions between ensure successive phonemes in sequence, and that the extracted phonemes are converted into audible sounds. 9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß die Phoneme durch digitale Signale dargestellt werden. J9. The method according to claim 8, characterized in that that the phonemes are represented by digital signals. J 909 8 3 6/0785909 8 3 6/0785
DE19681803621 1968-02-26 1968-10-17 Facility for synthesizing human speech Pending DE1803621A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US70832368A 1968-02-26 1968-02-26
US70838968A 1968-02-26 1968-02-26

Publications (1)

Publication Number Publication Date
DE1803621A1 true DE1803621A1 (en) 1969-09-04

Family

ID=27108056

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19681803621 Pending DE1803621A1 (en) 1968-02-26 1968-10-17 Facility for synthesizing human speech

Country Status (5)

Country Link
DE (1) DE1803621A1 (en)
FR (1) FR1603882A (en)
GB (1) GB1263523A (en)
NL (1) NL6902903A (en)
SU (1) SU417965A3 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2119208B (en) * 1982-04-28 1986-01-22 Gen Electric Co Plc Method of and apparatus for generating a plurality of electric signals

Also Published As

Publication number Publication date
FR1603882A (en) 1971-06-07
NL6902903A (en) 1969-08-28
SU417965A3 (en) 1974-02-28
GB1263523A (en) 1972-02-09

Similar Documents

Publication Publication Date Title
DE2918533C2 (en)
EP0366192B1 (en) Textprocessing arrangement
DE1472004A1 (en) Method and arrangement for processing stored speech signals
DE2850286A1 (en) ELECTRONIC STRIKING CLOCK
DE9006717U1 (en) Answering machine for digital recording and playback of voice signals
DE1965480A1 (en) Device for the artificial generation of words by converting a text printed in letters into pronunciation
DE3023581C2 (en) Method for the digital envelope control of a polyphonic music synthesis instrument and circuit arrangement for carrying out the method
DE69233622T2 (en) Device for generating announcements
DE2836738A1 (en) METHOD AND DEVICE FOR EXPRESSION ENCODING WHEN RECORDING FROM THE KEYBOARD OF AN ELECTRONIC PIANO
DE1811040C3 (en) Arrangement for synthesizing speech signals
DE2836736A1 (en) SYSTEM FOR ENCODING DEPTH AND ALTITUDE EXPRESSION EFFECTS WHEN RECORDING FROM THE KEYBOARD OF AN ELECTRONIC PIANO
EP0058130B1 (en) Method for speech synthesizing with unlimited vocabulary, and arrangement for realizing the same
DE2836737C3 (en) Method for recording on a recording medium data signal sequences corresponding to sound signals produced when playing a key-operated musical instrument
AT311077B (en) Device for synthesizing audio information
EP0372639A2 (en) Speech recognition system
DE1803621A1 (en) Facility for synthesizing human speech
DE4441906C2 (en) Arrangement and method for speech synthesis
WO2000016310A1 (en) Device and method for digital voice processing
DE4111781A1 (en) COMPUTER SYSTEM FOR VOICE RECOGNITION
DE3215868A1 (en) Method and arrangement for recognising the words in a continuous word chain
DE2335818C3 (en) Electrical arrangement for the automatic generation of spoken sentences
DE3232835C2 (en)
DE3406540C1 (en) Method and arrangement for speech synthesis
DE2016572A1 (en) Method and device for speech synthesis
DE2531006A1 (en) Speech synthesis system from diphthongs and phonemes - uses time limit for stored diphthongs and their double application

Legal Events

Date Code Title Description
OHW Rejection