CH639218A5 - VOICE ENCODING / DECODING METHOD. - Google Patents
VOICE ENCODING / DECODING METHOD. Download PDFInfo
- Publication number
- CH639218A5 CH639218A5 CH844278A CH844278A CH639218A5 CH 639218 A5 CH639218 A5 CH 639218A5 CH 844278 A CH844278 A CH 844278A CH 844278 A CH844278 A CH 844278A CH 639218 A5 CH639218 A5 CH 639218A5
- Authority
- CH
- Switzerland
- Prior art keywords
- signal
- subsection
- data
- intensity
- phoneme
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000003252 repetitive effect Effects 0.000 claims abstract description 4
- 230000015654 memory Effects 0.000 claims description 40
- 238000005070 sampling Methods 0.000 claims description 13
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 claims description 4
- 101150102866 adc1 gene Proteins 0.000 claims description 4
- 239000003990 capacitor Substances 0.000 claims description 4
- 101100162020 Mesorhizobium japonicum (strain LMG 29417 / CECT 9101 / MAFF 303099) adc3 gene Proteins 0.000 claims description 3
- 101150042711 adc2 gene Proteins 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000008859 change Effects 0.000 abstract description 28
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000007774 longterm Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 101100015484 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GPA1 gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Die vorliegende Erfindung betrifft ein Sprachkodierungs-/ Dekodierungs-Verfahren. The present invention relates to a speech coding / decoding method.
Öfters ist eine Umsetzung des analogen elektrischen Äquivalentes der Stimme in digitale Form, wie z.B. für Übersetzungen mit Computer usw., notwendig. Wegen der hohen Bitrate von ca. 60000 Bit/s, die eine einfache Abtastung und Umsetzung in digitale Form braucht, sind verschiedene Kodierungsverfahren der Stimme entstanden (Vocoder). It is often necessary to convert the analog electrical equivalent of the voice into digital form, e.g. for translations with computer etc., necessary. Because of the high bit rate of approx. 60,000 bit / s, which requires simple sampling and conversion into digital form, various coding methods for the voice have emerged (vocoder).
Diese Verfahren beruhen auf verschiedenen Prinzipien, wie z.B. in einer Teilung des analogen elektrischen Äquivalentes der Stimme, welches folgend als AEÄS abgekürzt wird, in mehrere Frequenzbänder, z.B. 32 und Kodierung der Nummer jedes Bandes und der Umhüllenden. Während der Wiederherstellung des AEÄS wird nach der obengenannten Kodierung die Intensität einer Zahl Oszillatoren, entsprechend der Bänder, variiert und demnach erfolgt die Zusammensetzung, welche das AEÄS gibt. Alle bekannten Sprachkodierungsverfah-ren ergeben eine Bitrate von weniger als 6000 Bit/s, aber deren praktische Ausführung ist sehr schwierig und kostspielig. These methods are based on various principles, e.g. in a division of the analog electrical equivalent of the voice, which is abbreviated as AEÄS, into several frequency bands, e.g. 32 and coding the number of each volume and the envelope. During the restoration of the AEÄS, the intensity of a number of oscillators, according to the bands, is varied according to the abovementioned coding, and accordingly the composition which gives the AEÄS takes place. All known speech coding methods result in a bit rate of less than 6000 bit / s, but their practical implementation is very difficult and expensive.
Die vorliegende Erfindung beruht auf einem anderen als die bekannten Verfahren und nützt folgende Eigenschaft aus, welche die Konsonanten und Vokale der Stimme haben. Die Signalabschnitte entsprechend Konsonanten und Vokalen, aus welchen die menschliche Stimme besteht und die folgend als Phoneme bezeichnet werden, haben eine Signalform, welche aus ähnlichen sich wiederholenden Signalunterabschnitten bestehen, welche sich von der Gesamtintensität jedes Unterabschnitts unterscheiden. Für einige Phoneme, z.B. ch und i|/, The present invention is based on a method other than the known methods and takes advantage of the following property which the consonants and vowels of the voice have. The signal sections corresponding to consonants and vowels which make up the human voice and which are hereinafter referred to as phonemes have a signal form which consist of similar repetitive signal subsections which differ from the total intensity of each subsection. For some phonemes, e.g. ch and i | /,
sind die Unterabschnitte nicht wiederholbarer Natur, sondern haben eine Rauschform. Die ähnlichen Unterabschnitte nennen wir auch Gruppen, und im Falle, wo die Signalform eines Phonems nicht wiederholbarer Natur ist, sondern eine Rauschform hat, definieren wir als Gruppe resp. Signalunterabschnitt, einen Teil des Signalabschnitts einer vorausbestimmten konstanten Zeitdauer. Während des Sprechens hat gewöhnlich jedes Phonem eine Dauer von 58 bis 200 ms und jede Gruppe eine Dauer von 4 bis 8 ms. Die Dauer der sich wiederholenden Gruppen resp. Signalunterabschnitte eines Phonems resp. Signalabschnitts kann auch kleiner als 4 ms sein, wenn sie aus nur einer Signalperiode bestehen, sind sie in Ausnahmefällen auch grösser als 8 ms. the subsections are not repeatable in nature, but have a noise form. We also call the similar subsections groups, and in the case where the signal form of a phoneme is not repeatable in nature but has a noise form, we define as a group or Signal subsection, part of the signal section of a predetermined constant period of time. While speaking, each phoneme usually has a duration of 58 to 200 ms and each group a duration of 4 to 8 ms. The duration of the repeating groups resp. Signal subsections of a phoneme, respectively. Signal sections can also be less than 4 ms, if they consist of only one signal period, in exceptional cases they are also greater than 8 ms.
Die Gruppen resp. Unterabschnitte, welche jedes Phonem bilden, sind für dieselbe Person und denselben Intensitätsbereich des Sprechens unter sich ähnlich mit einer Variation ihrer Intensität. Die Intensität der Unterabschnitte innerhalb desselben Phonems beginnt bei einem bestimmten Wert, erreicht gewöhnlich ihren maximalen Wert bei der zweiten oder dritten Wiederholung des Unterabschnitts und vermindert sich danach gegen das Ende des Phonems, wo sie einen minimalen Wert erreicht. The groups resp. Sub-sections that make up each phoneme are similar for the same person and intensity range of speaking among themselves with a variation in their intensity. The intensity of the subsections within the same phoneme starts at a certain value, usually reaches its maximum value on the second or third repetition of the subsection, and then decreases towards the end of the phoneme, where it reaches a minimum value.
Diese Erkenntnis ermöglicht nun die Realisierung eines Sprachkodierungsverfahrens, welches sich durch den kennzei-chenden Teil des Anspruchs 1 auszeichnet. This knowledge now enables the implementation of a speech coding method, which is characterized by the characterizing part of claim 1.
Die Bildung des Phonems aus ähnlichen Gruppen ermöglicht es, ein Phonem aus dem AEÄS eines Unterabschnitts und Intensitätsdaten jedes Unterabschnitts, wie z.B. die maximale Intensität, das Integral der Intensität oder ein Teilintegral der Intensität, zu bestimmen. The formation of the phoneme from similar groups enables a phoneme from the AEÄS of a subsection and intensity data of each subsection, e.g. to determine the maximum intensity, the integral of the intensity or a partial integral of the intensity.
Gemäss vorliegender Erfindung wird für jedes Phonem ein Unterabschnitt abgetastet, die analogen Abtastwerte in digitale umgesetzt und weiter die Intensität jeder Gruppe resp. jedes Unterabschnitts GID oder bestimmter Gruppen digitalisiert GID. Zudem werden Daten bezüglich der Dauer jedes Unterabschnitts oder die Zahl der Unterabschnitte jedes Phonems sowie Phonemwechselzeichen bestimmt. Das Phonemwechselzeichen ist ein digitales Signal vorausbestimmter Form, welches die Daten jedes Phonems separiert. Während der Dekodierung der Stimme werden innerhalb der Dauer eines Phonems die Abtastdaten des abgetasteten Unterabschnitts fortwährend wiederholt und nach der Umsetzung in analoge Form wird die Intensität, entsprechend der Intensität, welche jeder Unterabschnitt bei der Kodierung hatte, ausgesteuert. Das so entstehende Verfahren ist viel einfacher als die bekannten und kann grösstenteils mit logischen Schaltkreisen realisiert werden. Die Bitzahl jeder Abtastung wird vermindert durch eine Intensitätsnormierung der Stimme, welche im weiteren als Ausgleich bezeichnet wird, in einer oder zwei Stufen. Im Fall zweier Stufen: According to the present invention, a subsection is scanned for each phoneme, the analog samples are converted into digital and the intensity of each group or. each subsection GID or certain groups digitizes GID. In addition, data regarding the duration of each subsection or the number of subsections of each phoneme as well as phoneme alternation characters are determined. The phoneme change character is a digital signal of a predetermined form which separates the data of each phoneme. During the decoding of the voice, the scanning data of the scanned subsection are continuously repeated within the duration of a phoneme, and after the conversion into analog form, the intensity is adjusted according to the intensity that each subsection had when coding. The resulting process is much simpler than the known one and can largely be implemented with logic circuits. The bit number of each scan is reduced by an intensity normalization of the voice, which is referred to hereinafter as compensation, in one or two steps. In the case of two stages:
a) Es wird eine teilweise Integration des AEÄS während einer Zeitdauer von mehreren Phonemen vorgenommen, was Bildung der Langzeitintensität genannt sei. a) The AEÄS is partially integrated over a period of several phonemes, which is called the formation of long-term intensity.
b) Durch einen Verstärker mit digital veränderbarer Verstärkung wird die Intensität des AEÄS mit/durch den digitalen Wert der Langzeitintensität der Stimme multipliziert oder dividiert, so dass ein AEÄS/LZ entsteht, wobei das Langzeitintegral während der Zeit mehrerer Phonemen eine konstanten Wert hat. b) By means of an amplifier with digitally variable amplification, the intensity of the AEÄS is multiplied or divided by / by the digital value of the long-term intensity of the voice, so that an AEÄS / LZ is created, the long-term integral having a constant value during the time of several phonemes.
Das AEÄS/LZ, welches durch die Multiplikation oder Division mit der Langzeitintensität entstanden ist, wird während der Dauer eines Phonems integriert, das Resultat als Phonemintensität bezeichnet. The AEÄS / LZ, which is the result of multiplication or division with the long-term intensity, is integrated during the duration of a phoneme, the result is called the phoneme intensity.
d) Durch einen zweiten Verstärker mit digital veränderbarer Verstärkung wird die Intensität des AEÄS/LZ mit/durch den digitalen Wert des Integrals während eines Phonems, also der Phonemintensität, multipliziert oder dividiert, wodurch das AEÄS/Ph entsteht, wobei die Phonemintensität im Intervall eines Phonems einen konstanten Wert hat. d) The intensity of the AEÄS / LZ is multiplied or divided by / by the digital value of the integral during a phoneme, i.e. the phoneme intensity, by a second amplifier with digitally variable amplification, whereby the AEÄS / Ph is produced, the phoneme intensity being in the interval of one Phonems has a constant value.
Im Fall einer Stufe werden a) und b) ausgelassen und direkt das AEÄS/Ph-Signal gebildet. Das dazu notwendige Integral über ein Phonem kann durch eine andere Intensitäts-grösse ersetzt werden. Um diesselbe Resultatsform bei einer Stufe zu erhalten, muss die digitale Umsetzung des Integrationsresultats bei einer Stufe eine Bitzahl haben, welche der Summe der Bitzahlen, welche bei zwei Stufen erhalten wird, gleichkommt. Die Abtastung wird in beiden Fällen vom AEÄS/Ph-Signal vorgenommen. In the case of a stage, a) and b) are omitted and the AEÄS / Ph signal is formed directly. The integral over a phoneme required for this can be replaced by another intensity variable. In order to obtain the same form of results in one stage, the digital implementation of the integration result in one stage must have a number of bits which is equal to the sum of the number of bits obtained in two stages. In both cases, the scanning is carried out by the AEÄS / Ph signal.
Der Kode jedes Phonems besteht aus : The code of each phoneme consists of:
a) dem Phonemwechselzeichen, welches z.B. aus neun «1» und einer «0» oder neun «0» und einer «1» besteht (8-10 Bit pro Phonem). a) the phoneme change character, which e.g. consists of nine «1» and one «0» or nine «0» and one «1» (8-10 bits per phoneme).
b) den digitalen Daten der Phonemintensität PhlD (4 Bit pro Phonem) für eine Ausgleichsstufe oder den digitalen Daten der Langzeitintensität (2-3 Bit pro Phonem) und den digitalen Daten der Phonemintensität PhlD (1-3 Bit pro Phonem) bei zwei Ausgleichsstufen. b) the digital data of the phoneme intensity PhID (4 bits per phoneme) for an equalization level or the digital data of the long-term intensity (2-3 bits per phoneme) and the digital data of the phoneme intensity PhID (1-3 bits per phoneme) with two equalization levels.
c) den Daten der Anzahl Abtastungen eines Unterabschnitts oder Unterabschnitt-Zahl des Phonems (6 Bit Pro Phonem). c) the data of the number of samples of a subsection or subsection number of the phoneme (6 bits per phoneme).
d) den digitalen Daten der Abtastwerte eines Unterabschnitts (4 Bit pro Abtastung oder 230 Bit pro Phonem für 8 ms Gruppen). d) the digital data of the samples of a subsection (4 bits per sample or 230 bits per phoneme for 8 ms groups).
5 5
10 10th
15 15
20 20th
25 25th
30 30th
35 35
40 40
45 45
50 50
55 55
60 60
65 65
639 218 639 218
4 4th
e) den Daten der Unterabschnittsintensität GID (2 Bit pro d) den digitalen Daten der Abtastung eines Teils des e) the data of subsection intensity GID (2 bits per d) the digital data of the scanning of a part of the
1 oder 2 Gruppen). Unterabschnitts innerhalb einer bestimmten Zeit (z.B. 2 ms) 1 or 2 groups). Subsection within a certain time (e.g. 2 ms)
Die angegebenen Bitzahlen für obengenannte Daten des für den Bereich II. Die Zahl der Abtastungen ist immer fest Kodes sind rein indikativ und können je nach der benötigten bestimmt (z.B. 12-16 Bit). The specified number of bits for the above-mentioned data for area II. The number of samples is always fixed. Codes are purely indicative and can be determined depending on the one required (e.g. 12-16 bits).
Qualität der Stimme und der maximalen zulässigen Frequenz 5 e) den Daten des Teilintegrals der Intensität der übrigen geändert werden. Teile des abgetasteten Unterabschnitts. Die Zahl dieser Teile Quality of the voice and the maximum permissible frequency 5 e) the data of the partial integral of the intensity of the others are changed. Parts of the scanned subsection. The number of these parts
Die Daten des kodierten Phonems werden seriell in Spei- wird immer, z.B. 4, konstant festgelegt und für kleinere Unter-cher geordnet und mit einer bestimmten Verzögerung, z.B. abschnitte die nicht existierenden Teile als existierende mit The data of the encoded phoneme are always stored in series, e.g. 4, fixed and ordered for smaller subjects and with a certain delay, e.g. sections with the non-existing parts as existing
200-300 Bit, gespeichert oder für weitere Bearbeitung oder der Intensität 0 betrachtet. 200-300 bits, saved or viewed for further processing or intensity 0.
Übertragung weitergeleitet. to f) den digitalen Daten der Abtastung eines Unterab- Transfer forwarded. to f) the digital data of the sampling of a sub-
Für die Dekodierung der Stimme wird erst eine Ordnung schnitts, z.B. des vierten, im Bereich I (4 Bit pro Abtastung der Kodierdaten vorgenommen und deren Eintragung in ent- oder für Gruppenlänge 8 ms ca. 58 Bit). An order is first cut for the decoding of the voice, e.g. the fourth, in area I (4 bits per scan of the coding data and their entry in or for group length 8 ms approx. 58 bits).
sprechende Speicher oder Schieberegister. g) den Daten der Intensität der Unterabschnitte des speaking memories or shift registers. g) the data of the intensity of the subsections of the
Die digitalen Daten der Abtastung des Unterabschnittes Bereichs I und des Bereichs II (2 Bit für jeden Bereich je werden in fortlaufender Wiederholung abgegeben, so lang wie 15 Unterabschnitt oder je zwei Unterabschnitte). The digital data of the scanning of the subsection area I and the area II (2 bits for each area are delivered in continuous repetition, as long as 15 subsections or two subsections each).
die Dauer des Phonems ist. Durch einen Digital/Analog- Die Daten a) bis e) haben immer konstante Bitzahlen. Die is the duration of the phoneme. Through a digital / analog data a) to e) always have constant bit numbers. The
Wandler, im weitern mit DAC abgekürzt, werden diese Daten Ausgleiche, um das AEÄS/Ph-Signal zu erhalten, können in das AEÄS/G des Unterabschnitts, welcher abgetastet auch vor der Teilung des Frequenzbandes in zwei Bereiche wurde, umgesetzt, das nur innerhalb eines Unterabschnitts erfolgen, wobei der umgekehrte Ausgleich resp. Modulation Änderungen aufweist. 20 bei der Dekodierung nach der Zusammensetzung erfolgen Transducers, further abbreviated to DAC, these data compensations to obtain the AEÄS / Ph signal can be converted into the AEÄS / G of the subsection, which was also sampled before the division of the frequency band into two areas, which is only within a subsection, with the reverse compensation or. Modulation exhibits changes. 20 when decoding according to the composition
Über einen Verstärker, dessen Verstärkung sich digital muss. Via an amplifier whose amplification must be digital.
nach den Daten der jeweiligen Unterabschnitts-Intensität Die Daten der Kodierung werden wie folgt im Speicher according to the data of the respective subsection intensity The data of the coding are stored in the memory as follows
ändert, wird das AEÄS/G dividiert oder multipliziert, so dass geordnet: changes, the AEÄS / G is divided or multiplied so that:
ein AEÄS/Ph entsteht, welches Änderungen nur innerhalb des Erst das Phonemwechselzeichen und folgend alle Daten, Intervalls eines Phonems hat. Das AEÄS/Ph wird zu dem Ein- 25 welche feste Bitzahlen haben, von b) bis e), immer nach dersel-gang eines zweiten Verstärkers geführt, dessen Verstärkung ben Reihenfolge. Die Reihenfolge der Ordnung spielt keine mit den digitalen Daten der Phonemintensität PhlD dividiert Rolle. Es folgen die Abtastdaten des Bereiches I, z.B. des vier-oder multipliziert wird, und für den Fall einer Stufe das ten Unterabschnitts und am Schluss die Daten der Unterab- an AEÄS / Ph arises, which changes only within the first the phoneme change character and then all data, intervals of a phoneme. The AEÄS / Ph is always led to the input with fixed bit numbers, from b) to e), after the same gear of a second amplifier, the amplification of which follows the order. The order of the order is irrelevant to the digital data of the phoneme intensity PhID. The scan data of area I follow, e.g. of the four or is multiplied, and in the case of a stage the th subsection and finally the data of the subsection
ursprüngliche AEÄS ergibt. Für den Fall zweier Stufen liegt schnitts-Intensitäten. Die Daten werden mit einer minimalen das AEÄS/LZ vor, welches über einen dritten, mit dem ersten 30 Verzögerung m zwischen 100 und 300 Bit abgegeben, und zweiten Verstärker ähnlichen Verstärker durch Dividieren Die Dekodierung der Stimme für den Bereich I erfolgt wie oder Multiplizieren das ursprüngliche AEÄS ergibt. Die Rei- beschrieben auf Seite 5, Zeile 18 bis Zeile 28. Bei der Ordnung henfolge der umgekehrten Àusgleiche resp. Modulationen der der Daten aber werden die des Bereichs I, von denen des drei AEÄS spielt keine Rolle, und es kann z.B. erst der zweite, Bereichs II nach der Reihenfolge gesondert, nach der diese bei dann der erste Verstärker verwendet werden. 35 der Kodierung geordnet waren. Ebenfalls werden bei der original AEÄS results. In the case of two stages there are cutting intensities. The data are presented with a minimal AEÄS / LZ, which is output via a third, with the first 30 delay m between 100 and 300 bits, and second amplifier-like amplifier by dividing. The decoding of the voice for area I is done as or multiplying that original AEÄS results. The travel is described on page 5, line 18 to line 28. When ordering the reverse equilibrium resp. However, modulations of the data become those of area I, of which the three AEÄS does not matter, and e.g. only the second, area II separately according to the order in which they are then used in the first amplifier. 35 of the coding were ordered. Also at the
Eine noch weitere Verminderung der Bitzahl pro Gruppe Unterabschnitts-Intensität die zwei ersten Bit für den einen resp. Unterabschnitt, also auch der Bitzahl pro Phonem, kann Frequenzbereich und die zweiten zwei Bit für den anderen dadurch erreicht werden, dass das Frequenzband der Stimme Frequenzbereich vorgesehen. Für den Bereich II werden die in zwei Bereiche geteilt und jeder Bereich separat kodiert wird. Abtastdaten des ersten Teils des Unterabschnitts in dauernder Die Dekodierung geschieht ebenfalls separat für jeden Bereich 40 Wiederholung abgegeben, solang das Phonem dauert und über und es folgt die Zusammensetzung der zwei Bereiche zu dem einen DAC in analoge Form umgesetzt. Es folgt der umge-AEÄS/Ph nach der Digital/Analog-Umsetzung und nach den kehrte Ausgleich durch einen Verstärker mit steuerbarer VerAusgleichen. Die Kodierung der Stimme in diesem Fall wird Stärkung, nach Seite 5, Zeile 30 bis Seite 6, Zeile 9 entspre-wie folgt vorgenommen: chend den Daten der übrigen Teile des Unterabschnitts. Die- A further reduction in the number of bits per group subsection intensity the first two bits for the one. Sub-section, ie also the number of bits per phoneme, frequency range and the second two bits for the other can be achieved by providing the frequency band of the voice frequency range. For area II they are divided into two areas and each area is coded separately. Sampling data of the first part of the subsection in continuous. The decoding is likewise carried out separately for each area 40 repetitions, as long as the phoneme lasts and over and there follows the composition of the two areas to the one DAC converted into analog form. This is followed by the reverse AEÄS / Ph after the digital / analog conversion and after the return compensation by an amplifier with controllable compensation. The coding of the voice in this case is strengthened, according to page 5, line 30 to page 6, line 9, as follows: according to the data of the other parts of the subsection. The-
Das Frequenzband der Stimme wird durch zwei Filter in 45 ser umgekehrte Ausgleich resp. diese Modulation wird für den Bereich I, welcher die niedrigen Frequenzen unter jeden Unterabschnitt wiederholt, mit Hilfe der Angaben über The frequency band of the voice is equalized by two filters in 45 ser inverse compensation. this modulation is performed for area I, which repeats the low frequencies under each subsection, using the information on
1/b fmax durchlässt, wo am geeignetsten b zwischen 3 und 5 ist die Unterabschnittlänge, die vom Bereich I gegeben wird. Das und in den Bereich II, wo die Frequenz 1/b fmax bis fmax durch- AEÄS/GII, welches von diesem Ausgleich resultiert, wird gelassen werden, aufgeteilt. Der Bereich I wird, wie auf Seite über einen zweiten Verstärker zum Signal AEÄS/Phll gemäss 3, Zeile 1 bis Seite 3, Zeile 31 beschrieben wurde, kodiert, aber 50 den zwei übrigen Bit der Unterabschnitts-Intensität ausgegli-mit b mal grösseren Abtastintervallen. Im Bereich II nach den chen resp. moduliert so wie im Bereich I. Durch einen dritten Ausgleichen nach Seite 3, Zeile 33 bis Seite 4, Zeile 19, wird Verstärker wird das AEÄS/Phll-Signal zum ursprünglichen der Unterabschnitt, der im Bereich I abgetastet wurde, in Zeit- AEÄS des Bereichs II ausgeglichen resp. moduliert. Durch intervalle von ca. 2 ms geteilt und das erste Zeitintervall mit ei- Zusammensetzung der AEÄS-Signale der zwei Bereiche wird ner Abtastzeit etwas kleiner als 1/2 fmax abgetastet, die Abtast- 55 am Schluss das ursprüngliche AEÄS-Signal gebildet. Die Bitwerte dann digitalisiert. Durch ein System teilweiser Integra- zahl pro Phonem ist ca. die Hälfte der benötigten Bit gegen-tion der übrigen Teile dieses Unterabschnittes und Umsetzung über der Kodierung in einem Frequenzbereich. 1 / b passes fmax, where most suitable b between 3 and 5 is the subsection length given by area I. That and divided into area II, where the frequency 1 / b fmax to fmax by AEÄS / GII, which results from this compensation, will be left. The area I is coded as described on the page using a second amplifier for the signal AEÄS / Phll according to 3, line 1 to page 3, line 31, but 50 the two remaining bits of the subsection intensity are compensated with sampling intervals that are b times larger . In area II according to the chen resp. modulated as in area I. By a third equalization according to page 3, line 33 to page 4, line 19, the AEÄS / Phll signal becomes the original subsection, which was sampled in area I, in time AEÄS des Area II balanced or modulated. Divided by intervals of approx. 2 ms and the first time interval with a composition of the AEÄS signals of the two areas is sampled in a sampling time somewhat less than 1/2 fmax, the sampling 55 finally forms the original AEÄS signal. The bit values are then digitized. By means of a system of partial integers per phoneme, approximately half of the bits required are in opposition to the remaining parts of this subsection and implemented via the coding in a frequency range.
des Wertes der Integration in digitale Form werden die digita- Die Erfindung wird anschliessend beispielsweise anhand len Daten der übrigen Zeitintervalle dieses Unterabschnitts zweier Figuren erläutert. The value of the integration into digital form is then explained. The invention is then explained, for example, using the data of the remaining time intervals of this subsection of two figures.
erhalten. so Es zeigen: receive. so it show:
Im Fall der zwei Frequenzbereiche besteht der Kode eines Fig. 1 anhand eines Blockdiagramms eine Sprachkodie-Phonems aus: rungsVorrichtung zur Erläuterung des Verfahrens, In the case of the two frequency ranges, the code of FIG. 1 consists of a speech code phoneme based on a block diagram: device for explaining the method,
a) dem Phonemwechselzeichen (8-10 Bit). Fig. 2 anhand eines Blockdiagramms eine Vorrichtung zur b) der Gruppenlänge, d.h. den Daten der Anzahl Abtastun- Sprachdekodierung entsprechend dem Verfahren. a) the phoneme change character (8-10 bits). Fig. 2 is a block diagram showing a device for b) the group length, i.e. the data of the number of sampling speech decoding according to the method.
gen des Unterabschnitts im Bereich I oder der Anzahl Unter- 65 In Fig. 1 ist als Beispiel ein Kodierungsverfahren für die abschnitte des Phonems (6 Bit). Stimme (Vocoder) entsprechend der vorliegenden Erfindung c) den Daten der Phonemintensität für jeden Bereich (4 in einem Frequenzbereich und mit einer Ausgleichsstufe Bit). anhand eines Blockdiagrammes dargestellt. Der Integrator Ini of the subsection in area I or the number of subsections. In FIG. 1 there is an example of a coding method for the sections of the phoneme (6 bits). Voice (vocoder) according to the present invention c) the data of the phoneme intensity for each range (4 in a frequency range and with an equalization level bit). represented by a block diagram. The integrator Ini
5 5
639 218 639 218
macht eineTeilintegration über die ersten (m - 1) Unterabschnitte des AEÄS Signals, das Resultat wird über einen Ana-log/Digital-Wandler ADC2 für die Dauer eines Phonems gespeichert. Mit diesem Wert (Phonemintensität resp. Signal-abschnitts-Intensität) wird digital die Verstärkung eines Verstärkers VI verstellt, an dessen Eingang das AEÄS-Signal zugeführt wird. Durch die Änderung der Verstärkung wird am Ausgang des Verstärkers VI das AEÄS/Ph-Signal erzeugt, dessen Normierungsgrösse, das Resultat der Integration an Ini während der Zeit eines Phonems einen konstanten Wert hat, gebildet. makes a partial integration over the first (m - 1) subsections of the AEÄS signal, the result is stored via an analog-to-digital converter ADC2 for the duration of a phoneme. This value (phoneme intensity or signal section intensity) is used to digitally adjust the gain of an amplifier VI, at whose input the AEÄS signal is fed. By changing the gain, the AEÄS / Ph signal is generated at the output of the amplifier VI, the normalization variable, the result of the integration at Ini during the time of a phoneme, has a constant value.
Ein Tiefpassfilter Fl am Ausgang des Verstärkers VI lässt die Frequenzen, welche grösser sind als die maximale Frequenz fmax, die bei der Kodierung enthalten ist, nicht durch. Ein AD-Wandler ADC1 setzt das AEÄS/Ph-Signal am Ausgang des Tiefpassfilters Fl in digitale Form um. In Zeitintervallen Td, welche als Abtastintervalle zu betrachten sind, werden die momentanen Werte an den Ausgängen Q1 ... Q4 des AD-Wandlers ADC1 über die Eingänge 1 ... 4 in einem Schieberegister SRI gespeichert. Die Zeit Td ist etwas kleiner als 1/2 fmax. Ein Integrator In2 führt eine Integration des AEÄS/Ph-Signals über einen oder zwei Unterabschnitte durch, das Resultat wird durch einen weiteren AD-Wandler ADC3 mit parallelen Ausgängen Q1 und Q2 in digitale Form umgesetzt und je für einen oder zwei Unterabschnitte im Schieberegister SR2 über desen Paralleleingänge 1 und 2 für die entsprechende Zeit gespeichert (Unterabschnitts-Intensi-tätsdaten GID). A low-pass filter F1 at the output of the amplifier VI does not let through the frequencies which are greater than the maximum frequency fmax which is contained in the coding. An AD converter ADC1 converts the AEÄS / Ph signal at the output of the low-pass filter F1 into digital form. At time intervals Td, which are to be regarded as sampling intervals, the instantaneous values at the outputs Q1 ... Q4 of the AD converter ADC1 are stored in a shift register SRI via the inputs 1 ... 4. The time Td is slightly less than 1/2 fmax. An integrator In2 integrates the AEÄS / Ph signal over one or two subsections, the result is converted into digital form by another AD converter ADC3 with parallel outputs Q1 and Q2 and each for one or two subsections in the shift register SR2 whose parallel inputs 1 and 2 are stored for the corresponding time (subsection intensity data GID).
Eine Schaltung GW für die Anzeige des Unterabschnittwechsels erzeugt am Anfang jedes Unterabschnitts einen Impuls G-I. Wenn keine Unterabschnitte erkennbar sind, erzeugt diese Schaltung GW einen Impuls in bestimmten Zeitintervallen, z.B. zwischen 8 und 9 ms (siehe Seite 2, Zeile 12). Falls die sich wiederholenden Unterabschnitte kleiner als 4 ms sind, erzeugt die Schaltung GW einen Impuls für jeden zweiten Unterabschnitt. Der Unterabschnittswechsel wird durch einen Ladestromimpuls an einem Kondensator erkannt, wenn er über eine Diode von AEÄS/Ph-Signal geladen wird. Dieser Kondensator wird durch einen Widerstand während jedem Unterabschnitt wieder leicht entladen. Der Impuls G-I fällt immer zusammen mit dem Anfang einer Periode TE des Ausgangssystems. Der Unterabschnittswechsel wird viel schärfer erkennbar, wenn er vom AEÄS-Signal über einen Verstärker, dessen Verstärkung analog mit der Eingangsspannung variiert wird oder über einen Exponentialverstärker detektiert wird. In diesem Fall ist es zweckmässig, anstelle des Integrals für den Ausgleich des AEÄS-Signals den Maximalwert letzterwähnten Signals zu benützen. A circuit GW for indicating the change of subsection generates a pulse G-I at the beginning of each subsection. If no subsections are recognizable, this circuit GW generates a pulse at certain time intervals, e.g. between 8 and 9 ms (see page 2, line 12). If the repeating subsections are less than 4 ms, the circuit GW generates a pulse for every second subsection. The change of subsection is recognized by a charging current pulse on a capacitor when it is charged via a diode of AEÄS / Ph signal. This capacitor is easily discharged through a resistor during each subsection. The pulse G-I always coincides with the beginning of a period TE of the output system. The change in subsection is much more clearly recognizable if it is detected by the AEÄS signal via an amplifier, the amplification of which is varied analogously with the input voltage, or via an exponential amplifier. In this case it is expedient to use the maximum value of the last-mentioned signal instead of the integral for the compensation of the AEÄS signal.
Eine Phonemwechselschaltung PhW gibt in Verbindung mit der Schaltung GW und einer Zentraleinheit CUI (siehe Seite 13, Zeile 21 ; S. 14, Zeile 8) einen Phonemwechselimpuls Ph-I bei jedem Phonemwechsel ab. Die Funktion dieser Schaltung basiert auf der Korrelation zwischen zwei sich folgenden Gruppen resp. Unterabschnitten. Die Abtastdaten jedes Unterabschnitts vom Schieberegister SRI erscheinen an seinen Ausgängen Q1 ... Q4 und werden an Eingängen DI in den Speicher der Schaltung PhW geladen, bis die Korrelation mit den Abtastdaten der nächsten Gruppe resp. des nächsten Unterabschnittes stattgefunden hat. Für die Korrelation wird der analoge Wert jeder Abtastung eines Unterabschnitts mit dem digitalen Wert der entsprechenden Abtastung des vorherigen Unterabschnitts, die um dieselbe Zeitdauer von seinem Anfang entfernt war, multipliziert. Diese Multiplikation wird von einem digital steuerbaren Verstärker ausgeführt, dessen Verstärkung durch die Daten im Speicher der Schaltung PhW geändert wird. Danach werden diese Produktresultate addiert und das Summenresultat durch die Produktanzahl dividiert, was einen Maximalwert ergibt, solange sich die Unterabschnitte ähnlich sind. Eine plötzliche Verminderung des Summenwertes zeigt einen Phonemwechsel an, worauf der Phonemwechselimpuls Ph-I erzeugt wird. Der Ph-I-Impuls wird somit am Ende des ersten Unterabschnittes eines Phonems erzeugt, wenn die Korrelation zwischen ihm und dem letzten Unterabschnitt des vorherigen Phonems zu Ende ist. Der Phonemwechselimpuls Ph-I wird immer zusammen mit einem Unterabschnittswechselimpuls G-I erzeugt. A phoneme change circuit PhW in connection with the circuit GW and a central processing unit CUI (see page 13, line 21; page 14, line 8) emits a phoneme change pulse Ph-I with each phoneme change. The function of this circuit is based on the correlation between two successive groups. Subsections. The sample data of each subsection from the shift register SRI appear at its outputs Q1 ... Q4 and are loaded at inputs DI into the memory of the circuit PhW until the correlation with the sample data of the next group or. of the next subsection. For correlation, the analog value of each scan of a subsection is multiplied by the digital value of the corresponding scan of the previous subsection that was the same amount of time from its beginning. This multiplication is carried out by a digitally controllable amplifier, the gain of which is changed by the data in the memory of the circuit PhW. Then these product results are added and the total result divided by the number of products, which gives a maximum value as long as the subsections are similar. A sudden decrease in the total value indicates a phoneme change, whereupon the phoneme change pulse Ph-I is generated. The Ph-I pulse is thus generated at the end of the first subsection of a phoneme when the correlation between it and the last subsection of the previous phoneme has ended. The phoneme change pulse Ph-I is always generated together with a subsection change pulse G-I.
Die Abtastdaten des n-ten Unterabschnitts (z.B. n = 4) werden vom Serienausgang Q1 des Schieberegisters SRI in einen Speicher Ml (z.B. 256 Bit) über seinen Dateneingang DI eingetragen und die Anzahl der Abtastungen an diesem Unterabschnitt wird an der Zentraleinheit CUI behalten (siehe Seite 13, Zeile 22) und während des Wechsels des Unterabschnitts zu n + 1 an den ersten Paralleleingängen DI eines Schieberegisters SR3 eingetragen. Die nächsten Eingänge DI des Schieberegisters SR3 sind mit den parallelen Ausgängen Q1 ... Q4 der Speicherschaltung 4FF1 verbunden, um die Phonemintensität einzutragen. Der folgende Eingang ist mit — Vss der Stromversorgung und die übrigen Eingänge mit + VDD der Stromversorgung verbunden, um die 8 bis 10 Bit für das Phonemwechsel-zeichen einzutragen. Falls die Vorschub-Taktimpulse Tj des Schieberegisters SR3 verzögert beginnen, kann die Anzahl seiner Eingänge, welche auf « 1 » für ds Phonemwechselzeichen gesetzt sind, entsprechend vermindert werden. The scanning data of the nth subsection (e.g. n = 4) are entered by the serial output Q1 of the shift register SRI into a memory Ml (e.g. 256 bit) via its data input DI and the number of scans on this subsection is kept at the central unit CUI (see Page 13, line 22) and during the change of the subsection to n + 1 at the first parallel inputs DI of a shift register SR3. The next inputs DI of the shift register SR3 are connected to the parallel outputs Q1 ... Q4 of the memory circuit 4FF1 in order to enter the phoneme intensity. The following input is connected to - Vss of the power supply and the other inputs to + VDD of the power supply in order to enter the 8 to 10 bits for the phoneme change character. If the feed clock pulses Tj of the shift register SR3 start with a delay, the number of its inputs which are set to “1” for the phoneme change character can be reduced accordingly.
Alle Daten, die im Schieberegister SR3 und im Speicher Ml eingetragen sind, und die, welche nach dem Unterabschnitt n im Schieberegister SR2 eingetragen werden, werden mit Beginn des n + 1-ten Unterabschnitts und bis zum Phonemende in den Speicher M2 (z.B. 512 Bit) geschrieben. Die Daten der folgenden Phoneme werden aufeinanderfolgend im Speicher M2 eingetragen, bis dieser vollgeschrieben ist, wonach die übrigen Eintragungen im Zyklus von Beginn an fortgesetzt eingetragen werden, durch Löschen der vorherigen Daten. Ein elektronischer Schalter ES verbindet vom n+ 1-ten Unterabschnitt ab dem Dateneingang DI des Speichers M2 erst mit dem Ausgang DO des Schieberegisters SR3 folgend mit dem Datenausgang DO des Speichers Ml und am Schluss mit dem Datenausgang DO des Schieberegisters SR2 und nacheinander das Phonemwechselzeichen, die Daten der Phonemintensität, die Zahl der Abtastungen, welche eine feste Bitzahl hat, dann die Abtastdaten des Unterabschnitts n und am Schluss die Unterabschnittsintensitäten einzutragen. All data that are entered in the shift register SR3 and in the memory M1 and that which are entered after the subsection n in the shift register SR2 are stored in the memory M2 at the beginning of the n + 1th subsection and until the end of the phoneme (for example 512 bits ) written. The data of the following phonemes are entered successively in the memory M2 until it is full, after which the remaining entries in the cycle are continued from the beginning by deleting the previous data. An electronic switch ES connects the n + 1-th subsection from the data input DI of the memory M2 first to the output DO of the shift register SR3, then to the data output DO of the memory Ml and finally to the data output DO of the shift register SR2 and in succession the phoneme change character Enter the data of the phoneme intensity, the number of samples which has a fixed number of bits, then the sample data of subsection n and finally the subsection intensities.
Die ganze Steuerung des Eintragens der Daten für Phonemwechsel, Phonemintensität, Zahl der Abtastungen, Abtastdaten und Unterabschnittsintensitätsdaten in den Speichern 4FF1, Ml, den Schieberegistern SRI, SR2 und SR3 und folgend im Speicher M2, sowie die verschiedenen Taktimpulse Cl und die programmierten Impulse T; für die Ein- und Ausgabe der Daten an den verschiedenen Schaltkreisen und das Zählen der Unterabschnitte, wird von der Zentraleinheit CUI ausgeführt. Die Zentraleinheit CUI gibt ebenfalls die Adressen für das Schreiben und Lesen an den Speichern Ml und M2 an. Die Zentraleinheit CUI hat eine Zähleinheit, welche die Differenz der Leseadressen von den Schreibadressen steuert (siehe Seite 5, Zeilen 13-16 bis Seite 14, Zeile 14). All control of the entry of the data for phoneme change, phoneme intensity, number of samples, sample data and subsection intensity data in the memories 4FF1, Ml, the shift registers SRI, SR2 and SR3 and subsequently in the memory M2, as well as the various clock pulses Cl and the programmed pulses T; For the input and output of the data on the various circuits and the counting of the subsections, is carried out by the central processing unit CUI. The central unit CUI also specifies the addresses for writing and reading in the memories M1 and M2. The central processing unit CUI has a counting unit which controls the difference between the read addresses and the write addresses (see page 5, lines 13-16 to page 14, line 14).
Die Zentraleinheit CUI kann einen Mikroprozessor umfassen oder aus integrierten Schaltkreises eines Oszillators, Zählern, eines voreinstellbaren Vor- und Rückwärtszählers und Gattern bestehen, welche auf bekannte Art und Weise die nötigen Befehle erzeugen. Die Impulse G-I und Ph-I geben an die Zentraleinheit CUI die Gruppenwechsel- resp. Unterab-schnittswechsel- und Phonemwechsel-Information. The central unit CUI can comprise a microprocessor or consist of an integrated circuit of an oscillator, counters, a presettable up and down counter and gates, which generate the necessary commands in a known manner. The pulses G-I and Ph-I give the central unit CUI the group change resp. Subsection change and phoneme change information.
Der Speicher M2 wird mit der Frequenz fE gelesen, welche die Datenausgangsfrequenz ist. Das Lesen findet immer zwischen zwei Schreibeoperationen statt, so dass niemals Schreibund Lesebefehl gleichzeitig ausgeführt werden. Das Lesen findet mit einer Verzögerung von mehr als m Bit vom Schreiben The memory M2 is read at the frequency fE, which is the data output frequency. Reading always takes place between two write operations, so that write and read commands are never executed simultaneously. Reading takes place with a delay of more than m bits from writing
5 5
10 10th
15 15
20 20th
25 25th
30 30th
35 35
40 40
45 45
50 50
55 55
60 60
65 65
639 218 639 218
6 6
(z.B. m = 256 Bit) statt. Die Zentraleinheit CU 1 gibt die Leseadressen am Speicher M2 während der Lesezeit ab, während der übrigen Zeit die Schreibeadressen. (e.g. m = 256 bit) instead. The central unit CU 1 outputs the read addresses to the memory M2 during the read time, and the write addresses during the remaining time.
Die Ausgangssteuerung AR umfasst ein Flipflop, ein Schieberegister und ein 8 Eingangs-NAND-Gatter und gibt seriell am Datenausgang SDO des Systems die Daten des Speichers M2 ab. Wenn ein Phonemwechsel kommt, mit den sieben nacheinanderfolgenden « 1 », gibt die Ausgangssteuerung AR an die Zentraleinheit CUI ein «1 »-Signal. Falls die Differenz der Leseadressen von den Schreibadressen kleiner als m wird, dann stoppt dieses « 1 »-Signal der Ausgangssteuerung AR über die Zentraleinheit CUI das Lesen des Speichers M2, bis die Differenz wieder grösser als m wird, während die Ausgangssteuerung AR dauernd « 1 » abgibt, bis zum Wiederbeginn des Lesens. The output control AR comprises a flip-flop, a shift register and an 8 input NAND gate and outputs the data of the memory M2 in series at the data output SDO of the system. When there is a change of phoneme with the seven consecutive “1”, the output control AR sends a “1” signal to the central unit CUI. If the difference between the read addresses and the write addresses is less than m, then this “1” signal from the output control AR via the central unit CUI stops reading the memory M2 until the difference becomes greater than m again, while the output control AR continuously “1 »Gives up until reading starts again.
Im Falle, wo die Zentraleinheit CUI einen Mikroprozessor umfasst, mit Wortlänge a Bit, die AD-Wandler ADC1 und ADC2 a-Bit-Wandler sind, und der AD-Wandler ADC3 a/2-Bit-Wandler sind, können die Speicher Ml und M2 mit a parallelen 1- und Ausgängen organisiert sein und die Ausgangssteuerung AR wird anstelle des Flipflops ein zusätzliches Schieberegister aufweisen, mit a parallelen Eingängen und einem Serieausgang für die Serieausgabe der Daten des Systems. In the case where the central processing unit CUI comprises a microprocessor with a word length a bit, the AD converters ADC1 and ADC2 are a-bit converters and the AD converter ADC3 are a / 2-bit converters, the memories M1 and M2 be organized with a parallel 1 and outputs and the output control AR will have an additional shift register instead of the flip-flop, with a parallel inputs and a series output for the series output of the data of the system.
Figur 2 zeigt ein Blockdiagramm eines entsprechenden Dekodierungssystems. Die Datender kodierten Sprache werden erst in ein Schieberegister SR4 geführt, welches das Phonemwechselzeichen detektiert. Wenn mehr als sieben aufeinander folgende « 1 » vorliegen und dann das erste «0» auftritt, wird dies als Beginnzeichen eines neues Phonems resp. Signalabschnitts interpretiert. Die Abschnittsintensitätsdaten und die Unterabschnittslängendaten, welche auf das «0» folgen, werden in ein Schieberegister SR5 eingetragen. Dann werden die Abtastdaten, deren Anzahl durch die Unterabschnittslängendaten im Schieberegister SR5 gegeben ist, abwechselnd für jedes Phonem resp. jeden Signalabschnitt in Speicher M3 und M4 geschrieben. Nach der Vollendung des Einschreibens der Anzahl Abtastungen werden die Unterabschnittsintensitätsdaten abwechselnd in zwei Speicher M5 und M6 eingetragen, bis das Phonemwechselzeichen erscheint. Durch das Eintragen über ein Schieberegister SR6 entsteht eine Verzögerung von sieben Bit, welche das Eintragen der ersten sieben « 1 » des Phonemswechselzeichens verhindert. Die Speicher M3, M4, M5 und M6 können separate Speicher sein, oder es kann ein Speicher für M3 und M4 sowie ein Speicher für M5 und M6 vorgesehen sein, wo M3, M4 bzw. M5 und M6 Teile eines Speichers mit bestimmten Adressen sind. Figure 2 shows a block diagram of a corresponding decoding system. The data of the encoded language are first fed into a shift register SR4, which detects the phoneme change character. If there are more than seven consecutive "1" and then the first "0" occurs, this is the beginning of a new phoneme or. Interpreted signal section. The section intensity data and the subsection length data that follow the “0” are entered in a shift register SR5. Then the sampling data, the number of which is given by the subsection length data in the shift register SR5, is alternately for each phoneme. each signal section is written in memories M3 and M4. After the completion of the writing of the number of samples, the subsection intensity data are alternately entered in two memories M5 and M6 until the phoneme change sign appears. The entry via a shift register SR6 creates a delay of seven bits, which prevents the entry of the first seven «1» of the phoneme change character. The memories M3, M4, M5 and M6 can be separate memories, or a memory for M3 and M4 and a memory for M5 and M6 can be provided, where M3, M4 or M5 and M6 are parts of a memory with specific addresses.
Nach dem Eintragen der Abtastdaten werden die Abschnitts- resp. Phonemintensitätsdaten in eine Datenspeicherschaltung, z.B. ein mehrfaches Flipflop 4FF2 umgeschrieben und die Daten der Anzahl Abtastungen in einer Datenspeicherschaltung gespeichert oder an einem voreinstellbaren Vor- und Rückwärtszähler innerhalb der Zentraleinheit einge-5 stellt und bis zum Einschreiben der Daten des nächsten Abschnitts resp. Phonems beibehalten. Wenn die Abtastdaten in den Speichern M3 resp. M4 eingetragen sind, beginnt das Lesen in aufeinanderfolgenden Zyklen. Die im Schieberegister SR5 gespeicherte Anzahl Abtastungen gibt der Zentraleinheit io CU2 (siehe Seite 17 ab Zeile 14) die Daten für Länge der Wiederholung des genannten Zyklus. Der Ausgang des Speichers M3 oder M4 gibt, parallel, über das Schieberegister SR7 die digitalen Daten jeder Abtastung an eine Datenspeicherschaltung 4FF3. Ein DA-Wandler DAC1 setzt die digitalen Daten 15 der Abtastungen in analoge Signale um, und für jeden Abtastzyklus wird das so entstandene AEÄS-/G-Signal des Unterabschnitts nwiederholt. After entering the scan data, the section resp. Phoneme intensity data into a data storage circuit, e.g. a multiple flip-flop 4FF2 rewritten and the data of the number of samples stored in a data storage circuit or set on a presettable up and down counter within the central unit and until the data of the next section or. Preserve phonems. If the sample data in the memories M3 or. M4 are entered, reading begins in successive cycles. The number of samples stored in the shift register SR5 gives the central unit io CU2 (see page 17 from line 14) the data for the length of the repetition of the cycle mentioned. The output of the memory M3 or M4 gives, in parallel, the digital data of each scan to a data storage circuit 4FF3 via the shift register SR7. A DA converter DAC1 converts the digital data 15 of the samples into analog signals, and the AEÄS / G signal of the subsection n thus created is repeated for each sampling cycle.
Nach einem Tiefpassfilter F2 wird das analoge Signal AEÄS/G zum Eingang eines Verstärkers V2 geführt, dessen 20 Verstärkung durch die Daten der Unterabschnittsintensitäten, welche in den Speichern M5 oder M6 eingetragen sind, digital verändert wird. Ein Schieberegister SR8 gibt die Daten der jeweiligen Unterabschnitts-Intensität parallel an einen Schaltkreis 2FF1, welcher diese während der Dauer einer oder 25 zweier Unterabschnitte behält. Am Ausgang des Verstärkers V2 erscheint das AEÄS/Ph-Signal, welches über einen zweiten Verstärker V3 geführt, dessen Verstärkung digital durch die Phonem- resp. Abschnitts-Intensitätsdaten verändert wird, was das ursprüngliche AEÄS-Signal ergib. Ein zweiter Tiefpassfil-30 ter F3 dämpft die höheren Frequenzen, welche wegen den schnellen Änderungen an den Verstärkern V2 und V3 vorkommen können. Im Fall, wo die Speicher M3, M4 und M5, M6 Parallelausgänge aufweisen, werden die Schieberegister SR7 und SR8 weggelassen. After a low-pass filter F2, the analog signal AEÄS / G is led to the input of an amplifier V2, the 20 gain of which is digitally changed by the data of the subsection intensities, which are entered in the memories M5 or M6. A shift register SR8 outputs the data of the respective subsection intensity in parallel to a circuit 2FF1, which keeps them for the duration of one or two subsections. At the output of amplifier V2, the AEÄS / Ph signal appears, which is routed through a second amplifier V3, the amplification of which is digital by the phoneme or. Section intensity data is changed, which gives the original AEÄS signal. A second low-pass filter 30 ter F3 attenuates the higher frequencies, which can occur due to the rapid changes to the amplifiers V2 and V3. In the case where the memories M3, M4 and M5, M6 have parallel outputs, the shift registers SR7 and SR8 are omitted.
35 Die ganze Steuerung der Einträge der Abschnitts-Intensitätsdaten, der Anzahl Abtastungen, der abwechselnden Einträge in die Speicher M3 resp. M4 und M5 resp. M6, sowie die verschiedenen Taktimpulse Cl und die programmierten Impulse Tj für die Ein- und Ausgabe der Daten an den ver-40 schiedenen Schaltkreisen, wird von der Zentraleinheit CU2 ausgeführt. Die Zentraleinheit CU2 gibt die Adressen 0 ... 7 und 0 ... 6 an die Speicher M3 und M4 sowie M5 und M6. Sie kann einen Mikroprozesor umfassen oder aus integrierten Schaltkreisen von Zählern, Schieberegistern, Flipflops und 45 Gattern bestehen, welche auf bekannte Art und Weise die nötigen Befehle liefern. Der Oszillator, welcher die Taktimpulse gibt, wird, wie bekannt, mit der Frequenz des Eingangssignals synchronisiert. 35 The whole control of the entries of the section intensity data, the number of samples, the alternating entries in the memory M3 or. M4 and M5 resp. The central unit CU2 executes M6, as well as the various clock pulses Cl and the programmed pulses Tj for the input and output of the data on the various circuits. The central unit CU2 gives the addresses 0 ... 7 and 0 ... 6 to the memories M3 and M4 as well as M5 and M6. It can comprise a microprocessor or consist of integrated circuits of counters, shift registers, flip-flops and 45 gates, which deliver the necessary commands in a known manner. As is known, the oscillator which gives the clock pulses is synchronized with the frequency of the input signal.
2 Blatt Zeichnungen 2 sheets of drawings
Claims (9)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GR54119A GR58359B (en) | 1977-08-09 | 1977-08-09 | Voice codification system |
Publications (1)
Publication Number | Publication Date |
---|---|
CH639218A5 true CH639218A5 (en) | 1983-10-31 |
Family
ID=10927866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CH844278A CH639218A5 (en) | 1977-08-09 | 1978-08-09 | VOICE ENCODING / DECODING METHOD. |
Country Status (4)
Country | Link |
---|---|
CH (1) | CH639218A5 (en) |
DE (1) | DE2834751A1 (en) |
GB (1) | GB2004443B (en) |
GR (1) | GR58359B (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2125259B (en) * | 1982-08-04 | 1986-10-22 | Secr Defence | Digital coding of speech |
JP4256189B2 (en) * | 2003-03-28 | 2009-04-22 | 株式会社ケンウッド | Audio signal compression apparatus, audio signal compression method, and program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1487540C3 (en) * | 1966-12-01 | 1981-06-25 | Heinz Dipl.-Phys. 7801 Umkirch Kusch | Process for the analysis and synthesis of electrical acoustic signals |
-
1977
- 1977-08-09 GR GR54119A patent/GR58359B/en unknown
-
1978
- 1978-08-08 GB GB7832650A patent/GB2004443B/en not_active Expired
- 1978-08-08 DE DE19782834751 patent/DE2834751A1/en active Granted
- 1978-08-09 CH CH844278A patent/CH639218A5/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
GB2004443B (en) | 1982-07-21 |
DE2834751C2 (en) | 1988-05-19 |
DE2834751A1 (en) | 1979-02-22 |
GR58359B (en) | 1977-10-03 |
GB2004443A (en) | 1979-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69230308T2 (en) | Transformation processing apparatus and method and medium for storing compressed digital data | |
DE2050512C3 (en) | Device for deriving speech parameters and for generating synthetic speech | |
DE3117920C2 (en) | Method and device for the approximate representation of an analog signal with a reduced amount of data | |
DE3852678T2 (en) | Pattern recognition. | |
DE2753707A1 (en) | DEVICE FOR DETECTING THE APPEARANCE OF A COMMAND WORD FROM AN INPUT LANGUAGE | |
DE2920298A1 (en) | BINARY INTERPOLATOR CIRCUIT FOR AN ELECTRONIC MUSICAL INSTRUMENT | |
DE2946502C2 (en) | ||
DE3228756A1 (en) | METHOD AND DEVICE FOR PERIODICALLY COMPRESSING AND SYNTHESIS OF VOICE-FREE VOICE SIGNALS | |
DE69124210T2 (en) | Device for signal coding | |
DE2020753A1 (en) | Device for recognizing given speech sounds | |
DE2357067A1 (en) | SPEECH ANALYSIS DEVICE | |
DE2724347A1 (en) | DELTA MODULATOR WITH A QUANTIZING COMPARATOR | |
DE3006339C2 (en) | Speech synthesizer | |
DE2644478A1 (en) | DIFFERENTIAL PHASE TOUCH MODULATOR | |
DE1905680A1 (en) | Signal processing system | |
DE3784212T2 (en) | DIGITAL MUTE. | |
CH639218A5 (en) | VOICE ENCODING / DECODING METHOD. | |
DE3037276C2 (en) | Sound synthesizer | |
DE2435654C2 (en) | Method and device for the analysis and synthesis of human speech | |
DE3202437A1 (en) | PLAYBACK FOR A TWO-PHASE CODE DATA SIGNAL | |
DE2826570C2 (en) | ||
DE3129155A1 (en) | DATA COMPRESSOR SYSTEM | |
DE69126355T2 (en) | Charge distribution analog-digital converter with gradual approximation | |
DE69119005T2 (en) | Method and device for coding an analog signal with repeatability | |
DE2214521A1 (en) | Speech synthesis circuit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PL | Patent ceased |