DE10356054A1 - System and method for synthesizing a variety of voices - Google Patents

System and method for synthesizing a variety of voices Download PDF

Info

Publication number
DE10356054A1
DE10356054A1 DE10356054A DE10356054A DE10356054A1 DE 10356054 A1 DE10356054 A1 DE 10356054A1 DE 10356054 A DE10356054 A DE 10356054A DE 10356054 A DE10356054 A DE 10356054A DE 10356054 A1 DE10356054 A1 DE 10356054A1
Authority
DE
Germany
Prior art keywords
processor unit
voice
decoded
voices
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE10356054A
Other languages
German (de)
Inventor
Chao-Wen Chi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Winbond Electronics Corp
Original Assignee
Winbond Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Winbond Electronics Corp filed Critical Winbond Electronics Corp
Publication of DE10356054A1 publication Critical patent/DE10356054A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

Ein System und ein Verfahren zum Synthetisieren einer Vielzahl von Stimmen werden beschrieben. Das System weist eine Prozessoreinheit, ein Register, eine Signalspeichereinheit, einen Zeitgeber und einen Digital/Analog-Wandler auf. Die Prozessoreinheit dekodiert Sprachdaten in dekodierte Stimmen, und die dekodierten Stimmen werden dann an das Register übertragen. Eine Vielzahl von verschiedenen Abtastsignalen des Zeitgebers wird an die Signalspeichereinheit übertragen, um die Signalspeichereinheit periodisch auszulösen, und die Signalspeichereinheit holt sequenziell die dekodierten Stimmen, die in dem Register gespeichert sind, um wirksam Jitter zu vermeiden, wenn die Sprachdaten synthetisiert werden.A system and method for synthesizing a plurality of voices are described. The system has a processor unit, a register, a signal storage unit, a timer and a digital / analog converter. The processor unit decodes voice data into decoded voices and the decoded voices are then transferred to the register. A variety of different strobe signals from the timer are transmitted to the latch unit to periodically trigger the latch unit, and the latch unit sequentially fetches the decoded voices stored in the register to effectively avoid jitter when the speech data is synthesized.

Description

Gebiet der ErfindungTerritory of invention

Die vorliegende Erfindung betrifft allgemein ein System und Verfahren zum Synthetisieren einer Vielzahl von Stimmen, und insbesondere ein System und Verfahren zum Synthetisieren der Stimmen durch eine Signalspeichereinheit (latch unit), um ein Jitter-Phänomen zu vermeiden, wenn die Stimmen auf verschiedenen Sprachkanälen synthetisiert werden.The present invention relates to generally a system and method for synthesizing a variety of voices, and in particular a system and method for synthesizing of the voices through a latch unit to cause a jitter phenomenon avoid when the voices are synthesized on different voice channels become.

Die Anwendung digitaler Sprache wird im Zusammenhang mit dem rapiden Wachstum von Informations- und Kommunikationstechnologie weitläufig verwendet. Zum Beispiel wird das digitale Kodieren der Sprachsynthese normalerweise angewendet, um Sprachübertragung in elektronischen Verbraucherspielzeugen oder Mobiltelefonen zu behandeln. Insbesondere wird die Kodier/Dekodiertechnik der Sprachsynthese verwendet, um eine Tonübertragung auszuführen, so dass der Benutzer dem Ton klar zuhören kann, nachdem die Stimmen jeweils zum Zweck der Unterhaltung bzw. Kommunikation synthetisiert worden sind.The application of digital language will in connection with the rapid growth of information and communication technology widely used. For example, digital coding of speech synthesis is usually done applied to voice transmission in electronic consumer toys or cell phones to treat. In particular, the coding / decoding technique of speech synthesis used to carry out a sound transmission, so that the user can listen to the sound clearly after the voices synthesized in each case for the purpose of entertainment or communication have been.

1 zeigt ein Blockdiagramm eines Sprachsynthesizers gemäß des Stands der Technik. Der Sprachsynthesizer enthält üblicherweise eine Prozessoreinheit 100, ein Register 102, einen Digital/Analog-Wandler 104 und einen Lautsprecher 106. Ein Taktsignal wird zuerst in die Prozessoreinheit 100 und das Register 102 eingegeben, um mit dem Taktsignal die Prozessoreinheit 100 zur Berechnung von Sprachdaten und zur Bildung von dekodierten Stimmen zu betätigen. Das Taktsignal wird ebenfalls in das Register 102 eingegeben und löst das Register 102 aus. Die dekodierten Stimmen werden dann von der Prozessoreinheit 100 an das Register 102 gesendet. Nachher werden die dekodierten Stimmen sequenziell zu dem Digital/Analog-Wandler 104 und dem Lautsprecher 106 übertragen, wenn die Prozessoreinheit 100 die Dekodierberechnung der dekodierten Stimmen beendet. 1 Figure 3 shows a block diagram of a speech synthesizer according to the prior art. The speech synthesizer usually contains a processor unit 100 , a register 102 , a digital / analog converter 104 and a speaker 106 , A clock signal is first sent to the processor unit 100 and the register 102 entered to the processor unit with the clock signal 100 to calculate voice data and to form decoded voices. The clock signal is also in the register 102 entered and triggers the register 102 out. The decoded voices are then from the processor unit 100 to the register 102 Posted. Afterwards, the decoded voices become sequentially the digital / analog converter 104 and the speaker 106 transferred when the processor unit 100 the decoding calculation of the decoded voices ends.

2 zeigt ein Ausgabe-Zeitdiagramm des Sprachsynthesizers in 1 gemäß des Stands der Technik. Die X-Achse stellt die Zeit dar, und die Y-Achse stellt die Amplitude des Signals dar. SC bezeichnet eine Sequenz von Arbeitssignalen der Prozessoreinheit 200. T1, T2,..., Tn sind die Abtast-Perioden der Sprachsignale der Prozessoreinheit 100. D1, D2,..., Dn sind die dekodierten Stimmen, die erhalten werden, indem ein Firmware-Programm verwendet wird, wenn die Sprachdaten während einer Abtastperiode dekodiert werden. 2 shows an output timing chart of the speech synthesizer in FIG 1 according to the state of the art. The X axis represents time and the Y axis represents the amplitude of the signal. SC denotes a sequence of working signals from the processor unit 200 , T1, T2, ..., Tn are the sampling periods of the speech signals of the processor unit 100 , D1, D2, ..., Dn are the decoded voices obtained by using a firmware program when the speech data is decoded during a sampling period.

Theoretisch muss die Prozessoreinheit 100 die dekodierten Stimmen D1, D2 an das Register 102 übertragen, bevor die Abtast-Perioden T1, T2 des Arbeitssignals verstrichen sind, um dem Digital/Analog-Wandler 106 zu gestatten, die dekodierten Stimmen leicht zu lesen. Jedoch muss die Prozessoreinheit 100 einen Dekodierschritt ausführen, und empfängt gleichzeitig ein anderes unterbrochenes Signal bzw. Unterbrechungssignal I1 von den Peripheriegeräten. Die Prozessoreinheit 100 verbringt daher eine Menge zusätzlicher Berechnungszeit damit, dem unterbrochenen Anforderungssignal bzw. Unterbrechungsanforderungssignal I1 zu antworten, was zu einer unvollständigen Dekodierung der dekodierten Stimmen innerhalb einer Abtastperiode T2 führt. Das heisst, das unvollständige Dekodieren wird an den nächsten Betriebszyklus T3 verschoben. Die Prozessoreinheit 100 ist daher nicht in der Lage, während der Abtastperiode T2 die dekodierte Stimme D2 an das Register 102 zu übertragen, und überträgt dieselbe nur in der Abtastperiode T3.Theoretically, the processor unit 100 the decoded voices D1, D2 to the register 102 transmitted before the sampling periods T1, T2 of the working signal have passed to the digital / analog converter 106 to allow the decoded voices to be read easily. However, the processor unit 100 perform a decoding step and simultaneously receives another interrupt signal or interrupt signal I1 from the peripheral devices. The processor unit 100 therefore spends a lot of additional computation time responding to the interrupted request signal or interrupt request signal I1, resulting in incomplete decoding of the decoded voices within a sampling period T2. This means that the incomplete decoding is shifted to the next operating cycle T3. The processor unit 100 is therefore unable to register the decoded voice D2 during the sampling period T2 102 and transmits the same only in the sampling period T3.

Weiterhin empfängt die Prozessoreinheit 100 während der Betriebszyklen eine Menge unterbrochene Anforderungssignale (In) in dem Sprachsynthesizer. Da diese unterbrochenen Anforderungssignale (In) stark die Berechnungszeit (so wie MIPS der Prozessoreinheit 100) beanspruchen, können die dekodierten Stimmen in einer Abtastperiode nicht verrichtet werden, so dass der Analog/Digital-Wandler 104 die dekodierten Stimmen von dem Register 102 nicht lesen kann. Eine Störung der synthetisierten Sprache wird daher in dem so genannten Jitter-Phänomen gebildet. Mit anderen Worten, es treten eine deutliche Signalabweichung und laute Geräusche bzw. Rauschen innerhalb der dekodierten Stimmen auf, was die Qualität der synthetisierten Stimmen verringert.The processor unit also receives 100 a lot of interrupted request signals (In) in the speech synthesizer during the operating cycles. Since these interrupted request signals (In) greatly increase the calculation time (such as MIPS of the processor unit 100 ), the decoded voices cannot be performed in one sampling period, so the analog-to-digital converter 104 removes the decoded voices from the register 102 can't read. A disturbance in the synthesized speech is therefore formed in the so-called jitter phenomenon. In other words, there is a significant signal deviation and loud noises within the decoded voices, which reduces the quality of the synthesized voices.

Eine Aufgabe der vorliegenden Erfindung ist es, ein System und ein Verfahren zum Synthetisieren von Stimmen zu verwenden, um eine Signalspeichereinheit zu steuern, indem Abtastsignale von einem Zeitgeber verwendet werden; so dass die Signalspeichereinheit dekodierte Stimmen, die in dem Register gespeichert sind, erfassen kann. Als eine Folge wird das Problem unangemessener MIPS der Prozessoreinheit gelöst, um die Multitasking-Effizienz der Prozessoreinheit zu erhöhen.An object of the present invention is a system and method for synthesizing voices to be used to control a signal storage unit by sampling signals used by a timer; so the latch unit detect decoded voices stored in the register can. As a result, the problem of inappropriate MIPS of the processor unit solved, to increase the multitasking efficiency of the processor unit.

Eine andere Aufgabe der vorliegenden Erfindung ist es, ein System und ein Verfahren zum Synthetisieren von Stimmen zu verwenden, um es einer Vielzahl von Zeitgebern zu gestatten, eine Vielzahl von asynchronen Signalen (Sprachkanäle) zu erzeugen. Die asynchronen Signale werden verwendet, um eine Vielzahl von Signalspeichereinheiten zu betätigen, so dass die Signalspeichereinheit die dekodierten Stimmen gemäß der Abtastperiode der asynchronen Signale periodisch überträgt, um Jitter zwischen den dekodierten Stimmen zu vermeiden.Another task of the present Invention is a system and method for synthesizing of voices to use for a variety of timers allow to generate a large number of asynchronous signals (voice channels). The asynchronous signals are used to a variety of signal storage units to operate so that the latch unit decodes the voices according to the sampling period periodically transmits the asynchronous signals to reduce jitter between the to avoid decoded voices.

Noch eine andere Aufgabe der vorliegenden Erfindung ist es, ein System und ein Verfahren zum Synthetisieren von Stimmen zu verwenden, um Sprachkanäle mit verschiedenen Abtastperioden zu bilden. Die Sprachkanäle können die Belegung von Speicher der dekodierten Stimmen vermindern, um die Herstellungskosten des Sprachsynthesizers zu reduzieren.Yet another object of the present invention is to provide a system and method for Use synthesizing voices to form voice channels with different sampling periods. The voice channels can reduce the occupancy of memory of the decoded voices in order to reduce the manufacturing costs of the voice synthesizer.

Gemäß der vorstehenden Aufgaben führt die vorliegende Erfindung ein System und ein Verfahren zum Synthetisieren von Stimmen ein. Das System weist üblicherweise einen Speicher, eine Prozessoreinheit, ein Register, eine Signalspeichereinheit und einen Digital/Analog-Wandler auf. Die Sprachdaten werden in dem Speicher gespeichert. Die Prozessoreinheit ist mit dem Speicher verbunden und wird durch ein Taktsignal ausgelöst, so dass die Prozessoreinheit die Sprachdaten, die in dem Speicher gespeichert sind, lesen kann, und die Sprachdaten in dekodierte Stimmen dekodieren kann. Das Register ist mit der Prozessoreinheit verbunden und wird durch das Taktsignal betätigt, um die dekodierte Sprache von der Prozessoreinheit zu empfangen.According to the above tasks leads the present Invention a system and method for synthesizing voices on. The system usually points a memory, a processor unit, a register, a signal storage unit and a digital / analog converter. The voice data are in stored in memory. The processor unit is with the memory connected and is triggered by a clock signal so that the processor unit can read the voice data stored in the memory, and can decode the speech data into decoded voices. The register is connected to the processor unit and is by the clock signal actuated, to receive the decoded speech from the processor unit.

Die Signalspeichereinheit ist mit dem Register verbunden und wird durch einen Zeitgeber gesteuert, zum Erfassen der dekodierten Stimmen innerhalb des Registers. Der Zeitgeber überträgt ein Abtastsignal an die Signalspeichereinheit, um die Signalspeichereinheit periodisch gemäß der Periode des Abtastsignals auszulösen, und die Signalspeichereinheit liest sequenziell die dekodierten Stimmen von der Prozessoreinheit, um die Jitter innerhalb der synthetisierten Stimmen zu vermeiden. Der Digital/Analog-Wandler ist zum Übermitteln der dekodierten Stimmen in analoge synthetisierte Stimmen mit der Signalspeichereinheit verbunden, um die analogen synthetisierten Stimmen auszugeben.The signal storage unit is with connected to the register and controlled by a timer, to capture the decoded voices within the register. The Timer transmits a strobe signal to the latch unit to periodically the latch unit according to the period of Trigger scanning signal, and the latch unit sequentially reads the decoded ones Voices from the processor unit to the jitter within the synthesized To avoid voices. The digital / analog converter is for transmission of the decoded voices into analog synthesized voices with the Latch unit connected to the analog synthesized Issue votes.

Insbesondere sind ein oder mehrere Zeitgeber in die Signalspeichereinheit eingebaut, um verschiedene Abtastsignale mit jeweils verschiedenen Frequenzen zu bilden. Die Signalspeichereinheit lädt dann die in dem Register gespeicherten dekodierten Stimmen herunter und überträgt sie in einen Lautsprecher, anstelle des Übertragungsmodus der Prozessoreinheit im Stand der Technik. Eine Menge MIPS der Prozessoreinheit werden daher vorteilhafterweise eingespart. Weiterhin, da jede der dekodierten Stimmen periodisch befördert wird, werden die Jitter, in denen die dekodierten Stimmen auftreten, vollständig beseitigt.In particular, one or more Timers built into the latch unit to provide various To form scanning signals with different frequencies. The The latch unit then loads down the decoded voices stored in the register and transmits them into a speaker instead of the processor unit transmission mode in the state of the art. A lot of MIPS will be the processor unit therefore advantageously saved. Furthermore, since each of the decoded Voices promoted periodically the jitter in which the decoded voices occur is completely eliminated.

Da die Zeitgeber unabhängig von der Prozessoreinheit sind, und die Signalspeichereinheit in den Sprachsynthesizer eingebettet ist, beeinträchtigt die Signalspeichereinheit die Prozessoreinheit nicht. Die MIPS Zeit der Prozessoreinheit wird von der Signalspeichereinheit nicht beansprucht (appropriated), so dass es der Signalspeichereinheit gestattet wird, die dekodierten Stimmen regelmäßig zu holen und die dekodierten Stimmen periodisch in der vorbestimmten Zeit zu übertragen. Wenn die Prozessoreinheit die Berechnung von zwei dekodierten Stimmen in Antwort auf zwei Abtastsignale verrichtet, können zwei Zeitgeber in die Signalspeichereinheit eingebaut werden. Als Folge werden die dekodierten Stimmen periodisch an den Digital/Analog-Wandler gesendet, auf der Basis der Abtastperiode der zwei Zeitgeber.Because the timers are independent of the processor unit, and the signal storage unit in the Voice synthesizer embedded, affects the signal storage unit the processor unit is not. The MIPS time of the processor unit is not appropriated by the signal storage unit (see above) that the latch unit is allowed to decode the To get votes regularly and the decoded voices periodically in the predetermined time transferred to. When the processor unit calculates two decoded voices in In response to two strobe signals, two timers can be placed in the Signal storage unit can be installed. As a result, the decoded Voices sent periodically to the digital / analog converter, based on the Sampling period of the two timers.

Wichtiger, die vorliegende Erfindung ist vorteilhafterweise geeignet für eine Vielzahl von verschiedenen Abtastperioden (asynchrone Signale) in einem Mehrkanal-Sprachsynthesizer. Da die Übertragung der dekodierten Stimmen im Stand der Technik von der Prozessoreinheit gesteuert wird, muss die herkömmliche Prozessoreinheit die Dekodierberechnung von einem oder mehreren Sprachkanälen rechtzeitig während eines Betriebszyklus beenden. Zur Vereinfachung und Stabilität des Sprachsynthesizers in der vorliegenden Erfindung kann auf die unterbrochenen Anforderungssignale zwischen den Sprachkanälen innerhalb des Sprachsynthesizers nicht zugegriffen werden.More importantly, the present invention is advantageously suitable for a variety of different Sampling periods (asynchronous signals) in a multi-channel speech synthesizer. Because the transfer the decoded voices in the prior art from the processor unit is controlled, the conventional Processor unit the decoding calculation of one or more Voice channels in time while end an operating cycle. For simplification and stability of the speech synthesizer in the present invention can respond to the interrupted request signals between the voice channels cannot be accessed within the speech synthesizer.

Das heisst, wenn die Übertragung der dekodierten Stimmen in dem Sprachkanal progressiv ist, müssen die unterbrochenen Anforderungssignale des zweiten Sprachkanals an die Prozessoreinheit auf die des ersten Sprachkanals warten. Das heisst, wenn die Übertragung der dekodierten Stimmen in dem Sprachkanal progressiv ist, muss das unterbrochene Anforderungssignal des zweiten Sprachkanals, das von der Prozessoreinheit angefordert wird, auf die Übertragung des ersten Sprachkanals warten. Die Prozessoreinheit behandelt daher die unterbrochene Anforderung des zweiten Sprachkanals.That is, if the transfer of the decoded voices in the voice channel is progressive, the interrupted request signals of the second voice channel to the Processor unit waiting for the first voice channel. That means if the transfer of the decoded voices in the voice channel is progressive the interrupted request signal of the second voice channel, the requested by the processor unit on the transfer wait for the first voice channel. The processor unit therefore deals with the interrupted request of the second voice channel.

In der vorliegenden Erfindung ist eine Vielzahl von Zeitgebern in die Signalspeichereinheit eingebaut, um als ein Auslösemechanismus zu dienen. Die Signalspeichereinheit holt freiwillig bzw. selbsttätig gemäß der ersten Abtastperiode und der zweiten Abtastperiode die dekodierten Stimmen in dem Register. Weiter sendet die Signalspeichereinheit die dekodierten Stimmen regelmäßig auf jedem Sprachkanal des Sprachsynthesizers, um das Problem zu lösen, dass die Verzögerung der Übertragung zu Jitter führt. Noch wichtiger ist die Erfassungssequenz der dekodierten Stimmen zwischen den Sprachkanälen auf der Basis der Abtastperiode der Zeitgeber, um eine Störung zwischen dekodierten Stimmen der Sprachkanäle zu verhindern.In the present invention a large number of timers built into the signal storage unit, around as a trigger mechanism to serve. The signal storage unit fetches voluntarily or automatically according to the first Sampling period and the second sampling period the decoded voices in the register. The signal storage unit also sends the decoded Vote regularly any speech channel of the speech synthesizer to solve the problem that the delay the transfer leads to jitter. The acquisition sequence of the decoded voices is even more important between the voice channels based on the sampling period of the timer to detect a glitch between to prevent decoded voices of the voice channels.

Zusammenfassend, ein System und Verfahren zum Synthetisieren von Stimmen der vorliegenden Erfindung verwendet einen Zeitgeber, um eine Signalspeichereinheit zu steuern, so dass die Signalspeichereinheit dekodierte Stimmen, die in dem Register gespeichert sind, holen kann, um das Problem nicht ausreichender MIPS Zeit der Prozessoreinheit zu lösen, und die Multitasking-Effizienz des Vorgangs bzw. der Verarbeitung der Prozessoreinheit zu erhöhen. Weiter gestattet die Verwendung einer Vielzahl von Zeitgebern, um eine Vielzahl von asynchronen Abtastsignalen zu bilden, die Signalspeichereinheit auszulösen, so dass die dekodierten Stimmen sequenziell gemäß der Abtastperiode des Abtastsignals von den Zeitgebern geliefert werden, zur Vermeidung von Jitter.In summary, a system and method for synthesizing voices of the present invention uses a timer to control a latch unit so that the latch unit can fetch decoded voices stored in the register to address the problem of insufficient MIPS time to the processor unit solve, and to increase the multitasking efficiency of the process or processing of the processor unit. Furthermore, the use of a plurality of timers to form a plurality of asynchronous strobe signals allows the latch unit to be triggered so that the decoded voices are sequential according to the sampling period of the strobe nals are supplied by the timers to avoid jitter.

Kurze Beschreibung der Zeichnungen Brief description of the drawings

Die vorgenannten Aspekte und viele der begleitenden Vorteile dieser Erfindung werden ohne Weiteres anerkannt werden, da dieselben besser verstanden werden durch Bezug auf die folgende, detaillierte Beschreibung, wenn sie in Verbindung mit der begleitenden Zeichnung herangezogen wird, worin:The aforementioned aspects and many the accompanying advantages of this invention are readily apparent recognized because they are better understood by reference on the following detailed description when in connection with the accompanying drawing, in which:

1 ein Blockdiagramm eines Sprachsynthesizers gemäß des Stands der Technik darstellt; 1 Figure 3 is a block diagram of a prior art speech synthesizer;

2 ein Ausgabe-Zeit-Diagramm des Sprachsynthesizers in 1 gemäß des Stands der Technik darstellt; 2 an output-time diagram of the speech synthesizer in 1 according to the prior art;

3 ein Blockdiagramm eines Sprachsynthesizers gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellt; 3 Figure 3 is a block diagram of a speech synthesizer in accordance with a preferred embodiment of the present invention;

4 ein Ausgabe-Zeit-Diagramm des Sprachsynthesizers mit einem Zeitgeber in 3 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellt; 4 an output-time diagram of the speech synthesizer with a timer in 3 according to a preferred embodiment of the present invention;

5 ein Ausgabe-Zeit-Diagramm des Sprachsynthesizers mit einer Vielzahl von Zeitgebern in 3 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung darstellt; 5 an output-time diagram of the speech synthesizer with a variety of timers in 3 according to a preferred embodiment of the present invention;

6 ein Flußdiagramm von Sprachsynthesizer-Betrieb gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung ist. 6 FIG. 4 is a flow diagram of speech synthesizer operation in accordance with a preferred embodiment of the present invention.

Die vorliegende Erfindung ist auf ein System und Verfahren zum Synthetisieren einer Vielzahl von Stimmen gerichtet, um die Mängel eines herkömmlichen Synthesizers des Stands der Technik zu verbessern. Ein Zeitgeber wird verwendet, um eine Signalspeichereinheit zu steuern, um aktiv die dekodierten Stimmen, die in einem Register gespeichert sind, zu erfassen, um das Problem nicht ausreichender MIPS des Synthesizers zu lösen. Weiter löst eine Vielzahl von asynchronen Abtastsignalen von einer Vielzahl von Zeitgebern jeweils die Signalspeichereinheit aus. Die Signalspeichereinheit überträgt die dekodierten Stimmen von verschiedenen Kanälen der Zeitgeber dann sequenziell gemäß der Periode der asynchronen Abtastsignale. Als Folge werden die Jitter innerhalb der synthetisierten Stimmen der verschiedenen Kanäle wirksam beseitigt.The present invention is based on a system and method for synthesizing a variety of voices directed to the shortcomings a conventional one Improve prior art synthesizers. A timer is used to control a signal storage unit to be active the decoded voices stored in a register capture the problem of insufficient synthesizer MIPS to solve. Next solves a variety of asynchronous strobe signals from a variety the signal storage unit from timers. The signal storage unit transmits the decoded Voices from different channels of the The timer then sequentially according to the period of the asynchronous scanning signals. As a result, the jitter inside of the synthesized voices of the different channels eliminated.

3 zeigt ein Blockdiagramm eines Sprachsynthesizers gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung. Eine Vielzahl von Stimmen wird synthetisiert, indem Sprachdaten berechnet werden, um synthetisierte Stimmen zu erzeugen, um Jitter innerhalb der synthetisierten Stimmen zu vermeiden. Der Sprachsynthesizer weist üblicherweise einen Speicher 210, eine Prozessoreinheit 202, ein Register 204, eine Signalspeichereinheit 204 und einen Digital/Analog-Wandler 208 auf. Die Sprachdaten werden in dem Speicher 210 gespeichert. Die Prozessoreinheit 200 ist mit dem Speicher 210 verbunden, und wird durch ein Taktsignal 212 ausgelöst, so dass die Prozessoreinheit 200 die Sprachdaten, die in dem Speicher 210 gespeichert sind, lesen kann, und die Sprachdaten in dekodierte Stimmen dekodieren kann. Das Register 202 ist mit der Prozessoreinheit 200 verbunden, und wird durch das Taktsignal 212 zum Empfangen der dekodierten Stimmen von der Prozessoreinheit 200 betätigt. Die Signalspeichereinheit 204 ist mit dem Register 202 verbunden, und wird durch einen Zeitgeber 206 zum Erfassen der dekodierten Stimmen innerhalb des Registers 202 gesteuert. Der Zeitgeber 206 überträgt ein Abtastsignal an die Signalspeichereinheit 204, um die Signalspeichereinheit 204 gemäß der Periode des Abtastsignals periodisch auszulösen, und die Signalspeichereinheit 204 liest sequenziell die dekodierten Stimmen von der Prozessoreinheit 200, um die Jitter innerhalb der synthetisierten Stimme zu vermeiden. Der Digital/Analog-Wandler 208 ist mit der Signalspeichereinheit 204 verbunden, um die dekodierten Stimmen in eine analoge synthetisierte Stimme zu übermitteln, um die analoge synthetisierte Stimme auszugeben. 3 Figure 3 shows a block diagram of a speech synthesizer according to a preferred embodiment of the present invention. A variety of voices are synthesized by computing speech data to produce synthesized voices to avoid jitter within the synthesized voices. The speech synthesizer usually has a memory 210 , a processor unit 202 , a register 204 , a signal storage unit 204 and a digital / analog converter 208 on. The voice data is in the memory 210 saved. The processor unit 200 is with memory 210 connected, and is by a clock signal 212 triggered so the processor unit 200 the voice data in the memory 210 are stored, can read, and can decode the speech data into decoded voices. The registry 202 is with the processor unit 200 connected, and is by the clock signal 212 for receiving the decoded voices from the processor unit 200 actuated. The latch unit 204 is with the register 202 connected, and is controlled by a timer 206 to capture the decoded voices within the register 202 controlled. The timer 206 transmits a scanning signal to the signal storage unit 204 to the latch unit 204 periodically trigger according to the period of the sampling signal, and the latch unit 204 sequentially reads the decoded voices from the processor unit 200 to avoid the jitter within the synthesized voice. The digital / analog converter 208 is with the signal storage unit 204 connected to transmit the decoded voices into an analog synthesized voice to output the analog synthesized voice.

In der bevorzugten Ausführungsform der vorliegenden Erfindung weist die Signalspeichereinheit 204 eine Vielzahl von Lagen von Tiefe auf, um als Speichervorrichtung in einem Mehrlagenformat für die dekodierten Stimmen zu dienen. Eine zuerst-ein-zuerst-aus(FIFO)- Regel wird in den Lagen der Tiefe angewendet, so dass die Signalspeichereinheit 204 die dekodierten Stimmen stabil an den Digital/Analog-Wandler 208 überträgt. Die Prozessoreinheit 200 ist zum Beispiel eine Reihe von 6502 Mikrokontrollern, ein einzelner Chip oder eine Zentralprozessoreinheit (CPU) allgemeiner Verwendung.In the preferred embodiment of the present invention, the signal storage unit has 204 a plurality of layers of depth to serve as a multi-layer format storage device for the decoded voices. A first-in-first-out (FIFO) rule is applied in the layers of depth so that the latch unit 204 transmits the decoded voices stably to the digital / analog converter 208. The processor unit 200 For example, a series of 6502 microcontrollers, a single chip, or a central processing unit (CPU) are common.

Zusätzlich kann die Prozessoreinheit 200 eine Wellenform-Kodierung an den Sprachdaten im Zeitbereich ausführen. Die Wellenform-Kodierung schließt eine adaptive differenzielle Pulscodemodulation (ADPCM) und eine differenzielle Pulscodemodulation (DPCM) ein. Die ADPCM verwendet ein digitales Abtasten einer Kodiertechnik, um die analogen Signale in digitale Signale von Sprachsignalen umzuwandeln. Ebenso führt ADPCM die Differenz zwischen den beiden Abtastungen der Sprachdaten ein. Der eingenommene Speicher der ADPCM-Art ist kleiner aus der der herkömmlichen PCM-Art, um viel von dem Speicherplatz in der vorliegenden Erfindung einzusparen.In addition, the processor unit 200 perform waveform encoding on the voice data in the time domain. The waveform encoding includes adaptive differential pulse code modulation (ADPCM) and differential pulse code modulation (DPCM). The ADPCM uses digital sampling of an encoding technique to convert the analog signals into digital signals from speech signals. ADPCM also introduces the difference between the two samples of the speech data. The ADPCM-type memory taken up is smaller than that of the conventional PCM-type to save much of the memory space in the present invention.

Genauer sind einer oder mehrere Zeitgeber 206 in die Signalspeichereinheit 204 eingebaut, um jeweils verschiedene Abtastsignale mit verschiedenen Frequenzen zu bilden. Die Signalspeichereinheit 204 lädt daher die dekodierten Stimmen herunter, die in dem Register 202 gespeichert sind, und überträgt sie an einen Lautsprecher 214, anstelle des Übertragungsmodus der Prozessoreinheit im Stand der Technik. Daher wird eine Menge von MIPS Zeit der Prozessoreinheit 200 vorteilhafterweise in der vorliegenden Erfindung eingespart. Da jede der dekodierten Stimmen periodisch transportiert wird, werden die Jitter, die innerhalb der dekodierten Stimmen auftreten, vollständig beseitigt. Ein Zeitdiagramm von einem oder mehreren Zeitgebern, die in die Signalspeichereinheit eingebaut sind, wird im Detail beschrieben. Ein Sprachkanal ist ebenso definiert als ein Zeitgeber, der eine spezifische Frequenz einschließt. Mit anderen Worten, eine Vielzahl von Sprachkanälen sind jeweils mit den Zeitgebern 206, den Signalspeichereinheiten 204, den Registern 202 (oder Direktzugriffsspeicher RAM) und einer Vielzahl von Firmwares verbunden.One or more timers are more precise 206 into the signal storage unit 204 built in to form different scanning signals with different frequencies. The latch unit 204 therefore downloads the decoded voices contained in the register 202 stored, and transmits them to a speaker 214 , instead of the transmission mode of the processor unit in the prior art. Therefore, a lot of MIPS processor unit time 200 advantageously in the present gene invention saved. Since each of the decoded voices is transported periodically, the jitter that occurs within the decoded voices is completely eliminated. A timing diagram of one or more timers built into the latch unit is described in detail. A voice channel is also defined as a timer that includes a specific frequency. In other words, a variety of voice channels are each with the timers 206 , the signal storage units 204 , the registers 202 (or random access memory RAM) and a variety of firmwares.

4 zeigt ein Ausgabe-Zeitdiagramm des Sprachsynthesizers mit einem Zeitgeber in 3 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung. Die X-Achse stellt die Zeit dar, und die Y-Achse stellt die Amplitude des Signals dar. SC bezeichnet eine Sequenz von Betriebssignalen der Prozessoreinheit 200. TC ist die Abtastperiode eines Betriebssignals. D1 ist eine der dekodierten Stimmen, wenn die Sprachdaten während eines Betriebszyklus des Betriebssignals berechnet werden. SL ist das Abtastsignal des Zeitgebers 206. TL ist die Abtastperiode des Abtastsignals SL. Im Betrieb löst der Zeitgeber 206 die Signalspeichereinheit 204 durch Verwendung des Abtastsignals aus. Die Signalspeichereinheit 204 erfasst dann die dekodierten Stimmen D1, die in dem Register 202 gespeichert sind, und sendet die dekodierten Stimmen D1 in der vorbestimmten Zeit an den Digital/Analog-Wandler 208, um synthetisierte Stimmen zu bilden. Die synthetisierten Stimmen werden kontinuierlich an den Lautsprecher 214 übertragen. Der Rest kann durch Analogie abgeleitet werden, und die dekodierten Stimmen D2, ..., Dn werden sequenziell empfangen, wenn die Signalspeichereinheit 204 durch den Zeitgeber 206 ausgelöst wird; daher werden die dekodierten Stimmen D2,..., Dn sukzessiv in der vorbestimmten Zeit P2,..., Pn übermittelt. 4 shows an output timing diagram of the speech synthesizer with a timer in FIG 3 according to a preferred embodiment of the present invention. The X axis represents time and the Y axis represents the amplitude of the signal. SC denotes a sequence of operating signals from the processor unit 200 , TC is the sampling period of an operating signal. D1 is one of the decoded voices when the speech data is calculated during an operating cycle of the operating signal. SL is the strobe strobe signal 206 , TL is the sampling period of the sampling signal SL. The timer triggers during operation 206 the latch unit 204 by using the sampling signal. The latch unit 204 then detects the decoded voices D1 in the register 202 are stored, and sends the decoded voices D1 to the digital-to-analog converter 208 in the predetermined time to form synthesized voices. The synthesized voices are continuously sent to the speaker 214 transfer. The rest can be derived by analogy and the decoded voices D2, ..., Dn are received sequentially when the latch unit 204 by the timer 206 is triggered; therefore, the decoded voices D2, ..., Dn are successively transmitted in the predetermined time P2, ..., Pn.

Da die Signalspeichereinheit 204 die dekodierten Stimmen in dem Register 202 durch eine Betätigung der Abtastsignale von dem Zeitgeber 206 empfängt, wird die MIPS Zeit der Prozessoreinheit 200 nicht beansprucht, wenn der Zeitgeber 206 von der Prozessoreinheit 200 unabhängig ist. Als Folge reduziert die Signalspeichereinheit 204 wirksam die Belastung der Prozessoreinheit 200, und holt regelmäßig die dekodierten Stimmen aus dem Register 202. Deutlich erreicht die Prozessoreinheit 200 die Berechnung einer berechneten Stimme in Antwort auf ein Abtastsignal vor dem Abtastsignal der Signalspeichereinheit 204, und die Signalspeichereinheit 204 erhält dann sequenziell die dekodierten Stimmen. Demgemäß werden die dekodierten Stimmen periodisch an den Digital/Analog-Wandler 208 gesendet, um das Jitter-Problem in einem Kanal des Synthesizers zu lösen.Because the latch unit 204 the decoded voices in the register 202 by actuation of the strobe signals from the timer 206 receives, the MIPS time of the processor unit 200 not claimed when the timer 206 from the processor unit 200 is independent. As a result, the signal storage unit reduces 204 effective the load on the processor unit 200 , and regularly fetches the decoded voices from the register 202 , The processor unit clearly reached 200 calculating a calculated voice in response to a sample signal prior to the sample signal from the latch unit 204 , and the latch unit 204 then receives the decoded voices sequentially. Accordingly, the decoded voices are periodically sent to the digital-to-analog converter 208 sent to solve the jitter problem in one channel of the synthesizer.

5 zeigt ein Ausgabe-Zeitdiagramm des Sprachzynthesizers mit einer Vielzahl von Zeitgebern in 3 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung. 5 ist im Wesentlichen ähnlich zu 3. Der Hauptunterschied zwischen 5 und 3 ist, das eine Vielzahl von Zeitgebern zum Steuern der Signalspeichereinheit 204 auf die 5 angewendet wird. Zwei Zeitgeber, die aus Bequemlichkeit herangezogen worden sind, sind als ein erster Zeitgeber T1 und ein zweiter Zeitgeber T2 definiert. Die X-Achse stellt die Zeit dar, und die Y-Achse stellt die Amplitude des Signals dar. SC bezeichnet eine Reihe von Arbeitssignalen der Prozessoreinheit 200. TC ist der Betriebszyklus eines Arbeitssignals. D11, D21 sind einige der dekodierten Stimmen, wenn die Sprachdaten während eines Betriebszyklus des Betriebssignals berechnet werden. SL1 ist das Abtastsignal des ersten Zeitgebers; TL1 ist die Abtastperiode des Abtastsignals SL1. SL2 ist das Abtastsignal des ersten Zeitgebers; TL2 ist die Abtastperiode des Abtastsignals SL2. Im Betrieb erzeugen der erste Zeitgeber und der zweite Zeitgeber jeweils eine erste Abtastperiode TL1 und eine zweite Abtastperiode TL2. Die dekodierten Stimmen D11, D21 in dem Register 202 werden durch die Signalspeichereinheit 204 erfasst, wenn die erste Abtastperiode TL1 und die zweite Abtastperiode TL2 die Signalspeichereinheit 204 in der vorbestimmten Zeit P11, P21 auslösen. Die Signalspeichereinheit 204 verwendet den Auslösemechanismus der ersten Zeitgebers und des zweiten Zeitgebers, um sukzessive die dekodierten Stimmen (D11, D21), (D12, D13, D22),..., (D1m, D2n) zu empfangen. Die dekodierten Stimmen (D11, D21), (D12, D13, D22),..., (D1m, D2n) werden dann in der vorbestimmten Zeit (P11, P21), (P12, P13, P22),..., (P1m, P2n) übertragen. 5 FIG. 12 shows an output timing diagram of the speech synthesizer with a plurality of timers in FIG 3 according to a preferred embodiment of the present invention. 5 is essentially similar to 3 , The main difference between 5 and 3 which is a plurality of timers for controlling the signal storage unit 204 on the 5 is applied. Two timers that have been used for convenience are defined as a first timer T1 and a second timer T2. The X axis represents time and the Y axis represents the amplitude of the signal. SC denotes a series of working signals of the processor unit 200 , TC is the operating cycle of a work signal. D11, D21 are some of the decoded voices when the speech data is calculated during an operating cycle of the operating signal. SL1 is the strobe signal of the first timer; TL1 is the sampling period of the sampling signal SL1. SL2 is the strobe signal of the first timer; TL2 is the sampling period of the sampling signal SL2. In operation, the first timer and the second timer each generate a first sampling period TL1 and a second sampling period TL2. The decoded voices D11, D21 in the register 202 are through the latch unit 204 detected when the first sampling period TL1 and the second sampling period TL2 the latch unit 204 trigger P11, P21 in the predetermined time. The latch unit 204 uses the trigger mechanism of the first timer and the second timer to successively receive the decoded voices (D11, D21), (D12, D13, D22), ..., (D1m, D2n). The decoded voices (D11, D21), (D12, D13, D22), ..., (D1m, D2n) are then in the predetermined time (P11, P21), (P12, P13, P22), ..., (P1m, P2n) transmitted.

Ähnlich wird, da die Signalspeichereinheit 204 die dekodierten Stimmen aus dem Register 202 durch eine Betätigung des Abtastsignals von dem ersten und dem zweiten Zeitgeber 206 empfängt, die MIPS Zeit der Prozessoreinheit 200 nicht vorteilhafterweise beansprucht, wenn der Zeitgeber 206 von der Prozessoreinheit 200 unabhängig ist. Mit anderen Worten, die Signalspeichereinheit 204 wird während der Hardwarebildung in den Synthesizer eingebettet. Als Folge reduziert die Signalspeichereinheit 204 wirksam die Belastung der Prozessoreinheit 200, so dass die Signalspeichereinheit 204 die berechneten dekodierten Stimmen periodisch erfasst, und die dekodierten Stimmen in der vorbestimmten Zeit P11, P21 überträgt. Deutlich werden die dekodierten Stimmen erfasst und übertragen, um die Störung der synthetisierten Stimmen während des Betriebszyklus (TC) der Prozessoreinheit 200 gemäß der ersten Abtastperiode T1 und der zweiten Abtastperiode T2 zu vermeiden.Similarly, since the signal storage unit 204 the decoded voices from the register 202 by actuation of the strobe signal from the first and second timers 206 receives the MIPS time of the processor unit 200 not advantageously claimed when the timer 206 from the processor unit 200 is independent. In other words, the signal storage unit 204 is embedded in the synthesizer during hardware creation. As a result, the signal storage unit reduces 204 effective the load on the processor unit 200 so that the latch unit 204 periodically acquires the calculated decoded voices, and transmits the decoded voices in the predetermined time P11, P21. The decoded voices are clearly recorded and transmitted in order to disrupt the synthesized voices during the operating cycle (TC) of the processor unit 200 to avoid according to the first sampling period T1 and the second sampling period T2.

Genauer, die Prozessoreinheit 200 erreicht die Berechnung von zwei dekodierten Stimmen in Antwort auf zwei Abtastsigale vor den Abtastsignalen der Signalspeichereinheit 204, und die Signalspeichereinheit 204 ist innerhalb zweier Zeitgeber integriert. Demgemäß werden die dekodierten Stimmen auf Basis der Abtastperiode der Zeitgeber periodisch an den Digital/Analog-Wandler 208 gesendet.More precisely, the processor unit 200 accomplishes the calculation of two decoded voices in response to two strobe signals before the strobe unit's strobe signals 204 , and the latch unit 204 is integrated within two timers. Accordingly, the decoded voices based on the sampling period of the timers periodically to the digital / analog converter 208 Posted.

Die vorliegende Erfindung ist geeignet für eine Vielzahl von verschiedenen Abtastperioden (asynchrone Signale) für einen Mehrkanal-Sprachsynthesizer. Da die Übertragung der dekodierten Stimmen durch die Prozessoreinheit nach dem Stand der Technik gesteuert wird, muss die Prozessoreinheit Sprachberechnung von einem oder mehreren Kanälen während eines Betriebszyklus rechtzeitig erreichen. Zur Vereinfachung und Stabilisierung des Sprachsynthesizers kann auf die unterbrochenen Anforderungssignale zwischen den Sprachkanälen in dem Sprachsynthesizer nicht zugegriffen werden. Das heisst, wenn die Übertragung der dekodierten Stimmen in den Sprachkanälen progressiv ist, muss das unterbrochene Anforderungssignal des zweiten Sprachkanals, dass durch die Prozessoreinheit 200 angefordert wird, auf die Übertragung des ersten Sprachkanals warten. Die Prozessoreinheit 200 behandelt daher die unterbrochenen Anforderungen des zweiten Sprachkanals. The present invention is suitable for a variety of different sampling periods (asynchronous signals) for a multi-channel speech synthesizer. Since the transmission of the decoded voices is controlled by the processor unit according to the prior art, the processor unit must achieve speech calculation from one or more channels in good time during an operating cycle. In order to simplify and stabilize the speech synthesizer, the interrupted request signals between the speech channels in the speech synthesizer cannot be accessed. That is, if the transmission of the decoded voices in the voice channels is progressive, the interrupted request signal of the second voice channel must be that by the processor unit 200 is requested, wait for the transmission of the first voice channel. The processor unit 200 therefore deals with the interrupted requests of the second voice channel.

Demgemäß muss die herkömmliche Ausgabe der synthetisierten Stimmen eine Menge Jitter in der synthetisierten Stimme erzeugen, da der erste Sprachkanal und der zweite Sprachkanal sich gegenseitig durch Überlasten der Prozessoreinheit 200 behindern. Im Gegensatz dazu ist die Signalspeichereinheit 204 vollständig unabhängig von der Prozessoreinheit 200, und eine Vielzahl von Zeitgebern ist in die Signalspeichereinheit 204 eingebaut, um als ein Auslösemechanismus zu dienen. Die Signalspeichereinheit 204 holt selbsttätig die dekodierten Stimmen in dem Register 202 gemäß der ersten Abtastperiode und der zweiten Abtastperiode. Weiterhin sendet die Signalspeichereinheit 204 regelmäßig die dekodierten Stimmen auf jedem Sprachkanal des Sprachsynthesizers, um das Problem der Verzögerung der Übertragung aufgrund von Jitter zu lösen. Noch wichtiger, die Erfassungssequenz der dekodierten Stimmen zwischen den Sprachkanälen beruht auf der Basis der Abtastperiode des Zeitgebers 206, um Interferenz zwischen dekodierten Stimmen der Sprachkanäle zu verhindern.Accordingly, the conventional output of the synthesized voices must generate a lot of jitter in the synthesized voice because the first voice channel and the second voice channel mutually overload the processor unit 200 hinder. In contrast, the signal storage unit 204 completely independent of the processor unit 200 , and a plurality of timers are in the latch unit 204 built in to serve as a trigger mechanism. The latch unit 204 automatically fetches the decoded voices in the register 202 according to the first sampling period and the second sampling period. The signal storage unit also transmits 204 periodically decode the voices on each voice channel of the speech synthesizer to solve the problem of transmission delay due to jitter. More importantly, the acquisition sequence of the decoded voices between the voice channels is based on the sampling period of the timer 206 to prevent interference between decoded voices of the voice channels.

6 ist ein Flußdiagramm des Betriebs des Sprachsynthesizers gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung. In Schritt 600 liest die Prozessoreinheit die Sprachdaten, die in dem Speicher gespeichert sind, gemäß eines Taktsignals. In Schritt 602 dekodiert die Prozessoreinheit 200 dann die Sprachdaten in eine dekodierte Stimme. In Schritt 604 wird das Taktsignal ebenso verwendet, um ein Register zum Empfangen der dekodierten Stimme von der Prozessoreinheit zu dem Register auszulösen. 6 Figure 3 is a flow diagram of the operation of the speech synthesizer in accordance with a preferred embodiment of the present invention. In step 600, the processor unit reads the speech data stored in the memory according to a clock signal. In step 602, the processor unit decodes 200 then the speech data into a decoded voice. In step 604, the clock signal is also used to trigger a register to receive the decoded voice from the processor unit to the register.

Im nächsten Schritt 606 bildet eine Vielzahl von Zeitgebern Abtastsignale, um die Signalspeichereinheit zu steuern. Die Abtastperiode in Antwort auf das Abtasten des bzw. das Signal wird verwendet, um die Signalspeichereinheit regelmäßig auszulösen. Die Signalspeichereinheit holt daher aktiv die dekodierten Stimmen von der Prozessoreinheit. Jedes der Abtastsignale ist definiert als ein Kanal der synthetisierten Stimmen. Die Signalspeichereinheit überträgt rechtzeitig die dekodierte Stimme jedes Sprachkanals. Danach wandelt der Digital/Analog-Wandler die digitale Stimme in die analoge dekodierte Stimme um. Zuletzt wird die analoge dekodierte Stimme an einen Lautsprecher ausgegeben.In the next step 606 forms one Variety of timers strobe signals to the latch unit to control. The sampling period in response to the sampling of the the signal is used to trigger the latch unit periodically. The Signal storage unit therefore actively fetches the decoded voices from the processor unit. Each of the strobe signals is defined as a channel of synthesized voices. The signal storage unit transmits in time the decoded voice of each voice channel. The digital / analog converter then converts the digital voice into the analog decoded voice. Last the analog decoded voice is output to a speaker.

Gemäß dem Vorhergehenden verwendet ein System und Verfahren zum Synthetisieren von Stimmen der vorliegenden Erfindung einen Zeitgeber zum Steuern einer Signalspeichereinheit, so dass die Signalspeichereinheit dekodierte Stimmen, die in dem Register gespeichert sind, holen kann, um das Problem von nicht ausreichender MIPS Zeit der Prozessoreinheit zu lösen, und die Multitasking-Effizienz der Verarbeitung der Prozessoreinheit zu erhöhen. Weiterhin wird durch Verwendung einer Vielzahl von Zeitgebern, um eine Vielzahl von asynchronen Abtastsignalen zu bilden, gestattet, die Signalspeichereinheit auszulösen, so dass die dekodierten Stimmen sequenziell gemäß der Periode der Abtastsignale von den Zeitgebern zur Vermeidung von Jitter geliefert werden. Zusätzlich können die asynchronen Abtastsignale der Zeitgeber entsprechend verschiedener Sprachkanäle die Verwendung von Speicher der dekodierten Stimmen verringern, um die Herstellungskosten des Sprachsynthesizers zu reduzieren.Used according to the previous a system and method for synthesizing voices of the present Invention a timer for controlling a signal storage unit, so that the latch unit decoded voices that are in the register saved, can pick up the problem from insufficient MIPS time to solve the processor unit, and the multitasking efficiency to increase the processing of the processor unit. Furthermore, by using a variety of timers to a variety of asynchronous Forming scanning signals allows the signal storage unit to be triggered, so that the decoded voices sequentially according to the period of the strobe signals are supplied by the timers to avoid jitter. In addition, the asynchronous sampling signals of the timers corresponding to different voice channels use of memory of the decoded voices decrease to the manufacturing cost of the speech synthesizer.

Wie von einem Fachmann verstanden wird, sind die vorhergehenden bevorzugten Ausführungsformen der vorliegenden Erfindung erläuternd, anstatt die vorliegende Erfindung zu beschränken. Es ist beabsichtigt, dass sie verschiedene Modifikationen und ähnliche Anordnungen abdecken, eingeschlossen in dem Wesen und Schutzumfang der angefügten Ansprüche, deren Schutzumfang der breitesten Interpretation entsprechen sollte, um alle solche Modifikationen und ähnliche Struktur zu umfassen.As understood by a professional are the foregoing preferred embodiments of the present Illustrating the invention rather than limiting the present invention. It is intended, that they cover various modifications and similar arrangements, included in the nature and scope of the appended claims, the Scope of protection should correspond to the broadest interpretation all such modifications and the like Structure.

Claims (25)

System zum Synthetisieren einer Vielzahl von Stimmen, indem Sprachdaten berechnet werden, um eine synthetisierte Stimme zu erzeugen, um Jitter in der synthetisierten Stimme zu vermeiden, wobei das System umfasst: einen Speicher zum Speichern der Sprachdaten; eine Prozessoreinheit, die mit dem Speicher verbunden ist, und die durch ein Taktsignal ausgelöst wird, so dass die Prozessoreinheit die in dem Speicher gespeicherten Sprachdaten lesen kann, und die Sprachdaten in eine dekodierte Stimme dekodieren kann: ein Register, das mit der Prozessoreinheit verbunden ist, und das durch das Taktsignal betätigt wird, zum Empfangen der dekodierten Stimme von der Prozessoreinheit; eine Signalspeichereinheit, die mit dem Register verbunden ist, und die durch einen Zeitgeber zum Erfassen der dekodierten Stimmen innerhalb des Registers gesteuert wird, wobei der Zeitgeber ein Abtastsignal an die Signalspeichereinheit überträgt, um die Signalspeichereinheit gemäß einer Periode des Abtastsignals periodisch auszulösen, und die Signalspeichereinheit sequenziell die dekodierten Stimmen von der Prozessoreinheit liest, um Jitter in der synthetisierten Stimme zu vermeiden; und einen Digital/Analog-Wandler, der mit der Signalspeichereinheit verbunden ist, zum Übermitteln der dekodierten Stimme in eine analoge synthetisierte Stimme, um die analoge synthetisierte Stimme auszugeben.A system for synthesizing a plurality of voices by calculating speech data to generate a synthesized voice to avoid jitter in the synthesized voice, the system comprising: a memory for storing the speech data; a processor unit connected to the memory and triggered by a clock signal so that the processor unit can read the speech data stored in the memory and decode the speech data into a decoded voice: a register connected to the processor unit , and which is actuated by the clock signal, for receiving the decoded voice from the processor unit; a signal storage unit ver with the register and controlled by a timer for detecting the decoded voices within the register, the timer transmitting a strobe signal to the latch unit to periodically trigger the latch unit according to a period of the strobe signal, and the latch unit sequentially decoding the decoded voices from the processor unit reads to avoid jitter in the synthesized voice; and a digital-to-analog converter connected to the latch unit for transmitting the decoded voice to an analog synthesized voice to output the analog synthesized voice. System gemäß Anspruch 1, wobei der Signalspeicher eine Vielzahl von Lagen von Tiefe zum Speichern der dekodierten Stimme von der Prozessoreinheit aufweist.System according to claim 1, wherein the latch has a plurality of layers from depth to Storage of the decoded voice from the processor unit has. System gemäß Anspruch 2, wobei der Signalspeicher einen Direktzugriffsspeicher (RAM) aufweist.System according to claim 2, wherein the latch has a random access memory (RAM). System gemäß Anspruch 2, wobei die Lagen von Tiefe ein FIFO-Verfahren der Übertragung der dekodierten Stimmen von der Prozessoreinheit zu der Signalspeichereinheit aufweisen.System according to claim 2, the layers of depth using a FIFO method of transmission the decoded voices from the processor unit to the signal storage unit exhibit. System gemäß Anspruch 1, wobei die Prozessoreinheit einen Mikrokontroller oder eine Zentralprozessoreinheit (CPU) aufweist.System according to claim 1, wherein the processor unit is a microcontroller or a central processor unit (CPU). System gemäß Anspruch 1, wobei die Prozessoreinheit ein Wellenformkodierungsverfahren zum Kodieren der Sprachdaten in dem Speicher umfasst.System according to claim 1, wherein the processor unit uses a waveform encoding method for encoding the voice data in the memory. System gemäß Anspruch 5, wobei das Wellenformkodierungsverfahren Code Excited Linear Prediction (CELP) umfasst.System according to claim 5, wherein the waveform coding method Code Excited Linear Prediction (CELP) includes. System gemäß Anspruch 6, wobei das Wellenformkodierungsverfahren adaptive differenzielle Pulscodemodulation (ADPCM) umfasst. System according to claim 6, wherein the waveform coding method adaptive differential pulse code modulation (ADPCM) includes. System gemäß Anspruch 5, wobei das Wellenformkodierungsverfahren differenzielle Pulscodemodulation (DPCM) umfasst.System according to claim 5, wherein the waveform encoding method differential pulse code modulation (DPCM). System zum Synthetisieren einer Vielzahl von Stimmen, indem Sprachdaten im Speicher berechnet werden, um eine synthetisierte Stimme zu erzeugen, um Jitter in der synthetisierten Stimme zu vermeiden, wobei das System umfasst: eine Prozessoreinheit, die mit dem Speicher verbunden ist, und die durch ein Taktsignal ausgelöst wird, wobei die Prozessoreinheit die in dem Speicher gespeicherten Sprachdaten liest, und die Sprachdaten in eine dekodierte Stimme dekodiert; ein Register, das mit der Prozessoreinheit verbunden ist, und das durch das Taktsignal betätigt wird, zum Empfangen der dekodierten Stimme von der Prozessoreinheit; eine Signalspeichereinheit, die mit dem Register verbunden ist, und die durch eine Vielzahl von Zeitgebern zum Erfassen der dekodierten Stimmen innerhalb des Registers gesteuert wird, wobei die Zeitgeber eine Vielzahl von Abtastsignalen in Antwort auf die Zeitgeber an die Signalspeichereinheit übertragen, um die Signalspeichereinheit gemäß der verschiedenen Perioden von jedem der Abtastsignale periodisch auszulösen, und die Signalspeichereinheit sequenziell die dekodierten Stimmen von der Prozessoreinheit liest, um Jitter in der synthetisierten Stimme zu vermeiden; und einen Digital/Analog-Wandler, der mit der Signalspeichereinheit verbunden ist, zum Übermitteln der dekodierten Stimme in eine analoge synthetisierte Stimme, und zum Ausgeben der analogen synthetisierten Stimme.System for synthesizing a variety of voices, by computing speech data in memory to make a synthesized one Generating voice to avoid jitter in the synthesized voice the system comprising: a processor unit with the Memory is connected, and which is triggered by a clock signal, wherein the processor unit stores the voice data stored in the memory reads and decodes the speech data into a decoded voice; on Register, which is connected to the processor unit, and by actuated the clock signal for receiving the decoded voice from the processor unit; a Latch unit connected to the register and the by a variety of timers for detecting the decoded Voices are controlled within the register, with the timers a variety of strobe signals in response to the timers transmit the signal storage unit, around the signal storage unit according to the various Periodically trigger periods of each of the scan signals, and the latch unit sequentially decodes the voices of the processor unit reads to jitter in the synthesized voice to avoid; and a digital / analog converter that works with the Signal storage unit is connected to transmit the decoded Voice into an analog synthesized voice, and to output the analog synthesized voice. System gemäß Anspruch 10, wobei der Signalspeicher eine Vielzahl von Lagen von Tiefe zum Speichern der dekodierten Stimme von der Prozessoreinheit aufweist.System according to claim 10, wherein the latch has a plurality of layers of depth for storage the decoded voice from the processor unit. System gemäß Anspruch 11, wobei die Lagen von Tiefe ein FIFO-Verfahren der Übertragung der dekodierten Stimmen von der Prozessoreinheit zu der Signalspeichereinheit aufweisen.System according to claim 11, the layers of depth using a FIFO method of transmitting the decoded voices from the processor unit to the latch unit exhibit. System gemäß Anspruch 10, wobei die Prozessoreinheit einen Mikrokontroller oder eine Zentralprozessoreinheit (CPU) aufweist. System according to claim 10, wherein the processor unit is a microcontroller or a central processor unit (CPU). System gemäß Anspruch 10, wobei die Prozessoreinheit ein Wellenformkodierungsverfahren zum Kodieren der Sprachdaten in dem Speicher aufweist.System according to claim 10, wherein the processor unit uses a waveform coding method for Encoding the voice data in the memory. System gemäß Anspruch 14, wobei das Wellenformkodierungsverfahren Code Excited Linear Prediction (CELP) umfasst.System according to claim 14, the waveform encoding method Code Excited Linear Prediction (CELP) includes. System gemäß Anspruch 14, wobei das Wellenformkodierungsverfahren adaptive differenzielle Pulscodemodulation (ADPCM) umfasst.System according to claim 14, wherein the waveform encoding method is adaptive differential pulse code modulation (ADPCM) includes. System gemäß Anspruch 14, wobei das Wellenformkodierungsverfahren differenzielle Pulscodemodulation (DPCM) umfasst.System according to claim 14, wherein the waveform encoding method is differential pulse code modulation (DPCM). Verfahren zum Synthetisieren einer Vielzahl von Stimmen, indem Sprachdaten im Speicher berechnet werden, um eine synthetisierte Stimme zu erzeugen, um Jitter in der synthetisierten Stimme zu vermeiden, wobei das Verfahren die Schritte umfasst: Lesen der Sprachdaten, die in dem Speicher gespeichert sind, indem eine Prozessoreinheit gemäß eines Taktsignals verwendet wird; Dekodieren der Sprachdaten in eine dekodierte Stimme durch die Prozessoreinheit; Auslösen eines Registers mit dem Taktsignal, um die dekodierte Stimme von der Prozessoreinheit zu empfangen; Steuern einer Signalspeichereinheit durch eine Vielzahl von Abtastsignalen in Antwort auf eine Vielzahl von Zeitgebern, wobei die Zeitgeber eine Vielzahl von Abtastsignalen in Antwort auf die Zeitgeber an die Signalspeichereinheit übertragen, um die Signalspeichereinheit gemäß der verschiedenen Perioden jedes der Abtastsignale auszulösen, und die Signalspeichereinheit die dekodierten Stimmen von der Prozessoreinheit sequenziell liest, um Jitter in der synthetisierten Stimme zu vermeiden; Umwandeln der digitalen dekodierten Stimme in eine analoge dekodierte Stimme, und Ausgeben der analogen dekodierten Stimme.A method of synthesizing a plurality of voices by computing speech data in memory to produce a synthesized voice to avoid jitter in the synthesized voice, the method comprising the steps of: reading the speech data stored in the memory by a processor unit according to one Clock signal is used; Decoding the speech data into a decoded voice by the processor unit; Triggering a register with the clock signal to receive the decoded voice from the processor unit; Controlling a latch unit by a plurality of strobe signals in response to a plurality of timers, the timers transmitting a plurality of strobe signals in response to the timers to the latch unit to trigger the latch unit according to the different periods of each of the strobe signals, and the latch unit decoding the Reads voices from the processor unit sequentially to avoid jitter in the synthesized voice; Converting the digital decoded voice to an analog decoded voice, and outputting the analog decoded voice. System gemäß Anspruch 18, wobei das Register eine Vielzahl von Lagen von Tiefe zum Speichern der dekodierten Stimme von der Prozessoreinheit aufweist. System according to claim 18, the register being a plurality of layers of depth for storage the decoded voice from the processor unit. System gemäß Anspruch 19, wobei die Lagen von Tiefe ein FIFO-Verfahren der Übertragung der dekodierten Stimme von der Prozessoreinheit zu der Signalspeichereinheit aufweisen.System according to claim 19, the layers of depth using a FIFO method of transmitting the decoded voice from the processor unit to the latch unit exhibit. System gemäß Anspruch 18, wobei die Prozessoreinheit einen Mikrokontroller oder eine Zentralprozessoreinheit (CPU) aufweist.System according to claim 18, wherein the processor unit is a microcontroller or a central processor unit (CPU). System gemäß Anspruch 18, wobei die Prozessoreinheit ein Wellenformkodierungsverfahren zum Kodieren der Sprachdaten in dem Speicher aufweist.System according to claim 18, wherein the processor unit uses a waveform coding method for Encoding the voice data in the memory. System gemäß Anspruch 22, wobei das Wellenformkodierungsverfahren Code Excited Linear Prediction (CELP) umfasst.System according to claim 22, the waveform encoding method Code Excited Linear Prediction (CELP) includes. System gemäß Anspruch 22, wobei das Wellenformkodierungsverfahren adaptive differenzielle Pulscodemodulation (ADPCM) umfasst.System according to claim 22, wherein the waveform encoding method is adaptive differential pulse code modulation (ADPCM) includes. System gemäß Anspruch 22, wobei das Wellenformkodierungsverfahren differenzielle Pulscodemodulation (DPCM) umfasst.System according to claim 22, wherein the waveform encoding method is differential pulse code modulation (DPCM).
DE10356054A 2003-01-17 2003-12-01 System and method for synthesizing a variety of voices Ceased DE10356054A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW92101050 2003-01-17
TW092101050A TWI226601B (en) 2003-01-17 2003-01-17 System and method of synthesizing a plurality of voices

Publications (1)

Publication Number Publication Date
DE10356054A1 true DE10356054A1 (en) 2004-08-05

Family

ID=29778291

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10356054A Ceased DE10356054A1 (en) 2003-01-17 2003-12-01 System and method for synthesizing a variety of voices

Country Status (4)

Country Link
JP (1) JP2004226968A (en)
DE (1) DE10356054A1 (en)
GB (1) GB2397737B (en)
TW (1) TWI226601B (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR101333685B1 (en) * 2011-12-28 2013-12-03 (주) 반도전기통신 Apparatur and Method for Control the Descrambling Timing of Data Under the M2M Modem
GB2545718A (en) * 2015-12-23 2017-06-28 Nordic Semiconductor Asa Radio transceivers

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4774686A (en) * 1986-03-21 1988-09-27 Rca Licensing Corporation Serial digital signal processing circuitry
JPH0782423B2 (en) * 1987-09-16 1995-09-06 三洋電機株式会社 Data input / output circuit
JPH04371032A (en) * 1991-06-19 1992-12-24 Mitsubishi Electric Corp Digital data processing circuit
JP3052824B2 (en) * 1996-02-19 2000-06-19 日本電気株式会社 Audio playback time adjustment circuit
DE10035965A1 (en) * 2000-07-24 2002-02-21 Infineon Technologies Ag Data stream output method for MPEG decoder of digital TV receiver, involves changing frequency of clock signal used for reading-out data from FIFO memory, based on its storage level
US20020052744A1 (en) * 2000-10-31 2002-05-02 Chaur-Wen Jih Synchronized output speech synthesizer device
JP4396877B2 (en) * 2000-12-14 2010-01-13 コロムビアミュージックエンタテインメント株式会社 Jitter elimination apparatus and digital audio reproduction system
CN1144171C (en) * 2001-04-06 2004-03-31 华邦电子股份有限公司 Synchronous output device with sound synthesis

Also Published As

Publication number Publication date
GB2397737A (en) 2004-07-28
TWI226601B (en) 2005-01-11
GB0328325D0 (en) 2004-01-07
JP2004226968A (en) 2004-08-12
TW200414125A (en) 2004-08-01
GB2397737B (en) 2005-03-09

Similar Documents

Publication Publication Date Title
DE2753277C2 (en) Method and device for speech recognition
DE2953262C2 (en)
DE2659083C2 (en) Method and device for speaker recognition
DE2362050C3 (en) Electronic musical instrument
DE2229149A1 (en) Method of transmitting speech
DE2551632C2 (en) Method for composing voice messages
DE3339288A1 (en) DETECTING DEVICE FOR MICROBREAKS
DE3003385C2 (en) Envelope circuit for an electronic musical instrument
DE60023398T2 (en) Method and apparatus for improving speech recognition accuracy using event-based constraints
DE2637063A1 (en) CHANNEL PROCESSOR
DE2828919C2 (en) Circuit arrangement for a polyphonic electronic musical instrument
WO2012089579A1 (en) Method and device for processing data elements having minimal latency
DE69820497T2 (en) NEURONAL NETWORK AND ITS APPLICATION FOR VOICE RECOGNITION
DE10356054A1 (en) System and method for synthesizing a variety of voices
DE102010018042A1 (en) Analog-to-digital converter (A / D converter) with comparison function for analog signals
DE60214409T2 (en) METHOD AND DEVICE FOR TWO-PHASE BASIC FREQUENCY DETECTION
DE2513127C2 (en) Method for artificially generating a musical sound
DE102010028896A1 (en) Method and device for assigning a plurality of subtasks of a task to a plurality of arithmetic units of a given processor architecture
CN111667846A (en) Blind source separation method and device
EP0340301B1 (en) Digital adaptive transform coding process
DE4029716C2 (en) Voice operated remote control system
US4092495A (en) Speech synthesizing apparatus
Pompe On some entropy methods in data analysis
DE60200289T2 (en) Transition adjustment
CN110299148A (en) Voice fusion method, electronic device and storage medium based on Tensorflow

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection