SU1599888A1 - Method of compilation speech synthesis - Google Patents
Method of compilation speech synthesis Download PDFInfo
- Publication number
- SU1599888A1 SU1599888A1 SU884410536A SU4410536A SU1599888A1 SU 1599888 A1 SU1599888 A1 SU 1599888A1 SU 884410536 A SU884410536 A SU 884410536A SU 4410536 A SU4410536 A SU 4410536A SU 1599888 A1 SU1599888 A1 SU 1599888A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- segments
- vowels
- speech
- compilation
- synthesized
- Prior art date
Links
Landscapes
- Machine Translation (AREA)
Abstract
Изобретение относитс к речевой информатике. Цель изобретени - повышение натуральности звучани компилируемых речевых сообщений - достигаетс стыковкой фрагментов фонограмм заранее записанных дифонов и прот женых гласных звуков, которые ввод т на 20 - 40 мс перед предударными дифонами и на 40 - 60 мс перед ударными. 1 ил.The invention relates to speech informatics. The purpose of the invention is to increase the naturalness of compiled speech messages by connecting the fragments of phonograms of prerecorded difons and extended vowel sounds, which are entered for 20-40 ms before the pre-diphones and 40- 60 ms for the drums. 1 il.
Description
Изобретение относитс к речевой информатике и приборостроению дл синтеза речевых сообщений по тексту в системах акустического общени человека с автоматамиThe invention relates to speech informatics and instrumentation for the synthesis of speech messages in the text in the systems of acoustic communication of a person with automata.
Цель изобретени - повышение разборчивости и натуральности синтезируемой речи.The purpose of the invention is to increase the intelligibility and naturalness of synthesized speech.
Повыпение натуральности и разборчивости компилируемьпс сообщений достигаетс стыковкой фрагментов фонограмм , выбираемых из заранее записанных сегментов соответствуюп1их дифонов натуральной речи, содержаний конечную часть предшествующего и начальную часть последующего звуков, общей продолжительностью от 80 до 120 мс. Интонационные свойства высказываний моделируют BCTaBKaNOi из фонограмм , отдельно хран щихс стационарных участков гласных звуков. При КОМПИЛЯ1ТИИ вставки между дифонами, соответствующими предударным гласным , имеют продолжительность в пределах от 20 до 40 мс, а между дифонами.The compilation of messages achieves naturalness and intelligibility by joining phonogram fragments selected from pre-recorded segments corresponding to their different natural speech phono, the contents of the final part of the preceding and initial part of the subsequent sounds, with a total duration from 80 to 120 ms. The intonational properties of utterances model the BCTaBKaNOi from phonograms, separately stored stationary parts of vowels. In COMPILATION, the inserts between the diphones corresponding to the pre-stressed vowel have a duration ranging from 20 to 40 ms, and between the diphones.
соответствующими ударной гласной, продолжительностью в пределах от 40 до 60 мс.corresponding shock vowel, duration ranging from 40 to 60 ms.
На чертеже представлена блок-схема , по сн юща способ.The drawing shows a block diagram illustrating the method.
Текст с дополнительными знаками ударений ввод т в текстовый процессор 1, соединенный с посто нными запо- минаюп(ими устройствами 2 и 3, где хран т заранее записанные дифоны и прот жно произнесенные отдельные гласные звуки соответственно.Text with additional stress marks is entered into word processor 1 connected to fixed memory (devices 2 and 3 by them, where they store pre-recorded diphones and long pronounced separate vowel sounds, respectively.
Считываемые фонограммы поблочно через буферное запоминающее устройство 4 соответственно выбранным длительност м преобразуют цифро-аналого- -вым преобразователем 5 и воспроизвод т электроакустическим агрегатом 6.Readable phonograms are block by block through a buffer storage device 4, respectively, the selected durations are converted by a digital-to-analog converter 5 and reproduced by an electro-acoustic unit 6.
Компил ци сообщений из натуральных дифонов и фрагментов прот жных гласных обеспечивает естественный оттенок и разборчивость синтезируемых сообщений.Compilation of messages from natural diffons and fragments of vowels provides a natural shade and intelligibility of the synthesized messages.
(Л G(Lg
елate
со соwith so
0000
асace
0000
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU884410536A SU1599888A1 (en) | 1988-04-18 | 1988-04-18 | Method of compilation speech synthesis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU884410536A SU1599888A1 (en) | 1988-04-18 | 1988-04-18 | Method of compilation speech synthesis |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1599888A1 true SU1599888A1 (en) | 1990-10-15 |
Family
ID=21368852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU884410536A SU1599888A1 (en) | 1988-04-18 | 1988-04-18 | Method of compilation speech synthesis |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1599888A1 (en) |
-
1988
- 1988-04-18 SU SU884410536A patent/SU1599888A1/en active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР N 1451762, кл. G 10 L 5/02, 1985. Авторское свидетельство СССР N 5 1075300, кл. Г 10 L 5/02 1982. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7953600B2 (en) | System and method for hybrid speech synthesis | |
US6308156B1 (en) | Microsegment-based speech-synthesis process | |
Liberman et al. | Minimal rules for synthesizing speech | |
US8775185B2 (en) | Speech samples library for text-to-speech and methods and apparatus for generating and using same | |
WO2003065349B1 (en) | Text to speech | |
Krivokapic | Prosodic planning in speech production | |
Jilka et al. | Intonational foreign accent: speech technology and foreign language teaching | |
SU1599888A1 (en) | Method of compilation speech synthesis | |
JPH10510065A (en) | Method and device for generating and utilizing diphones for multilingual text-to-speech synthesis | |
US7529672B2 (en) | Speech synthesis using concatenation of speech waveforms | |
KR101029493B1 (en) | Method for controlling duration in speech synthesis | |
Varga et al. | A technique for using multipulse linear predictive speech synthesis in text-to-speech type systems | |
RU2298234C2 (en) | Method for compilation phoneme synthesis of russian speech and device for realization of said method | |
JP3060276B2 (en) | Speech synthesizer | |
US6112178A (en) | Method for synthesizing voiceless consonants | |
SU1075300A1 (en) | Method of syllabic compiling of speech | |
JPS5914752B2 (en) | Speech synthesis method | |
JPH02251998A (en) | Voice synthesizing device | |
JPS60153099A (en) | Rule type voice synthesizer | |
JP3404776B2 (en) | Signal playback device | |
Klabbers | Speech output generation in GoalGetter | |
Christogiannis et al. | Construction of the acoustic inventory for a greek text-to-speech concatenative synthesis system | |
Morton | Naturalness in synthetic speech | |
JPS60205597A (en) | Voice synthesizer | |
Lee et al. | New Promises in Reading by Listening |