SU1599888A1 - Method of compilation speech synthesis - Google Patents

Method of compilation speech synthesis Download PDF

Info

Publication number
SU1599888A1
SU1599888A1 SU884410536A SU4410536A SU1599888A1 SU 1599888 A1 SU1599888 A1 SU 1599888A1 SU 884410536 A SU884410536 A SU 884410536A SU 4410536 A SU4410536 A SU 4410536A SU 1599888 A1 SU1599888 A1 SU 1599888A1
Authority
SU
USSR - Soviet Union
Prior art keywords
segments
vowels
speech
compilation
synthesized
Prior art date
Application number
SU884410536A
Other languages
Russian (ru)
Inventor
Альберт Айрапетович Григорян
Карен Оникович Канаян
Original Assignee
Ереванский политехнический институт им.К.Маркса
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ереванский политехнический институт им.К.Маркса filed Critical Ереванский политехнический институт им.К.Маркса
Priority to SU884410536A priority Critical patent/SU1599888A1/en
Application granted granted Critical
Publication of SU1599888A1 publication Critical patent/SU1599888A1/en

Links

Landscapes

  • Machine Translation (AREA)

Abstract

Изобретение относитс  к речевой информатике. Цель изобретени  - повышение натуральности звучани  компилируемых речевых сообщений - достигаетс  стыковкой фрагментов фонограмм заранее записанных дифонов и прот женых гласных звуков, которые ввод т на 20 - 40 мс перед предударными дифонами и на 40 - 60 мс перед ударными. 1 ил.The invention relates to speech informatics. The purpose of the invention is to increase the naturalness of compiled speech messages by connecting the fragments of phonograms of prerecorded difons and extended vowel sounds, which are entered for 20-40 ms before the pre-diphones and 40- 60 ms for the drums. 1 il.

Description

Изобретение относитс  к речевой информатике и приборостроению дл  синтеза речевых сообщений по тексту в системах акустического общени  человека с автоматамиThe invention relates to speech informatics and instrumentation for the synthesis of speech messages in the text in the systems of acoustic communication of a person with automata.

Цель изобретени  - повышение разборчивости и натуральности синтезируемой речи.The purpose of the invention is to increase the intelligibility and naturalness of synthesized speech.

Повыпение натуральности и разборчивости компилируемьпс сообщений достигаетс  стыковкой фрагментов фонограмм , выбираемых из заранее записанных сегментов соответствуюп1их дифонов натуральной речи, содержаний конечную часть предшествующего и начальную часть последующего звуков, общей продолжительностью от 80 до 120 мс. Интонационные свойства высказываний моделируют BCTaBKaNOi из фонограмм , отдельно хран щихс  стационарных участков гласных звуков. При КОМПИЛЯ1ТИИ вставки между дифонами, соответствующими предударным гласным , имеют продолжительность в пределах от 20 до 40 мс, а между дифонами.The compilation of messages achieves naturalness and intelligibility by joining phonogram fragments selected from pre-recorded segments corresponding to their different natural speech phono, the contents of the final part of the preceding and initial part of the subsequent sounds, with a total duration from 80 to 120 ms. The intonational properties of utterances model the BCTaBKaNOi from phonograms, separately stored stationary parts of vowels. In COMPILATION, the inserts between the diphones corresponding to the pre-stressed vowel have a duration ranging from 20 to 40 ms, and between the diphones.

соответствующими ударной гласной, продолжительностью в пределах от 40 до 60 мс.corresponding shock vowel, duration ranging from 40 to 60 ms.

На чертеже представлена блок-схема , по сн юща  способ.The drawing shows a block diagram illustrating the method.

Текст с дополнительными знаками ударений ввод т в текстовый процессор 1, соединенный с посто нными запо- минаюп(ими устройствами 2 и 3, где хран т заранее записанные дифоны и прот жно произнесенные отдельные гласные звуки соответственно.Text with additional stress marks is entered into word processor 1 connected to fixed memory (devices 2 and 3 by them, where they store pre-recorded diphones and long pronounced separate vowel sounds, respectively.

Считываемые фонограммы поблочно через буферное запоминающее устройство 4 соответственно выбранным длительност м преобразуют цифро-аналого- -вым преобразователем 5 и воспроизвод т электроакустическим агрегатом 6.Readable phonograms are block by block through a buffer storage device 4, respectively, the selected durations are converted by a digital-to-analog converter 5 and reproduced by an electro-acoustic unit 6.

Компил ци  сообщений из натуральных дифонов и фрагментов прот жных гласных обеспечивает естественный оттенок и разборчивость синтезируемых сообщений.Compilation of messages from natural diffons and fragments of vowels provides a natural shade and intelligibility of the synthesized messages.

(Л G(Lg

елate

со соwith so

0000

асace

0000

Claims (1)

Формулаизобретени Invention Formula Способ компил ционного синтеза речи включающий воспроизведение отрезков из Заранее выделенных и записанных фрагментов натуральной речи при управлении длительностью отрезков сигналами, формируемыми при транскрибировании синтезируемых текстов в последовательности отрезков, отличающийс  тем, что, с целью повьшени  разборчивости и натуральности синтезируемой речи, вьщел ют и записывают все диЛоны, содержащиеThe method of compilation speech synthesis that includes the reproduction of segments from Pre-allocated and recorded fragments of natural speech while controlling the length of the segments by signals generated by transcribing synthesized texts in a sequence of segments, characterized in that, in order to improve legibility and naturalness of the synthesized speech, all dLones containing конечную часть предшествующего и начальную часть последующего звуков общей продолжительностью в 80-120 мс и изолированные стащ онарные участжи гласных естественной речи, а при воспроизведении синтезируемое сообщение компилируют из дифонов с включением между дифонами, соответствующими предударным гласным, отрезков соответствующих гласных продолжительностью в 20-40 мс и с включением между дифонами, содержащими ударные гласные , отрезков соответствующих гласных продолжительностью в 40-60 мс.the final part of the preceding and the initial part of the subsequent sounds with a total duration of 80-120 ms and isolated strings of natural speech vowels, and at reproduction the synthesized message is compiled from diffons with inclusion between segments, corresponding preliminary vowels, segments of corresponding vowels of 20-40 ms and with the inclusion between diphones containing shock vowels, segments of corresponding vowels with a duration of 40-60 ms. Текс/пTex / n
SU884410536A 1988-04-18 1988-04-18 Method of compilation speech synthesis SU1599888A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU884410536A SU1599888A1 (en) 1988-04-18 1988-04-18 Method of compilation speech synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU884410536A SU1599888A1 (en) 1988-04-18 1988-04-18 Method of compilation speech synthesis

Publications (1)

Publication Number Publication Date
SU1599888A1 true SU1599888A1 (en) 1990-10-15

Family

ID=21368852

Family Applications (1)

Application Number Title Priority Date Filing Date
SU884410536A SU1599888A1 (en) 1988-04-18 1988-04-18 Method of compilation speech synthesis

Country Status (1)

Country Link
SU (1) SU1599888A1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Авторское свидетельство СССР N 1451762, кл. G 10 L 5/02, 1985. Авторское свидетельство СССР N 5 1075300, кл. Г 10 L 5/02 1982. *

Similar Documents

Publication Publication Date Title
US7953600B2 (en) System and method for hybrid speech synthesis
US6308156B1 (en) Microsegment-based speech-synthesis process
Liberman et al. Minimal rules for synthesizing speech
US8775185B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
WO2003065349B1 (en) Text to speech
Krivokapic Prosodic planning in speech production
Jilka et al. Intonational foreign accent: speech technology and foreign language teaching
SU1599888A1 (en) Method of compilation speech synthesis
JPH10510065A (en) Method and device for generating and utilizing diphones for multilingual text-to-speech synthesis
US7529672B2 (en) Speech synthesis using concatenation of speech waveforms
KR101029493B1 (en) Method for controlling duration in speech synthesis
Varga et al. A technique for using multipulse linear predictive speech synthesis in text-to-speech type systems
RU2298234C2 (en) Method for compilation phoneme synthesis of russian speech and device for realization of said method
JP3060276B2 (en) Speech synthesizer
US6112178A (en) Method for synthesizing voiceless consonants
SU1075300A1 (en) Method of syllabic compiling of speech
JPS5914752B2 (en) Speech synthesis method
JPH02251998A (en) Voice synthesizing device
JPS60153099A (en) Rule type voice synthesizer
JP3404776B2 (en) Signal playback device
Klabbers Speech output generation in GoalGetter
Christogiannis et al. Construction of the acoustic inventory for a greek text-to-speech concatenative synthesis system
Morton Naturalness in synthetic speech
JPS60205597A (en) Voice synthesizer
Lee et al. New Promises in Reading by Listening