SU1075300A1 - Способ слоговой компил ции речи - Google Patents

Способ слоговой компил ции речи Download PDF

Info

Publication number
SU1075300A1
SU1075300A1 SU823525639A SU3525639A SU1075300A1 SU 1075300 A1 SU1075300 A1 SU 1075300A1 SU 823525639 A SU823525639 A SU 823525639A SU 3525639 A SU3525639 A SU 3525639A SU 1075300 A1 SU1075300 A1 SU 1075300A1
Authority
SU
USSR - Soviet Union
Prior art keywords
duration
speech
vowels
vowel
sound
Prior art date
Application number
SU823525639A
Other languages
English (en)
Inventor
Аркадий Пинхосович Вайншток
Александр Владимирович Книппер
Игорь Алексеевич Орлов
Владимир Георгиевич Потапов
Original Assignee
Институт Проблем Передачи Информации Ан Ссср
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Институт Проблем Передачи Информации Ан Ссср filed Critical Институт Проблем Передачи Информации Ан Ссср
Priority to SU823525639A priority Critical patent/SU1075300A1/ru
Application granted granted Critical
Publication of SU1075300A1 publication Critical patent/SU1075300A1/ru

Links

Landscapes

  • Telephone Function (AREA)

Abstract

1. СПОСОБ СЛОГОВОЙ КОМПИЛЯЦИИ РЕЧИ по тексту, использующий набор заранее записанных сигна i l .i,:--#K:-J - . -V- . , 1 .Ч S ц г.,; : ...: « и ..:,.-.-ХЧ:л..; S eJits.ij Mrif лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, отличающийс  тем, что, с целью повышени  качества звучани  компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков. 2. Способ по п. 1, отличающийс  тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, S то длительность берут наименьшую, а если гласный, то длительность (Л берут тем бс5льшую, чем больше различи  в характеристиках между типами гласных. сл 00

Description

Изобретение относитс  к приборостроению и может быть использовано дл  синтеза произвольного речевого сообщени . Известны способы компил ции речи из отдельных речевых элементов, которые реализуютс  последовательны соединением аллофонов (частей фонем или дифонов (сочетанием отрезков, двух звуков )1 и С23. Однако указанные способы обладают тем недостатком, что при аллофон ном или дифонном синтезах речи требуютс , соответственно, или сложные программы управлени , осуществл ющие сшивание речи из аллофонов с учетом их контекстной и позиционной вариативности, или большое числ дифонов разнообразного типа, отражаюри-ix коартикул ционные св зи межд двум  соседними звуками. Наиболее близким по технической сущности к изобретению  вл етс  спо соб слоговой компил ции речи по тексту, использующий набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных : гласных фиксированной длительности, в котором прои;звольное сообщение фо мируют последовательным выбором и объединением слогов и отдельных звуков линейным интерполированием их параметров на посто нном временном интервале. Позиционную изменчивость звуков задают контуром основного тона и длительностью гласных и согласных звуков на основе фонети ко-просодического анализа синтезируемого текста . Однако известный способ слоговой компил ции речи не имитирует естест венные коартикул ционные св зи между соедин емыми слогами и звуками приих линейном интерполировании на посто нном временном интервале . Поэтому слогова  компил ци  речи, облада  высокой разборчивость имеет выраженную слоговую структуру что воспринимаетс  слушающими как уху шение качества звучани  компилированной речи. Целью изобретени   в/1 етс  повышение качества звучани  компилиро ванной речи. Поставленна  цель достигаетс  тем, что согласно способу слоговой компил ции речи по тексту, использующему набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных гласных фиксированной длительности, перед согласными звуками слогов форми руют переходные сегменты различной длительности из последующих гласных звуков фиксированной длительности. При этом длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, причем, если этот звук согласный, то длительность берут наименьшую, а если гласный, то тем большую, чем больше различи  в характеристиках между типами гласных. Более высокое качество звучани  компилированной речи по предлагаемому способу объ сн етс  тем, что при сшивании слогов и звуков в слитное речевое сообщение между естественными речевыми элементами формируют переходные сегменты различной длительности из гласного звука последующего слога. Эти переходные сегменты создают искусственную коартикул цию звуков, близкую к естественной, так как дл  тех случаев , когда перестройка артикул торных органов человека более длительна , обеспечиваетс  больша  длительность переходных сегментов. Ка фиг. 1 показано формирование переходов, имитирующих коартикул цию между сшиваемыми базовыми элементами речи; на фиг. 2 - блоксхема системы, реализующей способ слоговой компи л ции речи. Различи  между параметрами гласных , и1Ттерпретируемые фазовыми порт-ретами на плоскс ст х формантных частот F - р2 , рассто ние в этих пространствах. Длительность элементов речи, хран щихс  в пам ти, мс. Если предшествующий звук согласный, то длительность переходного сегмента составл ет 20-30 мс, а если гласный, то 50-120 мс, т.е. длительность переходного гласного составл ет 0,1-0,4 от фиксированной длительности гласных, хран щихс  в пам ти. Способ слоговой компил ции речи мсжет быть реализован в соответствии со структурной схемой, (фиг. 2К В лингвистическом процессоре 1 осуществл ю.т фонетико-просодическое преобразование текстовой записи синтезируемой речи. На выходе этого блока текст представл ют цепочкой открытых слогов и отдельных гласных звуков. Просодический анализатор задает контур основного тона и производит маркировку слогов на ударные, предударные и заударные. В блоке эмул ции эффекта коартикул ции 2 осуществл ют вставку гласных сегментов в цепочку символов с блока 1 в соответствии с предлагаемым способом . В вычислителе временных интервалов 3 формируют временные траектории параметров синтезируемого сообщени  и его просодические характеристики дл  дальТ1ейшего их преобразовани  в речевой сигнал синтезатором 4 вокодерного типа. Базовые г
элементы, которые могут быть пред- ставлены дл  экономии пам ти в параметрическом виде, хран т в блоке 5 пам ти и выэывгиот блоком 3 по мере обраэовани  временных траекторий параметров синтезируемого сообщени . Громкоговоритель 6 осуществл ет преобразование речевого сигнала на выходе синтезатора 4 в акустические колебани .
Использование предлагаемого способа слоговой компил ции речи позволит повысить качество звучани  синтезированной речи.
Текст

Claims (2)

  1. (541(571 1. СПОСОБ СЛОГОВОЙ КОМПИЛЯЦИИ РЕЧИ по тексту, использующий набор заранее записанных сигна лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, отличающийся тем, что, с целью повышения качества звучания компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков.
  2. 2. Способ по π. 1, отличающийся тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, то длительность берут наименьшую, а если гласный, то длительность берут тем большую, чем больше различия в характеристиках между типами гласных.
SU823525639A 1982-12-21 1982-12-21 Способ слоговой компил ции речи SU1075300A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU823525639A SU1075300A1 (ru) 1982-12-21 1982-12-21 Способ слоговой компил ции речи

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU823525639A SU1075300A1 (ru) 1982-12-21 1982-12-21 Способ слоговой компил ции речи

Publications (1)

Publication Number Publication Date
SU1075300A1 true SU1075300A1 (ru) 1984-02-23

Family

ID=21040429

Family Applications (1)

Application Number Title Priority Date Filing Date
SU823525639A SU1075300A1 (ru) 1982-12-21 1982-12-21 Способ слоговой компил ции речи

Country Status (1)

Country Link
SU (1) SU1075300A1 (ru)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1. Патент CLiA № 4278838, кл.Q 10 I 1/00, 1981. 2.Патент FR 1602936, кл. G. 10 L 1/00, 1971. 3.Токура Е. и Сагисаки Е. Синтез по правилам, использующий СГ-слоги и его качество. - Доклады секции речи Акустического общества JP, 1980, с. 371-376. *

Similar Documents

Publication Publication Date Title
US5400434A (en) Voice source for synthetic speech system
ES2204071T3 (es) Sintetizador de habla basado en fomantes que utiliza una concatenacion de semisilabas con transicion independiente por fundido gradual en los dominios de los coeficientes de filtro y de fuentes.
JP3361066B2 (ja) 音声合成方法および装置
JPH031200A (ja) 規則型音声合成装置
US7047194B1 (en) Method and device for co-articulated concatenation of audio segments
US20040054537A1 (en) Text voice synthesis device and program recording medium
US5659664A (en) Speech synthesis with weighted parameters at phoneme boundaries
O'Shaughnessy et al. Diphone speech synthesis
US3532821A (en) Speech synthesizer
SU1075300A1 (ru) Способ слоговой компил ции речи
Varga et al. A technique for using multipulse linear predictive speech synthesis in text-to-speech type systems
KR101029493B1 (ko) 음성 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템
RU2298234C2 (ru) Способ компиляционного фонемного синтеза русской речи и устройство для его реализации
US6112178A (en) Method for synthesizing voiceless consonants
JP3233036B2 (ja) 歌唱音合成装置
JPS5888798A (ja) 音声合成方式
Gerazov et al. A novel quasi-diphone inventory approach to Text-To-Speech synthesis
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPH0642158B2 (ja) 音声合成装置
JPS5914752B2 (ja) 音声合成方式
JPH11161297A (ja) 音声合成方法及び装置
JP3310217B2 (ja) 音声合成方法とその装置
JP2573586B2 (ja) 規則型音声合成装置
SU1599888A1 (ru) Способ компил ционного синтеза речи
O'Shaughnessy Recent progress in automatic text-to-speech synthesis