SU1316030A1 - Способ анализа и синтеза речи и устройство дл его осуществлени - Google Patents

Способ анализа и синтеза речи и устройство дл его осуществлени Download PDF

Info

Publication number
SU1316030A1
SU1316030A1 SU864002918A SU4002918A SU1316030A1 SU 1316030 A1 SU1316030 A1 SU 1316030A1 SU 864002918 A SU864002918 A SU 864002918A SU 4002918 A SU4002918 A SU 4002918A SU 1316030 A1 SU1316030 A1 SU 1316030A1
Authority
SU
USSR - Soviet Union
Prior art keywords
input
output
signal
excitation
excitation signal
Prior art date
Application number
SU864002918A
Other languages
English (en)
Inventor
Юрий Владимирович Захаров
Original Assignee
Акустический институт им.акад.Н.Н.Андреева
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акустический институт им.акад.Н.Н.Андреева filed Critical Акустический институт им.акад.Н.Н.Андреева
Priority to SU864002918A priority Critical patent/SU1316030A1/ru
Application granted granted Critical
Publication of SU1316030A1 publication Critical patent/SU1316030A1/ru

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение может быть использовано в системах вокодерной телефонии . Цель изобретени  - повьш)сиие качества синтеза речи. Устройство, реализующее способ, состоит из источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, бттоков 8 и 11 быстрого преобразовани  Фурье, детектора 9 высоты тона, генератора 10 сигналов возбуждени , блока 12 умножени , накапливающего сумматора 13, кодера 14, декодера 15, генератора 16 сигналов возбуждени  и цифрового фильтра 17. Введение новых элементов и образование новых св зей между элементами устройства позвол ют достичь поставленную цель путем фильтрации сигнала возбуждени  фильтром с передаточной характеристикой, завис щеГ от спектральной огибающей исходного речевого сигнала и обеспе- чинлю це11 минимальную ошибку его восстановлени . Определение параметров спектральной огибающей исходного ре- чевог о сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени  позвол ет учесть конкретный вид сигнала возбуждени  так, что минимизируетс  ошибка синтеза речевого сигнала. 2 с.п.ф-лы, 2 ил. о (Л 5 № со 05 О со I . л/г./

Description

113
Изобретение относитс  к анализу и синтезу речи и может, быть использовано в системах вокодерной телефонии ,
Цель изобретени  - повышение качества синтеза речи путем фильтрации сигнала возбуждени  фильтром с передаточной характеристикой, завис щей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку его восстановлени  .
Супщость способа заключаетс  в следующем.
Исходный речевой сигнал разбивают на отдельные сегменты
Исходный речевой сигнал разбивают на отдельные сегменты. В течение каждого сегмента определ ют спектр исходного речевого сигнала X (ЬJ,) на наборе частот uj. , k , О,. , , , М- , лежащих в диапазоне частот речевого сигнала, и параметры сигнала возбуждени : параметр тон/щум, определ ющий характер сегмента, и период ос- HOFjHoro тона на вокализованном сегменте . Затем, использу  параметры сигнала возбуждени , формируют сигна вотбуждени , ;.1л  вокализованных сег- мс}ггон сигнал возбуждени  - это пос- -;к донательность коротких импульсов, период следона}1и  которых  вл етс  периодом основного тона, а дл  невокализованных сегментов - псевдослу- ча1П1а  последовательность импульсов, По сигналу возбужде)1и  определ ют комплексно-сонр женнь спектр сигнала возбуждени  Р (li- ,) , k О, М-1, где - знак сопр жени . Перемножа  атектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , получают взаимный спектр сигналов s (w) -L X Параметры спектральной огибающей исходного речевого сигнала определ ют путем усреднени  взаимного спектра s (ы) в разных интервалах частот
Л1-1
Т. Ч (u;)s(uj), m 1,N, krO
где N - число параметров спектральной огибающей исходного речевого сигнала,
а весовые функции 1/(ш) принимают посто нные значени  в неперекрывающихс  интервалах частот
V., ;
I О, дл  других k. Числа 0 определ ют граничные частоты при выделении параметров f :
т tn
0.v,cOj. ...V/v ;
ГО
t) . . , Ь
UJ
V.
Параметры сигнала возб -ждени  (параметр тон/шум и период основного тона) и параметры t , m Т. N.
Т №
полученные при анализе, передают в синтезатор, где на основании прин тых данных формируют сигнал возбуждени , который в точности совпадает с сигналом возбуждени , формируемым при анализе. Затем сигнал возбуждени  фильтруют в соответствии с параметрами спектральной огибающей исходного речевого сигнала. Передаточна  функци  фильтра, используемо- го дл  фильтрации сигнала возбуждени , определ етс  выражением
N
П() 51 (ы,),
ГЛ г1
где С„ /а„;
М-1
А /РЧ)/Ч,(и;,),
При такой передаточной функции H(w) параметры обеспечивают минимизацию ошибки
ЛЛ-1
0
I. /x(wJ - i (wJ/S
VrO
Q где x(uj) - спектр синтезированного речевого сигнала
x(u)) P(to)H(u), На фиг,1 изобралсена структурна  схема устройства дл  анализа и синте- 5 за речи: на фиг,2 - структурна  схема цифрового фильтра.
Устройство состоит из последовательно включенных источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, Анализатор 2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь (АЦП) 6, тактовый генератор 7, первый блок 8 быстрого преобразовани  Фурье (БПФ), детектор 9 высоты тона, генератор 10 сигналов возбуждени , второй блок 11 БПФ, блок 12 умножени , накапливающий сумматор 13 и ко313
дер 14, Си 1тс атор 4 содержит последовательно соединенные декодер 15, генератор 16 сигналов возбуждени , цифровой фильтр 17, цифроаналоговый преобразователь (ЦАП) 18 и фильтр 19 нижних частот.
Цифровой фильтр 17 содержит последовательно включенные блок БПФ 20, квадратор 21, накапливающий сумматор 22, блок 23 делени , блок 24 умножени  и блок 25 обратного БПФ,
Устройство дл  анализа и синтеза речи работает следующ1 М образом.
Исходный речевой сигнал с выхода источника 1 речевого сигнала фильтруетс  в фильтре 5 нижних частот и поступает на вход АЩ1 6, управл емого тактовым генератором 7. Цифровые отсчеты к., , К-1 с выхода АЦЦ 6 поступают в первый блок 8 БЦФ и на вход детектора 9 высоты тона. В первом блок 8 БЦФ вычисл етс  спектр исходного речевого сигнала
м-
х(иь) И fro
k о, М ,
на частотах i;.. 2irk/MT, где Т - период I-з ти  oi счетов в АЦП 6. Детектор 9 высоты тона измер ет параметры сигнала возбуждени : параметр тон/шум и период основН ..го тона . В соответствии с параметром тон/ шум г енератор 10 сигналов возбуждени  формирует либо цифров то последовательность импульсов с периодом повторени , равным измеренному периоду основного T0}ia, псевдослучайную цифровую послед(1вательность импульсов , С выхода генератора 10 сигналов вотб ;ден11Я цифровые отсчеты р. , i О, М-1 поступают во второй блок 11 БЦФ, в котором вычисл етс  спектр сигнала возбуждени 
м
P- e
-juJi, т
С выходов первого В и второго 11 блоков БПФ на входы блока 12 умножени  последовательно во времени поступают цифровые отсчеты х(и.; ) и P(w). В блоке 12 умножени  эти отсчеты перемножаютс , и на вход накапливающего сумматора 13 последовательно во времени поступают отсчеты взаимного спектра исходного речевого сигнала и си1 иала возбуждени  s(w) x(w)(}
04
Блок 12 умножени  можно вьтолнйть в виде обыкновенного цифрового уьшо- жител , В этом случае на его первый вход с выхода первого блока
8 БПФ цифровые отсчеты действительных Ci(iju) и мнимых Ь,, (о.) составл ющих спектра x(u).) исходного речевого сигнала должны поступать в следующем пор дке:,., а (и)) ,
Ь(ш), a(u)).,, и т,д. С выхода второго блока 11 БПФ цифровые .отсчеты действительных ap(W|) и мнимых bp(u),) составл ющих спектра Р(ш) сигнала возбуждени  должны поступать
в следующем пор дке :,,. а p(uUj) ,
bp(u)), ар(ш), bp(LUj), ao(w, )..., т.е. составл ющие дл  каждой частоты ш, должны nocT iiaTb в блок умножени  дважды. При этом на, выходе блока y ffloжeни  последовательно во времени образуютс  произведени 
. . .a,(w)ap(w) , a(u))bp(uij,), Ь i.jj)a9(w) , b(wj)bp(w).. . .
Дл  каждого k в накапливающем сумматоре 13 вычисл ютс  две суммы
a,(ui)ap(u)t) + b(u))bp (w) ;
30
Ь (u()a., (u.) - а (a))bp (uj) ,
 вл ющиес  соответственно действи- те1П1Ной и мнимой составл ющими про- и г едени  спектров х(и )P(u)|) на частоте со и суммируютс  по всем
k при V,. k J Vtrf Таким образом,
в накапливающем сумматоре 13 производитс  вычисление N параметров спектральной огибающей исходного речево- г о сигнала
.S,-,
1. V(u.)s(i,), m I,N, v-o
Пара 1етры поступают с выхода накапливающего сумматора 13 на один
из нходов кодера 14, Ца другой его вход с выхода детектора 9 высоты тона поступают параметры сигнала возбуждени . Кодер 14 совместно с декодером 15 обеспечивают передачу этих
параметров по каналу 3 св зи, включенному между анализатором 2 и синтезатором 4,
С первого выхода декодера 15 на вход генератора 16 сигналов возбуждеПИЯ поступают параметры тон/шум и период основного тона. Генератор 16 сигналов возбуждени  в синтезаторе 4 выполнен идентично генератору 10 сиг51316030
налов возбуждени  в анализаторе 2, В соответствии с входными параметрами генератор 16 сигналов возбуждени  в синтезаторе 4 формирует в точности такую же последовательность циф5 ж
ровых отсчетов Р. , i О, М-1, как генератор 10 сигналов возбуждени  в анализаторе 2, Эта последовательност поступает в цифровой фильтр 17 на вход блока 20 БПФ. В последнем вы- числ етс  спектр сигнала возбуждени  Р(и,), k О, М-1, С выхода блока 20 БПФ на вход квадратора 21 поочередно поступают цифровые отсчеты действительной  (,ц;) и мнимой Ьр(ш. составл ющих спектра P(u |) сигнала возбуждени  ...а(и ), р(и., )
ар(Ы|), bp(u)j,)В квадраторе 21
эти составл ющие возвод тс  в квадрат и поступают затем в накапливающий сумматор 22, где вычисл ютс  коэффициенты
V,r
а Z. а р (ы) Ь К)
:i:
/Р()/
М-1
V
2 r(t)/P(u;)/ , m 1 ,N.
k.O
Цифровые отсчеты а с выхода накапливающего сумматора 22 поступают на первый вход блока 23 делени , на второй вход которого с второго выхода декодера 15 поступают параметры , m 1,N, В блоке делени  параметры Е нормируютс  на отсчеты а, и с его вькода на первьй вход блока 24 умножени  поступают коэффициенты С|т, f 2 блоке умножени  спектр сигнала возбуждени  P(u)) умножаетс  в каждом из диапазонов частот ш., . ш (JJ на
т-1 rri
СВОЙ коэффициент С,„, в результате чего на его выходе формируетс  произведение спектра сигнала возбуждени  Р(и) на передаточную функцию
N
H(u;,) Z (ш,).
Т.е. спектр синтезированного речевого сигнала
x(wy)
РК)Н(ю)
Р(Ы,) г ,)
дл  всех частот ш , k О, М-1. Величины x(u),,) с выхода блока 24 умножени  поступают на вход блока обратного БПФ, вычисл юп;его цифровые отсчеты X;, , М-1 синтезированного речевого сигнала, которые далее преобразуютс  в ЦАЛ 18 в непрерывный сигнал и затем фильтруютс  в фильтре 19 нижних частот, в результате чего на выходе фильтра 19 нижних частот образуетс  синтезированный речевой сигнал.
Таким образом, определение параметров спектральной огибающей исходного речевого сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени  позвол ет
учесть конкретньй вид сигнала возбуждени  так, что минимизируетс  ошибка синтеза речевого сигнала, т.е. повышаетс  качество синтеза речи.
Например, на вокализованном сегменте речи в т-й полосе анализируемых частот могут оказатьс  две гармоники сигнала возбуждени , однако ошибки в воспроизведении спектральной плотности речевого сигнала, выражающейс  в том, что синтезированный речевой сигнал мог бы иметь в этой полосе частот спектральную плотность в 2 раза больше, чем у исходного речевого сигнала, не произойдет ввиду учета сигнала возбуждени .

Claims (1)

1. Способ анализа и синтеза речи,
в котором при анализе исходный речевой сигнал разбивают иа отдельные сегменты, на каждом сегменте определ ют параметры сигнала возбуждени , формируют сигнал возбуждени ,
определ ют параметры спектральной
огибающей исходного речевого сигнала, передают параметры, определенные при анализе, принимают эти параметры, формируют сигнал возбуждени , в точности совпадающий с сигналом возбуждени , формируемым при анализе, и синтезируют искусственный речевой сигнал путем фильтрации сигнала возбуждени  в соответствии с параметрами спектральной огибаюп1ей исходного речевого сигнала, отличающийс  тем, что, с целью повышени  качества синтеза речи, при ана713
лизе наход т спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , перемножают спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , а параметры спектральной огибающей исходного речевого сигнала наход т путем усреднени  произведени  спектра исходного речевого сигнала и комплексно-сопр женного спектра сигнала возбуждени  в различных непересекающихс  интервалах частот,
2, Устройство дл  анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала , анализатор, канал св зи и синтезатор , состо ошй из последовательно соединенных декодера, вход которого  вл етс  входом синтезатора, генератора сигналов возбуждени ,цифрового фильтра, управл ющий вход которого соединен с вторым выходом декодера , цифроаналогового преобразовател  и фильтра нижних частот, выход которого  вл етс  выходом синтезатора , причем анализатор содержит последовательно включенные фильтр нижних частот, вход которого  вл етс  входом анализатора, аналого-цифровой преобразователь, управл ющий вход которого соединен с выходом так08
тового генератора, детектор высоты тона, выход которого соединен с входом генератора сигналов возбуждени  и первьм входом кодера, выход кото- рого  вл етс  выходом анализатора, отличающеес  тем, что, с целью повьшени  качества синтеза речи, в анализатор введены первый блок быстрого преобразовани  Фурье,
вход которого соединен с входом детектора высоты тона, и последовательно соединенные второй блок быстрого преобразовани  Фурье, вход которого соединен с выходом генератора сигналов возбуждени , блок умножени , второй вход которого соединен с выходом первого блока быстрого преобразовани  Фурье, и накапливающий сумматор , выход которого соединен с вторым входом кодера, а цифровой фильтр выполнен в виде последовательно соединенных блока быстрого преобразовани  Фурье, вход которого  вл етс  информационным входом цифрового фильтра , квадратора, накапливающего сумматора , блока делени , второй вход которого  вл етс  управл ющим входом цифрового фильтра, блока умножени , второй вход которого соединен с выходом блока быстрого преобразовани  Фурье, и блока обратного быстрого преобразовани  Фурье, выход которого  вл етс  выходом цифрового фильтра.
фиг. 2
Редактор 0.Головач
Составитель С.Аврин Техред Л.Олийнык
Заказ 2368/54Тираж 345Подписное
ВНИИПИ Государственного комитета СССР
по делам изобретений и открытий 113035, Москва, Ж-35, Раушска  наб., д,4/5
,м. «.в.. «. , «- ™,..- ---. --- ----- - i---- - - -
Производственно-полиграфическое предпри тие, г.Ужгород, ул.Проектна , 4
Выход
Корректор ЛЛ1ил1тенко
SU864002918A 1986-01-06 1986-01-06 Способ анализа и синтеза речи и устройство дл его осуществлени SU1316030A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU864002918A SU1316030A1 (ru) 1986-01-06 1986-01-06 Способ анализа и синтеза речи и устройство дл его осуществлени

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU864002918A SU1316030A1 (ru) 1986-01-06 1986-01-06 Способ анализа и синтеза речи и устройство дл его осуществлени

Publications (1)

Publication Number Publication Date
SU1316030A1 true SU1316030A1 (ru) 1987-06-07

Family

ID=21214649

Family Applications (1)

Application Number Title Priority Date Filing Date
SU864002918A SU1316030A1 (ru) 1986-01-06 1986-01-06 Способ анализа и синтеза речи и устройство дл его осуществлени

Country Status (1)

Country Link
SU (1) SU1316030A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2547220C2 (ru) * 2009-10-21 2015-04-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации
RU2606171C2 (ru) * 2011-01-05 2017-01-10 Конинклейке Филипс Электроникс Н.В. Оценка изолирующих качеств обтуратора для ушного канала

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Авторское свидетельство СССР № 570082, кл. G 10 L 7/06, 1977. Патент GB Р 1485803, кл. G 01 L 7/06, 1974. ,(54) СПОСОБ АПАЛИЗА И СИНТЕЗА РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2547220C2 (ru) * 2009-10-21 2015-04-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации
RU2606171C2 (ru) * 2011-01-05 2017-01-10 Конинклейке Филипс Электроникс Н.В. Оценка изолирующих качеств обтуратора для ушного канала

Similar Documents

Publication Publication Date Title
EP0259950B1 (en) Digital speech sinusoidal vocoder with transmission of only a subset of harmonics
US4301329A (en) Speech analysis and synthesis apparatus
CA1065490A (en) Emphasis controlled speech synthesizer
US3566035A (en) Real time cepstrum analyzer
NL8020114A (nl) Residu geeexciteerd voor spellend spraakcodeerstelsel.
US3360610A (en) Bandwidth compression utilizing magnitude and phase coded signals representative of the input signal
JPS6131658B2 (ru)
JPS62234435A (ja) 符号化音声の復号化方式
EP0137532A2 (en) Multi-pulse excited linear predictive speech coder
US3909533A (en) Method and apparatus for the analysis and synthesis of speech signals
CA1242279A (en) Speech signal processor
US5048088A (en) Linear predictive speech analysis-synthesis apparatus
CA1172366A (en) Methods and apparatus for encoding and constructing signals
SU1316030A1 (ru) Способ анализа и синтеза речи и устройство дл его осуществлени
US3431362A (en) Voice-excited,bandwidth reduction system employing pitch frequency pulses generated by unencoded baseband signal
US4064363A (en) Vocoder systems providing wave form analysis and synthesis using fourier transform representative signals
FI98481C (fi) Menetelmä ja laite analogisen sisääntulosignaalin muuttamiseksi ohjauskoodeiksi ja vastaavan ulostulosignaalin syntetisoimiseksi näiden ohjauskoodien ohjauksen alaisena
US3448216A (en) Vocoder system
US3083266A (en) Vocoder apparatus
JPS5816297A (ja) 音声合成方式
JP2615991B2 (ja) 線形予測型音声分析合成装置
SU1434487A1 (ru) Способ анализа и синтеза речи и устройство дл его осуществлени
SU533966A1 (ru) Синтезатор речи
SU1476612A2 (ru) Низкоскоростной дельта-модул тор
SU1005321A2 (ru) Устройство дл измерени уровн шума в паузах речи