SU1316030A1

SU1316030A1 - Способ анализа и синтеза речи и устройство дл его осуществлени

Info

Publication number: SU1316030A1
Application number: SU864002918A
Authority: SU
Inventors: Юрий Владимирович Захаров
Original assignee: Акустический институт им.акад.Н.Н.Андреева
Priority date: 1986-01-06
Filing date: 1986-01-06
Publication date: 1987-06-07

Abstract

Изобретение может быть использовано в системах вокодерной телефонии . Цель изобретени - повьш)сиие качества синтеза речи. Устройство, реализующее способ, состоит из источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, бттоков 8 и 11 быстрого преобразовани Фурье, детектора 9 высоты тона, генератора 10 сигналов возбуждени , блока 12 умножени , накапливающего сумматора 13, кодера 14, декодера 15, генератора 16 сигналов возбуждени и цифрового фильтра 17. Введение новых элементов и образование новых св зей между элементами устройства позвол ют достичь поставленную цель путем фильтрации сигнала возбуждени фильтром с передаточной характеристикой, завис щеГ от спектральной огибающей исходного речевого сигнала и обеспе- чинлю це11 минимальную ошибку его восстановлени . Определение параметров спектральной огибающей исходного ре- чевог о сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени позвол ет учесть конкретный вид сигнала возбуждени так, что минимизируетс ошибка синтеза речевого сигнала. 2 с.п.ф-лы, 2 ил. о (Л 5 № со 05 О со I . л/г./

Description

113

Изобретение относитс к анализу и синтезу речи и может, быть использовано в системах вокодерной телефонии ,

Цель изобретени - повышение качества синтеза речи путем фильтрации сигнала возбуждени фильтром с передаточной характеристикой, завис щей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку его восстановлени .

Супщость способа заключаетс в следующем.

Исходный речевой сигнал разбивают на отдельные сегменты

Исходный речевой сигнал разбивают на отдельные сегменты. В течение каждого сегмента определ ют спектр исходного речевого сигнала X (ЬJ,) на наборе частот uj. , k , О,. , , , М- , лежащих в диапазоне частот речевого сигнала, и параметры сигнала возбуждени : параметр тон/щум, определ ющий характер сегмента, и период ос- HOFjHoro тона на вокализованном сегменте . Затем, использу параметры сигнала возбуждени , формируют сигна вотбуждени , ;.1л вокализованных сег- мс}ггон сигнал возбуждени - это пос- -;к донательность коротких импульсов, период следона}1и которых вл етс периодом основного тона, а дл невокализованных сегментов - псевдослу- ча1П1а последовательность импульсов, По сигналу возбужде)1и определ ют комплексно-сонр женнь спектр сигнала возбуждени Р (li- ,) , k О, М-1, где - знак сопр жени . Перемножа атектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , получают взаимный спектр сигналов s (w) -L X Параметры спектральной огибающей исходного речевого сигнала определ ют путем усреднени взаимного спектра s (ы) в разных интервалах частот

Л1-1

Т. Ч (u;)s(uj), m 1,N, krO

где N - число параметров спектральной огибающей исходного речевого сигнала,

а весовые функции 1/(ш) принимают посто нные значени в неперекрывающихс интервалах частот

V., ;

I О, дл других k. Числа 0 определ ют граничные частоты при выделении параметров f :

т tn

0.v,cOj. ...V/v ;

ГО

t) . . , Ь

UJ

V.

Параметры сигнала возб -ждени (параметр тон/шум и период основного тона) и параметры t , m Т. N.

Т №

полученные при анализе, передают в синтезатор, где на основании прин тых данных формируют сигнал возбуждени , который в точности совпадает с сигналом возбуждени , формируемым при анализе. Затем сигнал возбуждени фильтруют в соответствии с параметрами спектральной огибающей исходного речевого сигнала. Передаточна функци фильтра, используемо- го дл фильтрации сигнала возбуждени , определ етс выражением

N

П() 51 (ы,),

ГЛ г1

где С„ /а„;

М-1

А /РЧ)/Ч,(и;,),

При такой передаточной функции H(w) параметры обеспечивают минимизацию ошибки

ЛЛ-1

0

I. /x(wJ - i (wJ/S

VrO

Q где x(uj) - спектр синтезированного речевого сигнала

x(u)) P(to)H(u), На фиг,1 изобралсена структурна схема устройства дл анализа и синте- 5 за речи: на фиг,2 - структурна схема цифрового фильтра.

Устройство состоит из последовательно включенных источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, Анализатор 2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь (АЦП) 6, тактовый генератор 7, первый блок 8 быстрого преобразовани Фурье (БПФ), детектор 9 высоты тона, генератор 10 сигналов возбуждени , второй блок 11 БПФ, блок 12 умножени , накапливающий сумматор 13 и ко313

дер 14, Си 1тс атор 4 содержит последовательно соединенные декодер 15, генератор 16 сигналов возбуждени , цифровой фильтр 17, цифроаналоговый преобразователь (ЦАП) 18 и фильтр 19 нижних частот.

Цифровой фильтр 17 содержит последовательно включенные блок БПФ 20, квадратор 21, накапливающий сумматор 22, блок 23 делени , блок 24 умножени и блок 25 обратного БПФ,

Устройство дл анализа и синтеза речи работает следующ1 М образом.

Исходный речевой сигнал с выхода источника 1 речевого сигнала фильтруетс в фильтре 5 нижних частот и поступает на вход АЩ1 6, управл емого тактовым генератором 7. Цифровые отсчеты к., , К-1 с выхода АЦЦ 6 поступают в первый блок 8 БЦФ и на вход детектора 9 высоты тона. В первом блок 8 БЦФ вычисл етс спектр исходного речевого сигнала

м-

х(иь) И fro

k о, М ,

на частотах i;.. 2irk/MT, где Т - период I-з ти oi счетов в АЦП 6. Детектор 9 высоты тона измер ет параметры сигнала возбуждени : параметр тон/шум и период основН ..го тона . В соответствии с параметром тон/ шум г енератор 10 сигналов возбуждени формирует либо цифров то последовательность импульсов с периодом повторени , равным измеренному периоду основного T0}ia, псевдослучайную цифровую послед(1вательность импульсов , С выхода генератора 10 сигналов вотб ;ден11Я цифровые отсчеты р. , i О, М-1 поступают во второй блок 11 БЦФ, в котором вычисл етс спектр сигнала возбуждени

м

P- e

-juJi, т

С выходов первого В и второго 11 блоков БПФ на входы блока 12 умножени последовательно во времени поступают цифровые отсчеты х(и.; ) и P(w). В блоке 12 умножени эти отсчеты перемножаютс , и на вход накапливающего сумматора 13 последовательно во времени поступают отсчеты взаимного спектра исходного речевого сигнала и си1 иала возбуждени s(w) x(w)(}

04

Блок 12 умножени можно вьтолнйть в виде обыкновенного цифрового уьшо- жител , В этом случае на его первый вход с выхода первого блока

8 БПФ цифровые отсчеты действительных Ci(iju) и мнимых Ь,, (о.) составл ющих спектра x(u).) исходного речевого сигнала должны поступать в следующем пор дке:,., а (и)) ,

Ь(ш), a(u)).,, и т,д. С выхода второго блока 11 БПФ цифровые .отсчеты действительных ap(W|) и мнимых bp(u),) составл ющих спектра Р(ш) сигнала возбуждени должны поступать

в следующем пор дке :,,. а p(uUj) ,

bp(u)), ар(ш), bp(LUj), ao(w, )..., т.е. составл ющие дл каждой частоты ш, должны nocT iiaTb в блок умножени дважды. При этом на, выходе блока y ffloжeни последовательно во времени образуютс произведени

. . .a,(w)ap(w) , a(u))bp(uij,), Ь i.jj)a9(w) , b(wj)bp(w).. . .

Дл каждого k в накапливающем сумматоре 13 вычисл ютс две суммы

a,(ui)ap(u)t) + b(u))bp (w) ;

30

Ь (u()a., (u.) - а (a))bp (uj) ,

вл ющиес соответственно действи- те1П1Ной и мнимой составл ющими про- и г едени спектров х(и )P(u)|) на частоте со и суммируютс по всем

k при V,. k J Vtrf Таким образом,

в накапливающем сумматоре 13 производитс вычисление N параметров спектральной огибающей исходного речево- г о сигнала

.S,-,

1. V(u.)s(i,), m I,N, v-o

Пара 1етры поступают с выхода накапливающего сумматора 13 на один

из нходов кодера 14, Ца другой его вход с выхода детектора 9 высоты тона поступают параметры сигнала возбуждени . Кодер 14 совместно с декодером 15 обеспечивают передачу этих

параметров по каналу 3 св зи, включенному между анализатором 2 и синтезатором 4,

С первого выхода декодера 15 на вход генератора 16 сигналов возбуждеПИЯ поступают параметры тон/шум и период основного тона. Генератор 16 сигналов возбуждени в синтезаторе 4 выполнен идентично генератору 10 сиг51316030

налов возбуждени в анализаторе 2, В соответствии с входными параметрами генератор 16 сигналов возбуждени в синтезаторе 4 формирует в точности такую же последовательность циф5 ж

ровых отсчетов Р. , i О, М-1, как генератор 10 сигналов возбуждени в анализаторе 2, Эта последовательност поступает в цифровой фильтр 17 на вход блока 20 БПФ. В последнем вы- числ етс спектр сигнала возбуждени Р(и,), k О, М-1, С выхода блока 20 БПФ на вход квадратора 21 поочередно поступают цифровые отсчеты действительной (,ц;) и мнимой Ьр(ш. составл ющих спектра P(u |) сигнала возбуждени ...а(и ), р(и., )

ар(Ы|), bp(u)j,)В квадраторе 21

эти составл ющие возвод тс в квадрат и поступают затем в накапливающий сумматор 22, где вычисл ютс коэффициенты

V,r

а Z. а р (ы) Ь К)

:i:

/Р()/

М-1

V

2 r(t)/P(u;)/ , m 1 ,N.

k.O

Цифровые отсчеты а с выхода накапливающего сумматора 22 поступают на первый вход блока 23 делени , на второй вход которого с второго выхода декодера 15 поступают параметры , m 1,N, В блоке делени параметры Е нормируютс на отсчеты а, и с его вькода на первьй вход блока 24 умножени поступают коэффициенты С|т, f 2 блоке умножени спектр сигнала возбуждени P(u)) умножаетс в каждом из диапазонов частот ш., . ш (JJ на

т-1 rri

СВОЙ коэффициент С,„, в результате чего на его выходе формируетс произведение спектра сигнала возбуждени Р(и) на передаточную функцию

N

H(u;,) Z (ш,).

Т.е. спектр синтезированного речевого сигнала

x(wy)

РК)Н(ю)

Р(Ы,) г ,)

дл всех частот ш , k О, М-1. Величины x(u),,) с выхода блока 24 умножени поступают на вход блока обратного БПФ, вычисл юп;его цифровые отсчеты X;, , М-1 синтезированного речевого сигнала, которые далее преобразуютс в ЦАЛ 18 в непрерывный сигнал и затем фильтруютс в фильтре 19 нижних частот, в результате чего на выходе фильтра 19 нижних частот образуетс синтезированный речевой сигнал.

Таким образом, определение параметров спектральной огибающей исходного речевого сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени позвол ет

учесть конкретньй вид сигнала возбуждени так, что минимизируетс ошибка синтеза речевого сигнала, т.е. повышаетс качество синтеза речи.

Например, на вокализованном сегменте речи в т-й полосе анализируемых частот могут оказатьс две гармоники сигнала возбуждени , однако ошибки в воспроизведении спектральной плотности речевого сигнала, выражающейс в том, что синтезированный речевой сигнал мог бы иметь в этой полосе частот спектральную плотность в 2 раза больше, чем у исходного речевого сигнала, не произойдет ввиду учета сигнала возбуждени .

Claims

1. Способ анализа и синтеза речи,

в котором при анализе исходный речевой сигнал разбивают иа отдельные сегменты, на каждом сегменте определ ют параметры сигнала возбуждени , формируют сигнал возбуждени ,

определ ют параметры спектральной

огибающей исходного речевого сигнала, передают параметры, определенные при анализе, принимают эти параметры, формируют сигнал возбуждени , в точности совпадающий с сигналом возбуждени , формируемым при анализе, и синтезируют искусственный речевой сигнал путем фильтрации сигнала возбуждени в соответствии с параметрами спектральной огибаюп1ей исходного речевого сигнала, отличающийс тем, что, с целью повышени качества синтеза речи, при ана713

лизе наход т спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , перемножают спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , а параметры спектральной огибающей исходного речевого сигнала наход т путем усреднени произведени спектра исходного речевого сигнала и комплексно-сопр женного спектра сигнала возбуждени в различных непересекающихс интервалах частот,

2, Устройство дл анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала , анализатор, канал св зи и синтезатор , состо ошй из последовательно соединенных декодера, вход которого вл етс входом синтезатора, генератора сигналов возбуждени ,цифрового фильтра, управл ющий вход которого соединен с вторым выходом декодера , цифроаналогового преобразовател и фильтра нижних частот, выход которого вл етс выходом синтезатора , причем анализатор содержит последовательно включенные фильтр нижних частот, вход которого вл етс входом анализатора, аналого-цифровой преобразователь, управл ющий вход которого соединен с выходом так08

тового генератора, детектор высоты тона, выход которого соединен с входом генератора сигналов возбуждени и первьм входом кодера, выход кото- рого вл етс выходом анализатора, отличающеес тем, что, с целью повьшени качества синтеза речи, в анализатор введены первый блок быстрого преобразовани Фурье,

вход которого соединен с входом детектора высоты тона, и последовательно соединенные второй блок быстрого преобразовани Фурье, вход которого соединен с выходом генератора сигналов возбуждени , блок умножени , второй вход которого соединен с выходом первого блока быстрого преобразовани Фурье, и накапливающий сумматор , выход которого соединен с вторым входом кодера, а цифровой фильтр выполнен в виде последовательно соединенных блока быстрого преобразовани Фурье, вход которого вл етс информационным входом цифрового фильтра , квадратора, накапливающего сумматора , блока делени , второй вход которого вл етс управл ющим входом цифрового фильтра, блока умножени , второй вход которого соединен с выходом блока быстрого преобразовани Фурье, и блока обратного быстрого преобразовани Фурье, выход которого вл етс выходом цифрового фильтра.

фиг. 2

Редактор 0.Головач

Составитель С.Аврин Техред Л.Олийнык

Заказ 2368/54Тираж 345Подписное

ВНИИПИ Государственного комитета СССР

по делам изобретений и открытий 113035, Москва, Ж-35, Раушска наб., д,4/5

,м. «.в.. «. , «- ™,..- ---. --- ----- - i---- - - -

Производственно-полиграфическое предпри тие, г.Ужгород, ул.Проектна , 4

Выход

Корректор ЛЛ1ил1тенко