SU1316030A1 - Способ анализа и синтеза речи и устройство дл его осуществлени - Google Patents
Способ анализа и синтеза речи и устройство дл его осуществлени Download PDFInfo
- Publication number
- SU1316030A1 SU1316030A1 SU864002918A SU4002918A SU1316030A1 SU 1316030 A1 SU1316030 A1 SU 1316030A1 SU 864002918 A SU864002918 A SU 864002918A SU 4002918 A SU4002918 A SU 4002918A SU 1316030 A1 SU1316030 A1 SU 1316030A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- input
- output
- signal
- excitation
- excitation signal
- Prior art date
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение может быть использовано в системах вокодерной телефонии . Цель изобретени - повьш)сиие качества синтеза речи. Устройство, реализующее способ, состоит из источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, бттоков 8 и 11 быстрого преобразовани Фурье, детектора 9 высоты тона, генератора 10 сигналов возбуждени , блока 12 умножени , накапливающего сумматора 13, кодера 14, декодера 15, генератора 16 сигналов возбуждени и цифрового фильтра 17. Введение новых элементов и образование новых св зей между элементами устройства позвол ют достичь поставленную цель путем фильтрации сигнала возбуждени фильтром с передаточной характеристикой, завис щеГ от спектральной огибающей исходного речевого сигнала и обеспе- чинлю це11 минимальную ошибку его восстановлени . Определение параметров спектральной огибающей исходного ре- чевог о сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени позвол ет учесть конкретный вид сигнала возбуждени так, что минимизируетс ошибка синтеза речевого сигнала. 2 с.п.ф-лы, 2 ил. о (Л 5 № со 05 О со I . л/г./
Description
113
Изобретение относитс к анализу и синтезу речи и может, быть использовано в системах вокодерной телефонии ,
Цель изобретени - повышение качества синтеза речи путем фильтрации сигнала возбуждени фильтром с передаточной характеристикой, завис щей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку его восстановлени .
Супщость способа заключаетс в следующем.
Исходный речевой сигнал разбивают на отдельные сегменты
Исходный речевой сигнал разбивают на отдельные сегменты. В течение каждого сегмента определ ют спектр исходного речевого сигнала X (ЬJ,) на наборе частот uj. , k , О,. , , , М- , лежащих в диапазоне частот речевого сигнала, и параметры сигнала возбуждени : параметр тон/щум, определ ющий характер сегмента, и период ос- HOFjHoro тона на вокализованном сегменте . Затем, использу параметры сигнала возбуждени , формируют сигна вотбуждени , ;.1л вокализованных сег- мс}ггон сигнал возбуждени - это пос- -;к донательность коротких импульсов, период следона}1и которых вл етс периодом основного тона, а дл невокализованных сегментов - псевдослу- ча1П1а последовательность импульсов, По сигналу возбужде)1и определ ют комплексно-сонр женнь спектр сигнала возбуждени Р (li- ,) , k О, М-1, где - знак сопр жени . Перемножа атектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , получают взаимный спектр сигналов s (w) -L X Параметры спектральной огибающей исходного речевого сигнала определ ют путем усреднени взаимного спектра s (ы) в разных интервалах частот
Л1-1
Т. Ч (u;)s(uj), m 1,N, krO
где N - число параметров спектральной огибающей исходного речевого сигнала,
а весовые функции 1/(ш) принимают посто нные значени в неперекрывающихс интервалах частот
V., ;
I О, дл других k. Числа 0 определ ют граничные частоты при выделении параметров f :
т tn
0.v,cOj. ...V/v ;
ГО
t) . . , Ь
UJ
V.
Параметры сигнала возб -ждени (параметр тон/шум и период основного тона) и параметры t , m Т. N.
Т №
полученные при анализе, передают в синтезатор, где на основании прин тых данных формируют сигнал возбуждени , который в точности совпадает с сигналом возбуждени , формируемым при анализе. Затем сигнал возбуждени фильтруют в соответствии с параметрами спектральной огибающей исходного речевого сигнала. Передаточна функци фильтра, используемо- го дл фильтрации сигнала возбуждени , определ етс выражением
N
П() 51 (ы,),
ГЛ г1
где С„ /а„;
М-1
А /РЧ)/Ч,(и;,),
При такой передаточной функции H(w) параметры обеспечивают минимизацию ошибки
ЛЛ-1
0
I. /x(wJ - i (wJ/S
VrO
Q где x(uj) - спектр синтезированного речевого сигнала
x(u)) P(to)H(u), На фиг,1 изобралсена структурна схема устройства дл анализа и синте- 5 за речи: на фиг,2 - структурна схема цифрового фильтра.
Устройство состоит из последовательно включенных источника 1 речевого сигнала, анализатора 2, канала 3 св зи и синтезатора 4, Анализатор 2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь (АЦП) 6, тактовый генератор 7, первый блок 8 быстрого преобразовани Фурье (БПФ), детектор 9 высоты тона, генератор 10 сигналов возбуждени , второй блок 11 БПФ, блок 12 умножени , накапливающий сумматор 13 и ко313
дер 14, Си 1тс атор 4 содержит последовательно соединенные декодер 15, генератор 16 сигналов возбуждени , цифровой фильтр 17, цифроаналоговый преобразователь (ЦАП) 18 и фильтр 19 нижних частот.
Цифровой фильтр 17 содержит последовательно включенные блок БПФ 20, квадратор 21, накапливающий сумматор 22, блок 23 делени , блок 24 умножени и блок 25 обратного БПФ,
Устройство дл анализа и синтеза речи работает следующ1 М образом.
Исходный речевой сигнал с выхода источника 1 речевого сигнала фильтруетс в фильтре 5 нижних частот и поступает на вход АЩ1 6, управл емого тактовым генератором 7. Цифровые отсчеты к., , К-1 с выхода АЦЦ 6 поступают в первый блок 8 БЦФ и на вход детектора 9 высоты тона. В первом блок 8 БЦФ вычисл етс спектр исходного речевого сигнала
м-
х(иь) И fro
k о, М ,
на частотах i;.. 2irk/MT, где Т - период I-з ти oi счетов в АЦП 6. Детектор 9 высоты тона измер ет параметры сигнала возбуждени : параметр тон/шум и период основН ..го тона . В соответствии с параметром тон/ шум г енератор 10 сигналов возбуждени формирует либо цифров то последовательность импульсов с периодом повторени , равным измеренному периоду основного T0}ia, псевдослучайную цифровую послед(1вательность импульсов , С выхода генератора 10 сигналов вотб ;ден11Я цифровые отсчеты р. , i О, М-1 поступают во второй блок 11 БЦФ, в котором вычисл етс спектр сигнала возбуждени
м
P- e
-juJi, т
С выходов первого В и второго 11 блоков БПФ на входы блока 12 умножени последовательно во времени поступают цифровые отсчеты х(и.; ) и P(w). В блоке 12 умножени эти отсчеты перемножаютс , и на вход накапливающего сумматора 13 последовательно во времени поступают отсчеты взаимного спектра исходного речевого сигнала и си1 иала возбуждени s(w) x(w)(}
04
Блок 12 умножени можно вьтолнйть в виде обыкновенного цифрового уьшо- жител , В этом случае на его первый вход с выхода первого блока
8 БПФ цифровые отсчеты действительных Ci(iju) и мнимых Ь,, (о.) составл ющих спектра x(u).) исходного речевого сигнала должны поступать в следующем пор дке:,., а (и)) ,
Ь(ш), a(u)).,, и т,д. С выхода второго блока 11 БПФ цифровые .отсчеты действительных ap(W|) и мнимых bp(u),) составл ющих спектра Р(ш) сигнала возбуждени должны поступать
в следующем пор дке :,,. а p(uUj) ,
bp(u)), ар(ш), bp(LUj), ao(w, )..., т.е. составл ющие дл каждой частоты ш, должны nocT iiaTb в блок умножени дважды. При этом на, выходе блока y ffloжeни последовательно во времени образуютс произведени
. . .a,(w)ap(w) , a(u))bp(uij,), Ь i.jj)a9(w) , b(wj)bp(w).. . .
Дл каждого k в накапливающем сумматоре 13 вычисл ютс две суммы
a,(ui)ap(u)t) + b(u))bp (w) ;
30
Ь (u()a., (u.) - а (a))bp (uj) ,
вл ющиес соответственно действи- те1П1Ной и мнимой составл ющими про- и г едени спектров х(и )P(u)|) на частоте со и суммируютс по всем
k при V,. k J Vtrf Таким образом,
в накапливающем сумматоре 13 производитс вычисление N параметров спектральной огибающей исходного речево- г о сигнала
.S,-,
1. V(u.)s(i,), m I,N, v-o
Пара 1етры поступают с выхода накапливающего сумматора 13 на один
из нходов кодера 14, Ца другой его вход с выхода детектора 9 высоты тона поступают параметры сигнала возбуждени . Кодер 14 совместно с декодером 15 обеспечивают передачу этих
параметров по каналу 3 св зи, включенному между анализатором 2 и синтезатором 4,
С первого выхода декодера 15 на вход генератора 16 сигналов возбуждеПИЯ поступают параметры тон/шум и период основного тона. Генератор 16 сигналов возбуждени в синтезаторе 4 выполнен идентично генератору 10 сиг51316030
налов возбуждени в анализаторе 2, В соответствии с входными параметрами генератор 16 сигналов возбуждени в синтезаторе 4 формирует в точности такую же последовательность циф5 ж
ровых отсчетов Р. , i О, М-1, как генератор 10 сигналов возбуждени в анализаторе 2, Эта последовательност поступает в цифровой фильтр 17 на вход блока 20 БПФ. В последнем вы- числ етс спектр сигнала возбуждени Р(и,), k О, М-1, С выхода блока 20 БПФ на вход квадратора 21 поочередно поступают цифровые отсчеты действительной (,ц;) и мнимой Ьр(ш. составл ющих спектра P(u |) сигнала возбуждени ...а(и ), р(и., )
ар(Ы|), bp(u)j,)В квадраторе 21
эти составл ющие возвод тс в квадрат и поступают затем в накапливающий сумматор 22, где вычисл ютс коэффициенты
V,r
а Z. а р (ы) Ь К)
:i:
/Р()/
М-1
V
2 r(t)/P(u;)/ , m 1 ,N.
k.O
Цифровые отсчеты а с выхода накапливающего сумматора 22 поступают на первый вход блока 23 делени , на второй вход которого с второго выхода декодера 15 поступают параметры , m 1,N, В блоке делени параметры Е нормируютс на отсчеты а, и с его вькода на первьй вход блока 24 умножени поступают коэффициенты С|т, f 2 блоке умножени спектр сигнала возбуждени P(u)) умножаетс в каждом из диапазонов частот ш., . ш (JJ на
т-1 rri
СВОЙ коэффициент С,„, в результате чего на его выходе формируетс произведение спектра сигнала возбуждени Р(и) на передаточную функцию
N
H(u;,) Z (ш,).
Т.е. спектр синтезированного речевого сигнала
x(wy)
РК)Н(ю)
Р(Ы,) г ,)
дл всех частот ш , k О, М-1. Величины x(u),,) с выхода блока 24 умножени поступают на вход блока обратного БПФ, вычисл юп;его цифровые отсчеты X;, , М-1 синтезированного речевого сигнала, которые далее преобразуютс в ЦАЛ 18 в непрерывный сигнал и затем фильтруютс в фильтре 19 нижних частот, в результате чего на выходе фильтра 19 нижних частот образуетс синтезированный речевой сигнал.
Таким образом, определение параметров спектральной огибающей исходного речевого сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждени позвол ет
учесть конкретньй вид сигнала возбуждени так, что минимизируетс ошибка синтеза речевого сигнала, т.е. повышаетс качество синтеза речи.
Например, на вокализованном сегменте речи в т-й полосе анализируемых частот могут оказатьс две гармоники сигнала возбуждени , однако ошибки в воспроизведении спектральной плотности речевого сигнала, выражающейс в том, что синтезированный речевой сигнал мог бы иметь в этой полосе частот спектральную плотность в 2 раза больше, чем у исходного речевого сигнала, не произойдет ввиду учета сигнала возбуждени .
Claims (1)
1. Способ анализа и синтеза речи,
в котором при анализе исходный речевой сигнал разбивают иа отдельные сегменты, на каждом сегменте определ ют параметры сигнала возбуждени , формируют сигнал возбуждени ,
определ ют параметры спектральной
огибающей исходного речевого сигнала, передают параметры, определенные при анализе, принимают эти параметры, формируют сигнал возбуждени , в точности совпадающий с сигналом возбуждени , формируемым при анализе, и синтезируют искусственный речевой сигнал путем фильтрации сигнала возбуждени в соответствии с параметрами спектральной огибаюп1ей исходного речевого сигнала, отличающийс тем, что, с целью повышени качества синтеза речи, при ана713
лизе наход т спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , перемножают спектр исходного речевого сигнала и комплексно-сопр женный спектр сигнала возбуждени , а параметры спектральной огибающей исходного речевого сигнала наход т путем усреднени произведени спектра исходного речевого сигнала и комплексно-сопр женного спектра сигнала возбуждени в различных непересекающихс интервалах частот,
2, Устройство дл анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала , анализатор, канал св зи и синтезатор , состо ошй из последовательно соединенных декодера, вход которого вл етс входом синтезатора, генератора сигналов возбуждени ,цифрового фильтра, управл ющий вход которого соединен с вторым выходом декодера , цифроаналогового преобразовател и фильтра нижних частот, выход которого вл етс выходом синтезатора , причем анализатор содержит последовательно включенные фильтр нижних частот, вход которого вл етс входом анализатора, аналого-цифровой преобразователь, управл ющий вход которого соединен с выходом так08
тового генератора, детектор высоты тона, выход которого соединен с входом генератора сигналов возбуждени и первьм входом кодера, выход кото- рого вл етс выходом анализатора, отличающеес тем, что, с целью повьшени качества синтеза речи, в анализатор введены первый блок быстрого преобразовани Фурье,
вход которого соединен с входом детектора высоты тона, и последовательно соединенные второй блок быстрого преобразовани Фурье, вход которого соединен с выходом генератора сигналов возбуждени , блок умножени , второй вход которого соединен с выходом первого блока быстрого преобразовани Фурье, и накапливающий сумматор , выход которого соединен с вторым входом кодера, а цифровой фильтр выполнен в виде последовательно соединенных блока быстрого преобразовани Фурье, вход которого вл етс информационным входом цифрового фильтра , квадратора, накапливающего сумматора , блока делени , второй вход которого вл етс управл ющим входом цифрового фильтра, блока умножени , второй вход которого соединен с выходом блока быстрого преобразовани Фурье, и блока обратного быстрого преобразовани Фурье, выход которого вл етс выходом цифрового фильтра.
фиг. 2
Редактор 0.Головач
Составитель С.Аврин Техред Л.Олийнык
Заказ 2368/54Тираж 345Подписное
ВНИИПИ Государственного комитета СССР
по делам изобретений и открытий 113035, Москва, Ж-35, Раушска наб., д,4/5
,м. «.в.. «. , «- ™,..- ---. --- ----- - i---- - - -
Производственно-полиграфическое предпри тие, г.Ужгород, ул.Проектна , 4
Выход
Корректор ЛЛ1ил1тенко
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864002918A SU1316030A1 (ru) | 1986-01-06 | 1986-01-06 | Способ анализа и синтеза речи и устройство дл его осуществлени |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864002918A SU1316030A1 (ru) | 1986-01-06 | 1986-01-06 | Способ анализа и синтеза речи и устройство дл его осуществлени |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1316030A1 true SU1316030A1 (ru) | 1987-06-07 |
Family
ID=21214649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU864002918A SU1316030A1 (ru) | 1986-01-06 | 1986-01-06 | Способ анализа и синтеза речи и устройство дл его осуществлени |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1316030A1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2547220C2 (ru) * | 2009-10-21 | 2015-04-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации |
RU2606171C2 (ru) * | 2011-01-05 | 2017-01-10 | Конинклейке Филипс Электроникс Н.В. | Оценка изолирующих качеств обтуратора для ушного канала |
-
1986
- 1986-01-06 SU SU864002918A patent/SU1316030A1/ru active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР № 570082, кл. G 10 L 7/06, 1977. Патент GB Р 1485803, кл. G 01 L 7/06, 1974. ,(54) СПОСОБ АПАЛИЗА И СИНТЕЗА РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2547220C2 (ru) * | 2009-10-21 | 2015-04-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации |
RU2606171C2 (ru) * | 2011-01-05 | 2017-01-10 | Конинклейке Филипс Электроникс Н.В. | Оценка изолирующих качеств обтуратора для ушного канала |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0259950B1 (en) | Digital speech sinusoidal vocoder with transmission of only a subset of harmonics | |
US4301329A (en) | Speech analysis and synthesis apparatus | |
CA1065490A (en) | Emphasis controlled speech synthesizer | |
US3566035A (en) | Real time cepstrum analyzer | |
NL8020114A (nl) | Residu geeexciteerd voor spellend spraakcodeerstelsel. | |
US3360610A (en) | Bandwidth compression utilizing magnitude and phase coded signals representative of the input signal | |
JPS6131658B2 (ru) | ||
JPS62234435A (ja) | 符号化音声の復号化方式 | |
EP0137532A2 (en) | Multi-pulse excited linear predictive speech coder | |
US3909533A (en) | Method and apparatus for the analysis and synthesis of speech signals | |
CA1242279A (en) | Speech signal processor | |
US5048088A (en) | Linear predictive speech analysis-synthesis apparatus | |
CA1172366A (en) | Methods and apparatus for encoding and constructing signals | |
SU1316030A1 (ru) | Способ анализа и синтеза речи и устройство дл его осуществлени | |
US3431362A (en) | Voice-excited,bandwidth reduction system employing pitch frequency pulses generated by unencoded baseband signal | |
US4064363A (en) | Vocoder systems providing wave form analysis and synthesis using fourier transform representative signals | |
FI98481C (fi) | Menetelmä ja laite analogisen sisääntulosignaalin muuttamiseksi ohjauskoodeiksi ja vastaavan ulostulosignaalin syntetisoimiseksi näiden ohjauskoodien ohjauksen alaisena | |
US3448216A (en) | Vocoder system | |
US3083266A (en) | Vocoder apparatus | |
JPS5816297A (ja) | 音声合成方式 | |
JP2615991B2 (ja) | 線形予測型音声分析合成装置 | |
SU1434487A1 (ru) | Способ анализа и синтеза речи и устройство дл его осуществлени | |
SU533966A1 (ru) | Синтезатор речи | |
SU1476612A2 (ru) | Низкоскоростной дельта-модул тор | |
SU1005321A2 (ru) | Устройство дл измерени уровн шума в паузах речи |