RU2320028C1 - Способ и устройство сжатия спектра речевых сигналов - Google Patents

Способ и устройство сжатия спектра речевых сигналов Download PDF

Info

Publication number
RU2320028C1
RU2320028C1 RU2006134370/09A RU2006134370A RU2320028C1 RU 2320028 C1 RU2320028 C1 RU 2320028C1 RU 2006134370/09 A RU2006134370/09 A RU 2006134370/09A RU 2006134370 A RU2006134370 A RU 2006134370A RU 2320028 C1 RU2320028 C1 RU 2320028C1
Authority
RU
Russia
Prior art keywords
signal
envelope
speech
input
sub
Prior art date
Application number
RU2006134370/09A
Other languages
English (en)
Inventor
Владимир Константинович Уваров (RU)
Владимир Константинович Уваров
Дмитрий Николаевич Маркин (RU)
Дмитрий Николаевич Маркин
Original Assignee
Федеральное государственное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный университет кино и телевидения (СПбГУКиТ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный университет кино и телевидения (СПбГУКиТ) filed Critical Федеральное государственное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный университет кино и телевидения (СПбГУКиТ)
Priority to RU2006134370/09A priority Critical patent/RU2320028C1/ru
Application granted granted Critical
Publication of RU2320028C1 publication Critical patent/RU2320028C1/ru

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к области временного сжатия речевых сигналов. Техническим результатом заявленного изобретения является повышение качества передачи широкополосных речевых сигналов по узкополосным каналам за счет сокращения ширины спектра передаваемых речевых сигналов. Технический результат достигается тем, что сжатие спектра речевых сигналов осуществляют путем сокращения диапазона изменения мгновенной частоты речевого сигнала и его огибающей и путем ограничения спектра огибающей огибающей исходного речевого сигнала. 2 н.п. ф-лы, 1 ил., 1 прилож.

Description

Изобретение относится к области приборостроения, может быть использовано при передаче речевых сигналов и предназначено для сжатия спектра сигналов речи, достигаемого путем сокращения диапазона изменения мгновенной частоты сигнала и его огибающей, и ограничения спектра огибающей огибающей исходного речевого сигнала.
В последних исследованиях [6] установлено, что спектр субсигнала огибающей огибающей речевого сигнала (огибающей второй ступени модуляционного разложения речевого сигнала) может быть существенно сокращен в процессе передачи с сохранением разборчивости переданного сигнала. Это позволило сформулировать заявляемый способ сжатия спектра речевых сигналов, идея которого состоит в том, что если при передаче речевых сигналов в спектре огибающей огибающей сохранить лишь низкочастотную часть, сократить путем точного аналогового деления диапазон изменения мгновенной частоты речевого сигнала и его огибающей на передающей стороне (с последующим восстановлением масштаба мгновенной частоты речевого сигнала и его огибающей на приемной стороне), то не будет происходить заметного на слух ухудшения разборчивости и качества передаваемого речевого сигнала при существенном сокращении ширины его спектра. Для реализации заявляемого способа разработано устройство.
Известен способ, позволяющий сжимать частотный диапазон звуковых сигналов за счет сокращения диапазона изменения мгновенной частоты сигнала, по а.с. СССР №714473.
К причинам, препятствующим достижению требуемого технического результата при использовании известного способа, относится то, что для реализации этого способа необходимо осуществлять выделение мгновенной частоты в виде отдельно существующего субсигнала (выполнять частотную демодуляцию). Необходимость выполнения частотной демодуляции сигнала накладывает существенные ограничения на качество получаемых при этом сигналов [1, 2].
Наиболее близким способом того же назначения к заявленному способу по совокупности признаков является способ по а.с. №2130651.
Наиболее близким устройством того же назначения к заявленному устройству является устройство по а.с. №2130651.
К причинам, препятствующим достижению требуемого технического результата при использовании известного способа и устройства для его осуществления, относится то, что при реализации данного способа сжимается только спектр частотно-модулированной части исходного сигнала (косинуса фазы сигнала) за счет деления его мгновенной частоты, при этом спектр амплитудно-модулирующей части сигнала (огибающей) остается исходным, что в результате приводит к незначительному сокращению спектра результирующего сигнала (теоретически, максимально достижимый коэффициент сжатия спектра по данному способу - 2).
Сущность изобретения заключается в следующем.
Единая задача, на решение которой направлено изобретение, заключается в повышении качества передачи широкополосных речевых сигналов по узкополосным каналам.
Единый технический результат, который может быть получен при осуществлении изобретения, заключается в сокращении ширины спектра передаваемых речевых сигналов (при сохранении исходного качества сигнала).
Указанный единый технический результат при осуществлении изобретения по объекту - способу - достигается тем, что, как и в известном способе, точно делят мгновенную частоту исходного сигнала аналоговым способом в k деления раз, но в отличие от прототипа исходный сигнал дополняется сопряженным с ним по Гильберту сигналом, после чего в виде субсигнала выделяют огибающую исходного сигнала, определяя квадратный корень суммы квадратов каждого из пары сопряженных по Гильберту сигналов, делят исходный сигнал на субсигнал его огибающей, выделяя при этом в виде субсигнала косинус фазы исходного сигнала, субсигнал огибающей дополняют сигналом, сопряженным с ним по Гильберту, выделяют в виде субсигнала огибающую огибающей исходного сигнала, определяя корень квадратный из суммы квадратов субсигнала огибающей и сопряженного с ним по Гильберту сигнала, выделяют в виде субсигнала косинус фазы огибающей исходного сигнала, деля субсигнал огибающей исходного сигнала на субсигнал огибающей огибающей исходного сигнала, аналоговым способом точно делят в k деления раз мгновенную частоту огибающей исходного сигнала, ограничивают сверху спектр субсигнала огибающей огибающей исходного сигнала, выделяя ее низкочастотную часть, а затем перемножают ее с субсигналом косинуса фазы огибающей с деленной мгновенной частотой, полученное произведение перемножают с субсигналом косинуса фазы исходного сигнала с деленной мгновенной частотой, формируя тем самым выходной сигнал.
В качестве примера реализации заявляемого способа предлагается устройство.
Указанный единый технический результат при осуществлении изобретения достигается тем, что известное устройство, которое включает в себя аналоговый делитель мгновенной частоты, дополнительно снабжено двумя фазовращателями, четырьмя квадратичными детекторами, двумя сумматорами, двумя блоками извлечения квадратного корня, двумя аналоговыми делителями сигналов, вторым точным аналоговым делителем мгновенной частоты, фильтром нижних частот и двумя аналоговыми перемножителями, причем вход устройства образован входом второго фазовращателя, соединенным с первым входом второго аналогового делителя сигналов, выходы второго фазовращателя соединены с входами квадратичных детекторов первого демодулятора огибающей, выходы которых соединены с входами сумматора этого демодулятора, выход сумматора соединен с входом блока извлечения квадратного корня, выход которого образует выход первого демодулятора огибающей, он соединен со вторым входом второго аналогового делителя сигналов, с первым входом первого аналогового делителя сигналов и входом первого фазовращателя, выход второго аналогового делителя сигналов соединен с входом второго точного аналогового делителя мгновенной частоты, выход которого соединен со вторым входом второго аналогового перемножителя, выходы первого фазовращателя соединены с входами квадратичных детекторов второго демодулятора огибающей, выходы которых соединены с входами сумматора этого демодулятора, выход сумматора соединен с входом блока извлечения квадратного корня, выход которого образует выход второго демодулятора огибающей, он соединен с входом фильтра нижних частот и вторым входом первого аналогового делителя сигналов, выход которого соединен с входом первого точного аналогового делителя мгновенной частоты, выход которого соединен со вторым входом первого аналогового перемножителя, первый вход которого соединен с выходом фильтра нижних частот, выход первого аналогового перемножителя соединен с первым входом второго аналогового перемножителя, выход которого образует выход устройства.
Проведенный заявителем анализ уровня техники, включающий поиск по патентам и научно-техническим источникам информации, позволил установить, что заявителем не обнаружен аналог как для способа, так и для устройства, характеризующийся признаками, идентичными всем существенным признакам как способа, так и устройства изобретения, а определение из числа выявленных аналогов прототипа как наиболее близкого по совокупности признаков позволило определить совокупность существенных по отношению к техническому результату признаков в заявленном объекте, изложенных в формуле изобретения.
Следовательно, каждый из объектов изобретения соответствует требованию "новизна" действующего законодательства.
Для проверки соответствия заявленного изобретения требованию изобретательского уровня заявителем проведен дополнительный поиск известных решений с целью выявления признаков, совпадающих с признаками, отличительными от прототипа, результаты которого показали, что каждый из объектов изобретения не следует для специалиста явным образом из известного уровня техники, поскольку из уровня техники, определенного заявителем, не выявлено влияние предусматриваемых существенными признаками заявленного изобретения преобразований на достижение технического результата.
Следовательно, заявленное изобретение соответствует требованию "изобретательский уровень" действующего законодательства.
На чертеже представлена структурная схема заявляемого устройства, где 1, 2 - соответственно первый и второй фазовращатели; 3, 4, 5, 6 - квадратичные детекторы; 7, 8 - сумматоры; 9, 10 - блоки извлечения квадратного корня; 11, 12 - соответственно первый и второй аналоговые делители сигналов; 13 - фильтр нижних частот; 14, 15 - соответственно первый и второй аналоговые делители мгновенной частоты; 16, 17 - соответственно первый и второй аналоговые перемножители сигналов.
Сведения, подтверждающие возможность осуществления изобретения с получением вышеуказанного технического результата, заключаются в следующем.
В результате последних [1, 6] исследований установлено, что большая часть информации о спектральном составе речевых сигналов дублируется в их модулирующих функциях нескольких ступеней разложения, а также установлено, что спектр огибающей второй ступени разложения речевых сигналов может быть существенно сокращен при их передаче с сохранением разборчивости исходных сигналов.
В качестве математической модели исходного речевого сигнала принимается модель описания сигналов модуляционной теорией [3, 4]
Figure 00000002
где Sвх(t) - исходный речевой сигнал; S(t), φ(t) - огибающая и текущая фаза речевого сигнала соответственно, эти величины являются модулирующими функциями сигнала первой ступени модуляционного разложения [5], в каждый момент времени они определяют изменение амплитуды и фазы исходного речевого сигнала.
В соответствии с идеей многоступенного модуляционного разложения звуковых сигналов [5] в качестве математической модели огибающей исходного речевого сигнала принимается модель модуляционной теории, то есть
Figure 00000003
где S(t) - огибающая первой ступени разложения исходного сигнала; Ss(t), φs(t) - соответственно огибающая и текущая фаза второй ступени модуляционного разложения исходного речевого сигнала, то есть огибающая и текущая фаза огибающей исходного сигнала. Исходный речевой сигнал может быть представлен следующим образом:
Figure 00000004
Предлагаемое устройство работает следующим образом.
Входной речевой сигнал дополняется сопряженным с ним по Гильберту сигналом при помощи ФВ2. Демодулятором огибающей ДO1 в соответствии с дефинициями, принятыми в модуляционной теории [3, 4], определяется субсигнал огибающей исходного речевого сигнала
Figure 00000005
где
Figure 00000006
и
Figure 00000007
- соответственно исходный речевой сигнал и сопряженный с ним по Гильберту сигнал (квадратичными детекторами исходный речевой сигнал и сопряженный с ним по Гильберту сигнал возводятся в квадрат, сумматором находится сумма полученных квадратов сигналов, блоком извлечения квадратного корня определяется корень из суммы квадратов исходного речевого сигнала и сопряженного с ним по Гильберту сигнала).
С помощью аналогового делителя сигналов Дел.2 делением исходного речевого сигнала на субсигнал его огибающей определяется (в виде субсигнала) косинус фазы исходного речевого сигнала
Figure 00000008
Аналоговым делителем мгновенной частоты ДМЧ2 делится мгновенная частота исходного речевого сигнала в k раз, получается субсигнал cos[φ(t)/k].
Субсигнал огибающей исходного речевого сигнала при помощи фазовращателя ФВ1 дополняется сопряженным с ним по Гильберту сигналом, демодулятором огибающей ДO2 выделяется в виде субсигнала огибающая второй ступени разложения исходного речевого сигнала (способом, аналогичным выделению огибающей первой ступени), делителем аналоговых сигналов Дел.1 выделяется (в виде субсигнала) косинус фазы второй ступени разложения (косинус фазы огибающей исходного речевого сигнала). Фильтром нижних частот ФНЧ выделяется низкочастотная часть спектра субсигнала огибающей второй ступени разложения исходного сигнала Ss нч(t).
Аналоговым делителем мгновенной частоты ДМЧ1 делится мгновенная частота огибающей исходного сигнала в k раз, получается субсигнал cos[φs(t)/k].
Первым перемножителем, умножением субсигнала косинуса фазы огибающей исходного сигнала с деленной мгновенной частотой на сигнал низкочастотной части субсигнала огибающей огибающей исходного сигнала, формируется субсигнал огибающей выходного сигнала устройства, полученный субсигнал огибающей выходного сигнала при помощи второго перемножителя умножается на субсигнал косинуса фазы исходного сигнала с деленной мгновенной частотой, таким образом формируется выходной сигнал устройства
Figure 00000009
Спектр выходного сигнала существенно уже спектра исходного речевого сигнала.
После передачи речевого сигнала со сжатым по данному способу спектром на приемной стороне необходимо восстановить масштаб мгновенных частот сигнала и его огибающей (см. Приложение 1). Разборчивость сигнала с восстановленным на приемной стороне масштабом мгновенных частот не отличается от разборчивости исходного речевого сигнала.
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного изобретения следующих условий:
- средство, воплощающее заявленное изобретение при его осуществлении, предназначено для использования в технике связи;
- для заявленного изобретения, в том виде, как оно охарактеризовано в формуле изобретения, подтверждена возможность его осуществления с помощью вышеописанных в заявке или известных до даты приоритета средств и методов.
Следовательно, заявленное изобретение соответствует требованию "промышленная применимость" по действующему законодательству.
Литература
1. Уваров В.К. Точное компандирование частотного и динамического диапазонов звуковых сигналов. - СПб.: СПбГУКиТ, 2001.
2. Винницкий А.С. Модулирующие фильтры и следящий прием ЧМ. - М.: Советское радио, 1969.
3. Gabor D. Theory of Communication. - "Journ. IEE", 1945, vol.93, №26, part III, pp.429-457.
4. J. Ville, "Theorie et applications de la notion de signal analytique," Cables et Transmissions, 1948, vol.2A, №1, pp.61-74.
5. Ишуткин Ю.М. Многоступенный модуляционный анализ сигналов // Исследование преобразований изображения и звука в сквозном кинематографическом процессе: Сборник научных трудов/ Ленинградский институт киноинженеров. - Л., 1982.
6. Уваров В.К., Маркин Д.Н. Результаты новых исследований на основе модуляционной теории звуковых сигналов. В сб.: Факультету аудиовизуальной техники - 75 лет. - СПб.: СПбГУКиТ, 2005.
Приложение 1
Поскольку, по мнению авторов настоящей заявки, способ восстановления масштаба мгновенной частоты сигнала и его огибающей является очевидным, здесь не будет приводиться его подробное описание.
Кратко способ восстановления масштаба мгновенных частот сигнала и его огибающей можно описать следующим образом: способом, аналогичным описываемому в данной заявке, принятый сигнал разделяется на три составные части - Ss нч(t); cos[φs,(t)/k]; cos[φ(t)/k]; после чего умножением мгновенной частоты сигнала и его огибающей в k раз восстанавливаются масштабы мгновенных частот сигнала и его огибающей, затем перемножением сигналов Ss нч(t); cos[φs(t)]; cos[φ(t)] формируется новый синтезированный речевой сигнал
Figure 00000010
Процесс удвоения мгновенной частоты колебания с постоянной амплитудой cosφ (так называемого косинуса фазы) может быть проиллюстрирован известными формулами:
Figure 00000011
Для получения нечетных значений k могут быть использованы следующие известные формулы:
Figure 00000012
Очевидно, что формулы (8) и (9) могут быть использованы неоднократно для получения требуемого значения k.

Claims (2)

1. Способ сжатия спектра речевых сигналов, при котором делят мгновенную частоту речевого сигнала в k раз, речевой сигнал дополняют сигналом, сопряженным с ним по Гильберту и выделяют субсигнал огибающей речевого сигнала, отличающийся тем, что определяют субсигнал косинуса фазы речевого сигнала путем деления речевого сигнала на субсигнал огибающей речевого сигнала, субсигнал огибающей речевого сигнала дополняют сигналом, сопряженным с ним по Гильберту, выделяют субсигнал огибающей субсигнала огибающей речевого сигнала, определяют субсигнал косинуса фазы субсигнала огибающей речевого сигнала путем деления субсигнала огибающей речевого сигнала на субсигнал огибающей субсигнала огибающей речевого сигнала и делят в k раз мгновенную частоту субсигнала огибающей речевого сигнала, ограничивают сверху спектр субсигнала огибающей субсигнала огибающей речевого сигнала, выделяя ее низкочастотную часть, которую перемножают с субсигналом косинуса фазы субсигнала огибающей речевого сигнала с деленной мгновенной частотой, полученное произведение перемножают с субсигналом косинуса фазы речевого сигнала с деленной мгновенной частотой, формируя выходной сигнал.
2. Устройство для сжатия спектра речевых сигналов, которое включает в себя, первый делитель сигналов, первый делитель мгновенной частоты, первый фазовращатель, второй фазовращатель, выходы которого соединены с входами первого демодулятора огибающей, два перемножителя, отличающееся тем, что оно дополнительно снабжено вторым демодулятором огибающей, фильтром нижних частот, вторым делителем сигналов, вторым делителем мгновенной частоты, причем вход второго фазовращателя, соединенный с первым входом второго делителя сигналов, является входом устройства, выход первого демодулятора огибающей соединен со вторым входом второго делителя сигналов, с первым входом первого делителя сигналов и входом первого фазовращателя, выход второго делителя сигналов соединен с входом второго делителя мгновенной частоты, выход которого соединен со вторым входом второго перемножителя, выходы первого фазовращателя соединены с входами второго демодулятора огибающей, выход которого соединен с входом фильтра нижних частот и вторым входом первого делителя сигналов, выход которого соединен с входом первого делителя мгновенной частоты, выход которого соединен со вторым входом первого перемножителя, первый вход которого соединен с выходом фильтра нижних частот, выход первого перемножителя соединен с первым входом второго перемножителя, выход которого является выходом устройства.
RU2006134370/09A 2006-09-27 2006-09-27 Способ и устройство сжатия спектра речевых сигналов RU2320028C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2006134370/09A RU2320028C1 (ru) 2006-09-27 2006-09-27 Способ и устройство сжатия спектра речевых сигналов

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2006134370/09A RU2320028C1 (ru) 2006-09-27 2006-09-27 Способ и устройство сжатия спектра речевых сигналов

Publications (1)

Publication Number Publication Date
RU2320028C1 true RU2320028C1 (ru) 2008-03-20

Family

ID=39279889

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006134370/09A RU2320028C1 (ru) 2006-09-27 2006-09-27 Способ и устройство сжатия спектра речевых сигналов

Country Status (1)

Country Link
RU (1) RU2320028C1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2667149C1 (ru) * 2017-12-06 2018-09-17 Акционерное Общество "Российский Концерн По Производству Электрической И Тепловой Энергии На Атомных Станциях" (Ао "Концерн Росэнергоатом") Установка для переработки радиоактивных отходов

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2667149C1 (ru) * 2017-12-06 2018-09-17 Акционерное Общество "Российский Концерн По Производству Электрической И Тепловой Энергии На Атомных Станциях" (Ао "Концерн Росэнергоатом") Установка для переработки радиоактивных отходов

Similar Documents

Publication Publication Date Title
US7574313B2 (en) Information signal processing by modification in the spectral/modulation spectral range representation
US6041294A (en) Signal quality determining device and method
RU2010139018A (ru) Устройство и способ преобразования звукового сигнала в параметрическое представление, устройство и способ модификации параметрического представления, устройство и способ синтеза параметрического представления звукового сигнала
KR102106945B1 (ko) 서브-대역 스플리터 유닛 및 서브-대역 스플리터 유닛이 제공된 포락 곡선 검출기
DE60221927T2 (de) Vorrichtung und Programm zur Schallcodierung
CN105745706A (zh) 用于扩展频带的装置、方法和程序
RU99104814A (ru) Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
JPH0754440B2 (ja) 音声分析合成装置
AU2021289742B2 (en) Methods, apparatus, and systems for detection and extraction of spatially-identifiable subband audio sources
RU2320028C1 (ru) Способ и устройство сжатия спектра речевых сигналов
US5515112A (en) Chrominance transition corrector
US8563842B2 (en) Method and apparatus for separating musical sound source using time and frequency characteristics
US4130734A (en) Analog audio signal bandwidth compressor
CN108604454A (zh) 音频信号处理装置和输入音频信号处理方法
EP0746115A3 (en) Audio signal processing circuit for subband coding
RU2691122C1 (ru) Способ и устройство компандирования звуковых вещательных сигналов
CN1165890C (zh) 卡拉ok演唱者评价装置与方法及其存储媒体
US3641445A (en) Frequency analyzer
WO2021252795A2 (en) Perceptual optimization of magnitude and phase for time-frequency and softmask source separation systems
US3091665A (en) Autocorrelation vocoder equalizer
EP0809236A1 (en) Device for determining the quality of an output signal to be generated by a signal processing circuit, and also method
US3510597A (en) Frequency bandwidth compression and expansion system
US3361877A (en) Narrow band speech transmission system
Fitzgerald et al. On inpainting the adress algorithm
RU2731602C1 (ru) Способ и устройство компандирования с предыскажением звуковых вещательных сигналов

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20080928