RU2144222C1 - Способ сжатия звуковой информации и система для его реализации - Google Patents

Способ сжатия звуковой информации и система для его реализации Download PDF

Info

Publication number
RU2144222C1
RU2144222C1 RU98123939A RU98123939A RU2144222C1 RU 2144222 C1 RU2144222 C1 RU 2144222C1 RU 98123939 A RU98123939 A RU 98123939A RU 98123939 A RU98123939 A RU 98123939A RU 2144222 C1 RU2144222 C1 RU 2144222C1
Authority
RU
Russia
Prior art keywords
filter
input
output
signal
coefficients
Prior art date
Application number
RU98123939A
Other languages
English (en)
Inventor
А.В. Гусихин
М.А. Гилязов
Ю.В. Дубинский
Р.М. Насыров
А.В. Федоров
Original Assignee
Гусихин Артур Владимирович
Гилязов Марсель Ахатович
Дубинский Юрий Владимирович
Насыров Ренат Мухаметович
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Гусихин Артур Владимирович, Гилязов Марсель Ахатович, Дубинский Юрий Владимирович, Насыров Ренат Мухаметович filed Critical Гусихин Артур Владимирович
Priority to RU98123939A priority Critical patent/RU2144222C1/ru
Application granted granted Critical
Publication of RU2144222C1 publication Critical patent/RU2144222C1/ru

Links

Images

Abstract

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения. До и после оптимальной фильтрации фильтром, в процессе которой производят выбор номеров наборов коэффициентов фильтров с помощью устройства выбора фильтра и запоминающего устройства коэффициентов фильтров, осуществляют сжатие динамического диапазона сигналов - входного сигнала и сигнала после оптимальной фильтрации соответственно. Устройство выбора форм и запоминающего устройства форм производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона. Здесь номера наборов коэффициентов фильтров и параметров форм выбирают наиболее близкими к заданным из заранее запомненных по аналогичной звуковой информации, а по каналам связи в декодер передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметров форм, которые определяют объем сжатой информации. Технический результат заключается в устранении избыточности акустической информации (сжатие информации), что позволяет уменьшить требуемую пропускную способность канала связи (требуемую емкость памяти для хранения звуковой информации) при одновременной возможности адаптации под конкретный класс звукового сигнала, например мужскую и женскую речь, симфоническую музыку и др., с заданной в достаточно широком диапазоне степенью сжатия, а также улучшить качество восстанавливаемого выходного сигнала с данного устройства. 2 с.п. ф-лы, 3 ил.

Description

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио- и телевещания, телефонии, систем цифровой звукозаписи и звуковоспроизведения.
Известны способы, системы и устройства сжатия звуковой информации.
Система сжатия "ADPCM" используется в стандартах беспроводных телефонов DECT (Европа), PACS (США), PHS (Япония). Здесь адаптивная дифференциально-импульсная модуляция основана на предсказании и кодировании приращений соседних отсчетов звукового сигнала (В.А. Погрибной, Дельта-модуляция в цифровой обработке сигналов, М.: Радио и связь, 1990) - [1], (В.М. Назаров, Ю.Н. Прохоров, Методы цифровой обработки и передачи речевых сигналов, М.: Радио и связь, 1985) - [2], (Ю.А. Громаков, Современные технологии подвижной связи, Радио, 1997, N 5) - [3].
В стандарте сотовых сетей подвижной связи GSM 900 (GSM 1800) использована система сжатия "PRE - LTR", основанная на линейном предсказании речи (линейное предиктивное кодирование) - [2], [3], (Маркел ДЖ. Д., Грэй А.Х., Линейное предсказание речи: Пер. с англ., под ред. Ю.Н. Прохорова и В.С. Звездина, М.: Связь, 1980) - [4].
Система сжатия "PRE - LTR" ориентирована только на речевые сигналы, характеризуется большой вычислительной сложностью и малоизменяемым коэффициентом сжатия.
На кодировании в выделенных частотных диапазонах работает система сжатия "MUSICAM", используемая в стандартах цифрового радиовещания "Эврика 147/DAB", USA DR - [2], (А. Демин, Л. Кацнельсон, Система цифрового радиовещания "Эврика 147", Радио, 1996, N 8) - [5]. Эта система имеет большую вычислительную сложность и малоизменяемый коэффициент сжатия.
Для сравнительного анализа с заявляемым изобретением использован способ сжатия звуковой информации, используемый в работе беспроводных телефонов и система сжатия АДРСМ с адаптивной дифференциально-импульсной кодовой модуляцией (АДИКМ), структурное построение которой составляют фильтр, состоящий из фильтра-предсказателя, включенного в цепь обратной связи последовательно соединенных сумматора и квантователя, устройство оценки коэффициентов фильтра и кодер канала - [2, стр. 11]. В устройстве оценки коэффициентов фильтра анализируется текущий спектр входного сигнала и по нему определяются коэффициенты фильтра-предсказателя для минимизации сигнала ошибки. Сигнал ошибки формируется из разницы между входным сигналом и предсказанным. В кодере канала сигнал ошибки и коэффициенты фильтра объединяются в единый информационный поток, кодируются с применением статистического кодирования (и помехоустойчивого, если требуется), образуя выходной сигнал, который поступает в канал связи и ЗУ. Здесь коэффициент сжатия определяется отношением амплитуд входного сигнала и сигнала ошибки
Figure 00000002

Известные способ сжатия звуковой информации и система, его реализующая, характеризуясь простотой своей реализации, имеет следующие недостатки:
- ограниченный диапазон коэффициента сжатия сверху, так как частоты дискретизации входного сигнала и сигнала ошибки совпадают;
- плохое качество восстановления при фиксированном коэффициенте сжатия;
- плохая адаптация к различным классам акустической информации.
Изобретение решает задачу - максимально устранить избыточность акустической информации (сжатие информации), что позволяет уменьшить требуемую пропускную способность канала связи (требуемую емкость памяти для хранения звуковой информации) при одновременной возможности адаптации под конкретный класс звукового сигнала с заданной в достаточно широком диапазоне степенью сжатия, а также улучшить качество восстанавливаемого выходного сигнала с данного устройства.
Поставленная задача достигается тем, что по способу сжатия звуковой информации, включающему оптимальную фильтрацию звукового сигнала, до и после оптимальной фильтрации, в процессе которой производят выбор номеров наборов коэффициентов фильтров, проводят сжатие динамического диапазона сигналов, после чего производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона, при этом номера наборов коэффициентов фильтров и параметры форм выбирают наиболее близкими к данным из заранее запомненных по аналогичной звуковой информации, а по каналам связи передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметры форм, которые определяют объем сжатой информации.
В систему сжатия звуковой информации, содержащую цифровой фильтр, устройство оценки коэффициентов фильтра, вход которого соединен с первым входом цифрового фильтра, и кодер канала, дополнительно введены первый блок автоматического регулирования уровня, первый выход которого подключен к первому входу цифрового фильтра, и второй блок автоматического регулирования уровня, вход которого подключен к выходу цифрового фильтра, устройство выбора фильтра и запоминающее устройство коэффициентов фильтров, связанное с устройством выбора фильтра через его первый вход, второй вход которого соединен с выходом устройства оценки коэффициентов фильтра, а первый выход - со вторым входом цифрового фильтра, устройство выбора форм и запоминающее устройство форм, связанное с устройством выбора форм через его первый вход, второй вход которого соединен с первым выходом второго блока автоматического регулирования уровня, второй выход которого, а также вторые выходы первого блока автоматического регулирования уровня, устройства выбора фильтра и выход устройства выбора форм подключены к соответствующим входам кодера канала, выход которого является выходом системы сжатия звуковой информации, входом которой является вход первого блока автоматического регулирования уровня.
Сущность изобретения поясняется на фиг. 1, где представлена блок-схема заявляемой системы, фиг. 2 - иллюстрация прохождения сигнала по блокам системы, фиг. 3 - иллюстрация работы блоков автоматической регулировки уровня.
Здесь:
1. Первый блок автоматической регулировки уровня (АРУ 1).
2. Устройство оценки коэффициентов фильтра.
3. Устройство выбора фильтра.
4. Запоминающее устройство коэффициентов фильтров.
5. Цифровой фильтр.
6. Второй блок автоматической регулировки уровня (АРУ 2).
7. Устройство выбора форм.
8. Запоминающее устройство форм.
9. Кодер канала.
10. Квантователь.
12. Фильтр-предсказатель.
Для входного сигнала системы сжатия звуковой информации является вход блока автоматической регулировки уровня (АРУ 1), первый выход которого через устройство оценки коэффициентов фильтра 2 подключен на второй вход устройства выбора фильтра 3, первый вход которого соединен с запоминающим устройством коэффициентов фильтров 4. Первый же выход АРУ 1 подключен на первый вход цифрового фильтра 5, второй вход которого соединен с первым выходом устройства выбора фильтра 3, а выход - со входом второго блока автоматической регулировки уровня (АРУ 2) 6, первый выход которого подключен второму входу устройства выбора форм 7, первый вход которого соединен с запоминающим устройством форм 8.
Вторые выходы первого и второго блоков автоматической регулировки уровня 1 и 6, устройства выбора фильтра 3 и выход устройства выбора форм 7 подключены к соответствующим входам кодера канала 9. Цифровой фильтр 5 состоит из последовательно соединенных сумматора 10 и квантователя 11, в обратную связь которых включен фильтр-предсказатель 12; первым входом фильтра 5 является первый вход сумматора 10, вторым входом фильтра 5 - второй вход фильтра-предсказателя 12, а выходом фильтра 5 является выход квантователя 11, соединенный с первым входом фильтра-предсказателя 12.
Суть заявляемого способа звуковой информации - передавать не сам сигнал, а некие коэффициенты, описывающие сигнал с достаточной степенью точности.
Система может быть реализована как аппаратно, так и программно.
Входным сигналом для системы является цифровой звуковой сигнал с частотой дискретизации FD и N уровнями квантования по амплитуде. Входной сигнал S (фиг. 2, а) поступает на блок АРУ 1, в котором выделяется огибающая сигнала, производится нормировка сигнала (приведение уровня сигнала в диапазоне 0...1) и вторичное квантование сигнала с числом уровней квантования N 1.
Далее сигнал S' (фиг. 2, б) с выхода АРУ 1 поступает через устройство 2 оценки коэффициентов фильтра на устройство 3 выбора фильтра и цифровой фильтр 5. Устройство 3 выбора фильтра анализирует текущий спектр сигнала и выбирает из базы данных запоминающего устройства 4 коэффициентов фильтров на заданном интервале времени коэффициенты фильтра, передаточная характеристика которого в наибольшей степени согласована с текущим спектром. Номер NF выбранного фильтра поступает в кодер канала 9, а коэффициенты - на фильтр 5, который преобразует спектр сигнала в равномерный. После фильтрации сигнал S'' (фиг. 2, в) поступает на блок АРУ 2 6, действие которого аналогично действию АРУ 1. Сигнал S''' (фиг. 2, г) с блока АРУ 2 6 является сигналом с минимальным динамическим диапазоном и равномерным спектром. Он поступает на устройство 7 выбора форм, которое осуществляет ассоциативный поиск наиболее подходящей формы из запоминающего устройства форм 8 к отрезкам сигнала и формирует параметры каждой формы: номер, смещение и амплитуду.
В запоминающих устройствах коэффициентов фильтров 4 и форм 8 хранятся наборы коэффициентов фильтров и наборы наиболее встречающихся форм, соответственно ранее запомненные.
Все параметры сигнала, полученные при преобразовании сигнала каждым блоком: коэффициенты сжатия динамического диапазона с АРУ 1 1 и АРУ 2 6, номера наборов коэффициентов фильтров с устройства 3 и параметры форм с устройства 7, поступают на кодер 9 канала, где осуществляется группирование всех параметров и коэффициентов в единый поток информации, который кодируется с применением статистического кодирования, выравнивается по скорости и поступает в виде однородного цифрового потока в канал связи или на запоминающее устройство.
Таким образом, предложенные способ сжатия звуковой информации и система, его реализующая, позволяют:
- значительно уменьшить требуемую емкость памяти для хранения звуковой информации здесь в отличие от системы ADPCM передаются не коэффициенты фильтра, а номер набора коэффициентов фильтра из запоминающего устройства коэффициентов фильтров, наиболее близкий по коэффициентам. Например, если всего 16 коэффициентов по 8 бит каждый, то в ADPCM требуется передать 16х8=128 бит, то в данной системе при запоминающем устройстве на 2048 наборов коэффициентов фильтра надо передать только 11 бит или в 11,6 раз меньше. Такую же ситуацию определяет и использование устройства выбора форм и запоминающего устройства форм
- значительно уменьшить динамический диапазон наличием двух блоков автоматической регулировки уровня АРУ 1 и АРУ 2,
- иметь возможность легкой адаптации под конкретный класс звукового сигнала, например мужская, женская речь, симфоническая музыка и др., с заданной в достаточно широком диапазоне степенью сжатия или уровнем искажения в результате предложенного построения архитектуры системы сжатия, т.к. в запоминающих устройствах содержимое формируется в соответствии с текущим классом звуковой информации, т.е. присутствует элемент самообучения,
- улучшить качество восстанавливаемого выходного сигнала с данной системы. Для восстановления сжатого сигнала построение системы восстановления может быть выполнено согласно функции, обратной операциям сжатия.
Реализация системы не требует уникальных элементов и возможна на известных логических микросхемах памяти, процессорах обработки сигналов (при аппаратной реализации) или на общественных языках программирования: Ассемблер, Си, Паскаль Бейсик (при программной реализации).
Так, в блоках автоматической регулировки уровня АРУ 1 и АРУ 2 (фиг. 3) выделяется огибающая SH по максимальным значениям сигнала S и SL - по минимумам сигнала S, строятся модели огибающих SL* и SH* и вычисляются коэффициенты огибающей, производится нормировка сигнала S*=(S-SL*)/(SH*-SL*) и далее идет квантование на заданное количество уровней N. При восстановлении сигнала огибающие SL*и SH* восстанавливаются по коэффициентам огибающей, а сигнал S по формуле S = S* • (SH* - SL*) + SL*, т.е. производится операция, обратная АРУ.
Устройство выбора фильтра 3 выбирается из запоминающего устройства коэффициентов фильтров 4 на заданном интервале времени такой выбор коэффициентов фильтра, при котором выходной сигнал S'' минимален, посылает этот выбор коэффициентов фильтра на фильтр 5, а номер этого набора - в кодер канала 9.
Устройство выбора форм 7: в запоминающем устройстве форм 8 хранятся наборы наиболее встречающихся форм длиной от L до 2L - 1, сигнал S''', поступающий на устройство 7, разбивается последовательно на отрезки длиной не менее L и не более 2L - 1, для конкретной длины формы из запоминающего устройства 8 находится форма, наиболее коррелированная с данным отрезком сигнала, в кодер 9 канала поступают параметры отрезка сигнала: номер, смещение, амплитуда.
Кодер канала осуществляет группирование всех параметров и коэффициентов в единый поток информации, который кодируется одним из известных способов статистического кодирования плюс помехоустойчивое кодирование в зависимости от параметров канала связи (Справочник по теоретическим основам радиоэлектронники под редакцией Б. Х. Кривицкого, В.Н. Дулина в 2-х томах, М., "Энергия", 1977).

Claims (2)

1. Способ сжатия звуковой информации, включающий оптимальную фильтрацию звукового сигнала, отличающийся тем, что до и после оптимальной фильтрации, в процессе которой производят выбор номеров наборов коэффициентов фильтров, производят сжатие динамического диапазона сигналов, после чего производят выбор параметров форм сигнала, полученного после второго сжатия динамического диапазона, при этом номера наборов коэффициентов фильтров и параметры форм выбирают наиболее близкими к данным из заранее запомненным по аналогичной звуковой информации, а по каналам связи передают коэффициенты сжатия динамического диапазона, номера наборов коэффициентов фильтров и параметры форм, которые определяют объем сжатой информации.
2. Система сжатия звуковой информации, содержащая цифровой фильтр, устройство оценки коэффициентов фильтра, вход которого соединен с первым входом цифрового фильтра, и кодер канала, отличающаяся тем, что она дополнительно содержит первый блок автоматического регулирования уровня, первый выход которого подключен к первому входу цифрового фильтра, и второй блок автоматического регулирования уровня, вход которого подключен к выходу цифрового фильтра, устройство выбора фильтра и запоминающее устройство коэффициентов фильтров, связанное с устройством выбора фильтра через его первый вход, второй вход которого соединен с выходом устройства оценки коэффициентов фильтра, а первый выход - с вторым входом цифрового фильтра, устройство выбора форм и запоминающее устройство форм, связанное с устройством выбора форм через его первый вход, второй вход которого соединен с первым выходом второго блока автоматического регулирования уровня, второй выход которого, а также вторые выходы первого блока автоматического регулирования уровня, устройства выбора фильтра и выход устройства выбора форм подключены к соответствующим входам кодера канала, выход которого является выходом системы сжатия звуковой информации, входом которой является вход первого блока автоматического регулирования уровня.
RU98123939A 1998-12-30 1998-12-30 Способ сжатия звуковой информации и система для его реализации RU2144222C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU98123939A RU2144222C1 (ru) 1998-12-30 1998-12-30 Способ сжатия звуковой информации и система для его реализации

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU98123939A RU2144222C1 (ru) 1998-12-30 1998-12-30 Способ сжатия звуковой информации и система для его реализации

Publications (1)

Publication Number Publication Date
RU2144222C1 true RU2144222C1 (ru) 2000-01-10

Family

ID=20214157

Family Applications (1)

Application Number Title Priority Date Filing Date
RU98123939A RU2144222C1 (ru) 1998-12-30 1998-12-30 Способ сжатия звуковой информации и система для его реализации

Country Status (1)

Country Link
RU (1) RU2144222C1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9754601B2 (en) 2006-05-12 2017-09-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal encoding using a forward-adaptive prediction and a backwards-adaptive quantization
US10074377B2 (en) 2014-03-25 2018-09-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Назаров В.М., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов. - М.: Радио и связь, 1985, с.10 - 12. *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9754601B2 (en) 2006-05-12 2017-09-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal encoding using a forward-adaptive prediction and a backwards-adaptive quantization
US10074377B2 (en) 2014-03-25 2018-09-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
RU2678487C2 (ru) * 2014-03-25 2019-01-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном
USRE49107E1 (en) 2014-03-25 2022-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Similar Documents

Publication Publication Date Title
US5537509A (en) Comfort noise generation for digital communication systems
US7218900B2 (en) Radio transmitter and receiver
US4622680A (en) Hybrid subband coder/decoder method and apparatus
US5630016A (en) Comfort noise generation for digital communication systems
CN1218506C (zh) 采用状态判断来控制数字电话系统中的功能元件的方法和装置
US8195471B2 (en) Sampling rate conversion apparatus, coding apparatus, decoding apparatus and methods thereof
US5068899A (en) Transmission of wideband speech signals
US4831636A (en) Coding transmission equipment for carrying out coding with adaptive quantization
US6104991A (en) Speech encoding and decoding system which modifies encoding and decoding characteristics based on an audio signal
CN1153365C (zh) 采用不同编码原理的传送系统
ATE90821T1 (de) Digitales paket-fernsprechuebertragungsverfahren mit multiplexbetrieb.
CN102332267A (zh) 全频带可扩缩音频编解码器
CN101060550A (zh) 语音通信终端的杂音去除装置
US4319082A (en) Adaptive prediction differential-PCM transmission method and circuit using filtering by sub-bands and spectral analysis
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
Wilson et al. Adaptive tree encoding of speech at 8000 bits/s with a frequency-weighted error criterion
RU2144222C1 (ru) Способ сжатия звуковой информации и система для его реализации
US6499008B2 (en) Transceiver for selecting a source coder based on signal distortion estimate
JP2570603B2 (ja) 音声信号伝送装置およびノイズ抑圧装置
JPS63110830A (ja) 帯域分割符号化復号化装置
US20160019903A1 (en) Optimized mixing of audio streams encoded by sub-band encoding
EP1014738A2 (en) A method and apparatus for efficient bandwith usage in a packet switching network
JPS6096041A (ja) サブバンド符号化方法および装置
CA2376816A1 (en) Speech switching apparatus
JP2870050B2 (ja) ディジタルデータの高能率符号化方法