RU70000U1 - Устройство кодирования речевого сигнала в системах громкоговорящей связи - Google Patents

Устройство кодирования речевого сигнала в системах громкоговорящей связи Download PDF

Info

Publication number
RU70000U1
RU70000U1 RU2007134691/22U RU2007134691U RU70000U1 RU 70000 U1 RU70000 U1 RU 70000U1 RU 2007134691/22 U RU2007134691/22 U RU 2007134691/22U RU 2007134691 U RU2007134691 U RU 2007134691U RU 70000 U1 RU70000 U1 RU 70000U1
Authority
RU
Russia
Prior art keywords
input
speech signal
output
wavelet
channel
Prior art date
Application number
RU2007134691/22U
Other languages
English (en)
Inventor
Дмитрий Владимирович Бейлекчи
Юрий Анатольевич Кропотов
Original Assignee
Дмитрий Владимирович Бейлекчи
Юрий Анатольевич Кропотов
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дмитрий Владимирович Бейлекчи, Юрий Анатольевич Кропотов filed Critical Дмитрий Владимирович Бейлекчи
Priority to RU2007134691/22U priority Critical patent/RU70000U1/ru
Application granted granted Critical
Publication of RU70000U1 publication Critical patent/RU70000U1/ru

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Полезная модель относится к устройствам цифрового кодирования речевых сигналов для их компактного представления в целях передачи и хранения и может быть использовано при построении устройств приема и передачи речевого сигнала в системах громкоговорящей связи. Достигаемый технический результат заключается в минимизации объема цифровых данных, необходимых для представления речевого сигнала в канале импульсно-кодовой модуляции, а значит, и уменьшение требуемой полосы пропускания канала системы громкоговорящей связи. Указанный результат обеспечивается за счет того, что к входному цифровому потоку речевого сигнала применяется трехуровневое адаптивное вейвлет-преобразование с последующей адаптивной пороговой фильтрацией вейвлет-коэффициентов и уплотнением полученных цифровых данных при помощи кода переменной длины (RLE) или кодом Хаффмана. Таким образом, необходимая битовая скорость передачи цифрового потока в канале ИКМ снижается с 64 кбит/сек до 16 кбит/сек, а, значит, требуемая минимальная полоса пропускания аналогового канала становится равной 16 кГц.

Description

Полезная модель относится к устройствам цифрового кодирования речевых сигналов для их компактного представления в целях передачи и хранения и может быть использовано при построении устройств приема и передачи речевого сигнала в системах громкоговорящей связи (ГГС).
По авт.св. №2002134814 известен способ передачи дискретной информации по связному тракту, содержащему в направлении распространения сигнала по меньшей мере аналоговую линию связи и канал импульсно-кодовой модуляции (ИКМ), заключающийся в том, что преобразуют отсчеты подлежащего передаче дискретного сигнала к виду, пригодному для передачи на аналоговой линии связи передают канальный сигнал ИКМ по упомянутому каналу ИКМ, отличающийся тем, что выбирают спектр сигнала, передаваемого по аналоговой линии связи, таким, чтобы скорость передачи информации по упомянутой аналоговой линии связи равнялась скорости передачи информации по каналу ИКМ, а число уровней квантования отсчетов, передаваемых по аналоговой линии связи, было минимально возможным для данной аналоговой линии связи, при преобразовании полученного из аналоговой линии связи сигнала в канальный сигнал ИКМ уменьшают частоту дискретизации этого сигнала пропорционально отношению числа уровней квантования отсчетов, передаваемых по каналу ИКМ, к числу уровней квантования отсчетов, передаваемых по аналоговой линии связи.
Способ в авт.св. №2002134814 обеспечивает передачу любой дискретной информации, но нецелесообразно выделять большую полосу пропускания для передачи речевого сигнала.
Целью изобретения является уменьшение объема цифровых данных, необходимых для представления речевого сигнала в канале ИКМ, для минимизации полосы пропускания при передаче по аналоговой линии связи ГГС способом, описанным авт.св. №2002134814.
Поскольку значимые компоненты речевого сигнала в основном расположены в низкочастотной области, большинство высокочастотных коэффициентов вейвлет-преобразования близки к нулю, а количество низкочастотных коэффициентов экспоненциально уменьшается с повышением глубины разложения, то сжатие вейвлет-разложения сигнала потенциально более эффективно, чем сжатие исходного сигнала. Малые значения вейвлет-коэффициента в означают низкую энергетику соответствующих частотных полос в сигнале. Эти коэффициенты могут быть приравнены нулю без существенного искажения сигнала.
При применение к фильтрованным таким способом вейвлет-коэффициентам известных алгоритмов уплотнения данных, таких как кодирование кодом переменной длины
или кодирование кодом Хаффмана позволяет сократить количество отсчетов необходимых для представления речевого ИКМ-сигнала.
Сущность изобретения заключается в том, что данным устройством входной речевой ИКМ-сигнал разделяется на отрезки - векторы длиной равной степени числа 2, которые классифицируются на вокализованные и шумоподобные при помощи выделения основного тона. Над полученными векторами производится трехуровневое вейвлет-преобразование с последующей фильтрацией вейвлет-коэффициентов пороговой функцией. Параметры вейвлет и пороговой функции определяются в зависимости от типа отрезка речевого сигнала. Три уровня вейвлет преобразования позволяют оптимально разделить вейвлет-коэффициенты для получения максимального количества нулевых вейвлет-коэффициентов. Вектора вейвлет коэффициентов объединяются в один пакет, и выполняется операция уплотнения, после чего в пакет добавляется информация о типе исходного отрезка речевого сигнала и пакет последовательно передается в канал ИКМ ГГС.
На фиг.1. изображена структурная схема передающей части устройства кодирования речевого сигнала. Устройство содержит: блок выборки отсчетов сигнала БВ, блок классификации речевого сигнала БКРС, блок выбора параметров вейвлет и пороговой функций БВПФ, блоки дециматоров для трех уровней Д1, Д2, Д3, блоки свертки с высокочастотным вейвлет-вектором (прямое вейвлет-преобразование) для трех уровней С1В, С2В, С3В, блоки свертки с низкочастотным вейвлет-вектором (прямое вейвлет-преобразование) для трех уровней С1Н, С2Н, С3Н, блоки пороговой функций для трех уровней ПФ1, ПФ2, ПФ3, блок уплотнения и формирования пакета цифровых данных БУФП.
На фиг.2. изображена структурная схема приемной части устройства кодирования речевого сигнала. Устройство содержит: блок выборки отсчетов сигнала БВ, блок выбора параметров вейвлет и пороговой функций БВПФ, блоки свертки с высокочастотным вейвлет-вектором (обратное вейвлет-преобразование) для трех уровней С1В, С2В, С3В, блоки свертки с низкочастотным вейвлет-вектором (обратное вейвлет-преобразование) для трех уровней С1Н, С2Н, С3Н, блоки обратных дециматоров для трех уровней ОД1, ОД2, ОД3, блок формирования отсчетов сигнала БФО.
Устройство работает следующим образом. На входе устройства речевой ИКМ-сигнал поступает на блок выборки, который формирует вектор отсчетов речевого сигнала. Длина вектора должна быть кратна степени числа 2. Далее вектор отсчетов сигнала поступает в блок классификации речевого сигнала, где вектор классифицируется по признаку вокализованности (признак Т/Ш) путем выделения основного тона известными алгоритмами [2]. На основе классификации выбираются параметры вейвлет преобразования (высокочастотный и низкочастотный вейвлет-векторы) и параметр пороговой функции.
Также в блоке Д1 выполняется децимация исходного вектора по четным и нечетным составляющим. Над четными составляющими в блоке С1Н выполняется операция свертки с низкочастотный вейвлет-вектором. Результирующий вектор вейвлет-коэффициентов поступает на следующий уровень вейвлет-преобразования. Над нечетными составляющими в блоке C1В выполняется операция свертки с высокочастотным вейвлет-вектором. Результирующий вектор вейвлет-коэффициентов поступает в блок ПФ1, где выполняется обнуление элементов вектора, меньших параметра пороговой функции. На втором уровне преобразования выполняются аналогичные действия. Третий уровень преобразования отличается тем, что результирующий вектор вейвлет-коэффициентов после блока С1Н поступает не на следующий уровень преобразования, а на блок пороговой функции ПФ4. Четыре результирующие вектора фильтрованных вейвлет-коэффициентов поступают в блок уплотнения и формирования пакета цифровых данных БУФП, где они объединяются в один пакет и над ними выполняется операция уплотнения при помощи кода переменной длины (RLE) или кода Хаффмана при помощи известных алгоритмов [3]. После этого в пакет добавляется признак Т/Ш и с выхода блока БУФП пакет данных последовательно передается в канал ИКМ ГГС.
В приемной стороне кодированный сигнал поступает на блок выборки, который выделяет пакет данных, выбирает из него признак Т/Ш, выполняет декодирование кода уплотнения (переменной длины или Хаффмана) и разделяет пакет на четыре вектора вейвлет-коэффициентов. Признак Т/Ш поступает в блок БВПФ аналогичный одноименному блоку в передающей части. Векторы вейвлет-коэффициентов поступают на входы соответствующих блоков свертки с вейвлет-векторами. Результирующие векторы с выходов блоков высоко и низкочастотной свертки поступают на соответствующие входы блоков обратной децимации, где происходит формирование нового вектора, при этом отсчеты низкочастотного вектора являются четными отсчетами нового вектора, а отсчеты высокочастотного вектора - нечетными. Новый вектор поступает на вход блока свертки с низкочастотным вейвлет-вектором следующего уровня вейвлет-преобразования. Вектор с выхода последнего блока обратной децимации ОД1 является восстановленным вектором речевого сигнала и поступает на вход блока формирования отсчетов ИКМ-сигнала, в котором элементы вектора последовательно передаются на внешний цифро-аналоговый преобразователь и далее индикационное устройство.
При использовании данного устройства необходимая битовая скорость передачи цифрового потока в канале ИКМ снижается с 64 кбит/сек до 16 кбит/сек, а, значит, требуемая минимальная полоса пропускания аналогового канала ГГС становится равной 16 кГц.
ИСТОЧНИКИ ИНФОРМАЦИИ
1. Патент РФ №2002134814 С1, МПК G01R 17/02, Опубликован 20.06.2005 Бюл.№17.
2. Дж.Д.Маркел, А.Х.Грэй. Линейное предсказание речи/Под ред. Ю.Н.Прохорова и В.С.Звездина. - М.: Связь, 1980, стр.196-214
3. Nelson М. The Data Compression Book, 2nd ed., M&T books, Nov.1995.

Claims (1)

  1. Устройство кодирования речевого сигнала в системах громкоговорящей связи, обеспечивающее минимизацию объема цифровых данных в канале импульсно-кодовой модуляции, необходимых для представления речевого сигнала, путем применения к входному цифровому потоку речевого сигнала трехуровневого адаптивного вейвлет-преобразования с последующей адаптивной пороговой фильтрацией вейвлет-коэффициентов и уплотнения полученных цифровых данных, необходимая битовая скорость передачи цифрового потока в канале ИКМ снижается с 64 кбит/с до 16 кбит/с, а, значит, требуемая минимальная полоса пропускания аналоговой канала становится равной 16 кГц, содержащее передающую часть, включающую блок выборки, формирующий вектор отсчетов речевого сигнала, вход которого является входом устройства, а выход является входом блока классификации речевого сигнала по признаку тон/шум, выход которого соединен с блоком выбора параметров вейвлет и пороговой функций, и входом группы блоков прямого трехуровневого вейвлет-преобразования выходы которых, а также выход блока классификации речевого сигнала являются входами блока уплотнения и формирования пакета цифровых данных, выход которого является выходом передающей части устройства, и приемную часть, включающую блок выборки, выделяющий и декодирующий пакет данных, вход которого является входом приемной части устройства, а выход является входом блока выбора параметров вейвлет и пороговой функций, а также входом группы блоков обратного трехуровневого вейвлет-преобразования, выход последнего из которых является входом блока формирования отсчетов ИКМ-сигнала, выход которого является выходом устройства.
    Figure 00000001
RU2007134691/22U 2007-09-17 2007-09-17 Устройство кодирования речевого сигнала в системах громкоговорящей связи RU70000U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2007134691/22U RU70000U1 (ru) 2007-09-17 2007-09-17 Устройство кодирования речевого сигнала в системах громкоговорящей связи

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2007134691/22U RU70000U1 (ru) 2007-09-17 2007-09-17 Устройство кодирования речевого сигнала в системах громкоговорящей связи

Publications (1)

Publication Number Publication Date
RU70000U1 true RU70000U1 (ru) 2008-01-10

Family

ID=39020659

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007134691/22U RU70000U1 (ru) 2007-09-17 2007-09-17 Устройство кодирования речевого сигнала в системах громкоговорящей связи

Country Status (1)

Country Link
RU (1) RU70000U1 (ru)

Similar Documents

Publication Publication Date Title
CN1838239B (zh) 一种用于增强信源解码器的设备及方法
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
CN101518083B (zh) 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统
CN101421780B (zh) 用于编码和解码时变信号的方法和设备
CN100561576C (zh) 一种基于量化信号域的立体声及多声道编解码方法与系统
CN1153365C (zh) 采用不同编码原理的传送系统
KR20070051910A (ko) 스케일러블 부호화 장치, 스케일러블 복호화 장치,스케일러블 부호화 방법, 스케일러블 복호화 방법, 통신단말 장치 및 기지국 장치
JP4548348B2 (ja) 音声符号化装置及び音声符号化方法
JP2012529068A (ja) 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
CN101432802A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
CN101162584A (zh) 使用带宽扩展技术对音频信号编码和解码的方法和设备
CN1193344C (zh) 语音解码器和一种语音解码方法
KR20000069494A (ko) 이산 신호를 부호화하고 부호화된 이산 신호를 복호화하기 위한방법 및 장치
KR100819623B1 (ko) 음성 데이터의 처리 장치 및 처리 방법
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
RU70000U1 (ru) Устройство кодирования речевого сигнала в системах громкоговорящей связи
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JPH1011094A (ja) 広帯域音声符号化装置及び音声復号装置
JPH07183857A (ja) 伝送システム
JP3453116B2 (ja) 音声符号化方法及び装置
JPS5852239B2 (ja) 線型予測型音声分析合成系のパラメ−タの符号化方式
JPS6333025A (ja) 音声符号化法
JP3092124B2 (ja) 適応変換符号化の方法及び装置
JP2778128B2 (ja) 適応変換符号化の方法及び装置
JP2638208B2 (ja) 適応変換符号化復号化の方法及び装置

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20080918