RU2195715C1 - Способ сжатия и восстановления речевых сообщений - Google Patents

Способ сжатия и восстановления речевых сообщений Download PDF

Info

Publication number
RU2195715C1
RU2195715C1 RU2001113835A RU2001113835A RU2195715C1 RU 2195715 C1 RU2195715 C1 RU 2195715C1 RU 2001113835 A RU2001113835 A RU 2001113835A RU 2001113835 A RU2001113835 A RU 2001113835A RU 2195715 C1 RU2195715 C1 RU 2195715C1
Authority
RU
Russia
Prior art keywords
elements
matrix
size
speech signal
samples
Prior art date
Application number
RU2001113835A
Other languages
English (en)
Inventor
А.И. Лобашев
В.А. Тарусов
А.О. Тюлегенев
А.А. Устинов
Original Assignee
Военный университет связи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Военный университет связи filed Critical Военный университет связи
Priority to RU2001113835A priority Critical patent/RU2195715C1/ru
Application granted granted Critical
Publication of RU2195715C1 publication Critical patent/RU2195715C1/ru

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к передаче речевых сообщений. Его использование позволяет получить технический результат в виде обеспечения требуемой пропускной способности для ведения телефонных разговоров по низкоскоростным каналам связи. Способ заключается в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют квадратную матрицу квантованных отсчетов речевого сигнала, формируют множество единичных и нулевых элементов в виде прямоугольных матриц меньшего размера, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют квадратную матрицу восстановленных отсчетов речевого сигнала и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал. Технический результат достигается благодаря тому, что при поиске оптимальных матриц осуществляют неполный перебор всех возможных значений элементов в строках и столбцах матриц, на структуру и процесс оптимизации которых наложены соответствующие ограничения. 7 ил.

Description

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации. Предлагаемый способ может быть использован для передачи речевых сообщений по цифровым каналам связи со скоростью до 4 кбит/с и может быть отнесен к классу способов кодирования формы речевого сигнала или способов непосредственного кодирования-восстановления.
Известны способы кодирования формы речевого сигнала, см., например, книгу: Дж. Кейтер Компьютеры - синтезаторы речи. - М.: Мир, 1985, с.87-103, включающие выполнение трех операций: временную дискретизацию аналоговых сигналов, их квантование и кодирование (представление квантованных дискретных отсчетов речевого сигнала двоичными цифрами). Рассматриваемый способ главным образом определяет механизм кодирования и декодирования квантованных дискретных отсчетов речевого сигнала.
Известны также способы кодирования дискретных квантованных отсчетов речевого сигнала на основе дельта-модуляции, адаптивной дельта-модуляции, импульсно-кодовой модуляции, дифференциальной импульсно-кодовой модуляции, метода блочного кодирования с ортогональным преобразованием, см., например, книгу: Назаров М.В., Петров Ю.Н. Методы цифровой обработки и передачи цифровых сигналов. - M.: Радио и связь, 1985, с.142-161. Недостатком перечисленных выше способов-аналогов является относительно низкая информационная эффективность, под которой понимается достижение определенного качества восстановления речевой информации при заданной скорости передачи. В рассмотренных способах-аналогах приемлемое качество восстановления речевой информации достигается при скорости передачи более 16 кбит/с.
Аналогом является также способ, описанный в патенте Великобритании 2280827 А, МПК7 G 10 L 3/02 от 08.02.1995. Известный способ включает дискретизацию непрерывного сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала, ее преобразование к цифровому виду с использованием американского стандарта сжатия JPEG, передаче цифрового потока по каналу связи, приеме цифрового потока из канала связи, восстановлении матрицы квантованных отсчетов речевого сигнала из цифрового потока с использованием стандарта JPEG и обратном преобразовании квантованных отсчетов в непрерывный речевой сигнал. Однако недостатком этого способа является большая временная задержка речевого сигнала, что исключает возможность применения данного способа для ведения телефонных переговоров по цифровым каналам связи.
Наиболее близким по своей технической сущности к заявленному способу сжатия и восстановления речевых сообщений является способ, описанный в патенте России 2152646 А, МПК7 G 10 L 3/02 от 2000 г.
Способ-прототип включает дискретизацию непрерывного речевого сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала размером N•N элементов, преобразование матрицы квантованных отсчетов речевого сигнала размером N•N элементов к цифровому виду путем генерации случайной квадратной матрицы квантованных отсчетов размером m•m элементов, формировании множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m и m•N элементов, генерации случайных матриц размером N•m и m•N элементов, преобразовании матриц размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычислении матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, вычислении суммы квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, последовательной инверсии i-того элемента матриц m•N и N•m элементов, вычислении матрицы восстановленных отсчетов речевого сигнала размером N•N элементов с инвертированным элементом, вычислении суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, сравнении вычисленных ошибок и сохранении значения инвертированного i-того элемента матриц m•N и N•m элементов если разность больше нуля и инвертировании повторно i-той элемента матриц m•N и N•m элементов, если разность меньше нуля, передачи множества нулевых и единичных элементов прямоугольных матриц размером N•m и m•N элементов по каналу связи, приему множества нулевых и единичных элементов матриц размером N•m и m•N элементов из канала связи, формировании матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, преобразовании матрицы восстановленных отсчетов речевого сигнала размером N•N элементов в непрерывный речевой сигнал.
Способ-прототип позволяет снизить значение временной задержки передаваемой информации до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.
Недостатком этого способа-прототипа является относительно большая требуемая пропускная способность цифрового канала связи (4-8 кбит/с), что ограничивает возможность применения данного способа для ведения телефонных переговоров по низкоскоростным цифровым каналам связи.
Целью изобретения является разработка способа сжатия и восстановления речевых сообщений, обеспечивающего снижение требуемой пропускной способности цифрового канала связи, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.
Поставленная цель достигается тем, что в известном способе сжатия и восстановления речевых сообщений, заключающемся в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов, формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал, для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные элементы каждого столбца матрицы размером m•N элементов и нечетные элементы каждой строки матрицы размером N•m элементов.
Затем присваивают четным элементам каждого столбца матрицы размером m•N элементов и четным элементам каждой строки матрицы размером N•m элементов инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.
После этого преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов.
Затем последовательно инвертируют каждый нечетный элемент столбцов матрицы размером m•N элементов и каждый нечетный элемент строк матрицы размером N•m элементов и одновременно инвертируют последующие по номеру четные элементы столбцов матрицы размером m•N элементов и последующие по номеру четные элементы строк матрицы размером N•m элементов. Преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов. Вычисляют сумму квадратов разностей между элементами полученной в результате этого перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из полученной до инвертирования элемента суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов. В случае положительной разности - сохраняют значения инвертированных элементов, а в случае отрицательной разности - их повторно инвертируют. Затем сформированные множества нулевых и единичных элементов в виде нечетных элементов каждого столбца матрицы размером m•N элементов и нечетных элементов каждой строки матрицы размером N•m элементов передают в канал связи. Для формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов восстанавливают недостающие четные элементы каждого столбца матрицы размером m•N элементов и четные элементы каждой строки матрицы размером N•m элементов, присваивая им инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.
Предлагаемый способ позволяет перейти от представления речевого сигнала в виде матрицы квантованных отсчетов размером N•N элементов (для передачи каждого элемента которой требуется 8 бит) к представлению речевого сигнала в виде произведения трех матриц, одну из которых передавать по каналу связи нет необходимости (она заранее формируется на передающей и приемной сторонах), а две другие преобразуют в целочисленные матрицы (для передачи каждого элемента которых требуется 1 бит) и их размер меньше исходной матрицы квантованных отсчетов речевого сигнала (N•m и m•N элементов, m<N). Более того, наложение ограничений на структуру этих матриц позволяет передавать их по каналу связи в усеченном виде (только их нечетные строки или столбцы), что позволяет снизить значение величины требуемой пропускной способности канала до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.
Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественными всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна". Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного способа, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразовании на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности "изобретательский уровень".
Заявленный способ поясняется чертежами.
- Фиг.1 График кривой, описывающей форму непрерывного речевого сигнала.
- Фиг.2 Пример квантованных дискретных отсчетов речевого сигнала.
- Фиг. 3 Пример формирования матрицы квантованных отсчетов речевого сигнала размером N•N элементов.
- Фиг. 4 Представление матрицы восстановленных квантованных отсчетов речевого сигнала в виде произведения трех матриц.
- Фиг.5 Структура матриц [Y]Nxm, [X]mxN, и [Ypr]Nxm, [Xpr]mxN.
- Фиг.6 Преобразование матрицы квантованных отсчетов речевого сигнала к цифровому виду и обратное преобразование принятого из канала связи цифрового потока в матрицу восстановленных отсчетов речевого сигнала.
- Фиг.7 Последовательная оптимизация элементов матриц [Х]mxN и [Y]TmxN.
Возможность реализации заявленного способа сжатия и восстановления речевых сообщений при сохранении хорошего качества восстановления (высокой разборчивости и узнаваемости речи) объясняется следующим. Существует традиционный подход, когда с целью сокращения объема информации, который необходимо передать по каналу связи в единицу времени, каждое кодируемое сообщение
Figure 00000002
(блок последовательных отсчетов в виде матрицы квантованных отсчетов речевого сигнала), представляется своей оценкой
Figure 00000003
в виде произведения матрицы опорных векторов (базиса) на матрицу коэффициентов разложения. Получатель, используя принятые коэффициенты разложения и базис, осуществляет восстановление сообщений источника. Примеры такого подхода известны: дискретное косинусное преобразование, быстрое преобразование Фурье, преобразование Карунена-Лоэва, Вейвлет-преобразования и другие. Использование этих методов не позволяет достичь требуемого коэффициента сжатия при хорошем качестве восстановления речи. То есть объем информации, который необходимо передать по каналу связи в единицу времени при сохранении хорошего качества восстановления речевых сообщений, велик за счет больших размерностей и разрядности матрицы опорных векторов (базиса).
В предлагаемом способе опорные вектора (базис) не передаются, а формируются на приемной стороне из случайной матрицы и принятых из канала связи целочисленных коэффициентов.
Предлагаемый способ предполагает проведение следующих действий.
Формирование случайной квадратной матрицы квантованных отсчетов [B]mxm может быть выполнено на основе датчика случайных чисел, например на основе шумового диода. Для выполнения требования идентичности матрицы [B]mxm приемника, аналогичной матрице передатчика, перед началом каждого сеанса связи элементы матрицы [B]mxm могут быть сгенерированы на передаче и переданы но цифровому каналу связи на приемную сторону, например, в составе синхропосылки.
Дискретизацию непрерывного речевого сигнала, представленного на фиг.1, выполняют в соответствии с теоремой Котельникова. В предлагаемом способе выбрана общепринятая частота дискретизации непрерывного речевого сигнала 8 кГц.
Затем осуществляют квантование дискретных отсчетов. Квантование осуществляется на основе способов, описанных, например, в кн.: Назаров М.В., Петров Ю.Н. Методы цифровой обработки и передачи цифровых сигналов. - М.: Радио и связь, 1985, с. 142-161.
Далее, на основе множества квантованных дискретных отсчетов речевого сигнала осуществляют формирование матрицы квантованных отсчетов речевого сигнала [A]NxN. Формирование матрицы квантованных отсчетов речевого сигнала [A]NxN показано на фиг.3. При этом матрица квантованных отсчетов формируется из N2 квантованных дискретных отсчетов речевого сигнала, каждому элементу которой А, где j=1,2,...,N; i=1,2,...,N присваивают квантованное значение отсчета речевого сигнала, k-й номер которого определяют в соответствии с выражением: k=j+N•(i-1).
Для преобразования матрицы квантованных отсчетов речевого сигнала [A]NxN с целью уменьшения объема информации, передаваемого по каналу связи, используют подход, основанный на представлении матрицы [A]NxN в виде произведения трех матриц: прямоугольной матрицы размером N•m элементов (в дальнейшем обозначим ее как [Ypr]Nxm), случайной квадратной матрицы квантованных отсчетов размером m•m элементов (в дальнейшем обозначим ее как [B]mxm) и прямоугольной матрицы размером m•N элементов (в дальнейшем обозначим ее как [Хpr] mxN). Тогда, при кодировании матрицы квантованных отсчетов речевого сигнала [A] NxN, на передаче необходимо найти такие оптимальные матрицы [Ypr]Nxm и [Хpr]mxN, которые при перемножении с матрицей [B]mxm образуют некоторую матрицу восстановленных дискретных отсчетов речевого сигнала размером N•N элементов (в дальнейшем обозначим эту матрицу как
Figure 00000004
), наиболее близкую по заданному критерию к матрице квантованных дискретных отсчетов речевого сигнала [A]NxN.
Особенностью матриц [Ypr]Nxm и [Xpr]mxN является то, что они могут быть легко приведены к цифровому виду. Это достигается тем, что на элементы этих матриц накладываются следующие ограничения:
- элементы матриц [Ypr]Nxm и [Xpr]mxN принимают значения в диапазоне от нуля до единицы;
- ненулевые элементы каждой строки матрицы [Ypr]Nxm равны между собой и в сумме образуют единицу;
- ненулевые элементы каждого столбца матрицы [Xpr]mxN равны между собой и в сумме образуют единицу;
При таких ограничениях если элементы каждой строки матрицы [Ypr]Nxm умножить на количество ненулевых элементов в этой строке, то будет получена матрица [Y] Nxm, элементы которой определены только на множестве "1" и "0". Аналогично, если элементы каждого столбца матрицы [Xpr]mxN умножить на количество ненулевых элементов в столбце, то будет получена матрица [X]mxN, элементы которой определены только на множестве "1" и "0".
Так как при поиске оптимальных матриц [Ypr]Nxm и [Xpr]mxN осуществляют не полный перебор всех возможных значений элементов столбцов и строк матриц [Y]Nxm и [Х]mxN, то можем накладывать ограничения на структуру матриц [Y]Nxm и [X]mxN и на процесс оптимизации этих матриц с целью уменьшения количества информации, которую нужно будет в дальнейшем передавать по каналам связи.
Процедура, реализующая поиск на передаче оптимальных матриц [Y]Nxm и [X] mxN подробно описана в Приложении 1.
Таким образом, представление матрицы квантованных отсчетов речевого сигнала [A] NxN к цифровому виду на передаче осуществляют на основе формирования множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m (матрица [Y]Nxm) и m•N (матрица [X]mxN) элементов.
После определения оптимальных матриц [Ypr]Nxm и [Xpr]mxN передают в канал связи не все значения матриц [Y]Nxm и [X]mxN, а только значения нечетных элементов каждого столбца матрицы [X]mxN и нечетных элементов каждой строки матрицы [Y]Nxm.
Принимают из канала связи значения нечетных элементов каждого столбца матрицы [X] mxN и нечетных элементов каждой строки матрицы [Y]Nxm, восстанавливают недостающие четные элементы строк и столбцов матриц [Y]Nxm и [X] mxN. При этом четным элементам каждого столбца матрицы [X]mxN и четным элементам каждой строки матрицы [Y] Nxm присваивают инвертированные значения предшествующих по номеру элементов столбца для матрицы [X]mxN и строки для матрицы [Y]Nxm.
После приема из канала связи цифрового потока и восстановления матриц [Y]Nxm и [X]Nxm их преобразуют в матрицы [Ypr]Nxm и [Xpr]mxN соответственно. Преобразование выполняют путем деления элементов каждой строки матрицы [Y] Nxm на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы [X]mxN на сумму единиц соответствующего столбца. После этого формируют матрицу восстановленных отсчетов речевого сигнала
Figure 00000005
путем перемножения матриц [Ypr]Nxm и [Xpr]mxN и ранее сформированной квадратной матрицы квантованных дискретных отсчетов [В] mxm в соответствии с выражением
Figure 00000006
и выполняют обратное преобразование из матрицы восстановленных квантованных отсчетов речевого сигнала
Figure 00000007
в непрерывный речевой сигнал. Наглядно представление матрицы восстановленных дискретных отсчетов речевого сигнала
Figure 00000008
в виде произведения трех матриц представлено на фиг.4.
Для оценки эффективности предлагаемого способа сжатия и восстановления речевых сообщений было проведено имитационное моделирование на ПЭВМ. При кодировании речевых сообщений использовалось 8-разрядное АЦП. При этом размер кодируемого блока составлял 16•16 элементов, что обеспечивало задержку передачи речи 32 мс. Такая величина временной задержки передаваемой информации ниже временной задержки, реализуемой в способе-прототипе (в способе-прототипе величина временной задержки речевого сигнала составляет 72 мс). Задержка 32 мс позволяет осуществить ведение дуплексных телескопных переговоров по низкоскоростным каналам связи. Размер случайной квадратной матрицы квантованных дискретных отсчетов составлял 8•8 элементов. В предлагаемом способе высокая степень сжатия речевой информации достигалась за счет того, что для формирования на приеме матрицы восстановленных отсчетов речевого сигнала [A] NxN в цифровой канал связи необходимо передать количество двоичных единиц, определяемое размерами матриц [Y]Nxm и [X]mxN с учетом того, что передавать их надо в усеченном (ровно в 2 раза) виде. При этом достигаемый коэффициент сжатия (коэффициент уменьшения требуемой скорости передачи цифрового потока) может быть найден по формуле
Figure 00000009

где L - число уровней квантования дискретных отсчетов речевого сигнала.
При выборе N= 16, m=8 (L=256) обеспечивался коэффициент сжатия 16 раз (скорость передачи на выходе кодера - 4 [кбит/с]). При выборе размера случайной матрицы квантованных отсчетов речевого сигнала 6•6 элементов коэффициент сжатия речевых сообщений составил 21.3 раз (скорость передачи на выходе кодера - 3 [кбит/с]). Качество восстановленной речи на приеме оценивалось по соотношению сигнал/шум и составило около 8 [дБ]. При этом восстановленная речь сохраняет свою естественность, натуральность и обладает хорошей разборчивостью. Анализ вычислительной сложности показал, что сложность кодирования/декодирования предлагаемой процедуры (количество операций умножения, деления, сложения, вычитания) пропорционально приблизительно величине m2. Поэтому, предлагаемый способ сжатия и восстановления речи может быть реализован на современных процессорах обработки сигналов.
Приложение 1.
Процедура поиска оптимальных матриц [Y]Nxm и [X]mxN
Процесс поиска оптимальных матриц [Y]Nxm, [X]mxN, определенных на множестве "1" и "0", может занимать достаточно большое время вследствие большой размерности искомых матриц и ограничения на целочисленность их элементов. Известно, что задачи подобного типа обладают экспоненциальной сложностью. Поэтому для сокращения времени поиска оптимальных матриц [Y]Nxm, [X]mxN, в заявленном способе предлагается реализовать приближенный метод поиска. В качестве приближенного метода поиска в изобретении предложено использовать известный метод Гаусса-Зейделя для решения оптимизационных задач с большим числом неизвестных. Данный метод предполагает разбиение всего множества неизвестных на несколько подмножеств, например два, и осуществление оптимизации одного подмножества при фиксированном другом. Далее, для найденного оптимального подмножества выполняют оптимизацию элементов другого подмножества. Данный процесс повторяется, пока изменение одного из подмножеств не будет приводить к максимизации (минимизации) выбранного критерия.
В изобретении предлагается разбить все множество оптимизируемых элементов на два подмножества: подмножество элементов матрицы [Y]Nxm и подмножество элементов матрицы [X]mxN. Затем, фиксируя элементы матрицы [Y]Nxm, определить оптимальные элементы матрицы [X]mxN. Далее, для найденной оптимальной матрицы [X]mxN, определить оптимальные элементы матрицы [Y]Nxm. Данный процесс повторяется, пока изменение одного из подмножеств не будет приводить к максимизации выбранного критерия. При таком подходе для оптимизации элементов матриц [X]mxN и [Y]Nxm можно воспользоваться одним и тем же алгоритмом. Это объясняется тем, что данные матрицы "меняются местами" при транспонировании матрицы квантованных отсчетов речевого сигнала [A]NxN. Наглядно это представлено на фиг.7. Единственное различие состоит в том, что вместо оптимальной матрицы [Y] Nxm будет получена оптимальная матрица [Y] TmxN.
Однако из нее легко получить оптимальную матрицу [Y]Nxm, выполняя операцию транспонирования ([Y] T m×N )T.
Таким образом, достаточно рассмотреть процедуру оптимизации элементов матрицы [X]mxN. Для оптимизации элементов матрицы [X]mxN в изобретении предложен эвристический метод названный методом "пробных инверсий". Сущность метода состоит в следующем. Предварительно на передаче случайным образом генерируют нечетные элементы каждого столбца прямоугольной матрицы [X]mxN и нечетные элементы каждой строки прямоугольной матрицы [Y]Nxm, элементы которых принимают значения "1" или "0". Присваивают четным элементам столбцов матрицы [X]mxN и четным элементам строк матрицы [Y]Nxm инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы [X]mxN и матрицы [Y]Nxm соответственно. В течение всего процесса оптимизации матриц [X]mxN и [Y]Nxm при инверсии одного элемента матрицы инвертируется и элемент, связанный с ним по предлагаемому правилу. Затем осуществляют преобразование матрицы [Y]Nxm в матрицу [Ypr]Nxm путем деления элементов каждой строки матрицы [Y]Nxm на сумму единиц соответствующей строки.
Наглядно преобразование матрицы представлено на фиг.5. Затем выполняют умножение матриц [Ypr]Nxm и [B]mxm, получая при этом матрицу
[DY]Nxm=[Ypr]Nxm[B]mxm.
После выполнения данных подготовительных действий осуществляют оптимизацию элементов матрицы [X]mxN путем пробной инверсии ее каждого нечетного элемента каждого столбца. Одновременно с инверсией каждого нечетного k-го элемента j-го столбца производят инверсию последующего по номеру k+1-го элемента этого столбца.
Отметим, что инверсия (замена "1" на "0" или "0" на "1") любого k-го нечетного элемента, где k=1,3,...,m-1 и связанного с ним по описанному выше правилу последующего k+1-го четного элемента j-го столбца, где j=1,2,...,N матрицы [X] mxN приводит к изменению только элементов j-го столбца матрицы
Figure 00000010
, получаемой в результате произведения
Figure 00000011

где
Figure 00000012
- матрица восстановленных отсчетов речевого сигнала при инверсии k-го нечетного и связанного с ним по описанному выше правилу k+1-го четного элемента j-го столбца матрицы [X]mxN;
[Xpr] k,jmxN - матрица, полученная после инверсии k-го нечетного и связанного с ним по описанному выше правилу k+1-го четного элемента j-го столбца матрицы [X]mxN и ее последующего преобразования путем деления элементов каждого столбца на сумму единиц соответствующего столбца. Поэтому при поиске оптимальных элементов j-го столбца матрицы [X]mxN достаточно вычислить сумму квадратов разностей между элементами j-го столбца матрицы квантованных отсчетов речевого сигнала [A]NxN и элементами j-го столбца матрицы восстановленных квантованных отсчетов речевого сигнала
Figure 00000013

Figure 00000014

где аkj - k-е элементы j-го столбца матрицы [A]NxN;
Figure 00000015
- k-е элементы j-го столбца матрицы
Figure 00000016
.
На основании этого можно заключить, что поиск оптимальных элементов матрицы [X] mxN можно осуществлять последовательно по каждому k-у нечетному элементу j-го столбца, где j=1,2,...,N, k=1,3,...,m-1. Поэтому достаточно рассмотреть алгоритм оптимизации элементов j-го столбца матрицы [X]mxN.
Процесс поиска оптимальных элементов j-го столбца матрицы [X]mxN в заявленном способе предлагается осуществить в виде следующей последовательности действий:
1. Положить i=0.
2. Сформировать вектор:
Figure 00000017

где
Figure 00000018

3. Вычислить:
Figure 00000020

4. Положить i=i+1.
5. Вычислить: k=2i-1.
6. Выполнить:
- инверсию k-го нечетного элемента вектора
Figure 00000021
:
- инверсию k+1-го четного элемента вектора
Figure 00000022
:
- сформировать вектор:
Figure 00000023

6. Вычислить:
Figure 00000024

Figure 00000025

выполнить: если
Figure 00000026
, то присвоить
Figure 00000027
Figure 00000028
Figure 00000029

если
Figure 00000030
то значения e2j, и
Figure 00000031
оставить без изменения.
9. Выполнить: если i≠m/2, то увеличить i на единицу и перейти к пункту 4;
если i= m/2, то перейти поиску оптимальных элементов следующего столбца матрицы [X]mxN.
В результате выполнения данных операций на передаче получают оптимальную матрицу [X] mxN. После этого на передаче кодер выполняет поиск оптимальной матрицы [Y]Nxm аналогичным образом.

Claims (1)

  1. Способ сжатия и восстановления речевых сообщений, заключающийся в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов, формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал, отличающийся тем, что для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные элементы каждого столбца матрицы размером m•N элементов и нечетные элементы каждой строки матрицы размером N•m элементов, присваивают четным элементам каждого столбца матрицы размером m•N элементов и четным элементам каждой строки матрицы размером N•m элементов инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно, после чего преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, затем последовательно инвертируют каждый нечетный элемент столбцов матрицы размером m•N элементов и каждый нечетный элемент строк матрицы размером N•m элементов, и одновременно инвертируют последующие по номеру четные элементы столбцов матрицы размером m•N элементов и последующие по номеру четные элементы строк матрицы размером N•m элементов, преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из ранее полученной суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, в случае положительной разности сохраняют значения инвертированных элементов, а в случае отрицательной разности их повторно инвертируют, затем сформированные множества нулевых и единичных элементов в виде нечетных элементов каждого столбца матрицы размером m•N элементов и нечетных элементов каждой строки матрицы размером N•m элементов передают в канал связи, а для формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов восстанавливают недостающие четные элементы каждого столбца матрицы размером m•N элементов и четные элементы каждой строки матрицы размером N•m элементов, присваивая им инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.
RU2001113835A 2001-05-21 2001-05-21 Способ сжатия и восстановления речевых сообщений RU2195715C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2001113835A RU2195715C1 (ru) 2001-05-21 2001-05-21 Способ сжатия и восстановления речевых сообщений

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2001113835A RU2195715C1 (ru) 2001-05-21 2001-05-21 Способ сжатия и восстановления речевых сообщений

Publications (1)

Publication Number Publication Date
RU2195715C1 true RU2195715C1 (ru) 2002-12-27

Family

ID=20249870

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2001113835A RU2195715C1 (ru) 2001-05-21 2001-05-21 Способ сжатия и восстановления речевых сообщений

Country Status (1)

Country Link
RU (1) RU2195715C1 (ru)

Similar Documents

Publication Publication Date Title
JP6792011B2 (ja) Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
US6198412B1 (en) Method and apparatus for reduced complexity entropy coding
CN103430460A (zh) 一种波束赋形矩阵的发送、接收方法和装置
US5802369A (en) Energy-based wavelet system and method for signal compression and reconstruction
US20060293881A1 (en) Haar wavelet transform embedded lossless type IV discrete cosine transform
CN107895580B (zh) 一种音频信号的重建方法和装置
RU2195715C1 (ru) Способ сжатия и восстановления речевых сообщений
RU2419246C1 (ru) Способ сжатия и восстановления неподвижных полутоновых видеоизображений
US7640283B2 (en) Shared Haar wavelet transform
RU2195714C1 (ru) Способ сжатия и восстановления речевых сообщений
Naimi et al. Multiple description image coding using contourlet transform
US6539366B1 (en) Codec with genetic adaptation
RU2152646C1 (ru) Способ сжатия и восстановления речевых сообщений
RU2244963C1 (ru) Способ сжатия и восстановления речевых сообщений
RU2246798C1 (ru) Способ сжатия и восстановления сообщений
Sadkhan et al. A proposed analog speech scrambler based on parallel structure of wavelet transforms
CN109040116B (zh) 一种基于云端服务器的视频会议系统
RU2374785C2 (ru) Способ сжатия и восстановления сообщений
Swain et al. InceptCodeNet based CSI feedback in massive MIMO systems
RU2320027C2 (ru) Способ сжатия и восстановления речевых сообщений
RU2297099C2 (ru) Способ передачи дополнительной информации при кодировании речевых сообщений
RU2261532C1 (ru) Способ сжатия и восстановления сообщений
RU2817687C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
RU2288547C1 (ru) Способ сжатия и восстановления сообщений
Abduljabbar et al. A Survey paper on Lossy Audio Compression Methods