RU2811412C1 - СПОСОБ КОДИРОВАНИЯ ПАРАМЕТРОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРОГНОЗИРОВАНИЕМ и УСТРОЙСТВО КОДИРОВАНИЯ - Google Patents
СПОСОБ КОДИРОВАНИЯ ПАРАМЕТРОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРОГНОЗИРОВАНИЕМ и УСТРОЙСТВО КОДИРОВАНИЯ Download PDFInfo
- Publication number
- RU2811412C1 RU2811412C1 RU2022130122A RU2022130122A RU2811412C1 RU 2811412 C1 RU2811412 C1 RU 2811412C1 RU 2022130122 A RU2022130122 A RU 2022130122A RU 2022130122 A RU2022130122 A RU 2022130122A RU 2811412 C1 RU2811412 C1 RU 2811412C1
- Authority
- RU
- Russia
- Prior art keywords
- lpc
- parameter
- parameters
- channels
- encoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 156
- 238000013139 quantization Methods 0.000 claims abstract description 149
- 230000005236 sound signal Effects 0.000 claims abstract description 130
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000004891 communication Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 abstract description 11
- 238000004422 calculation algorithm Methods 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 108091006146 Channels Proteins 0.000 description 278
- 238000010586 diagram Methods 0.000 description 29
- 238000005259 measurement Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Abstract
Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в устранении избыточности параметров LPC между каналами, уменьшении количества битов, занятых для кодирования параметров LPC с квантованием для множества каналов, и уменьшении сложности вычислений ссылочного кодирования с квантованием для параметров LPC между каналами, учитывая объем вычислений алгоритма. Технический результат достигается за счет получения подлежащих кодированию параметров LPC для двух каналов аудио сигнала; определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC для двух каналов, где параметр LPC, отличный от опорного параметра LPC в совокупности подлежащих кодированию параметров LPC для двух каналов, является не опорным параметром LPC; получения результата прямого кодирования опорного параметра LPC; определения остатка не опорного параметра LPC на основе опорного параметра LPC; определения результата кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных. 6 н. и 24 з.п. ф-лы, 14 ил.
Description
Настоящая заявка претендует на приоритет заявки на выдачу патента Китая No. 202010349207.5, которая подана в Национальную администрацию Китая по вопросам интеллектуальной собственности 28 апреля 2020 г. под названием «СПОСОБ КОДИРОВАНИЯ ПАРАМЕТРОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРОГНОЗИРОВАНИЕМ И УСТРОЙСТВО КОДИРОВАНИЯ» ("LINEAR PREDICTION CODING PARAMETER CODING METHOD AND CODING APPARATUS"), и которая включена сюда посредством ссылки во всей своей полноте.
Область техники, к которой относится изобретение
Настоящая заявка относится к области технологий связи и, в частности, к способу кодирования параметров кодирования с линейным прогнозированием и устройству кодирования.
Уровень техники
Для того чтобы способствовать эффективному хранению и передаче аудио сигналов, кодирующему устройству для аудио необходимо сжимать аудио сигналы и преобразовывать их в кодированные потоки битов данных. Алгоритм кодирования на основе анализа линейного прогнозирования является одним из наиболее широко используемых алгоритмов кодирования для аудио сигналов. Главный принцип алгоритма кодирования состоит в определении параметра кодирования с линейным прогнозированием (linear prediction coding, LPC) с использованием краткосрочной зависимости аудио сигналов, и затем в фильтрации аудио сигналов с использованием фильтра с линейным прогнозированием для эффективного уменьшения скорости передачи битов данных при кодировании. Такой параметр LPC представляет собой параметр математической модели фильтра с линейным прогнозированием, и является одним из важнейших параметров при кодировании. Способ кодирования параметра LPC влияет на качество кодирования аудио сигналов, а для кодирования и передачи параметра LPC требуется определенная скорость передачи битов данных.
Для многоканального аудио сигнала, существующий способ кодирования параметра LPC содержит варианты независимого кодирования и ссылочного кодирования. В схеме независимого кодирования подобие параметров LPC между каналами не учитывается. Поэтому между квантованными параметрами LPC для всех каналов имеется большой объем избыточной информации и все это использует высокую скорость передачи битов данных. В схеме ссылочного кодирования сначала осуществляют прямое кодирование с квантованием применительно к параметру LPC одного канала, и осуществляют кодирование остатка с квантованием применительно к параметрам LPC по отдельности для рассматриваемого канала и другого канала. Наконец определяют схему кодирования с квантованием на основе эффекта кодирования, и записывают окончательный результат кодирования с квантованием применительно к параметру LPC в кодированном потоке битов данных.
Когда параметр LPC какого-либо канала кодируют по схеме ссылочного кодирования, кодирование остатка с квантованием необходимо осуществлять по отдельности с другим каналом, чтобы сравнить эффект кодирования для определения схемы кодирования. Когда имеется большое количество каналов, объем вычислений при кодировании остатка с квантованием оказывается большим.
Раскрытие сущности изобретения
Варианты настоящей заявки предлагают способ кодирования параметра кодирования с линейным прогнозированием с целью устранения избыточности параметров LPC между каналами, уменьшения количества битов, занятых для кодирования параметров LPC с квантованием для множества каналов, и уменьшения сложности вычислений ссылочного кодирования с квантованием для параметров LPC между каналами, учитывая объем вычислений алгоритма.
Первый аспект вариантов настоящей заявки предлагает способ кодирования параметров LPC, содержащий: получение подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала; определение опорного параметра LPC из подлежащих кодированию параметров LPC по меньшей мере для двух каналов, где параметр LPC, отличный от опорного параметра LPC, из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов представляет собой не опорный параметр LPC; получение результата прямого кодирования опорного параметра LPC; определение остатка не опорного параметра LPC на основе опорного параметра LPC; определение результата кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и запись результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированном потоке битов данных.
Подлежащий кодированию параметр LPC представляет собой первоначальный параметр LPC, параметр LPC c измерениями с высокими номерами (далее для краткости «параметр LPC с высокими измерениями») или параметр LPC с высокими измерениями, полученный после разбиения первоначального параметра LPC.
Способ кодирования параметров LPC, предлагаемый в рассматриваемом варианте настоящей заявки, применяют к кодированию параметров LPC для многоканального аудио сигнала. Определяют опорный параметр LPC из совокупности параметров LPC для множества каналов, осуществляют прямое кодирование опорного параметра LPC для получения результата прямого кодирования, и осуществляют ссылочное кодирование не опорного параметра LPC на основе опорного параметра LPC для получения результата кодирования остатка. Поэтому, для не опорного параметра LPC, нет необходимости выбирать из совокупности схем на основе разных опорных параметров LPC. Это может уменьшить объем вычислений и повысить эффективность кодирования.
В дополнение к этому, ссылочное кодирование позволяет учитывать сходство параметров LPC между каналами. Это уменьшает объем избыточной информации между квантованными параметрами LPC всех каналов и уменьшает количество занимаемых битов.
В одном из возможных вариантов реализации первого аспекта, процедура определения опорного параметра LPC на основе подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит: определение параметра LPC, который входит в совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов и который требует минимального количества битов для прямого кодирования с квантованием, в качестве опорного параметра LPC.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, опорный параметр LPC выбирают из совокупности множества параметров LPC посредством сравнения количеств битов, требуемых для прямого кодирования с квантованием применительно к этим параметрам. Это уменьшает количество битов, требуемое для прямого кодирования опорного параметра LPC с квантованием.
В одном из возможных вариантов реализации первого аспекта, совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подлежащие кодированию параметры LPC по меньшей мере для трех каналов. Процедура определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит: получение абсолютной величины разности между каждым параметром LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для трех каналов и другим параметров LPC; получение средней величины абсолютных величин разностей каждым параметром LPC и другими параметрами LPC; и определение параметра LPC, который входит в указанную совокупность параметров LPC и который имеет минимальную среднюю величину абсолютных величин разностей, в качестве опорного параметра LPC.
Согласно способу кодирования параметров LPC, описываемому в рассматриваемом варианте настоящей заявки, предложена конкретная реализация процедуры определения опорного параметра LPC из совокупности параметров LPC по меньшей мере трех каналов. Более конкретно, параметр LPC, имеющий минимальную разницу относительно других параметров LPC, выбирают в качестве опорного параметра LPC. Выбор параметра LPC с минимальной разницей может уменьшить искажения при ссылочном кодировании с квантованием, осуществляемом в отношении не опорного параметра LPC, и уменьшить количество битов, занимаемое для кодирования параметра LPC с квантованием.
В одном из возможных вариантов реализации первого аспекта, указанная разница содержит среднеквадратическую ошибку или косинусное расстояние.
Согласно способу кодирования параметров LPC, описываемому в рассматриваемом варианте настоящей заявки, предложены два конкретных способа вычисления разницы между параметрами LPC. Это повышает гибкость реализации технического решения.
В одном из возможных вариантов реализации первого аспекта, аудио сигнал содержит множество каналов, а способ дополнительно содержит: определение множества групп параметров посредством группирования подлежащих кодированию параметров LPC из множества каналов аудио сигнала. Одна из этого множества групп параметров содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, параметры LPC в этих множества группах параметров не имеют пересечений. Совокупность множества каналов содержит по меньшей мере четыре канала, и совокупность множества групп параметров содержит по меньшей мере две группы параметров.
Способ кодирования параметров LPC, предлагаемый в рассматриваемом варианте настоящей заявки, применяется главным образом к аудио сигналу с большим количеством каналов. Сначала группируют параметры LPC множества каналов, выбирают один опорный параметр LPC из каждой группы параметров LPC, и осуществляют ссылочное кодирование одного из не опорных параметров LPC в группе на основе опорного параметра LPC. По сравнению со ссылочным кодированием, осуществляемым применительно к параметрам LPC всех каналов на основе одного и того же параметра LPC, здесь можно уменьшить искажения. В качестве опции, каждый набор параметров содержит по меньшей мере два параметра LPC.
В одном из возможных вариантов реализации первого аспекта, процедура определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC из множества каналов аудио сигнала содержит: определение множества групп параметров на основе номеров каналов в указанной совокупности множества каналов аудио сигнала; или определение множества групп параметров на основе положения громкоговорителя, соответствующего каждому из множества каналов аудио сигнала.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, когда параметры LPC множества каналов группируют, это группирование может быть осуществлено на основе номеров каналов или позиций громкоговорителей, соответствующих этим каналам, для получения конкретной реализации группирования. Это повышает степень гибкость при реализации технического решения.
В одном из возможных вариантов реализации первого аспекта, процедура определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC из совокупности множества каналов аудио сигнала содержит: кластеризацию подлежащих кодированию параметров LPC из совокупности множества каналов аудио сигнала для определения множества групп параметров.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, группирование осуществляется на основе параметров LPC из всех каналов с использованием способа кластеризации. Множество полученных групп параметров имеют сходные параметры LPC. Это может уменьшить искажения при ссылочном кодировании, уменьшить количество битов, требуемое для осуществления ссылочного кодирования, и улучшить эффекты кодирования при ссылочном кодировании.
В одном из возможных вариантов реализации первого аспекта, процедура кластеризации подлежащих кодированию параметров LPC из множества каналов аудио сигнала для определения множества групп параметров содержит: определение M параметров LPC из совокупности подлежащих кодированию параметров LPC из множества каналов, где средняя величина абсолютных величин разностей между M параметрами LPC не меньше средней величины абсолютных величин разностей между любыми M параметрами LPC из совокупности параметров LPC из множества каналов, эти M параметров LPC являются центрами кластеризации M групп параметров, и M больше предварительно заданной величины; и осуществление кластеризации на основе этих M центров кластеризации, для определения M групп параметров, где абсолютная величина разности между первым параметром LPC и вторым параметром LPC в первой группе параметров из совокупности M групп параметров меньше абсолютной величины разности между первым параметром LPC и третьим параметром LPC, второй параметр LPC является центром кластеризации первой группы параметров, третий параметр LPC является центром кластеризации второй группы параметров, при этом первая группа параметров и вторая группа параметров являются какими-либо двумя разными группами параметров из совокупности M групп параметров.
Совокупность разностей между M параметрами LPC содержит разность между какими-либо двумя из M параметров LPC, и средняя величина абсолютных величин разностей между M параметрами LPC представляет собой среднюю величину из абсолютных величин M × (M - 1)/2 величин разностей.
Согласно способу кодирования параметров LPC, описываемому в рассматриваемом варианте настоящей заявки, предложен конкретный способ кластеризации для группирования параметров LPC из множества каналов в M предварительно заданных групп. Более конкретно, сначала определяют M параметров LPC с максимальной разностью в качестве центров кластеризации, и затем другие параметры LPC с минимальной разностью относительно центров кластеризации группируют в ту же самую группу. При таком подходе, разность между параметрами LPC является небольшой. Это может уменьшить искажения при ссылочном кодировании, уменьшить количество битов, требуемое для ссылочного кодирования, и усовершенствовать кодирующий эффект ссылочного кодирования.
В одном из возможных вариантов реализации первого аспекта процедура получения подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала содержит: разбиение первоначальных параметров LPC по меньшей мере для двух каналов аудио сигнала с целью получения группы параметров LPC с высокими измерениями и группы параметров LPC c измерениями с низкими номерами (далее для краткости «параметр LPC с низкими измерениями»). Группа параметров LPC с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, или группа параметров LPC с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов. В качестве опции, размерность параметра LPC в наборе параметров LPC с высокими измерениями является такой же, как размерность параметра LPC в наборе параметров LPC с низкими измерениями.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, первоначальные параметры LPC для всех аудио сигналов могут быть разбиты на основе размерности, и полученные в результате группу параметров LPC с высокими измерениями и группу параметров LPC с низкими измерениями кодируют по отдельности. Это повышает степень гибкости выбора схемы кодирования. Например, в сценарии, в котором параметры LPC с высокими измерениями для многоканального аудио сигнала в высокой степени похожи, а параметры LPC с низкими измерениями сильно различаются, ссылочное кодирование может быть осуществлено применительно к группе параметров LPC с высокими измерениями, и прямое кодирование осуществляется применительно к группе параметров LPC с низкими измерениями. Выбор схемы кодирования согласуется с фактическим сценарием применения. Это улучшает эффект кодирования при ссылочном кодировании.
В одном из возможных вариантов реализации первого аспекта, аудио сигнал содержит множество каналов и процедура получения подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала содержит: разбиение первоначальных параметров LPC из множества каналов аудио сигнала, с целью получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями; и получение множества групп параметров с высокими измерениями посредством группирования параметров LPC в группе параметров LPC с высокими измерениями, где одна из этих множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множества группах параметров с высокими измерениями не имеют пересечений; или получение множества групп параметров с низкими измерениями посредством группирования параметров LPC в группе параметров LPC с низкими измерениями, где одна из этих множества групп параметров с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множества группах параметров с низкими измерениями не имеют пересечений. Указанная совокупность множества каналов содержит по меньшей мере четыре канала, совокупность множества групп параметров с высокими измерениями содержит по меньшей мере две группы параметров, и совокупность множества групп параметров с низкими измерениями содержит по меньшей мере две группы параметров.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, первоначальные параметры LPC всех аудио сигналов разбивают на основе размерности, для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями. Если аудио сигнал имеет большое количество каналов, параметры LPC в группе параметров LPC с высокими измерениями из совокупности множества каналов могут быть дополнительно сгруппированы, либо параметры LPC в группе параметров LPC с низкими измерениями могут быть дополнительно сгруппированы. Посредством разбиения параметров LPC и группирования параметров LPC можно удовлетворить актуальным требованиям кодирования, и можно улучшить эффект кодирования ссылочного кодирования.
В одном из возможных вариантов реализации первого аспекта, прежде определения опорного параметра LPC из совокупности параметров LPC по меньшей мере для двух каналов, способ дополнительно содержит: определение, что абсолютные величины разностей между параметрами LPC для каждых двух каналов в совокупности по меньшей мере из двух каналов не больше предварительно заданной пороговой величины. Разность между параметрами LPC для указанных двух каналов содержит среднюю величину среднеквадратических ошибок или среднюю величину косинусных расстояний между параметрами LPC из указанных двух каналов. В качестве опции, если абсолютная величина разности между параметрами LPC для двух каналов из совокупности по меньшей мере двух каналов больше заданной пороговой величины, осуществляется прямое кодирование не опорного параметра LPC для получения результата прямого кодирования этого не опорного параметра LPC, и результат прямого кодирования записывают в кодированный поток битов данных.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, ссылочное кодирование осуществляется, когда удовлетворяется предварительно заданное условие. Это предварительно заданное условие состоит в том, что разность между параметрами LPC не больше заданной пороговой величины. К параметрам LPC с малой разностью применяется ссылочное кодирование. Это может уменьшить количество битов, занимаемых результатом кодирования с квантованием.
В одном из возможных вариантов реализации первого аспекта, прежде записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных, способ дополнительно содержит: получение результата прямого кодирования не опорного параметра LPC; и определение, что разность между первыми искажениями и вторыми искажениями не больше первой заданной пороговой величины. Первые искажения представляют собой искажения результата кодирования остатка не опорного параметра LPC относительно этого не опорного параметра LPC, и вторые искажения представляют собой искажения результата прямого кодирования не опорного параметра LPC относительно этого не опорного параметра LPC. В качестве опции, если разность между первыми искажениями и вторыми искажениями больше первой заданной пороговой величины, осуществляют прямое кодирование не опорного параметра LPC, для получения результата прямого кодирования не опорного параметра LPC, и результат этого прямого кодирования записывают в кодированный поток битов данных.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, предварительно заданное условие должно удовлетворяться прежде, чем осуществляется ссылочное кодирование не опорного параметра LPC. Более конкретно, разница между искажениями ссылочного кодирования, осуществляемого применительно к не опорному параметру LPC, и искажениями прямого кодирования, осуществляемому применительно к этому не опорному параметру LPC, не больше первой заданной пороговой величины. Это ограничивает искажения при ссылочном кодировании. Если искажения ссылочного кодирования больше первой заданной пороговой величины, результат кодирования может быть получен способом прямого кодирования. Это может обеспечить эффект кодирования параметра LPC в этом техническом решении.
В одном из возможных вариантов реализации первого аспекта, прежде записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированном потоке битов данных, способ дополнительно содержит: определение, что разность между первым количеством битов и вторым количеством битов больше второй заданной пороговой величины. Первое количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC, и второе количество битов представляет собой количество битов, требуемое для кодирования не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка. В качестве опции, если разность между первым количеством битов и вторым количеством битов меньше второй заданной пороговой величины, осуществляется прямое кодирование не опорного параметра LPC, с целью получение результата прямого кодирования этого не опорного параметра LPC, и этот результат прямого кодирования записывают в кодированный поток битов данных.
Согласно способу кодирования параметров LPC, предлагаемому в рассматриваемом варианте настоящей заявки, другое предварительно заданное условие далее должно удовлетворяться прежде, чем осуществлять ссылочное кодирование не опорного параметра LPC. Конкретнее, по сравнению с прямым кодированием, ссылочное кодирование может сберечь некоторое конкретное количество битов. Поэтому выбор ссылочного кодирования может уменьшить количество битов результата кодирования с квантованием применительно к параметру LPC. Если это предварительно заданное условие удовлетворено быть не может, осуществляется прямое кодирование рассматриваемого не опорного параметра LPC.
Второй аспект вариантов настоящего изобретения предлагает устройство кодирования, содержащее: модуль получения, конфигурированный для получения подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала; модуль определения, конфигурированный для определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, где параметр LPC, отличный от опорного параметра LPC, из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов представляет собой не опорный параметр LPC, модуль получения дополнительно выполнен с возможностью получения результата прямого кодирования опорного параметра LPC, модуль определения дополнительно выполнен с возможностью определения остатка не опорного параметра LPC на основе опорного параметра LPC; и модуль определения дополнительно выполнен с возможностью определения результата кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и модуль обработки, конфигурированный для записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных.
В одном из возможных вариантов реализации второго аспекта, модуль определения в частности конфигурирован для определения одного из параметров LPC, который входит в совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов и который требует минимального количества битов для прямого кодирования с квантованием, в качестве опорного параметра LPC.
В одном из возможных вариантов реализации второго аспекта, совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подлежащие кодированию параметры LPC по меньшей мере для трех каналов. Модуль получения в частности конфигурирован для: получения абсолютной величины разности между каждым параметром LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для трех каналов и другим параметром LPC; и получения средней величины абсолютных величин разностей между каждым параметром LPC и другими параметрами LPC. Модуль определения в частности конфигурирован для определения параметра LPC с минимальной средней величиной абсолютных величин разностей между параметрами LPC и опорным параметром LPC.
В одном из возможных вариантов реализации второго аспекта, эта разность содержит среднеквадратическую ошибку или косинусное расстояние.
В одном из возможных вариантов реализации второго аспекта, аудио сигнал содержит множество каналов, а модуль определения дополнительно выполнен с возможностью: определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC из совокупности множества каналов аудио сигнала. Одна из этих множества групп параметров содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в этих множества группах параметров не имеют пересечений.
В одном из возможных вариантов реализации второго аспекта, модуль определения в частности конфигурирован для: определения множества групп параметров на основе номеров каналов в совокупности множества каналов аудио сигнала; или определения множества групп параметров на основе позиции громкоговорителя, соответствующего каждому из этих множества каналов аудио сигнала.
В одном из возможных вариантов реализации второго аспекта, модуль определения в частности конфигурирован для кластеризации подлежащих кодированию параметров LPC из множества каналов аудио сигнала с целью определения множества групп параметров.
В одном из возможных вариантов реализации второго аспекта, модуль определения в частности конфигурирован для: определения M параметров LPC из совокупности подлежащих кодированию параметров LPC для множества каналов, где средняя величина абсолютных величин разностей между этими M параметрами LPC не меньше средней величины абсолютных величин разностей между любыми M параметрами LPC из совокупности параметров LPC множества каналов, указанные M параметров LPC являются центрами кластеризации M групп параметров, и M представляет собой предварительно заданное число; и осуществления кластеризации на основе указанных M центров кластеризации с целью определения M групп параметров. Абсолютная величина разности между первым параметром LPC и вторым параметром LPC в первой группе параметров из совокупности M групп параметров меньше абсолютной величины разности между первым параметром LPC и третьим параметром LPC, второй параметр LPC является центром кластеризации первой группы параметров, третий параметр LPC является центром кластеризации второй групп параметров, при этом первая группа параметров и вторая группа параметров являются любыми двумя разными группами параметров из совокупности M групп параметров.
В одном из возможных вариантов реализации второго аспекта, модуль получения в частности конфигурирован для: разбиения первоначальных параметров LPC по меньшей мере для двух каналов аудио сигнала с целью получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями. Группа параметров LPC с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, или группа параметров LPC с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов.
В одном из возможных вариантов реализации второго аспекта, аудио сигнал содержит множество каналов; и модуль получения в частности конфигурирован для: разбиения первоначальных параметров LPC из совокупности множества каналов аудио сигнала с целью получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями; и получения множества групп параметров с высокими измерениями посредством группирования параметров LPC в группе параметров LPC с высокими измерениями, где одна из указанных множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере из двух каналов, а также параметры LPC в указанных множества группах параметров с высокими измерениями не имеют пересечений; либо получения множества групп параметров с низкими измерениями посредством группирования параметров LPC в группе параметров LPC с низкими измерениями, где одна из указанных множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, а также параметры LPC в указанных множества группах параметров с высокими измерениями не имеют пересечений.
В одном из возможных вариантов реализации второго аспекта, модуль определения дополнительно выполнен с возможностью: определения, что абсолютная величина разности между параметрами LPC для каждых двух каналов из совокупности по меньшей мере из двух каналов не больше заданной пороговой величины. Эта разница между параметрами LPC для двух каналов представляет собой среднюю величину среднеквадратических ошибок или среднюю величину косинусных расстояний между параметрами LPC для этих двух каналов.
В одном из возможных вариантов реализации второго аспекта, модуль получения дополнительно выполнен с возможностью: получения результата прямого кодирования не опорного параметра LPC. Модуль определения дополнительно выполнен с возможностью определения, что разность между первыми искажениями и вторыми искажениями не больше первой заданной пороговой величины. Первые искажения представляют собой искажения результата кодирования остатка не опорного параметра LPC относительно этого не опорного параметра LPC, и вторые искажения представляют собой искажения результата прямого кодирования не опорного параметра LPC относительно этого не опорного параметра LPC.
В одном из возможных вариантов реализации второго аспекта, модуль определения дополнительно выполнен с возможностью определения, что разность между первым количеством битов и вторым количеством битов не меньше второй заданной пороговой величины. Первое количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC, и второе количество битов представляет собой количество битов, требуемое для кодирования не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка.
Третий аспект вариантов настоящей заявки предлагает устройство для кодирования, содержащую процессор и запоминающее устройство. Эти процессор и запоминающее устройство соединены один с другим, запоминающее устройство конфигурировано для сохранения компьютерной программы, эта компьютерная программа содержит программные команды, и процессор конфигурирован для вызова программных команд с целью осуществления способа согласно чему-либо одному - первому аспекту или какому-либо из возможных вариантов реализации первого аспекта.
Четвертый аспект вариантов настоящей заявки предлагает компьютерный программный продукт, содержащий команды. Когда этот компьютерный программный продукт исполняется на компьютере, этот компьютер может осуществлять способ согласно любому из первого аспекта и возможных вариантов реализации первого аспекта.
Пятый аспект настоящей заявки предлагает машиночитаемый носитель хранения информации, содержащий команды. При выполнении этих команд компьютером, этот компьютер может осуществлять способ согласно любому из первого аспекта и возможных вариантов реализации первого аспекта.
Шестой аспект настоящей заявки предлагает машиночитаемый носитель хранения информации, содержащий кодированный поток битов данных, полученный с использованием способа согласно любому из первого аспекта и возможных вариантов реализации первого аспекта.
Седьмой аспект настоящей заявки предлагает интегральную схему (чип), содержащую процессор. Этот процессор конфигурирован для считывания и выполнения компьютерной программы, сохраняемой в запоминающем устройстве, для осуществления любого возможного варианта реализации любого из приведенных выше аспектов. В качестве опции, интегральная схема содержит запоминающее устройство, и эти запоминающее устройство и процессор соединены с использованием схемы или провода. Далее, в качестве опции, интегральная схема дополнительно содержит интерфейс связи, и процессор соединен с этим интерфейсом связи. Интерфейс связи конфигурирован для приема данных и/или информации, которую необходимо обрабатывать. Процессор получает данные и/или информацию от интерфейса связи, обрабатывает эти данные и/или информацию и передает на выход результат обработки через интерфейс связи. Этот интерфейс связи представляет собой интерфейс ввода/вывода.
Восьмой аспект настоящей заявки предлагает устройство кодирования, содержащее процессор и интерфейс связи. Процессор считывает и сохраняет компьютерную программу через интерфейс связи, эта компьютерная программа содержит программные команды, а процессор конфигурирован для вызова программных команд с целью осуществления способа согласно чему-либо одному - первому аспекту или какому-либо из возможных вариантов реализации первого аспекта.
Девятый аспект настоящей заявки предлагает устройство кодирования, содержащее процессор и запоминающее устройство. Процессор конфигурирован для осуществления способа согласно любому из первого аспекта и возможных вариантов реализации первого аспекта, и запоминающее устройство конфигурировано для сохранения кодированного потока битов данных.
Варианты настоящей заявки предлагают способ кодирования параметров с линейным прогнозированием, и этот способ имеет следующие благоприятные эффекты:
Опорный параметр LPC определяют из совокупности множества параметров LPC, и может быть осуществлено ссылочное кодирование параметра LPC для не опорного канала на основе опорного параметра LPC. По сравнению с обычной технологией, в которой ссылочное кодирование осуществляется на основе множества опорных параметров LPC, объем вычислений может быть уменьшен.
В дополнение к этому, предлагаемый способ кодирования может уменьшить избыточность параметров LPC между каналами, уменьшить количество битов, занимаемых для кодирования с квантованием применительно к параметров LPC из множества каналов, и уменьшить сложность вычислений при ссылочном кодировании с квантованием параметров LPC между каналами, учитывая при этом объем вычислений алгоритма.
Краткое описание чертежей
Фиг. 1 представляет упрощенную схему типовой структуры многоканального аудио кодирования на основе анализа линейного прогнозирования;
Фиг. 2a представляет упрощенную схему способа прямого кодирования с квантованием для параметра LPC многоканального аудио сигнала;
Фиг. 2b представляет другую упрощенную схему способа ссылочного кодирования с квантованием для параметра LPC многоканального аудио сигнала;
Фиг. 3a представляет упрощенную схему архитектуры системы, применяемой на стороне терминала согласно одному из вариантов настоящей заявки;
Фиг. 3b представляет упрощенную схему архитектуры системы, применяемой на стороне сети радиосвязи или опорной сети связи согласно одному из вариантов настоящей заявки;
Фиг. 3c представляет упрощенную схему другой архитектуры системы, применяемой на стороне сети радиосвязи или опорной сети связи согласно одному из вариантов настоящей заявки;
Фиг. 3d представляет упрощенную схему архитектуры системы потокового сервиса виртуальной реальности (VR) согласно одному из вариантов настоящей заявки;
Фиг. 4a представляет упрощенную схему одного из вариантов способа кодирования параметров LPC в вариантах настоящей заявки;
Фиг. 4b представляет упрощенную схему другого варианта способа кодирования параметров LPC в вариантах настоящей заявки;
Фиг. 5 представляет упрощенную схему еще одного другого варианта способа способ кодирования параметров LPC в вариантах настоящей заявки;
Фиг. 6 представляет упрощенную схему еще одного другого варианта способа кодирования параметров LPC в вариантах настоящей заявки;
Фиг. 7 представляет упрощенную схему еще одного другого варианта способа кодирования параметров LPC в вариантах настоящей заявки;
Фиг. 8 представляет упрощенную схему одного из вариантов устройства кодирования в вариантах настоящей заявки; и
Фиг. 9 представляет упрощенную схему другого варианта устройства кодирования в вариантах настоящей заявки.
Осуществление изобретения
Варианты настоящей заявки предлагают способ кодирования параметров кодирования с линейным прогнозированием для уменьшения объема вычислений при кодировании.
Для облегчения понимания далее кратко описаны некоторые технические термины в вариантах настоящей заявки.
1. Параметр LPC: Параметр LPC может быть представлен в множестве формах, например, коэффициент анализа линейного прогнозирования (linear prediction analysis, LPA), параметр частоты линейчатого спектра (line spectrum frequency, LSF), параметр пары линейчатых спектров (line spectrum pair, LSP) и коэффициент отражения. Конкретная форма параметра кодирования с линейным прогнозированием в вариантах настоящей заявки не ограничивается. В последующих вариантах в качестве примера параметра кодирования с линейным прогнозированием используется параметр LSF.
2. Скорость передачи битов данных: Скорость передачи битов данных представляет собой количество битов, передаваемых в секунду.
3. Прямое кодирование с квантованием: Параметр LPC кодируют с использованием существующей технологии кодирования. В вариантах настоящей заявки, параметр LPC кодируют с использованием фиксированной кодовой таблицы и способа алгебраического векторного квантования (algebraic vector quantization, AVQ). В вариантах настоящей заявки это для краткости также называется прямым кодированием.
4. Ссылочное кодирование с квантованием: Кодирование с квантованием осуществляется применительно к параметру LPC для не опорного канала (который может также называться нереференсным параметром LPC) на основе параметра LPC для опорного канала (reference channel) (который может также называться референсным параметром LPC). В вариантах настоящей заявки, параметр LPC для не опорного канала и параметр LPC для опорного канала совместно используют одну и ту же фиксированную кодовую таблицу. Остаток между параметром LPC для не опорного канала и параметром LPC для опорного канала кодируют с использованием квантования AVQ. В вариантах настоящей заявки это для краткости также называется ссылочным кодированием.
5. Многоканальный (multi-channel) аудио сигнал: В вариантах настоящей заявки, термин «многоканальный» относится к двум или более каналам (channel). Когда многоканальный аудио сигнал содержит только два канала, такой многоканальный аудио сигнал называется стерео аудио сигналом. Многоканальный аудио сигнал может представлять собой стерео аудио сигнал или аудио сигнал с тремя или более каналами.
Термин «и/или» в настоящей заявке может обозначать соотношение ассоциирования для описания ассоциированных объектов и может указывать три соотношения. Например, запись «A и/или B» может обозначать следующие случаи: Существует только A, существуют оба - A и B, и существует только B, где A и B могут быть в единственном числе или во множественном числе. В дополнение к этому, символ «/» в настоящей заявке обычно обозначает соотношение «или» между ассоциированными объектами. В настоящей заявке, запись «по меньшей мере один» означает «один или более (множество)», а запись «множество из» обозначает «два или более». «По меньшей мере один из следующих объектов (сегментов)» или аналогичное выражение обозначает какую-либо комбинацию таких объектов, включая какую-либо комбинацию объектов (сегментов) в единственном числе (одиночных) или объектов (сегментов) во множественном числе. Например, «по меньшей мере один из a, b или c» может обозначать: «a, b, c», «a и b», «a и c», «b и c», или «a, b и c», где a, b и c могут быть в единственном или множественном числе.
В настоящем описании, Формуле изобретения и на чертежах настоящей заявки термины «первый», «второй» и т.д. предназначены только для различения между аналогичными объектами, но не обязательно указывают какой-то конкретный порядок или последовательность. Следует понимать, что термины, используемые таким способом, являются взаимозаменяемыми в соответствующих обстоятельствах, и это служит просто способом различения, когда в вариантах настоящей заявки описываются объекты, имеющие одинаковый атрибут. В дополнение к этому, термины «включает (в себя)», «содержит» и любые другие варианты должны охватывать неэксклюзивное включение, так что процедура, способ, система, продукт или устройство, которое содержит ряд модулей или блоков, не обязательно ограничивается этими модулями или блоками, а может содержать и другие модули или блоки, какие не были перечислены в явном виде или каковые по природе присущи такой процедуре, способу, системе, продукту или устройству.
Аудио сигналы, такие как многоканальная речь и музыка, часто могут создавать лучшее восприятие для людей. Для того чтобы способствовать эффективному хранению или передаче аудио сигналов, кодирующему устройству для аудио необходимо сжимать эти аудио сигналы и превращать их в поток битов данных. Однако, когда кодирующее устройство для аудио сжимает аудио сигналы, необходимо балансировать соотношение между качеством сигнала речи и музыкального сигнала с одной стороны и скоростью передачи битов данных с другой стороны. При условии низкой скорости передачи битов данных, когда осуществляется кодирование многоканального аудио сигнала, обычно возникает ситуация недостатка битов. Это оказывает отрицательное воздействие на качество кодирования аудио сигнала. Алгоритм кодирования на основе анализа линейного прогнозирования является одним из наиболее часто используемых алгоритмов для аудио сигнала. На Фиг. 1 представлена упрощенная схема типовой структуры многоканального аудио кодирования на основе анализа линейного прогнозирования.
Главный принцип алгоритма кодирования на основе анализа линейного прогнозирования заключается в определении параметра LPC с использованием краткосрочной зависимости аудио сигналов и затем в фильтрации этих аудио сигналов с использованием фильтра с линейным прогнозированием, чтобы эффективно уменьшить необходимую скорость передачи битов данных при кодировании. Параметр LPC представляет собой параметр математической модели фильтра с линейным прогнозированием и является одним из важных параметров при кодировании. Процедуры кодирования и передачи параметра LPC занимают определенную скорость передачи битов данных. Способ кодирования параметров LPC влияет на качество кодирования аудио сигнала. Для параметров LPC для множества каналов или параметров LPC между несколькими кадрами может быть использован способ независимого кодирования или ссылочного кодирования. Результат кодирования параметра LPC записывают в кодированный поток битов данных. Этот кодированный поток битов данных может содержать поток битов данных полезной нагрузки и поток битов данных конфигурации. Поток битов данных полезной нагрузки может нести конкретную информацию каждого кадра аудио сигнала, и поток битов данных конфигурации может нести информацию о конфигурации, совместно используемую всеми кадрами аудио сигнала. Поток битов данных полезной нагрузки и поток битов данных конфигурации могут быть независимы один от другого, либо они могут быть включены в один и тот же поток битов данных, иными словами, поток битов данных полезной нагрузки и поток битов данных конфигурации могут представлять собой разные части одного и того же потока битов данных. Здесь кодированный поток битов данных фактически представляет собой поток битов данных полезной нагрузки.
На Фиг. 1 показана базовая структура типового применения модуля линейного прогнозирования в кодирующем устройстве для аудио. Каналы с канала 1 (channel 1) по канал N (channel N) представляют собой N каналов аудио сигнала. Рассматриваемый вариант настоящей заявки относится к помещенной в штриховую рамку части для кодирования с квантованием применительно к параметрам LPC.
На Фиг. 2a представлена упрощенная схема способа прямого кодирования с квантованием для параметра LPC многоканального аудио сигнала. При использовании этого способа, прямое кодирование с квантованием осуществляется применительно к параметру LPC для каждого канала в многоканальном аудио сигнале. Кодирование с квантованием для каналов осуществляется независимо для одного канала от других каналов, вследствие чего между квантованными параметрами LPC этих каналов имеется избыточная информация. Результатом является тот факт, что прямое кодирование с квантованием занимает высокую скорость передачи битов данных.
На Фиг. 2b представлена другая упрощенная схема способа ссылочного кодирования с квантованием для параметра LPC многоканального аудио сигнала. Согласно другому способу кодирования параметра кодирования с линейным прогнозированием используется способ ссылочного кодирования с квантованием. Когда кодируют параметр LPC для каждого канала в многоканальном аудио сигнале, необходимо по отдельности сравнить множество схем, в которых кодирование осуществляется с использованием параметров LPC для других множества каналов в качестве опорных, чтобы выбрать для кодирования схему с наилучшим эффектом кодирования. Когда имеется большое количество каналов, тогда при сравнении множества схем кодирования производится большой объем вычислений.
На Фиг. 3a представлена упрощенная схема архитектуры системы, применяемой на стороне терминала согласно одному из вариантов настоящей заявки.
При передаче аудио сигналов устройство терминала на передающем конце осуществляет стерео кодирование стерео аудио сигнала, собранного модулем приема звука, осуществляет канальное кодирование и затем передает поток битов данных по цифровому каналу с использованием сети радиосвязи или опорной сети связи. Устройство терминала на приемном конце осуществляет канальное декодирование на основе принятого сигнала, декодирует стерео аудио сигнал с использованием стерео декодирующего устройства и воспроизводит стерео аудио сигнал с использованием модуля воспроизведения аудио сигнала в устройстве терминала на приемном конце. Способ кодирования параметров LPC, предлагаемый в вариантах настоящей заявки, может быть применен в кодирующем устройстве терминала и в декодирующем устройстве терминала.
На каждом из Фиг. 3b и Фиг. 3c представлена упрощенная схема архитектуры системы на стороне сети радиосвязи или беспроводной сети связи согласно одному из вариантов настоящей заявки.
В сети радиосвязи или в опорной сети связи, если требуется произвести транскодирование, необходимо осуществить соответствующее стерео кодирование и декодирование.
Стерео кодирование и декодирование может быть частью работы многоканального кодека. Например, при осуществлении многоканального кодирования собранный многоканальный аудио сигнал может быть подвергнут автоматическому микшированию для преобразования в формат с меньшим количеством каналов с целью получения стерео аудио сигнала, после чего кодируют полученный стерео аудио сигнал. Сторона декодирующего устройства осуществляет декодирование на основе кодированного потока битов данных многоканального аудио сигнала и получает стерео аудио сигнал, а затем восстанавливает многоканальный аудио сигнал после повышающего микширования, увеличивающего количество каналов. Поэтому способ кодирования параметров LPC, предлагаемый в вариантах настоящей заявки, может быть также применен в многоканальном кодеке в модуле связи терминала, в сети радиосвязи или в опорной сети связи.
На Фиг. 3d представлена упрощенная схема архитектуры системы для потокового сервиса виртуальной реальности (VR) согласно одному из вариантов настоящей заявки.
Способ кодирования параметров LPC, предлагаемый в вариантах настоящей заявки, далее применим к модулю кодирования и декодирования аудио (кодирование аудио сигнала и декодирование аудио сигнала) для потокового сервиса виртуальной реальности (VR). Как показано в части в штриховой рамке на Фиг. 3d, сквозная процедура обработки аудио сигнала представляет собой следующее: Осуществляют операцию предварительной обработки (предварительная обработка аудио) аудио сигнала «a» после прохождения этого аудио сигнала «a» через модуль приема звука (прием). Эта операция предварительной обработки содержит отфильтровывание низкочастотной части аудио сигнала, причем обычно в качестве точки разделения используется частота 20 Гц или 50 Гц. Выделяют информацию об ориентации аудио сигнала. После кодирующей обработки (кодирование аудио сигнала) и инкапсулирования (инкапсулирование файла/сегмента) передают аудио сигнал (доставка) на сторону декодирующего устройства. Сторона декодирующего устройства осуществляет декапсулирование (декапсулирование файла/сегмента) и затем декодирование (декодирование аудио сигнала). Далее осуществляют бинауральное отображение (отображение аудио сигнала) декодированного сигнала и отображенный аудио сигнал передают головным телефонам (headphones) слушателя. Эти головные телефоны могут представлять собой независимую головную гарнитуру, либо могут быть наушниками в устройстве с очками, таком как устанавливаемый на голове дисплей виртуальной реальности (например, HTC VIVE).
Способ кодирования параметров кодирования с линейным прогнозированием, предлагаемый в вариантах настоящей заявки, применим к стерео аудио сигналу, иными словами, к двухканальному аудио сигналу, и к многоканальному аудио сигналу. В последующем приведено описание со ссылками на конкретные варианты.
1. Способ кодирования параметра LSF для стерео аудио сигнала представлен на Фиг. 4a. На Фиг. 4a показана упрощенная схема одного из вариантов способа кодирования параметров кодирования с линейным прогнозированием, предлагаемого в вариантах настоящей заявки. Способ, в частности, содержит следующие этапы.
401: Вычисление разности между параметрами LSF.
Сначала, вычисляют разность между параметром LSF левого (L) канала и параметром LSF правого (R) канала стерео (Stereo) аудио сигнала. Эта разница может быть представлена среднеквадратической ошибкой, косинусным расстоянием или другой метрической характеристикой, способной представить различие между параметрами LPC. Здесь это никак конкретно не ограничено. В рассматриваемом варианте и в последующих вариантах для описания такой разности в качестве примера используют среднеквадратическую ошибку. Для вычисления среднеквадратической ошибки параметра LSF применяют следующий способ:
представляет разность между параметром LSF левого (L) канала и параметром LSF правого (R) канала, представляет параметр LSF левого (L) канала, где , представляет параметр LSF правого (R) канала, где , и D - размерность параметр LSF. В качестве опции, в рассматриваемом варианте используется D = 16.
Затем определяют, является ли разность между параметром LSF левого L канала и параметром LSF правого (R) канала меньше заданной пороговой величины. Если да, осуществляют этап 403. Если нет, осуществляют этап 402. Эта заданная пороговая величина является эмпирической константой. В качестве опции, диапазон величин составляет (0,2000], например, 1000, 1500, или 2000. Конкретная величина здесь не ограничена. В качестве опции, определяющее условие может, в качестве альтернативы, представлять собой: определение, является ли разница между параметром LSF левого (L) канала и параметром LSF правого (R) канала не больше заданной пороговой величины. Если да, осуществляют этап 403. Если нет, осуществляют этап 402.
402: Выполнение по отдельности прямого кодирования с квантованием применительно к параметру LSF левого (L) канала и параметру LSF правого (R) канала, если рассматриваемая разность не меньше заданной пороговой величины.
Если это условие не удовлетворяется, результаты прямого кодирования с квантованием применительно к параметрам LSF левого (L) канала и правого (R) канала записывают в кодированный поток битов данных. Прямое кодирование с квантованием использует предварительно заданную кодовую таблицу и предварительно заданный способ квантования AVQ для осуществления кодирования с квантованием применительно к параметрам LSF. Результаты прямого кодирования с квантованием, полученные посредством осуществления по отдельности прямого кодирования с квантованием параметра LSF левого (L) канала и параметра LSF правого (R) канала, записывают в кодированный поток битов данных. Осуществление кодирования с квантованием применительно к параметру LSF с использованием предварительно заданной кодовой таблицы и предварительно заданного способа квантования AVQ является обычной технологией. Конкретные этапы в настоящей заявке не описываются подробно.
403: Принятие решения о применении ссылочного кодирования с квантованием, если разность меньше предварительно заданной пороговой величины.
Если , определяют, что следует начать процедуру ссылочного кодирование с квантованием применительно к параметрам LSF левого (L) канала и правого (R) канала. Конкретнее, выполняют этапы с этапа 404 по этап 406.
404: Определение опорного параметра LSF и квантование этого опорного параметра LSF с использованием способа прямого кодирования с квантованием.
Сначала определяют опорный параметр LSF из параметра LSF левого (L) канала и параметра LSF правого (R) канала. Канал, соответствующий опорному параметру LSF может называться опорным каналом, и канал, соответствующий не опорному параметру LSF может называться не опорным каналом.
Имеются множество способов определения опорного параметра LSF. В качестве опции, параметр LSF для какого-либо канала случайным образом выбирают в качестве опорного параметра LSF. В качестве опции, параметр LSF предварительно заданного канала определяют в качестве опорного параметра LSF. В качестве опции, вычисляют количества битов, требуемые для прямого кодирования с квантованием параметров LSF левого и правого каналов. Параметр LSF для канала с меньшим количеством битов выбирают в качестве опорного параметра LSF и обозначают как LSFreference, а канал, к которому относится этот опорный параметр, называют опорным каналом. Поскольку количество битов для кодирования разных параметров LSF с использованием квантования AVQ варьируется, выбирая параметр LSF для канала, которому требуется меньшее количество битов, в качестве опорного параметра LSF, можно уменьшить общее количеств битов.
Затем параметр LSF для опорного канала квантуют с использованием способа прямого кодирования с квантованием. Результат прямого кодирования опорного параметра LSF обозначают как LSFreference_Q и записывают в кодированный поток битов данных.
405: Определение, что следует осуществить ссылочное кодирование с квантованием применительно к не опорному параметру LSF, если удовлетворяется предварительно заданное условие.
Прямое кодирование с квантованием и ссылочное кодирование с квантованием осуществляют по отдельности применительно к параметру LSF для не опорного канала, чтобы получить количества битов и величины искажений для указанных двух схем кодирования с квантованием. Искажения при прямом кодировании с квантованием представляют собой искажения результата прямого кодирования относительно параметра LPC, а искажения при ссылочном кодировании с квантованием представляют собой искажения результата кодирования остатка относительно параметра LPC. Затем сравнивают искажения и количества битов, соответствующие упомянутым выше двум схемам кодирования с квантованием. Схему кодирования с квантованием, которую будут использовать, определяют на основе искажений и количеств битов при кодировании, иными словами определяют ссылочное кодирование.
Определение, что следует осуществить ссылочное кодирование с квантованием применительно к не опорному каналу, если удовлетворяется предварительно заданное условие. Если предварительно заданное условие не удовлетворяется, осуществляют этап 406.
Здесь могут быть множество предварительно заданных условий. В качестве опции, если искажения при ссылочном кодировании с квантованием меньше первой заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием. В качестве опции, если количество битов, требуемое для ссылочного кодирования с квантованием, меньше второй заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием. В качестве опции, если искажения при ссылочном кодировании с квантованием ниже искажений при прямом кодировании с квантованием, и разность между искажениями при ссылочном кодировании с квантованием и искажениями при прямом кодировании с квантованием не меньше третьей заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием. В качестве опции, если количество битов, требуемое для ссылочного кодирования с квантованием, меньше количества битов, требуемого для прямого кодирования с квантованием, и разность между количеством битов, требуемым для ссылочного кодирования с квантованием, и количеством битов, требуемым для прямого кодирования с квантованием, не меньше четвертой заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием. В качестве опции, если искажения при ссылочном кодировании с квантованием ниже пятой заданной пороговой величины, и требуемое количество битов меньше шестой заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием. В качестве опции, если искажения при ссылочном кодировании с квантованием ниже искажений при прямом кодировании с квантованием, разность между искажениями не меньше седьмой заданной пороговой величины, количество битов, требуемое для ссылочного кодирования с квантованием, меньше количества битов, требуемого для прямого кодирования с квантованием, и разность между этими количествами битов не меньше восьмой заданной пороговой величины, определяют, что для не опорного канала используется ссылочное кодирование с квантованием.
Конкретное содержание этого предварительно заданного условия здесь не ограничивается. Следует отметить, что числовые значения первой заданной пороговой величины, второй заданной пороговой величины, третьей заданной пороговой величины, четвертой заданной пороговой величины, пятой заданной пороговой величины, шестой заданной пороговой величины, седьмой заданной пороговой величины и восьмой заданной пороговой величины здесь могут быть одинаковыми или разными, и конкретные числовые значения здесь не ограничиваются.
Конкретнее, определяют количества битов и искажения квантования при прямом кодировании с квантованием и при ссылочном кодировании с квантованием, осуществляемыми по отдельности применительно к параметру LSF для не опорного канала.
(1) Количество битов, требуемое при прямом кодировании с квантованием: Способ осуществления прямого кодирования с квантованием применительно к параметру LSF для не опорного канала является таким же, как способ осуществления прямого кодирования с квантованием применительно к параметру LSF для опорного канала. Количество битов, требуемое для осуществления прямого кодирования с квантованием применительно к параметру LSF не опорного канала, может быть получено на основе количества битов, требуемого для осуществления прямого кодирования с квантованием применительно к параметру LSF опорного канала.
(2) Количество битов, требуемое для ссылочного кодирования с квантованием: Для вычисления количества битов, требуемого для осуществления ссылочного кодирования с квантованием применительно к параметру LSF для не опорного канала, сначала вычисляют остаток между рассматриваемым параметром LSF и референсным параметром LSF, и затем осуществляют кодирование с квантованием применительно к остатку параметра LSFres с использованием способа квантования AVQ.
Остаток вычисляют следующим образом:
Это обычная технология осуществления кодирования с квантованием применительно к остатку параметра LSFres с использованием способа квантования AVQ, и результат квантования представлен как LSFres_Q. Конкретные этапы в рассматриваемом варианте настоящей заявки не описываются подробно.
Опорный результат квантования не опорного канала выражен следующим образом:
После кодирования с квантованием получают также количество битов, требуемое для осуществления ссылочного кодирования с квантованием применительно к параметру LSF не опорного канала.
(3) Искажения при прямом кодировании с квантованием:
(4) Искажения при ссылочном кодировании с квантованием:
здесь обозначает искажении при прямом квантовании, иными словами, искажения результата прямого кодирования не опорного параметра LPC относительно этого не опорного параметра LPC. обозначает искажения опорного квантования, иными словами, искажения результата кодирования остатка не опорного параметра LPC относительно этого не опорного параметра LPC. обозначает результат прямого кодирования с квантованием применительно к параметру LSF другого канала, обозначает результат ссылочного кодирования с квантованием применительно к параметру LSF другого канала, обозначает параметр LSF другого канала, и D обозначает размерность этого параметра LSF.
В качестве опции, если условие активизации режима ссылочного кодирование с квантованием удовлетворяется, значение флага ссылочного кодирования с квантованием устанавливают равным 1. В противном случае, значение флага ссылочного кодирования с квантованием устанавливают равным 0. Если значение флага ссылочного кодирования с квантованием равно 1, это означает, что схемой квантования параметра LSF для другого канала является ссылочное кодирование с квантованием. Если значение флага ссылочного кодирования с квантованием равно 0, это означает, что схемой квантования параметра LSF для другого канала является прямое кодирование с квантованием. Флаг ссылочного кодирования с квантованием записывают в кодированный поток битов данных. Когда значение флага ссылочного кодирования с квантованием равно 1, информацию о номере канала, соответствующего опорному параметру LSF, также записывают в кодированный поток битов данных, а количество битов, занимаемых флагом ссылочного кодирования с квантованием, варьируется в функции количества каналов. В рассматриваемом варианте имеются только левый (L) канал и правый (R) канал. Поэтому номер канала, соответствующего опорному параметру LSF, может быть представлен 1 битом.
Если активизирован режим ссылочного кодирования с квантованием, ссылочное кодирование с квантованием осуществляют применительно к параметру LSF для другого канала, иными словами, результат кодирования остатка, полученный после осуществления кодирования с квантованием применительно к остатку параметра LSFres с использованием способа квантования AVQ, записывают в кодированный поток битов данных. В противном случае, в кодированный поток битов данных записывают результат прямого кодирования, полученный после осуществления прямого кодирования с квантованием применительно к параметру LSF для другого канала.
406: Определение, что следует осуществить прямое кодирование с квантованием применительно к не опорному параметру LSF, если предварительно заданное условие не удовлетворяется.
Процедура прямого кодирования с квантованием здесь повторно описана не будет. Результат прямого кодирования не опорного параметра LSF записывают в кодированный поток битов данных.
Разница между рассматриваемым вариантом настоящей заявки и обычной технологией состоит в том, что на основе разности между параметрами LSF для каналов вычисляют разность между параметрами LSF для двух каналов, чтобы определить, следует ли перейти к процедуре ссылочного кодирования с квантованием, и следует ли активизировать опорный режим, в процессе работы в режиме ссылочного кодирования с квантованием.
На Фиг. 4b представлена упрощенная схема другого варианта способа кодирования параметров LPC в вариантах настоящей заявки. Сначала вычисляют разницу между параметром LSF левого (L) канала и параметром LSF правого (R) канала и определяют, является ли эта разница меньше заданной пороговой величины. Если нет, осуществляют прямое кодирование с квантованием применительно к параметру LSF левого (L) канала и параметру LSF правого (R) канала, определяют результаты прямого кодирования параметра LSF левого (L) канала и параметра LSF правого (R) канала, и записывают результаты прямого кодирования в кодированный поток битов данных. Если да, определяют опорный параметр LSF из параметра LSF левого (L) канала и параметра LSF правого (R) канала, осуществляют прямое кодирование с квантованием применительно к опорному параметру LSF, и записывают результат прямого кодирования в кодированный поток битов данных. Затем определяют схему кодирования для не опорного параметра LSF. В частности, для не опорного параметра LSF может быть применено прямое квантование, а также к этому не опорному параметру LSF может быть применено ссылочное квантование. Далее, сравнивают разницу между этими двумя схемами кодирования с квантованием, чтобы определить, удовлетворяется ли предварительно заданное условие. Конкретное содержание этого предварительно заданного условия приведено в описании этапа 405. Подробности здесь повторно описаны не будут. Если это предварительно заданное условие удовлетворяется, осуществляют ссылочное кодирование с квантованием применительно к не опорному параметру LSF, и записывают результат кодирования остатка не опорного параметра LSF в кодированный поток битов данных. Если предварительно заданное условие не удовлетворяется, осуществляют прямое кодирование с квантованием применительно к не опорному параметру LSF, и записывают результат прямого кодирования не опорного параметра LSF в кодированный поток битов данных.
В рассматриваемом варианте, следует ли к параметрам LSF двух каналов применить процедуру ссылочного кодирования с квантованием, определяют посредством вычисления разницы между параметрами LSF указанных двух каналов. Это может уменьшить объем вычислений для определения процедуры ссылочного кодирования. Активизация режима ссылочного кодирования с квантованием уменьшает избыточность при кодировании параметров LSF, уменьшает потребление битов при кодировании без увеличения искажений и значительно улучшает объективную оценку режима кодирования аудио при низкой скорости передачи битов данных.
2. Другой способ кодирования параметра LSF для стерео аудио сигнала показан на Фиг. 5. На Фиг. 5 представлена упрощенная схема еще одного другого варианта способа кодирования параметра кодирования с линейным прогнозированием в вариантах настоящей заявки. Способ, в частности, содержит следующие этапы.
501: Разбиение вектора параметров LSF для получения двух параметров LSF.
Сначала, векторы параметров LSF левого (L) и правого (R) каналов стерео аудио сигнала разбивают на два параметра LSF с высокими и низкими измерениями, и эти два параметра LSF обозначены как LSFlow и LSFhigh. В рассматриваемом варианте настоящей заявки для различения параметра LSF до и после разбиения параметр LSF до разбиения может называться первоначальным параметром LSF, а параметры LSFlow и LSFhigh после разбиения могут называться подлежащими кодированию параметрами LSF. В качестве опции, параметр LSFlow получен путем отсечения измерений с номерами от 0 до D/2 - 1 из первоначального параметра LSF, параметр LSFhigh получен путем отсечения измерений с номерами от D/2 до D - 1 из первоначального параметра LSF, и D - размерность параметр LSF.
Таким образом, получают параметр LSFlow с низкими измерениями и параметр LSFhigh с высокими измерениями из левого (L) канала и параметр LSFlow с низкими измерениями и параметр LSFhigh с высокими измерениями из правого (R) канала.
502. Осуществление кодирования с квантованием применительно к параметру LSFlow с низкими измерениями из левого (L) канала и параметру LSFlow с низкими измерениями из правого (R) канала.
За дополнительной информацией следует обратиться к описанию способа согласно варианту, соответствующему схеме, показанной на Фиг. 4a. Подробности здесь повторно описаны не будут.
503. Осуществление кодирования с квантованием применительно к параметру LSFhight с высокими измерениями из левого (L) канала и параметру LSFhight с высокими измерениями из правого (R) канала.
За информацией о конкретном способе осуществления кодирования с квантованием применительно к параметру LSFhight с высокими измерениями из левого (L) канала и параметру LSFhight с высокими измерениями из правого (R) канала следует обратиться к описанию варианта, соответствующего схеме, показанной на Фиг. 4a. Подробности здесь повторно описаны не будут.
Сначала разбивают параметр LSF, к которому нужно применить кодирование с квантованием. Для D-мерного параметра LSF процедура разбиения может быть использована для обработки различных сегментов с использованием разных политик квантования. Это еще больше повышает эффективность квантования.
3. Способ кодирования параметров LSF для многоканального аудио сигнала иллюстрирован на Фиг. 6. На Фиг. 6 представлена упрощенная схема еще одного другого варианта способа кодирования параметров LPC в вариантах настоящей заявки. Этот способ, в частности, содержит следующие этапы.
Для многоканального аудио при использовании технического решения с разбиением параметров LSF множества каналов на M групп в соответствии с предварительно заданным правилом параметры LSF в каждой группе кодируют соответствующим образом. В качестве опции, количество каналов аудио сигнала не меньше 4, и M не меньше 2.
601: Группирование параметров LPC из множества каналов для получения M групп параметров LSF.
Модуль группирования для параметров LPC из множества каналов сначала группирует входные параметры LSF для множества каналов в соответствии с предварительно заданным правилом и получает M групп параметров LSF после группирования. Каждая группа, составленная из параметров LSF, может называться группой параметров LSF. В качестве опции, это предварительно заданное правило может представлять собой: фиксированное группирование на основе последовательности каналов, группирование на основе позиции близлежащего громкоговорителя, соответствующего одному из каналов, или какое-то другое правило. Здесь это ничем специально не ограничено. Следует отметить, что количества параметров во всех группах параметров LSF могут быть одинаковыми или могут быть различными. Здесь это ничем специально не ограничено.
Например, предположим, что общее количество N параметров LSF из множества каналов равно 6, и количество M групп равно 2. Предварительно заданное правило состоит в том, что количество каналов во всех группах согласующееся. Иными словами, канал 1 и канал 2 объединяют в одну группу, канал 3 и канал 4 объединяют в одну группу и канал 5 и канал 6 объединяют в другую группу.
Предположим, что общее количество N параметров LSF из множества каналов равно 6, и количество M групп равно 3. Предварительно заданное правило состоит в том, что каналы с 1 по N/2 сгруппированы в одну группу, а каналы с N/2+1 по N сгруппированы в другую группу. Иными словами, канал 1, канал 2 и канал 3 образуют одну группу, а канал 4, канал 5 и канал 6 образуют другую группу.
Следует отметить, что после получения M групп параметров LSF каждую группу параметров LSF можно кодировать по отдельности. Для кодирования группы параметров LSF из двух параметров LSF обратитесь к способу кодирования, приведенному в Варианте 1 и в Варианте 2. Способы кодирования для множества групп параметров LSF могут быть одинаковыми или могут быть разными. Здесь это ничем специально не ограничено. В последующем, в частности, описан способ кодирования группы параметров применительно к группе параметров LSF, содержащей три или больше трех параметров LSF.
602: Определение по отдельности опорного параметра LSF в каждой из M групп параметров LSF.
Имеется множество способов определения опорного параметра LSF в каждой группе параметров LSF s. Предположим, что одна группа параметров LSF содержит «c» параметров LSF, и число «c» является константой. В качестве опции, если , за информацией о способе выбора опорного параметра LSF следует обратиться к способу, описываемому в варианте, соответствующем схеме, показанной на Фиг. 4a.
В качестве опции, если , способ выбора опорного параметра LSF содержит:
Сначала среднюю разность между j-ым параметром LSF в группе и другими параметрами LSF для других каналов в этой группе вычисляют следующим образом:
D - размерность параметра LSF, - j-ый параметр LSF в рассматриваемой группе, , при представляет собой k-ый параметр LSF, отличный от j-го параметра LSF в рассматриваемой группе.
Затем, получают номер r канала для опорного параметра LSF на основе принципа минимальной средней разности между каким-либо каналом и другими каналами:
Величина здесь представляет среднюю разность между параметром LSF для j-го канала в группе и параметрами LSF для других каналов в этой группе, и r представляет номер канала, соответствующего опорному параметру LSF.
603: Осуществление кодирования с квантованием применительно к каждой группе параметров LSF.
После определения опорного параметра LSF для каждой группы параметров LSF можно осуществить кодирование с квантованием применительно по отдельности к каждой группе параметров LSF. В качестве опции, прямое кодирование с квантованием осуществляется применительно к опорному параметру LSF, и ссылочное кодирование осуществляется применительно к не опорному параметру LSF. В качестве опции, прямое кодирование с квантованием осуществляется применительно к опорному параметру LSF, и ссылочное кодирование осуществляется применительно к не опорному параметру LSF, когда удовлетворяется предварительно заданное условие, Подробности относительно этого предварительно заданного условия приведены в описании этапа 405 в варианте, соответствующем схеме, показанной на Фиг. 4a. Подробности здесь повторно описаны не будут.
Параметры LPC из множества каналов группируют в соответствии с предварительно заданным правилом. Если группа имеет больше двух параметров LPC, опорный параметр LPC в каждой группе выбирают на основе принципа минимальной средней разности.
Когда группа имеет большое количество параметров LPC, выбор опорного параметра LPC из совокупности этих параметров LPC на основе принципа минимальной средней разности может повысить эффективность, и при этом можно обеспечить осуществление квантования параметров LPC для других каналов в этой группе с использованием выбранного опорного параметра LPC. При этом используется меньшее количество битов.
4. Способ кодирования параметров LSF для многоканального аудио сигнала представлен на Фиг. 7. На Фиг. 7 показана упрощенная схема еще одного другого варианта способа кодирования параметров LPC в вариантах настоящей заявки. Этот способ, в частности, содержит следующие этапы.
Имеется множество способов группирования параметр LSF из N каналов в M групп. В частности, группирование может быть осуществлено на основе параметров LSF с использованием способа кластеризации. Возможный способ группирования описан в рассматриваемом варианте настоящей заявки. Конкретное описание приведено ниже.
701: Определение разности между параметрами LSF для каналов.
Сначала вычисляют разности между параметрами LSF для каналов. Совокупность разностей между параметрами LSF для каналов содержит разность между любыми двумя параметрами LSF, и эта разность представляет собой среднеквадратическую ошибку, косинусное расстояние или другую подобную характеристику. Например, разность между параметрами LSF для канала i и канала j равна:
обозначает разницу между параметрами LSF для канала i и канала j, и D обозначает размерность параметра LSF.
702: Определение M центров группирования.
Эти M центров группирования определяют на основе разницы между параметрами LSF для каналов. Центр группирования может также называться центром кластеризации для группы параметров LSF. Существуют множество способов получения центров кластеризации. Здесь это ничем специально не ограничено.
В качестве опции, вычисляют среднюю величину абсолютных величин разностей между любыми M параметрами LPC, и в качестве M центров группирования используют M параметров LPC, которым соответствует максимальная средняя величина. Разности между M параметрами LPC составляют набор разностей между любыми двумя из M параметров LPC, и средняя величина абсолютных величин этих разностей между M параметрами LPC представляет собой среднюю величину для абсолютных величин M × (M - 1)/2 величин разностей.
В качестве опции, получают первоначальный центр группирования. Например, находят максимальную величину из всех полученных величин . Два центра группирования, LSFcentre_1 и LSFcentre_2, получают на основе двух параметров LSF, соответствующих максимальной величине, и затем получают M центров группирования на основе первоначального центра группирования.
Например, параметр LSF, который наиболее отличается от существующих центров группирования, выбирают из совокупности параметров LSF для других каналов, отличных от существующего центра группирования, в качестве нового центра группирования, LSFcentre_m, где . Способ выбора является следующим:
обозначает количество параметров LSF, отличных от параметра LSF существующего центра группирования, и m обозначает номер канала, соответствующего новому центру группирования LSFcentre_m.
Эту операцию выполняют итеративно до тех пор, пока не станет m = M, иными словами, не будут найдены M центров группирования.
703: Определение M групп параметров LSF на основе M центров группирования.
Осуществляется кластеризация параметров LSF на основе M центров группирования, и определяют M групп параметров LSF с использованием алгоритма кластеризации.
В качестве опции, оставшиеся параметры LSF за исключением центров группирования по отдельности объединяют в M групп на основе принципа минимальной разности. Способ является следующим:
Символ LSFremain здесь представляет какой-либо параметр LSF, отличный от параметра LSF центра группирования, выбранного на приведенном выше этапе. Параметр «s» является идентификатором группы, выбранной для параметра LSFremain.
В ходе выполнения приведенных выше этапов параметры LSF для N каналов могут быть сгруппированы в M групп.
704. Осуществление по отдельности кодирования с квантованием применительно к M группам параметров LSF.
После завершения группирования способ и другие процедуры для выбора опорного параметра LSF из каждой группы параметров LSF являются такими же, как в Варианте 3. Подробности здесь повторно описаны не будут.
Рассматриваемый вариант предлагает новый способ группирования параметров LPC для множества каналов. Используя этот способ группирования параметров LPC для множества каналов, можно получить улучшенный результат группирования и еще более повысить эффективность квантования.
5. Предлагается другой способ кодирования параметров LSF для многоканального аудио сигнала.
Для параметра LSF многоканального аудио сигнала способ кодирования может также учитывать разбиение этого параметра LSF.
Сначала вектор первоначального параметра LSF каждого канала разбивают на параметр LSF с высокими измерениями и параметр LSF с низкими измерениями, в соответствии с высокими и низкими номерами измерений. Параметр LSF с высокими измерениями и параметр LSF с низкими измерениями обозначены как LSFlow и LSFhigh соответственно. Способ генерации параметров LSFlow и LSFhigh согласован со способом Варианта 2. Затем осуществляют кодирование с квантованием применительно к параметрам LSFlow и LSFhigh для каждого канала в соответствии с процедурами Варианта 3 или Варианта 4.
Для многомерного параметра LSF процедура разбиения может быть использована для обработки разных сегментов с использованием различных политик квантования. Это дополнительно повышает эффективность квантования и оптимизирует эффект кодирования.
В приведенных выше вариантах рассмотрены способы кодирования параметров LPC. В последующем описана устройство для осуществления этих способов. На Фиг. 8 представлена упрощенная схема одного из вариантов устройства кодирования согласно вариантам настоящей заявки.
Один из вариантов настоящей заявки предлагает устройство кодирования. Это устройство кодирования может быть терминалом, может быть модулем связи терминала, сети радиосвязи или опорной сети связи, либо может быть кодирующим устройством терминала, декодирующим устройством терминала, многоканальным кодеком модуля связи терминала, сети радиосвязи или опорной сети связи, либо другим подобным устройством. Здесь это никак специально не ограничено.
Устройство кодирования содержит:
модуль 801 получения, конфигурированный для получения подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала;
модуль 802 определения, конфигурированный для определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, где параметр LPC, отличный от опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, является не опорным параметром LPC, где
модуль 801 получения дополнительно выполнен с возможностью получения результата прямого кодирования опорного параметра LPC;
модуль 802 определения дополнительно выполнен с возможностью определения остатка не опорного параметра LPC на основе опорного параметра LPC; и
модуль 802 определения дополнительно выполнен с возможностью определения результата кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и
модуль 803 обработки, конфигурированный для записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных.
В качестве опции, модуль 802 определения в частности конфигурирован для:
определения параметра LPC, который входит в совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов и который требует минимального количества битов для прямого кодирования с квантованием, в качестве опорного параметра LPC.
В качестве опции, совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подлежащие кодированию параметры LPC по меньшей мере для трех каналов.
Модуль 801 получения в частности конфигурирован для:
получения абсолютной величины разности между каждым параметром LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для трех каналов и другим параметром LPC; и
получения средней величины абсолютных величин разностей между каждым параметром LPC и другими параметрами LPC.
Модуль 802 определения в частности конфигурирован для:
определения параметра LPC, который входит в указанную совокупность параметров LPC и которому соответствует минимальная средняя величина разностей, в качестве опорного параметра LPC.
В качестве опции, эта разность содержит среднеквадратическую ошибку или косинусное расстояние.
В качестве опции, аудио сигнал содержит множество каналов.
Модуль 802 определения дополнительно выполнен с возможностью:
определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC для множества каналов аудио сигнала, где одна из множества групп параметров содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множества группах параметров не имеют пересечений.
В качестве опции, модуль 802 определения в частности конфигурирован для:
определения множества групп параметров на основе каналов из совокупности множества каналов аудио сигналов; или
определения множества групп параметров на основе позиции громкоговорителя, соответствующей каждому из множества каналов аудио сигналов.
В качестве опции, модуль 802 определения в частности конфигурирован для:
кластеризации подлежащих кодированию параметров LPC для множества каналов аудио сигналов, для определения множества групп параметров.
В качестве опции, модуль 802 определения в частности конфигурирован для:
определения M параметров LPC из совокупности подлежащих кодированию параметров LPC для множества каналов, где средняя величина абсолютных величин разностей между M параметрами LPC не меньше средней величины абсолютных величин разностей между M параметрами LPC из совокупности параметров LPC для множества каналов, эти M параметров LPC являются центрами кластеризации для M групп параметров, и M представляет собой предварительно заданную величину; и
осуществления кластеризация на основе M центров кластеризации, для определения M групп параметров, где абсолютная величина разности между первым параметром LPC и вторым параметром LPC в первой группе параметров из совокупности M групп параметров меньше абсолютной величины разности между первым параметром LPC и третьим параметром LPC, второй параметр LPC является центром кластеризации первой группы параметров, третий параметр LPC является центром кластеризации второй группы параметров, при этом первая группа параметров и вторая группа параметров являются любыми двумя разными группами параметров из совокупности M групп параметров.
В качестве опции, модуль 801 получения в частности конфигурирован для:
разбиения первоначальных параметров LPC по меньшей мере для двух каналов аудио сигналов, для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями, где группа параметров LPC с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, или группа параметров LPC с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов.
В качестве опции, аудио сигнал содержит множество каналов.
Модуль 801 получения в частности конфигурирован для:
разбиения первоначальных параметров LPC для множества каналов аудио сигнала, для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями; и
получения множества групп параметров с высокими измерениями посредством группирования параметров LPC в группу параметров LPC с высокими измерениями, где одна из множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC из множества групп параметров с высокими измерениями не имеют пересечений; или
получения множества групп параметров с низкими измерениями посредством группирования параметров LPC в группу параметров LPC с низкими измерениями, где одна из множества групп параметров с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC из множества групп параметров с низкими измерениями не имеют пересечений.
В качестве опции, модуль 802 определения дополнительно выполнен с возможностью:
определения, что абсолютная величина разности между параметрами LPC для каждых двух каналов из совокупности по меньшей мере двух каналов не больше заданной пороговой величины, где разность между параметрами LPC для двух каналов содержит среднюю величину среднеквадратических ошибок или среднюю величину косинусных расстояний между параметрами LPC для двух каналов.
В качестве опции, модуль 801 получения дополнительно выполнен с возможностью:
получения результата прямого кодирования не опорного параметра LPC.
Модуль 802 определения дополнительно выполнен с возможностью определения, что разность между первыми искажениями и вторыми искажениями не больше первой заданной пороговой величины. Первые искажения представляют собой искажения результата кодирования остатка не опорного параметра LPC относительно не опорного параметра LPC, и вторые искажения представляют собой искажения результата прямого кодирования не опорного параметра LPC относительно этого не опорного параметра LPC.
В качестве опции, модуль 802 определения дополнительно выполнен с возможностью:
определения, что разность между первым количеством битов и вторым количеством битов не меньше второй заданной пороговой величины. Первое количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC, и второе количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка.
На Фиг. 9 представлена упрощенная схема другого варианта устройства кодирования в вариантах настоящей заявки.
Устройство кодирования, предлагаемое в рассматриваемом варианте, может представлять собой процессор, сервер, специализированное устройство кодирования или другое подобное устройство. Конкретная форма устройства в рассматриваемом варианте настоящей заявки не ограничена.
Устройство 900 кодирования может значительно изменяться с различной конфигурацией или характеристиками и может содержать один или множество процессоров 901 и запоминающее устройство 902. Это запоминающее устройство 902 сохраняет программу или данные.
Запоминающее устройство 902 может представлять собой энергозависимое запоминающее устройство или энергонезависимое запоминающее устройство. В качестве опции, процессор 901 представляет собой одно или множество устройств из следующего списка: центральный процессор (central processing unit, CPU), графический процессор (graphics processing unit, GPU) или другое подобное устройство. Процессор CPU может представлять собой одноядерный процессор CPU или может быть многоядерным процессором CPU. Процессор 901 может осуществлять связь с запоминающим устройством 902 и выполнять в аппаратуре 900 кодирования последовательность команд из запоминающего устройства 902.
Устройство 900 кодирования далее содержит один или множество проводных или беспроводных (радио) сетевых интерфейсов 903, например, интерфейс Ethernet.
В качестве опции, хотя это не показано на Фиг. 9, устройство 900 кодирования может далее содержать один или множество источников питания и один или множество интерфейсов ввода/вывода. Интерфейс ввода/вывода может быть конфигурирован для соединения с дисплеем, мышью, клавиатурой, сенсорным экраном (тачскрином), датчиком или другим подобным компонентом. Интерфейс ввода/вывода является компонентом-опцией и может присутствовать или может не присутствовать. Здесь это никак не ограничено.
За информацией о процедуре, выполняемой процессором 901 в устройстве 900 кодирования в рассматриваемом варианте, следует обратиться к процедурам способов, рассмотренным в приведенных выше вариантах способа. Подробности здесь повторно описаны не будут.
Приведенные выше варианты способа согласно настоящей заявке могут быть применены к процессору, либо этот процессор реализует этапы приведенных выше вариантов способа. Процессор может представлять собой кристалл интегральной схемы (чип) и обладать способностью обрабатывать сигнал. В процессе реализации приведенные выше варианты способа могут быть осуществлены аппаратной логической интегральной схемой в процессоре, либо с использованием команд в форме программного обеспечения. Процессор может представлять собой центральный процессор (central processing unit, CPU), сетевой процессор (network processor, NP), комбинацию процессора CPU и процессора NP, цифровой процессор сигнала (digital signal processor, DSP), специализированную интегральную схему (application specific integrated circuit, ASIC), программируемую пользователем вентильную матрицу (field programmable gate array, FPGA) или другое программируемое логическое устройство, дискретный вентиль или транзисторное логическое устройство или дискретный аппаратный компонент. Он может реализовывать или осуществлять способы, этапы и логические блок-схемы, описываемые в настоящей заявке. Процессор общего назначения может представлять собой микропроцессор, либо такой процессор может быть каким-то обычным процессором или другим подобным устройством. Этапы способов, описываемых or в настоящей заявке, могут быть выполнены и завершены непосредственно с использованием аппаратного декодирующего процессора, или могут быть выполнены и завершены с использованием комбинации аппаратных модулей и модулей программного обеспечения в декодирующем процессоре. Модуль программного обеспечения может быть расположен на известном в технике носителе для хранения информации, таком как запоминающее устройство с произвольной выборкой, устройство флэш-памяти, постоянное запоминающее устройство, программируемое постоянное запоминающее устройство, электрически стираемое программируемое запоминающее устройство или регистр. Этот носитель для хранения информации расположен в запоминающем устройстве, а процессор считывает информацию из запоминающего устройства и выполняет этапы приведенных выше способов в комбинации с аппаратурой процессора. Хотя на чертеже показан только один процессор, устройство может содержать множество процессоров, либо процессор может содержать множество процессорных модулей. В частности, процессор может представлять собой одноядерный (single-CPU) процессор, либо может быть многоядерным (multi-CPU) процессором.
Запоминающее устройство конфигурировано для сохранения компьютерных команд, выполняемых процессором. Запоминающее устройство может представлять собой схему для хранения информации, либо может быть каким-то иным запоминающим устройством. Это запоминающее устройство может представлять собой энергозависимое запоминающее устройство или энергонезависимое запоминающее устройство, либо может содержать и энергозависимое запоминающее устройство, и энергонезависимое запоминающее устройство. Энергонезависимое запоминающее устройство может представлять собой постоянное запоминающее устройство (ПЗУ (read-only memory, ROM)), программируемое постоянное запоминающее устройство (ППЗУ (programmable ROM, PROM)), стираемое программируемое постоянное запоминающее устройство (СППЗУ (erasable PROM, EPROM)), электрически стираемое программируемое постоянное запоминающее устройство (ЭСППЗУ (electrically EPROM, EEPROM)) или устройство флэш-памяти. Энергозависимое запоминающее устройство может представлять собой запоминающее устройство с произвольной выборкой (ЗУПВ (random access memory, RAM)) и используется в качестве внешнего кэша. Запоминающее устройство может быть независимо от процессора, или оно может представлять собой модуль для хранения информации в процессоре. Здесь это никак не ограничено. Хотя на чертеже показано только одно запоминающее устройство, устройство может содержать множество запоминающих устройств, либо запоминающее устройство содержит множество модулей для хранения информации.
Приемопередатчик конфигурирован для реализации взаимодействия контентов между процессором и другим модулем или сетевым элементом. В частности, этот приемопередатчик может представлять собой интерфейс связи в аппаратуре, либо может быть приемопередающей схемой или модулем связи. Приемопередатчик может, в качестве альтернативы, представлять собой интерфейс связи или приемопередающую схему в процессоре. В одном из возможных вариантов реализации, приемопередатчик может представлять собой интегральную схему (чип) приемопередатчика. Приемопередатчик может далее содержать передающий модуль и/или приемный модуль. В одном из возможных вариантов реализации, приемопередатчик может содержать по меньшей мере один интерфейс связи. В другом возможном варианте реализации приемопередатчик может, в качестве альтернативы, быть модулем, реализованным в форме программного обеспечения. В каждом варианте настоящей заявки процессор может взаимодействовать с другим модулем или сетевым элементом через приемопередатчик. Например, процессор получает или принимает контент от другого сетевого элемента через приемопередатчик. Если процессор и приемопередатчик являются двумя физически раздельными компонентами, процессор может обмениваться контентом с другим модулем аппаратуры без использования приемопередатчика.
В одном из возможных вариантов реализации, процессор, запоминающее устройство и приемопередатчик могут быть соединены одни с другими через шину. Эта шина может быть шиной для соединения периферийных устройств (peripheral component interconnect, PCI) или шиной расширенной стандартной промышленной архитектуры (extended industry standard architecture, EISA) или другой подобной шиной. Шина может быть классифицирована как адресная шина, шина данных, шина управления или другая подобная шина.
В вариантах настоящей заявки, слово «пример», «например» или другое подобное слово используется, чтобы представить приведение примера, иллюстрации или описания. Никакие из вариантов или проектных схем, описываемых как «пример» или «например», в вариантах настоящей заявки не следует считать более предпочтительными или имеющими больше преимуществ, чем другой вариант или проектная схема. Точнее, использование слова «пример» или «например» предназначено для представления соответствующей концепции каким-то конкретным способом.
В вариантах настоящей заявки, для облегчения понимания, при описании используются множество примеров. Однако эти примеры являются просто примерами, так что это совсем не означает, что эти примеры представляют собой оптимальные варианты для реализации настоящей заявки.
Все или часть приведенных выше вариантов могут быть реализованы с использованием загружаемого программного обеспечения, оборудования (аппаратуры), встроенного программного обеспечения или какой-либо комбинации этих компонентов. Когда для реализации используется загружаемое программное обеспечение, все или часть вариантов могут быть реализованы в форме компьютерного программного продукта.
Компьютерный программный продукт содержит одну или более компьютерных команд. Когда выполняемые компьютером команды загружены и выполняются компьютером, происходит генерация всех или части процедур или функций согласно вариантам настоящей заявки. Компьютер может представлять собой компьютер общего назначения, специализированный компьютер, компьютерную сеть или другую программируемую устройство. Компьютерные команды могут быть сохранены на читаемом компьютером носителе для хранения информации, либо могут быть переданы от одного читаемого компьютером носителя для хранения информации другому читаемому компьютером носителю для хранения информации. Например, компьютерные команды могу быть переданы от одного веб-сайта, компьютера, сервера или дата-центра другому веб-сайту, компьютеру, серверу или дата-центру проводным (например, по коаксиальному кабелю, оптоволоконному кабелю или цифровой абонентской линии (digital subscriber line (DSL))) или беспроводным (например, в инфракрасном диапазоне, по радио или в СВЧ-диапазоне) способом. Читаемый компьютером носитель для хранения информации может представлять собой какой-либо пригодный для использования носитель, доступный для компьютера, или устройство для хранения данных, такое как сервер или дата-центр, интегрирующий один или множество пригодных для использования носителей. Пригодный для использования носитель может представлять собой магнитный носитель (например, гибкий диск, жесткий диск или магнитную ленту), оптический носитель (например, диск DVD), полупроводниковый носитель (например, твердотельный накопитель (solid-state, drive solid state disk (SSD))), или другое подобное устройство.
Claims (96)
1. Способ кодирования параметра кодирования с линейным прогнозированием (LPC), содержащий этапы, на которых:
получают подлежащие кодированию параметры LPC по меньшей мере для двух каналов аудио сигнала;
определяют опорный параметр LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, где параметр LPC, отличный от опорного параметра LPC в совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, является не опорным параметром LPC;
получают результат прямого кодирования опорного параметра LPC;
определяют остаток не опорного параметра LPC на основе опорного параметра LPC;
определяют результат кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и
записывают результат прямого кодирования опорного параметра LPC и результат кодирования остатка не опорного параметра LPC в кодированный поток битов данных.
2. Способ по п. 1, в котором процедура определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подэтап, на котором:
определяют параметр LPC, входящий в совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов и требующий минимального количества битов для прямого кодирования с квантованием, в качестве опорного параметра LPC.
3. Способ по п. 1, в котором совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подлежащие кодированию параметры LPC по меньшей мере для трех каналов; при этом
этап определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подэтапы, на которых:
получают абсолютную величину разности между каждым из параметров LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для трех каналов и другим параметром LPC;
получают среднюю величину абсолютных величин разностей между каждым из параметров LPC и другими параметрами LPC; и
определяют параметр LPC, входящий в совокупность параметров LPC и имеющий минимальную среднюю величину абсолютных величин разностей, в качестве опорного параметра LPC.
4. Способ по п. 3, в котором
указанная разность содержит среднеквадратическую ошибку или косинусное расстояние.
5. Способ по любому из пп. 1-4, в котором
аудио сигнал содержит множество каналов; при этом
способ дополнительно содержит этап, на котором:
определяют множество групп параметров посредством группирования подлежащих кодированию параметров LPC для множества каналов аудио сигнала, причем одна из указанного множества групп параметров содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в указанных множествах групп параметров не имеют пересечений.
6. Способ по п. 5, в котором
этап определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC для множества каналов аудио сигнала содержит подэтап, на котором:
определяют множество групп параметров на основе номеров каналов в совокупности множества каналов аудио сигнала; или
определяют множество групп параметров на основе позиции громкоговорителя, соответствующего каждому из множества каналов аудио сигнала.
7. Способ по п. 5, в котором
этап определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC из множества каналов аудио сигнала содержит подэтап, на котором:
осуществляют кластеризацию подлежащих кодированию параметров LPC из совокупности множества каналов аудио сигнала для определения множества групп параметров.
8. Способ по п. 7, в котором этап кластеризации подлежащих кодированию параметров LPC для множества каналов аудио сигнала для определения множества групп параметров содержит подэтапы, на которых:
определяют M параметров LPC из совокупности подлежащих кодированию параметров LPC для множества каналов, причем средняя величина абсолютных величин разностей между M параметрами LPC не меньше средней величины абсолютных величин разностей любых M параметров LPC из совокупности параметров LPC для множества каналов, где M параметров LPC являются центрами кластеризации для M групп параметров, и M является заданной величиной; и
осуществляют кластеризацию на основе найденных M центров кластеризации для определения M групп параметров, причем абсолютная величина разности между первым параметром LPC и вторым параметром LPC в первой группе параметров из совокупности M групп параметров меньше абсолютной величины разности между первым параметром LPC и третьим параметром LPC, второй параметр LPC является центром кластеризации первой группы параметров, третий параметр LPC является центром кластеризации второй группы параметров, а указанные первая группа параметров и вторая группа параметров являются любыми двумя разными группами параметров из совокупности M групп параметров.
9. Способ по любому из пп. 1-4, в котором
этап получения подлежащих кодированию параметров LPC по меньшей мере для двух каналов аудио сигнала содержит подэтап, на котором:
разбивают первоначальные параметры LPC по меньшей мере для двух каналов аудио сигнала, для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями, причем группа параметров LPC с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, или группа параметров LPC с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов.
10. Способ по любому из пп. 1-4, в котором
аудио сигнал содержит множество каналов; при этом
этап получения подлежащих кодированию параметров LPC по меньшей мере из двух каналов аудио сигнала содержит подэтапы, на которых:
разбивают первоначальные параметры LPC для множества каналов аудио сигнала для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями; и
получают множество групп параметров с высокими измерениями посредством группирования параметров LPC в группу параметров LPC с высокими измерениями, при этом одна из указанного множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множестве групп параметров с высокими измерениями не имеют пересечений; или
получают множество групп параметров с низкими измерениями посредством группирования параметров LPC в группу параметров LPC с низкими измерениями, при этом одна из указанного множества групп параметров с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множестве групп параметров с низкими измерениями не имеют пересечений.
11. Способ по любому из пп. 1-10, дополнительно содержащий, до этапа определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, этап, на котором:
определяют, что абсолютная величина разности между параметрами LPC для каждых двух каналов из совокупности по меньшей мере из двух каналов не больше заданной пороговой величины, причем указанная разность между параметрами LPC для двух каналов содержит среднюю величину среднеквадратических ошибок или среднюю величину косинусных расстояний между параметрами LPC для указанных двух каналов.
12. Способ по любому из пп. 1-11, дополнительно содержащий, до этапа записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных, этапы, на которых:
получают результат прямого кодирования не опорного параметра LPC; и
определяют, что разница между первыми искажениями и вторыми искажениями не больше первой заданной пороговой величины, при этом первые искажения представляют собой искажения результата кодирования остатка не опорного параметра LPC относительно указанного не опорного параметра LPC, а вторые искажения представляют собой искажения результата прямого кодирования не опорного параметра LPC относительно указанного не опорного параметра LPC.
13. Способ по любому из пп. 1-12, дополнительно содержащий, до этапа записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных, этап, на котором:
определяют, что разность между первым количеством битов и вторым количеством битов не меньше второй заданной пороговой величины, причем первое количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC, а второе количество битов представляет собой количество битов, требуемое для кодирования не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка.
14. Устройство кодирования, содержащее:
модуль получения для получения подлежащих кодированию параметров кодирования с линейным прогнозированием (LPC) по меньшей мере для двух каналов аудио сигнала;
модуль определения для определения опорного параметра LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов, где параметр LPC, отличный от опорного параметра LPC, из совокупности подлежащих кодированию параметров LPC по меньшей мере для двух каналов представляет собой не опорный параметр LPC, при этом
модуль получения дополнительно выполнен с возможностью получения результата прямого кодирования опорного параметра LPC;
модуль определения дополнительно выполнен с возможностью определения остатка не опорного параметра LPC на основе опорного параметра LPC; и
модуль определения дополнительно выполнен с возможностью определения результата кодирования остатка не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка; и
модуль обработки для записи результата прямого кодирования опорного параметра LPC и результата кодирования остатка не опорного параметра LPC в кодированный поток битов данных.
15. Устройство по п. 14, в котором модуль получения дополнительно выполнен с возможностью:
определения параметра LPC, входящего в совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов и требующего минимального количества битов для прямого кодирования с квантованием, в качестве опорного параметра LPC.
16. Устройство по п. 14, в котором совокупность подлежащих кодированию параметров LPC по меньшей мере для двух каналов содержит подлежащие кодированию параметры LPC по меньшей мере для трех каналов; при этом
модуль получения в частности выполнен с возможностью:
получения абсолютной величины разности между каждым из параметров LPC из совокупности подлежащих кодированию параметров LPC по меньшей мере для трех каналов и другим параметром LPC; и
получения средней величины абсолютных величин разностей между каждым из параметров LPC и другими параметрами LPC, а
модуль получения в частности выполнен с возможностью:
определения параметра LPC с минимальной средней величиной абсолютных величин разностей между параметрами LPC в качестве опорного параметра LPC.
17. Устройство по п. 16, в котором
указанная разность содержит среднеквадратическую ошибку или косинусное расстояние.
18. Устройство по любому из пп. 14-17, в котором
аудио сигнал содержит множество каналов; а
модуль получения дополнительно выполнен с возможностью:
определения множества групп параметров посредством группирования подлежащих кодированию параметров LPC из совокупности множества каналов аудио сигнала, причем одна из множества групп параметров содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множестве групп параметров не имеют пересечений.
19. Устройство по п. 18, в котором модуль получения в частности выполнен с возможностью:
определения множества групп параметров на основе номеров каналов из совокупности множества каналов аудио сигнала; или
определения множества групп параметров на основе позиции громкоговорителя, соответствующего каждому из множества каналов аудио сигнала.
20. Устройство по п. 18, в котором модуль получения в частности выполнен с возможностью:
кластеризации подлежащих кодированию параметров LPC для множества каналов аудио сигнала, для определения множества групп параметров.
21. Устройство по п. 20, в котором модуль получения в частности выполнен с возможностью:
определения M параметров LPC из совокупности подлежащих кодированию параметров LPC для множества каналов, где средняя величина абсолютных величин разностей между этими M параметрами LPC не меньше средней величины абсолютных величин разностей между любыми M параметрами LPC из совокупности параметров LPC множества каналов, где M параметров LPC представляют собой центры кластеризации M групп параметров, и M - заданная величина; и
осуществления кластеризации на основе найденных M центров кластеризации для определения M групп параметров, где абсолютная величина разности между первым параметром LPC и вторым параметром LPC в первой группе параметров из совокупности M групп параметров меньше абсолютной величины разности между первым параметром LPC и третьим параметром LPC, второй параметр LPC представляет собой центр кластеризации первой группы параметров, третий параметр LPC представляет собой центр кластеризации второй группы параметров, и первая группа параметров и вторая группа параметров представляют собой любые две разные группы параметров из совокупности M групп параметров.
22. Устройство по любому из пп. 14-17, в котором модуль получения в частности выполнен с возможностью:
разбиения первоначальных параметров LPC по меньшей мере для двух каналов аудио сигнала для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями, где группа параметров LPC с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, или группа параметров LPC с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов.
23. Устройство по любому из пп. 14-17, в котором
аудио сигнал содержит множество каналов; а
модуль получения в частности выполнен с возможностью:
разбиения первоначальных параметров LPC из множества каналов аудио сигнала для получения группы параметров LPC с высокими измерениями и группы параметров LPC с низкими измерениями; и
получения множества групп параметров с высокими измерениями посредством группирования параметров LPC в группу параметров LPC с высокими измерениями, где одна из указанного множества групп параметров с высокими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множестве групп параметров с высокими измерениями не имеют пересечений; или
получения множества групп параметров с низкими измерениями посредством группирования параметров LPC в группу параметров LPC с низкими измерениями, где одна из указанного множества групп параметров с низкими измерениями содержит подлежащие кодированию параметры LPC по меньшей мере для двух каналов, и параметры LPC в множества группах параметров с низкими измерениями не имеют пересечений.
24. Устройство по любому из пп. 14-23, в котором модуль получения дополнительно выполнен с возможностью:
определения, что абсолютная величина разности между параметрами LPC для каждых двух каналов из совокупности по меньшей мере из двух каналов не больше заданной пороговой величины, причем указанная разность между параметрами LPC для двух каналов содержит среднюю величину среднеквадратических ошибок или среднюю величину косинусных расстояний между параметрами LPC для указанных двух каналов.
25. Устройство по любому из пп. 14-24, в котором
модуль получения дополнительно выполнен с возможностью:
получения результата прямого кодирования не опорного параметра LPC; и
определения, что разность между первыми искажениями и вторыми искажениями не больше первой заданной пороговой величины, где первые искажения представляют собой искажения результата кодирования остатка не опорного параметра LPC относительно указанного не опорного параметра LPC, а вторые искажения представляют собой искажения результата прямого кодирования не опорного параметра LPC относительно указанного не опорного параметра LPC.
26. Устройство по любому из пп. 14-25, в котором
модуль получения дополнительно выполнен с возможностью:
определения, что разность между первым количеством битов и вторым количеством битов не меньше второй заданной пороговой величины, причем первое количество битов представляет собой количество битов, требуемое для прямого кодирования не опорного параметра LPC, а второе количество битов представляет собой количество битов, требуемое для кодирования не опорного параметра LPC на основе результата прямого кодирования опорного параметра LPC и остатка.
27. Устройство кодирования, содержащее процессор и запоминающее устройство, причем указанные процессор и запоминающее устройство соединены один с другим, запоминающее устройство выполнено с возможностью хранения компьютерной программы, содержащей программные команды, а процессор выполнен с возможностью вызова указанных программных команд для осуществления способа по любому из пп. 1-13.
28. Машиночитаемый носитель хранения информации, содержащий команды, вызывающие, при исполнении компьютером, выполнение, указанным компьютером, способа по любому из пп. 1-13.
29. Устройство кодирования, содержащее процессор и интерфейс связи, при этом процессор выполнен с возможностью считывания и сохранения компьютерной программы через интерфейс связи, причем компьютерная программа содержит программные команды, а процессор выполнен с возможностью вызова указанных программных команд для осуществления способа по любому из пп. 1-13.
30. Устройство кодирования, содержащее процессор и запоминающее устройство, причем процессор выполнен с возможностью осуществления способа по любому из пп. 1-13, а запоминающее устройство выполнено с возможностью хранения кодированного потока битов данных.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010349207.5 | 2020-04-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2811412C1 true RU2811412C1 (ru) | 2024-01-11 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2439718C1 (ru) * | 2007-12-31 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
EP2919232A1 (en) * | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and method for encoding and decoding |
EP3252763A1 (en) * | 2016-05-30 | 2017-12-06 | Nokia Technologies Oy | Low-delay audio coding |
RU2018114899A (ru) * | 2015-09-25 | 2019-10-25 | Войсэйдж Корпорейшн | Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала |
US20200126575A1 (en) * | 2017-04-10 | 2020-04-23 | Nokia Technologies Oy | Audio coding |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2439718C1 (ru) * | 2007-12-31 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
EP2919232A1 (en) * | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and method for encoding and decoding |
RU2018114899A (ru) * | 2015-09-25 | 2019-10-25 | Войсэйдж Корпорейшн | Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала |
EP3252763A1 (en) * | 2016-05-30 | 2017-12-06 | Nokia Technologies Oy | Low-delay audio coding |
US20200126575A1 (en) * | 2017-04-10 | 2020-04-23 | Nokia Technologies Oy | Audio coding |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI752281B (zh) | 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法 | |
RU2711055C2 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала | |
US9269366B2 (en) | Hybrid instantaneous/differential pitch period coding | |
EP1908056A1 (en) | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding | |
US11238875B2 (en) | Encoding and decoding methods, and encoding and decoding apparatuses for stereo signal | |
CN113728382B (zh) | 利用旋转的插值和量化进行空间化音频编解码 | |
KR102593235B1 (ko) | 공간 오디오 파라미터의 양자화 | |
JP2024102106A (ja) | ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置 | |
RU2811412C1 (ru) | СПОСОБ КОДИРОВАНИЯ ПАРАМЕТРОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРОГНОЗИРОВАНИЕМ и УСТРОЙСТВО КОДИРОВАНИЯ | |
JP7432011B2 (ja) | 線形予測符号化パラメータの符号化方法および符号化装置 | |
US20240153512A1 (en) | Audio codec with adaptive gain control of downmixed signals | |
KR20200038297A (ko) | 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스 | |
CN113129913B (zh) | 音频信号的编解码方法和编解码装置 | |
KR102492600B1 (ko) | 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품 | |
WO2020001568A1 (zh) | 立体声信号编码过程中确定加权系数的方法和装置 | |
US20220335960A1 (en) | Audio signal encoding method and apparatus, and audio signal decoding method and apparatus | |
CN110660400B (zh) | 立体声信号的编码、解码方法、编码装置和解码装置 | |
WO2022012553A1 (zh) | 多声道音频信号的编解码方法和装置 | |
CN118588096A (zh) | Tws蓝牙音频设备解码方法及装置 |