RU2023132369A - LOW LATENCY CODEC WITH LOW FREQUENCY EFFECTS - Google Patents

LOW LATENCY CODEC WITH LOW FREQUENCY EFFECTS Download PDF

Info

Publication number
RU2023132369A
RU2023132369A RU2023132369A RU2023132369A RU2023132369A RU 2023132369 A RU2023132369 A RU 2023132369A RU 2023132369 A RU2023132369 A RU 2023132369A RU 2023132369 A RU2023132369 A RU 2023132369A RU 2023132369 A RU2023132369 A RU 2023132369A
Authority
RU
Russia
Prior art keywords
coefficients
lfe
sub
processors
frequency
Prior art date
Application number
RU2023132369A
Other languages
Russian (ru)
Inventor
Ришабх ТИЯГИ
Дэвид МАКГРАТ
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2023132369A publication Critical patent/RU2023132369A/en

Links

Claims (69)

1. Способ кодирования канала с низкочастотными эффектами (LFE), содержащий этапы, на которых1. A method for encoding a low frequency effects (LFE) channel, comprising the steps of принимают, с использованием одного или более процессоров, канальный сигнал LFE временной области;receiving, using one or more processors, a time domain LFE channel signal; фильтруют, с использованием фильтра нижних частот, канальный сигнал LFE временной области;filtering, using a low pass filter, the time domain LFE channel signal; преобразуют, с использованием одного или более процессоров, фильтрованный канальный сигнал LFE временной области в представление в частотной области канального сигнала LFE, которое включает в себя некоторое число коэффициентов, представляющих частотный спектр канального сигнала LFE;converting, using one or more processors, the filtered time domain channel LFE signal into a frequency domain representation of the LFE channel signal, which includes a number of coefficients representing the frequency spectrum of the LFE channel signal; размещают, с использованием одного или более процессоров, коэффициенты в число групп подполос частот, соответствующее различным полосам частот канального сигнала LFE;placing, using one or more processors, coefficients into a number of subband groups corresponding to different frequency bands of the LFE channel signal; квантуют, с использованием одного или более процессоров, коэффициенты в каждой группе подполос частот согласно кривой частотного отклика фильтра нижних частот;quantizing, using one or more processors, the coefficients in each group of sub-bands according to the frequency response curve of the low-pass filter; кодируют, с использованием одного или более процессоров, квантованные коэффициенты в каждой группе подполос частот с использованием энтропийного кодера, настроенного для группы подполос частот; иencoding, using one or more processors, the quantized coefficients in each group of sub-bands using an entropy encoder configured for the group of sub-bands; And формируют, с использованием одного или более процессоров, поток битов, включающий в себя кодированные квантованные коэффициенты; иgenerating, using one or more processors, a bitstream including encoded quantized coefficients; And сохраняют, с использованием одного или более процессоров, поток битов на устройстве хранения данных или передают в потоковом режиме поток битов в следующее по ходу устройство.storing, using one or more processors, the bit stream on a storage device or streaming the bit stream to a downstream device. 2. Способ по п. 1, в котором выделение точек квантования соответствует форме характеристической кривой фильтра нижних частот, причем для групп подполос частот для нижних частот выделяется большее число точек квантования, чем для групп подполос частот для верхних частот.2. The method according to claim 1, in which the allocation of quantization points corresponds to the shape of the characteristic curve of the low-pass filter, and for groups of sub-bands for low frequencies, a larger number of quantization points are allocated than for groups of sub-bands for high frequencies. 3. Способ по п. 1 или 2, в котором квантование коэффициентов в каждой группе подполос частот дополнительно содержит этапы, на которых3. The method according to claim 1 or 2, in which the quantization of coefficients in each group of sub-frequency bands further comprises the steps of: формируют коэффициент сдвига при масштабировании на основе максимального числа доступных точек квантования и суммы абсолютных значений коэффициентов; generating a shift coefficient when scaling based on the maximum number of available quantization points and the sum of the absolute values of the coefficients; квантуют коэффициенты с использованием коэффициента сдвига при масштабировании.quantize the coefficients using the shift factor when scaling. 4. Способ по п. 3, в котором, если квантованный коэффициент превышает максимальное число точек квантования, коэффициент сдвига при масштабировании уменьшается, и коэффициенты квантуются снова.4. The method of claim 3, wherein if the quantized coefficient exceeds the maximum number of quantization points, the scaling shift factor is reduced and the coefficients are quantized again. 5. Способ по любому из предшествующих пп. 1-4, в котором точки квантования отличаются для каждой группы подполос частот.5. The method according to any of the preceding paragraphs. 1-4, in which the quantization points are different for each group of sub-bands. 6. Способ по любому из предшествующих пп. 1-5, в котором коэффициенты в каждой группе подполос частот квантуются согласно схеме точного квантования или схеме грубого квантования, при этом при использовании схемы точного квантования для одной или более групп подполос частот выделяется большее число точек квантования, чем назначено соответствующим группам подполос частот согласно схеме грубого квантования.6. Method according to any of the preceding paragraphs. 1-5, in which the coefficients in each group of sub-bands are quantized according to a fine quantization scheme or a coarse quantization scheme, wherein when using a fine quantization scheme, one or more groups of sub-bands are allocated a greater number of quantization points than are assigned to the corresponding groups of sub-bands according to the scheme rough quantization. 7. Способ по любому из предшествующих пп. 1-6, в котором знаковые биты для коэффициентов кодируются отдельно от упомянутых коэффициентов.7. The method according to any of the preceding paragraphs. 1-6, in which the sign bits for the coefficients are encoded separately from said coefficients. 8. Способ по любому из предшествующих пп. 1-7, в котором имеется четыре группы подполос частот, и первая группа подполос частот соответствует первому частотному диапазону в 0-100 Гц, вторая группа подполос частот соответствует второму частотному диапазону в 100-200 Гц, третья группа подполос частот соответствует третьему частотному диапазону в 200-300 Гц, и четвертая группа подполос частот соответствует четвертому частотному диапазону в 300-400 Гц.8. The method according to any of the preceding paragraphs. 1-7, in which there are four groups of sub-frequency bands, and the first group of sub-frequency bands corresponds to the first frequency range of 0-100 Hz, the second group of sub-frequency bands corresponds to the second frequency range of 100-200 Hz, the third group of sub-frequency bands corresponds to the third frequency range of 200-300 Hz, and the fourth group of sub-frequency bands corresponds to the fourth frequency range of 300-400 Hz. 9. Способ по любому из предшествующих пп. 1-8, в котором энтропийный кодер представляет собой арифметический энтропийный кодер.9. Method according to any of the preceding paragraphs. 1-8, in which the entropy encoder is an arithmetic entropy encoder. 10. Способ по любому из предшествующих пп. 1-9, в котором преобразование фильтрованного канального сигнала LFE временной области в представление в частотной области канального сигнала LFE, которое включает в себя некоторое число коэффициентов, представляющих частотный спектр канального сигнала LFE, дополнительно содержит этапы, на которых10. Method according to any of the preceding paragraphs. 1-9, wherein converting the filtered time domain LFE channel signal to a frequency domain representation of the LFE channel signal, which includes a number of coefficients representing the frequency spectrum of the LFE channel signal, further comprises the steps of: определяют первую длину шага канального сигнала LFE;determining a first step length of the LFE channel signal; обозначают первый размер окна кодирования со взвешиванием функции кодирования со взвешиванием на основе первой длины шага;denote a first weighted encoding window size of a weighted encoding function based on the first step length; применяют первый размер окна кодирования со взвешиванием к одному или более кадрам канального сигнала LFE временной области; applying a first weighted encoding window size to one or more frames of the time domain LFE channel signal; применяют модифицированное дискретное косинусное преобразование (MDCT) к кодированным со взвешиванием кадрам для формирования коэффициентов.apply a modified discrete cosine transform (MDCT) to the weighted encoded frames to generate the coefficients. 11. Способ по п. 10, дополнительно содержащий этапы, на которых11. The method according to claim 10, further comprising the steps of определяют вторую длину шага канального сигнала LFE;determining a second step length of the LFE channel signal; обозначают второй размер окна кодирования со взвешиванием функции кодирования со взвешиванием на основе второй длины шага; denote a second weighted encoding window size of a weighted encoding function based on the second step length; применяют второй размер окна кодирования со взвешиванием к одному или более кадров канального сигнала LFE временной области.applying a second weighted encoding window size to one or more frames of the time domain LFE channel signal. 12. Способ по п. 11, в котором12. The method according to claim 11, in which первая длина шага составляет N миллисекунд (мс);the first step length is N milliseconds (ms); N больше или равно 5 мс и меньше или равно 60 мс;N is greater than or equal to 5 ms and less than or equal to 60 ms; первый размер окна кодирования со взвешиванием выше или равен 10 мс;a first weighted encoding window size greater than or equal to 10 ms; вторая длина шага составляет 5 мс; the second step length is 5 ms; второй размер окна кодирования со взвешиванием составляет 10 мс.the second weighted coding window size is 10 ms. 13. Способ по п. 11, в котором13. The method according to claim 11, in which первая длина шага составляет 20 миллисекунд (мс);the first step length is 20 milliseconds (ms); первый размер окна кодирования со взвешиванием составляет 10 мс, 20 мс или 40 мс;the first weighted encoding window size is 10 ms, 20 ms or 40 ms; вторая длина шага составляет 10 мс; the second step length is 10 ms; второй размер окна кодирования со взвешиванием составляет 10 мс или 20 мс.the second weighted encoding window size is 10 ms or 20 ms. 14. Способ по п. 11, в котором14. The method according to claim 11, in which первая длина шага составляет 10 миллисекунд (мс);the first step length is 10 milliseconds (ms); первый размер окна кодирования со взвешиванием составляет 10 мс или 20 мс;the first weighted encoding window size is 10 ms or 20 ms; вторая длина шага составляет 5 мс; the second step length is 5 ms; второй размер окна кодирования со взвешиванием составляет 10 мс.the second weighted coding window size is 10 ms. 15. Способ по п. 11, в котором15. The method according to claim 11, in which первая длина шага составляет 20 миллисекунд (мс);the first step length is 20 milliseconds (ms); первый размер окна кодирования со взвешиванием составляет 10 мс, 20 мс или 40 мс;the first weighted encoding window size is 10 ms, 20 ms or 40 ms; вторая длина шага составляет 5 мс; the second step length is 5 ms; второй размер окна кодирования со взвешиванием составляет 10 мс.the second weighted coding window size is 10 ms. 16. Способ по п. 10, в котором функция кодирования со взвешиванием представляет собой выводимую методом Кайзера-Бесселя (KBD) функцию кодирования со взвешиванием с конфигурируемой длиной постепенного нарастания/затухания.16. The method of claim 10, wherein the weighted coding function is a Kaiser-Bessel derived (KBD) weighted coding function with a configurable fade-in/fade length. 17. Способ по любому из предшествующих пп. 1-16, в котором фильтр нижних частот представляет собой фильтр нижних частот на основе фильтра Баттеруорта четвертого порядка с частотой отсечки приблизительно в 130 Гц или ниже.17. The method according to any of the preceding paragraphs. 1-16, wherein the low pass filter is a low pass filter based on a fourth order Butterworth filter with a cutoff frequency of approximately 130 Hz or lower. 18. Способ по любому из предшествующих пп. 1-17, дополнительно содержащий этапы, на которых18. The method according to any of the preceding paragraphs. 1-17, further comprising the steps of определяют, с использованием одного или более процессоров, является ли энергетический уровень кадра канального сигнала LFE меньшим, чем пороговое значение;determining, using one or more processors, whether the frame energy level of the LFE channel signal is less than a threshold value; в соответствии с тем, что энергетический уровень меньше порогового уровня:in accordance with the fact that the energy level is less than the threshold level: формируют индикатор кадров молчания, указывающий, что декодер;generating a silent frame indicator indicating that the decoder; вставляют индикатор кадров молчания в метаданные потока канальных битов LFE; inserting a silent frame indicator into the metadata of the LFE channel bit stream; уменьшают скорость передачи канальных битов LFE при обнаружении кадров молчания.reduce the LFE channel bit rate when silent frames are detected. 19. Способ декодирования потока канальных битов с низкочастотными эффектами (LFE), содержащий этапы, на которых19. A method for decoding a channel bit stream with low frequency effects (LFE), comprising the steps of: принимают, с использованием одного или более процессоров, поток канальных битов LFE, причем поток канальных битов LFE включает в себя энтропийно кодированные коэффициенты, представляющие частотный спектр канального сигнала LFE временной области;receiving, using one or more processors, a stream of LFE channel bits, wherein the stream of LFE channel bits includes entropy coded coefficients representing a frequency spectrum of the time domain LFE channel signal; декодируют, с использованием одного или более процессоров, квантованные коэффициенты с использованием энтропийного декодера;decoding, using one or more processors, the quantized coefficients using an entropy decoder; выполняют обратное квантование, с использованием одного или более процессоров, обратно квантованных коэффициентов, при этом коэффициенты квантованы в группах подполос частот, соответствующих полосам частот согласно кривой частотного отклика фильтра нижних частот, используемого для фильтрации канального сигнала LFE временной области в кодере;performing inverse quantization, using one or more processors, of the inversely quantized coefficients, the coefficients being quantized into groups of subbands corresponding to frequency bands according to the frequency response curve of a low pass filter used to filter the time domain channel LFE signal in the encoder; преобразуют, с использованием одного или более процессоров, обратно квантованные коэффициенты в канальный сигнал LFE временной области;converting, using one or more processors, the inversely quantized coefficients into a time domain LFE channel signal; регулируют, с использованием одного или более процессоров, задержку канального сигнала LFE временной области; adjusting, using one or more processors, the delay of the time domain channel LFE signal; фильтруют, с использованием фильтра нижних частот, канальный сигнал LFE с отрегулированной задержкой.filter, using a low-pass filter, the delay-adjusted channel LFE signal. 20. Способ по п. 19, в котором порядок фильтра нижних частот выполнен с возможностью обеспечения того, что первая полная алгоритмическая задержка вследствие кодирования и декодирования канала LFE меньше или равна второй полной алгоритмической задержке вследствие кодирования и декодирования других каналов многоканального аудиосигнала, который включает в себя канальный сигнал LFE.20. The method of claim 19, wherein the low pass filter order is configured to ensure that the first total algorithmic delay due to encoding and decoding of the LFE channel is less than or equal to the second total algorithmic delay due to encoding and decoding of other channels of the multi-channel audio signal, which includes itself the LFE channel signal. 21. Способ по п. 20, дополнительно содержащий этапы, на которых21. The method according to claim 20, further comprising the steps of определяют, является ли вторая полная алгоритмическая задержка большей, чем пороговое значение; determining whether the second total algorithmic delay is greater than a threshold value; в соответствии с тем, что вторая полная алгоритмическая задержка больше порогового значения, конфигурируют фильтр нижних частот в качестве фильтра нижних частот N-го порядка, причём N является целым числом, большим или равным двум; in accordance with the fact that the second total algorithmic delay is greater than a threshold value, configuring the low-pass filter as an N-th order low-pass filter, where N is an integer greater than or equal to two; в соответствии с тем, что вторая полная алгоритмическая задержка не является большей, чем пороговое значение, конфигурируют порядок фильтра нижних частот таким образом, что он меньше N. in accordance with the fact that the second total algorithmic delay is not greater than the threshold value, the order of the low-pass filter is configured so that it is less than N.
RU2023132369A 2019-09-03 2020-09-01 LOW LATENCY CODEC WITH LOW FREQUENCY EFFECTS RU2023132369A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/895,049 2019-09-03
US63/069,420 2020-08-24

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2022108693A Division RU2809977C1 (en) 2019-09-03 2020-09-01 Low latency codec with low frequency effects

Publications (1)

Publication Number Publication Date
RU2023132369A true RU2023132369A (en) 2024-01-11

Family

ID=

Similar Documents

Publication Publication Date Title
JP6702593B2 (en) Method and apparatus for encoding and decoding audio signals
JP6518361B2 (en) Audio / voice coding method and audio / voice coder
CN105264597B (en) Noise filling in perceptual transform audio coding
MX2011000557A (en) Method and apparatus to encode and decode an audio/speech signal.
WO2009029035A1 (en) Improved transform coding of speech and audio signals
WO2005096274A1 (en) An enhanced audio encoding/decoding device and method
US9008811B2 (en) Methods and systems for adaptive time-frequency resolution in digital data coding
WO2008021247A2 (en) Arbitrary shaping of temporal noise envelope without side-information
WO2012122299A1 (en) Bit allocation and partitioning in gain-shape vector quantization for audio coding
US20120232909A1 (en) Method and system for two-step spreading for tonal artifact avoidance in audio coding
US7225123B2 (en) Method for compressing audio signal using wavelet packet transform and apparatus thereof
RU2015116610A (en) AUDIO SPEED CODING DEVICE, SPEECH-AUDIO DECODING DEVICE, SPEECH-AUDIO CODING METHOD AND SPEECH-AUDIO DECODING METHOD
KR102622804B1 (en) Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals
RU2023132369A (en) LOW LATENCY CODEC WITH LOW FREQUENCY EFFECTS
WO2005096508A1 (en) Enhanced audio encoding and decoding equipment, method thereof
JPWO2021046060A5 (en)
MX2022002323A (en) Low-latency, low-frequency effects codec.
CN102479514B (en) Coding method, decoding method, apparatus and system thereof
Chen et al. Scalefactor based bit shift FGS audio coding
Hansen et al. Fine-grain scalable audio coding based on envelope restoration and the SPIHT algorithm
RU2022105356A (en) ENCODING AND DECODING IVAS BITSTREAM
Padhi et al. Low bitrate MPEG 1 layer III encoder