RU2012136397A - Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала - Google Patents
Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала Download PDFInfo
- Publication number
- RU2012136397A RU2012136397A RU2012136397/08A RU2012136397A RU2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397/08 A RU2012136397/08 A RU 2012136397/08A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A
- Authority
- RU
- Russia
- Prior art keywords
- coding
- coefficients
- level
- frequency domain
- subbands
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 24
- 230000007704 transition Effects 0.000 title claims abstract 10
- 238000013139 quantization Methods 0.000 claims abstract 81
- 238000001514 detection method Methods 0.000 claims abstract 19
- 238000006243 chemical reaction Methods 0.000 claims abstract 18
- 230000001052 transient effect Effects 0.000 claims abstract 18
- 230000005236 sound signal Effects 0.000 claims abstract 13
- 239000010410 layer Substances 0.000 claims 68
- 238000009826 distribution Methods 0.000 claims 16
- 238000004364 calculation method Methods 0.000 claims 6
- 239000012792 core layer Substances 0.000 claims 3
- JLYXXMFPNIAWKQ-UHFFFAOYSA-N γ Benzene hexachloride Chemical compound ClC1C(Cl)C(Cl)C(Cl)C(Cl)C1Cl JLYXXMFPNIAWKQ-UHFFFAOYSA-N 0.000 claims 3
- 230000005540 biological transmission Effects 0.000 claims 2
- 238000010606 normalization Methods 0.000 claims 2
- AXTGDCSMTYGJND-UHFFFAOYSA-N 1-dodecylazepan-2-one Chemical compound CCCCCCCCCCCCN1CCCCCC1=O AXTGDCSMTYGJND-UHFFFAOYSA-N 0.000 claims 1
- 230000000295 complement effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ иерархического кодирования звука, включающий следующее:выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и по
Claims (18)
1. Способ иерархического кодирования звука, включающий следующее:
выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;
если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, а затем квантование и кодирование коэффициентов частотной области базового уровня для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с числами распределения битов и индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем квантование и кодирование сигналов кодирования расширенного уровня для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированные биты коэффициентов частотной области базового уровня и кодированные биты сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
2. Способ по п.1, где, если обнаружение транзиентов должно быть переходным сигналом, и коэффициенты частотной области переставляют, коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких, в пределах базового уровня и в пределах расширенного уровня соответственно.
3. Способ по п.2, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставленных в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
4. Способ по п.1 или 2, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
5. Способ по п.1, включающий также следующее: если обнаружение транзиентов должно быть установившимся сигналом,
на индексах квантования огибающей амплитуды поддиапазонов кодирования базового уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования базового уровня; и
на индексах квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования расширенного уровня.
6. Способ по п.1, где квантование и кодирование коэффициентов частотной области базового уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования базового уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы; и
квантование и кодирование сигналов кодирования расширенного уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования расширенного уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы.
7. Способ иерархического декодирования звука, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; если информация обнаружения транзиентов указывает на наличие переходного сигнала, дополнительно переставляют индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня, и выполняют распределение битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и переставляют сигналы кодирования расширенного уровня в порядке поддиапазонов и добавляют к ним коэффициенты частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
если информация обнаружения транзиентов указывает на наличие установившегося сигнала, на коэффициентах частотной области полного диапазона частот непосредственно выполняют обратное временно-частотное преобразование для получения звукового сигнала для выдачи; а если информация обнаружения транзиентов указывает на наличие переходного сигнала, коэффициенты частотной области полного диапазона частот переставляют, затем разделяют их на M групп коэффициентов частотной области, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
8. Способ по п.7, где, если информация обнаружения транзиентов указывает на наличие переходного сигнала, перестановка коэффициентов частотной области полного диапазона частот, включает: перестановка коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, и затем M групп коэффициентов частотной области переставляют в порядке субкадров.
9. Способ иерархического кодирования звука для переходных сигналов, включающий следующее:
разделение звукового сигнала на M субкадров, на каждом субкадре выполняют временно-частотное преобразование, M группами коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра, коэффициенты полной частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, и затем коэффициенты частотной области базового уровня квантуют и кодируют для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды поддиапазонов кодирования разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем сигналы кодирования расширенного уровня квантуют и кодируют для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
10. Способ по п.9, где коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня соответственно.
11. Способ по п.10, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
12. Способ по п.9 и 10, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
13. Способ иерархического декодирования для переходных сигналов, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, перестановка индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня;
выполнение распределения битов на поддиапазонах кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и перестановка сигналов кодирования расширенного уровня в порядке поддиапазонов и добавление к ним коэффициентов частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
перестановка коэффициентов частотной области полного диапазона частот, а затем разделение на M групп, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
14. Способ по п.13, где стадия, на которой переставляют коэффициенты частотной области полного диапазона частот, включает: расположение коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, а затем M групп коэффициентов частотной области располагают в порядке субкадров.
15. Система иерархического кодирования звука, содержащая:
устройство генерирования коэффициентов частотной области, устройство расчета огибающей амплитуды, устройство квантования и кодирования огибающей амплитуды, устройство распределения битов базового уровня, устройство векторного квантования и кодирования коэффициентов частотной области базового уровня, и мультиплексор потока битов; и содержащая также: устройство обнаружения транзиентов, устройство генерирования сигналов кодирования расширенного уровня, устройство генерирования огибающей амплитуды разностных сигналов, устройство распределения битов расширенного уровня, и устройство векторного квантования и кодирования сигналов кодирования расширенного уровня; где
устройство обнаружения транзиентов предназначено для выполнения обнаружения транзиентов на звуковом сигнале текущего кадра;
устройство генерирования коэффициентов частотной области соединено с устройством обнаружения транзиентов, и предназначено для того чтобы: если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнять временно-частотное преобразование для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделять звуковой сигнал на M субкадров, на каждом субкадре выполнять временно-частотное преобразование, создавать коэффициенты полной частотной области текущего кадра M группами коэффициентов частотной области, полученными путем преобразования, переставлять коэффициенты полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
устройство расчета огибающей амплитуды соединено с устройством генерирования коэффициентов частотной области, и предназначено для расчета значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня;
устройство квантования и кодирования огибающей амплитуды соединено с устройством расчета огибающей амплитуды и устройством обнаружения транзиентов, и предназначено для квантования и кодирования значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня кодированных битов квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
устройство распределения битов базового уровня соединено с устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня для получения числа распределения битов поддиапазонов кодирования базового уровня;
устройство векторного квантования и кодирования коэффициентов частотной области базового уровня соединено с устройством генерирования коэффициентов частотной области, устройством квантования и кодирования огибающей амплитуды и устройством распределения битов базового уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на коэффициентах частотной области поддиапазонов кодирования базового уровня, используя числа распределения битов поддиапазонов кодирования базового уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования базового уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, для получения кодированных битов коэффициентов частотной области базового уровня;
устройство генерирования сигналов кодирования расширенного уровня соединено с устройством генерирования коэффициентов частотной области и устройством векторного квантования и кодирования коэффициентов частотной области базового уровня и предназначено для генерирования разностных сигналов базового уровня для получения сигналов кодирования расширенного уровня, включающих разностные сигналы базового уровня и коэффициенты частотной области расширенного уровня;
устройство генерирования огибающей амплитуды разностных сигналов соединено с устройством квантования и кодирования огибающей амплитуды и устройство распределения битов базового уровня и предназначено для получения индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов соответствующих поддиапазонов кодирования базового уровня;
устройство распределения битов расширенного уровня соединено с устройством генерирования огибающей амплитуды разностных сигналов и устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня для получения чисел распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня;
устройство векторного квантования и кодирования сигналов кодирования расширенного уровня соединено с устройством квантования и кодирования огибающей амплитуды, устройством распределения битов расширенного уровня, устройством генерирования огибающей амплитуды разностных сигналов и устройством генерирования сигналов кодирования расширенного уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на сигналах кодирования расширенного уровня, используя числа распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, для получения кодированных битов сигналов кодирования расширенного уровня;
мультиплексор потока битов соединен с устройством квантования и кодирования огибающей амплитуды, устройством векторного квантования и кодирования коэффициентов частотной области базового уровня, устройством векторного квантования и кодирования сигналов кодирования расширенного уровня и предназначен для пакетирования битов дополнительной информации базового уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня, кодированных битов коэффициентов частотной области базового уровня, битов дополнительной информации расширенного уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования расширенного уровня и кодированных битов сигналов кодирования расширенного уровня.
16. Система по п.15, где устройство генерирования коэффициентов частотной области предназначено также для того чтобы: при перестановке коэффициентов частотной области переставлять коэффициенты частотной области соответственно, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня.
17. Система по п.16, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
18. Система по п.15 или 16, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2010101455311A CN102222505B (zh) | 2010-04-13 | 2010-04-13 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
| CN201010145531.1 | 2010-04-13 | ||
| PCT/CN2011/070206 WO2011127757A1 (zh) | 2010-04-13 | 2011-01-12 | 可分层音频编解码方法和系统及瞬态信号可分层编解码方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2012136397A true RU2012136397A (ru) | 2014-05-20 |
| RU2522020C1 RU2522020C1 (ru) | 2014-07-10 |
Family
ID=44779039
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2012136397/08A RU2522020C1 (ru) | 2010-04-13 | 2011-01-12 | Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8874450B2 (ru) |
| EP (1) | EP2528057B1 (ru) |
| CN (1) | CN102222505B (ru) |
| BR (1) | BR112012021359B1 (ru) |
| RU (1) | RU2522020C1 (ru) |
| WO (1) | WO2011127757A1 (ru) |
Families Citing this family (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA3051552C (en) * | 2011-04-20 | 2021-09-21 | Panasonic Intellectual Property Corporation Of America | Device and method for execution of huffman coding |
| SG194945A1 (en) | 2011-05-13 | 2013-12-30 | Samsung Electronics Co Ltd | Bit allocating, audio encoding and decoding |
| JP5807453B2 (ja) * | 2011-08-30 | 2015-11-10 | 富士通株式会社 | 符号化方法、符号化装置および符号化プログラム |
| EP2717262A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
| CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
| EP3561808B1 (en) | 2013-02-05 | 2021-03-31 | Telefonaktiebolaget LM Ericsson (publ) | Method and apparatus for controlling audio frame loss concealment |
| SG11201506543WA (en) * | 2013-02-20 | 2015-09-29 | Fraunhofer Ges Forschung | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
| US9560386B2 (en) * | 2013-02-21 | 2017-01-31 | Mozilla Corporation | Pyramid vector quantization for video coding |
| US9665541B2 (en) | 2013-04-25 | 2017-05-30 | Mozilla Corporation | Encoding video data using reversible integer approximations of orthonormal transforms |
| KR101803410B1 (ko) | 2013-12-02 | 2017-12-28 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
| RU2662693C2 (ru) | 2014-02-28 | 2018-07-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования |
| US10410645B2 (en) | 2014-03-03 | 2019-09-10 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
| SG10201808274UA (en) | 2014-03-24 | 2018-10-30 | Samsung Electronics Co Ltd | High-band encoding method and device, and high-band decoding method and device |
| ES2586712T3 (es) * | 2014-07-28 | 2016-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Búsqueda de forma de cuantificador de vector en pirámide |
| FR3024581A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
| EP2988300A1 (en) * | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
| EP2993665A1 (en) * | 2014-09-02 | 2016-03-09 | Thomson Licensing | Method and apparatus for coding or decoding subband configuration data for subband groups |
| CN111951814B (zh) * | 2014-09-04 | 2025-03-07 | 索尼公司 | 传输设备、传输方法、接收设备以及接收方法 |
| EP4601259A3 (en) * | 2014-09-30 | 2025-09-24 | Sony Group Corporation | Transmitting device, transmission method, receiving device, and receiving method |
| KR102362788B1 (ko) | 2015-01-08 | 2022-02-15 | 한국전자통신연구원 | 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법 |
| CA3062640C (en) | 2015-01-08 | 2022-04-26 | Electronics And Telecommunications Research Institute | An apparatus and method for broadcast signal reception using layered divisional multiplexing |
| EP3182411A1 (en) * | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
| US10210871B2 (en) * | 2016-03-18 | 2019-02-19 | Qualcomm Incorporated | Audio processing for temporally mismatched signals |
| WO2018109143A1 (en) * | 2016-12-16 | 2018-06-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods, encoder and decoder for handling envelope representation coefficients |
| US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
| US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
| US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
| CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
| WO2020253941A1 (en) | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
| CN113129910B (zh) * | 2019-12-31 | 2024-07-30 | 华为技术有限公司 | 音频信号的编解码方法和编解码装置 |
| CN114945981B (zh) * | 2020-06-24 | 2025-08-08 | 华为技术有限公司 | 一种音频信号处理方法和装置 |
| CN115691521A (zh) * | 2021-07-29 | 2023-02-03 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
| CN119274562A (zh) * | 2022-06-15 | 2025-01-07 | 腾讯科技(深圳)有限公司 | 音频编码及解码方法、装置、设备、介质及程序产品 |
Family Cites Families (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5502789A (en) * | 1990-03-07 | 1996-03-26 | Sony Corporation | Apparatus for encoding digital data with reduction of perceptible noise |
| CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
| US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
| KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
| US6658382B1 (en) * | 1999-03-23 | 2003-12-02 | Nippon Telegraph And Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
| EP1088304A1 (en) * | 1999-04-05 | 2001-04-04 | Hughes Electronics Corporation | A frequency domain interpolative speech codec system |
| US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
| US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
| MXPA03010237A (es) * | 2001-05-10 | 2004-03-16 | Dolby Lab Licensing Corp | Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido. |
| US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
| US7328150B2 (en) * | 2002-09-04 | 2008-02-05 | Microsoft Corporation | Innovations in pure lossless audio compression |
| US20070033014A1 (en) * | 2003-09-09 | 2007-02-08 | Koninklijke Philips Electronics N.V. | Encoding of transient audio signal components |
| FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
| US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
| US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
| US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
| WO2007063913A1 (ja) * | 2005-11-30 | 2007-06-07 | Matsushita Electric Industrial Co., Ltd. | サブバンド符号化装置およびサブバンド符号化方法 |
| US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
| ATE548727T1 (de) * | 2007-03-02 | 2012-03-15 | Ericsson Telefon Ab L M | Nachfilter für geschichtete codecs |
| JP5140730B2 (ja) * | 2007-08-27 | 2013-02-13 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成 |
| TWI346465B (en) * | 2007-09-04 | 2011-08-01 | Univ Nat Central | Configurable common filterbank processor applicable for various audio video standards and processing method thereof |
| US8290782B2 (en) * | 2008-07-24 | 2012-10-16 | Dts, Inc. | Compression of audio scale-factors by two-dimensional transformation |
| CN101414864B (zh) * | 2008-12-08 | 2013-01-30 | 华为技术有限公司 | 多天线分层预编码的方法及装置 |
-
2010
- 2010-04-13 CN CN2010101455311A patent/CN102222505B/zh active Active
-
2011
- 2011-01-12 BR BR112012021359-8A patent/BR112012021359B1/pt active IP Right Grant
- 2011-01-12 WO PCT/CN2011/070206 patent/WO2011127757A1/zh not_active Ceased
- 2011-01-12 EP EP11768369.8A patent/EP2528057B1/en active Active
- 2011-01-12 US US13/580,855 patent/US8874450B2/en active Active
- 2011-01-12 RU RU2012136397/08A patent/RU2522020C1/ru active
Also Published As
| Publication number | Publication date |
|---|---|
| US8874450B2 (en) | 2014-10-28 |
| EP2528057B1 (en) | 2016-04-06 |
| EP2528057A4 (en) | 2014-08-06 |
| BR112012021359A2 (pt) | 2017-08-15 |
| US20120323582A1 (en) | 2012-12-20 |
| WO2011127757A1 (zh) | 2011-10-20 |
| EP2528057A1 (en) | 2012-11-28 |
| CN102222505B (zh) | 2012-12-19 |
| CN102222505A (zh) | 2011-10-19 |
| RU2522020C1 (ru) | 2014-07-10 |
| BR112012021359B1 (pt) | 2020-12-15 |
| HK1179402A1 (en) | 2013-09-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2012136397A (ru) | Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала | |
| JP6518361B2 (ja) | オーディオ/音声符号化方法およびオーディオ/音声符号化装置 | |
| RU2224302C2 (ru) | Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов | |
| US9269372B2 (en) | Adaptive transition frequency between noise fill and bandwidth extension | |
| US8694325B2 (en) | Hierarchical audio coding, decoding method and system | |
| ES3037836T3 (en) | Audio encoding device and method | |
| CN103778918B (zh) | 音频信号的比特分配的方法和装置 | |
| CN104737227B (zh) | 语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法 | |
| JP6600054B2 (ja) | 方法、符号化器、復号化器、及び移動体機器 | |
| JP2008547043A (ja) | スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック | |
| ES2664090T3 (es) | Relleno de subvectores no codificados en señales de audio codificadas por transformada | |
| BRPI0514650B1 (pt) | Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio | |
| KR20110110044A (ko) | 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 | |
| KR102299916B1 (ko) | 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스 | |
| CN102157153B (zh) | 多声道信号编码、解码方法、装置及编解码系统 | |
| KR20170047361A (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
| CN101572586B (zh) | 编解码方法、装置及系统 | |
| CN102479514A (zh) | 一种编码方法、解码方法、装置和系统 | |
| EP4539045A1 (en) | Audio encoding and decoding method and apparatus, storage medium, and computer program product | |
| Atlas et al. | Modulation frequency and efficient audio coding | |
| CN101290771B (zh) | 一种基于先进音频编码器的比特消耗控制方法 | |
| WO2024179055A1 (zh) | 音频编解码方法及相关装置 | |
| Hansen et al. | Fine-grain scalable audio coding based on envelope restoration and the SPIHT algorithm | |
| KR101325760B1 (ko) | 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법 | |
| Johansen et al. | Fine-granular scalable and error resilient audio coding by tree-structured quantization |