RU2012136397A - Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала - Google Patents

Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала Download PDF

Info

Publication number
RU2012136397A
RU2012136397A RU2012136397/08A RU2012136397A RU2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397/08 A RU2012136397/08 A RU 2012136397/08A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A
Authority
RU
Russia
Prior art keywords
coding
coefficients
level
frequency domain
subbands
Prior art date
Application number
RU2012136397/08A
Other languages
English (en)
Other versions
RU2522020C1 (ru
Inventor
Ке ПЕН
Гуомин ЧЕНЬ
Хао ЮАНЬ
Донгпин ЦЗЯН
Цзяли ЛИ
Original Assignee
ЗетТиИ Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЗетТиИ Корпорейшн filed Critical ЗетТиИ Корпорейшн
Publication of RU2012136397A publication Critical patent/RU2012136397A/ru
Application granted granted Critical
Publication of RU2522020C1 publication Critical patent/RU2522020C1/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ иерархического кодирования звука, включающий следующее:выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и по

Claims (18)

1. Способ иерархического кодирования звука, включающий следующее:
выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;
если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, а затем квантование и кодирование коэффициентов частотной области базового уровня для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с числами распределения битов и индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем квантование и кодирование сигналов кодирования расширенного уровня для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированные биты коэффициентов частотной области базового уровня и кодированные биты сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
2. Способ по п.1, где, если обнаружение транзиентов должно быть переходным сигналом, и коэффициенты частотной области переставляют, коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких, в пределах базового уровня и в пределах расширенного уровня соответственно.
3. Способ по п.2, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставленных в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
4. Способ по п.1 или 2, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 15 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
5. Способ по п.1, включающий также следующее: если обнаружение транзиентов должно быть установившимся сигналом,
на индексах квантования огибающей амплитуды поддиапазонов кодирования базового уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования базового уровня; и
на индексах квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования расширенного уровня.
6. Способ по п.1, где квантование и кодирование коэффициентов частотной области базового уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования базового уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы; и
квантование и кодирование сигналов кодирования расширенного уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования расширенного уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы.
7. Способ иерархического декодирования звука, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; если информация обнаружения транзиентов указывает на наличие переходного сигнала, дополнительно переставляют индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня, и выполняют распределение битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и переставляют сигналы кодирования расширенного уровня в порядке поддиапазонов и добавляют к ним коэффициенты частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
если информация обнаружения транзиентов указывает на наличие установившегося сигнала, на коэффициентах частотной области полного диапазона частот непосредственно выполняют обратное временно-частотное преобразование для получения звукового сигнала для выдачи; а если информация обнаружения транзиентов указывает на наличие переходного сигнала, коэффициенты частотной области полного диапазона частот переставляют, затем разделяют их на M групп коэффициентов частотной области, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
8. Способ по п.7, где, если информация обнаружения транзиентов указывает на наличие переходного сигнала, перестановка коэффициентов частотной области полного диапазона частот, включает: перестановка коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, и затем M групп коэффициентов частотной области переставляют в порядке субкадров.
9. Способ иерархического кодирования звука для переходных сигналов, включающий следующее:
разделение звукового сигнала на M субкадров, на каждом субкадре выполняют временно-частотное преобразование, M группами коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра, коэффициенты полной частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, и затем коэффициенты частотной области базового уровня квантуют и кодируют для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды поддиапазонов кодирования разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем сигналы кодирования расширенного уровня квантуют и кодируют для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
10. Способ по п.9, где коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня соответственно.
11. Способ по п.10, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
12. Способ по п.9 и 10, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 11 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
13. Способ иерархического декодирования для переходных сигналов, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, перестановка индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня;
выполнение распределения битов на поддиапазонах кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и перестановка сигналов кодирования расширенного уровня в порядке поддиапазонов и добавление к ним коэффициентов частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
перестановка коэффициентов частотной области полного диапазона частот, а затем разделение на M групп, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
14. Способ по п.13, где стадия, на которой переставляют коэффициенты частотной области полного диапазона частот, включает: расположение коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, а затем M групп коэффициентов частотной области располагают в порядке субкадров.
15. Система иерархического кодирования звука, содержащая:
устройство генерирования коэффициентов частотной области, устройство расчета огибающей амплитуды, устройство квантования и кодирования огибающей амплитуды, устройство распределения битов базового уровня, устройство векторного квантования и кодирования коэффициентов частотной области базового уровня, и мультиплексор потока битов; и содержащая также: устройство обнаружения транзиентов, устройство генерирования сигналов кодирования расширенного уровня, устройство генерирования огибающей амплитуды разностных сигналов, устройство распределения битов расширенного уровня, и устройство векторного квантования и кодирования сигналов кодирования расширенного уровня; где
устройство обнаружения транзиентов предназначено для выполнения обнаружения транзиентов на звуковом сигнале текущего кадра;
устройство генерирования коэффициентов частотной области соединено с устройством обнаружения транзиентов, и предназначено для того чтобы: если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнять временно-частотное преобразование для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделять звуковой сигнал на M субкадров, на каждом субкадре выполнять временно-частотное преобразование, создавать коэффициенты полной частотной области текущего кадра M группами коэффициентов частотной области, полученными путем преобразования, переставлять коэффициенты полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
устройство расчета огибающей амплитуды соединено с устройством генерирования коэффициентов частотной области, и предназначено для расчета значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня;
устройство квантования и кодирования огибающей амплитуды соединено с устройством расчета огибающей амплитуды и устройством обнаружения транзиентов, и предназначено для квантования и кодирования значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня кодированных битов квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
устройство распределения битов базового уровня соединено с устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня для получения числа распределения битов поддиапазонов кодирования базового уровня;
устройство векторного квантования и кодирования коэффициентов частотной области базового уровня соединено с устройством генерирования коэффициентов частотной области, устройством квантования и кодирования огибающей амплитуды и устройством распределения битов базового уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на коэффициентах частотной области поддиапазонов кодирования базового уровня, используя числа распределения битов поддиапазонов кодирования базового уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования базового уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, для получения кодированных битов коэффициентов частотной области базового уровня;
устройство генерирования сигналов кодирования расширенного уровня соединено с устройством генерирования коэффициентов частотной области и устройством векторного квантования и кодирования коэффициентов частотной области базового уровня и предназначено для генерирования разностных сигналов базового уровня для получения сигналов кодирования расширенного уровня, включающих разностные сигналы базового уровня и коэффициенты частотной области расширенного уровня;
устройство генерирования огибающей амплитуды разностных сигналов соединено с устройством квантования и кодирования огибающей амплитуды и устройство распределения битов базового уровня и предназначено для получения индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов соответствующих поддиапазонов кодирования базового уровня;
устройство распределения битов расширенного уровня соединено с устройством генерирования огибающей амплитуды разностных сигналов и устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня для получения чисел распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня;
устройство векторного квантования и кодирования сигналов кодирования расширенного уровня соединено с устройством квантования и кодирования огибающей амплитуды, устройством распределения битов расширенного уровня, устройством генерирования огибающей амплитуды разностных сигналов и устройством генерирования сигналов кодирования расширенного уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на сигналах кодирования расширенного уровня, используя числа распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, для получения кодированных битов сигналов кодирования расширенного уровня;
мультиплексор потока битов соединен с устройством квантования и кодирования огибающей амплитуды, устройством векторного квантования и кодирования коэффициентов частотной области базового уровня, устройством векторного квантования и кодирования сигналов кодирования расширенного уровня и предназначен для пакетирования битов дополнительной информации базового уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня, кодированных битов коэффициентов частотной области базового уровня, битов дополнительной информации расширенного уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования расширенного уровня и кодированных битов сигналов кодирования расширенного уровня.
16. Система по п.15, где устройство генерирования коэффициентов частотной области предназначено также для того чтобы: при перестановке коэффициентов частотной области переставлять коэффициенты частотной области соответственно, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня.
17. Система по п.16, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
18. Система по п.15 или 16, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 15 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
RU2012136397/08A 2010-04-13 2011-01-12 Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала RU2522020C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201010145531.1 2010-04-13
CN2010101455311A CN102222505B (zh) 2010-04-13 2010-04-13 可分层音频编解码方法系统及瞬态信号可分层编解码方法
PCT/CN2011/070206 WO2011127757A1 (zh) 2010-04-13 2011-01-12 可分层音频编解码方法和系统及瞬态信号可分层编解码方法

Publications (2)

Publication Number Publication Date
RU2012136397A true RU2012136397A (ru) 2014-05-20
RU2522020C1 RU2522020C1 (ru) 2014-07-10

Family

ID=44779039

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012136397/08A RU2522020C1 (ru) 2010-04-13 2011-01-12 Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала

Country Status (6)

Country Link
US (1) US8874450B2 (ru)
EP (1) EP2528057B1 (ru)
CN (1) CN102222505B (ru)
BR (1) BR112012021359B1 (ru)
RU (1) RU2522020C1 (ru)
WO (1) WO2011127757A1 (ru)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3594943B1 (en) * 2011-04-20 2024-02-21 Panasonic Holdings Corporation Device and method for execution of huffman coding
TWI576829B (zh) * 2011-05-13 2017-04-01 三星電子股份有限公司 位元配置裝置
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
EP2717265A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
DK3125239T3 (da) 2013-02-05 2019-08-19 Ericsson Telefon Ab L M Fremgangsmåde og indretning til styring af maskering af audiorammetab
ES2736309T3 (es) 2013-02-20 2019-12-27 Fraunhofer Ges Forschung Aparato y procedimiento para codificar o descodificar una señal de audio utilizando una superposición que depende de una ubicación de transitorios
US9560386B2 (en) * 2013-02-21 2017-01-31 Mozilla Corporation Pyramid vector quantization for video coding
US9665541B2 (en) 2013-04-25 2017-05-30 Mozilla Corporation Encoding video data using reversible integer approximations of orthonormal transforms
EP4407609A3 (en) * 2013-12-02 2024-08-21 Top Quality Telephony, Llc A computer-readable storage medium and a computer software product
EP4325488A3 (en) * 2014-02-28 2024-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
CN111312277B (zh) 2014-03-03 2023-08-15 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
KR102865245B1 (ko) * 2014-03-24 2025-09-25 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
MY203900A (en) * 2014-07-28 2024-07-23 Ericsson Telefon Ab L M Pyramid vector quantizer shape search
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
EP2993665A1 (en) * 2014-09-02 2016-03-09 Thomson Licensing Method and apparatus for coding or decoding subband configuration data for subband groups
WO2016035731A1 (ja) * 2014-09-04 2016-03-10 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10856042B2 (en) * 2014-09-30 2020-12-01 Sony Corporation Transmission apparatus, transmission method, reception apparatus and reception method for transmitting a plurality of types of audio data items
KR102362788B1 (ko) * 2015-01-08 2022-02-15 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
WO2016111567A1 (ko) 2015-01-08 2016-07-14 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
MX2019006535A (es) 2016-12-16 2019-08-21 Ericsson Telefon Ab L M Metodos, codificador y decodificador para manejar coeficientes de representacion de envolvente.
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
WO2020253941A1 (en) 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN113129910B (zh) * 2019-12-31 2024-07-30 华为技术有限公司 音频信号的编解码方法和编解码装置
CN114945981B (zh) * 2020-06-24 2025-08-08 华为技术有限公司 一种音频信号处理方法和装置
CN115691521B (zh) * 2021-07-29 2026-03-13 华为技术有限公司 一种音频信号的编解码方法和装置
CN115116457B (zh) * 2022-06-15 2024-10-01 腾讯科技(深圳)有限公司 音频编码及解码方法、装置、设备、介质及程序产品

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
DE60017825T2 (de) * 1999-03-23 2006-01-12 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
AU4201100A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
US6260017B1 (en) * 1999-05-07 2001-07-10 Qualcomm Inc. Multipulse interpolative coding of transition speech frames
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
JP4290997B2 (ja) * 2001-05-10 2009-07-08 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション プレノイズの縮減による低ビットレートオーディオコーディングにおけるトランジエント効率の改善
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
KR20060131729A (ko) * 2003-09-09 2006-12-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 과도 오디오 신호 성분들의 인코딩
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
CN101317217B (zh) * 2005-11-30 2012-07-18 松下电器产业株式会社 子带编码装置和子带编码方法
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
US8571852B2 (en) * 2007-03-02 2013-10-29 Telefonaktiebolaget L M Ericsson (Publ) Postfilter for layered codecs
DK3288028T3 (da) * 2007-08-27 2019-09-02 Ericsson Telefon Ab L M Spektralanalyse/syntese med lav kompleksitet ved anvendelse af selekterbar tidsopløsning
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
CN101414864B (zh) * 2008-12-08 2013-01-30 华为技术有限公司 多天线分层预编码的方法及装置

Also Published As

Publication number Publication date
RU2522020C1 (ru) 2014-07-10
BR112012021359B1 (pt) 2020-12-15
EP2528057A1 (en) 2012-11-28
CN102222505B (zh) 2012-12-19
WO2011127757A1 (zh) 2011-10-20
CN102222505A (zh) 2011-10-19
EP2528057A4 (en) 2014-08-06
EP2528057B1 (en) 2016-04-06
US20120323582A1 (en) 2012-12-20
US8874450B2 (en) 2014-10-28
BR112012021359A2 (pt) 2017-08-15
HK1179402A1 (en) 2013-09-27

Similar Documents

Publication Publication Date Title
RU2012136397A (ru) Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала
TWI598872B (zh) 用以實行霍夫曼編碼之裝置及方法
US10878829B2 (en) Adaptive transition frequency between noise fill and bandwidth extension
RU2224302C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US8694325B2 (en) Hierarchical audio coding, decoding method and system
ES3037836T3 (en) Audio encoding device and method
CN104737227B (zh) 语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
JP2008547043A (ja) スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック
CN103778918A (zh) 音频信号的比特分配的方法和装置
US9424857B2 (en) Encoding method and apparatus, and decoding method and apparatus
TWI325234B (en) Encoder, decoder, method for lossless encoding of information values describing an audio signal, method for decoding an encoded representation of information values describing an audio signal, computer program and storage medium
CN102157153B (zh) 多声道信号编码、解码方法、装置及编解码系统
KR20170047361A (ko) 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치
CN100555413C (zh) 可伸缩地编解码音频数据的方法和装置
CN101572586B (zh) 编解码方法、装置及系统
CN102479514A (zh) 一种编码方法、解码方法、装置和系统
US20250166640A1 (en) Audio encoding/decoding method and apparatus, storage medium, and computer program product
Atlas et al. Modulation frequency and efficient audio coding
WO2024179055A1 (zh) 音频编解码方法及相关装置
Hansen et al. Fine-grain scalable audio coding based on envelope restoration and the SPIHT algorithm
HK1209893A1 (en) Encoding method and apparatus
WO2014033421A2 (en) System and method for spatial domain audio decompression and compression
HK1179402B (en) Hierarchical frequency encoding and decoding method for transient signal and system