RU2012136397A - Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала - Google Patents

Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала Download PDF

Info

Publication number
RU2012136397A
RU2012136397A RU2012136397/08A RU2012136397A RU2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397/08 A RU2012136397/08 A RU 2012136397/08A RU 2012136397 A RU2012136397 A RU 2012136397A RU 2012136397 A RU2012136397 A RU 2012136397A
Authority
RU
Russia
Prior art keywords
coding
coefficients
level
frequency domain
subbands
Prior art date
Application number
RU2012136397/08A
Other languages
English (en)
Other versions
RU2522020C1 (ru
Inventor
Ке ПЕН
Гуомин ЧЕНЬ
Хао ЮАНЬ
Донгпин ЦЗЯН
Цзяли ЛИ
Original Assignee
ЗетТиИ Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЗетТиИ Корпорейшн filed Critical ЗетТиИ Корпорейшн
Publication of RU2012136397A publication Critical patent/RU2012136397A/ru
Application granted granted Critical
Publication of RU2522020C1 publication Critical patent/RU2522020C1/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ иерархического кодирования звука, включающий следующее:выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и по

Claims (18)

1. Способ иерархического кодирования звука, включающий следующее:
выполнение обнаружения транзиентов (переходных процессов) на звуковом сигнале текущего кадра;
если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнение временно-частотного преобразования для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделение звукового сигнала на M субкадров, выполение на каждом субкадре временно-частотного преобразования, M групп коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра; перестановка коэффициентов полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазонов кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, а затем квантование и кодирование коэффициентов частотной области базового уровня для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с числами распределения битов и индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем квантование и кодирование сигналов кодирования расширенного уровня для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированные биты коэффициентов частотной области базового уровня и кодированные биты сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
2. Способ по п.1, где, если обнаружение транзиентов должно быть переходным сигналом, и коэффициенты частотной области переставляют, коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких, в пределах базового уровня и в пределах расширенного уровня соответственно.
3. Способ по п.2, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставленных в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
4. Способ по п.1 или 2, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 15 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
5. Способ по п.1, включающий также следующее: если обнаружение транзиентов должно быть установившимся сигналом,
на индексах квантования огибающей амплитуды поддиапазонов кодирования базового уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования базового уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования базового уровня; и
на индексах квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, полученных квантованием, выполняют кодирование по методу Хаффмана, и если общее число битов, израсходованных после кодирования по методу Хаффмана, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, меньше общего числа битов, израсходованных после натурального кодирования, выполненного на индексах квантования огибающей амплитуды всех поддиапазонов кодирования расширенного уровня, используют кодирование по методу Хаффмана, в противном случае используют натуральное кодирование, и устанавливают флажок кодирования по методу Хаффмана огибающей амплитуды поддиапазонов кодирования расширенного уровня.
6. Способ по п.1, где квантование и кодирование коэффициентов частотной области базового уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования базового уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы; и
квантование и кодирование сигналов кодирования расширенного уровня, включает:
выполнение кодирования по методу Хаффмана на всех индексах квантования расширенного уровня, полученных с использованием пирамидально-решетчатого векторного квантования;
если общее число битов, израсходованных после кодирования по методу Хаффмана на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, меньше общего числа битов, израсходованных после натурального кодирования на всех индексах квантования, полученных с использованием пирамидально-решетчатого векторного квантования, используют кодирование по методу Хаффмана, корректируют числа распределения битов поддиапазонов кодирования, используя биты, сэкономленных кодированием по методу Хаффмана, число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и кодирование по методу Хаффмана на поддиапазонах кодирования, для которых числа распределения битов откорректированы; в противном случае используют натуральное кодирование, корректируют числа распределения битов поддиапазонов кодирования, используя число битов, оставшихся после первого распределения битов, и общее число битов, сэкономленных кодированием всех поддиапазонов кодирования, в которых число битов, выделенных одному коэффициенту частотной области, равно 1 или 2, и снова выполняют векторное квантование и натуральное кодирование на поддиапазонах кодирования, для которых числа распределения битов откорректированы.
7. Способ иерархического декодирования звука, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; если информация обнаружения транзиентов указывает на наличие переходного сигнала, дополнительно переставляют индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня, и выполняют распределение битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и переставляют сигналы кодирования расширенного уровня в порядке поддиапазонов и добавляют к ним коэффициенты частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
если информация обнаружения транзиентов указывает на наличие установившегося сигнала, на коэффициентах частотной области полного диапазона частот непосредственно выполняют обратное временно-частотное преобразование для получения звукового сигнала для выдачи; а если информация обнаружения транзиентов указывает на наличие переходного сигнала, коэффициенты частотной области полного диапазона частот переставляют, затем разделяют их на M групп коэффициентов частотной области, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
8. Способ по п.7, где, если информация обнаружения транзиентов указывает на наличие переходного сигнала, перестановка коэффициентов частотной области полного диапазона частот, включает: перестановка коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, и затем M групп коэффициентов частотной области переставляют в порядке субкадров.
9. Способ иерархического кодирования звука для переходных сигналов, включающий следующее:
разделение звукового сигнала на M субкадров, на каждом субкадре выполняют временно-частотное преобразование, M группами коэффициентов частотной области, которые получают путем преобразования, создают коэффициенты полной частотной области текущего кадра, коэффициенты полной частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды и кодированных битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
выполнение распределения на поддиапазонах кодирования базового уровня битов в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, и затем коэффициенты частотной области базового уровня квантуют и кодируют для получения кодированных битов коэффициентов частотной области базового уровня;
обратное квантование вышеописанных коэффициентов частотной области на базовом уровне, на которых выполняют векторное квантование, и выполнение расчета разности относительно первоначальных коэффициентов частотной области, полученных после выполнения временно-частотного преобразования, для получения разностных сигналов базового уровня;
расчет индексов квантования огибающей амплитуды поддиапазонов кодирования разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов поддиапазонов кодирования базового уровня;
выполнение распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня, и затем сигналы кодирования расширенного уровня квантуют и кодируют для получения кодированных битов сигналов кодирования расширенного уровня, где сигналы кодирования расширенного уровня состоят из разностных сигналов базового уровня и коэффициентов частотной области расширенного уровня; и
мультиплексирование и пакетирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и расширенного уровня, кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня, а затем передача в конец декодирования.
10. Способ по п.9, где коэффициенты частотной области переставляют, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня соответственно.
11. Способ по п.10, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
12. Способ по п.9 и 10, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 11 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
13. Способ иерархического декодирования для переходных сигналов, включающий следующее:
демультиплексирование потока битов, переданного концом кодирования, декодирование кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня для получения индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, перестановка индексов квантования огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня соответственно, так что соответствующие им частоты выстраиваются от низких до высоких в соответствующих уровнях;
выполнение распределения битов на поддиапазонах кодирования базового уровня в соответствии с переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, таким образом рассчитывают индексы квантования огибающей амплитуды разностных сигналов базового уровня;
выполнение распределения битов на поддиапазонах кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и переставленными индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня;
декодирование кодированных битов коэффициентов частотной области базового уровня и кодированных битов сигналов кодирования расширенного уровня соответственно в соответствии с числами распределения битов поддиапазонов кодирования базового уровня и поддиапазонов кодирования сигналов кодирования расширенного уровня для получения коэффициентов частотной области базового уровня и сигналов кодирования расширенного уровня, и перестановка сигналов кодирования расширенного уровня в порядке поддиапазонов и добавление к ним коэффициентов частотной области базового уровня для получения коэффициентов частотной области полного диапазона частот; и
перестановка коэффициентов частотной области полного диапазона частот, а затем разделение на M групп, на каждой группе коэффициентов частотной области выполняют обратное временно-частотное преобразование, и выполняют расчет для получения окончательного звукового сигнала в соответствии с M группами сигналов временной области, которые получают путем преобразования.
14. Способ по п.13, где стадия, на которой переставляют коэффициенты частотной области полного диапазона частот, включает: расположение коэффициентов частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот в соответствующих субкадрах, для получения M групп коэффициентов частотной области, а затем M групп коэффициентов частотной области располагают в порядке субкадров.
15. Система иерархического кодирования звука, содержащая:
устройство генерирования коэффициентов частотной области, устройство расчета огибающей амплитуды, устройство квантования и кодирования огибающей амплитуды, устройство распределения битов базового уровня, устройство векторного квантования и кодирования коэффициентов частотной области базового уровня, и мультиплексор потока битов; и содержащая также: устройство обнаружения транзиентов, устройство генерирования сигналов кодирования расширенного уровня, устройство генерирования огибающей амплитуды разностных сигналов, устройство распределения битов расширенного уровня, и устройство векторного квантования и кодирования сигналов кодирования расширенного уровня; где
устройство обнаружения транзиентов предназначено для выполнения обнаружения транзиентов на звуковом сигнале текущего кадра;
устройство генерирования коэффициентов частотной области соединено с устройством обнаружения транзиентов, и предназначено для того чтобы: если обнаружение транзиентов должно быть установившимся сигналом, на звуковом сигнале выполнять временно-частотное преобразование для получения коэффициентов полной частотной области; если обнаружение транзиентов должно быть переходным сигналом, разделять звуковой сигнал на M субкадров, на каждом субкадре выполнять временно-частотное преобразование, создавать коэффициенты полной частотной области текущего кадра M группами коэффициентов частотной области, полученными путем преобразования, переставлять коэффициенты полной частотной области, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, где коэффициенты полной частотной области содержат коэффициенты частотной области базового уровня и коэффициенты частотной области расширенного уровня, поддиапазоны кодирования содержат поддиапазоны кодирования базового уровня и поддиапазоны кодирования расширенного уровня, коэффициенты частотной области базового уровня создают несколько поддиапазонов кодирования базового уровня, и коэффициенты частотной области расширенного уровня создают несколько поддиапазонов кодирования расширенного уровня;
устройство расчета огибающей амплитуды соединено с устройством генерирования коэффициентов частотной области, и предназначено для расчета значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня;
устройство квантования и кодирования огибающей амплитуды соединено с устройством расчета огибающей амплитуды и устройством обнаружения транзиентов, и предназначено для квантования и кодирования значений огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня, для получения индексов квантования огибающей амплитуды и кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня; где, если сигнал представляет собой установившийся сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня квантованы совместно, а если сигнал представляет собой переходной сигнал, значения огибающей амплитуды поддиапазонов кодирования базового уровня и поддиапазонов кодирования расширенного уровня кодированных битов квантованы отдельно соответственно, и индексы квантования огибающей амплитуды поддиапазонов кодирования базового уровня и индексы квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня переставляют соответственно;
устройство распределения битов базового уровня соединено с устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня для получения числа распределения битов поддиапазонов кодирования базового уровня;
устройство векторного квантования и кодирования коэффициентов частотной области базового уровня соединено с устройством генерирования коэффициентов частотной области, устройством квантования и кодирования огибающей амплитуды и устройством распределения битов базового уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на коэффициентах частотной области поддиапазонов кодирования базового уровня, используя числа распределения битов поддиапазонов кодирования базового уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования базового уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня, для получения кодированных битов коэффициентов частотной области базового уровня;
устройство генерирования сигналов кодирования расширенного уровня соединено с устройством генерирования коэффициентов частотной области и устройством векторного квантования и кодирования коэффициентов частотной области базового уровня и предназначено для генерирования разностных сигналов базового уровня для получения сигналов кодирования расширенного уровня, включающих разностные сигналы базового уровня и коэффициенты частотной области расширенного уровня;
устройство генерирования огибающей амплитуды разностных сигналов соединено с устройством квантования и кодирования огибающей амплитуды и устройство распределения битов базового уровня и предназначено для получения индексов квантования огибающей амплитуды разностных сигналов базового уровня в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования базового уровня и числами распределения битов соответствующих поддиапазонов кодирования базового уровня;
устройство распределения битов расширенного уровня соединено с устройством генерирования огибающей амплитуды разностных сигналов и устройством квантования и кодирования огибающей амплитуды и предназначено для выполнения распределения битов на поддиапазонах кодирования сигналов кодирования расширенного уровня в соответствии с индексами квантования огибающей амплитуды разностных сигналов базового уровня и индексами квантования огибающей амплитуды поддиапазонов кодирования расширенного уровня для получения чисел распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня;
устройство векторного квантования и кодирования сигналов кодирования расширенного уровня соединено с устройством квантования и кодирования огибающей амплитуды, устройством распределения битов расширенного уровня, устройством генерирования огибающей амплитуды разностных сигналов и устройством генерирования сигналов кодирования расширенного уровня и предназначено для того чтобы: выполнять нормализацию, векторное квантование и кодирование на сигналах кодирования расширенного уровня, используя числа распределения битов поддиапазонов кодирования сигналов кодирования расширенного уровня и квантованные значения огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, восстановленные в соответствии с индексами квантования огибающей амплитуды поддиапазонов кодирования сигналов кодирования расширенного уровня, для получения кодированных битов сигналов кодирования расширенного уровня;
мультиплексор потока битов соединен с устройством квантования и кодирования огибающей амплитуды, устройством векторного квантования и кодирования коэффициентов частотной области базового уровня, устройством векторного квантования и кодирования сигналов кодирования расширенного уровня и предназначен для пакетирования битов дополнительной информации базового уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования базового уровня, кодированных битов коэффициентов частотной области базового уровня, битов дополнительной информации расширенного уровня, кодированных битов огибающей амплитуды поддиапазонов кодирования расширенного уровня и кодированных битов сигналов кодирования расширенного уровня.
16. Система по п.15, где устройство генерирования коэффициентов частотной области предназначено также для того чтобы: при перестановке коэффициентов частотной области переставлять коэффициенты частотной области соответственно, так что соответствующие им поддиапазоны кодирования выстроены от низких частот до высоких частот, в пределах базового уровня и в пределах расширенного уровня.
17. Система по п.16, где, когда перестановка соответственно в базовом уровне и расширенном уровне, если коэффициентов частотной области, оставшихся в группе, недостаточно для создания одного поддиапазона, тогда выполняют дополнение, используя коэффициенты частотной области с одинаковыми или подобными частотами в следующей группе коэффициентов частотной области.
18. Система по п.15 или 16, где индексы коэффициентов частотной области в поддиапазонах кодирования после перестановки следующие:
Порядковый номер поддиапазона Индекс начального коэффициента частотной области (LIndex) Индекс конечного коэффициента частотной области (HIndex) 0 0 15 1 160 175 2 320 335 3 480 495 4 16 31 5 176 191 6 336 351 7 496 511 8 32 47 9 192 207 10 352 367 11 512 527 12 48 63 13 208 223 14 368 383 15 528 543 16 64, 65, 66, 67, 68, 69, 70, 71, 224, 225, 226, 227, 228, 229, 230, 231 17 384, 385, 386, 387, 388, 389, 390, 391, 544, 545, 546, 547, 548, 549, 550, 551 18 72 87 19 232 247 20 392 407 21 552 567 22 88 103 23 248 263 24 408 423 25 568 583 26 104 135 27 264 295 28 424 455 29 584 615
RU2012136397/08A 2010-04-13 2011-01-12 Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала RU2522020C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2010101455311A CN102222505B (zh) 2010-04-13 2010-04-13 可分层音频编解码方法系统及瞬态信号可分层编解码方法
CN201010145531.1 2010-04-13
PCT/CN2011/070206 WO2011127757A1 (zh) 2010-04-13 2011-01-12 可分层音频编解码方法和系统及瞬态信号可分层编解码方法

Publications (2)

Publication Number Publication Date
RU2012136397A true RU2012136397A (ru) 2014-05-20
RU2522020C1 RU2522020C1 (ru) 2014-07-10

Family

ID=44779039

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012136397/08A RU2522020C1 (ru) 2010-04-13 2011-01-12 Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала

Country Status (6)

Country Link
US (1) US8874450B2 (ru)
EP (1) EP2528057B1 (ru)
CN (1) CN102222505B (ru)
BR (1) BR112012021359B1 (ru)
RU (1) RU2522020C1 (ru)
WO (1) WO2011127757A1 (ru)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3051552C (en) * 2011-04-20 2021-09-21 Panasonic Intellectual Property Corporation Of America Device and method for execution of huffman coding
SG194945A1 (en) 2011-05-13 2013-12-30 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
EP3561808B1 (en) 2013-02-05 2021-03-31 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for controlling audio frame loss concealment
SG11201506543WA (en) * 2013-02-20 2015-09-29 Fraunhofer Ges Forschung Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion
US9560386B2 (en) * 2013-02-21 2017-01-31 Mozilla Corporation Pyramid vector quantization for video coding
US9665541B2 (en) 2013-04-25 2017-05-30 Mozilla Corporation Encoding video data using reversible integer approximations of orthonormal transforms
KR101803410B1 (ko) 2013-12-02 2017-12-28 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
RU2662693C2 (ru) 2014-02-28 2018-07-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
US10410645B2 (en) 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
SG10201808274UA (en) 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
ES2586712T3 (es) * 2014-07-28 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Búsqueda de forma de cuantificador de vector en pirámide
FR3024581A1 (fr) 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
EP2993665A1 (en) * 2014-09-02 2016-03-09 Thomson Licensing Method and apparatus for coding or decoding subband configuration data for subband groups
CN111951814B (zh) * 2014-09-04 2025-03-07 索尼公司 传输设备、传输方法、接收设备以及接收方法
EP4601259A3 (en) * 2014-09-30 2025-09-24 Sony Group Corporation Transmitting device, transmission method, receiving device, and receiving method
KR102362788B1 (ko) 2015-01-08 2022-02-15 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 프레임 생성 장치 및 방송 신호 프레임 생성 방법
CA3062640C (en) 2015-01-08 2022-04-26 Electronics And Telecommunications Research Institute An apparatus and method for broadcast signal reception using layered divisional multiplexing
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
WO2018109143A1 (en) * 2016-12-16 2018-06-21 Telefonaktiebolaget Lm Ericsson (Publ) Methods, encoder and decoder for handling envelope representation coefficients
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
WO2020253941A1 (en) 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN113129910B (zh) * 2019-12-31 2024-07-30 华为技术有限公司 音频信号的编解码方法和编解码装置
CN114945981B (zh) * 2020-06-24 2025-08-08 华为技术有限公司 一种音频信号处理方法和装置
CN115691521A (zh) * 2021-07-29 2023-02-03 华为技术有限公司 一种音频信号的编解码方法和装置
CN119274562A (zh) * 2022-06-15 2025-01-07 腾讯科技(深圳)有限公司 音频编码及解码方法、装置、设备、介质及程序产品

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6658382B1 (en) * 1999-03-23 2003-12-02 Nippon Telegraph And Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
EP1088304A1 (en) * 1999-04-05 2001-04-04 Hughes Electronics Corporation A frequency domain interpolative speech codec system
US6260017B1 (en) * 1999-05-07 2001-07-10 Qualcomm Inc. Multipulse interpolative coding of transition speech frames
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
MXPA03010237A (es) * 2001-05-10 2004-03-16 Dolby Lab Licensing Corp Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido.
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
US20070033014A1 (en) * 2003-09-09 2007-02-08 Koninklijke Philips Electronics N.V. Encoding of transient audio signal components
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
WO2007063913A1 (ja) * 2005-11-30 2007-06-07 Matsushita Electric Industrial Co., Ltd. サブバンド符号化装置およびサブバンド符号化方法
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
ATE548727T1 (de) * 2007-03-02 2012-03-15 Ericsson Telefon Ab L M Nachfilter für geschichtete codecs
JP5140730B2 (ja) * 2007-08-27 2013-02-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
CN101414864B (zh) * 2008-12-08 2013-01-30 华为技术有限公司 多天线分层预编码的方法及装置

Also Published As

Publication number Publication date
US8874450B2 (en) 2014-10-28
EP2528057B1 (en) 2016-04-06
EP2528057A4 (en) 2014-08-06
BR112012021359A2 (pt) 2017-08-15
US20120323582A1 (en) 2012-12-20
WO2011127757A1 (zh) 2011-10-20
EP2528057A1 (en) 2012-11-28
CN102222505B (zh) 2012-12-19
CN102222505A (zh) 2011-10-19
RU2522020C1 (ru) 2014-07-10
BR112012021359B1 (pt) 2020-12-15
HK1179402A1 (en) 2013-09-27

Similar Documents

Publication Publication Date Title
RU2012136397A (ru) Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала
JP6518361B2 (ja) オーディオ/音声符号化方法およびオーディオ/音声符号化装置
RU2224302C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US9269372B2 (en) Adaptive transition frequency between noise fill and bandwidth extension
US8694325B2 (en) Hierarchical audio coding, decoding method and system
ES3037836T3 (en) Audio encoding device and method
CN103778918B (zh) 音频信号的比特分配的方法和装置
CN104737227B (zh) 语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
JP2008547043A (ja) スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック
ES2664090T3 (es) Relleno de subvectores no codificados en señales de audio codificadas por transformada
BRPI0514650B1 (pt) Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
KR20110110044A (ko) 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
KR102299916B1 (ko) 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
CN102157153B (zh) 多声道信号编码、解码方法、装置及编解码系统
KR20170047361A (ko) 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치
CN101572586B (zh) 编解码方法、装置及系统
CN102479514A (zh) 一种编码方法、解码方法、装置和系统
EP4539045A1 (en) Audio encoding and decoding method and apparatus, storage medium, and computer program product
Atlas et al. Modulation frequency and efficient audio coding
CN101290771B (zh) 一种基于先进音频编码器的比特消耗控制方法
WO2024179055A1 (zh) 音频编解码方法及相关装置
Hansen et al. Fine-grain scalable audio coding based on envelope restoration and the SPIHT algorithm
KR101325760B1 (ko) 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법
Johansen et al. Fine-granular scalable and error resilient audio coding by tree-structured quantization