RU2014102965A - Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала - Google Patents

Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала Download PDF

Info

Publication number
RU2014102965A
RU2014102965A RU2014102965/08A RU2014102965A RU2014102965A RU 2014102965 A RU2014102965 A RU 2014102965A RU 2014102965/08 A RU2014102965/08 A RU 2014102965/08A RU 2014102965 A RU2014102965 A RU 2014102965A RU 2014102965 A RU2014102965 A RU 2014102965A
Authority
RU
Russia
Prior art keywords
residual vector
indicator
sign
audio
encoder
Prior art date
Application number
RU2014102965/08A
Other languages
English (en)
Other versions
RU2574851C2 (ru
Inventor
Володя ГРАНЧАРОВ
Сигурдур СВЕРРИССОН
Original Assignee
Телефонактиеболагет Лм Эрикссон (Пабл)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Телефонактиеболагет Лм Эрикссон (Пабл) filed Critical Телефонактиеболагет Лм Эрикссон (Пабл)
Publication of RU2014102965A publication Critical patent/RU2014102965A/ru
Application granted granted Critical
Publication of RU2574851C2 publication Critical patent/RU2574851C2/ru

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L19/00Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
    • G01L19/02Arrangements for preventing, or for compensating for, effects of inclination or acceleration of the measuring device; Zero-setting means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ кодирования временного сегмента аудиосигнала в аудиокодере с преобразованием, причем способ содержит этапы, на которых:- выводят (404) указатель, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;- выводят (406) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;- определяют (412), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;- кодируют амплитуду коэффициентов остаточного вектора; и- кодируют (408) знак коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.2. Способ по п. 1, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.3. Способ по п. 1 или 2, в котором предварительно заданный критерий сформулирован как:где ωи ωявляются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битовкодера.4. Способ по п. 3, в котором коэффициенты ωи ωмасштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.5. Способ по п.1, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.6. Способ по п.1, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной ча�

Claims (26)

1. Способ кодирования временного сегмента аудиосигнала в аудиокодере с преобразованием, причем способ содержит этапы, на которых:
- выводят (404) указатель, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- выводят (406) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;
- определяют (412), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- кодируют амплитуду коэффициентов остаточного вектора; и
- кодируют (408) знак коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.
2. Способ по п. 1, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.
3. Способ по п. 1 или 2, в котором предварительно заданный критерий сформулирован как:
Figure 00000001
где ω1 и ω2 являются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битов
кодера.
4. Способ по п. 3, в котором коэффициенты ω1 и ω2 масштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.
5. Способ по п.1, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.
6. Способ по п.1, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов кодера.
7. Способ по п.1, в котором схема факториального импульсного кодирования, FPC, используется для кодирования остаточного вектора, при этом показатель ΦFPC выводят как:
Figure 00000002
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
8. Аудиокодер с преобразованием для кодирования временного сегмента аудиосигнала, причем упомянутый кодер содержит:
- блок (506) вывода, выполненный для вывода указателя, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала, и для вывода показателя, Φ, относящегося к распределению энергии по частоте остаточного вектора;
- блок (508) определения, выполненный для определения,
удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала; и
- блок (510) кодирования, выполненный для кодирования амплитуды коэффициентов остаточного вектора и для кодирования знака коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.
9. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для вывода показателя, Φ, в качестве так называемого показателя спектральной неравномерности.
10. Аудиокодер с преобразованием по п. 8, в котором предварительно заданный критерий сформулирован как:
Figure 00000003
где ω1 и ω2 являются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битов кодера.
11. Аудиокодер с преобразованием по п. 8, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.
12. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для вывода показателя, Φ, только когда указатель, z, указывает частоты выше предварительно заданной переходной
частоты Zc, которая зависит от скорости b передачи битов кодера.
13. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для использования схемы факториального импульсного кодирования, FPC, для кодирования остаточного вектора, при этом показатель ΦFPC выводится как:
Figure 00000004
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
14. Способ декодирования кодированного временного сегмента аудиосигнала в аудиодекодере с преобразованием, причем способ содержит этапы, на которых:
- декодируют (603) амплитуды коэффициентов остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- выводят (604) указатель, z, положения на частотной шкале остаточного вектора;
- выводят (606) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;
- определяют (612), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- декодируют (608) соответствующий знак ненулевых коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно; и
- генерируют соответствующий произвольный знак для ненулевых коэффициентов остаточного вектора, когда определено, что критерий не удовлетворен и, таким образом, что изменение знака будет не слышно.
15. Способ по п. 14, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.
16. Способ по п. 14, в котором предварительно заданный критерий сформулирован как:
Figure 00000005
где ω1 и ω2 являются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битов декодера.
17. Способ по п. 16, в котором коэффициенты ω1 и ω2 масштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.
18. Способ по п. 14, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов декодера.
19. Способ по п. 14, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов декодера.
20. Способ по п. 14, в котором схема факториального импульсного кодирования, FPC, используется для декодирования остаточного вектора, при этом показатель ΦFPC выводят как:
Figure 00000006
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
21. Аудиодекодер с преобразованием для декодирования кодированного временного сегмента аудиосигнала, причем упомянутый декодер содержит:
- блок (710) декодирования, выполненный для декодирования амплитуд коэффициентов остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- блок (706) вывода, выполненный для вывода указателя, z, положения на частотной шкале остаточного вектора и для вывода показателя, Φ, относящегося к распределению энергии по частоте остаточного вектора;
- блок (708) определения, выполненный для определения, удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- блок (710) декодирования, дополнительно выполненный для декодирования знака ненулевых коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно; и
- генератор (712) знаков, выполненный для генерирования соответствующего произвольного знака для ненулевых коэффициентов остаточного вектора, когда определено, что критерий не удовлетворен и, таким образом, что изменение знака будет не слышно.
22. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для вывода показателя, Φ, в качестве так называемого показателя спектральной неравномерности.
23. Аудиодекодер с преобразованием по п. 21, в котором предварительно заданный критерий сформулирован как:
Figure 00000007
где ω1 и ω2 являются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битов декодера.
24. Аудиодекодер с преобразованием по п. 21, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов декодера.
25. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для вывода показателя, Φ, только когда указатель, z, указывает частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов декодера.
26. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для использования схемы факториального импульсного кодирования, FPC, для декодирования остаточного вектора, при этом показатель ΦFPC выводится как:
Figure 00000008
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
RU2014102965/08A 2011-06-30 Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала RU2574851C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2011/050889 WO2013002696A1 (en) 2011-06-30 2011-06-30 Transform audio codec and methods for encoding and decoding a time segment of an audio signal

Publications (2)

Publication Number Publication Date
RU2014102965A true RU2014102965A (ru) 2015-08-10
RU2574851C2 RU2574851C2 (ru) 2016-02-10

Family

ID=

Also Published As

Publication number Publication date
CN103620674B (zh) 2016-02-24
BR112013031816A2 (pt) 2016-12-13
US8831959B2 (en) 2014-09-09
US20140114667A1 (en) 2014-04-24
US20130006646A1 (en) 2013-01-03
CN103620674A (zh) 2014-03-05
US9546924B2 (en) 2017-01-17
EP2727105B1 (en) 2015-08-12
EP2727105A1 (en) 2014-05-07
WO2013002696A1 (en) 2013-01-03
BR112013031816B1 (pt) 2021-03-30

Similar Documents

Publication Publication Date Title
CY1119264T1 (el) Μεθοδος για αποκωδικοποιηση εντροπιας συντελεστων μετασχηματισμου
RU2017103905A (ru) Улучшение классификации между кодированием во временной области и кодированием в частотной области
MX355448B (es) Aparato y método para codificar y decodificar una señal de audio con relleno inteligente de separaciones en el dominio espectral.
RU2017101574A (ru) Системы и способы для оптимизации параметра модели в основанном на трехмерном представлении отображении цветов
MY165529A (en) Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order
MY166069A (en) Method and apparatus for encoding residual block, and method and apparatus for decoding residual block
MX2011011399A (es) Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
MY184661A (en) Mdct-based complex prediction stereo coding
SG10201806824WA (en) Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus
EP2698789A3 (en) Audio decoder and decoding method using efficient downmixing
MY154100A (en) Method and apparatus to encode and decode an audio/speech signal
RU2012127132A (ru) Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
RU2012141241A (ru) Аудиокодер, аудиодекодер, способ кодирования и декодирования аудиоинформации и компьютерная программа, определяющая значение поддиапазона контекста на основе нормы ранее декодированных спектральных значений
RU2013143162A (ru) Кодирующее устройство, способ кодирования и программа
MX2012010469A (es) Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo.
MX2011008685A (es) Codificador, decodificador y metodo para los mismos.
ATE394901T1 (de) Mehrkanal-synthesizer und verfahren zum erzeugen eines mehrkanal-ausgangssignals
IN2014CN03430A (ru)
RU2009133417A (ru) Кодирование аудиосигнала
IN2014KN01222A (ru)
ATE509347T1 (de) Vorrichtung und verfahren zum codieren eines informationssignals
CA2854074C (en) Method and apparatus for determining context model of transform coefficient level in entropy coding and decoding
MX2015009747A (es) Decodificador para generar una señal de audio mejorada en frecuencia, metodo de decodificacion, codificador para generar una señal codificada y metodo de codificacion utilizando informacion secundaria de seleccion compacta.
GB2466674B (en) Speech coding
ATE547787T1 (de) Verarbeitung von erregungen bei der audiokodierung und -dekodierung