RU2014102965A - Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала - Google Patents
Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала Download PDFInfo
- Publication number
- RU2014102965A RU2014102965A RU2014102965/08A RU2014102965A RU2014102965A RU 2014102965 A RU2014102965 A RU 2014102965A RU 2014102965/08 A RU2014102965/08 A RU 2014102965/08A RU 2014102965 A RU2014102965 A RU 2014102965A RU 2014102965 A RU2014102965 A RU 2014102965A
- Authority
- RU
- Russia
- Prior art keywords
- residual vector
- indicator
- sign
- audio
- encoder
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L19/00—Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
- G01L19/02—Arrangements for preventing, or for compensating for, effects of inclination or acceleration of the measuring device; Zero-setting means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ кодирования временного сегмента аудиосигнала в аудиокодере с преобразованием, причем способ содержит этапы, на которых:- выводят (404) указатель, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;- выводят (406) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;- определяют (412), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;- кодируют амплитуду коэффициентов остаточного вектора; и- кодируют (408) знак коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.2. Способ по п. 1, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.3. Способ по п. 1 или 2, в котором предварительно заданный критерий сформулирован как:где ωи ωявляются коэффициентами масштабирования; и θ является порогом, который зависит от скорости b передачи битовкодера.4. Способ по п. 3, в котором коэффициенты ωи ωмасштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.5. Способ по п.1, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.6. Способ по п.1, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной ча�
Claims (26)
1. Способ кодирования временного сегмента аудиосигнала в аудиокодере с преобразованием, причем способ содержит этапы, на которых:
- выводят (404) указатель, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- выводят (406) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;
- определяют (412), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- кодируют амплитуду коэффициентов остаточного вектора; и
- кодируют (408) знак коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.
2. Способ по п. 1, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.
4. Способ по п. 3, в котором коэффициенты ω1 и ω2 масштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.
5. Способ по п.1, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.
6. Способ по п.1, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов кодера.
8. Аудиокодер с преобразованием для кодирования временного сегмента аудиосигнала, причем упомянутый кодер содержит:
- блок (506) вывода, выполненный для вывода указателя, z, положения на частотной шкале остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала, и для вывода показателя, Φ, относящегося к распределению энергии по частоте остаточного вектора;
- блок (508) определения, выполненный для определения,
удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала; и
- блок (510) кодирования, выполненный для кодирования амплитуды коэффициентов остаточного вектора и для кодирования знака коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно.
9. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для вывода показателя, Φ, в качестве так называемого показателя спектральной неравномерности.
11. Аудиокодер с преобразованием по п. 8, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов кодера.
12. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для вывода показателя, Φ, только когда указатель, z, указывает частоты выше предварительно заданной переходной
частоты Zc, которая зависит от скорости b передачи битов кодера.
13. Аудиокодер с преобразованием по п. 8, дополнительно выполненный для использования схемы факториального импульсного кодирования, FPC, для кодирования остаточного вектора, при этом показатель ΦFPC выводится как:
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
14. Способ декодирования кодированного временного сегмента аудиосигнала в аудиодекодере с преобразованием, причем способ содержит этапы, на которых:
- декодируют (603) амплитуды коэффициентов остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- выводят (604) указатель, z, положения на частотной шкале остаточного вектора;
- выводят (606) показатель, Φ, относящийся к распределению энергии по частоте остаточного вектора;
- определяют (612), удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- декодируют (608) соответствующий знак ненулевых коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно; и
- генерируют соответствующий произвольный знак для ненулевых коэффициентов остаточного вектора, когда определено, что критерий не удовлетворен и, таким образом, что изменение знака будет не слышно.
15. Способ по п. 14, в котором показатель, Φ, является так называемым показателем спектральной неравномерности.
17. Способ по п. 16, в котором коэффициенты ω1 и ω2 масштабирования, по меньшей мере частично, выводят из эмпирических данных восприятия.
18. Способ по п. 14, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов декодера.
19. Способ по п. 14, в котором показатель, Φ, выводят (410), только когда указатель, z, указывает (406) частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов декодера.
20. Способ по п. 14, в котором схема факториального импульсного кодирования, FPC, используется для декодирования остаточного вектора, при этом показатель ΦFPC выводят как:
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
21. Аудиодекодер с преобразованием для декодирования кодированного временного сегмента аудиосигнала, причем упомянутый декодер содержит:
- блок (710) декодирования, выполненный для декодирования амплитуд коэффициентов остаточного вектора сегмента вектора преобразования, ассоциированного с временным сегментом аудиосигнала;
- блок (706) вывода, выполненный для вывода указателя, z, положения на частотной шкале остаточного вектора и для вывода показателя, Φ, относящегося к распределению энергии по частоте остаточного вектора;
- блок (708) определения, выполненный для определения, удовлетворен ли предварительно заданный критерий, предусматривающий показатель Φ, указатель z и предварительно заданный порог θ, таким образом оценивая, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала;
- блок (710) декодирования, дополнительно выполненный для декодирования знака ненулевых коэффициентов остаточного вектора, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно; и
- генератор (712) знаков, выполненный для генерирования соответствующего произвольного знака для ненулевых коэффициентов остаточного вектора, когда определено, что критерий не удовлетворен и, таким образом, что изменение знака будет не слышно.
22. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для вывода показателя, Φ, в качестве так называемого показателя спектральной неравномерности.
24. Аудиодекодер с преобразованием по п. 21, в котором порог θ выполнен с возможностью увеличения при увеличенной скорости b передачи битов декодера.
25. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для вывода показателя, Φ, только когда указатель, z, указывает частоты выше предварительно заданной переходной частоты Zc, которая зависит от скорости b передачи битов декодера.
26. Аудиодекодер с преобразованием по п. 21, дополнительно выполненный для использования схемы факториального импульсного кодирования, FPC, для декодирования остаточного вектора, при этом показатель ΦFPC выводится как:
где NNZP является числом ненулевых положений в остаточном векторе, и NTP является суммарным числом импульсов в остаточном векторе.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/SE2011/050889 WO2013002696A1 (en) | 2011-06-30 | 2011-06-30 | Transform audio codec and methods for encoding and decoding a time segment of an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2014102965A true RU2014102965A (ru) | 2015-08-10 |
RU2574851C2 RU2574851C2 (ru) | 2016-02-10 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
CN103620674B (zh) | 2016-02-24 |
BR112013031816A2 (pt) | 2016-12-13 |
US8831959B2 (en) | 2014-09-09 |
US20140114667A1 (en) | 2014-04-24 |
US20130006646A1 (en) | 2013-01-03 |
CN103620674A (zh) | 2014-03-05 |
US9546924B2 (en) | 2017-01-17 |
EP2727105B1 (en) | 2015-08-12 |
EP2727105A1 (en) | 2014-05-07 |
WO2013002696A1 (en) | 2013-01-03 |
BR112013031816B1 (pt) | 2021-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CY1119264T1 (el) | Μεθοδος για αποκωδικοποιηση εντροπιας συντελεστων μετασχηματισμου | |
RU2017103905A (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
MX355448B (es) | Aparato y método para codificar y decodificar una señal de audio con relleno inteligente de separaciones en el dominio espectral. | |
RU2017101574A (ru) | Системы и способы для оптимизации параметра модели в основанном на трехмерном представлении отображении цветов | |
MY165529A (en) | Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order | |
MY166069A (en) | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block | |
MX2011011399A (es) | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. | |
MY184661A (en) | Mdct-based complex prediction stereo coding | |
SG10201806824WA (en) | Video encoding method and apparatus using transformation unit of variable tree structure, and video decoding method and apparatus | |
EP2698789A3 (en) | Audio decoder and decoding method using efficient downmixing | |
MY154100A (en) | Method and apparatus to encode and decode an audio/speech signal | |
RU2012127132A (ru) | Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи | |
RU2012141241A (ru) | Аудиокодер, аудиодекодер, способ кодирования и декодирования аудиоинформации и компьютерная программа, определяющая значение поддиапазона контекста на основе нормы ранее декодированных спектральных значений | |
RU2013143162A (ru) | Кодирующее устройство, способ кодирования и программа | |
MX2012010469A (es) | Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo. | |
MX2011008685A (es) | Codificador, decodificador y metodo para los mismos. | |
ATE394901T1 (de) | Mehrkanal-synthesizer und verfahren zum erzeugen eines mehrkanal-ausgangssignals | |
IN2014CN03430A (ru) | ||
RU2009133417A (ru) | Кодирование аудиосигнала | |
IN2014KN01222A (ru) | ||
ATE509347T1 (de) | Vorrichtung und verfahren zum codieren eines informationssignals | |
CA2854074C (en) | Method and apparatus for determining context model of transform coefficient level in entropy coding and decoding | |
MX2015009747A (es) | Decodificador para generar una señal de audio mejorada en frecuencia, metodo de decodificacion, codificador para generar una señal codificada y metodo de codificacion utilizando informacion secundaria de seleccion compacta. | |
GB2466674B (en) | Speech coding | |
ATE547787T1 (de) | Verarbeitung von erregungen bei der audiokodierung und -dekodierung |