RU2012103446A - Способ и устройство кодирования и декодирования аудиосигналов (варианты) - Google Patents

Способ и устройство кодирования и декодирования аудиосигналов (варианты) Download PDF

Info

Publication number
RU2012103446A
RU2012103446A RU2012103446/08A RU2012103446A RU2012103446A RU 2012103446 A RU2012103446 A RU 2012103446A RU 2012103446/08 A RU2012103446/08 A RU 2012103446/08A RU 2012103446 A RU2012103446 A RU 2012103446A RU 2012103446 A RU2012103446 A RU 2012103446A
Authority
RU
Russia
Prior art keywords
encoding
bits
spectral coefficients
decoding
audio signal
Prior art date
Application number
RU2012103446/08A
Other languages
English (en)
Other versions
RU2505921C2 (ru
Inventor
Ми Янг КИМ
Антон Викторович ПОРОВ
Константин Сергеевич ОСИПОВ
Original Assignee
Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." filed Critical Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд."
Priority to RU2012103446/08A priority Critical patent/RU2505921C2/ru
Priority to US13/758,054 priority patent/US20130275140A1/en
Priority to KR1020130012609A priority patent/KR20130090826A/ko
Priority to PCT/KR2013/000891 priority patent/WO2013115625A1/ko
Publication of RU2012103446A publication Critical patent/RU2012103446A/ru
Application granted granted Critical
Publication of RU2505921C2 publication Critical patent/RU2505921C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ кодирования временного звукового сигнала, заключающийся в том, что входной сигнал преобразуют в спектральные коэффициенты, группируют спектральные коэффициенты в частотные полосы и оценивают нормы для каждой полосы как среднюю энергию в полосе, нормализуют спектр на основании оцененных норм, взвешивают нормы на основе психоакустических свойств звука, рассчитывают распределения бит на основании взвешенных норм, квантуют и кодируют спектр полученным количеством бит, отличающийся тем, что распределение бит рассчитывают на основании психоакустической модели, построенной по квантованным нормам.2. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором определение распределения бит основано на критерии отношения энергии сигнала к маскирующему порогу.3. Способ кодирования временного звукового сигнала в соответствии с п.2, где расчет количества импульсов основан на критерии отношения энергии сигнала к маскирующему порогу.4. Способ кодирования временного звукового сигнала в соответствии с п.3, в котором число бит определяют по формуле факториального импульсного кодирования (FPC) из известного числа импульсов.5. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором вычисляют параметры заполнения шумом для квантованных в ноль спектральных коэффициентов, с целью маскировки провалов спектра, параметры передают в поток данных.6. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором число импульсов по заданным битам в полосе определяют с помощью двухступенчатого алгоритма с низкой вычислительной сложностью.7. Способ декодирования �

Claims (26)

1. Способ кодирования временного звукового сигнала, заключающийся в том, что входной сигнал преобразуют в спектральные коэффициенты, группируют спектральные коэффициенты в частотные полосы и оценивают нормы для каждой полосы как среднюю энергию в полосе, нормализуют спектр на основании оцененных норм, взвешивают нормы на основе психоакустических свойств звука, рассчитывают распределения бит на основании взвешенных норм, квантуют и кодируют спектр полученным количеством бит, отличающийся тем, что распределение бит рассчитывают на основании психоакустической модели, построенной по квантованным нормам.
2. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором определение распределения бит основано на критерии отношения энергии сигнала к маскирующему порогу.
3. Способ кодирования временного звукового сигнала в соответствии с п.2, где расчет количества импульсов основан на критерии отношения энергии сигнала к маскирующему порогу.
4. Способ кодирования временного звукового сигнала в соответствии с п.3, в котором число бит определяют по формуле факториального импульсного кодирования (FPC) из известного числа импульсов.
5. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором вычисляют параметры заполнения шумом для квантованных в ноль спектральных коэффициентов, с целью маскировки провалов спектра, параметры передают в поток данных.
6. Способ кодирования временного звукового сигнала в соответствии с п.1, в котором число импульсов по заданным битам в полосе определяют с помощью двухступенчатого алгоритма с низкой вычислительной сложностью.
7. Способ декодирования закодированного звукового сигнала, включающий: декодирование и восстановление норм, расчет распределения бит на основе восстановленных норм, декодирование спектра, и обратное преобразование спектральных коэффициентов в сигнал во временной области, отличающийся тем, что распределение бит оценивают на основе психоакустической модели, построенной по восстановленным нормам.
8. Способ декодирования закодированного звукового сигнала в соответствии с п.7, в котором параметры шума декодируют из потока данных и квантованные в ноль спектральные коэффициенты заполняют шумом с целью маскировки провалов спектра.
9. Способ декодирования закодированного звукового сигнала в соответствии с п.7, в котором число импульсов по заданным битам в полосе определяют с помощью двухступенчатого алгоритма с низкой вычислительной сложностью.
10. Способ кодирования временного звукового сигнала, заключающийся в том, что входной сигнал преобразуют в спектральные коэффициенты, группируют спектральные коэффициенты в частотные полосы и оценивают нормы для каждой полосы как среднюю энергию в полосе, нормализуют спектр па основании оцененных норм, взвешивают нормы на основе психоакустических свойств звука, рассчитывают распределения бит на основании взвешенных норм, квантуют и кодируют спектр полученным количеством бит, отличающийся тем, что распределение бит рассчитывается на основании психоакустической модели, построенной по спектральным коэффициентам.
11. Способ кодирования временного звукового сигнала в соответствии с п.10, где психоакустические свойства сигнала оценивают на основе коэффициентов модифицированною дискретного косинусного преобразования (МДКП).
12. Способ кодирования временного звукового сигнала в соответствии с п.10, в которой распределение бит квантуют и передают в качестве дополнительной информации.
13. Способ кодирования временного звуковою сигнала в соответствии с п.10, в котором определение распределения бит основано на критерии отношения энергии сигнала к маскирующему порогу.
14. Способ кодирования временного звукового сигнала в соответствии с п.13, где расчет количества импульсов основан на критерии отношения энергии сигнала к маскирующему порогу.
15. Способ кодирования временного звукового сигнала в соответствии с п.14, в котором число бит определяется по формуле факториального импульсного кодирования (FPC) из известного числа импульсов.
16. Способ кодирования временного звукового сигнала в соответствии с п.10, в котором вычисляют параметры заполнения шумом для квантованных в ноль спектральных коэффициентов, с целью маскировки провалов спектра, параметры передают в поток данных.
17. Способ кодирования временного звукового сигнала в соответствии с п.10, в котором число импульсов по заданным битам в полосе определяют с помощью двухступенчатого алгоритма с низкой вычислительной сложностью.
18. Способ декодирования закодированного звукового сигнала, включающий: декодирование и восстановление норм, расчет распределения бит на основе восстановленных норм, декодирование спектра, и обратное преобразование спектральных коэффициентов в сигнал во временной области, отличающийся тем, что распределение бит декодируют из потока данных.
19. Способ декодирования закодированного звукового сигнала в соответствии с п.18, в котором параметры шума декодируют из потока данных и квантованные в ноль спектральные коэффициенты заполняют шумом с целью маскировки провалов спектра.
20. Способ декодирования закодированного звукового сигнала в соответствии с п.18, в котором число импульсов по заданным битам в полосе определяют с помощью двухступенчатого алгоритма с низкой вычислительной сложностью.
21. Устройство для кодирования/декодирования звукового сигнала, содержащее кодер и связанный с ним декодер, в котором кодер включает в себя следующие блоки:
блок модифицированного дискретного косинусного преобразования (МДКП), выполненный с возможностью преобразования входного сигнала в спектральные коэффициенты,
блок оценки и квантования норм, выполненный с возможностью группировки спектральных коэффициентов в частотные полосы и оценки нормы для каждой полосы как средней энергии в полосе,
блок кодирования норм,
блок построения психоакустической модели по квантованным нормам, предназначенный для определения важности полос,,
первый блок расчета распределения бит, выполненный с возможностью расчета распределения бит на основе данных о важности психоакустической модели, построенной по квантованным нормам,
блок квантования и кодирования спектра, выполненный с возможностью кодирования спектра полученным числом бит,
мультиплексор для передачи кодированных данных в битовый поток;
а декодер включает в себя следующие последовательно связанные блоки:
демультиплексор, предназначенный для разбития и расшифровки данных потока,
блок декодирования норм,
блок деквантования норм,
блок построения психоакустической модели по восстановленным нормам,
второй блок расчета распределения бит, выполненный с возможностью расчета распределения бит на основе данных психоакустической модели, построенной по восстановленным нормам,
блок декодировния и деквантования спектра, выполненный с возможностью декодирования спектра с учетом информации о распределении бит,
блок масштабирования декодированных спектральных коэффициентов в соответствии с восстановленными нормами,
блок обратного преобразования спектральных коэффициентов в сигнал во временной области.
22. Устройство для кодирования/декодирования звукового сигнала по п.21, в котором кодер дополнительно содержит блок вычисления параметров шума для квантованных в ноль спектральных коэффициентов, передающий вычисленные параметры в поток данных.
23. Устройство для кодирования/декодирования звукового сигнала по п.21, в котором декодер дополнительно содержит блок подстановки шума, выполненный с возможностью восстановления подстановкой шума декодированных в ноль спектральных коэффициентов.
24. Устройство для кодирования/декодирования звукового сигнала, содержащее кодер и связанный с ним декодер, в котором кодер включает в себя следующие блоки:
блок модифицированного дискретного косинусного преобразования (МДКП), выполненный с возможностью преобразования входного сигнала в спектральные коэффициенты,
блок оценки и квантования норм, выполненный с возможностью группировки спектральных коэффициентов в частотные полосы и оценки нормы для каждой полосы как средней энергии в полосе, блок кодирования норм,
блок построения психоакустической модели по спектральным коэффициентам, предназначенный для определения важности спектральных коэффициентов,
блок расчета распределения бит, выполненный с возможностью расчета распределения бит на основе данных о важности психоакустической модели,
блок квантования и кодирования спектра, выполненный с возможностью кодирования спектра полученным числом бит,
блок кодирования распределения бит,
мультиплексор для передачи кодированных данных в битовый поток;
а декодер включает в себя следующие блоки:
демультиплексор, предназначенный для разбития и расшифровки данных потока,
блок декодирования норм,
блок деквантования норм,
блок декодирования распределения бит, на вход которого поступают данные из потока,
блок декодирования и деквантования спектра, на вход которою поступают данные о распределении бит и данные из потока,
блок нормализации декодированных спектральных коэффициентов в соответствии с восстановленными нормами,
блок обратного преобразования спектральных коэффициентов в сигнал во временной области.
25. Устройство для кодирования/декодирования звукового сигнала по п.24, в котором кодер дополнительно содержит блок вычисления параметров шума для квантованных в ноль спектральных коэффициентов, передающий вычисленные параметры в поток данных.
26. Устройство для кодирования/декодирования звукового сигнала по п.24, в котором декодер дополнительно содержит блок подстановки шума, выполненный с возможностью восстановления подстановкой шума декодированных в ноль спектральных коэффициентов.
RU2012103446/08A 2012-02-02 2012-02-02 Способ и устройство кодирования и декодирования аудиосигналов (варианты) RU2505921C2 (ru)

Priority Applications (4)

Application Number Priority Date Filing Date Title
RU2012103446/08A RU2505921C2 (ru) 2012-02-02 2012-02-02 Способ и устройство кодирования и декодирования аудиосигналов (варианты)
US13/758,054 US20130275140A1 (en) 2012-02-02 2013-02-04 Method and apparatus for processing audio signals at low complexity
KR1020130012609A KR20130090826A (ko) 2012-02-02 2013-02-04 낮은 복잡도로 오디오 신호를 처리하는 방법 및 장치
PCT/KR2013/000891 WO2013115625A1 (ko) 2012-02-02 2013-02-04 낮은 복잡도로 오디오 신호를 처리하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2012103446/08A RU2505921C2 (ru) 2012-02-02 2012-02-02 Способ и устройство кодирования и декодирования аудиосигналов (варианты)

Publications (2)

Publication Number Publication Date
RU2012103446A true RU2012103446A (ru) 2013-10-27
RU2505921C2 RU2505921C2 (ru) 2014-01-27

Family

ID=48905581

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012103446/08A RU2505921C2 (ru) 2012-02-02 2012-02-02 Способ и устройство кодирования и декодирования аудиосигналов (варианты)

Country Status (4)

Country Link
US (1) US20130275140A1 (ru)
KR (1) KR20130090826A (ru)
RU (1) RU2505921C2 (ru)
WO (1) WO2013115625A1 (ru)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2013013261A (es) * 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10580424B2 (en) 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
US11538489B2 (en) * 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6236960B1 (en) * 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
RU2427978C2 (ru) * 2006-02-21 2011-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование аудио
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
US8207875B2 (en) * 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
RU2432624C1 (ru) * 2010-04-21 2011-10-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ уменьшения объема данных при широкополосном кодировании речевого сигнала
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Also Published As

Publication number Publication date
RU2505921C2 (ru) 2014-01-27
US20130275140A1 (en) 2013-10-17
KR20130090826A (ko) 2013-08-14
WO2013115625A1 (ko) 2013-08-08

Similar Documents

Publication Publication Date Title
RU2012103446A (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
CN101425294B (zh) 声音编解码与发送接收设备及编码方法、通信终端和基站
KR101083572B1 (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
JP2018112759A (ja) オーディオ/音声符号化方法およびオーディオ/音声符号化装置
CN105556599B (zh) 频谱包络的样本值的基于上下文的熵编码、解码的装置及方法
TWI671736B (zh) 對信號的包絡進行寫碼的設備及對其進行解碼的設備
JP5695074B2 (ja) 音声符号化装置および音声復号化装置
RU2017129566A (ru) Звуковые кодирующее устройство и декодирующее устройство
RU2013151798A (ru) Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для него
JP2010538316A (ja) 改良された音声及びオーディオ信号の変換符号化
RU2014105812A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
KR101412115B1 (ko) 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법
RU2012119783A (ru) Способ и устройство иерархического кодирования/декодирования аудио
JP2008310327A5 (ru)
MX363348B (es) Codificador, descodificador y metodo para codificar y descodificar.
RU2013142349A (ru) Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи
JP2013044923A5 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
RU2017143614A (ru) Усовершенствованный квантователь
IN2015DN04001A (ru)
RU2015121716A (ru) Устройство кодирования аудио/голоса, устройство декодирования аудио//голоса, способ кодирования аудио/голоса и способ декодирования аудио/голоса
EP2772912B1 (en) Audio encoding apparatus, audio decoding apparatus, audio encoding method, and audio decoding method
RU2017139868A (ru) Преобразующее кодирование/декодирование гармонических звуковых сигналов
US9454972B2 (en) Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech
RU2015135352A (ru) Способ и устройство для арифметического кодирования или арифметического декодирования
US20130103394A1 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200203