RU2010120678A - Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра - Google Patents
Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра Download PDFInfo
- Publication number
- RU2010120678A RU2010120678A RU2010120678/08A RU2010120678A RU2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678/08 A RU2010120678/08 A RU 2010120678/08A RU 2010120678 A RU2010120678 A RU 2010120678A RU 2010120678 A RU2010120678 A RU 2010120678A
- Authority
- RU
- Russia
- Prior art keywords
- spectral lines
- transform
- layer
- spectrum
- celp
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims abstract 33
- 230000003595 spectral effect Effects 0.000 claims abstract 79
- 230000005236 sound signal Effects 0.000 claims abstract 32
- 238000000034 method Methods 0.000 claims abstract 24
- 238000001831 conversion spectrum Methods 0.000 claims 14
- 230000002194 synthesizing effect Effects 0.000 claims 5
- 230000015572 biosynthetic process Effects 0.000 claims 3
- 239000011159 matrix material Substances 0.000 claims 2
- 230000005284 excitation Effects 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых: ! - получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала; ! - преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и ! - кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования. ! 2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром. ! 3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором: ! - кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий. ! 4. Способ по п.1, дополнительно содержащий этапы, на которых: ! - разбивают множество спектральных линий на множество подполос; и ! - группируют последовательные подполосы в области. ! 5. Способ по п.4, дополнительно содержащий этап, на котором: ! - кодируют основной импульс, выбранный из множе
Claims (40)
1. Способ для кодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом и аудиокодеке, и при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразуют остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодируют спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
2. Способ по п.1, в котором слой преобразования DCT-типа является слоем модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
3. Способ по п.1, в котором кодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
4. Способ по п.1, дополнительно содержащий этапы, на которых:
- разбивают множество спектральных линий на множество подполос; и
- группируют последовательные подполосы в области.
5. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют основной импульс, выбранный из множества спектральных линий для каждой из подполос в области.
6. Способ по п.4, дополнительно содержащий этап, на котором:
- кодируют позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя этап, на котором формируют матрицу, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
7. Способ по п.4, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
8. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют лексикографический индекс для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
9. Способ по п.8, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
10. Способ по п.1, в котором технология комбинаторного позиционного кодирования включает в себя этап, на котором:
- формируют индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
11. Способ по п.1, дополнительно содержащий этап, на котором:
- отбрасывают набор спектральных линий, чтобы сократить число спектральных линий, перед кодированием.
12. Способ по п.1, в котором восстановленная версия исходного аудиосигнала получается посредством этапов, на которых:
- синтезируют кодированную версию исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторно вводят предыскажения в синтезированный сигнал; и
- выполняют повышающую дискретизацию сигнала после повторного ввода предыскажений, чтобы получить восстановленную версию исходного аудиосигнала.
13. Устройство масштабируемого речевого и аудиокодера, содержащее:
- модуль слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), выполненный с возможностью формировать остаточный сигнал, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- модуль слоя преобразования типа дискретного косинусного преобразования (DCT), выполненный с возможностью:
- получать остаточный сигнал из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке; и
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- комбинаторный кодер спектра, выполненный с возможностью кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
14. Устройство по п.13, в котором модуль слоя преобразования DCT-типа является модулем слоя модифицированного дискретного косинусного преобразования (MDCT), и спектр преобразования является MDCT-спектром.
15. Устройство по п.13, в котором кодирование спектральных линий спектра преобразования включает в себя:
- кодирование позиций выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
16. Устройство по п.13, дополнительно содержащее:
- формирователь подполос, выполненный с возможностью разбивать множество спектральных линий на множество подполос; и
- формирователь областей, выполненный с возможностью группировать последовательные подполосы в области.
17. Устройство по п.16, дополнительно содержащее:
- кодер основных импульсов, выполненный с возможностью кодировать основной импульс, выбираемый из множества спектральных линий для каждой из подполос в области.
18. Устройство по п.16, дополнительно содержащее:
- кодер субимпульсов, выполненный с возможностью кодировать позиции выбранного поднабора спектральных линий в рамках области на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий;
- при этом кодирование спектральных линий спектра преобразования включает в себя формирование матрицы, на основе позиций выбранного поднабора спектральных линий, из всех возможных двоичных строк длины, равной всем позициям в области.
19. Устройство по п.16, в котором области перекрываются, и каждая область включает в себя множество последовательных подполос.
20. Устройство по п.13, в котором технология комбинаторного позиционного кодирования включает в себя:
- формирование лексикографического индекса для выбранного поднабора спектральных линий, при этом каждый лексикографический индекс представляет одну из множества возможных двоичных строк, представляющих позиции выбранного поднабора спектральных линий.
21. Устройство по п.20, в котором лексикографический индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
22. Устройство по п.13, в котором комбинаторный кодер спектра выполнен с возможностью формировать индекс, представляющий позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
23. Устройство по п.13, в котором восстановленная версия исходного аудиосигнала получается посредством следующего:
- синтезирование кодированной версии исходного аудиосигнала из слоя кодирования на основе CELP, чтобы получать синтезированный сигнал;
- повторный ввод предыскажений в синтезированный сигнал; и
- повышающая дискретизация сигнала после повторного ввода предыскажений, чтобы получать восстановленную версию исходного аудиосигнала.
24. Устройство масштабируемого речевого и аудиокодера, содержащее:
- средство для получения остаточного сигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- средство для преобразования остаточного сигнала, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- средство для кодирования спектральных линий спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
25. Процессор, включающий в себя схему масштабируемого кодирования речи и аудио, выполненную с возможностью:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
26. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого кодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать остаточный сигнал из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала;
- преобразовывать остаточный сигнал, из предыдущего слоя, в слое преобразования типа дискретного косинусного преобразования (DCT), чтобы получать соответствующий спектр преобразования, имеющий множество спектральных линий; и
- кодировать спектральные линии спектра преобразования с использованием технологии комбинаторного позиционного кодирования.
27. Способ для декодирования в масштабируемом речевом и аудиокодеке, имеющем несколько слоев, содержащий этапы, на которых:
- получают индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодируют индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезируют версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
28. Способ по п.27, дополнительно содержащий этапы, на которых:
- принимают CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодируют CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинируют декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
29. Способ по п.27, в котором синтезирование версии остаточного сигнала включает в себя этап, на котором:
- применяют обратное преобразование DCT-типа к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
30. Способ по п.27, в котором декодирование спектральных линий спектра преобразования включает в себя этап, на котором:
- декодируют позиции выбранного поднабора спектральных линий на основе представления позиций спектральных линий с использованием технологии комбинаторного позиционного кодирования для позиций ненулевых спектральных линий.
31. Способ по п.27, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
32. Способ по п.27, в котором слой обратного преобразования DCT-типа является слоем обратного модифицированного дискретного косинусного преобразования (IMDCT), и спектр преобразования является MDCT-спектром.
33. Способ по п.27, в котором полученный индекс представляет позиции спектральных линий в рамках двоичной строки, причем позиции спектральных линий кодируются на основе комбинаторной формулы:
- где n - длина двоичной строки, k - число выбранных спектральных линий, которые должны быть кодированы, и wj представляет отдельные биты двоичной строки.
34. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- комбинаторный декодер спектра, выполненный с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из модуля слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом модуль слоя кодирования на основе CELP содержит слой кодирования на основе CELP, имеющий один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- модуль слоя обратного преобразования типа обратного дискретного косинусного преобразования (IDCT), выполненный с возможностью синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования.
35. Устройство по п.34, дополнительно содержащее:
- CELP-декодер, выполненный с возможностью:
- принимать CELP-кодированный сигнал, кодирующий исходный аудиосигнал;
- декодировать CELP-кодированный сигнал, чтобы формировать декодированный сигнал; и
- комбинировать декодированный сигнал с синтезированной версией остаточного сигнала, чтобы получать восстановленную версию исходного аудиосигнала.
36. Устройство по п.34, в котором при синтезировании версии остаточного сигнала, модуль слоя обратного преобразования IDCT-типа выполнен с возможностью применять обратное преобразование типа DCT к спектральным линиям спектра преобразования, чтобы сформировать версию остаточного сигнала во временной области.
37. Устройство по п.34, в котором индекс представляет ненулевые спектральные линии в двоичной строке в меньшем числе битов, чем длина двоичной строки.
38. Устройство масштабируемого речевого и аудиодекодера, содержащее:
- средство для получения индекса, представляющего множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- средство для декодирования индекса в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- средство для синтезирования версии остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
39. Процессор, включающий в себя схему масштабируемого декодирования речи и аудио, выполненную с возможностью:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
40. Машиночитаемый носитель, содержащий инструкции, применяемые для масштабируемого декодирования речи и аудио, которые, когда выполняются посредством одного или более процессоров, побуждают процессоры:
- получать индекс, представляющий множество спектральных линий спектра преобразования остаточного сигнала, при этом остаточный сигнал является разностью между исходным аудиосигналом и восстановленной версией исходного аудиосигнала из слоя кодирования на основе линейного прогнозирования с возбуждением по коду (CELP), при этом слой кодирования на основе CELP содержит один или два предыдущих слоя в масштабируемом речевом и аудиокодеке;
- декодировать индекс в верхнем слое посредством выполнения в обратном порядке технологии комбинаторного позиционного кодирования, используемой для того, чтобы кодировать множество спектральных линий спектра преобразования; и
- синтезировать версию остаточного сигнала с использованием декодированного множества спектральных линий спектра преобразования в слое обратного преобразования типа обратного дискретного косинусного преобразования (IDCT).
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US98181407P | 2007-10-22 | 2007-10-22 | |
US60/981,814 | 2007-10-22 | ||
US12/255,604 US8527265B2 (en) | 2007-10-22 | 2008-10-21 | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US12/255,604 | 2008-10-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010120678A true RU2010120678A (ru) | 2011-11-27 |
RU2459282C2 RU2459282C2 (ru) | 2012-08-20 |
Family
ID=40210550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010120678/08A RU2459282C2 (ru) | 2007-10-22 | 2008-10-22 | Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра |
Country Status (13)
Country | Link |
---|---|
US (1) | US8527265B2 (ru) |
EP (1) | EP2255358B1 (ru) |
JP (2) | JP2011501828A (ru) |
KR (1) | KR20100085994A (ru) |
CN (2) | CN102968998A (ru) |
AU (1) | AU2008316860B2 (ru) |
BR (1) | BRPI0818405A2 (ru) |
CA (1) | CA2701281A1 (ru) |
IL (1) | IL205131A0 (ru) |
MX (1) | MX2010004282A (ru) |
RU (1) | RU2459282C2 (ru) |
TW (1) | TWI407432B (ru) |
WO (1) | WO2009055493A1 (ru) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
JP5221642B2 (ja) | 2007-04-29 | 2013-06-26 | 華為技術有限公司 | 符号化法、復号化法、符号器、および復号器 |
KR101649376B1 (ko) | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
WO2010044593A2 (ko) | 2008-10-13 | 2010-04-22 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
CN101931414B (zh) | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
WO2011045926A1 (ja) * | 2009-10-14 | 2011-04-21 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
ES2610163T3 (es) | 2009-10-20 | 2017-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, método para codificar información de audio, método para decodificar información de audio y programa de computación que utiliza una reducción de tamaño de intervalo interactiva |
US9153242B2 (en) * | 2009-11-13 | 2015-10-06 | Panasonic Intellectual Property Corporation Of America | Encoder apparatus, decoder apparatus, and related methods that use plural coding layers |
CA2780962C (en) * | 2009-11-19 | 2017-09-05 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
JP5773502B2 (ja) * | 2010-01-12 | 2015-09-02 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム |
KR101764633B1 (ko) | 2010-01-15 | 2017-08-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR101423737B1 (ko) | 2010-01-21 | 2014-07-24 | 한국전자통신연구원 | 오디오 신호의 디코딩 방법 및 장치 |
EP2555186A4 (en) * | 2010-03-31 | 2014-04-16 | Korea Electronics Telecomm | CODING METHOD AND DEVICE AND DECODING METHOD AND DEVICE |
EP2569767B1 (en) * | 2010-05-11 | 2014-06-11 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for processing of audio signals |
CN102299760B (zh) * | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
WO2012005210A1 (ja) * | 2010-07-05 | 2012-01-12 | 日本電信電話株式会社 | 符号化方法、復号方法、装置、プログラムおよび記録媒体 |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US8879634B2 (en) | 2010-08-13 | 2014-11-04 | Qualcomm Incorporated | Coding blocks of data using one-to-one codes |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
EP2707875A4 (en) | 2011-05-13 | 2015-03-25 | Samsung Electronics Co Ltd | NOISE REDUCTION AND AUDIO CODING |
CN103946918B (zh) | 2011-09-28 | 2017-03-08 | Lg电子株式会社 | 语音信号编码方法、语音信号解码方法及使用其的装置 |
JP6062861B2 (ja) * | 2011-10-07 | 2017-01-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
US8924203B2 (en) | 2011-10-28 | 2014-12-30 | Electronics And Telecommunications Research Institute | Apparatus and method for coding signal in a communication system |
CA2831176C (en) * | 2012-01-20 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
PL3193332T3 (pl) * | 2012-07-12 | 2020-12-14 | Nokia Technologies Oy | Kwantyzacja wektorowa |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
EP4220636A1 (en) * | 2012-11-05 | 2023-08-02 | Panasonic Intellectual Property Corporation of America | Speech audio encoding device and speech audio encoding method |
MY185164A (en) * | 2013-01-29 | 2021-04-30 | Fraunhofer Ges Forschung | Noise filling concept |
MX347410B (es) | 2013-01-29 | 2017-04-26 | Fraunhofer Ges Forschung | Aparato y metodo para seleccionar uno de un primer algoritmo de codificacion y un segundo algoritmo de codificacion. |
EP3098811B1 (en) | 2013-02-13 | 2018-10-17 | Telefonaktiebolaget LM Ericsson (publ) | Frame error concealment |
KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
WO2014160705A1 (en) | 2013-03-26 | 2014-10-02 | Dolby Laboratories Licensing Corporation | Encoding perceptually-quantized video content in multi-layer vdr coding |
CN105453173B (zh) | 2013-06-21 | 2019-08-06 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
JP6482540B2 (ja) | 2013-06-21 | 2019-03-13 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 改善されたピッチラグ推定を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法 |
EP2830056A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
PL3046104T3 (pl) * | 2013-09-16 | 2020-02-28 | Samsung Electronics Co., Ltd. | Sposób kodowania sygnału oraz sposób dekodowania sygnału |
WO2015037969A1 (ko) | 2013-09-16 | 2015-03-19 | 삼성전자 주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
PL3058567T3 (pl) * | 2013-10-18 | 2017-11-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Kodowanie pozycji pików spektralnych |
TWI578308B (zh) | 2013-10-18 | 2017-04-11 | 弗勞恩霍夫爾協會 | 音訊信號頻譜之頻譜係數的編碼技術 |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
PT3288026T (pt) * | 2013-10-31 | 2020-07-20 | Fraunhofer Ges Forschung | Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo |
KR101854296B1 (ko) | 2013-10-31 | 2018-05-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US10395663B2 (en) | 2014-02-17 | 2019-08-27 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
CN106233112B (zh) * | 2014-02-17 | 2019-06-28 | 三星电子株式会社 | 信号编码方法和设备以及信号解码方法和设备 |
CN107369453B (zh) * | 2014-03-21 | 2021-04-20 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
WO2015157843A1 (en) | 2014-04-17 | 2015-10-22 | Voiceage Corporation | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
CN111968655B (zh) | 2014-07-28 | 2023-11-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
KR102547480B1 (ko) * | 2014-12-09 | 2023-06-26 | 돌비 인터네셔널 에이비 | Mdct-도메인 에러 은닉 |
US10504525B2 (en) * | 2015-10-10 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Adaptive forward error correction redundant payload generation |
BR112020004909A2 (pt) * | 2017-09-20 | 2020-09-15 | Voiceage Corporation | método e dispositivo para distribuir, de forma eficiente, um bit-budget em um codec celp |
CN112669860B (zh) * | 2020-12-29 | 2022-12-09 | 北京百瑞互联技术有限公司 | 一种增加lc3音频编解码有效带宽的方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
JP3849210B2 (ja) * | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
US6263312B1 (en) * | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6351494B1 (en) | 1999-09-24 | 2002-02-26 | Sony Corporation | Classified adaptive error recovery method and apparatus |
US6662154B2 (en) * | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
DE60214599T2 (de) * | 2002-03-12 | 2007-09-13 | Nokia Corp. | Skalierbare audiokodierung |
CA2524243C (en) * | 2003-04-30 | 2013-02-19 | Matsushita Electric Industrial Co. Ltd. | Speech coding apparatus including enhancement layer performing long term prediction |
EP1688917A1 (en) * | 2003-12-26 | 2006-08-09 | Matsushita Electric Industries Co. Ltd. | Voice/musical sound encoding device and voice/musical sound encoding method |
JP4445328B2 (ja) | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
RU2007109825A (ru) | 2004-09-17 | 2008-09-27 | Мацусита Электрик Индастриал Ко., Лтд. (Jp) | Устройство аудиокодирования, устройство аудиодекодирования, устройство связи и способ аудиокодирования |
KR20070083856A (ko) | 2004-10-28 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법 |
US8036390B2 (en) | 2005-02-01 | 2011-10-11 | Panasonic Corporation | Scalable encoding device and scalable encoding method |
EP1988544B1 (en) * | 2006-03-10 | 2014-12-24 | Panasonic Intellectual Property Corporation of America | Coding device and coding method |
US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
-
2008
- 2008-10-21 US US12/255,604 patent/US8527265B2/en not_active Expired - Fee Related
- 2008-10-22 CN CN2012104034370A patent/CN102968998A/zh active Pending
- 2008-10-22 RU RU2010120678/08A patent/RU2459282C2/ru not_active IP Right Cessation
- 2008-10-22 BR BRPI0818405A patent/BRPI0818405A2/pt not_active IP Right Cessation
- 2008-10-22 KR KR1020107011197A patent/KR20100085994A/ko not_active Application Discontinuation
- 2008-10-22 CN CN2008801125420A patent/CN101836251B/zh not_active Expired - Fee Related
- 2008-10-22 AU AU2008316860A patent/AU2008316860B2/en not_active Ceased
- 2008-10-22 CA CA2701281A patent/CA2701281A1/en not_active Abandoned
- 2008-10-22 WO PCT/US2008/080824 patent/WO2009055493A1/en active Application Filing
- 2008-10-22 TW TW097140565A patent/TWI407432B/zh not_active IP Right Cessation
- 2008-10-22 JP JP2010531210A patent/JP2011501828A/ja not_active Ceased
- 2008-10-22 MX MX2010004282A patent/MX2010004282A/es active IP Right Grant
- 2008-10-22 EP EP08843220.8A patent/EP2255358B1/en not_active Not-in-force
-
2010
- 2010-04-15 IL IL205131A patent/IL205131A0/en unknown
-
2013
- 2013-04-11 JP JP2013083340A patent/JP2013178539A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP2255358A1 (en) | 2010-12-01 |
JP2013178539A (ja) | 2013-09-09 |
JP2011501828A (ja) | 2011-01-13 |
KR20100085994A (ko) | 2010-07-29 |
US20090234644A1 (en) | 2009-09-17 |
AU2008316860A1 (en) | 2009-04-30 |
EP2255358B1 (en) | 2013-07-03 |
WO2009055493A1 (en) | 2009-04-30 |
IL205131A0 (en) | 2010-11-30 |
CN101836251B (zh) | 2012-12-12 |
MX2010004282A (es) | 2010-05-05 |
CN101836251A (zh) | 2010-09-15 |
US8527265B2 (en) | 2013-09-03 |
CN102968998A (zh) | 2013-03-13 |
AU2008316860B2 (en) | 2011-06-16 |
RU2459282C2 (ru) | 2012-08-20 |
TWI407432B (zh) | 2013-09-01 |
BRPI0818405A2 (pt) | 2016-10-11 |
CA2701281A1 (en) | 2009-04-30 |
TW200935402A (en) | 2009-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2010120678A (ru) | Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра | |
CN101878504B (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
JP5112309B2 (ja) | 階層符号化/復号化装置 | |
JP5833557B2 (ja) | 位相情報と残余信号を用いる符号化/復号化装置及び方法 | |
TWI423252B (zh) | 多模式音訊信號解碼器、多模式音訊信號編碼器、使用基於線性預測編碼之雜訊塑形的方法與電腦程式 | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
JP5695074B2 (ja) | 音声符号化装置および音声復号化装置 | |
FI3958257T3 (fi) | Audiokooderi monikanavasignaalin koodaamiseksi ja audiodekooderi koodatun audiosignaalin dekoodaamiseksi | |
KR20100007738A (ko) | 음성/오디오 통합 신호의 부호화/복호화 장치 | |
TW201007698A (en) | Audio encoder and audio decoder | |
CA2703700A1 (en) | Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs | |
JP2005260969A5 (ru) | ||
CN101297356A (zh) | 音频压缩 | |
WO2013061531A1 (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
CN103946918B (zh) | 语音信号编码方法、语音信号解码方法及使用其的装置 | |
WO2013118476A1 (ja) | 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法 | |
US20100292986A1 (en) | encoder | |
UA95185C2 (ru) | Масштабированное кодирование и аудио с использованием комбинаторного кодирования mdct-спектра | |
Vasilache | Entropic encoding of lattice codevectors based on product code indexing | |
TH132840A (th) | โคเดกเสียงที่รองรับโหมดการลงรหัสโดเมนเวลา และโดเมนความถี่ | |
WO2008114078A1 (en) | En encoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20151023 |