RU2012143323A - Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигнала и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста - Google Patents
Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигнала и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста Download PDFInfo
- Publication number
- RU2012143323A RU2012143323A RU2012143323/08A RU2012143323A RU2012143323A RU 2012143323 A RU2012143323 A RU 2012143323A RU 2012143323/08 A RU2012143323/08 A RU 2012143323/08A RU 2012143323 A RU2012143323 A RU 2012143323A RU 2012143323 A RU2012143323 A RU 2012143323A
- Authority
- RU
- Russia
- Prior art keywords
- context
- frequency
- spectral values
- information
- time
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract 20
- 238000000034 method Methods 0.000 title claims 7
- 238000004590 computer program Methods 0.000 title claims 3
- 230000003595 spectral effect Effects 0.000 claims abstract 47
- 238000001228 spectrum Methods 0.000 claims abstract 7
- 238000013507 mapping Methods 0.000 claims 4
- 238000005070 sampling Methods 0.000 claims 2
- XUKUURHRXDUEBC-KAYWLYCHSA-N Atorvastatin Chemical compound C=1C=CC=CC=1C1=C(C=2C=CC(F)=CC=2)N(CC[C@@H](O)C[C@@H](O)CC(O)=O)C(C(C)C)=C1C(=O)NC1=CC=CC=C1 XUKUURHRXDUEBC-KAYWLYCHSA-N 0.000 claims 1
- 238000012952 Resampling Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Декодер звукового сигнала (150; 240) для обеспечения декодированного представления звукового сигнала (154) на основе кодированного представления звукового сигнала (152), включающего кодированное представление спектра (ac_spectral_data []) и кодированную информацию о деформации времени (tw_data []); декодер звукового сигнала включает:декодер контекст-ориентированного спектрального значения (160), сконфигурированный, чтобы декодировать кодовое слово (acod_m), описывающее одно или более спектральных значений или, по крайней мере, часть (m) представления чисел одного или более спектральных значений в зависимости от состояния контекста, чтобы получить декодированные спектральные значения (162, 297, x_ac_dec []);определитель состояния контекста (170; 400), сконфигурированный, чтобы определить текущее состояние контекста (164, с) в зависимости от одного или более ранее декодированных спектральных значений (162, 297);преобразователь частотной области во временную область с деформацией времени (180), сконфигурированный, чтобы обеспечить представление временной области с деформацией времени (182) данного звукового фрейма на основе набора декодированных спектральных значений (162, 297), связанных с данным звуковым фреймом и предоставленных декодером контекст-ориентированных спектральных значений и в зависимости от информации о деформации времени;где определитель состояния контекста (170; 400) сконфигурирован, чтобы адаптировать определение состояния контекста к изменению основной частоты между последующими звуковыми фреймами.2. Декодер звукового сигнала по п.1, в котором информация о деформации времени (tw_data) описывает изменение (p) высоты (звука) с течением врем
Claims (17)
1. Декодер звукового сигнала (150; 240) для обеспечения декодированного представления звукового сигнала (154) на основе кодированного представления звукового сигнала (152), включающего кодированное представление спектра (ac_spectral_data []) и кодированную информацию о деформации времени (tw_data []); декодер звукового сигнала включает:
декодер контекст-ориентированного спектрального значения (160), сконфигурированный, чтобы декодировать кодовое слово (acod_m), описывающее одно или более спектральных значений или, по крайней мере, часть (m) представления чисел одного или более спектральных значений в зависимости от состояния контекста, чтобы получить декодированные спектральные значения (162, 297, x_ac_dec []);
определитель состояния контекста (170; 400), сконфигурированный, чтобы определить текущее состояние контекста (164, с) в зависимости от одного или более ранее декодированных спектральных значений (162, 297);
преобразователь частотной области во временную область с деформацией времени (180), сконфигурированный, чтобы обеспечить представление временной области с деформацией времени (182) данного звукового фрейма на основе набора декодированных спектральных значений (162, 297), связанных с данным звуковым фреймом и предоставленных декодером контекст-ориентированных спектральных значений и в зависимости от информации о деформации времени;
где определитель состояния контекста (170; 400) сконфигурирован, чтобы адаптировать определение состояния контекста к изменению основной частоты между последующими звуковыми фреймами.
2. Декодер звукового сигнала по п.1, в котором информация о деформации времени (tw_data) описывает изменение (prel) высоты (звука) с течением времени; и
где определитель состояния контекст (170; 400) сконфигурирован, чтобы получить информацию о растяжении частоты (s; m_ContextUpdateRatio) из информации о деформации времени (tw_data); и
где определитель состояния контекста сконфигурирован, чтобы растянуть или сжать прошлый контекст (432, q [0] [], 450), связанный с предыдущим звуковым фреймом, вдоль оси частоты в зависимости от информации о растяжении частоты, (s, m_ContextUpdateRatio), чтобы получить адаптированный контекст (440, q [0] [], 452) для декодирования контекст-ориентированного одного или более спектральных значений текущего звукового фрейма.
3. Декодер звукового сигнала по п.2, в котором определитель состояния контекста (170, 400) сконфигурирован, чтобы получить информацию о первой средней частоте (frel, mean, k-1) в первом звуковом фрейме из информации о деформации времени (tw_data, prel, warp_contour []), и чтобы получить информацию о второй средней частоте (frel, mean, k) во втором звуковом фрейме, следующем за первым звуковым фреймом, из информации о деформации времени; и
где определитель состояния контекста сконфигурирован, чтобы вычислить соотношение между информацией о второй средней частоте (frel, mean, k) во втором звуковом фрейме и информацией о первой средней частоте (frel, mean, k-1) в первом звуковом фрейме, чтобы определить информацию о растяжении частоты (s, m_ContextUpdateRatio).
4. Декодер звукового сигнала по п.2, в котором определитель состояния контекста (170; 400) сконфигурирован, чтобы определить информацию о первом среднем контуре с деформацией времени (prel, mean, k-1) в первом звуковом фрейме из информации о деформации времени (tw_data, prel, warp_contour []), и
где определитель состояния контекста сконфигурирован, чтобы получить информацию о втором среднем контуре деформации времени (prel, mean, k) во втором звуковом фрейме, следующем за первым звуковым фреймом, из информации о деформации времени (252, tw_data, prel, warp_contour []), и
где определитель состояния контекста сконфигурирован, чтобы вычислить соотношение между информацией о первом среднем контуре деформации времени (prel, mean, k-1) в первом звуковом фрейме и информацией о втором среднем контуре деформации времени (prel, mean, k) во втором звуковом фрейме для определения информации о растяжении частоты (s, m_ContextUpdateRatio).
5. Декодер звукового сигнала по п.3, где определитель состояния контекста (170, 400) сконфигурирован, чтобы получить информацию о первой и второй средней частоте или информацию о первом и втором среднем контуре деформации времени из общего контура деформации времени (warp_contour []), простирающегося по множеству последовательных звуковых фреймов.
6. Декодер звукового сигнала по п.3, где декодер звукового сигнала включает вычислитель деформации времени (250), сконфигурированный, чтобы вычислить информацию о контуре деформации времени (prel[], warp_contour [], 258), описывающую временную эволюцию относительной высоты (звука) по множеству последовательных звуковых фреймов на основе информации о деформации времени (tw_data, 252), и
где определитель состояния контекста (170, 400) сконфигурирован, чтобы использовать информацию о контуре деформации времени для получения информации о растяжении частоты.
7. Декодер звукового сигнала по п.6, где декодер звукового сигнала включает вычислитель положения повторной выборки (1801),
где вычислитель положения повторной выборки (1801) сконфигурирован, чтобы вычислить положения выборки для использования ресэмплером с деформацией времени (1801) на основе информации о контуре деформации времени (prel[], warp_contour [], 258), таким образом, что временное изменение положений повторной выборки определяется информацией о контуре деформации времени.
8. Декодер звукового сигнала по п.1, в котором определитель состояния контекста (170, 400) сконфигурирован, чтобы получить числовое значение текущего контекста (164, с), которое описывает состояние контекста в зависимости от множества ранее декодированных спектральных значений, и чтобы выбрать правило отображения (cum_freq []), описывающее отображение кодового значения (acod_m) на коде символа, представляющем одно или более спектральных значений, или часть (m) представления чисел одного или более спектральных значений в зависимости от числового значения текущего контекста,
где декодер контекст-ориентированного спектрального значения (160) сконфигурирован, чтобы декодировать кодовое значение (acod_m), описывающее одно или более спектральных значений, или, по крайней мере, часть (m) представления чисел одного или более спектральных значений, посредством использования правила отображения (cum_freq []), выбранного определителем состояния контекста.
9. Декодер звукового сигнала по п.8, в котором определитель состояния контекста (170, 400) сконфигурирован, чтобы настроить и обновить предварительную структуру памяти контекста (432, m_qbuf) таким образом, что входы предварительной структуры памяти контекста описывали одно или более спектральных значений (162, 297) первого звукового фрейма, где коэффициенты входа входов предварительной структуры памяти контекста указывают на элемент расрешения по частоте или набор смежных элементов разрешения по частоте преобразователя частотной области во временную область (180е), с которым связаны соответствующие входы;
где определитель состояния контекста сконфигурирован, чтобы получить частотно-масштабированную структуру памяти контекста (440; m_qbuf) для декодирования второго звукового фрейма, следующего за первым звуковым фреймом, на основе предварительной структуры памяти контекста таким образом, что данный вход (450а, 450с, self->base.m_qbuf[n Warp TupleIdx]) или под вход (self->base.m_qbuf[n WarpTupleIdx].a) предварительной структуры памяти контекста, имеющей первый коэффициент частотности (i1+1, i2+2, nWarpTupleIdx), отображаются на соответствующем входе (452а, 452с, self->base.m_qbuf[nLinTupleIdx]) или под входе (self->base.m_qbuf[nLinTupleIdx].a) частотно-масштабированной структуры памяти контекста (440, m_qbuf, 452), имеющей второй коэффициент частотности (i1, i2-1, nLinTupleIdx), где второй коэффициент частотности связывается с иным элементом разрешения по частоте или набором смежных элементов разрешения по частоте преобразователя частотной области во временную область (180е), чем первый коэффициент частотности.
10. Декодер звукового сигнала по п.9, в котором определитель состояния контекста (170, 400) сконфигурирован, чтобы получить значение состояния контекста (164 420), описывающее текущее состояние контекста для декодирования кодового слова (acod_m), описывающего одно или более спектральных значений второго звукового фрейма, или, по крайней мере, часть (m) представления чисел одного или более спектральных значений второго звукового фрейма, имеющую третий коэффициент частотности (i1), посредством использования значений частотно-масштабированной структуры памяти контекста (440, m_qbuf, 452), коэффициенты частотности (i1-1, i1, i1+1) значений частотно-масштабированной структуры памяти контекста которых находятся в предварительно определенных отношениях с третьим коэффициентом частотности (i1),
где третий коэффициент частотности (i1) обозначает элемент разрешения по частоте или набор смежных элементов разрешения по частоте преобразователя частотной области во временную область (180е), с которым связано одно или более спектральных значений второго звукового фрейма, подлежащих декодированию, посредством использования текущего состояния контекста.
11. Декодер звукового сигнала по п.9, в котором определитель состояния контекста (170; 400) сконфигурирован, чтобы установить каждое множество входов (452а, 452с, self->base.m_qbuf[nLinTupleIdx]) частотно-масштабированной структуры памяти контекста (440 452, m_qbuf), имеющей соответствующий целевой коэффициент частотности (i1, i2-1, nLinTupleIdx), назначение соответствующего входа (450а, 450с, self->base.m_qbuf[nWarpTupleIdx]) предварительной структуры памяти контекста (432 450, m_qbuf), имеющего соответствующий исходный коэффициент частотности (i1+1, i2+2, nWarpTupleIdx),
где определитель состояния контекста сконфигурирован, чтобы определить соответствующие коэффициенты частотности (i1, i1+1; i2-1, i2+2; nLinTupleIdx, nWarpTupleIdx) входа частотно-масштабированной структуры памяти контекста и соответствующего входа предварительной структуры памяти контекста таким образом, что соотношение между указанными соответствующими коэффициентами частотности (nLinTupleIdx, nWarpTupleIdx) определяется изменением основной частоты между текущим звуковым фреймом, с которым связаны входы предварительной структуры памяти контекста, и последующим звуковым фреймом, декодируемый контекст которого определяется входами частотно-масштабированной структуры памяти контекста.
12. Декодер звукового сигнала по п.9, в котором определитель состояния контекста (170, 400) сконфигурирован, чтобы настроить предварительную структуру памяти контекста (432, m_qbuf, 450) таким образом, что каждое множество входов (450а, 450с, self->base.m_qbuf[nWarpTupleIdx]) предварительной структуры памяти контекста основывается на множестве спектральных значений (а, b, с, d) первого звукового фрейма, где коэффициенты входа (i1+1, i2+2, nWarpTupleIdx) входов предварительной структуры памяти контекста (432 450, m_qbuf) указывают на набор смежных элементов разрешения по частоте преобразователя частотной области во временную область (180е), с которым связаны соответствующие входы;
где определитель состояния контекста сконфигурирован, чтобы извлечь предварительные значения индивидуальных элементов разрешения по частоте контекста (lineReorderBuf [(curTuple-1) *4+0], …, lineReorderBuf [(curTuple-1) *4+3]), имеющие связанные индивидуальные коэффициенты элементов разрешения по частоте, из входов (self->base.m_qbuf[curTuple[][]) предварительной структуры памяти контекста;
где определитель состояния контекста сконфигурирован, чтобы получить частотно-масштабированные значения индивидуальных элементов разрешения по частоте контекста (lineTmpBuf[linLineIdx]), имеющие связанные индивидуальные коэффициенты разрешения по частоте (linLineIdx), таким образом, что данное предварительное значение индивидуального элемента разрешения по частоте контекста (lineReorderBuf [warpLineIdx]), имеющее первый коэффициент элемента разрешения по частоте (warpLineIdx), отображается на соответствующем значении частотно-масштабированного индивидуального элемента разрешения по частоте контекста (lineTmpBuf [linLineIdx]),имеющем второй коэффициент элемента разрешения по частоте (linLineIdx), таким образом, что получается отображение индивидуального элемента разрешения по частоте предварительного значения индивидуального элемента разрешения по частоте контекста; и
где определитель состояния контекста сконфигурирован, чтобы объединить множество частотно-масштабированных значений индивидуальных элементов разрешения по частоте контекста (lineTmpBuf [(curTuple-1) *4+0, …, lineTmpBuf [(curTuple-1) *4+3] в объединенный вход (self->base.m_qbuf[curTuple][]) частотно-масштабированной структуры памяти контекста.
13. Кодирующее устройство звукового сигнала (100; 200) для обеспечения кодированного представления (112) входного звукового сигнала (110), включающего кодированное представление спектра (132) и кодированную информацию о деформации времени (226); кодирующее устройство звукового сигнала включает:
поставщик представления частотной области (120), сконфигурированный для обеспечения представления частотной области (124), представляющего версию входного звукового сигнала с деформацией времени; деформация времени в соответствии с информацией о деформации времени (122);
кодирующее устройство контекст-ориентированного спектрального значения (130), сконфигурированное, чтобы обеспечить кодовое слово (acod_m), описывающее одно или более спектральных значений представления частотной области (124), или, по крайней мере, часть (m) представления чисел одного или более спектральных значений представления частотной области (124), в зависимости от состояния контекста (134), чтобы получить кодированные спектральные значения (acod_m) кодированного представления спектра (132); и
определитель состояния контекста (140), сконфигурированный, чтобы определить текущее состояние контекста (134) в зависимости от одного или более ранее закодированных спектральных значений, где определитель состояния контекста (140) сконфигурирован, чтобы адаптировать определение состояния контекста к изменению основной частоты между последующими звуковыми фреймами.
14. Кодирующее устройство звукового сигнала по п.13, в котором определитель состояния контекста сконфигурирован, чтобы получить числовое значение текущего контекста (134, с) в зависимости от множества ранее закодированных спектральных значений, и выбрать правило отображения, описывающее отображение одного или более спектральных значений, или части (m) представления чисел одного или более спектральных значений, на кодовое значение (acod_m) в зависимости от числового значения текущего контекста,
где кодирующее устройство контекст-ориентированного спектрального значения сконфигурировано, чтобы обеспечить кодовое значение, описывающее одно или более спектральных значений, или, по крайней мере, часть представления чисел одного или более спектральных значений посредством использования правила отображения, выбранного определителем состояния контекста.
15. Способ обеспечения декодированного представления звукового сигнала (154) на основе кодированного представления звукового сигнала (152), включающего кодированное представление спектра (ac_spectral_data []) и кодированную информацию о деформации времени (tw_data []); способ включает:
декодирование кодового слова (acod_m), описывающего одно или более спектральных значений или, по крайней мере, часть (m) представления чисел одного или более спектральных значений в зависимости от состояния контекста, чтобы получить декодированные спектральные значения (162, 297, x_ac_dec []);
определение текущего состояния контекста (164, с) в зависимости от одного или более ранних декодированных спектральных значений (162, 297);
обеспечение представления временной области с деформацией времени (182) данного звукового фрейма на основе набора декодированных спектральных значений (162, 297), связанных с данным звуковым фреймом и предоставленных декодером контекст-ориентированных спектральных значений и в зависимости от информации о деформации времени;
где определение состояния контекста адаптируется к изменению основной частоты между последующими звуковыми фреймами.
16. Способ обеспечения кодированного представления (112) входного звукового сигнала (110), включающего кодированное представление спектра (132) и кодированную информацию о деформации времени (226); способ включает:
обеспечение представления частотной области (124), представляющего версию входного звукового сигнала с деформацией времени; деформация времени в соответствии с информацией о деформации времени (122);
обеспечение кодового слова (acod_m), описывающего одно или более спектральных значений представления частотной области (124), или, по крайней мере, часть (m) представления чисел одного или более спектральных значений представления частотной области (124), в зависимости от состояния контекста (134), чтобы получить кодированные спектральные значения (acod_m) кодированного представления спектра (132); и
определение текущего состояния контекста (134) в зависимости от одного или более ранних закодированных спектральных значений,
где определение состояния контекста адаптируется к изменению основной частоты между последующими звуковыми фреймами.
17. Компьютерная программа для выполнения способа по п.15 или 16, когда компьютерная программа запущена на компьютере.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31250310P | 2010-03-10 | 2010-03-10 | |
US61/312,503 | 2010-03-10 | ||
PCT/EP2011/053541 WO2011110594A1 (en) | 2010-03-10 | 2011-03-09 | Audio signal decoder, audio signal encoder, method for decoding an audio signal, method for encoding an audio signal and computer program using a pitch-dependent adaptation of a coding context |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012143323A true RU2012143323A (ru) | 2014-04-20 |
RU2607264C2 RU2607264C2 (ru) | 2017-01-10 |
Family
ID=43829343
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012143340/08A RU2586848C2 (ru) | 2010-03-10 | 2011-03-09 | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени |
RU2012143323A RU2607264C2 (ru) | 2010-03-10 | 2011-03-09 | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигналя и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012143340/08A RU2586848C2 (ru) | 2010-03-10 | 2011-03-09 | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени |
Country Status (16)
Country | Link |
---|---|
US (2) | US9129597B2 (ru) |
EP (2) | EP2539893B1 (ru) |
JP (2) | JP5625076B2 (ru) |
KR (2) | KR101445296B1 (ru) |
CN (2) | CN102884572B (ru) |
AR (2) | AR080396A1 (ru) |
AU (2) | AU2011226143B9 (ru) |
BR (2) | BR112012022744B1 (ru) |
CA (2) | CA2792500C (ru) |
ES (2) | ES2458354T3 (ru) |
HK (2) | HK1179743A1 (ru) |
MX (2) | MX2012010469A (ru) |
PL (2) | PL2539893T3 (ru) |
RU (2) | RU2586848C2 (ru) |
TW (2) | TWI441170B (ru) |
WO (2) | WO2011110591A1 (ru) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2083418A1 (en) * | 2008-01-24 | 2009-07-29 | Deutsche Thomson OHG | Method and Apparatus for determining and using the sampling frequency for decoding watermark information embedded in a received signal sampled with an original sampling frequency at encoder side |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN103035249B (zh) * | 2012-11-14 | 2015-04-08 | 北京理工大学 | 一种基于时频平面上下文的音频算术编码方法 |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
CN105474313B (zh) | 2013-06-21 | 2019-09-06 | 弗劳恩霍夫应用研究促进协会 | 时间缩放器、音频解码器、方法和计算机可读存储介质 |
KR101953613B1 (ko) | 2013-06-21 | 2019-03-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
ES2716756T3 (es) * | 2013-10-18 | 2019-06-14 | Ericsson Telefon Ab L M | Codificación de las posiciones de los picos espectrales |
CA2925734C (en) * | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
BR112016020988B1 (pt) * | 2014-03-14 | 2022-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação |
US10770087B2 (en) * | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN105070292B (zh) * | 2015-07-10 | 2018-11-16 | 珠海市杰理科技股份有限公司 | 音频文件数据重排序的方法和系统 |
CN107710323B (zh) * | 2016-01-22 | 2022-07-19 | 弗劳恩霍夫应用研究促进协会 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
EP3306609A1 (en) | 2016-10-04 | 2018-04-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for determining a pitch information |
EP3701523B1 (en) | 2017-10-27 | 2021-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise attenuation at a decoder |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US20210192681A1 (en) * | 2019-12-18 | 2021-06-24 | Ati Technologies Ulc | Frame reprojection for virtual reality and augmented reality |
US11776562B2 (en) * | 2020-05-29 | 2023-10-03 | Qualcomm Incorporated | Context-aware hardware-based voice activity detection |
TWI825492B (zh) * | 2020-10-13 | 2023-12-11 | 弗勞恩霍夫爾協會 | 對多個音頻對象進行編碼的設備和方法、使用兩個以上之相關音頻對象進行解碼的設備和方法、電腦程式及資料結構產品 |
CN114488105B (zh) * | 2022-04-15 | 2022-08-23 | 四川锐明智通科技有限公司 | 一种基于运动特征及方向模板滤波的雷达目标检测方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP4196235B2 (ja) * | 1999-01-19 | 2008-12-17 | ソニー株式会社 | オーディオデータ処理装置 |
DE60018246T2 (de) * | 1999-05-26 | 2006-05-04 | Koninklijke Philips Electronics N.V. | System zur übertragung eines audiosignals |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
JP4364544B2 (ja) * | 2003-04-09 | 2009-11-18 | 株式会社神戸製鋼所 | 音声信号処理装置及びその方法 |
UA90506C2 (ru) * | 2005-03-11 | 2010-05-11 | Квелкомм Инкорпорейтед | Изменение масштаба времени кадров в вокодере с помощью изменения остатка |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
KR101040160B1 (ko) | 2006-08-15 | 2011-06-09 | 브로드콤 코포레이션 | 패킷 손실 후의 제한되고 제어된 디코딩 |
CN101375330B (zh) * | 2006-08-15 | 2012-02-08 | 美国博通公司 | 丢包后解码音频信号的时间扭曲的方法 |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN103000178B (zh) | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
FI3573056T3 (fi) * | 2008-07-11 | 2022-11-30 | Audiokooderi ja audiodekooderi | |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
-
2011
- 2011-03-09 KR KR1020127026462A patent/KR101445296B1/ko active IP Right Grant
- 2011-03-09 TW TW100107905A patent/TWI441170B/zh active
- 2011-03-09 BR BR112012022744-0A patent/BR112012022744B1/pt active IP Right Grant
- 2011-03-09 WO PCT/EP2011/053538 patent/WO2011110591A1/en active Application Filing
- 2011-03-09 CA CA2792500A patent/CA2792500C/en active Active
- 2011-03-09 MX MX2012010469A patent/MX2012010469A/es active IP Right Grant
- 2011-03-09 AU AU2011226143A patent/AU2011226143B9/en active Active
- 2011-03-09 WO PCT/EP2011/053541 patent/WO2011110594A1/en active Application Filing
- 2011-03-09 BR BR112012022741-6A patent/BR112012022741B1/pt active IP Right Grant
- 2011-03-09 ES ES11707665T patent/ES2458354T3/es active Active
- 2011-03-09 EP EP20110707415 patent/EP2539893B1/en active Active
- 2011-03-09 PL PL11707415T patent/PL2539893T3/pl unknown
- 2011-03-09 JP JP2012556506A patent/JP5625076B2/ja active Active
- 2011-03-09 JP JP2012556505A patent/JP5456914B2/ja active Active
- 2011-03-09 ES ES11707415T patent/ES2461183T3/es active Active
- 2011-03-09 RU RU2012143340/08A patent/RU2586848C2/ru active
- 2011-03-09 CN CN201180021269.2A patent/CN102884572B/zh active Active
- 2011-03-09 MX MX2012010439A patent/MX2012010439A/es active IP Right Grant
- 2011-03-09 CN CN201180023298.2A patent/CN102884573B/zh active Active
- 2011-03-09 TW TW100107904A patent/TWI455113B/zh active
- 2011-03-09 RU RU2012143323A patent/RU2607264C2/ru not_active Application Discontinuation
- 2011-03-09 PL PL11707665T patent/PL2532001T3/pl unknown
- 2011-03-09 KR KR1020127026461A patent/KR101445294B1/ko active IP Right Grant
- 2011-03-09 CA CA2792504A patent/CA2792504C/en active Active
- 2011-03-09 AU AU2011226140A patent/AU2011226140B2/en active Active
- 2011-03-09 EP EP20110707665 patent/EP2532001B1/en active Active
- 2011-03-10 AR ARP110100746 patent/AR080396A1/es active IP Right Grant
- 2011-03-10 AR ARP110100748 patent/AR084465A1/es active IP Right Grant
-
2012
- 2012-09-06 US US13/604,869 patent/US9129597B2/en active Active
- 2012-09-10 US US13/608,980 patent/US9524726B2/en active Active
-
2013
- 2013-06-08 HK HK13106813.7A patent/HK1179743A1/xx unknown
- 2013-06-26 HK HK13107466.5A patent/HK1181540A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2012143323A (ru) | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигнала и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста | |
RU2010139022A (ru) | Вычислитель контура временной деформации, кодера аудиосигнала, кодированное представление аудиосигнала, способы и программное обеспечение | |
RU2638734C2 (ru) | Кодирование спектральных коэффициентов спектра аудиосигнала | |
ES2651437T3 (es) | Codificador de audio y decodificador de audio | |
RU2012141241A (ru) | Аудиокодер, аудиодекодер, способ кодирования и декодирования аудиоинформации и компьютерная программа, определяющая значение поддиапазона контекста на основе нормы ранее декодированных спектральных значений | |
KR101750071B1 (ko) | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 | |
RU2554554C2 (ru) | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи | |
RU2012122278A (ru) | Аудиокодер, аудиодекодер, способ кодирования аудиоинформации, способ декодирования аудиоинформации и компьютерная программа, использующая зависимое от диапазона арифметическое кодирующее правило отображения | |
RU2011117696A (ru) | Аудиодекодер, аудиокодер, способ для декорирования аудиосигнала, способ кодирования звукового сигнала, компьютерная программа и аудиосигнал | |
US11501788B2 (en) | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium | |
JP2005260969A5 (ru) | ||
US11164589B2 (en) | Periodic-combined-envelope-sequence generating device, encoder, periodic-combined-envelope-sequence generating method, coding method, and recording medium | |
RU2020119054A (ru) | Аудиокодеры, аудиодекодеры, способы и компьютерные программы, применяющие кодирование и декодирование младших значащих битов | |
US20130082850A1 (en) | Data encoding apparatus, data decoding apparatus and methods thereof | |
RU2621003C2 (ru) | Адаптивное к тональности квантование низкой сложности аудиосигналов | |
JP2008089983A (ja) | 符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20160504 |
|
FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20160831 |