RU2013141919A - Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра - Google Patents

Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра Download PDF

Info

Publication number
RU2013141919A
RU2013141919A RU2013141919/08A RU2013141919A RU2013141919A RU 2013141919 A RU2013141919 A RU 2013141919A RU 2013141919/08 A RU2013141919/08 A RU 2013141919/08A RU 2013141919 A RU2013141919 A RU 2013141919A RU 2013141919 A RU2013141919 A RU 2013141919A
Authority
RU
Russia
Prior art keywords
window
data
frame
encoding
audio signal
Prior art date
Application number
RU2013141919/08A
Other languages
English (en)
Other versions
RU2574849C2 (ru
Inventor
Эммануэль РАВЕЛЛИ
Ральф ГАЙГЕР
Маркус ШНЕЛЛЬ
Гийом ФУКС
Веза РУОППИЛА
Том БЯКСТРЕМ
Бернхард ГРИЛЛ
Кристиан ХЕЛЬМРИХ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2013141919A publication Critical patent/RU2013141919A/ru
Application granted granted Critical
Publication of RU2574849C2 publication Critical patent/RU2574849C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

1. Устройство для кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащее:блок (102) применения оконной функции для применения окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,причем окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющимися частью (206) опережающего просмотра кодирования с преобразованием,причем окно анализа кодирования с предсказанием связано по меньшей мере с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющимися частью (208) опережающего просмотра кодирования с предсказанием,причем часть (206) опережающего просмотра кодирования с преобразованием и часть (208) опережающего просмотра кодирования с предсказанием тождественны друг другу или отличаются друг от друга менее чем 20% части (208) опережающего просмотра кодирования с предсказанием или менее чем 20% части (206) опережающего просмотра кодирования с преобразованием; ипроцессор (104) кодирования для генерации данных, кодированных с помощью кодирования с предсказанием, для текущего кадра с использов�

Claims (26)

1. Устройство для кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащее:
блок (102) применения оконной функции для применения окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,
причем окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющимися частью (206) опережающего просмотра кодирования с преобразованием,
причем окно анализа кодирования с предсказанием связано по меньшей мере с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющимися частью (208) опережающего просмотра кодирования с предсказанием,
причем часть (206) опережающего просмотра кодирования с преобразованием и часть (208) опережающего просмотра кодирования с предсказанием тождественны друг другу или отличаются друг от друга менее чем 20% части (208) опережающего просмотра кодирования с предсказанием или менее чем 20% части (206) опережающего просмотра кодирования с преобразованием; и
процессор (104) кодирования для генерации данных, кодированных с помощью кодирования с предсказанием, для текущего кадра с использованием обработанных с помощью оконной функции данных для анализа с предсказанием или для генерации данных, кодированных с преобразованием, для текущего кадра с использованием обработанных с помощью оконной функции данных для анализа с преобразованием.
2. Устройство по п. 1, в котором окно (204) анализа кодирования с преобразованием содержит неперекрывающуюся часть, простирающуюся в части (206) опережающего просмотра кодирования с преобразованием.
3. Устройство по п. 1, в котором окно (204) анализа кодирования с преобразованием содержит дополнительную перекрывающуюся часть (210), начинающуюся в начале текущего кадра и заканчивающуюся в начале неперекрывающейся части (208).
4. Устройство по п. 1, в котором блок (102) применения оконной функции сконфигурирован с возможностью использовать только начальное окно (220, 222) для перехода от кодирования с предсказанием к кодированию с преобразованием от кадра к следующему кадру, причем начальное окно не используется для перехода от кодирования с преобразованием к кодированию с предсказанием от одного кадра к следующему кадру.
5. Устройство по п. 1, дополнительно содержащее:
выходной интерфейс (106) для вывода кодируемого сигнала для текущего кадра; и
селектор (112) режима кодирования для управления процессором (104) кодирования для вывода или данных, кодированных с помощью кодирования с предсказанием, или данных, кодированных с преобразованием, для текущего кадра,
причем селектор (112) режима кодирования сконфигурирован с возможностью переключаться только между кодированием с предсказанием или кодированием с преобразованием для целого кадра, так что кодируемый сигнал для целого кадра или содержит данные, кодированные с помощью кодирования с предсказанием, или данные, кодированные с преобразованием.
6. Устройство по п. 1,
в котором блок применения (102) оконной функции использует, в дополнение к окну анализа кодирования с предсказанием дополнительное окно (202) анализа кодирования с предсказанием, связанное с дискретными значениями аудиосигнала, размещенными в начале текущего кадра, и в котором окно (200) анализа кодирования с предсказанием не связано с дискретными значениями аудиосигнала, размещенными в начале текущего кадра.
7. Устройство по п. 1,
в котором кадр содержит множество подкадров, причем окно (200) анализа с предсказанием центрировано в центре подкадра, и причем окно анализа кодирования с преобразованием центрировано на границе между двумя подкадрами.
8. Устройство по п. 7,
в котором окно (200) анализа с предсказанием центрировано в центре последнего подкадра кадра, причем дополнительное окно анализа (202) центрировано в центре второго подкадра текущего кадра, и причем окно анализа кодирования с преобразованием центрировано на границе между третьим и четвертым подкадром текущего кадра, причем текущий кадр подразделен на четыре подкадра.
9. Устройство по п. 1, в котором дополнительное окно (202) анализа кодирования с предсказанием не имеет части опережающего просмотра в будущем кадре и связано с дискретными значениями текущего кадра.
10. Устройство по п. 1, в котором окно анализа кодирования с преобразованием дополнительно содержит нулевую часть перед началом окна и нулевую часть после конца окна так, чтобы полная длина во времени окна анализа кодирования с преобразованием была в два раза больше длины во времени текущего кадра.
11. Устройство по п. 10, в котором для перехода от режима кодирования с предсказанием к режиму кодирования с преобразованием от одного кадра к следующему кадру блоком (102) применения оконной функции используется окно перехода,
причем окно перехода содержит первую неперекрывающуюся часть, начинающуюся в начале кадра, и перекрывающуюся часть, начинающуюся в конце неперекрывающейся части и простирающуюся в будущий кадр,
причем перекрывающаяся часть, простирающаяся в будущий кадр, имеет длину, которая идентична длине окна анализа части опережающего просмотра кодирования с преобразованием.
12. Устройство по п. 1, в котором длина во времени окна анализа кодирования с преобразованием больше, чем длина во времени окна (200, 202) анализа кодирования с предсказанием.
13. Устройство по п. 1, дополнительно содержащее:
выходной интерфейс (106) для вывода закодированного сигнала для текущего кадра; и
селектор (112) режима кодирования для управления процессором (104) кодирования для вывода или данных, кодированных с помощью кодирования с предсказанием, или данных, кодированных с преобразованием, для текущего кадра,
причем окно (102) сконфигурировано с возможностью использовать дополнительное окно кодирования с предсказанием, расположенное в текущем кадре перед окном кодирования с предсказанием, и
причем селектор (112) режима кодирования сконфигурирован с возможностью управлять процессором (104) кодирования для посылки только данных анализа кодирования с предсказанием полученных из окна кодирования с предсказанием, когда данные, кодированные с преобразованием, выводятся на выходной интерфейс, и не посылать данные анализа кодирования с предсказанием полученные из дополнительного окна кодирования с предсказанием, и
причем селектор (112) режима кодирования сконфигурирован с возможностью управлять процессором (104) кодирования для посылки данных анализа кодирования с предсказанием, полученных из окна кодирования с предсказанием, и для посылки данных анализа кодирования с предсказанием, полученных из дополнительного окна кодирования с предсказанием, когда данные кодированные с предсказанием, выводятся на выходной интерфейс.
14. Устройство по п. 1, в котором процессор (104) кодирования содержит:
анализатор (302) кодирования с предсказанием для получения данных кодирования с предсказанием для текущего кадра из обработанных с помощью оконной функции данных (100a) для анализа с предсказанием;
ветвь кодирования с предсказанием, содержащую:
каскад (304) фильтра для вычисления данных фильтра по дискретным значениям аудиосигнала для текущего кадра, используя данные кодирования с предсказанием; и
вычислитель (306) параметров кодера с предсказанием для вычисления параметров кодирования с предсказанием для текущих кадров; и
ветвь кодирования с преобразованием, содержащую:
спектрально-временной преобразователь (310) для преобразования данных окна для алгоритма кодирования с преобразованием в спектральное представление;
блок (312) спектрального взвешивания для взвешивания спектральных данных, используя взвешенные данные взвешивания, полученные из данных кодирования с предсказанием, для получения взвешенных спектральных данных; и
процессор (314) для спектральных данных для обработки взвешенных спектральных данных для получения данных, кодированных с помощью преобразования, для текущего кадра.
15. Способ кодирования аудиосигнала, имеющего поток дискретных значений (100) аудиосигнала, содержащий:
применение (102) окна (200) анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и применения окна (204) анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием,
причем окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющимися частью (206) опережающего просмотра кодирования с преобразованием,
причем окно анализа кодирования с предсказанием связано по меньшей мере с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющимися частью (208) опережающего просмотра кодирования с предсказанием,
причем часть (206) опережающего просмотра кодирования с преобразованием и часть (208) опережающего просмотра кодирования с предсказанием тождественны друг другу или отличаются друг от друга менее чем 20% части (208) опережающего просмотра кодирования с предсказанием или менее чем 20% части (206) опережающего просмотра кодирования с преобразованием; и
генерацию (104) данных, кодированных с помощью преобразования, для текущего кадра, используя обработанные с помощью оконной функции данные для анализа с предсказанием, или для генерации с преобразованием данных, кодированных с помощью преобразования, для текущего кадра, используя обработанные с помощью оконной функции данные для анализа с преобразованием.
16. Аудиодекодер для декодирования закодированного аудиосигнала, содержащий:
декодер (180) параметров предсказания для выполнения декодирования данных для кадра кодированного с предсказанием из закодированного аудиосигнала;
декодер (183) параметров преобразования для выполнения декодирования данных для кадра кодированного с преобразованием, из закодированного аудиосигнала,
причем декодер (183) параметров преобразования сконфигурирован выполнять спектрально-временное преобразование и применять окно синтеза к преобразованным данным для получения данных для текущего кадра и будущего кадра, окно синтеза, имеющее первую перекрывающуюся часть, смежную вторую неперекрывающуюся часть и смежную третью перекрывающуюся часть (206), третью перекрывающуюся часть, связанную с дискретными значениями аудиосигнала для будущего кадра, и неперекрывающуюся часть (208), связанную с данными текущего кадра; и
добавляющий перекрытие блок (184) для наложения и добавления обработанных с помощью окна синтеза дискретных значений, связанных с третьей перекрывающейся частью окна синтеза для текущего кадра, и обработанных с помощью окна синтеза дискретных значений, связанных с первой перекрывающейся частью окна синтеза для будущего кадра, для получения первой части дискретных значений аудиосигнала для будущего кадра, причем оставшиеся дискретные значения аудиосигнала для будущего кадра являются обработанными с помощью окна синтеза дискретными значениями, связанными со второй неперекрывающейся частью окна синтеза для будущего кадра, полученными без добавления перекрытия, когда текущий кадр и будущий кадр содержат данные, кодированные с преобразованием.
17. Аудиодекодер по п. 16, в котором текущий кадр закодированного аудиосигнала содержит данные кодированные с преобразованием, и будущий кадр содержит данные кодированные с предсказанием, причем декодер (183) параметров преобразования сконфигурирован выполнять обработку с помощью окна синтеза, используя окно синтеза для текущего кадра, для получения обработанных с помощью оконной функции дискретных значений аудиосигнала, связанных с неперекрывающейся частью (208) окна синтеза, причем обработанные с помощью окна синтеза дискретные значения аудиосигнала, связанные с третьей перекрывающейся частью окна синтеза для текущего кадра, отбрасываются, и
в котором дискретные значения аудиосигнала для будущего кадра обеспечены декодером (180) параметров предсказания без данных от декодера (183) параметров преобразования.
18. Аудиодекодер по п. 16, в котором текущий кадр содержит данные кодирования с предсказанием, а будущий кадр содержит данные кодирования с преобразованием,
в котором декодер (183) параметров преобразования сконфигурирован использовать окно перехода, отличающееся от окна синтеза,
в котором окно (220, 222) перехода содержит первую неперекрывающуюся часть (220) в начале будущего кадра и перекрывающуюся часть (222), начинающуюся в конце будущего кадра и простирающуюся в кадр после будущего кадра во времени, и
в котором дискретные значения аудиосигнала для будущего кадра генерируются без перекрытия, и аудиоданные, связанные со второй перекрывающейся частью (222) окна для будущего кадра вычисляются добавляющим перекрытие блоком (184) с использованием первой перекрывающейся части окна синтеза для кадра после будущего кадра.
19. Аудиодекодер по п. 16,
в котором вычислитель (183) параметров преобразования содержит:
блок (183b) спектрального взвешивания для взвешивания декодированных с преобразованием спектральных данных для текущего кадра, используя данные кодирования с предсказанием; и
вычислитель (183c) данных взвешивания кодирования с предсказанием для вычисления данных кодирования с предсказанием путем объединения взвешенной суммы данных кодирования с предсказанием, полученных из прошлого кадра, и данных кодирования с предсказанием, полученных из текущего кадра, для получения интерполированных данных кодирования с предсказанием.
20. Аудиодекодер по п. 19,
в котором вычислитель (183c) данных взвешивания кодирования с предсказанием сконфигурирован с возможностью преобразовывать данные кодирования с предсказанием в спектральное представление, имеющее весовые значения для каждого диапазона частот, и
причем блок (183b) спектрального взвешивания сконфигурирован с возможностью взвешивать все спектральные значения в полосе посредством идентичного весового значения для этой полосы.
21. Аудиодекодер по п. 16, в котором окно синтеза сконфигурировано с возможностью иметь полную продолжительность менее 50 мс и более 25 мс, причем первая и третья перекрывающиеся части имеют одинаковую длину, и причем третья перекрывающаяся часть имеет длину менее 15 мс.
22. Аудиодекодер по п. 16,
в котором окно синтеза имеет продолжительность в 30 мс без заполненных нулями частей, первая и третья перекрывающиеся части имеют длительность 10 мс, а неперекрывающаяся часть имеет длительность 10 мс.
23. Аудиодекодер по п. 16,
в котором декодер (183) параметров преобразования сконфигурирован с возможностью применять для спектрально-временного преобразования преобразование (183d) DCT, имеющее число дискретных значений, соответствующее длине кадра, и операцию (183e) обратной свертки для генерации числа временных значений, в два раза превышающего число временных значений до DCT, и
применять (183e) окно синтеза к результату операции обратной свертки, причем окно синтеза содержит перед первой перекрывающейся частью и после третьей перекрывающейся части нулевые части, имеющие длину, равную половине длины первой и третьей перекрывающихся частей.
24. Способ декодирования кодированного аудиосигнала, содержащий:
выполнение (180) декодирования данных для кадра, кодированного с предсказанием, из закодированного аудиосигнала;
выполнение (183) декодирования данных для кадра, кодированного с преобразованием, из закодированного аудиосигнала,
причем этап выполнения (183) декодирования данных для кадра, кодированного с преобразованием, содержит выполнение спектрально-временного преобразования и применение окна синтеза к преобразованным данным для получения данных для текущего кадра и будущего кадра, окна синтеза, имеющего первую перекрывающуюся часть, смежную вторую неперекрывающуюся часть и смежную третью перекрывающуюся часть (206), третью перекрывающуюся часть, связанную с дискретными значениями аудиосигнала для будущего кадра, и неперекрывающуюся часть (208), связанную с данными текущего кадра; и
перекрытие и добавление (184) обработанных с помощью окна синтеза дискретных значений, связанных с третьей перекрывающейся частью окна синтеза для текущего кадра, и обработанных с помощью окна синтеза дискретных значений, связанных с первой перекрывающейся частью окна синтеза для будущего кадра, для получения первой части дискретных значений аудиосигнала для будущего кадра, причем оставшиеся дискретные значения аудиосигнала для будущего кадра являются обработанными с помощью окна синтеза дискретными значениями, связанными со второй непересекающейся частью окна синтеза для будущего кадра, полученными без добавления перекрытия, когда текущий кадр и будущий кадр содержат данные, кодированные с преобразованием.
25. Машиночитаемый носитель, содержащий машиночитаемые команды, чтобы заставить компьютер осуществлять способ по п.15.
26. Машиночитаемый носитель, содержащий машиночитаемые команды, чтобы заставить компьютер осуществлять способ по п.24.
RU2013141919/08A 2011-02-14 2012-02-14 Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра RU2574849C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052450 WO2012110473A1 (en) 2011-02-14 2012-02-14 Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion

Publications (2)

Publication Number Publication Date
RU2013141919A true RU2013141919A (ru) 2015-03-27
RU2574849C2 RU2574849C2 (ru) 2016-02-10

Family

ID=

Also Published As

Publication number Publication date
EP4243017A2 (en) 2023-09-13
AR098557A2 (es) 2016-06-01
EP2676265B1 (en) 2019-04-10
JP2014510305A (ja) 2014-04-24
CN103503062B (zh) 2016-08-10
EP3503098C0 (en) 2023-08-30
TR201908598T4 (tr) 2019-07-22
KR101698905B1 (ko) 2017-01-23
CN103503062A (zh) 2014-01-08
AU2012217153B2 (en) 2015-07-16
TW201506907A (zh) 2015-02-16
AR102602A2 (es) 2017-03-15
EP4243017A3 (en) 2023-11-08
KR101853352B1 (ko) 2018-06-14
CN105304090B (zh) 2019-04-09
MY160265A (en) 2017-02-28
KR20130133846A (ko) 2013-12-09
AU2012217153A1 (en) 2013-10-10
CN105304090A (zh) 2016-02-03
US9047859B2 (en) 2015-06-02
CA2827272C (en) 2016-09-06
WO2012110473A1 (en) 2012-08-23
EP3503098B1 (en) 2023-08-30
AR085221A1 (es) 2013-09-18
MX2013009306A (es) 2013-09-26
ZA201306839B (en) 2014-05-28
KR20160039297A (ko) 2016-04-08
JP6110314B2 (ja) 2017-04-05
TWI479478B (zh) 2015-04-01
TW201301262A (zh) 2013-01-01
US20130332148A1 (en) 2013-12-12
PT2676265T (pt) 2019-07-10
EP3503098A1 (en) 2019-06-26
EP2676265A1 (en) 2013-12-25
SG192721A1 (en) 2013-09-30
BR112013020699A2 (pt) 2016-10-25
BR112013020699B1 (pt) 2021-08-17
TWI563498B (en) 2016-12-21
PL2676265T3 (pl) 2019-09-30
CA2827272A1 (en) 2012-08-23
ES2725305T3 (es) 2019-09-23

Similar Documents

Publication Publication Date Title
USRE49717E1 (en) Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
RU2017134619A (ru) Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
RU2575993C2 (ru) Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области
KR101883767B1 (ko) 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
TWI613644B (zh) 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式
RU2016105613A (ru) Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала
KR20120128136A (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
CN104584122B (zh) 使用改进的概率分布估计的基于线性预测的音频编码
JP6812504B2 (ja) 音声符号化方法および関連装置
RU2015116434A (ru) Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением
Nikolić et al. Low complex forward adaptive loss compression algorithm and its application in speech coding
EP3579229A1 (en) Method and apparatus for processing temporal envelope of audio signal, and encoder
KR101397512B1 (ko) 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템
KR20180015284A (ko) 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
RU2013141919A (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра
KR20200038297A (ko) 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스