RU2013141934A - Аудиокодек, использующий синтез шума в течение неактивной фазы - Google Patents
Аудиокодек, использующий синтез шума в течение неактивной фазы Download PDFInfo
- Publication number
- RU2013141934A RU2013141934A RU2013141934/08A RU2013141934A RU2013141934A RU 2013141934 A RU2013141934 A RU 2013141934A RU 2013141934/08 A RU2013141934/08 A RU 2013141934/08A RU 2013141934 A RU2013141934 A RU 2013141934A RU 2013141934 A RU2013141934 A RU 2013141934A
- Authority
- RU
- Russia
- Prior art keywords
- background noise
- audio signal
- parametric
- data stream
- audio
- Prior art date
Links
- 239000012073 inactive phase Substances 0.000 title claims abstract 25
- 230000015572 biosynthetic process Effects 0.000 title claims 2
- 238000003786 synthesis reaction Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract 47
- 239000012071 phase Substances 0.000 claims abstract 25
- 230000005284 excitation Effects 0.000 claims abstract 14
- 238000006243 chemical reaction Methods 0.000 claims abstract 4
- 230000003595 spectral effect Effects 0.000 claims 8
- 238000000034 method Methods 0.000 claims 4
- 238000007619 statistical method Methods 0.000 claims 3
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000007704 transition Effects 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000000354 decomposition reaction Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Image Generation (AREA)
- Electric Clocks (AREA)
Abstract
1. Аудиокодер, содержащий:- модуль (12) оценки фонового шума, выполненный с возможностью непрерывно обновлять параметрическую оценку фонового шума в течение активной фазы (24) на основе входного аудиосигнала;- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу (28) после активной фазы (24) на основе входного аудиосигнала,- при этом аудиокодер выполнен с возможностью, при обнаружении входа в неактивную фазу, кодировать в поток данных параметрическую оценку фонового шума, непрерывно обновляемую в течение активной фазы, после которой следует обнаруженная неактивная фаза.2. Аудиокодер по п. 1, в котором модуль (12) оценки фонового шума выполнен с возможностью, при непрерывном обновлении параметрической оценки фонового шума, осуществлять различение между компонентом шума и компонентом полезного сигнала во входном аудиосигнале и определять параметрическую оценку фонового шума просто из компонента шума.3. Аудиокодер по п. 1, в котором кодер (14) выполнен с возможностью, при кодировании входного аудиосигнала, выполнять прогнозирующее кодирование входного аудиосигнала в коэффициенты линейного прогнозирования и сигнал возбуждения, а также кодировать с преобразованием сигнал возбуждения и кодировать коэффициенты линейного прогнозирования в поток (30) данных.4. Аудиокодер по п. 3, в котором модуль (12) оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума с использованием сигнала возбуждения в течение активной фазы.5. Аудиокодер по п. 3, в котором модуль оценки фонового шума выпол
Claims (27)
1. Аудиокодер, содержащий:
- модуль (12) оценки фонового шума, выполненный с возможностью непрерывно обновлять параметрическую оценку фонового шума в течение активной фазы (24) на основе входного аудиосигнала;
- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и
- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу (28) после активной фазы (24) на основе входного аудиосигнала,
- при этом аудиокодер выполнен с возможностью, при обнаружении входа в неактивную фазу, кодировать в поток данных параметрическую оценку фонового шума, непрерывно обновляемую в течение активной фазы, после которой следует обнаруженная неактивная фаза.
2. Аудиокодер по п. 1, в котором модуль (12) оценки фонового шума выполнен с возможностью, при непрерывном обновлении параметрической оценки фонового шума, осуществлять различение между компонентом шума и компонентом полезного сигнала во входном аудиосигнале и определять параметрическую оценку фонового шума просто из компонента шума.
3. Аудиокодер по п. 1, в котором кодер (14) выполнен с возможностью, при кодировании входного аудиосигнала, выполнять прогнозирующее кодирование входного аудиосигнала в коэффициенты линейного прогнозирования и сигнал возбуждения, а также кодировать с преобразованием сигнал возбуждения и кодировать коэффициенты линейного прогнозирования в поток (30) данных.
4. Аудиокодер по п. 3, в котором модуль (12) оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума с использованием сигнала возбуждения в течение активной фазы.
5. Аудиокодер по п. 3, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в сигнале возбуждения и выполнять статистический анализ сигнала возбуждения при локальных минимумах, с тем чтобы получать параметрическую оценку фонового шума.
6. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного сигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть более низких частот входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части более высоких частот входного аудиосигнала.
7. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного сигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть более низких частот входного аудиосигнала и выбирать между использованием параметрического кодирования для того, чтобы кодировать спектральную огибающую части более высоких частот входного аудиосигнала, или оставлением некодированной части более высоких частот входного аудиосигнала.
8. Аудиокодер по п. 6, в котором кодер выполнен с возможностью прерывать прогнозирующее кодирование и/или кодирование с преобразованием и параметрическое кодирование в неактивных фазах или прерывать прогнозирующее кодирование и/или кодирование с преобразованием и выполнять параметрическое кодирование спектральной огибающей части более высоких частот входного аудиосигнала при более низком частотно-временном разрешении по сравнению с использованием параметрического кодирования в активной фазе.
9. Аудиокодер по п. 6, в котором кодер использует гребенку фильтров для того, чтобы спектрально разлагать входной аудиосигнал на набор подполос частот, формирующих часть более низких частот, и набор подполос частот, формирующих часть более высоких частот.
10. Аудиокодер по п. 9, в котором модуль оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума в активной фазе на основе частей более низких и более высоких частот входного аудиосигнала.
11. Аудиокодер по п. 10, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в частях более низких и более высоких частот входного аудиосигнала и выполнять статистический анализ частей более низких и более высоких частот входного аудиосигнала при локальных минимумах, с тем чтобы получать параметрическую оценку фонового шума.
12. Аудиокодер по п. 1, в котором модуль оценки шума выполнен с возможностью продолжать непрерывное обновление оценки фонового шума даже в течение неактивной фазы, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума, непрерывно обновляемой в течение неактивной фазы.
13. Аудиокодер по п. 12, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума в фиксированном или переменном интервале времени.
14. Аудиодекодер для декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу (86), после которой следует неактивная фаза (88), причем аудиодекодер содержит:
- модуль (90) оценки фонового шума, выполненный с возможностью непрерывно обновлять параметрическую оценку фонового шума из потока (104) данных в течение активной фазы (86);
- декодер (92), выполненный с возможностью восстанавливать аудиосигнал из потока данных в течение активной фазы;
- параметрический генератор (94) случайных чисел;
- формирователь (96) фонового шума, выполненный с возможностью синтезировать аудиосигнал в течение неактивной фазы (88) посредством управления параметрическим генератором (94) случайных чисел в течение неактивной фазы (88) в зависимости от параметрической оценки фонового шума;
- при этом декодер (92) выполнен с возможностью, при восстановлении аудиосигнала из потока данных, формировать сигнал возбуждения, кодированный с преобразованием в поток данных, согласно коэффициентам линейного прогнозирования, также кодированным в поток данных; и
- при этом модуль (90) оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума с использованием сигнала возбуждения.
15. Аудиодекодер по п. 14, в котором модуль (90) оценки фонового шума выполнен с возможностью, при непрерывном обновлении параметрической оценки фонового шума, осуществлять различение между компонентом шума и компонентом полезного сигнала в версии аудиосигнала, восстановленной из потока (104) данных в активной фазе (86), и определять параметрическую оценку фонового шума просто из компонента шума.
16. Аудиодекодер по п. 14, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в сигнале возбуждения и выполнять статистический анализ сигнала возбуждения при локальных минимумах, с тем чтобы получать параметрическую оценку фонового шума.
17. Аудиодекодер по п. 14, в котором декодер выполнен с возможностью, при восстановлении аудиосигнала, использовать прогнозирующее декодирование и/или декодирование с преобразованием для того, чтобы восстанавливать часть более низких частот аудиосигнала из потока данных и синтезировать часть более высоких частот аудиосигнала.
18. Аудиодекодер по п. 17, в котором декодер выполнен с возможностью синтезировать часть более высоких частот аудиосигнала из спектральной огибающей части более высоких частот входного аудиосигнала, параметрически кодированного в поток данных, или синтезировать часть более высоких частот аудиосигнала посредством расширения полосы пропускания вслепую на основе части более низких частот.
19. Аудиодекодер по п. 18, в котором декодер выполнен с возможностью прерывать прогнозирующее декодирование и/или декодирование с преобразованием в неактивных фазах и выполнять синтезирование части более высоких частот аудиосигнала посредством спектрального формирования реплики части более низких частот аудиосигнала согласно спектральной огибающей в активной фазе и спектрального формирования реплики синтезированного аудиосигнала согласно спектральной огибающей в неактивной фазе.
20. Аудиодекодер по п. 18, в котором декодер содержит гребенку обратных фильтров, чтобы спектрально составлять входной аудиосигнал из набора подполос частот части более низких частот и набора подполос частот части более высоких частот.
21. Аудиодекодер по п. 14, при этом аудиодекодер выполнен с возможностью обнаруживать вход в неактивную фазу каждый раз, когда поток данных прерывается, и/или каждый раз, когда поток данных сигнализирует переход к потоку данных.
22. Аудиодекодер по п. 14, в котором формирователь (96) фонового шума выполнен с возможностью синтезировать аудиосигнал в течение неактивной фазы (88) посредством управления параметрическим генератором (94) случайных чисел в течение неактивной фазы (88) в зависимости от параметрического фонового шума, непрерывно обновляемого посредством модуля оценки фонового шума, просто в случае отсутствия информации параметрической оценки фонового шума в потоке данных сразу после перехода от активной фазы к неактивной фазе.
23. Аудиодекодер по п. 14, в котором модуль (90) оценки фонового шума выполнен с возможностью, при непрерывном обновлении параметрической оценки фонового шума, использовать спектральное разложение аудиосигнала, восстановленное из декодера (92).
24. Аудиодекодер по п. 14, в котором модуль (90) оценки фонового шума выполнен с возможностью, при непрерывном обновлении параметрической оценки фонового шума, использовать QMF-спектр аудиосигнала, восстановленный из декодера (92).
25. Способ кодирования аудио, содержащий этапы, на которых:
- непрерывно обновляют параметрическую оценку фонового шума в течение активной фазы (24) на основе входного аудиосигнала;
- кодируют входной аудиосигнал в поток данных в течение активной фазы;
- обнаруживают вход в неактивную фазу (28) после активной фазы (24) на основе входного аудиосигнала; и
- при обнаружении входа в неактивную фазу, кодируют в поток данных параметрическую оценку фонового шума, непрерывно обновляемую в течение активной фазы, после которой следует обнаруженная неактивная фаза.
26. Способ декодирования аудио для декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу (86), после которой следует неактивная фаза (88), при этом способ содержит этапы, на которых:
- непрерывно обновляют параметрическую оценку фонового шума из потока (104) данных в течение активной фазы (86);
- восстанавливают аудиосигнал из потока данных в течение активной фазы;
- синтезируют аудиосигнал в течение неактивной фазы (88) посредством управления параметрическим генератором (94) случайных чисел в течение неактивной фазы (88) в зависимости от параметрической оценки фонового шума;
- при этом восстановление аудиосигнала из потока данных содержит этап, на котором формируют сигнал возбуждения, кодированный с преобразованием в поток данных, согласно коэффициентам линейного прогнозирования, также кодированным в поток данных, и
- при этом непрерывное обновление параметрической оценки фонового шума выполняется с использованием сигнала возбуждения.
27. Компьютерная программа, имеющая программный код для осуществления, при выполнении на компьютере, способа по любому из пп. 25 и 26.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052462 WO2012110481A1 (en) | 2011-02-14 | 2012-02-14 | Audio codec using noise synthesis during inactive phases |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013141934A true RU2013141934A (ru) | 2015-03-27 |
RU2586838C2 RU2586838C2 (ru) | 2016-06-10 |
Family
ID=71943599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013141934/08A RU2586838C2 (ru) | 2011-02-14 | 2012-02-14 | Аудиокодек, использующий синтез шума в течение неактивной фазы |
Country Status (17)
Country | Link |
---|---|
US (1) | US9153236B2 (ru) |
EP (1) | EP2676264B1 (ru) |
JP (1) | JP5969513B2 (ru) |
KR (1) | KR101613673B1 (ru) |
CN (1) | CN103534754B (ru) |
AR (1) | AR085224A1 (ru) |
CA (2) | CA2903681C (ru) |
ES (1) | ES2535609T3 (ru) |
HK (1) | HK1192641A1 (ru) |
MX (1) | MX2013009303A (ru) |
MY (1) | MY160272A (ru) |
PL (1) | PL2676264T3 (ru) |
RU (1) | RU2586838C2 (ru) |
SG (1) | SG192718A1 (ru) |
TW (1) | TWI480857B (ru) |
WO (1) | WO2012110481A1 (ru) |
ZA (1) | ZA201306873B (ru) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
US8892046B2 (en) * | 2012-03-29 | 2014-11-18 | Bose Corporation | Automobile communication system |
MX344169B (es) * | 2012-12-21 | 2016-12-07 | Fraunhofer Ges Forschung | Generacion de ruido de confort con alta resolucion espectro-temporal en transmision discontinua de señales de audio. |
BR112015017753B1 (pt) * | 2013-01-29 | 2022-05-31 | Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal. |
CN105225668B (zh) | 2013-05-30 | 2017-05-10 | 华为技术有限公司 | 信号编码方法及设备 |
JP6465020B2 (ja) * | 2013-05-31 | 2019-02-06 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
ES2716652T3 (es) | 2013-11-13 | 2019-06-13 | Fraunhofer Ges Forschung | Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922055A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
KR20150117114A (ko) * | 2014-04-09 | 2015-10-19 | 한국전자통신연구원 | 잡음 제거 장치 및 방법 |
LT3511935T (lt) | 2014-04-17 | 2021-01-11 | Voiceage Evs Llc | Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais |
EP2980790A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
MX365694B (es) | 2014-07-29 | 2019-06-11 | Ericsson Telefon Ab L M | Estimacion del ruido de fondo en señales de audio. |
TW202242853A (zh) | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
ES2769061T3 (es) | 2015-09-25 | 2020-06-24 | Fraunhofer Ges Forschung | Codificador y método para codificar una señal de audio con ruido de fondo reducido que utiliza codificación predictiva lineal |
CN108140395B (zh) * | 2015-09-25 | 2022-01-04 | 美高森美半导体(美国)股份有限公司 | 舒适噪声生成装置和方法 |
CN116631417A (zh) | 2017-01-10 | 2023-08-22 | 弗劳恩霍夫应用研究促进协会 | 音频解码器、提供解码的音频信号的方法、和计算机程序 |
CN109841222B (zh) * | 2017-11-29 | 2022-07-01 | 腾讯科技(深圳)有限公司 | 音频通信方法、通信设备及存储介质 |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11264014B1 (en) * | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11109440B2 (en) * | 2018-11-02 | 2021-08-31 | Plantronics, Inc. | Discontinuous transmission on short-range packet-based radio links |
KR20210137146A (ko) * | 2019-03-10 | 2021-11-17 | 카르돔 테크놀로지 엘티디. | 큐의 클러스터링을 사용한 음성 증강 |
US11545172B1 (en) * | 2021-03-09 | 2023-01-03 | Amazon Technologies, Inc. | Sound source localization using reflection classification |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
WO2024056701A1 (en) * | 2022-09-13 | 2024-03-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive stereo parameter synthesis |
Family Cites Families (151)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG70558A1 (en) | 1991-06-11 | 2000-02-22 | Qualcomm Inc | Variable rate vocoder |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
JP3304717B2 (ja) | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
US5537510A (en) | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5754733A (en) | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP3622365B2 (ja) | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JP3464371B2 (ja) * | 1996-11-15 | 2003-11-10 | ノキア モービル フォーンズ リミテッド | 不連続伝送中に快適雑音を発生させる改善された方法 |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
JP4024427B2 (ja) | 1999-05-24 | 2007-12-19 | 株式会社リコー | 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
DE60031002T2 (de) | 2000-02-29 | 2007-05-10 | Qualcomm, Inc., San Diego | Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6701772B2 (en) | 2000-12-22 | 2004-03-09 | Honeywell International Inc. | Chemical or biological attack detection and mitigation system |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
KR100464369B1 (ko) | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3815323B2 (ja) | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
DE60303689T2 (de) | 2002-09-19 | 2006-10-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiodecodierungsvorrichtung und -verfahren |
KR100711280B1 (ko) * | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
KR101058062B1 (ko) * | 2003-06-30 | 2011-08-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 잡음 부가에 의한 디코딩된 오디오의 품질 개선 |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
WO2005043511A1 (en) | 2003-10-30 | 2005-05-12 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
EP1852851A1 (en) | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
CA2566368A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
WO2006079349A1 (en) | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for weighted overlap-add |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
NZ562183A (en) | 2005-04-01 | 2010-09-30 | Qualcomm Inc | Systems, methods, and apparatus for highband excitation generation |
EP1899958B1 (en) | 2005-05-26 | 2013-08-07 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
PL1897085T3 (pl) * | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
US7974837B2 (en) | 2005-06-23 | 2011-07-05 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmitting apparatus |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US20090281812A1 (en) | 2006-01-18 | 2009-11-12 | Lg Electronics Inc. | Apparatus and Method for Encoding and Decoding Signal |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
EP2030199B1 (en) | 2006-05-30 | 2009-10-28 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
EP2044575B1 (en) | 2006-07-24 | 2017-01-11 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US20080147518A1 (en) | 2006-10-18 | 2008-06-19 | Siemens Aktiengesellschaft | Method and apparatus for pharmacy inventory management and trend detection |
BR122019024992B1 (pt) | 2006-12-12 | 2021-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
RU2356046C2 (ru) | 2007-06-13 | 2009-05-20 | Государственное образовательное учреждение высшего профессионального образования "Самарский государственный университет" | Способ получения капиллярных колонок и устройство для его осуществления |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
PT3550564T (pt) | 2007-08-27 | 2020-08-18 | Ericsson Telefon Ab L M | Análise/síntese espectral de baixa complexidade utilizando resolução temporal selecionável |
JP5264913B2 (ja) | 2007-09-11 | 2013-08-14 | ヴォイスエイジ・コーポレーション | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
WO2010003532A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
ES2657393T3 (es) | 2008-07-11 | 2018-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y descodificador de audio para codificar y descodificar muestras de audio |
JP5369180B2 (ja) | 2008-07-11 | 2013-12-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
RU2621965C2 (ru) | 2008-07-11 | 2017-06-08 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
EP2146344B1 (en) | 2008-07-17 | 2016-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding/decoding scheme having a switchable bypass |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CN102334160B (zh) | 2009-01-28 | 2014-05-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器,音频解码器,编码和解码音频信号的方法 |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
PL2234103T3 (pl) | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
CA2763793C (en) | 2009-06-23 | 2017-05-09 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
JP5243661B2 (ja) | 2009-10-20 | 2013-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム |
MX2012004593A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codec multimodo de audio y codificacion de celp adaptada a este. |
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
-
2012
- 2012-02-14 EP EP12706002.8A patent/EP2676264B1/en active Active
- 2012-02-14 CN CN201280015995.8A patent/CN103534754B/zh active Active
- 2012-02-14 CA CA2903681A patent/CA2903681C/en active Active
- 2012-02-14 RU RU2013141934/08A patent/RU2586838C2/ru active
- 2012-02-14 WO PCT/EP2012/052462 patent/WO2012110481A1/en active Application Filing
- 2012-02-14 ES ES12706002.8T patent/ES2535609T3/es active Active
- 2012-02-14 PL PL12706002T patent/PL2676264T3/pl unknown
- 2012-02-14 MX MX2013009303A patent/MX2013009303A/es active IP Right Grant
- 2012-02-14 SG SG2013060959A patent/SG192718A1/en unknown
- 2012-02-14 TW TW101104682A patent/TWI480857B/zh active
- 2012-02-14 CA CA2827335A patent/CA2827335C/en active Active
- 2012-02-14 AR ARP120100479A patent/AR085224A1/es active IP Right Grant
- 2012-02-14 KR KR1020137024142A patent/KR101613673B1/ko active IP Right Grant
- 2012-02-14 MY MYPI2013701422A patent/MY160272A/en unknown
- 2012-02-14 JP JP2013553903A patent/JP5969513B2/ja active Active
-
2013
- 2013-08-13 US US13/966,087 patent/US9153236B2/en active Active
- 2013-09-12 ZA ZA2013/06873A patent/ZA201306873B/en unknown
-
2014
- 2014-06-20 HK HK14105892.2A patent/HK1192641A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
HK1192641A1 (en) | 2014-08-22 |
SG192718A1 (en) | 2013-09-30 |
EP2676264A1 (en) | 2013-12-25 |
CN103534754B (zh) | 2015-09-30 |
CN103534754A (zh) | 2014-01-22 |
CA2827335C (en) | 2016-08-30 |
EP2676264B1 (en) | 2015-01-28 |
AR085224A1 (es) | 2013-09-18 |
PL2676264T3 (pl) | 2015-06-30 |
MX2013009303A (es) | 2013-09-13 |
JP5969513B2 (ja) | 2016-08-17 |
CA2903681C (en) | 2017-03-28 |
JP2014505907A (ja) | 2014-03-06 |
AU2012217161B2 (en) | 2015-11-12 |
TWI480857B (zh) | 2015-04-11 |
ES2535609T3 (es) | 2015-05-13 |
KR101613673B1 (ko) | 2016-04-29 |
AU2012217161A1 (en) | 2013-09-26 |
WO2012110481A1 (en) | 2012-08-23 |
TW201250671A (en) | 2012-12-16 |
KR20130138362A (ko) | 2013-12-18 |
CA2827335A1 (en) | 2012-08-23 |
RU2586838C2 (ru) | 2016-06-10 |
US20130332175A1 (en) | 2013-12-12 |
US9153236B2 (en) | 2015-10-06 |
CA2903681A1 (en) | 2012-08-23 |
MY160272A (en) | 2017-02-28 |
ZA201306873B (en) | 2014-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2013141934A (ru) | Аудиокодек, использующий синтез шума в течение неактивной фазы | |
RU2013142079A (ru) | Генерирование шума в аудиокодеках | |
RU2646314C1 (ru) | Гармоническое преобразование, усовершенствованное перекрестным произведением | |
KR101617816B1 (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
JP7258118B2 (ja) | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 | |
US9583114B2 (en) | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals | |
RU2547220C2 (ru) | Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации | |
RU2582061C2 (ru) | Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио | |
JP2023015055A (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
CA2716926A1 (en) | Apparatus for mixing a plurality of input data streams | |
RU2012147587A (ru) | Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания | |
KR102037691B1 (ko) | 오디오 프레임 손실 은폐 | |
RU2015102588A (ru) | Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей | |
RU2353980C2 (ru) | Аудиокодирование | |
RU2650031C2 (ru) | Проектирование таблицы частотных диапазонов для алгоритмов высокочастотной реконструкции | |
US20160035365A1 (en) | Sound encoding device, sound encoding method, sound decoding device and sound decoding method | |
EP4120257A1 (en) | Coding and decocidng of pulse and residual parts of an audio signal | |
Liuni et al. | A reduced multiple Gabor frame for local time adaptation of the spectrogram | |
EP4120253A1 (en) | Integral band-wise parametric coder | |
JP2006262292A (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
TH77173B (th) | โคเดกเสียงที่ใช้การสังเคราะห์สัญญาณรบกวนในระหว่างเฟสที่ไม่มีการใช้งาน | |
TH146525A (th) | การสร้างสัญญาณรบกวนในโคเดกสัญญาณเสียง | |
TH69255B (th) | การสร้างสัญญาณรบกวนในโคเดกสัญญาณเสียง |