KR20130133847A - 오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩 - Google Patents
오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩 Download PDFInfo
- Publication number
- KR20130133847A KR20130133847A KR1020137024213A KR20137024213A KR20130133847A KR 20130133847 A KR20130133847 A KR 20130133847A KR 1020137024213 A KR1020137024213 A KR 1020137024213A KR 20137024213 A KR20137024213 A KR 20137024213A KR 20130133847 A KR20130133847 A KR 20130133847A
- Authority
- KR
- South Korea
- Prior art keywords
- track
- pulse
- positions
- tracks
- pulses
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 claims description 56
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 4
- 238000013459 approach Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000008707 rearrangement Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
인코드된 오디오 신호를 디코딩하는 장치가 제공되며, 여기서 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 각 트랙들은 복수의 트랙 포지션들과 복수의 펄스들을 가진다. 디코딩 장치가 펄스 정보 디코더(110) 및 신호 디코더(120)를 가진다. 펄스 정보 디코더(110)가 복수의 펄스 포지션들을 디코드하도록 구성된다. 여기서, 펄스 포지션들 각각이 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고, 여기서 펄스 정보 디코더가 복수의 펄스 포지션들을 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자, 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스들 숫자 및 하나의 상태 번호를 사용하여 디코드하도록 구성된다. 신호 디코더(120)가 인코드된 오디오 신호를 복수의 펄스 포지션들과 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 디코드하도록 구성된다.
Description
본 발명은 오디오 프로세싱 및 오디오 코딩 분야에 관한 것으로, 특히 오디오 신호에서 트랙들의 펄스 포지션들의 인코딩 및 디코딩에 관한 것이다.
오디오 프로세싱 및/또는 코딩이 많은 방식들에서 발전하고 있다. 오디오 코딩에서, 선형 예측 코더들이 중요한 역할을 한다. 예를 들어, 스피치(speech)를 포함하는 오디오 신호와 같은 오디오 신호를 인코딩 할 때, 선형 예측 인코더들이 일반적으로 오디오 신호의 스펙트럼의 포락선(envelope)의 표현을 인코드한다. 이를 위해, 선형 예측 인코더들이 인코드된 형태에서 사운드의 스펙트럼의 포락선을 표현하기 위한 예측 필터 계수들을 결정할 수 있다. 이후에 예측 필터 계수들을 사용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 필터 계수들이 선형 예측 디코더에 의해 사용될 수 있다.
선형 예측 코더들에 대한 중요한 예들이 ACELP(Algebraic Code-Exited Linear Prediction coders) 코더들이다. ACELP 코더들은 예를 들어, USAC(Unified Speech and Audio Coding)에서 넓게 사용되고, 예를 들어, LD-USAC(Low Delay Unified Speech and Audio Coding)에서 추가의 응용 분야를 가질 수 있다.
예측 필터 계수들을 결정함으로써 ACELP 인코더들이 일반적으로 오디오 신호를 인코드한다. 더 나은 인코딩을 획득하기 위해서, ACELP 인코더들은 목표 신호로 불리기도 하는 잔여 신호(residual signal)를 인코드될 오디오 신호와 이미 결정된 예측 필터 계수들에 기초하여 결정한다. 잔여 신호가 예를 들어, 인코드되는 오디오 신호와 예측 필터 계수들과 가능하게는 피치(pitch) 분석 결과의 적응 필터 계수들에 의해서 인코드되는 신호 부분들 간의 차이를 나타내는 다른 신호 표현이 될 수 있다. ACELP 인코더는 이후 잔여 신호를 인코드하는 것이 목적으로 한다. 이를 위해, 인코더가 잔여 신호를 인코드하는데 사용되는 대수 코드북(algebraic codebook) 파라미터들을 인코드한다.
잔여 신호를 인코드하기 위해, 대수 코드북들이 사용된다. 일반적으로, 대수 코드북들은 예를 들어, 각 16개의 트랙 포지션들을 포함하는 4개의 트랙과 같은, 복수의 트랙들을 포함한다. 이와 같은 구성에서, 예를 들어, 인코드되는 오디오 신호의 서브프레임의 샘플들의 수에 상응하여, 4·16=64 샘플 포지션들이 각 대수 코드북에 의해서 표현될 수 있다.
코드북의 트랙들이 인터리브될 수 있으며, 이는 코드북의 트랙 0이 서브프레임의 샘플들 0, 4, 8, ..., 60을 대표하고, 트랙 1이 서브프레임의 샘플들 1, 5, 9, ..., 61을 대표하고, 트랙 2가 서브프레임의 샘플들 2, 6, 10, ..., 62를 대표하고, 트랙 3이 서브프레임의 샘플들 3, 7, 11, ..., 63을 대표하는 것과 같다. 각 트랙은 고정된 수의 펄스들을 가질 수 있다. 또는 트랙당 펄스들의 수는 예를 들어, 다른 조건들에 따라서 변할 수 있다. 펄스는, 예를 들어, 양 또는 음이 될 수 있고, 예를 들어, +1(양의 펄스) 또는 0(음의 펄스)으로 표현될 수 있다.
잔여 신호를 인코드하기 위해, 인코딩할때, 코드북 구성이 잔여 신호의 나머지 신호 부분을 가장 잘 표현하도록 선택될 수 있다. 이를 위하여, 사용가능한 펄스들은 인코드되는 최적의 신호 부분을 반영하도록 적절한 트랙 포지션들에 위치할 수 있다. 더욱이, 상응하는 펄스가 양인지 음인지 여부에 특정화 될 수 있다.
디코더 측에서, ACELP 디코더가 먼저 대수 코드북 파라미터들을 디코드한다. ACELP 디코더가 적응 코드북 파라미터들 또한 디코드 할 수 있다. 대수 코드북 파라미터를 결정하기 위해서, ACELP 디코더가 대수 코드북의 각 트랙에 대한 복수의 펄스 포지션들을 결정할 수 있다. 더욱이, ACELP 디코더가 또한 트랙 포지션의 펄스가 양인지 음인지 여부를 디코드 할 수 있다. 뿐만 아니라, ACELP 디코더가 적응 코드북 파라미터들도 디코드 할 수 있다. 이 정보에 기초하여, ACELP 디코더가 일반적으로 여기 신호(exicitation signal)를 생성한다. 디코드된 오디오 신호를 획득하기 위하여 합성 오디오 신호를 생성하도록 ACELP 디코더가 그 후에 예측 필터 계수들을 여기 신호에 적용한다.
ACLEP에서, 트랙에 대한 펄스들이 일반적으로 다음과 같이 인코드된다. 트랙이 길이가 16이고, 이 트랙에 대한 펄스의 수가 1이면, 펄스 포지션을 포지션(4비트)와 부호(1비트), 총 5비트로 인코드 할 수 있다. 트랙의 길이가 16이고, 펄스들의 수가 2이면, 첫 번째 펄스는 포지션(4비트)와 부호(1비트)로 인코드 된다. 왜냐하면, 두 번째 펄스의 부호를 첫 번째 펄스의 좌측에 있으면, 양으로, 첫 번째 펄스의 우측에 있으면, 음으로, 첫 번째 펄스와 같은 위치에 있으면 같은 부호로 선택할 수 있기 때문에 두 번째 펄스에 대해서, 포지션 4비트만 필요하다. 종합하면, 그러므로 2개의 펄스들을 인코드하는데 9비트가 필요하다. 펄스 포지션들을 각각 5비트씩으로 인코딩하는 것과 비교하면 매 펄스 쌍에 대해서 1비트를 절약한다.
둘 이상의 다수의 펄스들의 인코딩에 있어서, 펄스들을 쌍으로 인코드 할 수 있고, 펄스들의 수가 홀수이면, 마지막 펄스는 따로 인코드한다. 예를 들어, 5개 펄스들의 트랙에 대해서, 9+9+5=23 비트가 필요하다. 4개의 트랙들이 있으면, 4×23=92 비트들이 4개의 트랙들과 트랙당 5 펄스들을 가진 길이 64의 서브프레임을 인코딩하는데 필요하다. 그러나, 추가로 비트의 수가 더 감소하면, 높게 평가될 수 있다.
본 발명의 목적은 오디오 신호의 트랙들의 펄스들의 인코딩 및 디코딩에 대한 향상된 개념을 제공하는 것이다.
본 발명의 목적은 오디오 신호의 트랙들의 펄스들의 인코딩 및 디코딩에 대한 향상된 개념을 제공하는 것이다. 본 발명의 목적들은 청구항 1에 따른 디코딩하는 장치, 청구항 9에 따른 인코딩하는 장치, 청구항 13에 따른 디코딩하는 방법, 청구항 14에 따른 인코딩하는 방법 및 청구항 15에 따른 컴퓨터 프로그램에 의해 획득된다.
실시예들에 따르면, 하나의 상태 번호(state number)가 디코딩하는 장치를 위하여 사용 가능하다고 가정된다. 이에 더하여 인코드된 오디오 신호와 연관되는 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number) 및 적어도 하나의 트랙들의 펄스들의 수를 나타내는 전체 펄스들 숫자(total pulses number)가 본 발명의 디코딩하는 장치를 위하여 사용 가능하다고 가정된다. 바람직하게는 트랙 포지션들 숫자 및 전체 펄스들 숫자가 인코드된 오디오 신호와 연관된 각 트랙들에 대하여 사용 가능하다.
예를 들어, 5개의 펄스들을 가진 4개의 트랙들을 가지면, 대략 6.6×10^21 상태들에 이를 수 있으며, 실시예들에 따라 73비트들로 인코드 될 수 있고, 위에 기술된 92비트를 사용하는 최첨단 인코더 보다 대략 21%정도 더 효율적이다.
먼저, 효율적인 방법으로 오디오 신호의 트랙의 복수의 펄스 포지션들을 인코드하는 방법에 대한 개념이 제공된다. 다음에서, 트랙의 펄스들의 포지션뿐만 아니라 펄스가 양인지 음인지 여부를 인코드하는 것을 허용하는 개념까지 확장된다. 더욱이, 그 후에 효율적인 방식으로 복수의 트랙들에 대한 펄스 정보를 인코드하는 것을 허용하는 개념까지 확장된다. 개념들은 디코더 측에서 상응하여 적용된다.
이에 더하여, 실시예들은 인코딩 전략이 미리 결정된 수의 비트를 사용하면,각 트랙에서 동일한 수의 펄스들을 가진 어느 설정에서 동일한 수의 비트가 필요하다는 결과에 기초한다. 만약 사용 가능한 비트의 수가 고정되면, 얼마나 많은 펄스들이 미리 결정된 품질의 인코딩을 가능하게 하는 주어진 비트의 양으로 인코드 되는 것이 가능한 것인지를 직접 선택하는 것이 가능하다. 더욱이, 이런 접근 방법으로, 원하는 비트율이 구해질 때까지 다른 펄스들의 양으로 시도할 필요가 없을 뿐 아니라 직접 정확한 양의 펄스들을 선택할 수 있고, 따라서 복잡도가 감소한다.
위의 가정들에 기초하여, 오디오 신호 프레임의 트랙의 복수의 펄스 포지션들이 인코드 또는 디코드 될 수 있다.
본 발명이 어떤 종류의 오디오 신호의, 예를 들어, 스피치 신호들 또는 음악 신호들의 인코딩 또는 디코딩에 사용될 수 있지만, 본 발명은 특히 스피치 신호의 인코딩 또는 디코딩에 유용하다.
다른 실시예에서, 펄스 정보 디코더가 트랙 포지션들 숫자, 전체 펄스들 숫자 및 상태 번호를 사용하여 복수의 펄스 부호들을 디코드하도록 추가적으로 구성되고, 여기서 펄스들의 부호들 각각은 복수의 펄스들중 하나의 부호를 나타낸다. 신호 디코더가 추가적으로 복수의 펄스 부호들을 이용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 구성될 수 있다.
추가의 실시예에 따르면, 여기서 하나 또는 그 이상의 트랙들이 적어도 하나의 마지막 트랙 및 하나 또는 그 이상의 다른 트랙들을 포함할 수 있고, 펄스 정보 디코더가 제1 서브상태 번호 및 제2 서브상태 번호를 상태 번호로부터 생성하도록 구성될 수 있다. 펄스 정보 디코더가 제1 서브상태 번호에 기초하여 펄스 포지션들의 제1 그룹을 디코드하도록 구성될 수 있고, 펄스 정보 디코더가 이에 더해서 제2 서브상태 번호에 기초하여 펄스 포지션들의 제2 그룹을 디코드하도록 구성될 수 있다. 펄스 포지션들의 제2 그룹이 마지막 트랙의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성될 수 있다. 펄스 포지션들의 제1 그룹이 하나 또는 그 이상의 다른 트랙들의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성될 수 있다.
다른 실시예에 따르면, 상태 번호를 나눗셈의 결과로 정수 부분과 나머지 부분을 획득하기 위하여 상태 번호를 f(pk, N)으로 나누어서 제1 서브상태 번호 및 제2 서브상태 번호로 분리하도록 펄스 정보 디코더가 구성될 수 있고, 여기서, 정수 부분이 제1 서브상태 번호이고, 나머지가 제2 서브상태 번호이며, pk는 하나 또는 그 이상의 트랙들 각각의 펄스들의 수를 나타내고, N이 하나 또는 그 이상의 트랙들 각각의 트랙 포지션들 수를 나타낸다. f(pk, N)는 pk펄스들을 가진 길이 N의 트랙에서 획득할 수 있는 상태들의 수를 반환하는 함수이다.
다른 실시예에서, 펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호를 임계 값과 비교하는 테스트를 수행하도록 구성될 수 있다.
펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호가 임계 값보다 큰지, 크거나 동일한지, 작은지, 또는 작거나 동일한지 비교하는 테스트를 수행하도록 구성될 수 있고, 여기서 분석부는 상태 번호 또는 테스트 결과에 종속되어 업데이트된 상태 번호를 업데이트 하도록 추가로 구성된다.
일 실시예에서, 펄스 정보 디코더가 상태 번호 또는 업데이트된 상태 번호를 복수의 트랙들 중 하나의 각 트랙 포지션에 대한 임계 값과 비교하도록 구성될 수 있다.
일 실시예에 따르면, 펄스 정보 디코더가 트랙들 중 하나를 복수의 트랙 포지션들 중 적어도 하나의 트랙 포지션을 포함하는 제1 트랙 부분과 복수의 트랙 포지션들 중 다른 나머지 트랙 포지션을 포함하는 제2 트랙 부분으로 나누도록 구성될 수 있다. 제1 서브상태 번호 및 제2 서브상태 번호를 상태 번호를 기초로하여 생성하도록 펄스 정보 디코더가 구성될 수 있다. 더욱이, 제1 서브상태 번호를 기초로하여 제1 트랙 부분과 연관된 펄스 포지션들의 제1 그룹을 디코드하도록 펄스 정보 디코더가 구성될 수 있다. 더욱이, 제2 서브상태 번호를 기초로하여 제2 트랙 부분과 연관된 펄스 포지션들의 제2 그룹을 펄스 정보 디코더가 디코드하도록 구성될 수 있다.
일 실시예에 따르면, 오디오 신호를 인코딩하는 장치를 제공한다. 인코딩하는 장치는 오디오 신호와 연관된 복수의 예측 필터 계수를 오디오 신호에 기초한 잔여 신호와 복수의 예측 필터 계수를 생성하기 위하여 결정하도록 구성된 신호 처리기를 포함한다. 더욱이, 인코딩하는 장치가 오디오 신호를 인코드하기 위하여 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들 및 잔여 신호와 연관된 하나 또는 그 이상의 트랙들을 인코드하도록 구성된 펄스 정보 인코더를 포함한다. 각 트랙은 복수의 트랙 포지션들 및 복수의 펄스들을 가진다. 펄스 포지션들 각각은 트랙의 펄스들 중 하나의 포지션을 나타내기 위한 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다. 펄스 정보 인코더가 복수의 펄스 포지션들을 상태 번호를 생성함으로써 인코드하도록 구성되고, 펄스 포지션들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자 및 적어도 하나의 트랙들의 펄스들이 전체 수를 나타내는 전체 펄스들 숫자만을 기초로 하여 디코드될 수 있도록 한다.
다른 실시예에 따르면, 펄스 정보 인코더가 복수의 펄스 부호들을 인코드하도록 구성될 수 있고, 여기서 펄스 부호들 각각이 복수의 펄스들 중 하나의 부호를 타나낸다. 펄스 정보 인코더가 복수의 펄스 부호들을 상태 번호를 생성함으로써 인코드하도록 추가로 구성될 수 있고, 펄스 부호들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들 수를 나타내는 트랙 포지션들 숫자 및 전체 펄스 숫자만을 기초로 하여 디코드 될 수 있도록 한다.
일 실시예에서, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 정수 값을 트랙들 중 하나의 각 트랙 포지션에 대해서 트랙 포지션의 각 펄스에 대한 중간 번호에 가산하도록 구성된다.
다른 실시예에 따르면, 펄스 정보 인코더가 트랙들 중 하나를 복수의 트랙 포지션들 중 적어도 하나의 트랙 포지션을 포함하는 제1 트랙 부분과 복수의 트랙 포지션들 중 나머지 다른 트랙포지션을 포함하는 제2 트랙 부분으로 나누도록 구성될 수 있다. 더욱이, 펄스 정보 인코더가 제1 부분과 연관된 제1 서브상태 번호를 인코드하도록 구성될 수 있다. 뿐만 아니라, 펄스 정보 인코더가 제2 부분과 연관된 제2 서브상태 번호를 인코드하도록 구성될 수 있다. 더욱이, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성될 수 있다.
인코딩하는 장치와 향상된 인코딩 또는 디코딩 개념을 가진 상응하는 디코딩하는 장치가 제공되면 매우 높게 평가될 수 있고, 여기서 장치들은 펄스 정보를 펄스 정보 표현에 대하여 보다 적은 비트들을 사용하는 향상된 방법의 인코드 또는 디코드하는 수단을 가지며, 이것은 예를 들어 인코드된 오디오 신호를 각각 전송하기 위한 전송률을 감소시키는 것 그리고, 예를 들어 각각의 인코드된 오디오 신호를 저장하기 위한 저장소(storage)를 감소시키는 것이 될 수 있다.
도 1은 본 발명의 실시예에 따른 인코드된 오디오 신호를 디코딩하는 장치를 나타내는 블록도이다.
도 2는 본 발명의 실시예에 따른 오디오 신호를 인코딩하는 장치를 나타내는 블록도이다.
도 3은 부호를 갖지 않은 두 개의 펄스들과 세 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 4는 부호를 가진 하나의 펄스와 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 5는 부호를 가진 두 개의 펄스들과 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 펄스 정보 디코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.
도 7은 본 발명의 실시예에 따른 펄스 정보 인코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.
도 2는 본 발명의 실시예에 따른 오디오 신호를 인코딩하는 장치를 나타내는 블록도이다.
도 3은 부호를 갖지 않은 두 개의 펄스들과 세 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 4는 부호를 가진 하나의 펄스와 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 5는 부호를 가진 두 개의 펄스들과 두 개의 트랙 포지션들을 가진 트랙에 대한 모든 가능한 설정을 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 펄스 정보 디코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.
도 7은 본 발명의 실시예에 따른 펄스 정보 인코더에 의해 수행되는 처리 단계들을 나타내는 흐름도이다.
도 1은 인코드된 오디오 신호를 디코딩하는 장치를 나타내며, 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 트랙들 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가진다.
디코딩 장치는 펄스 정보 디코더(110)과 신호 디코더(120)를 포함한다. 펄스 정보 디코더(110)가 복수의 펄스 포지션들을 디코드하도록 구성된다. 펄스 포지션들 각각은 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다.
펄스 정보 디코더(110)가 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number)와 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)와 하나의 상태 번호(state number)를 사용하여 복수의 펄스 포지션들을 디코드하도록 구성된다.
신호 디코더(120)가 복수의 펄스 포지션들과 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코드하도록 구성된다.
상태 번호는 다음에 기술될 실시예에 따른 인코더에 의하여 인코드될 수 있는 수이다. 상태 번호는 예를 들어 압축된 표현에서 복수의 펄스 포지션들에 대한 정보를 포함하며, 예를 들어 표현은 적은 비트들을 필요로 하고, 디코더 측에서 트랙 포지션들과 전체 펄스들 수에 관한 정보가 사용가능할 때 디코드 될 수 있다.
일 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 디코더 측에서 사용가능할 수 있으며, 왜냐하면, 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자는 변하지 않는 정적 값이고 수신기에 의해 알려진 값이기 때문이다. 예를 들어서, 트랙 포지션들 숫자는 각 트랙에 대하여 항상 16이 될 수 있고, 전체 펄스들 숫자는 항상 4가 될 수 있다.
다른 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 디코딩하는 장치로 예를 들어 인코딩하는 장치에 의하여 명확하게 전송될 수 있다.
추가의 실시예에서, 디코더가 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 다른 파라미터들을 분석함으로써 결정할 수 있고, 다른 파라미터들이 명백하게 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 서술하지는 않으나, 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자가 도출될 수 있다.
다른 실시예에서, 오디오 신호의 각 트랙 또는 하나의 트랙 포지션들 숫자 및/또는 전체 펄스들 숫자를 도출하기 위하여 디코더는 다른 사용가능한 데이터를 분석할 수 있다.
추가의 실시예에서, 펄스 정보 디코더가 펄스가 양의 펄스인지 음의 펄스인지 디코드하도록 구성될 수 있다.
다른 실시예에서, 펄스 정보 디코더가 추가로 복수의 트랙들에 대한 펄스들의 정보를 포함하는 펄스 정보를 디코드하도록 구성될 수 있다. 펄스 정보는 예를 들어, 트랙에서 펄스들의 포지션에 관한 정보 및/또는 펄스가 양의 펄스인지 음의 펄스인지 여부에 관한 정보가 될 수 있다.
도 2는 신호 처리기(210)와 펄스 정보 인코더(220)를 포함하는 오디오 신호를 인코딩하는 장치를 나타낸다.
신호 처리기(210)가 오디오 신호에 기초한 잔여 신호(residual signal)와 복수의 예측 필터 계수들을 생성하기 위해서 오디오 신호와 연관된 복수의 예측 필터 계수를 결정하도록 구성된다.
펄스 정보 인코더(220)가 오디오 신호를 인코드하기 위해서 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코드하도록 구성된다. 하나 또는 그 이상의 트랙들이 신호 처리기(210)에 의해 생성된 잔여 신호와 연관된다. 트랙들 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가진다. 더욱이, 펄스 포지션들 각각이 트랙의 펄스들 중 하나의 포지션을 나타내도록 트랙들 중 하나의 트랙 포지션들 중 하나를 나타낸다.
펄스 정보 인코더(220)가 복수의 펄스 포지션들을 상태 번호를 생성함으로써 펄스 포지션들이 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자 및 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스 숫자만을 기초로 하여 디코드 될 수 있도록 인코드 하기 위해 구성된다.
다음에서, 상태 번호를 생성함으로써 펄스 포지션들과 가능한 펄스 부호(양의 펄스 또는 음의 펄스)를 인코딩하는 것과 관련된 본 발명의 실시예들의 기본 개념이 제시된다.
본 발명의 실시예들의 인코딩 원칙은 n 트랙 포지션들을 가진 하나의 트랙에서 k 펄스들의 모든 가능한 구성의 상태 목록이 고려되면, 트랙의 펄스들의 실제 상태를 인코드하는데 충분하다는 결과에 기초를 둔다. 가능한 적은 비트에 의한 상태의 인코딩이 바람직한 압축 인코딩을 제공한다. 이에 의하여, 상태 목록의 개념이 제공되며, 여기서 펄스 포지션들의 각 성좌(constellation)와 또한 가능한 펄스 부호들이 하나의 상태를 표현하고, 각 상태는 고유하게 열거된다.
도 3은 두 개의 펄스들과 세 개의 트랙 포지션을 가진 하나의 트랙이 고려될 때, 모든 가능한 설정들이 그려진 간단한 경우를 나타낸다. 두 펄스들은 동일한 트랙 포지션에 위치할 수 있다. 도 3의 예에서, 펄스들의 부호(예를 들면, 펄스가 양인지 음인지)는 고려되지 않으며, 이와 같은 예에서, 모든 펄스들은 예를 들어, 양으로 고려된다.
도 3에서, 세 개의 트랙 포지션들(도 3에서, 트랙 포지션들 1,2 및 3)을 가진 하나의 트랙에서 두 개의 방향성 없는(undirected) 펄스들의 위치하는 모든 가능한 상태들이 나타내어진다. 트랙에서 펄스들이 분배되는 방법을 묘사한 6개의 다른 가능한 상태(도 3에서, 0 부터 5까지 열거됨)만 존재한다. 이에 의하면, 실제 현재 구성을 묘사하기 위해서 범위 0 부터 5까지의 상태 번호를 사용하는 것으로 충분하다. 예를 들면, 도 3의 예에서 상태 번호가 4이고, 디코더가 인코딩 구조를 알고 있으면, 디코더가 상태 번호 4는 트랙이 트랙 포지션 1에 하나의 펄스와 다른 펄스는 트랙 포지션 3에 가진 것으로 결론내릴 수 있다. 이에 의하면, 도 3의 예에서, 도 3의 6가지 다른 상태들 중 하나로 식별하기 위한 상태 번호를 인코드하기 위하여 3비트로 충분하다.
도 4는 두 개의 트랙 포지션들(도 4에서, 트랙 포지션 1 및 2)을 가진 하나의 트랙에서 하나의 방향성을 가진 펄스의 위치에 대한 모든 가능한 상태들을 묘사하는 경우를 나타낸다. 도 4에서, 펄스들의 부호(펄스가 양인지 음인지)가 고려된다. 트랙에서 펄스가 분배되는 방법과 그의 부호(양 또는 음)를 묘사하는 4가지 가능한 상태들(도 4에서 0 부터 3까지 열거됨)이 있다. 범위 0 부터 3까지의 상태 번호를 사용하여 실제 현재 구성을 묘사하는데 충분하다. 예를 들어, 도 4의 예에서 상태 번호가 2이고, 디코더가 인코딩 구조를 알고 있으면, 디코더가 상태 번호 2가 트랙 포지션 1에 양의 펄스인 하나의 펄스를 가진 트랙을 의미하는 것으로 결론내릴 수 있다.
도 5는 두 개의 펄스들과 두 개의 트랙 포지션들을 가진 트랙이 고려될 때, 모든 가능한 구성들이 묘사된 추가의 경우를 나타낸다. 펄스들은 동일한 트랙 포지션에 위치할 수 있다. 도 5에서 보여지는 예에서, 펄스들의 부호(예를 들어, 펄스가 양인지 음인지)가 고려된다. 동일한 트랙 포지션에 있는 펄스들은 동일한 부호(예를 들어, 동일한 트랙 포지션의 트랙들은 모두 양이거나 모두 음이다)를 가진다고 가정된다.
도 5에서, 두 개의 트랙 포지션들(도 5에서, 트랙 포지션 1 및 2)을 가진 트랙에서 두 부호를 가지고 위치한 펄스들(예를 들어 펄스들은 양 또는 음인)의 모든 가능한 상태들이 나타내어진다. 트랙에서 펄스들이 분배될 수 있는 방법들을 묘사하는 8 가지의 다른 가능한 상태들(도 5에서 0부터 7까지 열거됨)이 있다. 이에 의하면, 실제 구성을 묘사하는데 범위 0 부터 7까지의 상태 번호를 사용하면 충분하다. 예를 들어, 도 5의 예에서 상태 번호가 3이고, 디코더가 인코딩 구조를 알면, 디코더가 상태 번호 3이 트랙 포지션 1에 양인 하나의 펄스와 트랙 포지션 2에 음인 하나의 펄스를 가진 트랙으로 결론 내릴 수 있다. 이에 의하면, 도 5의 예에서, 도 5의 8가지 다른 상태들 중 하나로 식별하기 위하여 상태 번호를 인코드하기에 3비트로 충분하다.
ACELP에서, 잔여 신호는 고정된 수의 부호표시된(signed) 펄스들로 인코드될 수 있다. 위에 서술한 것처럼, 펄스들은 예를 들어, 트랙 0이 mod(n,4)==0 인 포지션을 포함하고, 트랙 1이 mod(n,4)==1인 포지션을 포함하는 방식이 되도록 4개의 인터레이싱 된 트랙들로 분배될 수 있다. 각 트랙은 미리 정의된 수의 부호표시된 단위 펄스들을 가질 수 있고, 펄스들은 중첩될 수 있으나, 중첩되는 경우 펄스들은 동일한 부호를 갖는다.
펄스들을 인코딩함으로써, 펄스 포지션들과 그들의 부호로부터 가장 작은 가능한 비트들 양을 사용하는 표현으로 매핑하는 것이 달성되야 한다. 이에 더하여, 펄스 코딩이 고정된 비트 소비를 가져야 하며, 즉, 어떤 펄스 성좌가 동일한 수의 비트를 가진다.
각 트랙은 먼저 독립적으로 인코드되고, 각 트랙의 상태들은 전체 서브프레임의 상태를 표현하는 하나의 번호로 결합된다. 모든 상태가 동일한 확률을 가지고 고정된 비트 소비가 주어지면, 이런 접근은 수학적으로 최적의 비트 소모를 제공한다.
상태 열거(state enumeration) 개념은 다른 상태 성좌들의 압축 표현을 사용하여 또한 설명될 수 있다:
우리가 코드하고자 하는 잔여 신호를 x n 하자. 예를 들어 대수 코드북의 4로 인터리브된 트랙들을 고려하고, 샘플들 을 가진 제1 트랙, 샘플들 을 가진 제2 트랙 등등을 가정한다. 제1 트랙이 하나의 부호표시된 단위로 양자화되고, T=8, 트랙의 길이는 2라고 가정한다(T=인코드될 잔여 신호의 길이(샘플들)). T=8이고, 잔여 신호를 인코드하는데 사용되는 트랙들이 4이면, 4개의 트랙들 각각은 2개의 트랙 포지션들을 갖는다. 예를 들어, x0과 x4 두 개의 트랙 포지션을 갖는 제1 트랙이 고려된다. 제1 트랙의 펄스는 다음의 성좌들의 어느 하나에 나타날 수 있다:
이 구성에 대하여 4가지 다른 상태들이 있다.
유사하게, 두 개의 트랙 포지션들 x0 및 x4를 가진 제1 트랙에서 두 개의 펄스들이 있으면, 펄스들은 다음의 성좌들에서 할당될 수 있다.
따라서 이 구성은 8가지 상태를 가진다.
잔여 신호의 길이가 T=12로 확장되면, 4개 트랙 각각은 3개의 트랙 포지션들을 갖는다. 제1 트랙이 하나 더 샘플을 제공받아, 트랙 포지션들이 x0, x4, x8을 가지게 되며, 다음과 같다:
위 표는 만일 x8=0(x8에 펄스 없음)이면, x0 과 x4에 대한 8가지 다른 상태들이 있음; 만일 x8=1(x8에 하나의 양의 펄스)이면, x0과 x4에 대한 4 가지 다른 상태들이 있음; 만일 x8=-1(x8에 하나의 음의 펄스)이면, x0과 x4에 대한 4 가지 다른 상태들이 있음; 만일 x8=2(x8에 두 개의 양의 펄스)이면, x0과 x4에 대한 하나의 상태있음; 만일 x8=-2(x8에 두 개의 음의 펄스)이면, x0과 x4에 대한 하나의 상태가 있음을 의미한다.
여기서, 첫 줄에 대한 상태들의 수는 두 개의 이전 표들로부터 획득한 것이다. 첫 번째 줄에서 상태들의 수를 추가함으로써, 이 구성이 18개의 상태들을 가지는 것을 볼 수 있다.
T=12인 예에서, 모든 18가지 다른 가능한 상태들을 인코드하는데 5비트로 충분하다. 예를 들어 인코더는 범위[0,...,17]에서 18가지 구성들 중 하나를 특정하기 위하여 상태 번호를 선택할 수 있다. 만일 디코더가 인코딩 구조를 알고 있다면, 예를 들어, 상태 번호가 표현하는 구성을 알고 있다면, 디코더는 트랙에 대한 펄스 포지션들과 펄스 부호들을 디코드할 수 있다.
아래에서, 실시예에 따른 적절한 인코딩 방법들과 상응하는 디코딩 방법들이 제공될 것이다. 실시예에 따르면, 인코딩하는 장치가 아래에 제시되는 인코딩 방법들 중 하나를 수행하도록 구성되어 제공된다. 더욱이, 추가의 실시예에 따르면, 디코딩하는 장치가 아래에 제시되는 디코딩 방법들 중 하나를 수행하도록 구성되어 제공된다.
실시예들에서, 상태 번호를 생성하거나 상태 번호, p 펄스들을 가진 N 트랙 포지션들에 대한 가능한 구성들의 수를 디코드하는것이 계산되어 질 수 있다.
펄스들은 부호화 될 수 있고, 재귀 공식(recursive formular)이 사용될 수 있다. 재귀 공식은 N 트랙 포지션들과 부호표시된 p 펄스들(펄스들은 양 또는 음이 될 수 있고, 동일한 트랙 포지션의 펄스들은 동일한 부호를 가진다)을 가진 트랙에 대한 f(p, N) 상태들의 수를 계산하며, 여기서 재귀 공식 f(p, N) 이 다음과 같이 정의된다:
초기 조건들은
이며, 하나 또는 그 이상의 펄스들을 가진 하나의 포지션은 부호에 대하여 하나의 비트(2 상태들)을 필요로 하기 때문이다.
재귀 공식이 모든 다른 성좌들의 합계이다.
다시 말해, 주어진 p 펄스들에서, 현재 포지션 qN이 0내지 p펄스들을 가질수 있고, 따라서 나머지 N-1 포지션들이 p-qN 펄스들을 가진다. 현재 포지션에서 상태들의 수와 나머지 N-1 포지션들이 펄스들의 조합들을 가진 상태들의 수를 획득하기 위하여 곱해지고, 조합들은 전체 상태들의 수를 획득하기 위하여 합계된다.
실시예들에서, 재귀 함수는 반복(iterative) 알고리즘에 의해 계산되어 질 수 있고, 여기서 재귀는 반복에 의해 대체된다.
f(p,N)의 평가가 실시간 어플리케이션들에 대해서 수적으로 상대적으로 복잡하기 때문에 일부 실시예들에 따르면, 룩업 테이블은 f(p,N)을 계산하기 위해서 사용될 수 있다. 일부 실시예들에 따르면, 테이블은 오프-라인에서 계산되어질 수 있다.
다음에서, 상태 번호의 인코딩과 디코딩에 대한 추가의 개념이 제공된다:
N 트랙 포지션들과 부호표시된 p 펄스들을 가진 트랙에 대한 가능한 구성들의 수를 f(p, N)이라고 하자.
펄스 정보 인코더가 트랙을 분석할 수 있다: 만일 트랙에서 제1 포지션이 펄스를 가지고 있지 않다면, 나머지 N-1 포지션들이 부호표시된 p 펄스들을 가지고, 이 성좌를 기술하기 위해서, 단지 f(p, N-1) 상태들만 필요하다.
그 외에는, 만일 제1 포지션이 하나 또는 그 이상의 펄스들을 가지면, 펄스 정보 인코더가 f(p, N-1) 보다 큰 전체 상태를 정의할 수 있다.
펄스 정보 디코더에서, 펄스 정보 디코더가 예를 들어, 마지막 포지션에서 출발하고, 임계 값 예를 들어 f(p,N-1)을 가진 상태와 비교할 수 있다. 만일 임계값 보다 크면, 펄스 정보 디코더가 마지막 포지션이 적어도 하나의 펄스를 가진다고 결정할 수 있다. 펄스 정보 디코더가 상태로부터 f(p, N-1)을 차감함으로써 업데이트된 상태 번호를 획득하고, 남은 펄스들의 수를 하나 차감하여 상태를 업데이트 할 수 있다.
반면에, 마지막 포지션에 펄스가 하나도 없으면, 펄스 정보 디코더가 남은 포지션들의 수를 하나 차감할 수 있다. 이 절차를 남은 펄스가 없을 때까지 반복하여 펄스들의 부호화되지 않은 포지션들을 제공한다.
펄스들의 부호들을 고려하기 위해서, 펄스 정보 인코더가 상태의 가장 낮은비트에서 펄스들을 인코드 할 수 있다. 다른 실시예에서, 펄스 정보 인코더가 상태의 가장 높은 나머지 비트에서 부호를 인코드 할 수 있다. 그러나, 가장 낮은 비트에서 펄스 부호를 인코드하는 것이 이것이 정수 계산에 비하여 처리하기 쉽기 때문에 바람직하다.
펄스 정보 디코더에서 주어진 포지션의 첫 펄스가 발견되면, 펄스의 부호는 마지막 비트에 의해 결정된다. 업데이트된 상태 번호를 획득하기 위해서 남은 상태가 하나 오른쪽으로 이동된다.
실시예에서, 펄스 정보 디코더가 다음의 디코딩 알고리즘을 적용하도록 구성된다. 이 디코딩 알고리즘의 단계별 접근 방식에서, 각 트랙 포지션에 대한, 예를 들어, 번갈아서, 상태 번호 또는 업데이트된 상태 번호가 임계 값, 예를 들어 f(p,k-1)과 비교된다.
실시예에 따른, 펄스 정보 디코더 알고리즘이 제공된다:
실시예에 따른 펄스 정보에 관하여 펄스 정보 인코더가 다음의 인코딩 알고리즘을 적용하도록 구성된다. 펄스 정보 인코더가 펄스 정보 디코더와 같은 단계를 역 순서로 수행한다.
실시예에 따른, 펄스 정보 인코더 알고리즘이 제공된다:
이 알고리즘을 사용한 상태 번호 인코딩에서, 펄스 정보 인코더가 하나의 정수를 예를 들어, 알고리즘이 완수되기 이전의 상태 번호, 중간 번호(예를 들어, 중간 상태 번호)에 트랙들 중 하나의 각 펄스 포지션에 대한 트랙 포지션에서 각 펄스에 대하여 상태 번호(값)을 얻기 위해추가가한다.
예를 들어, 펄스 포지션들과 펄스 부호들인 펄스 정보의 인코딩 및 디코딩에 대한 접근이, 번갈아 단계별로 인코딩 및 디코딩 방법들에 의하여 트랙 포지션들이 고려되는 것처럼 "단계별 인코딩(step-by-step encoding)"과 "단계별 디코딩(step-by-step decoding)"으로 불릴 수 있다.
도 6은 본 발명의 일 실시예에 따른 펄스 정보 디코더에 의하여 수행되는 처리 단계를 묘사하는 흐름도이다.
현재 트랙 포지션 k를 N으로 설정한다(610). 여기서, N은 하나의 트랙에서 트랙 포지션의 수를 표현하고, 여기서 트랙 포지션들은 1부터 N까지 열거된다.
k 가 1보다 크거나 같은지 판단하고(620), 즉 고려되지 않은 트랙 포지션들이 남아 있는지 여부를 테스트한다. 만약 k가 1보다 크지 않거나 같지 않다면, 모든 트랙 포지션들이 고려되었고 프로세스는 종료한다.
반면에 상태가 f(p, k-1)보다 크거나 같은지 판단한다(630). 판단 결과가 크거나 같다면, k 포지션에 적어도 하나의 펄스가 존재한다. 판단 결과가 크지 않거나 같지 않다면, k 트랙 포지션에 펄스는 존재하지 않고, 프로세스는 단계 640으로 계속되며, 여기서 k는 1이 차감되고, 다음 트랙 포지션이 고려될 것이다.
그러나, 상태가 f(p, k-1)보다 크거나 같다면, 프로세스는 단계 642로 계속되고, 트랙 포지션 k에서 펄스가 놓여지고, 그 후에, 상태가 f(p, k-1)만큼 차감하여 업데이트 된다(644). 그 후에, 현재 펄스가 트랙 포지션 k에서 첫번째 발견된 펄스인지 판단한다(650). 판단 결과가 그렇지 않다면, 단계 680에서 남아 있는 펄스들의 수를 1만큼 차감하고, 프로세스는 단계 630으로 계속된다.
만약, 트랙 포지션 k에서 첫 번째 발견된 펄스인 경우, 프로세스는 단계 660으로 계속되고, 상태 s의 가장 낮은 비트의 설정 여부를 판단한다(660). 판단 결과 가장 낮은 비트가 설정되었으면, 이 트랙 포지션에서 펄스들의 부호가 음으로 설정되고(662), 다른 경우에는 트랙 포지션들의 부호가 양으로 설정된다(664). 두 경우 모두 상태는 오른쪽으로 한단계 이동(s:=s/2) 된다(670). 그 후에 또한, 남은 펄스들의 수가 1만큼 차감되고(680) 프로세스는 단계 630으로 계속된다.
도 7은 본 발명의 일 실시예에 따른 펄스 정보 인코더에 의하여 수행되는 처리 단계를 묘사하는 흐름도이다.
발견된 펄스들 p의 수를 0으로, 상태 s를 0으로 그리고 고려되는 트랙 포지션 k를 1로 설정한다(710).
k가 N 보다 작거나 같은지 판단하고(720), 즉 고려되지 않은 트랙 포지션들이 남아있는지 여부를 판단한다(여기서, N은 하나의 트랙에서 트랙 포지션들의 수를 의미한다). 만약 k가 N 보다 작거나 같지 않다면, 모든 트랙 포지션들은 고려되었고, 프로세스는 종료된다.
k가 N 보다 작거나 같다면, 포지션 k에 적어도 하나의 펄스가 존재하는지 여부를 판단한다(730). 판단 결과 펄스가 존재하지 않으면, 프로세스는 단계 740으로 계속되어, k가 1 증가되고 다음 트랙 포지션이 고려될 것이다.
그러나, 적어도 하나의 펄스가 트랙 포지션 k에 존재하면, 현재 고려되는 펄스가 트랙 포지션 k에서 마지막 펄스인지 여부를 판단한다(750). 판단 결과, 마지막 펄스가 아니면, 상태 s에 f(p, k-1)이 추가되어 상태 s가 업데이트 되고, 발견된 펄스들 p의 수가 1증가되고(770), 그리고 프로세스는 단계 780으로 계속된다.
만약 현재 고려중인 펄스가 트랙 포지션 k에서 마지막 펄스이면, 단계 750 이후에 프로세스는 단계 755로 계속되어, 상태를 한 단계 왼쪽으로 이동(s:=s*2)한다(755). 그 후에, 펄스의 부호가 음인지 판단한다(760). 만약 부호가 음이면, s의 가장 낮은 비트를 1로 설정한다(762); 그렇지 않다면, s의 가장 낮은 비트를 0으로 설정한다(또는 아무것도 하지 않는다)(764). 이 후, 두 경우 모두 상태 s를 상태 s에 f(p,k-1)을 더하고, 발견된 펄스들 p의 수를 1 증가하여 업데이트하고(770), 그리고 프로세스는 단계 780으로 게속된다.
포지션 k에 다른 펄스가 존재하는지 여부를 판단한다(780). 다른 펄스가 존재하면, 프로세스는 단계 750으로 계속되고, 그렇지 않다면, 프로세스는 단계 740으로 계속된다.
다음에서, 복수의 트랙들에 상태를 인코딩하는 합동 상태 번호(joint state number)를 생성하는 개념이 제공된다.
유감스럽게도, 하나의 트랙에서 가능한 상태들의 범위는 많은 경우에 2의 배수가 아니고, 각 상태의 이진 표현은 따라서 비효율적이다. 예를 들면, 가능한 상태들의 수가 5라면, 이진 수를 사용하여 표현하려면 3비트가 필요하다. 그러나, 각 5개의 상태들을 가진 4개의 트랙들이 있으면, 전체 서브 프레임에 대하여 5×5×5×5=625 상태들을 가지고 10비트들을 사용하여 표현할 수 있다(4×3=12비트 대신). 이는 3 대신에 트랙당 2.5비트들과 상응하고 따라서 트랙당 0.5 비트나 동등하게 서브프레임당 2비트를 절약할 수 있다(전체 비트 소모의 20%). 따라서, 이진 표현의 비효율성을 줄이기 위해서 각 트랙의 상태들을 하나의 합동 상태로 통합하는 것이 중요하다. 전송되는 어떤 수들에 대해서 동일한 접근을 사용할 수 있다. 예를 들면, 각 서브 프레임이 펄스들의 포지션들을 표현하는 상태를 가질 수 있으므로, 각 프레임은 예를 들어, 4개의 서브 프레임을 가지고, 이 상태들은 하나의 합동 상태 번호로 통합될 수 있다.
예를 들어, 4개의 트랙들을 가진 서브 프레임이 주어지면, 각 트랙의 상태들을 같이 인코딩함으로써 효율을 향상시켜서 비트 소비를 감소시킬 수 있다. 예를 들어, 각 트랙이 pk 펄스들을 가지고, 각 트랙의 길이가 N이면, 예를 들어, N 트랙 포지션들을 가지면, 각 트랙의 상태가 범위 0 내지 f(p,N)-1이다. 각 트랙들의 상태 sk가 공식을 가진 서브 프레임들의 합동 상태 s로 결합될 수 있다(서브 프레임당 4개의 트랙을 가정)
각 트랙의 상태들이 디코더에서 합동 상태를 f(pk,N)으로 나눔으로써 결정될 수 있으며, 나머지가 마지막 트랙의 상태이고, 정수 부분이 나머지 트랙들의 합동 상태이다. 만약 트랙들의 수가 4가 아니면, 즉시 위의 수식에서 조건의 수를 적절하게 더하거나 차감할 수 있다.
트랙당 펄스들의 수가 클때, 가능한 상태들의 수도 커진다. 예를 들어, 트랙당 6개의 펄스들을 가진 4개의 트랙들과 트랙 길이 N=16이면, 상태는 83비트이고, 이는 일반적인 CPU들의 최대 이진 수의 길이를 초과한다. 매우 긴 정수를 가지고 일반적인 방법들을 사용하여 위의 공식을 평가하기 위해서 일부 추가의 단계가 따라온다.
상태 확률들이 동일하다고 가정할 때, 이 접근이 트랙 상태들의 대수 코딩과 같은 것을 역시 관찰할 수 있다.
위에서, 예를 들어, 포지션들 및 트랙의 펄스들의 가능한 부호들과 같은 트랙의 펄스 정보 인코딩 및 디코딩에 대한 단계별 접근을 제시하고 있다. 다른 실시예들은 "분할 및 정복(split-and-conquer)" 접근이라고 불리는 다른 접근을 제공한다.
분할 및 정복 접근을 적용하도록 구성된 펄스 정보 인코더가 하나의 트랙을 두 개의 트랙 부분 x1 및 x2로 분리하고, 이는 두 개의 벡터(x=[x1 x2])로 고려될 수 있다. 기본 아이디어는 두 벡터 x1 과 x2를 각각 인코드하고, 공식에 의해서 둘을 통합하는 것이다.
위의 수학식에서, 펄스들의 수를 이미 알고 있을 때, 즉, 벡터들이 각각 p1 및 p2=p-p1일 때, 벡터 x1 및 x2의 상태들을 s(x1) 및 s(x2)로 표시한다. 벡터 x1에서 0 내지 p1-1 펄스들을 가진 모든 상태들을 고려하기 위해서, 위 수학식에서 합산 항이 추가된다.
위의 알고리즘/공식이 다음의 두 이전 프로세싱 단계들을 적용함으로써 인터레이스된 트랙들을 인코드하도록 적용될 수 있다. 먼저, 트랙 k에 대한 모든 샘플들로 벡터 를 구성하고, 이들 벡터들을 의 정의에 의해서 통합한다. 단지 샘플들의 순서를 재배열하여 트랙 1로부터 모든 샘플들이 제1 그룹에 위치하도록하고 나머지도 같은 방식으로 위치하도록 한다.
두 번째로, 트랙당 펄스들의 수는 일반적으로 고정되어있다. 트랙 1이 항상 p1 펄스들을 가지면, 모든 k≠p1에 대하여 트랙 1에서 상태들의 수는 f(k,N1)=0 이다. p1 펄스들을 가지지 않은 트랙 1에 대한 상태가 존재하지 않는 것을 말하는 다른 방식이다. 공식적으로, 상태들의 수 공식은 다음과 같이 정의될 수 있다:
N>1 인 경우에
그리고 N=1인 경우,
샘플들을 재배열함으로써, 그리고 상태들의 수에 대한 위의 정의(수학식 4)를 사용하여, 수학식 3에 의해서 모든 트랙들의 합동 상태를 계산할 수 있다. 상태들의 수가 대부분 0을 포함하므로, 트랙들의 상태를 통합할 때, 수학식 3의 합산은 0이다. 그러므로 두 트랙들의 통합은 수학식 2와 동일하다. 유사하게, 모든 4개의 트랙들(또는 5)의 통합이 두 개의 접근을 통하여 또한 동일한 결과를 제공하는 것을 즉시 보여줄 수 있다.
일 실시예에 따르면, 재배열이 인코더에 대한 전처리 단계로서 사용될 수 있다. 다른 실시예에서, 재배열은 인코더에 통합될 수 있다. 유사하게 일 실시예에서, 재배열이 디코더에 대한 후처리 단계로서 사용될 수 있다. 다른 실시예에서, 재배열은 디코더에 통합될 수 있다.
트랙에서 펄스들의 수가 고정되지 않으면, 상태들의 수 공식을 즉시 적절하게 조정할 수 있고, 여전히 동일한 인코딩 알고리즘을 사용한다.
"트랙 데이터 결합(Combining track data)" 섹션에서 제시된 접근 방법을 관찰하면, 위의 방법은 통합하는 트랙의 순서가 적절하게 선택되면 동일한 결과를 제공한다. 유사하게, 단계별 접근과 분할 및 정복 접근도 동일한 결과를 제공한다. 그러므로, 어떤 것이 더 구현에 실용적인지 또는 어떤 접근이 플랫폼의 계산적 제한에서 더 적합한지에 따라서 디코더 및 인코더에서 사용할 접근이 무엇인지 독립적으로 선택할 수 있다.
실시예에 따르면, 펄스 정보 인코더 알고리즘이 제공되고, 다음과 같이 의사 코드로 기술될 수 있다.
일 실시예에 따른 이 같은 인코딩 알고리즘에서, 펄스 정보 인코더가 트랙들 중 하나를 제1 트랙 부분과 제2 트랙 부분으로 분리하도록 구성된다. 펄스 정보 인코더가 제1 트랙 부분과 연관된 제1 서브상태 번호(substate number)를 인코드하도록 구성된다. 게다가, 펄스 정보 인코더가 제2 트랙 부분과 연관된 제2 서브상태 번호를 인코더하도록 구성된다. 더욱이, 펄스 정보 인코더가 상태 번호를 획득하기 위해서 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성된다.
유사하게, 일 실시예에 따르면, 아래와 같이 유사 코드로 기술될 수 있는 펄스 정보 디코더 알고리즘이 제공된다:
분할 및 정복 접근을 실현하는 일 실시예에서, 펄스 정보 디코더가 제1 서브상태 번호와 제2 서브상태 번호를 상태 번호에 기초하여 생성하도록 구성된다. 펄스 정보 디코더가 제1 서브상태 번호에 기초하여 트랙들 중 하나의 제1 부분의 펄스 포지션들의 제1 그룹을 디코드하도록 구성된다. 더욱이, 펄스 정보 디코더가 제2 서브상태 번호에 기초하여 트랙들 중 하나에서 제2 부분의 펄스 포지션들의 제2 그룹을 디코드하도록 구성된다.
비록 몇몇의 측면들은 장치의 관점에서 설명되었지만, 이러한 측면들은 상응하는 방법의 설명을 또한 나타내는 것을 명확하며, 여기서 블록 또는 장치는 방법의 단계 또는 방법의 단계의 특징에 대응한다. 유사하게, 방법의 단계의 관점에서 설명된 측면들은 상응하는 장치에 대해 상응하는 블록 또는 아이템 또는 특징의 설명을 또한 나타낸다.
특정 구현 요구들에 따르면, 발명의 실시예들은 하드웨어 또는 소프트웨어에서 구현될 수 있다. 구현은 디지털 저장 매체(예를 들어, 플로피 디스크(floppy disk), DVD, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리(FLASH memory))를 사용하여 실행될 수 있으며, 디지털 저장 매체는 그것들에 저장된 전자적으로 판독가능한 제어 신호들을 가지며, 이는 프로그래밍 가능한 컴퓨터 시스템과 협력하며(또는 협력하는 것이 가능하며), 그로 인해 각각의 방법이 수행된다.
발명에 따른 몇몇 실시예들은 전자적으로 판독가능한 제어 신호들을 가지는 데이터 캐리어(carrier)를 포함하며, 이는 프로그래밍 가능한 컴퓨터 시스템과 협력하는 것이 가능하며, 그로 인해 명세서에 설명된 방법들 중 하나는 수행된다.
일반적으로, 컴퓨터 프로그램 제품이 컴퓨터에서 동작하는 경우, 본 발명의 실시예들은 프로그램 코드, 방법들 중 하나의 수행을 위해 동작하는 프로그램 코드를 가지는 컴퓨터 프로그램 제품으로서 수행될 수 있다. 예를 들어, 프로그램 코드는 기계 판독가능한 캐리어 상에 저장될 수 있다.
다른 실시예들은 명세서에 설명된 방법들 중 하나의 수행을 위한 컴퓨터 프로그램을 포함하며, 이는 기계 판독가능한 캐리어 상에 또는 비-일시적인 저장 장치에 저장된다.
즉, 컴퓨터 프로그램이 컴퓨터상에서 동작하는 경우, 따라서 방법 발명의 실시예는 명세서에 설명된 방법들 중 하나의 수행을 위한 프로그램 코드를 가지는 컴퓨터 프로그램을 포함한다.
따라서, 방법 발명의 추가 실시예는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독가능한 매체)이며, 데이터 캐리어는, 자신에 기록되는, 명세서에 설명된 방법들 중 하나의 수행을 위한 컴퓨터 프로그램을 포함한다.
따라서, 방법 발명의 추가 실시예는 데이터 스트림 또는 명세서에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 시퀀스(sequence)이다. 예를 들어, 데이터 스트림 또는 신호들의 시퀀스는 데이터 통신 연결(예를 들어, 인터넷 또는 라디오 채널)을 통해 전송되기 위해 구성될 수 있다.
추가 실시예는 명세서에 설명된 방법들 중 하나의 실행을 위해 적응되거나 또는 구성되는 처리부(예를 들어, 컴퓨터 또는 프로그래밍 가능한 논리 디바이스(device))를 포함한다.
추가 실시예는 명세서에 설명된 방법들 중 하나의 실행을 위해 설치된 컴퓨터 프로그램을 가지는 컴퓨터를 포함한다.
몇몇 실시예들에서, 프로그래밍 가능한 논리 디바이스(예를 들어, FPGA)는 명세서에 설명된 방법들의 몇몇 또는 모든 기능들의 수행을 위해 사용될 수 있다. 몇몇 실시예들에서, FPGA는 명세서에 설명된 방법들 중 하나를 수행하기 위해 마이크로프로세서와 동작할 수 있다. 일반적으로, 방법들은 어떠한 하드웨어 장치에 의해서도 바람직하게 수행된다.
상기에서 설명된 실시예들은 본 발명의 원칙들을 위해 단순하게 설명되었다. 구성들의 수정들과 변화들 및 명세서에 기재된 상세한 설명들은 당업자에게 자명할 것으로 이해된다. 따라서, 이것은 계류된(impending) 특허 청구항들의 범위에 의해 오직 제한되고 실시예들에 대한 기재 및 설명에 의해 제시된 특정 상세한 설명들에 의해 제한되지 않음을 의미한다.
Claims (15)
- 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 상기 트랙들 중 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가지는 상기 인코드된 오디오 신호를 디코딩하는 장치에 있어서,
복수의 펄스 포지션들을 디코딩하는 펄스 정보 디코더(110)로서, 여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고,
적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number), 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number) 및 하나의 상태 번호(state number)를 사용하여 상기 복수의 펄스 포지션들을 디코드하도록 구성된 펄스 정보 디코더(110); 및
상기 복수의 펄스 포지션들과 상기 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수들을 사용하여 합성된 오디오 신호를 생성함으로써 상기 인코드된 오디오 신호를 디코딩하는 신호 디코더(120)를 포함하는 디코딩 장치. - 청구항 1에 있어서,
상기 펄스 정보 디코더(110)는, 상기 트랙 포지션들 숫자, 상기 전체 펄스들 숫자 및 상기 상태 번호를 사용하여 복수의 펄스 부호들을 디코드하도록 추가적으로 구성되고, 여기서 상기 펄스 부호들 각각은 상기 복수의 펄스들 중 하나의 부호를 나타내며,
상기 신호 디코더(120)는, 상기 복수의 펄스 부호들을 추가적으로 사용하여 합성된 오디오 신호를 생성함으로써 상기 인코드된 신호를 디코드하도록 구성되는 것을 특징으로 하는 디코딩 장치. - 청구항 1 또는 2에 있어서,
상기 하나 또는 그 이상의 트랙들이 적어도 하나의 마지막 트랙과 하나 또는 그 이상의 다른 트랙들을 포함하고,
상기 펄스 정보 디코더(110)는 상기 상태 번호로부터 제1 서브상태 번호(substate number)와 제2 서브상태 번호를 생성하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제1 서브상태 번호를 기초로 하여 상기 펄스 포지션들의 제1 그룹을 디코드하도록 구성되고,
상기 펄스 정보 디코더(110)가 상기 제2 서브상태 번호를 기초로 하여 상기 펄스 포지션들의 제2 그룹을 디코드하도록 구성되고,
상기 펄스 포지션들의 상기 제2 그룹은 상기 마지막 트랙의 트랙 포지션들을 나타내는 펄스 포지션들로만 구성되고,
상기 펄스 포지션들의 상기 제1 그룹은 상기 하나 또는 그 이상의 다른 트랙들을 나타내는 펄스 포지션들로만 구성되는 것을 특징으로 하는 디코딩 장치. - 청구항 3에 있어서,
상기 펄스 정보 디코더는 나눗셈의 결과로 정수 부분과 나머지 부분을 획득하기 위해 상기 상태 번호를 f(pk, N)로 나눔으로써 상기 제1 서브상태 번호와 상기 제2 서브상태 번호를 생성하도록 구성되고,
상기 정수 부분이 상기 제1 서브상태 번호, 상기 나머지 부분이 상기 제2 서브상태 번호이고,
pk 가 상기 하나 또는 그 이상의 트랙들 중 각각에 대하여 상기 펄스들의 수를 나타내고, N이 상기 하나 또는 그 이상의 트랙들 중 각각에 대하여 상기 트랙 포지션들의 수를 나타내는 것을 특징으로 하는 디코딩 장치. - 상기 청구항들 중 어느 하나에 있어서,
상기 펄스 정보 디코더(110)가 상기 상태 번호 또는 업데이트된 상태 번호를 임계 값과 비교하는 테스트를 수행하도록 구성되는 것을 특징으로 하는 디코딩 장치. - 청구항 5에 있어서,
상기 펄스 정보 디코더(110)는 상기 상태 번호 또는 업데이트된 상태 번호가 임계 값보다 큰지, 크거나 동일한지, 작은지, 작거나 동일한지 비교함으로써 상기 테스트를 수행하도록 구성되고, 상기 펄스 정보 디코더(110)가 상기 상태 번호 또는 상기 테스트의 결과에 따라 업데이트된 상태 번호를 업데이트하도록 추가적으로 구성되는 것을 특징으로 하는 디코딩 장치. - 청구항 6에 있어서,
상기 펄스 정보 디코더(110)는 상기 상태 번호 또는 상기 업데이트된 상태 번호를 상기 복수의 트랙들 중 하나에서 각 트랙 포지션에 대한 임계 값과 비교하도록 구성되는 것을 특징으로 하는 디코딩 장치. - 청구항 1 내지 3 중 어느 하나에 있어서,
상기 펄스 정보 디코더(110)는 상기 트랙들 중 하나를 상기 복수의 트랙 포지션들 중 적어도 두 개의 트랙 포지션들을 포함하는 제1 트랙 부분과 상기 복수의 트랙 포지션들 중 적어도 두 개의 다른 트랙 포지션들을 포함하는 제2 트랙 부분으로 분리하도록 구성되고,
상기 펄스 정보 디코더(110)는 제1 서브상태 번호 및 제2 서브상태 번호를 상기 상태 번호를 기초로 하여 생성하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제1 서브상태 번호를 기초로 하여 상기 제1 트랙 부분과 연관된 펄스 포지션들의 제1 그룹을 디코딩하도록 구성되고,
상기 펄스 정보 디코더(110)는 상기 제2 서브상태 번호를 기초로 하여 상기 제2 트랙 부분과 연관된 펄스 포지션들의 제2 그룹을 디코딩하도록 구성되는 것을 특징으로 하는 디코딩 장치. - 오디오 신호를 인코딩하는 장치에 있어서,
상기 오디오 신호와 연관된 복수의 예측 필터 계수들을 결정하고, 상기 오디오 신호에 기초한 잔여 신호(residual signal)와 상기 복수의 예측 필터 계수들을 생성하는 신호 처리기(210); 및
상기 오디오 신호, 상기 잔여 신호와 연관된 하나 또는 그 이상의 트랙들, 복수의 트랙 포지션들 및 복수의 펄스들을 가진 트랙들 중 각각을 인코딩하기 위해 상기 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코딩하는 펄스 정보 인코더(220)를 포함하되,
여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 트랙 포지션들 중 하나를 나타내고,
상기 펄스 정보 인코더(220)는 상기 펄스 포지션들이 상기 상태 번호, 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track position number) 및 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)만을 기초로 하여 디코드될 수 있도록 상태 번호(state number)를 생성함으로써 상기 복수의 펄스 포지션들을 인코드하도록 구성되는 것을 특징으로하는 인코딩 장치. - 청구항 9에 있어서,
상기 펄스 정보 인코더(220)는 복수의 펄스 부호들을 인코드하도록 구성되며, 상기 펄스 부호들 각각이 상기 복수의 펄스 부호들의 중 하나의 부호를 나타내고,
상기 펄스 정보 인코더(220)는 상기 복수의 펄스 부호들을 상기 상태 번호를 생성함으로써 인코드하여, 상기 펄스 부호들이 상기 상태 번호, 적어도 하나의 트랙들의 트랙 포지션들의 전체 수를 나타내는 상기 트랙 포지션들 숫자 및 전체 펄스들 숫자만을 기초로 하여 디코드될 수 있도록 구성되는 것을 특징으로 하는 인코딩 장치. - 청구항 9 또는 10에 있어서,
상기 펄스 정보 인코더(220)는 상기 상태 번호를 획득하도록 상기 트랙들 중 하나의 각 트랙 포지션에 대한 트랙 포지션에서 각 펄스에 대한 중간 번호(intermediate number)에 정수 값을 가산하도록 구성된 것을 특징으로 하는 인코딩 장치. - 청구항 9 또는 10에 있어서,
상기 펄스 정보 인코더(220)는 상기 트랙들 중 하나를 상기 복수의 트랙 포지션들 중 적어도 두 개의 트랙 포지션들을 포함하는 제1 트랙 부분과 상기 복수의 트랙 포지션들 중 적어도 두 개의 다른 트랙 포지션들을 포함하는 제2 트랙 부분으로 분리하도록 구성되고,
상기 펄스 정보 인코더(220)는 제1 부분과 연관된 제1 서브상태 번호를 인코드하도록 구성되고,
상기 펄스 정보 인코더(220)는 제2 부분과 연관된 제2 서브상태 번호를 인코드하도록 구성되고,
상기 펄스 정보 인코더(220)는 상기 상태 번호를 획득하기 위하여 제1 서브상태 번호와 제2 서브상태 번호를 결합하도록 구성되는 것을 특징으로 하는 인코딩 장치. - 하나 또는 그 이상의 트랙들이 인코드된 오디오 신호와 연관되고, 상기 트랙들 중 각각은 복수의 트랙 포지션들과 복수의 펄스들을 가지는 상기 인코드된 오디오 신호를 디코딩하는 방법에 있어서,
복수의 펄스 포지션들을 디코딩하는 단계로서, 여기서 상기 펄스 포지션들 각각은 상기 트랙의 상기 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 상기 트랙 포지션들 중 하나를 나타내고,
여기서 상기 복수의 펄스 포지션들이 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track position number), 상기 적어도 하나의 트랙들의 펄스들의 전체 수를 나타내는 전체 펄스 숫자(total pulses number) 및 하나의 상태 번호(state number)를 사용함으로써 디코드되는 상기 복수의 펄스 포지션들을 디코딩하는 단계; 및
상기 복수의 펄스 포지션들과 상기 인코드된 오디오 신호와 연관된 복수의 예측 필터 계수를 사용하여 합성 오디오 신호를 생성함으로써 인코드된 오디오 신호를 디코딩하는 단계를 포함하는 디코딩 방법. - 오디오 신호를 인코딩하는 방법에 있어서,
상기 오디오 신호와 연관된 복수의 예측 필터 계수들을 결정하고, 상기 오디오 신호에 기초하는 잔여 신호(residual signal)와 복수의 예측 필터 계수들을 생성하는 단계; 및
상기 오디오 신호, 상기 잔여 신호와 연관된 하나 또는 그 이상의 트랙들, 복수의 트랙 포지션들 및 복수의 펄스들을 가진 트랙들 각각을 인코드하도록 상기 하나 또는 그 이상의 트랙들과 관련된 복수의 펄스 포지션들을 인코딩하는 단계를 포함하되,
여기서 상기 펄스 포지션들의 각각은 상기 트랙의 펄스들 중 하나의 포지션을 나타내도록 상기 트랙들 중 하나의 상기 트랙 포지션들 중 하나를 나타내고,
여기서 상기 펄스 포지션들이 상태 번호(state number), 적어도 하나의 상기 트랙들의 상기 트랙 포지션들의 전체 수를 나타내는 트랙 포지션들 숫자(track positions number) 및 적어도 하나의 상기 트랙들의 상기 펄스들의 전체 수를 나타내는 전체 펄스들 숫자(total pulses number)만을 기초로하여 디코드될 수 있도록 상기 상태 번호를 생성함으로써 상기 복수의 펄스 포지션들이 인코드되는 것을 특징으로 하는 인코딩 방법. - 컴퓨터(computer) 또는 신호 프로세서(signal processor)에서 실행될 때, 청구항 13 또는 14의 방법을 구현하는 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052294 WO2012110416A1 (en) | 2011-02-14 | 2012-02-10 | Encoding and decoding of pulse positions of tracks of an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130133847A true KR20130133847A (ko) | 2013-12-09 |
KR101643450B1 KR101643450B1 (ko) | 2016-08-10 |
Family
ID=71943601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137024213A KR101643450B1 (ko) | 2011-02-14 | 2012-02-10 | 오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9595263B2 (ko) |
EP (3) | EP3239978B1 (ko) |
JP (1) | JP5800915B2 (ko) |
KR (1) | KR101643450B1 (ko) |
CN (1) | CN103460284B (ko) |
AR (1) | AR085361A1 (ko) |
AU (1) | AU2012217184B2 (ko) |
BR (1) | BR112013020700B1 (ko) |
CA (1) | CA2827156C (ko) |
ES (2) | ES2639646T3 (ko) |
HK (1) | HK1245987B (ko) |
MX (1) | MX2013009345A (ko) |
PL (3) | PL3239978T3 (ko) |
PT (2) | PT3239978T (ko) |
RU (1) | RU2586597C2 (ko) |
SG (1) | SG192747A1 (ko) |
TR (1) | TR201903388T4 (ko) |
WO (1) | WO2012110416A1 (ko) |
ZA (1) | ZA201306841B (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
JP2022539217A (ja) | 2019-07-02 | 2022-09-07 | ドルビー・インターナショナル・アーベー | 離散指向性情報の表現、符号化、および復号化のための方法、装置、およびシステム |
US11088784B1 (en) | 2020-12-24 | 2021-08-10 | Aira Technologies, Inc. | Systems and methods for utilizing dynamic codes with neural networks |
US11575469B2 (en) | 2020-12-28 | 2023-02-07 | Aira Technologies, Inc. | Multi-bit feedback protocol systems and methods |
US11483109B2 (en) | 2020-12-28 | 2022-10-25 | Aira Technologies, Inc. | Systems and methods for multi-device communication |
US11368251B1 (en) | 2020-12-28 | 2022-06-21 | Aira Technologies, Inc. | Convergent multi-bit feedback system |
US20220291955A1 (en) | 2021-03-09 | 2022-09-15 | Intel Corporation | Asynchronous input dependency resolution mechanism |
US11489623B2 (en) | 2021-03-15 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets |
US11496242B2 (en) | 2021-03-15 | 2022-11-08 | Aira Technologies, Inc. | Fast cyclic redundancy check: utilizing linearity of cyclic redundancy check for accelerating correction of corrupted network packets |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040043278A (ko) * | 2002-11-18 | 2004-05-24 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
Family Cites Families (216)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69232202T2 (de) | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
JP2003501925A (ja) | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) * | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) * | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7206739B2 (en) * | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7302387B2 (en) * | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
CN1703736A (zh) | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR20040058855A (ko) * | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
AU2003208517A1 (en) | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
ES2354427T3 (es) | 2003-06-30 | 2011-03-14 | Koninklijke Philips Electronics N.V. | Mejora de la calidad de audio decodificado mediante la adición de ruido. |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US6987591B2 (en) | 2003-07-17 | 2006-01-17 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada | Volume hologram |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
WO2005073959A1 (en) | 2004-01-28 | 2005-08-11 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
EP2770694A1 (en) | 2004-02-12 | 2014-08-27 | Core Wireless Licensing S.a.r.l. | Classified media quality of experience |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
CN1930607B (zh) | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
CA2566368A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
WO2006079348A1 (en) | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for generating concealment frames in communication system |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
JP4519169B2 (ja) | 2005-02-02 | 2010-08-04 | 富士通株式会社 | 信号処理方法および信号処理装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
WO2006126844A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
WO2006136901A2 (en) | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
WO2008007700A1 (fr) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
EP2040251B1 (en) | 2006-07-12 | 2019-10-09 | III Holdings 12, LLC | Audio decoding device and audio encoding device |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN101512633B (zh) | 2006-07-24 | 2012-01-25 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
EP2054876B1 (en) | 2006-08-15 | 2011-10-26 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
EP3288027B1 (en) | 2006-10-25 | 2021-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
JP5171842B2 (ja) | 2006-12-12 | 2013-03-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法 |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP5241701B2 (ja) | 2007-03-02 | 2013-07-17 | パナソニック株式会社 | 符号化装置および符号化方法 |
US8364472B2 (en) | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
DE102007013811A1 (de) | 2007-03-22 | 2008-09-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
EP2157573B1 (en) * | 2007-04-29 | 2014-11-26 | Huawei Technologies Co., Ltd. | An encoding and decoding method |
CN101388210B (zh) * | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
CN101743586B (zh) | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
CA2698039C (en) | 2007-08-27 | 2016-05-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
AU2009221443B2 (en) | 2008-03-04 | 2012-01-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for mixing a plurality of input data streams |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
MY181231A (en) | 2008-07-11 | 2020-12-21 | Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PL2301020T3 (pl) | 2008-07-11 | 2013-06-28 | Fraunhofer Ges Forschung | Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
CN102177426B (zh) | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
UA99878C2 (ru) | 2009-01-16 | 2012-10-10 | Долби Интернешнл Аб | Гармоническое преобразование, усовершенствованное перекрестным произведением |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
AR075199A1 (es) | 2009-01-28 | 2011-03-16 | Fraunhofer Ges Forschung | Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
CN103366755B (zh) | 2009-02-16 | 2016-05-18 | 韩国电子通信研究院 | 对音频信号进行编码和解码的方法和设备 |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
EP3764356A1 (en) | 2009-06-23 | 2021-01-13 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
BR122020024236B1 (pt) | 2009-10-20 | 2021-09-14 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento |
WO2011048117A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8793126B2 (en) | 2010-04-14 | 2014-07-29 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
FR2963254B1 (fr) | 2010-07-27 | 2012-08-24 | Maurice Guerin | Dispositif et procede pour laver des surfaces internes d?une enceinte |
BR112013020482B1 (pt) | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
EP3373296A1 (en) | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
WO2013075753A1 (en) | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-10 ES ES12703123.5T patent/ES2639646T3/es active Active
- 2012-02-10 CN CN201280016442.4A patent/CN103460284B/zh active Active
- 2012-02-10 RU RU2013142068/08A patent/RU2586597C2/ru active
- 2012-02-10 PL PL17171964T patent/PL3239978T3/pl unknown
- 2012-02-10 JP JP2013553882A patent/JP5800915B2/ja active Active
- 2012-02-10 EP EP17171964.4A patent/EP3239978B1/en active Active
- 2012-02-10 EP EP18209670.1A patent/EP3471092B1/en active Active
- 2012-02-10 CA CA2827156A patent/CA2827156C/en active Active
- 2012-02-10 WO PCT/EP2012/052294 patent/WO2012110416A1/en active Application Filing
- 2012-02-10 PL PL12703123T patent/PL2676267T3/pl unknown
- 2012-02-10 BR BR112013020700-0A patent/BR112013020700B1/pt active IP Right Grant
- 2012-02-10 KR KR1020137024213A patent/KR101643450B1/ko active IP Right Grant
- 2012-02-10 ES ES17171964T patent/ES2715191T3/es active Active
- 2012-02-10 AR ARP120100443A patent/AR085361A1/es active IP Right Grant
- 2012-02-10 MX MX2013009345A patent/MX2013009345A/es active IP Right Grant
- 2012-02-10 EP EP12703123.5A patent/EP2676267B1/en active Active
- 2012-02-10 SG SG2013061379A patent/SG192747A1/en unknown
- 2012-02-10 TR TR2019/03388T patent/TR201903388T4/tr unknown
- 2012-02-10 AU AU2012217184A patent/AU2012217184B2/en active Active
- 2012-02-10 PT PT17171964T patent/PT3239978T/pt unknown
- 2012-02-10 PL PL18209670T patent/PL3471092T3/pl unknown
- 2012-02-10 PT PT127031235T patent/PT2676267T/pt unknown
-
2013
- 2013-08-14 US US13/966,635 patent/US9595263B2/en active Active
- 2013-09-11 ZA ZA2013/06841A patent/ZA201306841B/en unknown
-
2018
- 2018-04-24 HK HK18105291.5A patent/HK1245987B/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040043278A (ko) * | 2002-11-18 | 2004-05-24 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101643450B1 (ko) | 오디오 신호 트랙들의 펄스 포지션들의 인코딩 및 디코딩 | |
KR101353170B1 (ko) | 완전히 활용되지 않는 코드 공간을 압축하는데 산술 스테이지를 이용하는 인코더 및 디코더 | |
TWI488176B (zh) | 音訊信號音軌脈衝位置之編碼與解碼技術 | |
US7733973B2 (en) | Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium | |
MX2011003815A (es) | Decodificador de audio, codificador de audio, metodo para decodificar una señal de audio, metodo para codificar una señal de audio, programa de computadora y señal de audio. | |
KR20120069752A (ko) | 팩토리얼 펄스 코더를 위한 산술 인코딩 | |
CN102341844B (zh) | 编码方法、解码方法、编码装置、解码装置 | |
KR101170137B1 (ko) | 복잡성이 축소된 벡터 인덱싱 및 탈-인덱싱 | |
US20100079312A1 (en) | Apparatus and method of lossless coding and decoding | |
KR101456495B1 (ko) | 무손실 부호화/복호화 장치 및 방법 | |
JP2005506581A (ja) | 正弦波モデルパラメータの周波数差分符号化 | |
US9558752B2 (en) | Encoding device and encoding method | |
WO2011162723A1 (en) | Entropy encoder arrangement and entropy decoder arrangement | |
US8487789B2 (en) | Method and apparatus for lossless encoding and decoding based on context | |
CN112669857B (zh) | 一种语音处理的方法、装置及设备 | |
CN110771045A (zh) | 编码装置、解码装置、编码方法、解码方法、以及程序 | |
US9324331B2 (en) | Coding device, communication processing device, and coding method | |
ES2821725T3 (es) | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio | |
JP2019124951A (ja) | 快適雑音生成モード選択のための装置および方法 | |
KR20080071845A (ko) | 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |