KR101525185B1 - 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 - Google Patents

트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 Download PDF

Info

Publication number
KR101525185B1
KR101525185B1 KR1020137024069A KR20137024069A KR101525185B1 KR 101525185 B1 KR101525185 B1 KR 101525185B1 KR 1020137024069 A KR1020137024069 A KR 1020137024069A KR 20137024069 A KR20137024069 A KR 20137024069A KR 101525185 B1 KR101525185 B1 KR 101525185B1
Authority
KR
South Korea
Prior art keywords
audio signal
encoding algorithm
transient
signal
quality
Prior art date
Application number
KR1020137024069A
Other languages
English (en)
Other versions
KR20130126708A (ko
Inventor
크리스티안 헴리히
기욤 푹스
고란 마르코비치
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20130126708A publication Critical patent/KR20130126708A/ko
Application granted granted Critical
Publication of KR101525185B1 publication Critical patent/KR101525185B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 신호의 부분을 위하여 인코딩된 오디오 신호(26)를 획득하기 위하여 오디오(10)의 부분을 코딩하기 위한 장치는 트랜지언트 검출 결과(14)를 획득하기 위하여 트랜지언트 신호가 상기 오디오 신호의 부분 내에 위치되는지를 검출하기 위한 트랜지언트 검출기(12), 오디오 신호 상의 제 1 특성을 갖는 제 1 인코딩 알고리즘을 실행하기 위한, 그리고 오디오 신호 상의 제 1 특성과는 다른 제 2 특성을 갖는 제 2 인코딩 알고리즘을 실행하기 위한 인코더 스테이지(16), 품질 결과(20)를 획득하기 위하여 다른 인코딩 알고리즘에 대하여 어떠한 인코딩 알고리즘이 오디오 신호의 부분에 더 근사치인 인코딩된 오디오 신호를 야기하는지를 결정하기 위한 프로세서(18), 및 트랜지언트 검출 결과(14) 및 품질 결과(20)를 기초로 하여 오디오 신호의 부분에 대하여 인코딩된 오디오 신호가 제 1 인코딩 알고리즘 또는 제 2 인코딩 알고리즘에 의해 발생되는지를 결정하기 위한 컨트롤러(22)를 포함한다.

Description

트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법{APPARATUS AND METHOD FOR CODING A PORTION OF AN AUDIO SIGNAL USING A TRANSIENT DETECTION AND A QUALITY RESULT}
본 발명은 오디오 코딩, 특히 서로 다른 시간 부분들에 대하여, 서로 다른 인코딩 알고리즘들을 사용하여 인코딩된 신호가 발생되는 전환된 오디오 코딩에 관한 것이다.
오디오 신호의 서로 다른 부분들을 위하여 서로 다른 인코딩 알고리즘들을 결정하는 전환된 오디오 코더들이 알려진다. 일례가 이른바 국제 표준 3GPP TS 26.920 V6.1.0 2004-12에 정의된 확장 적응성 멀티-레이트 광대역(extended adaptive multi-rate-wideband) 코덱 또는 AMR-WB+ 코덱이다. 본 명세서에서, 변환 코딩 여진(transform coded Excitation, TCX), 대역폭 확장(BWE), 및 스테레오를 첨가함으로써 대수 부호 여진 선형 예측(Algebrsic Code Excited Linear Prediction, ACELP) 기반 확장 적응성 멀티-레이트 광대역 코덱을 확장시키는 코딩 개념이 설명된다. 확장 적응성 멀티-레이트 광대역 오디오 코덱은 내부 샘플링 주파수(Fs)에서 2048 샘플들과 동일한 입력 프레임들을 처리한다. 내부 샘플링 주파수는 12,800 내지 38,400 ㎐의 범위 내에 한정된다. 2048 샘플 프레임들은 두 개의 임계적으로 샘플링된 동일한 주파수 대역으로 분할된다. 이는 저주파수(LF) 및 고주파수(HF) 대역과 상응하는 두 개의 1024 샘플의 수퍼프레임(superframe)을 야기한다. 각각의 수퍼프레임은 4개의 256-샘플 프레임으로 나눠진다. 내부 샘플링 레이트에서의 샘플링은 입력 신호를 재샘플링하는(re-sample), 다양한 샘플링 변환 계획의 사용에 의해 획득된다. 저주파수 및 고주파수 신호들은 그리고 나서 두 가지의 서로 다른 접근법을 사용하여 인코딩된다. 저주파수 신호는 전환된 대수 부호 여진 선형 예측 및 변환 코딩 여진을 기초로 하여, "코어(core)" 인코더/디코더를 사용하여 인코딩되고 디코딩된다. 대수 부호 여진 선형 예측 방식에서, 표준 확장 적응성 멀티-레이트 광대역 코덱이 사용된다. 고주파수 신호는 대역폭 확장 방법을 사용하여 상대적으로 적은 비트들(16 비트/프레임)로 인코딩된다.
인코더로부터 디코더로 전송된 파라미터들은 방식-선택(mode-selection) 비트들, 저주파수 파라미터들 및 고주파수 파라미터들이다. 각각의 1024-샘플 수퍼프레임을 위한 파라미터들은 동일한 크기의 4개의 포켓(pocket)으로 분해된다. 입력 신호가 스테레오일 때, 왼쪽 및 오른쪽 채널들은 대수 부호 여진 선형 예측-변환 코딩 여진 인코딩을 위한 모노-신호들로 결합되고, 반면에 스테레오 인코딩은 입력 채널들 모두를 수신한다. 확장 적응성 멀티-레이트 광대역 디코더 구조에 있어서, 저주파수 및 고주파수 대역들은 별도로 디코딩된다. 그리고 나서, 대역들은 합성 필터뱅크(synthesis filterbank) 내에 결합된다. 만일 출력이 모노로만 제한되면, 스테레오 파라미터들은 생략되고 디코더는 모노 방식으로 작동한다.
확장 적응성 멀티-레이트 광대역 코덱은 저주파수 신호를 인코딩할 때, 대수 부호 여진 선형 예측 및 변환 코딩 여진 방식 모두를 위한 선형 예측 분석을 적용한다. 선형 예측 계수들은 매 64-샘플 서브-프레임에서 선형으로 보간된다. 선형 예측 분석 윈도우는 길이 384 샘플들의 반(half)-코사인이다. 코딩 방식은 폐쇄 루프 합성에 의한 분석(analysis-by-synthesis) 방법을 기초로 하여 선택된다. 256 샘플 프레임들만이 대수 부호 여진 선형 예측 프레임들을 위하여 고려되나, 256, 512 또는 1024 샘플들의 프레임들이 변환 코딩 여진 방식에서 가능하다. 대수 부호 여진 선형 예측 코딩은 장기 예측(LTP) 분석과 합성 및 대수 코드북 여진으로 구성된다. 변환 코딩 여진 방식에서, 지각적으로(perceptually) 가중된 신호는 변환 도메인 내에서 처리되다. 푸리에 변환된 가중 신호는 스플릿 다중-가중 격자 양자화(대수 벡터 양자화)를 사용하여 양자화된다. 변환은 1024, 512 또는 256 샘플 윈도우들로 계산된다. 여진 신호는 역 가중 필터를 통하여 양자화된 가중 신호를 역 필터링(inverse filtering)함으로써 복원된다. 오디오 신호의 특정 부분이 대수 부호 여진 선형 예측 방식 또는 변환 코딩 여진 방식을 사용하여 인코딩되는지를 결정하기 위하여, 폐쇄 루프 모드 선택 또는 개방 루프 모드 선택이 사용된다. 폐쇄 루프 모드 선택에 있어서, 11개의 연속적인 시도들이 사용된다. 시도 뒤에, 비교하기 위하여 두 방식들 사이에 방식 선택이 만들어진다. 선택 기준은 가중 오디오 신호 및 합성된 가중 오디오 신호 사이의 평균 분절 신호대 잡음비(Signal Noise Ratio, SNR)이다. 따라서, 인코더는 두 인코딩 알고리즘에 따른 완전한 인코딩, 두 인코딩 알고리즘에 따른 완전한 디코딩을 실행하고, 그 뒤에 두 인코딩/디코딩 운용들의 결과가 오리지널 신호와 비교된다. 따라서, 각각의 인코딩 알고리즘, 즉, 한편으로는 대수 부호 여진 선형 예측 및 다른 한편으로는 변환 코딩 여진을 위하여, 분절 신호대 잡음비 값이 획득되고 더 나은 분절 신호대 잡음비 값을 갖거나 또는 개별 서브-프레임을 위한 분절 신호대 잡음비 값에 대하여 평균을 냄으로써 프레임에 대하여 결정되는 더 나은 평균 분절 신호대 잡음비 값을 갖는 알고리즘을 인코딩이 사용된다. .
부가적인 전환된 오디오 코딩 방식은 이른바 통합 음성 오디오 코딩(Unified Speech Audio Coding, USAC) 코더이다. 이러한 코딩 알고리즘은 ISO/IEC 23003-3에서 설명된다. 일반적인 구조는 다음과 같이 설명될 수 있다. 우선, 스테레오 또는 다중 채널 처리 및 입력 신호의 높은 오디오 주파수들의 파라미터 표현을 발생시키는 향상된 스펙트럼 대역 복제 유닛을 처리하기 위하여 MPEG 서라운드 기능 유닛의 통상의 전/후처리 시스템이 존재한다. 그리고 나서 하나는 변형된 고급 오디오 코딩 공구 경로로 구성되고 나머지는 선형 예측 코딩 기반 경로로 구성되는, 두 개의 분기가 존재하는데, 이는 차례로 선형 예측 코딩 잔류의 주파수-도메인 표현 또는 시간-도메인 표현을 특징으로 한다. 고급 오디오 코딩 및 선형 예측 코딩 모두를 위하여 전송된 스펙트럼은 변형 이산 코사인 변환 도메인 내에 표현되고 그 다음에 양자화 및 산술 코딩이 뒤따른다. 시간-도메인 표현은 대수 부호 여진 선형 예측 여진 코딩 방식을 사용한다. 디코더의 기능들은 비트스트림 패이로드(bitstream payload) 내에 양자화된 오디오 스펙트럼 또는 시간-도메인 표현의 기술을 발견하고 양자화된 값들을 및 재구성 정보를 디코딩하는 것이다. 따라서, 인코더는 두 가지 결정을 실행한다. 첫 번째 결정은 주파수 도메인 대 선형 예측 도메인 방식 결정을 위한 신호 분류를 실행하는 것이다. 두 번째 결정은 선형 예측 도메인 내에서, 대수 부호 여진 선형 예측 또는 변환 코딩 여진을 사용하여 신호 부분이 인코딩되는지를 결정하는 것이다.
매우 낮은 지연이 필요한, 시나리오 내의 전환된 오디오 코딩 방식을 적용하기 위하여, 변환 기반 코딩 부분들이 특히 고려되어야만 하는데, 그 이유는 이러한 코딩 부분들이 변환 길이 및 윈도우 디자인에 의존하는 특정 지연을 도입하기 때문이다. 따라서, 통합 음성 및 오디오 코딩 개념은 전환 윈도우들을 포함하는 상당한 변환 길이 및 길이 적용(또한 블록 전환으로서 알려진)을 갖는 변형된 고급 오디오 코딩 브랜치(branch) 때문에 매우 낮은 지연 적용들에 적합하지 않다.
다른 한편으로, 확장 적응성 멀티-레이트 광대역 코딩 개념은 대수 부호 여진 선형 예측 또는 변환 코딩 여진이 사용되는지의 인코더-면 판정(decision) 때문에 문제가 있는 것으로 얼려졌다. 대수 부호 여진 선형 예측은 뛰어난 코딩 이득을 제공하나, 신호 부분이 대수 부호 여진 선형 예측 코딩 방식을 위하여 적합하지 않을 때 상당한 오디오 품질 문제들을 야기할 수 있다. 따라서, 품질 이유들을 위하여, 입력 신호가 음성을 포함하지 않을 때마다 변환 코딩 여진을 사용하려는 경향이 있다. 그러나 낮은 비트레이트들에서의 너무 많은 변환 코딩 여진의 사용은 비트레이트 문제들을 야기할 것인데, 그 이유는 변환 코딩 여진이 상대적으로 낮은 코딩 이득을 제공하기 때문이다. 따라서, 코딩 이득 상으로 볼 때, 가능할 때마다 대수 부호 여진 선형 예측을 사용할 것이나, 이전에 설명된 것과 같이, 이는 예를 들면, 음악 또는 유사한 고정 신호들을 위하여 대수 부호 여진 선형 예측이 최적인 것은 아니라는 사실에 기인하여 오디오 품질 문제들을 야기할 수 있다.
분절 신호대 잡음비 계산은 품질 측정인데, 이는 결과만을, 즉, 오리지널 신호 또는 인코딩되거나/디코딩되는 신호 사이의 신호대 잡음비가 더 나은지 아닌지만을 기초로 하여 더 나은 코딩 방식 방식을 결정하며, 따라서 더 나은 신호대 잡음비를 야기하는 인코딩 알고리즘이 사용된다. 그러나, 이는 항상 비트레이트 제약들 하에서 작동해야만 한다. 따라서, 예를 들면, 분절 신호대 잡음비 측정과 같은 품질 측정만의 사용은 품질 및 비트레이트 사이의 최상의 절충을 야기하는 것은 아니라는 것이 알려졌다.
오디오 신호의 일부분를 코딩하기 위한 향상된 개념을 제공하는 것이 본 발명의 목적이다.
본 발명의 목적은 청구항 1에 따른 일부분의 오디오 신호를 코딩하기 위한 장치 또는 청구항 14에 따른 일부분의 오디오 신호를 코딩하기 위한 방법에 의해 달성된다.
본 발명은 더 많은 트랜지언트(transient) 신호 부분들을 위하여 적합한 제 1 인코딩 알고리즘 및 더 많은 고정(stationary) 신호 부분들을 위하여 적합한 제 2 인코딩 알고리즘 사이의 더 나은 판정은 품질 측정뿐만 아니라 부가적으로 트랜지언트 검출 결과를 기초로 할 때 획득된다는 사실을 기초로 한다. 품질 측정이 오리지널 신호에 관한 인코딩/디코딩 체인의 결과만을 본다면, 트랜지언트 검출 결과는 부가적으로 오리지널 입력 오디오 신호만의 분석에만 의존한다. 따라서, 최종적으로 일부분의 오디오 신호가 어떤 인코딩 알고리즘에 의해 인코딩되는지를 결정하기 위하여 두 측정들, 즉, 한편으로는 품질 결과 및 다른 한편으로는 트랜지언트 검출 결과는 한편으로는 코딩 이득(coding gain) 및 다른 한편으로는 오디오 품질 사이의 향상된 절충에 이르게 한다.
일부분의 오디오 신호를 위하여 인코딩된 오디오 신호를 획득하기 위하여 일부분의 오디오 신호를 코딩하기 위한 장치는 트랜지언트 신호가 트랜지언트 검출 결과를 획득하기 위하여 오디오 신호의 부분 내에 위치되는지를 검출하기 위한 트랜지언트 검출기를 포함한다. 장치는 또한 오디오 신호 상의 제 1 특성을 갖는 제 1 인코딩 알고리즘을 실행하기 위하여, 그리고 오디오 신호 상의 제 1 특성과는 다른 제 2 특성을 갖는 제 2 인코딩 알고리즘을 실행하기 위한 인코더 스테이지(encoder stage)를 포함한다. 일 실시 예에서, 제 1 인코딩 알고리즘과 관련된 제 1 특성은 더 많은 트랜지언트 신호에 더 적합하고, 제 2 인코딩 알고리즘과 관련된 제 2 특성은 더 많은 고정 신호에 더 적합하다. 바람직하게는, 제 1 인코딩 알고리즘은 대수 부호 여진 선형 예측 인코딩 알고리즘이고 제 2 인코딩 알고리즘은 변형 이산 코사인 변환, 고속 푸리에 변환 또는 다른 변환 혹은 필터뱅크를 기초로 하는 변환 코딩 여진 인코딩 알고리즘이다. 게다가, 품질 결과를 획득하기 위하여 어떤 인코딩 알고리즘이 오디오 신호의 부분에 더 근사치인 인코딩된 오디오 신호를 야기하는지를 결정하기 위하여 프로세서가 제공된다. 게다가, 컨트롤러가 제공되는데, 컨트롤러는 오디오 신호의 부분을 위하여 인코딩된 오디오 신호가 제 1 인코딩 알고리즘 또는 제 2 인코딩 알고리즘에 의해 발생되는지를 결정하도록 구성된다. 본 발명에 따라, 컨트롤러는 품질 결과뿐만 아니라, 부가적으로 트랜지언트 검출 결과를 기초로 하여 이러한 결정을 실행하도록 구성된다.
일 실시 예에서, 비록 품질 결과가 제 1 인코딩 알고리즘을 위하여 더 나은 결과를 나타내더라도, 트랜지언트 검출 결과가 비-트랜지언트(non-transient) 신호를 나타낼 때, 컨트롤러는 제 2 인코딩 알고리즘을 결정하도록 구성된다. 게다가, 비록 품질 결과가 제 2 인코딩 알고리즘을 위하여 더 나은 결과를 나타내더라도, 트랜지언트 검출 결과가 트랜지언트 신호를 나타낼 때, 컨트롤러는 제 1 인코딩 알고리즘을 결정하도록 구성된다.
또 다른 실시 예에서, 트랜지언트 결과가 품질 결과를 부정하는 이러한 결과는 과거에 제 1 인코딩 알고리즘이 결정된 다수의 초기 신호 부분들이 미리 결정된 수보다 적을 때만 제 2 인코딩 알고리즘이 결정되는 것과 같이 이력(hysteresis) 기능을 사용하여 향상된다. 유사하게, 컨트롤러는 과거에 제 2 인코딩 알고리즘이 결정된 다수의 초기 신호 부분들이 미리 결정된 수보다 적을 때 제 1 인코딩 알고리즘만을 결정하도록 구성된다. 이력 처리의 장점은 코딩 방식들 사이의 전환(switch-over)들의 수가 특정 입력 신호들을 위하여 감소된다는 것이다. 신호 내의 임계점(critical point)들에서의 너무 빈번한 전환은 특히 낮은 비트레이트들을 위한 가청 아티팩트(audible artifact)들을 발생할 수 있다. 그러한 아티팩트들의 가능성은 이력을 구현함으로써 감소된다.
또 다른 실시 예에서, 품질 결과는 품질 결과가 하나의 코딩 알고리즘을 위하여 강력한 품질 장점을 나타낼 때 트랜지언트 검출 결과에 대하여 선호된다. 그때 신호가 트랜지언트 신호인지 아닌지에 관계없이 다른 인코딩 알고리즘보다 더 뛰어난 품질 결과를 갖는 인코딩 알고리즘이 선택된다. 다른 한편으로, 트랜지언트 검출 결과는 두 인코딩 알고리즘 사이의 품질 차이가 높지 않을 때 결정적일 수 있다. 이를 위하여, 이진(binary) 품질 결과뿐만 아니라 정량적 품질 결과를 결정하는 것이 바람직하다. 이진 품질 결과는 어떠한 인코딩 알고리즘이 더 나은 품질 결과를 야기하는지만을 나타낼 수 있으나, 정량적 품질 결과는 어떠한 인코딩 알고리즘이 더 나은 결과를 야기하는지를 결정할 뿐만 아니라 상응하는 인코딩 알고리즘이 얼마나 더 나은지를 결정한다. 다른 한편으로, 또한 정량적 트랜지언트 검출 결과를 사용할 수 있으나, 기본적으로 이진 트랜지언트 검출 결과가 또한 충분할 수 있다.
따라서, 본 발명은 한편으로는 비트레이트 및 다른 한편으로는 품질 사이의 뛰어난 절충에 대한 특별한 장점을 제공하는데, 그 이유는 트랜지언트 신호들을 위하여 덜한 품질을 야기하는 코딩 알고리즘이 선택되기 때문이다. 품질 결과가 예를 들면, 변환 코딩 여진 결정을 선호할 때, 그럼에도 불구하고 대수 부호 여진 선형 예측 방식이 행해지는데, 이는 약간 감소된 오디오 품질을 야기할 수 있으나 결국은 대수 부호 여진 선형 예측 사용과 관련하여 더 높은 코딩 이득을 야기한다.
다른 한편으로, 품질 결과가 대수 부호 여진 선형 예측 프레임을 선호할 때, 그럼에도 불구하고 비-트랜지언트 신호들을 위하여 변환 코딩 여진 판정이 행해진다. 따라서, 더 나은 오디오 품질을 위하여 약간 덜한 코딩 이득이 수용된다.
따라서, 본 발명은 인코딩되고 다시 디코딩된 신호의 품질이 고려되는 것뿐만 아니라 부가적으로 또한 실제로 인코딩되는 입력 신호가 그것의 트랜지언트 특성에 대하여 분석되고 이러한 트랜지언트 분석의 결과는 트랜지언트 신호들을 위하여 적합한 알고리즘 또는 고정 신호들을 위하여 더 적합한 알고리즘을 위한 결정에 부가적으로 영향을 주도록 사용된다는 사실에 기인하여 품질 및 비트레이트 사이에 향상된 절충을 야기한다.
본 발명의 또 다른 실시 예들은 첨부된 도면을 참조하여 그 뒤에 설명된다.
도 1은 본 발명에 따른 오디오 신호의 부분을 코딩하기 위한 장치의 블록 다이어그램을 도시한다.
도 2는 두 가지 서로 다른 인코딩 알고리즘 및 그것들에 적합한 신호들을 위한 테이블을 도시한다.
도 3은 서로 독립적으로 적용될 수 있으나, 바람직하게는 결합하여 적용될 수 있는, 품질 조건, 트랜지언트 조건 및 이력 조건에 대한 개요를 도시한다.
도 4는 서로 다른 상황들에서 전환이 실행되거나 또는 실행되지 않은 상태 테이블을 도시한다.
도 5는 일 실시 예에서 트랜지언트 결과를 결정하기 위한 플로차트를 도시한다.
도 6a는 일 실시 예에서 품질 결과를 결정하기 위한 플로차트를 도시한다.
도 6b는 도 6a의 품질 결과에 대하여 더 상세히 도시한다.
도 7은 본 발명에 따라 코딩하기 위한 장치의 더 상세한 블록 다이어그램을 도시한다.
도 1은 입력 라인(10)에 제공되는 오디오 신호의 부분을 코딩하기 위한 장치를 도시한다. 오디오 신호의 부분은 라인(14) 상의 트랜지언트 검출 결과를 획득하기 위하여 트랜지언트 신호가 오디오 신호의 부분 내에 위치되는지를 검출하기 위한 트랜지언트 검출기(12) 내로 입력된다. 게다가, 인코더 스테이지(16)가 제공되는데, 인코더 스테이지는 오디오 신호 상에 제 1 인코딩 알고리즘을 실행하도록 구성되며 제 1 인코딩 알고리즘은 제 1 특성을 갖는다. 게다가, 인코더 스테이지(16)는 오디오 신호 상에 제 2 인코딩 알고리즘을 실행하도록 구성되는데, 제 2 인코딩 알고리즘은 제 1 특성과는 다른 제 2 특성을 갖는다.
부가적으로, 장치는 제 1 및 제 2 인코딩 알고리즘 중 어떤 인코딩 알고리즘이 오리지널 오디오 신호의 부분에 더 근사치인 인코딩된 오디오 신호를 야기하는지를 결정하기 위한 프로세서(18)를 포함한다. 프로세서(18)는 라인(20) 상의 이러한 결과를 기초로 하여 품질 결과를 발생시킨다. 라인(20) 상의 품질 결과 및 라인(14) 상의 트랜지언트 검출 결과 모두 컨트롤러(22)에 제공된다. 컨트롤러(22)는 오디오 신호의 부분을 위하여 인코딩된 오디오 신호가 제 1 인코딩 알고리즘 또는 제 2 인코딩 알고리즘에 의해 발생되는지를 결정하도록 구성된다. 이러한 결정을 위하여, 품질 결과(20) 뿐만 아니라 트랜지언트 검출 결과가 사용된다. 게다가, 출력 인터페이스(24)가 선택적으로 제공되는데, 출력 인터페이스는 예를 들면, 비트스트림 또는 라인(26) 상의 인코딩된 오디오 신호의 다른 표현과 같은 인코딩된 오디오 신호를 출력한다.
인코더 스테이지(16)가 합성 처리에 의해 실행되는 일 실시 예에서, 인코더 스테이지(16)는 오디오 신호의 부분의 제 1 인코딩된 표현을 획득하기 위하여 오디오 신호의 동일한 부분을 수신하고 제 1 인코딩 알고리즘에 의해 이러한 오디오 신호의 부분을 인코딩한다. 게다가, 인코더 스테이지는 제 2 인코딩 알고리즘을 사용하여 오디오 신호의 동일한 부분의 인코딩된 표현을 발생시킨다. 게다가, 인코더 스테이지(16)는 합성 처리에 의한 이러한 분석에서, 제 1 인코딩 알고리즘 및 제 2 인코딩 알고리즘 모두를 위한 디코더를 포함한다. 하나의 상응하는 디코더는 제 1 인코딩 알고리즘과 관련된 디코딩 알고리즘을 사용하여 제 1 인코딩된 표현을 디코딩한다. 게다가, 제 2 인코딩 알고리즘과 관련된 또 다른 디코딩 알고리즘을 실행하기 위한 디코더가 제공되는데, 따라서, 마침내 인코더 스테이지는 오디오 신호의 동일한 부분을 위한 두 개의 디코딩된 표현을 가질 뿐만 아니라 라인(10) 상의 오디오 신호의 동일한 부분을 위한 두 개의 디코딩된 신호를 갖는다. 이러한 두 개의 디코딩된 신호는 그리고 나서 라인(28)을 거쳐 프로세서에 제공되고 프로세서는 두 디코딩된 표현을 입력(30)을 거쳐 획득된 오리지널 오디오 신호의 동일한 부분과 비교한다. 그리고 나서 각각의 인코딩 알고리즘을 위한 분절 신호대 잡음비가 결정된다. 이른바 이러한 품질 결과는 일 실시 예에서, 더 나은 코딩 알고리즘의 표시, 즉, 제 1 인코딩 알고리즘 또는 제 2 인코딩 알고리즘이 더 나은 신호대 잡음비를 야기하는 이진 신호를 제공한다. 부가적으로, 품질 결과는 정량적 정보, 즉, 예를 들면, dB에서 상응하는 인코딩 알고리즘이 얼마나 더 나은가를 나타낸다.
이러한 상황에서, 컨트롤러가 완전히 품질 결과(20)에 의존할 때, 인코더 스테이지는 상응하는 인코딩 알고리즘의 이미 저장된 인코딩된 표현을 출력 인터페이스(24)로 보내도록 하기 위하여 라인(32)을 거쳐 인코더 스테이지를 액세스하는데, 따라서 이러한 인코딩된 표현은 인코딩된 오디오 신호 내의 오리지널 오디오 신호의 상응하는 부분을 표현한다.
대안으로서, 품질 결과를 결정하기 위하여 프로세서(18)가 개방 루프 방식을 실행할 때, 두 인코딩 알고리즘 모두가 하나 및 동일한 오디오 신호 부분에 적용될 필요는 없다. 대신에, 프로세서(18)는 어떠한 인코딩 알고리즘이 더 나은지를 결정하고, 그리고 나서, 인코더 스테이지(16)는 프로세서에 의해 표시되는 인코딩 알고리즘만을 적용하도록 라인(28)을 거쳐 제어되며, 그리고 나서 선택된 인코딩 알고리즘에 기인하는 이러한 인코딩된 표현은 라인(24)을 거쳐 출력 인터페이스(24)에 제공된다.
인코더 스테이지(16)의 특정 구현에 따라, 두 인코딩 알고리즘 모두는 선형 예측 코딩 도메인 내에서 작동할 수 있다. 이러한 경우에 있어서, 제 1 인코딩 알고리즘과 같은 대수 부호 여진 선형 예측 및 제 2 인코딩 알고리즘과 같은 변환 코딩 여진을 위한 것과 같이, 통상의 선형 예측 코딩이 실행된다. 이러한 선형 예측 코딩 전처리는 오디오 신호의 부분의 선형 예측 코딩 분석을 포함하는데, 이는 오디오 신호의 부분을 위한 선형 예측 코딩 계수들을 결정한다. 그리고 나서, 선형 예측 코딩 분석 필터는 결정된 선형 예측 코딩 계수들을 사용하여 조정되고, 오리지널 오디오 신호는 이러한 선형 예측 코딩 분석 필터에 의해 필터링된다. 그리고 나서, 인코더 스테이지는 선형 예측 코딩 잔류 신호를 계산하기 위하여 선형 예측 코딩 분석 필터의 출력 및 오디오 입력 신호 사이의 샘플에 관한 차이를 계산하고 그리고 나서 개방 루프 방식 내에 제 1 인코딩 알고리즘 또는 제 2 인코딩 알고리즘을 받거나 또는 이전에 설명된 것과 같이 폐쇄 루프 방식 내에 두 인코딩 알고리즘 모두가 제공된다. 대안으로서, 선형 예측 코딩에 의한 필터링 및 잔류 신호의 샘플에 관한 결정은 통합 음성 및 오디오 코딩 표준에 설명된 주파수 도메인 잡음 형상화(FDNS, frequency domain noise shaping)에 의해 대체될 수 있다.
도 2는 인코더 스테이지의 바람직한 구현을 도시한다. 제 1 인코딩 알고리즘과 같이, 부호 여진 선형 예측 인코딩 특성을 갖는 대수 부호 여진 선형 예측 인코딩 알고리즘이 사용된다. 게다가, 이러한 인코딩 알고리즘은 트랜지언트 신호들을 위하여 더 적합하다. 제 2 인코딩 알고리즘은 이러한 제 2 인코딩 알고리즘을 비-트랜지언트 신호들을 위하여 더 적합하게 하는 코딩 특성을 갖는다. 바람직하게는, 변환 코딩 여진과 같은 변환 여진 코딩 알고리즘이 사용되고, 특히, 도 1에 도시된 코딩 개념을 특히 전화 적용들 및 특히, 휴대폰 또는 이동 전화 적용들에서와 같은 2방향(two-way) 통신이 존재하는 실시간 시나리오에서 필요한 낮은 지연 구현들을 위하여 적합하도록 만드는 20 ms의 프레임 길이를 갖는 변환 코딩 여진 20 인코딩 알고리즘이 바람직하다(윈도우 길이는 오버랩에 기인하여 더 높을 수 있다).
그러나, 본 발명은 부가적으로 제 1 및 제 2 인코딩 알고리즘의 다른 조합들에서 유용하다, 바람직하게는, 트랜지언트 신호들을 위하여 더 적합한 제 1 인코딩 알고리즘은 GSM-사용 인코더들(G.729) 또는 다른 시간-도메인 인코더들과 같은 잘 알려진 시간-도메인 인코더들을 포함할 수 있다. 다른 한편으로, 비-트랜지언트 신호 인코딩 알고리즘은 MP3, 고급 오디오 코딩, 오디오 코딩 3과 같은 잘 알려진 변환-도메인 인코더 또는 다른 변환 또는 필터뱅크 기반 오디오 인코딩 알고리즘일 수 있다. 그러나, 저-지연 구현을 위하여, 한편으로는 대수 부호 여진 선형 예측 및 다른 한편으로는 변환 코딩 여진 인코더가 고속 푸리에 변환 또는 훨씬 더 바람직하게는 짧은 윈도우 길이를 갖는 변형 이산 코사인 변환을 기초로 할 수 있는, 변환 코딩 여진의 조합이 바람직하다. 따라서, 두 인코딩 알고리즘은 선형 예측 코딩 분석 필터를 사용하여 오디오 신호를 선형 예측 코딩 도메인으로 변환하여 획득되는 선형 예측 코딩 도메인 내에서 작동한다. 그러나, 대수 부호 여진 선형 예측은 그리고 나서 선형 예측 코딩-"시간"-도메인 내에서 작동하나, 변환 코딩 여진 인코더는 선형 예측 코딩-"주파수"-도메인 내에서 작동한다.
그 다음에, 도 1의 컨트롤러(22)의 바람직한 구현이 도 3의 맥락에서 논의된다.
바람직하게는, 대수 부호 여진 선형 예측과 같은 제 1 인코딩 알고리즘 및 변환 코딩 여진 20과 같은 제 2 인코딩 알고리즘 사이의 전환은 세 가지 조건을 사용하여 실행된다. 첫 번째 조건은 도 1의 품질 결과(20)에 의해 표현되는 품질 조건이다. 두 번째 조건은 도 1의 라인(14) 상의 트랜지언트 검출 결과에 의해 표현되는 트랜지언트 조건이다. 세 번째 조건은 과거에, 즉, 오디오 신호의 이른 부분들을 위하여 컨트롤러(22)에 의해 만들어진 결정들에 의존하는 이력 조건이다.
품질 조건은 품질 조건이 제 1 인코딩 알고리즘 및 제 2 인코딩 알고리즘 사이의 큰 품질 거리를 나타낼 때 더 높은 품질 인코딩 알고리즘으로의 전환이 실행되는 것과 같이 구현된다. 예를 들면, 1 dB 신호대 잡음비 차이에 의해 하나의 인코딩 알고리즘이 다른 인코딩 알고리즘을 능가할 때, 그때 품질 조건은 전환을 결정하거나 또는 바꾸어 말하면, 어떠한 트랜지언트 검출 또는 이력과 관계없이 오디오 신호의 실제로 고려되는 부분을 위하여 실제로 사용되는 인코딩 알고리즘을 결정한다.
그러나, 품질 조건이 1 또는 그 이하의 dB 신호대 잡음비 차이의 품질 거리와 같은 두 인코딩 알고리즘 사이의 작은 품질 거리만을 나타낼 때, 낮은 품질 인코딩 알고리즘으로의 전환은 트랜지언트 검출 결과가 오디오 신호 특성에 적합한지, 즉, 오디오 신호가 트랜지언트인지 또는 아닌지를 나타낼 때 발생할 수 있다. 그러나, 트랜지언트 검출 결과가 낮은 인코딩 알고리즘이 오디오 신호 특성에 맞지 않을 때, 높은 인코딩 알고리즘이 사용될 것이다. 후자의 경우에 있어서, 다시 한 번, 품질 조건은 결과를 결정하나, 낮은 품질 인코딩 알고리즘 및 오디오 신호의 트랜지언트/고정 상황은 서로 맞지 않는다.
이력 조건은 특히 트랜지언트 조건의 조합에서, 즉, 마지막 N보다 적은 프레임이 다른 알고리즘으로 인코딩되었을 때만 낮은 품질 인코딩 알고리즘으로의 전환이 실행되는 것에서 특히 유용하다. 바람직한 실시 예들에서, N은 5 프레임들과 동등하나, 바람직하게는 각각 위의 샘플들의 최소 수, 예를 들면, 128 샘플들을 포함하는, N 프레임 또는 신호 부분들보다 적거나 동등한 다른 값들이 또한 사용될 수 있다.
도 4는 특정 상황들에 따른 상태 변화들의 테이블을 도시한다. 왼쪽 칼럼은 변환 코딩 여진 또는 대수 부호 여진 선형 예측을 위하여 초기 프레임들의 수가 N보다 크거나 또는 N보다 작은 상황을 나타낸다.
마지막 라인은 변환 코딩 여진을 위한 큰 품질 거리 또는 대수 부호 여진 선형 예측을 위한 큰 품질 거리가 존재하는지를 나타낸다. 처음의 두 칼럼이 존재하는, 이러한 두 가지 경우에 있어서, "X"로 표시된 지점에서 변화가 실행되고, "0"으로 표시된 지점에서는 변화가 실행되지 않는다.
게다가, 마지막 두 칼럼은 변환 코딩 여진을 위한 작은 품질 거리가 결정되고 될 때 그리고 트랜지언트 신호가 검출될 때 또는 대수 부호 여진 선형 예측을 위한 작은 품질 거리가 검출되고 신호 부분이 비-트랜지언트 신호로서 검출될 때의 상황을 나타낸다.
마지막 두 칼럼이 처음 두 라인은 모두 초기 프레임들의 수가 10보다 클 때 품질 결과가 결정되는 것을 나타낸다. 따라서, 하나의 코딩 알고리즘을 위하여 과거로부터 강력한 표시가 존재할 때, 트랜지언트 검출은 전혀 역할을 하지 않는다.
그러나, 두 인코딩 알고리즘 중 하나에 인코딩되는 초기 프레임들의 수가 N보다 작을 때, 트랜지언트 신호들을 위하여 필드(field) 40에 표시되는 변환 코딩 여진으로부터 대수 부호 여진 선형 예측으로 전환이 실행된다. 부가적으로, 필드 41에 표시된 것과 같이, 비-트랜지언트 신호를 갖고 있다는 사실 때문에 대수 부호 여진 선형 예측에 유리한 작은 품질 거리가 존재할 때에도 대수 부호 여진 선형 예측으로부터 변환 코딩 여진으로의 변화가 실행된다. 마지막 LCLP 프레임들의 수가 N보다 작을 때 그 위의 프레임이 또한 대수 부호 여진 선형 예측으로 인코딩되고, 따라서 필드 42에 표시된 것과 같이 어떠한 전환도 필요하지 않다. 부가적으로, 변환 코딩 여진 프레임들의 수가 N보다 작을 때 그리고 대수 부호 여진 선형 예측을 위하여 작은 품질 거리가 존재하고 신호가 비-트랜지언트일 때, 현재 프레임은 변환 코딩 여진을 사용하여 인코딩되고, 필드 43에 표시된 것과 같이 어떠한 전환도 필요하지 않다. 따라서, 이력의 영향은 필드 42, 43을 이러한 두 필드 위의 4개의 필드를 비교함으로써 명확해진다.
따라서, 본 발명은 바람직하게는 트랜지언트 검출기의 출력에 의한 폐쇄 루프 결정을 위한 이력에 영향을 준다. 따라서, 변환 코딩 여진 또는 대수 부호 여진 선형 예측이 주어지든지 간에 확장 적응성 멀티-레이트 광대역 내에서와 같이, 순수 폐쇄 루프 결정은 존재하지 않는다. 대신에, 폐쇄 루프 계산은 트랜지언트 검출 결과에 영향을 받는데, 즉, 모든 트랜지언트 신호 부분은 오디오 신호 내에서 결정된다. 대수 부호 여진 선형 예측 프레임 또는 변환 코딩 여진 프레임이 계산되는지의 결정은 폐쇄 루프 계산들 또는 일반적으로 품질 결과에만 의존하지 않으나, 부가적으로 트랜지언트 검출되는지 아닌지에 따라 의존한다.
바꾸어 말하면, 현재 프레임을 위하여 어떠한 인코딩 알고리즘이 사용되는지를 결정하기 위한 이력은 다음과 같이 표현될 수 있다:
변환 코딩 여진을 위한 품질 결과가 대수 부호 여진 선형 예측을 위한 품질 결과보다 약간 작고, 현재 고려되는 신호 부분들 또는 바로 현재 프레임이 트랜지언트가 아닐 때, 변환 코딩 여진이 대수 부호 여진 선형 예측 대신에 사용된다.
다른 한편으로, 대수 부호 여진 선형 예측을 위한 품질 결과가 변환 코딩 여진을 위한 품질 결과보다 약간 작고, 프레임이 트랜지언트일 때, 대수 부호 여진 선형 예측이 변환 코딩 여진 대신에 사용된다. 바람직하게는, 트랜지언트 검출 결과로서 평탄도(flatness) 측정이 계산되는데, 이는 정량적 수이다. 평탄도가 특정 값보다 크거나 동일할 때, 프레임은 트랜지언트인 것으로 결정된다. 다른 한편으로, 평탄도가 이러한 한계 값(threshold value)보다 작을 때, 프레임은 비-트랜지언트인 것으로 결정된다. 한계 값으로서, 두 가지의 평탄도 측정이 바람직한데, 평탄도의 계산은 도 5에서 더 상세히 설명된다.
게다가, 품질 결과에 관하여, 정량적 측정이 바람직하다. 신호대 잡음비 측정 또는 특히, 분절 신호대 잡음비 측정이 사용될 때, 이전에 사용된 것과 같은 용어 "약간 작은"은 1 dB가 더 작은 것을 의미할 수 있다. 따라서, 변환 코딩 여진 및 대수 부호 여진 선형 예측을 위한 신호대 잡음비들은 서로 더 다르거나 또는 달리 설명하면, 두 신호대 잡음비 값들 사이의 절대 차이가 1 dB보다 클 때, 도 3의 품질 조건만이 현재 오디오 신호 부분을 위한 인코딩 알고리즘을 결정한다.
위에서 설명된 결정은 과거 또는 초기 프레임들의 변환 코딩 여진 또는 대수 부호 여진 선형 예측의 트랜지언트 검출 또는 이력 출력 또는 신호대 잡음비가 가정(if) 조건 내로 포함될 때 더 정교할 수 있다. 따라서, 일 실시 예를 위하여 조건 3으로서 도 3에 도시된 이력이 만들어진다. 특히, 도 3은 이력 출력, 즉, 트랜지언트 조건을 변형하기 위하여 과거를 위한 결정이 사용될 때 대안을 도시한다.
대안으로서, 초기 변환 코딩 여진 또는 대수 부호 여진 선형 예측-신호대 잡음비들을 기초로 하는 또 다른 이력 조건은 초기 프레임들에 대하여 신호대 잡음비 차이의 변화가 예를 들면, 한계값보다 낮을 때 낮은 품질 인코딩 알고리즘을 위한 결정만이 실행된다는 사실을 포함할 수 있다. 또 다른 실시 예는 트랜지언트 검출 결과가 정량적 수일 때 트랜지언트 검출 결과의 사용을 포함할 수 있다. 그때, 낮은 품질 인코딩 알고리즘으로의 전환은 예를 들면 초기 프레임으로부터 현재 프레임으로의 정량적 트랜지언트 검출 결과의 변화가 다시 한계값 아래일 때만 실행될 수 있다. 도 3의 이력 조건 3의 또 다른 변형을 위한 이러한 도면들의 다른 조합들은 한편으로는 비트레이트 및 다른 한편으로는 오디오 품질 사이의 더 나은 절충을 획득하기 이하여 유용한 것으로 입증될 수 있다.
게다가, 도 3에 도시되고 이전에 설명된 것과 같은 이력 조건은 예를 들면, 대수 부호 여진 선형 예측 및 변환 코딩 여진 인코딩 알고리즘들의 내부 분석 데이터를 기초로 하는, 또 다른 이력 대신에 사용될 수 있거나 또는 이에 더하여 사용될 수 있다.
그 뒤에, 도 14의 라인(14) 상의 트랜지언트 검출의 바람직한 결정을 설명하기 위하여 도 5가 참조된다.
단계 50에서, 라인(10) 상의 펄스 코드 변조(PCM) 입력 신호와 같은 시간-도메인 오디오 신호는 하이-패스(high-pass) 필터링된 오디오 신호를 획득하기 위하여 하이-패스 필터링된다. 그리고 나서, 단계 52에서, 오디오 신호의 부분과 동일할 수 있는 하이-패스 필터링된 신호의 프레임은 복수의, 예를 들면, 8개의 서브 블록들로 세분된다. 그리고 나서, 단계 54에서, 각각의 서브 블록을 위한 에너지 값이 계산된다. 그리고 나서, 단계 56에서, 인접한 서브 블록들의 쌍들이 형성된다. 쌍들은 제 1 및 제 2 서브 블록으로 구성되는 첫 번째 쌍, 제 2 및 제 3 서브 블록으로 구성되는 두 번째 쌍, 제 3 및 제 4 서브 블록으로 구성되는 세 번째 쌍 등을 포함할 수 있다. 부가적으로, 초기 프레임의 마지막 서브 블록 및 현재 프레임의 제 1 서브 블록을 포함하는 쌍이 또한 사용될 수 있다. 대안으로서, 예를 들면, 제 1 및 제 2 서브 블록의 쌍들, 제 3 및 제 4 서브 블록의 쌍들, 등만을 형성하는 것과 같이 쌍들을 형성하는 다른 방법들이 실행될 수 있다. 그리고 나서, 또한 도 5의 블록(56)에 설명된 것과 같이, 각각의 서브 블록 쌍의 높은 에너지 값이 선택되고, 단계 58에 설명된 것과 같이, 서브 블록 쌍의 낮은 에너지 값에 의해 세분된다. 그리고 나서, 도 5의 블록(60)에 설명된 것과 같이, 프레임을 위한 단계(58)의 모든 결과들이 결합된다. 이러한 결합은 블록(58)의 결과들의 합계, 및 합계의 결과가 서브-블록 당 8쌍이 블록(56) 내에 결정되었을 때, 8과 같은 수의 쌍들에 의해 세분되는 평균으로 구성될 수 있다. 블록(60)의 결과는 신호 부분이 트랜지언트인지 아닌지를 결정하기 위하여 컨트롤러(22)에 의해 사용되는 평탄도 측정이다. 평탄도 측정이 2보다 크거나 동일할 때, 트랜지언트 신호 부분이 검출되나, 평탄도 측정이 2보다 작으면, 신호는 비-트랜지언트 또는 고정인 것이 결정된다. 그러나, 1. 5 및 3 사이의 다른 한계값들이 또한 사용될 수 있으나, 두 한계값이 최상의 결과를 제공한다는 것이 설명되었다.
다른 트랜지언트 검출기들이 또한 사용될 수 있다는 것을 이해하여야 한다. 트랜지언트 신호들은 부가적으로 유성음 신호(voiced speech signal)들을 포함한다. 종래에, 트랜지언트 신호들은 신호들 또는 캐스터네츠 같은 박수 혹은 글자들 "p" 또는 "t" 등을 발음함으로써 획득되는 신호들을 포함하는 음성 파열음들 포함한다. 그러나, "a", "e", "i", "o", "u" 같은 음성은 고전 접근법에서 트랜지언트 신호들이 아니 것으로 여겨지는데, 그 이유는 이들은 성문음(glottal) 또는 피치 펄스(pitch pulse)를 특징으로 하기 때문이다. 그러나, 음성들은 또한 유성음 신호들을 표현하기 때문에, 음성들은 또한 본 발명을 위한 트랜지언트 신호들인 것으로 고려된다. 유성음을 무성음과 구별하는 음성 검출기들에 의해, 또는 오디오 신호와 관련된 메타데이터를 평가하고 메타데이터 평가기(metadata evaluator)로, 상응하는 부분이 트랜지언트인지 또는 비-트랜지언트인지를 나타냄으로써 도 5에서의 과정에 부가적으로 또는 대안으로서, 그러한 신호들의 검출이 행해질 수 있다.
그 뒤에, 도 1의 라인(20) 상의 품질 결과를 계산하는 세 번째 방법, 즉, 프로세서(18)가 바람직하게 구성되는 방법을 설명하기 위하여 도 6a가 도시된다.
블록(61)에서, 복수의 가능성 각각을 위하여, 제 1 및 제 2 인코딩 알고리즘을 사용하여 부분이 인코딩되고 디코딩되는 폐쇄 루프 과정이 설명된다. 그리고 나서, 단계 63에서, 인코딩되고 다시 디코딩된 오디오 신호 및 오리지널 신호의 차이에 따라 분절 신호대 잡음비와 같은 측정이 계산된다. 이러한 측정은 두 인코딩 알고리즘 모두를 위하여 계산된다.
그리고 나서, 개별 분절 신호대 잡음비들을 사용하여 평균 분절 신호대 잡음비가 단계 65에서 계산되고, 이러한 계산은 두 인코딩 알고리즘 모두를 위하여 다시 실행되는데, 따라서, 결국 단계 65는 오디오 신호의 동일한 부분을 위한 두 개의 서로 다른 평균 신호대 잡음비 값을 야기한다. 하나의 프레임을 위한 이러한 분절 신호대 잡음비 사이의 차이는 도 1의 라인(20) 상의 정량적 품질 결과로서 사용된다.
도 6b는 두 개의 방정식을 도시하는데, 상부 방정식은 블록(63)에서 사용되고, 하부 방정식은 블록(65)에서 사용된다. xW는 가중 오디오 신호를 나타내며,
Figure 112013083157495-pct00001
는 인코딩되고 다시 디코딩된 가중 신호를 나타낸다.
블록(65)에서 실행된 평균은 하나의 프레임에 대한 평균인데, 각각의 프레임은 서브프레임들의 수(NSF)로 구성되고, 4개의 그러한 프레임이 함께 수퍼프레임을 형성한다. 따라서, 수퍼프레임은 1024 샘플들을 포함하고, 각각의 프레임은 2056 샘플들을 포함하며, 도 6b의 상부 방정식 또는 단계 63이 실행되는, 각각이 서브프레임은 64 샘플들을 포함한다. 블록(63)에서 사용된 상부 방정식에서, n은 샘플 수 지수이고 N은 서브프레임이 64 샘플들을 갖는 것을 표시하는 63과 동일한 서브프레임 내의 샘플들의 최대 수이다.
도 7은 도 1의 실시 예와 유사한, 인코딩을 위한 본 발명의 장치의 또 다른 실시 예를 도시하는데, 동일한 참조 번호는 동일한 구성요소를 나타낸다. 그러나, 도 7은 인코더 스테이지(16)의 더 상세한 표현을 설명하는데, 이는 가중 및 선형 예측 코딩 분석/필터링을 실행하기 위한 전-프로세서(16a)를 포함하며, 전-프로세서 블록(16a)은 라인(70) 상의 선형 예측 코딩 데이터를 출력 인터페이스(24)에 제공한다. 게다가, 도 1의 인코더 스테이지(16)는 16b에서 제 1 인코딩 알고리즘을 포함하고 16c에서 제 2 인코딩 알고리즘을 포함하는데, 이는 각각 대수 부호 여진 선형 예측 인코딩 알고리즘 및 변환 코딩 여진 인코딩 알고리즘이다.
게다가, 인코더 스테이지(16)는 블록들(16d, 16c) 전에 연결되는 스위치(16d) 또는 블록들(16b, 16c) 다음에 연결되는 스위치(16e)를 포함할 수 있는데, "전에" 또는 "다음에"는 적어도 도 7의 상부에서 하부로 블록(16a 내지 16e)에 대하여 존재하는 신호 흐름 방향을 언급한다. 블록(16d)은 폐쇄 루프 결정에서 존재하지 않을 것이다. 이 경우에 있어서, 스위치(16e)만이 존재할 것인데, 그 이유는 두 인코딩 알고리즘(16b, 16c)이 오디오 신호의 하나 및 동일한 부분 상에 작동하고 선택된 인코딩 알고리즘의 결과가 제거될 것이고 출력 인터페이스(24)로 전달될 것이기 때문이다.
그러나, 만일 두 인코딩 알고리즘이 하나 및 동일한 신호 상에 작동하기 전에 개방 루프 결정 또는 다른 결정이 실행되면, 스위치(16e)는 존재하지 않을 것이나, 스위치(16d)는 존재할 것이며, 오디오 신호의 각각의 부분은 블록들(16b, 16c) 중 하나만을 사용하여 인코딩될 것이다.
게다가, 특히 폐쇄 루프 방식을 위하여, 두 블록들의 출력은 라인(71, 72)에 의해 표시된 것과 같이 프로세서 및 컨트롤러 블록(18, 22)에 연결된다. 스위치 제어는 라인들(73, 74)을 거쳐 프로세서 및 컨트롤러 블록(18, 22)으로부터 상응하는 스위치들(16d, 16e)로 발생한다. 다시, 구현에 따라, 라인들(73, 74) 중 하나만이 일반적으로 거기에 존재할 것이다.
인코딩된 오디오 신호(26)는 따라서 다른 데이터 중에서, 일반적으로 출력 인터페이스(24) 내로 입력되기 전에 허프만 코딩(Huffman-coding) 또는 산술 코딩에 의한 것과 같이 중복 인코딩될 대수 부호 여진 선형 예측 또는 변환 코딩 여진의 결과를 포함한다. 부가적으로, 인코딩된 오디오 신호 내에 포함되도록 하기 위하여 선형 예측 코딩 데이터(70)가 출력 인터페이스(24)에 제공된다. 게다가, 부분이 부가적으로 디코더에 오디오 신호의 현재 부분이 대수 부호 여진 선형 예측 또는 변환 코딩 여진 부분인 것을 표시하는 인코딩된 오디오 신호 내로의 코딩 방식 결정을 포함하는 것이 바람직하다.
장치의 맥락에서 일부 양상들이 설명되었으나, 이러한 양상들은 또한 블록 또는 장치가 방법 단계 또는 방법 단계의 특징에 상응하는, 상응하는 방법의 설명을 나타내는 것이 자명하다. 유사하게, 방법 단계의 맥락에서 설명된 양상들은 또한 상응하는 장치의 상응하는 블록 또는 아이템 또는 특징을 나타낸다.
특정 구현 필요성에 따라, 본 발명의 실시 예들은 하드웨어 또는 소프트웨어에서 구현될 수 있다. 구현은 디지털 저장 매체, 예를 들면, 거기에 저장되는 전자적으로 판독가능한 신호들을 갖는, 플로피 디스크, DVD, CD, ROM,, PROM, EPROM, EEPROM 또는 플래시 메모리를 사용하여 실행될 수 있는데, 이는 각각의 방법이 실행되는 것과 같이 프로그램가능 컴퓨터 시스템과 협력한다(또는 협력할 수 있다).
본 발명에 따른 일부 실시 예들은 여기에 설명된 방법들 중의 하나가 실행되는 것과 같이, 프로그램가능 컴퓨터 시스템과 협력할 수 있는, 전자적으로 판독가능한 제어 신호들을 갖는 비-일시적 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시 예들은 프로그램 코드를 갖는 컴퓨터 프로그램 베춤으로서 구현될 수 있는데, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터상에 구동될 때 방법들 중의 하나를 실행하도록 작동할 수 있다. 프로그램 코드는 예를 들면 기계 판독가능 캐리어 상에 저장될 수 있다.
다른 실시 예들은 기계 판독가능 캐리어 상에 저장되는, 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램을 포함한다.
바꾸어 말하면, 따라서 본 발명의 방법이 일 실시 예는 컴퓨터 프로그램이 컴퓨터상에 구동할 때, 여기에 설명된 방법들 중의 하나를 실행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
본 발명의 방법의 또 다른 실시 예는 따라서 여기에 설명된 방법들 중의 하나를 실행하기 위하여 그것에 대해 기록된, 컴퓨터 프로그램을 포함하는 데이터 캐리어(또는 디지털 저장 매체, 또는 컴퓨터 판독가능 매체)이다.
본 발명의 방법의 또 다른 실시 예는 따라서 여기에 설명된 방법들 중의 하나를 실행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 데이터 스트림 또는 시퀀스이다. 신호들의 데이터 스트림 또는 시퀀스는 예를 들면 데이터 통신 연결, 예를 들면 인터넷을 거쳐 전달되도록 구성될 수 있다.
또 다른 실시 예는 처리 수단들, 예를 들면, 여기에 설명된 방법들 중의 하나를 실행하거나 적용하도록 구성되는 컴퓨터, 또는 프로그램가능 논리 장치를 포함한다.
또 다른 실시 예는 여기에 설명된 방법들 중의 하나를 실행하기 위하여 거기에 설치된 컴퓨터 프로그램을 갖는 컴퓨터를 포함한다.
일부 실시 예들에서, 프로그램가능 논리 장치(예를 들면, 필드 프로그램가능 게이트 어레이(field programmable gate array))는 여기에 설명된 방법들의 기능들이 일부 또는 모두를 실행하도록 사용될 수 있다. 일부 실시 예들에서, 필드 프로그램가능 게이트 어레이는 여기에 설명된 방법들 중의 하나를 실행하기 위하여 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 바람직하게는 어떠한 하드웨어 장치에 의해 실행된다.
위에서 설명된 실시 예들은 단지 본 발명의 원리를 설명하기 위한 것이다. 여기에 설명된 배치들 및 내용들의 변형 및 변경들은 통상의 지식을 가진 자들에 자명할 것이라는 것을 이해하여야 한다. 따라서, 본 발명의 실시 예들의 설명에 의해 표현된 특정 상세 내용에 의한 것이 아니라 첨부된 청구항들의 범위에 의해서만 한정되는 것으로 의도된다.
10 : 입력 라인
12 : 트랜지언트 검출기
14 : 라인
16 : 인코더 스테이지
18 : 프로세서
20 : 라인
22 : 컨트롤러
24 : 출력 인터페이스
26 : 인코딩된 오디오 신호
28 : 라인
30 : 입력
32 : 라인

Claims (15)

  1. 오디오 신호의 부분에 대하여 인코딩된 오디오 신호(26)를 획득하기 위하여 오디오(10)의 부분을 코딩하기 위한 장치에 있어서,
    트랜지언트 검출 결과(14)를 획득하기 위하여 트랜지언트 신호가 상기 오디오 신호의 부분 내에 위치되는지를 검출하기 위한 트랜지언트 검출기(12);
    상기 오디오 신호 상의 제 1 특성을 갖는 제 1 인코딩 알고리즘을 실행하기 위한, 그리고 상기 오디오 신호 상의 상기 제 1 특성과는 다른 제 2 특성을 갖는 제 2 인코딩 알고리즘을 실행하기 위한 인코더 스테이지(16);
    품질 결과(20)를 획득하기 위하여 다른 인코딩 알고리즘에 대하여 어떠한 인코딩 알고리즘이 상기 오디오 신호의 부분에 더 근사치인 인코딩된 오디오 신호를 야기하는지를 결정하기 위한 프로세서(18); 및
    상기 트랜지언트 검출 결과(14) 및 상기 품질 결과(20)를 기초로 하여 상기 오디오 신호의 부분에 대하여 상기 인코딩된 오디오 신호가 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘에 의해 발생되는지를 결정하기 위한 컨트롤러(22);를 포함하며,
    상기 컨트롤러(22)는 비록 상기 품질 결과(20)가 상기 제 1 인코딩 알고리즘을 위한 더 나은 품질을 나타내어도, 상기 트랜지언트 검출 결과(14)가 비-트랜지언트 신호를 나타낼 때, 상기 제 2 인코딩 알고리즘을 결정하도록 구성되고, 또는 상기 컨트롤러(22)는 비록 상기 품질 결과(20)가 상기 제 2 인코딩 알고리즘을 위한 더 나은 품질을 나타내어도, 상기 트랜지언트 검출 결과가 트랜지언트 신호를 나타낼 때, 상기 제 1 인코딩 알고리즘을 결정하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  2. 제 1항에 있어서, 상기 인코더 스테이지(16)는 상기 제 2 인코딩 알고리즘보다 트랜지언트 신호들에 더 적합한 상기 제 1 인코딩 알고리즘을 사용하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  3. 제 2항에 있어서, 상기 제 1 인코딩 알고리즘은 대수 부호 여진 선형 예측 알고리즘이고, 상기 제 2 인코딩 알고리즘은 변환 코딩 알고리즘인 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  4. 제 1항에 있어서, 상기 컨트롤러(22)는 상기 품질 결과가 한계 차이 값보다 작은, 상기 인코딩 알고리즘들과 다른 품질을 나타낼 때만 상기 제 2 인코딩 알고리즘 또는 상기 제 1 인코딩 알고리즘을 결정하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  5. 제 4항에 있어서, 상기 한계 값은 3 dB와 동일하거나 또는 작으며 상기 두 인코딩 알고리즘을 위한 상기 품질 결과는 상기 오디오 신호(10) 및 상기 오디오 신호의 인코딩되고 다시 디코딩된 버전 사이의 신호대 잡음비 계산을 사용하여 계산되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  6. 제 1항에 있어서, 상기 컨트롤러(22)는 상기 제 1 또는 제 2 인코딩 알고리즘이 결정된 초기 신호 부분들의 수가 미리 결정된 수보다 작을 때, 상기 제 2 인코딩 알고리즘 또는 상기 제 1 인코딩 알고리즘만을 결정하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  7. 제 6항에 있어서, 상기 컨트롤러(22)는 10보다 작은 미리 결정된 값을 사용하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  8. 제 1항에 있어서, 상기 트랜지언트 검출기(12)는:
    하이-패스 필터링된 신호 블록을 획득하기 위하여 상기 오디오 신호를 하이-패스 필터링하는 단계(50);
    상기 하이-패스 필터링된 신호 블록을 복수의 서브 블록으로 세분하는 단계;
    각각의 서브 블록을 위한 에너지를 계산하는 단계;
    각각의 쌍을 위한 결과를 획득하기 위하여 인접한 서브 블록들의 각각의 쌍을 위한 에너지 값들을 결합하는 단계; 및
    상기 트랜지언트 검출 결과(14)를 획득하기 위하여 상기 쌍들을 위한 결과들을 결합하는 단계;를 실행하도록 구성되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  9. 제 1항에 있어서, 상기 인코더 스테이지(16)는 잔류 신호를 결정하기 위하여 선형 예측 코딩 계수들에 의해 결정되는 선형 예측 코딩 분석 필터를 사용하여 상기 오디오 신호를 필터링하도록 상기 오디오 신호로부터 선형 예측 코딩 계수들을 결정하기 위한 선형 예측 코딩 필터링 스테이지를 더 포함하고, 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘은 상기 잔류 신호에 적용되며,
    상기 인코딩된 오디오 신호는 상기 선형 예측 코딩 계수들 상의 정보(70)를 더 포함하는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  10. 제 1항에 있어서, 상기 인코더 스테이지(16)는 상기 제 1 인코딩 알고리즘(16b) 및 상기 제 2 인코딩 알고리즘(16c)에 연결되는 스위치(16d) 또는 그 뒤에 상기 제 1 인코딩 알고리즘(16b) 및 상기 제 2 인코딩 알고리즘(16c)에 연결되는 스위치(16e)를 포함하며, 상기 스위치(16d, 16e)는 상기 컨트롤러(22)에 의해 제어되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 장치.
  11. 오디오 신호의 부분에 대하여 인코딩된 오디오 신호(26)를 획득하기 위하여 오디오 신호(10)의 부분을 코딩하기 위한 방법에 있어서,
    트랜지언트 검출 결과(14)를 획득하기 위하여 트랜지언트 신호가 상기 오디오 신호의 부분 내에 위치되는지를 검출하는 단계(12);
    상기 오디오 신호 상의 제 1 특성을 갖는 제 1 인코딩 알고리즘을 실행하는 단계, 및 상기 오디오 신호 상의 상기 제 1 특성과는 다른 제 2 특성을 갖는 제 2 인코딩 알고리즘을 실행하는 단계(16);
    품질 결과(20)를 획득하기 위하여 다른 인코딩 알고리즘에 대하여 어떠한 인코딩 알고리즘이 상기 오디오 신호의 부분에 더 근사치인 인코딩된 오디오 신호를 야기하는지를 결정하는 단계(18); 및
    상기 트랜지언트 검출 결과(14) 및 상기 품질 결과(20)를 기초로 하여 상기 오디오 신호의 부분에 대하여 상기 인코딩된 오디오 신호가 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘에 의해 발생되는지를 결정하는 단계(22);를 포함하며,
    비록 상기 품질 결과(20)가 상기 제 1 인코딩 알고리즘을 위한 더 나은 품질을 나타내어도, 상기 트랜지언트 검출 결과(14)가 비-트랜지언트 신호를 나타낼 때, 상기 제 2 인코딩 알고리즘이 결정되며, 또는 비록 상기 품질 결과(20)가 상기 제 2 인코딩 알고리즘을 위한 더 나은 품질을 나타내어도, 상기 트랜지언트 검출 결과가 트랜지언트 신호를 나타낼 때, 상기 제 1 인코딩 알고리즘이 결정되는 것을 특징으로 하는 오디오 신호의 부분을 코딩하기 위한 방법.
  12. 컴퓨터상에 구동될 때, 제 11항에 따라 오디오 신호의 부분을 코딩하는 방법을 실행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램을 저장한 저장 매체.
  13. 삭제
  14. 삭제
  15. 삭제
KR1020137024069A 2011-02-14 2012-02-13 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 KR101525185B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052396 WO2012110448A1 (en) 2011-02-14 2012-02-13 Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020147032302A Division KR101562281B1 (ko) 2011-02-14 2012-02-13 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20130126708A KR20130126708A (ko) 2013-11-20
KR101525185B1 true KR101525185B1 (ko) 2015-06-02

Family

ID=71943603

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147032302A KR101562281B1 (ko) 2011-02-14 2012-02-13 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
KR1020137024069A KR101525185B1 (ko) 2011-02-14 2012-02-13 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020147032302A KR101562281B1 (ko) 2011-02-14 2012-02-13 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법

Country Status (19)

Country Link
US (1) US9620129B2 (ko)
EP (1) EP2676270B1 (ko)
JP (1) JP5914527B2 (ko)
KR (2) KR101562281B1 (ko)
CN (1) CN103493129B (ko)
AR (2) AR085217A1 (ko)
AU (1) AU2012217216B2 (ko)
BR (1) BR112013020588B1 (ko)
CA (2) CA2827266C (ko)
ES (1) ES2623291T3 (ko)
MX (1) MX2013009304A (ko)
MY (1) MY166006A (ko)
PL (1) PL2676270T3 (ko)
PT (1) PT2676270T (ko)
RU (1) RU2573231C2 (ko)
SG (1) SG192714A1 (ko)
TW (1) TWI476760B (ko)
WO (1) WO2012110448A1 (ko)
ZA (1) ZA201306842B (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2899013C (en) 2013-01-29 2017-11-07 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm
EP2959479B1 (en) 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
BR112015029172B1 (pt) * 2014-07-28 2022-08-23 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Aparelho e método para selecionar um dentre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos
TWI602172B (zh) 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN110998722B (zh) 2017-07-03 2023-11-10 杜比国际公司 低复杂性密集瞬态事件检测和译码
CN117198302A (zh) 2017-08-10 2023-12-08 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
EP3719799A1 (en) * 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation
CN110767243A (zh) * 2019-11-04 2020-02-07 重庆百瑞互联电子技术有限公司 一种音频编码方法、装置及设备
CN115881139A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
WO2024110562A1 (en) * 2022-11-23 2024-05-30 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive encoding of transient audio signals

Family Cites Families (245)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135754A (en) 1980-03-26 1981-10-23 Nippon Denso Co Ltd Method of controlling current feeding time period at the time of acceleration
US4711212A (en) 1985-11-26 1987-12-08 Nippondenso Co., Ltd. Anti-knocking in internal combustion engine
CA2483322C (en) 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
JP3304717B2 (ja) 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) * 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JPH10276095A (ja) 1997-03-28 1998-10-13 Toshiba Corp 符号化器及び復号化器
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
DE19827704C2 (de) 1998-06-22 2000-05-11 Siemens Ag Verfahren zur zylinderselektiven Klopfregelung einer Brennkraftmaschine
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
CN1145928C (zh) 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
DE60031002T2 (de) 2000-02-29 2007-05-10 Qualcomm, Inc., San Diego Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
DE10012956A1 (de) 2000-03-16 2001-09-20 Bosch Gmbh Robert Vorrichtung und Verfahren zur Regelung des Energieangebots für die Zündung einer Brennkraftmaschine
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20040142496A1 (en) 2001-04-23 2004-07-22 Nicholson Jeremy Kirk Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US7206739B2 (en) 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP3815323B2 (ja) 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
US6646332B2 (en) 2002-01-18 2003-11-11 Terence Quintin Collier Semiconductor package device
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US20040010329A1 (en) 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
EP1543307B1 (en) 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
CA2501368C (en) 2002-10-11 2013-06-25 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
JP4191503B2 (ja) 2003-02-13 2008-12-03 日本電信電話株式会社 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
WO2004082288A1 (en) 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
KR100556831B1 (ko) 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
EP1642265B1 (en) 2003-06-30 2010-10-27 Koninklijke Philips Electronics N.V. Improving quality of decoded audio by adding noise
DE10331803A1 (de) 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
CA2475283A1 (en) 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Method for recovery of lost speech data
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7418396B2 (en) 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
DE602004004818T2 (de) 2003-10-30 2007-12-06 Koninklijke Philips Electronics N.V. Audiosignalcodierung oder -decodierung
KR20070001115A (ko) 2004-01-28 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 복소수 값 데이터를 이용하는 오디오 신호 디코딩
JP5356652B2 (ja) * 2004-02-12 2013-12-04 コア ワイアレス ライセンシング エス アー アール エル 分類されたメディア経験の質
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
AU2004319556A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) * 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
MX2007003063A (es) * 2004-09-17 2007-05-16 Koninkl Philips Electronics Nv Codificacion combinada de audio que minimiza la distorsion perceptual.
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
CN101120398B (zh) 2005-01-31 2012-05-23 斯凯普有限公司 通信系统中用于帧连接的方法
CN100593197C (zh) 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
WO2006107836A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for split-band encoding of speech signals
JP4767069B2 (ja) 2005-05-02 2011-09-07 ヤマハ発動機株式会社 鞍乗型車両のエンジン制御装置及びそのエンジン制御方法
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
CA2609945C (en) 2005-06-18 2012-12-04 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
WO2006137425A1 (ja) 2005-06-23 2006-12-28 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
WO2007083931A1 (en) 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US7556670B2 (en) 2006-03-16 2009-07-07 Aylsworth Alonzo C Method and system of coordinating an intensifier and sieve beds
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
JP5190363B2 (ja) 2006-07-12 2013-04-24 パナソニック株式会社 音声復号装置、音声符号化装置、および消失フレーム補償方法
JP5052514B2 (ja) 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN102592303B (zh) 2006-07-24 2015-03-11 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
KR101041895B1 (ko) 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
PL2076901T3 (pl) 2006-10-25 2017-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania wartości podpasm audio i urządzenie i sposób do generowania próbek audio w dziedzinie czasu
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
CN102395033B (zh) 2006-12-12 2014-08-27 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
CN101622665B (zh) 2007-03-02 2012-06-13 松下电器产业株式会社 编码装置以及编码方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8364472B2 (en) 2007-03-02 2013-01-29 Panasonic Corporation Voice encoding device and voice encoding method
DE102007063635A1 (de) * 2007-03-22 2009-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
PT2827327T (pt) 2007-04-29 2020-08-27 Huawei Tech Co Ltd Método para codificação de impulsos de excitação
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
JP5686369B2 (ja) 2007-06-11 2015-03-18 フラウンホッファー−ゲゼルシャフト ツァー フェーデルング デア アンゲバンテン フォルシュング エー ファー インパルス状の部分と定常部分とを有するオーディオ信号を符号化するオーディオ符号器、符号化方法、復号器、および復号化方法
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN103594090B (zh) 2007-08-27 2017-10-10 爱立信电话股份有限公司 使用时间分辨率能选择的低复杂性频谱分析/合成
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) * 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
ES2665766T3 (es) 2008-03-04 2018-04-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mezclado de corrientes de datos de entrada y generación a partir de ahí de una corriente de datos de salida
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
JP2009224850A (ja) 2008-03-13 2009-10-01 Toshiba Corp 無線通信装置
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
KR101400513B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144171B1 (en) 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
PL2346029T3 (pl) 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MY181231A (en) 2008-07-11 2020-12-21 Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
PL2301020T3 (pl) 2008-07-11 2013-06-28 Fraunhofer Ges Forschung Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8380498B2 (en) 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
MY154633A (en) 2008-10-08 2015-07-15 Fraunhofer Ges Forschung Multi-resolution switched audio encoding/decoding scheme
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CN103632678B (zh) 2009-01-16 2017-06-06 杜比国际公司 叉积增强的谐波转置
WO2010086373A2 (en) 2009-01-28 2010-08-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP2645367B1 (en) 2009-02-16 2019-11-20 Electronics and Telecommunications Research Institute Encoding/decoding method for audio signals using adaptive sinusoidal coding and apparatus thereof
EP2234103B1 (en) * 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
US8363597B2 (en) 2009-04-09 2013-01-29 Qualcomm Incorporated MAC architectures for wireless communications using multiple physical layers
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP2446539B1 (en) * 2009-06-23 2018-04-11 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
JP5267362B2 (ja) * 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
US8635357B2 (en) * 2009-09-08 2014-01-21 Google Inc. Dynamic selection of parameter sets for transcoding media data
MY167980A (en) 2009-10-20 2018-10-09 Fraunhofer Ges Forschung Multi- mode audio codec and celp coding adapted therefore
WO2011048118A1 (en) 2009-10-20 2011-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications
JP5247937B2 (ja) 2009-10-20 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号符号器、オーディオ信号復号器、エイリアシング消去を用いたオーディオ信号の符号化又は復号化方法
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
FR2963254B1 (fr) 2010-07-27 2012-08-24 Maurice Guerin Dispositif et procede pour laver des surfaces internes d?une enceinte
MY164797A (en) 2011-02-14 2018-01-30 Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V Apparatus and method for processing a decoded audio signal in a spectral domain
CN103477386B (zh) 2011-02-14 2016-06-01 弗劳恩霍夫应用研究促进协会 音频编解码器中的噪声产生
WO2013023046A1 (en) 2011-08-10 2013-02-14 Thompson Automotive Labs Llc Methods and apparatus for engine analysis and remote engine analysis
WO2013075753A1 (en) * 2011-11-25 2013-05-30 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal
KR20130134193A (ko) 2012-05-30 2013-12-10 삼성전자주식회사 컨커런트 서비스를 제공하기 위한 전자 장치 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WD7 of USAC, ISO/IEC JTC1/SC29/WG11 MPEG2010/N11299, April 2010, Dresden *

Also Published As

Publication number Publication date
CA2827266A1 (en) 2012-08-23
BR112013020588A2 (pt) 2018-07-10
CA2827266C (en) 2017-02-28
ES2623291T3 (es) 2017-07-10
JP2014510303A (ja) 2014-04-24
AU2012217216A1 (en) 2013-09-26
AU2012217216B2 (en) 2015-09-17
EP2676270B1 (en) 2017-02-01
US20130332177A1 (en) 2013-12-12
EP2676270A1 (en) 2013-12-25
MY166006A (en) 2018-05-21
WO2012110448A1 (en) 2012-08-23
CN103493129B (zh) 2016-08-10
US9620129B2 (en) 2017-04-11
JP5914527B2 (ja) 2016-05-11
BR112013020588B1 (pt) 2021-07-13
SG192714A1 (en) 2013-09-30
RU2013142072A (ru) 2015-03-27
MX2013009304A (es) 2013-10-03
RU2573231C2 (ru) 2016-01-20
AR098480A2 (es) 2016-06-01
CN103493129A (zh) 2014-01-01
CA2920964C (en) 2017-08-29
PT2676270T (pt) 2017-05-02
AR085217A1 (es) 2013-09-18
KR101562281B1 (ko) 2015-10-22
ZA201306842B (en) 2014-05-28
CA2920964A1 (en) 2012-08-23
KR20130126708A (ko) 2013-11-20
TW201301265A (zh) 2013-01-01
KR20140139630A (ko) 2014-12-05
PL2676270T3 (pl) 2017-07-31
TWI476760B (zh) 2015-03-11

Similar Documents

Publication Publication Date Title
KR101525185B1 (ko) 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP1747554B1 (en) Audio encoding with different coding frame lengths
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
EP3396669B1 (en) Harmonicity-dependent controlling of a harmonic filter tool
US20190272839A1 (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP2290815A2 (en) Method and system for reducing effects of noise producing artifacts in a voice codec
JP2016505902A (ja) 第1の符号化アルゴリズム及び第2の符号化アルゴリズムのうちの1つを選択するための装置及び方法
CA2910878C (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
ZA200609478B (en) Audio encoding with different coding frame lengths

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180427

Year of fee payment: 4