KR101427863B1 - 오디오 신호 코딩 방법 및 장치 - Google Patents

오디오 신호 코딩 방법 및 장치 Download PDF

Info

Publication number
KR101427863B1
KR101427863B1 KR1020137023033A KR20137023033A KR101427863B1 KR 101427863 B1 KR101427863 B1 KR 101427863B1 KR 1020137023033 A KR1020137023033 A KR 1020137023033A KR 20137023033 A KR20137023033 A KR 20137023033A KR 101427863 B1 KR101427863 B1 KR 101427863B1
Authority
KR
South Korea
Prior art keywords
delay
frequency
audio signal
coding
low
Prior art date
Application number
KR1020137023033A
Other languages
English (en)
Other versions
KR20130126695A (ko
Inventor
레이 미아오
제신 리우
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20130126695A publication Critical patent/KR20130126695A/ko
Application granted granted Critical
Publication of KR101427863B1 publication Critical patent/KR101427863B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호 방법 및 장치에 관한 것이다. 방법, 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계; 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하는 단계; 및 주파수 코딩 방식 또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 단계를 포함한다.

Description

오디오 신호 코딩 방법 및 장치{AUDIO SIGNAL CODING METHOD AND APPARATUS}
삭제
본 발명은 통신 분야에 관한 것이며, 특히 오디오 신호 코딩 방법 및 장치에 관한 것이다.
오디오 코딩 동안, 사람의 귀의 비트 레이트 한계 및 청력 특성을 고려하여, 저주파 오디오 신호의 정보를 양호하게 코딩하고 고주파 오디오 신호의 정보를 폐기한다. 그렇지만, 네트워크 기술의 급속한 발전으로, 네트워크 대역폭 한계가 낮아지고 있다. 사람들의 음색(timbre)에 대한 조건은 더 높아지고 있는 반면, 신호에 대한 대역폭을 부가함으로써 고주파 오디오 신호의 정보를 저장하고 싶어한다. 이 방법에서, 오디오 신호의 음색이 개선된다. 구체적으로, 이것은 대역폭 확장(BandWidth Extension: BWE) 기술을 사용함으로써 실현될 수 있다.
대역폭 확장에 의해 오디오 신호의 주파수 범위를 확장시키고 신호 품질을 향상시킬 수 있다. 현재, 흔히 사용되고 있는 BWT 기술로서는, 예를 들어, G.729.1의 시간 도메인(Time Domain: TD) 대역폭 확장 알고리즘, 동영상 전문가 그룹(Moving Picture Experts Group: MPEG)에서의 스펙트럼 대역 복제(Spectral Band Replication: SBR) 기술, 및 국제 통신 연합(International Telecommucation Union: ITU-I) G.722B/G.722.1D에서의 주파수 도메인(Frequency Domain: FD) 대역폭 확장 알고리즘을 들 수 있다.
도 1 및 도 2는 종래기술에서의 대역폭 확장에 대한 개략도이다. 즉, 저주파(예를 들어, 6.4 kHz보다 작은 주파수) 오디오 신호가 시간 도메인 코딩(TD coding) 또는 주파수 도메인 코딩(FD coding)을 사용하든 안 하든 간에, 고주파(예를 들어, 6.4-16/14 kHz) 오디오 신호는 대역폭 확장을 위해 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)을 사용한다.
종래기술에서는, 저주파 오디오 신호의 코딩 방식 및 오디오 신호의 특성을 고려하지 않고, 시간 도메인 대역폭 확장의 시간 도메인 코딩 또는 주파수 도메인 대역폭 확장의 주파수 도메인 코딩만을 사용하여 고주파 오디오 신호를 코딩한다.
본 발명의 실시예는 오디오 신호 코딩 방법 및 장치를 제공하며, 이에 따라 고정 코딩 대신 적응 코딩을 실현할 수 있다.
본 발명의 실시예는 오디오 신호 코딩 방법을 제공하며, 상기 방법은,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및
주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계
를 포함한다.
본 발명의 실시예는 오디오 신호 코딩 장치를 제공하며, 상기 장치는,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및
주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛
을 포함한다.
본 발명의 실시예의 오디오 코딩 방법 및 장치에 따르면, 고주파 오디오 신호로의 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성에 따라 확정될 수 있다. 이 방법에서, 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성이 대역폭 확장 동안 고려되지 않는 경우를 회피할 수 있고, 대역폭 확장은 단일 코딩 방식에 제한되지 않으며, 적응 코딩이 실현되고, 오디오 코딩 품질이 향상된다.
도 1은 종래기술에서의 대역폭 확장에 대한 제1 개략도이다.
도 2는 종래기술에서의 대역폭 확장에 대한 제2 개략도이다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
도 4는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도이다.
도 5는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도이다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다.
도 7은 ITU-T G.718에서의 분석 윈도에 대한 개략도이다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다.
첨부된 도면 및 실시예를 참조하여 본 발명의 기술적 솔루션에 대해 이하에 설명한다.
본 발명의 실시예에 따르면, 주파수 대역 확장에 시간 도메인 대역폭 확장이 사용되는지 또는 주파수 도메인 대역폭 확장이 사용되는지는 주파수 오디오 신호의 코딩 방식 또는 오디오 신호의 특성에 따라 확정될 수 있다.
이 방법에서, 저주파 코딩이 시간 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있고; 저주파 코딩이 주파수 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다. 도 3에 도시된 바와 같이, 본 발명의 본 실시예에 따른 오디오 신호 코딩 방법은 구체적으로 이하의 단계를 포함한다:
단계 101: 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류한다.
저주파 오디오 신호는 직접 코딩되는 반면, 고주파 오디오 신호는 대역폭 확장을 통해 코딩되어야 한다.
단계 102: 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩한다.
저주파 오디오 신호는 2가지 방식, 즉 시간 도메인 코딩 또는 주파수 도메인 코딩으로 코딩될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서, 저주파 음성 신호는 시간 도메인 코딩을 사용하여 코딩되고; 음악 오디오 신호와 관련해서, 저주파 음성 신호는 주파수 도메인 코딩을 사용하여 코딩된다. 일반적으로, 시간 도메인 코딩, 예를 들어, 코드 여기 선형 예측(Code Excited Linear Predition: CELP)을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있으며, 주파수 도메인 코딩, 예를 들어, 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 또는 고속 푸리에 변환(Fast fourier Transform: FFT)을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.
단계 103: 저주파 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다.
이 단계는 고주파 오디오 신호를 코딩하는 경우에 몇 가지 가능성에 대해 설명한다: 첫째, 저주파 오디오 신호의 코딩 방식에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 둘째, 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 셋째, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계.
저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 그렇지만, 오디오 신호들의 특성은 음성 오디오 신호 또는 음악 오디오 신호가 될 수 있다. 고주파 오디오 신호의 코딩 방식은 시간 도메인 대역폭 확장 모드 또는 주파수 도메인 대역폭 확장 모드가 될 수 있다. 고주파 오디오 신호의 대역폭 확장과 관련해서, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 코딩이 수행되어야 한다.
저주파 코딩 방식 및 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다. 선택된 대역폭 확장 모드는 저주파 코딩 방식 및 오디오 신호들의 특성에 대응하고, 동일한 도메인 코딩 방식에 속한다.
일실시예에서, 선택된 대역폭 확장 모드는 저주파 코딩 방식에 대응한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호 및 저주파 오디오 신호의 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.
다른 실시예에서, 선택된 대역폭 확장 모드는 오디오 신호들의 특성에 적절한 저주파 코딩 방식에 대응한다: 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 적절한 저주파 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.
또 다른 실시예에서, 저주파 코딩 방식 및 오디오 신호들의 특성을 종합적으로 고려함으로써, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하고 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 4를 참조하면, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도가 도시되어 있다. 시간 도메인(TD) 코딩 또는 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호, 예를 들어, 0-6.4kHz에서의 오디오 신호를 코딩할 수 있다. 고대역 오디오 신호, 예를 들어, 6.4-16/14 kHz의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.
요컨대, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서는, 저주파 오디오 신호의 코딩 방식 및 고주파 신호의 대역폭 확장이 일대일 대응이 되지 않는다. 예를 들어, 시간 도메인(TD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있으며; 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.
구체적으로, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 방식은 저주파 오디오 신호의 저주파 코딩 방식에 따라 처리를 수행하는 것이다. 상세하게 사항에 대해서는, 도 5에 도시된 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도를 참조하면 된다. 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩하며; 주파수 도메인(FD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩한다.
그러므로 고주파 오디오 신호의 코딩 방식 및 저주파 오디오 신호의 코딩 방식이 동일한 도메인에 속하면, 오디오 신호들의 특성/저주파 오디오 신호를 참조하지 않아도 된다. 즉, 오디오 신호들의 특성/저주파 오디오 신호를 참조하는 대신, 저주파 오디오 신호의 코딩 방식을 참조하여 고주파 오디오 신호의 코딩을 처리한다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식에 따라 확정되며, 이에 따라 대역폭 확장 동안 저주파 오디오 신호의 코딩 방식이 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 다른 방식은 오디오 신호들의 특성 또는 저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩한다.
도 4를 계속 참조하면, 저주파 오디오 신호의 코딩 방식에 관계없이, 오디오 신호의 특성/저주파 오디오 신호만을 참조하여 고주파 오디오 신호의 대역폭 확장을 위한 코딩이 수행된다. 그러므로 시간 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 시간 도메인 코딩 또는 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있고; 주파수 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 주파수 도메인 코딩 또는 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 또 다른 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 시간 도메인 코딩 방식 및 오디오 신호들/저주파 오디오 신호를 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하거나 또는 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 그리고 오디오 신호/저주파 오디오 신호가 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다. 도 6에 도시된 바와 같이, 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩, 또는 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호를 코딩할 수 있고; 주파수 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩할 수 있다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
본 발명의 실시예에 따른 오디오 신호 코딩 방법에서, 저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 또한, 대역폭 확장, 즉 시간 도메인 대역폭 확장 및 주파수 도메인 대역폭 확장에 대해 2 방식을 사용할 수 있고, 이것은 상이한 저주파 코딩 방식에 대응할 수 있다.
시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 다를 수 있으며, 이에 따라 통일된 지연을 도달하기 위한 얼라인먼트가 필요하다.
모든 저주파 오디오 신호의 코딩 지연이 동일하다고 가정하면, 시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 동일하다. 일반적으로, 시간 도메인 대역폭 확장에서의 지연은 고정되어 있는 반면, 주파수 도메인 대역폭 확장에서의 지연은 조정 가능하다. 그러므로 주파수 도메인 대역폭 확장에서의 지연을 조정하여 통일된 지연을 실현할 수 있다.
본 발명의 본 실시예에 따르면, 제로 지연이 저주파 오디오 신호의 디코딩과 관련되어 있는 대역폭 확장을 실현할 수 있다. 여기서, 비대칭 윈도(asymmetric window)는 고유하게 지연을 가지고 있으므로 제로 지연은 저주파 대역에 관련된다. 또한, 본 발명의 본 실시예에 따르면, 고주파 신호에 대해 상이한 윈도윙이 수행될 수 있다. 여기서는, 비대칭 윈도를 사용하는데, 예를 들어, 도 7에 도시되어 있는 ITU-T G.718에서의 분석 윈도(analyzing window)를 사용한다. 또한, 저주파 오디오 신호의 디코딩에 관련된 제로 지연과 저주파 오디오 신호의 디코딩에 관련된 고주파 윈도의 지연 간의 어떠한 차이도 도 8에 도시된 바와 같이 실현될 수 있다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다. 도 8에 도시된 바와 같이, 상이한 프레임들(frames), 예를 들어, (m-1) 프레임, (m) 프레임, 및 (m + 1) 프레임과 관련해서, 고주파 신호의 높은 지연 윈도윙(High delay windowing), 고주파 신호의 낮은 지연 윈도윙(Low delay windowing), 및 고주파 신호의 제로 지연 윈도윙(Zero delay windowing)이 실현될 수 있다. 고주파 신호의 각각의 지연 윈도윙은 윈도윙의 지연을 고려하지 않되, 고주파 신호의 상이한 윈도윙 방식만을 고려한다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 9에 도시된 바와 같이, 입력 프레임의 저주파 오디오 신호가 완전하게 디코딩되지 않으면, 디코딩된 저주파 오디오 신호를 고주파 여기 신호로서 사용한다. 입력 프레임의 고주파 오디오 신호에 대한 윈도윙은 입력 프레임의 저주파 오디오 신호의 디코딩 지연에 따라 확정된다.
예를 들어, 코딩되고 디코딩된 저주파 오디오 신호는 D1 ms의 지연을 가진다. 코딩 단의 인코더가 고주파 오디오 신호에 대해 시간-주파수 변환을 수행하면, D1 ms의 지연을 가지는 고주파 오디오 신호에 대해 시간-주파수 변환이 수행되고, 고주파 오디오 신호의 윈도윙 변환은 D2 ms의 지연을 생성할 수 있다. 그러므로 디코딩 단의 디코더에 의해 디코딩된 고주파 신호의 전체 지연은 D1 + D2 ms이다. 이 방법에서, 디코딩된 저주파 오디오 신호와 비교해 보면, 고주파 오디오 신호는 D2 ms의 추가 지연을 가진다. 즉, 디코딩된 저주파 오디오 신호는 그 디코딩된 고주파 오디오 신호의 지연과 정렬하기 위해서는 D2 ms의 추가 지연을 필요로 하고, 이에 따라 출력 신호의 전체 지연은 D1 + D2 ms이다. 그렇지만, 디코딩 단에서, 고주파 여기 신호는 저주파 오디오 신호의 예측으로부터 획득되어야 하므로, 디코딩 단에서의 저주파 오디오 신호 및 코딩 단에서의 고주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행된다. D1 ms의 지연 후, 코딩 단에서의 고주파 오디오 신호 및 디코딩 단에서의 저주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행되므로, 여기 신호가 정렬된다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 10에 도시된 바와 같이, 디코딩 단은 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 직접 수행하고, 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.
예를 들어, 디코딩된 저주파 신호가 D1 ms의 지연을 가지고 있는 한편, 코딩 단이 고주파 신호에 대해 시간-주파수 변환을 수행하면, 지연 처리가 수행되지 않으며, 고주파 신호에 대한 윈도윙은 D2 ms의 지연을 생성할 수 있고, 이에 따라 디코딩 단에서 디코딩된 고주파 신호의 전체 지연은 D2 ms이다.
D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬되기 위한 추가의 지연을 필요로 하지 않는다. 그렇지만, 디코딩 단은, D1 ms만큼 지연되는 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 또는 D2의 전체 지연을 가진다.
D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 - D1) ms의 추가의 지연이 필요하다. 예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2) ms의 추가의 지연이 필요하다.
고주파 신호의 제로-지연 윈도윙과 높은 지연 윈도윙 간의 BWE란, 코딩 단이 D3 ms 후에 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 수행한다는 것을 의미한다. 지연의 범위는 0 내지 D1 ms이다. 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.
D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 고주파 오디오 신호와 정렬되기 위한 D3 ms의 추가의 지연을 필요로 한다. 그렇지만, 디코딩 단은, D1 ms만큼 지연된 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1 - D3의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 + D3 또는 D1 + D3의 전체 지연을 가진다.
D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, (D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D3 - D1) ms의 추가의 지연이 필요하다.
예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, max(D1, D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 여기서 max(a, b)는 a와 b 간의 더 큰 값을 취해진다는 것을 나타낸다. max(D1, D2 + D3) = D2 + D3이면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 + D3 - D1) ms의 추가의 지연이 필요하고; max(D1, D2 + D3) = D1이면, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2 - D3) ms의 추가의 지연이 필요하다. 예를 들어, D3 = (D1 - D2)이면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D2 ms이다. 이 경우, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 추가의 지연이 필요하지 않다.
그러므로 본 발명의 실시예에서, 시간 도메인 대역폭 확장 동안, 주파수 도메인 대역폭 확장의 상태는 다음 프레임이 주파수 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 마찬가지로, 주파수 도메인 대역폭 확장 동안, 시간 도메인 대역폭 확장의 상태는 다음 프레임이 시간 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 이 방법에서, 대역폭 전환의 연속성이 실현된다.
전술한 실시예는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 관한 것이며, 오디오 신호 처리 장치를 사용하여 실현될 수 있다. 도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다. 도 11에 도시된 바와 같이, 본 발명의 실시예에서 제공하는 신호 처리 장치는 구체적으로 분류 유닛(11), 저주파 신호 코딩 유닛(12), 및 고주파 신호 코딩 유닛(13)을 포함한다.
분류 유닛(11)은 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있다. 저주파 신호 코딩 유닛(12)은 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 코딩 방식은 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식이 될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서는, 시간 도메인 코딩을 사용하여 저주파 음성 신호를 코딩하고, 음악 오디오 신호와 관련해서는, 주파수 도메인 코딩을 사용하여 저주파 음성 신호를 코딩한다. 일반적으로, 시간 도메인 코딩을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있고, 주파수 도메인 코딩을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.
고주파 신호 코딩 유닛(13)은 주파수 코딩 방식 및/또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하도록 구성되어 있다.
구체적으로, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행한다.
또한, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 코딩을 사용하여 고주파 음성 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 코딩을 사용하여 고주파 음악 신호를 코딩한다. 이 경우, 저주파 오디오 신호의 코딩 방식은 고려되지 않는다.
또한, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하고, 오디오 신호들/저주파 오디오 신호가 음성 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하거나 또는 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하며, 오디오 신호들/저주파 오디오 신호가 음악 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다. 도 12에 도시된 바와 같이, 본 발명의 실시예에 따른 신호 처리 장치는 구체적으로 저주파 신호 디코딩 유닛(14)을 더 포함한다.
저주파 신호 디코딩 유닛(14)은 저주파 오디오 신호를 디코딩하도록 구성되어 있으며, 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연 D1이 생성된다.
구체적으로, 고주파 오디오 신호가 지연 윈도를 가지면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제1 지연 D1만큼 지연된 후, 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성되며, 이에 따라, 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 D1과 제2 지연 D2의 합, 즉 (D1 + D2)이다.
고주파 오디오 신호가 지연 윈도를 가지지 않으면, 고주파 신호 코딩 유닛(13)은 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성된다. 제1 지연 D1이 제2 지연 D2보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은 제2 지연 D2와 제1 지연 D1 간의 차(D2 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2이며; 제1 지연 D1이 제2 지연 D2보다 크면, 저주파 신호 코딩 유닛(12)은, 고주파 오디오 신호를 코딩한 후, 제1 지연 D1와 제2 지연 D2 간의 차(D1 - D2)만큼 그 코딩된 고주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1이다.
고주파 오디오 신호가 지연 윈도를 가지고 있고 이 지연 윈도의 지연이 제로 지연과 높은 지연 사이이면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제3 지연 D3만큼 지연된 후, 그 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 고주파 신호의 코딩 동안 제2 지연 D2이 생성된다. 제1 지연이 제2 지연보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2와 제3 지연 D3의 합, 즉 (D2 + D3)이다. 제1 지연이 제2 지연보다 크면, 2가지 가능성이 존재한다: 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 크거나 같으면, 고주파 오디오 신호를 코딩한 후, 고주파 신호 코딩 유닛(13)은, 제1 지연 D1과, 제2 지연 D2와 제3 지연 D3의 합 간의 차(D1 - D2 - D3)만큼 그 코딩된 고주파 오디오 신호를 지연시키고; 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 작으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키며, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1 또는 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)이다.
본 발명의 실시예에서 제공하는 오디오 신호 코딩 장치에 따르면, 고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정될 수 있으며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
당업자라면 본 발명의 실시예에서 설명된 예시적 유닛 및 알고리즘 단계는 전자기기 하드웨어, 컴퓨터 소프트웨어, 또는 하드웨어와 소프트웨어의 조합의 형태로 실현될 수 있다. 하드웨어와 소프트웨어의 상호호환성을 명확하게 설명하기 위해, 각각의 실시예의 구성 및 단계가 일반적으로 기능에 의해 설명된다. 하드웨어 또는 소프트웨어로 기능이 실현되는지는 기술적 솔루션의 특정한 어플리케이션 및 설계상의 제한 조건에 따라 좌우된다. 당업자라면 특정한 어플리케이션에 대한 설명된 기능을 실현할 다른 방법을 사용할 수 있다. 그렇지만, 본 발명의 범위를 넘어서는 실현에 대해서는 고려하지 않는다.
본 발명의 실시예에 따른 방법 또는 알고리즘의 단계는 프로세서에 의해 동작할 수 있는 하드웨어 또는 소프트웨어 모듈에 의해 실행될 수 있거나 이것들의 조합에 의해 실행될 수 있다. 소프트웨어 모듈은 랜덤 액세스 메모리(RAM), 메모리, 리드-온리 메모리(ROM), 전기적 프로그래머블 ROM, 전기적 삭제 가능형 프로그래머블 ROM, 레지스터, 하드디스크, 휴대형 하드디스크, 콤팩트 디스크-리드 온리 메모리(CD-ROM), 또는 종래기술에 잘 알려진 임의의 다른 저장 매체에 저장될 수 있다.
본 발명의 목적, 기술적 솔루션, 및 이로운 효과에 대해 전술한 실시예에서 상세히 설명하였다. 전술한 설명은 단지 본 발명의 예시적 실시예에 지나지 않으며, 본 발명의 보호 범위를 제한하려는 것이 아님은 당연하다. 본 발명의 개념 및 원리를 벗어남이 벗이 이루어지는 모든 변형, 등가의 대체, 및 개선은 본 발명의 보호 범위에 해당된다.

Claims (15)

  1. 오디오 신호 코딩 방법에 있어서,
    오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;
    상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및
    주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계
    를 포함하는 오디오 신호 코딩 방법.
  2. 제1항에 있어서,
    상기 주파수 코딩 방식에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
    상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
  3. 제1항에 있어서,
    상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
    상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
  4. 제1항에 있어서,
    상기 주파수 코딩 방식 및 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
    상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 고주파 오디오 신호 또는 상기 저주파 오디오 신호에 대한 지연 처리를 수행하는 단계
    를 더 포함하며,
    이에 따라, 상기 고주파 오디오 신호의 지연 및 상기 저주파 오디오 신호의 지연은 디코딩 단(decoding end)에서 동일하게 되는, 오디오 신호 코딩 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
    상기 고주파 오디오 신호에 대한 제1 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
    이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
    상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이고, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법.
  7. 제1항 내지 제4항 중 어느 한 항에 있어서,
    제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이며,
    상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
    상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법.
  8. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
    제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
    상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연되거나, 또는 상기 저주파 오디오 신호는 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합인, 오디오 신호 코딩 방법.
  9. 오디오 신호 코딩 장치에 있어서,
    오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;
    상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및
    주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛
    을 포함하는 오디오 신호 코딩 장치.
  10. 제9항에 있어서,
    상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치.
  11. 제9항에 있어서,
    상기 오디오 신호들이 음성 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하도록 구성되어 있으며,
    상기 오디오 신호들이 음악 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는, 오디오 신호 코딩 장치.
  12. 제9항에 있어서,
    상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치.
  13. 제9항 내지 제12항 중 어느 한 항에 있어서,
    상기 저주파 오디오 신호를 디코딩하도록 구성되어 있는 저주파 신호 디코딩 유닛
    을 더 포함하며,
    상기 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연이 생성되며,
    상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호가 상기 제1 지연만큼 지연된 후, 상기 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
    이에 따라, 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
    상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는, 오디오 신호 코딩 장치.
  14. 제9항 내지 제12항 중 어느 한 항에 있어서,
    제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이고,
    상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
    상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치.
  15. 제9항 내지 제12항 중 어느 한 항에 있어서,
    상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
    제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
    상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연시키도록 구성되어 있거나, 또는 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있으며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합이며,
    상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치.
KR1020137023033A 2011-10-08 2012-03-22 오디오 신호 코딩 방법 및 장치 KR101427863B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110297791.5 2011-10-08
CN201110297791.5A CN103035248B (zh) 2011-10-08 2011-10-08 音频信号编码方法和装置
PCT/CN2012/072792 WO2012163144A1 (zh) 2011-10-08 2012-03-22 音频信号编码方法和装置

Publications (2)

Publication Number Publication Date
KR20130126695A KR20130126695A (ko) 2013-11-20
KR101427863B1 true KR101427863B1 (ko) 2014-08-07

Family

ID=47258352

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137023033A KR101427863B1 (ko) 2011-10-08 2012-03-22 오디오 신호 코딩 방법 및 장치

Country Status (6)

Country Link
US (3) US9251798B2 (ko)
EP (2) EP3239980A1 (ko)
JP (3) JP2014508327A (ko)
KR (1) KR101427863B1 (ko)
CN (1) CN103035248B (ko)
WO (1) WO2012163144A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
RU2665281C2 (ru) 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
MX353200B (es) * 2014-03-14 2018-01-05 Ericsson Telefon Ab L M Método y aparato de codificación de audio.
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
US11032580B2 (en) 2017-12-18 2021-06-08 Dish Network L.L.C. Systems and methods for facilitating a personalized viewing experience
US10365885B1 (en) 2018-02-21 2019-07-30 Sling Media Pvt. Ltd. Systems and methods for composition of audio content from multi-object audio
WO2021258350A1 (zh) * 2020-06-24 2021-12-30 华为技术有限公司 一种音频信号处理方法和装置
CN112086102B (zh) * 2020-08-31 2024-04-16 腾讯音乐娱乐科技(深圳)有限公司 扩展音频频带的方法、装置、设备以及存储介质
CN112992167A (zh) * 2021-02-08 2021-06-18 歌尔科技有限公司 音频信号的处理方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040064311A1 (en) 2002-10-01 2004-04-01 Deepen Sinha Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
ATE319162T1 (de) * 2001-01-19 2006-03-15 Koninkl Philips Electronics Nv Breitband-signalübertragungssystem
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
CN1288625C (zh) * 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
EP2221808B1 (en) 2003-10-23 2012-07-11 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
KR100614496B1 (ko) * 2003-11-13 2006-08-22 한국전자통신연구원 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
KR100707174B1 (ko) 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
PL1875463T3 (pl) * 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
JP5098569B2 (ja) * 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
RU2452042C1 (ru) * 2008-03-04 2012-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
CN101572087B (zh) * 2008-04-30 2012-02-29 北京工业大学 嵌入式语音或音频信号编解码方法和装置
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
EP2176862B1 (en) * 2008-07-11 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040064311A1 (en) 2002-10-01 2004-04-01 Deepen Sinha Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband

Also Published As

Publication number Publication date
JP2015172778A (ja) 2015-10-01
JP2014508327A (ja) 2014-04-03
KR20130126695A (ko) 2013-11-20
US20170053661A1 (en) 2017-02-23
US20140114670A1 (en) 2014-04-24
WO2012163144A1 (zh) 2012-12-06
JP2017187790A (ja) 2017-10-12
CN103035248B (zh) 2015-01-21
US9779749B2 (en) 2017-10-03
US20160148622A1 (en) 2016-05-26
EP3239980A1 (en) 2017-11-01
EP2680260A1 (en) 2014-01-01
US9514762B2 (en) 2016-12-06
EP2680260A4 (en) 2014-09-03
CN103035248A (zh) 2013-04-10
US9251798B2 (en) 2016-02-02

Similar Documents

Publication Publication Date Title
KR101427863B1 (ko) 오디오 신호 코딩 방법 및 장치
JP6698792B2 (ja) オーディオフレーム損失のコンシールメントを制御する方法及び装置
JP5571235B2 (ja) ピッチ調整コーディング及び非ピッチ調整コーディングを使用する信号符号化
US8504378B2 (en) Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
US8600765B2 (en) Signal classification method and device, and encoding and decoding methods and devices
RU2658892C2 (ru) Устройство и способ для расширения диапазона частот для акустических сигналов
US9406307B2 (en) Method and apparatus for polyphonic audio signal prediction in coding and networking systems
EP2381438B1 (en) Signal classification processing method, classification processing device and encoding system
US11915709B2 (en) Inter-channel phase difference parameter extraction method and apparatus
US8996389B2 (en) Artifact reduction in time compression
JP5098530B2 (ja) 復号化装置、復号化方法および復号化プログラム
JP2023166423A (ja) Mdct係数からのスペクトル形状予測
US20150334501A1 (en) Method and Apparatus for Generating Sideband Residual Signal
RU2648632C2 (ru) Классификатор многоканального звукового сигнала
JP5295380B2 (ja) 符号化装置、復号化装置およびこれらの方法
US20230154479A1 (en) Low cost adaptation of bass post-filter

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170720

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180719

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190718

Year of fee payment: 6