KR101427863B1 - 오디오 신호 코딩 방법 및 장치 - Google Patents
오디오 신호 코딩 방법 및 장치 Download PDFInfo
- Publication number
- KR101427863B1 KR101427863B1 KR1020137023033A KR20137023033A KR101427863B1 KR 101427863 B1 KR101427863 B1 KR 101427863B1 KR 1020137023033 A KR1020137023033 A KR 1020137023033A KR 20137023033 A KR20137023033 A KR 20137023033A KR 101427863 B1 KR101427863 B1 KR 101427863B1
- Authority
- KR
- South Korea
- Prior art keywords
- delay
- frequency
- audio signal
- coding
- low
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 387
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000003111 delayed effect Effects 0.000 claims description 14
- 230000005284 excitation Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 오디오 신호 방법 및 장치에 관한 것이다. 방법, 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계; 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하는 단계; 및 주파수 코딩 방식 또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 단계를 포함한다.
Description
삭제
본 발명은 통신 분야에 관한 것이며, 특히 오디오 신호 코딩 방법 및 장치에 관한 것이다.
오디오 코딩 동안, 사람의 귀의 비트 레이트 한계 및 청력 특성을 고려하여, 저주파 오디오 신호의 정보를 양호하게 코딩하고 고주파 오디오 신호의 정보를 폐기한다. 그렇지만, 네트워크 기술의 급속한 발전으로, 네트워크 대역폭 한계가 낮아지고 있다. 사람들의 음색(timbre)에 대한 조건은 더 높아지고 있는 반면, 신호에 대한 대역폭을 부가함으로써 고주파 오디오 신호의 정보를 저장하고 싶어한다. 이 방법에서, 오디오 신호의 음색이 개선된다. 구체적으로, 이것은 대역폭 확장(BandWidth Extension: BWE) 기술을 사용함으로써 실현될 수 있다.
대역폭 확장에 의해 오디오 신호의 주파수 범위를 확장시키고 신호 품질을 향상시킬 수 있다. 현재, 흔히 사용되고 있는 BWT 기술로서는, 예를 들어, G.729.1의 시간 도메인(Time Domain: TD) 대역폭 확장 알고리즘, 동영상 전문가 그룹(Moving Picture Experts Group: MPEG)에서의 스펙트럼 대역 복제(Spectral Band Replication: SBR) 기술, 및 국제 통신 연합(International Telecommucation Union: ITU-I) G.722B/G.722.1D에서의 주파수 도메인(Frequency Domain: FD) 대역폭 확장 알고리즘을 들 수 있다.
도 1 및 도 2는 종래기술에서의 대역폭 확장에 대한 개략도이다. 즉, 저주파(예를 들어, 6.4 kHz보다 작은 주파수) 오디오 신호가 시간 도메인 코딩(TD coding) 또는 주파수 도메인 코딩(FD coding)을 사용하든 안 하든 간에, 고주파(예를 들어, 6.4-16/14 kHz) 오디오 신호는 대역폭 확장을 위해 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)을 사용한다.
종래기술에서는, 저주파 오디오 신호의 코딩 방식 및 오디오 신호의 특성을 고려하지 않고, 시간 도메인 대역폭 확장의 시간 도메인 코딩 또는 주파수 도메인 대역폭 확장의 주파수 도메인 코딩만을 사용하여 고주파 오디오 신호를 코딩한다.
본 발명의 실시예는 오디오 신호 코딩 방법 및 장치를 제공하며, 이에 따라 고정 코딩 대신 적응 코딩을 실현할 수 있다.
본 발명의 실시예는 오디오 신호 코딩 방법을 제공하며, 상기 방법은,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및
주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계
를 포함한다.
본 발명의 실시예는 오디오 신호 코딩 장치를 제공하며, 상기 장치는,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및
주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛
을 포함한다.
본 발명의 실시예의 오디오 코딩 방법 및 장치에 따르면, 고주파 오디오 신호로의 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성에 따라 확정될 수 있다. 이 방법에서, 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성이 대역폭 확장 동안 고려되지 않는 경우를 회피할 수 있고, 대역폭 확장은 단일 코딩 방식에 제한되지 않으며, 적응 코딩이 실현되고, 오디오 코딩 품질이 향상된다.
도 1은 종래기술에서의 대역폭 확장에 대한 제1 개략도이다.
도 2는 종래기술에서의 대역폭 확장에 대한 제2 개략도이다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
도 4는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도이다.
도 5는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도이다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다.
도 7은 ITU-T G.718에서의 분석 윈도에 대한 개략도이다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다.
도 2는 종래기술에서의 대역폭 확장에 대한 제2 개략도이다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
도 4는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도이다.
도 5는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도이다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다.
도 7은 ITU-T G.718에서의 분석 윈도에 대한 개략도이다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다.
첨부된 도면 및 실시예를 참조하여 본 발명의 기술적 솔루션에 대해 이하에 설명한다.
본 발명의 실시예에 따르면, 주파수 대역 확장에 시간 도메인 대역폭 확장이 사용되는지 또는 주파수 도메인 대역폭 확장이 사용되는지는 주파수 오디오 신호의 코딩 방식 또는 오디오 신호의 특성에 따라 확정될 수 있다.
이 방법에서, 저주파 코딩이 시간 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있고; 저주파 코딩이 주파수 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다. 도 3에 도시된 바와 같이, 본 발명의 본 실시예에 따른 오디오 신호 코딩 방법은 구체적으로 이하의 단계를 포함한다:
단계 101: 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류한다.
저주파 오디오 신호는 직접 코딩되는 반면, 고주파 오디오 신호는 대역폭 확장을 통해 코딩되어야 한다.
단계 102: 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩한다.
저주파 오디오 신호는 2가지 방식, 즉 시간 도메인 코딩 또는 주파수 도메인 코딩으로 코딩될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서, 저주파 음성 신호는 시간 도메인 코딩을 사용하여 코딩되고; 음악 오디오 신호와 관련해서, 저주파 음성 신호는 주파수 도메인 코딩을 사용하여 코딩된다. 일반적으로, 시간 도메인 코딩, 예를 들어, 코드 여기 선형 예측(Code Excited Linear Predition: CELP)을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있으며, 주파수 도메인 코딩, 예를 들어, 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 또는 고속 푸리에 변환(Fast fourier Transform: FFT)을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.
단계 103: 저주파 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다.
이 단계는 고주파 오디오 신호를 코딩하는 경우에 몇 가지 가능성에 대해 설명한다: 첫째, 저주파 오디오 신호의 코딩 방식에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 둘째, 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 셋째, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계.
저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 그렇지만, 오디오 신호들의 특성은 음성 오디오 신호 또는 음악 오디오 신호가 될 수 있다. 고주파 오디오 신호의 코딩 방식은 시간 도메인 대역폭 확장 모드 또는 주파수 도메인 대역폭 확장 모드가 될 수 있다. 고주파 오디오 신호의 대역폭 확장과 관련해서, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 코딩이 수행되어야 한다.
저주파 코딩 방식 및 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다. 선택된 대역폭 확장 모드는 저주파 코딩 방식 및 오디오 신호들의 특성에 대응하고, 동일한 도메인 코딩 방식에 속한다.
일실시예에서, 선택된 대역폭 확장 모드는 저주파 코딩 방식에 대응한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호 및 저주파 오디오 신호의 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.
다른 실시예에서, 선택된 대역폭 확장 모드는 오디오 신호들의 특성에 적절한 저주파 코딩 방식에 대응한다: 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 적절한 저주파 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.
또 다른 실시예에서, 저주파 코딩 방식 및 오디오 신호들의 특성을 종합적으로 고려함으로써, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하고 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 4를 참조하면, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도가 도시되어 있다. 시간 도메인(TD) 코딩 또는 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호, 예를 들어, 0-6.4kHz에서의 오디오 신호를 코딩할 수 있다. 고대역 오디오 신호, 예를 들어, 6.4-16/14 kHz의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.
요컨대, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서는, 저주파 오디오 신호의 코딩 방식 및 고주파 신호의 대역폭 확장이 일대일 대응이 되지 않는다. 예를 들어, 시간 도메인(TD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있으며; 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.
구체적으로, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 방식은 저주파 오디오 신호의 저주파 코딩 방식에 따라 처리를 수행하는 것이다. 상세하게 사항에 대해서는, 도 5에 도시된 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도를 참조하면 된다. 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩하며; 주파수 도메인(FD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩한다.
그러므로 고주파 오디오 신호의 코딩 방식 및 저주파 오디오 신호의 코딩 방식이 동일한 도메인에 속하면, 오디오 신호들의 특성/저주파 오디오 신호를 참조하지 않아도 된다. 즉, 오디오 신호들의 특성/저주파 오디오 신호를 참조하는 대신, 저주파 오디오 신호의 코딩 방식을 참조하여 고주파 오디오 신호의 코딩을 처리한다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식에 따라 확정되며, 이에 따라 대역폭 확장 동안 저주파 오디오 신호의 코딩 방식이 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 다른 방식은 오디오 신호들의 특성 또는 저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩한다.
도 4를 계속 참조하면, 저주파 오디오 신호의 코딩 방식에 관계없이, 오디오 신호의 특성/저주파 오디오 신호만을 참조하여 고주파 오디오 신호의 대역폭 확장을 위한 코딩이 수행된다. 그러므로 시간 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 시간 도메인 코딩 또는 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있고; 주파수 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 주파수 도메인 코딩 또는 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 또 다른 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 시간 도메인 코딩 방식 및 오디오 신호들/저주파 오디오 신호를 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하거나 또는 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 그리고 오디오 신호/저주파 오디오 신호가 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다. 도 6에 도시된 바와 같이, 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩, 또는 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호를 코딩할 수 있고; 주파수 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩할 수 있다.
고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
본 발명의 실시예에 따른 오디오 신호 코딩 방법에서, 저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 또한, 대역폭 확장, 즉 시간 도메인 대역폭 확장 및 주파수 도메인 대역폭 확장에 대해 2 방식을 사용할 수 있고, 이것은 상이한 저주파 코딩 방식에 대응할 수 있다.
시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 다를 수 있으며, 이에 따라 통일된 지연을 도달하기 위한 얼라인먼트가 필요하다.
모든 저주파 오디오 신호의 코딩 지연이 동일하다고 가정하면, 시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 동일하다. 일반적으로, 시간 도메인 대역폭 확장에서의 지연은 고정되어 있는 반면, 주파수 도메인 대역폭 확장에서의 지연은 조정 가능하다. 그러므로 주파수 도메인 대역폭 확장에서의 지연을 조정하여 통일된 지연을 실현할 수 있다.
본 발명의 본 실시예에 따르면, 제로 지연이 저주파 오디오 신호의 디코딩과 관련되어 있는 대역폭 확장을 실현할 수 있다. 여기서, 비대칭 윈도(asymmetric window)는 고유하게 지연을 가지고 있으므로 제로 지연은 저주파 대역에 관련된다. 또한, 본 발명의 본 실시예에 따르면, 고주파 신호에 대해 상이한 윈도윙이 수행될 수 있다. 여기서는, 비대칭 윈도를 사용하는데, 예를 들어, 도 7에 도시되어 있는 ITU-T G.718에서의 분석 윈도(analyzing window)를 사용한다. 또한, 저주파 오디오 신호의 디코딩에 관련된 제로 지연과 저주파 오디오 신호의 디코딩에 관련된 고주파 윈도의 지연 간의 어떠한 차이도 도 8에 도시된 바와 같이 실현될 수 있다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다. 도 8에 도시된 바와 같이, 상이한 프레임들(frames), 예를 들어, (m-1) 프레임, (m) 프레임, 및 (m + 1) 프레임과 관련해서, 고주파 신호의 높은 지연 윈도윙(High delay windowing), 고주파 신호의 낮은 지연 윈도윙(Low delay windowing), 및 고주파 신호의 제로 지연 윈도윙(Zero delay windowing)이 실현될 수 있다. 고주파 신호의 각각의 지연 윈도윙은 윈도윙의 지연을 고려하지 않되, 고주파 신호의 상이한 윈도윙 방식만을 고려한다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 9에 도시된 바와 같이, 입력 프레임의 저주파 오디오 신호가 완전하게 디코딩되지 않으면, 디코딩된 저주파 오디오 신호를 고주파 여기 신호로서 사용한다. 입력 프레임의 고주파 오디오 신호에 대한 윈도윙은 입력 프레임의 저주파 오디오 신호의 디코딩 지연에 따라 확정된다.
예를 들어, 코딩되고 디코딩된 저주파 오디오 신호는 D1 ms의 지연을 가진다. 코딩 단의 인코더가 고주파 오디오 신호에 대해 시간-주파수 변환을 수행하면, D1 ms의 지연을 가지는 고주파 오디오 신호에 대해 시간-주파수 변환이 수행되고, 고주파 오디오 신호의 윈도윙 변환은 D2 ms의 지연을 생성할 수 있다. 그러므로 디코딩 단의 디코더에 의해 디코딩된 고주파 신호의 전체 지연은 D1 + D2 ms이다. 이 방법에서, 디코딩된 저주파 오디오 신호와 비교해 보면, 고주파 오디오 신호는 D2 ms의 추가 지연을 가진다. 즉, 디코딩된 저주파 오디오 신호는 그 디코딩된 고주파 오디오 신호의 지연과 정렬하기 위해서는 D2 ms의 추가 지연을 필요로 하고, 이에 따라 출력 신호의 전체 지연은 D1 + D2 ms이다. 그렇지만, 디코딩 단에서, 고주파 여기 신호는 저주파 오디오 신호의 예측으로부터 획득되어야 하므로, 디코딩 단에서의 저주파 오디오 신호 및 코딩 단에서의 고주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행된다. D1 ms의 지연 후, 코딩 단에서의 고주파 오디오 신호 및 디코딩 단에서의 저주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행되므로, 여기 신호가 정렬된다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 10에 도시된 바와 같이, 디코딩 단은 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 직접 수행하고, 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.
예를 들어, 디코딩된 저주파 신호가 D1 ms의 지연을 가지고 있는 한편, 코딩 단이 고주파 신호에 대해 시간-주파수 변환을 수행하면, 지연 처리가 수행되지 않으며, 고주파 신호에 대한 윈도윙은 D2 ms의 지연을 생성할 수 있고, 이에 따라 디코딩 단에서 디코딩된 고주파 신호의 전체 지연은 D2 ms이다.
D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬되기 위한 추가의 지연을 필요로 하지 않는다. 그렇지만, 디코딩 단은, D1 ms만큼 지연되는 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 또는 D2의 전체 지연을 가진다.
D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 - D1) ms의 추가의 지연이 필요하다. 예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2) ms의 추가의 지연이 필요하다.
고주파 신호의 제로-지연 윈도윙과 높은 지연 윈도윙 간의 BWE란, 코딩 단이 D3 ms 후에 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 수행한다는 것을 의미한다. 지연의 범위는 0 내지 D1 ms이다. 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.
D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 고주파 오디오 신호와 정렬되기 위한 D3 ms의 추가의 지연을 필요로 한다. 그렇지만, 디코딩 단은, D1 ms만큼 지연된 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1 - D3의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 + D3 또는 D1 + D3의 전체 지연을 가진다.
D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, (D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D3 - D1) ms의 추가의 지연이 필요하다.
예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, max(D1, D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 여기서 max(a, b)는 a와 b 간의 더 큰 값을 취해진다는 것을 나타낸다. max(D1, D2 + D3) = D2 + D3이면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 + D3 - D1) ms의 추가의 지연이 필요하고; max(D1, D2 + D3) = D1이면, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2 - D3) ms의 추가의 지연이 필요하다. 예를 들어, D3 = (D1 - D2)이면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D2 ms이다. 이 경우, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 추가의 지연이 필요하지 않다.
그러므로 본 발명의 실시예에서, 시간 도메인 대역폭 확장 동안, 주파수 도메인 대역폭 확장의 상태는 다음 프레임이 주파수 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 마찬가지로, 주파수 도메인 대역폭 확장 동안, 시간 도메인 대역폭 확장의 상태는 다음 프레임이 시간 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 이 방법에서, 대역폭 전환의 연속성이 실현된다.
전술한 실시예는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 관한 것이며, 오디오 신호 처리 장치를 사용하여 실현될 수 있다. 도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다. 도 11에 도시된 바와 같이, 본 발명의 실시예에서 제공하는 신호 처리 장치는 구체적으로 분류 유닛(11), 저주파 신호 코딩 유닛(12), 및 고주파 신호 코딩 유닛(13)을 포함한다.
분류 유닛(11)은 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있다. 저주파 신호 코딩 유닛(12)은 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 코딩 방식은 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식이 될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서는, 시간 도메인 코딩을 사용하여 저주파 음성 신호를 코딩하고, 음악 오디오 신호와 관련해서는, 주파수 도메인 코딩을 사용하여 저주파 음성 신호를 코딩한다. 일반적으로, 시간 도메인 코딩을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있고, 주파수 도메인 코딩을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.
고주파 신호 코딩 유닛(13)은 주파수 코딩 방식 및/또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하도록 구성되어 있다.
구체적으로, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행한다.
또한, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 코딩을 사용하여 고주파 음성 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 코딩을 사용하여 고주파 음악 신호를 코딩한다. 이 경우, 저주파 오디오 신호의 코딩 방식은 고려되지 않는다.
또한, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하고, 오디오 신호들/저주파 오디오 신호가 음성 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하거나 또는 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하며, 오디오 신호들/저주파 오디오 신호가 음악 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다. 도 12에 도시된 바와 같이, 본 발명의 실시예에 따른 신호 처리 장치는 구체적으로 저주파 신호 디코딩 유닛(14)을 더 포함한다.
저주파 신호 디코딩 유닛(14)은 저주파 오디오 신호를 디코딩하도록 구성되어 있으며, 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연 D1이 생성된다.
구체적으로, 고주파 오디오 신호가 지연 윈도를 가지면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제1 지연 D1만큼 지연된 후, 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성되며, 이에 따라, 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 D1과 제2 지연 D2의 합, 즉 (D1 + D2)이다.
고주파 오디오 신호가 지연 윈도를 가지지 않으면, 고주파 신호 코딩 유닛(13)은 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성된다. 제1 지연 D1이 제2 지연 D2보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은 제2 지연 D2와 제1 지연 D1 간의 차(D2 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2이며; 제1 지연 D1이 제2 지연 D2보다 크면, 저주파 신호 코딩 유닛(12)은, 고주파 오디오 신호를 코딩한 후, 제1 지연 D1와 제2 지연 D2 간의 차(D1 - D2)만큼 그 코딩된 고주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1이다.
고주파 오디오 신호가 지연 윈도를 가지고 있고 이 지연 윈도의 지연이 제로 지연과 높은 지연 사이이면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제3 지연 D3만큼 지연된 후, 그 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 고주파 신호의 코딩 동안 제2 지연 D2이 생성된다. 제1 지연이 제2 지연보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2와 제3 지연 D3의 합, 즉 (D2 + D3)이다. 제1 지연이 제2 지연보다 크면, 2가지 가능성이 존재한다: 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 크거나 같으면, 고주파 오디오 신호를 코딩한 후, 고주파 신호 코딩 유닛(13)은, 제1 지연 D1과, 제2 지연 D2와 제3 지연 D3의 합 간의 차(D1 - D2 - D3)만큼 그 코딩된 고주파 오디오 신호를 지연시키고; 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 작으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키며, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1 또는 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)이다.
본 발명의 실시예에서 제공하는 오디오 신호 코딩 장치에 따르면, 고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정될 수 있으며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.
당업자라면 본 발명의 실시예에서 설명된 예시적 유닛 및 알고리즘 단계는 전자기기 하드웨어, 컴퓨터 소프트웨어, 또는 하드웨어와 소프트웨어의 조합의 형태로 실현될 수 있다. 하드웨어와 소프트웨어의 상호호환성을 명확하게 설명하기 위해, 각각의 실시예의 구성 및 단계가 일반적으로 기능에 의해 설명된다. 하드웨어 또는 소프트웨어로 기능이 실현되는지는 기술적 솔루션의 특정한 어플리케이션 및 설계상의 제한 조건에 따라 좌우된다. 당업자라면 특정한 어플리케이션에 대한 설명된 기능을 실현할 다른 방법을 사용할 수 있다. 그렇지만, 본 발명의 범위를 넘어서는 실현에 대해서는 고려하지 않는다.
본 발명의 실시예에 따른 방법 또는 알고리즘의 단계는 프로세서에 의해 동작할 수 있는 하드웨어 또는 소프트웨어 모듈에 의해 실행될 수 있거나 이것들의 조합에 의해 실행될 수 있다. 소프트웨어 모듈은 랜덤 액세스 메모리(RAM), 메모리, 리드-온리 메모리(ROM), 전기적 프로그래머블 ROM, 전기적 삭제 가능형 프로그래머블 ROM, 레지스터, 하드디스크, 휴대형 하드디스크, 콤팩트 디스크-리드 온리 메모리(CD-ROM), 또는 종래기술에 잘 알려진 임의의 다른 저장 매체에 저장될 수 있다.
본 발명의 목적, 기술적 솔루션, 및 이로운 효과에 대해 전술한 실시예에서 상세히 설명하였다. 전술한 설명은 단지 본 발명의 예시적 실시예에 지나지 않으며, 본 발명의 보호 범위를 제한하려는 것이 아님은 당연하다. 본 발명의 개념 및 원리를 벗어남이 벗이 이루어지는 모든 변형, 등가의 대체, 및 개선은 본 발명의 보호 범위에 해당된다.
Claims (15)
- 오디오 신호 코딩 방법에 있어서,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및
주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계
를 포함하는 오디오 신호 코딩 방법. - 제1항에 있어서,
상기 주파수 코딩 방식에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법. - 제1항에 있어서,
상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법. - 제1항에 있어서,
상기 주파수 코딩 방식 및 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호 또는 상기 저주파 오디오 신호에 대한 지연 처리를 수행하는 단계
를 더 포함하며,
이에 따라, 상기 고주파 오디오 신호의 지연 및 상기 저주파 오디오 신호의 지연은 디코딩 단(decoding end)에서 동일하게 되는, 오디오 신호 코딩 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 고주파 오디오 신호에 대한 제1 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이고, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연되거나, 또는 상기 저주파 오디오 신호는 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합인, 오디오 신호 코딩 방법. - 오디오 신호 코딩 장치에 있어서,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및
주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛
을 포함하는 오디오 신호 코딩 장치. - 제9항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치. - 제9항에 있어서,
상기 오디오 신호들이 음성 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하도록 구성되어 있으며,
상기 오디오 신호들이 음악 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는, 오디오 신호 코딩 장치. - 제9항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치. - 제9항 내지 제12항 중 어느 한 항에 있어서,
상기 저주파 오디오 신호를 디코딩하도록 구성되어 있는 저주파 신호 디코딩 유닛
을 더 포함하며,
상기 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연이 생성되며,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호가 상기 제1 지연만큼 지연된 후, 상기 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
이에 따라, 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는, 오디오 신호 코딩 장치. - 제9항 내지 제12항 중 어느 한 항에 있어서,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이고,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치. - 제9항 내지 제12항 중 어느 한 항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연시키도록 구성되어 있거나, 또는 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있으며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110297791.5 | 2011-10-08 | ||
CN201110297791.5A CN103035248B (zh) | 2011-10-08 | 2011-10-08 | 音频信号编码方法和装置 |
PCT/CN2012/072792 WO2012163144A1 (zh) | 2011-10-08 | 2012-03-22 | 音频信号编码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130126695A KR20130126695A (ko) | 2013-11-20 |
KR101427863B1 true KR101427863B1 (ko) | 2014-08-07 |
Family
ID=47258352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137023033A KR101427863B1 (ko) | 2011-10-08 | 2012-03-22 | 오디오 신호 코딩 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (3) | US9251798B2 (ko) |
EP (2) | EP3239980A1 (ko) |
JP (3) | JP2014508327A (ko) |
KR (1) | KR101427863B1 (ko) |
CN (1) | CN103035248B (ko) |
WO (1) | WO2012163144A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI591620B (zh) * | 2012-03-21 | 2017-07-11 | 三星電子股份有限公司 | 產生高頻雜訊的方法 |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN103413553B (zh) * | 2013-08-20 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、编码端、解码端和系统 |
RU2665281C2 (ru) | 2013-09-12 | 2018-08-28 | Долби Интернэшнл Аб | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
MX353200B (es) * | 2014-03-14 | 2018-01-05 | Ericsson Telefon Ab L M | Método y aparato de codificación de audio. |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
CN110062945B (zh) * | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
US10365885B1 (en) | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
WO2021258350A1 (zh) * | 2020-06-24 | 2021-12-30 | 华为技术有限公司 | 一种音频信号处理方法和装置 |
CN112086102B (zh) * | 2020-08-31 | 2024-04-16 | 腾讯音乐娱乐科技(深圳)有限公司 | 扩展音频频带的方法、装置、设备以及存储介质 |
CN112992167A (zh) * | 2021-02-08 | 2021-06-18 | 歌尔科技有限公司 | 音频信号的处理方法、装置及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040064311A1 (en) | 2002-10-01 | 2004-04-01 | Deepen Sinha | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
ATE319162T1 (de) * | 2001-01-19 | 2006-03-15 | Koninkl Philips Electronics Nv | Breitband-signalübertragungssystem |
JP4308229B2 (ja) * | 2001-11-14 | 2009-08-05 | パナソニック株式会社 | 符号化装置および復号化装置 |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
EP2221808B1 (en) | 2003-10-23 | 2012-07-11 | Panasonic Corporation | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof |
KR100614496B1 (ko) * | 2003-11-13 | 2006-08-22 | 한국전자통신연구원 | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 |
FI119533B (fi) | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
EP1798724B1 (en) * | 2004-11-05 | 2014-06-18 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
KR100707174B1 (ko) | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
US8010352B2 (en) * | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
KR101390188B1 (ko) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | 적응적 고주파수영역 부호화 및 복호화 방법 및 장치 |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
JP5098569B2 (ja) * | 2007-10-25 | 2012-12-12 | ヤマハ株式会社 | 帯域拡張再生装置 |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101896968A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
KR100970446B1 (ko) | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
RU2452042C1 (ru) * | 2008-03-04 | 2012-05-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки аудиосигнала |
CN101572087B (zh) * | 2008-04-30 | 2012-02-29 | 北京工业大学 | 嵌入式语音或音频信号编解码方法和装置 |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
EP2176862B1 (en) * | 2008-07-11 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
-
2011
- 2011-10-08 CN CN201110297791.5A patent/CN103035248B/zh active Active
-
2012
- 2012-03-22 KR KR1020137023033A patent/KR101427863B1/ko active IP Right Grant
- 2012-03-22 JP JP2013555743A patent/JP2014508327A/ja active Pending
- 2012-03-22 WO PCT/CN2012/072792 patent/WO2012163144A1/zh active Application Filing
- 2012-03-22 EP EP17150229.7A patent/EP3239980A1/en not_active Withdrawn
- 2012-03-22 EP EP12793206.9A patent/EP2680260A4/en not_active Ceased
-
2013
- 2013-12-31 US US14/145,632 patent/US9251798B2/en active Active
-
2015
- 2015-06-03 JP JP2015113465A patent/JP2015172778A/ja active Pending
-
2016
- 2016-02-01 US US15/011,824 patent/US9514762B2/en active Active
- 2016-11-02 US US15/341,451 patent/US9779749B2/en active Active
-
2017
- 2017-06-06 JP JP2017111397A patent/JP2017187790A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040064311A1 (en) | 2002-10-01 | 2004-04-01 | Deepen Sinha | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
Also Published As
Publication number | Publication date |
---|---|
JP2015172778A (ja) | 2015-10-01 |
JP2014508327A (ja) | 2014-04-03 |
KR20130126695A (ko) | 2013-11-20 |
US20170053661A1 (en) | 2017-02-23 |
US20140114670A1 (en) | 2014-04-24 |
WO2012163144A1 (zh) | 2012-12-06 |
JP2017187790A (ja) | 2017-10-12 |
CN103035248B (zh) | 2015-01-21 |
US9779749B2 (en) | 2017-10-03 |
US20160148622A1 (en) | 2016-05-26 |
EP3239980A1 (en) | 2017-11-01 |
EP2680260A1 (en) | 2014-01-01 |
US9514762B2 (en) | 2016-12-06 |
EP2680260A4 (en) | 2014-09-03 |
CN103035248A (zh) | 2013-04-10 |
US9251798B2 (en) | 2016-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101427863B1 (ko) | 오디오 신호 코딩 방법 및 장치 | |
JP6698792B2 (ja) | オーディオフレーム損失のコンシールメントを制御する方法及び装置 | |
JP5571235B2 (ja) | ピッチ調整コーディング及び非ピッチ調整コーディングを使用する信号符号化 | |
US8504378B2 (en) | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same | |
US8600765B2 (en) | Signal classification method and device, and encoding and decoding methods and devices | |
RU2658892C2 (ru) | Устройство и способ для расширения диапазона частот для акустических сигналов | |
US9406307B2 (en) | Method and apparatus for polyphonic audio signal prediction in coding and networking systems | |
EP2381438B1 (en) | Signal classification processing method, classification processing device and encoding system | |
US11915709B2 (en) | Inter-channel phase difference parameter extraction method and apparatus | |
US8996389B2 (en) | Artifact reduction in time compression | |
JP5098530B2 (ja) | 復号化装置、復号化方法および復号化プログラム | |
JP2023166423A (ja) | Mdct係数からのスペクトル形状予測 | |
US20150334501A1 (en) | Method and Apparatus for Generating Sideband Residual Signal | |
RU2648632C2 (ru) | Классификатор многоканального звукового сигнала | |
JP5295380B2 (ja) | 符号化装置、復号化装置およびこれらの方法 | |
US20230154479A1 (en) | Low cost adaptation of bass post-filter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170720 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180719 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20190718 Year of fee payment: 6 |