KR20160145799A - 코딩/디코딩 방법, 장치 및 시스템 - Google Patents

코딩/디코딩 방법, 장치 및 시스템 Download PDF

Info

Publication number
KR20160145799A
KR20160145799A KR1020167032571A KR20167032571A KR20160145799A KR 20160145799 A KR20160145799 A KR 20160145799A KR 1020167032571 A KR1020167032571 A KR 1020167032571A KR 20167032571 A KR20167032571 A KR 20167032571A KR 20160145799 A KR20160145799 A KR 20160145799A
Authority
KR
South Korea
Prior art keywords
full
band signal
coding
signal
audio signal
Prior art date
Application number
KR1020167032571A
Other languages
English (en)
Other versions
KR101906522B1 (ko
Inventor
빈 왕
저신 류
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=54936715&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20160145799(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20160145799A publication Critical patent/KR20160145799A/ko
Application granted granted Critical
Publication of KR101906522B1 publication Critical patent/KR101906522B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Abstract

본 발명의 실시예는 코딩/디코딩 방법, 장치, 및 시스템을 제공한다. 코딩 방법에 따라서, 디엠퍼시스 처리는 입력 오디오 신호의 특징 인자에 따라서 결정되는 디엠퍼시스 파라미터를 사용하여 전 대역 신호에 대해 수행되고, 그 후, 디코더가 입력 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 대응하는 디엠퍼시스 디코딩 처리를 수행하여 입력 오디오 신호를 복원할 수 있도록, 전 대역 신호가 코딩된 후 디코더에게 전송된다. 이로 인해, 디코더에 의해 복원되는 오디오 신호가 신호 왜곡을 갖기 쉽다는 종래 기술의 문제점이 해결되고, 코딩 성능을 향상시키기 위해 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 적응적인 디엠퍼시스 처리를 구현할 수 있으므로, 디코더에 의해 복원되는 입력 오디오 신호가 비교적 높은 신회도를 가지며 원래의 신호에 보다 유사해진다.

Description

코덱 방법, 장치 및 시스템 {CODEC METHOD, DEVICE AND SYSTEM}
본 발명은 오디오 신호 처리 기술에 관한 것으로, 구체적으로는 시간 도메인 기반 코딩/디코딩 방법, 장치, 및 시스템에 관한 것이다.
채널 용량과 저장 공간을 절약하기 위해, 인간의 귀가 오디오 신호의 저주파수 정보보다 고주파수 정보에 덜 민감하다는 것을 고려하여, 고주파수 정보가 일반적으로 제거됨으로써, 오디오 품질이 떨어지게 된다. 따라서, 오디오 품질을 향상시키기 위해, 대역폭 확장 기술이 제거된 고주파수 정보를 재건하기 위해 도입되었다. 속도가 증가함에 따라, 코딩 성능이 보장되는 전제하에, 코딩될 수 있는 고주파수 부분의 보다 넓은 대역으로 인해 수신기가 보다 넓은 대역과 보다 높은 품질의 오디오 신호를 획득할 수 있다.
종래 기술에서, 고속의 조건 하에서, 입력 오디오 신호의 주파수 스펙트럼은 대역폭 확장 기술을 사용하여 전 대역에서 코딩될 수 있다. 코딩의 기본 원리는, 입력 오디오 신호의 전 대역 신호를 획득하기 위해, 대역 통과 필터(Band Pass Filter, 약칭해서 BPF)를 사용하여 입력 오디오 신호에 대해 밴드 통과 필터링 처리를 수행하고; 전 대역 신호의 에너지(Ener0)를 획득하기 위해, 전 대역 신호에 대해 에너지 산출을 수행하며; 고주파수 대역 코딩 정보를 획득하기 위해, 초광대역(Super Wide Band, 약칭해서 SWB) 시간 대역 확장(Time Band Extension, 약칭해서 TBE) 인코더를 사용하여 고주파수 대역 신호를 코딩하고; 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 전 대역 선형 예측 코딩(Linear Predictive Coding, 약칭해서 LPC) 계수와 전 대역(Full Band, 약칭해서 FB) 여기(Excitation) 신호를 결정하며; 예측된 전 대역 신호를 획득하기 위해, LPC 계수와 FB 여기 신호에 따라서 예측 처리를 수행하고; 디엠퍼시스(de-emphasis) 처리가 수행된 예측된 전 대역 신호의 에너지(Ener1)를 결정하기 위해, 예측된 전 대역 신호에 대해 디엠퍼시스 처리를 수행하며; Ener0에 대한 Ener1의 에너지 비율을 산출하는 것이다. 디코더가 고주파수 대역 코딩 정보와 에너지 비율에 따라서 입력 오디오 신호의 전 대역 신호를 복원하여 입력 오디오 신호를 복원할 수 있도록, 고주파수 대역 코딩 정보와 에너지 비율이 디코더에게 전송된다.
전술한 해결수단에서, 디코더에 의해 복원되는 입력 오디오 신호는 비교적 심각한 신호 왜곡을 갖기 쉽다.
본 발명의 실시예는 코딩/디코딩 방법, 장치, 및 시스템을 제공하며, 디코더에 의해 복원되는 입력 오디오 신호가 비교적 심한 신호 왜곡을 갖기 쉽다는 종래 기술의 문제점을 없애거나 또는 해결할 수 있다.
제1 측면에 따르면, 본 발명은 코딩 방법을 제공하며,
코딩 장치에 의해, 입력 오디오 신호의 특징 인자(characteristic factor)를 획득하기 위해 상기 입력 오디오 신호의 저주파수 대역 신호를 코딩하는 단계;
상기 코딩 장치에 의해, 제1 전 대역 신호(full band signal)를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측(spread spectrum prediction)을 수행하는 단계;
상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리(de-emphasis processing)를 수행하는 단계 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
상기 코딩 장치에 의해, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하는 단계;
상기 코딩 장치에 의해, 제2 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호에 대해 대역 통과 필터링 처리(band-pass filtering processing)를 수행하는 단계;
상기 코딩 장치에 의해, 상기 제2 전 대역 신호의 제2 에너지를 산출하는 단계;
상기 코딩 장치에 의해, 상기 제1 전 대역 신호의 제1 에너지에 대한 상기 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출하는 단계; 및
상기 코딩 장치에 의해 디코딩 장치에게, 상기 입력 오디오 신호의 코딩에 의해 생성된 비트스트림을 전송하는 단계
를 포함하며,
상기 비트스트림은 상기 입력 오디오 신호의 상기 특징 인자, 고주파수 대역 코딩 정보, 및 상기 에너지 비율을 포함한다.
제1 측면을 참고한, 제1 측면의 제1 가능한 구현예에서, 본 방법은,
상기 코딩 장치에 의해, 특징 인자의 개수를 획득하는 단계;
상기 코딩 장치에 의해, 상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하는 단계; 및
상기 코딩 장치에 의해, 상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하는 단계를 더 포함한다.
제1 측면의 제1 가능한 구현예를 참고한, 제1 측면의 제2 가능한 구현예에서, 상기 코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계는,
상기 코딩 장치에 의해 상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호(full band excitation signal)를 결정하는 단계; 및
상기 코딩 장치에 의해, 상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계를 포함한다.
제1 측면 또는 제1 측면의 제1 또는 제2 가능한 구현예 중 어느 하나를 참고한, 제1 측면의 제3 가능한 구현예에서, 상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계는,
상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정(frequency spectrum movement correction)을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리(frequency spectrum reflection processing)를 수행하는 단계; 및
상기 코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하는 단계를 포함한다.
제1 측면 또는 제1 측면의 제1 내지 제3 가능한 구현예 중 어느 하나를 참고한, 제1 측면의 제4 가능한 구현예에서, 상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자(voicing factor), 스펙트럼 경사(spectral tilt), 단기 평균 에너지(short-term average energy), 또는 단기 제로 크로싱 비율(short-term zero-crossing rate)을 포함한다.
제2 측면에 따르면, 본 발명은 디코딩 방법을 제공하며,
디코딩 장치에 의해, 코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하는 단계 - 상기 오디오 신호 비트스트림은 상기 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함함 -;
상기 디코딩 장치에 의해, 저주파수 대역 신호를 획득하기 위해 상기 특징 인자를 사용하여 상기 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하는 단계;
상기 디코딩 장치에 의해, 고주파수 대역 신호를 획득하기 위해 상기 고주파수 대역 코딩 정보를 사용하여 상기 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행하는 단계;
상기 디코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계;
상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
상기 디코딩 장치에 의해, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하는 단계;
상기 디코딩 장치에 의해, 상기 오디오 신호 비트스트림 내에 포함된 상기 에너지 비율, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호, 및 상기 제1 에너지에 따라서 제2 전 대역 신호를 획득하는 단계 - 상기 에너지 비율은 상기 제1 에너지에 대한 상기 제2 전 대역 신호의 에너지의 에너지 비율임 -; 및
상기 디코딩 장치에 의해, 상기 제2 전 대역 신호, 상기 저주파수 대역 신호, 및 상기 고주파수 대역 신호에 따라서 상기 오디오 신호 비트스트림에 대응하는 상기 오디오 신호를 복원하는 단계를 포함한다.
제2 측면을 참고한, 제2 측면의 제1 가능한 구현예에서, 본 방법은,
상기 디코딩 장치에 의해, 디코딩을 통해 특징 인자의 개수를 획득하는 단계;
상기 디코딩 장치에 의해, 상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하는 단계; 및
상기 디코딩 장치에 의해, 상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하는 단계를 더 포함한다.
제2 측면 또는 제2 측면의 제1 가능한 구현예를 참고한, 제2 측면의 제2 가능한 구현예에서, 상기 디코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계는,
상기 디코딩 장치에 의해 상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하는 단계; 및
상기 디코딩 장치에 의해, 상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 제1 또는 제2 가능한 구현예 중 어느 하나를 참고한, 제2 측면의 제3 가능한 구현예에서, 상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계는,
상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하는 단계; 및
상기 디코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하는 단계를 포함한다.
제2 측면 또는 제2 측면의 제1 내지 제3 가능한 구현예 중 어느 하나를 참고한, 제2 측면의 제4 가능한 구현예에서, 상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함한다.
제3 측면에 따르면, 본 발명은 코딩 장치를 제공하며,
입력 오디오 신호의 특징 인자를 획득하기 위해 상기 입력 오디오 신호의 저주파수 대역 신호를 코딩하도록 구성된 제1 코딩 모듈;
제1 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행하도록 구성된 제2 코딩 모듈;
상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된 디엠퍼시스 처리 모듈 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하도록 구성된 산출 모듈;
제2 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호에 대해 대역 통과 필터링 처리를 수행하도록 구성된 대역 통과 처리 모듈 - 상기 산출 모듈은 상기 제2 전 대역 신호의 제2 에너지를 산출하고, 그리고 상기 제1 전 대역 신호의 제1 에너지에 대한 상기 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출하도록 추가로 구성됨 -; 및
상기 입력 오디오 신호에 대한 코딩 후의 비트스트림을 디코딩 장치에게 전송하도록 구성된 전송 모듈
을 포함하며,
상기 비트스트림은 상기 입력 오디오 신호의 상기 특징 인자, 고주파수 대역 코딩 정보, 및 상기 에너지 비율을 포함한다.
제3 측면을 참고한, 제3 측면의 제1 가능한 구현예에서, 상기 코딩 장치는,
특징 인자의 개수를 획득하고,
상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하며,
상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하도록
구성된 디엠퍼시스 파라미터 결정 모듈을 더 포함한다.
제3 측면 또는 제3 측면의 제1 가능한 구현예를 참고한, 제3 측면의 제2 가능한 구현예에서, 상기 제2 코딩 모듈은 구체적으로,
상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하고,
상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하도록 구성된다.
제3 측면 또는 제3 측면의 제1 또는 제2 가능한 구현예 중 어느 하나를 참고한, 제3 측면의 제3 가능한 구현예에서, 상기 디엠퍼시스 처리 모듈은 구체적으로,
상기 제2 코딩 모듈에 의해 획득되는 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며,
주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하도록 구성된다.
제3 측면 또는 제3 측면의 제1 내지 제3 가능한 구현예 중 어느 하나를 참고한, 제3 측면의 제4 가능한 구현예에서, 상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함한다.
제4 측면에 따르면, 본 발명은 디코딩 장치를 제공하며,
코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하도록 구성된 수신 모듈 - 상기 오디오 신호 비트스트림은 상기 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함함 -;
저주파수 대역 신호를 획득하기 위해 상기 특징 인자를 사용하여 상기 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하도록 구성된 제1 디코딩 모듈;
고주파수 대역 신호를 획득하기 위해 상기 고주파수 대역 코딩 정보를 사용하여 상기 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행하고, 그리고 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하도록 구성된 제2 디코딩 모듈;
상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된 디엠퍼시스 처리 모듈 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하고, 그리고 상기 오디오 신호 비트스트림 내에 포함된 상기 에너지 비율, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호, 및 상기 제1 에너지에 따라서 제2 전 대역 신호를 획득하도록 구성된 산출 모듈 - 상기 에너지 비율은 상기 제1 에너지에 대한 상기 제2 전 대역 신호의 에너지의 에너지 비율임 -; 및
상기 제2 전 대역 신호, 상기 저주파수 대역 신호, 및 상기 고주파수 대역 신호에 따라서 상기 오디오 신호 비트스트림에 대응하는 상기 오디오 신호를 복원하도록 구성된 복원 모듈을 포함한다.
제4 측면을 참고한, 제4 측면의 제1 가능한 구현예에서, 상기 디코딩 장치는,
디코딩을 통해 특징 인자의 개수를 획득하고,
상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하며,
상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하도록 구성된 디엠퍼시스 파라미터 결정 모듈을 더 포함한다.
제4 측면 또는 제4 측면의 제1 가능한 구현예를 참고한, 제4 측면의 제2 가능한 구현예에서, 상기 제2 디코딩 모듈은 구체적으로,
상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하고,
상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하도록 구성된다.
제4 측면 또는 제4 측면의 제1 또는 제2 가능한 구현예 중 어느 하나를 참고한, 제4 측면의 제3 가능한 구현예에서, 상기 디엠퍼시스 처리 모듈은 구체적으로,
상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며,
주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하도록 구성된다.
제4 측면 또는 제4 측면의 제1 내지 제3 가능한 구현예 중 어느 하나를 참고한, 제4 측면의 제4 가능한 구현예에서, 상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함한다.
제5 측면에 따르면, 본 발명은 코딩/디코딩 시스템을 제공하며, 제3 측면 또는 제3 측면의 제1 내지 제4 가능한 구현예 중 어느 하나에 따른 코딩 장치; 및 제4 측면 또는 제4 측면의 제1 내지 제4 가능한 구현예 중 어느 하나에 따른 디코딩 장치를 포함한다.
본 발명의 실시예에서 제공되는 코덱 방법, 장치 및 시스템에 따르면, 디엠퍼시스 처리가 입력 오디오 신호의 특징 인자에 따라서 결정되는 디엠퍼시스 파라미터를 사용하여 전 대역 신호에 대해 수행되고, 그 후, 디코더가 입력 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 대응하는 디엠퍼시스 디코딩 처리를 수행하여 입력 오디오 신호를 복원할 수 있도록, 전 대역 신호가 코딩되어 디코더에게 전송된다. 이로 인해 디코더에 의해 복원되는 오디오 신호가 신호 왜곡을 갖기 쉽다는 종래 기술의 문제점이 해결되고, 코딩 성능을 향상시키기 위해 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 적응적인 디엠퍼시스 처리를 구현할 수 있어서, 디코더에 의해 복원되는 입력 오디오 신호가 비교적 높은 신뢰도를 가지며 원래의 신호에 보다 근접해질 수 있다.
본 발명의 실시예 또는 종래 기술에서의 기술적 해결수단을 더욱 명확히 기술하기 위해, 이하에서 본 발명의 실시예 또는 종래 기술을 설명할 때 필요한 첨부 도면을 간략하게 소개한다. 분명한 것은, 이하의 설명에서의 첨부 도면은 본 발명의 일부 실시예를 나타내며, 통상의 기술자라면 첨부된 도면으로부터 창작 능력 없이도 다른 도면을 도출해 낼 수 있다는 것이다.
도 1은 본 발명의 실시예에 따른 코딩 방법의 실시예의 흐름도이다.
도 2는 본 발명의 실시예에 따른 디코딩 방법의 실시예의 흐름도이다.
도 3은 본 발명의 실시예에 따른 코딩 장치의 제1 실시예의 개략적인 구성도이다.
도 4는 본 발명의 실시예에 따른 디코딩 장치의 제1 실시예의 개략적인 구성도이다.
도 5는 본 발명의 실시예에 따른 코딩 장치의 제2 실시예의 개략적인 구성도이다.
도 6은 본 발명의 실시예에 따른 코딩 장치의 제2 실시예의 개략적인 구성도이다.
도 7은 본 발명의 실시예에 따른 코딩/디코딩 시스템의 실시예의 개략적인 구성도이다.
본 발명의 실시예의 목적, 기술적 해결수단, 및 이점을 보다 명확하게 하기 위해, 이하에서 본 발명의 실시예에 관한 첨부 도면을 참조하여 본 발명의 실시예의 기술적 해결수단을 명확하고 상세하게 기술한다. 분명한 것은, 여기 기술된 실시예는 단지 본 발명의 실시예의 일부이며 전부가 아니라는 것이다. 본 발명의 실시예에 기초하여 창작 노력 없이 통상의 기술자에 의해 획득되는 다른 모든 실시예는 본 발명의 보호 범위 내에 포함될 것이다.
도 1은 본 발명의 실시예에 따른 코딩 방법의 실시예의 개략적인 흐름도이다. 도 1에 도시된 바와 같이, 본 방법 실시예는 다음의 단계를 포함한다.
단계 S101: 코딩 장치는 입력 오디오 신호의 특징 인자(characteristic factor)를 획득하기 위해 입력 오디오 신호의 저주파수 대역 신호를 코딩한다.
코딩된 신호는 오디오 신호이다. 특징 인자는 오디오 신호의 특징을 반영하는 데 사용되며, "보이싱 인자(voicing factor)", "스펙트럼 경사(spectral tilt)", "단기 평균 에너지(short-term average energy)", 또는 "단기 제로 크로싱 비율(short-term zero-crossing rate)"을 포함하지만 이에 한정되는 것은 아니다. 특징 인자는 입력 오디오 신호의 저주파수 대역 신호를 코딩함으로써 코딩 장치에 의해 획득될 수 있다. 구체적으로, 예로서 보이싱 인자를 사용하면, 보이싱 인자는 저주파수 대역 신호를 코딩함으로써 획득되는 저주파수 대역 코딩 정보로부터 추출되는 피치 주기(pitch period), 대수 코드북(algebraic codebook), 및 그들 각자의 이득에 따른 계산을 통해 획득될 수 있다.
단계 S102: 코딩 장치는 제1 전 대역 신호를 획득하기 위해 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행한다.
고주파수 대역 신호가 코딩되는 경우, 고주파수 대역 코딩 정보가 추가로 획득된다.
단계 S103: 코딩 장치는 제1 전 대역 신호에 대해 디엠퍼시스(de-emphasis) 처리를 수행하며, 여기서 디엠퍼시스 처리의 디엠퍼시스 파라미터는 특징 인자에 따라서 결정된다.
단계 S104: 코딩 장치는 디엠퍼시스 처리가 수행된 제1 전 대역 신호의 제1 에너지를 산출한다.
단계 S105: 코딩 장치는 제2 전 대역 신호를 획득하기 위해 입력 오디오 신호에 대해 대역 통과 필터 처리를 수행한다.
단계 S106: 코딩 장치는 제2 전 대역 신호의 제2 에너지를 산출한다.
단계 S107: 코딩 장치는 제1 전 대역 신호의 제1 에너지 대한 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출한다.
단계 S108: 코딩 장치는, 디코딩 장치에게, 입력 오디오 신호를 코딩한 후의 비트스트림을 전송하며, 여기서 비트스트림은 입력 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함한다.
또한, 본 방법 실시예는,
코딩 장치에 의해, 특징 인자의 개수를 획득하는 단계;
코딩 장치에 의해, 특징 인자와 특징 인자의 개수에 따라서 특징 인자의 평균값을 결정하는 단계; 및
코딩 장치에 의해, 특징 인자의 평균값에 따라서 디엠퍼시스 파라미터를 결정하는 단계를 더 포함한다.
구체적으로, 코딩 장치는 특징 인자 중 하나를 획득할 수 있다. 특징 인자가 보이싱 인자인 예를 사용하면, 코딩 장치는 보이싱 인자의 개수를 획득하고, 보이싱 인자와 보이싱 인자의 개수에 따라서, 입력 오디오 신호의 보이싱 인자의 평균값을 결정하며, 보이싱 인자의 평균값에 따라서 디엠퍼시스 파라미터를 추가로 결정한다.
또한, 단계 S102에서, 코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행하는 단계는,
고주파수 대역 신호에 따라서 코딩 장치에 의해, 전 대역 신호를 예측하는 데 사용되는 LPC 계수와 전 대역 여기 신호를 결정하는 단계; 및
코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 LPC 계수와 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계를 포함한다.
또한, 단계 S103은,
코딩 장치에 의해, 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정(frequency spectrum movement correction)을 수행하고, 보정된 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리(frequency spectrum reflection processing)를 수행하는 단계; 및
코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계를 포함한다.
선택적으로, 단계 S103 후에, 본 방법 실시예는,
코딩 장치에 의해, 디엠퍼시스 처리가 수행된 제1 전 대역 신호에 대해 업샘플링(upsampling)과 밴드 통과 처리를 수행하는 단계를 더 포함하고;
이에 대응하여, 단계 S104는,
코딩 장치에 의해, 디엠퍼시스 처리, 업샘플링, 및 밴드 통과 처리가 수행된 제1 전 대역 신호의 제1 에너지를 산출하는 단계를 포함한다.
이하, 본 방법 실시예의 구체적인 구현 방식에 대해 특징 인자가 보이싱 인자인 예를 사용하여 설명한다. 다른 특징 인자에 대해, 그들의 구현 과정이 이와 유사하며, 상세한 것에 대해서는 추가 설명하지 않는다.
구체적으로, 입력 오디오 신호를 수신한 후, 코딩 장치의 신호 코딩 장치는 입력 오디오 신호로부터 저주파수 대역 신호를 추출하며, 이 때 대응하는 주파수 스펙트럼 범위는 [0, f1]이고, 입력 오디오 신호의 보이싱 인자를 획득하기 위해 저주파수 대역 신호를 코딩한다. 구체적으로, 신호 코딩 장치는 저주파수 대역 코딩 정보를 획득하기 위해 저주파수 대역 신호를 코딩하고; 보이싱 인자를 획득하기 위해 저주파수 대역 코딩 정보에 포함된 피치 주기, 대수 코드북, 및 그들 각자의 이득에 따라서 산출하며; 보이싱 인자에 따라서 디엠퍼시스 파라미터를 결정한다. 신호 코딩 장치는 입력 오디오 신호로부터 고주파수 대역 신호를 추출하며, 이 때 대응하는 주파수 스펙트럼 범위는 [f1, f2]이고; 고주파수 대역 코딩 정보를 획득하기 위해 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행하며; 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 LPC 계수와 전 대역 여기 신호를 결정하고; 예측된 제1 전 대역 신호를 획득하기 위해 LPC 계수와 전 대역 여기 신호에 대해 코딩 처리를 수행하며; 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하며, 여기서 디엠퍼시스 처리의 디엠퍼시스 파라미터는 보이싱 인자에 따라서 결정된다. 제1 전 대역 신호가 결정된 후, 주파수 스펙트럼 천이 보정과 주파수 스펙트럼 반사 처리가 제1 전 대역 신호에 대해 수행되고, 그 후, 디엠퍼시스 처리가 수행될 수 있다. 선택적으로, 업샘플링과 대역 통과 필터링 처리는 디엠퍼시스 처리가 수행된 제1 전 대역 신호에 대해 수행될 수 있다. 그 후, 코딩 장치는 처리된 제1 전 대역 신호의 제1 에너지(Ener0)를 산출하고; 제2 전 대역 신호를 획득하기 위해 입력 오디오 신호에 대해 대역 통과 필터링 처리를 수행하며, 이 때의 주파수 스펙트럼 범위는 [f2, f3]이고; 제2 전 대역 신호의 제2 에너지(Ener1)를 결정하며; 디코딩 장치가 수신된 비트스트림, 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율에 따라서 오디오 신호를 복원할 수 있도록, 입력 오디오 신호의 코딩 후의 비트스트림 내에 입력 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함시킨다.
일반적으로, 48-킬로 헤르츠(Kilo Hertz, 약칭해서 KHz)의 입력 오디오 신호의 경우, 입력 오디오 신호의 저주파수 대역 신호의 대응 주파수 스펙트럼 범위 [0, f1]는 구체적으로 [0, 8 KHz]일 수 있고, 입력 오디오 신호의 고주파수 대역 신호의 대응 주파수 스펙트럼 범위 [f1, f2]는 구체적으로 [8 KHz, 16 KHz]일 수 있다. 제2 전 대역 신호에 대응하는 대응 주파수 스펙트럼 범위 [f2, f3]는 구체적으로 [16 KHz, 20 KHz]일 수 있다. 이하, 구체적인 주파수 스펙트럼 범위를 예로 사용하여 본 방법 실시예의 구현 방식에 대해 상세하게 설명한다. 본 발명은 본 구현 방식에 응용될 수 있으며, 이에 한정되는 것은 아니다.
구체적인 구현에서, [0, 8 KHz]에 대응하는 저주파수 대역 신호는, 저주파수 대역 코딩 정보를 획득하기 위해, 코드 여기 선형 예측(Code Excited Linear Prediction, 약칭해서 CELP) 코드(코어) 인코더를 사용하여 코딩될 수 있다. 코어 인코더에 의해 사용되는 코딩 알고리즘은 기존의 대수 코드 여기 선형 예측(Algebraic Code Excited Linear Prediction, 약칭해서 ACELP) 알고리즘일 수 있으며, 이에 한정되는 것은 아니다.
피치 주기, 대수 코드북, 및 그들 각자의 이득은 저주파수 대역 코딩 정보로부터 추출되고, 보이싱 인자는 기존의 알고리즘을 사용에 의한 산출을 통해 획득되며, 알고리즘에 대해서는 더 이상 상세하게 설명하지 않는다. 보이싱 인자가 결정된 후, 디엠퍼시스 파라미터를 산출하는 데 사용된 디엠퍼시스 인자(μ)가 결정된다. 이하, 예로서 보이싱 인자를 사용하여, 디엠퍼시스 인자(μ)가 결정되는 산출 과정에 대해 상세하게 설명한다.
획득된 M개의 보이싱 인자가 먼저 결정되며, 이러한 인자는 보통 4 또는 5일 수 있다. 보이싱 인자의 평균값(varvoiceshape)을 결정하기 위해, M개의 보이싱 인자가 더해지고 평균이 취해진다. 디엠퍼시스 인자(μ)가 평균값에 따라서 결정되고, 디엠퍼시스 파라미터(H(Z))는 [수학식 1]에 의해 표시된 바와 같이, μ에 따라서 추가로 획득될 수 있다.
Figure pct00001
여기서, H(Z)은 Z 도메인에서의 전달 함수(transfer function)의 표현이고, Z-1는 지연 유닛을 나타내며, μ는 varvoiceshape에 따라서 결정된다. varvoiceshape에 관한 임의 값이 μ로서 선택될 수 있고, 이것은 구체적으로 μ=varvoiceshape3, μ=varvoiceshape2, μ=varvoiceshape, 또는 μ=1-varvoiceshape3,일 수 있으며, 이에 한정되는 것은 아니다.
[8 KHz, 16 KHz]에 대응하는 고주파수 대역 신호는 초광대역(Super Wide Band) 시간 대역 확장(Time Band Extension, 약칭해서 TBE) 인코더를 사용하여 코딩될 수 있다. 이것은, 고주파수 대역 여기 신호를 복원하기 위해 코더 인코더로부터 피치 주기, 대수 코드북, 및 그들 각자의 이익을 추출하고; 고주파수 대역 LPC 계수를 획득하기 위해 LPC 분석을 수행하여 고주파수 대역 신호 컴포넌트를 추출하며; 복원된 고주파수 대역 신호를 획득하기 위해 고주파수 대역 여기 신호와 고주파수 대역 LPC 계수를 통합하고; 이득 조정 파라미터 이득을 획득하기 위해 복원된 고주파수 대역 신호를 입력 오디오 정보 내의 고주파수 대역 신호와 비교하며; 고주파수 대역 코딩 정보를 획득하기 위해 소량의 비트를 사용하여 고주파수 대역 LPC 계수와 이득 파라미터 이득을 양자화하는 것을 포함한다.
또한, SWB 인코더는, 입력 오디오 신호의 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 전 대역 LPC 계수와 전 대역 여기 신호를 결정하고, 예측된 제1 전 대역 신호를 획득하기 위해 전 대역 LPC 계수와 전 대역 여기 신호에 대해 통합 처리를 수행하며, 그 후, 주파수 스펙트럼 천이 보정이 [수학식 2]를 사용하여 제1 전 대역 신호에 대해 수행될 수 있다.
Figure pct00002
여기서, k는 k번째 시간 샘플 포인트를 나타내고, k는 양수이며, S2는 주파수 스펙트럼 천이 보정 후의 제1 주파수 스펙트럼 신호이고, S1은 제1 전 대역 신호이며, PI는 원주율이고, fn은 주파수 스펙트럼이 이동해야 하는 거리가 n 시간 샘플 포인트인 것을 나타내며, n은 양수이고, fs는 신호 샘플링 비율을 나타낸다.
주파수 스펙트럼 천이 보정 후, 주파수 스펙트럼 반사 처리가 수행된 제1 전 대역 신호(S3)를 획득하기 위해 주파수 스펙트럼 반사 처리가 S2에 대해 수행되고, 주파수 스펙트럼 천이 전후에 대응하는 시간 샘플 포인트의 주파수 스펙트럼 신호의 크기가 반사된다. 주파수 스펙트럼이 원래의 주파수 스펙트럼의 구조와 동일한 구조로 배치될 수 있도록, 주파수 스펙트럼 반사의 구현 방식이 통상의 주파수 스펙트럼 반사와 동일할 수 있으며, 상세한 것에 대해 추가 설명하지 않는다.
그 후, 디엠퍼시스 처리가 수행된 제1 전 대역 신호(S4)를 획득하기 위해, 보이싱 인자를 사용하여 결정된 디엠퍼시스 파라미터를 사용하여 디엠퍼시스 처리가 수행되고, 그 후, S4의 에너지(Ener0)가 결정된다. 구체적으로, 디엠퍼시스 처리는 디엠퍼시스 파라미터를 갖는 디엠퍼시스 필터를 사용하여 수행될 수 있다.
선택적으로, S4가 획득된 후, 업샘플링 처리가 수행된 제1 전 대역 신호(S5)를 획득하기 위해, 제로 삽입(zero insertion)에 의해, 엠퍼시스 처리가 수행된 제1 전 대역 신호에 대해 업샘플링 처리가 수행될 수 있고, 그 후, 제1 전대역 신호(S6)를 획득하기 위해 [16 KHz, 20 KHz]의 통과 범위를 갖는 대역 통과 필터(Band Pass Filter, 약칭해서 BPF)를 사용하여 S5에 대해 대역 통과 필터링 처리가 수행될 수 있으며, 그 후 S6의 에너지(Ener0)가 결정된다. 업샘플링과 대역 통과 처리는 디엠퍼시스 처리가 수행된 제1 전 대역 신호에 대해 수행되고, 그 후 코딩 성능을 향상시키기 위해 고주파수 대역 여기 신호의 주파수 스펙트럼 에너지와 주파수 스펙트럼 구조가 조정될 수 있도록, 제1 전 대역 신호가 결정된다.
제2 전 대역 신호는 코딩 장치에 의해 [16 KHz, 20 KHz]의 통과 범위를 갖는 대역 통과 필터를 사용하여 입력 오디오 신호에 대해 대역 통과 필터링 처리를 수행함으로써 획득될 수 있다. 제2 전 대역 신호가 획득된 후, 코딩 장치는 제2 전 대역 신호의 에너지(Ener1)를 결정하고, 에너지(Ener0)에 대한 에너지(Ener1)의 비율을 산출한다. 양자화 처리가 에너지 비율(energy ratio)에 대해 수행된 후, 입력 오디오 신호의 특징 인자와 고주파수 대역 코딩 정보가 비트스트림으로 패키지화되어 디코딩 장치에게 전송된다.
종래 기술에서, 디엠퍼시스 필터링 파라미터(H(Z))의 디엠퍼시스 인자(μ)는 통상적으로 고정 값을 갖고, 입력 오디오 신호의 신호 유형은 고려되지 않으며, 디코딩 장치에 의해 복원되는 입력 오디오 신호는 신호 왜곡을 갖기 쉽다.
본 방법 실시예에 따르면, 디엠퍼시스 처리가 입력 오디오 신호의 특징 인자에 따라서 결정되는 디엠퍼시스 파라미터를 사용하여 전 대역 신호에 대해 수행되고, 그 후, 디코더가 입력 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 대응하는 디엠퍼시스 디코딩 처리를 수행하여 입력 오디오 신호를 복원할 수 있도록, 전 대역 신호가 코딩되어 디코더에게 전송된다. 이로 인해 디코더에 의해 복원되는 오디오 신호가 신호 왜곡을 갖기 쉽다는 종래 기술의 문제점이 해결되고, 코딩 성능을 향상시키기 위해 오디오 신호의 특징 인자에 따라서 전 대역 신호에 대해 적응적인 디엠퍼시스 처리를 수행할 수 있어서, 디코더에 의해 복원되는 입력 오디오 신호가 비교적 높은 신뢰도를 가지며 원래의 신호에 보다 근접해질 수 있다.
도 2는 본 발명의 실시예에 따른 디코딩 방법 실시예의 흐름도이고, 도 1에 도시된 방법 실시예에 대응하는 디코더측 방법 실시예이다. 도 2에 도시된 바와 같이, 본 방법 실시예는 다음의 단계를 포함한다.
단계 S201: 디코딩 장치는 코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하며, 여기서 오디오 신호 비트스트림은 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함한다. 특징 인자는 오디오 신호의 특징을 반영하는 데 사용되며, "보이싱 인자(voicing factor)", "스펙트럼 경사(spectral tilt)", "단기 평균 에너지(short-term average energy)", 또는 "단기 제로 크로싱 비율(short-term zero-crossing rate)"을 포함하지만 이에 한정되는 것은 아니다. 특징 인자는 도 1에서 예시된 방법 실시예에서의 특징 인자와 동일하므로 중복 설명하지 않는다.
단계 S202: 디코딩 장치는 저주파수 대역 신호를 획득하기 위해 특징 인자를 사용하여 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행한다.
단계 S203: 디코딩 장치는 고주파수 대역 신호를 획득하기 위해 고주파수 대역 코딩 정보를 사용하여 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행한다.
단계 S204: 디코딩 장치는 제1 전 대역 신호를 획득하기 위해 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행한다.
단계 S205: 디코딩 장치는 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하며, 여기서 디엠퍼시스 처리의 디엠퍼시스 파라미터는 특징 인자에 따라서 결정된다.
단계 S206: 디코딩 장치는 디엠퍼시스 처리가 수행된 제1 전 대역 신호의 제1 에너지를 산출한다.
단계 S207: 디코딩 장치는 오디오 신호 비트스트림 내에 포함된 에너지 비율, 디엠퍼시스 처리가 수행된 제1 전 대역 신호, 및 제1 에너지에 따라서 제2 전 대역 신호를 획득하며, 여기서 에너지 비율은 제1 에너지에 대한 제2 전 대역 신호의 에너지의 에너지 비율이다.
단계 S208: 디코딩 장치는 제2 전 대역 신호, 저주파수 대역 신호, 및 고주파수 대역 신호에 따라서 오디오 신호 비트스트림에 대응하는 오디오 신호를 복원한다.
또한, 본 방법 실시예는,
디코딩 장치에 의해, 디코딩을 통해 특징 인자의 개수를 획득하는 단계;
디코딩 장치에 의해, 특징 인자와 특징 인자의 개수에 따라서 특징 인자의 평균값을 결정하는 단계; 및
디코딩 장치에 의해, 특징 인자의 평균값에 따라서 디엠퍼시스 파라미터를 결정하는 단계를 더 포함한다.
또한, 단계 S204는,
고주파수 대역 신호에 따라서 디코딩 장치에 의해, 전 대역 신호를 예측하는 데 사용되는 LPC 계수와 전 대역 여기 신호를 결정하는 단계; 및
디코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 LPC 계수와 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계를 포함한다.
또한, 단계 S205는,
디코딩 장치에 의해, 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하는 단계; 및
디코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계를 포함한다.
선택적으로, 단계 S205 후에, 본 방법 실시예는,
디코딩 장치에 의해, 디엠퍼시스 처리가 수행된 제1 전 대역 신호에 대해 업샘플링과 밴드 통과 처리를 수행하는 단계를 더 포함하고;
이에 대응하여, 단계 S206은,
디코딩 장치에 의해, 디엠퍼시스 처리, 업샘플링, 및 밴드 통과 처리가 수행된 제1 전 대역 신호의 제1 에너지를 결정하는 단계를 포함한다.
본 방법 실시예는 도 1에 예시된 방법 실시예에서의 기술적 해결수단에 대응한다. 본 방법 실시예의 구체적인 구현 방식에 대해 특징 인자가 보이싱 인자인 예를 사용하여 설명한다. 다른 특징 인자에 대해, 그들의 구현 과정이 이와 유사하며, 상세한 것에 대해서는 추가 설명하지 않는다.
구체적으로, 디코딩 장치는 코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하며, 여기서 오디오 신호 비트스트림은 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함한다. 그 후, 디코딩 장치는 오디오 신호 비트스트림으로부터 오디오 신호의 특징 인자를 추출하고, 저주파수 대역 신호를 획득하기 위해 오디오 신호의 특징 인자를 사용하여 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하며, 고주파수 대역 신호를 획득하기 위해 고주파수 대역 코딩 정보를 사용하여 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행한다. 디코딩 장치는특징 인자에 따라서 디엠퍼시스 파라미터를 결정하고; 제1 전 대역 신호(S1)를 획득하기 위해 디코딩을 통해 획득되는 고주파수 대역 신호에 따라서 전 대역 신호 예측을 수행하며, 주파수 스펙트럼 천이 보정 처리가 수행된 제1 전 대역 신호(S2)를 획득하기 위해 S1에 대해 주파수 스펙트럼 천이 보정 처리를 수행하고, 신호(S3)를 획득하기 위해 S2에 대해 주파수 스펙트럼 반사 처리를 수행하며, S4를 획득하기 위해, 특징 인자에 따라서 결정되는 디엠퍼시스 파라미터를 사용하여 S3에 대해 디엠퍼시스 처리를 수행하고, S4의 제1 에너지(Ener0)를 산출한다. 선택적으로, 디코딩 장치는 신호(S5)를 획득하기 위해 신호(S4)에 대해 업샘플링 처리를 수행하고, 신호(S6)를 획득하기 위해 S5에 대해 대역 통과 필터링 처리를 수행하며, 그 후 S6의 제1 에너지(Ener0)를 산출한다. 그 후, 제2 전 대역 신호가 신호(S4 또는 S6), Ener0, 및 수신된 에너지 비율에 따라서 획득되고, 오디오 신호 비트스트림에 대응하는 오디오 신호가 제2 전 대역 신호와, 디코딩을 통해서 획득되는 저주파수 대역 신호 및 고주파수 대역 신호에 따라서 복원된다.
구체적인 구현예에서, 저주파수 대역 디코딩은, 코더 디코더에 의해, 저주파수 대역 신호를 획득하기 위해 특징 인자를 사용하여 오디오 신호 비트스트림에 대해 수행될 수 있다. 고주파수 대역 디코딩은, SWB 디코더에 의해, 고주파수 대역 신호를 획득하기 위해 고주파수 대역 코딩 정보에 대해 수행될 수 있다. 고주파수 대역 신호가 획득된 후, 확산 스펙트럼 예측은 제1 전 대역 신호를 획득하기 위해 고주파수 대역 신호에 따라서 또는 고주파수 대역 신호가 감쇄 인자(attenuation factor)에 의해 곱해진 후에 수행되고, 주파수 스펙트럼 천이 보정 처리, 주파수 스펙트럼 반사 처리, 및 디엠퍼시스 처리가 제1 전 대역 신호에 대해 수행된다. 선택적으로, 업샘플링 처리와 대역 통과 필터링 처리는 디엠퍼시스 처리가 수행된 제1 주파수 대역 신호에 대해 수행된다. 구체적인 구현예에서, 도 1에 예시된 방법 실시예에서의 구현 방식과 유사한 방식이 처리를 위해 사용될 수 있으며, 상세한 것에 대해서는 중복 설명하지 않는다.
신호(S4 또는 S6), Ener0, 및 수신된 에너지 비율에 따라서 제2 전 대역 신호를 획득하는 단계는, 구체적으로, 제2 전 대역 신호의 에너지(Ener1=Ener0×R)를 복원하기 위해 에너지 비율(R)과 제1 에너지(Ener0)에 따라서 제1 전 대역 신호에 대해 에너지 조정을 수행하고, 제1 전 대역 신호의 주파수 스펙트럼과 에너지(Ener1)에 따라서 제2 전 대역 신호를 획득하는 단계이다.
본 방법 실시예에 따르면, 디코딩 장치가 오디오 신호 비트스트림에 포함된 오디오 신호의 특징 인자를 사용하여 디엠퍼시스 파라미터를 결정하고, 전 대역 신호에 대해 디엠퍼시스 처리를 수행하며, 특징 인자를 사용하여 디코딩을 통해 저주파수 대역 신호를 획득함으로써, 디코딩 장치에 의해 복원되는 오디오 신호가 원래의 입력 오디오 신호에 더 근접하며 또한 보다 높은 신뢰도를 갖는다.
도 3은 본 발명의 실시예에 따른 코딩 장치의 제1 실시예의 개략적인 구성도이다. 도 3에 도시된 바와 같이, 코딩 장치(300)는 제1 코딩 모듈(301), 제2 코딩 모듈(302), 디엠퍼시스 처리 모듈(303), 산출 모듈(304), 대역 통과 처리 모듈(305), 및 전송 모듈(306)을 포함하며,
제1 코딩 모듈(301)은 입력 오디오 신호의 특징 인자를 획득하기 위해 입력 오디오 신호의 저주파수 대역 신호를 코딩하도록 구성되며, 여기서, 특징 인자는 오디오 신호의 특징을 반영하는 데 사용되고, "보이싱 인자", "스펙트럼 경사", "단기 평균 에너지", 또는 "단기 제로 크로싱 비율"을 포함하며;
제2 코딩 모듈(302)은 제1 전 대역 신호를 획득하기 위해 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행하도록 구성되고;
디엠퍼시스 처리 모듈(303)은 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성되며, 여기서 디엠퍼시스 처리의 디엠퍼시스 파라미터는 특징 인자에 따라서 결정되고;
산출 모듈(304)은 디엠퍼시스 처리가 수행된 제1 전 대역 신호의 제1 에너지를 산출하도록 구성되며;
대역 통과 처리 모듈(305)은 제2 전 대역 신호를 획득하기 위해 입력 오디오 신호에 대해 대역 통과 필터 처리를 수행하도록 구성되고;
산출 모듈(304)은 제2 전 대역 신호의 제2 에너지를 산출하고, 제1 전 대역 신호의 제1 에너지 대한 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출하도록 추가로 구성되며;
전송 모듈(306)은, 디코딩 장치에게, 입력 오디오 신호를 코딩한 후의 비트스트림을 전송하도록 구성되고, 여기서 비트스트림은 입력 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함한다
또한, 코딩 장치(300)는,
특징 인자의 개수를 획득하고;
특징 인자와 특징 인자의 개수에 따라서 특징 인자의 평균값을 결정하며;
특징 인자의 평균값에 따라서 디엠퍼시스 파라미터를 결정하도록 구성된,
디엠퍼시스 파라미터 결정 모듈(307)을 더 포함한다.
또한, 제2 코딩 모듈(302)은 구체적으로,
고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 LPC 계수와 전 대역 여기 신호를 결정하고;
제1 전 대역 신호를 획득하기 위해 LPC 계수와 전 대역 여기 신호에 대해 코딩 처리를 수행하도록 구성된다.
또한, 디엠퍼시스 처리 모듈(303)은 구체적으로,
제2 코딩 모듈(302)에 의해 획득되는 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며;
주파수 스펙트럼 반사 처리가 수행된 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된다.
본 실시예에서 제공되는 코딩 장치는 도 1에 예시된 방법 실시예에서의 기술적 해결수단을 실행하도록 구성될 수 있다. 그들의 구현 원리와 기술적 효과는 유사하며, 상세한 것은 중복 설명하지 않는다.
도 4는 본 발명의 실시예에 따른 디코딩 장치의 제1 실시예의 개략적인 구성도이다. 도 4에 도시된 바와 같이, 디코딩 장치(400)는 수신 모듈(401), 제1 디코딩 모듈(402), 제2 디코딩 모듈(403), 디엠퍼시스 처리 모듈(404), 산출 모듈(405), 및 복원 모듈(406)을 포함하며,
수신 모듈(401)은 코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하도록 구성되며, 여기서 오디오 신호 비트스트림은 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함하고,
여기서, 특징 인자는 오디오 신호의 특징을 반영하는 데 사용되며, "보이싱 인자", "스펙트럼 경사", "단기 평균 에너지", 또는 "단기 제로 크로싱 비율"을 포함하며;
제1 디코딩 모듈(402)은 저주파수 대역 신호를 획득하기 위해 특징 인자를 사용하여 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하도록 구성되고;
제2 디코딩 모듈(403)은 고주파수 대역 신호를 획득하기 위해 고주파수 대역 코딩 정보를 사용하여 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행하고,
제1 전 대역 신호를 획득하기 위해 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하도록 구성되며;
디엠퍼시스 처리 모듈(404)은 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성되고, 여기서 디엠퍼시스 처리의 디엠퍼시스 파라미터는 특징 인자에 따라서 결정되며;
산출 모듈(405)은 디엠퍼시스 처리가 수행된 제1 전 대역 신호의 제1 에너지를 산출하고, 오디오 신호 비트스트림 내에 포함된 에너지 비율, 디엠퍼시스 처리가 수행된 제1 전 대역 신호, 및 제1 에너지에 따라서 제2 전 대역 신호를 획득하도록 구성되며, 여기서 에너지 비율은 제1 에너지에 대한 제2 전 대역 신호의 에너지의 에너지 비율이고;
복원 모듈(406)은 제2 전 대역 신호, 저주파수 대역 신호, 및 고주파수 대역 신호에 따라서 오디오 신호 비트스트림에 대응하는 오디오 신호를 복원하도록 구성된다.
또한, 디코딩 장치(400)는,
디코딩을 통해 특징 인자의 개수를 획득하고;
특징 인자와 특징 인자의 개수에 따라서 특징 인자의 평균값을 결정하며;
특징 인자의 평균값에 따라서 디엠퍼시스 파라미터를 결정하도록 구성된,
디엠퍼시스 파라미터 결정 모듈(407)을 더 포함한다.
또한, 제2 디코딩 모듈(403)은 구체적으로,
고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 LPC 계수와 전 대역 여기 신호를 결정하고;
제1 전 대역 신호를 획득하기 위해 LPC 계수와 전 대역 여기 신호에 대해 코딩 처리를 수행하도록 구성된다.
또한, 디엠퍼시스 처리 모듈(404)은 구체적으로,
제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며;
주파수 스펙트럼 반사 처리가 수행된 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된다.
본 실시예에서 제공되는 디코딩 장치는 도 2에서 예시된 방법 실시예에서의 기술적 해결수단을 실행하도록 구성될 수 있다. 그들의 구현 원리와 기술적 요과는 유사하며, 상세한 것은 중복 설명하지 않는다.
도 5는 본 발명의 실시예에 따른 코딩 장치의 제2 실시예의 개략적인 구성도이다. 도 5에 도시된 바와 같이, 코딩 장치(500)는 프로세서(501), 메모리(502), 및 통신 인터페이스(503)를 포함한다. 프로세서(501), 메모리(502), 및 통신 인터페이스(503)는 버스(도면에서 굵은 실선으로 도시됨)에 의해 연결된다.
통신 인터페이스(503)는 오디오 신호의 입력을 수신하고 디코딩 장치와 통신하도록 구성된다. 메모리(502)는 프로그램 코드를 저장하도록 구성된다. 프로세서(501)는 도 1에 예시된 방법 실시예에서의 기술적 해결수단을 실행하기 위해 메모리(502) 내에 저장된 프로그램 코드를 호출하도록 구성된다. 그들의 구현 원리와 기술적 효과는 유사하며, 상세한 것에 대해서는 중복 설명하지 않는다.
도 6은 본 발명의 실시예에 따른 코딩 장치의 제2 실시예의 개략적인 구성도이다. 도 6에 도시된 바와 같이, 디코딩 장치(600)는 프로세서(601), 메모리(602), 및 통신 인터페이스(603)를 포함한다. 프로세서(601), 메모리(602), 및 통신 인터페이스(603)는 버스(도면에서 굵은 실선으로 도시됨)에 의해 연결된다.
통신 인터페이스(603)는 코딩 장치와 통신하고 복원된 오디오 신호를 출력하도록 구성된다. 메모리(602)는 프로그램 코드를 저장하도록 구성된다. 프로세서(601)는 도 2에 예시된 방법 실시예에서의 기술적 해결수단을 실행하기 위해 메모리(602) 내에 저장된 프로그램 코드를 호출하도록 구성된다. 그들의 구현 원리와 기술적 효과는 유사하며, 상세한 것에 대해서는 중복 설명하지 않는다.
도 7은 본 발명에 따른 코딩/디코딩 시스템의 실시예의 개략적인 구성도이다. 도 7에 도시된 바와 같이, 코덱 시스템(700)은 코딩 장치(701) 및 디코딩 장치(702)를 포함한다. 코딩 장치(701)와 디코딩 장치(702)는 각각 도 3에 도시된 코딩 장치와 도 4에 도시된 코딩 장치일 수 있으며, 각각 도 1과 도 2에서 예시된 방법 실시예에서의 기술적 해결수단을 실행하도록 구성될 수 있다. 그들의 구현 원리와 기술적 효과는 유사하며, 상세한 것에 대해서는 중복 설명하지 않는다.
전술한 구현 방식들의 설명을 통해, 통상의 기술자는 본 발명이 하드웨어, 소프트웨어, 펌웨어 또는 이들의 조합을 통해 구현될 수 있음을 명확하게 이해할 수 있다. 본 발명이 소프트웨어를 통해 구현될 경우, 전술한 기능들은 컴퓨터로 판독 가능한 매체에 저장되거나, 컴퓨터로 판독 가능한 매체 내의 하나 이상의 명령 또는 코드로서 전송될 수 있다. 컴퓨터로 판독 가능한 매체는 컴퓨터 기록 매체 및 통신 매체를 모두 포함하며, 여기서 통신 매체는 한 곳에서 다른 곳으로의 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함한다. 기록 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가능한 매체가 될 수 있다. 이와 같은 컴퓨터로 판독 가능한 매체는, 예시이면서 제한되지 않는 것으로서, RAM, ROM, EEPROM, CD-ROM 또는 다른 광디스크 스토리지, 또는 자기 디스크 기록 매체, 또는 다른 자기 기억장치, 또는 원하는 프로그램 코드를 명령 또는 데이터 구조의 형태로 캐링(carrying) 또는 저장하는 데에 사용될 수 있고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 연결은 컴퓨터로 판독 가능한 매체로 적절하게 일컬어질 수 있다. 예를 들어, 소프트웨어가 동축 케이블, 광섬유/광케이블, TP(twisted pair), DSL(digital subscriber line) 또는 적외선, 전파 및 마이크로파 등의 무선 기술을 사용함으로써 웹사이트, 서버 또는 다른 원격 소스로부터 전송될 경우, 동축 케이블, 광섬유/광케이블, TP, DSL 또는 적외선, 전파 및 마이크로파 등의 무선 기술은 매체의 정의에 포함된다. 예를 들면, 본 발명에서 사용된 디스크(Disk, Disc)는, CD(compact disc), 레이져 디스크, 광 디스크, DVD(digital versatile disc), 플로피 디스크(floppy disc) 및 블루레이 디스크(blu-ray disc)를 포함하는 것으로서, 일반적으로 자기 수단(magnetic means)에 의해 데이터를 복제하는 디스크(disk)와, 레이저 수단에 의해 데이터를 광으로(optically) 복제하는 디스크(disc)가 있다. 이들의 조합 역시 컴퓨터로 판독 가능한 매체의 보호 범위 내에 포함될 것이다.
게다가, 실시예에 의존하여, 본 명세서에서 설명된 임의 방법 중 일부 동작 또는 이벤트는 상이한 시퀀스에 따라서 실행될 수 있거나, 또는 추가되고, 결합되거나, 또는 제거될 수 있다(예를 들어, 일부 특정 목적을 달성하기 위한 것이며, 설명된 모든 동작이나 이벤트가 필요한 것은 아니다). 게다가, 일부 실시예에서, 동작 또는 이벤트는 하이퍼-스레딩 처리, 인터럽트 처리, 또는 복수의 프로세서에 의한 동시 처리를 수행할 수 있으며, 동시 처리는 시퀀셜 실행이 아닐 수 있다. 또한, 명료성을 고려하면, 본 발명의 구체적인 실시예는 단일 단계 또는 모듈의 기능으로서 설명되지만, 본 발명의 기술이 상기한 복수의 단계 또는 모듈의 결합된 실행일 수도 있다는 것이 이해되어져야 한다.
마지막으로, 전술한 실시예는 본 발명의 기술적 해결수단을 설명하기 위한 것이지 본 발명을 한정하기 위한 것이 아니라는 것이다. 전술한 실시예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자는 여전히, 본 발명의 실시예의 기술적 해결수단의 범위를 벗어남이 없이, 전술한 실시예에 기재된 기술적 해결수단에 수정을 가하거나 그 기술적 특징의 일부 또는 전부를 동등물로 대체할 수 있음을 알아야 한다.

Claims (21)

  1. 코딩 방법으로서,
    코딩 장치에 의해, 입력 오디오 신호의 특징 인자(characteristic factor)를 획득하기 위해 상기 입력 오디오 신호의 저주파수 대역 신호를 코딩하는 단계;
    상기 코딩 장치에 의해, 제1 전 대역 신호(full band signal)를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측(spread spectrum prediction)을 수행하는 단계;
    상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리(de-emphasis processing)를 수행하는 단계 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
    상기 코딩 장치에 의해, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하는 단계;
    상기 코딩 장치에 의해, 제2 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호에 대해 대역 통과 필터링 처리(band-pass filtering processing)를 수행하는 단계;
    상기 코딩 장치에 의해, 상기 제2 전 대역 신호의 제2 에너지를 산출하는 단계;
    상기 코딩 장치에 의해, 상기 제1 전 대역 신호의 제1 에너지에 대한 상기 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출하는 단계; 및
    상기 코딩 장치에 의해 디코딩 장치에게, 상기 입력 오디오 신호의 코딩에 의해 생성된 비트스트림을 전송하는 단계
    를 포함하며,
    상기 비트스트림은 상기 입력 오디오 신호의 상기 특징 인자, 고주파수 대역 코딩 정보, 및 상기 에너지 비율을 포함하는,
    코딩 방법.
  2. 제1항에 있어서,
    상기 코딩 장치에 의해, 특징 인자의 개수를 획득하는 단계;
    상기 코딩 장치에 의해, 상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하는 단계; 및
    상기 코딩 장치에 의해, 상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하는 단계
    를 더 포함하는 코딩 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계는,
    상기 코딩 장치에 의해 상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호(full band excitation signal)를 결정하는 단계; 및
    상기 코딩 장치에 의해, 상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계
    를 포함하는, 코딩 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계는,
    상기 코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정(frequency spectrum movement correction)을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리(frequency spectrum reflection processing)를 수행하는 단계; 및
    상기 코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하는 단계
    를 포함하는, 코딩 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자(voicing factor), 스펙트럼 경사(spectral tilt), 단기 평균 에너지(short-term average energy), 또는 단기 제로 크로싱 비율(short-term zero-crossing rate)을 포함하는,
    코딩 방법.
  6. 디코딩 방법으로서,
    디코딩 장치에 의해, 코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하는 단계 - 상기 오디오 신호 비트스트림은 상기 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함함 -;
    상기 디코딩 장치에 의해, 저주파수 대역 신호를 획득하기 위해 상기 특징 인자를 사용하여 상기 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하는 단계;
    상기 디코딩 장치에 의해, 고주파수 대역 신호를 획득하기 위해 상기 고주파수 대역 코딩 정보를 사용하여 상기 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행하는 단계;
    상기 디코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계;
    상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
    상기 디코딩 장치에 의해, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하는 단계;
    상기 디코딩 장치에 의해, 상기 오디오 신호 비트스트림 내에 포함된 상기 에너지 비율, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호, 및 상기 제1 에너지에 따라서 제2 전 대역 신호를 획득하는 단계 - 상기 에너지 비율은 상기 제1 에너지에 대한 상기 제2 전 대역 신호의 에너지의 에너지 비율임 -; 및
    상기 디코딩 장치에 의해, 상기 제2 전 대역 신호, 상기 저주파수 대역 신호, 및 상기 고주파수 대역 신호에 따라서 상기 오디오 신호 비트스트림에 대응하는 상기 오디오 신호를 복원하는 단계
    를 포함하는 디코딩 방법.
  7. 제6항에 있어서,
    상기 디코딩 장치에 의해, 디코딩을 통해 특징 인자의 개수를 획득하는 단계;
    상기 디코딩 장치에 의해, 상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하는 단계; 및
    상기 디코딩 장치에 의해, 상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하는 단계
    를 더 포함하는, 디코딩 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 디코딩 장치에 의해, 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하는 단계는,
    상기 디코딩 장치에 의해 상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하는 단계; 및
    상기 디코딩 장치에 의해, 상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하는 단계
    를 포함하는, 디코딩 방법.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서,
    상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하는 단계는,
    상기 디코딩 장치에 의해, 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하는 단계; 및
    상기 디코딩 장치에 의해, 주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하는 단계
    를 포함하는, 디코딩 방법.
  10. 제6항 내지 제9항 중 어느 한 항에 있어서,
    상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함하는,
    디코딩 방법.
  11. 코딩 장치로서,
    입력 오디오 신호의 특징 인자를 획득하기 위해 상기 입력 오디오 신호의 저주파수 대역 신호를 코딩하도록 구성된 제1 코딩 모듈;
    제1 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호의 고주파수 대역 신호에 대해 코딩 및 확산 스펙트럼 예측을 수행하도록 구성된 제2 코딩 모듈;
    상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된 디엠퍼시스 처리 모듈 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
    디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하도록 구성된 산출 모듈;
    제2 전 대역 신호를 획득하기 위해 상기 입력 오디오 신호에 대해 대역 통과 필터링 처리를 수행하도록 구성된 대역 통과 처리 모듈 - 상기 산출 모듈은 상기 제2 전 대역 신호의 제2 에너지를 산출하고, 그리고 상기 제1 전 대역 신호의 제1 에너지에 대한 상기 제2 전 대역 신호의 제2 에너지의 에너지 비율을 산출하도록 추가로 구성됨 -; 및
    상기 입력 오디오 신호에 대한 코딩 후의 비트스트림을 디코딩 장치에게 전송하도록 구성된 전송 모듈
    을 포함하며,
    상기 비트스트림은 상기 입력 오디오 신호의 상기 특징 인자, 고주파수 대역 코딩 정보, 및 상기 에너지 비율을 포함하는,
    코딩 장치.
  12. 제11항에 있어서,
    특징 인자의 개수를 획득하고,
    상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하며,
    상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하도록
    구성된 디엠퍼시스 파라미터 결정 모듈
    을 더 포함하는, 코딩 장치.
  13. 제11항 또는 제12항에 있어서,
    상기 제2 코딩 모듈은 구체적으로,
    상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하고,
    상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하도록
    구성된, 코딩 장치.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서,
    상기 디엠퍼시스 처리 모듈은 구체적으로,
    상기 제2 코딩 모듈에 의해 획득되는 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며,
    주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하도록
    구성된, 코딩 장치.
  15. 제11항 내지 제14항 중 어느 한 항에 있어서,
    상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함하는,
    코딩 장치.
  16. 디코딩 장치로서,
    코딩 장치에 의해 전송되는 오디오 신호 비트스트림을 수신하도록 구성된 수신 모듈 - 상기 오디오 신호 비트스트림은 상기 오디오 신호 비트스트림에 대응하는 오디오 신호의 특징 인자, 고주파수 대역 코딩 정보, 및 에너지 비율을 포함함 -;
    저주파수 대역 신호를 획득하기 위해 상기 특징 인자를 사용하여 상기 오디오 신호 비트스트림에 대해 저주파수 대역 디코딩을 수행하도록 구성된 제1 디코딩 모듈;
    고주파수 대역 신호를 획득하기 위해 상기 고주파수 대역 코딩 정보를 사용하여 상기 오디오 신호 비트스트림에 대해 고주파수 대역 디코딩을 수행하고, 그리고 제1 전 대역 신호를 획득하기 위해 상기 고주파수 대역 신호에 대해 확산 스펙트럼 예측을 수행하도록 구성된 제2 디코딩 모듈;
    상기 제1 전 대역 신호에 대해 디엠퍼시스 처리를 수행하도록 구성된 디엠퍼시스 처리 모듈 - 상기 디엠퍼시스 처리의 디엠퍼시스 파라미터는 상기 특징 인자에 따라서 결정됨 -;
    디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호의 제1 에너지를 산출하고, 그리고 상기 오디오 신호 비트스트림 내에 포함된 상기 에너지 비율, 디엠퍼시스 처리가 수행된 상기 제1 전 대역 신호, 및 상기 제1 에너지에 따라서 제2 전 대역 신호를 획득하도록 구성된 산출 모듈 - 상기 에너지 비율은 상기 제1 에너지에 대한 상기 제2 전 대역 신호의 에너지의 에너지 비율임 -; 및
    상기 제2 전 대역 신호, 상기 저주파수 대역 신호, 및 상기 고주파수 대역 신호에 따라서 상기 오디오 신호 비트스트림에 대응하는 상기 오디오 신호를 복원하도록 구성된 복원 모듈
    을 포함하는 디코딩 장치.
  17. 제16항에 있어서,
    디코딩을 통해 특징 인자의 개수를 획득하고,
    상기 특징 인자와 상기 특징 인자의 개수에 따라서 상기 특징 인자의 평균값을 결정하며,
    상기 특징 인자의 평균값에 따라서 상기 디엠퍼시스 파라미터를 결정하도록
    구성된 디엠퍼시스 파라미터 결정 모듈
    을 더 포함하는, 디코딩 장치.
  18. 제16항 또는 제17항에 있어서,
    상기 제2 디코딩 모듈은 구체적으로,
    상기 고주파수 대역 신호에 따라서, 전 대역 신호를 예측하는 데 사용되는 선형 예측 코딩(linear predictive coding, LPC) 계수와 전 대역 여기 신호를 결정하고,
    상기 제1 전 대역 신호를 획득하기 위해 상기 LPC 계수와 상기 전 대역 여기 신호에 대해 코딩 처리를 수행하도록
    구성된, 디코딩 장치.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서,
    상기 디엠퍼시스 처리 모듈은 구체적으로,
    상기 제1 전 대역 신호에 대해 주파수 스펙트럼 천이 보정을 수행하고, 보정된 상기 제1 전 대역 신호에 대해 주파수 스펙트럼 반사 처리를 수행하며,
    주파수 스펙트럼 반사 처리가 수행된 상기 제1 전 대역 신호에 대해 상기 디엠퍼시스 처리를 수행하도록
    구성된, 디코딩 장치.
  20. 제16항 내지 제19항 중 어느 한 항에 있어서,
    상기 특징 인자는 상기 오디오 신호의 특징을 반영하는 데 사용되고, 보이싱 인자, 스펙트럼 경사, 단기 평균 에너지, 또는 단기 제로 크로싱 비율을 포함하는,
    디코딩 장치.
  21. 코딩/디코딩 시스템으로서,
    청구항 11 내지 청구항 15 중 어느 한 항에 따른 코딩 장치; 및
    청구항 16 내지 청구항 20 중 어느 한 항에 따른 디코딩 장치
    를 포함하는, 코딩/디코딩 시스템.
KR1020167032571A 2014-06-26 2015-03-20 코딩/디코딩 방법, 장치 및 시스템 KR101906522B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410294752.3A CN105225671B (zh) 2014-06-26 2014-06-26 编解码方法、装置及系统
CN201410294752.3 2014-06-26
PCT/CN2015/074704 WO2015196835A1 (zh) 2014-06-26 2015-03-20 编解码方法、装置及系统

Publications (2)

Publication Number Publication Date
KR20160145799A true KR20160145799A (ko) 2016-12-20
KR101906522B1 KR101906522B1 (ko) 2018-10-10

Family

ID=54936715

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167032571A KR101906522B1 (ko) 2014-06-26 2015-03-20 코딩/디코딩 방법, 장치 및 시스템

Country Status (15)

Country Link
US (3) US9779747B2 (ko)
EP (2) EP3637416A1 (ko)
JP (1) JP6496328B2 (ko)
KR (1) KR101906522B1 (ko)
CN (2) CN105225671B (ko)
AU (1) AU2015281686B2 (ko)
BR (1) BR112016026440B8 (ko)
CA (1) CA2948410C (ko)
DE (2) DE202015009942U1 (ko)
HK (1) HK1219802A1 (ko)
MX (1) MX356315B (ko)
MY (1) MY173513A (ko)
RU (1) RU2644078C1 (ko)
SG (1) SG11201609523UA (ko)
WO (1) WO2015196835A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015018023B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema
CN105978540B (zh) * 2016-05-26 2018-09-18 英特格灵芯片(天津)有限公司 一种连续时间信号的去加重处理电路及其方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
JP6125031B2 (ja) * 2013-01-11 2017-05-10 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
US6912496B1 (en) * 1999-10-26 2005-06-28 Silicon Automation Systems Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US9886959B2 (en) * 2005-02-11 2018-02-06 Open Invention Network Llc Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100789368B1 (ko) * 2005-05-30 2007-12-28 한국전자통신연구원 잔차 신호 부호화 및 복호화 장치와 그 방법
WO2007040365A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
JP4850086B2 (ja) 2007-02-14 2012-01-11 パナソニック株式会社 Memsマイクロホン装置
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20110035212A1 (en) * 2007-08-27 2011-02-10 Telefonaktiebolaget L M Ericsson (Publ) Transform coding of speech and audio signals
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
US8457688B2 (en) * 2009-02-26 2013-06-04 Research In Motion Limited Mobile wireless communications device with voice alteration and related methods
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
PT2559028E (pt) 2010-04-14 2015-11-18 Voiceage Corp Livro de códigos de inovação combinados flexível e evolutivo a utilizar num codificador e descodificador celp
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
CN102800317B (zh) 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
FR2984580A1 (fr) 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
CN102737646A (zh) * 2012-06-21 2012-10-17 佛山市瀚芯电子科技有限公司 单一麦克风的实时动态语音降噪方法
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
JP6125031B2 (ja) * 2013-01-11 2017-05-10 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729. ITU-T Recommendation G.729.1. 2006.05. *
NAGEL Frederik, et al. A harmonic bandwidth extension method for audio codecs. IEEE International Conference on Acoustics, Speech and Signal Processing 2009(ICASSP 2009), 2009. pp.145-148. *

Also Published As

Publication number Publication date
EP3133600A1 (en) 2017-02-22
US10339945B2 (en) 2019-07-02
MX2016015526A (es) 2017-04-25
AU2015281686B2 (en) 2018-02-01
KR101906522B1 (ko) 2018-10-10
HK1219802A1 (zh) 2017-04-13
US20170372715A1 (en) 2017-12-28
MY173513A (en) 2020-01-30
CN106228991B (zh) 2019-08-20
DE202015009916U1 (de) 2021-08-04
EP3133600A4 (en) 2017-05-10
RU2644078C1 (ru) 2018-02-07
CN106228991A (zh) 2016-12-14
CN105225671A (zh) 2016-01-06
AU2015281686A1 (en) 2016-12-01
CA2948410A1 (en) 2015-12-30
JP6496328B2 (ja) 2019-04-03
BR112016026440A2 (ko) 2017-08-15
WO2015196835A1 (zh) 2015-12-30
DE202015009942U1 (de) 2021-10-01
US20190333528A1 (en) 2019-10-31
CA2948410C (en) 2018-09-04
CN105225671B (zh) 2016-10-26
MX356315B (es) 2018-05-23
BR112016026440B8 (pt) 2023-03-07
JP2017525992A (ja) 2017-09-07
BR112016026440B1 (pt) 2022-09-20
SG11201609523UA (en) 2016-12-29
US20170110137A1 (en) 2017-04-20
EP3133600B1 (en) 2019-08-28
EP3637416A1 (en) 2020-04-15
US10614822B2 (en) 2020-04-07
US9779747B2 (en) 2017-10-03

Similar Documents

Publication Publication Date Title
JP6076247B2 (ja) ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御
US10614822B2 (en) Coding/decoding method, apparatus, and system for audio signal
US8428957B2 (en) Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
RU2760485C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP5719941B2 (ja) オーディオ信号の効率的なエンコーディング/デコーディング
JP6559658B2 (ja) 低遅延符号化/復号のための音声信号のリサンプリング
EP2041745A1 (en) Adaptive encoding and decoding methods and apparatuses
WO2009029555A1 (en) Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
KR102156846B1 (ko) 디지털 오디오 신호 내의 프리-에코의 효과적인 감쇠
JP2016508618A (ja) 周波数領域におけるlpc系符号化のための低周波数エンファシス
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
KR102099293B1 (ko) 오디오 인코더 및 오디오 신호를 인코딩하는 방법
TWI540570B (zh) 用以處理編碼信號之裝置及方法和用以產生編碼信號之編碼器及方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant