KR20090036459A - 계층형 광대역 오디오 신호의 부호화 방법 및 장치 - Google Patents

계층형 광대역 오디오 신호의 부호화 방법 및 장치 Download PDF

Info

Publication number
KR20090036459A
KR20090036459A KR1020070101664A KR20070101664A KR20090036459A KR 20090036459 A KR20090036459 A KR 20090036459A KR 1020070101664 A KR1020070101664 A KR 1020070101664A KR 20070101664 A KR20070101664 A KR 20070101664A KR 20090036459 A KR20090036459 A KR 20090036459A
Authority
KR
South Korea
Prior art keywords
signal
encoding
base layer
voiced sound
result
Prior art date
Application number
KR1020070101664A
Other languages
English (en)
Other versions
KR101449431B1 (ko
Inventor
성호상
오은미
이강은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070101664A priority Critical patent/KR101449431B1/ko
Priority to US12/076,781 priority patent/US7974839B2/en
Publication of KR20090036459A publication Critical patent/KR20090036459A/ko
Application granted granted Critical
Publication of KR101449431B1 publication Critical patent/KR101449431B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 계층형 광대역 오디오 신호의 부호화 방법에 관한 것으로, 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 필터링된 신호를 변조하며, 변조된 신호를 시간 도메인에서 부호화하여 유성음 신호의 기본 계층의 부호화 결과를 출력하고, 변조된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하며, 에러 신호를 부호화하여 유성음 신호의 향상 계층의 부호화 결과를 출력함으로써, 적은 양의 비트로 기본 계층 및 향상 계층을 부호화하여 전체 유성음 신호의 음질을 향상시킬 수 있다.

Description

계층형 광대역 오디오 신호의 부호화 방법 및 장치{Method and apparatus for encoding scalable wideband audio signal}
본 발명은 오디오 신호의 부호화 방법 및 장치에 관한 것으로, 보다 상세하게는 계층형 광대역 오디오 신호의 부호화 방법 및 장치에 관한 것이다.
음성 통신의 응용 분야가 다양해지고 네트워크의 전송속도가 향상되면서 고품질의 음성 통신에 대한 필요성이 커지고 있다. 이에 따라 기존의 음성 통신 대역인 0.3kHz∼3.4kHz에 비해 자연성과 명료도 등 다양한 측면에서 우수한 성능을 갖는 0.05kHz∼7kHz의 대역폭을 갖는 광대역 음성 신호의 전달이 요구되고 있다.
또한 네트워크 측면에서, 데이터를 패킷 단위로 전송하는 패킷 스위칭 네트워크(packet switching network)는 채널의 정체 현상을 초래할 수 있고, 이로 인한 패킷 손실과 음질 저하가 발생될 수 있다. 이를 해결하기 위하여 손상된 패킷을 은닉하는 기술이 사용되고 있지만 이는 근본적인 처방이 될 수 없다.
따라서, 최근에는 광대역 음성 신호를 효과적으로 압축하면서 채널의 정체 현상을 해결할 수 있는 계층형 광대역 음성 부호화 기술에 대한 연구가 진행되고 있다.
도 1은 종래의 계층형 코덱의 일 예를 나타내는 블록도이다.
도 1을 참조하면, 계층형 코덱은 기본 계층 코덱(100), 감산기(110), 및 에러 신호 부호화부(120)를 포함한다.
기본 계층 코덱(100)는 입력 신호(IN)를 부호화하고, 부호화된 결과를 다시 복호화한다. 감산기(110)는 원 신호인 입력 신호(IN)에서 기본 계층 코덱(100)에서 출력된 결과를 뺀다. 에러 신호 부호화부(120)는 감산기(110)에서 출력된 결과인 에러 신호를 부호화한다. 이로써, 동일한 대역의 SNR(Signal to Noise Ratio)를 향상시킬 수 있다.
도 2는 종래의 계층형 코덱의 다른 예를 나타내는 블록도이다.
도 2를 참조하면, 계층형 코덱은 다운 샘플링부(200), 저주파수 밴드 코덱(210), 업샘플링부(220), 고주파수 밴드 복원부(230), 가산기(240), 감산기(250), 및 에러 신호 부호화부(260)를 포함한다.
다운 샘플링부(200)는 입력 신호(IN)를 다운 샘플링하여, 입력 신호(IN)의 대역보다 약간 낮은 대역을 신호를 핵심 계층 신호로 출력한다. 예를 들어, 입력 신호(IN)의 대역은 8kHz이고, 다운 샘플링된 신호의 대역은 6.4kHz일 수 있다. 저주파수 밴드 코덱(210)은 핵심 계층 신호인 다운 샘플링된 신호를 부호화하고, 부호화된 결과를 다시 복호화한다. 이러한, 저주파수 밴드 코덱(210)의 예로는 AMR-WB 코덱이 있다. 업샘플링부(220)는 저주파수 밴드 코덱(210)의 출력을 업샘플링한다. 고주파수 밴드 복원부(230)는 저주파수 밴드 코덱(210)에서 부호화되지 않는 대역의 신호를 복원한다. 가산기(240)는 업샘플링부(220)의 출력과 고주파수 밴드 복원부(230)의 출력을 더한다. 가산기(250)는 원 신호인 입력 신호(IN)에서 가산기(240)의 출력을 뺀다. 에러 신호 부호화부(260)는 가산기(250)의 출력인 에러 신호를 부호화한다. 이로써, 전체 합성된 신호의 SNR을 향상시킬 수 있다.
도 3은 종래의 계층형 코덱의 또 다른 예를 나타내는 블록도이다.
도 3을 참조하면, 계층형 코덱은 밴드 분할부(300), 저주파수 밴드 코덱(310), 고주파수 밴드 코덱(320), 제1 및 제2 감산기(330, 340), 및 에러 신호 부호화부(350)를 포함한다.
밴드 분할부(300)는 입력 신호(IN)의 주파수 대역을 동일하게 분할하여 저주파수 밴드 신호와 고주파수 밴드 신호를 출력한다. 저주파수 밴드 코덱(310)은 핵심 계층인 저주파수 밴드 신호를 부호화하고, 부호화된 결과를 복호화한다. 고주파수 밴드 코덱(320)은 고주파수 밴드 신호를 부호화하고, 부호화된 결과를 복호화한다. 이와 같이, 추가적으로 고주파수 밴드 신호를 부호화함으로써 음질이 향상될 수 있다. 제1 감산기(330)는 원래의 저주파수 밴드 신호에서 저주파수 밴드 코덱(310)에서 출력된 결과를 감산하고, 제2 감산기(340)는 원래의 고주파수 밴드 신호에서 고주파수 밴드 코덱(320)에서 출력된 결과를 감산한다. 에러 신호 부호화부(350)는 제1 및 제2 감산기(330, 340)에서 출력된 에러 신호를 부호화한다. 이로써, 전체 대역의 신호의 SNR을 향상시킬 수 있다.
본 발명이 해결하고자 하는 과제는 광대역 오디오 신호를 효과적으로 압축하여 기본 계층 및 향상 계층의 음질을 향상시킬 수 있는 계층형 광대역 오디오 신호의 부호화 방법, 계층형 광대역 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체, 및 계층형 광대역 오디오 신호의 부호화 장치를 제공하는데 있다.
상기 과제를 해결하기 위한 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 방법은 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 단계; 상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 단계; 상기 변조된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하는 단계; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 단계를 포함한다.
또한, 상기 과제는 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 단계; 상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 단계; 상기 변조된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하는 단계; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 단계를 포함하는 계층형 광대역 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 과제를 해결하기 위한 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부; 상기 필터링된 신호를 변조하는 신호 변조부; 상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부; 상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부; 상기 변조된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함한다.
또한, 상기 과제를 해결하기 위한 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 유성음 신호를 프리엠퍼시스(pre-emphasis) 필터링하는 필터링부; 상기 프리엠퍼시스 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부; 상기 필터링된 신호를 변조하는 신호 변조부; 상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부; 상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부; 상기 변조된 신호를 역 필터링하는 역필터링부; 상기 역필터링된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함한다.
또한, 상기 과제를 해결하기 위한 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 유성음 신호를 소정의 샘플링 레이트로 다운 샘플링하는 다운 샘플링부; 상기 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부; 상기 필터링된 신호를 변조하는 신호 변조부; 상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부; 상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부; 상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 대역만 통과시키는 밴드패스필터링부; 상기 변조된 신호를 원래의 샘플링 레이트로 업 샘플링하는 업 샘플링부; 상기 밴드패스필터링된 신호와 상기 업 샘플링된 신호를 가산하는 가산부; 상기 가산된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함한다.
또한, 상기 과제를 해결하기 위한 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 유성음 신호를 소정의 샘플링 레이트로 다운 샘플링하는 다운 샘플링부; 상기 다운 샘플링된 신호를 프리엠퍼시스 필터링하는 필터링부; 상기 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부; 상기 필터링된 신호를 변조하는 신호 변조부; 상기 변조된 신호를 계층형 CELP 방식으로 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과로써 기본 계층 인덱스 및 향상 계층 인덱스를 출력하는 계층형 CELP 부호화부; 상기 기본 계층 인덱스 및 상기 향상 계층 인덱스를 복호화하는 계층형 CELP 복호화부; 상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 대역만 통과시키는 밴드패스필터링부; 상기 변조된 신호를 역 필터링하는 역필터링부; 상기 역 필터링된 신호를 원래의 샘플링 레이트로 업 샘플링하는 업 샘플링부; 상기 업 샘플링된 신호 및 상기 밴드패스필터링된 신호를 가산하는 가산부; 상기 가산된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및 상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함한다.
본 발명에 따르면, 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 필터링된 신호를 변조하며, 변조된 신호를 시간 도메인에서 부호화하여 유성음 신호의 기본 계층의 부호화 결과를 출력하고, 변조된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하며, 에러 신호를 부호화하여 유성음 신호의 향상 계층의 부호화 결과를 출력함으로써, 적은 양의 비트로 기본 계층 및 향상 계층을 부호화하여 전체 유성음 신호의 음질을 향상시킬 수 있다.
다시 말해, 원래의 유성음 신호가 아닌 변조된 신호에서, 변조된 신호가 부호화/복호화된 신호를 감산하여 에러 신호를 생성함으로써, 에러 신호의 변동 폭이 크지 않게 된다. 따라서, 에러 신호의 다이나믹 영역(dynamic range)이 크지 않으 므로 에러 신호에 대한 부호화의 로드(load)가 크지 않아 적은 비트를 이용함에도 불구하고, 향상 계층의 음질 저하를 최소화할 수 있다. 이로써, 기본 계층 및 향상 계층을 포함한 전체 유성음 신호의 음질을 향상시켜, 전체적으로 광대역 오디오 신호의 부호화 장치의 음질을 향상시킬 수 있다.
본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 4는 본 발명의 일 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 4를 참조하면, 계층형 광대역 오디오 신호의 부호화 장치는 신호 분석부(Signal Analysis Unit, 400), 신호 변조부(Signal Modification Unit, 410), CELP(Code Excited Linear Prediction) 부호화부(CELP Encoding Unit, 420), CELP 복호화부(CELP Decoding Unit, 430), 후처리부(Post-processing Unit, 440), 감산기(450) 및 에러 신호 부호화부(Error Signal Encoding Unit, 460)를 포함한다.
신호 분석부(400)는 외부로부터 수신된 유성음 신호(IN)에 대하여 선형 예측 분석(Linear Prediction Analysis)을 수행하여 필터링한다. 보다 상세하게는, 신호 분석부(400)는 원래의 유성음 신호와 예측된 유성음 신호의 오차가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 선형 예측 필터의 계수에 따라 유성음 신호를 필터링한다.
여기서, 유성음 신호(IN)는 아날로그의 스피치 또는 오디오 신호를 디지털 신호로 변조한 PCM(Pulse Code Modulation) 신호로부터 추출될 수 있다. 본 발명의 다른 실시예에서, 유성음 신호(IN)는 PCM 신호로부터 추출된 정적인 유성음 신호(stationary voiced signal)일 수 있다.
도 4에는 도시되지 않았으나, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 신호 분리부(미도시)를 더 포함할 수 있다. 여기서, 신호 분리부는 PCM 신호를 유성음 신호 및 유성음을 제외한 신호로 분리할 수 있다. 또한, 신호 분리부는 PCM 신호를 정적인 유성음 신호 및 정적인 유성음을 제외한 신호로 분리할 수 있다.
신호 변조부(410)는 신호 분석부(400)에서 필터링된 신호를 변조한다. 이로써, CELP 부호화부(420)에서 부호화의 대상이 되는 신호가 수정된다. 보다 상세하게는, 신호 변조부(410)는 신호의 처리 단위인 프레임(frame)의 양쪽 경계인 에지(edge)에서 피치(pitch)를 구하고, 각 프레임의 양쪽 에지에서 구한 피치를 선형적으로 보간(interpolation)하여 프레임 내부의 피치를 구함으로써 필터링된 신호를 연속적이고 규칙적으로 변조한다. 이로써, 원래 입력된 신호의 피치가 약간 바뀔 수 있으나, 신호 변조부(410)는 원래 입력된 신호와 변조된 신호의 차이를 인간이 지각할 수 없도록 제한된 피치 변화의 범위에서 신호 분석부(400)에서 출력된 신호를 변조한다.
일반적으로 음성 신호의 피치라는 단어는 음성 신호 중에서 가장 기본이 되는 주파수, 즉, 시간 축에서 크게 나타나는 피크(peak)들의 주파수를 의미하며 성대의 주기적인 떨림에 의해서 생성된다. 피치는 인간의 청각에 매우 민감하게 반응하는 파라미터로써, 음성 신호의 화자를 구분하는데 사용될 수 있다. 그러므로, 정확한 피치 해석은 음성 합성의 음질을 좌우하는 중요한 요소이며, 음성 부호화에 있어서도 피치의 정확한 추출과 복원은 음질에 결정적인 역할을 한다.
보통 유성음 신호의 피치 주기는 연속적으로 서서히 변하는 경향이 있으므 로, 신호 변조부(410)는 매 프레임의 경계마다 피치를 한번씩 전송한 후, 각 프레임에 포함된 서브 프레임은 이전에 전송된 피치와 현재 전송된 피치를 선형적으로 보간하여 필터링된 신호를 연속적이고 규칙적인 신호로 변조한다. 이로써, 신호 변조부(410)에서 변조된 신호를 부호화하여, 피치 정보를 부호화하는데 할당되는 비트를 최소화할 수 있다.
다시 말해, 신호 변조부(410)에서 변조된 신호를 CELP 방식으로 부호화할 때, 피치 정보(구체적으로, 피치 이득과 피치 지연)를 부호화하는 적응 코드북(adaptive codebook)의 기여도를 높일 수 있으며, 고정 코드북(fixed codebook)에 할당되는 비트를 줄일 수 있으므로, 전체적으로 부호화에 할당되는 비트를 줄일 수 있다. 따라서, 신호 변조를 통하여 낮은 비트율에서 피치 정보에 사용되는 비트를 최소화시켜서 전체적으로 음질을 향상시킬 수 있다.
CELP 부호화부(420)는 신호 변조부(410)에서 변조된 신호를 CELP 방식으로 부호화하여 기본 계층의 부호화 결과(EN_1)를 출력한다. 구체적으로, CELP 부호화부(420)는 원래 유성음 신호를 부호화하는 대신에 신호 변조부(410)에서 변조된 신호를 부호화함으로써, 부호화의 대상이 되는 신호가 연속적이고 규칙적인 신호로 변조된다. 여기서, 기본 계층은 최소한의 음질을 복원할 수 있는 정보만을 나타낸다.
이 경우, CELP 부호화부(420)에서 변조된 신호를 부호화하는 방식으로 CELP 방식을 이용하는 것은 본 발명의 일 실시예임을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있다. 따라서, CELP 부호화부(420)는 시간 도 메인에서 부호화하는 다른 부호화 방식을 이용하여 변조된 신호를 부호화하여 기본 계층의 부호화 결과를 출력할 수 있다.
보다 상세하게는, CELP 부호화부(420)는 신호 분석부(400)에서 출력된 선형 예측 필터의 계수를 양자화하고, 변조된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 변조된 신호의 피치 성분을 부호화하여, 상기 양자화된 선형 예측 부호화의 계수 및 부호화된 피치 성분을 기본 계층의 부호화 결과(EN_1)로서 출력한다. 예를 들어, 부호화된 피치 성분은 적응 코드북의 검색 결과인 피치 이득(gain) 및 피치 지연(lag), 고정 코드북의 검색 결과인 인덱스(index) 및 게인 등을 포함할 수 있다.
CELP 복호화부(430)는 CELP 부호화부(420)에서 출력된 기본 계층의 부호화 결과를 합성한다. 보다 상세하게는, CELP 복호화부(430)는 양자화된 선형 예측 필터의 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터(pitch synthesis filter), 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터(formant synthesis filter)를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다.
후처리부(440)는 CELP 복호화부(430)에서 합성된 신호에 대하여 포먼트와 피치를 제외한 부분의 크기를 감소시키는 후처리를 수행한다. 예를 들어, 후처리부(440)는 CELP 복호화부(430)에서 합성된 신호에 대하여 포먼트와 피치 성분을 제외한 부분의 크기를 감소시키기 위한 필터링을 수행하는 포스트 필터(post filter) 등을 적용할 수 있다. 이 경우, 후처리부(440)에서 출력된 신호는 원래의 유성음 신호가 아니고, 원래의 유성음 신호가 왜곡된 신호이다.
감산기(450)는 신호 변조부(410)에서 변조된 신호(Modulated Signal, MS)와 후처리부(440)에서 출력된 신호의 차를 구하여 에러 신호로 출력한다. 다시 말해, 감산기(450)는 신호 변조부(410)에서 변조된 신호(MS)에서 후처리부(440)에서 출력된 신호를 감산하여 에러 신호로 출력한다. 이 경우, 감산기(450)는 원래의 유성음 신호 대신에 신호 변조부(410)에서 변조된 신호(MS)에서 후처리부(440)에서 출력된 신호를 감산함으로써, 에러 신호의 변동 폭이 줄어들게 되고, 이로써 에러 신호의 최강음과 최약음의 비인 다이나믹 영역(dynamic range)을 줄일 수 있다. 여기서, 다이나믹 영역은 음성 신호를 전송하거나 녹음할 때 최강음과 최약음의 비를 데시벨로 나타낸 것이다.
에러 신호 부호화부(460)는 감산기(450)에서 출력된 에러 신호를 부호화하여 향상 계층의 부호화 결과(EN_2)를 출력한다. 이 경우, 상술한 바와 같이 부호화 대상이 되는 에러 신호의 다이나믹 영역이 크지 않으므로, 에러 신호 부호화부(460)는 적은 양의 비트를 이용하여 에러 신호를 부호화할 수 있으므로 부호화의 효율을 향상시킬 수 있다. 여기서, 향상 계층은 음질을 향상시킬 수 있는 추가 정보를 나타낸다.
이로써, 복호화단에서는 기본 계층의 부호화 결과 및 향상 계층의 부호화 결과를 복호화함으로써 전체 음질이 향상될 수 있다.
도 5는 본 발명의 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 5를 참조하면, 계층형 광대역 오디오 신호의 부호화 장치는 필터링부(500), 신호 분석부(510), 신호 변조부(520), CELP 부호화부(530), CELP 복호화부(540), 후처리/역필터링부(550), 역필터링부(560), 감산기(570) 및 에러 신호 부호화부(580)를 포함한다.
필터링부(500)는 외부로부터 수신된 유성음 신호(IN)를 필터링한다. 여기서, 유성음 신호(IN)는 아날로그의 스피치 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호로부터 추출될 수 있다. 본 발명의 다른 실시예에서, 유성음 신호(IN)는 PCM 신호로부터 추출된 정적인 유성음 신호일 수 있다.
도 5에는 도시되지 않았으나, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 신호 분리부(미도시)를 더 포함할 수 있다. 여기서, 신호 분리부는 PCM 신호를 유성음 신호 및 유성음을 제외한 신호로 분리할 수 있다. 또한, 신호 분리부는 PCM 신호를 정적인 유성음 신호 및 정적인 유성음을 제외한 신호로 분리할 수 있다.
보다 상세하게는, 필터링부(500)는 유성음 신호(IN)에 대하여 프리엠퍼시스(pre-emphasis) 필터링을 수행할 수 있다. 여기서, 프리엠퍼시스 필터링은 SNR(Signal-to-Noise Ratio)의 향상을 위하여 전송로의 잡음 특성 등에 따라 미리 입력 신호를 왜곡하는 것을 나타낸다. 구체적으로, 필터링부(500)는 전 대역의 신호를 통과시키지만, 저주파수 밴드 신호 보다 고주파수 밴드 신호에 가중치를 두고 필터링을 수행한다. 이와 같이, 유성음 신호(IN)의 다이나믹 영역에 변화를 주어 저주파수 밴드 신호의 신호 레벨(예를 들어, 에너지, 진폭 등)을 줄여서 부호화에 할당되는 비트양을 줄일 수 있다.
신호 분석부(510)는 필터링부(500)에서 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링한다. 보다 상세하게는, 신호 분석부(510)는 원래의 유성음 신호와 예측된 유성음 신호의 오차가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 선형 예측 필터의 계수에 따라 필터링부(500)에서 필터링된 신호를 다시 필터링한다.
신호 변조부(520)는 신호 분석부(510)에서 필터링된 신호를 변조한다. 이로써, CELP 부호화부(530)에서 부호화의 대상이 되는 신호가 수정된다. 보다 상세하게는, 신호 변조부(520)는 신호의 처리 단위인 프레임의 양쪽 경계인 에지에서 피치를 구하고, 각 프레임의 양쪽 에지에서 구한 피치를 선형적으로 보간하여 프레임 내부의 피치를 구함으로써 필터링된 신호를 연속적이고 규칙적으로 변조한다. 이로써, 원래 입력된 신호의 피치가 약간 바뀔 수 있으나, 신호 변조부(520)는 원래 입력된 신호와 변조된 신호의 차이를 인간이 지각할 수 없도록 제한된 피치 변화의 범위에서 신호 분석부(510)에서 필터링된 신호를 변조한다.
보통 유성음 신호의 피치 주기는 연속적으로 서서히 변하는 경향이 있으므로, 신호 변조부(520)는 매 프레임의 경계마다 피치를 한번씩 전송한 후, 각 프레임에 포함된 부 프레임에서 이전에 전송된 피치와 현재 전송된 피치를 선형적으로 보간하여 필터링된 신호를 연속적이고 규칙적인 신호로 변조한다. 이로써, 신호 변조부(520)에서 변조된 신호를 부호화하여, 피치 정보를 부호화하는데 할당되는 비트를 최소화할 수 있다.
CELP 부호화부(530)는 신호 변조부(520)에서 변조된 신호를 CELP 방식으로 부호화하여 기본 계층의 부호화 결과(EN_1)를 출력한다. 구체적으로, CELP 부호화부(530)는 원래 유성음 신호를 부호화하는 대신에 신호 변조부(520)에서 변조된 신호를 부호화함으로써, 부호화의 대상이 되는 신호가 연속적이고 규칙적인 신호로 변조된다. 여기서, 기본 계층은 최소한의 음질을 복원할 수 있는 정보만을 나타낸다.
이 경우, CELP 부호화부(530)에서 변조된 신호를 부호화하는 방식으로 CELP 방식을 이용하는 것은 본 발명의 일 실시예임을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있다. CELP 부호화부(530)는 시간 도메인에서 부호화하는 다른 부호화 방식을 이용하여 변조된 신호를 부호화하여 기본 계층의 부호화 결과를 출력할 수 있다.
보다 상세하게는, CELP 부호화부(530)는 신호 분석부(510)에서 출력된 선형 예측 부호화의 계수를 양자화하고, 변조된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 변조된 신호의 피치 성분을 부호화하여, 상기 양자화된 선형 예측 부호화의 계수 및 부호화된 피치 성분을 기본 계층의 부호화 결과(EN_1)로서 출력한다. 예를 들어, 부호화된 피치 성분은 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인 등을 포함할 수 있다.
CELP 복호화부(540)는 CELP 부호화부(530)에서 출력된 기본 계층의 부호화 결과를 합성한다. 보다 상세하게는, CELP 복호화부(540)는 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다. 여기서, 향상 계층은 음질을 향상시킬 수 있는 추가 정보를 나타낸다.
후처리/역필터링부(550)는 CELP 복호화부(540)에서 합성된 신호에 대하여 포먼트와 피치를 제외한 부분의 크기를 감소시키는 후처리 및 역 필터링(inverse filtering)을 수행한다. 예를 들어, 후처리부(550)는 CELP 복호화부(540)에서 합성된 신호에 대하여 포스트 필터 등을 적용할 수 있다. 또한, 후처리부(550)는 유성음 신호(IN)가 필터링부(500)에서 필터링되었으므로, 이에 대응하는 역 필터링을 수행한다. 이 경우, 후처리부(550)에서 출력된 신호는 원래의 유성음 신호가 아니고, 원래의 유성음 신호가 왜곡된 신호이다.
역 필터링부(560)는 신호 변조부(520)에서 변조된 신호에 대하여 역 필터링을 수행한다. 입력된 유성음 신호(IN)는 필터링부(500)에서 필터링되었으므로, 이에 대응하는 역필터링이 수행될 필요가 있다.
감산기(570)는 역 필터링부(560)에서 역 필터링된 신호와 후처리/역필터링부(550)에서 출력된 신호의 차를 구하여 에러 신호로 출력한다. 다시 말해, 감산기(570)는 역 필터링부(560)에서 역필터링된 신호에서 후처리/역필터링부(550)에서 출력된 신호를 감산하여 에러 신호로 출력한다. 이 경우, 감산기(570)는 원래의 유성음 신호 대신에 신호 변조부(520)에서 변조된 신호에 대하여 역필터링이 수행된 신호에서 후처리/역필터링부(550)에서 출력된 신호를 감산함으로써, 에러 신호의 변동 폭이 줄어들게 되고, 이로써 에러 신호의 다이나믹 영역을 줄일 수 있다.
에러 신호 부호화부(580)는 감산기(570)에서 출력된 에러 신호를 부호화하고, 향상 계층의 부호화 결과(EN_2)를 출력한다. 이 경우, 상술한 바와 같이 부호화 대상이 되는 에러 신호의 다이나믹 영역이 크지 않으므로, 에러 신호 부호화부(580)는 적은 양의 비트를 이용하여 에러 신호를 부호화할 수 있으므로 부호화의 효율을 향상시킬 수 있다.
도 6은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 6을 참조하면, 계층형 광대역 오디오 신호의 부호화 장치는 다운 샘플링부(down-sampling unit, 600), 신호 분석부(610), 신호 변조부(620), CELP 부호화부(630), CELP 복호화부(640), 후처리부(650), 밴드패스필터링부(band pass filtering unit, 660), 업 샘플링부(up-sampling unit, 670), 가산부(680), 감산부(685) 및 에러 신호 부호화부(690)를 포함한다.
다운 샘플링부(600)는 외부로부터 수신된 유성음 신호(IN)를 다운 샘플링한다. 여기서, 유성음 신호(IN)는 아날로그의 스피치 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호로부터 추출될 수 있다. 본 발명의 다른 실시예에서, 유성음 신호(IN)는 PCM 신호로부터 추출된 정적인 유성음 신호일 수 있다.
도 6에는 도시되지 않았으나, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 신호 분리부(미도시)를 더 포함할 수 있다. 여기서, 신호 분리부는 PCM 신호를 유성음 신호 및 유성음을 제외한 신호로 분리할 수 있다. 또한, 신호 분리부는 PCM 신호를 정적인 유성음 신호 및 정적인 유성음을 제외한 신호로 분리 할 수 있다.
본 발명의 광대역 오디오 신호의 부호화 장치는 50Hz 내지 7kHz의 대역의 유성음 신호(IN)에 대한 부호화를 수행하는바, 유성음 신호(IN)의 샘플링 레이트(sampling rate)는 나이키스트(Nyquist) 이론에 따라 16kH일 수 있다. 여기서, 나이키스트 이론은 디지털 신호의 전송에서 부호 간 간섭을 방지하기 위하여 입력되는 신호의 최고 주파수의 2배 이상의 주파수에서 샘플링하는 것을 의미한다.
구체적으로, 다운 샘플링부(600)는 부호화의 효율을 향상시키기 위하여 유성음 신호(IN)의 샘플링 레이트를 16kHz에서 12.8kHz로 다운샘플링한다. 여기서, 다운샘플링은 신호의 샘플링 레이트를 감소시키는 것을 의미한다. 이로써, 다운샘플링부(300)에서 출력된 신호는 6.4kHz의 대역까지의 신호일 수 있다.
신호 분석부(610)는 다운 샘플링부(600)에서 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링한다. 보다 상세하게는, 신호 분석부(610)는 원래의 유성음 신호와 예측된 유성음 신호의 오차가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 선형 예측 필터의 계수에 따라 다운 샘플링부(600)에서 다운 샘플링된 신호를 필터링한다.
신호 변조부(620)는 신호 분석부(610)에서 필터링된 신호를 변조한다. 이로써, CELP 부호화부(630)에서 부호화의 대상이 되는 신호가 수정된다. 보다 상세하게는, 신호 변조부(620)는 신호의 처리 단위인 프레임의 양쪽 경계인 에지에서 피치를 구하고, 각 프레임의 양쪽 에지에서 구한 피치를 선형적으로 보간하여 프레임 내부의 피치를 구함으로써 필터링된 신호를 연속적이고 규칙적으로 변조한다. 이로 써, 원래 입력된 신호의 피치가 약간 바뀔 수 있으나, 신호 변조부(620)는 원래 입력된 신호와 변조된 신호의 차이를 인간이 지각할 수 없도록 제한된 피치 변화의 범위에서 신호 분석부(610)에서 필터링된 신호를 변조한다.
보통 유성음 신호의 피치 주기는 연속적으로 서서히 변하는 경향이 있으므로, 신호 변조부(620)는 매 프레임의 경계마다 피치를 한번씩 전송한 후, 각 프레임에 포함된 부 프레임에서 이전에 전송된 피치와 현재 전송된 피치를 선형적으로 보간하여 필터링된 신호를 연속적이고 규칙적인 신호로 변조한다. 이로써, 신호 변조부(620)에서 변조된 신호를 부호화하여, 피치 정보를 부호화하는데 할당되는 비트를 최소화할 수 있다.
CELP 부호화부(630)는 신호 변조부(620)에서 변조된 신호를 CELP 방식으로 부호화하여 기본 계층의 부호화 결과(EN_1)를 출력한다. 구체적으로, CELP 부호화부(630)는 원래 유성음 신호를 부호화하는 대신에 신호 변조부(620)에서 변조된 신호를 부호화함으로써, 부호화의 대상이 되는 신호가 연속적이고 규칙적인 신호로 변조된다. 여기서, 기본 계층은 최소한의 음질을 복원할 수 있는 정보만을 나타낸다.
이 경우, CELP 부호화부(630)에서 변조된 신호를 부호화하는 방식으로 CELP 방식을 이용하는 것은 본 발명의 일 실시예임을 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있다. CELP 부호화부(630)는 시간 도메인에서 부호화하는 다른 부호화 방식을 이용하여 변조된 신호를 부호화하여 기본 계층 코덱 인덱스를 출력할 수 있다. 여기서, 향상 계층은 음질을 향상시킬 수 있는 추가 정보를 나타낸다.
보다 상세하게는, CELP 부호화부(630)는 신호 분석부(610)에서 출력된 선형 예측 부호화의 계수를 양자화하고, 변조된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 변조된 신호의 피치 성분을 부호화하여, 상기 양자화된 선형 예측 부호화의 계수 및 부호화된 피치 성분을 기본 계층의 부호화 결과(EN_1)로서 출력한다. 예를 들어, 부호화된 피치 성분은 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인 등을 포함할 수 있다.
CELP 복호화부(640)는 CELP 부호화부(630)에서 출력된 기본 계층의 부호화 결과를 합성한다. 보다 상세하게는, CELP 복호화부(640)는 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다.
후처리부(650)는 CELP 복호화부(640)에서 합성된 신호에 대하여 포먼트와 피치를 제외한 부분의 크기를 감소시키는 후처리를 수행한다. 예를 들어, 후처리부(650)는 CELP 복호화부(640)에서 합성된 신호에 대하여 포스트 필터 등을 적용할 수 있다. 이 경우, 후처리부(650)에서 출력된 신호는 원래의 유성음 신호가 아니고, 원래의 유성음 신호가 왜곡된 신호이다.
밴드패스필터링부(660)는 유성음 신호(IN)를 수신하여 6.4 내지 7kHz의 대역의 신호만 필터링한다. 다운 샘플링부(600)는 6.4kH의 대역까지의 신호만을 출력하므로, 6.4kHz의 대역까지만 CELP 방식으로 부호화될 수 있다. 따라서, 입력된 유성 음 신호(IN) 중 6.4 내지 7kHz의 대역의 신호를 필터링한다.
업 샘플링부(670)는 신호 변조부(620)에서 변조된 신호를 원래 유성음 신호의 샘플링 레이트인 16kHz로 업 샘플링한다.
가산기(680)는 밴드패스필터링부(660)의 출력과 업 샘플링부(670)의 출력을 합한다. 이로써, 가산기(680)는 원래 유성음 신호(IN)와 마찬가지의 전 대역의 신호를 출력한다.
감산기(685)는 가산기(680)에서 출력된 신호와 후처리부(650)에서 출력된 신호의 차를 구하여 에러 신호로 출력한다. 다시 말해, 감산기(685)는 가산기(680)에서 출력된 신호에서 후처리부(650)에서 출력된 신호를 감산하여 에러 신호로 출력한다. 이 경우, 감산기(685)는 원래의 유성음 신호 대신에 신호 변조부(620)에서 변조된 신호 및 원래의 유성음 신호 중 변조되지 않은 대역의 신호가 가산된 신호에서 후처리부(650)에서 출력된 신호를 감산함으로써, 에러 신호의 변동 폭이 줄어들게 되고, 이로써 에러 신호의 다이나믹 영역을 줄일 수 있다.
에러 신호 부호화부(690)는 감산기(685)에서 출력된 에러 신호를 부호화하고, 향상 계층의 부호화 결과(EN_2)를 출력한다. 이 경우, 상술한 바와 같이 부호화 대상이 되는 에러 신호의 다이나믹 영역이 크지 않으므로, 에러 신호 부호화부(690)는 적은 양의 비트를 이용하여 에러 신호를 부호화할 수 있으므로 부호화의 효율을 향상시킬 수 있다.
도 7은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 7을 참조하면, 계층형 광대역 오디오 신호의 부호화 장치는 다운 샘플링부(700), 신호 분석부(710), 신호 변조부(720), 계층형(scalable) CELP 부호화부(730), 계층형 CELP 복호화부(740), 후처리부(750), 밴드패스필터링부(760), 업 샘플링부(770), 가산기(780), 감산기(785) 및 에러 신호 부호화부(790)를 포함한다.
다운 샘플링부(700)는 외부로부터 수신된 유성음 신호(IN)를 다운 샘플링한다. 여기서, 유성음 신호(IN)는 아날로그의 스피치 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호로부터 추출될 수 있다. 본 발명의 다른 실시예에서, 유성음 신호(IN)는 PCM 신호로부터 추출된 정적인 유성음 신호일 수 있다.
도 7에는 도시되지 않았으나, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 신호 분리부(미도시)를 더 포함할 수 있다. 여기서, 신호 분리부는 PCM 신호를 유성음 신호 및 유성음을 제외한 신호로 분리할 수 있다. 또한, 신호 분리부는 PCM 신호를 정적인 유성음 신호 및 정적인 유성음을 제외한 신호로 분리할 수 있다.
본 발명의 광대역 오디오 신호의 부호화 장치는 50Hz 내지 7kHz의 대역의 유성음 신호(IN)에 대한 부호화를 수행하는바, 유성음 신호(IN)의 샘플링 레이트는 나이키스트 이론에 따라 16kH일 수 있다. 여기서, 나이키스트 이론은 디지털 신호의 전송에서 부호 간 간섭을 방지하기 위하여 입력되는 신호의 최고 주파수의 2배 이상의 주파수에서 샘플링하는 것을 의미한다.
구체적으로, 다운 샘플링부(700)는 부호화의 효율을 향상시키기 위하여 유성 음 신호(IN)의 샘플링 레이트를 16kHz에서 12.8kHz로 다운 샘플링한다. 여기서, 다운샘플링은 신호의 샘플링 레이트를 감소시키는 것을 의미한다. 이로써, 다운 샘플링부(700)에서 출력된 신호는 6.4kHz의 대역까지의 신호일 수 있다.
신호 분석부(710)는 다운 샘플링부(700)에서 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링한다. 보다 상세하게는, 신호 분석부(710)는 원래의 유성음 신호와 예측된 유성음 신호의 오차가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 선형 예측 필터의 계수에 따라 다운 샘플링부(700)에서 다운 샘플링된 신호를 필터링한다.
신호 변조부(720)는 신호 분석부(710)에서 필터링된 신호를 변조한다. 이로써, 계층형 CELP 부호화부(730)에서 부호화의 대상이 되는 신호가 수정된다. 보다 상세하게는, 신호 변조부(720)는 신호의 처리 단위인 프레임의 양쪽 경계인 에지에서 피치를 구하고, 각 프레임의 양쪽 에지에서 구한 피치를 선형적으로 보간하여 프레임 내부의 피치를 구함으로써 필터링된 신호를 연속적이고 규칙적으로 변조한다. 이로써, 원래 입력된 신호의 피치가 약간 바뀔 수 있으나, 신호 변조부(720)는 원래 입력된 신호와 변조된 신호의 차이를 인간이 지각할 수 없도록 제한된 피치 변화의 범위에서 신호 분석부(710)에서 필터링된 신호를 변조한다.
보통 유성음 신호의 피치 주기는 연속적으로 서서히 변하는 경향이 있으므로, 신호 변조부(720)는 매 프레임의 경계마다 피치를 한번씩 전송한 후, 각 프레임에 포함된 부 프레임에서 이전에 전송된 피치와 현재 전송된 피치를 선형적으로 보간하여 필터링된 신호를 연속적이고 규칙적인 신호로 변조한다. 이로써, 신호 변 조부(720)에서 변조된 신호를 부호화하여, 피치 정보를 부호화하는데 할당되는 비트를 최소화할 수 있다.
계층형 CELP 부호화부(730)는 신호 변조부(720)에서 변조된 신호를 계층형 CELP 방식으로 부호화하여 기본 계층의 부호화 결과로서 기본 계층 인덱스(EN_1) 및 향상 계층 인덱스(EN_2)를 출력한다. 구체적으로, 계층형 CELP 부호화부(730)는 원래 유성음 신호를 부호화하는 대신에 신호 변조부(720)에서 변조된 신호를 부호화함으로써, 부호화의 대상이 되는 신호가 연속적이고 규칙적인 신호로 변조된다. 보다 상세하게는, 계층형 CELP 부호화부(730)는 부호화에 할당되는 비트양을 늘려서 입력되는 신호에 대한 부호화의 정확성을 향상시키기 위한 것으로, 변조된 신호를 계층형으로 부호화하여 기본 계층 인덱스(EN_1) 및 향상 계층 인덱스(EN_2)를 유성음 신호의 기본 계층의 부호화 결과로써 출력한다.
보다 상세하게는, 계층형 CELP 부호화부(730)는 신호 분석부(410)에서 출력된 선형 예측 부호화의 계수를 양자화하고, 변조된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 부호화하여, 기본 계층의 부호화 결과로써 기본 계층 인덱스(EN_1) 및 향상 계층 인덱스(EN_2)를 출력한다. 여기서, 기본 계층 인덱스(EN_1)는 양자화된 선형 예측 부호화 계수, 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인을 포함한다. 마찬가지로, 향상 계층 인덱스(EN_2)는 양자화된 선형 예측 부호화 계수, 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인을 포함한다.
계층형 CELP 복호화부(740)는 계층형 CELP 부호화부(730)에서 출력된 기본 계층 인덱스 및 향상 계층 인덱스를 합성한다. 보다 상세하게는, 계층형 CELP 복호화부(740)는 기본 계층 인덱스(EN_1)에 포함된 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다. 또한, 계층형 CELP 복호화부(740)는 향상 계층 인덱스(EN_2)에 포함된 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다.
후처리부(750)는 계층형 CELP 복호화부(740)에서 합성된 신호에 대하여 포먼트와 피치를 제외한 부분의 크기를 감소시키는 후처리를 수행한다. 예를 들어, 후처리부(750)는 계층형 CELP 복호화부(740)에서 합성된 신호에 대하여 포스트 필터 등을 적용할 수 있다. 이 경우, 후처리부(750)에서 출력된 신호는 원래의 유성음 신호가 아니고, 원래의 유성음 신호가 왜곡된 신호이다.
밴드패스필터링부(760)는 유성음 신호(IN)를 수신하여 6.4 내지 7kHz의 대역의 신호만 밴드패스필터링한다. 다운 샘플링부(700)는 6.4kH의 대역까지의 신호만을 출력하므로, 6.4kHz의 대역까지만 CELP 방식으로 부호화될 수 있다. 따라서, 입력된 유성음 신호(IN) 중 6.4 내지 7kHz의 대역의 신호를 필터링한다.
업 샘플링부(770)는 신호 변조부(720)에서 변조된 신호를 원래 유성음 신호 의 샘플링 레이트인 16kHz로 업 샘플링한다.
가산기(780)는 밴드패스필터링부(760)의 출력과 업 샘플링부(770)의 출력을 합한다. 이로써, 가산부(780)는 원래 유성음 신호(IN)와 마찬가지의 전 대역의 신호를 출력한다.
감산기(785)는 가산기(780)에서 출력된 신호와 후처리부(750)에서 출력된 신호의 차를 구하여 에러 신호로 출력한다. 다시 말해, 감산기(785)는 가산기(780)에서 출력된 신호에서 후처리부(750)에서 출력된 신호를 감산하여 에러 신호로 출력한다. 이 경우, 감산기(785)는 원래의 유성음 신호 대신에 신호 변조부(720)에서 변조된 신호 및 원래의 유성음 신호 중 변조되지 않은 대역의 신호가 가산된 신호에서 후처리부(750)에서 출력된 신호를 감산함으로써, 에러 신호의 변동 폭이 줄어들게 되고, 이로써 에러 신호의 다이나믹 영역을 줄일 수 있다.
에러 신호 부호화부(790)는 감산기(785)에서 출력된 에러 신호를 부호화하고, 향상 계층의 부호화 결과(EN_3)를 출력한다. 이 경우, 상술한 바와 같이 부호화 대상이 되는 에러 신호의 다이나믹 영역이 크지 않으므로, 에러 신호 부호화부(790)는 적은 양의 비트를 이용하여 에러 신호를 부호화할 수 있으므로 부호화의 효율을 향상시킬 수 있다.
도 8은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 8을 참조하면, 계층형 광대역 오디오 신호의 부호화 장치는 다운 샘플링부(800), 필터링부(810), 신호 분석부(820), 신호 변조부(830), 계층형 CELP 부호 화부(840), 계층형 CELP 복호화부(850), 후처리/역필터링부(860), 밴드패스필터링부(870), 역필터링부(874), 업 샘플링부(878), 가산기(880), 감산기(885) 및 에러 신호 부호화부(890)를 포함한다.
다운 샘플링부(800)는 외부로부터 수신된 유성음 신호(IN)를 다운 샘플링한다. 여기서, 유성음 신호(IN)는 아날로그의 스피치 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호로부터 추출될 수 있다. 본 발명의 다른 실시예에서, 유성음 신호(IN)는 PCM 신호로부터 추출된 정적인 유성음 신호일 수 있다.
도 8에는 도시되지 않았으나, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 장치는 신호 분리부(미도시)를 더 포함할 수 있다. 여기서, 신호 분리부는 PCM 신호를 유성음 신호 및 유성음을 제외한 신호로 분리할 수 있다. 또한, 신호 분리부는 PCM 신호를 정적인 유성음 신호 및 정적인 유성음을 제외한 신호로 분리할 수 있다.
본 발명의 광대역 오디오 신호의 부호화 장치는 50Hz 내지 7kHz의 대역의 유성음 신호(IN)에 대한 부호화를 수행하는바, 유성음 신호(IN)의 샘플링 레이트는 나이키스트 이론에 따라 16kH일 수 있다. 여기서, 나이키스트 이론은 디지털 신호의 전송에서 부호 간 간섭을 방지하기 위하여 입력되는 신호의 최고 주파수의 2배 이상의 주파수에서 샘플링하는 것을 의미한다.
구체적으로, 다운 샘플링부(800)는 부호화의 효율을 향상시키기 위하여 유성음 신호(IN)의 샘플링 레이트를 16kHz에서 12.8kHz로 다운 샘플링한다. 여기서, 다운샘플링은 신호의 샘플링 레이트를 감소시키는 것을 의미한다. 이로써, 다운샘플 링부(800)에서 출력된 신호는 6.4kHz의 대역까지의 신호일 수 있다.
필터링부(810)는 다운 샘플링부(800)에서 다운 샘플링된 신호를 필터링한다. 보다 상세하게는, 필터링부(810)는 다운 샘플링된 신호에 대하여 프리엠퍼시스(pre-emphasis) 필터링을 수행할 수 있다. 여기서, 프리엠퍼시스 필터링은 SNR의 향상을 위하여 전송로의 잡음 특성 등에 따라 미리 입력 신호를 왜곡하는 것을 나타낸다. 구체적으로, 필터링부(810)는 전 대역의 신호를 통과시키지만, 저주파수 밴드 신호 보다 고주파수 밴드 신호에 가중치를 두고 필터링을 수행한다. 이로써, 저주파수 밴드 신호의 신호 레벨(예를 들어, 에너지, 진폭 등)을 줄여서 부호화에 할당되는 비트양을 줄일 수 있다.
신호 분석부(820)는 필터링부(810)에서 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링한다. 보다 상세하게는, 신호 분석부(820)는 원래의 유성음 신호와 예측된 유성음 신호의 오차가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 선형 예측 필터의 계수에 따라 필터링부(810)에서 필터링된 신호를 다시 필터링한다.
신호 변조부(830)는 신호 분석부(820)에서 필터링된 신호를 변조한다. 이로써, 계층형 CELP 부호화부(840)에서 부호화의 대상이 되는 신호가 수정된다. 구체적으로, 신호 변조부(830)는 신호의 처리 단위인 프레임의 양쪽 경계인 에지에서 피치를 구하고, 각 프레임의 양쪽 에지에서 구한 피치를 선형적으로 보간하여 프레임 내부의 피치를 구함으로써 필터링된 신호를 연속적이고 규칙적으로 변조한다. 이로써, 원래 입력된 신호의 피치가 약간 바뀔 수 있으나, 신호 변조부(830)는 원 래 입력된 신호와 변조된 신호의 차이를 인간이 지각할 수 없도록 제한된 피치 변화의 범위에서 신호 분석부(820)에서 출력된 신호를 변조한다.
보통 유성음 신호의 피치 주기는 연속적으로 서서히 변하는 경향이 있으므로, 신호 변조부(830)는 매 프레임의 경계마다 피치를 한번씩 전송한 후, 각 프레임에 포함된 부 프레임에서 이전에 전송된 피치와 현재 전송된 피치를 선형적으로 보간하여 필터링된 신호를 연속적이고 규칙적인 신호로 변조한다. 이로써, 신호 변조부(830)에서 변조된 신호를 부호화하여, 피치 정보를 부호화하는데 할당되는 비트를 최소화할 수 있다.
계층형 CELP 부호화부(840)는 신호 변조부(830)에서 변조된 신호를 계층형 CELP 방식으로 부호화하여 기본 계층의 부호화 결과로서 기본 계층 인덱스(EN_1) 및 향상 계층 인덱스(EN_2)를 출력한다. 구체적으로, 계층형 CELP 부호화부(840)는 원래 유성음 신호를 부호화하는 대신에 신호 변조부(830)에서 변조된 신호를 부호화함으로써, 부호화의 대상이 되는 신호가 연속적이고 규칙적인 신호로 변조된다. 보다 상세하게는, 계층형 CELP 부호화부(840)는 부호화에 할당되는 비트양을 늘려서 입력되는 신호에 대한 부호화의 정확성을 향상시키기 위한 것으로, 변조된 신호를 계층형으로 부호화하여 기본 계층 인덱스(EN_1) 및 향상 계층 인덱스(EN_2)를 유성음 신호의 기본 계층의 부호화 결과로써 출력한다.
보다 상세하게는, 계층형 CELP 부호화부(840)는 신호 분석부(820)에서 출력된 선형 예측 부호화의 계수를 양자화하고, 변조된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 부호화하여, 기본 계층의 부호화 결과로써 기본 계층 인덱 스(EN_1) 및 향상 계층 인덱스(EN_2)를 출력한다. 여기서, 기본 계층 인덱스(EN_1)는 양자화된 선형 예측 부호화 계수, 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인을 포함한다. 마찬가지로, 향상 계층 인덱스(EN_2)는 양자화된 선형 예측 부호화 계수, 적응 코드북의 검색 결과인 피치 게인 및 피치 래그, 고정 코드북의 검색 결과인 인덱스 및 게인을 포함한다.
계층형 CELP 복호화부(850)는 계층형 CELP 부호화부(840)에서 출력된 기본 계층 인덱스 및 향상 계층 인덱스를 합성한다. 보다 상세하게는, 계층형 CELP 복호화부(850)는 기본 계층 인덱스(EN_1)에 포함된 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다. 또한, 계층형 CELP 복호화부(850)는 향상 계층 인덱스(EN_2)에 포함된 양자화된 선형 예측 부호화 계수를 역양자화하고, 부호화된 피치 성분을 합성하기 위한 피치 합성 필터, 및 합성된 피치 성분에 포먼트 성분을 합성하기 위한 포먼트 합성 필터를 이용하여 피치와 포먼트가 합성된 신호를 생성할 수 있다.
후처리/역필터링부(860)는 계층형 CELP 복호화부(850)에서 합성된 신호에 대하여 후처리 및 역 필터링을 수행한다. 예를 들어, 후처리/역필터링부(860)는 계층형 CELP 복호화부(850)에서 합성된 신호에 대하여 포스트 필터 등을 적용할 수 있다. 또한, 후처리/역필터링부(860)는 다운 샘플링된 신호가 필터링부(810)에서 필 터링되었으므로, 이에 대응하는 역필터링을 수행한다. 이 경우, 후처리/역필터링부(860)에서 출력된 신호는 원래의 유성음 신호가 아니고, 원래의 유성음 신호가 왜곡된 신호이다.
밴드패스필터링부(870)는 유성음 신호(IN)를 수신하여 6.4 내지 7kHz의 대역의 신호만 필터링한다. 다운 샘플링부(800)는 6.4kH의 대역까지의 신호만을 출력하므로, 6.4kHz의 대역까지만 CELP 방식으로 부호화될 수 있다. 따라서, 입력된 유성음 신호(IN) 중 6.4 내지 7kHz의 대역의 신호를 필터링한다.
역 필터링부(874)는 신호 변조부(830)에서 변조된 신호에 대하여 역 필터링을 수행한다. 다운 샘플링된 신호는 필터링부(810)에서 필터링되었으므로, 이에 대응하는 역 필터링이 수행될 필요가 있다.
업 샘플링부(878)는 역 필터링부(874)에서 역 필터링된 신호를 원래 유성음 신호의 샘플링 레이트인 16kHz로 업 샘플링한다.
가산기(880)는 밴드패스필터링부(860)의 출력과 업 샘플링부(878)의 출력을 합한다. 이로써, 가산부(880)는 원래 유성음 신호(IN)와 마찬가지의 전 대역의 신호를 출력한다.
감산기(885)는 가산기(880)에서 출력된 신호와 후처리/역필터링부(860)에서 출력된 신호의 차를 구하여 에러 신호로 출력한다. 다시 말해, 감산기(885)는 가산기(880)에서 출력된 신호에서 후처리/역필터링부(860)에서 출력된 신호를 감산하여 에러 신호로 출력한다. 이 경우, 감산기(885)는 원래의 유성음 신호 대신에 신호 변조부(830)에서 변조된 신호 및 원래의 유성음 신호 중 변조되지 않은 대역의 신 호가 가산된 신호에서 후처리/역필터링부(860)에서 출력된 신호를 감산함으로써, 에러 신호의 변동 폭이 줄어들게 되고, 이로써 에러 신호의 다이나믹 영역을 줄일 수 있다.
에러 신호 부호화부(890)는 감산기(885)에서 출력된 에러 신호를 부호화하고, 향상 계층의 부호화 결과(EN_3)를 출력한다. 이 경우, 상술한 바와 같이 부호화 대상이 되는 에러 신호의 다이나믹 영역이 크지 않으므로, 에러 신호 부호화부(890)는 적은 양의 비트를 이용하여 에러 신호를 부호화할 수 있으므로 부호화의 효율을 향상시킬 수 있다.
도 9는 본 발명의 일 실시예에 따른 계층형 광대역 오디오 신호의 부호화 방법을 나타나내는 흐름도이다.
도 9를 참조하면, 본 실시예에 따른 계층형 광대역 오디오 신호의 부호화 방법은 도 4에 도시된 계층형 광대역 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 4에 도시된 계층형 광대역 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 계층형 광대역 오디오 신호의 부호화 방법에도 적용된다.
900 단계에서 신호 분석부(400)는 외부로부터 수신된 유성음 신호(IN)에 대하여 선형 예측 분석을 수행하여 필터링하고, 신호 변조부(410)는 필터링된 신호를 변조한다. 본 발명의 다른 실시예는 900 단계에서 유성음 신호에 대하여 필터링을 수행하고, 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하며, 필터링된 신호를 변조할 수 있다. 본 발명의 또 다른 실시예는 900 단계에서 유성음 신호 를 다운 샘플링하고, 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하며, 필터링된 신호를 변조할 수 있다. 본 발명의 또 다른 실시예는 900 단계에서 유성음 신호를 다운 샘플링하고, 다운 샘플링된 신호를 필터링하며, 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 필터링된 신호를 변조할 수 있다.
910 단계에서 CELP 부호화부(420)는 변조된 신호를 시간 도메인에서 부호화하여 유성음 신호의 기본 계층의 부호화 결과를 출력한다. 이 경우, CELP 부호화부(420)는 변조된 신호를 CELP 방식으로 부호화할 수 있다. 본 발명의 다른 실시예는 910 단계에서 변조된 신호를 계층형 CELP 방식으로 부호화하여 기본 계층의 부호화 결과로서 기본 계층 인덱스 및 향상 계층 인덱스를 출력할 수 있다.
920 단계에서 감산부(450)는 변조된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력한다. 본 발명의 다른 실시예는 920 단계에서 변조된 신호에 대하여 역필터링을 수행하고, 역필터링된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력할 수 있다. 본 발명의 또 다른 실시예는 920 단계에서 유성음 신호의 소정의 주파수 대역만 밴드패스필터링하고, 변조된 신호를 업 샘플링하며, 밴드패스필터링된 신호와 업 샘플링된 신호를 가산하고, 가산된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력할 수 있다. 본 발명의 또 다른 실시예는 920 단계에서 유성음 신호의 소정의 주파수 대역만 밴드패스필터링하고, 변조된 신호에 대하여 역 필터링을 수행하며, 역 필터링된 신호를 업 샘플링하고, 밴드패스필터링된 신호와 업 샘플링된 신호를 가산하며, 가산된 신호에서 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력할 수 있다.
930 단계에서 에러 신호 부호화부(460)는 에러 신호를 부호화하여 유성음 신호의 향상 계층의 부호화 결과를 출력한다.
또한, 본 발명에 따른 계층형 광대역 오디오 신호의 부호화 방법은 기본 계층의 부호화 결과 및 향상 계층의 부호화 결과를 다중화하여 유성음 신호에 대한 부호화 결과로써 출력하는 단계를 더 포함할 수 있다.
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
도 1은 종래의 계층형 코덱의 일 예를 나타내는 블록도이다.
도 2는 종래의 계층형 코덱의 다른 예를 나타내는 블록도이다.
도 3은 종래의 계층형 코덱의 또 다른 예를 나타내는 블록도이다.
도 4는 본 발명의 일 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 5는 본 발명의 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 6은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 7은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 8은 본 발명의 또 다른 실시예에 따른 계층형 광대역 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 9는 본 발명의 일 실시예에 따른 계층형 광대역 오디오 신호의 부호화 방법을 나타나내는 흐름도이다.

Claims (21)

  1. 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 단계;
    상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 단계;
    상기 변조된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하는 단계; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 단계를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  2. 제1항에 있어서,
    상기 기본 계층의 부호화 결과 및 상기 향상 계층의 부호화 결과를 다중화하여 상기 유성음 신호에 대한 부호화 결과로써 출력하는 단계를 더 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  3. 제1항에 있어서,
    상기 기본 계층의 부호화 결과를 출력하는 단계는
    상기 변조된 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화 하여 기본 계층의 부호화 결과를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  4. 제1항에 있어서,
    상기 유성음 신호에 대하여 프리엠퍼시스(pre-emphasis) 필터링을 수행하는 단계를 더 포함하고,
    상기 필터링된 신호를 변조하는 단계는
    상기 프리엠퍼시스 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  5. 제4항에 있어서,
    상기 변조된 신호에 대하여 역필터링을 수행하는 단계를 더 포함하고,
    상기 에러 신호를 출력하는 단계는
    상기 역필터링된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 상기 에러 신호를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  6. 제1항에 있어서,
    상기 유성음 신호를 소정의 샘플링 레이트(sampling rate)로 다운 샘플링하 는 단계를 더 포함하고,
    상기 필터링된 신호를 변조하는 단계는
    상기 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  7. 제6항에 있어서,
    상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 주파수 대역만 밴드패스필터링하는 단계;
    상기 변조된 신호를 원래의 샘플링 레이트로 업 샘플링하는 단계; 및
    상기 밴드패스필터링된 신호와 상기 업 샘플링된 신호를 가산하는 단계를 더 포함하고,
    상기 에러 신호를 출력하는 단계는
    상기 가산된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 상기 에러 신호를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  8. 제6항에 있어서,
    상기 기본 계층의 부호화 결과를 출력하는 단계는
    상기 변조된 신호를 계층형 CELP 방식으로 부호화하여 상기 기본 계층의 부 호화 결과로써 기본 계층 인덱스 및 향상 계층 인덱스를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  9. 제1항에 있어서,
    상기 유성음 신호를 소정의 샘플링 레이트로 다운 샘플링하는 단계; 및
    상기 다운 샘플링된 신호를 프리엠퍼시스 필터링하는 단계를 더 포함하고,
    상기 필터링된 신호를 변조하는 단계는
    상기 프리엠퍼시스 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  10. 제9항에 있어서,
    상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 주파수 대역만 밴드패스필터링하는 단계;
    상기 변조된 신호에 대하여 역 필터링을 수행하는 단계;
    상기 역 필터링된 신호를 원래의 샘플링 레이트로 업 샘플링하는 단계; 및
    상기 밴드패스필터링된 신호와 상기 업 샘플링된 신호를 가산하는 단계를 더 포함하고,
    상기 에러 신호를 출력하는 단계는
    상기 가산된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감 산하여 상기 에러 신호를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  11. 제9항에 있어서,
    상기 기본 계층 코덱 인덱스를 출력하는 단계는
    상기 변조된 신호를 계층형 CELP 방식으로 부호화하여 상기 기본 계층의 부호화 결과로써 기본 계층 인덱스 및 향상 계층 인덱스를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  12. 제11항에 있어서,
    상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 주파수 대역만 밴드패스필터링하는 단계;
    상기 변조된 신호에 대하여 역 필터링을 수행하는 단계;
    상기 역 필터링된 신호를 원래의 샘플링 레이트로 업 샘플링하는 단계; 및
    상기 밴드패스필터링된 신호와 상기 업 샘플링된 신호를 가산하는 단계를 더 포함하고,
    상기 에러 신호를 출력하는 단계는
    상기 가산된 신호에서 상기 기본 계층 인덱스 및 상기 향상 계층 인덱스가 복호화된 신호를 감산하여 상기 에러 신호를 출력하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법.
  13. 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하고, 상기 필터링된 신호를 변조하는 단계;
    상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 단계;
    상기 변조된 신호에서 상기 기본 계층의 부호화 결과가 복호화된 신호를 감산하여 에러 신호를 출력하는 단계; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 단계를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  14. 유성음 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부;
    상기 필터링된 신호를 변조하는 신호 변조부;
    상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부;
    상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부;
    상기 변조된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과 를 출력하는 에러 신호 부호화부를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  15. 제14항에 있어서,
    상기 시간 도메인 부호화부는 상기 변조된 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 상기 기본 계층의 부호화 결과를 출력하고,
    상기 시간 도메인 복호화부는 상기 기본 계층의 부호화 결과를 CELP 방식으로 복호화하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  16. 제14항에 있어서,
    상기 기본 계층의 부호화 결과 및 상기 향상 계층의 부호화 결과를 다중화하여 비트스트림을 생성하는 다중화부를 더 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  17. 유성음 신호를 프리엠퍼시스(pre-emphasis) 필터링하는 필터링부;
    상기 프리엠퍼시스 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부;
    상기 필터링된 신호를 변조하는 신호 변조부;
    상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부;
    상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부;
    상기 변조된 신호를 역 필터링하는 역필터링부;
    상기 역필터링된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  18. 유성음 신호를 소정의 샘플링 레이트로 다운 샘플링하는 다운 샘플링부;
    상기 다운 샘플링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부;
    상기 필터링된 신호를 변조하는 신호 변조부;
    상기 변조된 신호를 시간 도메인에서 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과를 출력하는 시간 도메인 부호화부;
    상기 기본 계층의 부호화 결과를 시간 도메인에서 복호화하는 시간 도메인 복호화부;
    상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 대역만 통과시키는 밴드패스필터링부;
    상기 변조된 신호를 원래의 샘플링 레이트로 업 샘플링하는 업 샘플링부;
    상기 밴드패스필터링된 신호와 상기 업 샘플링된 신호를 가산하는 가산부;
    상기 가산된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과를 출력하는 에러 신호 부호화부를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  19. 제18항에 있어서,
    상기 시간 도메인 부호화부는 상기 변조된 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 상기 기본 계층의 부호화 결과를 출력하고,
    상기 시간 도메인 복호화부는 상기 기본 계층의 부호화 결과를 CELP 방식으로 복호화하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  20. 제18항에 있어서,
    상기 시간 도메인 복호화부는
    상기 변조된 신호를 계층형 CELP 방식으로 부호화하여 상기 기본 계층의 부호화 결과로써 기본 계층 인덱스 및 향상 계층 인덱스를 출력하고,
    상기 시간 도메인 복호화부는
    상기 기본 계층 인덱스 및 상기 향상 계층 인덱스를 복호화하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
  21. 유성음 신호를 소정의 샘플링 레이트로 다운 샘플링하는 다운 샘플링부;
    상기 다운 샘플링된 신호를 프리엠퍼시스 필터링하는 필터링부;
    상기 필터링된 신호에 대하여 선형 예측 분석을 수행하여 필터링하는 신호 분석부;
    상기 필터링된 신호를 변조하는 신호 변조부;
    상기 변조된 신호를 계층형 CELP 방식으로 부호화하여 상기 유성음 신호의 기본 계층의 부호화 결과로써 기본 계층 인덱스 및 향상 계층 인덱스를 출력하는 계층형 CELP 부호화부;
    상기 기본 계층 인덱스 및 상기 향상 계층 인덱스를 복호화하는 계층형 CELP 복호화부;
    상기 유성음 신호 중 상기 다운 샘플링된 신호의 주파수 대역을 제외한 소정의 대역만 통과시키는 밴드패스필터링부;
    상기 변조된 신호를 역 필터링하는 역필터링부;
    상기 역 필터링된 신호를 원래의 샘플링 레이트로 업 샘플링하는 업 샘플링부;
    상기 업 샘플링된 신호 및 상기 밴드패스필터링된 신호를 가산하는 가산부;
    상기 가산된 신호에서 상기 복호화된 신호를 감산하여 에러 신호를 출력하는 감산부; 및
    상기 에러 신호를 부호화하여 상기 유성음 신호의 향상 계층의 부호화 결과 를 출력하는 에러 신호 부호화부를 포함하는 것을 특징으로 하는 계층형 광대역 오디오 신호의 부호화 장치.
KR1020070101664A 2007-10-09 2007-10-09 계층형 광대역 오디오 신호의 부호화 방법 및 장치 KR101449431B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070101664A KR101449431B1 (ko) 2007-10-09 2007-10-09 계층형 광대역 오디오 신호의 부호화 방법 및 장치
US12/076,781 US7974839B2 (en) 2007-10-09 2008-03-21 Method, medium, and apparatus encoding scalable wideband audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070101664A KR101449431B1 (ko) 2007-10-09 2007-10-09 계층형 광대역 오디오 신호의 부호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090036459A true KR20090036459A (ko) 2009-04-14
KR101449431B1 KR101449431B1 (ko) 2014-10-14

Family

ID=40524021

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070101664A KR101449431B1 (ko) 2007-10-09 2007-10-09 계층형 광대역 오디오 신호의 부호화 방법 및 장치

Country Status (2)

Country Link
US (1) US7974839B2 (ko)
KR (1) KR101449431B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249783A1 (en) * 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
CN101771417B (zh) 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
CN106297813A (zh) * 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
KR20040058855A (ko) * 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
ATE368279T1 (de) * 2003-05-01 2007-08-15 Nokia Corp Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법

Also Published As

Publication number Publication date
KR101449431B1 (ko) 2014-10-14
US20090094023A1 (en) 2009-04-09
US7974839B2 (en) 2011-07-05

Similar Documents

Publication Publication Date Title
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
US8260620B2 (en) Device for perceptual weighting in audio encoding/decoding
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
CA2483791C (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
EP2056294B1 (en) Apparatus, Medium and Method to Encode and Decode High Frequency Signal
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
RU2584463C2 (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
KR101393298B1 (ko) 적응적 부호화/복호화 방법 및 장치
KR100813259B1 (ko) 입력신호의 계층적 부호화/복호화 장치 및 방법
JP6486962B2 (ja) 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器
US9177569B2 (en) Apparatus, medium and method to encode and decode high frequency signal
KR101449431B1 (ko) 계층형 광대역 오디오 신호의 부호화 방법 및 장치
US8571852B2 (en) Postfilter for layered codecs
KR100682966B1 (ko) 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
KR19980036961A (ko) 음성 부호화 및 복호화 장치와 그 방법
KR19980036962A (ko) 음성 부호화 및 복호화 장치와 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee