KR100935961B1 - 부호화 장치 및 복호화 장치 - Google Patents

부호화 장치 및 복호화 장치 Download PDF

Info

Publication number
KR100935961B1
KR100935961B1 KR1020037008615A KR20037008615A KR100935961B1 KR 100935961 B1 KR100935961 B1 KR 100935961B1 KR 1020037008615 A KR1020037008615 A KR 1020037008615A KR 20037008615 A KR20037008615 A KR 20037008615A KR 100935961 B1 KR100935961 B1 KR 100935961B1
Authority
KR
South Korea
Prior art keywords
frequency spectrum
spectrum
parameter
high frequency
partial
Prior art date
Application number
KR1020037008615A
Other languages
English (en)
Other versions
KR20040063076A (ko
Inventor
츠시마미네오
노리마츠다케시
니시오고스케
다나카나오야
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20040063076A publication Critical patent/KR20040063076A/ko
Application granted granted Critical
Publication of KR100935961B1 publication Critical patent/KR100935961B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Abstract

부호화 장치(200)는 시간 영역의 입력 신호를 저주파 스펙트럼을 포함하는 주파수 스펙트럼으로 변환하는 MDCT부(202), 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 확장 데이터를 생성하는 BWE 부호화부(204), 및 MDCT부(202)에 의해 얻어진 저주파 스펙트럼 및 BWE 부호화부(204)에 의해 얻어진 확장 데이터를 부호화하여 출력하는 부호화 데이터 스트림 생성부(205)를 구비한다. BWE 부호화부(204)는 확장 데이터로서 (i) MDCT부(202)에 의해 얻어진 저주파 스펙트럼을 형성하는 다수의 하위 부대역 중 고주파 스펙트럼으로서 복제되는 하위 부대역을 지정하는 제1 파라미터, 및 (ii) 복제된 후의 상기 하위 부대역의 게인을 지정하는 제2 파라미터를 생성한다.

Description

부호화 장치 및 복호화 장치{ENCODING DEVICE AND DECODING DEVICE}
본 발명은 직교 변환 등의 방법을 이용하여 음성이나 음악신호 등의 오디오 신호를 시간 영역에서 주파수 영역으로 변환함으로써 얻어진 신호를, 보다 적은 양의 부호화 비트 스트림으로 부호화함으로써 데이터를 압축하는 부호화 장치와, 부호화 데이터 스트림의 수신 시에 데이터를 신장하는 복호화 장치에 관한 것이다.
오디오 신호의 부호화 및 복호화 방법은 현재까지 굉장히 많이 개발되었다. 특히 요즈음에는, ISO/IEC에서 국제 표준화된 IS13818-7이 공지되어, 고효율로 고음질의 재생을 위한 부호화 방법으로서 높이 평가되고 있다. 이 부호화 방식은 AAC라 한다. 근래에, 이 AAC가 MPEG4라 불리는 표준에 채용되어, 상기 IS13818-7에 몇 개의 확장 기능을 추가로 구비한 MPEG4-AAC라 불리는 방식이 개발되었다. 부호화 과정의 일례가 MPEG4-AAC의 유익한 부분에 기술되어 있다.
다음은 도 1을 참조하여, 종래의 방법을 이용한 오디오 부호화 장치에 관해 설명한다. 도 1은 종래의 부호화 장치(100)의 구조를 나타내는 블록도이다. 이 부호화 장치(100)는 스펙트럼 증폭부(101), 스펙트럼 양자화부(102), 호프만 부호화부(103) 및 부호화 데이터 스트림 전송부(104)를 포함한다. 아날로그 오디오 신호를 고정 주파수로 표본화하여 얻어진 오디오 이산 신호 스트림은, 일정한 시간 간격으로 일정한 수의 샘플로 분할되고, 도시하지 않은 시간-주파수 변환부에 의해 주파수 영역의 데이터로 변환되어, 부호화 장치(100)의 입력 신호로서 스펙트럼 증폭부(101)에 송신된다. 스펙트럼 증폭부(101)는 미리 정해진 대역마다 어떤 하나의 게인을 갖는 이 미리 정해진 대역에 포함되는 스펙트럼을 증폭한다. 스펙트럼 양자화부(102)는 증폭된 스펙트럼을 미리 정해진 변환식으로 양자화한다. AAC 방식의 경우에는, 부동소수로 표현된 주파수 스펙트럼 데이터를 정수값으로 반올림함으로써 양자화가 행해진다. 호프만 부호화부(103)는 양자화된 스펙트럼 데이터를 몇 개의 그룹으로 호프만 부호화하고, 스펙트럼 증폭부(101)에서 미리 정해진 대역마다의 게인과, 양자화를 위한 변환식을 지정하는 데이터를 호프만 부호화하여, 그 부호들을 부호화 데이터 스트림 전송부(104)에 보낸다. 호프만 부호화된 부호화 데이터 스트림은 전송로나 기록매체를 통해 부호화 데이터 스트림 전송부(104)에서 복호화장치로 전송되어, 복호화 장치에 의해 시간 영역의 오디오 신호로 복원된다. 종래의 부호화 장치는 상술한 바와 같이 동작한다.
종래의 부호화 장치(100)에서는, 데이터량의 압축능력이 호프만 부호화부(103)의 성능에 달려있어, 높은 압축률, 요컨대, 적은 데이터량으로 부호화가 행해질 때는, 스펙트럼 증폭부(101)에서 게인을 충분히 낮추어, 스펙트럼 양자화부(102)에 의해 얻어지는 양자화 스펙트럼 스트림을 호프만 부호화부(103)에서 데이터 사이즈가 작아지도록 부호화해야 한다. 그러나, 이 방법에 의해 데이터량을 줄이는 부호화가 행해지면, 음성 및 음악의 재생 대역이 좁아지게 된다. 그래서, 청음 시에 음이 탁해지는 것을 부정할 수 없다. 그 결과, 음질을 유지할 수 없는 문제가 생긴다.
본 발명의 목적은, 상술한 문제점에 비추어서, 높은 압축률로 오디오 신호를 부호화할 수 있는 부호화 장치, 및 부호화 오디오 신호를 복호화하여 광대역 주파수 스펙트럼 데이터 및 광대역 오디오 신호를 재생할 수 있는 복호화 장치를 제공하는 것이다.
상기 문제를 해결하기 위해, 본 발명에 의한 부호화 장치는 입력 신호를 부호화하는 부호화 장치로서, 시간 영역의 입력 신호를 저주파 스펙트럼을 포함하는 주파수 스펙트럼으로 변환하는 시간-주파수 변환부; 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 확장 데이터를 생성하는 대역 확장부; 및 상기 저주파 스펙트럼 및 상기 확장 데이터를 부호화하여, 그 부호화된 저주파 스펙트럼 및 확장 데이터를 출력하는 부호화부를 구비하며, 상기 대역 확장부는 상기 확장 데이터로서 제1 파라미터 및 제2 파라미터를 생성하고, 상기 제1 파라미터는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 고주파 스펙트럼으로서 복제할 부분 스펙트럼을 지정하고, 상기 제2 파라미터는 복제된 후의 상기 부분 스펙트럼의 게인을 지정한다.
상술한 바와 같이, 본 발명의 부호화 장치는 낮은 비트 레이트로 광대역의 오디오 부호화 데이터 스트림의 제공을 가능하게 한다. 저주파 성분에 관해서, 본 발명의 부호화 장치는 호프만 부호화법 등의 압축 기술을 이용하여 그 스펙트럼을 부호화한다. 한편, 고주파 성분에 관해서는, 그 스펙트럼을 부호화하는 것이 아니 라, 주로 고주파 스펙트럼을 치환하는 저주파 스펙트럼을 복제한 데이터만을 부호화한다. 따라서, 고주파 성분을 나타내는 부호화 데이터 스트림에 의해 소비되는 데이터량이 감소될 수 있는 효과가 있다.
또한, 본 발명의 복호화 장치는 부호화 신호를 복호화하는 복호화 장치로서, 상기 부호화 신호는 저주파 스펙트럼 및 확장 데이터를 포함하고, 상기 확장 데이터는 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 제1 및 제2 파라미터를 포함하며, 상기 복호화 장치는, 상기 부호화 신호를 복호화함으로써 상기 저주파 스펙트럼 및 상기 확장 데이터를 생성하는 복호화부; 상기 저주파 스펙트럼, 제1 파라미터 및 제2 파라미터로부터 상기 고주파 스펙트럼을 생성하는 대역 확장부; 및 상기 생성된 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환하는 주파수-시간 변환부를 구비하며, 상기 대역 확장부는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 제1 파라미터에 의해 지정된 부분 스펙트럼을 복제하고, 복제된 후의 상기 부분 스펙트럼의 게인을 상기 제2 파라미터에 따라 결정하여, 상기 얻어진 부분 스펙트럼을 상기 고주파 스펙트럼으로서 생성한다.
본 발명의 복호화 장치에 의하면, 저주파 성분의 사본에 적합한 게인 조정 등의 조작을 부가함으로써 고주파 성분이 생성되기 때문에, 적은 양의 데이터를 갖는 부호화 데이터 스트림으로부터 광대역 음성이 재생될 수 있는 효과가 있다.
또한, 상기 대역 확장부는 생성된 고주파 스펙트럼에 노이즈 스펙트럼을 가산할 수도 있고, 상기 주파수-시간 변환부는 상기 노이즈 스펙트럼이 가산된 상기 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환할 수도 있다.
본 발명의 복호화 장치에 의하면, 고주파 스펙트럼에 노이즈 스펙트럼을 가산함으로써, 복제된 저주파 성분에 게인 조정이 행해지기 때문에, 고주파 스펙트럼의 음조를 극단적으로 높이지 않고 주파수 대역을 확장할 수 있는 효과가 있다.
도 1은 종래의 부호화 장치의 구성을 나타내는 블록도,
도 2는 본 발명의 제1 실시형태에 따른 부호화 장치의 구성을 나타내는 블록도,
도 3a는 MDCT부에 의해 출력된 MDCT 계수 열을 나타내는 도면,
도 3b는 도 3a에 나타낸 MDCT 계수 중 0번째∼(maxline - 1)번째의 MDCT 계수를 나타내는 도면,
도 3c는 도 2에 나타낸 BWE 부호화부에서의 확장 오디오 부호화 데이터 스트림 생성 방법의 일례를 나타내는 도면,
도 4a는 원음의 MDCT 계수 열을 나타내는 파형도,
도 4b는 BWE 부호화부에 의한 치환에 의해 생성된 MDCT 계수 열을 나타내는 파형도,
도 4c는 도 4b에 나타낸 MDCT 계수 열에 게인 제어가 일어날 때 생성되는 MDCT 계수 열을 나타내는 파형도,
도 5a는 통상의 오디오 부호화 비트 스트림의 일례를 나타내는 도면,
도 5b는 본 실시형태에 따른 부호화 장치에 의해 출력된 오디오 부호화 비트 스트림의 일례를 나타내는 도면,
도 5c는 도 5b에 나타낸 확장 오디오 부호화 데이터 스트림에 기술된 확장 오디오 부호화 데이터 스트림의 일례를 나타내는 도면,
도 6은 도 2에 나타낸 부호화 장치로부터 출력된 오디오 부호화 비트 스트림을 복호화하는 복호화 장치의 구성을 나타내는 블록도,
도 7은 제2 실시형태의 BWE 부호화부에서의 확장 주파수 스펙트럼 데이터 생성 방법을 나타내는 도면,
도 8a는 제2 실시형태와 동일한 방식으로 분할된 하위 및 상위 부대역을 나타내는 도면,
도 8b는 하위 부대역(A)에서의 MDCT 계수열의 일례를 나타내는 도면,
도 8c는 하위 부대역(A)에서의 MDCT 계수의 순서를 반전함으로써 얻어진 부대역(As)에서의 MDCT 계수열의 일례를 나타내는 도면,
도 8d는 하위 부대역(A)에서의 MDCT 계수의 부호를 반전함으로써 얻어진 부대역(Ar)을 나타내는 도면,
도 9a는 상위 부대역(h0)에 지정된 하위 부대역(A)에서의 MDCT 계수의 일례를 나타내는 도면,
도 9b는 노이즈 생성부에 의해 생성된 하위 부대역(A)에서와 동일한 수의 MDCT 계수의 일례를 나타내는 도면,
도 9c는 도 9a에 나타낸 하위 부대역(A)에서의 MDCT 계수 및 도 9b에 나타낸 노이즈 생성부에 의해 생성된 MDCT 계수에 의해 생성되어, 상위 부대역(h0)을 치환하는 MDCT 계수의 일례를 나타내는 도면,
도 10a는 시간(t0)에서의 한 프레임의 MDCT 계수를 나타내는 도면,
도 10b는 시간(t1)에서의 다음 프레임의 MDCT 계수를 나타내는 도면,
도 10c는 시간(t2)에서의 그 다음 프레임의 MDCT 계수를 나타내는 도면,
도 11a는 시간(t0)에서의 한 프레임의 MDCT 계수를 나타내는 도면,
도 11b는 시간(t1)에서의 다음 프레임의 MDCT 계수를 나타내는 도면,
도 11c는 시간(t2)에서의 그 다음 프레임의 MDCT 계수를 나타내는 도면,
도 12는 QMF 필터를 이용하여 부호화된 오디오 부호화 비트 스트림으로부터 광대역 시간-주파수 신호를 복호화하는 복호화 장치의 구성을 나타내는 블록도,
도 13은 제6 실시형태의 복호화 장치에 의해 복호화된 시간-주파수 신호의 일례를 나타내는 도면이다.
이하, 본 발명의 실시형태에 따른 부호화 장치 및 복호화 장치에 관해, 도면(도 2∼도 13)을 참조하여 설명한다.
(제1 실시형태)
우선, 부호화 장치를 설명한다. 도 2는 본 발명의 제1 실시형태에 따른 복호화 장치(200)의 구성을 나타내는 블록도이다. 부호화 장치(200)는, 저역 스펙트럼을 고정 주파수 대역폭의 부대역으로 분할하여, 그 안에 포함된 고주파 대역에 복제되어야 하는 부대역을 지정하는 데이터를 포함한 오디오 부호화 비트 스트림을 출력하는 장치이다. 부호화 장치(200)는 전처리부(201), MDCT부(202), 양자화부(203), BWE 부호화부(204) 및 부호화 데이터 스트림 생성부(205)를 구비한다. 전처리부(201)는 입력된 오디오 신호가, 부호화 및/또는 복호화에 따른 양자화 왜곡에 의한 음질 변화를 고려하여, 시간 분해능에 보다 높은 우선권을 부여하는 2,048 샘플보다 적은 프레임마다(SHORT 윈도우) 양자화되어야 하는지, 또는 2,048 샘플(LONG 윈도우)마다 양자화되어야 하는지를 판정한다. MDCT부(202)는 전처리부(201)에서 출력된 시간 영역의 오디오 이산 신호 스트림을 변형 이산 코사인 변환(MDCT)으로 변환하여, 주파수 영역의 주파수 스펙트럼을 출력한다. 양자화부(203)는 MDCT부(202)에서 출력된 주파수 스펙트럼의 저주파 대역을 양자화하여, 호프만 부호화한 뒤 출력한다. BWE 부호화부(204)는, MDCT부(202)에 의해 얻어진 MDCT 계수를 수신하면, 수신한 스펙트럼 중 저역 스펙트럼을 고정 주파수 대역폭을 갖는 부대역으로 분할하고, MDCT부(202)로부터 출력된 고역 스펙트럼에 기초하여, 고역 스펙트럼을 치환하여 고주파 대역에 복제되어야 하는 하위 부대역을 지정한다. BWE 부호화부(204)는 상위 부대역마다 지정된 하위 부대역을 나타내는 확장 주파수 스펙트럼 데이터를 생성하고, 생성된 확장 주파수 스펙트럼 데이터를 필요에 따라 양자화하여, 호프만 부호화함으로써 확장 오디오 데이터 스트림을 출력한다. 부호화 데이터 스트림 생성부(205)는 양자화부(203)에서 출력된 저역 오디오 데이터 스트림과 BWE 부호화부(204)에서 출력된 확장 오디오 부호화 데이터 스트림을 AAC 표준 하에 규정된 오디오 부호화 비트 스트림의 오디오 부호화 데이 터 스트림 섹션 및 확장 오디오 부호화 데이터 스트림 섹션에 각각 기록하여, 이들을 외부에 출력한다.
이하, 상기와 같이 구성된 부호화 장치(200)의 동작을 설명한다. 우선, 예를 들어 44.1㎑의 표본화 주파수로 표본화된 오디오 이산 신호 스트림이 2,048 샘플을 포함하는 프레임마다 전처리부(201)에 입력된다. 한 프레임 내의 오디오 신호는 2,048 샘플로 한정되는 것은 아니고, 후술하는 복호화 장치의 설명을 쉽게 하기 위해 다음 설명에서는 2,048 샘플의 경우를 예로 한다. 전처리부(201)는 입력된 오디오 신호에 기초하여, 그 입력된 오디오 신호가 LONG 윈도우로 부호화되어야 하는지, SHORT 윈도우로 부호화되어야 하는지를 판정한다. 이하, 전처리부(201)가 오디오 신호를 LONG 윈도우로 부호화한다고 판정한 경우에 관해 설명한다.
전처리부(201)에서 출력된 오디오 이산 신호 스트림은 일정 간격으로 시간 영역의 이산 신호로부터 주파수 스펙트럼 데이터로 변환되어 출력된다. MDCT는 시간-주파수 변환에 공통이다. 간격으로는 128, 256, 512, 1,024, 2,048 샘플 중 어느 것이나 이용된다. MDCT에서, 시간 영역의 이산 신호의 샘플 수는 변환된 주파수 스펙트럼 데이터의 샘플 수와 동일할 수도 있다. MDCT는 당업자에게 잘 알려진 기술이다. 여기서는, 전처리부(201)에서 출력된 2,048 샘플의 오디오 신호가 MDCT부(202)에 입력되어 MDCT가 행해진다는 가정 아래 설명한다. 또한, MDCT부(202)는 과거 프레임(2,048 샘플)과 새롭게 입력된 프레임(2,048 샘플)을 이용해 MDCT를 행하여 2,048 샘플의 MDCT 계수를 출력한다. MDCT는 일반적으로 식 1 등으로 주어진다.
<식 1>
Figure 112003022778711-pct00001
Zi,n: 윈도우에 위치된 입력 오디오 샘플
n: 샘플 색인
k: MDCT 계수의 색인
i: 프레임 번호
N: 윈도우 길이
n0=(N/2+1)/2
일반적으로, 부호화 처리에서는, 상기와 같이 얻어진 주파수 스펙트럼 데이터를 완전 가역, 또는 데이터 압축에 상당하는 호프만 부호화 등의 비가역 부호로 표현하여, 부호화 데이터 스트림을 생성한다. 여기서, 저주파 성분에서 고주파 성분으로의 주파수 순서로 정렬된 2,048 샘플의 MDCT 계수 중 절반인, 0번째∼1,023번째의 저역 MDCT 계수는 양자화부(203)에 입력된다. 양자화부(203)는 입력된 MDCT 계수를 AAC 방식 등의 양자화 방법을 이용해 양자화하여, 저역 오디오 부호화 데이터 스트림을 생성한다. 일반적으로 AAC 등의 양자화 방법에서는, 양자화되는 MDCT 계수의 수가 한정되지 않는다. 따라서, 양자화부(203)는 입력된 저역 MDCT 계수를 모두 양자화할 수도 있고, 그중 일부를 양자화할 수도 있다. 여기서, 양자화부(203)는 MDCT 계수 중 0번째∼(maxline - 1)번째의 "maxline"의 계수를 양자화하여 부호화한다. 여기서, "maxline"은 종래의 부호화 장치에 의해 양자화되어 복 호화되는 MDCT 계수의 주파수 상한이다. 한편, MDCT부(202)에서 출력된 모든 MDCT 계수(2,048 계수)는 BWE 부호화부(204)에 입력된다.
도 2에 나타낸 BWE 부호화부(204)에서 확장 오디오 부호화 데이터 스트림을 생성하는 처리에 관해 도 3a∼3c를 참조하여 보다 상세히 설명한다. 도 3a는 MDCT부(202)에 의해 출력되는 MDCT 계수 열을 나타내는 도면이다. 도 3b는 도 3a에 나타낸 MDCT 계수 중, 양자화부(203)에 의해 부호화되는 0번째∼(maxline - 1)번째의 MDCT 계수를 나타낸다. 도 3c는 도 2에 나타낸 BWE 부호화부(204)에서 확장 오디오 부호화 데이터 스트림을 생성하는 방법의 일례를 나타내는 도면이다. 도 3a∼3c에서, 가로축은 주파수를 나타내며, 저주파에서부터 고주파로 0∼2,047의 번호가 MDCT 계수에 할당된다. 세로축은 MDCT 계수의 값을 나타낸다. 이들 도면에서, 주파수 스펙트럼은 주파수 방향으로 연속한 파형들로 표현된다. 그러나, 이들은 연속한 파형이 아니라 이산 스펙트럼이다. 도 3a에 도시한 바와 같이, MDCT부(202)에서 출력되는 2,048 MDCT 계수는 최대 대역폭의 표본화 주파수의 주파수 대역의 절반 폭에 일정 시간 주기로 표본화된 원음을 나타낼 수 있다. 일반적으로 종래의 부호화 장치에서는, 도 3a에 나타낸 MDCT 계수 중 청음에 중요한 저역 MDCT 계수들만, 예를 들어 "maxline"까지만 양자화되고 부호화되어, 복호화 장치에 송신된다. 따라서, BWE 부호화부(204)는, "maxline"의 고역 MDCT 계수를 나타내는 혹은 도 3a에 나타낸 고역 MDCT 계수 자체를 치환하는 확장 주파수 스펙트럼 데이터를 생성한다. 즉, BWE 부호화부(204)는, 0번째∼(maxline - 1)번째까지의 계수는 양자화부(203)에 의해 미리 부호화되기 때문에, 도 3c에 도시한 바와 같이, (maxline)번째∼(targetline - 1)번째 MDCT 계수를 부호화하는 것을 목적으로 하고 있다.
우선, BWE 부호화부(204)는 복호화 장치에서 데이터가 오디오 신호로서 재생되는 고주파 대역의 범위(구체적으로는, "maxline"에서 "targetline"까지의 주파수 범위)를 가정하고, 가정한 범위를 고정 주파수 대역폭을 갖는 부대역으로 분할한다. 또, BWE 부호화부(204)는 입력된 MDCT 계수 중 0번째∼(maxline - 1)번째 MDCT 계수를 포함하는 저주파 대역 전부 또는 일부를 분할하고, (maxline)번째∼2,047번째 MDCT 계수를 포함하는 각각의 상위 부대역을 치환할 수 있는 하위 부대역을 지정한다. 각 상위 부대역을 치환할 수 있는 하위 부대역으로서, 상위 부대역과의 에너지 차가 최소인 하위 부대역이 지정된다. 혹은, 절대값이 피크인 MDCT 계수의 주파수 영역에서의 위치가 고역 MDCT 계수의 위치에 가장 가까운 하위 부대역이 지정될 수도 있다.
도 3c에 나타낸 BWE 부호화부(204)의 경우, MDCT 계수의 번호를 나타내는 "startline", "targetline", "endline", "sbw" 사이에는 다음의 관계(식 2)가 있는 것으로 한다.
<식 2>
endline = maxline - shiftlen
startline = endline - W ·sbw
targetline = maxline + V ·sbw
W: 예컨대 4
V: 예컨대 8
여기서, "shiftlen"은 미리 설정된 값이 될 수도 있고, 입력된 MDCT 계수에 따라 산출될 수도 있으며, 그 값을 나타내는 데이터는 BWE 부호화부(204)에서 부호화될 수도 있다.
도 3c는 고주파 대역이 MDCT 계수의 "sbw" 샘플을 포함하는 주파수 폭을 갖는 각각 8개의 부대역, 즉 MDCT 계수(h0∼h7)로 나누어지는 경우를 나타내고, 저주파 대역은 각각 "sbw" 샘플을 갖는 4개의 MDCT 계수 부대역(A, B, C, D)을 가질 수 있다. 이 경우, 편의상 "startline"과 "endline" 사이의 범위는 4개의 부대역으로 나누어지고, "maxline"과 "targetline" 사이의 범위는 8개의 부대역으로 나누어지지만, 부대역의 수와 한 부대역 내의 샘플 수는 이것에 한정되는 것은 아니다. BWE 부호화부(204)는 주파수 폭이 "sbw"인 상위 부대역(h0∼h7)의 MDCT 계수를 치환하는 동일 주파수 폭 "sbw"의 하위 부대역(A, B, C, D)을 지정하여 부호화한다. 여기서 "치환"란, 얻어지는 MDCT 계수의 일부, 이 경우에는 A∼D의 부대역의 MDCT 계수를 상위 부대역(h0∼h7)의 MDCT 계수로서 복제하는 것을 의미한다. 이 치환은 상기 치환된 MDCT 계수에 대해 게인 제어가 실행되는 경우를 포함할 수도 있다.
BWE 부호화부(204)의 경우, 상위 부대역을 치환하는 하위 부대역의 표현에 필요한 데이터량은, 각 상위 부대역마다 4개의 하위 부대역(A∼D) 중 하나가 지정될 수 있으면 이 필요를 충족시키기 때문에, 상위 부대역(h0∼h7)당 기껏해야 2비트이다. 상술한 바와 같이, BWE 부호화부(204)는 어느 하위 부대역(A∼D)이 상위 부대역(h0∼h7)을 치환하는지를 나타내는 확장 주파수 스펙트럼 데이터를 부호화하 여, 그 하위 부대역의 확장 데이터 스트림으로 확장 오디오 부호화 데이터 스트림을 생성한다.
또한, BWE 부호화부(204)는 생성된 확장 오디오 부호화 데이터 스트림의 진폭을 조정한다. 도 4a는 원음의 MDCT 계수 열을 나타내는 파형도이다. 도 4b는 BWE 부호화부(204)에 의한 치환에 의해 생성된 MDCT 계수 열을 나타내는 파형도이다. 도 4c는 도 4b에 나타낸 MDCT 계수 열에 게인 제어가 일어날 때 생성되는 MDCT 계수 열을 나타내는 파형도이다. 도 4a에 도시한 바와 같이, BWE 부호화부(204)는 "maxline"에서 "targetline"까지의 고역 MDCT 계수를 다수의 대역으로 분할하여, 대역마다의 게인 데이터를 부호화한다. 게인 데이터의 부호화를 위해 "maxline"에서 "targetline"까지의 대역은, 도 3에 나타낸 상위 부대역(h0∼h7)과 동일한 방법 혹은 다른 방법에 의해 분할된다. 여기서는, 동일한 분할 방법이 이용되는 경우에 관해 도 4를 참조하여 설명한다.
도 4a에 도시한 바와 같이 상위 부대역(h0)에 포함된 원음의 MDCT 계수는 x(0), x(1), ‥·, x(sbw - 1)이고, 도 4b에 도시한 바와 같이 치환에 의해 얻어진 상위 부대역(h0)의 MDCT 계수는 r(0), r(1), ‥·, r(sbw - 1)이고, 도 4c에서의 부대역(h0)의 MDCT 계수는 y(0), y(1), ‥·, y(sbw - 1)이다. 그리고, x, r, y열에 대해 다음 식 3에 의해 게인(g0)이 얻어져, 부호화된다.
식 3
Figure 112003022778711-pct00002
상위 부대역(h1∼h7)에 관해, 게인 데이터가 산출되어 상기와 같은 방법으로 부호화된다. 이들 게인 데이터(g0∼g7)도 확장 오디오 부호화 데이터 스트림에 소정의 비트 수로 부호화된다.
도 5에 도식적으로 나타낸 바와 같이, 상기와 같이 부호화된 확장 오디오 부호화 데이터 스트림이 부호화 장치(200)에서 출력된 오디오 확장 비트 스트림에 기술된다. 도 5a는 통상의 오디오 부호화 비트 스트림의 일례를 나타내는 도면이다. 도 5b는 본 실시형태에 따른 부호화 장치(200)에 의해 출력된 오디오 부호화 비트 스트림의 일례를 나타내는 도면이다. 도 5c는 도 5b에 나타낸 확장 오디오 부호화 데이터 스트림 섹션에 기술된 확장 오디오 부호화 데이터 스트림의 일례를 나타내는 도면이다. 오디오 부호화 비트 스트림이 도 5a에 도시한 바와 같이 스트림(1)의 프레임마다 형성되어 있는 경우, 부호화 장치(200)는 도 5b에 도시한 바와 같이 각 프레임의 일부(예컨대 어두운 영역)를 스트림(2)의 확장 오디오 부호화 비트 스트림 섹션으로서 사용한다. 이 확장 오디오 부호화 데이터 스트림 섹션은 MPEG-2 AAC 및 MPEG-4 AAC에 기술된 "data_stream_element"의 영역이다. 이 "data_stream_element"는 종래의 부호화 시스템의 기능이 확장되는 경우의 확장 데이터를 기술하기 위한 예비 영역이며, 어떠한 종류의 데이터가 기록되더라도 종래의 복호화 장치에 의해 오디오 부호화 데이터 스트림으로서 인식되지 않는다. 또한, "data_steam_element"는 오디오 부호화 데이터의 길이를 동일하게 유지하기 위해 "0" 등의 무의미한 데이터로 메우는 영역으로, 예를 들어 MPEG-2 AAC 및 MPEG-4 AAC에서의 Fill Element의 영역이다. 오디오 부호화 비트 스트림의 이 영역에 확 장 오디오 부호화 데이터 스트림을 기술함으로써, 본 발명의 오디오 부호화 비트 스트림이 종래의 복호화 장치에 의해 복호화되더라도 확장 오디오 부호화 데이터 스트림을 오디오 신호로서 재생할 때 발생하는 노이즈가 없어, 종래의 것과 동일한 대역폭을 갖는 오디오 신호가 재생될 수 있다.
또한, 도 5c에 도시한 바와 같이, 확장 오디오 부호화 데이터 스트림에는, 마지막 프레임의 확장 오디오 부호화 데이터와 동일한 방법으로 분할되는 하위 부대역(A∼D)이 사용되는지 여부를 나타내는 항목 및 각 상위 부대역(h0∼h7)의 MDCT 계수를 나타내는 항목이 기술된다. 각 상위 부대역(h0∼h7)의 MDCT 계수를 나타내는 항목에는, 지정된 하위 부대역(A∼D)을 나타내는 데이터 및 이들의 게인 데이터가 기술된다. 마지막 프레임에서 확장 오디오 부호화 데이터 스트림과 동일한 하위 부대역(A∼D)이 사용되는지 여부를 나타내는 항목에는, 마지막 프레임과 동일한 방식으로 분할된 하위 부대역 중 하나를 이용하여 상위 부대역(h0∼h7)의 MDCT 계수를 치환할 때는 "1"이 기재되고, 그렇지 않으면, 즉 마지막 프레임과는 다른 새로운 방식으로 분할된 하위 부대역(A∼D) 중 하나를 이용하여 치환할 때는 "0"이 기재된다. A∼D 중 지정된 하위 부대역을 나타내는 항목에는, 4개의 하위 부대역(A∼D) 중 하나를 지정하는 2비트의 데이터가 기술된다. 또한, 게인 데이터를 예를 들어 4비트로 기술된다. 이렇게 함으로써, 한 프레임의 고역 MDCT 계수는 마지막 프레임과 동일한 방식으로 분할된 하위 부대역(A∼D)이 상위 부대역(h0∼h7)을 치환할 경우, 1 + 8 ×(2 + 4) = 49비트의 확장 오디오 부호화 데이터 스트림으로 표현될 수 있다. 또한, 마지막 프레임과 동일한 하위 부대역(A ∼D)을 이용하는 프레임에서, 확장 오디오 부호화 데이터 스트림은 예를 들어 "1"의 값을 나타내는 1비트만으로 표현될 수 있다.
이에 따라, 본 발명의 부호화 장치(200)에 따른 오디오 신호 부호화 방식이 종래의 부호화 방식에 적용된 경우, 확장 오디오 부호화 데이터 스트림을 이용하여 적은 양의 데이터로 고주파 대역을 표현하는 것이 가능해져, 고주파 대역에서 광대역 오디오 음성을 풍부한 음성으로 재생하는 것이 가능해진다.
다음에, 복호화 장치를 설명한다.
복호화의 처리에서는, 입력된 오디오 부호화 데이터 스트림이 복호화되어 주파수 스펙트럼 데이터를 얻고, 주파수 영역의 주파수 스펙트럼은 시간 영역의 데이터로 변환되므로, 시간 영역의 오디오 신호가 재생된다.
도 6은 도 2에 나타낸 부호화 장치(200)로부터 출력된 오디오 부호화 비트 스트림을 복호화하는 복호화 장치(600)의 구성을 나타내는 블록도이다. 복호화 장치(600)는 확장 오디오 부호화 데이터 스트림을 포함하는 오디오 부호화 비트 스트림을 복호화하여, 광대역 주파수 스펙트럼 데이터를 출력한다. 복호화 장치(600)는 부호화 데이터 스트림 분할부(601), 역양자화부(602), IMDCT(Inversed Modified Discrete Cosine Transform)부(603), 노이즈 생성부(604), BWE 복호화부(605) 및 확장 IMDCT부(606)를 구비한다. 부호화 데이터 스트림 분할부(601)는 입력된 오디오 부호화 비트 스트림을 저주파 대역을 나타내는 오디오 부호화 데이터 스트림 및 고주파 대역을 나타내는 확장 오디오 부호화 데이터 스트림으로 분할하여, 분할된 오디오 부호화 데이터 스트림 및 확장 오디오 부호화 데이터 스트림을 각각 역양자 화부(602) 및 BWE 복호화부(605)에 출력한다. 역양자화부(602)는 오디오 부호화 비트 스트림으로부터 분할된 오디오 부호화 데이터 스트림을 역양자화하여, 저역 MDCT 계수를 출력한다. 여기서, 역양자화부(602)는 오디오 부호화 데이터 스트림과 확장 오디오 부호화 데이터 스트림을 모두 수신할 수도 있다. 또한, 양자화부(203)에서 양자화 방법으로서 AAC 방식이 사용되었다면, 역양자화부(602)는 AAC 방식에 따른 역양자화를 이용하여 MDCT 계수를 복원한다. 이것에 의해, 역양자화부(602)는 0번째∼(maxline - 1)번째의 저역 MDCT 계수를 복원하여 출력한다.
IMDCT부(603)는 역양자화부(602)에서 출력된 저역 MDCT 계수를 주파수-시간 변환하여, 시간 영역의 저역 오디오 신호를 출력한다. 구체적으로, IMDCT부(603)는 역양자화부(602)에서 출력된 저역 MDCT 계수를 수신하면, 한 프레임당 1,024 샘플의 오디오 출력이 얻어진다. 여기서, IMDCT부(603)는 1,024 샘플의 IMDCT 연산을 행한다. IMDCT 연산은 일반적으로 다음의 식 4로 주어진다.
<식 4>
Figure 112003022778711-pct00003
n: 샘플 색인
i: 윈도우 색인
k: MDCT 계수의 색인
N: 윈도우 길이
n0=(N/2+1)/2
한편, 부호화 데이터 스트림 분할부(601)에 의해 오디오 부호화 비트 스트림으로부터 분할된 확장 오디오 부호화 데이터 스트림은 BWE 복호화부(605)에 출력된다. 또한, 역양자화부(602)에서 출력되는 0번째∼(maxline - 1)번째의 저역 MDCT 계수 및 노이즈 생성부(604)의 출력은 BWE 복호화부(605)에 입력된다. BWE 복호화부(605)의 동작의 상세에 관해서는 후술한다. BWE 복호화부(605)는 분할된 확장 오디오 부호화 데이터 스트림을 복호화함으로써 얻어지는 확장 주파수 스펙트럼 데이터에 기초하여 (maxline)번째∼2,047번째의 고역 MDCT 계수의 역양자화를 하여, 역양자화부(602)에 의해 얻어지는 0번째∼(maxline - 1)번째의 저역 MDCT 계수를 (maxline)번째∼2,047번째의 고역 MDCT 계수에 가산하여, O번째∼2,047번째의 광대역 MDCT 계수를 출력한다. 확장 IMDCT부(606)는 IMDCT부(603)에 의해 행해진 것의 2배의 샘플의 IMDCT 연산을 하여, 한 프레임당 2,048 샘플의 광대역 출력 오디오 신호를 얻는다.
이하, BWE 복호화부(605)의 동작을 보다 상세히 설명한다. BWE 복호화부(605)는 역양자화부(602)에 의해 얻어지는 0번째∼(maxline - 1)번째의 MDCT 계수와 확장 오디오 부호화 데이터 스트림을 이용하여, (maxline)번째∼(targetline)번째의 MDCT 계수를 복원한다. "startline", "endline", "maxline", "targetline", "sbw", "shiftlen"은 모두 부호화 장치(200) 끝의 BWE 부호화부(204)에 의해 이용된 것과 같은 값이다. 도 5c에 도시한 바와 같이, 확장 오디오 부호화 데이터 스트림에서는, 상위 부대역(h0∼h7)의 MDCT 계수 를 치환하는 하위 부대역(A∼D)을 나타내는 데이터가 부호화된다. 따라서, 그 데이터를 바탕으로, 상위 부대역(h0∼h7)의 MDCT 계수를 지정된 하위 부대역(A∼D)의 MDCT 계수가 각각 치환한다.
그 결과, BWE 복호화부(605)는 0번째∼(targetline)번째의 MDCT 계수를 얻는다. 또한 BWE 복호화부(605)는 확장 오디오 부호화 데이터 스트림에 있는 게인 데이터를 바탕으로 게인 제어를 한다. 도 4b에 도시한 바와 같이, BWE 복호화부(605)는 "maxline"에서 "targetline"까지의 각 상위 부대역(h0∼h7)에서의, 하위 부대역(A∼D)이 치환하는 MDCT 계수 열을 생성한다. 또한, 상위 부대역(h0)에서의 치환 MDCT 계수를 r(0), r(1), ‥·, r(sbw - 1)로 하고, 상위 부대역(h0)에 대해 확장 부호화 데이터 스트림에서 얻어지는 게인 데이터를 g0으로 하면, BWE 복호화부(605)는 다음의 관계식 5에 따라 도 4c에 도시한 바와 같이 게인 제어된 MDCT 계수 열을 얻을 수 있다. 구체적으로, 상위 부대역(h0)의 MDCT 계수를 y(0), y(1), ‥·, y(sbw - 1)로 하면, 게인 제어된 i번째 MDCT 계수 y(i)의 값이 다음 식 5로 주어진다.
<식 5>
yi = g0 ·ri
동일한 방식으로, 상위 부대역(h1∼h7)은 각각의 상위 부대역에 대한 게인 데이터(g1∼g7)를 치환에 의한 MDCT 계수에 곱함으로써 게인 제어된 MDCT 계수를 얻을 수 있다. 또한, 노이즈 생성부(604)는 백색 노이즈, 핑크 노이즈 혹은 저역 MDCT 계수 전부 또는 일부의 임의 조합인 노이즈를 생성하여, 그 생성된 노이즈를 게인 제어된 MDCT 계수에 가산한다. 이 때, 가산된 노이즈와 저주파 대역으로부터 복제된 스펙트럼과 조합된 스펙트럼의 에너지를 식 5로 표현한 스펙트럼의 에너지로 보정할 수 있다.
제1 실시형태에서는, 식 5에 따라 치환된 MDCT 계수에 곱해지는 게인 데이터의 부호화에 관해 설명하였다. 그러나, 게인 데이터로서는 상대적인 게인 값이 아닌 MDCT 계수의 에너지나 평균진폭 등 절대적인 값인 게인 데이터가 부호화 또는 복호화될 수도 있다.
상기와 같이 구성된 BWE 복호화부(605)를 이용하여, 적은 양의 데이터로 표현되는 확장 오디오 부호화 데이터 스트림이 이용되더라도, 고주파 대역에서 특히 풍부한 음성을 갖는 광대역 오디오 음성이 재생될 수 있다.
AAC 방식에 따른 부호화 장치(200) 및 복호화 장치(600)에 관해 설명하였지만, 본 발명의 부호화 장치 및 복호화 장치는 이것에 한정되지 않고 다른 부호화 방법이 사용될 수도 있다.
또한, 부호화 장치(200)에서는 0번째∼2,047번째 MDCT 계수가 MDCT부(202)에서 BWE 부호화부(204)로 출력된다. 그러나, BWE 부호화부(204)는 양자화부(203)에 의해 양자화된 MDCT 계수를 역양자화함으로써 얻어지는 양자화 왜곡을 포함하는 MDCT 계수를 추가로 수신할 수도 있다. 또한, BWE 부호화부(204)는 0번째∼(maxline - 1)번째의 하위 부대역에 대한 양자화부(203)의 출력 및 (maxline)번째∼(targetline - 1)번째 상위 부대역에 대한 MDCT부(202)의 출력을 각각 역양자화함으로써 얻어진 MDCT 계수를 수신할 수도 있다.
제1 실시형태에서는, 경우에 따라 확장 주파수 스펙트럼 데이터가 양자화 및 부호화되는 것을 설명하였다. 그러나, 물론 호프만 부호화 등의 가변 길이 부호화로 표현되는 부호화 대상 데이터(확장 주파수 스펙트럼 데이터)가 확장 오디오 부호화 데이터 스트림으로서 사용될 수도 있다. 이 부호화에 응하여, 복호화 장치는 확장 오디오 부호화 데이터 스트림을 역양자화할 필요 없이 호프만 부호 등의 가변 길이 부호를 복호화할 수도 있다.
또한, 제1 실시형태에서는, 본 발명의 부호화 및 복호화 방법이 MPEG-2 AAC 및 MPEG-4 AAC에 적용되는 경우를 설명하였다. 그러나, 본 발명은 이것에 한정되지 않고, MPEG-1 오디오 및 MPEG-2 오디오 등의 다른 부호화 방법이 적용될 수도 있다. MPEG-1 오디오 및 MPEG-2 오디오가 사용되면, 확장 오디오 부호화 데이터 스트림이 규격에 기재된 "ancillary_data"에 적용된다.
제1 실시형태에서는, 입력된 오디오 신호를 시간-주파수 변환함으로써 얻어진 주파수 스펙트럼(MDCT 계수) 내의 하위 부대역의 주파수 스펙트럼이 상위 부대역을 치환하는 것으로 설명하였다. 그러나, 본 발명은 이것에 한정되지 않고, 시간-주파수 변환에 의해 출력된 주파수 스펙트럼의 주파수 상한을 지나는 범위까지 상위 부대역을 치환할 수도 있다. 이 경우, 치환에 이용되는 하위 부대역은 원음을 나타내는 고역 주파수 스펙트럼(MDCT 계수)에 기초하여 지정될 수 없다.
(제2 실시형태)
본 발명의 제2 실시형태는 다음에 있어서 제1 실시형태와 다르다. 즉, 제1 실시형태의 BWE 부호화부(204)는 "startline"에서 "endline"까지의 저역 MDCT 계수 열을 4개의 부대역(A∼D)으로 분할하였지만, 제2 실시형태의 BWE 부호화부는 "startline"에서 "endline"까지의 동일 대역폭을 일부 중첩을 허용하는 7개의 부대역(A∼G)으로 분할한다. 제2 실시형태의 부호화 장치 및 복호화 장치는 제1 실시형태의 부호화 장치(200) 및 복호화 장치(600)와 기본적으로 동일한 구성을 갖고, 제1 실시형태와 다른 점은 부호화 장치의 BWE 부호화부(701) 및 복호화 장치의 BWE 복호화부(702)에 의해 행해지는 처리뿐이다. 따라서, 제2 실시형태에서는 BWE 부호화부(701) 및 BWE 복호화부(702)만을 변경된 참조부호로 설명하고, 이미 설명한 제1 실시형태의 부호화 장치(200) 및 복호화 장치(600)의 그 밖의 성분들은 동일한 참조부호가 할당되고, 그 설명이 생략된다. 또한, 다음 실시형태에서는, 전술한 설명과 다른 점만을 설명하고, 동일한 점은 생략한다.
이하, 도 7을 참조하여 제2 실시형태의 BWE 부호화부(701)를 설명한다. 도 7은 제2 실시형태의 BWE 부호화부(701)에서 확장 주파수 스펙트럼 데이터를 생성하는 방법을 나타내는 도면이다. 이 도면에서, 하위 부대역(E, F, G)은 제1 실시형태에서와 같은 방식으로 분할된 부대역(A, B, C, D) 중 하위 부대역(A, B, C)을 고주파 방향으로 sbw/2만큼 시프트 함으로써 얻어진 부대역이다. 여기서, 하위 부대역(A, B, C)이 고주파 방향으로 sbw/2만큼 시프트 되지만, 대역을 일부 중첩을 허용하는 부대역으로 분할하는 방법, 부대역을 시프트 하는 주파수 폭, 분할된 부대역의 수 등은 상기에 한정되는 것은 아니다. BWE 부호화부(701)는 각각의 상위 부대역(h0∼h7)을 치환하는 7개의 하위 부대역(A∼G) 중 하나를 지정하는 데이터를 생성하여 부호화한다.
한편, 제2 실시형태의 복호화 장치는 제2 실시형태의 부호화 장치(부호화 장치(200)의 BWE 부호화부(204) 대신 BWE 부호화부(701)를 포함)에 의해 부호화되는 확장 오디오 부호화 데이터 스트림을 수신하여, 상위 부대역(h0∼h7)을 치환하는 하위 부대역(A∼G)의 MDCT 계수를 지정하는 데이터를 복호화하고, 상위 부대역(h0∼h7)의 MDCT 계수를 하위 부대역(A∼G)의 MDCT 계수로 치환한다.
또한, 하위 부대역(A∼G) 중 어느 하나를 지정하는 데이터를 예컨대 3비트의 부호 데이터로 나타내는 것으로 한다. 부호 데이터로서 "0"∼"6"의 정수가 각각 하위 부대역(A∼G)을 나타내면, "7"의 값으로 나타낸 부호 데이터가 생성된 경우에, A∼G의 어느 것을 이용해서도 치환하지 않게 하는 제어를 할 수도 있다. 여기서, 부호 데이터로서 3비트의 부호 데이터가 사용되어, 부호 데이터의 값이 "7"인 경우에 관해 설명하였지만, 부호 데이터의 비트 수 및 부호 데이터의 값은 다른 값이어도 상관없다.
제1 실시형태에서 이용된 게인 제어 및/또는 노이즈 가산은 제2 실시형태에서도 마찬가지로 이용한다. 상술한 바와 같이 구성된 부호화 장치 및 복호화 장치가 이용되면, 데이터량이 크지 않은 확장 오디오 부호화 데이터 스트림을 이용하여, 광대역 재생음이 얻어질 수 있다.
(제3 실시형태)
제3 실시형태는 다음에 있어서 제2 실시형태와 다르다. 즉, 제2 실시형태의 BWE 부호화부(701)는 "startline"에서 "endline"까지의 저역 MDCT 계수 열을 일부 중첩을 허용하는 7개의 부대역(A∼G)으로 분할하였지만, 제3 실시형태의 BWE 부호화부는 "startline"에서 "endline"까지의 동일 대역폭을 7개의 부대역(A∼G)으로 분할하여, 순서가 반전된 하위 부대역의 MDCT 계수 및 양과 음의 부호가 반전된 하위 부대역의 MDCT 계수를 정의한다.
제3 실시형태에서 제1 및 제2 실시형태의 부호화 장치(200) 및 복호화 장치(600)와 다른 성분은 부호화 장치의 BWE 부호화부(801) 및 복호화 장치의 BWE 복호화부(802)뿐이다. 이하, 도 8을 참조하여 제3 실시형태의 BWE 부호화부를 설명한다.
도 8a∼8d는 제3 실시형태의 BWE 부호화부(801)가 확장 주파수 스펙트럼 데이터를 생성하는 방법을 나타내는 도면이다. 도 8a는 제2 실시형태와 동일한 방식으로 분할된 하위 및 상위 부대역을 나타내는 도면이다. 도 8b는 하위 부대역(A)에서의 MDCT 계수열의 일례를 나타내는 도면이다. 도 8c는 하위 부대역(A)에서의 MDCT 계수의 순서를 반전함으로써 얻어진 부대역(As)에서의 MDCT 계수열의 일례를 나타내는 도면이다. 도 8d는 하위 부대역(A)에서의 MDCT 계수의 부호를 반전함으로써 얻어진 부대역(Ar)을 나타내는 도면이다. 예를 들어, 하위 부대역(A)의 MDCT 계수는 (p0, p1, ‥·, pN)으로 나타낸다. 이 경우, 예를 들어 p0은 부대역(A)의 O번째 MDCT 계수의 값을 나타낸다. 부대역(A)의 MDCT 계수의 순서를 주파수 방향으로 반전함으로써 얻어진 부대역(As)의 MDCT 계수는 (pN, p(n-1), ‥·, p0)이다. 하위 부대역(A)의 MDCT 계수의 부호를 반전함으로써 얻어진 부대역(Ar)의 MDCT 계 수는 (-p0, -p1, ‥·, -pN)으로 나타낸다. 부대역(A)뿐만 아니라, 부대역(B∼G)에 대해서도, 순서가 반전된 부대역(Bs∼Gs) 및 부호가 반전된 부대역(Br∼Gr)이 정의된다.
상술한 바와 같이, 제3 실시형태의 BWE 부호화부(801)는 각각의 상위 부대역(h0∼h7)을 치환하는 한 부대역, 즉, 7개의 하위 부대역(A∼G), 이 하위 부대역(A∼G)의 7개의 MDCT 계수의 순서 또는 부호를 반전함으로써 얻어진 7개의 하위 부대역(As∼Gs) 또는 7개의 하위 부대역(Ar∼Gr) 중 어느 하나를 지정한다. BWE 부호화부(801)는 지정된 하위 부대역을 이용하여 고역 MDCT 계수를 나타내는 데이터를 부호화하여, 도 5c에 나타낸 바와 같이 확장 오디오 부호화 데이터 스트림을 생성한다. 이 경우, BWE 부호화부(80A)는 고역 MDCT 계수를 치환하는 하위 부대역을 지정하는 데이터, 지정된 하위 부대역의 MDCT 계수의 순서를 반전할지 여부를 나타내는 데이터, 및 지정된 하위 부대역이 MDCT 계수의 양과 음의 부호를 반전할지 여부를 나타내는 데이터를, 상위 부대역마다 확장 주파수 스펙트럼 데이터로서 부호화한다.
한편, 제3 실시형태의 복호화 장치는 상술한 바와 같이 제3 실시형태의 부호화 장치에 의해 부호화된 확장 오디오 부호화 데이터 스트림을 수신하여, 하위 부대역(A∼G)의 MDCT 계수 중 어느 것이 각각의 상위 부대역(h0∼h7)을 치환하는지, MDCT 계수의 순서를 반전할지 여부, 및 MDCT 계수의 양과 음의 부호를 반전할지 여부를 나타내는 확장 주파수 스펙트럼 데이터를 복호화한다. 다음에, 복호화된 확장 주파수 스펙트럼에 따라, 복호화 장치는 지정된 하위 부대역(A∼G)의 MDCT 계수 의 순서 또는 부호를 반전함으로써 상위 부대역(h0∼h7)의 MDCT 계수를 생성한다.
또한, 제3 실시형태는 하위 부대역의 MDCT 계수의 순서 및 양과 음의 부호의 확장뿐만 아니라, 하위 부대역의 MDCT 계수를 필터링 처리한 것에 의한 치환을 포함한다. 여기서 필터링 처리란, 예컨대 IIR 필터링, FIR 필터링 등을 의미하고, 당업자에게는 잘 알려진 기술이므로 그 설명은 생략한다. 이 필터링 처리에서, 필터링 계수가 부호화 장치로 확장 오디오 부호화 데이터 스트림에 부호화되면, 복호화 장치에서, 지정된 하위 부대역의 MDCT 계수에 대해, 복호화된 필터링 계수에 의해 지시된 IIR 필터링이나 FIR 필터링이 행해져, 상위 부대역이 필터링 처리된 MDCT 계수로 치환될 수 있다. 여기서, 제1 실시형태에 이용된 게인 제어는 제3 실시형태에서도 마찬가지로 이용된다. 상기와 같이 구성된 부호화 장치 및 복호화 장치가 이용되면, 데이터량이 크지 않은 확장 오디오 부호화 데이터 스트림을 이용하여, 광대역 재생음이 얻어질 수 있다.
(제4 실시형태)
제4 실시형태는 다음에 있어서 제3 실시형태와 다르다. 즉, 제4 실시형태의 복호화 장치는 상위 부대역(h0∼h7)의 MDCT 계수를 지정된 하위 부대역(A∼G)의 MDCT 계수만으로 치환하는 것이 아니라, 지정된 하위 부대역(A∼G)의 MDCT 계수 외에도 노이즈 생성부에 의해 생성된 MDCT 계수로 치환한다. 따라서, 제1 실시형태의 복호화 장치(600)와 구성이 다른 제4 실시형태의 복호화 장치의 성분은 노이즈 생성부(901) 및 BWE 복호화부(902)뿐이다. 제4 실시형태의 복호화 장치에서 확장 오디오 부호화 데이터 스트림을 복호화하는 처리에 관해, 예를 들어 BWE 복호화되는 상위 부대역(h0)이 하위 부대역(A)으로 치환되는 경우를 도 9a∼9c를 참조하여 하기에 설명한다. 도 9a는 상위 부대역(h0)에 지정된 하위 부대역(A)에서의 MDCT 계수의 일례를 나타내는 도면이다. 도 9b는 노이즈 생성부(901)에 의해 생성된 하위 부대역(A)에서와 동일한 수의 MDCT 계수의 일례를 나타내는 도면이다. 도 9c는 도 9a에 나타낸 하위 부대역(A)에서의 MDCT 계수 및 도 9b에 나타낸 노이즈 생성부(901)에 의해 생성된 MDCT 계수에 의해 생성되어, 상위 부대역(h0)을 치환하는 MDCT 계수의 일례를 나타내는 도면이다. 여기서, 하위 부대역(A)의 MDCT 계수는 A = (p0, p1, ‥·, pN)가 된다. 그리고, 하위 부대역(A)과 동일한 수의 노이즈 신호 MDCT 계수 M = (n0, n1, ‥·, nN)이 노이즈 생성부(901)에서 얻어진다. BWE 복호화부(902)는 가중 계수 α, β를 이용하여 하위 부대역(A)의 MDCT 계수 A 및 노이즈 신호 MDCT 계수 M을 조정하여, 상위 부대역(h0)의 MDCT 계수를 치환하는 치환 MDCT 계수 A'를 생성한다. 치환 계수 A'는 다음의 식 6으로 표현된다.
<식 6>
A' = α(p0, p1, ‥·, pN) + β(n0, n1, ‥·, nN)
가중 계수 α, β는 제4 실시형태의 복호화 장치에서 미리 설정된 값이 될 수도 있고, 부호화 장치에서 가중 계수 α, β의 값을 나타내는 제어 데이터를 확장 오디오 부호화 데이터 스트림으로 부호화하여, 복호화 장치에서 이 값을 복호화함으로써 얻어진 값이 될 수도 있다.
여기서, BWE 복호화부(902)에 의해 출력되는 부대역(h0)을 예로 하여 설명하 였지만, 다른 상위 부대역(h1∼h7)에도 동일한 처리가 행해진다. 또한, 치환되는 하위 부대역의 예로서 하위 부대역(A)을 설명하였지만, 역양자화부에 의해 얻어지는 다른 하위 부대역에 대한 처리도 동일하다. 가중 계수 α, β에 대해서는, 하나는 "0"이 되고 다른 하나는 "1"이 되는 값으로 할 수도 있고, "α+ β"가 "1"이 되는 값으로 할 수도 있다. 또한, α= 0일 때, 상위 부대역의 MDCT 계수의 에너지와 노이즈 데이터의 MDCT 계수의 에너지와의 비가 산출되어, 얻어진 에너지 비가 노이즈 정보의 MDCT 계수에 대한 게인 데이터로서 확장 오디오 부호화 데이터 스트림에 부호화된다. 또한, BWE 복호화부(902)에 의해 복제되는 한 하위 부대역의 MDCT 계수가 모두 "0"인 경우에는, α의 값에 상관없이 β의 값을 "1"로 설정하는 제어가 행해질 수도 있다. 노이즈 생성부(901)는 미리 준비된 테이블을 보유하여, 그 테이블에 있는 값을 노이즈 신호 MDCT 계수 열로서 출력하도록 구성할 수도 있고, 시간 영역의 노이즈 신호의 MDCT에 의해 얻어지는 노이즈 신호 MDCT 계수를 프레임마다 작성하도록 구성할 수도 있으며, 시간 영역의 노이즈 신호에 대해 게인 제어를 행하고, 게인 제어된 노이즈 신호의 MDCT에 의해 얻어지는 MDCT 계수 전부 또는 일부를 이용하여 노이즈 신호 MDCT 계수를 출력하도록 구성할 수도 있다.
특히, 시간 영역의 노이즈 신호에 대해 시간 영역에서 게인 제어하고 이에 MDCT를 행함으로써 얻어지는 MDCT 계수가 이용되는 경우에는, 재생음의 프리-에코를 억압하는 효과가 기대될 수 있다. 이 경우, 노이즈 신호의 게인을 시간 영역에서 제어하기 위한 게인 제어 데이터는 제4 실시형태의 부호화 장치에 의해 미리 부호화되고, 복호화 장치는 게인 제어 데이터를 복호화하여 이용할 수도 있다. 상기 와 같이 구성된 복호화 장치가 이용되면, 하위 부대역의 MDCT 계수가 BWE 복호화되는 상위 부대역의 MDCT 계수를 충분히 표현할 수 없는 경우에도, 노이즈 신호의 MDCT 계수를 이용하여, 음조의 극단적인 상승 없이 광대역 재생을 실현하는 효과가 기대될 수 있다.
(제5 실시형태)
제5 실시형태는 다수의 시간 프레임을 하나의 단위로서 제어 가능하도록 기능이 확장된 점이 제4 실시형태와 다르다. 제5 실시형태의 부호화 장치 및 복호화 장치에 있어서의 BWE 부호화부(1001) 및 BWE 복호화부(1002)의 동작을 도 10a∼10c 및 도 11a∼11c를 참조하여 설명한다.
도 10a는 시간(t0)에서의 한 프레임의 MDCT 계수를 나타내는 도면이다. 도 10b는 시간(t1)에서의 다음 프레임의 MDCT 계수를 나타내는 도면이다. 도 10c는 시간(t2)에서의 그 다음 프레임의 MDCT 계수를 나타내는 도면이다. 시간(t0, t1, t2)은 연속하는 시간이고, 프레임에 동기한 시간이다. 제1 내지 제4 실시형태에서는, 시간(t0, t1, t2)에 각각 확장 오디오 부호화 데이터 스트림이 생성되지만, 제5 실시형태의 부호화 장치는 다수의 연속하는 프레임에 공통인 확장 오디오 부호화 데이터 스트림을 생성한다. 이들 도면에서는 3개의 연속하는 프레임을 도시하였지만, 연속하는 프레임의 수는 임의의 수가 적용될 수 있다. 제1 실시형태의 도 5c에서는, 확장 오디오 부호화 데이터 스트림의 상부는 마지막 프레임의 확장 오디오 부호화 데이터 스트림과 같은 방식으로 분할된 하위 부대역(A∼D)이 사용되는지 여부를 나타내는 항목을 갖는다. 제5 실시형태의 BWE 부호화부(100) 또한 마찬가지로, 각 프레임의 확장 오디오 부호화 데이터 스트림의 상부에 마지막 프레임에서와 같은 확장 오디오 부호화 데이터 스트림이 사용되는지 여부를 나타내는 항목을 제공한다. 이하, 시간(t0, t1, t2)에 각 프레임에 있어서의 상위 부대역이 예를 들어 시간(t0)에 프레임의 확장 오디오 부호화 데이터 스트림을 이용하여 복화화되는 경우를 설명한다.
제5 실시형태의 복호화 장치는 다수의 연속하는 프레임의 공통 사용을 위해 생성된 확장 오디오 부호화 데이터 스트림을 수신하여, 각 프레임의 BWE 복호화를 한다. 예컨대, 시간(t0)에 프레임에 있어서의 상위 부대역(hO)이 동일한 시간(t0)의 프레임에 있어서의 하위 부대역(C)으로 치환되는 경우, BWE 복호화부(100)는 또한 시간(t1)에 프레임에 있어서의 상위 부대역(hO)을 시간(t1)의 하위 부대역(C)을 이용하여 복호화하고, 또 시간(t2)에 프레임에 있어서의 상위 부대역(h0)을 시간(t2)의 부대역(C)을 이용하여 복호화한다. BWE 복호화부(1002)는 다른 상위 부대역(h1∼h7)에 관해서도 동일한 처리를 한다. 상기와 같이 구성된 부호화 장치 및 복호화 장치가 이용되면, 확장 오디오 부호화 데이터 스트림이 차지하는 오디오 부호화 비트 스트림의 영역이 동일한 확장 오디오 부호화 데이터 스트림을 사용하는 다수의 프레임에 대해 전체적으로 작아질 수 있어, 보다 효율적인 부호화 및 복호화가 실현될 수 있다.
이하, 도 11a∼11c를 참조하여 제5 실시형태의 부호화 장치 및 복호화 장치의 다른 예를 설명한다. BWE 부호화부(1101)가 다수의 연속하는 프레임에 대해 동 일한 확장 오디오 부호화 데이터 스트림을 이용하여 복호화되는 고역 MDCT 계수에 관해, 프레임마다 다른 게인으로 게인 제어를 하기 위한 게인 데이터를 부호화한다는 점에서 이 예는 상술한 예와 다르다. 도 11a∼11c도, 도 10a∼10c와 같이 시간(t0, t1, t2)에 연속하는 다수의 프레임에 있어서의 MDCT 계수를 나타내는 도면이다. 제5 실시형태의 다른 부호화 장치는, 다수의 프레임에서 BWE 복호화되는 고역 MDCT 계수의 게인의 상대적인 값을 확장 오디오 부호화 데이터 스트림에 생성한다. 예를 들어, 이하에 일례를 도시한다. BWE 복호화되는 대역폭("maxline"에서 "targetline"까지의 고주파 대역)의 MDCT 계수의 평균 진폭을 시간(t0, t1, t2)의 프레임에 대하여 GO, G1, G2로 한다.
우선, 시간(t0, t1, t2)의 프레임 중에서 참조 프레임이 결정된다. 참조 프레임으로서 시간(t0)의 최초의 프레임이 미리 결정될 수도 있고, 혹은 최대 평균 진폭을 주는 프레임이 참조 프레임으로서 미리 결정되고, 별도로 최대 평균 진폭을 주는 프레임의 위치를 나타내는 데이터가 확장 오디오 부호화 데이터 스트림으로 부호화될 수도 있다. 여기서는, 시간(t0)의 프레임에 있어서의 평균 진폭(G0)이, 고역 MDCT 계수가 동일 확장 오디오 부호화 데이터 스트림을 이용하여 복호화되는 연속하는 프레임의 최대 평균 진폭인 것으로 한다. 이 경우, 시간(t1)의 프레임에 있어서의 고주파 대역의 평균 진폭은 시간(t0)의 참조 프레임에 대해서는 G1/G0으로 표현되고, 시간(t2)의 프레임에 있어서의 고주파 대역의 평균 진폭은 시간(t0)의 참조 프레임에 대해서는 G2/G0으로 표현된다. BWE 부호화부(1101)는 고주파 대역의 이들 평균 진폭의 상대적인 값(G1/G0, G2/G0)을 양자화하여, 이를 확장 오디 오 부호화 데이터 스트림으로 부호화한다.
한편, 제5 실시형태의 다른 복호화 장치에서, BWE 복호화부(1102)는 확장 오디오 부호화 데이터 스트림을 수신하고, 확장 오디오 부호화 데이터 스트림 중 참조 프레임을 지정하여 이를 복호화하거나 미리 결정된 프레임을 복호화하고, 참고 프레임의 평균 진폭 값을 복호화한다. 또한, BWE 복호화부(1102)는 BWE 복호화되는 고역 MDCT 계수의 참조 프레임에 대한 상대적인 평균 진폭 값을 복호화하여, 공동 확장 오디오 부호화 데이터 스트림에 따라 복호화되는 각 프레임의 고역 MDCT 계수에 게인 제어를 한다. 상술한 바와 같이, 도 11a∼11c에 도시한 BWE 복호화부(1102)에 의하면, 공통 확장 오디오 부호화 데이터 스트림을 사용하여 복호화되는 다수의 프레임의 평균 진폭을 보정하는 것이 용이하다. 그 결과, 광대역 오디오 신호로 원음에 충실하게 재생될 수 있는 오디오 부호화 데이터 스트림을 적은 양의 데이터로 부호화 및 복호화하는 것이 가능해진다.
(제6 실시형태)
제6 실시형태는 제5 실시형태의 부호화 장치 및 복호화 장치가 시간 영역의 오디오 신호를 주파수 스펙트럼의 시간 변화를 나타내는 시간-주파수 신호로 변환 및 역변환한다는 점에서 제5 실시형태와 다르다. 예를 들어 44.1㎑의 표본화 주파수로 표본화된 오디오 신호의 한 프레임에 대한 1,024개의 샘플 중 약 0.73msec마다 매 연속하는 32개의 샘플이 주파수 변환되어, 각각 32개의 샘플로 구성된 주파수 스펙트럼이 얻어진다. 1,024 샘플의 프레임마다 약 0.73msec의 시간차를 갖는 32개의 주파수 스펙트럼이 얻어진다. 이들 주파수 스펙트럼은 각각 32 샘플에 대해 0㎑에서 최대 22.05㎑까지의 재생 대역폭을 나타낸다. 이들 주파수 스펙트럼 중 시간 방향으로 동일한 주파수의 스펙트럼 데이터의 값을 조합함으로써 얻어지는 파형은 QMF 필터의 출력인 시간-주파수 신호이다. 본 실시형태의 부호화 장치는 QMF 필터의 출력인 시간-주파수 신호 중 0번째∼15번째 시간-주파수 신호를 종래의 부호화 장치와 같은 방식으로 양자화 및 가변 길이 부호화한다. 한편, 16번째∼31번째 고역 시간-주파수 신호에 관해, 부호화 장치는 16번째∼31번째 신호 각각을 치환하는 0번째∼15번째 시간-주파수 신호 중 하나를 지정하여, 0번째∼15번째 저역 시간-주파수 신호 중 지정된 것을 나타내는 데이터 및 지정된 저역 시간-주파수 신호의 진폭을 조정하기 위한 게인 데이터를 포함하는 확장 시간-주파수 신호를 생성한다. 필터링 처리가 행해지거나 파라미터에 따라 다른 특성을 갖는 필터가 사용되는 경우, 처리의 상세 혹은 필터의 특성을 지정하는 파라미터는 확장 시간-주파수 신호에 미리 기술되어 있다. 다음에, 부호화 장치는 저역 시간-주파수 신호를 양자화 및 가변 길이 부호화함으로써 얻어지는 저역 오디오 부호화 데이터 스트림 및 확장 시간-주파수 신호를 오디오 부호화 비트 스트림으로 가변 길이 부호화함으로써 얻어지는 고역 부호화 데이터 스트림을 기술하여 출력한다.
도 12는 QMF 필터를 이용하여 부호화된 오디오 부호화 비트 스트림으로부터 광대역 시간-주파수 신호를 복호화하는 복호화 장치(1200)의 구성을 나타내는 블록도이다. 이 복호화 장치(1200)는 고역 시간-주파수 신호를 나타내는 확장 시간-주파수 신호를 가변 길이 부호화함으로써 얻어진 부호화 데이터 스트림 및 저역 시간-주파수 신호를 양자화 및 부호화함으로써 얻어진 부호화 데이터 스트림으로 구성된 입력 오디오 부호화 비트 스트림 중 광대역 시간-주파수 신호를 복호화하는 복호화 장치이다. 복호화 장치(1200)는 핵심 복호화부(1201), 확장 복호화부(1202) 및 스펙트럼 가산부(1203)를 구비한다. 핵심 복호화부(1201)는 입력된 오디오 부호화 비트 스트림을 복호화하여, 양자화된 저역 시간-주파수 신호, 및 고역 시간-주파수 신호를 나타내는 확장 시간-주파수 신호로 분할한다. 핵심 복호화부(1201)는 또한 오디오 부호화 비트 스트림으로부터 분할된 저역 시간-주파수 신호를 역양자화하여 스펙트럼 가산부(1203)에 출력한다. 스펙트럼 가산부(1203)는 핵심 복호화부(1201)에 의해 복호화 및 역양자화된 시간-주파수 신호와 핵심 복호화부(1202)에 의해 생성된 고역 시간-주파수 신호를 가산하여, 예를 들어 전체 재생 대역이 0㎑∼22.05㎑인 시간-주파수 신호를 출력한다. 출력된 이 시간-주파수 신호는 도시하진 않았지만 후술하는 예컨대 QMF 역변환 필터에 의해 시간 영역의 신호로 변환되어, 후술하는 스피커에 의해 음성 및 음악 등의 가청음으로 전환된다.
확장 복호화부(1202)는 핵심 복호화부(1201)에 의해 복호화된 저역 시간-주파수 신호 및 확장 시간-주파수 신호를 수신하고, 분할된 확장 시간-주파수 신호를 바탕으로 고역 시간-주파수 신호를 치환하는 저역 시간-주파수 신호를 지정하여, 이를 고주파 대역에 복제하고, 그 진폭을 조정하여 고역 시간-주파수 신호를 생성하는 처리부이다. 확장 복호화부(1202)는 또한 치환 제어부(1204) 및 게인 조정부(1205)를 구비한다. 치환 제어부(1204)는 복호화된 확장 시간-주파수 신호 에 따라 예를 들어 16번째 고역 시간-주파수 신호를 치환하는 0번째∼15번째 저역 시간-주파수 신호 중 하나를 지정하여, 지정된 저역 시간-주파수 신호를 16번째 고역 시간-주파수 신호로서 복제한다. 게인 조정부(1205)는 확장 시간-주파수 신호에 기술된 게인 데이터에 따라 16번째 고역 시간-주파수 신호로서 복제된 저역 시간-주파수 신호를 증폭시키고 진폭을 조정한다. 확장 복호화부(1202)는 또한 17번째∼31번째 고역 시간-주파수 신호 각각에 대해 치환 제어부(1204) 및 게인 조정부(1205)에 의한 상술한 처리를 한다. 0번째∼15번째 저역 시간-주파수 신호 중 하나를 지정하는 4비트 및 복제된 저역 시간-주파수 신호의 진폭을 조정하는 게인 데이터의 4비트가 사용되는 경우, 16번째∼31번째 고역 시간-주파수 신호는 기껏해야 (4 + 4) ×32 = 256비트로 표현될 수 있다.
도 13은 제6 실시형태의 복호화 장치(1200)에 의해 복호화된 시간-주파수 신호의 일례를 나타내는 도면이다. k번째 저역 시간-주파수 신호의 스펙트럼이 Bk=(pk(t0), pk(t1), ‥·, pk(t31))(k는 0 ≤k ≤15의 정수)로 표현될 때, 예를 들어 양자화 및 부호화된 0번째∼15번째 저역 시간-주파수 신호(B0∼B15)는, 도 13에 도시한 바와 같이, 제6 실시형태의 도면에 도시하지 않은 부호화 장치에 의해 생성되는 오디오 부호화 비트 스트림에 기술된다. 한편, 16번째∼31번째 고역 시간-주파수 신호(B16∼B31)에 관해서는, 16번째∼31번째 고역 시간-주파수 신호를 각각 치환하는 0번째∼15번째 저역 시간-주파수 신호(B0∼B15) 중 하나를 지정하는 데이터, 및 고주파 대역에 복제된 각 저역 시간-주파수 신호의 진폭을 조정하기 위한 게인 데이터가 기술된다. 예를 들어, 16번째 고역 시간-주파수 신호(b16)를 표 현하기 위해, 16번째 고역 시간-주파수 신호(B16)를 치환하는 10번째 저역 시간-주파수 신호(B10)를 나타내는 데이터, 및 16번째 고역 시간-주파수 신호(B16)로서 고주파 대역에 복제된 저역 시간-주파수 신호(B10)의 진폭을 조정하는 게인 데이터(G0)가 확장 시간-주파수 신호에 기술된다. 따라서, 핵심 복호화부(1201)에 의해 복호화 및 역양자화된 10번째 저역 시간-주파수 신호(B10)는 16번째 고역 시간-주파수 신호(B16)로서 고주파 대역에 복제되고, 게인 데이터(G0)에 지시된 게인에 의해 증폭되어, 16번째 고역 시간-주파수 신호(B16)가 생성된다. 17번째 고역 시간-주파수 신호(B17)에 대해 동일한 처리가 행해진다. 확장 시간-주파수 신호에 기술된 11번째 저역 시간-주파수 신호(B11)는 치환 제어부(1204)에 의해 17번째 고역 시간-주파수 신호(B17)로서 복제되고, 게인 데이터(G1)에 지시된 게인에 의해 증폭되어, 17번째 고역 시간-주파수 신호(B17)가 생성된다. 18번째∼31번째 고역 시간-주파수 신호(B18∼B31)에 대해 동일한 처리가 반복되어, 모든 고역 시간-주파수 신호가 얻어질 수 있다.
상술한 바와 같이 제6 실시형태에 의하면, 부호화 장치는 QMF 필터의 출력인 시간-주파수 신호에 본 발명의 치환, 즉, 저역 시간-주파수 신호에 의한 고역 시간-주파수 신호의 치환을 적용함으로써 비교적 적은 양의 데이터 증가로 광대역 오디오 시간-주파수 신호를 부호화할 수 있는 한편, 복호화 장치는 고주파 대역에서 풍부한 음성으로 재생될 수 있는 오디오 신호를 복호화할 수 있다.
제6 실시형태에서는, 각각의 저역 시간-주파수 신호가 각각의 고역 시간-주파수 신호를 치환하는 것으로 설명하였지만, 본 발명은 이것에 한정되지 않는다. 저주파 대역 및 고주파 대역이 동일한 수(예를 들어 4개)의 시간-주파수 신호로 구성된 다수의 그룹(예를 들어 8개)으로 분할됨으로써, 저 대역의 한 그룹 내의 시간-주파수 신호가 고주파 대역의 각 그룹을 치환하도록 설계될 수도 있다. 또한, 고주파 대역에 복제된 저역 시간-주파수 신호의 진폭은 32개의 스펙트럼 값으로 구성된 생성 노이즈를 가산함으로써 조정될 수도 있다. 또한, 제6 실시형태는 표본화 주파수가 44.1㎑이고, 한 프레임이 1,024개의 샘플로 구성되며, 하나의 시간-주파수 신호에 포함되는 샘플 수는 22, 한 프레임에 포함되는 시간-주파수 신호의 수는 32인 것으로 하고 설명하였지만, 본 발명은 이것에 한정되지 않는다. 표본화 주파수 및 한 프레임에 포함되는 샘플 수는 다른 어떤 값으로 할 수도 있다.
본 발명에 따른 부호화 장치는 BS 및 CS를 포함하는 위성 방송국에 배치된 오디오 부호화 장치, 인터넷 등의 통신망을 통해 콘텐츠를 배포하는 콘텐츠 배포 서버용 오디오 부호화 장치, 및 범용 컴퓨터에 의해 실행되는 오디오 신호를 부호화하기 위한 프로그램으로서 유용하다.
또한, 본 발명에 따른 복호화 장치는 가정용 STB에 포함된 오디오 복호화 장치뿐만 아니라, 범용 컴퓨터에 의해 실행되는 오디오 신호를 복호하기 위한 프로그램, STB 또는 범용 컴퓨터에 포함된 오디오 신호를 복호하기 위한 회로 기판 또는 LSI, 및 STB 또는 범용 컴퓨터에 삽입된 IC 카드로서 유용하다.

Claims (43)

  1. 입력 신호를 부호화하는 부호화 장치에 있어서,
    시간 영역의 입력 신호를 저주파 스펙트럼을 포함하는 주파수 스펙트럼으로 변환하는 시간-주파수 변환부;
    상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 확장 데이터를 생성하는 대역 확장부; 및
    상기 저주파 스펙트럼 및 상기 확장 데이터를 부호화하여, 그 부호화된 저주파 스펙트럼 및 확장 데이터를 출력하는 부호화부를 구비하며,
    상기 대역 확장부는 상기 확장 데이터로서 제1 파라미터 및 제2 파라미터를 생성하고, 상기 제1 파라미터는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 부분 스펙트럼을 지정하고, 상기 제2 파라미터는 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 것을 특징으로 하는 부호화 장치.
  2. 제1항에 있어서, 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 적어도 2개의 스펙트럼이 서로 중첩되는 주파수 대역 부분을 갖는 것을 특징으로 하는 부호화 장치.
  3. 제2항에 있어서, 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트 럼은 중첩되는 주파수 대역을 갖는 2개의 주파수 대역을 각각 다수의 주파수 대역으로 분할함으로써 얻어지는 것을 특징으로 하는 부호화 장치.
  4. 제1항에 있어서, 상기 고주파 스펙트럼은 다수의 부분 스펙트럼에 의해 형성되고,
    상기 대역 확장부는 상기 고주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 각각에 대해 상기 제1 파라미터 및 상기 제2 파라미터를 생성하는 것을 특징으로 하는 부호화 장치.
  5. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제3 파라미터를 더 생성하고, 상기 제3 파라미터는 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 가장 낮은 주파수 성분을 포함하는 부분 스펙트럼의 주파수 위치를 지정하는 것을 특징으로 하는 부호화 장치.
  6. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제4 파라미터를 더 생성하고, 상기 제4 파라미터는 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 가장 높은 주파수 성분을 포함하는 부분 스펙트럼의 주파수 위치를 지정하는 것을 특징으로 하는 부호화 장치.
  7. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제5 파라미터를 더 생성하고, 상기 제5 파라미터는 복제 시에 상기 부분 스펙트럼에 행해지는 필터링 처리를 지정하는 것을 특징으로 하는 부호화 장치.
  8. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제6 파라미터를 더 생성하고, 상기 제6 파라미터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 그 위상이 반전된 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 그 위상이 반전되지 않은 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지를 나타내는 것을 특징으로 하는 부호화 장치.
  9. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제7 파라미터를 더 생성하고, 상기 제7 파라미터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 주파수 영역에서 반전된 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 상기 주파수 영역에서 반전되지 않은 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지를 나타내는 것을 특징으로 하는 부호화 장치.
  10. 제1항에 있어서, 상기 제1 파라미터는, 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 어느 것도 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되지 않는 것을 나타내는 데이터를 포함하는 것을 특징으로 하는 부호화 장치.
  11. 제1항에 있어서, 상기 제2 파라미터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되는 상기 부분 스펙트럼의 게인에 곱하는 계수인 것을 특징으로 하는 부호화 장치.
  12. 제1항에 있어서, 상기 제2 파라미터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 후의 상기 부분 스펙트럼의 게인의 절대값인 것을 특징으로 하는 부호화 장치.
  13. 제1항에 있어서, 상기 대역 확장부는 상기 확장 데이터로서 제8 파라미터를 더 생성하고, 상기 제8 파라미터는 상기 제1 파라미터 및 상기 제2 파라미터에 의해 지정된 상기 고주파 스펙트럼에 가산되는 노이즈 스펙트럼의 에너지를 지정하는 것을 특징으로 하는 부호화 장치.
  14. 제13항에 있어서, 상기 제8 파라미터는 상기 고주파 스펙트럼에 대한 상기 노이즈 스펙트럼의 에너지 비인 것을 특징으로 하는 부호화 장치.
  15. 제1항에 있어서, 상기 부호화 장치는 상기 입력 신호의 부호화를 일정 수의 시간 프레임마다 반복하고,
    상기 대역 확장부는, 연속하는 다수의 시간 프레임에 대해 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 상기 제2 파라미터를 생성하는 것을 특징으로 하는 부호화 장치.
  16. 제1항에 있어서, 상기 부호화 장치는 상기 입력 신호의 부호화를 일정 수의 시간 프레임마다 반복하고,
    상기 대역 확장부는 상기 연속하는 다수의 시간 프레임 중 상기 고주파 스펙 트럼의 게인이 최대인 시간 프레임을 지정하는 제9 파라미터를 상기 확장 데이터로서 더 생성하고, 상기 게인이 최대인 시간 프레임 이외의 시간 프레임에서 상기 최대값에 대한 상대적인 값으로 표현된 값으로서 상기 제2 파라미터를 생성하는 것을 특징으로 하는 부호화 장치.
  17. 제1항에 있어서, 상기 부호화부는 호프만 부호화에 따라 상기 저주파 스펙트럼 및 상기 확장 데이터 전부 또는 일부를 부호화하는 것을 특징으로 하는 부호화 장치.
  18. 부호화 신호를 복호화하는 복호화 장치에 있어서,
    상기 부호화 신호는 저주파 스펙트럼 및 확장 데이터를 포함하고, 상기 확장 데이터는 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 제1 및 제2 파라미터를 포함하며,
    상기 복호화 장치는,
    상기 부호화 신호를 복호화함으로써 상기 저주파 스펙트럼 및 상기 확장 데이터를 생성하는 복호화부;
    상기 저주파 스펙트럼, 제1 파라미터 및 제2 파라미터로부터 상기 고주파 스펙트럼을 생성하는 대역 확장부; 및
    상기 생성된 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환하는 주파수-시간 변환부를 구비하며,
    상기 대역 확장부는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 제1 파라미터에 의해 지정된 부분 스펙트럼을 복제하고, 복제된 후의 상기 부분 스펙트럼의 게인을 상기 제2 파라미터에 따라 결정하며, 상기 게인을 상기 복제된 부분 스펙트럼에 곱하여 얻어진 부분 스펙트럼을 상기 고주파 스펙트럼으로서 사용하는 것을 특징으로 하는 복호화 장치.
  19. 제18항에 있어서, 상기 확장 데이터는 제3 파라미터를 포함하고,
    상기 대역 확장부는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 상기 부분 스펙트럼에 대해 상기 제3 파라미터에 의해 지정된 필터링 처리를 행하여, 상기 필터링 처리가 행해진 후의 상기 부분 스펙트럼을 상기 고주파 스펙트럼으로서 생성하는 것을 특징으로 하는 복호화 장치.
  20. 제18항에 있어서, 상기 확장 데이터는 제4 파라미터를 포함하고,
    상기 대역 확장부는, 상기 제4 파라미터에 따라, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 그 위상이 반전된 부분 스펙트럼, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 부분 스펙트럼 그 자체를 상기 고주파 스펙트럼으로서 생성하는 것을 특징으로 하는 복호화 장치.
  21. 제18항에 있어서, 상기 확장 데이터는 제5 파라미터를 포함하고,
    상기 대역 확장부는, 상기 제5 파라미터에 따라, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 주파수 영역에서 반전된 부분 스펙트럼, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 부분 스펙트럼 그 자체를 상기 고주파 스펙트럼으로서 생성하는 것을 특징으로 하는 복호화 장치.
  22. 제18항에 있어서, 상기 대역 확장부는 상기 생성된 고주파 스펙트럼에 노이즈 스펙트럼을 가산하고,
    상기 주파수-시간 변환부는 상기 노이즈 스펙트럼이 가산된 상기 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환하는 것을 특징으로 하는 복호화 장치.
  23. 제22항에 있어서, 상기 확장 데이터는 제6 파라미터는 포함하고,
    상기 대역 확장부는 상기 생성된 고주파 스펙트럼에 상기 제6 파라미터에 의해 지정된 에너지를 갖는 노이즈 스펙트럼을 가산하는 것을 특징으로 하는 복호화 장치.
  24. 제23항에 있어서, 상기 제6 파라미터는 상기 고주파 스펙트럼에 대한 상기 노이즈 스펙트럼의 에너지 비이고,
    상기 대역 확장부는 상기 생성된 고주파 스펙트럼의 에너지에 상기 제6 파라미터에 의해 지정된 에너지 비를 곱하여 얻어진 에너지를 갖는 노이즈 스펙트럼을 상기 고주파 스펙트럼에 가산하는 것을 특징으로 하는 복호화 장치.
  25. 제22항에 있어서, 상기 시간 영역의 노이즈 신호를 시간-주파수 변환함으로 써 얻어진 노이즈 스펙트럼을 생성하는 노이즈 스펙트럼 생성부를 더 구비하고,
    상기 대역 확장부는 상기 노이즈 스펙트럼 생성부에 의해 생성된 상기 노이즈 스펙트럼을 상기 고주파 스펙트럼에 가산하는 것을 특징으로 하는 복호화 장치.
  26. 제25항에 있어서, 상기 노이즈 스펙트럼 생성부는 상기 노이즈 스펙트럼의 데이터를 미리 기억하는 메모리 테이블을 구비하고, 상기 메모리 테이블에 기억된 상기 데이터를 독출함으로써 상기 노이즈 스펙트럼을 생성하는 것을 특징으로 하는 복호화 장치.
  27. 제18항에 있어서, 상기 대역 확장부는, 상기 생성된 고주파 스펙트럼을 형성하는 모든 스펙트럼 데이터의 값이 0이고, 상기 제2 파라미터에 의해 결정된 상기 고주파 스펙트럼의 절대 게인이 0이 아닌 경우에는, 준비된 노이즈 스펙트럼을 이용하여 상기 고주파 스펙트럼을 생성하는 것을 특징으로 하는 복호화 장치.
  28. 제18항에 있어서, 상기 부호화 신호는 입력 신호를 일정 수의 시간 프레임마다 부호화함으로써 얻어지는 상기 저주파 스펙트럼 및 상기 확장 데이터를 포함하고,
    상기 제2 파라미터는, 연속하는 다수의 시간 프레임에 대해, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 공통 파라미터이며,
    상기 대역 확장부는, 연속하는 다수의 시간 프레임에 대해, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제된 후의 상기 부분 프레임의 게인을 상기 제2 파라미터에 따라 결정하는 것을 특징으로 하는 복호화 장치.
  29. 제18항에 있어서, 상기 부호화 신호는 입력 신호를 일정 수의 시간 프레임마다 부호화함으로써 얻어지는 상기 저주파 스펙트럼 및 상기 확장 데이터를 포함하고,
    상기 확장 데이터는 상기 연속하는 다수의 시간 프레임 중 상기 고주파 스펙트럼의 게인이 최대인 시간 프레임을 지정하는 제7 파라미터를 포함하고.
    상기 게인이 최대인 시간 프레임 이외의 시간 프레임에서의 제2 파라미터는 상기 최대값에 대한 상대적인 값으로 표현된 값이며,
    상기 대역 확장부는 상기 연속하는 다수의 시간 프레임 중 상기 제7 파라미터로 나타낸 상기 시간 프레임 이외의 시간 프레임의 상기 고주파 스펙트럼의 게인을, 상기 제7 파라미터로 나타낸 상기 시간 프레임에서의 상기 고주파 스펙트럼의 게인에 상기 제2 파라미터로 나타낸 상기 상대값을 곱하여 얻어진 게인으로 결정하는 것을 특징으로 하는 복호화 장치.
  30. 제18항에 있어서, 상기 복호화부는 호프만 복호화에 따라 상기 부호화 신호 전부 또는 일부를 복호화함으로써 상기 저주파 스펙트럼 및 상기 확장 데이터를 생성하는 것을 특징으로 하는 복호화 장치.
  31. 입력 신호를 부호화하는 부호화 방법에 있어서,
    시간 영역의 입력 신호를 저주파 스펙트럼을 포함하는 주파수 스펙트럼으로 변환하는 시간-주파수 변환 단계;
    상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 확장 데이터를 생성하는 대역 확장 단계; 및
    상기 저주파 스펙트럼 및 상기 확장 데이터를 부호화하여, 그 부호화된 저주파 스펙트럼 및 확장 데이터를 출력하는 부호화 단계를 구비하며,
    상기 대역 확장 단계에서는, 상기 확장 데이터로서 제1 파라미터 및 제2 파라미터가 생성되고, 상기 제1 파라미터는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 부분 스펙트럼을 지정하고, 상기 제2 파라미터는 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 것을 특징으로 하는 부호화 방법.
  32. 부호화 신호를 복호화하는 복호화 방법에 있어서,
    상기 부호화 신호는 저주파 스펙트럼 및 확장 데이터를 포함하고, 상기 확장 데이터는 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 제1 및 제2 파라미터를 포함하며,
    상기 복호화 방법은,
    상기 부호화 신호를 복호화함으로써 상기 저주파 스펙트럼 및 상기 확장 데이터를 생성하는 복호화 단계;
    상기 저주파 스펙트럼, 제1 파라미터 및 제2 파라미터로부터 상기 고주파 스펙트럼을 생성하는 대역 확장 단계; 및
    상기 생성된 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환하는 주파수-시간 변환 단계를 구비하며,
    상기 대역 확장 단계에서는, 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 제1 파라미터에 의해 지정된 부분 스펙트럼이 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어, 복제된 후의 상기 부분 스펙트럼의 게인이 상기 제2 파라미터에 따라 결정되며, 상기 게인을 상기 복제된 부분 스펙트럼에 곱하여 얻어진 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는 것을 특징으로 하는 복호화 방법.
  33. 입력 신호를 부호화하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체에 있어서,
    시간 영역의 입력 신호를 저주파 스펙트럼을 포함하는 주파수 스펙트럼으로 변환하는 시간-주파수 변환 단계;
    상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 확장 데이터를 생성하는 대역 확장 단계; 및
    상기 저주파 스펙트럼 및 상기 확장 데이터를 부호화하여, 그 부호화된 저주파 스펙트럼 및 확장 데이터를 출력하는 부호화 단계를 구비하며,
    상기 대역 확장 단계에서는, 상기 확장 데이터로서 제1 파라미터 및 제2 파라미터가 생성되고, 상기 제1 파라미터는 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 부분 스펙트럼을 지정하고, 상기 제2 파라미터는 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체.
  34. 부호화 신호를 복호화하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체에 있어서,
    상기 부호화 신호는 저주파 스펙트럼 및 확장 데이터를 포함하고, 상기 확장 데이터는 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 제1 및 제2 파라미터를 포함하며,
    상기 프로그램은,
    상기 부호화 신호를 복호화함으로써 상기 저주파 스펙트럼 및 상기 확장 데이터를 생성하는 복호화 단계;
    상기 저주파 스펙트럼, 제1 파라미터 및 제2 파라미터로부터 상기 고주파 스펙트럼을 생성하는 대역 확장 단계; 및
    상기 생성된 고주파 스펙트럼 및 상기 저주파 스펙트럼을 조합함으로써 얻어진 주파수 스펙트럼을 시간 영역의 신호로 변환하는 주파수-시간 변환 단계를 구비하며,
    상기 대역 확장 단계에서는, 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 제1 파라미터에 의해 지정된 부분 스펙트럼이 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어, 복제된 후의 상기 부분 스펙트럼의 게인이 상기 제2 파라미터에 따라 결정되며, 상기 게인을 상기 복제된 부분 스펙트럼에 곱하여 얻어진 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체.
  35. 부호화 신호가 기록되는 컴퓨터 판독 가능 기록매체에 있어서,
    상기 부호화 신호는 저주파 스펙트럼 및 확장 데이터를 포함하고, 상기 확장 데이터는 상기 저주파 스펙트럼보다 높은 주파수의 고주파 스펙트럼을 지정하는 제1 및 제2 파라미터를 포함하고,
    상기 제1 파라미터는, 상기 저주파 스펙트럼을 형성하는 다수의 부분 스펙트럼 중 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 부분 스펙트럼을 지정하는 파라미터이고,
    상기 제2 파라미터는 복제된 후의 상기 부분 스펙트럼의 게인을 지정하는 파라미터인 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  36. 제35항에 있어서, 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 적어도 2개의 스펙트럼이 서로 중첩되는 주파수 대역 부분을 갖는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  37. 제35항에 있어서, 상기 확장 데이터는 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 가장 낮은 주파수 성분을 포함하는 부분 스펙트럼의 주파수 위치를 지정하는 제3 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  38. 제35항에 있어서, 상기 확장 데이터는 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 가장 높은 주파수 성분을 포함하는 부분 스펙트럼의 주파수 위치를 지정하는 제4 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  39. 제35항에 있어서, 상기 확장 데이터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제될 때 상기 부분 스펙트럼에 행해지는 필터링 처리를 지정하는 제5 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  40. 제35항에 있어서, 상기 확장 데이터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 그 위상이 반전된 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 그 위상이 반전되지 않은 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지를 나타내는 제6 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  41. 제35항에 있어서, 상기 확장 데이터는, 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 주파수 영역에서 반전된 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지, 또는 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되어 상기 주파수 영역에서 반전되지 않은 부분 스펙트럼이 상기 고주파 스펙트럼으로서 사용되는지를 나타내는 제7 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  42. 제35항에 있어서, 상기 제1 파라미터는, 상기 저주파 스펙트럼을 형성하는 상기 다수의 부분 스펙트럼 중 어느 것도 상기 고주파 스펙트럼을 생성하는데 사용하기 위해 복제되지 않는 것을 나타내는 데이터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
  43. 제35항에 있어서, 상기 확장 데이터는 상기 제1 파라미터 및 상기 제2 파라미터에 의해 지정된 상기 고주파 스펙트럼에 가산되는 노이즈 스펙트럼의 에너지를 지정하는 제8 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
KR1020037008615A 2001-11-14 2002-11-07 부호화 장치 및 복호화 장치 KR100935961B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2001-00348412 2001-11-14
JP2001348412 2001-11-14
PCT/JP2002/011605 WO2003042979A2 (en) 2001-11-14 2002-11-07 Encoding device and decoding device

Publications (2)

Publication Number Publication Date
KR20040063076A KR20040063076A (ko) 2004-07-12
KR100935961B1 true KR100935961B1 (ko) 2010-01-08

Family

ID=19161235

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037008615A KR100935961B1 (ko) 2001-11-14 2002-11-07 부호화 장치 및 복호화 장치

Country Status (7)

Country Link
US (14) US7139702B2 (ko)
EP (2) EP1444688B1 (ko)
JP (1) JP5048697B2 (ko)
KR (1) KR100935961B1 (ko)
CN (1) CN100395817C (ko)
DE (1) DE60214027T2 (ko)
WO (1) WO2003042979A2 (ko)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100935961B1 (ko) 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
BRPI0415464B1 (pt) * 2003-10-23 2019-04-24 Panasonic Intellectual Property Management Co., Ltd. Aparelho e método de codificação de espectro.
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101213840B1 (ko) * 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
WO2005112001A1 (ja) 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP4774820B2 (ja) * 2004-06-16 2011-09-14 株式会社日立製作所 電子透かし埋め込み方法
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
EP1798724B1 (en) 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
ES2350494T3 (es) * 2005-04-01 2011-01-24 Qualcomm Incorporated Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla.
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8296134B2 (en) * 2005-05-13 2012-10-23 Panasonic Corporation Audio encoding apparatus and spectrum modifying method
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
WO2007052088A1 (en) * 2005-11-04 2007-05-10 Nokia Corporation Audio compression
KR100739786B1 (ko) * 2006-01-20 2007-07-13 삼성전자주식회사 다중 채널 디지털 앰프 시스템 및 그 신호 처리 방법
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
WO2007148925A1 (en) 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP2101318B1 (en) * 2006-12-13 2014-06-04 Panasonic Corporation Encoding device, decoding device and corresponding methods
US8560328B2 (en) 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
MX2010001394A (es) * 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
EP2210253A4 (en) 2007-11-21 2010-12-01 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A SIGNAL
US8004432B2 (en) 2007-11-30 2011-08-23 Shimadzu Corporation Time-of-flight measuring device
RU2439720C1 (ru) * 2007-12-18 2012-01-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки звукового сигнала
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
CN101604983B (zh) * 2008-06-12 2013-04-24 华为技术有限公司 编解码装置、系统及其方法
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
CN101836253B (zh) * 2008-07-11 2012-06-13 弗劳恩霍夫应用研究促进协会 一种使用频谱倾斜控制成帧技术来计算带宽扩展数据的装置及方法
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102598125B (zh) * 2009-11-13 2014-07-02 松下电器产业株式会社 编码装置、解码装置及其方法
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
CN102131081A (zh) * 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
EP2525357B1 (en) * 2010-01-15 2015-12-02 LG Electronics Inc. Method and apparatus for processing an audio signal
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP2012032713A (ja) * 2010-08-02 2012-02-16 Sony Corp 復号装置、復号方法、およびプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
EP2603913B1 (en) 2010-08-12 2014-06-11 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Resampling output signals of qmf based audio codecs
WO2012026741A2 (ko) * 2010-08-24 2012-03-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
MX2013007489A (es) 2010-12-29 2013-11-20 Samsung Electronics Co Ltd Aparato y metodo para codificacion/decodificacion para extension de ancho de banda de alta frecuencia.
CN103460286B (zh) 2011-02-08 2015-07-15 Lg电子株式会社 带宽扩展的方法和设备
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
JP5704018B2 (ja) * 2011-08-05 2015-04-22 富士通セミコンダクター株式会社 オーディオ信号符号化方法および装置
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
PL2791937T3 (pl) * 2011-11-02 2016-11-30 Wytworzenie rozszerzenia pasma wysokiego sygnału dźwiękowego o poszerzonym paśmie
WO2013118398A1 (ja) 2012-02-08 2013-08-15 国立大学法人九州工業大学 生体情報処理装置、生体情報処理システム、生体情報の圧縮方法、及び、生体情報の圧縮処理プログラム
CN103366751B (zh) * 2012-03-28 2015-10-14 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
HUE028238T2 (en) * 2012-03-29 2016-12-28 ERICSSON TELEFON AB L M (publ) Extend the bandwidth of a harmonic audio signal
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
WO2014185569A1 (ko) * 2013-05-15 2014-11-20 삼성전자 주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101790901B1 (ko) * 2013-06-21 2017-10-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Fdns 적용 이전에 백색 잡음으로의 mdct 스펙트럼의 페이딩을 실현하는 장치 및 방법
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
KR101498113B1 (ko) * 2013-10-23 2015-03-04 광주과학기술원 사운드 신호의 대역폭 확장 장치 및 방법
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN105336339B (zh) * 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
US9786291B2 (en) * 2014-06-18 2017-10-10 Google Technology Holdings LLC Communicating information between devices using ultra high frequency audio
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
WO2018201113A1 (en) 2017-04-28 2018-11-01 Dts, Inc. Audio coder window and transform implementations
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN113840328B (zh) * 2021-09-09 2023-10-20 锐捷网络股份有限公司 一种数据压缩方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0600504A1 (en) * 1992-12-04 1994-06-08 SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. Method of and device for speech-coding based on analysis-by-synthesis techniques
EP0805435A2 (en) * 1996-04-30 1997-11-05 Texas Instruments Incorporated Signal quantiser for speech coding
US6240385B1 (en) * 1998-05-29 2001-05-29 Nortel Networks Limited Methods and apparatus for efficient quantization of gain parameters in GLPAS speech coders

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US340385A (en) * 1886-04-20 Lubricator
US668072A (en) * 1900-04-14 1901-02-12 Edwin L Wilson Printer's quoin.
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
ATE173366T1 (de) * 1991-09-30 1998-11-15 Sony Corp Verfahren und anordnung zur audiodatenkompression
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
JP3243174B2 (ja) 1996-03-21 2002-01-07 株式会社日立国際電気 狭帯域音声信号の周波数帯域拡張回路
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
FR2791167B1 (fr) 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6879652B1 (en) * 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
JP4470304B2 (ja) * 2000-09-14 2010-06-02 ソニー株式会社 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
EP1382035A1 (en) * 2001-04-18 2004-01-21 Koninklijke Philips Electronics N.V. Audio coding
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
EP1386310A1 (en) 2001-05-11 2004-02-04 Matsushita Electric Industrial Co., Ltd. Device to encode, decode and broadcast audio signal with reduced size spectral information
DE60206269T2 (de) * 2001-06-08 2006-06-29 Koninklijke Philips Electronics N.V. Editieren von audiosignalen
US7400651B2 (en) * 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
WO2003038389A1 (en) 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device and audio data distribution system
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
EP1635183B1 (en) * 2002-07-03 2007-11-21 Q-Star Test N.V. Device for monitoring quiescent current of an electronic device
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1631954B1 (en) * 2003-05-27 2007-02-14 Koninklijke Philips Electronics N.V. Audio coding
DE602004023397D1 (de) * 2003-07-29 2009-11-12 Panasonic Corp Audiosignalband-expansionsvorrichtung und verfahren
WO2005083677A2 (en) * 2004-02-18 2005-09-09 Philips Intellectual Property & Standards Gmbh Method and system for generating training data for an automatic speech recogniser
US7396176B2 (en) * 2005-07-01 2008-07-08 Schoemer Karl G Corn on the cob buttering device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0600504A1 (en) * 1992-12-04 1994-06-08 SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. Method of and device for speech-coding based on analysis-by-synthesis techniques
EP0805435A2 (en) * 1996-04-30 1997-11-05 Texas Instruments Incorporated Signal quantiser for speech coding
US6240385B1 (en) * 1998-05-29 2001-05-29 Nortel Networks Limited Methods and apparatus for efficient quantization of gain parameters in GLPAS speech coders

Also Published As

Publication number Publication date
EP1701340A3 (en) 2006-10-18
DE60214027T2 (de) 2007-02-15
WO2003042979A2 (en) 2003-05-22
US7509254B2 (en) 2009-03-24
WO2003042979A3 (en) 2004-02-19
US7783496B2 (en) 2010-08-24
USRE44600E1 (en) 2013-11-12
USRE47935E1 (en) 2020-04-07
US20090157393A1 (en) 2009-06-18
EP1444688A2 (en) 2004-08-11
CN100395817C (zh) 2008-06-18
CN1527995A (zh) 2004-09-08
DE60214027D1 (de) 2006-09-28
JP2009116371A (ja) 2009-05-28
JP5048697B2 (ja) 2012-10-17
US20030093271A1 (en) 2003-05-15
USRE48145E1 (en) 2020-08-04
EP1701340A2 (en) 2006-09-13
EP1444688B1 (en) 2006-08-16
EP1701340B1 (en) 2012-08-29
USRE46565E1 (en) 2017-10-03
US20070005353A1 (en) 2007-01-04
USRE47949E1 (en) 2020-04-14
US20060287853A1 (en) 2006-12-21
US7308401B2 (en) 2007-12-11
KR20040063076A (ko) 2004-07-12
USRE47956E1 (en) 2020-04-21
USRE45042E1 (en) 2014-07-22
US20100280834A1 (en) 2010-11-04
USRE47814E1 (en) 2020-01-14
US7139702B2 (en) 2006-11-21
US8108222B2 (en) 2012-01-31
USRE48045E1 (en) 2020-06-09

Similar Documents

Publication Publication Date Title
KR100935961B1 (ko) 부호화 장치 및 복호화 장치
JP3926726B2 (ja) 符号化装置および復号化装置
CN1702974B (zh) 用于对数字信号编码/解码的方法和设备
AU2002318813B2 (en) Audio signal decoding device and audio signal encoding device
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
US20030195742A1 (en) Encoding device and decoding device
KR20080025636A (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JP4308229B2 (ja) 符号化装置および復号化装置
KR20030040203A (ko) 부호화 장치, 복호화 장치 및 방송 시스템
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
JP4297078B2 (ja) 復号方法及び装置
JPH10228298A (ja) 音声信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121203

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131202

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141210

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151208

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20171213

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20181211

Year of fee payment: 10