KR20070029755A - 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 - Google Patents

신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 Download PDF

Info

Publication number
KR20070029755A
KR20070029755A KR1020067027378A KR20067027378A KR20070029755A KR 20070029755 A KR20070029755 A KR 20070029755A KR 1020067027378 A KR1020067027378 A KR 1020067027378A KR 20067027378 A KR20067027378 A KR 20067027378A KR 20070029755 A KR20070029755 A KR 20070029755A
Authority
KR
South Korea
Prior art keywords
signal
spectral signal
normalization
normalized
quantization precision
Prior art date
Application number
KR1020067027378A
Other languages
English (en)
Other versions
KR101143792B1 (ko
Inventor
시로 스즈끼
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20070029755A publication Critical patent/KR20070029755A/ko
Application granted granted Critical
Publication of KR101143792B1 publication Critical patent/KR101143792B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

신호 부호화 장치(1)에서, 주파수 정규화부(11)는, 스펙트럼 신호의 각 스펙트럼을 각각 정규화 계수를 이용하여 정규화하고, 스펙트럼마다의 정규화부 계수 인덱스를 양자화 정밀도 결정부(13)에 공급한다. 양자화 정밀도 결정부(13)는, 정규화되어 소정의 레인지 변환이 실시된 레인지 변환 스펙트럼 신호의 스펙트럼마다의 정규화 계수 인덱스에 대하여 청각 특성을 이용한 가중 계수를 가산하고, 이 가산 결과에 따라서 양자화 정밀도를 결정한다. 그리고, 양자화부(14)는, 양자화 정밀도 결정부(13)로부터 공급된 양자화 정밀도 인덱스에 따른 양자화 정밀도로 양자화를 행하고, 부호화·부호열 생성부(15)는, 양자화 정밀도 결정부(13)로부터 공급된 가중 계수를 정규화 계수 인덱스나 양자화 스펙트럼 신호와 함께 부호화한다. [대표도]
도 1
스펙트럼 신호, 정규화부, 인덱스, 파라미터, 가중 계수

Description

신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법{SIGNAL ENCODING DEVICE AND METHOD, AND SIGNAL DECODING DEVICE AND METHOD}
본 발명은, 입력된 디지털 오디오 신호를 소위 변환 부호화에 의해 부호화하고, 얻어지는 부호열을 출력하는 신호 부호화 장치 및 그 방법, 및 그 부호열을 복호하여 원래의 오디오 신호를 복원하는 신호 복호 장치 및 그 방법에 관한 것이다.
본 출원은, 일본국에서 2004년 6월 28일에 출원된 일본 특허 출원 번호 2004-190249를 기초로 하여 우선권을 주장하는 것으로, 이 출원은 참조함으로써, 본 출원에 채용된다.
종래부터, 음성이나 음악 등의 오디오 신호의 부호화 방법이 여러 가지 알려져 있지만, 그 하나로서, 예를 들면 시간 영역의 오디오 신호를 주파수 영역의 스펙트럼 신호로 변환(스펙트럼 변환)하는, 소위 변환 부호화 방법을 예로 들 수 있다.
여기에서, 상술한 스펙트럼 변환으로서는, 예를 들면 입력된 오디오 신호를 소정 단위 시간(프레임)마다 블록화하고, 그 블록마다 이산 푸리에 변환(Discrete Fourier Transformation; DFT), 이산 코사인 변환(Discrete Cosine Transformation; DCT), 혹은 변형 이산 코사인 변환(Modified DCT; MDCT) 등을 행 함으로써 시간 영역의 오디오 신호를 주파수 영역의 스펙트럼 신호로 변환하는 것이 있다.
또한, 이 스펙트럼 변환에 의해 생성된 스펙트럼 신호를 부호화할 때에는, 스펙트럼 신호를 임의의 일정폭의 주파수 대역으로 분할하고, 주파수 대역마다 정규화한 후에 양자화하여 부호화하는 방법이 있다. 주파수 대역 분할을 행할 때의 각 주파수 대역의 폭은, 인간의 청각 특성을 고려하여 결정되는 경우가 있다. 구체적으로는, 스펙트럼 신호를 임계 대역(크리티컬 밴드)이라고 불리는 고역일수록 넓어지는 대역 분할폭으로 복수(예를 들면 24나 32)의 주파수 대역으로 분할하는 경우가 있다. 또한, 각 주파수 대역마다 적응적인 비트 할당(비트 얼로케이션)을 행하여 부호화하는 경우도 있다. 비트 할당 방법으로서는, 예를 들면 문헌 「IEEE Transactions of Acoustics, Speech, and Signal Processing, Vol. ASSP-25, N0.4, August 1977」(이하, 문헌 1이라고 함)에 기재되어 있는 방법을 예로 들 수 있다.
이 문헌 1에서는, 주파수 대역마다의 각 주파수 성분의 크기를 바탕으로 비트 할당을 행하고 있다. 이 방법에서는, 양자화 잡음 스펙트럼이 평탄해져서, 잡음 에너지가 최소로 되지만, 청각적으로는 마스킹 효과나 등감도 곡선이 고려되고 있지 않기 때문에, 실제의 잡음감은 최소는 아니다.
또한, 이 문헌 1에서는 임계 대역이라고 하는 개념을 이용하여, 고역일수록 넓은 대역 분할폭으로 통합하여 양자화를 행하고 있기 때문에, 저역에 비해 고역에서는 양자화 정밀도 확보에 대한 정보 효율이 악화된다고 하는 문제가 있다. 게다가, 이 문제를 해소하기 위해서는, 1개의 주파수 대역 중에서 특정한 주파수 성분 만을 분리·추출하는 방법이나, 큰 주파수 성분을 미리 시간 영역에서 분리·추출하는 방법 등의 부가적인 기능이 필요해지게 된다.
<발명의 개시>
<발명이 해결하고자 하는 과제>
본 발명은, 이와 같은 종래의 실정을 감안하여 제안된 것으로, 임계 대역으로 분할하지 않고, 재생 시의 잡음감이 최소로 되도록 오디오 신호를 부호화하는 신호 부호화 장치 및 그 방법, 및 그 부호열을 복호하여 원래의 오디오 신호를 복원하는 신호 복호 장치 및 그 방법을 제공하는 것을 목적으로 한다.
상술한 목적을 달성하기 위해, 본 발명에 관한 신호 부호화 장치는, 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하는 스펙트럼 변환 수단과, 상기 각 스펙트럼 신호에 대하여, 소정의 스텝폭을 갖는 복수의 정규화 계수 중 어느 하나를 선택하고, 선택한 정규화 계수를 이용하여 상기 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하는 정규화 수단과, 상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하는 양자화 정밀도 결정 수단과, 상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하는 양자화 수단과, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 부호열을 생성하는 부호화 수단을 구비하는 것을 특징으로 한다.
여기에서, 상기 양자화 정밀도 결정 수단은, 상기 오디오 신호 또는 상기 스펙트럼 신호의 특징에 기초하여 상기 가중 계수를 결정한다.
또한, 본 발명에 관한 신호 부호화 방법은, 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하는 스펙트럼 변환 공정과, 상기 각 스펙트럼 신호에 대하여, 소정의 스텝폭을 갖는 복수의 정규화 계수중 어느 하나를 선택하고, 선택한 정규화 계수를 이용하여 상기 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하는 정규화 공정과, 상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하는 양자화 정밀도 결정 공정과, 상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하는 양자화 공정과, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 부호열을 생성하는 부호화 공정을 갖는 것을 특징으로 한다.
또한, 본 발명에 관한 신호 복호 장치는, 상술한 신호 부호화 장치 및 그 방법에 의해 생성된 부호열을 복호하여 오디오 신호를 복원하는 것으로서, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중치 정보를 적어도 복호하는 복호 수단과, 상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 수단과, 상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 수단과, 상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 수단과, 상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역스펙트럼 변환 수단을 구비하는 것을 특징으로 한다.
또한, 본 발명에 관한 신호 복호 방법은, 마찬가지로 상술한 신호 부호화 장치 및 그 방법에 의해 생성된 부호열을 복호하여 오디오 신호를 복원하는 것으로서, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중치 정보를 적어도 복호하는 복호 공정과, 상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 공정과, 상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 공정과, 상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 공정과, 상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 한다.
또한, 본 발명에 관한 신호 복호 방법은, 입력된 부호열을 복호하여 시간 영역의 오디오 신호를 복원하는 것으로서, 양자화 스펙트럼 신호, 정규화 계수의 인덱스 및 가중치 정보를 적어도 복호하는 복호 공정과, 상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하 고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 공정과, 상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 공정과, 상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 공정과, 상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역스펙트럼 변환 공정을 갖는 것을 특징으로 한다.
본 발명의 또 다른 목적, 본 발명에 의해 얻어지는 구체적인 이점은, 이하에 설명되는 실시예의 설명으로부터 한층 명백해질 것이다.
도 1은 본 실시 형태에서의 신호 부호화 장치의 개략 구성을 도시하는 도면.
도 2는 동일 신호 부호화 장치에서의 부호화 처리의 수순을 설명하는 플로우차트.
도 3의 A 및 B는 동일 신호 부호화 장치의 시간-주파수 변환부에서의 시간-주파수 변환 처리를 설명하는 도면.
도 4는 동일 신호 부호화 장치의 주파수 정규화부에서의 정규화 처리를 설명하는 도면.
도 5는 동일 신호 부호화 장치의 레인지 변환부에서의 레인지 변환 처리를 설명하는 도면.
도 6은 동일 신호 부호화 장치의 양자화부에서의 양자화 처리의 일례를 설명하는 도면.
도 7은 정규화 계수 인덱스의 가중치 부여를 행하지 않는 경우에서의 스펙트럼의 포락선 및 노이즈 플로어를 도시하는 도면.
도 8은 가중 계수 테이블 Wn[]을 결정하는 방법의 일례를 설명하는 플로우차트.
도 9는 가중 계수 테이블 Wn[]을 결정하는 방법의 다른 예를 설명하는 플로우차트.
도 10은 정규화 계수 인덱스의 가중치 부여를 행하는 경우에서의 스펙트럼의 포락선 및 노이즈 플로어의 일례를 도시하는 도면.
도 11은 종래의 양자화 정밀도의 결정 처리를 설명하는 플로우차트.
도 12는 본 실시 형태에서의 양자화 정밀도의 결정 처리를 설명하는 플로우차트.
도 13은 도 11에 따라 양자화 정밀도를 결정한 경우에서의 부호열과 도 12에 따라 양자화 정밀도를 결정한 경우에서의 부호열을 도시하는 도면.
도 14는 가중 계수의 규격이 변경된 경우에서의 후방 호환성을 확보하는 방법을 설명하는 도면.
도 15는 본 실시 형태에서의 신호 복호 장치의 개략 구성을 도시하는 도면.
도 16은 동일 신호 복호 장치에서의 복호 처리의 수순을 설명하는 플로우차트.
도 17은 동일 신호 복호 장치의 부호열 복호부 및 양자화 정밀도 복원부에서의 처리를 설명하는 플로우차트.
<발명을 실시하기 위한 최량의 형태>
이하, 본 발명을 적용한 구체적인 실시 형태에 대해, 도면을 참조하면서 상세히 설명한다. 본 실시 형태는, 본 발명을, 입력된 디지털 오디오 신호를 소위 변환 부호화에 의해 부호화하고, 얻어진 부호열을 출력하는 신호 부호화 장치 및 그 방법, 및 그 부호열을 복호하여 원래의 오디오 신호를 복원하는 신호 복호 장치 및 그 방법에 적용한 것이다.
우선, 본 실시 형태에서의 신호 부호화 장치의 개략 구성을 도 1에 도시한다. 또한, 도 1에 도시하는 신호 부호화 장치(1)에서의 부호화 처리의 수순을 도 2의 플로우차트에 도시한다. 이하, 도 1을 참조하면서, 도 2의 플로우차트에 대해 설명한다.
도 2의 스텝 S1에서, 시간-주파수 변환부(10)는, 오디오 신호(PCM(Pulse Code Modulation) 데이터 등)를 소정 단위 시간(프레임)마다 입력하고, 스텝 S2에서, 이 오디오 신호를 변형 이산 코사인 변환(Modified Discrete Cosine Transformation; MDCT)에 의해 스펙트럼 신호로 변환한다. 이 결과, 도 3의 A에 도시하는 N개의 오디오 신호는, 도 3의 B에 도시하는 N/2개의 MDCT 스펙트럼(절대값 표시)으로 변환된다. 시간-주파수 변환부(10)는, 스펙트럼 신호를 주파수 정규화부(11)에 공급함과 함께, 스펙트럼의 개수 정보를 부호화·부호열 생성부(15)에 공급한다.
다음으로 스텝 S3에서, 주파수 정규화부(11)는, 도 4에 도시하는 바와 같이 N/2개의 각 스펙트럼을 각각 정규화 계수 sf(0), …, sf(N/2-1)로 정규화하고, 정규화 스펙트럼 신호를 생성한다. 여기에서, 정규화 계수 sf는 6㏈씩, 즉 2배씩의 스텝폭을 갖고 있는 것으로 한다. 정규화할 때에는 각 스펙트럼의 값보다도 1단계만큼 큰 값의 정규화 계수를 이용함으로써, 정규화 스펙트럼의 값의 범위를 ±0.5∼±1.0의 범위로 집약할 수 있다. 주파수 정규화부(11)는, 정규화 스펙트럼 마다의 정규화 계수 sf를 예를 들면 이하의 표 1에 나타내는 바와 같이 정규화 계수 인덱스 idsf로 변환하고, 정규화 스펙트럼 신호를 레인지 변환부(12)에 공급함과 함께, 정규화 스펙트럼마다의 정규화 계수 인덱스 idsf를 양자화 정밀도 결정부(13) 및 부호화·부호열 생성부(15)에 공급한다.
Figure 112006096879706-PCT00001
계속하여 스텝 S4에서, 레인지 변환부(12)는, 도 5의 왼쪽 종축에 도시하는 바와 같이 ±0.5∼±1.0의 범위로 집약된 정규화 스펙트럼의 값을, ±0.5의 위치를 0.0으로 간주함으로써, 오른쪽 종축에 도시하는 바와 같이, 0.0∼±1.0의 범위로 레인지 변환한다. 본 실시 형태의 신호 부호화 장치(1)에서는, 이러한 레인지 변환을 행하고 나서 양자화를 행하기 때문에, 양자화 정밀도를 향상시키는 것이 가능하다. 레인지 변환부(12)는, 레인지 변환 후의 레인지 변환 스펙트럼 신호를 양자화 정밀도 결정부(13)에 공급한다.
계속하여 스텝 S5에서, 양자화 정밀도 결정부(13)는, 주파수 정규화부(11)로부터 공급된 정규화 계수 인덱스 idsf에 기초하여 각 레인지 변환 스펙트럼의 양자화 정밀도를 결정하고, 레인지 변환 스펙트럼 신호와 후술하는 양자화 정밀도 인덱스idwl을 양자화부(14)에 공급한다. 또한, 양자화 정밀도 결정부(13)는, 양자화 정밀도를 결정할 때에 이용한 가중치 정보를 부호화·부호열 생성부(15)에 공급하지만, 가중치 정보를 이용한 양자화 정밀도 결정 처리에 관한 상세는 후술한다.
계속하여 스텝 S6에서, 양자화부(14)는, 양자화 정밀도 결정부(13)로부터 공급된 양자화 정밀도 인덱스 idwl이 a인 경우에 2^a의 양자화 스텝에서 각 레인지 변환 스펙트럼을 양자화하여 양자화 스펙트럼을 생성하고, 양자화 스펙트럼 신호를 부호화·부호열 생성부(15)에 공급한다. 양자화 정밀도 인덱스 idwl과 양자화 스텝 nsteps의 관계의 일례를 이하의 표 2에 나타낸다. 또한, 이 표 2에서는, 양자화 정밀도 인덱스 idwl이 a인 경우의 양자화 스텝을 2^a-1로 하고 있다.
Figure 112006096879706-PCT00002
이 결과, 예를 들면 양자화 정밀도 인덱스 idwl이 3인 경우에는, 레인지 변환 스펙트럼의 값을 nspec로 하고, 양자화 스펙트럼의 값을 q(-3≤q≤3)로 하였을 때, 하기의 수학식 1에 따라, 도 6에 도시하는 바와 같이 양자화된다. 또한, 도 6에서의 검정 동그라미는 레인지 변환 스펙트럼의 값을 나타내고, 흰 동그라미는 양자화 스펙트럼의 값을 나타낸다.
Figure 112006096879706-PCT00003
계속하여 스텝 S7에서, 부호화·부호열 생성부(15)는, 시간-주파수 변환부(15)로부터 공급된 스펙트럼의 개수 정보, 주파수 정규화부(10)로부터 공급된 정규화 계수 인덱스 idsf, 양자화 정밀도 결정부(13)로부터 공급된 가중치 정보, 양자화 스펙트럼 신호를 각각 부호화하고, 스텝 S8에서 부호열을 생성하고, 스텝 S9에서, 이 부호열을 출력한다.
마지막으로 스텝 S10에서, 오디오 신호의 최후의 프레임인지의 여부가 판별되고, 최후의 프레임인 경우(예)에는 부호화 처리를 종료하고, 그렇지 않은 경우(아니오)에는 스텝 S1로 되돌아가 다음 프레임의 오디오 신호를 입력한다.
여기에서, 상술한 양자화 정밀도 결정부(13)에서의 처리의 상세에 대해 설명한다. 또한, 양자화 정밀도 결정부(13)는, 상술한 바와 같이 가중치 정보를 이용하여 레인지 변환 스펙트럼마다의 양자화 정밀도를 결정하지만, 이하에서는 우선, 가중치 정보를 이용하지 않고 양자화 정밀도를 결정하는 것으로서 설명한다.
양자화 정밀도 결정부(13)는, 주파수 정규화부(11)로부터 공급된 정규화 스펙트럼마다의 정규화 계수 인덱스 idsf 및 소정의 변수 A로부터, 각 레인지 변환 스펙트럼의 양자화 정밀도 인덱스 idwl을 이하의 표 3에 도시하는 바와 같이 일의적으로 결정한다.
Figure 112006096879706-PCT00004
이 표 3으로부터 알 수 있듯이, 정규화 계수 인덱스 idsf가 1개 작아지면 양자화 정밀도 인덱스 idwl도 1개 작아져, 게인이 최대 6㏈ 내려간다. 이것은, 정규화 계수 인덱스 idsf가 X이며 양자화 정밀도가 B인 경우의 절대 SNR(Signal to Noise Ratio)을 SNRabs로 하였을 때, 정규화 계수 인덱스 idsf가 X-1인 경우에 동등한 SNRabs를 얻기 위해서는 대략 B-1의 양자화 정밀도가 필요해지고, 또한 정규화 계수 인덱스 idsf가 X-2인 경우에는 마찬가지로 대략 B-2의 양자화 정밀도가 필요로 되는 것에 주목한 것이다. 구체적으로, 정규화 계수가 4, 2, 1이며, 양자화 정밀도 인덱스 idwl이 3, 4, 5, 6인 경우에서의 절대 최대 양자화 오차를 이하의 표 4에 나타낸다.
이 표 4로부터 알 수 있듯이, 정규화 계수가 4, 양자화 정밀도 인덱스 idwl이 5일 때의 절대 최대 양자화 오차(=0.129)는, 정규화 계수가 2, 양자화 정밀도 인덱스 idwl이 4일 때의 절대 최대 양자화 오차(=0.133)와 대략 동일한 값으로 되어 있다. 또한, 양자화 정밀도 인덱스 idwl이 a일 때의 양자화 스텝 nsteps를 2^a로 하면 B, B-1, B-2는 상호 완전히 일치하지만, 여기에서는 상술한 표 1과 마찬가지로 양자화 스텝 nsteps를 2^a-1로 하고 있기 때문에, 약간의 오차가 발생하고 있다.
상술한 변수 A란, 최대의 정규화 계수 인덱스 idsf에 대하여 할당되는 최대 양자화 비트수(최대 양자화 정보)를 나타내고 있고, 이 값은 부가 정보로서 부호열에 포함된다. 또한, 후술하지만, 이 변수 A로서는 우선 규격상 얻을 수 있는 최대의 양자화 비트수를 설정하고, 부호화의 결과, 총 사용 비트수가 총 사용 가능 비트수를 상회하는 경우에는, 순차적으로 뒤로 물린다.
이 변수 A의 값이 17비트인 경우에서, 레인지 변환 스펙트럼마다의 정규화 계수 인덱스 idsf와 양자화 정밀도 인덱스 idwl의 관계를 나타내는 테이블의 일례를 이하의 표 5에 나타낸다. 이 표5에서 동그라미로 둘러싸여 있는 숫자는, 레인지 변환 스펙트럼마다 결정된 양자화 정밀도 인덱스 idwl을 나타내는 것으로 한다.
Figure 112006096879706-PCT00006
표 5에 나타내는 바와 같이, 정규화 계수 인덱스 idsf가 최대인 31인 경우에는 최대 양자화 비트수인 17비트에서 양자화가 행해지고, 예를 들면 정규화 계수 인덱스 idsf가 최대의 정규화 계수 인덱스 idsf보다 2만큼 작은 29인 경우에는 15비트에서 양자화가 행해진다.
여기에서, 해당하는 정규화 계수 인덱스 idsf가 최대의 정규화 계수 인덱스idsf보다도 17 이상 작은 경우에는 양자화 비트가 마이너스로 되게 되지만, 그 경우에는 0비트로 하한을 설정하는 것으로 한다. 또한, 정규화 계수 인덱스 idsf에는 5비트가 공급되기 때문에, 이 표 5에서 양자화 비트수가 0비트로 된 경우라도, 부호 비트만 1비트에서 기술함으로써 평균 SNR로서 3㏈의 정밀도로 스펙트럼 정보를 기록하는 것도 가능하지만, 이와 같은 부호 비트의 기록은 필수적이지는 않다.
이상과 같이 하여, 정규화 계수 인덱스 idsf로부터 각 레인지 변환 스펙트럼의 양자화 정밀도 인덱스를 일의적으로 결정한 경우에서의 스펙트럼의 포락선 (a) 및 노이즈 플로어 (b)를 도 7에 도시한다. 도 7에 도시하는 바와 같이, 이 경우의 노이즈 플로어는 대략 평탄해진다. 즉, 인간의 청감상 중요한 저역에 대해서도 청감상 중요하지 않은 고역에 대해서도 똑같은 양자화 정밀도로 양자화를 행하고 있기 때문에, 잡음감은 최소로 되지 않는다.
따라서, 본 실시 형태에서의 양자화 정밀도 결정부(13)는, 실제로는 레인지 변환 스펙트럼마다 정규화 계수 인덱스 idsf에 가중치 부여를 행하고, 이 가중치 부여된 정규화 계수 인덱스 idsf를 이용하여 상술한 바와 같이 양자화 정밀도 인덱스 idwl을 결정한다.
구체적으로는, 우선 이하의 표 6에 나타내는 바와 같이, 각 레인지 변환 스펙트럼의 정규화 계수 인덱스 idsf에 대하여 가중 계수 Wn[i](i=0∼N/2-1)을 가산하여, 새로운 정규화 계수 인덱스 idsfl을 생성한다.
Figure 112006096879706-PCT00007
이 표 6의 예에서는, 저역의 정규화 계수 인덱스 idsf에는 4 내지 1의 값을 가산하고, 고역의 정규화 계수 인덱스 idsf에는 아무것도 가산하고 있지 않다. 이 결과, 정규화 계수 인덱스 idsf의 최대값이 35로 되기 때문에, 표 5의 테이블을 정규화 계수 인덱스 idsf의 최대 가산수인 4만큼 큰 방향으로 단순히 확장하였다고 하면, 예를 들면 이하의 표 7과 같아진다. 이 표 7에서, 파선의 동그라미로 둘러싸여 있는 숫자는 가중치 부여를 행하지 않은 경우에 레인지 변환 스펙트럼마다 결정된 양자화 정밀도 인덱스 idwl을 나타내고, 실선의 동그라미로 둘러싸여 있는 숫자는 가중치 부여를 행하는 경우에 레인지 변환 스펙트럼마다 결정된 양자화 정밀도 인덱스 idwl1을 나타내는 것으로 한다.
Figure 112006096879706-PCT00008
이 표 7의 예에서는, 저역의 양자화 정밀도가 향상되지만, 최대 양자화 비트수(최대 양자화 정보)가 증가하여 총 사용 비트수가 증가하기 때문에, 총 사용 비트수가 총 사용 가능 비트수를 초과하게 될 가능성이 있다. 따라서, 현실적으로는 총 사용 비트수가 총 사용 가능 비트수에 들어가도록 비트 조정을 행하는 결과, 예를 들면 이하의 표 8에 도시하는 바와 같은 테이블로 된다. 이 예에서는, 최대 양자화 비트수(최대 양자화 정보)를 표 7의 21로부터 19로 감소시킴으로써, 총 사용 비트수를 조정하고 있다.
Figure 112006096879706-PCT00009
표 5에서 결정되는 양자화 정밀도 인덱스와 표 8에서 결정되는 양자화 정밀도 인덱스 idwl1을 비교하면 이하의 표 9와 같이 된다.
Figure 112006096879706-PCT00010
이 표 9로부터 알 수 있듯이, 인덱스가 0부터 3인 레인지 변환 스펙트럼의 양자화 정밀도가 향상되고 있는 한편으로, 인덱스가 6이상의 레인지 변환 스펙트럼의 양자화 정밀도가 감소하고 있다. 이와 같이, 정규화 계수 인덱스 idsf에 대하여 가중 계수 Wn[i]를 가산함으로써, 저역에 비트를 집중시켜 인간의 청각에 중요한 대역의 음질을 향상시킬 수 있다.
본 실시 형태에서는, 이 가중 계수 Wn[i]를 테이블화한 가중 계수 테이블 Wn[]을 미리 복수 가져 두거나, 또는 모델링 수식 및 파라미터를 복수 가져 두어 순차적으로 가중 계수 테이블 Wn[]을 생성하거나 하고, 일정한 기준을 기초로 음원의 특징(주파수 에너지, 과도 특성, 게인, 마스킹 특성 등)을 판정하여, 최적으로 판단되는 가중 계수 테이블 Wn[]을 이용한다. 이 판정 처리의 플로우차트를 도 8 및 도 9에 도시한다.
가중 계수 테이블 Wn[]을 미리 복수 가져 두는 경우, 우선 도 8의 스텝 S20에서, 스펙트럼 신호 또는 시간 영역의 오디오 신호를 해석하고, 특징량(주파수 에너지, 과도 특성, 게인, 마스킹 특성 등)을 추출한다. 다음으로 스텝 S21에서, 이 특징량을 바탕으로 가중 계수 테이블 Wn[]을 선택하고, 스텝 S22에서, 선택한 가중 계수 테이블 Wn[]의 인덱스와 가중 계수 Wn[i](i=0∼N/2-1)를 출력한다.
한편, 모델링 수식 및 파라미터를 복수 가져 두어 순차적으로 가중 계수 테이블 Wn[]을 생성하는 경우, 우선 스텝 S30에서, 스펙트럼 신호 또는 시간 영역의 오디오 신호를 해석하여, 특징량(주파수 에너지, 과도 특성, 게인, 마스킹 특성 등)을 추출한다. 다음으로 스텝 S31에서, 이 특징량을 바탕으로 모델링 수식 fn(i)를 선택하고, 스텝 S32에서, 이 모델링 수식 fn(i)의 파라미터 a, b, c, …를 선택한다. 여기에서, 모델링 수식 fn(i)란, 레인지 변환 스펙트럼의 순서와 파라미터 a, b, c, …로 이루어지는 다항식으로, 예를 들면 하기의 수학식 2와 같이 나타내어진다.
Figure 112006096879706-PCT00011
계속하여 스텝 S33에서, 이 모델링 수식 fn(i)를 계산하여 가중 계수 테이블 Wn[]을 생성하고, 모델링 수식 fn(i)의 인덱스 및 파라미터 a, b, c, …와 가중 계수 Wn[i](i=0∼N/2-1)을 출력한다.
또한, 이 가중 계수 테이블 Wn[]을 선택할 때의 「일정한 기준」은 절대적인 것이 아니고, 각 신호 부호화 장치에서 임의로 설정 가능한 것이다. 신호 부호화 장치에서는, 선택된 가중 계수 테이블 Wn[]의 인덱스, 또는 모델링 수학식 fn(i)의 인덱스 및 파라미터 a, b, c, …를 부호열 중에 포함시킨다. 신호 복호 장치에서는, 이 가중 계수 테이블 Wn[]의 인덱스, 또는 모델링 수식 fn(i)의 인덱스 및 파라미터 a, b, c, …에 따라 양자화 정밀도를 재계산하기 위해, 기준이 서로 다른 신호 부호화 장치에 의해 생성된 부호열과의 호환성은 유지된다.
이상과 같이 하여, 정규화 계수 인덱스 idsf에 가중치 부여를 행한 새로운 정규화 계수 인덱스 idsf로부터 각 레인지 변환 스펙트럼의 양자화 정밀도 인덱스를 일의적으로 결정한 경우에서의 스펙트럼의 포락선 (a) 및 노이즈 플로어 (b)의 일례를 도 10에 도시한다. 가중 계수 Wn[i]를 전혀 가산하지 않은 경우의 노이즈 플로어는 직선 ACE이며, 가중 계수 Wn[i]를 가산한 경우의 노이즈 플로어는 직선 BCD로 된다. 즉, 노이즈 플로어를 직선 ACE로부터 직선 BCD로 변형시키는 것이 가중 계수 Wn[i]이다. 이 도 10의 예에서는, 삼각형 CDE의 비트를 삼각형 ABC에 분배한 결과, 삼각형 ABC의 SNR은 향상되어, 노이즈 플로어가 상승 직선으로 되어 있다. 또한, 이 예에서는 간단히 하기 위해 삼각형을 이용하여 설명하고 있지만, 가중 계수 테이블 Wn[], 또는 모델링 수식 및 파라미터의 취득 방법에 의해, 노이즈 플로어를 임의의 형태로 변형시키는 것이 가능하다.
여기에서, 종래의 양자화 정밀도의 결정 처리와 본 실시 형태에서의 양자화 정밀도의 결정 처리를 도 11 및 도 12에 도시한다.
종래에서는, 우선 스텝 S40에서, 정규화 계수 인덱스 idsf에 따라 양자화 정밀도를 결정하고, 스텝 S41에서, 스펙트럼의 개수 정보, 정규화 정보, 양자화 정보 및 스펙트럼 정보를 부호화할 때에 필요로 되는 총 사용 비트수를 계산한다. 계속하여 스텝 S42에서, 총 사용 비트수가 총 사용 가능 비트수 이하인지의 여부를 판별하고, 총 사용 비트수가 총 사용 가능 비트수 이하인 경우(예)에는 처리를 종료하고, 그렇지 않은 경우(아니오)에는 스텝 S40으로 되돌아가 양자화 정밀도를 다시 결정한다.
한편, 본 실시 형태에서는, 우선 스텝 S50에서, 상술된 바와 같이 가중 계수 테이블 Wn[]을 결정하고, 스텝 S51에서, 정규화 계수 인덱스 idsf에 가중 계수 Wn[i]를 가산하여 새로운 정규화 계수 인덱스 idsf1을 생성한다. 계속하여 스텝 S52에서, 정규화 계수 인덱스 idsf1에 따라 양자화 정밀도 인덱스 idwl1을 일의적 으로 결정하고, 스텝 S53에서, 스펙트럼의 개수 정보, 정규화 정보, 가중치 정보 및 스펙트럼 정보를 부호화할 때에 필요로 되는 총 사용 비트수를 계산한다. 계속하여 스텝 S54에서, 총 사용 비트수가 총 사용 가능 비트수 이하인지의 여부를 판별하여, 총 사용 비트수가 총 사용 가능 비트수 이하인 경우(예)에는 처리를 종료하고, 그렇지 않은 경우(아니오)에는 스텝 S50으로 되돌아가 가중 계수 테이블 Wn[]을 다시 결정한다.
도 11에 따라서 양자화 정밀도를 결정한 경우에서의 부호열과 도 12에 따라서 양자화 정밀도를 결정한 경우에서의 부호열을 각각 도 13의 (a), (b)에 도시한다. 도 13에 도시하는 바와 같이, 가중 계수 테이블 Wn[]을 사용함으로써, 종래, 양자화 정보의 부호화에 필요했던 비트수보다도 적은 비트수로 가중치 정보(최대 양자화 정보를 포함함)를 부호화할 수 있기 때문에, 잉여 비트를 스펙트럼 정보의 부호화에 사용할 수 있다.
또한, 상술한 가중 계수 테이블 Wn[]은, 신호 복호 장치의 규격을 결정한 단계부터는 변경이 불가능하게 되게 된다. 이 때문에, 다음과 같은 구조를 미리 조립해 두는 것으로 한다.
우선, 상술한 예에서의 최대 양자화 비트수는 최대의 정규화 계수 인덱스idsf에 대하여 공급되는 양자화 비트수이며, 이는 총 사용 비트수가 총 사용 가능 비트수를 초과하지 않는 가장 가까운 값이 설정된다. 이것을, 총 사용 비트수가 총 사용 가능 비트수에 대하여 여유를 갖도록 설정한다. 예를 들면 표 8을 예로 들면, 최대 양자화 비트수는 19비트이지만, 이것을 10비트 등의 작은 값으로 정해 둔다. 이 경우, 잉여 비트가 다량으로 발생하는 부호열이 생성되지만, 그 시점에서의 신호 복호 장치에서는 그 데이터는 기각될 뿐이다. 차세대의 신호 부호화 장치, 신호 복호 장치에서는, 이 잉여 비트를 새롭게 결정된 규격에 따라 배분하여 부호화/복호하면 되기 때문에, 후방 호환성은 확보할 수 있다고 하는 이점이 있다. 구체적으로는, 예를 들면 도 14의 (a)에 도시하는 바와 같은 어느 신호 복호 장치에서도 복호 가능한 부호열에 사용하는 비트수를 삭감하고, 잉여 비트를 도 14의 (b)에 도시하는 바와 같이, 새로운 가중치 정보와 그 가중치 정보를 이용하여 부호화한 새로운 스펙트럼 정보에 분배할 수 있다.
다음으로, 본 실시 형태에서의 신호 복호 장치의 개략 구성을 도 15에 도시한다. 또한, 도 15에 도시하는 신호 복호 장치(2)에서의 복호 처리의 수순을 도 16의 플로우 차트에 도시한다. 이하, 도 15를 참조하면서, 도 16의 플로우차트에 대해 설명한다.
도 16의 스텝 S60에서, 부호열 복호부(20)는, 소정 단위 시간(프레임)마다 부호화된 부호열을 입력하고, 스텝 S61에서, 이 부호열을 복호한다. 이 때, 부호열 복호부(20)는, 복호한 스펙트럼의 개수 정보, 정규화 정보 및 가중치 정보(최대 양자화 정보를 포함함)를 양자화 정밀도 복원부(21)에 공급하고, 양자화 정밀도 복원부(21)는, 이들 정보에 기초하여 양자화 정밀도 인덱스 idwl1을 복원한다. 또한, 부호열 복호부(20)는, 복호한 개수 정보 및 양자화 스펙트럼 신호를 역양자화부(22)에 공급하고, 복호한 개수 정보 및 정규화 정보를 역정규화부(24)에 공급한다.
이 스텝 S61에서의 부호열 복호부(20) 및 양자화 정밀도 복원부(21)의 처리에 대해, 도 17의 플로우차트를 이용하여 더 상세히 설명한다. 우선 스텝 S70에서 개수 정보를 복호하고, 스텝 S71에서 정규화 정보를 복호하고, 스텝 S72에서 가중치 정보를 복호한다. 다음으로 스텝 S73에서, 정규화 정보를 복호하여 얻어진 정규화 계수 인덱스 idsf에 가중 계수 Wn을 가산하여 정규화 계수 인덱스 idsf를 생성하고, 스텝 S74에서, 이 정규화 계수 인덱스 idsf로부터 양자화 정밀도 인덱스 idwl1을 일의적으로 복원한다.
도 16으로 되돌아가 스텝 S62에서, 역양자화부(22)는, 양자화 정밀도 복원부(21)로부터 공급된 양자화 정밀도 인덱스 idwl1에 기초하여 양자화 스펙트럼 신호를 역양자화하여, 레인지 변환 스펙트럼 신호를 생성한다. 역양자화부(22)는, 이 레인지 변환 스펙트럼 신호를 역레인지 변환부(23)에 공급한다.
계속하여 스텝 S63에서, 역레인지 변환부(23)는, 0.0∼±1.0의 범위로 레인지 변환되어 있던 레인지 변환 스펙트럼의 값을 ±0.5∼±1.0의 범위로 역레인지 변환하여 정규화 스펙트럼 신호를 생성한다. 역레인지 변환부(23)는, 이 정규화 스펙트럼 신호를 역정규화부(24)에 공급한다.
계속하여 스텝 S64에서, 역정규화부(24)는, 정규화 정보를 복호하여 얻어진 정규화 계수 인덱스 idsf를 이용하여 정규화 스펙트럼 신호를 역정규화하여, 얻어진 스펙트럼 신호를 주파수-시간 변환부(25)에 공급한다.
계속하여 스텝 S65에서, 주파수-시간 변환부(25)는, 역정규화부(24)로부터 공급된 스펙트럼 신호를 역MDCT에 의해 시간 영역의 오디오 신호(PCM 데이터 등)로 변환하여, 스텝 S66에서, 이 오디오 신호를 출력한다.
마지막으로 스텝 S67에서, 오디오 신호의 최후의 부호열인지의 여부가 판별되어, 최후의 부호열인 경우(예)에는 복호 처리를 종료하고, 그렇지 않은 경우(아니오)에는 스텝 S60으로 되돌아가 다음 프레임의 부호열을 입력한다.
이상 설명한 바와 같이, 본 실시 형태에서의 신호 부호화 장치(1) 및 신호 복호 장치(2)에 의하면, 신호 부호화 장치(1)에서, 각 스펙트럼의 값에 의존하여 비트를 할당할 때에 청각 특성을 이용한 가중 계수 Wn[i]를 준비하고, 이 가중 계수 Wn[i]에 관한 가중치 정보를 정규화 계수 인덱스 idsf나 양자화 스펙트럼 신호와 함께 부호화하여 부호열에 포함시키고, 신호 복호 장치(2)에서는, 이 부호열을 복호하여 얻어진 가중 계수 Wn[i]를 이용하여 양자화 스펙트럼마다의 양자화 정밀도를 복원하고, 이 양자화 정밀도에 따라서 양자화 스펙트럼 신호를 역양자화함으로써, 재생 시의 잡음감을 최소화할 수 있다.
또한, 본 실시 형태에서는, 임계 대역이라고 하는 개념을 갖지 않고, 모든 스펙트럼을 각각 정규화 계수로 정규화하고, 그 정규화 계수를 모두 부호화하여 부호열에 포함시킨다. 이와 같이, 임계 대역마다가 아닌 스펙트럼마다 정규화 계수의 기록이 필요해지기 때문에, 정보 효율이라고 하는 점에서는 불리하지만, 절대 정밀도적으로는 매우 유리하다. 단, 스펙트럼마다 정규화 계수를 구함으로써, 인접하는 스펙트럼끼리의 정규화 계수에 존재하는 높은 상관을 이용한 효율적인 가역압축 조작이 가능하기 때문에, 임계 대역을 이용하는 경우와 비교하여 일방적으로 정보 효율이 불리하다고 하는 것은 아니다.
또한, 본 발명은, 도면을 참조하여 설명한 상술한 실시예에 한정되는 것은 아니고, 첨부한 청구의 범위 및 그 주지를 일탈하지 않고, 다양한 변경, 치환 또는 그 동등한 것을 행할 수 있음은 당업자에게 있어 분명하다.
상술한 본 발명에 따르면, 신호 부호화 장치에서, 각 주파수 성분의 값에 의존하여 비트를 할당할 때에 청각 특성을 이용한 가중 계수를 준비하고, 이 가중 계수에 관한 가중치 정보를 정규화 계수의 인덱스나 양자화 스펙트럼 신호와 함께 부호화하여 부호열에 포함시키고, 신호 복호 장치로는, 이 부호열을 복호하여 얻어진 가중 계수를 이용하여 주파수 성분마다의 양자화 정밀도를 복원하고, 이 양자화 정밀도에 따라서 양자화 스펙트럼을 역양자화함으로써, 재생 시의 잡음감을 최소화할 수 있다.

Claims (16)

  1. 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하는 스펙트럼 변환 수단과,
    상기 각 스펙트럼 신호에 대하여, 소정의 스텝폭을 갖는 복수의 정규화 계수 중 어느 하나를 선택하고, 선택한 정규화 계수를 이용하여 상기 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하는 정규화 수단과,
    상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하는 양자화 정밀도 결정 수단과,
    상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하는 양자화 수단과,
    상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 부호열을 생성하는 부호화 수단
    을 구비하는 것을 특징으로 하는 신호 부호화 장치.
  2. 제1항에 있어서,
    상기 양자화 정밀도 결정 수단은, 상기 오디오 신호 또는 상기 스펙트럼 신호의 특징에 기초하여 상기 가중 계수를 결정하는 것을 특징으로 하는 신호 부호화 장치.
  3. 제2항에 있어서,
    상기 양자화 정밀도 결정 수단은, 상기 가중 계수가 테이블화된 가중 계수 테이블을 복수 갖고 있고,
    상기 오디오 신호 또는 상기 스펙트럼 신호의 특징에 기초하여 상기 복수의 가중 계수 테이블 중 어느 하나를 선택하여 상기 가중 계수를 결정하고,
    상기 부호화 수단은, 선택된 가중 계수 테이블의 인덱스를 부호화하는 것을 특징으로 하는 신호 부호화 장치.
  4. 제2항에 있어서,
    상기 양자화 정밀도 결정 수단은, 상기 스펙트럼 신호마다의 가중 계수를 결정하기 위한 모델링 수식을 복수 갖고 있고, 상기 오디오 신호 또는 상기 스펙트럼 신호의 특징에 기초하여 상기 복수의 모델링 수식 중 어느 하나를 선택함과 함께 선택된 모델링 수식의 파라미터를 결정하여 상기 가중 계수를 결정하고,
    상기 부호화 수단은, 선택된 모델링 수식의 인덱스 및 해당 모델링 수식의 파라미터를 부호화하는 것을 특징으로 하는 신호 부호화 장치.
  5. 제1항에 있어서,
    상기 양자화 정밀도 결정 수단은, 상기 가산 결과가 최대로 되는 스펙트럼 신호에 대한 양자화 정밀도가 규격상 최대의 양자화 정밀도로 되도록 상기 각 정규 화 스펙트럼 신호의 양자화 정밀도를 결정하고, 상기 부호화 수단에 의한 부호화의 결과, 총 사용 비트수가 총 사용 가능 비트수를 상회하는 경우에는, 총 사용 비트수가 총 사용 가능 비트수 이하로 되도록 상기 각 정규화 스펙트럼 신호의 양자화 정밀도를 순차적으로 뒤로 물리는 것을 특징으로 하는 신호 부호화 장치.
  6. 제1항에 있어서,
    상기 정규화 계수의 인덱스가 1씩 증감하면 상기 양자화 정밀도가 1비트씩 증감하는 것을 특징으로 하는 신호 부호화 장치.
  7. 제1항에 있어서,
    상기 정규화 계수는 2배씩의 스텝폭을 갖고 있고,
    상기 정규화 수단은, 각 스펙트럼 신호의 값보다도 크고 또한 각 스펙트럼 신호의 값에 가장 가까운 정규화 계수를 이용하여, 각 스펙트럼 신호의 값을 ±0.5 내지 ±1.0의 범위로 정규화하는 것을 특징으로 하는 신호 부호화 장치.
  8. 제7항에 있어서,
    ±0.5 내지 ±1.0의 범위로 정규화된 각 정규화 스펙트럼 신호를 0 내지 ±1.0의 범위로 레인지 변환하는 레인지 변환 수단을 더 구비하는 것을 특징으로 하는 신호 부호화 장치.
  9. 제1항에 있어서,
    상기 양자화 정밀도 결정 수단은, 상기 부호화 수단에 의한 부호화의 결과, 총 사용 비트수가 총 사용 가능 비트수를 하회하여 잉여 비트가 발생하도록 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정함과 함께, 상기 정규화 계수의 인덱스에 대하여 새로운 신호 복호 장치에서만 복호 가능한 새로운 가중 계수를 스펙트럼 신호마다 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 새로운 양자화 정밀도를 결정하고,
    상기 부호화 수단은, 상기 잉여 비트를 이용하여, 상기 새로운 양자화 정밀도에 따라서 양자화된 양자화 스펙트럼 신호 및 상기 새로운 가중 계수를 더 부호화하는 것을 특징으로 하는 신호 부호화 장치.
  10. 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하는 스펙트럼 변환 공정과,
    상기 각 스펙트럼 신호에 대하여, 소정의 스텝폭을 갖는 복수의 정규화 계수 중 어느 하나를 선택하고, 선택한 정규화 계수를 이용하여 상기 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하는 정규화 공정과,
    상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하는 양자화 정밀도 결정 공정과,
    상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하는 양자화 공정과,
    상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 부호열을 생성하는 부호화 공정
    을 갖는 것을 특징으로 하는 신호 부호화 방법.
  11. 제10항에 있어서,
    상기 양자화 정밀도 결정 공정에서는, 상기 오디오 신호 또는 상기 스펙트럼 신호의 특징에 기초하여 상기 가중 계수를 결정하는 것을 특징으로 하는 신호 부호화 방법.
  12. 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하고, 소정의 스텝폭을 갖는 복수의 정규화 계수 중 어느 하나를 이용하여, 상기 각 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하고, 상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하고, 상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하고, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 생성한 부호열을 복호하여 상기 오디오 신호를 복원하는 신호 복호 장치로서,
    상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중치 정 보를 적어도 복호하는 복호 수단과,
    상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 수단과,
    상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 수단과,
    상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 수단과,
    상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역 스펙트럼 변환 수단
    을 구비하는 것을 특징으로 하는 신호 복호 장치.
  13. 제12항에 있어서,
    상기 정규화 계수의 인덱스가 1씩 증감하면 상기 양자화 정밀도가 1비트씩 증감하는 것을 특징으로 하는 신호 복호 장치.
  14. 제12항에 있어서,
    상기 정규화 계수는 2배씩의 스텝폭을 갖고, 상기 정규화에서는, 각 스펙트럼 신호의 값보다도 크고 또한 각 스펙트럼 신호의 값에 가장 가까운 정규화 계수를 이용하여, 각 스펙트럼 신호의 값을 ±0.5 내지 ±1.0의 범위로 정규화하고, 이 ±0.5 내지 ±1.0의 범위로 정규화된 각 정규화 스펙트럼 신호를 0 내지 ±1.0의 범위로 레인지 변환하고 있고,
    상기 0 내지 ±1.0의 범위로 레인지 변환된 각 정규화 스펙트럼 신호의 값을 ±0.5 내지 ±1.0의 범위로 복원하는 역레인지 변환 수단을 더 구비하는 것을 특징으로 하는 신호 복호 장치.
  15. 입력된 시간 영역의 오디오 신호를 소정 단위 시간마다 주파수 영역의 스펙트럼 신호로 변환하고, 소정의 스텝폭을 갖는 복수의 정규화 계수 중 어느 하나를 이용하여, 상기 각 스펙트럼 신호를 정규화하여 정규화 스펙트럼 신호를 생성하고, 상기 정규화에 이용한 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 결정하고, 상기 양자화 정밀도에 따라서 상기 각 정규화 스펙트럼 신호를 양자화하여 양자화 스펙트럼 신호를 생성하고, 상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중 계수에 관한 가중치 정보를 적어도 부호화하여 생성한 부호열을 복호하여 상기 오디오 신호를 복원하는 신호 복호 방법으로서,
    상기 양자화 스펙트럼 신호, 상기 정규화 계수의 인덱스 및 상기 가중치 정보를 적어도 복호하는 복호 공정과,
    상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 공정과,
    상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 공정과,
    상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 공정과,
    상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역스펙트럼 변환 공정
    을 갖는 것을 특징으로 하는 신호 복호 방법.
  16. 입력된 부호열을 복호하여 시간 영역의 오디오 신호를 복원하는 신호 복호 방법으로서,
    양자화 스펙트럼 신호, 정규화 계수의 인덱스 및 가중치 정보를 적어도 복호 하는 복호 공정과,
    상기 정규화 계수의 인덱스에 대하여 스펙트럼 신호마다 상기 가중치 정보로부터 결정된 가중 계수를 가산하고, 그 가산 결과에 기초하여 각 정규화 스펙트럼 신호의 양자화 정밀도를 복원하는 양자화 정밀도 복원 공정과,
    상기 각 정규화 스펙트럼 신호의 양자화 정밀도에 따라서 상기 양자화 스펙트럼 신호를 역양자화하여 정규화 스펙트럼 신호를 복원하는 역양자화 공정과,
    상기 정규화 계수를 이용하여 상기 각 정규화 스펙트럼 신호를 역정규화하여 스펙트럼 신호를 복원하는 역정규화 공정과,
    상기 스펙트럼 신호를 변환하여 상기 소정 단위 시간마다의 오디오 신호를 복원하는 역 스펙트럼 변환 공정
    을 갖는 것을 특징으로 하는 신호 복호 방법.
KR1020067027378A 2004-06-28 2005-05-31 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 KR101143792B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004190249A JP4734859B2 (ja) 2004-06-28 2004-06-28 信号符号化装置及び方法、並びに信号復号装置及び方法
JPJP-P-2004-00190249 2004-06-28
PCT/JP2005/009939 WO2006001159A1 (ja) 2004-06-28 2005-05-31 信号符号化装置及び方法、並びに信号復号装置及び方法

Publications (2)

Publication Number Publication Date
KR20070029755A true KR20070029755A (ko) 2007-03-14
KR101143792B1 KR101143792B1 (ko) 2012-05-15

Family

ID=35778495

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067027378A KR101143792B1 (ko) 2004-06-28 2005-05-31 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법

Country Status (6)

Country Link
US (1) US8015001B2 (ko)
EP (3) EP1768104B1 (ko)
JP (1) JP4734859B2 (ko)
KR (1) KR101143792B1 (ko)
CN (1) CN101010727B (ko)
WO (1) WO2006001159A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
KR101390433B1 (ko) * 2009-03-31 2014-04-29 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
US8224978B2 (en) * 2009-05-07 2012-07-17 Microsoft Corporation Mechanism to verify physical proximity
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method
CN102263576B (zh) * 2010-05-27 2014-06-25 盛乐信息技术(上海)有限公司 无线信息传输方法及实现设备
JP2012103395A (ja) 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
WO2012137617A1 (ja) * 2011-04-05 2012-10-11 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP2014102308A (ja) * 2012-11-19 2014-06-05 Konica Minolta Inc 音響出力装置
US8855303B1 (en) * 2012-12-05 2014-10-07 The Boeing Company Cryptography using a symmetric frequency-based encryption algorithm
EP3079151A1 (en) * 2015-04-09 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and method for encoding an audio signal

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69217590T2 (de) 1991-07-31 1997-06-12 Matsushita Electric Ind Co Ltd Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals
JP2558997B2 (ja) * 1991-12-03 1996-11-27 松下電器産業株式会社 ディジタルオーディオ信号の符号化方法
JP3513879B2 (ja) * 1993-07-26 2004-03-31 ソニー株式会社 情報符号化方法及び情報復号化方法
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH08129400A (ja) * 1994-10-31 1996-05-21 Fujitsu Ltd 音声符号化方式
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH10240297A (ja) * 1996-12-27 1998-09-11 Mitsubishi Electric Corp 音響信号符号化装置
DE69940918D1 (de) * 1998-02-26 2009-07-09 Sony Corp Verfahren und vorrichtung zur kodierung/dekodierung sowie programmaufzeichnungsträger und datenaufzeichnungsträger
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
AU2001284513A1 (en) 2000-09-11 2002-03-26 Matsushita Electric Industrial Co., Ltd. Encoding apparatus and decoding apparatus
JP4508490B2 (ja) * 2000-09-11 2010-07-21 パナソニック株式会社 符号化装置および復号化装置
JP2002221997A (ja) * 2001-01-24 2002-08-09 Victor Co Of Japan Ltd オーディオ信号符号化方法
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP4005906B2 (ja) 2002-12-09 2007-11-14 大成建設株式会社 掘削撹拌装置及び地盤改良方法
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法

Also Published As

Publication number Publication date
JP2006011170A (ja) 2006-01-12
CN101010727B (zh) 2011-07-06
CN101010727A (zh) 2007-08-01
KR101143792B1 (ko) 2012-05-15
EP1768104A1 (en) 2007-03-28
JP4734859B2 (ja) 2011-07-27
WO2006001159A1 (ja) 2006-01-05
US8015001B2 (en) 2011-09-06
EP1768104B1 (en) 2016-09-21
EP3096316B1 (en) 2019-09-25
EP1768104A4 (en) 2008-04-02
EP3096316A1 (en) 2016-11-23
US20080015855A1 (en) 2008-01-17
EP3608908A1 (en) 2020-02-12

Similar Documents

Publication Publication Date Title
KR101143792B1 (ko) 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
ES2762325T3 (es) Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
US7283967B2 (en) Encoding device decoding device
JP4548348B2 (ja) 音声符号化装置及び音声符号化方法
US9548056B2 (en) Signal adaptive FIR/IIR predictors for minimizing entropy
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20010050959A1 (en) Encoder and communication device
JP5609591B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP3519859B2 (ja) 符号器及び復号器
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP4635709B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JP4024185B2 (ja) デジタルデータ符号化装置
JP5018557B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
JP4609097B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
JP2002141805A (ja) 符号化器および通信デバイス
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP3930596B2 (ja) 音声信号符号化方法
JP2005196029A (ja) 符号化装置及び方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150422

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160422

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170421

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180420

Year of fee payment: 7