KR20080102027A - 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 - Google Patents
오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 Download PDFInfo
- Publication number
- KR20080102027A KR20080102027A KR1020070048302A KR20070048302A KR20080102027A KR 20080102027 A KR20080102027 A KR 20080102027A KR 1020070048302 A KR1020070048302 A KR 1020070048302A KR 20070048302 A KR20070048302 A KR 20070048302A KR 20080102027 A KR20080102027 A KR 20080102027A
- Authority
- KR
- South Korea
- Prior art keywords
- mode
- symbol
- encoding
- encoder
- bit string
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000013179 statistical model Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 abstract description 20
- 238000013139 quantization Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000000926 separation method Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000287107 Passer Species 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
오디오 신호의 무손실 부호화/복호화 장치 및 그 방법이 개시된다. 오디오 신호의 무손실 부호화 장치는 제1 심볼을 직접 부호화하는 제1 부호화기, 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈, 제1 부호화기와 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기, 및 부호화 모드에 대응하여 제1 심볼을 부호화하여 출력하는 제2 선택기로 이루어진다. 이에 따르면, 오디오 신호의 부호화 성능을 향상시킬 수 있다.
Description
도 1a는 일반적인 오디오 부호화기의 일 실시예의 구성을 나타낸 블록도이고, 도 1b는 일반적인 오디오 복호화기의 일 실시예의 구성을 나타낸 블럭도,
도 2은 본 발명의 일실시예에 따른 무손실 부호화 장치의 구성을 나타낸 블럭도,
도 3은 도 2에 도시된 제2 선택기의 세부적인 구성을 나타낸 블럭도,
도 4는 본 발명의 일 실시예에 따른 무손실 부호화 방법의 동작을 나타낸 흐름도,
도 5는 도 4에 도시된 440 단계의 세부적인 동작을 나타낸 흐름도,
도 6은 본 발명의 일 실시예에 따른 무손실 복호화 장치의 구성을 나타낸 블럭도,
도 7은 본 발명의 일 실시예에 따른 무손실 복호화 방법의 동작을 나타낸 흐름도, 및
도 8은 본 발명의 일 실시예에 따른 무손실 부호화 장치의 성능과 종래 기술에 따른 무손실 부호화 장치의 성능을 비교한 테이블이다.
본 발명은 오디오 신호의 부호화 및/또는 복호화에 관한 것으로, 보다 상세하게는 주파수 계수의 양자화 인덱스를 무손실 부호화/복호화하는 장치 및 그 방법에 관한 것이다.
도 1a는 MP3(MPEG-1 Audio Layer 3), AAC(Advanced Audio Coding) 코덱 등에서 널리 사용되고 있는 일반적인 오디오 부호화기의 일실시예의 구성을 도시한 블럭도이다. 도 1a를 참조하면, 오디오 부호화기는 주파수 변환부(100), 심리음향 분석부(110), 양자화부(120), 및 무손실 부호화부(130)를 포함한다.
주파수 변환부(100)는 오디오 신호를 주파수 영역으로 변환시켜 주파수 계수(spectral coefficients)를 생성한다. 심리음향 분석부(110)는 오디오 신호의 청각적 특성을 분석하여 오디오 신호에 대한 매스킹 정보를 생성한다. 양자화부(120)는 주파수 계수를 양자화하여 주파수 계수의 양자화 인덱스를 출력하고, 이때 매스킹 정보에 따라 각 주파수 대역별로 양자화 규격을 결정하고, 결정된 양자화 규격에 따라 주파수 계수를 양자화한다. 양자화부(120)는 양자화 성능을 향상시키기 위하여 예측 양자화 등의 다양한 양자화 기법을 사용할 수 있다. 무손실 부호화부(130)는 주파수 계수의 양자화 인덱스를 부호화하여 비트열(bitstream)을 생성한다. 비트열은 저장 매체 또는 통신 채널을 통하여 전송된다.
도 1b는 도 1a에 도시된 오디오 부호화기에 대응되는 일반적인 오디오 복호화기의 일실시예의 구성을 도시한 블럭도이다. 도 1b를 참조하면, 오디오 복호화 기는 무손실 복호화부(140), 역양자화부(150), 및 주파수 역변환부(160)를 포함한다.
무손실 복호화부(140)는 저장 매체 또는 통신 채널을 통하여 전송된 비트열을 복호화하여 양자화 인덱스를 추출한다. 역양자화부(150)는 양자화 인덱스를 역양자화하여 주파수 계수를 구한다. 주파수 역변환부(160)는 주파수 계수를 시간 영역으로 변환시켜 최종 오디오 신호를 복원한다.
상기한 오디오 부호화기에 있어서, 무손실 부호화시 부호화할 입력 데이터를 일반적으로 심볼이라고 하고, 입력 심볼과 출력 부호 사이에서 역변환이 가능하고(즉, 출력 부호로부터 입력 심볼의 복원이 가능), 추가적인 왜곡이 발생하지 않는 경우를 무손실 부호화라고 한다. 오디오 부호화기에서 채용하는 무손실 부호화의 목표는 주어진 입력 심볼들을 최소의 비트 양으로 부호화하는 것이다. 일반적으로 주파수 계수의 양자화 인덱스를 심볼로 사용하여 무손실 부호화하는 경우, 허프만 부호화(Huffman coding) 또는 산술 부호화(Arithmetic coding) 등의 엔트로피 부호화 방법을 사용한다.
오디오 신호의 주파수 특성은 오디오 신호의 종류에 따라 많은 차이를 가지고, 동일한 종류의 오디오 신호에서도 프레임별로 매우 변화가 심하게 나타난다. 또한, 일반적인 오디오 신호의 주파수 계수는 주파수 대역에 따라 특성의 변화가 나타나며, 예로 저주파 대역과 고주파 대역의 주파수 계수는 서로 상이한 특성을 가진다. 무손실 부호화의 성능을 향상시키기 위하여 심볼의 특성에 적합한 통계 모델을 사용하여야 하고, 주어진 심볼과 통계 모델이 맞지 않으면 부호화 성능이 급격히 저하된다. 그러나, 상술한 바와 같이 오디오 신호에는 매우 다양한 성질을 가지는 심볼이 혼합되어 있고, 이를 하나의 통계 모델로 부호화하게 되면 각각의 세부적인 심볼 특성을 반영하지 못하여 무손실 부호화의 성능 저하를 초래한다.
따라서 심볼의 특성이 다양하게 변하는 환경에서의 부호화 성능을 향상시키기 위한 기술이 필요하다. 일반적인 허프만 부호화에서 이 문제를 해결하는 방법은 다수의 허프만 테이블을 제공하는 것이다. 즉, 서로 다른 통계 모델에 의한 허프만 테이블을 다수 만들고, 입력 심볼에 적합한 통계 모델에 의한 허프만 테이블을 선택하여 부호화하는 것이다. 이때, 각 심볼에서 선택한 허프만 테이블 정보 전달을 위한 오버헤드 비트(overhead bit)를 필요로 하므로 각 심볼마다 허프만 테이블을 선택하는 것은 비효율적이기 때문에, 일반적으로 심볼을 다수의 그룹으로 나누고 각 그룹별로 허프만 테이블을 선택하는 방법을 사용한다. 이 기술에 의하면 그룹별 오버헤드 비트가 추가로 필요하지만 각 그룹에 적합한 통계 모델을 사용하게 되어 전체 부호화 비트 수는 감소하는 효과를 얻을 수 있다.
상기한 방법은, 모든 그룹에 대하여 동일한 부호화 방법을 적용하고 단지 통계 모델만 선택적으로 사용하는 것이다. 그러나, 만일 서로 다른 부호화 방법 중에서 각 그룹의 심볼에 가장 적합한 부호화 방법을 선택하고, 선택된 부호화 방법에서 다시 적절한 통계 모델을 선택하여 부호화하면 단순히 통계 모델만을 선택하는 것에 비하여 부호화 성능을 향상시킬 수 있다. 이와 같은 방법에서는, 주어진 각각의 부호화 방법이 근본적인 차이를 가지고 있고, 그에 따라 한 가지 방법에서는 성능이 저하되지만 다른 방법으로 부호화하면 성능이 향상되는 효과를 얻어야 한다. 따라서, 만일 허프만 부호화와 산술 부호화 중에서 선택하는 단순한 방법을 사용하면 두 방법이 모두 심볼을 직접 엔트로피 부호화하는 동일한 방법을 사용하므로 부호화 방법 선택의 효과를 얻기 어렵다.
이와 같이 유사한 성질의 부호화 방법을 다수 사용하여 선택하는 것은 성능 향상에 한계가 있으며, 부호화 방법의 선택을 통하여 성능 향상의 극대화를 얻기 위하여 성질이 다른 새로운 부호화 방법을 포함하여야 한다. 예로, 심볼값의 크기를 부호화하는 종래기술의 부호화방법 대신에 심볼의 진행 흐름을 새로운 심볼로 변환하여 부호화하는 새로운 부호화 방법을 필요로 하는 것이다.
본 발명이 이루고자 하는 기술적 과제는, 동일한 부호화 왜곡을 가지면서 적은 비트 수를 갖는 비트열로 오디오 신호를 압축하여 오디오 부호화기의 성능을 향상시킬 수 있는 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 오디오 신호의 무손실 부호화/복호화 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 오디오 신호의 무손실 부호화 장치는, 제1 심볼을 직접 부호화하는 제1 부호화기; 상기 제1 심볼을 제2 심볼로 변환하고, 상기 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제 2 부호화기 모듈; 상기 제1 부호화기와 상기 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기; 및 상기 부호화 모드에 대응하여 상기 제1 심볼을 부호화하여 출력하는 제2 선택기를 포함한다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 오디오 신호의 무손실 부호화 방법은, 제1 심볼을 직접 부호화하는 단계; 상기 제1 심볼을 제2 심볼로 변환하고, 상기 제2 심볼을 부호화하는 단계; 상기 제1 심볼의 부호화 결과와 상기 제2 심볼의 부호화 결과를 비교하고, 비교 결과에 따라서 부호화 모드를 결정하는 단계; 및 상기 부호화 모드에 대응하여 상기 제1 심볼을 부호화하는 단계를 포함한다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 오디오 신호의 무손실 복호화 장치는, 전송된 선택 모드를 해석하여, 해석 결과에 따라서 비트열을 나누어 제공하는 선택 모드 해석부; 상기 선택 모드에 대응하여 상기 선택 모드 해석부로부터 제공되는 비트열을 직접 복호화하여 제1 심볼을 복원하는 제1 복호화기; 부호 역변환 과정과 심볼 역변환 과정을 수행하는 복수의 제2 복호화기를 포함하며, 상기 선택 모드에 포함된 영역 모드에 대응하여 상기 선택 모드 해석부로부터 제공되는 비트열을 상기 선택 모드에 포함된 식별 모드에 해당하는 제2 복호화기로 복호화하는 제2 복호화기 모듈; 및 상기 선택 모드에 대응하여 상기 제1 복호화기의 복호화 결과와 상기 제2 복호화기의 복호화 결과를 결합하여 상기 제1 심볼을 복원하는 결합기를 포함한다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 오디오 신호의 무손실 복호화 방법은, 전송된 선택 모드를 해석하여, 해석 결과에 따라서 비트열을 나누어 제1 복호화기와 부호 역변환 과정과 심볼 역변환 과정을 수행하는 제2 복호화기로 제공하는 단계; 상기 선택 모드에 대응하여 상기 제1 복호화기로 제공되는 비트열을 직접 복호화하여 제1 심볼을 복원하는 단계; 상기 선택 모드에 포함된 영역 모드에 대응하여 상기 선택 모드 해석부로부터 제공되는 비트열을 상기 선택 모드에 포함된 식별 모드에 해당하는 제2 복호화기로 복호화하는 단계; 및 상기 선택 모드에 대응하여 상기 제1 복호화기의 복호화 결과와 상기 제2 복호화기의 복호화 결과를 결합하여 상기 제1 심볼을 복원하는 단계를 포함한다.
이하에서, 첨부된 도면들을 참조하여 본 발명에 따른 무손실 부호화/복호화 장치 및 그 방법에 대해 상세히 설명한다.
본 발명의 일 실시예에서는 도 1a 또는 도 1b와 같은 구조를 갖는 오디오 부호화기 또는 오디오 복호화기를 가정하며, 주파수 계수의 양자화 인덱스를 심볼로 입력하는 무손실 부호화 또는 복호화 동작을 가정한다. 본 발명에 의한 개념과 동작을 주파수 계수가 아닌 임의의 데이터에 적용하는 것도 가능하며, 본 발명에서 언급하는 주파수 계수는 본 발명의 일 실시예에 불과하며 본 발명의 범위는 모든 입력 심볼에 대한 동작을 포함한다.
본 발명에 의한 무손실 부호화의 일 실시예에서는, 부호화할 제1 심볼이 주어질 때, 제1 부호화기는 제1 심볼을 직접 허프만 부호화 또는 산술 부호화하고, 제2 부호화기는 제 1 심볼을 특정 규칙에 따라 제2 심볼로 변환하고 제2 심볼을 다양한 통계 모델을 적용하여 부호화한다.
한편, 제2 부호화기의 일 실시예에서는 다음 수학식 1에 의하여 제1 심볼 x[n]에 대하여 레벨 k에 대한 비트값 Qk[n]을 구하고, 각 레벨의 비트값 Qk[n]을 연결하여 1차원 비트열 B[i]을 생성하여 제2 심볼을 생성하거나, 1차원 비트열을 다시 런(Run) 길이열 B[m]으로 변환하여 제2 심볼을 생성한다. 여기서 n은 제1 심볼의 각 구성요소를 나타내는 변수이고, i와 m은 제2 심볼의 구성요소를 나타내는 변수이다. 한편, 비트값을 생성할 때 각 레벨마다 두가지의 방향을 사용할 수 있으며, 각 방향에 따라서 1차원 비트열과 런 길이열이 다르고, 그에 따라 부호화에 필요한 비트수가 다르게 된다. 따라서, 모든 레벨에서 비트 나열방향을 선택하거나, 각 레벨의 비트값을 1차원으로 연결하는 순서를 서로 달리함으로써, 다양한 1차원 비트열을 생성하는 것도 가능하다. 예를 들어, 제1 심볼이 주파수 계수의 양자화 인덱스인 경우 특정 레벨에서 주파수가 증가하는 방향으로 비트를 나열하고 다음 레벨에서는 주파수가 감소하는 방향으로 나열하여 인접한 레벨에서 비트 나열방향이 반대가 되도록 할 수 있다. 제2 부호화기는 이와 같이 생성된 제2 심볼을 부호화한다. 이때, 제2 부호화기는 1차원 비트열에 대하여 각 비트값에 해당하는 레벨에 따라 서로 다른 통계 모델을 적용하여 부호화하는 것도 가능하다. 또한, 제2 부호화기는 1차원 비트열에서 비트를 다수의 그룹으로 분리하고, 각 그룹별로 서로 다른 통계 모델을 적용하여 부호화하는 것도 가능하다.
한편, 1차원 비트열 B[i]로부터 제1 심볼 x[n]은 다음 수학식 2 및 3에 의해 복원한다.
부호화기의 성능 향상을 위하여 심볼을 다수의 그룹으로 분리하고 각 그룹별로 부호화기를 선택하여 사용하는 기술이 사용된다. 예로, 다수의 허프만 테이블을 사용하고 각 그룹별로 최적의 허프만 테이블을 선택하여 허프만 부호화한다.
각 그룹별로 부호화기를 결정하기 위하여 각 그룹의 심볼을 다수의 부호화기로 각각 부호화하여 적은 비트 수를 사용하는 방법을 해당 그룹의 부호화기로 정하는 것이 가장 기초적인 방법이다. 일반적으로 그룹의 수가 증가하면 각 그룹의 부호화기의 정보 전송을 위한 오버헤드 비트 수가 증가하여 오히려 부호화기 선택에 의하여 성능이 저하되게 되므로 그룹을 적절하게 정하는 것이 중요하다. 더욱이, 상기 수학식 1을 사용하는 제2 부호화기는 제1 심볼의 정보를 카운터 방향으로 나 열하여 비트열을 생성하므로 제1 심볼의 진행 패턴이 매우 중요한 정보로 활용된다. 따라서, 특정 그룹에 매우 적은 수의 제1 심볼이 포함되면 해당 심볼의 흐름 성질을 제2 부호화기에서 반영하기 어렵고 그에 따라 부호화기 선택의 효과가 감소된다. 또한, 서로 이웃하지 않는 심볼 그룹에 대하여 제2 부호화기 방법을 적용하면 실제로 연결이 되지 않은 심볼들의 정보를 1차원 비트열로 연결하게 되므로 제2 부호화기의 성능이 저하된다. 이상과 같은 문제점을 해결하기 위하여 이웃한 제1 심볼로 구성된 큰 그룹에 대하여서만 제2 부호화기를 적용하는 제한된 선택 방법을 사용하는 것이 바람직하다.
본 발명에 의한 무손실 부호화의 일 실시예에서는, 두 단계의 선택 구조를 사용한다. 제1 단계에서는 먼저 일반적인 제1 부호화기의 동작에서 정의된 규칙에 따라 제1 심볼을 다수의 그룹으로 나누고, 각 그룹별로 제1 심볼에 대한 제1 부호화기 동작을 수행하며, 이때 제1 부호화기는 각 그룹별로 최적의 통계 모델을 선택하여 사용한다. 다음, 그룹 구분없이 모든 제 1 심볼을 제2 심볼로 변환한 후 부호화한다. 이때, 심볼 변환 방법 또는 통계 모델에 따른 부호 변환 방법 중 적어도 하나를 달리하는 다수의 제2 부호화기를 모두 동작시키고 최적의 제2 부호화기를 선택한다. 다음, 제1 및 제2 부호화기의 성능을 비교하여 우수한 성능의 부호화기를 결정하며, 제1 부호화기가 선택된 경우를 부호화 모드 0, 제2 부호화기가 선택된 경우를 부호화 모드 1이라 한다.
제2 단계의 동작은 다음과 같다. 제1 단계에서 부호화 모드 0이 선택되면 제2 단계는 그대로 통과하고, 이 경우 모든 제1 심볼이 일반적인 제1 부호화기로 부호화 된다. 만일 제1 단계에서 부호화 모드 1이 선택되면 제1 심볼의 전체 그룹을 그룹 순서에 따라 3개 영역으로 다시 분리하고, 앞과 뒤 영역은 제1 부호화기로, 중간 영역은 다수의 제2 부호화기로 부호화한다. 마찬가지로, 서로 다른 다수의 제2 부호화기는 심볼 변환 방법 또는 통계 모델에 따른 부호 변환 방법 중 적어도 하나를 달리하여 구분된다. 가능한 모든 영역 분리 구조의 각각에 대하여, 중간 영역에 다수의 제2 부호화기를 적용하여 최적의 성능을 가지는 제2 부호화기를 선택하고, 그 결과를 해당 영역 분리 구조에 대한 제2 부호화기의 성능이라 정의한다. 다음, 각 영역 분리 구조마다 앞과 뒤 영역을 제1 부호화기로 부호화할 때 필요한 비트 수를 계산하여 모든 영역의 부호화에 필요한 전체 부호화 비트 수를 측정하여 최적의 성능을 가지는 영역 분리 구조를 검색한다. 이와 같이 하면, 제2 부호화기는 중간의 연속된 그룹의 제1 심볼을 그룹 구분 없이 연결하여 제2 심볼로 변환하여 부호화하고, 제2 부호화기가 적용되는 심볼은 반드시 연속된 심볼이 되어 제2 부호화기가 요구하는 특성을 만족한다.
제2 단계에서 검색하는 부호화 모드 1에 대한 영역 분리 구조의 경우의 수는 매우 다양하게 결정될 수 있으며, 본 발명의 일 실시예에서는 다음 표 1과 같이 결정한다. 여기서, N은 총 그룹 수이고, 각 영역에 포함되는 그룹을 정의한다.
영역 분리 구조 | 제1 부호화기를 적용하는 앞 영역에 포함된 그룹 | 제2 부호화기를 적용하는 중간 영역에 포함된 그룹 | 제1 부호화기를 적용하는 뒤 영역에 포함된 그룹 |
영역 모드 1.0 | - | 0 ~ N-1 | - |
영역 모드 1.1 | - | 0 ~ N-2 | N-1 |
영역 모드 1.2 | - | 0 ~ N-3 | N-2, N-1 |
영역 모드 1.3 | 0 | 1 ~ N-1 | - |
영역 모드 1.4 | 0 | 1 ~ N-2 | N-1 |
영역 모드 1.5 | 0 | 1 ~ N-3 | N-2, N-1 |
영역 모드 1.6 | 0, 1 | 2 ~ N-1 | - |
영역 모드 1.7 | 0, 1 | 2 ~ N-2 | N-1 |
영역 모드 1.8 | 0, 1 | 2 ~ N-3 | N-2, N-1 |
영역 모드 1.9 | 0, 1, 2 | 3 ~ N-1 | - |
영역 모드 1.10 | 0, 1, 2 | 3 ~ N-2 | N-1 |
영역 모드 1.11 | 0, 1, 2 | 3 ~ N-3 | N-2, N-1 |
영역 모드 1.12 | 0, 1, 2, 3 | 4 ~ N-1 | - |
영역 모드 1.13 | 0, 1, 2, 3 | 4 ~ N-2 | N-1 |
영역 모드 1.14 | 0, 1, 2, 3 | 4 ~ N-3 | N-2, N-1 |
영역 모드 1.15 | 0, 1, 2, 3, 4 | 5 ~ N-1 | - |
상기의 경우, 앞 영역에는 최대 5개의 그룹에서 제1 부호화 방법의 사용이 가능하고, 뒤 영역에는 최대 2개의 그룹에서 제1 부호화 방법의 사용이 가능하고, 총 16 가지의 영역 분리 구조에 대하여 최적의 구조를 선택한다.
상기 예를 구현하기 위하여 필요한 오버헤드 비트는 다음과 같다. 여기서, 제2 부호화기는 하나만 있고 제2 부호화기 선택을 위한 오버헤드 비트는 없다고 가정한다. 또한, 제1 부호화기는 일반적으로 AAC에서 사용하는 허프만 부호화를 사용한다고 가정하고 비트를 구한다. AAC에서 1024개의 주파수 계수는 다수의 주파수 대역으로 분리되고, 동일한 허프만 테이블을 사용하는 주파수 대역을 묶어 섹션을 정의한다. 본 발명에서는 이렇게 정의된 섹션을 하나의 그룹으로 정의하여 사용한다. 단, 설명을 간단하게 하기 위하여 각 그룹은 최대 32개의 주파수 대역으로 구성된다고 가정하고, 따라서 각 그룹을 정의하기 위하여 5 비트를 필요로 한다. 또한, 제1 부호화기를 사용하는 그룹은 사용하는 허프만 테이블을 정의하기 위하여 4 비트를 소비하므로, 결국 제1 부호화기를 사용하는 그룹마다 4 + 5 = 9 오버헤드 비트가 필요하다. 따라서 만일 제1 단계에서 부호화 모드 0가 선택되면 오버헤드 비트는 1 비트이고, 부호화 모드 1 이 선택되면 다음 표 2과 같이 가변적인 추가 오버헤트 비트가 필요하다.
오버헤드 비트 종류 | 용도 | 비트 수 |
제 1 비트군 | 부호화 모드 0, 부호화 모드 1 구분 | 1 |
제 2 비트군 | 영역 모드 1.0 ~ 영역 모드 1.15 구분 | 4 |
제 3 비트군 | 제1 부호화 방법을 적용하는 그룹 정의 | 그룹 수 * 5 |
제 4 비트군 | 제1 부호화 방법을 적용하는 그룹에서 사용하는 허프만 테이블 | 그룹 수 * 4 |
따라서, 부호화 모드와 영역 모드에 따라 필요한 오버헤드 비트 수는 변하며, 최소 1 비트(기본 모드 0 선택)에서 최대 59 비트(서브 모드 1.14 선택)가 필요하다. 그러나 부호화방법의 선택에 의하여 오버헤드 비트 이상의 비트 감소가 가능하므로 전체적으로 본 발명에 의한 무손실 부호화장치를 사용하여 무손실 부호화의 성능을 향상시킬 수 있다.
도 2는 본 발명의 일실시예에 따른 무손실 부호화장치의 구성을 나타낸 블럭도이다. 도 2를 참조하면, 무손실 부호화장치는 제1 부호화기(200), 제2 부호화기 모듈(210), 제1 선택기(250), 및 제2 선택기(260)를 포함한다.
제1 부호화기(200)는 입력되는 제1 심볼을 일반적인 무손실 부호화방법에 따라서 최적 부호화하고, 그 결과 제1 그룹 정보, 제1 그룹별 비트열, 제1 그룹별 비트 수를 출력한다. 제1 그룹 정보는 제1 부호화기(210)의 동작에서 제1 심볼을 다수의 그룹으로 나누는 그룹 구조를 정의한다.
제2 부호화기 모듈(210)은 다수의 제2 부호화기(220)를 포함하고, 각 제2 부호화기(220)는 심볼 변환기(230)과 부호 변환기(240)로 구성된다. 심볼 변환기(230)는 제1 심볼을 입력하여 상기 수학식 1의 방법에 따라 비트열로 변환하거나, 비트열을 다시 런 길이로 변환하는 방법을 포함하는 다양한 방법을 사용하여 제2 심볼을 구하여 출력한다. 부호 변환기(240)는 각각 상이한 통계 모델을 사용하여 제2 심볼을 부호화하여 제2 비트열과 제2 비트 수를 출력한다. 서로 다른 제2 부호화기(220)는 심볼 변환기(230)의 심볼 변환 방법 또는 부호 변환기(240)의 부호 변환 방법 중에서 적어도 하나를 달리하여 구분된다. 여기서, 부호 변환 방법은 적용되는 통계 모델에 따라서 달라질 수 있다.
제1 선택기(250)는 제1 부호화기(200)에 의한 제1 그룹별 비트 수의 총 그룹 합과, 다수의 제2 부호화기(220)에 의한 각 제2 비트 수를 비교하여 최소 비트 수를 가지는 부호화기를 선택하고, 선택 결과에 따라서 부호화 모드를 결정하여 출력한다. 즉, 부호화 모드는 제1 부호화기(200)의 성능이 우수함을 나타내는 부호화 모드 0와 제2 부호화기(220)의 성능이 우수함을 나타내는 부호화 모드 1로 이루어진다.
제2 선택기(260)는 입력된 부호화 모드에 따라서 전술한 제2 단계의 선택 과정을 수행하여 최종 선택 모드와 최종 비트열을 출력한다. 이때, 제2 선택기(260)로부터 출력되는 최종 선택 모드는 부호화 모드 0인 경우 부호화 모드에 대한 정보 즉 표 1의 제1 비트군을 포함하고, 최종 비트열은 제1 부호화기(200)에 의한 비트열로 이루어진다. 한편, 제2 선택기(260)로부터 출력되는 최종 선택 모드는 부호화 모드 1인 경우 부호화 모드에 대한 정보 즉 표 2의 제1 비트군, 영역 모드 즉 표 2의 제2 비트군과 해당 영역 모드에 대한 제2 부호화기(220)의 식별 모드를 포함하고, 최종 비트열은 해당 영역 모드에 대응하여 선택되는 제1 부호화기(200)에 의한 비트열 중 앞과 뒤영역에 해당하는 비트열과 제2 부호화기(220)에 의한 비트열 즉, 중간 영역에 해당하는 비트열로 이루어진다. 각 최종 선택 모드는 표 2의 제3 비트군과 제4 비트군을 포함한다.
도 3은 도 2에 도시된 제2 선택기(260)의 세부적인 구성을 나타낸 블럭도이다. 도 3을 참조하면, 제2 선택기(260)는 바이패스기(300), 세부 모드 결정기(310), 및 출력기(350)를 포함한다. 세부 모드 결정기(310)는 영역 구분기(320), 다수의 제3 부호화기 모듈(330-1~330-R), 및 제3 선택기(340)를 포함한다.
바이패스기(300)는 제1 부호화기(200)로부터 제공되는 제1 그룹별 비트열과, 제1 선택기(250)로부터 제공되는 부호화 모드를 입력하여 바이패스시킨다. 바이패스기(300)는 부호화 모드를 제1 중간 선택 모드로 출력하고, 제1 그룹별 비트열을 제1 중간 비트열로 출력한다.
세부 모드 결정기(310)는 제1 심볼에 대한 복수개의 영역 모드 각각에 대하여, 중간 영역에 다수의 제2 부호화기를 적용하여 최적의 성능을 가지는 제2 부호화기의 식별 모드를 결정하고, 각 영역 모드마다 앞과 뒤 영역을 제1 부호화기로 부호화할 때 필요한 비트 수를 계산하여 모든 영역의 부호화에 필요한 전체 부호화 비트 수를 측정하여 최적의 성능을 가지는 영역 모드를 결정한다.
구체적으로, 영역 구분기(320)는 제1 심볼과, 제1 부호화기(200)로부터 제공되는 제1 그룹 정보와, 제1 선택기(250)로부터 제공되는 부호화 모드를 입력하고, 부호화 모드 1 일 경우 즉, 제2 부호화기가 선택된 경우 동작한다. 영역 구분기(320)는 제1 그룹 정보에 따라서 전체 그룹을 앞, 중간, 뒤의 3 영역으로 다시 나누며, 이때 앞 영역은 0개부터 최대 p 개 그룹, 뒤 영역은 0개부터 최대 q 개 그룹을 포함하도록 한다. 이와 같이 하여 총 (p+1)×(q+1) 종류의 영역 모드가 결정되며, 이로부터 실제로 검색에 사용할 R ≤ (p+1)×(q+1) 가지의 영역 모드를 정의한다. 즉, 각 영역 모드는 중간의 연결된 그룹 구조를 정의하므로 시작 그룹과 끝 그룹에 의해 정의되며, 총 R 개의 서로 다른 시작-끝 조합을 가진다. 이에 따라서, 영역 구분기(320)는 제1 심볼 중에서 R 종류의 영역 모드에 포함되는 R 종류의 제3 심볼을 각각 정의하여 출력한다.
R 종류의 제3 부호화기 모듈(330-1~330-R)는 각각에 해당하는 제3 심볼을 입력하여 제2 부호화기 모듈(210)과 동일한 동작을 수행하고, 각각 최적의 성능을 가지는 하나의 제2 부호화기를 선택하고, 선택된 제2 부호화기의 식별 모드를 포함하여 해당하는 제2 중간 비트열과 제1 중간 비트 수를 각각 출력한다.
제3 선택기(340)은 영역 구분기(320)에서 결정된 R 가지의 영역 모드 각각에 대하여, 제1 중간 비트 수와 각 영역 모드에서 제외된 앞과 뒤 영역에 해당하는 제1 그룹별 비트 수, 필요한 오버헤드 비트를 모두 더하여 해당 영역 모드에 필요한 총 비트 수를 구한다. 그리고, R 가지 영역 모드의 비트 수 중에서 최소의 총 비트 수를 가지는 영역 모드를 선택하고, 부호화 모드, 선택된 영역 모드와 제2 부호화기의 식별 모드를 포함하는 제2 중간 선택 모드와 해당되는 제2 중간 비트열을 출력한다.
출력기(350)는 부호화 모드에 따라서, 바이패스기(300)로부터의 제1 중간 선택 모드와 제3 선택기(340)로부터의 제2 중간 선택 모드 중에서 하나를 선택하여 최종 선택 모드로 출력하고, 바이패스기(300)로부터의 제1 중간 비트열과 제3 선택기(340)로부터의 제2 중간 비트열을 조합하여 최종 비트열로 출력한다. 즉, 출력기(350)는 부호화 모드 0이면 제1 중간 선택 모드와 제1 중간 비트열을 각각 최종 선택 모드와 최종 비트열로 출력한다. 한편, 출력기(350)는 부호화 모드 1이면 제2 중간 선택 모드를 최종 선택 모드로 출력하고, 제2 중간 선택 모드에 포함된 영역 모드에 대응하여 제1 중간 비트열 중 앞과 뒤 영역에 해당하는 비트열과 제2 중간 비트열을 결합하여 최종 비트열로 출력한다.
도 4는 본 발명의 일 실시예에 따른 무손실 부호화 방법의 동작을 나타낸 흐름도이다.
400 단계에서는 제1 심볼을 제1 부호화기로 부호화하여 그룹 정보, 비트열, 그룹별 비트 수를 구한다. 410 단계에서는 다수의 제 2 부호화기의 동작에 따라 각각 제1 심볼을 제2 심볼로 변환하고, 제2 심볼을 부호화하여 각각의 비트열과 비트 수를 구한다.
420 단계에서는 400 단계와 410 단계에서 구한 각각의 비트 수를 비교하여 최소 비트 수를 가지는 부호화기를 선택한다. 만일 제1 부호화기가 선택되면, 즉 부호화 모드 0이면 430 단계에서 부호화 모드를 최종 선택 모드로 출력하고 400 단계에서 구한 비트열을 출력한다. 만일 제2 부호화기가 선택되면, 즉 부호화 모드 1이면 440 단계에서 영역 모드와 제2 부호화기의 식별 모드를 포함하는 세부 모드를 결정하고, 영역 모드 및 제2 부호화기의 식별 모드에 따라서 앞과 뒤영역은 제1 부호화기로, 중간 영역은 제2 부호화기로 부호화하여 얻어지는 최종 비트열을 출력한다.
도 5는 도 4에 도시된 440 단계의 세부 동작을 나타낸 흐름도이다.
500 단계에서는 400 단계에서 구한 그룹 정보를 기반으로 하여, 제1 심볼의 전체 그룹을 앞, 중간, 뒤 영역으로 다시 나누고, 앞 영역의 그룹 수와 뒤 영역의 그룹 수에 따라 총 R 가지의 서로 다른 영역 모드를 정의한다. 510 단계에서는 제1 심볼에 대하여 R 가지의 영역 모드에 해당하는 R 가지의 제3 심볼을 정의한다.
520 단계에서는 R 가지의 제3 심볼 각각에 대하여 410 단계와 동일하게 다수의 제2 부호화기 동작을 수행하여 최소의 비트 수를 가지는 제2 부호화기를 선택하고 선택된 제2 부호화기의 식별 모드를 포함하여 해당하는 비트열과 비트 수를 출력한다. 530 단계에서는 R 가지의 영역 모드 각각에 대하여, 520 단계의 비트 수와 해당 영역 모드에서 제외된 앞과 뒤의 그룹들에 해당하는 제1 부호화기의 비트 수와 필요한 오버헤트 비트를 모두 더하여 각 영역 모드별 비트 수를 구한다.
540 단계에서는 각 영역 모드별 비트 수를 비교하여 최소의 비트 수를 가지는 영역 모드를 선택하고, 550 단계에서는 선택된 영역 모드와 제2 부호화기의 식별 모드를 포함하여 최종 선택 모드로 결정하고 해당 비트 열을 출력한다.
도 6은 본 발명의 일실시예에 따른 무손실 복호화 장치의 구성을 나타낸 블럭도이다. 도 6을 참조하면, 무손실 복호화 장치는 선택 모드 해석부(600), 제1 복호화기(610), 제2 복호화기 모듈(630) 및 결합기(660)을 포함한다.
선택 모드 해석부(600)는 전송된 선택 모드와 비트열을 입력하고, 선택 모드를 해석한다. 만약, 선택 모드가 부호화 모드만을 포함하는 경우, 입력된 비트열을 제1 복호화기(610)로 제공한다. 만약, 선택 모드가 부호화 모드와 함께 세부 모드를 포함하는 경우, 입력된 비트열을 선택 모드에 포함된 영역 모드에 따라서 제1 복호화기(610)와 제2 복호화기 모듈(620)로 나누어 제공한다. 즉, 영역 모드에 대응하여, 앞과 뒤 영역은 제1 복호화기(610)로, 중간 영역은 제2 복호화기 모듈(620) 중 해당하는 제2 복호화기(630)로 제공한다.
제1 복호화기(610)는 도 2의 제1 부호화기(200)에 대응되며, 입력된 비트열 전부 또는 입력된 비트열 중 영역 모드에 따른 앞과 뒤 영역에 해당하는 그룹에 대하여 복호화한다. 예로, 선택 모드가 부호화 모드 0인 경우, 입력된 비트열 전부에 대하여 그룹별로 복호화하여 복원된 제1 심볼을 출력하고, 선택 모드가 부호화 모드 1인 경우 영역 모드에 따라서 앞과 뒤 영역에 해당하는 그룹에 대하여 복호화한다.
제2 복호화기 모듈(630)은 도 2의 제2 부호화기 모듈(220)에 대응되며, 다수의 제2 복호화기(640)를 포함한다. 각 제2 복호화기(640)는 부호 역변환기(640)와 심볼 역변환기(650)를 포함하며, 각각 도 2의 부호 변환기(240)와 심볼 변환기(230)에 대응한다. 제2 복호화기 모듈(630)은 선택 모드에 포함된 제2 부호화기의 식별 모드에 따라서 해당하는 중간 영역에 대하여 해당하는 제2 복호화기(630)로 복호화 동작을 수행한다.
결합기(660)는 선택 모드가 부호화 모드 1인 경우 제1 복호화기(610)에서 복호화된 앞과 뒤 영역에 해당하는 그룹과 제2 복호화기(540)에서 복호화된 증간 영역에 해당하는 그룹을 결합하여 복원된 제1 심볼을 출력한다.
도 7은 본 발명의 일실시예에 따른 무손실 복호화방법의 동작을 나타낸 흐름도이다.
700 단계에서는 전송된 선택 모드를 해석하여 선택 모드에 따라서 이원화된 복호화 동작을 수행하도록 비트율을 제공한다. 710 단계에서는 선택 모드가 부호화 모드 0인 경우, 제1 복호화기에 의해 비트열을 그룹별로 복호화하여 제1 심볼을 복원한다. 720 단계에서는 선택 모드가 부호화 모드 1인 경우, 선택 모드에 포함된 영역 모드에 따라서 앞과 뒤 영역에 포함되는 그룹에 대해서는 제1 복호화기로 복호화하고, 중간 영역에 포함되는 그룹에 대해서는 식별 모드에 대응하는 제2 복호화기로 복호화한 다음, 결합하여 제1 심볼을 복원한다.
본 발명에 의한 무손실 부호화 장치의 일 실시예를 실제 주파수 계수에 적용한 결과의 성능과 종래 기술에 의한 무손실 부호화 장치와의 성능을 비교하면 다음과 같다.
두 종류의 서로 다른 특성을 가지는 오디오 입력 신호(입력 #1, 입력 #2)에 대하여 도 1a의 오디오 부호화기의 동작에 따라 프레임 단위로 1024개의 주파수 계수를 구하고 주어진 매스킹 정보에 따라 대역별로 양자화하여 계수의 양자화 인덱스를 구하였다. 다음, 도 2 및 도 3의 동작에 따라 선택적 부호화를 실시하여 도 8의 결과를 얻었다. 이에 따르면, 종래기술에 의한 부호화 성능에 비하여 4.3% 및 0.4% 의 비트 감소 이득을 얻게 되며, 오디오 부호화기 전체의 성능 향상 효과를 제공함을 알 수 있다.
상기한 본 발명은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명에 따르면, 오디오 부호화기에 있어서 매우 다양한 특성의 입력 심볼을 최적의 방법으로 부호화하기 위하여, 동작 구조와 특성이 서로 다른 다수의 무손실 부호화방법을 제공하고, 이들 중에서 입력 심볼의 특성에 적합한 무손실 부호화방법을 선택적으로 사용함으로써, 주파수 계수의 무손실 부호화의 성능을 향상시키므로 동일한 부호화 왜곡을 가지면서 보다 적은 수의 비트열로 오디오 신호를 압축할 수 있다. 또한, 목표 비트 수를 동일하게 할 경우 동일한 압축률을 가지면 왜곡을 감소시켜 오디오 부호화기의 성능을 향상시킬 수 있다.
Claims (25)
- 제1 심볼을 직접 부호화하는 제1 부호화기;상기 제1 심볼을 제2 심볼로 변환하고, 상기 제2 심볼을 부호화하는 복수의 제2 부호화기를 포함하는 제2 부호화기 모듈;상기 제1 부호화기와 상기 복수의 제2 부호화기의 성능을 비교하고, 비교 결과에 따라서 부호화 모드를 출력하는 제1 선택기; 및상기 부호화 모드에 대응하여 상기 제1 심볼을 부호화하여 최종 비트열을 출력하는 제2 선택기를 포함하여 구성되는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 항에 있어서, 상기 제2 부호화기는 상기 제1 심볼에 대하여 각 레벨에 대한 비트값을 구하고, 각 레벨의 비트값을 연결하여 1차원 비트열로 생성하여 상기 제2 심볼을 생성하는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 항에 있어서, 상기 제2 부호화기는 상기 제1 심볼에 대하여 각 레벨에 대한 비트값을 구하고, 각 레벨의 비트값을 연결하여 1차원 비트열로 생성하고, 상기 1차원 비트열을 런 길이열로 변환하여 상기 제2 심볼을 생성하는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 항에 있어서, 상기 복수의 제2 부호화기는 상기 제1 심볼을 상기 제2 심 볼로 변환하는 방법과, 상기 제2 심볼의 부호화에 사용되는 통계모델 중 적어도 한 가지가 서로 다른 것을 특징으로 하는 무손실 부호화 장치.
- 제2 항 또는 제3 항에 있어서, 상기 제2 부호화기는 상기 각 레벨의 비트값을 1차원으로 연결하는 순서 혹은 방향을 서로 달리하여 상기 1차원 비트열을 생성하는 것을 특징으로 하는 무손실 부호화 장치.
- 제2 항 또는 제3 항에 있어서, 상기 제2 부호화기는 상기 1차원 비트열에 대하여 각 비트값에 해당하는 레벨에 따라 서로 다른 통계 모델을 적용하여 상기 제2 심볼을 부호화하는 것을 특징으로 하는 무손실 부호화 장치.
- 제2 항 또는 제3 항에 있어서, 상기 제2 부호화기는 상기 1차원 비트열에서 비트를 다수의 그룹으로 분리하고, 각 그룹별로 서로 다른 통계 모델을 적용하여 상기 제2 심볼을 부호화하는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 항에 있어서, 상기 제2 선택기는상기 부호화 모드와 상기 제1 부호화기로부터의 제1 비트열을 바이패스시키는 바이패스기;상기 제1 심볼에 대하여 최적의 부호화 성능을 갖는 영역 모드와 제2 부호화기의 식별 모드를 결정하고, 결정된 영역 모드와 식별 모드에 대응하여 상기 제2 부호화기로부터의 제2 비트열을 출력하는 세부 모드 결정기; 및상기 부호화 모드, 영역 모드 및 식별모드에 대응하여 상기 제1 비트열과 상기 제2 비트열을 조합하여 상기 최종 비트열로 출력하는 출력기를 포함하는 것을 특징으로 하는 무손실 부호화 장치.
- 제8 항에 있어서, 상기 세부 모드 결정기는상기 제1 심볼을 복수의 영역 모드에 따라서 제1 그룹과 제2 그룹으로 분리하는 영역 구분기;상기 복수의 영역 모드에 대응하여 각 영역 모드에 따른 제2 그룹을 상기 복수의 제2 부호화기로 부호화하는 복수의 제3 부호화기 모듈; 및상기 각 영역 모드에 포함된 제1 그룹에 대한 제1 부호화기의 부호화 결과와 제2 그룹에 대한 상기 제2 부호화기의 부호화 결과, 상기 복수의 영역 모드 중 최소의 비트 수를 발생시키는 영역 모드와 제2 부호화기의 식별 모드를 선택하여 상기 제2 비트열을 출력하는 제3 선택기를 포함하는 것을 특징으로 하는 무손실 부호화 장치.
- 제9 항에 있어서, 상기 영역 구분기는 상기 제1 심볼에 있어서 앞과 뒤 영역을 상기 제1 그룹으로, 나머지 영역을 상기 제2 그룹으로 정의하는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 항에 있어서, 상기 제2 선택기는 선택 모드와 비트열을 출력하며, 선택 모드는 부호화 모드만을 포함하거나, 상기 부호화 모드, 영역 모드, 및 상기 제2 부호화기의 식별 모드를 포함하는 것을 특징으로 하는 무손실 부호화 장치.
- 제1 심볼을 직접 부호화하는 단계;상기 제1 심볼을 제2 심볼로 변환하고, 상기 제2 심볼을 부호화하는 단계;상기 제1 심볼의 부호화 결과와 상기 제2 심볼의 부호화 결과를 비교하고, 비교 결과에 따라서 부호화 모드를 결정하는 단계; 및상기 부호화 모드에 대응하여 상기 제1 심볼을 부호화하여 최종 비트열을 생성하는 단계를 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 제12 항에 있어서, 상기 제2 심볼의 변환단계는상기 제1 심볼에 대하여 각 레벨에 대한 비트값을 구하고, 각 레벨의 비트값을 연결하여 1차원 비트열로 생성하는 단계를 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 제13 항에 있어서, 상기 제2 심볼의 변환단계는상기 1차원 비트열을 런 길이열로 변환하는 단계를 더 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 제13 항 또는 제14 항에 있어서, 상기 제2 심볼의 변환단계는 상기 각 레벨의 비트값을 1차원으로 연결하는 순서 혹은 방향을 서로 달리하여 상기 1차원 비트열을 생성하는 것을 특징으로 하는 무손실 부호화 방법.
- 제12 항에 있어서, 상기 제2 심볼의 부호화 단계는 상기 제2 심볼의 부호화에 사용되는 통계모델을 서로 다르게 하여 수행되는 것을 특징으로 하는 무손실 부호화 방법.
- 제12 항에 있어서, 상기 최종 비트열 생성단계는상기 부호화 모드와 상기 제1 부호화기로부터의 제1 비트열을 바이패스시키는 단계;상기 제1 심볼에 대하여 최적의 부호화 성능을 갖는 영역 모드와 제2 부호화기의 식별 모드를 결정하고, 결정된 영역 모드와 식별 모드에 대응하여 상기 제2 부호화기로부터의 제2 비트열을 생성하는 단계; 및상기 부호화 모드, 영역 모드 및 식별모드에 대응하여 상기 제1 비트열과 상기 제2 비트열을 조합하여 상기 최종 비트열로 생성하는 단계를 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 제17 항에 있어서, 상기 제2 비트열의 생성단계는상기 제1 심볼을 복수의 영역 모드에 따라서 제1 그룹과 제2 그룹으로 분리 하는 단계;상기 복수의 영역 모드에 대응하여 각 영역 모드에 따른 상기 제1 그룹을 직접 부호화하고, 상기 제2 그룹을 상기 제2 심볼로 변환하여 부호화하는 단계; 및상기 각 영역 모드에 포함된 제1 그룹에 대한 부호화 결과와 제2 그룹에 대한 부호화 결과, 상기 복수의 영역 모드 중 최소의 비트 수를 발생시키는 영역 모드와 상기 제2 그룹의 부호화를 위한 식별 모드를 선택하고, 해당하는 상기 제2 비트열을 출력하는 제3 선택기를 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 제18 항에 있어서, 상기 제1 그룹은 상기 제1 심볼에 있어서 앞과 뒤 영역으로, 상기 제2 그룹은 나머지 중간 영역으로 정의하는 것을 특징으로 하는 무손실 부호화 방법.
- 제12 항에 있어서, 상기 제2 비트열의 생성 단계에서는 선택 모드와 최종 비트열을 출력하며, 상기 선택 모드는 부호화 모드만을 포함하거나, 상기 부호화 모드, 영역 모드, 및 부호화기의 식별 모드를 포함하는 것을 특징으로 하는 무손실 부호화 방법.
- 전송된 선택 모드를 해석하여, 해석 결과에 따라서 비트열을 나누어 제공하는 선택 모드 해석부;상기 선택 모드에 대응하여 상기 선택 모드 해석부로부터 제공되는 비트열을 직접 복호화하여 제1 심볼을 복원하는 제1 복호화기;부호 역변환 과정과 심볼 역변환 과정을 수행하는 복수의 제2 복호화기를 포함하며, 상기 선택 모드에 포함된 영역 모드에 대응하여 상기 선택 모드 해석부로부터 제공되는 비트열을 상기 선택 모드에 포함된 식별 모드에 해당하는 제2 복호화기로 복호화하는 제2 복호화기 모듈; 및상기 선택 모드에 대응하여 상기 제1 복호화기의 복호화 결과와 상기 제2 복호화기의 복호화 결과를 결합하여 상기 제1 심볼을 복원하는 결합기를 포함하는 것을 특징으로 하는 무손실 복호화 장치.
- 제21 항에 있어서, 상기 결합기는 상기 영역 모드에 대응하여 상기 제1 심볼에 앞과 뒤 영역은 상기 제1 복호화기로부터, 상기 제1 심볼의 중간 영역은 상기 제2 복호화기로부터 얻어지는 복호화결과를 결합하는 것을 특징으로 하는 무손실 복호화 방법.
- 전송된 선택 모드를 해석하여, 해석 결과에 따라서 비트열을 나누어 제1 복호화기와 부호 역변환 과정과 심볼 역변환 과정을 수행하는 제2 복호화기로 제공하는 단계;상기 선택 모드에 대응하여 상기 제1 복호화기로 제공되는 비트열을 직접 복호화하여 제1 심볼을 복원하는 단계;상기 선택 모드에 포함된 영역 모드에 대응하여 상기 선택 모드 해석부로부 터 제공되는 비트열을 상기 선택 모드에 포함된 식별 모드에 해당하는 제2 복호화기로 복호화하는 단계; 및상기 선택 모드에 대응하여 상기 제1 복호화기의 복호화 결과와 상기 제2 복호화기의 복호화 결과를 결합하여 상기 제1 심볼을 복원하는 단계를 포함하는 것을 특징으로 하는 무손실 복호화 방법.
- 제23 항에 있어서, 상기 결합 단계는 상기 영역 모드에 대응하여 상기 제1 심볼에 앞과 뒤 영역은 상기 제1 복호화 결과를, 상기 제1 심볼의 중간 영역은 상기 제2 복호화 결과를 결합하는 것을 특징으로 하는 무손실 복호화 방법.
- 제12 항 내지 제20 항과, 제23 항 내지 제24 항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070048302A KR100889750B1 (ko) | 2007-05-17 | 2007-05-17 | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 |
US12/101,545 US7605722B2 (en) | 2007-05-17 | 2008-04-11 | Lossless audio coding/decoding apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070048302A KR100889750B1 (ko) | 2007-05-17 | 2007-05-17 | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080102027A true KR20080102027A (ko) | 2008-11-24 |
KR100889750B1 KR100889750B1 (ko) | 2009-03-24 |
Family
ID=40026963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070048302A KR100889750B1 (ko) | 2007-05-17 | 2007-05-17 | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7605722B2 (ko) |
KR (1) | KR100889750B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014182390A1 (en) * | 2013-05-08 | 2014-11-13 | Magnum Semiconductor, Inc. | Systems, apparatuses, and methods for transcoding a bitstream |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7659839B2 (en) * | 2007-08-15 | 2010-02-09 | Ternarylogic Llc | Methods and systems for modifying the statistical distribution of symbols in a coded message |
US8577026B2 (en) | 2010-12-29 | 2013-11-05 | Ternarylogic Llc | Methods and apparatus in alternate finite field based coders and decoders |
AU2004319555A1 (en) * | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding models |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101485339B1 (ko) * | 2008-09-29 | 2015-01-26 | 삼성전자주식회사 | 무손실 부호화/복호화 장치 및 방법 |
JP4764488B2 (ja) * | 2009-03-16 | 2011-09-07 | 株式会社東芝 | デコード装置およびデコード方法 |
EP2237269B1 (en) * | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
CN101609680B (zh) | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
TWI671736B (zh) * | 2011-10-21 | 2019-09-11 | 南韓商三星電子股份有限公司 | 對信號的包絡進行寫碼的設備及對其進行解碼的設備 |
US11790926B2 (en) | 2020-01-28 | 2023-10-17 | Electronics And Telecommunications Research Institute | Method and apparatus for processing audio signal |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
KR100354531B1 (ko) * | 1998-05-06 | 2005-12-21 | 삼성전자 주식회사 | 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템 |
US6223162B1 (en) * | 1998-12-14 | 2001-04-24 | Microsoft Corporation | Multi-level run length coding for frequency-domain audio coding |
US6300888B1 (en) * | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
KR100325999B1 (ko) | 1999-06-09 | 2002-03-07 | 윤종용 | 벽부착형 전자렌지 |
JP2001007704A (ja) | 1999-06-24 | 2001-01-12 | Matsushita Electric Ind Co Ltd | トーン成分データの適応オーディオ符号化方法 |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
KR100355383B1 (ko) | 2001-01-12 | 2002-10-12 | 삼성전자 주식회사 | 광대역 음성 신호 압축을 위한 선택적 부호화 장치 및 그방법 |
KR100908114B1 (ko) * | 2002-03-09 | 2009-07-16 | 삼성전자주식회사 | 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법 |
CN1781253B (zh) * | 2003-06-20 | 2012-01-25 | 日本电信电话株式会社 | 浮点格式的数字信号的无损编码方法、解码方法及其装置 |
EP1662667B1 (en) * | 2003-09-02 | 2015-11-11 | Nippon Telegraph And Telephone Corporation | Floating point signal reversible encoding method, decoding method, device thereof, program, and recording medium thereof |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
AU2004319555A1 (en) * | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding models |
KR100695125B1 (ko) * | 2004-05-28 | 2007-03-14 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
EP1989707A2 (fr) * | 2006-02-24 | 2008-11-12 | France Telecom | Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants |
-
2007
- 2007-05-17 KR KR1020070048302A patent/KR100889750B1/ko not_active IP Right Cessation
-
2008
- 2008-04-11 US US12/101,545 patent/US7605722B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014182390A1 (en) * | 2013-05-08 | 2014-11-13 | Magnum Semiconductor, Inc. | Systems, apparatuses, and methods for transcoding a bitstream |
Also Published As
Publication number | Publication date |
---|---|
US7605722B2 (en) | 2009-10-20 |
KR100889750B1 (ko) | 2009-03-24 |
US20080284623A1 (en) | 2008-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100889750B1 (ko) | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 | |
EP1400954B1 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
KR100561869B1 (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
JP3435674B2 (ja) | 信号の符号化方法と復号方法及びそれを使った符号器及び復号器 | |
JP2002372995A (ja) | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム | |
TW200836492A (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
KR100968057B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
KR20070046752A (ko) | 신호 처리 방법 및 장치 | |
CN102158692A (zh) | 编码方法、解码方法、编码器和解码器 | |
KR100952065B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
JP3475985B2 (ja) | 情報符号化装置および方法、情報復号化装置および方法 | |
JP3557164B2 (ja) | オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体 | |
CN107924683A (zh) | 正弦编码和解码的方法和装置 | |
CN103035249B (zh) | 一种基于时频平面上下文的音频算术编码方法 | |
JPH09135173A (ja) | 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体 | |
JPH0761044B2 (ja) | 音声符号化法 | |
JP4195598B2 (ja) | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム | |
JP3361790B2 (ja) | オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体 | |
KR20080055578A (ko) | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 | |
JP2002374171A (ja) | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム | |
JP4534112B2 (ja) | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム | |
KR100926366B1 (ko) | 코드북 결정 방법, 오디오 신호의 부호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130304 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140303 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |