KR100851715B1 - 데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 - Google Patents
데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 Download PDFInfo
- Publication number
- KR100851715B1 KR100851715B1 KR1020060048065A KR20060048065A KR100851715B1 KR 100851715 B1 KR100851715 B1 KR 100851715B1 KR 1020060048065 A KR1020060048065 A KR 1020060048065A KR 20060048065 A KR20060048065 A KR 20060048065A KR 100851715 B1 KR100851715 B1 KR 100851715B1
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- data
- subband
- samples
- frames
- Prior art date
Links
- 238000007906 compression Methods 0.000 title claims abstract description 18
- 230000006835 compression Effects 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 title claims description 20
- 238000013139 quantization Methods 0.000 claims abstract description 30
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 9
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 9
- 230000006837 decompression Effects 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 18
- 238000013144 data compression Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
디지털 오디오 데이터가 각각이 소정의 개수("16" 내지 "1024" 사이의 범위 내에서 점차 증가함)의 부대역 샘플들을 포함하는 복수의 프레임으로 분할된 후; 음향 심리학적 분석 및 양자화를 통해 압축되어, 압축률이 높고 톤 생성 지연(tone-generation latency)이 적은 압축 데이터가 실현된다. 압축 데이터는 역양자화 및 부대역 합성을 통해 디코딩되고, 이에 따라 디코딩된 데이터는 메모리(예를 들어, FIFO 메모리) 내에 순차적으로 기록된다. 디코딩은 메모리의 현재의 빈 기억용량에 따라 적절하게 수행되거나 멈춰진다.
디지털 오디오 데이터, 부대역 샘플, 프레임, 음향 심리학적 분석, 양자화
Description
도 1은 본 발명의 바람직한 실시예에 따른 데이터 압축 회로를 나타내는 블록도.
도 2는 본 발명의 바람직한 실시예에 따른 데이터 압축해제 회로를 나타내는 블록도.
도 3은 도 2에 나타낸 데이터 압축해제 회로의 전반적인 동작을 나타내는 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
1: 메모리
2: 프레임 분할
3: 제어기
4: 부대역 변환
5: 음향 심리학적 분석
본 발명은 지연이 적은 디지털 오디오 데이터의 압축 및 압축해제를 위한 방법에 관한 것이다.
본 출원은, 그 내용이 본원에 참조로서 포함되는, 일본 특허 출원 번호 제2005-159484호에 대한 우선권을 주장한다.
디지털 오디오 데이터를 압축하기 위한 방법이 MP3(즉, MPEG 오디오 계층 3) 및 MPEG 오디오 AAC(고급 오디오 코딩)와 같은 부대역 코딩뿐만 아니라 ADPCM(즉, 적응형 차분 펄스 코드 변조) 및 LPC(즉, 선형 예측 코딩)에 의해 실현된다는 것이 잘 알려져 있다.
선형 예측 코딩 방법들은 이들이 압축해제(또는 디코딩)로 인한 지연 없이 재생(또는 톤-생성 프로세싱(tone-generation processing))을 시작할 수 있도록 디지털 오디오 데이터를 샘플 단위로 압축하는데, 이에 따라 적은 톤 생성 지연을 실현하지만, 부대역 코딩 방법에 비하여 높은 압축률은 실현되지 않는다. 부대역 코딩 방법들은 복수의 샘플들을 프레임(또는 블록) 단위로 압축하므로, 이 방법들은 선형 예측 코딩 방법에 비하여 높은 압축률을 실현한다. 그러나, 부대역 코딩 방법은 상위 프레임에 포함된 모든 샘플들의 압축해제가 완료되기 전까지 재생을 시작할 수 없으므로, 각각의 프레임에 포함된 샘플의 개수가 커질수록 압축해제 시간은 길어지게 되어, 톤 생성 지연을 증가시킨다. 일본 특허 제2734323호 및 국제 공개 공보 WO99/29133라 명명된 문헌은 높은 압축 성능을 보장하면서 톤 생성 지연의 개선을 실현하는 데이터 압축 방법을 제시하고 있다.
본 발명의 목적은 톤 생성 지연이 적은 디지털 오디오 데이터의 압축 및 압축해제를 위한 방법을 제공하는 것이다.
본 발명의 제1 양태에서, 데이터 압축은 일련의 샘플링 데이터를 n개의 프레임으로 분할한 후(각각의 프레임에 포함된 샘플의 개수는 제1 프레임으로부터 제k 프레임으로 가면서 점차 증가하며, 1<k<n(k 및 n은 정수)임); 각각의 프레임에 포함된 샘플링 데이터가 복수의 부대역 신호(다음에 음향 심리학적 분석을 통해 양자화됨)로 분할되어, 압축 데이터를 생성하는 방식으로 수행된다.
구체적으로, 디지털 오디오 데이터가 각각이 소정의 개수(음악 선율의 발성부(attack portion)에 따라 "16" 내지 "1024" 사이의 범위 내에서 점차 증가함)의 부대역 샘플들을 포함하는 복수의 프레임으로 분할되고; 각각의 프레임이 음향 심리학적 분석 및 양자화를 통해 압축되어, 이에 따라 톤 생성 지연이 적은 압축 데이터가 생성된다.
본 발명의 제2 양태에서, 데이터 압축해제는 각각이 압축 데이터에 대응하는 복수의 부대역 신호를 포함하는 n개의 프레임을 사용하여 수행되고 (각각의 프레임에 포함된 샘플의 개수는 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하며, 1<k<n(k 및 n은 정수)임); 그 후 압축 이전의 일련의 샘플링 데이터를 재생하기 위해 압축 데이터가 프레임 단위로 디코딩되어, 샘플링 데이터가 메모리에 순차적으로 기록되는데, 여기서 디코딩은 메모리의 빈 기억용량에 따라 제어된다.
구체적으로, 압축 데이터는 역양자화 및 부대역 합성(synthesis)을 통해 프레임 단위로 디코딩된다. 디코딩된 데이터는 메모리(예를 들어, FIFO 메모리)에 순차적으로 기록되는데, 여기서 디코딩은 메모리의 현재의 빈 기억용량에 따라 적절하게 수행되거나 멈춰지거나 한다.
본 발명의 이러한 및 다른 목적, 양태 및 실시예들은 다음의 도면을 참조하여 보다 상세하게 설명될 것이다.
본 발명은 첨부된 도면들을 참조하여 예시를 통해 보다 상세하게 설명될 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 데이터 압축 회로의 구성을 나타내는 블록도이다. 도 1의 데이터 압축 회로는 디지털 오디오 데이터를 압축하기 위한 부대역 코딩 방법을 채용한다. 디지털 오디오 데이터를 사용하여 음악 선율의 재생을 처리하기 위해, 데이터 압축 회로는 음악 선율의 발성부(또는 상부)에 따라 하나의 프레임에 포함되는 샘플의 개수가 다양하도록 설계된다(도 1의 하단에 나타낸 바 그래프 참조). 즉, 하나의 프레임에 포함되는 샘플의 개수가 고정적인 1024로 설정된 종래의 부대역 코딩 방법과는 달리, 본 발명의 실시예는 하나의 프레임에 포함되는 샘플의 개수가 16, 32, 64, 128, 256,... 및 1024로 다양할 수 있다는 것을 특징으로 하는데, 이러한 하나의 프레임에 포함된 샘플의 개수는 점차 "2"배씩 증가하여 마지막에는 "1024"가 되어, 프레임 당 1024개의 샘플에 대한 압축이 수행되도록 고정된다.
도 1의 데이터 압축 회로의 상세가 설명될 것이다.
참조 번호(1)는 압축 이전의 디지털 오디오 데이터(예를 들어, PCM 데이터), 즉, 일련의 샘플링 데이터를 저장하기 위한 메모리를 나타낸다. 참조 번호(2)는 프레임 단위로 된, 메모리(1)로부터의 복수(제어기(3)로부터 주어진 프레임 사이즈에 의해 지정된 개수)의 샘플들을 포함하는 디지털 오디오 데이터를 순차적으로 판독하는 프레임 분할 블록을 나타낸다. 그 후, 이 판독된 디지털 오디오 데이터는 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다. 처음에는, 16개의 샘플들이 메모리(1)로부터 판독된 후, 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다. 그 다음, 32개의 샘플들이 메모리(1)로부터 판독된 후, 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다. 그 다음, 64개의 샘플들이 메모리(1)로부터 판독된 후, 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다. 그 다음, 128개의 샘플들이 메모리(1)로부터 판독된 후, 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다. 마찬가지로, 256개의 샘플들 및 512개의 샘플들이 메모리(1)로부터 판독된 후 전달된다. 마지막으로, 1024개의 샘플들이 메모리(1)로부터 판독된 후, 부대역 변환 블록(4) 및 음향 심리학적 분석 블록(5)으로 전달된다.
부대역 변환 블록(4)은 소정의 부대역 개수에 따라, 각각이 동일한 대역폭을 갖는 복수의 부대역 신호로 입력 데이터를 분할한다. 소정의 개수가 16으로 설정됐다면, 입력 데이터는 16개의 부대역 신호로 분할되며, 따라서 각각의 부대역 신호는 샘플링 주파수의 1/16로 다운 샘플링된다. 소정의 개수가 32로 설정됐을 때, 입력 데이터는 32개의 부대역 신호로 분할되며, 따라서 각각의 부대역 신호는 샘플링 주파수의 1/32로 다운 샘플링된다. 환산계수(scale factor) 추출 및 정규화 블록(6)은 하나의 프레임에 포함된 부대역 샘플들 중에서 최대 값을 갖는 샘플을 탐지하는데, 여기서 이 최대 값이 환산계수를 생성하기 위해 양자화된다. 그 후, 각각의 부대역 신호는 이 환산계수를 사용하여 분할되고, 그 후 ±1인 소정의 범위 내에서 정규화된다.
음향 심리학적 분석 블록(5)은 부대역에 따라 어떤 마스킹 임계치(masking threshold; 즉 허용가능한 양자화 잡음 파워(noise power))가 생성되는지에 기초하여, 주파수 스펙트럼에 대하여 FFT(fast Fourier transform)을 사용하여 계산을 수행한다. 비트 할당 블록(7)은 음향 심리학적 분석 블록(5)의 출력에 기초하고, 비트율에 의해 결정되는 프레임당 사용가능한 비트 개수에 따른 제한 하에서, 반복 루프 프로세싱을 수행하여, 각각의 부대역당 양자화 비트의 개수를 결정한다. 비트 할당 블록(7)은 압축된 디지털 오디오 데이터에 의해 실현되는, 본래 재생 품질과 거의 동등한 높은 재생 품질을 보장하면서 각각의 프레임에 할당되는 비트의 개수를 줄일 수 있으며, 따라서 압축된 디지털 오디오 데이터에 대한 기본 프레임 사이즈가 큰 수(예를 들어, 1024개의 샘플)로 설정됐을 때도, 압축률을 높이는 것이 가능하다. 양자화 블록(8)은 부대역 신호에 대해서 양자화를 수행하는데, 이 부대역 신호들은 각각의 부대역에 관하여 설정된 양자화 비트의 개수의 견지에서 환산계수 추출 및 정규화 블록(6)으로부터 출력된다. 비트 스트림 생성 블록(9)은 환산계수 추출 및 정규화 블록(6), 비트 할당 블록(7) 및 양자화 블록(8)의 출력에 기초하여 각각의 프레임당 비트 스트림 BS을 생성한다. 비트 스트림 BS는 오디오 데이터(양자화된 부대역 샘플에 대응함) 및 부가 데이터(제어기(3)로부터 출력된 각 부대역 당 비트 할당 정보, 환산계수 및 프레임 사이즈를 포함함)를 포함한다. 전술된 데이터에 헤더를 추가하여, 비트 스트림 BS를 완성하고, 그 후 이 비트 스트림은 ROM(10)에 기록된다.
그 다음, ROM(10)으로부터 판독된 비트 스트림에 대해서 압축해제를 수행하기 위한 데이터 압축해제 회로의 상세가 설명될 것이다.
도 2는 데이터 압축해체 회로의 구성을 나타내는 블록도이며, 여기서 전술된 비트 스트림 BS가 ROM(10)으로부터 판독된다. ROM(10)으로부터 판독되는 비트 스트림 BS의 헤더는 제어 회로(14)에 공급되고, 비트 스트림에 포함된 부가 데이터 및 부대역 샘플들은 비트 스트림 분석 블록(12)에 공급된다. 구체적으로, 비트 스트림 분석 블록(12)은 ROM(10)으로부터 판독된 비트 스트림 BS으로부터 양자화된 부대역 샘플 및 부가 데이터를 분리시켜, 부대역 샘플은 역양자화 회로(13)에 공급되고, 부가 데이터는 제어 회로(14)에 공급되도록 한다. 역양자화 회로(13)는 부대역 샘플에 대해서 역양자화를 수행하고 또한 환산계수를 사용하는 곱셈(multiplication)을 수행하여, 부대역 데이터를 생성한다. 부대역 데이터는 소정의 부대역 개수(사전에 결정됨)에 따라 부대역 합성 회로(16)에 선택적으로 공급된다.
제어 회로(14)는 도 2의 데이터 압축해제 회로의 몇몇 블록들을 제어하는데, CPU(즉, 중앙 처리 장치, 도시되지 않음)로부터의 명령어의 수신시에 ROM(10)에 대한 판독 주소를 생성한다. 그 외에도, 제어 회로(14)는 비트 스트림 분석 블록(12)으로부터 출력되는 부가 데이터를 수신하여, 역양자화 회로(13)에 비트 할당 정보 및 환산계수를 출력한다. 또한, 제어 회로(14)는 FIFO 메모리(17)로부터 출력되는 데이터 ED에 기초하여 역양자화 회로(13) 및 부대역 합성 회로(16)에 의해 수행되는 디코딩을 제어한다. 디코딩에 대한 상세는 다음에 설명될 것이다.
부대역 합성 회로(16)는 소정의 개수의 부대역들에 따라 역양자화 회로(13)로부터 출력되는 부대역 데이터를 합성하여, 압축 이전의 본래 디지털 오디오 데이터를 디코딩을 통해 재생한다. 디코딩된 디지털 오디오 데이터의 샘플은 FIFO 메모리(17)에 공급된다. FIFO 메모리(17)에 저장된 디코딩된 디지털 오디오 데이터의 샘플은 샘플링 펄스의 타이밍(그 주파수를 fs로 표시함)과 동기화되어 디지털-대-아날로그(D/A) 변환기(18)에 순차적으로 공급된다. 그 외에도, FIFO 메모리(17)는 통상적으로 제어 회로(14)에 공급되고 데이터 ED로 표시한 현재의 빈 기억용량을 나타낸다. D/A 변환기(18)는 FIFO 메모리(17)로부터 출력된 디지털 오디오 데이터를 아날로그 음악 톤 신호로 변환시킨다.
다음으로, 도 2의 데이터 압축해제 회로의 전반적인 동작이 도 3을 참조하여 설명될 것이다.
CPU(도시되지 않음)로부터 시작 명령어를 수신할 때, 제어 회로(14)는 도 2의 데이터 압축해제 회로의 여러 블록에 대한 초기화를 수행하며, 또한 FIFO 메모리(17)에 저장된 내용을 소거한다(단계 S1 참조). 그 다음, ROM(10)에 대한 제1 프레임을 판독해내기 위한 주소가 출력된다. 따라서, 제1 프레임에 대응하는 비트 스트림 BS가 ROM(10)으로부터 판독되어, 이 비트 스트림의 헤더는 제어 회로(14)에 공급되고(단계 S2 참조), 이 비트 스트림의 부대역 샘플 및 부가 데이터는 비트 스트림 분석 블록(12)에 공급된다. 비트 스트림 분석 블록(12)은 비트 스트림 BS로부터 부가 데이터 및 양자화된 부대역 샘플들을 분리시켜, 부대역 샘플들은 역양자화 회로(13)에 공급되고, 부가 데이터는 제어 회로(14)에 공급된다.
제어 회로(14)는 비트 스트림 데이터 BS의 헤더에 기초하여 현재 프레임이 제1 프레임과 일치하는지를 판정한다(단계 S3 참조). 제1 프레임인 경우, 제어 회로(14)는 부가 데이터에 포함된 비트 할당 정보 및 환산계수를 역양자화 회로(13)에 공급하여, 역양자화를 시작하게 한다. 이에 따라, 역양자화 회로(13)는 부대역 샘플에 대해 역양자화를 수행하고, 또한 환산계수를 사용하는 곱셈을 수행하여, 부대역 데이터를 생성하며, 이것은 다음에 부대역 합성 회로(16)에 공급된다. 부대역 합성 회로(16)는 역양자화 회로(13)로부터 출력된 32개의 부대역 데이터를 합성하여, 압축 이전의 본래 디지털 오디오 데이터를 재생하는데, 이 데이터는 다음에 FIFO 메모리(17)에 공급된다. 이에 따라, 디코딩이 전술된 것처럼 수행되어(단계 S4 참조), 디코딩된 디지털 오디오 데이터가 FIFO 메모리(17)에 저장된다(단계 S5 참조). 기록 동작이 완료된 후, 데이터가 FIFO 메모리(17)로부터 판독된다.
제1 프레임이 16개(전술된 프레임 사이즈에 의해 지정됨)의 샘플을 포함하기 때문에, 디코딩(단계 S4 참조)이 단시간 내에 수행될 수 있으며, 이에 따라 사운드는 지연이 거의 없이 생성된다.
그 다음, 제어 회로는 ROM(10)에 대한 제2 프레임을 판독해내기 위한 주소를 출력한다. 이에 따라, 제2 프레임에 대응하는 비트 스트림이 ROM(10)으로부터 판독되어, 이 비트 스트림의 헤더는 제어 회로(14)에 공급되고(단계 S2 참조), 이 비트 스트림의 부대역 샘플 및 부가 데이터는 비트 스트림 분석 블록(12)에 공급된다. 제어 회로(14)가 FIFO 메모리(17)의 현재의 빈 기억용량을 나타내는 데이터 ED를 수신하고, 제2 프레임의 사이즈를 FIFO 메모리(17)의 현재의 빈 기억용량과 비교한다(단계 S7 참조). 덧붙여 말하자면, 각 프레임의 프레임 사이즈는 제어 회로(14)로 설정되는 부가 데이터에 포함된다.
현재의 빈 사이즈가 프레임 사이즈보다 작으면, FIFO 메모리(17)는 현재의 빈 사이즈가 프레임 사이즈보다 커질 때까지 스탠바이 상태(stand-by state)에 있게 된다(단계 S7 참조). 현재의 빈 사이즈가 프레임 사이즈보다 커지면, 제어 회로(14)는 비트 할당 정보 및 환산계수를 역양자화 회로(13)에 출력함으로써 역양자화가 시작된다. 그 후, 디코딩을 수행하기 위한 전술된 동작들이 마찬가지로 수행되어(단계 S8 참조), 그 디코딩 결과가 FIFO 메모리(17)에 저장된다(단계 S9 참조).
마찬가지로, 다음 비트 스트림들(예를 들어, 제3, 제4 및 제5 프레임)이 ROM(10)으로부터 순차적으로 판독되고 디코딩되어(단계 S7 내지 S9 참조), 디코딩 결과가 FIFO 메모리(17)에 순차적으로 저장된다. FIFO 메모리(17)에 저장된 디코딩된 디지털 오디오 데이터의 샘플들은 샘플링 펄스(fs)의 타이밍과 동기화되어 선입선출 방식으로 FIFO 메모리(17)로부터 순차적으로 판독되고, 그 후 D/A 변환기(18)를 통해 아날로그 음악 톤 신호로 변환된다. 통상적으로, FIFO 메모리(17)는 1024*2개의 샘플에 대응하는 소정의 기억용량을 갖는다. 즉, 톤 생성 프로세싱이 완료된 직후에는 FIFO 메모리(17) 내에 충분히 큰 빈 기억용량이 존재하게 되므로, 단계 S7에서 다음 샘플들은 대기 시간을 발생시키지 않으면서 FIFO 메모리(17)에 저장된다. 요약하면, 본 발명은, 재생 시작 타이밍 이후 순차적으로 판독되는 디지털 오디오 데이터의 샘플이 FIFO 메모리(17)에 점차 축적되기 때문에, 수많은 샘플을 갖는 프레임 각각이 사운드 휴지기를 발생시키지 않으면서 디코딩될 수 있게 하는 디코딩 공간을 생성하도록 설계되었다.
전술된 바와 같이, 본 실시예는, 디지털 오디오 데이터의 상부(즉, 음악 선율의 재생 시작부)에 대응하는 프레임들 각각에 포함된 샘플의 개수가 각각이 샘플들의 본래 개수(즉, 1024)보다 작은 16, 32, 64...와 같은 소정의 수로 설정되는 것을 특징으로 한다. 디코딩되는 샘플의 개수가 작기 때문에, 역양자화 회로(13) 및 부대역 합성 회로(16)에 의해 수행되는 디코딩이 단시간 내에 완료될 수 있다는 것은 잘 알려져 있다. 이러한 이유로, 본 실시예는 디지털 오디오 데이터의 재생 시작 타이밍(즉, 음악 선율의 재생 시작 타이밍)에서의 지연(또는 톤 생성 지연)을 줄일 수 있다. 디지털 오디오 데이터의 상부(또는 음악 선율의 발성부)에 대응하는 프레임들 각각에 포함된 샘플의 개수는 16에서부터 1024로 점차 증가하고, 이 샘플의 개수는 디지털 오디오 데이터의 상부의 전달 이후에 본래 개수로 설정되어, 압축률을 더욱 높이는 것이 가능하다. 압축 디지털 오디오 데이터에 대한 기본 프레임 사이즈가 비교적 큰 수로 설정되기 때문에, 디지털 오디오 데이터의 본래 재생 품질과 동등한 높은 재생 품질을 보장하면서 압축률도 향상시키는 것이 가능하다.
재생 시작 타이밍에 설정된 샘플의 개수가 반드시 전술된 수열로 제한되는 것은 아니다. 예를 들어, 각 프레임당 샘플의 개수는 16, 16, 32, 32, 64, 64,...와 같은 원하는 수열로 다양할 수 있다. 요약하면, FIFO 메모리(17)에 대한 판독 동작보다 기록 동작이 빠르게 진행되는 한, 이 수열은 재생시에 사운드의 끊김을 방지하도록 자유롭게 결정될 수 있는데, 여기서 이러한 수열은 디코딩 속도에 따른다. 구체적으로, 디지털 오디오 데이터의 상부에 대응하는 프레임들 각각에 포함된 샘플의 개수는 점차 증가하여 마지막에는 1024에 이른다. 디지털 오디오 데이터의 재생시에, 1024개의 샘플을 포함한 각각의 프레임에 대한 총 디코딩 시간이 512(샘플수)에 샘플링 펄스(fs)들 간의 시간간격을 곱함으로써 구해진 소정의 값과 일치하면, FIFO 메모리(17)는 1024개의 샘플을 포함하는 상위 프레임에 대한 디코딩 프로세스를 시작하는 타이밍 이전에 적어도 512개의 샘플을 저장하고 있을 필요가 있다. 이에 따라, 수열은 이러한 요구를 만족하도록 결정되어야 한다. 그 외에도, 데이터 압축 회로의 구성을 간단하게 하기 위해 2의 제곱을 사용하여 수열이 결정되는 것이 바람직하다.
본 발명이 반드시 음악 톤 데이터의 압축 및 압축해제에만 제한되는 것은 아니며 다른 유형의 디지털 데이터의 압축 및 압축해제에도 적용될 수 있다. 예를 들어, 본 발명은 게임 장치 및 오디오 장치에 포함된 사운드 소스 및 톤 생성기에 적용될 수 있다.
마지막으로, 본 발명은 전술된 실시예(예시적인 것 일뿐 제한적인 것은 아님)에 반드시 제한되는 것은 아니므로, 임의의 수정물 및 설계 변경도 첨부된 청구항에 의해 정의된 본 발명의 영역에 포함될 수 있다.
본 발명은 적은 톤 생성 지연을 갖는 디지털 오디오 데이터의 압축 및 압축해제를 제공하는 방법을 제공한다.
Claims (12)
- 각각의 프레임에 포함된 샘플들의 개수가 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하는 방식으로, 일련의 샘플링 데이터를 n개의 프레임들로 분할하는 단계- 1<k<n이고, k 및 n은 정수임-;각각의 프레임에 포함된 샘플링 데이터를 복수의 부대역 신호들로 분할하되, 각 프레임에 대한 상기 부대역 신호의 개수는 프레임 내의 샘플 수와 관계없이 고정된 수인 단계; 및음향 심리학적 분석을 통해 상기 부대역 신호들에 대해 양자화를 수행하여, 압축 데이터를 생성하는 단계를 포함하는 데이터 압축 방법.
- 제1항에 있어서, 상기 일련의 샘플링 데이터는 디지털 오디오 데이터에 대응하는 데이터 압축 방법.
- 각각의 프레임에 포함된 샘플들의 개수가 상위 프레임에서부터 제k 프레임으로 가면서 점차 증가하는 방식으로, 일련의 샘플링 데이터를 n개의 프레임들로 분할하기 위한 제1 분할기- 1<k<n이고, k 및 n은 정수임-;각각의 프레임에 포함된 상기 샘플링 데이터를 복수의 부대역 신호들로 분할하되, 각 프레임에 대한 상기 부대역 신호의 개수는 프레임 내의 샘플 수와 관계없이 고정된 수인 제2 분할기; 및음향 심리학적 분석을 통해 상기 부대역 신호들에 대해 양자화를 수행하여, 압축 데이터를 생성하기 위한 압축기를 포함하는 데이터 압축 장치.
- 각각이 압축 데이터에 대응하는 복수의 부대역 신호들을 포함하는 n개의 프레임들을 저장하기 위한 제1 메모리- 각각의 프레임에 포함된 샘플들의 개수는 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하며(1<k<n; k 및 n은 정수), 각 프레임에는 프레임 내의 샘플 수와 관계없이 고정된 수의 상기 부대역 신호가 포함되어 있음 -;압축 이전의 일련의 샘플링 데이터를 재생하기 위해 상기 압축 데이터를 프레임 단위로 디코딩하기 위한 디코더;상기 샘플링 데이터가 순차적으로 기록되는 제2 메모리; 및상기 제2 메모리의 빈 기억용량에 따라 상기 디코더의 디코딩 프로세스를 제어하기 위한 제어기를 포함하는 데이터 압축해제 장치.
- 제4항에 있어서, 상기 일련의 샘플링 데이터는 디지털 오디오 데이터에 대응하는 데이터 압축해제 장치.
- 각각의 프레임들이 복수의 부대역 샘플들을 포함하는 방식으로, 디지털 오디오 데이터를 복수의 프레임들로 분할하는 단계; 및음향 심리학적 분석 및 양자화를 통해 각각의 상기 프레임들을 압축하여, 압축 데이터를 생성하는 단계를 포함하고상기 각각의 프레임들에 포함된 상기 복수의 부대역 샘플들의 개수는 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하는 디지털 오디오 데이터 압축 방법.
- 제6항에 있어서, 각각의 상기 프레임들에서 상기 부대역 샘플들의 개수가 "16" 내지 "1024" 범위에서 점차 증가하는 디지털 오디오 데이터 압축 방법.
- 디지털 오디오 데이터를, 각각이 복수의 부대역 샘플들을 포함하는 복수의 프레임들로 분할하기 위한 분할기; 및음향 심리학적 분석 및 양자화를 통해 각각의 상기 프레임들을 압축하여, 압축 데이터를 생성하기 위한 압축기를 포함하고상기 각각의 프레임들에 포함된 상기 복수의 부대역 샘플들의 개수는 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하는 데이터 압축 회로.
- 제8항에 있어서, 각각의 상기 프레임들에서 상기 부대역 샘플들의 개수가 "16" 내지 "1024" 범위에서 점차 증가하는 데이터 압축 회로.
- 음향 심리학적 분석 및 양자화를 통해, 각각이 복수의 부대역 샘플들을 포함하는 복수의 프레임들에 기초하여 생성된 압축 데이터를 압축해제하기 위한 데이터 압축해제 회로에 있어서,역양자화 및 부대역 합성을 통해 상기 압축 데이터를 프레임 단위로 디코딩하기 위한 디코더;디코딩된 데이터가 순차적으로 기록되는 메모리; 및상기 메모리의 현재의 빈 기억공간에 따라 상기 디코더를 작동시키거나 멈추기 위한 제어기를 포함하고상기 각각의 프레임들에 포함된 상기 복수의 부대역 샘플들의 개수는 제1 프레임에서부터 제k 프레임으로 가면서 점차 증가하는 데이터 압축해제 회로.
- 제10항에 있어서, 각각의 상기 프레임들에서 상기 부대역 샘플들의 개수가 "16" 내지 "1024" 범위에서 점차 증가하는 데이터 압축해제 회로.
- 제10항에 있어서, 상기 메모리는 선입선출 방식으로 동작하는 데이터 압축해제 회로.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2005-00159484 | 2005-05-31 | ||
JP2005159484A JP4639966B2 (ja) | 2005-05-31 | 2005-05-31 | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060125484A KR20060125484A (ko) | 2006-12-06 |
KR100851715B1 true KR100851715B1 (ko) | 2008-08-11 |
Family
ID=37464584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060048065A KR100851715B1 (ko) | 2005-05-31 | 2006-05-29 | 데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7711555B2 (ko) |
JP (1) | JP4639966B2 (ko) |
KR (1) | KR100851715B1 (ko) |
CN (1) | CN1874163B (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8401865B2 (en) * | 2007-07-18 | 2013-03-19 | Nokia Corporation | Flexible parameter update in audio/speech coded signals |
CN102063906B (zh) * | 2010-09-19 | 2012-05-23 | 北京航空航天大学 | 一种aac音频实时解码容错控制方法 |
JP6146686B2 (ja) * | 2015-09-15 | 2017-06-14 | カシオ計算機株式会社 | データ構造、データ格納装置、データ取り出し装置および電子楽器 |
CN111384963B (zh) * | 2018-12-28 | 2022-07-12 | 上海寒武纪信息科技有限公司 | 数据压缩解压装置和数据解压方法 |
CN116884437B (zh) * | 2023-09-07 | 2023-11-17 | 北京惠朗时代科技有限公司 | 基于人工智能的语音识别处理器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08186502A (ja) * | 1995-01-05 | 1996-07-16 | Matsushita Electric Ind Co Ltd | 符号化信号再生装置 |
KR100303580B1 (ko) * | 1992-06-02 | 2001-11-22 | 요트.게.아. 롤페즈 | 송신기,엔코딩장치및송신방법 |
JP2002049394A (ja) * | 2000-05-26 | 2002-02-15 | Yamaha Corp | ディジタルオーディオデコーダ |
JP2002341896A (ja) * | 2001-05-11 | 2002-11-29 | Yamaha Corp | ディジタルオーディオ圧縮回路および伸長回路 |
JP2004348056A (ja) * | 2003-05-26 | 2004-12-09 | Yamaha Corp | ディジタルオーディオデコーダ |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
JP2734323B2 (ja) | 1992-11-30 | 1998-03-30 | ヤマハ株式会社 | 電子楽器の音源装置 |
JP3402483B2 (ja) * | 1993-01-29 | 2003-05-06 | ソニー株式会社 | オーディオ信号符号化装置 |
KR100377394B1 (ko) | 1997-12-04 | 2003-06-11 | 삼성전자주식회사 | 이동통신시스템의핸드오프수행장치및방법 |
US6180861B1 (en) * | 1998-05-14 | 2001-01-30 | Sony Computer Entertainment Inc. | Tone generation device and method, distribution medium, and data recording medium |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
EP1215663A1 (en) * | 2000-12-15 | 2002-06-19 | BRITISH TELECOMMUNICATIONS public limited company | Encoding audio signals |
US20040088161A1 (en) * | 2002-10-30 | 2004-05-06 | Gerald Corrigan | Method and apparatus to prevent speech dropout in a low-latency text-to-speech system |
CN1461112A (zh) * | 2003-07-04 | 2003-12-10 | 北京阜国数字技术有限公司 | 一种基于极小化全局噪声掩蔽比准则和熵编码的量化的音频编码方法 |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
US20050240397A1 (en) * | 2004-04-22 | 2005-10-27 | Samsung Electronics Co., Ltd. | Method of determining variable-length frame for speech signal preprocessing and speech signal preprocessing method and device using the same |
-
2005
- 2005-05-31 JP JP2005159484A patent/JP4639966B2/ja not_active Expired - Fee Related
-
2006
- 2006-05-26 CN CN2006100899342A patent/CN1874163B/zh not_active Expired - Fee Related
- 2006-05-29 US US11/420,780 patent/US7711555B2/en not_active Expired - Fee Related
- 2006-05-29 KR KR1020060048065A patent/KR100851715B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100303580B1 (ko) * | 1992-06-02 | 2001-11-22 | 요트.게.아. 롤페즈 | 송신기,엔코딩장치및송신방법 |
JPH08186502A (ja) * | 1995-01-05 | 1996-07-16 | Matsushita Electric Ind Co Ltd | 符号化信号再生装置 |
JP2002049394A (ja) * | 2000-05-26 | 2002-02-15 | Yamaha Corp | ディジタルオーディオデコーダ |
JP2002341896A (ja) * | 2001-05-11 | 2002-11-29 | Yamaha Corp | ディジタルオーディオ圧縮回路および伸長回路 |
JP2004348056A (ja) * | 2003-05-26 | 2004-12-09 | Yamaha Corp | ディジタルオーディオデコーダ |
Also Published As
Publication number | Publication date |
---|---|
US7711555B2 (en) | 2010-05-04 |
JP4639966B2 (ja) | 2011-02-23 |
JP2006337508A (ja) | 2006-12-14 |
CN1874163A (zh) | 2006-12-06 |
US20060271374A1 (en) | 2006-11-30 |
KR20060125484A (ko) | 2006-12-06 |
CN1874163B (zh) | 2011-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100851715B1 (ko) | 데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 | |
JP2006126826A (ja) | オーディオ信号符号化/復号化方法及びその装置 | |
JP2013535023A (ja) | 基本層および少なくとも一つの向上層を含む層構造の階層的ビットストリームを探索し、再生する方法および装置 | |
US20020169601A1 (en) | Encoding device, decoding device, and broadcast system | |
KR20010111630A (ko) | 시간/피치 변환 장치 및 시간/피치 변환 방법 | |
JP2001053869A (ja) | 音声蓄積装置及び音声符号化装置 | |
JPH0846516A (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに記録媒体 | |
CN100538820C (zh) | 一种对音频数据进行处理的方法及装置 | |
US7653540B2 (en) | Speech signal compression device, speech signal compression method, and program | |
CN101740075B (zh) | 音频信号播放装置、音频信号播放方法和程序 | |
US20050114136A1 (en) | Manipulating wavetable data for wavetable based sound synthesis | |
KR100368456B1 (ko) | 음성속도 및 음정가변 어학학습장치 | |
US20050238185A1 (en) | Apparatus for reproduction of compressed audio data | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
KR100359528B1 (ko) | 엠피 쓰리 인코더/디코더 | |
JPH10333698A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、及び記録媒体 | |
JP4159927B2 (ja) | ディジタルオーディオデコーダ | |
JP2003271198A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
Auristin et al. | New Ieee Standard For Advanced Audio Coding In Lossless Audio Compression: A Literature Review | |
US20090157396A1 (en) | Voice data signal recording and retrieving | |
JP3918826B2 (ja) | 楽音データ再生装置 | |
JP2011257575A (ja) | 音声処理装置、音声処理方法、プログラムおよび記録媒体 | |
JP2007011286A (ja) | データ圧縮方法およびデータ圧縮回路並びにデータ伸張回路 | |
Liu | The perceptual impact of different quantization schemes in G. 719 | |
JP2004029377A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130701 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140701 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |