KR20070020584A - Apparatus for writing and playing audio and audio coding method in the apparatus - Google Patents
Apparatus for writing and playing audio and audio coding method in the apparatus Download PDFInfo
- Publication number
- KR20070020584A KR20070020584A KR1020050074627A KR20050074627A KR20070020584A KR 20070020584 A KR20070020584 A KR 20070020584A KR 1020050074627 A KR1020050074627 A KR 1020050074627A KR 20050074627 A KR20050074627 A KR 20050074627A KR 20070020584 A KR20070020584 A KR 20070020584A
- Authority
- KR
- South Korea
- Prior art keywords
- audio
- section
- frame
- unit
- audio data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 26
- 230000005236 sound signal Effects 0.000 claims abstract description 22
- 230000006835 compression Effects 0.000 claims abstract description 21
- 238000007906 compression Methods 0.000 claims abstract description 21
- 238000005070 sampling Methods 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 14
- 230000006837 decompression Effects 0.000 claims description 6
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
- H03M7/3046—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM] adaptive, e.g. adaptive differential pulse code modulation [ADPCM]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 오디오 코딩 기술에 관한 것으로, 특히 압축률을 향상시킬 수 있는 코딩 기술에 관한 것이다.The present invention relates to audio coding technology, and more particularly to a coding technology that can improve the compression rate.
본 발명에 따른 오디오 기록 재생 장치는 아날로그 오디오 신호를 디지털 오디오 데이터로 변환한 후 압축을 하기 전에, 불필요한 오디오 프레임을 삭제 처리한 후에 압축을 한다. 이 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.The audio recording and reproducing apparatus according to the present invention compresses an unnecessary audio frame after erasing an unnecessary audio frame before converting the analog audio signal into digital audio data and then compressing it. As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency and maintaining the sound quality of the entire audio stream. Provide the effect.
오디오, 코딩, 압축률. Audio, coding, compression rate.
Description
도 1은 본 발명의 일실시예에 따른 오디오 기록 재생 장치 구성을 개략적으로 도시한 블록도.1 is a block diagram schematically showing the configuration of an audio recording and reproducing apparatus according to an embodiment of the present invention;
도 2는 본 발명의 일실시예에 따른 압축률 개선을 위한 오디오 인코딩 방법을 개략적으로 도시한 흐름도.2 is a flowchart schematically illustrating an audio encoding method for improving a compression rate according to an embodiment of the present invention.
도 3은 본 발명의 일실시예에 따른 오디오 디코딩 방법을 개략적으로 도시한 흐름도.3 is a flowchart schematically illustrating an audio decoding method according to an embodiment of the present invention.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
100 : 메모리 200 : 인코딩부100: memory 200: encoding unit
210 : 샘플링/양자화부 220 : 구간 판별부210: sampling / quantization unit 220: section discriminating unit
223 : 에너지 산출부 225 : 구간 판단부223: energy calculation unit 225: section determination unit
230 : 구간 삭제부 240 : 압축 저장부230: section delete unit 240: compressed storage unit
250 : 정보 기록부 300 : 디코딩부250: information recording unit 300: decoding unit
310 : 데이터 변환부 320 : 백색잡음 추가부310: data conversion unit 320: white noise addition unit
330 : 압축 해제부330: decompression unit
본 발명은 오디오 코딩 기술에 관한 것으로, 특히 압축률을 향상시킬 수 있는 코딩 기술에 관한 것이다.The present invention relates to audio coding technology, and more particularly to a coding technology that can improve the compression rate.
종래 오디오 디코딩 기술은 입력되는 아날로그 오디오 신호를 8KHz 샘플링(sampling)한 후 16bit 양자화(quantization) 처리를 한다. 샘플링 및 양자화에 의해 디지털 방식의 오디오 데이터인 128Kbps의 PCM 데이터가 만들어진다. PCM은 음성이나 오디오의 특성을 고려하여 데이터를 압축하는 것이 아니라 단지 데이터를 8KHz 샘플링하여 16bit 선형 양자화 정도만 거치므로, 비음성 오디오 신호나 음성 신호 모두 가능하다. 이는 통신 채널상에 전송되는 목적보다는 메모리 상에 저장하여 활용하는 방식이 적당하며, 계산량이 작은 반면에 압축률은 현저히 떨어진다. 따라서 PCM 포맷은 오디오 데이터 변화량만을 압축하는 ADPCM(Adaptive Differential Pulse Coded Modulation)에 의해 압축된다. 종래는 이 같은 ADPCM에 의해 1/4 정도의 압축률을 얻을 수 있다.Conventional audio decoding technology performs 16-bit quantization after sampling an input analog audio signal at 8KHz. Sampling and quantization produce PCM data of 128 Kbps, digital audio data. PCM does not compress the data in consideration of the characteristics of voice or audio, but only 16-bit linear quantization by sampling the data at 8KHz, which is possible for both non-audio audio and voice signals. This method is more suitable for storage and use in memory than the purpose of transmission on a communication channel, while the calculation rate is small while the compression rate is significantly lower. Therefore, the PCM format is compressed by ADPCM (Adaptive Differential Pulse Coded Modulation), which compresses only the amount of audio data variation. Conventionally, the compression ratio of about 1/4 can be obtained by such an ADPCM.
본 발명은 이 같은 배경에서 도출된 것으로, 음질의 보존을 유지하면서도 압축률을 좀 더 개선하는 것을 목적으로 한다.The present invention is derived from this background, and aims to further improve the compression ratio while maintaining sound quality preservation.
상술한 목적을 달성하기 위한 본 발명의 일 양상에 따른 오디오 기록 재생 장치는 아날로그 오디오 신호를 디지털 오디오 데이터로 변환한 후 압축을 하기 전에, 불필요한 오디오 프레임을 삭제 처리한 후에 압축을 한다.An audio recording and reproducing apparatus according to an aspect of the present invention for achieving the above object compresses an unnecessary audio frame after the unwanted audio frame is deleted before converting the analog audio signal into digital audio data and then compressing it.
본 발명의 이 같은 양상에 따라 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.According to this aspect of the present invention, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency as well as the overall audio. Provides the effect of maintaining the sound quality of the stream.
전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명을 이러한 실시예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.The foregoing and further aspects of the present invention will become more apparent through the preferred embodiments described with reference to the accompanying drawings. Hereinafter, the present invention will be described in detail to enable those skilled in the art to easily understand and reproduce the present invention.
도 1은 본 발명의 일실시예에 따른 오디오 기록 재생 장치 구성을 개략적으로 도시한 블록도이다. 도시된 바와 같이 오디오 기록 재생 장치()는 메모리(100)와, 인코딩부(200)와, 디코딩부(300)를 포함한다. 메모리(100)는 바람직하게 비휘발성 메모리인 플래쉬 메모리일 수 있다. 인코딩부(200)는 종래와 같이 아날로그 오디오 신호의 PCM 데이터화 및 압축을 하여 메모리(100)에 저장 처리하는 구성이다. 그리고 디코딩부(300)는 인코딩부(200)에 의해 인코딩된 오디오 데이터를 그 역을 변환 처리를 통해 아날로그 오디오 신호로 복원하여 출력하는 구성이다. 이 같은 구성 및 이하 특징적인 하위 구성을 갖는 오디오 기록 재생 장치()는 휴대폰과 같은 오디오 기록 및 재생이 가능한 이동통신 단말기에 탑재되어 구현될 수도 있다.1 is a block diagram schematically showing the configuration of an audio recording and reproducing apparatus according to an embodiment of the present invention. As shown, the audio recording and reproducing apparatus includes a memory 100, an encoding unit 200, and a decoding unit 300. The memory 100 may be a flash memory, which is preferably a nonvolatile memory. The encoder 200 is configured to perform PCM data conversion and compression of an analog audio signal and store the processed data in the memory 100 as in the prior art. The decoding unit 300 is a component that restores the audio data encoded by the encoding unit 200 to an analog audio signal through a conversion process and outputs the analog audio signal. The audio recording and reproducing apparatus () having such a configuration and the following characteristic sub-configuration may be mounted on a mobile communication terminal capable of recording and reproducing audio such as a mobile phone.
본 발명의 특징적인 양상에 따른 인코딩부(200)는 입력되는 아날로그 오디오 신호를 샘플링 및 양자화하는 샘플링/양자화부(210)와, 샘플링 및 양자화된 오디오 데이터의 오디오 구간과 묵음 구간을 판별하는 구간 판별부(220)와, 구간 판별부(220)에 의해 판별된 묵음 구간의 적어도 일부를 삭제하는 구간 삭제부(230)와, 일부 구간이 삭제된 오디오 데이터를 압축하여 메모리(100)에 저장하는 압축 저장부(240)를 포함한다. According to an aspect of the present invention, the encoding unit 200 includes a sampling / quantization unit 210 for sampling and quantizing an input analog audio signal, and an interval discrimination section for determining an audio section and a silent section of the sampled and quantized audio data. A section 220, a section deleting unit 230 for deleting at least a portion of the silent section determined by the section discriminating unit 220, and compression for compressing audio data from which some sections are deleted and storing the compressed audio data in the memory 100 The storage unit 240 is included.
샘플링/양자화부(210)는 주지된 바와 같이 마이크 같은 입력 수단으로부터 입력되어 아날로그 신호 처리된 아날로그 오디오 신호를 디지털 오디오 데이터로 변환 처리한다. 구체적으로 샘플링/양자화부(210)는 아날로그 오디오 신호를 바람직하게 8KHz 샘플링(sampling)한 후에, 16bit의 양자화(quantization) 처리를 한다. 이 같은 샘플링/양자화부(210)의 아날로그 오디오 신호 처리에 의해 128Kbps의 PCM 데이터가 만들어진다.As is well known, the sampling / quantization unit 210 converts an analog audio signal input from an input means such as a microphone and processed into an analog signal to digital audio data. In detail, the sampling / quantization unit 210 performs sampling of the analog audio signal, preferably 8 KHz, and then performs 16-bit quantization. By the analog audio signal processing of the sampling / quantization unit 210, 128 Kbps of PCM data is generated.
구간 판별부(220)는 샘플링/양자화부(210)로부터 출력되는 128Kbps의 PCM 데이터의 오디오 구간과 묵음 구간을 판별한다. 본 실시예에 있어서, 구간 판별부(220)는 샘플링 및 양자화된 오디오 데이터의 프레임별 에너지 값을 산출하는 에너지 산출부(223)와, 에너지 산출부(223)에 의해 산출된 프레임별 에너지 값 레벨에 따라 오디오 구간인지 묵음 구간인지를 판단하는 구간 판단부(225)를 포함한다. 일 실시예에 있어서, 에너지 산출부(223)는 PCM 데이터의 1 프레임(20msec)별로 에너지 값을 산출한다. 여기서 프레임은 구간의 최소 단위가 된다. 또한 오디오 에너지는 오디오 크기에 비례하는 것으로, 소리의 크기에 대한 에너지라 할 수 있다. 일 예에 따라 오디오 에너지 산출은 PCM 데이터의 크기값을 제곱함에 의해 산출될 수 있다. 구간 판단부(225)는 에너지 산출부(223)에 의해 산출된 프레임별 오디오 에너지 값으로부터 그 프레임이 오디오 구간인지 아니면 묵음 구간인지를 판단한다. 바람직한 일 예에 따라 구간 판단부(225)는 사전에 정의된 경계값(boundary)을 기준으로 경계값보다 높으면 오디오 구간으로 판단하고, 경계값보다 낮으면 묵음 구간으로 판단한다.The section discriminating unit 220 determines the audio section and the silent section of the 128 Kbps PCM data output from the sampling / quantization unit 210. In the present embodiment, the section discriminating unit 220 is the energy calculation unit 223 for calculating the energy value of each frame of the sampled and quantized audio data, and the energy value level for each frame calculated by the energy calculator 223. And a
구간 삭제부(230)는 구간 판단부(225)에 의해 묵음 구간으로 판단된 구간 중 적어도 일부를 삭제 처리한다. 일 예에 따라 구간 삭제부(230)는 구간 판단부(225)에 의해 판단된 묵음 구간 전체를 삭제 처리할 수 있다. 바람직한 일 실시예에 있어서, 구간 삭제부(230)는 구간 판단부(225)에 의해 판단된 묵음 구간 중 일부만을 삭제 처리한다. 예를 들어 구간 삭제부(230)는 묵음 구간에 포함되는 프레임들 중 상대적으로 에너지 레벨이 높은 특정 프레임은 삭제하지 않는 것이다.The section deleting unit 230 deletes at least a portion of the section determined as the silent section by the
추가적으로 구간 삭제부(230)는 음성 구간으로 판별되더라도 에너지 레벨에 따라 일부 프레임은 삭제 처리한다. 바람직한 일 실시예에 있어서, 구간 삭제부(230)는 전자 프레임 대하여 그 뒤에 따라오는 일정 개수의 후자 프레임들간의 에너지를 비교하고, 상대적으로 에너지 레벨 차이가 많이 나는 후자 프레임들을 삭제 처리한다. 바람직한 일 예에 따라 구간 삭제부(230)는 에너지 레벨 차이에 대해 사전에 정의된 경계값(boundary)을 기준으로 후자 프레임들의 삭제를 처리한다. In addition, the section deleting unit 230 deletes some frames according to the energy level even if the section deleting unit 230 is determined as the voice section. In an exemplary embodiment, the section deleting unit 230 compares the energy between a predetermined number of latter frames following the electronic frame, and deletes the latter frames having a relatively large energy level difference. According to an exemplary embodiment, the section deleting unit 230 processes deletion of the latter frames based on a predefined boundary for the energy level difference.
압축 저장부(240)는 구간 삭제부(230)에서 적어도 일부 묵음 구간이 삭제된 PCM 데이터를 알려진 바와 같은 ADPCM(Adaptive Differential Pulse Coded Modulation) 포맷으로 압축하여 메모리(100)에 저장 처리한다.The compression storage unit 240 compresses the PCM data from which the at least some silent sections are deleted by the section deleting unit 230 in the adaptive differential pulse coded modulation (ADPCM) format as is known, and stores them in the memory 100.
본 발명의 바람직한 실시예에 따라 묵음 구간 및 오디오 구간의 일부 프레임을 삭제하는 것은, 인간 청각 능력의 분해능을 고려하여 높은 에너지를 갖는 특정 프레임 이후에 발생하는 임계치 이하의 낮은 에너지들의 프레임은 복원하지 않아도 인간이 구별하지 못한다는 타임 마스킹(Time Masking) 효과를 응용한 것이다. 이 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.Deleting some frames of the silent section and the audio section according to the preferred embodiment of the present invention does not require reconstruction of a frame of low energy below the threshold that occurs after a specific frame having high energy in consideration of the resolution of the human hearing ability. It is a time masking effect that humans cannot distinguish. As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency and maintaining the sound quality of the entire audio stream. Provide the effect.
본 발명의 추가적인 양상에 따라 인코딩부(200)는 삭제된 프레임 정보를 메모리(100)에 기록하는 정보 기록부(250)를 더 포함하며, 디코딩부(300)는 메모리(100)에 저장된 오디오 데이터를 압축 해제하는 압축 해제부(330)와, 메모리(100)에 기록된 프레임 정보를 참조하여 압축 해제부(330)에 의해 압축 해제된 오디오 데이터의 삭제 프레임 위치에 백색 잡음(white noise)를 추가하는 백색잡음 추가부(320)와, 백색잡음 추가부(320)에 의해 백색 잡음이 추가된 오디오 데이터를 아날로그 오디오 신호로 변환하여 출력하는 데이터 변환부(310)를 포함한다.According to an additional aspect of the present invention, the encoding unit 200 further includes an
정보 기록부(250)는 구간 삭제부(230)에서 삭제 처리되는 프레임에 대한 정보를 메모리(100)에 기록한다. 일 실시예에 있어서, 정보 기록부(250)가 메모리(100)에 기록하는 프레임 정보는 전체 오디오 데이터 구간에서 삭제된 프레임의 위치에 대한 정보가 될 수 있다. 또다른 실시예에 있어서, 정보 기록부(250)가 메모 리(100)에 기록하는 프레임 정보는 전체 오디오 데이터 구간에서 삭제된 프레임의 위치에 대한 정보뿐만 아니라 그 삭제된 프레임의 에너지 레벨 정보를 더 포함할 수 있다. 이 같은 삭제된 프레임 정보는 이하 설명하는 디코딩부(300)에서 메모리(100)에 저장된 오디오 데이터를 디코딩할 때 이용되게 된다.The
압축 해제부(330)는 메모리(100)에 저장된 오디오 데이터를 압축 해제한다. 바람직한 일 실시예에 따라 압축 해제부(330)는 인코딩부(200)에서 사용된 압축 방식에 따라 오디오 데이터를 압축 해제한다. 압축 해제부(330)에 의해 오디오 데이터가 압축 해제되면, PCM 데이터 포맷을 갖게 된다. The
백색잡음 추가부(320)는 현재 디코딩 처리중인 오디오 데이터에 해당하는 프레임 정보를 메모리(100)로부터 읽어들인다. 일 실시예에 있어서, 백색잡음 추가부(320)는 프레임 정보인 오디오 데이터의 전체 구간에서 삭제된 프레임의 원래 위치에 대한 정보를 통해, 그 구간에 디폴트(default) 크기를 갖는 백색 잡음(white noise)을 추가한다. 백색 잡음을 추가하는 이유는 전체 오디오 스트림의 동기를 맞추어 주기 위함이다. 또다른 실시예에 있어서, 백색잡음 추가부(320)는 프레임 정보인 오디오 데이터의 전체 구간에서 삭제된 프레임의 원래 위치 및 에너지 레벨 정보를 통해, 그 구간에 원래 에너지 레벨을 갖는 백색 잡음(white noise)을 추가한다. The white
데이터 변환부(310)는 백색잡음 추가부(320)에 의해 삭제된 프레임 구간에 백색 잡음이 삽입된 오디오 데이터를 전술한 샘플링/양자화의 역의 처리를 통해 아날로그 오디오 신호로 변환하여 출력한다.The
도 2는 본 발명의 일실시예에 따른 압축률 개선을 위한 오디오 코딩 방법을 개략적으로 도시한 흐름도이다. 예를 들어 음성 녹음 모드 상태에서 마이크로부터 아날로그 오디오 신호가 입력되면, 샘플링/양자화부(210)는 입력된 신호를 8KHz 샘플링(sampling)하고 16bit 양자화(quantization)하여 PCM 데이터로 변환한다(단계 S210)(단계 S220). 구간 판별부(220)는 변환된 PCM 데이터의 오디오 구간과 묵음 구간을 판별한다. 일 실시예에 있어서, 구간 판별부(220)는 PCM 데이터의 1 프레임(20msec)별로 에너지 값을 산출한다(단계 S230). 그리고 산출된 프레임별 에너지 레벨에 따라 오디오 구간과 묵음 구간으로 구분하고, 바람직하게 선택적으로 프레임 구간을 삭제한다(단계 S240). 구간 삭제에 대한 실시예에 대해서는 이미 자세히 언급하였으므로, 불필요한 중복 설명은 생략한다. 압축 저장부(240)는 선택적으로 프레임 구간 삭제된 PCM 데이터를 바람직하게 ADPCM 포맷으로 압축하여 메모리(100)에 저장 처리한다(단계 S250)(단계 S260). 그리고 도시하지는 않았지만, 인코딩부(200)의 정보 기록부(250)는 PCM 데이터 중 삭제된 프레임 구간에 대한 위치 정보, 나아가 에너지 값에 대한 정보를 메모리(100)에 기록한다. 메모리(100)에 기록된 정보는 이하 도 3을 참조로 하여 설명하는 오디오 데이터의 디코딩 시에 이용된다.2 is a flowchart schematically illustrating an audio coding method for improving compression ratio according to an embodiment of the present invention. For example, when an analog audio signal is input from the microphone in the voice recording mode, the sampling / quantization unit 210 samples the input signal at 8 KHz, and 16-bit quantizes the converted signal into PCM data (step S210). (Step S220). The section discriminating unit 220 determines an audio section and a silent section of the converted PCM data. In one embodiment, the interval determination unit 220 calculates an energy value for each frame (20msec) of the PCM data (step S230). The audio section is divided into an audio section and a silent section according to the calculated energy level for each frame, and preferably, the frame section is selectively deleted (step S240). Since the embodiment for deleting the section has already been described in detail, unnecessary redundant description is omitted. The compression storage unit 240 selectively compresses the PCM data of which the frame section is deleted in the ADPCM format and stores the processed data in the memory 100 (step S250) (step S260). Although not shown, the
도 3은 본 발명의 일실시예에 따른 오디오 디코딩 방법을 개략적으로 도시한 흐름도이다. 예를 들어 사용자가 메모리(100)에 저장된 오디오 데이터들 중 하나를 선택하여 재생 명령을 하면, 압축 해제부(330)는 ADPCM 포맷으로 압축되어 있는 선택된 오디오 데이터를 압축 해제한다(단계 S310). 백색잡음 추가부(320)는 메모 리(100)에 기록된 프레임 정보들 중 선택된 오디오 데이터에 해당하는 프레임 정보를 참조하여 압축 해제된 PCM 데이터의 삭제 프레임 구간에 백색 잡음(white noise)을 추가한다(단계 S320). 일 실시예에 따라 백색잡음 추가부(320)는 삭제 프레임 구간에 동일한 디폴트(default) 크기를 갖는 백색 잡음을 추가할 수 있으며, 또다른 실시예에 따라 원래 에너지 레벨을 갖는 백색 잡음을 추가할 수도 있다. 데이터 변환부(310)는 백색 잡음이 추가된 PCM 데이터를 샘플링/양자화의 역 처리를 통해 아날로그 오디오 신호로 변환하여 스피커로 출력한다.3 is a flowchart schematically illustrating an audio decoding method according to an embodiment of the present invention. For example, when a user selects one of the audio data stored in the memory 100 and performs a playback command, the
상술한 바와 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론, 음성 구간이라도 선별적인 프레임 삭제와 묵음 구간에서도 선별적으로 프레임 삭제를 하지 않음으로써 전체 오디오 스트림 상의 음질을 효과적으로 유지할 수 있게 한다.As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving memory efficiency by improving the compression ratio, and selectively selecting even voice sections. In the frame erasure and silent periods, the frame quality is not selectively deleted, thereby effectively maintaining the sound quality of the entire audio stream.
한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌 자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.On the other hand, the present invention has been described with reference to the embodiments shown in the drawings, which are merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention should be defined only by the appended claims.
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050074627A KR100776432B1 (en) | 2005-08-16 | 2005-08-16 | Apparatus for writing and playing audio and audio coding method in the apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050074627A KR100776432B1 (en) | 2005-08-16 | 2005-08-16 | Apparatus for writing and playing audio and audio coding method in the apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070020584A true KR20070020584A (en) | 2007-02-22 |
KR100776432B1 KR100776432B1 (en) | 2007-11-16 |
Family
ID=41637439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050074627A KR100776432B1 (en) | 2005-08-16 | 2005-08-16 | Apparatus for writing and playing audio and audio coding method in the apparatus |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100776432B1 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3227929B2 (en) * | 1993-08-31 | 2001-11-12 | ソニー株式会社 | Speech encoding apparatus and decoding apparatus for encoded signal |
JP2838159B2 (en) * | 1993-12-28 | 1998-12-16 | 株式会社アドバンス | Audio signal processing device |
KR0170658B1 (en) * | 1994-12-15 | 1999-03-30 | 김광호 | Compression-extension method of audio signal and the apparatus suitable for this method |
JPH1051337A (en) | 1996-07-29 | 1998-02-20 | Yukio Hiromoto | Fm multiplex character broadcast sound recording control program device |
US6029127A (en) | 1997-03-28 | 2000-02-22 | International Business Machines Corporation | Method and apparatus for compressing audio signals |
KR20030004819A (en) * | 2001-07-06 | 2003-01-15 | 엘지전자 주식회사 | Audio system for recording audio signals on digital medium to remove noise of them reproduced on analog medium |
-
2005
- 2005-08-16 KR KR1020050074627A patent/KR100776432B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100776432B1 (en) | 2007-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3145358B2 (en) | Silence period compression method | |
US20030215013A1 (en) | Audio encoder with adaptive short window grouping | |
KR100473889B1 (en) | Method of editing audio data and recording medium thereof and digital audio player | |
KR20100089772A (en) | Method of coding/decoding audio signal and apparatus for enabling the method | |
JP5446013B2 (en) | Coding apparatus and decoding apparatus for adaptive differential pulse code modulation | |
JP3784583B2 (en) | Audio storage device | |
JPWO2005057550A1 (en) | Audio compression / decompression equipment | |
KR100776432B1 (en) | Apparatus for writing and playing audio and audio coding method in the apparatus | |
JP4508599B2 (en) | Data compression method | |
JP3227929B2 (en) | Speech encoding apparatus and decoding apparatus for encoded signal | |
JP4618634B2 (en) | Compressed audio data processing method | |
JP2005149608A (en) | Audio data recording/reproducing system and audio data recording medium therefor | |
JP2005316499A (en) | Voice-coder | |
JPH10326100A (en) | Voice recording method, voice reproducing method, and voice recording and reproducing device | |
KR19990013584A (en) | Speech Coding Decoding Method | |
JP2905215B2 (en) | Recording and playback device | |
JPH11283332A (en) | Compressed data storage device | |
JP4556866B2 (en) | High efficiency encoding program and high efficiency encoding apparatus | |
JP2005151327A (en) | Pcm data compressing/decompressing method and apparatus | |
JP2002287800A (en) | Speech signal processor | |
KR0141237B1 (en) | Audio signal recording/reproducing method | |
JP2000078274A (en) | Message recorder for variable rate coding system, and method for recording size reduced message in the variable rate coding system | |
JPH0816199A (en) | Sound recording device | |
JP3276863B2 (en) | Answering machine | |
JP2001175292A (en) | Audio signal encoding/decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121031 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20131030 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20141103 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20151102 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170508 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |