KR20070020584A - Apparatus for writing and playing audio and audio coding method in the apparatus - Google Patents

Apparatus for writing and playing audio and audio coding method in the apparatus Download PDF

Info

Publication number
KR20070020584A
KR20070020584A KR1020050074627A KR20050074627A KR20070020584A KR 20070020584 A KR20070020584 A KR 20070020584A KR 1020050074627 A KR1020050074627 A KR 1020050074627A KR 20050074627 A KR20050074627 A KR 20050074627A KR 20070020584 A KR20070020584 A KR 20070020584A
Authority
KR
South Korea
Prior art keywords
audio
section
frame
unit
audio data
Prior art date
Application number
KR1020050074627A
Other languages
Korean (ko)
Other versions
KR100776432B1 (en
Inventor
장두신
Original Assignee
주식회사 팬택
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택 filed Critical 주식회사 팬택
Priority to KR1020050074627A priority Critical patent/KR100776432B1/en
Publication of KR20070020584A publication Critical patent/KR20070020584A/en
Application granted granted Critical
Publication of KR100776432B1 publication Critical patent/KR100776432B1/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
    • H03M7/3046Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM] adaptive, e.g. adaptive differential pulse code modulation [ADPCM]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 코딩 기술에 관한 것으로, 특히 압축률을 향상시킬 수 있는 코딩 기술에 관한 것이다.The present invention relates to audio coding technology, and more particularly to a coding technology that can improve the compression rate.

본 발명에 따른 오디오 기록 재생 장치는 아날로그 오디오 신호를 디지털 오디오 데이터로 변환한 후 압축을 하기 전에, 불필요한 오디오 프레임을 삭제 처리한 후에 압축을 한다. 이 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.The audio recording and reproducing apparatus according to the present invention compresses an unnecessary audio frame after erasing an unnecessary audio frame before converting the analog audio signal into digital audio data and then compressing it. As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency and maintaining the sound quality of the entire audio stream. Provide the effect.

오디오, 코딩, 압축률. Audio, coding, compression rate.

Description

오디오 기록 재생 장치 및 그 장치에서 실행 가능한 압축률 개선을 위한 오디오 코딩 방법{Apparatus for writing and playing audio and audio coding method in the apparatus}Apparatus for writing and playing audio and audio coding method in the apparatus}

도 1은 본 발명의 일실시예에 따른 오디오 기록 재생 장치 구성을 개략적으로 도시한 블록도.1 is a block diagram schematically showing the configuration of an audio recording and reproducing apparatus according to an embodiment of the present invention;

도 2는 본 발명의 일실시예에 따른 압축률 개선을 위한 오디오 인코딩 방법을 개략적으로 도시한 흐름도.2 is a flowchart schematically illustrating an audio encoding method for improving a compression rate according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 따른 오디오 디코딩 방법을 개략적으로 도시한 흐름도.3 is a flowchart schematically illustrating an audio decoding method according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

100 : 메모리 200 : 인코딩부100: memory 200: encoding unit

210 : 샘플링/양자화부 220 : 구간 판별부210: sampling / quantization unit 220: section discriminating unit

223 : 에너지 산출부 225 : 구간 판단부223: energy calculation unit 225: section determination unit

230 : 구간 삭제부 240 : 압축 저장부230: section delete unit 240: compressed storage unit

250 : 정보 기록부 300 : 디코딩부250: information recording unit 300: decoding unit

310 : 데이터 변환부 320 : 백색잡음 추가부310: data conversion unit 320: white noise addition unit

330 : 압축 해제부330: decompression unit

본 발명은 오디오 코딩 기술에 관한 것으로, 특히 압축률을 향상시킬 수 있는 코딩 기술에 관한 것이다.The present invention relates to audio coding technology, and more particularly to a coding technology that can improve the compression rate.

종래 오디오 디코딩 기술은 입력되는 아날로그 오디오 신호를 8KHz 샘플링(sampling)한 후 16bit 양자화(quantization) 처리를 한다. 샘플링 및 양자화에 의해 디지털 방식의 오디오 데이터인 128Kbps의 PCM 데이터가 만들어진다. PCM은 음성이나 오디오의 특성을 고려하여 데이터를 압축하는 것이 아니라 단지 데이터를 8KHz 샘플링하여 16bit 선형 양자화 정도만 거치므로, 비음성 오디오 신호나 음성 신호 모두 가능하다. 이는 통신 채널상에 전송되는 목적보다는 메모리 상에 저장하여 활용하는 방식이 적당하며, 계산량이 작은 반면에 압축률은 현저히 떨어진다. 따라서 PCM 포맷은 오디오 데이터 변화량만을 압축하는 ADPCM(Adaptive Differential Pulse Coded Modulation)에 의해 압축된다. 종래는 이 같은 ADPCM에 의해 1/4 정도의 압축률을 얻을 수 있다.Conventional audio decoding technology performs 16-bit quantization after sampling an input analog audio signal at 8KHz. Sampling and quantization produce PCM data of 128 Kbps, digital audio data. PCM does not compress the data in consideration of the characteristics of voice or audio, but only 16-bit linear quantization by sampling the data at 8KHz, which is possible for both non-audio audio and voice signals. This method is more suitable for storage and use in memory than the purpose of transmission on a communication channel, while the calculation rate is small while the compression rate is significantly lower. Therefore, the PCM format is compressed by ADPCM (Adaptive Differential Pulse Coded Modulation), which compresses only the amount of audio data variation. Conventionally, the compression ratio of about 1/4 can be obtained by such an ADPCM.

본 발명은 이 같은 배경에서 도출된 것으로, 음질의 보존을 유지하면서도 압축률을 좀 더 개선하는 것을 목적으로 한다.The present invention is derived from this background, and aims to further improve the compression ratio while maintaining sound quality preservation.

상술한 목적을 달성하기 위한 본 발명의 일 양상에 따른 오디오 기록 재생 장치는 아날로그 오디오 신호를 디지털 오디오 데이터로 변환한 후 압축을 하기 전에, 불필요한 오디오 프레임을 삭제 처리한 후에 압축을 한다.An audio recording and reproducing apparatus according to an aspect of the present invention for achieving the above object compresses an unnecessary audio frame after the unwanted audio frame is deleted before converting the analog audio signal into digital audio data and then compressing it.

본 발명의 이 같은 양상에 따라 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.According to this aspect of the present invention, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency as well as the overall audio. Provides the effect of maintaining the sound quality of the stream.

전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명을 이러한 실시예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.The foregoing and further aspects of the present invention will become more apparent through the preferred embodiments described with reference to the accompanying drawings. Hereinafter, the present invention will be described in detail to enable those skilled in the art to easily understand and reproduce the present invention.

도 1은 본 발명의 일실시예에 따른 오디오 기록 재생 장치 구성을 개략적으로 도시한 블록도이다. 도시된 바와 같이 오디오 기록 재생 장치()는 메모리(100)와, 인코딩부(200)와, 디코딩부(300)를 포함한다. 메모리(100)는 바람직하게 비휘발성 메모리인 플래쉬 메모리일 수 있다. 인코딩부(200)는 종래와 같이 아날로그 오디오 신호의 PCM 데이터화 및 압축을 하여 메모리(100)에 저장 처리하는 구성이다. 그리고 디코딩부(300)는 인코딩부(200)에 의해 인코딩된 오디오 데이터를 그 역을 변환 처리를 통해 아날로그 오디오 신호로 복원하여 출력하는 구성이다. 이 같은 구성 및 이하 특징적인 하위 구성을 갖는 오디오 기록 재생 장치()는 휴대폰과 같은 오디오 기록 및 재생이 가능한 이동통신 단말기에 탑재되어 구현될 수도 있다.1 is a block diagram schematically showing the configuration of an audio recording and reproducing apparatus according to an embodiment of the present invention. As shown, the audio recording and reproducing apparatus includes a memory 100, an encoding unit 200, and a decoding unit 300. The memory 100 may be a flash memory, which is preferably a nonvolatile memory. The encoder 200 is configured to perform PCM data conversion and compression of an analog audio signal and store the processed data in the memory 100 as in the prior art. The decoding unit 300 is a component that restores the audio data encoded by the encoding unit 200 to an analog audio signal through a conversion process and outputs the analog audio signal. The audio recording and reproducing apparatus () having such a configuration and the following characteristic sub-configuration may be mounted on a mobile communication terminal capable of recording and reproducing audio such as a mobile phone.

본 발명의 특징적인 양상에 따른 인코딩부(200)는 입력되는 아날로그 오디오 신호를 샘플링 및 양자화하는 샘플링/양자화부(210)와, 샘플링 및 양자화된 오디오 데이터의 오디오 구간과 묵음 구간을 판별하는 구간 판별부(220)와, 구간 판별부(220)에 의해 판별된 묵음 구간의 적어도 일부를 삭제하는 구간 삭제부(230)와, 일부 구간이 삭제된 오디오 데이터를 압축하여 메모리(100)에 저장하는 압축 저장부(240)를 포함한다. According to an aspect of the present invention, the encoding unit 200 includes a sampling / quantization unit 210 for sampling and quantizing an input analog audio signal, and an interval discrimination section for determining an audio section and a silent section of the sampled and quantized audio data. A section 220, a section deleting unit 230 for deleting at least a portion of the silent section determined by the section discriminating unit 220, and compression for compressing audio data from which some sections are deleted and storing the compressed audio data in the memory 100 The storage unit 240 is included.

샘플링/양자화부(210)는 주지된 바와 같이 마이크 같은 입력 수단으로부터 입력되어 아날로그 신호 처리된 아날로그 오디오 신호를 디지털 오디오 데이터로 변환 처리한다. 구체적으로 샘플링/양자화부(210)는 아날로그 오디오 신호를 바람직하게 8KHz 샘플링(sampling)한 후에, 16bit의 양자화(quantization) 처리를 한다. 이 같은 샘플링/양자화부(210)의 아날로그 오디오 신호 처리에 의해 128Kbps의 PCM 데이터가 만들어진다.As is well known, the sampling / quantization unit 210 converts an analog audio signal input from an input means such as a microphone and processed into an analog signal to digital audio data. In detail, the sampling / quantization unit 210 performs sampling of the analog audio signal, preferably 8 KHz, and then performs 16-bit quantization. By the analog audio signal processing of the sampling / quantization unit 210, 128 Kbps of PCM data is generated.

구간 판별부(220)는 샘플링/양자화부(210)로부터 출력되는 128Kbps의 PCM 데이터의 오디오 구간과 묵음 구간을 판별한다. 본 실시예에 있어서, 구간 판별부(220)는 샘플링 및 양자화된 오디오 데이터의 프레임별 에너지 값을 산출하는 에너지 산출부(223)와, 에너지 산출부(223)에 의해 산출된 프레임별 에너지 값 레벨에 따라 오디오 구간인지 묵음 구간인지를 판단하는 구간 판단부(225)를 포함한다. 일 실시예에 있어서, 에너지 산출부(223)는 PCM 데이터의 1 프레임(20msec)별로 에너지 값을 산출한다. 여기서 프레임은 구간의 최소 단위가 된다. 또한 오디오 에너지는 오디오 크기에 비례하는 것으로, 소리의 크기에 대한 에너지라 할 수 있다. 일 예에 따라 오디오 에너지 산출은 PCM 데이터의 크기값을 제곱함에 의해 산출될 수 있다. 구간 판단부(225)는 에너지 산출부(223)에 의해 산출된 프레임별 오디오 에너지 값으로부터 그 프레임이 오디오 구간인지 아니면 묵음 구간인지를 판단한다. 바람직한 일 예에 따라 구간 판단부(225)는 사전에 정의된 경계값(boundary)을 기준으로 경계값보다 높으면 오디오 구간으로 판단하고, 경계값보다 낮으면 묵음 구간으로 판단한다.The section discriminating unit 220 determines the audio section and the silent section of the 128 Kbps PCM data output from the sampling / quantization unit 210. In the present embodiment, the section discriminating unit 220 is the energy calculation unit 223 for calculating the energy value of each frame of the sampled and quantized audio data, and the energy value level for each frame calculated by the energy calculator 223. And a section determination unit 225 for determining whether the audio section is the silent section. In one embodiment, the energy calculator 223 calculates an energy value for each frame (20 msec) of PCM data. The frame is the minimum unit of the interval. In addition, the audio energy is proportional to the audio volume and may be referred to as the energy of the loudness. According to an example, the audio energy calculation may be calculated by squaring the magnitude value of the PCM data. The section determination unit 225 determines whether the frame is an audio section or a silent section from the audio energy value for each frame calculated by the energy calculating section 223. According to an exemplary embodiment, the section determination unit 225 determines that the audio section is higher than the threshold value based on a predefined boundary value, and determines that it is the silent section when the threshold value is lower than the threshold value.

구간 삭제부(230)는 구간 판단부(225)에 의해 묵음 구간으로 판단된 구간 중 적어도 일부를 삭제 처리한다. 일 예에 따라 구간 삭제부(230)는 구간 판단부(225)에 의해 판단된 묵음 구간 전체를 삭제 처리할 수 있다. 바람직한 일 실시예에 있어서, 구간 삭제부(230)는 구간 판단부(225)에 의해 판단된 묵음 구간 중 일부만을 삭제 처리한다. 예를 들어 구간 삭제부(230)는 묵음 구간에 포함되는 프레임들 중 상대적으로 에너지 레벨이 높은 특정 프레임은 삭제하지 않는 것이다.The section deleting unit 230 deletes at least a portion of the section determined as the silent section by the section determining unit 225. According to an example, the section deleting unit 230 may delete the entire silent section determined by the section determining unit 225. In an exemplary embodiment, the section deleting unit 230 deletes only a part of the silent section determined by the section determining unit 225. For example, the section deleting unit 230 does not delete a specific frame having a relatively high energy level among the frames included in the silent section.

추가적으로 구간 삭제부(230)는 음성 구간으로 판별되더라도 에너지 레벨에 따라 일부 프레임은 삭제 처리한다. 바람직한 일 실시예에 있어서, 구간 삭제부(230)는 전자 프레임 대하여 그 뒤에 따라오는 일정 개수의 후자 프레임들간의 에너지를 비교하고, 상대적으로 에너지 레벨 차이가 많이 나는 후자 프레임들을 삭제 처리한다. 바람직한 일 예에 따라 구간 삭제부(230)는 에너지 레벨 차이에 대해 사전에 정의된 경계값(boundary)을 기준으로 후자 프레임들의 삭제를 처리한다. In addition, the section deleting unit 230 deletes some frames according to the energy level even if the section deleting unit 230 is determined as the voice section. In an exemplary embodiment, the section deleting unit 230 compares the energy between a predetermined number of latter frames following the electronic frame, and deletes the latter frames having a relatively large energy level difference. According to an exemplary embodiment, the section deleting unit 230 processes deletion of the latter frames based on a predefined boundary for the energy level difference.

압축 저장부(240)는 구간 삭제부(230)에서 적어도 일부 묵음 구간이 삭제된 PCM 데이터를 알려진 바와 같은 ADPCM(Adaptive Differential Pulse Coded Modulation) 포맷으로 압축하여 메모리(100)에 저장 처리한다.The compression storage unit 240 compresses the PCM data from which the at least some silent sections are deleted by the section deleting unit 230 in the adaptive differential pulse coded modulation (ADPCM) format as is known, and stores them in the memory 100.

본 발명의 바람직한 실시예에 따라 묵음 구간 및 오디오 구간의 일부 프레임을 삭제하는 것은, 인간 청각 능력의 분해능을 고려하여 높은 에너지를 갖는 특정 프레임 이후에 발생하는 임계치 이하의 낮은 에너지들의 프레임은 복원하지 않아도 인간이 구별하지 못한다는 타임 마스킹(Time Masking) 효과를 응용한 것이다. 이 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론 전체 오디오 스트림의 음질을 유지할 수 있는 효과를 제공한다.Deleting some frames of the silent section and the audio section according to the preferred embodiment of the present invention does not require reconstruction of a frame of low energy below the threshold that occurs after a specific frame having high energy in consideration of the resolution of the human hearing ability. It is a time masking effect that humans cannot distinguish. As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving the compression ratio and increasing memory efficiency and maintaining the sound quality of the entire audio stream. Provide the effect.

본 발명의 추가적인 양상에 따라 인코딩부(200)는 삭제된 프레임 정보를 메모리(100)에 기록하는 정보 기록부(250)를 더 포함하며, 디코딩부(300)는 메모리(100)에 저장된 오디오 데이터를 압축 해제하는 압축 해제부(330)와, 메모리(100)에 기록된 프레임 정보를 참조하여 압축 해제부(330)에 의해 압축 해제된 오디오 데이터의 삭제 프레임 위치에 백색 잡음(white noise)를 추가하는 백색잡음 추가부(320)와, 백색잡음 추가부(320)에 의해 백색 잡음이 추가된 오디오 데이터를 아날로그 오디오 신호로 변환하여 출력하는 데이터 변환부(310)를 포함한다.According to an additional aspect of the present invention, the encoding unit 200 further includes an information recording unit 250 for recording the deleted frame information in the memory 100, and the decoding unit 300 stores the audio data stored in the memory 100. White noise is added to the decompression unit 330 for decompression and the erase frame position of the audio data decompressed by the decompression unit 330 with reference to the frame information recorded in the memory 100. The white noise adding unit 320 and the white noise adding unit 320 include a data converter 310 for converting the audio data to which the white noise is added into an analog audio signal and outputting the analog audio signal.

정보 기록부(250)는 구간 삭제부(230)에서 삭제 처리되는 프레임에 대한 정보를 메모리(100)에 기록한다. 일 실시예에 있어서, 정보 기록부(250)가 메모리(100)에 기록하는 프레임 정보는 전체 오디오 데이터 구간에서 삭제된 프레임의 위치에 대한 정보가 될 수 있다. 또다른 실시예에 있어서, 정보 기록부(250)가 메모 리(100)에 기록하는 프레임 정보는 전체 오디오 데이터 구간에서 삭제된 프레임의 위치에 대한 정보뿐만 아니라 그 삭제된 프레임의 에너지 레벨 정보를 더 포함할 수 있다. 이 같은 삭제된 프레임 정보는 이하 설명하는 디코딩부(300)에서 메모리(100)에 저장된 오디오 데이터를 디코딩할 때 이용되게 된다.The information recording unit 250 records information about a frame deleted by the section deleting unit 230 in the memory 100. In one embodiment, the frame information recorded in the memory 100 by the information recording unit 250 may be information about the position of the deleted frame in the entire audio data section. In another embodiment, the frame information recorded by the information recording unit 250 in the memory 100 further includes energy level information of the deleted frame as well as information on the position of the deleted frame in the entire audio data section. can do. Such deleted frame information is used when the decoding unit 300 to be described below decodes the audio data stored in the memory 100.

압축 해제부(330)는 메모리(100)에 저장된 오디오 데이터를 압축 해제한다. 바람직한 일 실시예에 따라 압축 해제부(330)는 인코딩부(200)에서 사용된 압축 방식에 따라 오디오 데이터를 압축 해제한다. 압축 해제부(330)에 의해 오디오 데이터가 압축 해제되면, PCM 데이터 포맷을 갖게 된다. The decompressor 330 decompresses the audio data stored in the memory 100. According to a preferred embodiment, the decompressor 330 decompresses the audio data according to the compression method used by the encoder 200. When the audio data is decompressed by the decompressor 330, the audio data has a PCM data format.

백색잡음 추가부(320)는 현재 디코딩 처리중인 오디오 데이터에 해당하는 프레임 정보를 메모리(100)로부터 읽어들인다. 일 실시예에 있어서, 백색잡음 추가부(320)는 프레임 정보인 오디오 데이터의 전체 구간에서 삭제된 프레임의 원래 위치에 대한 정보를 통해, 그 구간에 디폴트(default) 크기를 갖는 백색 잡음(white noise)을 추가한다. 백색 잡음을 추가하는 이유는 전체 오디오 스트림의 동기를 맞추어 주기 위함이다. 또다른 실시예에 있어서, 백색잡음 추가부(320)는 프레임 정보인 오디오 데이터의 전체 구간에서 삭제된 프레임의 원래 위치 및 에너지 레벨 정보를 통해, 그 구간에 원래 에너지 레벨을 갖는 백색 잡음(white noise)을 추가한다. The white noise adding unit 320 reads frame information corresponding to the audio data currently being decoded from the memory 100. In one embodiment, the white noise adding unit 320 is a white noise having a default size in the interval through the information on the original position of the deleted frame in the entire interval of the audio data that is frame information Add). The reason for adding white noise is to keep the entire audio stream in sync. In another exemplary embodiment, the white noise adding unit 320 uses the original position and energy level information of the deleted frame in the entire section of the audio data, which is the frame information, to provide white noise having the original energy level in the section. Add).

데이터 변환부(310)는 백색잡음 추가부(320)에 의해 삭제된 프레임 구간에 백색 잡음이 삽입된 오디오 데이터를 전술한 샘플링/양자화의 역의 처리를 통해 아날로그 오디오 신호로 변환하여 출력한다.The data converter 310 converts and outputs audio data in which white noise is inserted into a frame section erased by the white noise adding unit 320 into an analog audio signal through the above-described processing of sampling / quantization.

도 2는 본 발명의 일실시예에 따른 압축률 개선을 위한 오디오 코딩 방법을 개략적으로 도시한 흐름도이다. 예를 들어 음성 녹음 모드 상태에서 마이크로부터 아날로그 오디오 신호가 입력되면, 샘플링/양자화부(210)는 입력된 신호를 8KHz 샘플링(sampling)하고 16bit 양자화(quantization)하여 PCM 데이터로 변환한다(단계 S210)(단계 S220). 구간 판별부(220)는 변환된 PCM 데이터의 오디오 구간과 묵음 구간을 판별한다. 일 실시예에 있어서, 구간 판별부(220)는 PCM 데이터의 1 프레임(20msec)별로 에너지 값을 산출한다(단계 S230). 그리고 산출된 프레임별 에너지 레벨에 따라 오디오 구간과 묵음 구간으로 구분하고, 바람직하게 선택적으로 프레임 구간을 삭제한다(단계 S240). 구간 삭제에 대한 실시예에 대해서는 이미 자세히 언급하였으므로, 불필요한 중복 설명은 생략한다. 압축 저장부(240)는 선택적으로 프레임 구간 삭제된 PCM 데이터를 바람직하게 ADPCM 포맷으로 압축하여 메모리(100)에 저장 처리한다(단계 S250)(단계 S260). 그리고 도시하지는 않았지만, 인코딩부(200)의 정보 기록부(250)는 PCM 데이터 중 삭제된 프레임 구간에 대한 위치 정보, 나아가 에너지 값에 대한 정보를 메모리(100)에 기록한다. 메모리(100)에 기록된 정보는 이하 도 3을 참조로 하여 설명하는 오디오 데이터의 디코딩 시에 이용된다.2 is a flowchart schematically illustrating an audio coding method for improving compression ratio according to an embodiment of the present invention. For example, when an analog audio signal is input from the microphone in the voice recording mode, the sampling / quantization unit 210 samples the input signal at 8 KHz, and 16-bit quantizes the converted signal into PCM data (step S210). (Step S220). The section discriminating unit 220 determines an audio section and a silent section of the converted PCM data. In one embodiment, the interval determination unit 220 calculates an energy value for each frame (20msec) of the PCM data (step S230). The audio section is divided into an audio section and a silent section according to the calculated energy level for each frame, and preferably, the frame section is selectively deleted (step S240). Since the embodiment for deleting the section has already been described in detail, unnecessary redundant description is omitted. The compression storage unit 240 selectively compresses the PCM data of which the frame section is deleted in the ADPCM format and stores the processed data in the memory 100 (step S250) (step S260). Although not shown, the information recording unit 250 of the encoding unit 200 records the position information of the deleted frame section among the PCM data, and also the information on the energy value, in the memory 100. The information recorded in the memory 100 is used at the time of decoding the audio data described below with reference to FIG.

도 3은 본 발명의 일실시예에 따른 오디오 디코딩 방법을 개략적으로 도시한 흐름도이다. 예를 들어 사용자가 메모리(100)에 저장된 오디오 데이터들 중 하나를 선택하여 재생 명령을 하면, 압축 해제부(330)는 ADPCM 포맷으로 압축되어 있는 선택된 오디오 데이터를 압축 해제한다(단계 S310). 백색잡음 추가부(320)는 메모 리(100)에 기록된 프레임 정보들 중 선택된 오디오 데이터에 해당하는 프레임 정보를 참조하여 압축 해제된 PCM 데이터의 삭제 프레임 구간에 백색 잡음(white noise)을 추가한다(단계 S320). 일 실시예에 따라 백색잡음 추가부(320)는 삭제 프레임 구간에 동일한 디폴트(default) 크기를 갖는 백색 잡음을 추가할 수 있으며, 또다른 실시예에 따라 원래 에너지 레벨을 갖는 백색 잡음을 추가할 수도 있다. 데이터 변환부(310)는 백색 잡음이 추가된 PCM 데이터를 샘플링/양자화의 역 처리를 통해 아날로그 오디오 신호로 변환하여 스피커로 출력한다.3 is a flowchart schematically illustrating an audio decoding method according to an embodiment of the present invention. For example, when a user selects one of the audio data stored in the memory 100 and performs a playback command, the decompressor 330 decompresses the selected audio data compressed in the ADPCM format (step S310). The white noise adding unit 320 adds white noise to the erase frame section of the decompressed PCM data by referring to the frame information corresponding to the selected audio data among the frame information recorded in the memory 100. (Step S320). According to an embodiment, the white noise adding unit 320 may add white noise having the same default size to the erasure frame section. Alternatively, the white noise adding unit 320 may add white noise having an original energy level. have. The data converter 310 converts PCM data including white noise into an analog audio signal through reverse processing of sampling / quantization and outputs the analog audio signal to a speaker.

상술한 바와 같이 본 발명에 따른 오디오 기록 재생 장치는 사람의 청각이 민감하지 않은 범위 안에서 불필요한 오디오 프레임을 삭제 처리할 수 있으므로, 압축률을 개선하여 메모리 효율을 높일 수 있음은 물론, 음성 구간이라도 선별적인 프레임 삭제와 묵음 구간에서도 선별적으로 프레임 삭제를 하지 않음으로써 전체 오디오 스트림 상의 음질을 효과적으로 유지할 수 있게 한다.As described above, the audio recording and reproducing apparatus according to the present invention can delete unnecessary audio frames within a range in which human hearing is not sensitive, thereby improving memory efficiency by improving the compression ratio, and selectively selecting even voice sections. In the frame erasure and silent periods, the frame quality is not selectively deleted, thereby effectively maintaining the sound quality of the entire audio stream.

한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌 자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.On the other hand, the present invention has been described with reference to the embodiments shown in the drawings, which are merely exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention should be defined only by the appended claims.

Claims (12)

오디오 코딩 방법에 있어서, 상기 방법이 :In an audio coding method, the method is: a) 아날로그 오디오 신호를 샘플링 및 양자화하는 단계와;a) sampling and quantizing the analog audio signal; b) 양자화된 오디오 데이터의 오디오 구간과 묵음 구간을 판별하는 단계와;b) determining an audio section and a silent section of the quantized audio data; c) 묵음 구간의 적어도 일부를 삭제하는 단계와;c) deleting at least a portion of the silent section; d) 적어도 일부 구간이 삭제된 오디오 데이터를 압축하여 저장하는 단계;d) compressing and storing audio data from which at least some sections are deleted; 를 포함하는 것을 특징으로 하는 압축률 개선을 위한 오디오 코딩 방법.Audio coding method for improving the compression rate comprising a. 제 1 항에 있어서, 상기 단계 b)가 :The process of claim 1, wherein step b) is: b1) 샘플링 및 양자화된 오디오 데이터의 프레임별 에너지 값을 산출하는 단계와,b1) calculating frame-by-frame energy values of the sampled and quantized audio data; b2) 산출된 프레임별 에너지 레벨에 따라 오디오 구간인지 묵음 구간인지를 판단하는 단계를 포함하는 것을 특징으로 하는 압축률 개선을 위한 오디오 코딩 방법.b2) determining an audio section or a silent section according to the calculated energy level for each frame. 제 2 항에 있어서, 상기 단계 c)가 :The process of claim 2, wherein step c) is: 묵음 구간의 적어도 일부를 삭제하되, 상대적으로 에너지 레벨이 높은 프레임은 제외하는 것을 특징으로 하는 압축률 개선을 위한 오디오 코딩 방법.The method of claim 2, wherein at least a portion of the silent section is deleted, but a frame having a relatively high energy level is excluded. 제 2 항에 있어서, 상기 방법이 :The method of claim 2 wherein the method is: e) 상대적으로 큰 오디오 프레임에 뒤따르는 하나 이상의 후자 프레임을 삭제하는 단계;e) deleting one or more latter frames following a relatively large audio frame; 를 더 포함하는 것을 특징으로 하는 압축률 개선을 위한 오디오 코딩 방법.Audio coding method for improving the compression rate, characterized in that it further comprises. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 상기 방법이 :The method of claim 1, wherein the method comprises: f) 삭제된 프레임 정보를 기록하는 단계와;f) recording deleted frame information; p) 상기 단계 d)에 의해 저장된 오디오 데이터를 압축 해제하는 단계와;p) decompressing the audio data stored by step d); q) 상기 단계 f)에 의해 기록된 프레임 정보를 참조하여 압축 해제된 오디오 데이터의 삭제 프레임 위치에 백색 잡음(white noise)를 추가하는 단계와;q) adding white noise to the erase frame position of the decompressed audio data with reference to the frame information recorded by step f); r) 백색 잡음이 추가된 오디오 데이터를 아날로그 오디오 신호로 변환하여 출력하는 단계;r) converting the audio data added with white noise into an analog audio signal and outputting the analog audio signal; 를 더 포함하는 것을 압축률 개선을 위한 오디오 코딩 방법.Audio coding method for improving the compression rate further comprising. 제 5 항에 있어서, 상기 단계 q)가 :The method of claim 5, wherein step q) comprises: 상기 단계 f)에 의해 기록된 프레임 정보를 참조하여 삭제 프레임의 에너지 레벨을 갖는 백색 잡음을 추가하는 것을 특징으로 하는 압축률 개선을 위한 오디오 코딩 방법.And adding white noise having an energy level of an erased frame with reference to the frame information recorded by the step f). 메모리와, 인코딩부와, 디코딩부를 포함하는 오디오 기록 재생 장치에 있어 서, 상기 인코딩부가 :In an audio recording and reproducing apparatus including a memory, an encoding section and a decoding section, the encoding section includes: 입력되는 아날로그 오디오 신호를 샘플링 및 양자화하는 샘플링/양자화부와;A sampling / quantization unit for sampling and quantizing the input analog audio signal; 샘플링 및 양자화된 오디오 데이터의 오디오 구간과 묵음 구간을 판별하는 구간 판별부와;A section discriminating section for discriminating an audio section and a silent section of the sampled and quantized audio data; 상기 구간 판별부에 의해 판별된 묵음 구간의 적어도 일부를 삭제하는 구간 삭제부와;A section deleting unit which deletes at least a portion of the silent section determined by the section discriminating unit; 일부 구간이 삭제된 오디오 데이터를 압축하여 상기 메모리에 저장하는 압축 저장부;A compression storage unit for compressing audio data from which some sections are deleted and storing the compressed audio data in the memory; 를 포함하는 것을 특징으로 하는 오디오 기록 재생 장치.Audio recording and reproducing apparatus comprising a. 제 7 항에 있어서, 상기 구간 판별부가 :The method of claim 7, wherein the section discriminating unit: 샘플링 및 양자화된 오디오 데이터의 프레임별 에너지 값을 산출하는 에너지 산출부와,An energy calculator for calculating an energy value of each frame of the sampled and quantized audio data; 상기 에너지 산출부에 의해 산출된 프레임별 에너지 레벨에 따라 오디오 구간인지 묵음 구간인지를 판단하는 구간 판단부를 포함하는 것을 특징으로 하는 오디오 기록 재생 장치.And a section determination section that determines whether the audio section is the silent section or the silent section according to the energy level of each frame calculated by the energy calculating section. 제 8 항에 있어서, 상기 구간 삭제부가 :The method of claim 8, wherein the section deleting unit: 묵음 구간의 적어도 일부를 삭제하되, 상대적으로 에너지 레벨이 높은 프레임은 제외하는 것을 특징으로 하는 오디오 기록 재생 장치.An audio recording and reproducing apparatus, characterized in that at least a part of the silent section is deleted, but a frame having a relatively high energy level is excluded. 제 8 항에 있어서, 상기 구간 삭제부가 :The method of claim 8, wherein the section deleting unit: 상대적으로 큰 오디오 프레임에 뒤따르는 하나 이상의 후자 프레임을 삭제하는 것을 특징으로 하는 오디오 기록 재생 장치.And at least one latter frame following a relatively large audio frame. 제 7 항 내지 제 10 항 중 어느 한 항에 있어서, 상기 인코딩부가 :The apparatus of claim 7, wherein the encoding unit comprises: 삭제된 프레임 정보를 상기 메모리에 기록하는 정보 기록부;를 더 포함하며,And an information recording unit for recording deleted frame information in the memory. 상기 디코딩부가 :The decoding unit: 상기 메모리에 저장된 오디오 데이터를 압축 해제하는 압축 해제부와;A decompression unit for decompressing audio data stored in the memory; 상기 메모리에 기록된 프레임 정보를 참조하여 상기 압축 해제부에 의해 압축 해제된 오디오 데이터의 삭제 프레임 위치에 백색 잡음(white noise)를 추가하는 백색잡음 추가부와;A white noise adding unit which adds white noise to the erase frame position of the audio data decompressed by the decompression unit with reference to the frame information recorded in the memory; 상기 백색잡음 추가부에 의해 백색 잡음이 추가된 오디오 데이터를 아날로그 오디오 신호로 변환하여 출력하는 데이터 변환부;A data converter converting the audio data having the white noise added by the white noise adder into an analog audio signal and outputting the analog audio signal; 를 더 포함하는 것을 특징으로 하는 오디오 기록 재생 장치.Audio recording and reproducing apparatus further comprising. 제 11 항에 있어서, 상기 백색잡음 추가부가 :The method of claim 11, wherein the white noise addition portion: 상기 메모리에 기록된 프레임 정보를 참조하여 삭제 프레임의 에너지 레벨을 갖는 백색 잡음을 추가하는 것을 특징으로 하는 오디오 기록 재생 장치.And white noise having an energy level of an erased frame with reference to the frame information recorded in the memory.
KR1020050074627A 2005-08-16 2005-08-16 Apparatus for writing and playing audio and audio coding method in the apparatus KR100776432B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050074627A KR100776432B1 (en) 2005-08-16 2005-08-16 Apparatus for writing and playing audio and audio coding method in the apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050074627A KR100776432B1 (en) 2005-08-16 2005-08-16 Apparatus for writing and playing audio and audio coding method in the apparatus

Publications (2)

Publication Number Publication Date
KR20070020584A true KR20070020584A (en) 2007-02-22
KR100776432B1 KR100776432B1 (en) 2007-11-16

Family

ID=41637439

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050074627A KR100776432B1 (en) 2005-08-16 2005-08-16 Apparatus for writing and playing audio and audio coding method in the apparatus

Country Status (1)

Country Link
KR (1) KR100776432B1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3227929B2 (en) * 1993-08-31 2001-11-12 ソニー株式会社 Speech encoding apparatus and decoding apparatus for encoded signal
JP2838159B2 (en) * 1993-12-28 1998-12-16 株式会社アドバンス Audio signal processing device
KR0170658B1 (en) * 1994-12-15 1999-03-30 김광호 Compression-extension method of audio signal and the apparatus suitable for this method
JPH1051337A (en) 1996-07-29 1998-02-20 Yukio Hiromoto Fm multiplex character broadcast sound recording control program device
US6029127A (en) 1997-03-28 2000-02-22 International Business Machines Corporation Method and apparatus for compressing audio signals
KR20030004819A (en) * 2001-07-06 2003-01-15 엘지전자 주식회사 Audio system for recording audio signals on digital medium to remove noise of them reproduced on analog medium

Also Published As

Publication number Publication date
KR100776432B1 (en) 2007-11-16

Similar Documents

Publication Publication Date Title
JP3145358B2 (en) Silence period compression method
US20030215013A1 (en) Audio encoder with adaptive short window grouping
KR100473889B1 (en) Method of editing audio data and recording medium thereof and digital audio player
KR20100089772A (en) Method of coding/decoding audio signal and apparatus for enabling the method
JP5446013B2 (en) Coding apparatus and decoding apparatus for adaptive differential pulse code modulation
JP3784583B2 (en) Audio storage device
JPWO2005057550A1 (en) Audio compression / decompression equipment
KR100776432B1 (en) Apparatus for writing and playing audio and audio coding method in the apparatus
JP4508599B2 (en) Data compression method
JP3227929B2 (en) Speech encoding apparatus and decoding apparatus for encoded signal
JP4618634B2 (en) Compressed audio data processing method
JP2005149608A (en) Audio data recording/reproducing system and audio data recording medium therefor
JP2005316499A (en) Voice-coder
JPH10326100A (en) Voice recording method, voice reproducing method, and voice recording and reproducing device
KR19990013584A (en) Speech Coding Decoding Method
JP2905215B2 (en) Recording and playback device
JPH11283332A (en) Compressed data storage device
JP4556866B2 (en) High efficiency encoding program and high efficiency encoding apparatus
JP2005151327A (en) Pcm data compressing/decompressing method and apparatus
JP2002287800A (en) Speech signal processor
KR0141237B1 (en) Audio signal recording/reproducing method
JP2000078274A (en) Message recorder for variable rate coding system, and method for recording size reduced message in the variable rate coding system
JPH0816199A (en) Sound recording device
JP3276863B2 (en) Answering machine
JP2001175292A (en) Audio signal encoding/decoding device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121031

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131030

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141103

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20151102

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170508

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee