KR20060128212A - Apparatus and method for playback speed altering with preservation of tone signal - Google Patents
Apparatus and method for playback speed altering with preservation of tone signal Download PDFInfo
- Publication number
- KR20060128212A KR20060128212A KR1020050049460A KR20050049460A KR20060128212A KR 20060128212 A KR20060128212 A KR 20060128212A KR 1020050049460 A KR1020050049460 A KR 1020050049460A KR 20050049460 A KR20050049460 A KR 20050049460A KR 20060128212 A KR20060128212 A KR 20060128212A
- Authority
- KR
- South Korea
- Prior art keywords
- file
- sound
- playback speed
- speed
- pcm data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004321 preservation Methods 0.000 title 1
- 239000000872 buffer Substances 0.000 claims abstract description 33
- 230000005236 sound signal Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 6
- 239000003638 chemical reducing agent Substances 0.000 claims description 5
- 239000003623 enhancer Substances 0.000 claims description 5
- 230000008929 regeneration Effects 0.000 claims description 5
- 238000011069 regeneration method Methods 0.000 claims description 5
- 230000003139 buffering effect Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 2
- 230000006866 deterioration Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000000593 degrading effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/34—Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/30—Delta-sigma modulation
- H03M3/322—Continuously compensating for, or preventing, undesired influence of physical parameters
- H03M3/324—Continuously compensating for, or preventing, undesired influence of physical parameters characterised by means or methods for compensating or preventing more than one type of error at a time, e.g. by synchronisation or using a ratiometric arrangement
- H03M3/346—Continuously compensating for, or preventing, undesired influence of physical parameters characterised by means or methods for compensating or preventing more than one type of error at a time, e.g. by synchronisation or using a ratiometric arrangement by suppressing active signals at predetermined times, e.g. muting, using non-overlapping clock phases
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/00057—MPEG-1 or MPEG-2 audio layer III [MP3]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/00065—Sigma-delta audio encoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/1062—Data buffering arrangements, e.g. recording or playback buffers
- G11B2020/10675—Data buffering arrangements, e.g. recording or playback buffers aspects of buffer control
- G11B2020/10694—Data buffering arrangements, e.g. recording or playback buffers aspects of buffer control output interface, i.e. the way data leave the buffer, e.g. by adjusting the clock rate
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
도1은 종래 기술에 따른 엠피쓰리(MP3) 플레이어의 블록 구성도,1 is a block diagram of an MP3 player according to the prior art;
도2는 본 발명의 일 실시예에 따른 음성신호를 보존하는 재생속도 가변 장치의 블록 구성도,2 is a block diagram of a reproducing rate variable device for preserving a voice signal according to an embodiment of the present invention;
도3은 도2의 음성신호를 보존하는 재생속도 가변 장치의 재생속도 조절기의 세부 블록 구성도,FIG. 3 is a detailed block diagram of a playback speed controller of the playback speed variable device for retaining the audio signal of FIG.
도4는 도2의 음성신호를 보존하는 재생속도 가변 장치의 PCM 데이터 처리기의 세부 블록 구성도,FIG. 4 is a detailed block diagram of a PCM data processor of the apparatus for variable playing speed storing the audio signal of FIG. 2; FIG.
도5는 본 발명의 일실시예에 따른 음성신호를 보존하는 재생속도 가변 방법을 도시한 절차 흐름도이다.5 is a flowchart illustrating a method of changing a reproduction speed for preserving a voice signal according to an embodiment of the present invention.
본 발명은 음성신호를 보존하는 재생속도 가변 장치 및 방법에 관한 것으로, 보다 구체적으로는 음성의 밀도 변화를 이용하여 음색 및 음질의 열화 없이 의미 있는 신호의 재생속도를 능동적으로 가변시키는, 음성신호를 보존하는 재생속도 가변 장치 및 방법에 관한 것이다.The present invention relates to a reproducing rate variable device and method for preserving a voice signal, and more particularly to a voice signal that actively varies the reproducing speed of a meaningful signal without deterioration of timbre and sound quality by using a change in density of the voice. The present invention relates to a variable speed regenerative apparatus and method.
일반적으로, 음성 재생속도를 늦추면 청각 인지 후 두뇌의 사고 사이 간격을 늘릴 수 있게 되어, 사람의 음성 정보 인식 능력이 향상된다. 그러나 음성 정보 인식 향상을 위해 단순히 재생시간을 늦추는 것은 음성이 열화(劣化)되어 음성정보 인식이 오히려 저하된다. In general, slowing the speed of speech can increase the interval between brain thinking after hearing recognition, thereby improving the ability of humans to recognize voice information. However, simply delaying the playback time to improve the speech information recognition deteriorates the speech and degrades the speech information recognition.
종래에 음성 재생 시간을 늘리거나 줄이는 방법은 음성 재생속도를 변경한 후, 재생속도의 변경에 따라 발생된 음성 열화를 음성 비선형 여과기를 사용하여 열화현상을 보상하는 방법을 주로 사용하였다. 도1은 종래 기술에 따른 엠피쓰리(MP3) 플레이어의 원음 재생 블록 구성도이다.Conventionally, a method of increasing or decreasing a voice reproduction time mainly uses a method of compensating for degradation by using a voice nonlinear filter after changing the reproduction speed of a voice and changing the reproduction speed. 1 is a block diagram of an original sound reproduction block of an MP3 player according to the prior art.
이러한 종래의 음성 재생 시간을 늘리거나 줄이는 방법은 음성 비선형 여과기를 사용하여야하고, 음성 주파수 특성에 따라 음성 비선형 여과기를 설계하여야 하는 문제점이 있다.The conventional method of increasing or decreasing the voice reproduction time has to use a voice nonlinear filter and has a problem of designing a voice nonlinear filter according to voice frequency characteristics.
본 발명은 상술한 문제점을 해결하기 위하여 창안된 것으로, 의미가 적은 음성 구간을 능동적으로 속도를 변경하여 의미가 있는 음성을 열화시키지 않으면서 음성 재생속도를 조절하는, 음성신호를 보존하는 재생속도 가변 장치 및 방법을 제 공하는데 그 목적이 있다.The present invention was devised to solve the above-described problems, and the play speed variable for preserving the voice signal to adjust the voice play speed without degrading the meaningful voice by actively changing the speed in the voice section having a low meaning Its purpose is to provide an apparatus and method.
본 발명의 다른 목적 및 장점들은 하기에 설명될 것이며, 본 발명의 실시예에 의해 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허청구범위에 나타낸 수단 및 조합에 의해 실현될 수 있다.Other objects and advantages of the invention will be described below and will be appreciated by the embodiments of the invention. Furthermore, the objects and advantages of the present invention can be realized by means and combinations indicated in the claims.
상기와 같은 목적을 달성하기 위한 본 발명은, 압축된 소리 파일이 저장되는 파일 저장부, 상기 파일 저장부의 소리 파일을 버퍼링하는 파일 버퍼, 상기 파일 버퍼의 소리 파일 정보를 저장하고, 사용자의 재생 속도 요구에 따라 재생 속도 정보를 생성하는 재생 속도 조절부, 상기 파일 버퍼로부터 전달되는 소리 파일을 PCM 데이터로 변환하는 디코더, 상기 디코더로부터 전달되는 PCM 데이터를 버퍼링하는 데이터 버퍼, 상기 데이터 버퍼로부터 전달되는 PCM 데이터에서 음성이 없는 구간을 찾아서 상기 재생 속도 정보에 따라 재생 속도를 조절하는 PCM 데이터 처리부 및 상기 PCM 데이터 처리부로부터 전달되는 PCM 데이터를 음성 아날로그 신호로 변환하는 코덱을 포함한다.According to an aspect of the present invention, a file storage unit for storing a compressed sound file, a file buffer for buffering a sound file of the file storage unit, a sound file information of the file buffer, and a playback speed of a user are stored. A reproduction speed adjusting unit for generating reproduction rate information on demand, a decoder for converting a sound file transmitted from the file buffer into PCM data, a data buffer for buffering PCM data transmitted from the decoder, and a PCM transmitted from the data buffer And a codec for converting PCM data transferred from the PCM data processor to a voice analog signal by finding a section in which data is absent from the data and adjusting a playback speed according to the reproduction speed information.
여기에서, 상기 파일 저장부는 엠피 쓰리(MP3) 파일, 윈도 미디어 오디오(WMA)파일 및 오그 보비스(OGG) 파일 중 적어도 하나의 소리 파일을 저장하고, 상기 디코더는 상기 파일 저장부에 저장된 소리 파일을 디코딩하는 엠피 쓰리 디코더, 윈도 미디어 오디오 디코더, 오그 보비스 디코더 중 적어도 하나의 디코더인 것이 바람직하다.Here, the file storage unit stores at least one sound file of an MP3 file, a Windows Media Audio (WMA) file, and an OGG Vorbis (OGG) file, and the decoder stores the sound file stored in the file storage unit. Preferably, the decoder is at least one of an MP3 decoder, a Windows Media Audio decoder, and an Ogg Vorbis decoder.
또한, 상기 재생 속도 조절부는 상기 파일 버퍼의 소리 파일 정보를 저장하는 헤더 데이터 분석기, 사용자의 재생 속도 요구에 따라서 현재 구동 중인 상기 파일 버퍼의 소리 파일의 재생 속도 정보를 설정하는 재생 속도 생성기, 상기 재생 속도 정보에 따라서 상기 소리 파일을 재생할 수 있도록 상기 PCM 데이터 처리부를 제어하는 PCM 데이터 조절기, 감지된 사용자의 재생 속도 요구에 따라 재생 속도 정보를 설정하도록 상기 재생 속도 생성기를 제어하는 동작 상태 제어기를 포함한다.The playback speed controller may further include a header data analyzer configured to store sound file information of the file buffer, a playback speed generator configured to set playback speed information of a sound file of the file buffer currently driven according to a playback speed request of the user, and the playback A PCM data controller controlling the PCM data processing unit to play the sound file according to the speed information, and an operation state controller controlling the playback speed generator to set the playback speed information according to the detected playback speed request of the user. .
또한 상기 재생 속도 조절부는 상기 파일 버퍼의 소리 파일의 동작 상태 정보를 표시하는 동작 상태 표시기를 더 포함할 수 있다.The reproduction speed controller may further include an operation state indicator for displaying operation state information of the sound file of the file buffer.
또한 상기 PCM 데이터 처리부는 상기 데이터 버퍼로부터 전달되는 PCM 데이터에서 음성을 제외한 소리 신호를 감쇄시키는 음성 여과기, 상기 PCM 데이터에서 유음 구간과 무음 구간을 찾아내는 기준을 설정하고, 설정된 기준에 따라 무음 구간 정보를 생성하는 음량 측정기, 상기 무음 구간에 상기 재생 속도 정보에 따라 무음 데이터를 추가하는 PCM 데이터 증대기 및 상기 무음 구간에 상기 재생 속도 정보에 따라 무음 데이터를 제거하는 PCM 데이터 감축기를 포함한다.The PCM data processor may also set a voice filter for attenuating sound signals excluding voices from the PCM data transmitted from the data buffer, a criterion for finding a sounded section and a silent section from the PCM data, and setting silent section information according to the set criteria. And a PCM data enhancer for adding silent data to the silent section according to the playback speed information, and a PCM data reducer to remove silent data according to the playback speed information to the silent section.
또한 본 발명은 소리 파일로부터 분리된 소리 재생 정보를 이용하여 소리를 재생하는 재생 속도 조절 방법에 있어서, 상기 소리 파일의 재생 속도 가변 영역을 정하는 기준 음압을 설정하는 임계 재생 음압 설정단계, 상기 기준 음압으로부터 일정 범위 구간을 상기 가변 영역으로 설정하는 가변 영역 설정단계, 상기 가변 영역과 상기 가변 영역외의 구간비로 재생 속도 조절 정보를 설정하는 재생속도 설정 단계, 사용자로부터 재생 속도 비율을 입력받는 단계, 상기 재생 속조 조절 정보를 이용하여 상기 재생속도 비율에 따라 소리 파일을 재생하는 단계를 포함한다.In another aspect, the present invention provides a method for adjusting a reproduction speed using sound reproduction information separated from a sound file, the threshold sound pressure setting step of setting a reference sound pressure for determining a variable speed range of the sound file, the reference sound pressure A variable region setting step of setting a predetermined range section from the variable region to a playback speed setting step of setting playback speed control information at a section ratio outside the variable region and the variable region; receiving a playback rate ratio from a user; Playing a sound file according to the play speed ratio using the speed control information.
여기에서 상기 임계 재생 음압 설정단계는 상기 소리 파일의 일부분을 재생하여 음성 이외의 신호를 감쇄시킨 후 상기 기준음압을 설정하는 것이 바람직하다.Here, in the threshold reproducing sound pressure setting step, the reference sound pressure may be set after reproducing a portion of the sound file to attenuate signals other than voice.
또한 상기 임계 재생 음압 설정단계는 상기 소리 파일의 일부분을 24/1000초 이상의 시간 구간에서 4회 이상 표본 조사한 표본 음압값을 상기 기준음압으로 할 수 있다.The threshold reproducing sound pressure setting step may be a reference sound pressure value of a sample sound pressure obtained by sampling a portion of the sound file four or more times in a time interval of 24/1000 seconds or more.
또한 상기 가변 영역 설정단계는 상기 일정 범위 구간을 상기 기준음압에 대하여 170% 이하의 음압 구간과 +40% 이상의 음압구간으로 하는 것이 바람직하다.In the variable region setting step, the predetermined range may be a sound pressure section of 170% or less and a sound pressure section of + 40% or more with respect to the reference sound pressure.
또한 상기 소리파일 재생단계는 상기 가변영역에서 아래 수학식에 따라 상기 사용자가 입력한 속도 비율로 상기 소리파일을 재생하는 것이 바람직하다.In the sound file reproducing step, the sound file may be reproduced at the speed ratio input by the user according to the following equation in the variable region.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Prior to this, terms or words used in the specification and claims should not be construed as having a conventional or dictionary meaning, and the inventors should properly explain the concept of terms in order to best explain their own invention. Based on the principle that can be defined, it should be interpreted as meaning and concept corresponding to the technical idea of the present invention.
따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.Therefore, the embodiments described in the specification and the drawings shown in the drawings are only the most preferred embodiment of the present invention and do not represent all of the technical idea of the present invention, various modifications that can be replaced at the time of the present application It should be understood that there may be equivalents and variations.
도2는 본 발명의 일 실시예에 따른 음성신호를 보존하는 재생속도 가변 장치의 블록 구성도이다. 도시된 바와 같이 본 발명의 일 실시예에 따른 재생속도 가변 장치는 파일 저장부(110), 파일 버퍼(120), 디코더(130), 데이터 버퍼(140), 코덱(150), 재생속도 조절부(160) 및 PCM 데이터 처리부(170)를 포함한다.2 is a block diagram of a reproducing speed variable device for preserving a voice signal according to an embodiment of the present invention. As shown, the apparatus for varying playback speed according to an embodiment of the present invention includes a
본 발명의 일실시예에 따른 재생속도 가변 장치는 원음 재생 장치, 예를 들면, MP3 플레이어 등의 재생속도 가변 기능을 수행하는 부분으로 사용될 수 있으며, 하드웨어 및 소프트웨어의 조합으로 구현될 수 있다.The variable playback speed apparatus according to an embodiment of the present invention may be used as a part for performing a variable playback speed function of an original sound playback apparatus, for example, an MP3 player, and may be implemented by a combination of hardware and software.
상기 파일 저장부(110)는 소리 파일이 저장된다. 여기에서 소리파일은 MP3(MPEG Audio Layer 3) 파일, WMA(Windows Media Audio)파일, OGG(Ogg Vorbis) 파일 등 압축된 소리파일인 것이 바람직하다.The
상기 디코더(130)는 상기 파일 저장부(120)에 저장된 소리파일을 PCM 데이터로 변환한다. 디코더(130)는 하나 이상일 수 있으며, 소리파일의 종류별로 구비되는 것이 바람직하다. 예를 들면, 디코더(130)는 MP3디코더, WMA디코더 또는 OGG 디코더일 수 있다.The
상기 코덱(150)은 디코더(130)로 디코딩된 PCM 데이터를 PCM 데이터 처리부(170)를 통해 전달받고 이를 음성 아날로그 신호로 변환한다. 코덱(150)에는 음성 아날로그 신호를 소리로 변환하는 이어폰(180) 등이 연결될 수 있다. The
상기 파일 저장부(110)와 디코더(130)사이에는 파일 버퍼(120)가 삽입되고, 상기 디코더(130)와 상기 코덱(150)사이에는 데이터 버퍼(140)가 삽입되는 것이 바람직하다.The
상기 재생속도 조절부(160)는 구동하려는 파일의 정보를 저장하고, 현재 구동되고 있는 파일의 동작 상태를 사용자에게 제공하며, 사용자의 재생속도 조정 요구에 따라 재생 속도 정보를 생성한다. 또한 재생속도 조절부(160)는 PCM 데이터 처리부(170)를 제어하여 구동시킨다. The
상기 PCM 데이터 처리부(170)는 재생속도 조절부(160)의 제어에 의해 구동되며, 데이터 버퍼(140)로부터 수신되는 PCM 데이터에서 음성이 없는 구간을 찾아서 음성을 제외한 소리 신호를 감쇄시킨다. 그리고 음성이 없는 구간의 재생 속도를 재생 속도 정보에 따라서 가변시킨다.The
본 발명의 일실시예에 따른 음성신호를 보존하는 재생속도 조정 장치에서 재생속도 조절부(160)는 파일 버퍼(120)의 소리 파일 정보를 사용하지만 소리 파일에 변형을 주지 않기 때문에 압축된 파일을 복원하는데 전혀 영향을 미치지 않는다. In the playback speed adjusting apparatus for preserving the voice signal according to an embodiment of the present invention, the playback
한편 PCM 데이터 처리부(170)는 재생 속도를 조절하지 않는 경우 데이터 버퍼(140)에 있는 PCM 데이터를 가공하지 않고 코덱(150)으로 전달하게 되므로 압축된 파일을 종래와 같은 MP3 플레이어 방식으로 동작할 수 있게 된다. If the
도3은 도2의 음성신호를 보존하는 재생속도 가변 장치의 재생속도 조절부의 세부 블록 구성도이다. 도시된 바와 같이 재생속도 조절부(160)는 헤더 데이터 분 석기(162), 동작 상태 표시기(164), 재생속도 생성기(166), PCM 데이터 조절기(168) 및 동작 상태 제어기(167)를 포함한다.FIG. 3 is a detailed block diagram of a playback speed controller of the playback speed variable device for storing the audio signal of FIG. As shown, the
상기 헤더 데이터 분석기(162)는 현재 구동하려는 파일정보를 저장한다. 여기에서 파일정보는 파일 타입(file type), 버전(version), 샘플 레이트(sample rate), 채널당 샘플 수(samples per channel), 압축 정보(packed information), 요구 비트 수(required bits), 프리 포맷(free format) 등을 포함한다. 파일정보에는 파일 타입에 따라 추가 정보가 저장될 수 있다.The
상기 동작 상태 표시기(164)는 현재 구동되고 있는 파일의 동작 상태에 대한 정보를 보유하고 진행 시간, 오류 상태 등을 문자와 아이콘 형태로 디스플레이한다.The
여기에서 오류 상태는 동작 상태 제어기(167)에서 상태에 따른 상세 정보로 이용될 수 있다. 오류 상태는 MP3의 경우 망가진 프레임(broken frame), 데이터 오버플로우(data overflow), 언서포티드 레이어(unsupported layer), 포비든 비트 레이트(forbidden bit rate), 롱 엠펙 빌드(wrong MPEG build) 등을 포함하며, WMA의 경우 배드 에이에스에프 헤더(bad asf header), 배드 패킷 헤더(bad packet header), 배드 웨이팅 모드(bad weighting mode), 배드 패킷(bad packet) 등을 포함한다.Here, the error state may be used as detailed information according to the state in the
상기 재생 속도 생성기(166)는 사용자의 재생속도 조정 요구에 따라 현재 동작 중인 파일의 재생 속도를 정하여 준다. 즉, 현재 동작 중인 파일에 음성 비율이 높으면 음성신호를 보존하는 재생속도 가변 방식으로 재생속도를 조절하고, 현재 진행되는 파일에 음성신호가 적은 경우 재생속도 자체를 늘려서 재생 음을 전체적으로 늘려 주도록 재생속도 조절비를 정하여 준다. The
상기 PCM 데이터 조절기(168)는 PCM 데이터 처리부(170)를 제어한다. 즉, 음성 여과기(172)의 설정 및 음량 측정기(174)의 구동을 제어한다. 또한 PCM 데이터 조절기(168)는 PCM 데이터 처리부(170)를 제어하여 재생속도 생성기(166)에서 생성된 재생속도 비율에 따라 음성신호를 보존하면서 재생속도를 조절하는 데 필요한 무음 데이터를 추가하거나 감소시킬 수 있다. The
음성신호를 보존하는 재생 속도 가변 방식은 음성 신호가 없는 부분에 무음을 추가하는 방식을 말한다. 이때 소리 파일의 문장을 구성하는 각 단어의 길이가 달라 단어와 단어 사이의 무음 구간이 일정하지 않아 음성신호가 없는 부분이 불규칙적으로 나타나기 때문에 음성신호의 형태에 따라 무음을 추가 또는 감소시키는 것이 바람직하다.The reproduction speed variable method of preserving the audio signal refers to a method of adding silence to a portion in which there is no audio signal. In this case, since the length of each word constituting the sentence of the sound file is different and the silent section between the words is not constant, portions without the voice signal appear irregularly. Therefore, it is preferable to add or reduce the silence according to the shape of the voice signal. .
상기 동작 상태 제어기(167)는 재생 속도 조절부(160)의 구성요소, 즉, 헤더 데이터 분석기(162), 동작 상태 표시기(164), 재생 속도 생성기(166) 및 PCM 데이터 조절기(168)를 구동시키는 기능을 수행한다.The
동작 상태 제어기(167)는 미리 설정해 놓은 원음재생 장치의 타이머 인터럽트가 발생되거나, 원음재생 장치의 관리 프로그램이 새로 파일을 읽는 경우 구동된다. 여기에서 관리 프로그램은 MP3 플레이어와 같은 원음 재생 장치에 있어서 음악재생, MP3 정보를 LCD에 표시하는 기능, 메뉴 기능, 키보드 입력받는 기능 등을 수행하는 프로그램일 수 있다.The
동작 상태 제어기(167)는 타이머 인터럽트가 발생되는 경우 동작 상태 표시기(164)에 변경된 내용이 있는지를 검사하여 변경된 내용이 있으면, 변경된 내용에 따라 동작 상태 표시기(164)에 변경된 내용을 알려준다.When the timer interrupt occurs, the
또한 동작 상태 제어기(164)는 변경된 내용이 재생속도를 변경하는 것이면, 재생 속도 생성기(166)로 변경된 재생속도에 따라 새로 재생 속도를 생성하도록 제어한다. 그리고 변경된 내용을 PCM 데이터 조절부(170)로 통지하여 PCM 데이터 조절부(170)를 구동시킨다. In addition, the
한편 동작 상태 제어기(167)는 동작 상태 표시기(164)에 변경된 내용이 없으면, 동작을 끝내고 인터럽트가 발생되기 직전에 수행되던 프로세스로 제어를 돌려준다.On the other hand, if there is no change in the
도4는 도2의 음성신호를 보존하는 재생속도 가변 장치의 PCM 데이터 처리부의 세부 블록 구성도이다. 도시된 바와 같이 PCM 데이터 처리부(170)는, 음성 여과기(172), 음량 측정기(174), PCM 데이터 증대기(176) 및 PCM 데이터 감축기(177)를 포함한다.FIG. 4 is a detailed block diagram of the PCM data processing unit of the reproduction speed variable device for storing the audio signal shown in FIG. As illustrated, the
상기 음성 여과기(172)는 데이터 버퍼(120)로부터 PCM 데이터를 전달받아 음성을 제외한 소리 신호를 감쇄시키는 역할을 한다. PCM 버퍼(178)에 음성 이외의 소리 신호가 있으면 음성이 없는 구간을 찾아 낼 수 없기 때문이다. The
음성 여과기(172)는 두 개 이상 구비될 수 있으며, 남성 및 여성을 구분하여 사용하는 것이 바람직하다. 음성만 들어도 남성과 여성을 구분할 수 있는 이유는 남성과 여성의 음색이 다르기 때문인데, 남성과 여성을 구분하여 음성 여과기(172)를 적용하는 경우 음성 이외의 소리에 대한 감쇄 정밀도를 높일 수 있게 된다.Two or more voice filters 172 may be provided, and it is preferable to use a male and a female separately. The reason why the male and the female can be distinguished by the voice alone is that the tone of the male and the female is different. When the
상기 음량 측정기(174)는 PCM 버퍼(178)에 음성이 있는 구간과 없는 구간을 찾아내는 기준을 설정하고, 설정된 기준에 따라 음성이 없는 구간에 대한 정보를 생성한다. The
상기 PCM 데이터 증대기(176)는 음성신호를 보존하면서 재생속도를 늦추는 기능을 한다. 음향 측정기(174)에서 제공한 음성이 없는 구간 정보를 이용하여, 음성이 없는 구간에 재생 속도 생성기(166)에서 정해준 시간 간격으로 무음 데이터를 추가한다.The
상기 PCM 데이터 감축기(177)는 음성신호를 보존하면서 재생속도를 빠르게 하는 기능을 한다. 음향 측정기(174)에서 제공한 음성이 없는 구간에 재생 속도 생성기(166)에서 정해준 시간 간격으로 무음 데이터를 제거한다.The PCM data reducer 177 functions to speed up the playback speed while preserving the audio signal. The silent data is removed at a time interval determined by the
도5는 본 발명의 일실시예에 따른 음성신호를 보존하는 재생속도 가변 방법을 도시한 절차 흐름도이다. 도시된 바와 같이 본 발명의 일실시예에 따른 재생속도 조정 방법은 임계 재생 음압 설정단계(S100), 가변 영역 설정단계(S200), 재생 속도 설정단계(S300), 속도 비율을 입력 받는 단계(S400) 및 속도 비율에 따른 재생단계(S500)를 포함한다.5 is a flowchart illustrating a method of changing a reproduction speed for preserving a voice signal according to an embodiment of the present invention. As shown, the regeneration speed adjusting method according to an embodiment of the present invention includes the step of setting the critical reproducing sound pressure step (S100), the variable region setting step (S200), the reproducing speed setting step (S300), and the speed ratio (S400). And the regeneration step (S500) according to the speed ratio.
본 발명의 일실시예에 따른 음성신호를 보존하는 재생속도 가변 방법은 디지털로 샘플링되어 압축된 소리를 소리와 소리 재생 정보로 분리하여 저장하고, 소리 재생정보를 사용하여 소리를 재생할 수 있다.According to an embodiment of the present invention, a method of changing a reproduction speed for preserving a voice signal may separately store and store digitally sampled and compressed sounds into sound and sound reproduction information, and reproduce the sound using the sound reproduction information.
먼저 상기 임계 재생 음압 설정단계(S100)는 음원 재생 속도 조절 구간을 정하는 기준인 임계 재생음압(Tp)을 설정한다.First, the threshold reproducing sound pressure setting step S100 sets a threshold reproducing sound pressure Tp which is a reference for determining a sound source reproducing speed adjusting section.
이 단계에서는 재생 속도 생성기(166)는 사용자가 감지하지 못할 정도의 적은 소리 또는 짧은 시간 동안 녹음된 소리를 재생하여 음성 여과기(172)를 통과시킨다. 음성 여과기(172)를 통하여 음성 이외의 신호가 감쇄된 음성 신호가 추출되며, 추출된 음성 신호는 음량 측정기(174)를 사용하여 무음과 유음을 구분할 임계 재생 음압(Tp)을 설정한다.In this step, the
예를 들면, 임계 재생 음압은 녹음된 소리를 24/1000 sec 이상의 시간 구간에서 4회 표본 조사하여 인접된 표본 값으로 임계 음압을 설정할 수 있다.For example, the threshold reproducing sound pressure may set the threshold sound pressure as an adjacent sample value by inspecting the recorded sound four times in a time interval of 24/1000 sec or more.
상기 가변 영역 설정단계(S200)는 재생 속도 생성기(166)가 임계 재생 음압을 기준으로 일정 범위의 구간을 능동적 가변영역으로 설정한다.In the variable region setting step (S200), the
여기에서 일정 범위는 예를 들면, 설정된 임계 재생 음압에 대하여 - 70% 이하의 음압과 +40% 이상의 음압 구간일 수 있다. 이를 수학식으로 나타내면 아래 수학식1과 같다.Here, the predetermined range may be, for example, a sound pressure of -70% or less and a sound pressure section of + 40% or more with respect to the set threshold reproducing sound pressure. This is represented by Equation 1 below.
상기 재생속도 설정단계(S300)는 재생 속도 생성기(166)가 상기 가변 영역 설정단계(S200)에서 설정된 가변영역을 재생 속도 조절구간으로 설정하고 가변 영역을 벗어난 구간과 가변영역 내에 있는 구간비로 재생속도 조절 정보를 설정한다. 여기에서 재생 속도 조절 정보는 사용자가 변경하려는 재생속도에 따라 재생속도를 조절할 수 있는 정보이다.In the regeneration speed setting step S300, the reproducing
상기 속도비율을 입력 받는 단계(S400)는 동작 상태 제어기(167)가 사용자로부터 소리를 늘리거나 줄이려는 속도 비율을 입력받는다.In step S400 of receiving the speed ratio, the
상기 속도 비율에 따른 재생단계(S500)는 PCM 데이터 조절기(168)가 소리 재생정보, 재생속도 조절정보 및 사용자가 입력한 속도비율을 이용하여 소리를 재생한다.In the reproducing step (S500) according to the speed ratio, the
이 단계에서는 재생속도를 늦추는 경우에는 재생 속도 조절 정보에 따라 PCM 데이터 증대기(176)를 제어하여 임계값 보다 낮은 구간에 무음을 추가하고, 재생속도를 빠르게 하는 경우에는 재생 속도 조절 정보에 따라 PCM 데이터 감축기(177)를 제어하여 임계값보다 낮은 구간을 축소시켜 코덱(150)으로 전송한다.In this step, if the playback speed is slowed down, the
예를 들어 설명하면, 가변 영역 즉, 임계 재생 음압의 범위를 벗어나는 영역에 대하여는 아래 수학식2와 같이 사용자가 입력한 속도비율에 맞추어 소리를 재생할 수 있다. For example, in the variable region, that is, the region out of the range of the critical reproduction sound pressure, sound may be reproduced according to the speed ratio input by the user as shown in Equation 2 below.
수학식2에서 X는 재생속도 조절을 위해 무음구간에 추가 또는 삭제되는 무음 비율이다. 수학식2는 소리를 재생하는데 있어 무음 구간이 발견되면 그 무음구간에 X를 곱한 만큼의 무음 구간을 추가하거나 삭제함으로써 음성 안에 있는 의미가 적 은 구간만을 능동적으로 속도를 변경할 수 있음을 나타낸다. In Equation 2, X is a silent ratio added or deleted in the silent section to adjust the playback speed. Equation (2) indicates that when a silent section is found in reproducing sound, only a section having less meaning in the voice can be actively changed by adding or deleting a silent section multiplied by X to the silent section.
따라서, 본 발명의 음성신호를 보존하는 재생 속도 조절 방법은 의미 있는 음성을 열화시키지 않으면서 사용자가 원하는 속도로 원음을 재생할 수 있게 된다.Therefore, the reproduction speed adjusting method for preserving the voice signal of the present invention enables the user to reproduce the original sound at a desired speed without degrading the meaningful voice.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술 사상과 아래에 기재될 특허 청구범위의 균등 범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.As mentioned above, although this invention was demonstrated by the limited embodiment and drawing, this invention is not limited by this, The person of ordinary skill in the art to which this invention belongs, Of course, various modifications and variations are possible within the scope of equivalent claims.
상술한 바와 같은 본 발명의 음성신호를 보존하는 재생속도 가변 장치 및 방법은, 의미가 적은 음성 구간을 능동적으로 속도를 변경하여 음성 재생속도를 조절함으로써, 음성 열화 보상을 위한 음성 비선형 여과기를 사용하지 않고서도 의미가 있는 음성을 열화시키지 않으면서 음성 재생속도를 조절할 수 있는 효과가 있다.As described above, the apparatus and method for changing a playback speed for preserving a voice signal of the present invention do not use a voice nonlinear filter for compensating for voice degradation by actively changing the speed of a voice section having a low meaning to adjust the voice playback speed. It is possible to adjust the voice playback speed without degrading the meaningful voice even without it.
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050049460A KR100677950B1 (en) | 2005-06-09 | 2005-06-09 | Apparatus and method for playback speed altering with preservation of tone signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050049460A KR100677950B1 (en) | 2005-06-09 | 2005-06-09 | Apparatus and method for playback speed altering with preservation of tone signal |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060128212A true KR20060128212A (en) | 2006-12-14 |
KR100677950B1 KR100677950B1 (en) | 2007-02-05 |
Family
ID=37730911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050049460A KR100677950B1 (en) | 2005-06-09 | 2005-06-09 | Apparatus and method for playback speed altering with preservation of tone signal |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100677950B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008035829A1 (en) * | 2006-09-22 | 2008-03-27 | I-Ware Inc., Ltd. | Apparatus and method for playback speed altering with preservation of tone signal |
KR20150056276A (en) * | 2013-11-15 | 2015-05-26 | 현대모비스 주식회사 | Pre-processing apparatus for speech recognition and method thereof |
US9104378B2 (en) | 2013-08-26 | 2015-08-11 | Samsung Electronics Co., Ltd. | Method for processing data and electronic device thereof |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0129829B1 (en) * | 1994-09-28 | 1998-04-17 | 오영환 | Audio reproducing velocity control apparatus |
-
2005
- 2005-06-09 KR KR1020050049460A patent/KR100677950B1/en not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008035829A1 (en) * | 2006-09-22 | 2008-03-27 | I-Ware Inc., Ltd. | Apparatus and method for playback speed altering with preservation of tone signal |
US9104378B2 (en) | 2013-08-26 | 2015-08-11 | Samsung Electronics Co., Ltd. | Method for processing data and electronic device thereof |
US9412380B2 (en) | 2013-08-26 | 2016-08-09 | Samsung Electronics Co., Ltd | Method for processing data and electronic device thereof |
KR20150056276A (en) * | 2013-11-15 | 2015-05-26 | 현대모비스 주식회사 | Pre-processing apparatus for speech recognition and method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR100677950B1 (en) | 2007-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4146489B2 (en) | Audio packet reproduction method, audio packet reproduction apparatus, audio packet reproduction program, and recording medium | |
KR100302370B1 (en) | Speech interval detection method and system, and speech speed converting method and system using the speech interval detection method and system | |
US7912710B2 (en) | Apparatus and method for changing reproduction speed of speech sound | |
KR20080011831A (en) | Apparatus and method for controlling equalizer equiped with audio reproducing apparatus | |
EP1218876B1 (en) | Apparatus and method for a telecommunications system | |
JP2011198348A (en) | Sound recording device | |
JPS62274941A (en) | Audio coding system | |
KR100677950B1 (en) | Apparatus and method for playback speed altering with preservation of tone signal | |
JP2013101366A (en) | Device and method for improving quality of voice codec | |
JP2009296297A (en) | Sound signal processing device and method | |
JPWO2005057550A1 (en) | Audio compression / decompression equipment | |
JP2020134887A (en) | Sound signal processing program, sound signal processing method and sound signal processing device | |
JP2008197199A (en) | Audio encoder and audio decoder | |
EP2261900A1 (en) | Method and apparatus for modifying the playback rate of audio-video signals | |
JP4311541B2 (en) | Audio signal compression device | |
JPH09138698A (en) | Sound recording/reproducing device | |
JP6409163B2 (en) | Audio processing apparatus, audio processing program, and audio processing method | |
JP2006113375A (en) | Voice reproducing device and program for controlling reproduction and stoppage of voice | |
WO2008035829A1 (en) | Apparatus and method for playback speed altering with preservation of tone signal | |
JP2006350132A (en) | Device, method, and program for audio reproduction | |
JPH05204395A (en) | Audio gain controller and audio recording and reproducing device | |
KR100372576B1 (en) | Method of Processing Audio Signal | |
JPH10111699A (en) | Voice reproducer | |
JP4516805B2 (en) | Audio equipment | |
JP4817949B2 (en) | In-vehicle machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20111230 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20121129 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |