KR20070008232A - Apparatus and method of reproducing digital multimedia slow or fast - Google Patents

Apparatus and method of reproducing digital multimedia slow or fast Download PDF

Info

Publication number
KR20070008232A
KR20070008232A KR1020050063298A KR20050063298A KR20070008232A KR 20070008232 A KR20070008232 A KR 20070008232A KR 1020050063298 A KR1020050063298 A KR 1020050063298A KR 20050063298 A KR20050063298 A KR 20050063298A KR 20070008232 A KR20070008232 A KR 20070008232A
Authority
KR
South Korea
Prior art keywords
audio
video
tsm
data
speed
Prior art date
Application number
KR1020050063298A
Other languages
Korean (ko)
Inventor
최우영
전혜정
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020050063298A priority Critical patent/KR20070008232A/en
Publication of KR20070008232A publication Critical patent/KR20070008232A/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/20Driving; Starting; Stopping; Control thereof
    • G11B19/28Speed controlling, regulating, or indicating
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B2020/10935Digital recording or reproducing wherein a time constraint must be met

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

An apparatus and a method for adjusting a digital multimedia X-speed rating are provided to set an X-speed rating for reproduction within a range of 0.5 to 2.0 times and offer a function of a digital image device capable of reproducing a natural picture and sound. A DVD(Digital Video Device) decoding member(210) loads and decodes data of a DVD medium. A video processing member processes video data from the DVD data decoded by the DVD decoding member. Video data are stored in a video data member(220). A TSM(Time Scale Modification) member(230) controls a video frame according to audio speed control. A video output member(240) outputs the video frame outputted from the video TSM member to a screen. An audio processing member includes an audio data member(250) for storing audio data.

Description

디지털 멀티미디어 배속 조절 장치 및 방법{APPARATUS AND METHOD OF REPRODUCING DIGITAL MULTIMEDIA SLOW OR FAST}Digital multimedia speed control device and method {APPARATUS AND METHOD OF REPRODUCING DIGITAL MULTIMEDIA SLOW OR FAST}

도 1은 종래의 DVD 플레이어의 구조를 나타낸 블록도이다.1 is a block diagram showing the structure of a conventional DVD player.

도 2는 본 발명의 실시 예에 따른 오디오 프레임 배속 조절 장치의 구조를 나타낸 블록도이다.2 is a block diagram showing the structure of an audio frame double speed control apparatus according to an embodiment of the present invention.

도 3은 본 발명의 실시 예에 따른 오디오 배속 조절 방법의 동작 순서도이다.3 is a flowchart illustrating a method of controlling audio speed according to an exemplary embodiment of the present invention.

도 4는 본 발명이 실시 예에 따른 비디오 프레임 배속 조절 방법의 동작 순서도이다.4 is a flowchart illustrating an operation of adjusting a video frame rate according to an exemplary embodiment of the present invention.

도 5는 본 발명의 실시 예에 따른 디지털 멀티미디어 프레임 배속 조절의 오디오 및 비디오 데이터의 변경을 나타낸다.5 is a view illustrating a change of audio and video data of digital multimedia frame double speed control according to an embodiment of the present invention.

본 발명은 음성 처리 시스템에 관한 것으로서, 특히 재생 속도에 따라 화면과 소리가 자연스럽게 재생되도록 하는 장치 및 방법에 관한 것이다. 더욱 상세하게는 본 발명은 재생 중 속도 조절시 화면의 배속율을 소리 쪽의 배속율에 맞추어 업 샘플링(Up-sampling)/다운 샘플링(Down-sampling)방법을 통해 조절하는 장치 및 방법이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech processing system, and more particularly, to an apparatus and a method for naturally reproducing a screen and sound according to a reproduction speed. In more detail, the present invention is an apparatus and method for adjusting the speed of the screen when the speed is adjusted during playback by an up-sampling / down-sampling method according to the speed of the sound.

TSM(Time Scale Modification) 알고리즘은 디지털 신호의 빠르기를 조절해주는 방법으로써 어학용이나 신호압축 등에 적용되어지고 있다.The TSM (Time Scale Modification) algorithm is applied to language compression or signal compression as a method of adjusting the speed of digital signals.

TSM 알고리즘의 가장 기본적인 형태인 업 샘플링/다운 샘플링은 사람의 목소리나 음악신호의 음질을 크게 떨어뜨려 이후 OLA, SOLA, PSOLA 및 WSOLA 등의 다양한 알고리즘으로 음성이나 음악의 음질을 크게 떨어뜨리지 않고 속도 조절을 할 수 있도록 한다.Upsampling / Downsampling, the most basic form of TSM algorithm, greatly reduces the sound quality of human voice or music signal, and then adjusts the speed without significantly reducing the sound quality of voice or music by various algorithms such as OLA, SOLA, PSOLA and WSOLA. To do this.

즉, 음성(Speech) 및 오디오(Audio)의 속도를 음색의 큰 변화 없이 제어하는 음성 신호의 변속 재생은 재생속도의 변경이 있더라고 음색의 변질이나 손실 없이 사람이 빨리 혹은 천천히 이야기하는 것처럼 들리게 하는 기법이다.In other words, the variable speed reproduction of a voice signal that controls the speed of speech and audio without a large change in the tone makes the sound sound as if a person speaks quickly or slowly without changing or reproducing the tone even though there is a change in the playback speed. to be.

음성 및 오디오의 정확한 배율의 속도 조절이 응용된 경우를 보면, DTV의 타임 쉬프트(Time Shift) 기능의 비디오와 정확한 동기가 맞추어져야하며, MP3 플레이어, 멀티미디어 플레이어, 휴대폰 등의 경우에서도 속도 조절에서 배속율을 정확히 맞추어 주는 것은 매우 중요하다.In case that the speed control of the accurate magnification of voice and audio is applied, it must be synchronized with the video of the time shift function of DTV, and even in the case of MP3 player, multimedia player, mobile phone, etc. It is very important that the rate is correct.

음성 및 오디오의 속도를 음색의 큰 변화 없이 제어하는 방법은 1985년 미국의 Salim Roucos가 OLA와 SOLA 알고리즘을 제안하면서 급격히 발전하였고, OLA의 기본 개념은 도 1에서 축소(Compress)와 확장(Expand)으로 나타나 있다.The method of controlling the speed of voice and audio without significant change in timbre was rapidly developed in 1985 when Salim Roucos of the United States proposed the OLA and SOLA algorithm, and the basic concept of OLA is compressed and expanded in FIG. Is indicated.

도 1에 나타난 바와 같이 타임 스케일(Time Scale)의 확장은 실제 재생시 느리게 재생되게 되며, 축소(압축)는 반대로 빠르게 재생되는 효과가 있다.As shown in FIG. 1, the expansion of the time scale is reproduced slowly during the actual reproduction, and the reduction (compression) is rapidly reproduced.

TSM은 시간 축에서 입력신호를 압축하거나 확장하여 신호의 재생속도를 변화시키는 것으로서, 음악 재생기기에서 템포의 변환, 외국어 학습을 위한 음성 속도의 변환, 데이터 압축 및 복원(MPEGx, H.26x 등) 등 다양한 분야에 응용된다. 특히 MP3 플레이어, 멀티미디어 플레이어, 휴대폰 등에도 적용된다.TSM compresses or expands the input signal on the time axis to change the playback speed of the signal.TSM converts tempo, voice speed for foreign language learning, and data compression and restoration (MPEGx, H.26x, etc.). It is applied to various fields. In particular, it is applied to MP3 players, multimedia players, mobile phones, etc.

TSM 알고리즘은 시간 축을 변환하는 방법으로 크게 시간 영역방법과 주파수 영역방법으로 나눌 수 있다The TSM algorithm is a method of transforming the time axis and can be divided into a time domain method and a frequency domain method.

대표적인 시간 영역방법으로는 입력신호를 윈도우(window) 단위로 세그먼테이션 하여 이웃한 윈도우 간에 소정의 연산 과정(overlap amp; add)을 거쳐 입력신호를 압축하거나 확장하는 OLA 알고리즘과, 이웃한 윈도우 간의 피치(pitch) 동기를 이용하여 상기와 같은 연산을 함으로써 OLA의 클리킹(clicking) 현상(압축시)과 반향(reverberation) 현상(확장시)의 단점을 극복하여 보다 자연스러운 출력 음성을 얻을 수 있도록 하는 SOLA 알고리즘과, 다양한 SOLA 변형 알고리즘이 존재한다.Typical time domain methods include an OLA algorithm for segmenting an input signal in units of windows and compressing or expanding the input signal through a predetermined operation (overlap amp; add) between neighboring windows, and a pitch between neighboring windows ( SOLA algorithm that obtains a more natural output voice by overcoming the shortcomings of OLA clicking (compression) and reverberation (expansion) by performing the above operation using pitch synchronization. And various SOLA modification algorithms.

그리고 대표적인 주파수 영역방법으로는 STFT를 이용한 그리핀 앤드 림(Griffin and Lim) 알고리즘 등이 있다. Typical frequency domain methods include the Griffin and Lim algorithm using STFT.

상기 SOLA 알고리즘은 시간영역에서 템포를 변환시키는 대표적인 방법으로 이웃한 윈도우간의 피치정보를 이용하여 'overlap-add'연산을 수행함으로써 기존 OLA 방법의 단점을 개선한 알고리즘이다.The SOLA algorithm is a representative method for converting the tempo in the time domain and improves the disadvantages of the existing OLA method by performing an 'overlap-add' operation using pitch information between neighboring windows.

Roucos의 SOLA나 이후에 제안된 PSOLA/WSOLA 등은 다양한 방법으로 최적의 OLA 위치를 찾아주는 방법에 관한 이론으로써 다양한 형태로 발전되었다.Roucos' SOLA and later proposed PSOLA / WSOLA have evolved into various forms as theories on how to find the optimal OLA location in various ways.

그러나 현재의 DVD 플레이어에서는 재생 속도를 조절하는 경우, 화면 재생만 을 조절할 수 있으며 소리는 들려주지 않는 방식을 이용하고 있다.However, in current DVD players, when the playback speed is adjusted, only the screen playback can be controlled and no sound is heard.

따라서 DVD를 통해 멀티미디어를 감상하는 경우 사용자가 2배속 또는 0.5배속으로 속도 조절을 하여도 화면만 조절되고 소리가 들리지 않으므로 불편함을 초래한다.Therefore, in case of watching multimedia through DVD, even if the user adjusts the speed at 2x or 0.5x speed, only the screen is adjusted and no sound is heard, causing inconvenience.

본 발명의 목적은 재생의 배속율을 0.5배에서 2.0 사이로 정할 수 있고, 자연스럽게 화면과 소리가 재생되는 디지털 영상 기기의 기능을 제공하기 위한 디지털 멀티미디어 배속 조절 장치 및 방법을 제공하는데 있다.An object of the present invention is to provide a digital multimedia speed control device and method for providing a function of a digital video device that can determine the speed of playback between 0.5 and 2.0 times, and naturally reproduces the screen and sound.

본 발명의 또 다른 목적은 TSM 알고리즘을 이용하여 디지털 영상 기기의 재생 시 소리쪽 신호를 0.5배에서 2.0 배사이의 배속율로 자연스럽고 정확하게 조절할 수 있도록 하는 디지털 멀티미디어 배속 조절 장치 및 방법을 제공하는데 있다.It is still another object of the present invention to provide an apparatus and method for adjusting digital multimedia speed that enables natural and accurate adjustment of a sound side signal at a speed ratio of 0.5 to 2.0 times using a TSM algorithm. .

본 발명의 또 다른 목적은 디지털 영상 기기의 재생 중 속도 조절시 화면 배속율을 소리 배속율에 맞추어 업 샘플링/다운 샘플링할 수 있도록 하는 디지털 멀티미디어 배속 조절 장치 및 방법을 제공하는데 있다.It is still another object of the present invention to provide an apparatus and method for adjusting digital multimedia speed that enables up-sampling / downsampling of a screen speed rate according to a sound speed rate during speed adjustment during playback of a digital video device.

상기한 바와 같은 목적을 달성하기 위하여 본 발명에 따른 디지털 멀티미디어 배속 조절 장치는,Digital multimedia speed control device according to the present invention to achieve the above object,

디지털 멀티미디어 재생 배속 조절을 위한 장치에 있어서, 디코딩된 디지털 오디오 데이터를 제어신호에 따른 배속율로 PCM 데이터를 변환하는 오디오 TSM부; 및 상기 오디오 TSM 부가 변환한 오디오 신호에 따라 디코딩된 디지털 비디오 데이 터의 프레임 수를 변환하는 비디오 TSM부를 포함한다.An apparatus for adjusting digital multimedia reproduction speed, comprising: an audio TSM unit for converting decoded digital audio data into PCM data at a speed ratio according to a control signal; And a video TSM unit for converting the number of frames of decoded digital video data according to the audio signal converted by the audio TSM unit.

또한 상기 본 발명의 디지털 멀티미디어 배속 조절 장치에 있어서, 상기 오디오 TSM부는 TSM 알고리즘에 의해 선택된 채널의 오디오 데이터를 변환하고, 선택되지 않은 채널의 오디오데이터를 0x0로 변환하는 것을 특징으로 한다.In the digital multimedia speed control apparatus of the present invention, the audio TSM unit converts audio data of a channel selected by a TSM algorithm, and converts audio data of an unselected channel into 0x0.

또한 상기 본 발명의 디지털 멀티미디어 배속 조절 장치에 있어서, 상기 비디오 TSM부는 상기 오디오 TSM부가 변환한 오디오 신호의 배속율에 따라 비디오 프레임의 삭제 또는 삽입을 수행하여 프레임 수를 변환하는 것을 특징으로 한다.In the digital multimedia speed control apparatus of the present invention, the video TSM unit converts the number of frames by deleting or inserting a video frame according to the speed ratio of the audio signal converted by the audio TSM unit.

또한 상기 본 발명의 디지털 멀티미디어 배속 조절 방법에 있어서, 디지털 멀티미디어의 재생 배속 조절 방법에 있어서, 디코딩된 오디오 데이터를 로딩 하여 제어신호에 따른 배속율로 TSM 알고리즘에 따라 변환하는 단계; 상기 변환된 오디오 데이터의 배속율에 따라 디코딩된 오디오 데이터의 프레임수를 변환하는 단계; 및 상기 변환된 오디오 데이터 및 비디오 데이터의 싱크를 동기화하여 출력하는 단계를 포함한다.In addition, in the digital multimedia speed control method of the present invention, the playback speed control method of digital multimedia, the method comprising the steps of: loading the decoded audio data and converting according to the TSM algorithm at a speed ratio according to the control signal; Converting the number of frames of the decoded audio data according to the speed ratio of the converted audio data; And synchronizing and outputting the sync of the converted audio data and video data.

또한, 상기 본 발명의 디지털 멀티미디어 배속 조절 방법에 있어서, 상기 제어신호에 따른 배속율이 1보다 작은 경우 TSM 확장을 적용하여 느리게 재생을 수행하고, 상기 배속율이 1보다 큰 경우 TSM 축소를 적용하여 빠르게 재생을 수행하는 것을 특징으로 한다.In the digital multimedia speed control method of the present invention, when the speed ratio according to the control signal is smaller than 1, TSM expansion is applied slowly, and when the speed ratio is greater than 1, TSM reduction is applied. It is characterized by performing fast playback.

또한, 상기 본 발명의 디지털 멀티미디어 배속 조절 방법에 있어서, 상기 비디오 데이터의 프레임은 상기 오디오 데이터의 배속율에 따라 선택된 프레임을 삭제 하거나, 복사하여 삽입하는 것을 특징으로 한다.In the digital multimedia speed control method of the present invention, the frame of the video data is characterized in that the selected frame is deleted or copied according to the speed ratio of the audio data.

또한, 상기 본 발명의 디지털 멀티미디어 배속 조절 방법에 있어서, 상기 비디오 데이터의 프레임 수는 다음의 식에 의해 정해지며, 정수배가 아닌 경우 반올림하여 정하는 것을 특징으로 한다.In addition, in the digital multimedia double speed adjustment method of the present invention, the number of frames of the video data is determined by the following equation, and is determined by rounding when not an integer multiple.

<< V_N' == V_N *(S_N'/S_N)>><< V_N '== V_N * (S_N' / S_N) >>

이때, 상기 V_N 은 원래 비디오 프레임의 수, V_N'은 변환된 비디오 프레임의 수, S_N'/S_N은 오디오 데이터의 배속율을 나타낸다.In this case, V_N represents the number of original video frames, V_N 'represents the number of converted video frames, and S_N' / S_N represents a speed ratio of audio data.

또한, 상기 본 발명의 디지털 멀티미디어 배속 조절 방법에 있어서, 상기 싱크는 정해진 단위를 기준으로 오디오 데이터 및 비디오 데이터의 싱크를 동기화하는 것을 특징으로 한다.In addition, in the digital multimedia speed control method of the present invention, the sink is characterized in that the synchronization of the audio data and video data synchronization based on a predetermined unit.

언급된 바와 같이 본 발명에 따른 디지털 멀티미디어 배속 조절 장치 및 방법은 디지털 영상 기기의 재생에서 0.5배에서 2.0배까지의 배속율로 소리와 화면이 자연스럽게 조절될 수 있도록 하며, 이하에서는 도면을 참조하여 디지털 멀티미디어 배속 조절 장치 및 방법에 대하여 보다 상세히 설명하기로 한다.As mentioned above, the apparatus and method for adjusting digital multimedia speed according to the present invention allows the sound and the screen to be naturally adjusted at a speed ratio of 0.5 to 2.0 times in reproduction of a digital video apparatus, and hereinafter, digital An apparatus and method for controlling multimedia speed will be described in more detail.

다만, 본 발명을 설명함에 있어서 종래에 공지가 되어 알려진 부분에 대해서는 자세한 설명을 생략하기로 한다.However, in the following description of the present invention, a detailed description will be omitted for the known parts.

도 2는 본 발명의 실시 예에 따른 오디오 프레임 배속 조절 장치의 구조를 나타낸 블록도이다.2 is a block diagram showing the structure of an audio frame double speed control apparatus according to an embodiment of the present invention.

도 2를 참조하면, DVD 미디어의 데이터를 로딩하여 디코딩하기 위한 DVD 디코딩부(210)와, 상기 DVD 디코딩부(210)가 디코딩한 DVD 데이터에서 비디오 데이터를 처리하는 비디오 처리부는 비디오 데이터가 저장되는 비디오 데이터부(220)와 오디오 속도 조절에 따라 비디오 프레임을 조절하는 비디오 TSM부(230) 및 비디오 TSM부(230)가 출력하는 비디오 프레임을 화면에 출력하는 비디오 출력부(24))를 포함하여 구성된다.Referring to FIG. 2, a DVD decoding unit 210 for loading and decoding data of DVD media, and a video processing unit for processing video data from the DVD data decoded by the DVD decoding unit 210 may store video data. The video data unit 220 and the video TSM unit 230 for adjusting the video frame according to the audio speed control and the video output unit 24 for outputting the video frame output from the video TSM unit 230 on the screen, It is composed.

그리고 오디오 데이터를 처리하는 오디오 처리부는 오디오 데이터가 저장되는 오디오 데이터부(250)와, 상기 오디오 데이터부(250)에 저장된 오디오 신호를 제어신호에 따라 빠르게 혹은 느리게 조절하는 오디오 TSM부(260)와, 상기 TSM 부(240)에 의해 속도가 조절된 디지털 오디오 신호를 아날로그로 변환하는 DAC(270)와, 상기 DAC(270)가 변환한 아날로그 오디오 신호를 출력하는 다수의 스피커(280)를 포함한다.The audio processing unit for processing audio data includes an audio data unit 250 storing audio data, an audio TSM unit 260 for quickly or slowly adjusting an audio signal stored in the audio data unit 250 according to a control signal. And a DAC 270 for converting the digital audio signal whose speed is controlled by the TSM unit 240 to analog, and a plurality of speakers 280 for outputting the analog audio signal converted by the DAC 270. .

상기 DAC(270)가 5.1채널의 오디오 신호를 출력한다고 가정할 때, 스피커(280)는 좌, 우 채널(281, 282)과, 가운데 채널(283)과, 서라운드 좌, 우 채널(284, 285) 및 우퍼(286)를 포함하게 된다.Assuming that the DAC 270 outputs 5.1 channel audio signals, the speaker 280 has left and right channels 281 and 282, a center channel 283, and surround left and right channels 284 and 285. ) And woofer 286.

우선, 오디오 처리부의 오디오 TSM부(260)는 TSM 알고리즘에 의해 0.5배에서 2.0배속까지의 오디오 신호를 압축 또는 확장한다.First, the audio TSM unit 260 of the audio processing unit compresses or expands an audio signal from 0.5 times to 2.0 times by the TSM algorithm.

이때, 오디오 신호의 압축 또는 확장은 복수개의 채널 중 TSM 알고리즘에 의해 선택되는 채널만을 수행하며, 나머지 채널의 오디오 신호는 0x0으로 변경하여 조절된다.At this time, the compression or expansion of the audio signal is performed only the channel selected by the TSM algorithm of the plurality of channels, the audio signal of the remaining channels are adjusted by changing to 0x0.

압축 또는 확장된 오디오 신호는 DAC(270)가 수신하여 아날로그 오디오 신호로 변환하고, 변환된 오디오 신호는 채널별로 스피커(280)를 통해 출력된다.The compressed or expanded audio signal is received by the DAC 270 and converted into an analog audio signal, and the converted audio signal is output through the speaker 280 for each channel.

또한, 상기 비디오 TSM부(230)는 비디오 프레임을 오디오 TSM부(260)가 처리 하는 오디오 신호와 맞추어 조절하게 된다.In addition, the video TSM unit 230 adjusts the video frame to match the audio signal processed by the audio TSM unit 260.

즉, 원래 소리 부분의 PCM 데이터가 S_N에서 속도 조절을 거쳐 S_N'로 변환되면, 비디오 TSM부(230)는 비디오 프레임을 V_N에서 V_N'으로 만든다.That is, when the PCM data of the original sound portion is converted into S_N 'through the speed adjustment at S_N, the video TSM unit 230 makes the video frame from V_N to V_N'.

이때, 상기 V_N'는 V_N ㅧ (S_N/S_N')로 계산할 수 있으며, V_N'이 정수값이 나오지 않는 경우는 반올림하여 처리한다.At this time, the V_N 'can be calculated as V_N ㅧ (S_N / S_N'). If V_N 'does not yield an integer value, it is rounded up.

또한, 상기 복호화 단위마다 화면의 싱크를 맞추어 주어 자연스럽게 처리되도록 한다.In addition, the synchronization of the screen is adjusted for each decoding unit so that the processing is performed naturally.

상기한 오디오 및 비디오의 배속 조절을 자세히 설명하면 다음과 같다.The speed control of the above-described audio and video will be described in detail as follows.

도 3은 본 발명의 실시 예에 따른 오디오 배속 조절 방법의 동작 순서도이고, 도 4는 본 발명이 실시 예에 따른 비디오 프레임 배속 조절 방법의 동작 순서도이다.3 is a flowchart illustrating a method of adjusting audio speed according to an exemplary embodiment of the present invention, and FIG. 4 is a flowchart of a method of adjusting a video frame speed according to an exemplary embodiment of the present invention.

도 3을 참조하면, 오디오 배속을 조절하기 위해서 제어신호에 의해 배속 조절 명령이 전달되면, DVD 디코딩부(210)는 1프레임(frame)의 오디오 부분을 디코딩한다(S301). 이때 1프레임은 디코딩의 한 단위를 나타낸다.Referring to FIG. 3, when a speed control command is transmitted by a control signal in order to adjust audio speed, the DVD decoding unit 210 decodes an audio portion of one frame (S301). In this case, one frame represents one unit of decoding.

또한, 정확히 설명하자면, 상기 DVD 디코딩부(210)는 디지털 멀티미디어 미디어(DVD 등)에서 1프레임의 비디오와 오디오를 동시에 로딩하여 디코딩하고 각각 비디오 데이터부(220)와 오디오 데이터부(250)에 저장하게 된다.In addition, to be precise, the DVD decoding unit 210 simultaneously loads and decodes one frame of video and audio from digital multimedia media (DVD, etc.) and stores them in the video data unit 220 and the audio data unit 250, respectively. Done.

오디오 TSM부(260)는 오디오 데이터부(250)에 저장된 오디오 PCM 데이터를 각 채널별로 로딩한다(S302). 이때 오디오 데이터는 S_N개로 샘플링 되어 있다.The audio TSM unit 260 loads audio PCM data stored in the audio data unit 250 for each channel (S302). At this time, audio data is sampled into S_N pieces.

오디오 TSM부(260)는 로딩한 오디오 PCM 데이터중 TSM 알고리즘에 의해 선택 되는 채널만을 S_N 개의 PCM 데이터에서 S_N'개로 변환한다(S303).The audio TSM unit 260 converts only the channels selected by the TSM algorithm among the loaded audio PCM data from S_N PCM data to S_N '(S303).

이때, 상기 오디오 TSM부(260)가 TSM 알고리즘에 의해 오디오 PCM 데이터를 변환하는 것은 업 샘플링/다운 샘플링과 OLA/SOLA/WSOLA/"Optimized AMDF & OLA" 등 다양한 방법이 있으며 TSM의 품질을 좋게 하기 위해서는 OLA/SOLA/WSOLA/"Optimized AMDF & OLA" 방법을 이용하는 것이 바람직하다.In this case, the audio TSM unit 260 converts the audio PCM data by the TSM algorithm in various ways such as upsampling / downsampling and OLA / SOLA / WSOLA / "Optimized AMDF & OLA". It is preferable to use the OLA / SOLA / WSOLA / "Optimized AMDF & OLA" method.

그리고 상기한 알고리즘은 이미 공지된 기술이므로 자세한 설명을 생략하기로 한다.Since the above algorithm is a known technique, a detailed description thereof will be omitted.

그리고 오디오 TSM부(260)는 선택되지 않은 채널의 PCM 데이터를 모두 0x0으로 변경하여 소리 제거한다(S304).The audio TSM unit 260 removes sound by changing all PCM data of the unselected channel to 0x0 (S304).

상기 단계 S303 및 S304에 의해 변환된 오디오 PCM 데이터는 DAC(270)로 입력되며, 각 채널에 따라 스피커(280)를 통해 출력된다(S305).The audio PCM data converted by the steps S303 and S304 are input to the DAC 270 and output through the speaker 280 according to each channel (S305).

만약 상기 오디오 TSM부(260)가 서라운드 좌, 우 채널의 오디오 PCM 데이터만을 S_N'개로 변환하여 출력하였다면 사용자는 서라운드 좌, 우 채널 스피커(284, 285)를 통해서만 조절된 오디오출력을 들을 수 있을 것이다.If the audio TSM unit 260 converts only the audio PCM data of the surround left and right channels into S_N 'outputs, the user may hear the adjusted audio output only through the surround left and right channel speakers 284 and 285. .

그리고 처리할 데이터가 더 있다면(S306), 상기 단계 S301 내지 단계 305의 과정을 통해 오디오 배속 조절을 수행한다.If there is more data to be processed (S306), audio speed control is performed through the process of steps S301 to 305.

상기한 오디오 배속 조절에 따른 비디오 프레임의 배속 조절은 도 4를 참조하여 설명하겠다.The speed control of the video frame according to the above-described audio speed control will be described with reference to FIG. 4.

도 4를 참조하면, 상기 도 3에서 설명한 바와 같이 DVD 디코딩부(210)가 디지털 멀티미디어 데이터를 디코딩하여 비디오 데이터를 비디오 데이터부(220)에 저 장하면, 비디오 TSM부(230)가 프레임을 조절한다.Referring to FIG. 4, when the DVD decoding unit 210 decodes the digital multimedia data and stores the video data in the video data unit 220 as described above with reference to FIG. 3, the video TSM unit 230 adjusts the frame. do.

먼저 비디오 TSM부(230)는 1프레임의 비디오 부분을 디코딩하여 로딩하고(S401), V_N 개의 프레임을 오디오 배속 조절에 맞도록 V_N'개로 변환한다(S402).First, the video TSM unit 230 decodes and loads a video portion of one frame (S401), and converts V_N frames into V_N 'to match the audio double speed control (S402).

상기 V_N'는 다음의 수학식 1에 의해 구해질 수 있다.V_N 'may be obtained by Equation 1 below.

V_N' == V_N * (S_N'/S_N)V_N '== V_N * (S_N' / S_N)

그리고 비디오 TSM부(230)가 V_N'로 프레임수를 변환하는 방식은 V_N 개의 비디오 프레임 중에서 정해진 규칙에 따라 선택되는 프레임을 삭제하거나 복사함으로써 가능하다.The video TSM unit 230 converts the number of frames to V_N 'by deleting or copying a frame selected from V_N video frames according to a predetermined rule.

예를 들어, 오디오 배속 조절이 2.0배로 되는 경우는 짝수(또는 홀수) 번째 프레임을 삭제하고, 오디오 배속 조절이 0.5배로 되는 경우는 앞의 프레임을 복사하여 다음 프레임과의 사이에 집어넣는 방법으로 프레임 수를 변환한다.For example, if the audio speed control is 2.0, the even (or odd) frame is deleted. If the audio speed control is 0.5, the frame is copied by copying the previous frame and interposing it with the next frame. Convert the number.

또한, 상기 프레임 수의 변환은 V_N'가 정수배로 나누어지지 않을 경우 반올림하여 처리하도록 하기 때문에 오디오 싱크와 어긋날 수 있는 문제가 있는데, 이는 디코딩 단위마다 오디오 배속 조절과의 싱크를 맞추어 싱크가 어긋나지 않도록 한다(S403). In addition, the conversion of the number of frames is a problem that can be shifted from the audio sync since V_N 'is not divided by an integer multiple, so that the sync is synchronized with the audio double speed adjustment for each decoding unit so that the sync is not shifted. (S403).

상기한 도 3 및 도 4에서 설명한 바와 같은 디지털 멀티미디어 배속 조절을 실제 데이터를 이용하여 나타내면 도 5와 같다.The digital multimedia double speed adjustment as described above with reference to FIGS. 3 and 4 will be described with reference to FIG. 5.

도 5는 본 발명의 실시 예에 따른 디지털 멀티미디어 프레임 배속 조절의 오디오 및 비디오 데이터의 변경을 나타낸다.5 is a view illustrating a change of audio and video data of digital multimedia frame double speed control according to an embodiment of the present invention.

도 5를 참조하면, 오디오 데이터와 비디오 데이터가 각각 본 데이터(a)와 같은 모양으로 나타날 때 2배속의 TSM 데이터(b)에서는 오디오 데이터가 압축된 모양으로 나타나며, 비디오 데이터는 짝수 번째의 프레임을 제거하여 싱크를 맞춘 것을 알 수 있다.Referring to FIG. 5, when the audio data and the video data appear in the same shape as the present data (a), the audio data appears in the compressed form in the TSM data (b) at the double speed, and the video data indicates an even numbered frame. You can see that the sink is removed.

또한, 0.5배속 TSM 데이터(c)에서는 오디오 데이터가 2배로 길게 확장되어있는 모양과, 각각의 프레임을 복사하여 다음 프레임과의 사이에 삽입한 비디오 데이터의 모양을 알 수 있다.Further, in the 0.5 times TSM data (c), the shape in which the audio data is extended twice as long and the shape of the video data copied between each frame and inserted between the next frame can be seen.

본 발명의 실시 예에 따른 디지털 멀티미디어 배속 조절 장치 및 방법은 TSM 알고리즘을 이용하여 오디오 데이터의 배속 조절을 수행하고, 이에 맞추어 비디오 데이터의 배속을 조절하도록 함으로써 화면과 소리가 자연스럽게 재생되도록 하는 특징이 있으며, 본 발명을 올바르게 이해하는 당업자는 본 발명의 사상 범위 내에서 구성 요소의 취사선택에 의해서 또 다른 실시 예를 만들어 내는 것은 쉬운 일이다.Digital multimedia speed control apparatus and method according to an embodiment of the present invention is characterized in that the screen and sound are naturally reproduced by adjusting the speed of the audio data using the TSM algorithm and adjusting the speed of the video data accordingly. However, it will be easy for a person skilled in the art to properly understand the present invention to create another embodiment by selecting the components within the scope of the present invention.

상기된 바와 같은 본 발명에 따른 디지털 멀티미디어 배속 조절 장치 및 방법은 TSM 알고리즘을 이용하여 오디오 데이터의 배속 조절을 수행하고, 이에 맞추어 비디오 데이터의 배속을 조절하도록 함으로써 소리 배속율에 화면 배속율을 맞추도록 하여 화면과 소리가 자연스럽게 재생되도록 하는 효과가 있다.As described above, the apparatus and method for adjusting digital multimedia speed according to the present invention uses the TSM algorithm to adjust the speed of the audio data, and adjust the speed of the video data accordingly to adjust the screen speed to the sound speed. It is effective to make the screen and sound play naturally.

Claims (8)

디지털 멀티미디어 재생 배속 조절을 위한 장치에 있어서,In the device for adjusting the digital multimedia playback speed, 디코딩된 디지털 오디오 데이터를 제어신호에 따른 배속율로 PCM 데이터를 변환하는 오디오 TSM부; 및An audio TSM unit converting the decoded digital audio data into PCM data at a speed ratio according to a control signal; And 상기 오디오 TSM 부가 변환한 오디오 신호에 따라 디코딩된 디지털 비디오 데이터의 프레임 수를 변환하는 비디오 TSM부;A video TSM unit converting the number of frames of decoded digital video data according to the audio signal converted by the audio TSM unit; 를 포함하는 디지털 멀티미디어 배속 조절 장치Digital multimedia control device including a 제 1항에 있어서,The method of claim 1, 상기 오디오 TSM부는 TSM 알고리즘에 의해 선택된 채널의 오디오 데이터를 변환하고, 선택되지 않은 채널의 오디오데이터를 0x0로 변환하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 장치.And the audio TSM unit converts audio data of a channel selected by a TSM algorithm and converts audio data of an unselected channel into 0x0. 제 1항에 있어서,The method of claim 1, 상기 비디오 TSM부는 상기 오디오 TSM부가 변환한 오디오 신호의 배속율에 따라 비디오 프레임의 삭제 또는 삽입을 수행하여 프레임 수를 변환하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 장치.And the video TSM unit converts the number of frames by deleting or inserting a video frame according to the speed ratio of the audio signal converted by the audio TSM unit. 디지털 멀티미디어의 재생 배속 조절 방법에 있어서,In the playback speed control method of digital multimedia, 디코딩된 오디오 데이터를 로딩 하여 제어신호에 따른 배속율로 TSM 알고리즘에 따라 변환하는 단계;Loading the decoded audio data and converting the decoded audio data according to the TSM algorithm at a speed ratio according to the control signal; 상기 변환된 오디오 데이터의 배속율에 따라 디코딩된 오디오 데이터의 프레임수를 변환하는 단계; 및Converting the number of frames of the decoded audio data according to the speed ratio of the converted audio data; And 상기 변환된 오디오 데이터 및 비디오 데이터의 싱크를 동기화하여 출력하는 단계Synchronizing and outputting the sync of the converted audio data and video data 를 포함하는 디지털 멀티미디어 배속 조절 방법.Digital multimedia speed control method comprising a. 제 4항에 있어서,The method of claim 4, wherein 상기 제어신호에 따른 배속율이 1보다 작은 경우 TSM 확장을 적용하여 느리게 재생을 수행하고, 상기 배속율이 1보다 큰 경우 TSM 축소를 적용하여 빠르게 재생을 수행하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 방법.When the speed ratio according to the control signal is less than 1, TSM expansion is applied slowly to perform the playback, and when the speed ratio is greater than 1, the digital multimedia speed adjusting method is characterized in that to perform fast playback by applying TSM reduction. . 제 4항에 있어서,The method of claim 4, wherein 상기 비디오 데이터의 프레임은 상기 오디오 데이터의 배속율에 따라 선택된 프레임을 삭제 하거나, 복사하여 삽입하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 방법.The frame of the video data is digital multimedia speed control method, characterized in that to delete, copy and insert the selected frame according to the rate of the audio data. 제 4항에 있어서,The method of claim 4, wherein 상기 비디오 데이터의 프레임 수는 다음의 식에 의해 정해지며, 정수배가 아 닌 경우 반올림하여 정하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 방법.The frame number of the video data is determined by the following equation, and if not an integer multiple, digital multimedia speed adjustment method characterized in that the rounding. << V_N' == V_N *(S_N'/S_N)>><< V_N '== V_N * (S_N' / S_N) >> 이때, 상기 V_N 은 원래 비디오 프레임의 수, V_N'은 변환된 비디오 프레임의 수, S_N'/S_N은 오디오 데이터의 배속율을 나타낸다.In this case, V_N represents the number of original video frames, V_N 'represents the number of converted video frames, and S_N' / S_N represents a speed ratio of audio data. 제 4항에 있어서,The method of claim 4, wherein 상기 싱크는 정해진 단위를 기준으로 오디오 데이터 및 비디오 데이터의 싱크를 동기화하는 것을 특징으로 하는 디지털 멀티미디어 배속 조절 방법.And synchronizing the sync of the audio data and the video data on the basis of a predetermined unit.
KR1020050063298A 2005-07-13 2005-07-13 Apparatus and method of reproducing digital multimedia slow or fast KR20070008232A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050063298A KR20070008232A (en) 2005-07-13 2005-07-13 Apparatus and method of reproducing digital multimedia slow or fast

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050063298A KR20070008232A (en) 2005-07-13 2005-07-13 Apparatus and method of reproducing digital multimedia slow or fast

Publications (1)

Publication Number Publication Date
KR20070008232A true KR20070008232A (en) 2007-01-17

Family

ID=38010479

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050063298A KR20070008232A (en) 2005-07-13 2005-07-13 Apparatus and method of reproducing digital multimedia slow or fast

Country Status (1)

Country Link
KR (1) KR20070008232A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100782261B1 (en) * 2006-05-18 2007-12-04 엘지전자 주식회사 Video syncronization based on reproducing audio signal slow or fast
KR101298658B1 (en) * 2007-03-16 2013-08-21 삼성전자주식회사 Audio playback device having control function of playback speed and method thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100782261B1 (en) * 2006-05-18 2007-12-04 엘지전자 주식회사 Video syncronization based on reproducing audio signal slow or fast
KR101298658B1 (en) * 2007-03-16 2013-08-21 삼성전자주식회사 Audio playback device having control function of playback speed and method thereof

Similar Documents

Publication Publication Date Title
TW504664B (en) Method of reproducing audio signals without causing tone variation in fast or slow playback mode and reproducing apparatus for the same
JP3053541B2 (en) Synchronous variable speed playback of digitally recorded audio and video
KR101334366B1 (en) Method and apparatus for varying audio playback speed
JP5319704B2 (en) Audio signal processing method and apparatus
US10244271B2 (en) Audio recording device, audio recording system, and audio recording method
KR20000010930A (en) Speaking speed changing method and device
JPH08190400A (en) Acoustic variable-speed reproducing apparatus
JP2009005369A (en) File creation apparatus and data output apparatus
KR20000068955A (en) Sound processing method, sound processor, and recording/reproduction device
KR20070008232A (en) Apparatus and method of reproducing digital multimedia slow or fast
JP2009075280A (en) Content playback device
JP5325059B2 (en) Video / audio synchronized playback device, video / audio synchronized processing device, video / audio synchronized playback program
JP2007183410A (en) Information reproduction apparatus and method
KR100782261B1 (en) Video syncronization based on reproducing audio signal slow or fast
EP1538570A2 (en) Method for graphically displaying audio frequency component in digital broadcast receiver
JP2002297200A (en) Speaking speed converting device
JP2010093614A (en) Video signal playback apparatus
JP2001242890A (en) Data structure of voice data, generating method, reproducing method, recording method, recording medium, distribution method and reproducing method of multimedia
JP4529859B2 (en) Audio playback device
JPH1188844A (en) Speech speed/picture speed simultaneous conversion system, method therefor and storage medium recorded with speech speed/picture speed simultaneous conversion control program
JP2005204003A (en) Continuous media data fast reproduction method, composite media data fast reproduction method, multichannel continuous media data fast reproduction method, video data fast reproduction method, continuous media data fast reproducing device, composite media data fast reproducing device, multichannel continuous media data fast reproducing device, video data fast reproducing device, program, and recording medium
JP4229041B2 (en) Signal reproducing apparatus and method
JPH1093921A (en) Sound signal reproducing device and sound signal reproducing method
KR100659883B1 (en) Method of audio reproducing with motion video sequence
JPH08237135A (en) Coding data decodr and video audio multiplex data decoder using the decoder

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination