KR20080066468A - 오디오 데이터 재생 시간 추정 장치 및 방법 - Google Patents

오디오 데이터 재생 시간 추정 장치 및 방법 Download PDF

Info

Publication number
KR20080066468A
KR20080066468A KR1020070003953A KR20070003953A KR20080066468A KR 20080066468 A KR20080066468 A KR 20080066468A KR 1020070003953 A KR1020070003953 A KR 1020070003953A KR 20070003953 A KR20070003953 A KR 20070003953A KR 20080066468 A KR20080066468 A KR 20080066468A
Authority
KR
South Korea
Prior art keywords
bit rate
audio data
average
value
frames
Prior art date
Application number
KR1020070003953A
Other languages
English (en)
Other versions
KR100860962B1 (ko
Inventor
김용성
김태훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070003953A priority Critical patent/KR100860962B1/ko
Priority to US11/843,011 priority patent/US8000823B2/en
Priority to CN2008100015124A priority patent/CN101221802B/zh
Publication of KR20080066468A publication Critical patent/KR20080066468A/ko
Application granted granted Critical
Publication of KR100860962B1 publication Critical patent/KR100860962B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 가변 비트로 인코딩된 오디오 데이터의 재생 시간을 효율적으로 추정할 수 있는 오디오 데이터의 재생 시간 추정 장치 및 방법에 관한 것이다.
본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 장치는, ID3 태그 및 복수개의 프레임을 포함하는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식에 근거하여 추출하는 추출부, 상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 근거하여 상기 오디오 데이터의 평균 비트 전송률을 계산하는 평균 비트 전송률 계산부, 및 상기 평균 비트 전송률에 근거하여 상기 오디오 데이터의 재생시간을 계산하는 재생시간 계산부를 포함한다.
MP3, 비트 전송률, 재생시간

Description

오디오 데이터 재생 시간 추정 장치 및 방법{Audio data palyback time presumption apparatus and metod for the same}
도 1은 본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 장치를 보다 상세히 도시한 도면이다.
도 2는 MP3 방식에 의해 압축된 오디오 데이터의 포맷을 도시한 도면이다.
도 3은 준임의표집 방식에 근거하여 1024개의 의사임의점을 추출하는 과정 및 그 결과를 나타낸 도면이다.
도 4 내지 도 6은 본 발명의 실시예에 적용된 가중치 함수를 예시한 도면이다.
도 7은 본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 방법을 도시한 흐름도이다.
<도면의 주요 부분에 관한 부호의 설명>
100: 오디오 데이터 재생시간 추정 장치
110: 입력부
120: 저장부
130: 추출부
140: 평균 비트 전송률 계산부
150: 재생시간 계산부
160: 디스플레이부
본 발명은 오디오 데이터의 평균 비트 전송률 및 재생 시간을 추정할 수 있는 기술에 관한 것으로서, 더욱 상세하게는 가변 비트 전송률로 압축된 오디오 데이터의 평균 비트 전송률 및 재생 시간을 효율적으로 추정할 수 있는 오디오 데이터 재생 시간 추정 장치 및 방법에 관한 것이다.
현재 오디오 압축 기술은 WMA(Window Media Audio), AAC(Advanced Audio Coding), OGG(Ogg Vorbis) 및 MP3(MPEG Audio Layer-3) 등의 다양한 기술이 존재한다. 이 중 MP3는 MPEG1에서 규정한 고음질의 오디오 압축기술의 하나로서, 오디오 데이터를 독립된 비트 전송률을 갖는 프레임들의 나열로 표현한다. 오디오 데이터를 MP3 방식으로 압축할 때, 각각의 프레임에는 동일한 압축률이 적용될 수도 있고(이하, 고정 비트 전송률; Constant Bit Rate), 각 프레임마다 서로 다른 압축률이 적용될 수도 있다(이하, 가변 비트 전송률; Variable Bit Rate). 이러한 MP3는 음반 CD에 가까운 음질을 유지하면서 일반 CD의 50배로 압축이 가능하다는 장점을 갖기 때문에, TCP를 바탕으로 한 인터넷 상에서 널리 이용되고 있다.
한편, MP3 플레이어와 같은 디지털 오디오 플레이어는, MP3 방식에 의해 압축된 오디오 데이터를 재생할 때, 상기 오디오 데이터에 관한 정보 예를 들면, 평 균 비트 전송률 및 재생 시간 등을 사용자에게 제공한다. 이를 위해 종래에는 오디오 데이터를 구성하는 모든 프레임을 스캔하여 각 프레임의 비트 전송률 및 재생 시간을 획득하고, 획득된 데이터를 근거로 하여 오디오 데이터의 평균 비트 전송률 및 재생 시간을 얻는다.
그러나 상기와 같은 종래 기술에 의하면, 오디오 데이터의 크기가 크거나, 플레이어의 성능이 낮은 경우, 오디오 데이터를 스캔하는데 많은 시간이 소요된다는 문제점이 있다.
이러한 문제점을 해결하기 위해 오디오 데이터를 구성하는 프레임들 중에서 초기의 K개의 프레임에 대해서만 비트 전송률 및 재생 시간을 구하고, 이들의 평균값을 해당 오디오 데이터의 평균 비트 전송률 및 재생 시간으로 추정하는 기술이 제시되었다.
그러나 제시된 종래 기술은 고정 비트 전송률로 압축된 오디오 데이터의 경우에는 비교적 정확한 결과를 얻을 수 있으나, 가변 비트 전송률로 압축된 오디오 데이터의 경우에는 정확한 결과를 얻기가 어렵다는 문제가 있다.
본 발명의 목적은 가변 비트 전송률로 압축된 오디오 데이터의 평균 비트 전송률 및 재생 시간을 효율적으로 추정할 수 있는 오디오 데이터 재생 시간 추정 장치 및 방법을 제공하는 것이다.
그러나 본 발명의 목적은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있 을 것이다.
상기 목적을 달성하기 위하여, 본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 장치는, ID3 태그 및 복수개의 프레임을 포함하는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식에 근거하여 추출하는 추출부, 상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 근거하여 상기 오디오 데이터의 평균 비트 전송률을 계산하는 평균 비트 전송률 계산부, 및 상기 평균 비트 전송률에 근거하여 상기 오디오 데이터의 재생시간을 계산하는 재생시간 계산부를 포함한다.
상기 목적을 달성하기 위하여, 본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 방법은, ID3 태그 및 복수개의 프레임을 포함하는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식에 근거하여 추출하는 단계, 상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 근거하여 상기 오디오 데이터의 평균 비트 전송률을 계산하는 단계, 및 상기 평균 비트 전송률에 근거하여 상기 오디오 데이터의 재생시간을 계산하는 단계를 포함한다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범수를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 본 발명의 실시예에 의한 오디오 데이터 재생 시간 추정 장치 및 방법을 설명하기 위한 블록도 또는 처리 흐름도에 대한 도면들을 참고하여 본 발명에 대해 설명하도록 한다. 이 때, 처리 흐름도 도면들의 각 블록과 흐름도 도면들의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수 있음을 이해할 수 있을 것이다.
이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 흐름도 블록(들)에서 설명된 기능들을 수행하는 수단을 생성하게 된다.
이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 흐름도 블록(들)에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다.
컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 흐름도 블록(들)에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록은 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
먼저, 도 1 내지 도 6을 참조하여, 본 발명의 실시예에 따른 오디오 데이터 재생 시간 추정 장치에 대해서 설명하기로 한다.
도 1은 본 발명의 실시예에 따른 오디오 데이터 재생시간 추정 장치(100)를 도시한 도면이다. 도시된 바와 같이, 오디오 데이터 재생시간 추정 장치(100)는, 저장부(120), 입력부(110), 추출부(130), 평균 비트 전송률 계산부(140), 재생시간 계산부(150) 및 디스플레이부(160)를 포함하여 구성된다.
저장부(120)는 MP3 포맷으로 압축된 오디오 데이터를 저장한다. 상기 오디오 데이터는 다수개의 프레임이 나열되어 구성된다. 여기서, 도 2를 참조하여 MP3 압축 방식에 의해 압축된 오디오 데이터의 구조에 대해서 간단히 살펴보기로 한다.
도 2는 MP3 방식에 따라 압축된 오디오 데이터의 포맷를 도시한 도면이다. 도시된 바와 같이, 오디오 데이터는 ID3태그 및 다수개의 프레임을 포함하여 구성된다. 여기서, ID3태그는 상기 오디오 데이터에 대한 메타 데이터를 포함한다. 그리고, 상기 프레임은 헤더 영역 및 데이터 영역으로 구성되는데, 상기 데이터 영역은 상기 오디오 데이터의 일정 구간에 대한 오디오 신호를 포함하며, 상기 헤더 영역은 데이터 영역에 기록되어 있는 오디오 신호에 대한 정보 예를 들면, 비트 전송률, 샘플링 레이트 등의 정보를 포함한다.
다시 도 1을 참조하면, 저장부(120)는 MP3 포맷으로 압축된 오디오 데이터 이외에도, 상기 오디오 데이터의 평균 비트 전송률 및 재생시간을 추정하기 위한 알고리즘을 저장한다. 이러한 저장부(120)는 롬(Read Only Memory: ROM), 피롬(Programable Read Only Memory: PROM), 이피롬(Erasable Programmable Read Only Memory: EPROM), 이이피롬(Electrically Erasable Programmable Read Only Memory: EEPROM), 플래쉬 메모리(Flash memory)와 같은 비휘발성 메모리 소자 또는 램(Random Access Memory: RAM)과 같은 휘발성 메모리 소자 또는 하드디스크 드라이브(Hard Disk Drive; HDD)와 같은 저장 매체 중 적어도 하나로 구현될 수 있으나 이에 한정되지는 않는다.
입력부(110)는 사용자의 명령을 입력받는다. 예를 들면, 기 저장되어 있는 오디오 데이터를 재생하는 명령, 오디오 데이터의 재생을 중지시키는 명령, 기 저장되어 있는 오디오 데이터를 삭제하는 명령 등을 입력받는다. 이를 위해 입력부(110)는 소정 키신호를 발생시키는 다수개의 키를 구비할 수 있으며, 상기 다수 개의 키는 하드웨어적 또는 소프트웨어적으로 구현될 수 있다.
추출부(130)는 기 저장되어 있는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 프레임을 추출한다. 이하의 설명에서는, 추출된 프레임을 '샘플 프레임'이라 칭하기로 한다. 추출부(130)는 오디오 데이터로부터 복수개의 샘플 프레임을 추출할 때, 준임의표집(quasi-random sampling) 방식에 근거하여 추출하는 것이 바람직하다. 준임의표집 방식에 의해 추출된 샘플들은 무작위적인 특성을 나타내면서도, 임의표집(random sampling) 방식이나 유사임의표집(pseudo random sampling) 방식에 의해 추출된 샘플들에 비하여 규칙적인 특성을 나타낸다.
도 3은 2차원 평면에서 1024개의 의사임의점을 준임의표집 방식에 따라 추출한 결과를 예시한 도면이다. 구체적으로, 도 3은 왼쪽 상단의 그림부터 시계방향으로, 128개의 의사임의점을 추출한 결과, 384개의 의사임의점을 추출한 결과, 512개의 의사임의점을 추출한 결과, 및 상기 세 개의 그림에 도시된 의사임의점을 모두 나타낸 결과(즉, 준임의표집 방식에 따라 추출된 1024개의 의사임의점)를 차례로 도시한 것이다.
도 3에서 도시된 그림들을 살펴보면, 준임의표집 방식에 따라 추출된 128개의 샘플, 384개의 샘플 및 512개의 샘플들은 각각 일정한 패턴을 가지고 2차원 공간을 채우고 있는 것을 알 수 있으며, 상기 샘플들을 모두 나타내었을 때, 1024개의 샘플들은 2차원 공간의 특정 부분에 집중되어 있지 않고, 균일하게 분포되어 있는 것을 알 수 있다. 이와 같이, 준임의표집 방식에 따라, 모집단으로부터 샘플을 추출하게 되면, 임의표집 방식 또는 유사임의 표집 방식에 따라 샘플을 추출하는 것에 비해 모집단 전반에 걸쳐 균일하게 샘플이 추출되기 때문에, 추출된 샘플을 근거로 하여 모집단의 특성을 추정하는 경우, 그 정확도를 향상시킬 수 있다.
다시 도 1을 참조하면, 추출부(130)는 준임의표집 방식에 따라 복수개의 샘플 프레임을 추출한다. 이를 위해, 추출부(130)는 우선, K개의 의사 난수(quasi-random number)를 생성한다. 오디오 데이터의 전체 길이(L)에서, ID3 태그의 길이(D)를 제외한 모든 프레임의 길이를 N 바이트라고 한다면, 상기 K는 상기 N에 비하여 매우 작은 값으로 설정되는 것이 바람직하다(K<<N).
이 후, 추출부(130)는 생성된 K개의 의사 난수를 오름차순으로 정렬한다. 의사 난수를 ti라 했을 때, K개의 의사 난수를 정렬한 결과가 [수학식 1]과 같다면, 의사 난수 ti는 1과 N 사이의 정수에 해당하며, [수학식 2]의 조건을 만족한다.
Figure 112007003474043-PAT00001
Figure 112007003474043-PAT00002
의사 난수를 정렬한 후, 추출부(130)는 오디오 데이터를 구성하는 복수개의 프레임 중 ti번째 위치한 프레임을 추출한다.
평균 비트 전송률 계산부(140)는 추출부(130)에 의해 추출된 샘플 프레임의 헤더 영역을 읽어, 각 샘플 프레임의 비트 전송률을 얻은 다음, 이들의 평균값을 구한다. 이 때, 평균 비트 전송률 계산부(140)는 M-추정기(M-estimatior)에 근거하여, 상기 평균값을 구하는 것이 바람직하다. 다시 말해, 평균 비트 전송률 계산부(140)는 각 샘플 프레임에서 얻은 비트 전송률에 따라서, 서로 다른 가중치를 적용한 다음, 평균을 구하는 것이 바람직하다. 상기 계산된 평균값은 오디오 데이터의 평균 비트 전송률에 대한 추정량(estimator)으로 볼 수 있다. 상기 M-추정기의 종류에는 코쉬 추정기(Cauchy estimator), 웰치 추정기(Welch estimator), 터키 추정기(Tukey estimator) 및 후버 추정기(Huber estimator) 등을 예로 들 수 있다.
도 4 내지 도 6은 본 발명의 실시예에 다른 가중치 함수를 예시한 도면이다. 도 4는 후버 추정기에서 사용되는 가중치 함수를 도시한 그래프이고, 도 5는 코쉬 추정기에서 사용되는 가중치 함수를 도시한 그래프이며, 도 6은 웰치 추정기에서 사용되는 가중치 함수를 도시한 그래프이다. 각 그래프에서 가로축은 비트 전송률을 나타내며, 세로축은 해당 비트 전송률에 적용되는 가중치를 나타낸다.
먼저, 도 4에 도시된 가중치 함수는 비트 전송률이 제1 임계값으로 증가할수록 가중치가 급격히 증가하는 것을 알 수 있다. 그리고, 비트 전송률이 제1 임계값과 제2 임계값으로 증가할수록 가중치가 최대치로 유지되는 것을 알 수 있다. 이에 비하여, 비트 전송률이 상기 제2 임계값에서 최대값으로 증가할수록 가중치는 급격히 감소하는 것을 알 수 있다.
이에 비해, 도 5에 도시된 가중치 함수는 비트 전송률이 최소값에서 제3 임계값으로 증가할수록 선형으로 증가하고, 비트 전송률이 상기 제3 임계값에서 최대 값으로 증가갈수록 선형으로 감소되는 형태임을 알 수 있다.
도 6에 도시된 가중치 함수는 도 5에 도시된 가중치 함수와 유사하게 비트 전송률이 최소값에서 제3 임계값으로 증가할수록 증가하며, 비트 전송률이 상기 제3 임계값에서 최대값으로 증가할수록 감소되는 형태임을 알 수 있다. 다만, 도 6에 도시된 가중치 함수는 도 5에 도시된 가중치 함수와는 다르게 곡선 형태를 갖는 것을 알 수 있다. 이 때, 도 6에서의 제3 임계값은 도 5에 도시된 제3 임계값과 같거나 다를 수 있다.
도 4 내지 도 6에서 살펴본 바와 같이, 비트 전송률에 따라 서로 다른 가중치를 적용하여 평균값을 계산하게 되면, 각 샘플 프레임으로부터 획득된 비트 전송률 중 한 두개의 특이값(outlier)이 상기 평균값에 미치는 영향을 감소시킬 수 있다. 즉, 가중치를 적용하지 않은 경우에 비해 강인한(robust) 추정량을 얻을 수 있는 것이다.
다시 도 1을 참조하면, 재생시간 계산부(150)는 오디오 데이터를 구성하는 모든 프레임의 길이 및 재생시간 계산부(150)에 의해 계산된 평균 비트 전송률에 근거하여, 상기 오디오 데이터의 재생시간을 계산한다. 구체적으로, 재생시간 계산부(150)는 평균 비트 전송률을 바이트 단위로 변환한 다음, 평균 비트 전송률을 상기 변환된 값으로 나눔으로써, 상기 오디오 데이터의 재생 시간을 계산한다. 이를 수학식으로 나타내는 [수학식 3]과 같다.
[수학식 3]에서, T는 오디오 데이터의 재생시간을 나타내며, B는 재생시간 계산부(150)에 의해 계산된 오디오 데이터의 평균 비트 전송률을 나타낸다. 그리고, N은 오디오 데이터를 구성하는 모든 프레임의 길이를 나타내는 것으로, 오디오 데이터의 전체 길이(L)에서 ID3 태그의 길이(D)를 차감하여 얻을 수 있다.
디스플레이부(160)는 명령 처리 결과를 가시적인 형태로 출력한다. 예를 들면, 재생될 오디오 데이터의 목록 및 상기 오디오 데이터의 재생 시간을 디스플레이한다. 이러한 디스플레이부(160)는 LCD, PDP, LED, OLED, Flexible display 등의 다양한 디스플레이 수단에 의하여 구현될 수 있으며, 전술한 입력부(110)와 하드웨어적으로 독립된 형태로 구현되거나, 터치스크린과 같이 입력부(110)와 하드웨어적으로 통합된 형태로 구현될 수도 있다.
도 7은 본 발명의 실시예에 따른 오디오 데이터 재생 시간 추정 방법을 도시한 흐름도이다.
먼저, 입력부(110)를 통해 사용자의 명령이 입력되면(S710), 추출부(130)는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식에 근거하여 추출한다(S720). 상기 샘플 프레임을 추출하는 단계는, K개의 의사 난수를 생성하는 단계와, 오디오 데이터를 구성하는 모든 프레임 중 상 기 난수에 대응하는 위치의 프레임을 상기 샘플 프레임으로 추출하는 단계로 이루어질 수 있다.
샘플 프레임이 추출되면, 평균 비트 전송률 계산부(140)는 각 샘플 프레임의 헤더 영역을 읽어, 각 샘플 프레임의 비트 전송률을 얻은 다음, M-추정기에 근거하여, 상기 비트 전송률의 평균값을 구한다(S730). 상기 비트 전송률의 평균값을 구하는 단계는, 각 샘플 프레임으로부터 획득한 비트 전송률을 분석하여, 비트 전송률에 따라 서로 다른 가중치를 적용하는 단계와, 상기 가중치가 적용된 비트 전송률의 평균값을 계산하는 단계로 이루어질 수 있다. 이 때, 비트 전송률에 따라 서로 다른 가중치를 적용하는 것은, 각 샘플 프레임으로부터 획득된 비트 전송률 중 한 두개의 특이값이 평균값에 미치는 영항을 감소시키기 위함이며, 상기 과정을 거쳐 계산된 평균값은 상기 오디오 데이터의 평균 비트 전송률로 이해될 수 있다.
오디오 데이터의 평균 비트 전송률이 계산되면, 재생시간 계산부(150)는 오디오 데이터를 구성하는 모든 프레임의 길이(단위; Byte) 및 상기 평균 비트 전송률에 근거하여, 상기 오디오 데이터의 재생시간을 계산한다(S740). 여기서, 상기 오디오 데이터의 재생시간을 계산하는 단계는, 오디오 데이터의 전체 길이 L(단위; Byte)에서 ID3 태그의 길이인 D(단위; Byte)를 차감하여, 상기 오디오 데이터를 구성하는 모든 프레임의 길이인 N(단위; Byte)을 구하는 단계와, 상기 평균 비트 전송률을 바이트 단위로 변환하는 단계와, 상기 N을 상기 변환된 값으로 나누어 상기 오디오 데이터의 재생시간(T)을 구하는 단계로 이루어질 수 있다.
상기 오디오 데이터의 재생시간(T)이 계산되면, 상기 계산된 재생시간(T)은 상기 오디오 데이터의 다른 정보 예를 들면, ID3 태그에 기록된 정보와 함께 디스플레이부(160)를 통해 디스플레이된다(S750).
이상과 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
상기한 바와 같은 본 발명에 의한 오디오 데이터 재생 시간 추정 장치 및 방법에 따르면 다음과 같은 효과가 하나 혹은 그 이상 있다.
오디오 데이터의 일부만을 스캔하고서도 상기 오디오 데이터의 평균 비트 전송률 및 재생시간을 추정할 수 있다.
오디오 데이터로부터 표본 프레임 추출시, 쿼시 랜덤 샘플링 방식에 근거하여 추출함으로써, 상기 오디오 데이터의 평균 비트 전송률 및 재생 시간을 빠르게 추정할 수 있으며, 추정된 결과의 정확성을 높일 수 있다.
추출된 각 프레임의 비트 전송률 및 재생시간을 분석하고, 각 프레임별로 서로 다른 가중치를 적용하여 오디오 데이터의 평균 비트 전송률 및 재생 시간을 추정함으로써, 추정된 결과의 정확성을 높일 수 있다.
저사양의 하드웨어에서도 오디오 데이터의 평균 비트 전송률 및 재생시간을 효율적으로 추정할 수 있다.

Claims (16)

  1. ID3 태그 및 복수개의 프레임을 포함하는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식(quasi-random sampling)에 근거하여 추출하는 추출부;
    상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 근거하여 상기 오디오 데이터의 평균 비트 전송률을 계산하는 평균 비트 전송률 계산부; 및
    상기 평균 비트 전송률에 근거하여 상기 오디오 데이터의 재생시간을 계산하는 재생시간 계산부를 포함하는 오디오 데이터 재생시간 추정 장치.
  2. 제 1 항에 있어서, 상기 추출부는,
    복수개의 의사 난수(quasi-random number)를 생성하여 오름차순으로 정렬하고, 상기 복수개의 프레임 중에서 상기 의사 난수와 동일한 위치의 프레임을 상기 샘플 프레임으로 추출하는 오디오 데이터 재생시간 추정 장치.
  3. 제 1 항에 있어서, 상기 평균 비트 전송률 계산부는,
    상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 따라서, 서로 다른 가중치를 상기 비트 전송률에 적용하고, 상기 가중치가 적용된 비트 전송률의 평균값을 계산하는 오디오 데이터 재생시간 추정 장치.
  4. 제 3 항에 있어서, 상기 평균 비트 전송률 계산부는,
    상기 비트 전송률이 최소값에서 제1 임계값으로 증가할수록 높은 가중치를 적용하고, 상기 비트 전송률이 상기 제1 임계값에서 제2 임계값으로 증가할수록 상기 제1 임계값에서의 가중치를 적용하며, 상기 비트 전송률이 상기 제2 임계값에서 최대값으로 증가할수록 낮은 가중치를 적용하는 오디오 데이터 재생시간 추정 장치.
  5. 제 3 항에 있어서, 상기 평균 비트 전송률 계산부는,
    상기 비트 전송률이 최소값에서 제1 임계값으로 증가수록 높은 가중치를 적용하고, 상기 비트 전송률이 상기 제1 임계값에서 최대값으로 증가할수록 낮은 가중치를 적용하는 오디오 데이터 재생시간 추정 장치.
  6. 제 3 항에 있어서,
    상기 평균값은 상기 오디오 데이터의 평균 비트 전송률인 오디오 데이터 재생시간 추정 장치.
  7. 제 1 항에 있어서, 상기 재생시간 계산부는,
    상기 오디오 데이터의 전체 길이에서 상기 ID3 태그의 길이가 제외된 값을 상기 평균 비트 전송률이 바이트 단위로 변환된 변환값으로 나누어, 상기 재생시간을 계산하는 오디오 데이터 재생시간 추정 장치.
  8. 제 1 항에 있어서, 상기 오디오 데이터의 재생시간을 디스플레이하는 디스플레이부를 더 포함하는 오디오 데이터 재생시간 추정 장치.
  9. ID3 태그 및 복수개의 프레임을 포함하는 오디오 데이터로부터 상기 오디오 데이터를 대표하는 복수개의 샘플 프레임을 준임의표집 방식에 근거하여 추출하는 단계;
    상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 근거하여 상기 오디오 데이터의 평균 비트 전송률을 계산하는 단계; 및
    상기 평균 비트 전송률에 근거하여 상기 오디오 데이터의 재생시간을 계산하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  10. 제 9 항에 있어서, 상기 추출하는 단계는,
    복수개의 의사 난수(quasi-random number)를 생성하여 오름차순으로 정렬하는 단계; 및
    상기 복수개의 프레임 중에서 상기 의사 난수와 동일한 위치의 프레임을 상기 샘플 프레임으로 추출하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  11. 제 9 항에 있어서, 상기 평균 비트 전송률을 계산하는 단계는,
    상기 복수개의 샘플 프레임으로부터 획득된 비트 전송률에 따라서, 서로 다 른 가중치를 상기 비트 전송률에 적용하는 단계; 및
    상기 가중치가 적용된 비트 전송률의 평균값을 계산하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  12. 제 11 항에 있어서,
    상기 서로 다른 가중치를 상기 비트 전송률에 적용하는 단계는,
    상기 비트 전송률이 최소값에서 제1 임계값으로 증가할수록 높은 가중치를 적용하는 단계;
    상기 비트 전송률이 상기 제1 임계값에서 제2 임계값으로 증가할수록 상기 제1 임계값에서의 가중치를 적용하는 단계; 및
    상기 비트 전송률이 상기 제2 임계값에서 최대값으로 증가할수록 낮은 가중치를 적용하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  13. 제 11 항에 있어서,
    상기 서로 다른 가중치를 상기 비트 전송률에 적용하는 단계는,
    상기 비트 전송률이 최소값에서 제1 임계값으로 증가할수록 높은 가중치를 적용하는 단계;
    상기 비트 전송률이 상기 제1 임계값에서 최대값으로 증가할수록 낮은 가중치를 적용하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  14. 제 11 항에 있어서,
    상기 평균값은 상기 오디오 데이터의 평균 비트 전송률인 오디오 데이터 재생시간 추정 방법.
  15. 제 9 항에 있어서, 상기 오디오 데이터의 재생시간을 계산하는 단계는,
    상기 오디오 데이터의 전체 길이에서 상기 ID3 태그의 길이가 제외된 값을 상기 평균 비트 전송률이 바이트 단위로 변환된 변환값으로 나누어, 상기 재생시간을 계산하는 단계를 포함하는 오디오 데이터 재생시간 추정 방법.
  16. 제 9 항에 있어서,
    상기 계산된 재생시간을 디스플레이하는 단계를 더 포함하는 오디오 데이터 재생시간 추정 방법.
KR1020070003953A 2007-01-12 2007-01-12 오디오 데이터 재생 시간 추정 장치 및 방법 KR100860962B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020070003953A KR100860962B1 (ko) 2007-01-12 2007-01-12 오디오 데이터 재생 시간 추정 장치 및 방법
US11/843,011 US8000823B2 (en) 2007-01-12 2007-08-22 Audio playback time estimating apparatus and method
CN2008100015124A CN101221802B (zh) 2007-01-12 2008-01-04 音频重放时间估计设备及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070003953A KR100860962B1 (ko) 2007-01-12 2007-01-12 오디오 데이터 재생 시간 추정 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20080066468A true KR20080066468A (ko) 2008-07-16
KR100860962B1 KR100860962B1 (ko) 2008-09-30

Family

ID=39618392

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070003953A KR100860962B1 (ko) 2007-01-12 2007-01-12 오디오 데이터 재생 시간 추정 장치 및 방법

Country Status (3)

Country Link
US (1) US8000823B2 (ko)
KR (1) KR100860962B1 (ko)
CN (1) CN101221802B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009001344A2 (en) * 2007-06-25 2008-12-31 Recollect Ltd. A recording system for salvaging information in retrospect
US9076484B2 (en) 2008-09-03 2015-07-07 Sandisk Technologies Inc. Methods for estimating playback time and handling a cumulative playback time permission
JP5912496B2 (ja) * 2011-12-16 2016-04-27 東芝アルパイン・オートモティブテクノロジー株式会社 デジタル再生装置
US9582904B2 (en) * 2013-11-11 2017-02-28 Amazon Technologies, Inc. Image composition based on remote object data
US9596280B2 (en) 2013-11-11 2017-03-14 Amazon Technologies, Inc. Multiple stream content presentation
US9634942B2 (en) 2013-11-11 2017-04-25 Amazon Technologies, Inc. Adaptive scene complexity based on service quality
US9578074B2 (en) 2013-11-11 2017-02-21 Amazon Technologies, Inc. Adaptive content transmission
US9604139B2 (en) 2013-11-11 2017-03-28 Amazon Technologies, Inc. Service for generating graphics object data
US9805479B2 (en) 2013-11-11 2017-10-31 Amazon Technologies, Inc. Session idle optimization for streaming server
US9641592B2 (en) 2013-11-11 2017-05-02 Amazon Technologies, Inc. Location of actor resources

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200277959Y1 (ko) 1998-08-26 2002-09-17 엘지 오티스 엘리베이터 유한회사 회전자의측면지지구조
US20020003941A1 (en) * 2000-06-26 2002-01-10 Eiichi Hatae Remaining recordable time calculation apparatus that converts amount of free area of recording medium into time
US20020131761A1 (en) * 2001-01-16 2002-09-19 Kojiro Kawasaki Information recording medium, apparatus and method for recording/reproducing information to/from the medium
KR100378796B1 (ko) 2001-04-03 2003-04-03 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
KR20030015579A (ko) * 2001-08-16 2003-02-25 주식회사 코스모탄 지정된 변속율에 정확하게 비례하는 재생시간을 갖도록오디오신호의 시간스케일을 수정하는 방법과 이를 위한장치
MXPA04002148A (es) * 2001-09-06 2004-06-29 Thomson Licensing Sa Metodo y aparato paa el cronometraje de tiempo de reproduccion transcurrido en archivos de datos de audio codificados en forma digital con velocidad variable de bits.
JP2003297062A (ja) 2002-03-28 2003-10-17 Kenwood Corp 再生装置および楽曲再生方法
KR20030088648A (ko) 2002-05-14 2003-11-20 전자부품연구원 디지털 라디오 방송 수신기에서의 음향 정보 서비스 제공장치 및 그 방법
KR100573219B1 (ko) * 2004-04-27 2006-04-24 우종식 위치정보를 이용한 자막, 정지영상, 동영상의 동기화생성/재생방법 및 그 장치
KR100608597B1 (ko) * 2004-06-29 2006-08-03 삼성전자주식회사 콤보 시스템에서 적응적 레코딩 방법
KR200388648Y1 (ko) 2005-02-17 2005-07-01 유경수 무봉제 음낭돌출부 남성기능성 팬티 및 이의 제작방법
KR200444854Y1 (ko) 2007-05-11 2009-06-10 김관식 곡선으로 미려함을 배가한 한복 옷 고름

Also Published As

Publication number Publication date
KR100860962B1 (ko) 2008-09-30
US8000823B2 (en) 2011-08-16
CN101221802A (zh) 2008-07-16
CN101221802B (zh) 2011-05-18
US20080172140A1 (en) 2008-07-17

Similar Documents

Publication Publication Date Title
KR100860962B1 (ko) 오디오 데이터 재생 시간 추정 장치 및 방법
US7796860B2 (en) Method and system for playing back videos at speeds adapted to content
US8586847B2 (en) Musical fingerprinting based on onset intervals
US7706663B2 (en) Apparatus and method for embedding content information in a video bit stream
KR102340196B1 (ko) 동영상 처리 장치 및 방법
EP1081960A1 (en) Signal processing method and video/voice processing device
DE502004002904D1 (de) Verfahren und anordnung zur videocodierung, wobei die videocodierung texturanalyse und textursynthese umfasst, sowie ein entsprechendes computerprogramm und ein entsprechendes computerlesbares speichermedium
JP2005531024A (ja) 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法
JP2005210234A (ja) 映像内容認識装置、録画装置、映像内容認識方法、録画方法、映像内容認識プログラム、および録画プログラム
JP2009139769A (ja) 信号処理装置、信号処理方法及びプログラム
US8976973B2 (en) Sound control device, computer-readable recording medium, and sound control method
CN113160848B (zh) 舞蹈动画生成方法、模型训练方法、装置、设备及存储介质
JP5096259B2 (ja) 要約コンテンツ生成装置および要約コンテンツ生成プログラム
JP2006340066A5 (ko)
KR20110135044A (ko) 3d영상 처리 장치 및 그 방법
JP2004266742A (ja) ディスク装置、ディスク記録方法、ディスク再生方法、記録媒体、並びにプログラム
JP4620126B2 (ja) 映像識別装置
JP2007249075A (ja) 音声再生装置および高域補間処理方法
KR100644627B1 (ko) 음장 제어 정보 부호화 방법 및 이에 적합한 음장 처리 방법
JP2008166895A (ja) 映像表示装置及びその制御方法、プログラム、記録媒体
JP2012044390A (ja) 映像要約装置および映像要約プログラム
KR101431046B1 (ko) Fruc를 위한 영상정보 인코딩 방법 및 장치, 저장매체
CN109285197B (zh) 一种gif图像处理方法和移动终端
JP6125807B2 (ja) データ圧縮装置、データ圧縮プログラム、データ圧縮システム、データ圧縮方法、データ伸張装置、およびデータ圧縮伸張システム
JP4453603B2 (ja) ダイジェスト作成装置およびダイジェスト作成処理のプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120814

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130822

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee