KR101091992B1

KR101091992B1 - 오디오 재생속도 제어 장치 및 방법

Info

Publication number: KR101091992B1
Application number: KR1020110010258A
Authority: KR
Inventors: 전준현; 유덕현; 김동혁
Original assignee: 동국대학교 산학협력단
Priority date: 2011-02-01
Filing date: 2011-02-01
Publication date: 2011-12-09

Abstract

오디오 재생속도 제어 장치 및 방법이 개시된다. 오디오 재생속도 제어 장치는 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부, 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 산출부 및 평균(m) 및 표준편차(σ)를 이용하여 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 프레임 내의 블록 중에서 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함한다.

Description

오디오 재생속도 제어 장치 및 방법{Apparatus and Method for controlling play back speed of audio}

본 발명은 오디오 재생속도 제어 장치 및 방법에 관한 것이다.

오디오의 재생속도(Play Back Speed)를 제어하는 방법은 1985년 미국의 Salim Roucos가 SOLA(Synchronized OverLap Add) 알고리즘을 제안하면서 발전하였다. SOLA 방식은 감속과 배속에 따라 음성 신호를 확장(Expand)하거나 축소(Compress)하는 방식이다. 타임 스케일(Time Scale)의 확장은 녹음된 음성 신호의 발성화자가 그 음성을 실제로 느리게 발성하는 것과 동일한 효과를 가지며, 반대로 타임 스케일의 축소는 음성을 빠르게 발성하는 것과 동일한 효과를 가진다.

하지만, 이와 같은 SOLA 방식은 오디오 재생속도의 증가 및 감소에 따른 오디오 주파수 스펙트럼에 심각한 왜곡을 발생시켜 재생되는 오디오 신호의 음색 변질과 명료도 저하 등의 심각한 음질 손상의 문제점이 있다. 예를 들어, 재생속도를 높일 경우(배속), 오디오 주파수 스펙트럼 간의 중첩 현상(aliasing effect)이 발생하며, 이로 인한 고주파 성분의 중첩 왜곡으로 정확한 발음의 구분이 어려울 뿐만 아니라 음색이 모기 소리와 같이 고음으로 변하여 귀에 거슬리는 문제점이 있다.

본 발명은 오디오의 재생속도 배속시 고주파 성분의 중첩 왜곡을 감소시키기 위하여 원본 오디오 데이터에서 액티브(active) 데이터를 가지는 다이나믹(dynamic) 영역을 추출하여 배속을 제어하는 것이다.

본 발명의 일 측면에 따르면, 오디오의 재생속도를 제어하는 오디오 재생속도 제어 장치가 개시된다.

본 발명의 실시예에 따른 오디오 재생속도 제어 장치는 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부, 상기 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 산출부 및 상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함한다.

상기 추출부는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정한다.

여기서, x_k는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, m_i는 i번째 프레임의 평균이고, σ_i는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임

상기 기준점변수에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절된다.

상기 추출부는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출한다.

상기 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행하는 보정부를 더 포함한다.

상기 보정부는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 상기 다이나믹 영역의 재생속도의 차이만큼 보정을 수행한다.

상기 보정부는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간(interpolation)함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행한다.

상기 보정부는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행한다.

본 발명의 다른 측면에 따르면, 오디오 재생속도 제어 장치가 오디오의 재생속도를 제어하는 방법이 개시된다.

본 발명의 실시예에 따른 오디오 재생속도 제어 방법은 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 단계, 상기 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 단계, 상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브 데이터 여부를 판정하는 단계, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계 및 상기 다이나믹 블록을 포함하는 다이나믹 영역을 구성하는 단계를 포함한다.

상기 액티브 데이터 여부를 판정하는 단계는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정한다.

상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출한다.

상기 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행하는 단계를 더 포함한다.

상기 재생속도에 대한 보정을 수행하는 단계는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하는 단계 및 상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계를 포함한다.

상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행한다.

상기 재생속도에 대한 보정을 수행하는 단계는 재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행하는 단계를 포함한다.

본 발명의 다른 측면에 따르면, 오디오 재생속도 제어 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체가 개시된다.

본 발명은 오디오의 재생속도 배속시 고주파 성분의 중첩 왜곡을 감소시키기 위하여 원본 오디오 데이터에서 액티브 데이터를 가지는 다이나믹 영역을 추출하여 배속을 제어할 수 있다.

또한, 본 발명은 오디오의 재생속도 배속시 음색의 변화를 방지하여 배속된 오디오가 원본 오디오와 같은 음색을 유지하게 할 수 있다.

도 1은 오디오 재생속도 제어 방법을 나타낸 흐름도.
도 2는 S300 단계의 세부 흐름도.
도 3은 S400 단계의 세부 흐름도.
도 4는 S500 단계의 세부 흐름도.
도 5는 추출된 블록에 대한 보간(interpolation)을 나타낸 도면.
도 6은 원본 오디오 데이터의 분포와 배속된 오디오 데이터의 분포를 나타낸 도면.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.

또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.

이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면 번호에 상관없이 동일한 수단에 대해서는 동일한 참조 번호를 사용하기로 한다.

도 1은 오디오 재생속도 제어 방법을 나타낸 흐름도이다. 오디오 재생속도 제어는 오디오의 재생속도 제어 기능을 구비한 오디오 시스템에 의하여 수행될 수 있으며, 오디오 시스템은 오디오 재생속도 제어 장치(70)를 포함할 수 있다. 이하에서는, 이해와 설명의 편의를 위하여 오디오 재생속도 제어 방법이 오디오 재생속도 제어 장치(70)에 의하여 수행되는 것으로 가정하여 설명한다.

S100 단계에서, 오디오 재생속도 제어 장치(70)는 오디오 배속에 대한 명령 및 파라미터 정보를 입력받아 오디오 재생속도 제어에 필요한 파라미터(parameter)를 결정하고 초기화한다. 여기서, 파라미터는 재생속도, 프레임 사이즈(N: 양의 정수), 블록 사이즈(n: 양의 정수), 최소액티브데이터개수(#_Active_Sample), 기준점변수(α)를 포함한다.

S200 단계에서, 오디오 재생속도 제어 장치(70)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한다. 여기서, N 사이즈는 원본 오디오 데이터의 사이즈보다 작게 설정되고, n 사이즈는 N 사이즈보다 작게 설정될 수 있다. 예를 들어, 프레임 사이즈 N=1024이고, 블록 사이즈 n=128이라고 가정하면, 각 프레임 당 블록 수는 8개가 될 수 있다.

S300 단계에서, 오디오 재생속도 제어 장치(70)는 복수의 프레임에서 i번째 프레임을 처리한다.

도 2는 S300 단계의 세부 흐름도이다.

S310 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임 처리를 위한 파라미터를 초기화한다. 여기서, 파라미터는 다이다믹블록개수(#_dynamic_block), 블록순번(j) 등이 될 수 있다.

S320 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임의 평균(m_i) 및 표준편차(σ_i)를 산출한다.

S330 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임에서 j번째 블록을 추출한다.

다시, 도 1을 참조하면, S400 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임에 포함된 복수의 블록 중에서 다이나믹 블록을 추출한다.

도 3은 S400 단계의 세부 흐름도이다.

S410 단계에서, 오디오 재생속도 제어 장치(70)는 카운터를 초기화한다(count=0). 여기서, 카운터는 블록 내에 연속적으로 존재하는 액티브 데이터의 개수를 카운팅하기 위한 파라미터이다.

S420 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터(x_k)가 액티브 데이터인지 여부를 판단한다. 즉, 도 3에 도시된 바와 같이 하기의 수학식 1을 이용하여 k번째 오디오 데이터(x_k)의 액티브 데이터 여부를 판단할 수 있다. 즉, 오디오 재생속도 제어 장치(70)는 수학식 1을 만족하는 블록 내의 오디오 데이터를 액티브 데이터로 판정할 수 있다.

[수학식 1]

여기서, x_k는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, m_i는 i번째 프레임의 평균이고, σ_i는 i번째 프레임의 표준편차이다. α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수이다. 판정기준점은 오디오 데이터의 특성이나 배속의 정도에 따라 설정될 수 있으며, 예를 들면, 2배속인 경우 2σ가 될 수 있다. 즉, α값에 따라 추출되는 오디오 데이터 양(블록 수)이 조절되며, 이에 따라 재생속도(배속)가 조절될 수 있다.

만약, k번째 오디오 데이터(x_k)가 액티브 데이터가 아닌 경우, S410 단계로 진입한다. 즉, 오디오 재생속도 제어 장치(70)는 카운터를 초기화하여 j번째 블록 내의 액티브 데이터의 연속성을 확인한다.

S430 단계에서, 오디오 재생속도 제어 장치(70)는 k번째 오디오 데이터(x_k)가 액티브 데이터인 경우, 카운팅을 한다(count=count+1).

S440 단계에서, 오디오 재생속도 제어 장치(70)는 카운터값이 최소액티브데이터개수(#_Active_Sample)를 초과하는지 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 j번째 블록 내에 액티브 데이터가 연속적으로 최소액티브데이터개수를 초과하게 존재하는지 여부를 판단한다.

S450 단계에서, 오디오 재생속도 제어 장치(70)는 카운터값이 최소액티브데이터개수를 초과하지 않는 경우, j번째 블록 처리의 완료 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 현재 k번째 오디오 데이터(x_k)가 j번째 블록의 마지막 데이터인지 여부를 판단한다.

만약, k번째 오디오 데이터(x_k)가 j번째 블록의 마지막 데이터가 아닌 경우, S420 단계로 진입한다. 이때, S420 단계에서, 오디오 재생속도 제어 장치(70)는 k를 1만큼 증가시켜 다음 오디오 데이터에 대하여 액티브 데이터 여부를 판단할 수 있다.

또한, 오디오 재생속도 제어 장치(70)는 블록 처리가 완료된 경우, S480 단계로 진입하여 다음 블록을 처리하거나 다음 프레임을 처리할 수 있다.

S440 단계에서의 판단 결과, 카운터값이 최소액티브데이터개수를 초과하는 경우, S460 단계에서, 오디오 재생속도 제어 장치(70)는 다이다믹블록개수를 카운팅한다(#_dynamic_block=#_dynamic_block+1). 오디오 재생속도 제어 장치(70)는 다이다믹블록개수의 카운팅을 통해 추출된 오디오 데이터양(즉, 블록 수)을 확인하고 이를 통해 재생속도를 인식할 수 있다.

S470 단계에서, 오디오 재생속도 제어 장치(70)는 j번째 블록을 다이나믹 블록으로 추출하여 저장한다.

S480 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임 처리의 완료 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 현재 j번째 블록이 i번째 프레임의 마지막 블록인지 여부를 판단한다.

만약, j번째 블록이 i번째 프레임의 마지막 블록인 경우, S500 단계로 진입한다.

S490 단계에서, 오디오 재생속도 제어 장치(70)는 j번째 블록이 i번째 프레임의 마지막 블록이 아닌 경우, 블록순번(j)을 1씩 증가시킨다(j=j+1). 이것은 다음 블록을 처리하기 위한 것이다.

다시, 도 1을 참조하면, S500 단계에서, 오디오 재생속도 제어 장치(70)는 추출된 다이나믹 영역의 재생속도 보정을 위한 보간(interpolation)을 수행한다. 여기서, 다이나믹 영역은 S400 단계에서 추출된 다이나믹 블록으로 구성된다.

도 4는 S500 단계의 세부 흐름도이다.

S510 단계에서, 오디오 재생속도 제어 장치(70)는 추출된 블록의 개수를 이용하여 다이나믹 영역의 재생속도를 확인한다. 즉, 오디오 재생속도 제어 장치(70)는 설정된 재생속도와 다이나믹 영역의 재생속도의 차이를 확인할 수 있다.

S520 단계에서, 오디오 재생속도 제어 장치(70)는 액티브 데이터를 가지는 추출된 블록의 이웃 블록을 이용하여 재생속도를 보정한다. 예를 들어, 도 5를 참조하면, 도 5는 추출된 블록에 대한 보간(interpolation)을 나타낸 도면이다. 오디오 재생속도 제어 장치(70)는 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 도 5에 도시된 바와 같이 추출된 블록에 이웃 블록을 연결하여 보간함으로써 다이나믹 영역의 재생속도를 감소시키는 보정을 수행할 수 있다.

S530 단계에서, 오디오 재생속도 제어 장치(70)는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행한다.

이와 같이, 프레임 내의 통계 특성을 이용하여 유효값을 추출하는 방법은 절대적인 크기를 기준으로 데이터가 추출하는 것과 달리 프레임 내에서 액티브 데이터를 가지는 블록 단위의 다이나믹 영역을 추출함으로써, 배속된 오디오 데이터가 원본 오디오 데이터의 분포를 유지할 수 있게 한다. 즉, 도 6을 참조하면, 도 6은 원본 오디오 데이터의 분포와 배속된 오디오 데이터의 분포를 나타낸 도면이다. 여기서, 도 6에 도시된 배속된 오디오 데이터는 상술한 방법을 통해 산출한 데이터이다. 도 6에 도시된 바와 같이, 배속된 오디오 데이터는 원본 오디오 데이터의 분포를 유지할 수 있다.

도 7은 오디오 재생속도 제어 장치의 구성을 개략적으로 예시한 블록도이다.

도 7을 참조하면, 오디오 재생속도 제어 장치(70)는 분할부(71), 산출부(72), 추출부(73), 보정부(74) 및 저장부(75)를 포함한다.

분할부(71)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한다. 여기서, N 사이즈는 원본 오디오 데이터의 사이즈보다 작게 설정되고, n 사이즈는 N 사이즈보다 작게 설정될 수 있다. 예를 들어, 프레임 사이즈 N=1024이고, 블록 사이즈 n=128이라고 가정하면, 각 프레임 당 블록 수는 8개가 될 수 있다.

산출부(72)는 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출한다.

추출부(73)는 프레임 내의 블록 중에서 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하여 다이나믹 영역을 구성한다.

추출부(73)는 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 액티브 데이터가 존재하는지 여부를 판단하여 존재하는 경우 해당 블록을 다이나믹 블록으로 추출한다. 추출부(73)는 앞서 상술한 수학식 1을 이용하여 블록 내의 각 오디오 데이터에 대하여 액티브 데이터 여부를 판정할 수 있다. 즉, 추출부(73)는 블록 내의 오디오 데이터와 프레임의 평균(m)의 차이와 프레임의 표준편차(σ)를 비교하여 액티브 데이터 여부를 판정할 수 있다. 이에 대해서는 도 3에서 상술하였으므로 상세한 설명은 생략한다.

보정부(74)는 추출된 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행한다. 즉, 보정부(74)는 추출된 블록의 개수를 이용하여 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 다이나믹 영역의 재생속도의 차이만큼 보정을 수행할 수 있다. 예를 들어, 보정부(74)는 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 도 5에 도시된 바와 같이 추출된 블록에 이웃 블록을 연결하여 보간함으로써, 다이나믹 영역의 재생속도를 감소시키는 보정을 수행할 수 있다.

또한, 보정부(74)는 재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행한다.

저장부(75)는 원본 오디오 데이터 및 오디오의 재생속도 제어를 통해 산출되는 오디오 데이터를 저장한다. 예를 들어, 저장부(75)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한 오디오 데이터를 저장할 수 있다. 또한, 저장부(75)는 추출된 블록을 포함하는 다이나믹 영역을 저장할 수 있다. 또한, 저장부(75)는 재생속도가 보정된 다이나믹 영영을 저장할 수 있다.

한편, 본 발명의 실시예에 따른 오디오 재생속도 제어 방법은 다양한 전자적으로 정보를 처리하는 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 저장 매체에 기록될 수 있다. 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조등을 단독으로 또는 조합하여 포함할 수 있다.

저장 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 저장 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 또한 상술한 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치, 예를 들어, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims

원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부;
상기 분할된 각 프레임에 대하여 프레임 내의 오디오 데이터의 평균(m) 및 표준편차(σ)를 산출하는 산출부; 및
상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함하되,
상기 추출부는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정하는 것을 특징으로 하는 오디오 재생속도 제어 장치.

여기서, x_k는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, m_i는 i번째 프레임의 평균이고, σ_i는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
삭제
제1항에 있어서,
상기 기준점변수(α)의 설정값에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절되는 것을 특징으로 하는 오디오 재생속도 제어 장치.
제1항에 있어서,
상기 추출부는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출하는 것을 특징으로 오디오 재생속도 제어 장치.
제1항에 있어서,
상기 다이나믹 블록과 이웃 블록을 보간(interpolation)하여 재생속도에 대한 보정을 수행하는 보정부를 더 포함하는 오디오 재생속도 제어 장치.
제5항에 있어서,
상기 보정부는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 상기 다이나믹 영역의 재생속도의 차이만큼 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
제6항에 있어서,
상기 보정부는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간(interpolation)함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
제5항에 있어서,
상기 보정부는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
오디오 재생속도 제어 장치가 오디오의 재생속도를 제어하는 방법에 있어서,
원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 단계;
상기 분할된 각 프레임에 대하여 프레임 내의 오디오 데이터의 평균(m) 및 표준편차(σ)를 산출하는 단계;
상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브 데이터 여부를 판정하는 단계;
상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계; 및
상기 다이나믹 블록을 포함하는 다이나믹 영역을 구성하는 단계를 포함하되,
상기 액티브 데이터 여부를 판정하는 단계는
하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정하는 것을 특징으로 하는 오디오 재생속도 제어 방법.

여기서, x_k는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, m_i는 i번째 프레임의 평균이고, σ_i는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
삭제
제9항에 있어서,
상기 기준점변수(α)의 설정값에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절되는 것을 특징으로 하는 오디오 재생속도 제어 방법.
제9항에 있어서,
상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계는
상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출하는 것을 특징으로 오디오 재생속도 제어 방법.
제9항에 있어서,
상기 다이나믹 블록과 이웃 블록을 보간(interpolation)하여 재생속도에 대한 보정을 수행하는 단계를 더 포함하는 오디오 재생속도 제어 방법.
제13항에 있어서,
상기 재생속도에 대한 보정을 수행하는 단계는
상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하는 단계; 및
상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
제14항에 있어서,
상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계는
상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
제13항에 있어서,
상기 재생속도에 대한 보정을 수행하는 단계는
재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
제9항, 제11항 내지 제16항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.