KR101091992B1 - 오디오 재생속도 제어 장치 및 방법 - Google Patents

오디오 재생속도 제어 장치 및 방법 Download PDF

Info

Publication number
KR101091992B1
KR101091992B1 KR1020110010258A KR20110010258A KR101091992B1 KR 101091992 B1 KR101091992 B1 KR 101091992B1 KR 1020110010258 A KR1020110010258 A KR 1020110010258A KR 20110010258 A KR20110010258 A KR 20110010258A KR 101091992 B1 KR101091992 B1 KR 101091992B1
Authority
KR
South Korea
Prior art keywords
block
dynamic
frame
audio
audio data
Prior art date
Application number
KR1020110010258A
Other languages
English (en)
Inventor
전준현
유덕현
김동혁
Original Assignee
동국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 산학협력단 filed Critical 동국대학교 산학협력단
Priority to KR1020110010258A priority Critical patent/KR101091992B1/ko
Application granted granted Critical
Publication of KR101091992B1 publication Critical patent/KR101091992B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10046Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
    • G11B20/10203Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter baseline correction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/22Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

오디오 재생속도 제어 장치 및 방법이 개시된다. 오디오 재생속도 제어 장치는 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부, 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 산출부 및 평균(m) 및 표준편차(σ)를 이용하여 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 프레임 내의 블록 중에서 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함한다.

Description

오디오 재생속도 제어 장치 및 방법{Apparatus and Method for controlling play back speed of audio}
본 발명은 오디오 재생속도 제어 장치 및 방법에 관한 것이다.
오디오의 재생속도(Play Back Speed)를 제어하는 방법은 1985년 미국의 Salim Roucos가 SOLA(Synchronized OverLap Add) 알고리즘을 제안하면서 발전하였다. SOLA 방식은 감속과 배속에 따라 음성 신호를 확장(Expand)하거나 축소(Compress)하는 방식이다. 타임 스케일(Time Scale)의 확장은 녹음된 음성 신호의 발성화자가 그 음성을 실제로 느리게 발성하는 것과 동일한 효과를 가지며, 반대로 타임 스케일의 축소는 음성을 빠르게 발성하는 것과 동일한 효과를 가진다.
하지만, 이와 같은 SOLA 방식은 오디오 재생속도의 증가 및 감소에 따른 오디오 주파수 스펙트럼에 심각한 왜곡을 발생시켜 재생되는 오디오 신호의 음색 변질과 명료도 저하 등의 심각한 음질 손상의 문제점이 있다. 예를 들어, 재생속도를 높일 경우(배속), 오디오 주파수 스펙트럼 간의 중첩 현상(aliasing effect)이 발생하며, 이로 인한 고주파 성분의 중첩 왜곡으로 정확한 발음의 구분이 어려울 뿐만 아니라 음색이 모기 소리와 같이 고음으로 변하여 귀에 거슬리는 문제점이 있다.
본 발명은 오디오의 재생속도 배속시 고주파 성분의 중첩 왜곡을 감소시키기 위하여 원본 오디오 데이터에서 액티브(active) 데이터를 가지는 다이나믹(dynamic) 영역을 추출하여 배속을 제어하는 것이다.
본 발명의 일 측면에 따르면, 오디오의 재생속도를 제어하는 오디오 재생속도 제어 장치가 개시된다.
본 발명의 실시예에 따른 오디오 재생속도 제어 장치는 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부, 상기 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 산출부 및 상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함한다.
상기 추출부는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정한다.
Figure 112011008224169-pat00001
여기서, xk는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, mi는 i번째 프레임의 평균이고, σi는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
상기 기준점변수에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절된다.
상기 추출부는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출한다.
상기 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행하는 보정부를 더 포함한다.
상기 보정부는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 상기 다이나믹 영역의 재생속도의 차이만큼 보정을 수행한다.
상기 보정부는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간(interpolation)함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행한다.
상기 보정부는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행한다.
본 발명의 다른 측면에 따르면, 오디오 재생속도 제어 장치가 오디오의 재생속도를 제어하는 방법이 개시된다.
본 발명의 실시예에 따른 오디오 재생속도 제어 방법은 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 단계, 상기 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출하는 단계, 상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브 데이터 여부를 판정하는 단계, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계 및 상기 다이나믹 블록을 포함하는 다이나믹 영역을 구성하는 단계를 포함한다.
상기 액티브 데이터 여부를 판정하는 단계는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정한다.
Figure 112011008224169-pat00002
여기서, xk는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, mi는 i번째 프레임의 평균이고, σi는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
상기 기준점변수에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절된다.
상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출한다.
상기 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행하는 단계를 더 포함한다.
상기 재생속도에 대한 보정을 수행하는 단계는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하는 단계 및 상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계를 포함한다.
상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행한다.
상기 재생속도에 대한 보정을 수행하는 단계는 재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행하는 단계를 포함한다.
본 발명의 다른 측면에 따르면, 오디오 재생속도 제어 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체가 개시된다.
본 발명은 오디오의 재생속도 배속시 고주파 성분의 중첩 왜곡을 감소시키기 위하여 원본 오디오 데이터에서 액티브 데이터를 가지는 다이나믹 영역을 추출하여 배속을 제어할 수 있다.
또한, 본 발명은 오디오의 재생속도 배속시 음색의 변화를 방지하여 배속된 오디오가 원본 오디오와 같은 음색을 유지하게 할 수 있다.
도 1은 오디오 재생속도 제어 방법을 나타낸 흐름도.
도 2는 S300 단계의 세부 흐름도.
도 3은 S400 단계의 세부 흐름도.
도 4는 S500 단계의 세부 흐름도.
도 5는 추출된 블록에 대한 보간(interpolation)을 나타낸 도면.
도 6은 원본 오디오 데이터의 분포와 배속된 오디오 데이터의 분포를 나타낸 도면.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면 번호에 상관없이 동일한 수단에 대해서는 동일한 참조 번호를 사용하기로 한다.
도 1은 오디오 재생속도 제어 방법을 나타낸 흐름도이다. 오디오 재생속도 제어는 오디오의 재생속도 제어 기능을 구비한 오디오 시스템에 의하여 수행될 수 있으며, 오디오 시스템은 오디오 재생속도 제어 장치(70)를 포함할 수 있다. 이하에서는, 이해와 설명의 편의를 위하여 오디오 재생속도 제어 방법이 오디오 재생속도 제어 장치(70)에 의하여 수행되는 것으로 가정하여 설명한다.
S100 단계에서, 오디오 재생속도 제어 장치(70)는 오디오 배속에 대한 명령 및 파라미터 정보를 입력받아 오디오 재생속도 제어에 필요한 파라미터(parameter)를 결정하고 초기화한다. 여기서, 파라미터는 재생속도, 프레임 사이즈(N: 양의 정수), 블록 사이즈(n: 양의 정수), 최소액티브데이터개수(#_Active_Sample), 기준점변수(α)를 포함한다.
S200 단계에서, 오디오 재생속도 제어 장치(70)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한다. 여기서, N 사이즈는 원본 오디오 데이터의 사이즈보다 작게 설정되고, n 사이즈는 N 사이즈보다 작게 설정될 수 있다. 예를 들어, 프레임 사이즈 N=1024이고, 블록 사이즈 n=128이라고 가정하면, 각 프레임 당 블록 수는 8개가 될 수 있다.
S300 단계에서, 오디오 재생속도 제어 장치(70)는 복수의 프레임에서 i번째 프레임을 처리한다.
도 2는 S300 단계의 세부 흐름도이다.
S310 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임 처리를 위한 파라미터를 초기화한다. 여기서, 파라미터는 다이다믹블록개수(#_dynamic_block), 블록순번(j) 등이 될 수 있다.
S320 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임의 평균(mi) 및 표준편차(σi)를 산출한다.
S330 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임에서 j번째 블록을 추출한다.
다시, 도 1을 참조하면, S400 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임에 포함된 복수의 블록 중에서 다이나믹 블록을 추출한다.
도 3은 S400 단계의 세부 흐름도이다.
S410 단계에서, 오디오 재생속도 제어 장치(70)는 카운터를 초기화한다(count=0). 여기서, 카운터는 블록 내에 연속적으로 존재하는 액티브 데이터의 개수를 카운팅하기 위한 파라미터이다.
S420 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터(xk)가 액티브 데이터인지 여부를 판단한다. 즉, 도 3에 도시된 바와 같이 하기의 수학식 1을 이용하여 k번째 오디오 데이터(xk)의 액티브 데이터 여부를 판단할 수 있다. 즉, 오디오 재생속도 제어 장치(70)는 수학식 1을 만족하는 블록 내의 오디오 데이터를 액티브 데이터로 판정할 수 있다.
[수학식 1]
Figure 112011008224169-pat00003
여기서, xk는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, mi는 i번째 프레임의 평균이고, σi는 i번째 프레임의 표준편차이다. α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수이다. 판정기준점은 오디오 데이터의 특성이나 배속의 정도에 따라 설정될 수 있으며, 예를 들면, 2배속인 경우 2σ가 될 수 있다. 즉, α값에 따라 추출되는 오디오 데이터 양(블록 수)이 조절되며, 이에 따라 재생속도(배속)가 조절될 수 있다.
만약, k번째 오디오 데이터(xk)가 액티브 데이터가 아닌 경우, S410 단계로 진입한다. 즉, 오디오 재생속도 제어 장치(70)는 카운터를 초기화하여 j번째 블록 내의 액티브 데이터의 연속성을 확인한다.
S430 단계에서, 오디오 재생속도 제어 장치(70)는 k번째 오디오 데이터(xk)가 액티브 데이터인 경우, 카운팅을 한다(count=count+1).
S440 단계에서, 오디오 재생속도 제어 장치(70)는 카운터값이 최소액티브데이터개수(#_Active_Sample)를 초과하는지 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 j번째 블록 내에 액티브 데이터가 연속적으로 최소액티브데이터개수를 초과하게 존재하는지 여부를 판단한다.
S450 단계에서, 오디오 재생속도 제어 장치(70)는 카운터값이 최소액티브데이터개수를 초과하지 않는 경우, j번째 블록 처리의 완료 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 현재 k번째 오디오 데이터(xk)가 j번째 블록의 마지막 데이터인지 여부를 판단한다.
만약, k번째 오디오 데이터(xk)가 j번째 블록의 마지막 데이터가 아닌 경우, S420 단계로 진입한다. 이때, S420 단계에서, 오디오 재생속도 제어 장치(70)는 k를 1만큼 증가시켜 다음 오디오 데이터에 대하여 액티브 데이터 여부를 판단할 수 있다.
또한, 오디오 재생속도 제어 장치(70)는 블록 처리가 완료된 경우, S480 단계로 진입하여 다음 블록을 처리하거나 다음 프레임을 처리할 수 있다.
S440 단계에서의 판단 결과, 카운터값이 최소액티브데이터개수를 초과하는 경우, S460 단계에서, 오디오 재생속도 제어 장치(70)는 다이다믹블록개수를 카운팅한다(#_dynamic_block=#_dynamic_block+1). 오디오 재생속도 제어 장치(70)는 다이다믹블록개수의 카운팅을 통해 추출된 오디오 데이터양(즉, 블록 수)을 확인하고 이를 통해 재생속도를 인식할 수 있다.
S470 단계에서, 오디오 재생속도 제어 장치(70)는 j번째 블록을 다이나믹 블록으로 추출하여 저장한다.
S480 단계에서, 오디오 재생속도 제어 장치(70)는 i번째 프레임 처리의 완료 여부를 판단한다. 즉, 오디오 재생속도 제어 장치(70)는 현재 j번째 블록이 i번째 프레임의 마지막 블록인지 여부를 판단한다.
만약, j번째 블록이 i번째 프레임의 마지막 블록인 경우, S500 단계로 진입한다.
S490 단계에서, 오디오 재생속도 제어 장치(70)는 j번째 블록이 i번째 프레임의 마지막 블록이 아닌 경우, 블록순번(j)을 1씩 증가시킨다(j=j+1). 이것은 다음 블록을 처리하기 위한 것이다.
다시, 도 1을 참조하면, S500 단계에서, 오디오 재생속도 제어 장치(70)는 추출된 다이나믹 영역의 재생속도 보정을 위한 보간(interpolation)을 수행한다. 여기서, 다이나믹 영역은 S400 단계에서 추출된 다이나믹 블록으로 구성된다.
도 4는 S500 단계의 세부 흐름도이다.
S510 단계에서, 오디오 재생속도 제어 장치(70)는 추출된 블록의 개수를 이용하여 다이나믹 영역의 재생속도를 확인한다. 즉, 오디오 재생속도 제어 장치(70)는 설정된 재생속도와 다이나믹 영역의 재생속도의 차이를 확인할 수 있다.
S520 단계에서, 오디오 재생속도 제어 장치(70)는 액티브 데이터를 가지는 추출된 블록의 이웃 블록을 이용하여 재생속도를 보정한다. 예를 들어, 도 5를 참조하면, 도 5는 추출된 블록에 대한 보간(interpolation)을 나타낸 도면이다. 오디오 재생속도 제어 장치(70)는 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 도 5에 도시된 바와 같이 추출된 블록에 이웃 블록을 연결하여 보간함으로써 다이나믹 영역의 재생속도를 감소시키는 보정을 수행할 수 있다.
S530 단계에서, 오디오 재생속도 제어 장치(70)는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행한다.
이와 같이, 프레임 내의 통계 특성을 이용하여 유효값을 추출하는 방법은 절대적인 크기를 기준으로 데이터가 추출하는 것과 달리 프레임 내에서 액티브 데이터를 가지는 블록 단위의 다이나믹 영역을 추출함으로써, 배속된 오디오 데이터가 원본 오디오 데이터의 분포를 유지할 수 있게 한다. 즉, 도 6을 참조하면, 도 6은 원본 오디오 데이터의 분포와 배속된 오디오 데이터의 분포를 나타낸 도면이다. 여기서, 도 6에 도시된 배속된 오디오 데이터는 상술한 방법을 통해 산출한 데이터이다. 도 6에 도시된 바와 같이, 배속된 오디오 데이터는 원본 오디오 데이터의 분포를 유지할 수 있다.
도 7은 오디오 재생속도 제어 장치의 구성을 개략적으로 예시한 블록도이다.
도 7을 참조하면, 오디오 재생속도 제어 장치(70)는 분할부(71), 산출부(72), 추출부(73), 보정부(74) 및 저장부(75)를 포함한다.
분할부(71)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한다. 여기서, N 사이즈는 원본 오디오 데이터의 사이즈보다 작게 설정되고, n 사이즈는 N 사이즈보다 작게 설정될 수 있다. 예를 들어, 프레임 사이즈 N=1024이고, 블록 사이즈 n=128이라고 가정하면, 각 프레임 당 블록 수는 8개가 될 수 있다.
산출부(72)는 분할된 각 프레임의 평균(m) 및 표준편차(σ)를 산출한다.
추출부(73)는 프레임 내의 블록 중에서 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하여 다이나믹 영역을 구성한다.
추출부(73)는 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 액티브 데이터가 존재하는지 여부를 판단하여 존재하는 경우 해당 블록을 다이나믹 블록으로 추출한다. 추출부(73)는 앞서 상술한 수학식 1을 이용하여 블록 내의 각 오디오 데이터에 대하여 액티브 데이터 여부를 판정할 수 있다. 즉, 추출부(73)는 블록 내의 오디오 데이터와 프레임의 평균(m)의 차이와 프레임의 표준편차(σ)를 비교하여 액티브 데이터 여부를 판정할 수 있다. 이에 대해서는 도 3에서 상술하였으므로 상세한 설명은 생략한다.
보정부(74)는 추출된 다이나믹 블록의 이웃 블록을 이용하여 재생속도에 대한 보정을 수행한다. 즉, 보정부(74)는 추출된 블록의 개수를 이용하여 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 다이나믹 영역의 재생속도의 차이만큼 보정을 수행할 수 있다. 예를 들어, 보정부(74)는 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 도 5에 도시된 바와 같이 추출된 블록에 이웃 블록을 연결하여 보간함으로써, 다이나믹 영역의 재생속도를 감소시키는 보정을 수행할 수 있다.
또한, 보정부(74)는 재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행한다.
저장부(75)는 원본 오디오 데이터 및 오디오의 재생속도 제어를 통해 산출되는 오디오 데이터를 저장한다. 예를 들어, 저장부(75)는 원본 오디오 데이터를 N 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n 사이즈의 블록 단위로 분할한 오디오 데이터를 저장할 수 있다. 또한, 저장부(75)는 추출된 블록을 포함하는 다이나믹 영역을 저장할 수 있다. 또한, 저장부(75)는 재생속도가 보정된 다이나믹 영영을 저장할 수 있다.
한편, 본 발명의 실시예에 따른 오디오 재생속도 제어 방법은 다양한 전자적으로 정보를 처리하는 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 저장 매체에 기록될 수 있다. 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조등을 단독으로 또는 조합하여 포함할 수 있다.
저장 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 저장 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 또한 상술한 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치, 예를 들어, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (17)

  1. 원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 분할부;
    상기 분할된 각 프레임에 대하여 프레임 내의 오디오 데이터의 평균(m) 및 표준편차(σ)를 산출하는 산출부; 및
    상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브(active) 데이터 여부를 판정하고, 상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹(dynamic) 블록으로 추출하여 다이나믹 영역을 구성하는 추출부를 포함하되,
    상기 추출부는 하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
    Figure 112011077782917-pat00013

    여기서, xk는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, mi는 i번째 프레임의 평균이고, σi는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
  2. 삭제
  3. 제1항에 있어서,
    상기 기준점변수(α)의 설정값에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절되는 것을 특징으로 하는 오디오 재생속도 제어 장치.
  4. 제1항에 있어서,
    상기 추출부는 상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출하는 것을 특징으로 오디오 재생속도 제어 장치.
  5. 제1항에 있어서,
    상기 다이나믹 블록과 이웃 블록을 보간(interpolation)하여 재생속도에 대한 보정을 수행하는 보정부를 더 포함하는 오디오 재생속도 제어 장치.
  6. 제5항에 있어서,
    상기 보정부는 상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하고, 설정된 재생속도와 상기 다이나믹 영역의 재생속도의 차이만큼 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
  7. 제6항에 있어서,
    상기 보정부는 상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간(interpolation)함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
  8. 제5항에 있어서,
    상기 보정부는 재생속도 보정 후 노이즈(niose) 제거를 위한 로우 패스 필터링(lowpassfiltering)을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 장치.
  9. 오디오 재생속도 제어 장치가 오디오의 재생속도를 제어하는 방법에 있어서,
    원본 오디오 데이터를 N(양의 정수) 사이즈의 프레임 단위로 분할하고, 분할된 각 프레임을 n(양의 정수) 사이즈의 블록 단위로 분할하는 단계;
    상기 분할된 각 프레임에 대하여 프레임 내의 오디오 데이터의 평균(m) 및 표준편차(σ)를 산출하는 단계;
    상기 평균(m) 및 상기 표준편차(σ)를 이용하여 상기 블록 내의 오디오 데이터에 대하여 액티브 데이터 여부를 판정하는 단계;
    상기 프레임 내의 블록 중에서 상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계; 및
    상기 다이나믹 블록을 포함하는 다이나믹 영역을 구성하는 단계를 포함하되,
    상기 액티브 데이터 여부를 판정하는 단계는
    하기의 수학식을 만족하는 상기 블록 내의 오디오 데이터를 상기 액티브 데이터로 판정하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
    Figure 112011077782917-pat00014

    여기서, xk는 i번째 프레임의 j번째 블록 내의 k번째 오디오 데이터이고, mi는 i번째 프레임의 평균이고, σi는 i번째 프레임의 표준편차이고, α(실수)는 액티브 데이터의 판정기준점을 조절하는 기준점변수임
  10. 삭제
  11. 제9항에 있어서,
    상기 기준점변수(α)의 설정값에 따라 추출되는 블록의 개수가 조절되고, 상기 추출되는 블록의 개수에 따라 재생속도가 조절되는 것을 특징으로 하는 오디오 재생속도 제어 방법.
  12. 제9항에 있어서,
    상기 액티브 데이터를 가지는 블록을 다이나믹 블록으로 추출하는 단계는
    상기 블록 내에 포함된 오디오 데이터 중에서 미리 설정된 개수만큼 연속되게 상기 액티브 데이터가 존재하는 경우, 해당 블록을 상기 다이나믹 블록으로 추출하는 것을 특징으로 오디오 재생속도 제어 방법.
  13. 제9항에 있어서,
    상기 다이나믹 블록과 이웃 블록을 보간(interpolation)하여 재생속도에 대한 보정을 수행하는 단계를 더 포함하는 오디오 재생속도 제어 방법.
  14. 제13항에 있어서,
    상기 재생속도에 대한 보정을 수행하는 단계는
    상기 다이나믹 블록의 개수를 이용하여 상기 다이나믹 영역의 재생속도를 확인하는 단계; 및
    상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
  15. 제14항에 있어서,
    상기 다이나믹 영역의 재생속도와 설정된 재생속도의 차이만큼 보정을 수행하는 단계는
    상기 다이나믹 영역의 재생속도가 설정된 재생속도를 초과한 경우, 상기 다이나믹 블록에 상기 이웃 블록을 연결하여 보간함으로써, 상기 다이나믹 영역의 재생속도를 감소시키는 보정을 수행하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
  16. 제13항에 있어서,
    상기 재생속도에 대한 보정을 수행하는 단계는
    재생속도 보정 후 노이즈 제거를 위한 로우 패스 필터링을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 재생속도 제어 방법.
  17. 제9항, 제11항 내지 제16항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.
KR1020110010258A 2011-02-01 2011-02-01 오디오 재생속도 제어 장치 및 방법 KR101091992B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110010258A KR101091992B1 (ko) 2011-02-01 2011-02-01 오디오 재생속도 제어 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110010258A KR101091992B1 (ko) 2011-02-01 2011-02-01 오디오 재생속도 제어 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101091992B1 true KR101091992B1 (ko) 2011-12-09

Family

ID=45505986

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110010258A KR101091992B1 (ko) 2011-02-01 2011-02-01 오디오 재생속도 제어 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101091992B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107631A1 (ko) * 2017-11-29 2019-06-06 (주) 유윈인포시스 컨텐츠 제작 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101005303B1 (ko) 2010-06-08 2011-01-04 이상권 오디오 데이터의 성격과 어울리는 출력 패턴 자동 생성 방법 및 출력 패턴 자동 생성 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101005303B1 (ko) 2010-06-08 2011-01-04 이상권 오디오 데이터의 성격과 어울리는 출력 패턴 자동 생성 방법 및 출력 패턴 자동 생성 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107631A1 (ko) * 2017-11-29 2019-06-06 (주) 유윈인포시스 컨텐츠 제작 장치 및 방법

Similar Documents

Publication Publication Date Title
JP6927385B2 (ja) 復号化装置および方法、並びにプログラム
KR101227876B1 (ko) 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치
JP6536320B2 (ja) 音声信号処理装置、音声信号処理方法及びプログラム
JP5704397B2 (ja) 符号化装置および方法、並びにプログラム
JP7064489B2 (ja) 非対称なトランスオーラルオーディオ再生のための利得位相等化(gpeq)フィルタおよびチューニング方法
CN114495953A (zh) 用于回避控制的元数据
JP6051505B2 (ja) 音声処理装置および音声処理方法、記録媒体、並びにプログラム
CN111312290B (zh) 音频数据音质检测方法及装置
EP2828849B1 (en) Talker collisions in an auditory scene
US8538565B2 (en) Music playing apparatus, music playing method, recording medium storing music playing program, and integrated circuit that implement gapless play
US20230254655A1 (en) Signal processing apparatus and method, and program
KR101091992B1 (ko) 오디오 재생속도 제어 장치 및 방법
CN101422054A (zh) 声像定位装置
US20230105632A1 (en) Signal processing apparatus and method, and program
EP3724995A1 (en) Occupancy-based automatic correction of room acoustics
US9871497B2 (en) Processing audio signal to produce enhanced audio signal
US10390137B2 (en) Dominant frequency processing of audio signals
US20140214412A1 (en) Apparatus and method for processing voice signal
CN110660409A (zh) 一种扩频的方法及装置
JP7450196B2 (ja) 制御装置、制御方法及びプログラム
WO2023196219A1 (en) Methods, apparatus and systems for user generated content capture and adaptive rendering
CN105869650B (zh) 数字音频数据播放方法及装置
US20240171926A1 (en) Artifact reduction on transitions between audio tracks
CN110493616B (zh) 一种音频信号处理方法、装置、介质和设备
KR102531634B1 (ko) 오디오 장치 및 그 제어방법

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171204

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee