KR100930610B1

KR100930610B1 - 트릭 모드 오디오 재생

Info

Publication number: KR100930610B1
Application number: KR1020047013596A
Authority: KR
Inventors: 로날드 린 블레어; 마크 알랜 슐츠; 로버트 워렌 슈미트
Original assignee: 톰슨 라이센싱
Priority date: 2002-03-01
Filing date: 2003-02-21
Publication date: 2009-12-09
Also published as: EP1481392B1; US7149412B2; JP2005519417A; AU2003213132A1; CN1312664C; TW200307249A; EP1481392A1; PL372219A1; WO2003075262A1; TWI254281B; DE60323059D1; KR20040101256A; MXPA04008424A; CN1675686A; MY176452A; JP4334355B2; US20030165325A1; EP1481392A4

Abstract

본 발명은 1X이외의 속도에서 디지털 오디오 레코딩을 플레이하는 방법에 관한 것이다. 본 발명은 복수의 오디오 프레임으로 표시된, 저장된 디지털 오디오 정보를 검색하는 단계(205)를 포함한다. 복수의 오디오 프레임의 부분은 오디오 프레임의 부분에서의 에너지 컨텐트에 따라 등급이 매겨진다(215). 등급을 매기는 단계에 따른 최소한의 에너지 컨텐트를 갖는 오디오 프레임은 복수의 오디오 프레임의 부분으로부터 삭제된다(230). 삭제 단계 이후의 오디오 프레임 부분 중 남은 부분은 오디오 트릭 모드 재생 신호를 형성하기 위해 선택된다(235).

Description

트릭 모드 오디오 재생{TRICK MODE AUDIO PLAYBACK}

본 발명은 개선된 트릭모드 재생에 관한 것으로, 좀더 상세하게는 정상 속도가 아닌 속도에서의 디지털 오디오 컨텐트의 트릭 모드 재생을 개선하는 분야에 관한 것이다.

DVD로부터의 트릭모드 재생은 디스크 상에서 특정한 위치를 찾거나 정상 속도 재생에서 손실된 클립의 상세사항을 조사하기 위한 정상 재생 속도로부터의 증속 또는 감속을 포함할 수 있다. 종래에, 정상 재생 속도는 1X로서 표기될 수 있다. 오디오 및 비디오 트릭 모드 둘 모두가 가능하며, 이들 둘 모두는 상업적으로 이용 가능한 DVD 플레이어 상에서 볼 수 있다. 그러나, 고속 또는 저속에서의 오디오 재생을 위한 종래의 방법은 문제가 있는 것으로 판명되었다. 현재 이용 가능한 제품에서 사용된 디지털 신호 프로세서 및 특히 오디오 디지털 신호 프로세서의 진전은 개선된 오디오 트릭 모드를 위해 좀더 정교한 실시간 처리를 할 가능성을 생성하였다.

비디오 트릭 모드 사용의 한 가지 문제는 재생 비디오 세그먼트에 대응하는 오디오의 처리에 관한 것이다. 예컨대, 사용자가 디스플레이된 비디오 세그먼트를 증속 또는 감속할 때, 재생되는 대응하는 오디오 세그먼트는 왜곡될 수 있다. 전형 적으로, 오디오 세그먼트 내의 오디오 샘플은 고속 트릭모드 동안 더 높은 주파수로 이동될 수 있고, 저속 트릭 모드 동안에 더 낮은 주파수로 이동될 수 있다. 정상 재생에 비교할 때 대략 1.5 내지 3배사이에 있는 인자만큼 재생 속도를 증가시키는 고속 트릭 모드는 사람의 말이 더 높은 피치에서 들리게 하는 경향이 있다. 이 더 높은 피치의 오디오 재생, 즉 칩멍크 효과(chipmunk effect)는 성가신 것이며, 많은 경우에 청취자가 이해할 수 없는 것이다. 이에 반해, 저속 주파수 트릭 모드는 이해할 수는 있지만 듣기에 즐겁지는 않은 낮은 주파수 워블을 발생시킬 수 있다.

본 명세서에서 설명되는 바와 같이 비디오 트릭 모드 동안에 가장 유용한 오디오 재생을 얻기 위해, 특정한 트릭 모드의 속성을 또한 고려해야 한다. 예컨대, 1.5X와 같은 특정한 트릭 모드 속도에 대해 이해할 수 있는 오디오를 제공하는 여러 기술을 사용할 수 있는 반면, 이러한 기술은 예컨대 6X 또는 10X와 같은 훨씬 더 높은 트릭 모드 속도에서 만족스럽지 못한 결과를 제공할 수 있다. 이러한 높은 재생 속도에서, 오디오 컨텐트를 비디오 프로그래밍과 동기적으로 플레이시키거나 또는 적어도 이러한 비디오 프로그래밍의 속도에 대응하는 속도로 플레이시키고자 하는 임의의 시도는 결국 그 단어들이 전달될 필요가 있는 빠른 속도로 인해 이해할 수 없는 말을 초래할 수 있다.

트릭 모드 재생 동안에 발생될 수 있는 여러 유형의 오디오 아티팩트(artifact)를 듣는 것을 피하기 위해, 종래의 DVD 플레이어는 종종 비디오 트릭 모드 동안에 오디오를 묵음화할 것이다. 그러나, 이것은 오디오가 이러한 모 드에서 중요할 수 있으므로 아주 만족스러운 해법은 아니다. 따라서, 이것은 만약 DVD 플레이어가 종래기술의 한계를 극복하는 방법으로 오디오를 재생할 수 있고, 비디오 트릭 모드 동안에 유익하고 듣기에 즐거운 오디오 재생을 달성하는 경우에 유리할 것이다.

본 발명은 1X이외의 트릭 모드 재생 속도에서 비디오 프리젠테이션에 대한 오디오 컨텐트를 플레이시키는 방법에 관한 것이다. 본 방법은 하드디스크 또는 DVD와 같은 저장 매체로부터, 비디오 프리젠테이션의 적어도 비디오 부분 및 이에 대응하는 오디오 부분을 생성하기 위한 정보를 검색하는 단계를 포함할 수 있다. 비디오 프리젠테이션의 오디오 부분은 오디오 정보를 표시하는 복수의 오디오 프레임을 포함할 수 있다. 비디오 프리젠테이션에 대한 오디오 프레임 각각 또는 그 일부분은 그 오디오 에너지 컨텐트에 따라 등급이 매겨질 수 있다. 오디오 트릭 모드 재생 신호가 비디오 프리젠테이션에 대해 생성될 수 있고, 그 에너지 컨텐트에 따라 등급이 매겨졌던 오디오 프레임 부분 중 선택된 부분을 포함한다. 필요한 트릭 모드 재생 속도는 트릭 모드 재생을 위해 선택될 등급이 매겨진 프레임의 양을 결정하는데 사용될 수 있다.

오디오 프레임 각각의 에너지 컨텐트를 계산한 후, 오디오 프레임 부분은 선택된 비디오 트릭 모드 재생 속도를 기초로 해서 선택적으로 제거될 수 있다. 선택적으로 제거될 오디오 프레임 부분은 백분율 또는 분수를 기초로 할 수 있다. 예컨대, 3X인 트릭 모드 속도에서, 오디오 프레임의 대략 2/3 즉, 66%가 제거되어야 한 다. 제거의 기준은 예컨대 매 제 3 오디오 프레임만을 유지하는 것과 같이 선택된 트릭 모드 속도로부터 유도된 직접적인 선형 산술 관계를 사용하기보다는 각 오디오 프레임의 계산된 평균 에너지 컨텐트를 기초로 할 수 있다. 특히, 최소한의 에너지양을 갖는 이들 프레임은 먼저 충분한 프레임이 필요한 트릭 모드 속도를 수용하도록 남겨질 때까지 제거될 수 있다. 일반적으로, 필요한 트릭 모드 속도가 더 높아질수록, 제거되어야 할 프레임 수가 더 많아진다. 프레임을 제거한 후, 남은 오디오 프레임은 선택된 비디오 트릭 모드의 비디오 프로그래밍과 시간적으로 상응하는 재생을 위해 오디오 신호를 생성하도록 연결될 수 있다(concatenated).

적어도 하나의 오디오 프레임에 대한 전압을 표시하는 순시값의 절대크기들의 합은 오디오 프레임의 적어도 일부분에 대한 에너지 컨텐트를 결정하거나 표시하기 위한 지시자로서 사용될 수 있다. 유사하게, 적어도 하나의 오디오 프레임에 대한 주파수 범위 내에서 주파수 빈(bin)의 값들의 크기들의 합이 오디오 프레임의 적어도 일부분에 대한 에너지 컨텐트를 계산하는데 사용될 수 있다.

본 발명은 1X보다 더 빠른 속도에서의 비디오 트릭 모드 재생 동안에 오디오/비디오 프리젠테이션의 오디오 부분을 플레이시키기 위한 장치를 또한 제공할 수 있다. 이 장치는 저장 매체로부터, 비디오 프리젠테이션의 적어도 비디오 부분 및 이에 대응하는 오디오 부분을 발생시키기 위한 정보를 검색하기 위한 저장 매체 판독기를 포함할 수 있다. 비디오 프리젠테이션의 오디오 부분은 오디오 정보를 갖고 있는 복수의 오디오 프레임을 포함할 수 있다. 오디오 프로세서는 그 에너지 컨텐트에 따라 비디오 프리젠테이션을 위한 복수의 오디오 프레임의 적어도 일 부분의 등급을 매기도록 구성될 수 있다. 오디오 프로세서는 비디오 프리젠테이션을 위한 오디오 트릭 모드 재생 신호를 생성하도록 구성될 수 있으며, 이러한 오디오 트릭 모드 재생 신호는 그 등급을 기초로 해서 오디오 프레임의 부분 중 선택된 부분을 포함할 수 있다.

처리 수단은 오디오 프레임의 적어도 일부분의 오디오 에너지 컨텐트를 계산하도록 구성될 수 있다. 처리 수단은 비디오 프리젠테이션의 오디오 부분으로부터, 선택된 비디오 트릭 모드 재생 속도를 기초로 하여 오디오 프레임의 부분의 백분율 또는 분수부분을 선택적으로 제거할 수 있다. 처리 수단은 등급별로 최소한의 에너지 컨텐트양을 갖는 오디오 프레임의 백분율 부분을 제거하도록 더 구성될 수 있다. 최소한의 에너지양을 갖는 오디오 프레임을 제거한 후, 처리 수단은 필요한 트릭 모드 재생 신호를 생성하기 위해 남은 오디오 프레임을 연결할 수 있다.

처리 수단은, 오디오 프레임의 적어도 일부분에 대한 에너지 컨텐트를 계산하는데 사용될 수 있는 적어도 하나의 프레임에 대한 전압을 표시하는 순시값의 절대 크기들의 합을 계산하도록 구성될 수 있다. 유사하게, 처리 수단은 선택된 빈, 즉 적어도 하나의 프레임에 대한 주파수 범위 내의 특정한 주파수 빈에서 신호의 크기의 상한 또는 하한 프레임이 아니라 오디오 프레임의 적어도 일부분에 대한 에너지 컨텐트를 계산하는데 사용될 수 있는 선택된 빈의 평균을 생성하기 위한 합을 계산하도록 구성될 수 있다.

리플레이 오디오 속도를 증가시키기 위한 본 발명의 장치는 유리하게는 예컨대 하드디스크나 고체 메모리를 사용하며 MP3와 같은 인코딩을 구비한 디지털 오디 오 재생 소스에서 사용될 수 있다. 디지털 오디오 재생 디바이스는 원래의 1X 레코딩된 속도보다 더 높은 속도에서의 오디오 신호 재생을 촉진하기 위해 본 명세서에서 개시된 본 발명의 장치로부터 도움을 얻을 수 있다.

도 1은 본 발명의 장치에 따른 하나 이상의 개선된 동작 기능이 제공될 수 있는 DVD 디바이스의 블록도.

도 2는 도 1의 DVD 디바이스와 같은 예시적인 미디어 플레이어에서 구현되는 것으로 본 발명의 장치를 이해하는데 유용한 흐름도.

도 3a는 본 발명에 따른 그 에너지 컨텐트에 대한 상대 값이 각각 할당된 예시적인 오디오 프레임을 도시한 도면.

도 3b는 본 발명에 따른 삭제 가능성이 표기된 예시적인 오디오 프레임을 도시한 도면.

도 3c는 본 발명의 따른 삭제 가능성이 표기된 프레임 그룹에 할당된 예시적인 가중치를 도시한 도면.

도 3d는 본 발명에 따른 삭제 가능성이 표기된 프레임 삭제를 도시한 도면.

도 3e는 본 발명에 따라 프레임이 삭제된 후 남은 프레임의 연결을 도시한 도면.

본 발명은 임의의 적절한 저장 매체 상에 레코딩된 임의의 유형의 디지털 비디오에서 1X보다 더 큰 속도에서 비디오 트릭 모드 동안 오디오 재생을 수행하는데 사용될 수 있다. 편의상, 본 발명은 종래의 MPEG-1 또는 MPEG-2 포맷을 사용하는 DVD 매체 환경에서 기술된다. 그러나, 당업자는 본 발명이 이러한 관점으로 제한되지 않는 것을 이해할 것이다. 데이터 저장 매체는 후속하는 시간에 검색 및 재생하기 위해 상당한 양의 오디오 및 비디오 데이터를 저장할 수 있는 임의의 매체를 포함할 수 있다. 본 명세서에서 사용된 바와 같이, 저장 매체는 데이터 저장을 위한 광, 자기, 및 전자 수단을 포함할 수 있지만, 이것으로 제한되지 않는다. 예시적인 디지털 저장 매체는 광 디지털 다용도 디스크(DVD), 자기 하드디스크, 자기-광학 디스크, 비디오 CD 또는 표준 CD, 또는 다이내믹 랜덤 액세스 메모리(DRAM), 동기 DRAM(SDRAM) 또는 다른 RAM 기반 메모리와 같은 고체 메모리를 포함할 수 있다. 나아가, 비록 본 명세서에서 개시된 본 발명의 장치가 트릭 모드 비디오 재생에 대한 오디오 부속물 환경에서 기술되지만, 이들 유리한 장치는 원래의 1X 레코딩 속도보다 더 높은 속도에서 디지털 방식으로 레코딩된 오디오 신호의 재생에도 동일하게 응용될 수 있다.

도 1은 본 발명이 구현될 수 있는 예시적인 DVD 비디오 플레이어의 블록도이다. 디바이스(100)는 디지털 저장 매체로부터 저장된 데이터를 판독하는 성능을 가질 수 있다. 도 1을 참조하면, 저장 매체는 예컨대 재기록 가능한 DVD와 같은 디스크 매체(102)일 수 있다. 디바이스(100)는 기계 조립부(104), 제어부(120), 오디오/비디오(A/V) 출력 처리부(170)를 포함할 수 있다. 서로 다른 부분에 대한 대부분의 블록의 할당은 자명한 반면, 일부 블록의 할당은 편의상 이뤄진 것이며, 디바이스(100)의 동작을 이해하는데 중요하지 않다. 중요하게, 만약 데이터 저장 매체가 고체 디바이스라면, 기계 조립부(104)는 본 발명을 실행하는데 필요하지 않음을 인식해야 한다. 이 경우, 저장 매체에 저장된 코딩된 디지털 데이터는 제어 CPU(122)에 의해 직접 액세스될 수 있고, 트랙 버퍼(172)에서 버퍼링될 수 있다.

그럼에도 불구하고, 기계적 조립부(104)는 디스크(102)를 회전시키기 위한 모터(106)와, 회전하는 디스크(102) 위에서 움직이도록 적응된 픽업 조립부(108)를 포함할 수 있다. 픽업 조립부(108) 상에 탑재되거나, 이러한 조립부(108)와 관련된 레이저는 비디오 및/또는 오디오 프로그램 데이터를 재생하기 위해 디스크 트랙 상에 이미 저장된 데이터에 조명될 수 있다. 본 발명을 이해하기 위해, 디스크가 레코딩 가능한지의 여부는 상관없다. 픽업 조립부(108)와 모터(106)와 관련된 레이저는 서보(110)에 의해 제어될 수 있다. 서보(110)는 또한 디스크(102) 상의 나선형 트랙으로부터 판독된 데이터를 나타내는 입력 재생 신호를 수신하도록 구성될 수 있다. 재생 신호는 또한 에러 정정 회로(130)에 대한 입력 역할을 할 수 있고, 이러한 회로(130)는 제어부(120)의 일부 또는 A/V 출력 처리부(170)의 일부인 것으로 고려될 수 있다.

제어부(120)는 제어 CPU(122)를 포함할 수 있다. 서보(110)는 또한 제어부(120)의 일부인 것으로 고려될 수 있다. 적절한 소프트웨어 또는 펌웨어는 제어 CPU(122)에 의해 수행된 종래의 동작을 위해 메모리에 제공될 수 있다. 게다가, 본 명세서에서 기술된 개선된 특성을 위한 프로그램 루틴이 제어 CPU(122)를 위해 제공될 수 있다.

시청자가 활성 가능한 기능을 위한 제어 버퍼(132)는 현재 이용 가능한 예시 적인 기능, 즉 플레이, 역재생, 고속 전진, 저속 플레이, 일시정지/플레이 및 정지를 지시하도록 구성될 수 있다. 일시정지 기능은 대부분의 비디오카세트 레코더(VCR) 상에서 전형적으로 볼 수 있는 일시정지 동작과 유사하다. 일시정지 기능은 광고나 예고편과 같은 원치 않은 세그먼트를 제거하기 위해 사전에 레코딩된 프리젠테이션의 재생을 수동으로 중단시키는 성능을 가질 수 있다. 개선된 특성 버퍼(136)는 본 명세서에서 기술된 트릭 모드 제어를 포함하는 다른 개선된 재생 기능을 구현하기 이해 제공될 수 있다. 재생 트릭 모드는 표준 1X 재생 속도가 아닌 속도에서의 고속 재생 및 역재생을 포함할 수 있다.

출력 처리부(170)는 에러 정정 블록(130)과 트랙 버퍼 또는 출력 버퍼(172)를 포함할 수 있고, 이 버퍼(172)에서 디스크로부터 판독된 데이터가 버퍼링될 수 있고, 추가 처리를 위해 패킷들로 조립될 수 있다. 패킷은 디멀티플렉서(176)를 통과하여 비디오 및 오디오 처리를 위한 각 경로 내로의 패킷의 전파를 제어하는 조건적 액세스 회로(174)에 의해 처리될 수 있다. 비디오는 예컨대 MPEG-1 또는 MPEG-2 포맷으로부터와 같은 디코더(178)에 의해 디코딩될 수 있고, 인코더(180)에 의해 ATSC, NTSC, SECAM 또는 PAL과 같은 표준화된 텔레비전 신호 포맷으로 인코딩될 수 있다. 오디오는 예컨대 MPEG-1 또는 MPEG-2 또는 MP3 포맷으로부터 디코더(182)에 의해 디코딩될 수 있고, 오디오 디지털/아날로그(D/A) 컨버터(184)에 의해 아날로그 형태로 변환될 수 있다. 오디오 D/A(184)는 오디오 디코더(182)로부터 수신된 디지털 오디오를 처리하고, 아날로그 출력 신호를 생성할 수 있다.

오디오 디코더(182)는 바람직하게는 디코딩하기 이전에 오디오 데이터를 일 시적으로 저장하기 위한 버퍼를 포함한다. 오디오 디코더(182)의 동작은 버스(181)를 통해서 제어 CPU(122)와 같은 프로세서에 의해 제어될 수 있다. 오디오 디코더(182)로부터의 디지털 오디오는 오디오 D/A(184)와 같은 적절한 디지털/아날로그 변환 디바이스에 의해 아날로그 형태로 변환될 수 있다.

나아가, 디지털 오디오 프레임 당 에너지 컨텐트의 결정과, 이후 기술될 바와 같이 원하는 트릭 모드 재생 속도에 대응하는 오디오 신호를 생성하기 위한 오디오 프레임의 후속한 선택 및 제거는 또한 제어 CPU(122)에 의해 수행될 수 있다. 오디오 디코더(182)와 오디오 D/A(184) 사이의 통신은 시스템 버스(181)와 같은 적절한 시스템 통신 링크에 의해 제공될 수 있다. 시스템 버스(181)는 또한 오디오 디코더(182)와, 오디오 D/A(184)의 여러 동작 파라미터를 제어하는데 사용될 수 있다. 제어 CPU(122)와는 독립적인 마이크로제어기 또는 마이크로프로세서가 또한 프레임 당 에너지 컨텐트를 결정하고, 트릭 모드 재생 오디오 신호를 생성하기 위해 특정한 프레임을 선택하고 제거하도록 구성될 수 있다. 이러한 장치에서, 마이크로제어기나 마이크로프로세서는 버스(181)에 연결될 수 있고, 오디오 디코더(182)로부터 오디오 프레임 컨텐트를 수신할 수 있다. 처리된 오디오 프레임을 포함하는 마이크로제어기나 마이크로프로세서로부터의 출력 오디오 신호는 기저대역 아날로그 오디오 출력 신호로의 변환을 위해 오디오 D/A(184)에 입력될 수 있다.

편의상, 본 발명은 도 1의 구조에 대해 기술된다. 그럼에도 불구하고, 제어 CPU(122)는 사전에 특정된 수의 오디오 프레임을 버퍼링하도록 구성될 수 있다. 버퍼는 오디오 디코더(182) 내에 통합될 수 있거나, 별도의 오디오 버퍼가 제공될 수 있다. 대안적으로, 하드디스크가 MPEG 비디오나 MP3 오디오 프리젠테이션을 저장하는 경우, 하드디스크는 버퍼로 동작할 수 있고, CPU(122)는 검사하기 위해 디스크 상에 저장된 오디오 프레임 블록의 오디오 컨텐트의 크기를 결정할 수 있다. 여하튼, 일단 사전에 특정된 수의 오디오 프레임이 버퍼링되면, CPU(122)는 버퍼링된 오디오 프레임의 적어도 일부분의 에너지 컨텐트를 결정할 수 있다.

비록 리플레이 오디오에 대한 본 발명의 증속은 비디오 트릭 모드 재생에 속도매칭된 오디오 첨부물 측면에서 기술되었을 지라도, 이러한 유리한 장치는 하드디스크나 고체 메모리를 구비하고 MP3와 같은 디지털 인코딩을 사용하는 개인용 오디오 플레이어, 응답 및 메모 디바이스와 같은 디지털 오디오 재생 소스에 동일하게 응용될 수 있다. 디지털 오디오 재생 디바이스는 원래의 1X 레코딩 속도보다 더 높은 속도에서 오디오 신호의 재생을 촉진하기 위해 본 명세서에 개시된 본 발명의 장치로부터 도움을 얻을 수 있다.

오디오 디코더(182)로의 입력 오디오 신호가 펄스 코드 변조된(PCM) 오디오 신호인 경우에, 시간 영역 샘플은 일반적으로 음향 압력파의 순시 전압 아날로그를 나타낸다. 그 결과로, 제어 CPU(122)는 프레임의 에너지 컨텐트를 결정하기 위해 순시 전압값의 크기의 절대값을 합산하도록 구성될 수 있다. 오디오 디코더(182)에 대한 입력 오디오 신호가 압축된 오디오 신호인 경우에, 주파수 도메인 신호의 에너지 레벨은 전형적으로 빈(bin)이라고 불리는 협대역 주파수 그룹으로 표시된다. 압축된 오디오에 대해, 제어 CPU(122)는 프레임 내의 주파수 성분의 평균 에너지를 표시하는 하나의 값을 생성하기 위해 주파수 빈 내의 신호 성분의 크기를 합산하도 록 구성될 수 있다. 유리하게, 관심이 있는 오디오 부분이 주파수의 주어진 범위 내에 있을 것이므로, 에너지 컨텐트는 관심이 있는 주파수 범주 내에 있는 그 주파수 성분만의 크기를 합산함으로서 결정될 수 있다. 예컨대, 극저 및/또는 극(extremely)고 주파수 성분은 에너지 결정으로부터 배제될 수 있다. 그럼에도 불구하고, 하나 또는 복수의 오디오 프레임의 에너지 컨텐트를 결정하기 위해 제어 CPU(122)에 의해 실행될 수 있는 알고리즘은 종래기술에서 잘 알려져 있다.

버퍼에서 사전에 특정된 수의 프레임 각각의 에너지 컨텐트를 결정한 이후, 제어 CPU(122)는 버퍼 내의 각 프레임 내에 포함된 에너지의 절대, 상대, 또는 평균양을 표시하는 숫자를 할당할 수 있다. 그 후, 제어 CPU(122)는 각 오디오 프레임에 대해 할당된 절대, 상대 또는 평균 에너지 값을 버퍼 내의 모든 다른 프레임에 대해 할당된 절대, 상대 또는 평균 에너지 값에 대비하여 등급을 매길 수 있다. 제어 CPU(122)는, 오디오를 비디오 트릭 모드 속도에 실질적으로 매칭시키는 프레임 카운트에 도달될 때까지 최소한의 에너지를 갖는 프레임을 버릴 수 있다. 유리하게, 본 발명은 오디오 프레임을 처리하고, 이를 통해 속도를 증가시키고 하드웨어 복잡도를 감소시키는 수학적 알고리즘에 의존한다. 특히, 예컨대 8-비트 마이크로프로세서인 마이크로프로세서나 마이크로제어기가 오디오 프레임을 처리하도록 구성될 수 있다. 중요하게도, 본 발명을 실현하기 위해 고속 푸리에 변환(FFT) 및 역 FFT(IFFT) 알고리즘 및/또는 회로를 사용할 필요성은, 비록 청구항의 해석이 이러한 측면으로 제한되지는 않지만, 없다.

도 2는 본 발명의 장치에 따른 예시적인 단계를 도시한 흐름도를 예시한다. 도 2를 참조하면, 비디오 프리젠테이션의 오디오 부분은 단계(205)에서 오디오 디코더(182)에 의해 포착되거나 검색될 수 있다. 단계(210)에서, 제어 CPU(122)는 버퍼 내에 사전에 특정된 수의 프레임(L)을 버퍼링할 수 있다. 단계(215)에서, 버퍼 내의 L개의 프레임 각각의 에너지 컨텐트는 제어 CPU(122)에 의해 결정될 수 있다. 제어 CPU(122)는 버퍼 내의 프레임 각각의 등급을 매기거나 이들의 에너지 컨텐트에 상대값을 할당할 수 있다. 본 발명의 사상에서 벗어나지 않고, 오디오 에너지는 버퍼 내의 프레임의 일부분에 대해서만 계산될 수 있음을 인식해야 한다. 버퍼 컨텐트의 단지 일부분에 대한 이러한 에너지 합산은 더 높은 트릭 플레이 속도에서 사용될 수 있다. 유사하게, 버퍼 내의 L개의 프레임의 일부분만 등급이 매겨질 수 있다.

단계(220)에서, 제어 CPU(122)는 Y개의 프레임을 삭제 후보로서 표기할 수 있으며, 여기서 Y는 삭제될 필요가 있는 것보다 약간 더 많은 프레임이 삭제 후보로서 선택되도록 선택된다. 유리하게, 이것은 어떤 프레임이 삭제될 것인지를 결정하는데 더 큰 융통성을 제공한다. 예컨대, 만약 버퍼 길이가 46개의 프레임이었다면, 그리고 필요한 재생 트릭 모드 재생 속도가 2X였다면, Y는 23개의 프레임보다 약간 더 많은 프레임이 삭제를 위해 표기되도록 선택되며, 이는 매 두 개의 프레임 중 50%, 즉 1개의 프레임이 2X의 트릭 모드 재생 속도를 달성하기 위해 삭제되어야 하기 때문이다. 그러므로, 예컨대, Y{=28(23+Δ)}개의 프레임이 가능한 삭제를 위해 선택될 수 있다.

유리하게, 가장 간단한 수학식이 삭제될 가능한 프레임의 수를 나타내며, 이 를 통해 계산의 복잡성을 줄이는데 사용될 수 있다. 예컨대, 수학식은 Y=(L/S)+0.1L이며, 여기서, Y는 후보 삭제 프레임의 수이며, S는 후보 삭제 프레임의 수를 결정하는데 사용되는 트릭 모드 재생 속도이며, L은 버퍼링된 오디오 프레임의 수이다. Y의 소수 부분은 정수개의 프레임을 얻도록 사사오입되어 더해지거나 버려질 수 있다. 인자(0.1L)는 임의적으로 선택되며, 시스템에 대한 제한으로 여겨지지 않아야 함을 인식해야 한다. 가능한 삭제를 위한 프레임을 표기하는데 사용된 기준은 최소한의 에너지 양을 갖는 이들 프레임을 기초로 할 수 있다. 따라서, 이러한 예에서, 최소한의 오디오 에너지를 갖는 28개의 프레임이 가능한 삭제를 위해 표기될 수 있다.

삭제를 위한 후보로서 프레임을 표기한 후, 가중 알고리즘이 단계(225)에서 각 프레임에 대해 결정된 에너지의 상대값에 적용될 수 있다. 예컨대, 가중 알고리즘은 도 3c에 도시된 바와 같이 가능한 삭제를 위해 표기된 연속 프레임 그룹의 크기 즉 수를 결정하는 것으로 구성될 수 있다. 단계(230)에서, 후보 프레임은 실제 삭제를 위해 표기되며, 이들 프레임은 삭제된다. 프레임을 삭제하는데 사용된 기준은 단계(225)에서의 프레임 그룹에 할당된 가중치를 기초로 할 수 있다. 예컨대, 모든 필요한 후보 삭제 프레임이 비디오 트릭 모드에 대응하는 필요한 속도를 얻기 위해 삭제될 때까지, 최고 가중치를 갖는 프레임 그룹이 먼저 삭제될 수 있고, 그 다음 높은 가중치의 프레임 그룹이 두 번째로 삭제되는 등의 방식으로 진행된다. 일반적으로, 단계(215 및 225)는 본 실시예에서 사용된 등급매김 단계로서, 비록 본 발명이 이러한 관점으로 제한되지는 않을 지라도, 고려될 수 있다.

인접한 오디오 블록 사이에 간격 또는 경계식별부(delineation)를 제공하기 위해 매 후보 삭제 그룹의 제 1 프레임을 보유하는 것이 바람직할 수 있다. 이러한 경계식별부는 적어도 대략 100ms인 지속기간을 갖는 상대적인 침묵, 즉 감소된 오디오 컨텐트를 보장할 수 있으며, 이러한 기간은 실험을 통해 바람직한 것으로 알려졌다. 상대적인 침묵 즉 감소된 오디오 컨텐트 레벨의 기간은 청취자가 말의 개별 블록 사이를 식별할 수 있게 한다. 더 긴 침묵이 또한 사용될 수 있지만, 대략 500ms보다 더 긴 상대적인 침묵 기간은 일반적으로 과도하고 불필요한 것으로 알려져 있다. 단계(230)에서 프레임을 삭제한 후, 남은 프레임은 도 3e에 도시된 바와 같이 연결되어 단계(235)에서의 트릭 모드 오디오 재생 신호를 생성할 수 있다.

도 3a는 에너지 컨텐트를 위해 할당된 상대값을 각각 보여주는 예시적인 오디오 프레임을 예시한다. 도 3을 참조하면, 이것은 각 프레임에 상대값이 할당된 46개의 프레임을 포함하는 길이(L=46)의 예시적인 버퍼(300)를 도시한다. 예시적으로 필요한 트릭 모드 재생 속도(S)는 2X이다. 그러므로, 매 두 개의프레임 중 50%, 즉 하나가 2X의 평균 재생 속도를 얻기 위해 버려져야 한다.

도 3b는 삭제를 위한 후보로서 대각선으로 표기되고 도시된 버퍼(300) 내의 예시적인 오디오 프레임을 도시한다. 도 3b를 참조하면, Y개의프레임은 가능한 삭제를 위해 선택될 것이며, 여기서, Y=(L/S)+0.1L이며, L=46이고, S=2이므로, Y(=28)개의 프레임(사사오입되어 더해짐)은 가능한 삭제를 위해 표기될 것이다. 삭제를 위해 표기된 후보 프레임은 그 에너지 컨텐트의 상대값에 의해 식별된 오디오 에너지의 최저값을 갖는 28개의 프레임이다.

도 3c는 가능한 삭제를 위해 표기된 버퍼(300) 내의 후보 프레임 그룹에 할당된 예시적인 가중치를 도시한다. 도 3c를 참조하면, 가중치는 후보 프레임으로부터 연속 프레임 그룹을 선택하고, 그룹 내의 연속 프레임의 수에 대응한 가중치를 할당함으로서 할당될 수 있다. 예컨대, 도 3c에서, 가능한 삭제를 위해 표기된 가장 큰 연속 프레임 그룹이 305로서 식별되며, 11개의 프레임을 포함하며, 예컨대 11의 가중치가 할당된다. 그 다음으로 가장 큰 연속 프레임 그룹은 310으로서 식별되며, 이것은 6개의 프레임을 포함하고, 6개의 예시적인 가중치가 할당된다.

도 3d를 참조하면, 23개의 프레임은 2X의 트릭 모드 재생 속도를 얻기 위해 삭제되어야 한다. 최고 가중치를 갖는 이들 프레임 그룹에서부터 시작하여, 프레임은 그에 따라 모든 23개의 프레임이 삭제될 때가지 삭제된다. 바람직하게, 연속적인 오디오 블록 사이의 충분한 경계식별을 보장하기 위해, 매 후보 프레임 그룹 내의 제 1 프레임은 보관된다. 예컨대, 프레임 그룹(305)에 대해, 055의 상대 에너지 컨텐트 값을 갖는 제 1 프레임(315)(도 3c 참조)이 보관될 수 있다. 유사하게, 프레임 그룹(310)에 대해, 005의 상대 에너지 컨텐트 값을 갖는 제 1 프레임(320)이 보관될 수 있다. 도 3d는 표기된 삭제 후보를 삭제한 이후의 버퍼(300) 내의 남은 프레임을 도시한다.

도 3e는 여러 프레임을 삭제 한후 남은 오디오 프레임의 연결을 도시한다. 도3e를 참조하면, 23개의 프레임이 삭제된 후, 남은 23개의 프레임은 2X 트릭 모드 재생 신호를 표시하기 위해 연결될 수 있다. 플레이어(100)는, 오디오신호가 트릭 모드 비디오와 동일한 시간 프로그램 속도로 동시에 또는 이러한 속도로 재생되도 록 오디오 디지털/아날로그 컨버터(D/A)(184)에서 트릭 모드 오디오 재생 신호를 생성할 수 있다.

특히, 본 발명은 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어의 조합으로 실현될 수 있다. 본 발명에 따른 기계로 판독 가능한 저장은 예컨대 제어 CPU(122)와 같은 하나의 컴퓨터 시스템에서 중앙집중 방식으로 또는, 서로 다른 요소가 몇 개의 상호 연결된 컴퓨터 시스템에 걸쳐서 흩어져 있는 분배된 방식으로 실현될 수 있다. 본 명세서에서 기술된 방법을 실현하기 위해 적응된 임의의 종류의 컴퓨터 시스템 또는 다른 장치가 허용될 수 있다.

상세하게, 비록 본 명세서에서 기술된 본 발명이 도 1의 제어 CPU(122)를 고려하고 있지만, 하드웨어 및 소프트웨어의 전형적인 조합은 컴퓨터 프로그램을 구비한 범용 컴퓨터 시스템을 포함할 수 있으며, 이러한 프로그램은 로딩되어 실행될 때 컴퓨터 시스템 및/또는 DVD 플레이어 및/또는 MPEG 비디오 프리젠테이션을 포함하는 하드디스크 및/또는 도 1에 도시된 시스템과 유사한 다른 시스템을 이러한 프로그램이 본 명세서에서 기술된 방법을 실행하도록 제어한다. 본 발명은 또한 본 명세서에서 기술된 방법을 구현하게 하는 모든 특성을 포함하고, 컴퓨터 시스템에 로딩될 때 이들 방법을 실행할 수 있는 컴퓨터 프로그램 제품에 내장될 수 있다.

본 발명의 환경에서의 컴퓨터 프로그램은, 특정한 기능을 바로 수행하거나, 다음의 기능: (a) 또 다른 언어, 코드, 또는 표기로의 변환 및 (b) 다른 자료 형태로의 재생중 하나 또는 둘 모두 이후에 특정한 기능을 정보 처리 성능을 갖는 시스템이 수행하게 하고자 하는 임의의 언어, 코드 또는 표기로 된 지령 세트의 임의의 표현을 의미할 수 있다.

상기 설명은 단지 예시를 위한 것이며, 다음의 청구항에서 제시된 것을 제외하고, 본 발명을 어떤 식으로든 제한하지 않고자 한다.

상술한 바와 같이, 본 발명은 개선된 트릭모드 재생, 좀더 상세하게는 정상 속도가 아닌 속도에서의 디지털 오디오 컨텐트의 트릭 모드 재생을 개선하는 분야에 이용된다.

Claims

1X이외의 속도에서 디지털 오디오 레코딩을 플레이하는 방법으로서,

복수의 오디오 프레임에서 표시된, 저장된 디지털 오디오 정보를 검색하는 단계(205)와;

상기 복수의 오디오 프레임에 대해 상기 오디오 프레임의 에너지 컨텐트에 따라서 등급을 매기는 단계(215)와;

상기 등급을 매기는 단계에 따라 최소한의 에너지 컨텐트를 갖는 프레임을 상기 복수의 오디오 프레임으로부터 삭제하는 단계(230)와;

오디오 트릭 모드 재생 신호를 형성하기 위해 상기 삭제 단계 다음에 상기 오디오 프레임 중 남은 프레임을 선택하는 단계(235)를 포함하는, 디지털 오디오 레코딩 플레이 방법.

제 1항에 있어서, 상기 선택 단계(235)는 상기 오디오 트릭 모드 재생 신호를 형성하기 위해 상기 남은 오디오 프레임을 연결하는 단계를 더 포함하는, 디지털 오디오 레코딩 플레이 방법.

제 1항에 있어서, 상기 삭제 단계(230)는 선택된 트릭 모드 재생 속도에 따른 상기 복수의 오디오 프레임의 백분율을 상기 복수의 오디오 프레임에서 삭제하는 단계를 더 포함하는, 디지털 오디오 레코딩 플레이 방법.

1X이외의 속도에서 트릭 모드 재생 동안에 비디오 프리젠테이션을 수반하는 오디오 프로그래밍을 플레이하는 방법으로서,

상기 비디오 프리젠테이션의 적어도 비디오 부분과 이에 대응하는 오디오 부분을 표시하는 정보를 검색하는 단계(205)로서, 상기 오디오 부분은 복수의 오디오 프레임 내의 오디오 정보를 표시하는, 검색 단계(205)와;

상기 복수의 오디오 프레임에 대해 상기 복수의 오디오 프레임의 에너지 컨텐트에 따라 등급을 매기는 단계(215)와;

오디오 트릭 모드 재생 신호를 형성하기 위해 상기 등급을 매기는 단계를 기초로 해서 오디오 프레임을 선택하는 단계(230)를,

포함하는, 오디오 프로그래밍 플레이 방법.

제 4항에 있어서, 상기 등급을 매기는 단계(215)는 상기 복수의 오디오 프레임의 상기 에너지 컨텐트를 계산하는 단계를 더 포함하는, 디지털 오디오 레코딩 플레이 방법.

제 4항에 있어서, 상기 선택 단계(230)는 선택된 비디오 트릭 모드 속도에 따라 상기 복수의 오디오 프레임의 부분을 제거하는 단계를 더 포함하는, 오디오 프로그래밍 플레이 방법.

제 5항에 있어서, 상기 선택 단계(230)는 상기 계산 단계에 따른 최소한의 에너지 컨텐트를 갖는 프레임을 상기 복수의 오디오 프레임으로부터 제거하는 단계를 더 포함하는, 오디오 프로그래밍 플레이 방법.

제 7항에 있어서, 상기 선택 단계(230)는 상기 트릭 모드 재생 신호를 형성하기 위해 최소한의 에너지 컨텐트를 갖는 상기 오디오 프레임을 제거하고 남은 오디오 프레임을 연결하는 단계(235)를 더 포함하는, 오디오 프로그래밍 플레이 방법.

제 6항에 있어서, 상기 제거 단계(230)에서, 필요한 트릭 모드 재생 속도가 더 빠를수록, 제거될 상기 오디오 프레임의 크기가 더 커지는, 오디오 프로그래밍 플레이 방법.

제 5항에 있어서, 상기 계산 단계(215)는 적어도 하나의 오디오 프레임에 대한 순시 전압값을 표시하는 크기 값을 합산하는 단계를 더 포함하는, 오디오 프로그래밍 플레이 방법.

제 5항에 있어서, 상기 계산 단계(215)는 적어도 하나의 오디오 프레임에 대한 주파수 범위 내의 주파수 빈(bin)내의 값의 크기를 합산하는 단계를 더 포함하는, 오디오 프로그래밍 플레이 방법.

1X 이외의 속도에서 트릭 모드 재생 동안에 비디오 프로그래밍과 관련된 오디오 프로그래밍을 플레이하는 장치로서,

프로그램의 적어도 비디오 부분과 이에 대응하는 오디오 부분을 표시하는 정보를 저장 매체(102)로부터 검색하기 위한 저장 매체 판독기(108)로서, 상기 오디오 부분은 복수의 오디오 프레임의 오디오 정보를 표시하는, 저장 매체 판독기(108)와; 상기 복수의 오디오 프레임에 대해 상기 오디오 프레임의 에너지 컨텐트에 따라 등급을 매기고, 상기 오디오 프레임의 등급에 따라, 상기 오디오 프레임 중 선택된 프레임으로부터 오디오 트릭 모드 재생 신호를 형성하기 위한 오디오 프로세서(122)를,

포함하는, 오디오 프로그래밍 플레이 장치.

제 12항에 있어서, 상기 오디오 프로세서(122)는 상기 복수의 오디오 프레임의 상기 에너지 컨텐트를 계산하기 위한 계산 수단을 포함하는, 오디오 프로그래밍 플레이 장치.

제 13항에 있어서, 상기 오디오 프로세서(122)는 선택된 비디오 트릭 모드 재생 속도에 따라 상기 복수의 오디오 프레임의 백분율 부분을 상기 오디오 부분으로부터 선택적으로 제거하기 위한 수단을 더 포함하는, 오디오 프로그래밍 플레이 장치.

제 14항에 있어서, 상기 제거 수단(122)은 상기 복수의 오디오 프레임으로부터 계산된 에너지 컨텐트중 최소량을 갖는 상기 복수의 오디오 프레임의 상기 백분율 부분을 선택적으로 제거하는, 오디오 프로그래밍 플레이 장치.

제 15항에 있어서, 상기 오디오 프로세서(122)는 상기 트릭 모드 재생 신호의 오디오 트릭 모드 재생 신호를 형성하기 위해 상기 복수의 오디오 프레임의 상기 백분율 부분의 상기 제거 단계 이후 남은 오디오 프레임을 연결하는, 오디오 프로그래밍 플레이 장치.

제 14항에 있어서, 상기 제거 수단(122)에서, 필요한 트릭 모드 재생 속도가 더 빠를수록, 제거될 오디오 프레임의 상기 백분율 부분이 더 커지는, 오디오 프로그래밍 플레이 장치.

제 13항에 있어서, 상기 계산 수단(122)은 적어도 하나의 오디오 프레임에 대한 전압을 표시하는 순시값의 크기의 절대값의 합을 결정함으로서 상기 에너지 컨텐트를 계산하는, 오디오 프로그래밍 플레이 장치.

제 13항에 있어서, 상기 계산 수단(122)은 적어도 하나의 오디오 프레임을 위한 주파수 범위 내의 주파수 빈(bin) 내의 값의 크기의 합을 결정함으로서 상기 에너지 컨텐트를 계산하는, 오디오 프로그래밍 플레이 장치.