KR20100056505A

KR20100056505A - 슬라이드 쇼 이벤트들과 오디오의 동기화

Info

Publication number: KR20100056505A
Application number: KR1020107005544A
Authority: KR
Inventors: 반-완 리; 카이 청 루이
Original assignee: 마이크로소프트 코포레이션
Priority date: 2007-09-18
Filing date: 2008-08-25
Publication date: 2010-05-27
Also published as: CN101802816A; EP2201478B1; CN101802816B; US20090077460A1; TW200921447A; MY155096A; JP2010539619A; EP2201478A1; US8381086B2; BRPI0815915A2; RU2010110132A; KR101247000B1; WO2009038929A1; AU2008302614A1; TWI534648B; EP2201478A4; AU2008302614B2; JP5349482B2; MX2010002967A; RU2470353C2

Abstract

슬라이드 쇼 이벤트들을 오디오와 동기화시키는 기술들이 본원에 설명된다. 정의된 이벤트들 동안에 재생될 오디오 파일과, 하나 이상의 애니메이션 이벤트들, 슬라이드 이행들 또는 시각적 효과들을 정의하는 데이터가 수신된다. 오디오 파일은 포함된 오디오 이벤트들을 식별하도록 처리된다. 오디오 파일 내의 오디오 이벤트들이 식별되면, 오디오 이벤트들이 애니메이션 이벤트들과 어떻게 동기화될 지를 정의하는 데이터를 포함하는 오디오 동기화 스킴을 사용하여, 정의된 애니메이션 이벤트들이 식별된 오디오 이벤트들에 동기화된다. 사용자가 프레젠테이션에 적용될 오디오 동기화 스킴을 선택할 수 있게 하는 사용자 인터페이스가 제공된다. 사용자가 오디오 파일 내에 식별된 임의의 오디오 이벤트와 애니메이션 이벤트를 시각적으로 연관시킬 수 있게 하는 사용자 인터페이스도 제공될 수 있다.

Description

슬라이드 쇼 이벤트들과 오디오의 동기화{SYNCHRONIZING SLIDE SHOW EVENTS WITH AUDIO}

프레젠테이션 애플리케이션 프로그램들은 시청각 프레젠테이션을 생성하고 행하는 기능을 제공한다. 통상적으로, 프레젠테이션들은 하나 이상의 프레젠테이션 슬라이드의 형태를 취한다. 각각의 프레젠테이션 슬라이드는 텍스트, 사진, 리스트, 표, 차트, 형식, 클립 아트, 영화 및 기타와 같은 수많은 개체를 포함할 수 있다. 프레젠테이션 슬라이드들은 프레젠테이션을 하기 위해 화면에 표시되고 사용자의 커맨드를 통해 내비게이션될 수 있다.

많은 프레젠테이션 애플리케이션 프로그램들은 각각의 프레젠테이션 슬라이드 상의 개체들을 애니메이션하고 그에 시각적 효과를 적용하고 프레젠테이션 슬라이드들 간의 이행(transition)들을 애니메이션하고 그에 시각적 효과를 적용하는 기능을 제공한다. 예를 들어, 전형적인 프레젠테이션 애플리케이션 프로그램들에 의해 제공되는 기능을 이용하면, 사용자는 프레젠테이션 슬라이드 상의 개체에 대해 이동 경로를 정의할 수 있다. 프레젠테이션 슬라이드가 디스플레이되는 경우, 프레젠테이션 애플리케이션 프로그램은 개체가 정의된 이동 경로를 따라 애니메이션되게 할 것이다. 사용자는 다른 유형의 애니메이션 및 프레젠테이션 개체에 적용될 시각적 효과 속성들을 유사한 방식으로 수동으로 정의할 수 있다.

많은 프레젠테이션 애플리케이션 프로그램은 또한 프레젠테이션 동안 오디오 파일을 재생하는 기능을 제공한다. 그러나, 사용자가 프레젠테이션 내의 애니메이션 이벤트들을 오디오 파일 내의 관심있는 시간 포인트들과 동기화하는 것은 전통적으로 어렵다. 예를 들어, 사용자는 프레젠테이션 내의 텍스트 및 그래픽의 애니메이션이 오디오 파일의 각각의 주요 비트(beat)가 재생될 때 발생하기를 원할 수 있다. 예전에는 사용자들이 오디오 파일 내의 관심있는 오디오 이벤트들을 식별하기 위해 오디오 파일을 반복적으로 듣고, 그 후 슬라이드 쇼 이벤트들의 시작 시간들을 수동으로 식별된 오디오 이벤트들과 수동으로 정렬함으로써 이러한 결과를 얻었다. 이러한 것은 사용자들이 불만스러워 하는 지루하고 시간 소모적인 프로세스이며, 많은 경우에서 이상적인 것보다 낮은 결과들을 제공한다.

본원에 이루어진 개시물들은 이러한 고려 및 기타와 관련하여 제공된다.

요 약

슬라이드 쇼 이벤트들과 오디오를 동기화하는 기술이 본원에 설명된다. 특히, 본원에 제시되는 기술들 및 개념들을 사용하면, 오디오 파일 내의 오디오 이벤트들이 자동화된 방식으로 식별될 수 있다. 예를 들어, 오디오 파일 내의 주요 비트, 조용한 절(silent passage), 또는 악기에 의한 절(instrumental passage)이 식별될 수 있다. 식별된 오디오 이벤트들은 그 후 애니메이션, 시각적 효과 및 슬라이드 이행과 같은 슬라이드 쇼 이벤트들에 자동화된 방식으로 동기화된다. 이러한 방식으로, 사용자가 오디오 이벤트들을 수동으로 식별하거나 오디오 이벤트들을 슬라이드 쇼 이벤트들에 수동으로 동기화시키지 않고 오디오 이벤트들이 슬라이드 쇼 이벤트들에 용이하게 동기화될 수 있다.

본원에 제시된 일 양상에 따르면, 하나 이상의 애니메이션 이벤트, 슬라이드 이행 또는 시각적 효과를 정의하는 데이터가 수신된다. 예를 들어, 사용자는 이러한 이벤트들을 정의하기 위해 그래픽 사용자 인터페이스를 활용할 수 있다. 사용자는 또한 정의된 이벤트들의 수행 동안 재생될 오디오 파일을 명시할 수 있다. 오디오 파일은 그에 포함된 오디오 이벤트들을 식별하도록 처리된다. 오디오 이벤트들은 비트들, 악기에 의한 절들, 조용한 절들 등과 같은 임의의 중요한 가청 이벤트가 오디오 파일에서 재생되는 시점을 나타낸다. 일 양상에 따르면, 오디오 이벤트들은 오디오 파일 내의 오디오 시작(audio onset)의 위치를 찾음(locate)으로써 식별된다. 오디오 시작들은 특정 주파수의 오디오 에너지 레벨이 특정 임계값 아래 또는 위로 상승하는 오디오 파일 내의 시점들이다. 위치가 찾아진 오디오 시작들은 동기화를 위해 적절한 수의 오디오 이벤트들 제공하도록 필터링될 수 있다.

오디오 파일 내의 오디오 이벤트들이 식별되면, 정의된 애니메이션 이벤트들이 오디오 동기화 스킴(scheme)을 사용하여 식별된 오디오 이벤트들에 동기화된다. 오디오 동기화 스킴은 오디오 이벤트들이 애니메이션 이벤트들에 어떻게 동기화될 지를 정의하는 데이터를 포함하는 "레시피(recipe)"이다. 예를 들어, 실시예들에 따르면, 오디오 동기화 스킴 내의 데이터는 각각의 오디오 이벤트와 대응하는 애니메이션 이벤트 간의 오프셋을 명시한다. 이러한 방식에서, 오디오 이벤트의 발생 전, 그와 동시에, 또는 그 후에 애니메이션 이벤트를 트리거하는 명령들이 제공된다.

다른 실시예들에서, 오디오 동기화 스킴 내의 데이터는 각각의 오디오 이벤트가 대응하는 애니메이션 이벤트의 시작 또는 끝과 동기되어야 할 지 여부를 명시한다. 데이터는 또한 오디오 이벤트들의 모두 또는 서브세트가 애니메이션 이벤트들과 동기되어야 할 지 여부를 명시할 수 있다. 예를 들어, 그러한 데이터를 사용하면 4번째 오디오 이벤트마다 애니메이션 이벤트와 동기화될 수 있다. 데이터는 또한 오디오 이벤트들의 서브세트가 어떻게 선택될 지를 명시할 수 있다. 오디오 이벤트들이 애니메이션 이벤트들에 어떻게 동기화될 지를 정의하는 오디오 동기화 스킴 내에 다른 유형들의 명령들이 유사하게 제공될 수 있다.

다수의 오디오 동기화 스킴의 정의를 통해, 애니메이션 이벤트들을 오디오와 동기화시키기 위한 상이한 "무드(mood)"가 생성될 수 있다. 일 실시예에서, 사용자가 프레젠테이션에 적용될 오디오 동기화 스킴을 선택할 수 있게 하는 무드 갤러리 사용자 인터페이스가 제공된다. 오디오 동기화 스킴들에는, 프레젠테이션에 적용될 때 전달하는 "무드"를 설명하는 명칭들이 제공될 수 있다. 예를 들어, 행복하거나 설득력있는 무드를 전달하는 오디오 동기화 스킴들이 정의될 수 있다.

다른 실시예들에 따르면, 타임라인(timeline)을 따라 오디오 파일의 파형을 디스플레이하는 사용자 인터페이스도 제공된다. 식별된 오디오 이벤트들에 대응하는 표시자들도 파형 상에 디스플레이될 수 있다. 사용자 인터페이스는 또한 사용자로 하여금 파형 상에 도시된 오디오 이벤트들과 애니메이션 이벤트들을 수동으로 연관시키게 할 수 있다. 예를 들어, 적절한 사용자 입력 디바이스를 이용하면, 사용자는 애니메이션에 대응하는 개체를 타임라인을 따라 이동시킬 수 있다. 이에 응답하여, 애니메이션 이벤트의 시작 및/또는 종료 시간이 파형에 도시된 오디오 이벤트들에 대응하는 표시자들에 스냅(snap)될 것이다. 이러한 방식에서, 본원에 제공된 사용자 인터페이스는 사용자가 오디오 파일 내에 식별된 임의의 오디오 이벤트와 애니메이션 이벤트를 시각적으로 연관시키게 할 수 있다.

본원에 제시된 특징들이 프레젠테이션 애플리케이션 프로그램의 맥락에서 설명되었지만, 이러한 특징들은 개체들을 애니메이션하거나, 시각적 효과들을 수행하거나 또는 이행을 디스플레이하면서 오디오 사운드트랙을 재생하는 기능을 제공하는 임의의 유형의 컴퓨터 프로그램을 이용하여 활용될 수 있다는 것을 이해하여야 한다. 상술한 대상은 컴퓨터 제어된 장치, 컴퓨터 프로세스, 컴퓨팅 시스템 또는 컴퓨터 판독가능 매체와 같은 제품으로서 구현될 수도 있다는 것을 이해하여야 한다. 이러한 특징들 및 다양한 다른 특징들은 다음의 상세한 설명을 읽고 연관된 도면을 검토함으로써 명백해 질 것이다.

본 요약은 아래의 상세한 설명에서 더 설명되는 개념들의 선택을 간략한 형태로 소개하도록 제공된다. 본 요약은 청구 대상의 중요한 특징 또는 본질적인 특징들을 식별하기 위한 의도가 아니며, 본 요약이 청구 대상의 범위를 제한하기 위해 사용되는 것을 의도한 것도 아니다. 또한, 청구 대상은 본 개시물의 임의의 부분에 메모된 임의의 또는 모든 문제점들을 해결하는 구현들로 제한되지 않는다.

도 1은 본원에 제시된 하나의 구현에 제공되는 프레젠테이션 애플리케이션의 양상들을 예시하는 소프트웨어 아키텍쳐 도면이다.
도 2는 본원에 설명된 하나의 구현에서 슬라이드 쇼 이벤트들과 오디오 이벤트들을 동기화하기 위한 예시적인 루틴을 나타내는 흐름도이다.
도 3은 본원에 제시된 하나의 구현에서 사용자가 오디오 동기화 스킴을 선택할 수 있는 예시적인 무드 갤러리를 나타내는 사용자 인터페이스 도면이다.
도 4는 본원에 제시된 하나의 구현에 따라 오디오 파일 내의 오디오 이벤트들을 식별하기 위한 예시적인 프로세스를 나타내는 프로세스 도면이다.
도 5는 본원에 제시된 하나의 구현에서 오디오 파일 내의 오디오 시작들을 식별하기 위한 소프트웨어 아키텍쳐의 양상들을 나타내는 소프트웨어 아키텍쳐 도면이다.
도 6은 본원에 제시된 일 실시예에 의해 제공되고 이용되는 시작 검출기(onset detector)의 양상들을 나타내는 소프트웨어 아키텍쳐 도면이다.
도 7은 일 실시예에 따라 오디오 파일 내의 오디오 이벤트들을 보고 프레젠테이션 문서 내에서 오디오 이벤트들을 슬라이드 쇼 이벤트들에 수동으로 할당하는 예시적인 사용자 인터페이스를 나타내는 사용자 인터페이스 도면이다.
도 8은 본원에 제시된 실시예들을 구현할 수 있는 컴퓨팅 시스템에 대한 예시적인 컴퓨터 하드웨어 및 소프트웨어 아키텍쳐를 나타내는 컴퓨터 아키텍쳐 도면이다.

다음의 상세한 설명은 슬라이드 쇼 이벤트들을 오디오 이벤트들과 동기화시키는 기술들에 관한 것이다. 본원에 제시된 실시예들을 사용하면, 사용자가 오디오 이벤트들을 수동으로 식별하거나 또는 오디오 이벤트들을 슬라이드 쇼 이벤트들에 수동으로 동기화시키지 않고, 오디오 파일 내의 오디오 이벤트들이 자동적인 방식으로 식별되고 애니메이션, 시각적 효과, 및 슬라이드 이행과 같은 슬라이드 쇼 이벤트들에 동기화될 수 있다. 본원에 제시된 다양한 실시예들에 대한 추가적인 상세는 도 1 ~ 8을 참조하여 아래에 제공될 것이다.

본원에 설명된 대상이 컴퓨터 시스템 상의 운영 체제 및 애플리케이션 프로그램들의 실행과 함께 실행되는 프로그램 모듈들의 일반적인 맥락에서 제공되었지만, 다른 구현들이 다른 유형들의 프로그램 모듈들과 조합하여 실행될 수 있다는 것을 본 기술분야의 당업자는 인식할 것이다. 일반적으로, 프로그램 모듈들은 루틴들, 프로그램들, 컴포넌트들, 데이터 구조들, 및 특정 태스크들을 수행하거나 특정 추상적 데이터 유형들을 구현하는 다른 유형들의 구조들을 포함한다. 더욱이, 본원에 설명된 대상은, 핸드-헬드 디바이스들, 멀티프로세서 시스템들, 마이크로프로세서-기반 또는 프로그램가능한 소비자 가전기기, 미니컴퓨터들, 메인프레임 컴퓨터들 등을 포함하는 다른 컴퓨터 시스템 구성들을 이용하여 구현될 수 있다는 것을 본 기술분야의 당업자는 이해할 것이다.

다음의 상세한 설명에서, 본 명세서의 일부분을 형성하고 예로서 특정 실시예들 또는 예시들이 도시되는 첨부 도면들을 참조한다. 유사한 참조부호들이 몇몇 도면들에 걸쳐 유사한 요소들을 나타내는 도면들을 참조하면, 슬라이드 쇼 이벤트들과 오디오 이벤트들을 동기화시키는 컴퓨팅 시스템 및 방법의 양상들이 기술될 것이다.

도 1을 참조하여, 슬라이드 쇼 이벤트들을 오디오 이벤트들과 동기화시키기 위해 본원에 제시되는 일 실시예에 대한 상세가 제공될 것이다. 특히, 도 1은 본원에 제시된 일 구현에 따라 슬라이드 쇼 이벤트들을 동기화하는데 이용되는 소프트웨어 아키텍쳐의 양상들을 예시한다. 도 1에 도시된 바와 같이, 본원에 제시된 실시예들은 프레젠테이션 애플리케이션 프로그램(102)의 맥락에서 설명된다. 프레젠테이션 애플리케이션(102)은 시청각 프레젠테이션을 생성하고 행하는 기능을 제공한다. 통상적으로, 프레젠테이션들은 프레젠테이션 문서(104) 내에 포함되는 하나 이상의 프레젠테이션 슬라이드(106A ~ 106C)의 형태를 취한다. 각각의 프레젠테이션 슬라이드(106A ~ 106C)는 텍스트, 사진, 리스트, 표, 챠트, 형식, 클립 아트 및 영화와 같은 많은 개체(108A ~ 108C)을 포함할 수 있다. 다른 유형들의 시청각 개체들도 활용될 수 있다. 프레젠테이션 슬라이드(106A ~ 106C)는 프레젠테이션 문서(104)에 정의된 프레젠테이션을 행하기 위해 컴퓨터 디스플레이 화면 상에 디스플레이되고 사용자의 커맨드를 통해 내비게이션될 수 있다.

프레젠테이션 애플리케이션(102)은 또한 개체들(108A ~ 108C) 및 프레젠테이션 슬라이드들(106A ~ 106C) 간의 이행들을 애니메이션하고 시각적 효과를 적용하는 기능을 포함한다. 예를 들어, 사용자는 개체들(108A ~ 108C)에 대한 애니메이션 이벤트들(107A ~ 107C)을 생성하기 위해 프레젠테이션 애플리케이션(102)에 의해 제공되는 기능을 활용할 수 있다. 도 1에 도시된 애니메이션 이벤트들(107A ~ 107C)는 개체들(108A ~ 108C)로 하여금 이동 경로를 따라 이동할 수 있게 한다. 그러나, 다른 유형들의 2차원 및 3차원 애니메이션들도 정의될 수 있다는 것을 이해하여야 한다. 유사하게, 시각적 효과가 개체들(108A ~ 108C)에 적용될 수 있다. 예를 들어, 개체들(108A ~ 108C)이 점점 또렷해지거나/흐려지거나(fade in/out) 또는 디졸브(dissolve)되게 하는 시각적 효과가 정의될 수 있다. 프레젠테이션 슬라이드들(106A ~ 106C) 중 2개 사이의 스위칭 또는 이행 동안에 애니메이션 효과 또는 시각적 효과가 디스플레이되게 하는 이행 효과(transition effects)도 정의될 수 있다. 슬라이드 쇼 이벤트들은 애니메이션 이벤트들, 시각적 효과들, 이행 이벤트들 및 프레젠테이션 애플리케이션 프로그램 내에 정의될 수 있는 임의의 다른 유형의 시각적 이벤트를 포함한다.

일 실시예에서, 프레젠테이션 애플리케이션(102)은 또한 오디오 파일(114) 내의 오디오 이벤트들을 정의된 슬라이드 쇼 이벤트들에 동기시키기 위한 기능을 포함한다. 이러한 기능을 제공하기 위해, 프레젠테이션 애플리케이션(102)은 오디오 파일(114) 내의 오디오 이벤트들을 식별하는 프로세싱을 수행하는 오디오 동기화 컴포넌트(112)를 포함한다. 이 프로세스는 도 4 ~ 6을 참조하여 아래에 설명될 것이다. 프레젠테이션 애플리케이션(102)은 또한 프레젠테이션 문서(104) 내에 정의된 슬라이드 쇼 이벤트들과 식별된 오디오 이벤트들을 동기화하는 기능을 제공한다. 이와 관련하여, 프레젠테이션 애플리케이션(102)은 사용자가 오디오 동기화 컴포넌트(112)에 의해 생성된 슬라이드 쇼 이벤트들과 오디오 이벤트들의 동기화를 수동으로 조정할 수 있게 하는 사용자 인터페이스도 제공한다. 이러한 사용자 인터페이스에 관한 상세는 도 7을 참조하여 아래에 제공될 것이다.

본원에 제시된 다양한 실시예들에 따르면, 오디오 동기화 컴포넌트(112)는 오디오 동기화 스킴(110A)를 활용하여 오디오 이벤트들이 슬라이드 쇼 이벤트들과 어떻게 동기화되어야 하는지를 결정한다. 오디오 동기화 스킴(110A)은 오디오 이벤트들이 슬라이드 쇼 이벤트들과 동기화되는 방법을 정의하는 데이터를 포함하는 "레시피"이다. 예를 들어, 실시예들에 따르면, 오디오 동기화 스킴(110A)의 데이터는 각각의 오디오 이벤트와 대응하는 애니메이션 이벤트 간의 오프셋을 명시한다. 이러한 방식에서, 오디오 이벤트의 발생 전, 그와 동시에 또는 그 후에 슬라이드 쇼 이벤트를 트리거하는 명령들이 제공된다.

다른 실시예들에서, 오디오 동기화 스킴(110A)의 데이터는 대응하는 애니메이션 이벤트의 시작 또는 끝과 각각의 오디오 이벤트가 동기화되어야 하는지 여부를 명시한다. 그 데이터는 또한 오디오 이벤트들의 전부 또는 서브세트가 애니메이션 이벤트들과 동기화되어야 하는지 여부를 명시할 수 있다. 예를 들어, 그러한 데이터를 이용하면, 4번째 오디오 이벤트마다 애니메이션 이벤트와 동기화될 수 있다. 데이터는 또한 오디오 이벤트들의 서브세트가 선택되는 방법을 명시할 수 있다. 오디오 이벤트들이 애니메이션 이벤트들과 어떻게 동기화되어야 하는 지를 정의하는 오디오 동기화 스킴(110A) 내에 다른 유형들의 명령이 유사하게 제공될 수 있다.

다수의 오디오 동기화 스킴(110A ~ 110C)의 정의를 통해, 애니메이션 이벤트들을 오디오와 동기화하기 위한 상이한 "무드"들이 생성될 수 있다. 일 실시예에서, 사용자가 프레젠테이션 문서(104)에 적용될 오디오 동기화 스킴들(110A ~ 110C) 중 하나를 선택할 수 있게 하는 무드 갤러리 사용자 인터페이스가 제공된다. 오디오 동기화 스킴들(110A ~ 110C)에는, 프레젠테이션에 적용될 때 전달되는 "무드"를 설명하는 명칭들이 주어질 수 있다. 예를 들어, 행복한 무드 또는 설득력있는 무드를 전달하는 오디오 동기화 스킴들이 정의될 수 있다. 무드 갤러리 사용자 인터페이스에 관한 추가적인 상세는 도 3과 관련하여 아래에 제공될 것이다.

도 2를 참조하면, 슬라이드 쇼 이벤트들을 오디오 이벤트들과 동기화하기 위한, 본원에 제시되는 실시예들에 관한 추가적인 상세가 제공될 것이다. 특히 도 2는 슬라이드 쇼 이벤트들을 오디오 이벤트들과 동기화하는 루틴(200)을 설명하는 흐름도를 나타낸다. 본원에 설명되는 논리적인 동작들은 (1) 컴퓨팅 시스템 상에서 동작하는 프로그램 모듈들 또는 일련의 컴퓨터 구현된 액트들(acts) 및/또는 (2) 컴퓨팅 시스템 내의 상호접속된 머신 로직 회로들 또는 회로 모듈들로서 구현된다는 것을 이해하여야 한다. 그 구현은 컴퓨팅 시스템의 성능 및 다른 요구조건에 따른 선택의 문제이다. 따라서, 본원에 설명된 논리적 동작들은 동작들, 구조적 디바이스들, 액트들 또는 모듈들로서 다양하게 지칭된다. 이러한 동작들, 구조적 디바이스들, 액트들 및 모듈들은 소프트웨어, 펌웨어, 특수목적 디지털 로직 및 그들의 임의의 조합으로 구현될 수 있다. 또한, 본원에 설명된 것 및 도면에 도시된 것 보다 많거나 적은 동작들이 수행될 수 있다는 것을 이해하여야 한다. 이러한 동작들은 또한 본원에 설명된 것과는 상이한 순서로 수행될 수 있다.

루틴(200)은 사용자가 프레젠테이션 내의 슬라이드 쇼 이벤트들을 정의하는 동작 202에서 시작한다. 예를 들어, 프레젠테이션 애플리케이션(102)에 의해 제공되는 기능을 활용하면, 사용자는 개체들(108A ~ 108C) 또는 프레젠테이션 슬라이드들(106A ~ 106C)에 대하여 애니메이션 이벤트들, 시각적 효과들, 이행 이벤트들 또는 다른 유형들의 이벤트들을 정의할 수 있다. 사용자가 원하는 슬라이드 쇼 이벤트들을 생성하면, 루틴(200)은 동작 202에서 동작 204로 진행한다.

동작 204에서, 프레젠테이션 애플리케이션(102)은 오디오 파일(114)의 선택을 수신한다. 예를 들어, 일 구현에서, 사용자는 상기 동작 202에서 정의된 슬라이드 쇼 이벤트들의 프레젠테이션 동안에 재생될 오디오 파일(114)을 명시할 수 있다. 오디오 파일(114)은 표준 WAV 오디오 파일, MP3 오디오 파일로서 포맷되거나 또는 다른 유형의 오디오 포맷을 활용하여 포맷될 수 있다. 또한, 오디오 파일(114)이 다른 유형의 파일 내에 포함될 수 있다는 것을 이해하여야 한다. 예를 들어, 오디오 파일(114)은 비디오 파일 내에 포함되는 오디오 데이터를 포함할 수 있다. 이러한 실시예에서, 본원에 제시된 양상들은 비디오 파일 내의 오디오 이벤트들에 대해 슬라이드 쇼 이벤트들을 동기화시키는데 활용될 수 있다. 이는 또한 오디오 데이터를 포함하는 비디오 파일에 적용되는 효과들, 이행들 및 다른 유형들의 기능들의 동기화를 허용한다.

사용자가 슬라이드 쇼 이벤트들과 동기화될 오디오 파일(114)을 선택하면, 루틴(200)은 동작 206으로 계속된다. 동작 206에서, 사용자는 정의된 슬라이드 쇼 이벤트들에 대해 오디오 파일(114) 내의 오디오 이벤트들을 동기화하는데 사용될 오디오 동기화 스킴(110A ~ 110C)들 중 하나를 선택하도록 허용된다. 일 구현에 따르면, 사용자가 원하는 오디오 동기화 스킴(110)을 선택할 수 있도록, 도 3에 도시된 "무드" 갤러리 사용자 인터페이스(300)가 제시된다. 도 3에 도시된 바와 같이, "무드" 갤러리 사용자 인터페이스(300)는 다수의 사용자 인터페이스 버튼(302A ~ 302F)를 포함하며, 각각의 버튼(302)은 특정 오디오 동기화 스킴(110)에 대응한다.

일 구현에서, 애니메이션 이벤트들을 오디오와 동기화시키기 위한 상이한 "무드"를 전달하는 다수의 오디오 동기화 스킴(110A ~ 110C)이 생성된다. 오디오 동기화 스킴(110A ~ 110C)에는 또한 프레젠테이션에 적용될 때 전달하는 "무드"를 설명하는 명칭들이 주어진다. 이러한 명칭들은 각각의 오디오 동기화 스킴에 대응하는 버튼들(302A ~ 302F)에 반영될 수 있다. 예를 들어, 버튼(302A)는, 프레젠테이션에 적용될 때, 정의된 슬라이드 쇼 이벤트들이 오디오 파일(114) 내의 오디오 이벤트들과 적극적인 방식(assertive way)으로 동기화되게 하는 오디오 동기화 스킴에 대응한다. 사용자는 적절한 사용자 입력 디바이스를 사용하여 버튼들(302A ~ 302F)들 중 하나 및 대응하는 오디오 동기화 스킴(110)을 선택한다.

이제 도 2로 돌아가면, 오디오 동기화 스킴(110)이 동작 206에서 선택되면, 루틴(200)은 동작 208로 진행한다. 동작 208에서, 선택된 오디오 파일(114) 내의 오디오 이벤트들이 식별된다. 오디오 파일(114) 내의 관심있는 오디오 이벤트들을 식별하기 위한 하나의 예시적인 프로세스에 관한 상세가 도 4 ~ 6과 관련하여 아래에 제공된다. 오디오 파일(114) 내의 오디오 이벤트들이 식별되면, 루틴(200)은 동작 210에서 동작 212로 진행한다.

동작 212에서, 오디오 동기화 컴포넌트(112)는 동작 202에서 상기와 같이 정의된 슬라이드 쇼 이벤트들을 동작 208에서 식별된 오디오 이벤트들과 동기화시킨다. 특히, 일 구현에 따르면, 오디오 동기화 컴포넌트(112)는 정의된 슬라이드 쇼 이벤트들의 타이밍을 식별된 오디오 이벤트들에 대응하도록 조정한다. 일 구현에서, 이러한 것은 위의 동작 206에서 선택된 오디오 동기화 스킴(110)을 사용하여 행하여진다. 선택된 오디오 동기화 스킴(110)의 콘텐츠에 기초하여, 오디오 이벤트들은 대응하는 슬라이드 쇼 이벤트의 시작 또는 끝과 동기될 수 있거나, 오디오 이벤트들의 전부 또는 서브세트가 슬라이드 쇼 이벤트들과 동기될 수 있거나 또는 슬라이드 쇼 이벤트들이 오디오 이벤트들와 어떻게 동기화되어 원하는 "무드"를 제공하는지에 대한 다른 수정들도 이루어질 수 있다.

슬라이드 쇼 이벤트들이 식별된 오디오 이벤트들과 동기화되었다면, 루틴(200)은, 오디오 동기화 컴포넌트에 의해 수행된 동기화를 수동으로 조정할 기회가 사용자에게 제공되는 동작 212로 계속된다. 예를 들어, 일 구현에서, 사용자가 슬라이드 쇼 이벤트들과 오디오 이벤트들 간의 동기화를 수동으로 조정할 수 있는 사용자 인터페이스가 제공된다. 이러한 프로세스를 수행하는 하나의 예시적인 사용자 인터페이스가 도 7과 관련하여 아래에 설명된다. 사용자가 임의의 조정을 한 경우, 오디오 파일(114) 및 슬라이드 쇼 이벤트들은 동시에 재생될 수 있다. 동작 212로부터, 루틴(200)은 동작 214로 계속되어 그곳에서 종료된다.

도 4는 오디오 파일(114) 내의 하나 이상의 오디오 이벤트들(410)을 식별하기 위해 본원에 제공된 하나의 예시적인 프로세스의 개요를 나타낸다. 위에서 간단히 언급된 바와 같이, 오디오 이벤트들(410)은 비트들, 악기에 의한 절들, 조용한 절들 및 기타들과 같이, 오디오 파일 내의 중요한 가청 이벤트들이 위치하는 시간 포인트들을 나타낸다. 오디오 파일(114) 내의 오디오 시작들(406)의 위치를 찾을 수 있는 오디오 시작 검출 프로세스(404)를 수행함으로써 오디오 이벤트들(410)이 식별된다. 오디오 시작들(406)은 특정 주파수에서의 오디오 에너지 레벨이 특정한 임계값 아래 또는 위로 상승하는 오디오 파일 내의 시간 포인트들이다. 일 실시예에서 이용되는 예시적인 오디오 시작 검출 프로세스(404)에 관한 상세는 도 5 및 6과 관련하여 아래에 제공될 것이다.

일 구현에서, 필터링 프로세스(408)는 위치를 찾은 오디오 시작(406)을 필터링하는데 이용되어 동기화를 위한 적절한 수의 오디오 이벤트들(410)을 제공한다. 이는, 미가공(raw) 오디오 시작 시간들이 유명한 음악 내에서 종종 밀접하게 근접해 있기 때문이다. 따라서, 오디오 시작 검출 프로세스(404)에 의해 식별된 오디오 시작들(406)은 필터링 프로세스(408)에 의해 더 처리되어 동기화를 위한 오디오 시작들(406)의 적절한 서브세트를 선택한다. 실시예들에 따르면, 필터링 프로세스(408)는 오디오 시작들(406) 간의 평균 간격, 평균 간격들로부터의 편차, 오디오 시작들(406)의 세기 또는 다른 인자들을 활용하여 오디오 시작들(406)을 적절한 수의 오디오 이벤트들(410)로 필터링한다.

도 5를 참조하면, 도 4와 관련하여 위에서 간략하게 언급된 오디오 시작 검출 프로세스(404)를 수행하기 위한 예시적인 소프트웨어 아키텍쳐(502)가 설명될 것이다. 도 5에 도시된 구현에서, 오디오 파일(114)이 찾아지고 WAV 오디오 포맷의 미가공 오디오 샘플들의 연속적인 스트림으로 변환된다. 이는, MICROSOFT DIRECTSHOW 기술을 활용하여 오디오 데이터를 파형 샘플들로 디코딩하는 MEDIAGRAPH 클래스(504)에 의해 이루어진다.

MEDIAGRAPH 클래스(504)에 의해 출력된 오디오 샘플 스트림은, 샘플들에 대해 STFT(Short-Time Fourier Transform)을 수행하여 주파수 스펙트럼들의 스트림을 얻는 시간-주파수 변환기(506)로 입력된다. 일 구현에서, 시간-주파수 변환기(506)는 오디오 샘플들의 스트림에 대해 슬라이딩 윈도우로서 역할하는 버퍼를 유지한다. 버퍼가 차면, 시간-주파수 변환기(506)는 먼저 데이터에 대해 윈도윙 함수(windowing function)를 적용하여 버퍼의 양쪽 끝의 데이터가 0에 근접하게 한다. 그 후, FFT(Fast Fourier Transform) 알고리즘을 이용하여 윈도우된 데이터에 푸리에 변환을 적용한다. 슬라이딩 윈도우 역할을 하는 버퍼는 그 후 새로운 오디오 샘플들을 수용하도록 앞쪽으로 이동한다.

윈도잉 함수의 적용에 의한 에너지 감쇠를 보상하기 위해, 일 실시예에서 슬라이딩 윈도우는 전체 버퍼 크기에 대해 전진하지는 않는다. 대신, 부분적인 윈도우 전진을 허용하기 위해 중첩 인자가 명시될 수 있다. 일 구현에서, 시간-주파수 변환기(506)는 다음의 파라미터들; 2048 샘플들의 버퍼 크기; 해밍(Hamming) 윈도잉 함수; 및 0.5의 중첩 인자를 사용한다. 이 구현은 이러한 파라미터들의 용이한 맞춤화(easy customization)을 허용할 수도 있다. 예를 들어, 한(Hann) 윈도잉 함수 및 0.75의 중첩 인자가 대신 이용될 수 있다. 해밍 및 한 윈도잉 함수들은 본 기술 분야의 당업자에게 알려져 있다.

시간-주파수 변환기(506)로부터의 주파수 스펙트럼들의 스트림은 몇몇 서브밴드들에 대응하는 에너지 값들의 스트림들로 변환된다. 이러한 것은, 각각의 서브밴드 주파수 범위에 대응하는 FFT 출력 빈(bin)들의 크기들을 제곱하고(squaring) 그들을 함께 합산함으로써 수행된다. 도 5에 예시된 구현에서, 4개의 서브밴드; 22㎐ ~ 256㎐, 256㎐ ~ 2048㎐, 2048㎐ ~ 8192㎐ 및 8192㎐ ~ 22050㎐ (44100㎐의 오디오 샘플링 레이트를 가정할 경우)가 존재한다. 서브밴드 범위들은 임의의 서브밴드 분할을 명시하도록 수정될 수 있다는 것을 이해하여야 한다.

에너지 값 스트림들의 각각은 대응하는 시작 검출기(508A ~ 508D)로 입력된다. 각각의 시작 검출기(508A ~ 508D)는 시간 값들의 리스트, 오디오 시작들(406A ~ 406D) - 그들의 대응 에너지 값들과 함께 급격한 에너지 변화들이 발생함 - 를 생성한다. 오디오 시작 수집기(audio onset aggregator)(510)는 이러한 서브밴드 시작들(406A ~ 406D)을 한 세트의 오디오 시작들(406E)로 결합시킨다. 시작 검출기들(508A ~ 508D)의 동작에 관한 추가적인 상세는 도 6과 관련하여 아래에 제공된다.

도 6을 참조하여, 시작 검출기(508)에 관한 추가적인 상세가 제공될 것이다. 도 6에 도시된 바와 같이, 각각의 시작 검출기(508)는 소스 필터(602)를 포함한다. 소스 필터(602)는 입력 값 스트림들을 수신하고 데이터 값들에 시간 인덱스들을 부착한다. 각각의 시작 검출기(508)는 또한 메디안 필터(604)를 포함한다. 메디안 필터(604)(median filter)는 소스 필터(602)로부터 타임드(timed) 데이터 스트림을 수신하고 입력 데이터의 이동 메디안 평균(moving median average)을 연산한다. 이러한 이동 메디안의 윈도우 크기는 맞춤화가능하다.

메디안 필터(604)의 출력은 피크 검출기(606)에 대한 임계 곡선으로서 이용된다. 피크 검출기(606)는 소스 필터(602)의 출력을 데이터 입력으로서 수신하고 메디안 필터(604)의 출력을 임계 입력으로서 수신한다. 피크 검출기(606)는 데이터 중에서 임계값 위의 피크들을 식별한다. 피크 검출기(606)의 출력은 시작 검출기(508)의 출력이다. 도 5 ~ 6을 참조하여 설명되는 소프트웨어 아키텍쳐 및 방법은 단순히 예시적인 것이며, 오디오 파일(114) 내의 오디오 이벤트들(410)을 식별하는데 다른 기술들이 이용될 수 있다.

도 7을 참조하여, 오디오 파일 내의 오디오 이벤트들을 볼 수 있고 오디오 이벤트들을 프레젠테이션 문서 내의 슬라이드 쇼 이벤트들에 수동으로 할당하는 예시적인 사용자 인터페이스(700)가 설명될 것이다. 도 7에 도시된 바와 같이, 일 실시예에서, 사용자 인터페이스(700)는 다수의 레인(lane)(702A ~ 702D)을 포함한다. 레인(702A)는 오디오 파일(114)의 컨텐츠의 그래픽 표현을 파형(704) 형태로 제공한다. 오디오 파일(114) 내의 식별된 오디오 이벤트들(410)에 대응하는 하나 이상의 표시자(706A ~ 706G)가 파형(704)과 함께 디스플레이된다. 표시자들(706A ~ 706G)은 오디오 파일(114) 내의 식별된 오디오 이벤트 각각의 위치를 그래픽으로 표현한다.

레인들(702B ~ 702D)는 임의의 정의된 슬라이드 쇼 이벤트들의 타이밍을 그래픽으로 나타낸다. 예를 들어, 도 7에 도시된 예에서, 슬라이드 쇼 이벤트 시간 개체들(708A ~ 708C)는 3개의 슬라이드 쇼 이벤트들에 대응하는 레인들(702A ~ 702D) 내에 디스플레이된다. 슬라이드 쇼 이벤트 시간 개체들(708A ~ 708C)의 각각의 폭은 이벤트의 기간을 그래픽으로 표현한다.

타임라인(710)과 관련한 각각의 슬라이드 쇼 이벤트 시간 개체(708A ~ 708C)의 위치는, 대응하는 슬라이드 쇼 이벤트가 수행될 시간을 나타낸다. 도 7에 도시된 예에서, 이벤트 시간 개체(708A)가 표시자(706B)와 정렬되어, 대응하는 슬라이드 쇼 이벤트가 표시자(706B)에 대응하는 오디오 이벤트의 시간에 트리거될 것이라는 것을 표시한다. 이벤트 시간 개체(708B)가 표시자(706D)와 정렬되어, 대응하는 슬라이드 쇼 이벤트가 표시자(706D)에 대응하는 오디오 이벤트의 시간에 트리거될 것이라는 것을 표시한다. 이벤트 시간 개체(708C)가 표시자(706F)와 정렬되어, 대응하는 슬라이드 쇼 이벤트가 표시자(706F)에 대응하는 오디오 이벤트의 시간에 트리거될 것이라는 것을 표시한다. 그러므로, 사용자 인터페이스(700)가 오디오 이벤트들이 오디오 동기화 컴포넌트(112)에 의해 슬라이드 쇼 이벤트들과 동기화되는 방법에 대한 그래픽 뷰를 제공한다는 것을 이해하여야 한다.

일 실시예에 따르면, 도 7에 도시된 사용자 인터페이스(700)는 또한 사용자가 파형(704) 상에 표현된 오디오 이벤트들과 슬라이드 쇼 이벤트들과의 동기화를 수동으로 조정할 수 있게 하는 기능을 제공한다. 예를 들어, 적절한 사용자 입력 디바이스를 이용하면, 사용자는 이벤트 시간 개체들(708A ~ 708C) 중 하나를 타임라인(710)을 따라 이동시킬 수 있다. 이에 응답하여, 이벤트 시간 개체의 시작 및/또는 종료 시간은 파형(704) 상에 나타난 오디오 이벤트들에 대응하는 표시자들(706A ~ 706G)에 "스냅(snap)"될 것이다. 이러한 방식에서, 본원에 제공된 사용자 인터페이스(700)는 사용자가 오디오 파일(114) 내에 식별된 임의의 오디오 이벤트(410)와 슬라이드 쇼 이벤트를 시각적으로 연관시킬 수 있게 한다. 도 7에 도시된 사용자 인터페이스(700)는 단순히 예시적인 것이며 다른 유형의 사용자 인터페이스 구현들이 이러한 기능을 제공하는데 사용될 수 있다.

도 8은 슬라이드 쇼 이벤트들과 오디오 이벤트들을 앞서 제시한 방식으로 동기화하기 위해 본원에 설명된 소프트웨어 컴포넌트들을 실행할 수 있는 컴퓨터(800)을 위한 예시적인 컴퓨터 아키텍쳐를 나타낸다. 도 8에 도시된 컴퓨터 아키텍쳐는 종래의 데스크톱, 랩톱 또는 서버 컴퓨터를 예시하고 본원에 설명된 프레젠테이션 애플리케이션(102)의 임의의 양상들을 실행하는데 활용될 수 있다. 상술한 바와 같이, 컴퓨터(800)는 또한 애니메이션 효과들, 시각적 효과들 또는 이행들을 오디오 이벤트들과 동기화하기 위한, 본원에 제시된 개념들을 채용하는 다른 유형들의 애플리케이션 프로그램들을 실행할 수 있다.

도 8에 도시된 컴퓨터 아키텍쳐는 중앙처리장치(802)(CPU), RAM(random access memory)(814) 및 ROM(read only memory)(816)를 포함하는 시스템 메모리(808), 및 메모리를 CPU(802)에 연결시키는 시스템 버스(804)를 포함한다. 기동 동안과 같이 컴퓨터(800) 내의 구성요소들 간에 정보를 전달하는데 도움을 주는 기본 루틴들을 포함하는 기본 입력/출력 시스템은 ROM(816)에 저장된다. 컴퓨터(800)는 본원에서 보다 상세하게 설명되는, 운영 체제(818), 애플리케이션 프로그램들 및 다른 프로그램 모듈들을 저장하는 대용량 저장 장치(810)를 더 포함한다.

대용량 저장 장치(810)는 버스(804)에 접속된 대용량 저장장치 제어기(도시 안됨)을 통해 CPU(802)에 접속된다. 대용량 저장 장치(810) 및 그와 연관된 컴퓨터 판독가능한 매체들은 컴퓨터(800)에 대해 비휘발성 저장장치를 제공한다. 본원에 포함된 컴퓨터 판독가능한 매체들의 설명이 하드 디스크 또는 CD-ROM 드라이브와 같은 대용량 저장 장치를 지칭하더라도, 컴퓨터 판독가능한 매체들은 컴퓨터(800)에 의해 액세스될 수 있는 임의의 이용가능한 컴퓨터 저장 매체들일 수 있다는 점을 본 기술분야의 당업자는 이해할 것이다.

한정이 아닌 예로서, 컴퓨터 판독가능한 매체들은, 컴퓨터 판독가능한 명령어들, 데이터 구조들, 프로그램 모듈들 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 착탈형 및 비착탈형 매체들을 포함할 수 있다. 예를 들어, 컴퓨터 판독가능한 매체들은 RAM, ROM, EPROM, EEPROM, 플래시 메모리 또는 다른 고상 메모리 기술, CD-ROM, DVD(digital versatile disks), HD-DVD, BLU-RAY, 또는 다른 광학 저장장치, 자기 카세트들, 자기 테이프, 자기 디스크 저장장치 또는 기타 자기 저장 장치들 또는 원하는 정보를 저장하는데 사용되고 컴퓨터(800)에 의해 액세스될 수 있는 임의의 기타 매체를 포함하나, 이에 한정되지 않는다.

다양한 실시예들에 따르면, 컴퓨터(800)는 네트워크(820)와 같은 네트워크를 통해 원격 컴퓨터들로의 논리적 접속들을 이용하는 네트워크화된 환경에서 동작할 수 있다. 컴퓨터(800)는 버스(804)에 접속된 네트워크 인터페이스 유닛(806)을 통해 네트워크(820)에 접속될 수 있다. 네트워크 인터페이스 유닛(806)은 또한 다른 유형들의 네트워크들 및 원격 컴퓨터 시스템들에 접속하는데 활용될 수 있다는 것을 이해하여야 한다. 컴퓨터(800)는 또한 키보드, 마우스 또는 전자 스타일러스(도 8에 도시되지 않음)을 포함하는, 다수의 다른 디바이스들로부터의 입력을 수신하고 처리하기 위한 입력/출력 제어기(812)를 포함할 수 있다. 유사하게, 입력/출력 제어기는 디스플레이 스크린, 프린터 또는 기타 유형의 출력 디바이스(마찬가지로 도 8에 도시 안됨)로의 출력을 제공할 수 있다.

위에서 간략하게 언급된 바와 같이, 네트워크화된 데스크톱, 랩톱 또는 서버 컴퓨터의 동작을 제어하는데 적합한 운영 체제(818)를 포함하는, 다수의 프로그램 모듈 및 데이터 파일들이 컴퓨터(800)의 RAM(814) 및 대용량 저장 장치(810)에 저장될 수 있다. 대용량 저장 장치(810) 및 RAM(814)은 또한 하나 이상의 프로그램 모듈들을 저장할 수 있다. 특히, 대용량 저장 장치(810) 및 RAM(814)은 슬라이드 쇼 이벤트들과 오디오 이벤트들을 동기화하기 위한, 본원에 설명된 기능을 제공하는 프레젠테이션 애플리케이션(102)을 저장할 수 있다. 대용량 저장 장치(810) 및 RAM(814)은 또한 오디오 동기화 스킴들(110) 및 프레젠테이션 문서(104)를 저장할 수 있고, 이들 모두는 위에서 설명되었다.

앞선 설명에 기초하면, 슬라이드 쇼 이벤트들을 오디오 이벤트들과 동기화하는 기술들이 본원에 제공된다는 것을 이해할 것이다. 본원에 제시된 대상이 컴퓨터 구조적 특징들, 방법론적인 액트(act)들, 및 컴퓨터 판독가능한 매체들에 특정한 언어로 설명되었지만, 첨부된 청구범위에 정의된 발명이 본원에 설명된 특정 특징들, 액트들 또는 매체들로 반드시 한정되는 것이 아니라는 것을 이해하여야 한다. 오히려, 특정 특징들, 액트들 및 매체들은 청구범위를 구현하는 예시적인 형태들로 개시된다.

상술한 대상은 단지 예시적인 것이며 한정으로 해석되어서는 안된다. 예시되고 설명된 예시적인 실시예들 및 애플리케이션들을 따르지 않고, 다음의 청구범위에서 제시되는 본원의 진정한 사상 및 범위로부터 벗어나지 않고 본원에 설명된 대상에 대해 다양한 수정들 및 변화들이 이루어질 수 있다.

Claims

하나 이상의 애니메이션 이벤트들(107)을 하나 이상의 오디오 이벤트들(410)과 동기화하는 방법으로서,
상기 애니메이션 이벤트들(107)을 정의하는 단계;
상기 오디오 이벤트들(410)을 식별하기 위해 오디오 파일(114)을 처리하는 단계; 및
오디오 동기화 스킴(scheme)(110)을 사용하여 상기 애니메이션 이벤트들(107)을 식별된 오디오 이벤트들(410)에 동기화시키는 단계
를 포함하는 방법.
제1항에 있어서,
상기 오디오 이벤트들을 식별하기 위해 오디오 파일을 처리하는 단계는, 포함된 하나 이상의 오디오 시작들(audio onsets)을 식별하기 위해 상기 오디오 파일을 처리하는 단계 및 상기 오디오 이벤트들을 식별하기 위해 상기 오디오 시작들을 필터링하는 단계를 포함하는 방법.
제1항에 있어서,
상기 오디오 동기화 스킴은 상기 오디오 이벤트들이 상기 애니메이션 이벤트들과 어떻게 동기화될 것인지를 정의하는 데이터를 포함하는 방법.
제2항에 있어서,
상기 데이터는 각각의 오디오 이벤트 및 대응하는 애니메이션 이벤트 간의 오프셋을 명시하는 방법.
제2항에 있어서,
상기 데이터는 각각의 오디오 이벤트가 대응하는 애니메이션 이벤트의 시작 또는 끝과 동기화될 지 여부를 명시하는 방법.
제2항에 있어서,
상기 데이터는 상기 오디오 이벤트들의 전부 또는 단지 서브세트만이 상기 애니메이션 이벤트들과 동기화할지 여부를 명시하는 방법.
제6항에 있어서,
상기 데이터는 상기 오디오 이벤트들의 상기 서브세트가 어떻게 선택되는지를 명시하는 방법.
컴퓨터에 의해 실행될 때, 제1항의 방법을 컴퓨터가 수행하게 하는 컴퓨터 판독가능한 명령어들이 저장된 컴퓨터 판독가능한 매체.
프레젠테이션 문서(106) 내에 정의된 하나 이상의 슬라이드 쇼 이벤트들(107)을 하나 이상의 오디오 이벤트들(410)과 동기화시키는 방법으로서,
프레젠테이션 애플리케이션 프로그램(102) 내의 상기 슬라이드 쇼 이벤트들(107)을 정의하는 사용자 입력을 수신하는 단계;
오디오 파일(114)을 수신하는 단계;
상기 슬라이드 쇼 이벤트들(107)을 상기 오디오 파일(114) 내의 오디오 이벤트들(410)과 동기화시키는 요청 및 상기 슬라이드 쇼 이벤트들(107)을 상기 오디오 이벤트들(410)과 동기화시키는데 사용하기 위한 오디오 동기화 스킴(110)의 식별을 수신하는 단계;
상기 요청에 응답하여, 상기 오디오 이벤트들(410)을 식별하기 위해 상기 오디오 파일(114)을 처리하는 단계; 및
식별된 오디오 동기화 스킴(110)을 사용하여, 상기 슬라이드 쇼 이벤트들(107)을 식별된 오디오 이벤트들(410)에 동기화시키는 단계
를 포함하는 방법.
제9항에 있어서,
상기 슬라이드 쇼 이벤트들은 애니메이션 이벤트들을 포함하는 방법.
제9항에 있어서,
상기 슬라이드 쇼 이벤트들은 슬라이드 이행들(slide transitions)을 포함하는 방법.
제9항에 있어서,
상기 슬라이드 쇼 이벤트들은 상기 프레젠테이션 문서 내의 개체에 대한 시각적 효과들의 적용을 포함하는 방법.
제9항에 있어서,
상기 오디오 파일을 표현하는 파형을 포함하는 사용자 인터페이스를 디스플레이하는 단계; 및
식별된 오디오 이벤트들에 대응하는 하나 이상의 표시자들을 상기 파형 상에 디스플레이하는 단계
를 더 포함하는 방법.
제13항에 있어서,
상기 사용자 인터페이스는 상기 슬라이드 쇼 이벤트들 각각에 대응하는 슬라이드 쇼 이벤트 시간 개체를 더 포함하고, 각각의 슬라이드 쇼 이벤트 시간 개체는 상기 파형 상에 디스플레이된 표시자에 스냅(snap)될 수 있는 방법.
컴퓨터에 의해 실행될 때, 제9항의 방법을 컴퓨터가 수행하게 하는 컴퓨터 판독가능한 명령어들이 저장된 컴퓨터 판독가능한 매체.
제1항에 있어서,
상기 오디오 동기화 스킴은 상기 오디오 이벤트들이 상기 애니메이션 이벤트들과 어떻게 동기화될 것인지를 정의하는 데이터를 포함하는 방법.
하나 이상의 애니메이션 이벤트들(107)을 하나 이상의 오디오 이벤트들(410)과 동기화시키는 데 사용하기 위한 데이터 구조(110)를 저장하는 컴퓨터 판독가능한 매체로서,
상기 데이터 구조(110)는,
상기 오디오 이벤트들(410)이 상기 애니메이션 이벤트들(107)에 어떻게 동기화될 지를 정의하는 데이터를 저장하는 제1 데이터 필드
를 포함하고,
상기 제1 데이터 필드에 저장된 데이터는 상기 애니메이션 이벤트들(107)이 상기 오디오 이벤트들(410)과 어떻게 동기화될 지를 결정하기 위해 프레젠테이션 애플리이션(102)에 의해 소비되는 컴퓨터 판독가능한 매체.
제17항에 있어서,
상기 데이터 구조는 각각의 오디오 이벤트와 대응하는 애니메이션 이벤트 간의 오프셋을 명시하는 데이터를 저장하는 제2 데이터 필드를 더 포함하는 컴퓨터 판독가능한 매체.
제18항에 있어서,
상기 데이터 구조는 각각의 오디오 이벤트가 대응하는 애니메이션 이벤트의 시작 또는 끝과 동기화되어야 할 지 여부를 명시하는 데이터를 저장하는 제3 데이터 필드를 더 포함하는 컴퓨터 판독가능한 매체.
제19항에 있어서,
상기 데이터 구조는 상기 오디오 이벤트들의 전부 또는 서브세트만이 상기 애니메이션 이벤트들과 동기화되어야 할 지 여부 및 상기 오디오 이벤트들의 서브세트가 어떻게 선택되는지를 명시하는 데이터를 저장하는 제4 데이터 필드를 더 포함하는 컴퓨터 판독가능한 매체.