KR20150070039A - 오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치 - Google Patents

오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치 Download PDF

Info

Publication number
KR20150070039A
KR20150070039A KR1020140181838A KR20140181838A KR20150070039A KR 20150070039 A KR20150070039 A KR 20150070039A KR 1020140181838 A KR1020140181838 A KR 1020140181838A KR 20140181838 A KR20140181838 A KR 20140181838A KR 20150070039 A KR20150070039 A KR 20150070039A
Authority
KR
South Korea
Prior art keywords
audio
samples
frames
type information
ptren
Prior art date
Application number
KR1020140181838A
Other languages
English (en)
Inventor
시릴 켕키스
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=50780558&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20150070039(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20150070039A publication Critical patent/KR20150070039A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4392Processing of audio elementary streams involving audio buffer management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal

Abstract

본 발명은 오디오 및/또는 시청각 콘텐츠의 수신기(PVR)에서의 오디오 콘텐츠 복원 방법과 관련되며, 상기 수신기(PVR)는 상기 오디오 콘텐츠의 복원에 적합하고, 상기 오디오 콘텐츠는 인코딩된 상태로 수신되고, 오디오 샘플들(SAn)의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 한 부분에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함한다. 하나의 특정 실시예에 따르면, 상기 오디오 콘텐츠 복원 방법은, 상기 프레임들로부터 오디오 샘플들을 선택하는 단계 - 상기 선택된 오디오 샘플들은 상기 포인터 타입 정보로부터 식별됨 - 와 상기 선택된 샘플들만을 복원하는 단계를 포함한다.

Description

오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치{METHOD FOR ACCELERATED RESTITUTION OF AUDIO CONTENT AND ASSOCIATED DEVICE}
본 발명은 시청각 콘텐츠의 아이템들의 복원의 분야에 관한 것으로서, 구체적으로는 오디오 컴포넌트의 가속화된 복원에 관한 것이다.
시청각 콘텐츠의 수신 및 복원을 위한 많은 장치는 수신시에 시청각 콘텐츠의 아이템에 대한 국지적 기록 및 그의 후속 복원을 가능하게 하도록 구성된다. 이러한 장치들은 종종 하드 드라이브들 또는 하드 드라이브 저장 유닛과 동등한 판독 및 기입 기능들을 특징으로 하는 플래시 메모리 모듈들과 같은 기록 모듈들을 구비한다.
게다가, 그러한 장치의 사용자들은 기록된 시청각 콘텐츠의 아이템을 그들이 원하고 여유가 있는 시간에 언제든지 볼 수 있다.
때때로, 사용자는 시청각 콘텐츠의 아이템을 볼 시간이 있다고 생각하고, 이를 보기 시작하며, 그 후에 시간이 충분하지 않은 경우에는 가속 방식으로 보기를 원한다.
복원 품질을 저하하지 않고서, 즉 사용자가 가속 디스플레이 효과를 인식하지 못하고, 오디오 컴포넌트가 그 본래의 지속기간보다 짧은 시간 동안에 발생하는 복원에 의해 변형되지 않고서, 콘텐츠가 가속 방식으로 관찰되는 것을 가능케 하는 방법들이 존재한다.
이러한 기술들은 비디오와 관련하여 시간에 걸쳐 적절히 분산되는 일부 이미지들을 제거하며, 오디오와 관련해서는 가속 오디오 복원에 대한 특정 기술들을 이용한다.
오늘날, 일부 수신, 기록 및 복원 장비를 이용하여, 예를 들어 1시간짜리 시청각 콘텐츠를 40분에 보는 것이 가능하다.
오디오의 고속 복원, 즉 그의 명목 지속기간보다 짧은 지속기간에서의 복원과 관련하여, 이용 기술들을 3개의 동작 방식으로 분류하는 것이 가능하다.
제1 기술은 콘텐츠의 오디오 컴포넌트를 비디오 컴포넌트와 동일한 속도로 판독하는 것이며, 이는 인코딩된 오디오 컴포넌트에 의해 톤 왜곡을 유발한다. 가속은 오디오 복원을 더 높은 피치로 시프트시킨다.
이러한 제1 기술은 복원 품질의 과도한 저하를 유발하므로 비즈니스 관점에서 수용 불가한 것으로 간주된다.
제2 기술은 고속 복원 동안 톤의 변경이 발생하지 않도록, 인코딩된 오디오 컴포넌트를 처리하는 것이다. 이것은 예를 들어, 오디오 컴포넌트가 더 빠르게 복원되고, 주파수 전위가 오디오 샘플에 적용되는 경우이다.
이러한 제2 기술은 오디오 복원 품질 면에서는 수용 가능한 결과를 생성하지만, 모든 처리가 수행됨으로 인해 상당한 프로세서 및 메모리 자원을 필요로 하며, 이는 시스템 부하 관점에서, 특히 실시간 멀티태스킹 환경에서 불리하다.
제3 기술은 오디오 복원을 가속화하는 한편, 오디오 컴포넌트들을 구성하는 오디오 프레임들의 부분들을 제거하는 것이다. 이러한 방법은 예를 들어 WSOLA("Waveform-similarity-based Synchronised OverLap-Add") 알고리즘을 이용하는 공지된 처리에 대응한다.
이러한 제3 기술은 이전의 기술과 같이 만족스런 결과를 달성하지만, 수신 및 복원 장치가 그의 프로세서 및 메모리 자원들의 한계에서 동작할 때 여전히 많은 자원을 필요로 한다.
본 발명은 시청각 콘텐츠의 아이템의 복원을 그의 명목 지속기간보다 짧은 기간 내에 가속화하기 위한 방법, 및 특히 수신 및 복원 장치들에서가 아니라 인코딩 레벨에서 필요한 소정의 처리를 수행하는 가속화된 오디오 복원 방법을 제안함으로써 종래 기술을 개선한다.
본 발명은 특히 오디오 및/또는 시청각 콘텐츠의 수신기(PVR)에서의 오디오 콘텐츠 복원 방법과 관련되며, 상기 수신기는 상기 오디오 콘텐츠의 복원에 적합하고, 상기 오디오 콘텐츠는 인코딩된 상태로 수신되고, 오디오 샘플들의 연속 프레임들 및 상기 프레임들의 오디오 샘플들의 적어도 한 부분에 대한 포인터 타입 정보를 포함한다.
하나의 특정 실시예에 따르면, 상기 방법은,
상기 프레임들로부터 오디오 샘플들을 선택하는 단계 - 상기 선택된 오디오 샘플들은 상기 포인터 타입 정보로부터 식별됨 - 와,
상기 선택된 샘플들만을 복원하는 단계
를 포함한다.
실시예들에 따르면, 이것은 예를 들어 디지털 오디오 또는 비디오 드라이브와 같은, 수신기 장치 외부의 저장소를 포함하는 매체 상에 저장된 오디오 또는 시청각 콘텐츠, 또는 통신 네트워크로부터 스트림 내에서 수신된 오디오 또는 비디오 콘텐츠의 아이템의 복원일 수 있다.
하나의 특정 실시예에 따르면, 상기 수신기는 명목 복원 속도 및 상기 명목 복원 속도보다 높은 적어도 하나의 복원 속도에서의 상기 오디오 콘텐츠의 복원에 적합하며, 상기 선택된 샘플들만의 상기 복원은 상기 명목 값보다 높은 상기 적어도 하나의 복원 속도 중 하나로 수행된다.
아래 단락들에서, 포인터 타입 정보 또는 포인터들은 복수의 아이템 중에서 하나의 아이템을 식별하는 데 유용한 임의의 정보를 의미하는 것으로 이해된다. 따라서, 포인터는 용어 "마커"에도 대응하며, 순위, 위치, 인덱스, 주소 또는 시간적 참조일 수 있지만, 이에 한정되지 않는다.
본 명세서에서 "명목 복원 지속기간에 비해 가속된 복원 지속기간"이라는 표현은 본 발명의 복원 방법의 일부 실시예들에 따른 오디오 콘텐츠 복원의 전체 지속기간이 오디오 콘텐츠에 대한 고유 복원 지속시간보다 짧다는 것을 의미한다. 예를 들어, 본 발명의 복원 방법의 일부 실시예들에 따르면, 1분의 오디오 콘텐츠가 40 내지 50초 내에 복원될 수 있다.
유리하게도, 오리지널 톤을 유지하면서도, 오디오 또는 시청각 콘텐츠의 아이템의 복원 지속기간을 줄이는 것이 가능해진다. 따라서, 사용자는 본 방법에 따라 복원된 수신 시청각 콘텐츠의 아이템을 그의 명목 지속기간보다 짧은 시간에, 예를 들어 더 높은 음역으로의 시프트와 같은 톤의 변형을 전혀 인식하지 못하고 시청할 수 있다.
하나의 특정 실시예에 따르면, 상기 포인터 타입 정보는 헤더 패킷들 내에 포함되며, 상기 헤더 패킷들 각각은 상기 프레임들 중 하나와 관련된다.
하나의 특정 실시예에 따르면, 상기 포인터 타입 정보는 복원 또는 절단될 일련의 샘플들의 시작을 식별하는 정보 및/또는 복원 또는 절단될 일련의 샘플들의 끝을 식별하는 정보를 포함한다.
하나의 특정 실시예에 따르면, 복원 방법은 적어도 하나의 제1 오디오 샘플과 적어도 하나의 제2 오디오 샘플을 혼합하는 단계를 더 포함하고, 상기 적어도 하나의 제1 및 상기 적어도 하나의 제2 오디오 샘플들은 오디오 샘플들에 대한 상기 포인터 타입 정보로부터 선택된다.
하나의 특정 실시예에 따르면, 상기 제1 및 제2 샘플들의 상기 혼합은 상기 제1 및 제2 샘플들의 평균값을 계산함으로써 수행된다.
하나의 특정 실시예에 따르면, 오디오 샘플들에 대한 상기 포인터 타입 정보는 복원 또는 절단될 샘플들과 관련된 포인터들 및 혼합될 선택된 샘플들과 관련된 포인터들을 포함한다.
하나의 특정 실시예에 따르면, 상기 포인터 타입 정보는 혼합될 일련의 샘플들의 시작을 식별하는 정보 및/또는 혼합될 일련의 샘플들의 끝을 식별하는 정보를 포함한다.
하나의 특정 실시예에 따르면, 상기 헤더 패킷들 각각은 포인터 타입 정보의 여러 세트를 포함하고, 상기 세트들 각각은 상기 명목 복원 속도보다 높은 상기 복원 속도의 하나의 가능한 값과 각각 관련된다.
하나의 특정 실시예에 따르면, 복원 방법은 WSOLA 방법에 기초하여 연속 오디오 샘플들을 변경하기 위한 알고리즘을 이용한다.
명확히 설명되지는 않지만, 제공되는 실시예들은 임의의 조합 또는 하위 조합을 이용하여 구현될 수 있다. 예를 들어, 헤더 패킷들 각각이 명목 복원 속도보다 큰 여러 개의 가능한 복원 속도 값과 각각 관련된 여러 개의 포인터 타입 정보를 포함하는 복원 방법의 일 실시예는 복원 방법이 적어도 하나의 제1 오디오 샘플과 적어도 하나의 제2 오디오 샘플을 포함하는 단계를 포함하고, 적어도 하나의 제1 오디오 샘플 및 적어도 하나의 제2 오디오 샘플은 오디오 샘플들에 대한 포인터 타입 정보로부터 선택되는 실시예와 결합될 수 있다.
본 명세서를 검토할 때 이 분야의 기술자들이 쉽게 상상할 수 있는 다른 실시예들도 본 발명의 범위 내에 포함된다.
특히, 본 발명은 WSOLA 방법에 기초하여 인코딩되는 연속 오디오 샘플들의 복원으로 한정되지 않는다.
또 다른 양태에 따르면, 본 발명은 시청각 및/또는 오디오 콘텐츠의 수신기 디코더에 관한 것으로서, 상기 수신기 디코더는 오디오 콘텐츠의 아이템의 복원을 위해 구성되는 적어도 하나의 프로세서를 포함하고, 상기 오디오 콘텐츠는 인코딩된 상태로 수신되고 오디오 샘플들의 연속 프레임들 및 상기 프레임들의 오디오 샘플들의 적어도 일부에 대한 포인터 타입 정보를 포함한다.
하나의 특정 실시예에 따르면, 상기 적어도 하나의 프로세서는
상기 프레임들로부터의 오디오 샘플들의 선택 - 상기 선택되는 오디오 샘플들은 상기 포인터 타입 정보로부터 식별됨 - 과,
상기 선택된 샘플들만의 복원
을 위해 구성된다.
명확히 설명되지는 않지만, 상기 수신기 디코더는 본 발명의 복원 방법이 그 실시예들 중 어느 하나에서 구현되도록 구성될 수 있다.
또 다른 양태에 따르면, 본 발명은 또한 오디오 콘텐츠를 인코딩하기 위한 방법과도 관련되며, 상기 인코딩된 오디오 콘텐츠는 오디오 샘플들의 연속 프레임들 및 상기 프레임들의 오디오 샘플들의 적어도 일부에 대한 포인터 타입 정보를 포함한다.
하나의 특정 실시예에 따르면, 상기 인코딩하기 위한 방법은 복원될 오디오 샘플들을 선택하는 단계, 및 상기 선택된 오디오 샘플들을 상기 포인터 타입 정보에 의해 식별하는 단계를 포함한다.
본 발명의 일 실시예에 따르면, 상기 인코딩 방법은 WSOLA 방법에 기초하여 연속 오디오 샘플들을 변경하기 위한 알고리즘을 포함한다.
명확히 설명되지는 않지만, 상기 인코딩 방법은 전술한 복원 방법의 실시예들 중 적어도 하나와 호환되는 실시예들에서 구현될 수 있다.
또 다른 양태에 따르면, 본 발명은 또한 오디오 및/또는 시청각 콘텐츠의 인코더와 관련되며, 상기 인코더는 오디오 콘텐츠의 아이템을 인코딩하기 위해 구성되는 적어도 하나의 프로세서를 포함하고, 상기 인코딩된 오디오 콘텐츠는 오디오 샘플들의 연속 프레임들 및 상기 프레임들의 오디오 샘플들의 적어도 일부에 대한 포인터 타입 정보를 포함한다. 하나의 특정 실시예에 따르면, 상기 적어도 하나의 프로세서는 복원될 오디오 샘플들의 선택 및 상기 포인터 타입 정보에 의한 상기 선택된 오디오 샘플들의 식별을 위해 구성된다.
명확히 설명되지는 않지만, 상기 인코더는 본 발명의 인코딩 방법이 그의 실시예들 중 어느 하나에서 구현하도록 구성될 수 있다.
또 다른 양태에 따르면, 본 발명은 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램 제품과 관련되며, 상기 프로그램 코드 명령어들은 상기 프로그램이 컴퓨터에 의해 실행될 때 전술한 복원 방법을 전술한 실시예들 중 어느 하나에서 실행한다.
또 다른 양태에 따르면, 본 발명은 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램 제품과 관련되며, 상기 프로그램 코드 명령어들은 상기 프로그램이 컴퓨터에 의해 실행될 때 전술한 인코딩 방법을 전술한 실시예들 중 어느 하나에서 실행한다.
또 다른 양태에 따르면, 본 발명은 연속 오디오 샘플 프레임들 및 상기 프레임들의 오디오 샘플들의 적어도 일부에 대한 포인터 타입 정보를 포함하는 스트림을 운반하는 신호와 관련된다. 하나의 특정 실시예에 따르면, 상기 신호는 본 발명의 주제인 인코딩 방법의 특정 실시예들 중 하나에 따라 인코딩된 데이터를 포함한다.
또 다른 양태에 따르면, 본 발명은 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램을 저장하는 컴퓨터 판독 가능 매체와 관련되며, 상기 프로그램 코드 명령어들은 상기 프로그램이 컴퓨터에 의해 실행될 때 본 발명의 복원 방법 또는 본 발명의 인코딩 방법을 그들의 전술한 실시예들 중 어느 하나에서 실행한다.
그러한 컴퓨터 판독 가능 저장 매체는 컴퓨터 판독 가능 및 컴퓨터 실행 가능 프로그램 코드 명령어들을 포함하는 적어도 하나의 컴퓨터 판독 가능 저장 매체 상에 로딩되는 컴퓨터 프로그램 제품의 형태를 취할 수 있다.
따라서, 본 특허 출원에서, 컴퓨터 판독 가능 저장 매체는 정보를 저장하기 위한 고유 용량 및 그가 저장하는 정보의 복원을 가능하게 하기 위한 고유 용량을 갖는 비일시적 저장 매체인 것으로 간주된다.
컴퓨터 판독 가능 저장 매체는 예를 들어 반도체로 제조된 전자, 자기, 광학, 전자기 또는 적외선 또는 전술한 기술들의 조합으로 구현하는 시스템, 장치 또는 장비의 아이템일 수 있지만, 이에 한정되지 않는다. 본 발명의 원리들이 적용될 수 있는 컴퓨터 판독 가능 저장 매체들의 더 구체적인 예들을 제공하는 아래의 요소들, 즉 휴대용 컴퓨터 디스켓, 하드웨어 디스크, ROM(판독 전용 메모리) 타입의 메모리, EPROM(소거 및 프로그래밍 가능한 판독 전용 메모리) 타입의 소거 가능 메모리 또는 플래시 메모리, ROM 메모리(CD ROM)를 포함하는 휴대용 컴팩트 디스크, 광학 저장 장비, 자기 저장 장비, 또는 전술한 요소들의 임의의 적절한 조합은 본질적으로 예시의 목적을 위해 언급될 뿐이며, 이 분야의 기술자들이 쉽게 이해하듯이, 어떠한 경우에도 포괄적인 리스트를 구성하지 않는다.
이 분야의 기술자들이 쉽게 이해할 수 있듯이, 변형예들에 따르면, 본 발명의 양태들은 장치에 의해, 방법에 의해 또는 컴퓨터 판독 가능 저장 매체에 의해 구현될 수 있다. 따라서, 본 발명의 양태들은 소정 실시예들에서 완전 하드웨어 컴포넌트들(예를 들어, 전자 컴포넌트, 또는 컴포넌트들을 구비한 전자 카드)의 형태로 또는 (예를 들어, 펌웨어 컴포넌트들, "상주" 소프트웨어 프로그램, 마이크로코드 등을 포함하는) 완전 소프트웨어 컴포넌트들의 형태로 구현될 수 있다. 다른 실시예들은 하드웨어 컴포넌트들 및 소프트웨어 컴포넌트들 양자를 구현할 수 있다. 더욱이, 이러한 하드웨어 또는 소프트웨어 컴포넌트들은 동일한 물리적 장비 아이템 내에 구현될 수 있다.
본 명세서에서, 용어 "모듈"은 일반적으로 하드웨어 컴포넌트 또는 소프트웨어 컴포넌트 중 하나에 대응할 수 있는 컴포넌트를 지시한다. 더욱이, 본 발명의 양태들은 컴퓨터 판독 가능 저장 매체의 형태로 구현될 수 있다. 하나 이상의 컴퓨터 판독 가능 저장 매체의 임의 조합이 사용될 수 있다.
첨부 도면들을 참조하는 아래의 설명을 검토할 때 본 발명이 더 잘 이해되고, 다른 구체적인 특징들 및 장점들이 명백해질 것이다. 도면들에서:
도 1은 하나의 특정 실시예에 따른 인코딩 방법을 구현하는 인코더와 하나의 특정 실시예에 따른 복원 방법을 구현하는 수신기-레코더 장치 사이에서 시청각 콘텐츠를 전송하기 위한 시스템을 나타낸다.
도 2는 하나의 특정 실시예에 따른 복원 방법을 이용하여 도 1의 수신기 레코더 장치에 의해 복원될 인코딩된 오디오 프레임들의 연속을 나타낸다.
도 3은 하나의 특정 실시예에 따른 도 1의 수신기 레코더 장치에 의해 구현되는 복원 방법에 의해 사용되는 것과 같은 오디오 프레임 및 그의 헤더를 나타낸다.
도 4는 하나의 특정 실시예에 따른 인코딩 및/또는 복원 방법에 의해 사용되는 것과 같은 오디오 프레임 및 그의 헤더의 변형예를 나타낸다.
도 5는 하나의 특정 실시예에 따른 오디오 콘텐츠의 아이템의 복원 방법에 따라 샘플들을 선택하는 단계들을 나타내는 도면이다.
도 6은 하나의 특정 실시예에 따른 오디오 콘텐츠의 아이템의 인코딩 방법의 일부 단계들을 나타내는 도면이다.
도 1 내지 6에서, 도시된 모듈들은 물리적으로 구별 가능한 유닛들에 대응할 수 있거나 대응하지 않을 수 있는 기능 유닛들이다. 예를 들어, 이러한 모듈들 또는 그들의 일부는 단일 컴포넌트 내에 함께 그룹화되거나, 동일 소프트웨어의 기능들로 구성된다. 이와 달리, 다른 실시예들에 따르면, 일부 모듈들은 별개의 물리적 독립체들로 구성된다.
도 1은 본 발명의 하나의 특정한 비한정적인 실시예에 따른 인코딩 방법을 구현하는 인코더(E)와 본 발명의 하나의 특정한 비한정적인 실시예에 따른 복원 방법을 구현하는 수신기 레코더 장치(PVR) 사이에서 시청각 콘텐츠를 전송하기 위한 시스템을 나타낸다.
본 발명의 일 실시예에 따르면, 인코더(E)는 하나 이상의 시청각 소스로부터 신호들을 수신하고, 송신 링크(L1)에 의해 서버(S)로 전송되는 하나 이상의 디지털 스트림 내에 수신된 신호들을 인코딩한다. 시청각 콘텐츠의 하나 이상의 아이템에 대응하는 디지털 스트림들은 시청각 콘텐츠 서버(S) 상에 파일들의 형태로 저장된다.
다른 실시예들에서, 인코딩된 스트림들은 USB 드라이브, 외부 하드 드라이브 또는 컴팩트 디스크(CD)와 같은 외부 매체 상에 저장될 수 있다. 시청각 콘텐츠 수신기 레코더 장치(PVR)는 광대역 네트워크(BN)에 의해 서버(S)에 접속된다. 수신기 레코더(PVR)는 서버(S) 상에서 이용 가능한 시청각 콘텐츠를 사용자의 제어하에 선택 및 수신할 수 있도록 구성된다. 수신기 레코더(PVR)는 링크(L2)에 의해 복원 장치(D)에 더 접속된다. 복원 장치(D)는 시청각 콘텐츠의 아이템의 비디오 컴포넌트의 표시 및 시청각 콘텐츠의 아이템의 오디오 컴포넌트의 오디오 복원을 가능하게 하도록 구성된다. 장치(D)는 예를 들어 텔레비전 세트이다. 링크(L2)는 예를 들어 장비를 접속하기 위한 표준 HDMI("고화질 멀티미디어 인터페이스")와 호환되는 디지털 송신 링크이다. 수신기 디코더 장치(PVR)는 서버(S)로부터 수신되는 시청각 콘텐츠의 하나 이상의 아이템의 국지적 저장에 적합한 저장 유닛을 포함하여, 사용자가 콘텐츠의 수신 후에 수신 콘텐츠를 보는 것을 가능케 한다. 수신기 레코더 장치(PVR)는 일반적으로 TV 디코더, TV 레코더 또는 셋톱 박스라고도 하는 하나의 수신기-디코더-레코더 장비에 고유한 수신, 역다중화, 버퍼링, 처리, 디코딩 및 복원 기능들을 구현하는 모듈들 모두를 포함한다. 장치(PVR)는 특히 이 분야의 기술자들에게 공지된 모뎀-라우터 장비를 통해 광대역 네트워크에 접속하도록 구성되는 통신 인터페이스, 디멀티플렉서 모듈, 메모리 모듈, 프로세서를 포함하는 제어 유닛, 랜덤 액세스 메모리, 비휘발성 메모리, 디코딩 모듈, 및 디코딩 이후에 대한 시청각 콘텐츠 복원 모듈은 물론, 모든 관련 모듈들 및 장치들을 포함한다. 이러한 다양한 모듈들은 여기서는 상세히 설명되지 않으며, 그들의 설명은 본 발명의 이해에는 유용하지 않다. 실시예의 변형예들에 따르면, 복원 장치(D)는 수신기-레코더 장치(PVR) 내에 포함될 수 있다. 양 장치(PVR, D)는 예를 들어 데스크탑 컴퓨터, 랩탑 컴퓨터, 레코더를 갖는 텔레비전, 디스플레이 스크린을 갖는 수신기, 라디오 수신기, 하이파이 재생 채널 또는 스마트폰의 형태로 예시될 수 있다.
도 2는 본 발명에 따른 복원 방법을 이용하는 도 1의 수신기-레코더 장치에 의해 복원될 인코딩된 오디오 프레임들의 연속을 나타낸다. 본 발명의 바람직한 실시예에 따르면, 시청각 콘텐츠 서버(S) 상에서 이용 가능한 시청각 콘텐츠는 적어도 하나의 오디오 컴포넌트 및 하나의 비디오 컴포넌트를 포함한다. 오디오 컴포넌트는 오디오 스트림(S1)을 구성하는 샘플들(SA1, SA2, SA3,..., SAn, SAn +1, SAn+2,..., SAn +i 등)의 연속을 포함한다. 오디오 스트림(S1)은 프레임 모드에서 인코딩되며, 이는 수송 및 처리를 용이하게 하고, 특히 오디오 샘플들(SA1, SA2, SA3,..., SAn, SAn +1, SAn +2,..., SAn +i)의 프레임별 순차적 처리를 가능하게 한다. 스트림의 프레임 모드에서의 인코딩은 인코더(E)에 의해 수행되어, 오디오 샘플들(SA1, SA2, SA3,..., SAn, SAn +1, SAn +2,..., SAn +i)은 연속 프레임들(F1, F2, F3,..., Fn, Fn +1, Fn +2,..., Fn +j) 내에 포함된다. 프레임들(F1, F2, F3,..., Fn, Fn +1, Fn+2,..., Fn +j) 각각은 헤더를 포함하며, 이는 예를 들어 프레임 식별자, 스트림(S1)에 의해 운반되는 시청각 프로그램에 대한 식별자, 전송 에러들을 검출하기 위한 연속성 카운터, 프레임 내에 포함된 오디오 샘플들의 수의 지시자와, 예를 들어 오디오 샘플링 주파수, 스트림에 의해 영향받는 오디오 라우트들(채널들)의 수, 오디오 채널들의 수에 기초하는 프레임들 내의 샘플들의 배열과 같은 스트림의 인코딩과 관련된 정보 등과 같은 프레임들을 처리하기 위한 유용한 정보를 포함한다.
본 발명의 일 실시예에 따르면, 고유 스트림(S1)은 인코더(E)에 의한 샘플들의 선택과 관련된 정보의 삽입에 앞서 예를 들어 AC3 돌비, MPEG-1 계층 2 또는 AAC 포맷, 또는 그들의 후속물들 중 하나에 따라 인코딩된다.
일부 실시예들에서, 포인터 타입 정보는 오디오 스트림과 동시에 복원되어야 하는 비디오 스트림의 프레임들에 의해 운반될 수 있다. 다른 실시예들에서, 도시된 실시예에서와 같이, 그들은 오디오 프레임들 자체에 의해 운반될 수 있다.
따라서, 적절하게, 도시된 실시예에서, 각각의 헤더 자체는 현재 프레임 및 다음 프레임의 일부 오디오 샘플들에 대한 포인터 타입 정보를 포함하여, 서브세트의 수신기 레코더 장치(PVR)에 의한 오디오 스트림(S1)에 대응하는 오디오 컴포넌트의 복원을 위한 샘플들만의 선택을 가능케 한다.
본 발명의 실시예에 따르면, 일부 오디오 샘플들에 대한 일부 포인터들은 프레임들에 의해 운반되는 모든 샘플들로부터 선택될 일련의 샘플들의 범위를 정하는 데 사용되고, 다른 포인터들은 그들 사이에 혼합할 일련의 샘플들의 범위를 정하는데 사용된다.
유리하게, 도시된 실시예에서, 오디오 샘플들 중 일부의 생략에 대응하는 오디오 샘플들의 서브세트의 선택은 인코딩된 샘플들의 시작과 끝을 절단함으로써 복원될 샘플들의 수를 줄인다. 절단으로부터 발생하는 프레임들의 적어도 일부들이 중첩 및 혼합에 의해 연결되며, 중첩 및 혼합은 함께 이러한 동작들로부터 발생하는 오디오 콘텐츠의 복원 동안 절단의 효과들을 완화한다.
절단된 프레임들 내의 선택된 샘플들의 절단 및 연결로부터 발생하는 오디오 스트림의 복원은, 그것의 생성 동안 스트림의 샘플링 주파수에 대응하는 복원 주파수에서, 오디오 콘텐츠를 그의 명목 지속기간보다 짧은 기간 내에 복원하는 것을 가능하게 한다. 명목 지속기간은 샘플들의 서브세트의 선택이 부재할 때의 스트림의 복원을 의미하는 것으로 이해된다.
적절하게, 수신되는 스트림은 유지할 샘플들 및 혼합할 샘플들의 선택에 유용한, 일부 샘플들에 대한 포인터들의 형태의 정보를 포함한다. 포인터들은 프레임들의 헤더들 내에 존재하며, 가속 복원 속도와 관련하여 정의된다.
유리하게, 인코딩된 스트림(S1) 내의 이러한 정보의 존재는 수신기 레코더 장치(PVR)에서의 샘플들의 선택을 위해 요구되는 상당한 자원이 없어도 할 수 있도록 한다. 사실상, 예를 들어 WSOLA 알고리즘에 따르는 방법에 의해 행해지는 바와 같이 콘텐츠의 아이템의 가속 복원을 위한 샘플들을 선택하는 알고리즘의 구현은 상당한 시스템 자원들을 필요로 하며, 종종 장비(PVR)와 같은 수신기 레코더 장치의 제어 및 처리 유닛에 대한 주요한 과부하를 구성한다.
본 발명의 바람직한 실시예에 따르면, 도 2에 도시된 프레임 Fn의 헤더는 프레임 Fn 및 Fn +1의 샘플들에 대한 포인터 필드들을 포함한다. 도 2에 도시된 특정 실시예에 따르면, 이러한 포인터들은 생략될 일련의 샘플들 내의 제1 샘플 프레임에서의 위치 및 다음 프레임 Fn +1의 내의 생략될 일련의 샘플들 내의 최종 샘플의 위치를 포함한다. 이러한 포인터들은 각각 PtrBn 및 PtrEn이라고 한다. 절단으로 인해 그리고 프레임 Fn의 마지막의 남은 요소들과 프레임 Fn +1의 처음의 남은 요소들 사이에 나타나는 불연속성을 완화하기 위해, 일부 남은 요소들이 함께 혼합된다. 혼합은 예를 들어 WSOLA 알고리즘과 같이 이 분야의 기술자들에게 공지된 알고리즘에 기초하여 정의되는 다수의 요소에 대해 수행된다. 절단 영역들 및 혼합 영역들의 범위를 정하는 요소들을 정의하기 위한 방법은 여기서는 설명되지 않는데, 그 이유는 본 발명의 이해에 필요하지 않기 때문이다. 따라서, 도 2에 도시된 특정 실시예에 따르면, 프레임 Fn의 헤더 내에 포함된 포인터들 PtrMBn 및 PtrMEn은 각각, 불연속성을 완화하고 가속 속도에서의 복원의 품질을 개선하기 위해 혼합될 필요가 있는 (PtrBn 및 PtrEn에 의해 범위가 정해지는, 생략될 일련의 샘플들 외의) 선택되는 요소들을 지시한다.
따라서, 도 2에 도시된 특정 실시예에 따르면, 포인터 PtrMBn 및 PtrBn 각각에 의해 범위가 정해지는 프레임 Fn으로부터의 샘플들은 포인터 PtrEn 및 PtrMEn에 의해 범위가 정해지는 프레임 Fn +1로부터의 선택된 샘플들과 쌍을 이루어 혼합될 것이다. 게다가, 샘플들의 선택으로부터 발생하는 오디오 스트림은 더 적은 샘플들을 포함하는데, 그 이유는 PtrBn 및 PtrEn 포인터들 사이의 연속 샘플들이 생략되기 때문이다. 유리하게, 샘플링 주파수와 동일한 주파수의 복원은 오디오 콘텐츠의 그의 명목 지속기간보다 짧은 기간 내의 복원을 가능하게 한다. 명목 지속기간은 선택의 부재(생략) 시의 프레임들 내의 모든 샘플들에 대한 샘플링 주파수에서의 복원 지속기간이다.
도 2의 도시된 실시예에 따르면, 생략될 일련의 오디오 샘플들은 현재 프레임 Fn에서 시작되고, 다음 프레임 Fn +1에서 끝난다. 다른 실시예들에서, 프레임은 프레임 내에서 시작하고 끝나는, 생략될 하나 또는 여러 개의 일련의 오디오 샘플들을 포함할 수 있다. 프레임은 또한 생략될 오디오 샘플을 포함하지 않을 수 있거나, 프레임 내에서 시작되고 끝나는, 생략될 하나 또는 여러 개의 일련의 오디오 샘플들을 포함하거나, 및 프레임 내에서 시작되지만 그 안에서 끝나지 않는(또는 프레임 내에서 끝나지만 그 안에서 시작되지 않는), 생략될 일련의 오디오 샘플들을 포함할 수 있다. 이 같은 실시예에서, (생략 또는 혼합될 샘플들과 관련된) 포인터 타입 정보는 포인팅되는 오디오 샘플을 포함하는 프레임의 수 및 포인팅되는 오디오 샘플의 그가 속하는 프레임 내의 위치를 포함할 수 있다.
포인터들에 의해 각각 지시되는 샘플들의 위치들은 원하는 복원 속도에 의존한다. 따라서, 명목 복원 속도와 관련하여 가속 복원 속도가 클수록(각각, 복원 지속기간이 낮을수록), 이에 따른 명목 기간에는 선택되는 샘플들의 수가 적고(각각, 크고), 생략되는 샘플들의 수가 많다(각각, 적다). 명목 속도보다 최대 20% 큰 복원 시간의 증가에 대한 복원 품질과 관련하여 만족스런 결과들을 얻는 것이 가능하다.
본 발명의 일 실시예에 따르면, 프레임들 각각은 복원 속도의 여러 인덱스(가속 팩터)와 각각 관련된 전술한 바와 같은 여러 세트의 포인터들을 포함한다. 따라서, 프레임 헤더는 예를 들어 팩터 x 1.1을 갖는 가속 속도에 대한 절단 및 혼합 포인터들의 리스트, 팩터 x 1.2를 갖는 가속 속도에 대한 절단 및 혼합 포인터들의 리스트, 및 팩터 x 1.3, x 1.4 등에 대한 것들도 포함할 수 있다. 프레임 헤더 내에 다수의 세트의 포인터들이 존재하는 경우, 샘플들의 선택을 행하는 수신기 레코더 PVR의 제어 유닛은 원하는 가속 팩터에 대응하는 포인터들의 세트를 고려하고, 사용자에 의해 요청되는 원하는 복원에 대응하는 포인터들의 세트를 이용하여 샘플들을 선택을 행한다.
본 발명의 실시예에 따르면, 순위 n의 프레임이 수신된 후, 순위 n+1의 프레임 Fn +1이 수신될 때, 수신기 레코더(PVR)의 제어 유닛은, 각별히 각각의 프레임 Fn 및 Fn +1 내에 위치하는 생략될 일련의 샘플들의 범위를 식별하는 포인터 PtrBn 및 PtrEn은 물론, 샘플들의 프레임들의 절단으로 인한 불연속 효과들을 최상으로 제한하기 위해 혼합되어야 하는 일련의 샘플들의 범위를 식별하는 포인터 PtrMBn 및 PtrMEn을 판독함으로써, 순위 n의 프레임 Fn의 헤더 콘텐츠를 분석한다.
프레임 Fn 및 Fn +1을 수신한 후에 그리고 본 발명의 특정한 비한정적인 실시예에 따라, 포인터 PtrEn -1로부터 포인터 PtrBn까지의 프레임 Fn으로부터의 샘플들은 복원 버퍼(버퍼 메모리)에 재복사되며, 이어서 포인터 PtrMBn과 PtrBn 사이에 위치하는 샘플들은 포인터 PtrEn과 PtrMEn 사이에 위치하는 샘플들과 연속적으로 혼합되고, 예를 들어 샘플들의 평균을 취함으로써, 혼합으로부터 발생하는 값들은 이전에 재복사된 값들(샘플들)에 이어서 복원 버퍼에 기입된다. 혼합될 일련의 샘플들의 한계에 도달할 때, 포인터 PtrMEn에서 샘플들의 재복사가 시작되고, 다음 프레임의 포인터 PtrBn +1까지 계속된다. 이러한 선택 동작과 병렬로, 오디오 디코딩 모듈에 입력을 공급하고, 샘플들의 선택으로부터 발생하는 오디오 스트림을 복원하기 위해서, 복원 프로세스가 여전히 장치(PVR)의 제어 유닛의 제어하에 복원 버퍼를 스캐닝한다. 물론, 프레임들의 헤더가 여러 개의 가능한 복원 속도에 대응하는 여러 세트의 포인터들을 포함하는 경우, 제어 유닛은 정의된 복원 속도에 대응하는 포인터들을 판독한다. 이러한 속도는 오디오 스트림(S1)에 대응하는 시청각 콘텐츠를 시청하고자 하는 사용자 요구에 의해, 이 요구를 행하도록 구성된 사용자 인터페이스를 통해 선택된다.
도 3은 본 발명의 하나의 특정한 비한정적인 실시예에 따른 수신기 레코더 장치(PVR)에 의해 구현되는 복원 방법에 의해 사용되는 바와 같은 오디오 프레임 Fn 및 그의 헤더 Hn을 나타낸다. 헤더 Hn은 프레임의 순위 n, 즉 오디오 스트림(S1) 내의 그의 위치를 식별하는 것을 가능하게 하는 정보 필드(FID)를 포함한다. 헤더 Hn은 또한 원하는 복원 속도(SPD)를 식별하는 필드를 포함한다. 가속 복원 속도와 명목 속도 간의 관계를 정의하기 위한 식별자에 더하여, 이 필드 자체는 인코딩에서 단일 가속 복원 속도가 정의되는지 및 이에 따라 헤더 내에 포인터들의 단일 세트만이 존재하는지 아니면 헤더 내에 포인터들의 다수의 연속 세트가 존재하는지를 정의하기 위한 필드를 포함한다. 도 3은 단일 가속 속도가 정의되고, 단일 세트의 포인터들이 생략될 일련의 샘플들 및 혼합될 일련의 샘플들을 정의하는 경우를 나타낸다.
도 4는 인코딩에서 2개의 가속 복원 속도가 지원되는 본 발명에 따른 복원 방법에 의해 사용되는 바와 같은 오디오 프레임 Fn 및 그의 헤더 Hn의 변형예를 나타낸다. 이 경우, 제1 속도 식별 필드(SP1)는 명목 복원 속도와 제1 가속 속도 사이의 속도비와 관련된 정보에 더하여, 인코딩된 가속 속도들의 수가 2개이고, 샘플들을 절단 및 혼합하는 데 사용되는 2 세트의 포인터들이 헤더 내에 이어지는 것을 지시하는 정보를 포함한다. 도 4에서, 헤더 Hn에서, 2 세트의 포인터들을 알리고 제1 세트에 대응하는 복원 속도를 인코딩하는 필드 SP1 뒤에 제1 세트의 포인터들(Ptr1Bn, Ptr1En, Ptr1MBn, Ptr1MEn)이 각각 이어지고, 이어서 포인터들의 제2 세트를 알리고 대응하는 속도를 인코딩하는 필드 SP2 뒤에 제2 세트의 포인터들(Ptr2Bn, Ptr2En, Ptr2MBn, Ptr2MEn)이 이어진다. 인코딩된 스트림을 수신하는 수신기 레코더 장치(PVR)는 오퍼레이터에 의해 선택되는 복원 속도에 따라 샘플들을 선택하도록 조절되고, 이 복원 속도는 명목 속도(모든 수신된 샘플들이 복원됨) 또는 필드 SP1 또는 필드 SP2에 의해 지시되는 속도 중 하나이다. 원하는 복원 속도가 SP1인 경우, 스트림(S1)에 의해 운반되는 오디오 콘텐츠의 복원을 위한 샘플들의 선택은 포인터들(Ptr1Bn, Ptr1En, Ptr1MBn, Ptr1MEn)을 이용하여 수행된다. 유사하게, 원하는 복원 속도가 SP2인 경우, 샘플들을 선택하는 데 사용되는 포인터들은 Ptr2Bn, Ptr2En, Ptr2MBn 및 Ptr2MEn이다.
도 5는 본 발명의 하나의 특정한 비한정적인 실시예에 따른 오디오 콘텐츠의 아이템의 복원 방법에 따른 샘플들을 선택하는 단계들을 나타내는 도면이다.
단계 S0은 시스템의 초기화에 대응하며, 초기화 동안, 수신기 레코더 장치(PVR)는 사용자가 서버(S)로부터 이전에 수신되고 인코더(E)에 의해 인코딩된 시청각 콘텐츠를 보기 시작할 수 있는 명목 동작 모드로 구성된다. 시청각 콘텐츠는 하드 디스크와 같은 장치(PVR)의 저장 유닛에 비디오 스트림 및 오디오 스트림을 포함하는 파일의 형태로 저장된다. 오디오 스트림은 도 2에 도시된 스트림(S1)이다.
단계 S01 동안, 기록된 스트림(S1)이 장치(PVR)의 저장 유닛으로부터 판독되고, 착신 스트림의 역다중화 후에, 특히 오디오 및 비디오 컴포넌트들을 분리하기 위해 제어 유닛에 의해 분석된다.
스트림(S1)의 연속 프레임들(Fn, Fn +1)은 단계 S2 및 단계 S3 동안 연속적으로 판독 및 분석되며, 제어 유닛은 단계 S2 동안 판독된 포인터들(PtrBn, PtrEn, PtrMBn, PtrMEn)에 기초하여 샘플들(SAn)의 서브세트를 선택한다. 제어 유닛은 선택된 샘플들을 복원 버퍼에 재복사하고, 샘플 혼합이 필요할 때 혼합 작업의 결과를 그곳에 기입한다. 단계 S4 동안, 프레임 카운터가 증가되고, 다음 프레임에 대해 샘플 선택 프로세스가 반복되며, 그러한 동안에 선택 프로세스와 병렬로 복원 프로세스가 샘플들을 오디오 디코딩 모듈을 포함하는 복원 모듈로 전송함으로써 복원 버퍼를 비운다. 복원 버퍼는 제어 유닛에 의해 순환 버퍼로서 관리된다. 본 실시예에 따르면, 순위 n의 프레임의 헤더는 포인터들을 이용하여, 순위 n 및 순위 n+1의 프레임들 내의 샘플들로부터 선택될 샘플들을 지시한다. 따라서, 도시된 특정 실시예에서, 선택 및 복사를 수행하기 위해 적어도 2개의 프레임을 수신하는 것이 필요하며, 필요한 경우에는 선택된 샘플들을 복원 버퍼로 혼합한 후에, 일련의 샘플들은 포인터들에 의해 범위가 정해진다.
즉, 설명되는 실시예에 따르면, 본 발명은 일 양태에 따라 명목 복원 속도에서 그리고 명목 복원 속도보다 높은 적어도 하나의 복원 속도에서 시청각 콘텐츠의 복원에 적절한 오디오 프로그램 수신기(PVR)에서의 오디오 콘텐츠 복원 방법을 포함한다. 오디오 콘텐츠는 운반 스트림(S1) 내에 인코딩된 상태로 수신된다. 인코더(E)에 의해 행해진 인코딩에 따라, 운반 스트림(S1)은 오디오 샘플들(SAn)의 프레임들(Fn) 및 프레임들(Fn)의 오디오 샘플들의 적어도 일부에 대한 포인터 타입 정보(PtrMBn, PtrBn, PtrEn, PtrMEn)의 연속을 포함한다. 스트림(S1)에 대한 복원 방법은:
- 복원 동작 전에 프레임들(Fn)로부터 오디오 샘플들을 선택하는 단계 - 선택되는 오디오 샘플들은 포인터 타입 정보(PtrMBn, PtrBn, PtrEn, PtrMEn)로부터 식별됨 - ,
- 선택되어 복원 버퍼에 기입된 샘플들만을 복원하는 단계 - 이로써 이들 샘플들의 복원 지속기간은 선택의 부재시의 완전한 프레임들의 복원 지속기간보다 짧음 -
을 포함한다.
선택하고 복원 버퍼에 기입하는 동작은 절단 영역 전후의 오디오 샘플들의 혼합을 포함한다. 따라서, 위치가 포인터 PtrMBn에 의해 정의되는, 순위 n의 프레임으로부터의 샘플은 위치가 포인터 PtrEn에 의해 정의되는, 순위 n+1의 프레임으로부터의 샘플과 혼합된다.
수신기 레코더(PVR)는 가속된 복원의 설명된 방법을 구현함으로써 인코딩된 오디오 스트림(S1)에 대응하는 오디오 콘텐츠를 복원하는데 적합하다. 그의 제어 유닛은 복원 버퍼에 복사함으로써, 혼합의 결과를 복원 버퍼에 기입하기 전에 처리될 샘플들 및 혼합될 샘플들을 선택하는 동시에, 선택 및 혼합 프로세스로부터 발생하는 오디오 스트림을 복원하기 위해 복원 버퍼를 판독한다.
따라서, 설명된 프로세스들은 수신기 레코더(PVR)에서 가능하며, 인코더(E)는 고유 오디오 콘텐츠의 아이템을 인코딩하는 방법을 구현하며, 도 6에 도시된 바와 같이, 오디오 샘플들의 연속 프레임들 및 오디오 샘플들에 대한 포인터 타입 정보를 삽입(S7)함으로써 오디오 운송 스트림을 생성한다. 인코딩 방법은 예를 들어 WSOLA 방법에 기초하는 알고리즘을 이용하며, 복원될 샘플들의 선택(S5) 및 포인터 타입 정보에 의해 절단할 샘플들 및 혼합할 샘플들의 식별(S6)을 포함한다.
도시된 실시예에서, 인코더(E)는 오디오 스트림(S1)의 프레임들(Fn)의 헤더 필드들 내에 샘플들에 대한 포인터들을 삽입하여, 수신기 레코더(PVR)가 삽입된 포인터들로부터 식별되는 오디오 샘플들의 서브세트만을 선택하는 것을 가능하게 하여, 가속된 복원을 구현한다.
본 발명은 오디오 샘플들의 연속 프레임들 및 예를 들어 프레임들 각각 내에 삽입된 포인터 타입 정보를 포함하는 오디오 스트림의 형태의 인코딩된 오디오 신호와도 관련되어, 이러한 신호의 수신기가 절단될 하나 이상의 일련의 오디오 샘플들 및 결국은 혼합될 하나 이상의 일련의 오디오 샘플들을 식별하는 것을 가능하게 하여, 그들이 톤의 왜곡 없이 수신기에 의해 오디오 신호의 가속 복원을 수행하는 데 사용되는 것을 가능하게 한다.
본 발명은 전술한 실시예와 관련될 뿐만 아니라, 오디오 프레임들의 수신기가 인코딩에 의해 오디오 스트림 내에 삽입된 정보에 기초하여 오디오 샘플들의 서브세트만을 선택하는 것을 가능하게 하고, 이어서 (예를 들어, 오디오 톤의 심한 변경 없이) 오디오 콘텐츠의 복원을 그의 명목 지속기간보다 짧은 지속기간 내에 가능하게 하여, 인코딩에서의 정의된 지속기간의 콘텐츠의 아이템이 수신 및 복원 장치에 의해 더 짧은 지속기간 내에 복원될 수 있게 하도록 의도되는 임의의 방법과도 관련된다.
본 발명의 실시예의 변형예에 따르면, 선택될 오디오 샘플들에 대한 포인터들은 인코더(E)에 의해 오디오 스트림 내에 삽입되며, 워터마킹 방법을 이용하여 장치(PVR)에 의해 추출된다.

Claims (19)

  1. 오디오 및/또는 시청각 콘텐츠의 수신기(PVR)에서의 오디오 콘텐츠 복원 방법으로서,
    상기 수신기(PVR)는 상기 오디오 콘텐츠의 복원에 적합하고, 상기 오디오 콘텐츠는 인코딩된 상태로 수신되고, 오디오 샘플들(SAn)의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 한 부분에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함하며,
    상기 방법은,
    - 상기 프레임들(Fn)로부터 오디오 샘플들을 선택하는 단계 - 상기 선택된 오디오 샘플들은 상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)로부터 식별됨 -;
    - 상기 선택된 샘플들만을 복원하는 단계
    를 포함하는 것을 특징으로 하는 복원 방법.
  2. 제1항에 있어서,
    상기 수신기(PVR)는 명목 복원 속도 및 상기 명목 복원 속도보다 높은 적어도 하나의 복원 속도에서의 상기 오디오 콘텐츠의 복원에 적합하며, 상기 선택된 샘플들만의 상기 복원은 상기 명목 값보다 높은 상기 적어도 하나 이상의 복원 속도 중 하나로 수행되는 것을 특징으로 하는 복원 방법.
  3. 제1항에 있어서,
    상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)는 헤더 패킷들(Hn) 내에 포함되며, 상기 헤더 패킷들(Hn) 각각은 상기 프레임들(Fn) 중 하나와 관련되는 것을 특징으로 하는 복원 방법.
  4. 제1항에 있어서,
    상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)는 복원 또는 절단될 일련의 샘플들의 시작을 식별하는 정보 및/또는 복원 또는 절단될 일련의 샘플들의 끝을 식별하는 정보를 포함하는 것을 특징으로 하는 복원 방법.
  5. 제1항에 있어서,
    적어도 하나의 제1 오디오 샘플과 적어도 하나의 제2 오디오 샘플을 혼합하는 단계를 더 포함하고, 상기 적어도 하나의 제1 및 상기 적어도 하나의 제2 오디오 샘플은 오디오 샘플들에 대한 상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)로부터 선택되는 것을 특징으로 하는 복원 방법.
  6. 제5항에 있어서,
    상기 제1 및 제2 샘플들의 상기 혼합은 상기 제1 및 제2 샘플들의 평균값을 계산함으로써 수행되는 것을 특징으로 하는 복원 방법.
  7. 제5항에 있어서,
    오디오 샘플들에 대한 상기 포인터 타입 정보는 복원 또는 절단될 샘플들과 관련된 포인터들(PtrBn, PtrEn) 및 혼합될 선택된 샘플들과 관련된 포인터들(PtrMBn, PtrMEn)을 포함하는 것을 특징으로 하는 복원 방법.
  8. 제5항에 있어서,
    상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)는 혼합될 일련의 샘플들의 시작을 식별하는 정보 및/또는 혼합될 일련의 샘플들의 끝을 식별하는 정보를 포함하는 것을 특징으로 하는 복원 방법.
  9. 제2항에 있어서,
    헤더 패킷들 각각은 포인터 타입 정보의 여러 세트를 포함하고, 상기 세트들 각각은 상기 명목 복원 속도보다 높은 상기 복원 속도의 가능한 값(SP1, SP2) 중 하나와 각각 관련되는 것을 특징으로 하는 복원 방법.
  10. 제1항에 있어서,
    WSOLA 방법에 기초하여 연속 오디오 샘플들을 변경하기 위한 알고리즘을 이용하는 것을 특징으로 하는 복원 방법.
  11. 시청각 및/또는 오디오 콘텐츠의 수신기 디코더(PVR)로서,
    오디오 콘텐츠의 아이템의 복원을 위해 구성되는 적어도 하나의 프로세서를 포함하고,
    상기 오디오 콘텐츠는 인코딩된 상태로 수신되며, 오디오 샘플들(SAn)의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 일부에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함하며,
    상기 적어도 하나의 프로세서는,
    상기 프레임들(Fn)로부터의 오디오 샘플들의 선택 - 상기 선택되는 오디오 샘플들은 상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)로부터 식별됨 - 과,
    상기 선택된 샘플들만의 복원
    을 위해 구성되는 것을 특징으로 하는 수신기 디코더.
  12. 오디오 콘텐츠를 인코딩하기 위한 방법으로서,
    상기 인코딩된 오디오 콘텐츠는 오디오 샘플들의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 일부에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함하며,
    상기 인코딩 방법은,
    복원될 오디오 샘플들을 선택하는 단계, 및
    상기 선택된 오디오 샘플들을 상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)에 의해 식별하는 단계
    를 포함하는 것을 특징으로 하는 인코딩 방법.
  13. 제12항에 있어서,
    WSOLA 방법에 기초하여 연속 오디오 샘플들을 변경하기 위한 알고리즘을 사용하는 것을 특징으로 하는 인코딩 방법.
  14. 컴퓨터 프로그램 제품으로서,
    프로그램이 컴퓨터에 의해 실행될 때, 제1항에 따른 복원 방법을 실행하기 위한 프로그램 코드 명령어들을 포함하는 것을 특징으로 하는, 컴퓨터 프로그램 제품.
  15. 컴퓨터 판독 가능 저장 매체로서,
    프로그램이 컴퓨터에 의해 실행될 때, 제1항에 따른 복원 방법을 실행하기 위한 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램이 저장되어 있는, 컴퓨터 판독 가능 저장 매체.
  16. 컴퓨터 프로그램 제품으로서,
    프로그램이 컴퓨터에 의해 실행될 때, 제12항에 따른 인코딩 방법을 실행하기 위한 프로그램 코드 명령어들을 포함하는 것을 특징으로 하는, 컴퓨터 프로그램 제품.
  17. 컴퓨터 판독 가능 저장 매체로서,
    프로그램이 컴퓨터에 의해 실행될 때, 제12항에 따른 인코딩 방법을 실행하기 위한 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램이 저장되어 있는, 컴퓨터 판독 가능 저장 매체.
  18. 오디오 및/또는 시청각 콘텐츠의 인코더로서,
    오디오 콘텐츠의 아이템을 인코딩하도록 구성되는 적어도 하나의 프로세서를 포함하고,
    상기 인코딩된 오디오 콘텐츠는 오디오 샘플들의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 일부에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함하며,
    상기 적어도 하나의 프로세서는 복원될 오디오 샘플들의 선택 및 상기 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)에 의한 상기 선택된 오디오 샘플들의 식별을 위해 구성되는 것을 특징으로 하는 인코더.
  19. 오디오 콘텐츠의 연속 프레임들(Fn) 및 상기 프레임들(Fn)의 오디오 샘플들(SAn)의 적어도 일부에 대한 포인터 타입 정보(PtrBn, PtrEn, PtrMBn, PtrMEn)를 포함하는 스트림을 운반하는 신호로서,
    제12항의 인코딩 방법에 따라 인코딩된 데이터를 포함하는 것을 특징으로 하는 신호.
KR1020140181838A 2013-12-16 2014-12-16 오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치 KR20150070039A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1362639 2013-12-16
FR1362639 2013-12-16

Publications (1)

Publication Number Publication Date
KR20150070039A true KR20150070039A (ko) 2015-06-24

Family

ID=50780558

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140181838A KR20150070039A (ko) 2013-12-16 2014-12-16 오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치

Country Status (6)

Country Link
US (1) US9813689B2 (ko)
EP (1) EP2899723A1 (ko)
JP (1) JP2015132819A (ko)
KR (1) KR20150070039A (ko)
CN (1) CN104717544A (ko)
TW (1) TWI630603B (ko)

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623344A (en) * 1992-09-01 1997-04-22 Hitachi America, Ltd. Digital video recording device with trick play capability
US6324337B1 (en) 1997-08-01 2001-11-27 Eric P Goldwasser Audio speed search
US6959220B1 (en) * 1997-11-07 2005-10-25 Microsoft Corporation Digital audio signal filtering mechanism and method
US8538886B1 (en) 1998-08-31 2013-09-17 Google Inc. Watermarking system and methodology for digital multimedia content
US6252919B1 (en) * 1998-12-17 2001-06-26 Neomagic Corp. Re-synchronization of independently-clocked audio streams by fading-in with a fractional sample over multiple periods for sample-rate conversion
US6185527B1 (en) * 1999-01-19 2001-02-06 International Business Machines Corporation System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
US6868224B1 (en) 1999-05-05 2005-03-15 Ati International Srl Method and apparatus for providing multimedia playback
US7293280B1 (en) * 1999-07-08 2007-11-06 Microsoft Corporation Skimming continuous multimedia content
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP2002073093A (ja) * 2000-09-05 2002-03-12 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
US8340972B2 (en) * 2003-06-27 2012-12-25 Motorola Mobility Llc Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment
US7464028B2 (en) 2004-03-18 2008-12-09 Broadcom Corporation System and method for frequency domain audio speed up or slow down, while maintaining pitch
US20080131075A1 (en) 2006-12-01 2008-06-05 The Directv Group, Inc. Trick play dvr with audio pitch correction
US8428443B2 (en) 2007-03-12 2013-04-23 At&T Intellectual Property I, L.P. Systems and methods of providing modified media content
US8891946B2 (en) 2009-09-09 2014-11-18 Netflix, Inc. Accelerated playback of streaming media
US9749676B2 (en) 2010-06-08 2017-08-29 Microsoft Technology Licensing, Llc Virtual playback speed modification

Also Published As

Publication number Publication date
US20150181190A1 (en) 2015-06-25
TW201535357A (zh) 2015-09-16
US9813689B2 (en) 2017-11-07
TWI630603B (zh) 2018-07-21
CN104717544A (zh) 2015-06-17
EP2899723A1 (en) 2015-07-29
JP2015132819A (ja) 2015-07-23

Similar Documents

Publication Publication Date Title
JP4270379B2 (ja) デジタル情報の効率的な伝送および再生
US10129587B2 (en) Fast switching of synchronized media using time-stamp management
US20020122656A1 (en) Method and apparatus for recording broadcast data
US9165602B2 (en) Information storage medium storing multi-angle data and method and apparatus for reproducing the multi-angle data
GB2462732A (en) Simultaneous recording of multiple broadcast programs on a digital video recorder
JP2001346205A (ja) 信号の誤りを隠蔽する方法
JP2006520986A (ja) ストリームバッファチャネル用のcpiデータ
US8260124B2 (en) Method and apparatus for reproducing digital broadcast and method of recording digital broadcast
US20070201819A1 (en) Apparatus and method for variable speed playback of digital broadcasting stream
EP2101499B1 (en) Broadcast station device and recording/reproduction device
US6892022B1 (en) Storing and retrieving encoded data stream with specified time of delivery on a hard disk
US8213778B2 (en) Recording device, reproducing device, recording medium, recording method, and LSI
WO2007052413A1 (ja) 映像再生装置、映像再生方法、映像再生プログラム、および、映像再生プログラムを記録した記録媒体
KR20150070039A (ko) 오디오 콘텐츠의 가속화된 복원을 위한 방법 및 관련 장치
US20110022400A1 (en) Audio resume playback device and audio resume playback method
WO2012029252A1 (en) Information processing apparatus, information processing method, and program
JP2005197839A (ja) トランスポートストリームの特殊再生方法及びトランスポートストリームの記録再生装置
CN111131868B (zh) 基于播放器的视频录制方法及装置
JP2006345548A (ja) 情報処理装置
KR100452614B1 (ko) 디지털 방송수신기에서의 트릭 플레이 방법
JP4861221B2 (ja) 記録装置、記録方法、映像記録再生装置、および、その録画ファイル加工方法
JP3750688B2 (ja) 記録方法及び記録再生装置
JP2012034210A (ja) 映像音声記録再生装置、および映像音声記録再生方法
JP2006067142A (ja) 復号装置
KR20120055186A (ko) 낸드 플레시 메모리 및 암호,복호 장치를 포함한 영상저장 및 복원 장치의 구현방법.

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination