KR100798551B1 - 인포머셜 제공 방법 - Google Patents

인포머셜 제공 방법 Download PDF

Info

Publication number
KR100798551B1
KR100798551B1 KR1020060020122A KR20060020122A KR100798551B1 KR 100798551 B1 KR100798551 B1 KR 100798551B1 KR 1020060020122 A KR1020060020122 A KR 1020060020122A KR 20060020122 A KR20060020122 A KR 20060020122A KR 100798551 B1 KR100798551 B1 KR 100798551B1
Authority
KR
South Korea
Prior art keywords
information
program
segment
broadcast
time
Prior art date
Application number
KR1020060020122A
Other languages
English (en)
Other versions
KR20060099413A (ko
Inventor
설상훈
김혁만
전승수
김정림
윤자천
Original Assignee
비브콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/069,767 external-priority patent/US20050193408A1/en
Application filed by 비브콤 인코포레이티드 filed Critical 비브콤 인코포레이티드
Publication of KR20060099413A publication Critical patent/KR20060099413A/ko
Application granted granted Critical
Publication of KR100798551B1 publication Critical patent/KR100798551B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/72Systems specially adapted for using specific information, e.g. geographical or meteorological information using electronic programme guides [EPG]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2542Management at additional data server, e.g. shopping server, rights management server for selling goods, e.g. TV shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Abstract

방송 스트림에서 프레임의 정확한 위치를 표현하거나 접근하기 위해서, 방송 스트림에 대한 미디어 로케이터(media locator)로서 방송 시각을 이용하여 프레임의 정확한 위치를 표현(represent) 또는 가리키는(locate) 방법이 제공된다. 또한 방송 시각으로 시간 정보가 표현된 전송된 세그먼트 정보를 이용하여 DVR에 녹화될 수 있는 프로그램의 세그먼트에 효율적으로 랜덤 액세스하기 위해서, 종래의 프로그램 가이드(예를 들어, ATSC-PSIP 또는 DVB-SI EPG)와 연관된 DVR 등에 방송 또는 다른 전송된 프로그램의 세그먼트화 정보를 효율적으로 전송하는 기술(방법, 장치, 시스템)이 제공된다. 세그먼트화 정보는 방송 프로그램의 세그먼트의 세그먼트 제목, 시간적인 시작 위치와 지속 시간을 포함할 수 있다. 또한, 하드웨어(H/W) 또는 소프트웨어(S/W) 또는 펌웨어(F/W) 또는 그 조합에 의해 생성될 수 있는 비디오 파일의 특정 부분으로부터의 섬네일 이미지를 이용하여 수신된 세그먼트화 정보에 기초하여 브라우징하는 쌍방향 그래픽 유저 인터페이스(GUI)가 생성된다.

Description

인포머셜 제공 방법{METHOD FOR LOCALIZING A FRAME AND PRESENTING SEGMENTATION INFORMATION FOR AUDIO-VISUAL PROGRAMS}
도 1은 예시적인 미디어 로컬리제이션을 도시하는 도면,
도 2는 단일의 비디오 프로그램에 속하는 세그먼트의 예시적인 계층적 트리 구조를 도시하는 도면,
도 3은 종래 기술에 따른 PSIP내의 직접 채널 변경 테이블(DCCT)에 이용되는 분류별 장르 코드 할당의 예를 예시하는 테이블,
도 4a 및 도 4b는 표 2에 지정된 BNF 구문에 기초하여 생성된 예시적인 세그먼트화 정보 메타데이터를 도시하는 도면,
도 5a는 종래 기술에 따른 ETT 내의 대강의 프로그램 줄거리를 나타내는 예시적인 그래픽 유저 인터페이스(GUI)를 도시하는 도면,
도 5b는 적절한 분석 소프트웨어가 없는 종래의 STB 상에서 ETT 및 단문/확장된 기술어(descriptor)에 삽입된 세그먼트화 정보를 찾을 수 있는 방법을 나타내는 예시적인 GUI를 도시하는 도면,
도 6a 및 도 6b는 이벤트 세그먼트 기술어(event segment descriptor)의 비트 스트림 구문에 기초하여 생성된 세그먼트화 정보의 개략적 버전을 도시하는 도 면,
도 6c 및 도 6d는 세그먼트의 커맨드 모드 동작의 예를 도시하는 도면,
도 7은 증분의 데이터가 트랜스포트 스트림에 다중화되는 방법을 도시하는 도면,
도 8은 DVR의 녹화된 프로그램에 대한 세그먼트 정보를 나타내는 프로그램 가이드를 도시하는 도면,
도 9는 DVR의 녹화된 프로그램에 대한 예시적인 스토리보드를 나타내는 프로그램 가이드를 도시하는 도면,
도 10은 메타데이터가 EPG를 통해 전송될 때 세그먼트화 정보 메타데이터가 DVR에서 처리되는 방법을 나타내는 흐름도,
도 11 및 도 12는 인포머셜 가이드의 그래픽 유저 인터페이스(GUI)를 도시하는 도면,
도 13 및 도 14는 DVR의 인포머셜을 처리하기 위한 전체 프로세스를 도시하는 도면,
도 15는 적절한 시간에 인포머셜 세그먼트화 정보만을 종종 전송함으로써, 광고의 스킵을 감소시키는 이벤트 세그먼트 기술어의 예시적인 전송 간격 시간을 나타내는 도면,
도 16은 프로그램의 자동 녹화가 트리거되는 방법을 나타내는 흐름도,
도 17a, 도 17b, 도 17c 및 도 17d는 (방송) AV 스트림의 프레임에 관련된 정보를 제공하기 위한 예시적인 서비스 방법을 도시하는 도면,
도 18a, 도 18b, 도 18c 및 도 18d는 방송 프로그램의 프레임에 관련된 정보를 처리하기 위한 예시적인 클라이언트 STB 또는 DVR의 블록도,
도 19a, 도 19b, 도 19c 및 도 19d는 TV 시청자의 예시적인 GUI를 도시하는 도면.
도면의 주요 부분에 대한 부호의 설명
1702 : AV 스트림 1704 : 방송 네트워크
1706 : STB 1708 : 백 채널
1710 : 프레임 관련 정보 서버 1712 : 멀티플렉서
1714 : 저장부 1812 : 정보 처리 유닛
1814 : 유저 인터페이스 1818 : 디스플레이 장치
관련 출원의 참고
본 발명은 출원인이 동일하며 발명자 Sanghoon SULL, Seong Soo CHUN, M.D.ROSTOKER, Hyeokman KIM에 의해 "PROCESSING AND PRESENTATION OF INFOMERICALS FOR AUDIO-VISUAL PROGRAMS"이란 명칭으로 본원과 동일 일자에 출원된 공동 계류중인 미국 특허 출원 제 11/---- 호와 관련되어 있다.
본 발명은 출원인이 동일하며 발명자 Sanghoon SULL, Jung Rim KIM, Seong Soo CHUN, Ja-Cheon YOON에 의해 "DELIVERY AND PRESENTATION OF CONTENT-RELEVANT INFORMATION ASSOCIATED WITH FRAMES OF AUDIO-VISUAL PROGRAMS"이란 명칭으로 본원과 동일 일자에 출원된 미국 특허 출원 제 11/--- 호와 관련되어 있다.
우선권을 주장하며 본 출원의 일부 계속 출원인 이하의 모든 관련 출원은 완전히 본 명세서에 참조로 포함된다.
본 출원은 미국 가출원 제 60/549,624 호(2004년 3월 3일 출원)를 우선권으로 주장한다.
본 출원은 미국 가출원 제 60/549,605 호(2004년 3월 3일 출원)를 우선권으로 주장한다.
본 출원은 미국 가출원 제 60/610,074 호(2004년 9월 15일 출원)를 우선권으로 주장한다.
본 출원은 미국 가출원 제 USSN 60/359,564 호(2002년 2월 25일 출원)를 우선권으로 주장하는 미국 특허 출원 제 10/361,794 호(2003년 2월 10일 출원, 2004년 7월 1일에 US2004/0126021로 공개)의 일부 계속 출원이다.
본 출원은 미국 가출원 제 60/359,566(2002년 2월 25일 출원)과 미국 가출원 제 60/434,173 호(2002년 12월 17일 출원)를 우선권으로 주장하는 미국 특허 출원 제 10/365,576 호(2003년 2월 12일 출원, 2004년 7월 1일에 US2004/0128317로 공개)의 일부 계속 출원이다.
본 출원은 미국 특허 출원 제 10/369,333(2003년 2월 19일 출원, 2003년 9월 18일 US2003/0177503로 공개)의 일부 계속 출원이다.
본 출원은 미국 가출원 제 60/359,567 호(2002년 2월 25일 출원)를 우선권으로 주장하는 미국 특허 출원 제 10/368,304 호(2003년 2월 18일 출원, 2004년 7월 1일 US2004/0125124로 공개)의 일부 계속 출원이다.
본 출원은 이하의 5개 가특허 출원을 우선권으로 주장하는 2001년 7월 23일자 출원의 미국 특허 출원 제 09/911,293 호(2002년 6월 6일 US2002/0069218A1로 공개)의 일부 계속 출원이다.
미국 가출원 제 60/221,394 호(2000년 7월 24일 출원)
미국 가출원 제 60/221,843 호(2000년 7월 28일 출원)
미국 가출원 제 60/222,373 호(2000년 7월 31일 출원)
미국 가출원 제 60/271,908 호(2001년 2월 27일 출원)
미국 가출원 제 60/291,728 호(2001년 5월 17일 출원)
기술 분야
본 명세서는 오디오-비주얼 프로그램에 관련된 정보를 생성, 전송, 처리, 저장 및 제공하는 것에 관한 것이며, 보다 상세하게는, 종래의 프로그램 가이드를 통해서 방송 TV 프로그램의 비디오 세그먼트에 대한 정보를 관련 데이터 저장부를 구비한 셋톱 박스(STB)에 전달하는 시스템 및 기술에 관한 것이다.
배경 기술
기술적인 진보는 인터넷뿐만 아니라 지상파, 케이블 및 위성 방송을 포함한 다양한 미디어를 통해 사용자에게 전송된 관련 데이터(이하, "프로그램" 또는 "콘텐츠"라 함)를 포함한 오디오, 비주얼, 및/또는 오디오비주얼(이하, "오디오-비주얼" 또는 "오디오비주얼"이라 함) 프로그램/콘텐츠의 광범위한 콘텐츠 및 서비스를 계속해서 생성하고 있다.
디지털 TV 대 아날로그 TV
1996년 12월에, 연방 통신 위원회(FCC)는 소비자가 현재 사용하고 있는 아날로그 TV 시스템을 대체하는 획기적인 디지털 TV(DTV)에 대한 미국 표준을 승인하였다. DTV 시스템에 대한 필요성은 TV 시청자가 필요로 하는 고화질 및 서비스 개선에 대한 요구로 인해 발생하였다. DTV는 한국, 일본 및 유럽 전체 등의 여러 나라에서 광범위하게 채택되었다.
DTV 시스템은 종래의 아날로그 TV 시스템에 비해 몇가지 장점을 가지고 있어서 TV 시청자의 요구를 충족시키고 있다. 표준 화질 TV(SDTV) 또는 고화질 TV(HDTV) 시스템에 의해 종래의 아날로그 TV 시스템에 비해 훨씬 선명한 화질을 시청할 수 있다. HDTV 시청자는 아날로그의 종래의 아날로그 4×3의 종횡비에 비해 16×9 종횡비(폭-높이)를 가진 와이드 스크린 포맷(영화관에서 볼 수 있음)에 디스플레이되는 1920×1080 화소의 해상도로 고화질의 픽쳐를 수신할 수 있다. 종래의 TV 종횡비가 4×3이지만, 일반적으로 화상의 양 측면에서 각 픽쳐의 크로핑 부분만큼 픽쳐의 최상부와 바닥부에서 공백 스크린 영역을 남기고 중앙의 4×3 영역만을 보여주는 레터 박스(letter box) 포맷으로 와이드 스크린 프로그램을 종래의 TV 스크린 상에서 여전히 볼 수 있다. 또한, DTV 시스템에 의해 다수의 TV 프로그램을 다중 방송할 수 있으며, 또한, 설명 자막, 옵션, 여러 또는 상이한 오디오 옵션(옵션 언어 등) 등의 보조 데이터, 보다 넓은 포맷(레터 박스 등) 및 추가 픽쳐를 포함할 수 있다. 예를 들어, 시청자가 보다 완벽한 "홈" 시어터 체험을 즐기게 하는 현재의 5.1 채널 콤팩트 디스크(CD)-품질의 서라운드 사운드 등의 보다 양호한 관련 오디오의 이점을 청취자가 가질 수 있다.
U.S. FCC는 각각의 지상 디지털 방송 채널에 대해 아날로그 NTSC 채널에 사용하는 것과 동일한 대역폭의 6 MHz(메가 헤르쯔) 대역폭을 할당하였다. MPEG-2 등의 비디오 압축 방법을 이용함으로써, 하나 이상의 고화질 프로그램이 동일 대역폭 내에서 전송될 수 있다. 따라서, DTV 방송국은 프로그램을 전송하기 위해서 여러 표준(예를 들어, HDTV 또는 SDTV) 중에서 선택할 수 있다. 예를 들어, ATSC는 그 예 및 설명이 2004년 5월 12일 " ATSC Standard A/53C with Amendment No . 1:ATSC Digital Television Standard " Rev . C(www.atsc.org를 참조)에 있을 수 있는 다양한 해상도, 종횡비, 프레임 비율의 18개의 상이한 포맷을 갖는다. 디지털 TV 시스템에서의 픽쳐는 순차 또는 비월 모드로 주사된다. 순차 모드에서, 프레임 픽쳐는 래스터 주사 순서로 주사되며, 비월 모드에서는, 프레임 픽쳐가 래스터 주사 순서로 각각이 주사되는 2개의 시간적으로 교대하는 필드 픽쳐로 구성되어 있다. 비월 모드와 순차 모드에 대한 보다 상세한 설명은 Barry G., Atul Puri , Arun N. Netravali 의 " Digital Video : An Introduction to MPEG -2 ( Digital Multimedia Standards Series )"에 있다. SDTV가 화질면에서 HDTV에 비해 좋지 않지만, 현재 또는 과거의 아날로그 TV보다는 높은 화질의 픽쳐를 제공할 것이다.
디지털 방송은 완전히 새로운 옵션과 형태의 프로그래밍을 제공한다. 방송국은 추가 비디오, 화상 및/또는 오디오(다른 가능한 데이터 전송과 함께)를 제공하여 TV 시청자의 시청 체험을 향상시킬 수 있다. 예를 들어, 비디오(일반적으로 가능한 추가 데이터와 함께 조합된 비디오+오디오) 신호로 전송될 수 있는 하나 이상의 전자 프로그램 가이드(EPG)는 관심있는 채널로 사용자를 안내할 수 있다. 대부분의 일반적인 디지털 방송 및 리플레이(예를 들어, 비디오 콤팩트 디스크(VCD) 또는 디지털 비디오 디스크(DVD)에 의한)는 프로그램 상연을 위한 압축 해제와 함께 저장 및/또는 방송을 위한 비디오 화상의 압축을 포함한다. 대부분의 일반적인 압축 표준(오디오 등의 관련 데이터에 또한 사용될 수 있음) 중에는 JPEG 및 다양한 MPEG 표준이 있다.
JPEG
1. 서설
JPEG(Joing Photographic Experts Group)는 정지 화상 압축의 표준이다. JPEG 위원회는 정지 화상의 손실, 무손실 및 거의 무손실의 압축과, 연속 계조, 정지 프레임, 단색 및 컬러 화상의 압축에 대한 표준을 개발하였다. JPEG 표준은 응용 프로그램이 그들의 조건을 만족시키는 구성 요소를 선택할 수 있는 3개의 메인 압축 기술을 제공한다. 3개의 메인 압축 기술은 (ⅰ) 베이스라인 시스템, (ⅱ) 확장 시스템 및 (ⅲ) 무손실 모드 기술이다. 베이스라인 시스템은 순차적인 모드의 8 비트/화소 입력으로 제한된 허프만 코딩을 이용한 단순하고 효율적인 이산 여현 변환(DCT) 기반의 알고리즘이다. 확장 시스템은 베이스라인 시스템을 개선시켜 계층적 및 순차적 모드의 12 비트/화소 입력으로 광범위한 응용 프로그램을 만족시키며, 무손실 모드는 허프만 또는 산술 코딩을 이용한 DCT에 의존하는 예측 코딩, DPCM(Differential Pulse Coded Modulation)을 기초로 한다.
2. JPEG 압축
JPEG 인코더 블록도의 예가 John Miano의 압축 화상 파일 포맷:JPEG, PNG, GIF, XBM, BMP(ACM 프레스)에 있으며, 더욱 완전한 기술적인 설명은 ISO/IEC 국제 표준 10918-1(www.jpeg.org/jpeg/를 참조)에 있다. 비디오 프레임 화상 등의 원 픽쳐는 8×8 화소 블록으로 분할되며, 각각의 블록은 DCT를 이용하여 개별적으로 변환된다. DCT는 공간 영역으로부터 주파수 영역으로의 변환 함수이다. DCT 변환은 MPEG-1, MPEG-2, MPEG-4 및 JPEG 등의 여러 손실 압축 기술에 사용된다. DCT 변환이 사용되어 화상 내의 주파수 성분을 분석하고, 사람의 눈으로 일반적으로 인식하지 못하는 주파수를 폐기한다. DCT에 대한 더욱 완전한 설명은 Alan V. Oppenheim, Ronald W. Schafer , John R. Buck 의 " Discrete - Time Signal Processing"(Prentice Hall , 1999년 2월 제 2 판)에 있다. 모든 변환 계수는 사용자 규정의 양자화 테이블(또한 q 테이블 또는 정규화 매트릭스이라 함)을 이용하여 균일하게 양자화된다. 인코딩 화상의 화질 및 압축 비율은 양자화 테이블의 원소를 변경함으로써 변경될 수 있다. 일반적으로, 2-D DCT 어레이의 좌상부의 DC 계수는 공간 블록의 평균 밝기에 비례하며, 현재 블록의 양자화된 DC 계수와 이전 블 록의 양자화된 DC 계수간의 차이로부터 가변 길이 코딩된다. AC 계수는 지그재그 주사를 통해 1-D 벡터로 재배열되고 런 렝스(run-length) 코딩을 이용하여 인코딩된다. 최종적으로, 압축 화상은 허프만 코딩을 이용하는 것과 같이, 엔트로피 코딩된다. 허프판 코딩은 문자의 빈도수에 기초한 가변 길이 코딩이다. 가장 빈번한 문자는 소수의 비트로 코딩되고 드문 문자는 다수의 비트로 코딩된다. 허프만 코딩에 대한 보다 상세한 설명은 Khalid Sayood 의 " Introduction to Data Compressioon"(Morgan Kaufmann , 2000년 2월 제 2 판)에 있다.
JPEG 디코더는 역순으로 동작한다. 따라서, 압축 데이터가 엔트로피 디코딩되고 2차원 양자화 DCT 계수가 구해진 후에, 각각의 계수는 양자화 테이블을 이용하여 양자화 해제된다. JPEG 압축은 현재의 디지털 정지 카메라 시스템과 다수의 가라오케 "노래방" 시스템에서 일반적으로 찾을 수 있다.
웨이블릿(Wavelet)
웨이블릿은 데이터를 여러 주파수 성분으로 분할하는 변환 함수이다. 웨이블릿은 컴퓨터 비전의 다중 해상도 분석과, 오디오 및 비디오 압축에서의 대역 분할 코딩 기술과, 응용 수학에서의 웨이블릿 시리즈를 포함한 여러 상이한 분야에서 유용하다. 웨이블릿 압축은 DCT형 변환 압축의 대안 또는 부가물이며, MPEG-4 등의 다양한 MPEG 표준에 있어서 고려되거나 채택된다. 더욱 완전한 설명은 Raghuveer M. Rao의 "Wavelet transforms: Introduction to Theory and Application"에 있다.
MPEG
MPEG(Moving Pictures Experts Group) 위원회는 콤팩트 디스크(CD) 용도로 비디오 및 오디오를 표준화하는 것을 목표로 시작하였다. 국제 표준 기구(ISO)와 국제 전기 기술 위원회(IEC)와의 회의는 1994년에 MPEG-2라는 제목으로 표준을 마무리하였고, 이는 현재 디지털 TV 방송의 비디오 코딩 표준으로서 채택되고 있다. MPEG는 예시적인 표준과 함께 www.mpeg.org에 더욱 완전히 기술되고 설명되어 있다. 추가로, MPEG-2는 Barry G. Haskell , Atul Puri , Arun N. Netravali 의 "Digital Video : An Introduction to MPEG -2( Digital Multimedia Standards Series)"에 기술되어 있으며, MPEG-4는 Touradj Ebrahimi , Fernando Pereira 의 "The MPEG -4 Book "에 기술되어 있다.
MPEG 압축
MPEG 표준 압축의 목표는 아날로그 또는 디지털 비디오 신호(및 오디오 신호 또는 텍스트 등의 관련된 데이터)를 획득하여 보다 효율적인 대역폭인 디지털 데이터의 패킷으로 변환하는 것이다. 디지털 데이터의 패킷을 생성함으로써, 선명도를 떨어뜨리지 않는 신호를 생성하고, 고화질의 픽쳐를 제공하고, 높은 신호 대 잡음비를 달성할 수 있다.
MPEG 표준은 정지 화상의 JPEG 표준으로부터 사실상 유추된다. MPEG-2 비디오 압축 표준은 풀 프레임 비디오 화상에 대한 정보를 단지 가끔 생성함으로써 높은 데이터 압축비를 달성한다. 이들 풀 프레임 화상 또는 "인트라코딩" 프레임(픽쳐)은 "I-프레임"이라 한다. 각각의 I-프레임은 다른 프레임과는 무관하게 단일 비디오 프레임(화상 또는 픽쳐)의 완전한 설명을 포함하며, 사람의 눈의 특성을 이 용하여 사람이 전통적으로 볼 수 없는 높은 주파수의 과다한 정보를 제거한다. 이들 "I-프레임" 화상은 MPEG-2 스트림 내에서 참조 화상으로서 작용하는 "앵커 프레임"(종종 "키 프레임" 또는 "참조 프레임"이라 함)으로서 작용한다. I-프레임 간에, 델타 코딩, 움직임 보상 및 다양한 보간/예측 기술이 사용되어 인터리빙 프레임을 생성한다. "상호 코딩된" B-프레임(양방향성의 코딩 프레임)과 P-프레임(예측 코딩 프레임)은 I-프레임 간에 인코딩된 "중간" 프레임의 예이며, I-프레임(참조 프레임)과 관련하여 그들이 나타내는 개재의 프레임 간의 차이에 대한 정보만을 저장한다. MPEG 시스템은 2개의 메인 층, 즉, 시스템 층(비디오 및 오디오를 동기화하는 타이밍 정보) 및 압축 층으로 구성되어 있다.
MPEG 표준 스트림은 비디오 시퀀스 층, GOP 층, 픽쳐층, 슬라이스층, 매크로블록층 및 블록층으로 구성된 층의 계층으로서 구성되어 있다.
비디오 시퀀스 층은 시퀀스 헤더(및 옵션으로 다른 시퀀스 헤더)로 시작하며, 일반적으로 하나 이상의 픽쳐를 포함하며, 종료 시퀀스 코드로 종료한다. 시퀀스 헤더는 코딩된 픽쳐의 크기, 차이가 있다면 디스플레이된 비디오 픽쳐의 크기, 프레임 비율, 비디오의 종횡비, 프로파일 및 레벨 식별, 비월 또는 순차 시퀀스 식별, 사적 사용자 데이터, 비디오와 관련된 다른 글로벌 파라미터 등의 기본적인 파라미터를 포함한다.
GOP층은 헤더와, 랜덤 액세스, 고속 서치 및 편집을 가능하게 한 하나 이상의 일련의 픽쳐로 구성되어 있다. GOP 헤더는 특정의 레코딩 장치에 사용되는 시간 코드를 포함한다. GOP의 제 1의 인트라(I)-픽쳐 다음의 양방향성(B)-픽쳐가 폐 쇄된 GOP로 불리는 랜덤 액세스 이후에 디코딩될 수 있는지 여부를 나타내는 편집 플래그를 또한 포함한다. MPEG에서, 비디오 픽쳐는 일반적으로 일련의 GOP로 분할된다.
픽쳐층은 비디오 시퀀스의 비디오 시퀀스의 주된 코딩 유닛이다. 픽쳐는 휘도(Y)와 2개의 색차(Cb 및 Cr 또는 U 및 V)를 나타내는 3개의 직사각형 매트릭스로 구성되어 있다. 픽쳐 헤더는 화상의 픽쳐 코딩 유형(인트라(I), 예측(P), 양방향성(B) 픽쳐), 픽쳐의 구조(프레임, 필드 픽쳐), 지그재그 주사의 유형에 대한 정보와, 픽쳐의 디코딩에 관련된 다른 정보를 포함한다. 순차 모드 비디오에 있어서, 픽쳐는 프레임과 일치하며 상호 교환가능하게 사용될 수 있으며, 비월 모드 비디오에 있어서, 픽쳐는 프레임의 상부 필드 또는 하부 필드를 지칭한다.
슬라이스는 블록의 2×2 매트릭스로 일반적으로 구성된 일련의 연속적인 매크로블록으로 구성되어 있으며, 데이터 손상의 경우에 에러 탄력성(error resilience)을 인정한다. 에러 탄력적 환경에서 슬라이스가 존재하기 때문에, 손상되어 있는 전체 픽쳐 대신에 부분적인 픽쳐가 구성될 수 있다. 비트스트림이 에러를 포함하면, 디코더는 다음 슬라이스의 개시로 스킵할 것이다. 비트스트림내에 보다 많은 슬라이스가 있으면 양호한 에러를 은닉할 수 있지만, 이렇게 사용되지 않는다면 달리 화질을 개선하는데 사용될 수도 있는 공간을 사용한다. 슬라이스는 I-픽쳐에서의 모든 매크로블록이 전송되는 경우에 좌측에서 우측으로 또한 최상부에서 바닥부로 전형적으로 이동하는 매크로블록으로 구성되어 있다. P-픽쳐와 B-픽쳐에서, 전형적으로, 슬라이스의 몇몇 매크로블록이 전송되며, 몇몇의 매크로블 록은 그렇지 않으며, 즉, 몇몇의 매크로블록은 스킵된다. 그러나, 슬라이스의 맨 처음 매크로블록과 마지막 매크로블록은 항상 전송되어야 한다. 또한, 슬라이스는 겹치지 않아야 한다.
블록은 매크로블록에서 8×8 블록의 양자화된 DCT 계수에 대한 데이터로 구성된다. 공간 영역에서의 화소의 8×8 블록은 DCT에 의해 주파수 영역으로 변환되고 주파수 계수는 양자화된다. 양자화는 제한된 개수의 양자화 값 중 하나로서 각각의 주파수 계수를 근사치화하는 프로세스이다. 인코더는 8×8 블록에서의 각각의 주파수 계수가 얼마나 양자화되는지를 결정하는 양자화 매트릭스를 선택한다. 양자화 에러에 대한 사람의 인식은 높은 공간적 주파수(컬러 등)에 있어서는 더 낮아서, 고주파수가 전형적으로 보다 대략적으로(소수의 허용값으로) 양자화된다.
DCT와 양자화의 조합으로 특히 높은 공간적 주파수에서 주파수 계수의 대부분이 0으로 된다. 이를 최대한 이용하기 위해서, 계수는 지그재그 순서로 구성되어 긴 0의 길이를 생성한다. 그 다음, 계수는 일련의 길이-진폭 쌍으로 변환되고, 각각의 쌍은 다수의 0의 계수와 0인 아닌 계수의 진폭을 나타낸다. 이들 길이-진폭은 가변 길이 코드로 코딩되고, 이는 공통으로 발생하는 쌍에 대하여 짧은 코드를 이용하며, 보다 적은 공통 쌍에 대하여 긴 코드를 이용한다. 이러한 과정은 Barry G. Haskell , Atul Puri , Arun N. Netravali 의 " Digital Video : An Introduction to MPEG -2"( Chapman & Hall , December , 1996)에 상세히 설명되어 있다. 또한, " Generic Coding of Moving Pictures and Associated Audio Information - Part 2: Video ", ISO / IEC 13818-2 ( MPEG -2), 1994(www.mpeg.org를 참조)에 상세히 설명되어 있다.
상호 픽쳐 코딩
상호 픽쳐 코딩은 이전 프레임으로부터 이전 인코딩된 화소를 이용하여 픽쳐를 구성하는데 사용되는 코딩 기술이다. 이러한 기술은 비디오 내의 인접한 픽쳐는 일반적으로 매우 유사하다는 것을 기초로 한다. 픽쳐가 동체를 포함하고 있다면, 또한, 하나의 프레임 내에서의 그들의 이동의 추정이 가능하다면, 적절히 공간적으로 배치된 이전 프레임 내의 화소를 이용하는 시간적 예측이 적응된다. MPEG의 픽쳐 유형은 사용된 상호 예측의 유형에 따라서 3개 유형의 픽쳐로 분류된다. 상호 픽쳐 코딩에 대한 보다 상세한 설명은 Barry G. Haskell, Atul Puri, Arun N. Netravali의 "Digital Video: An Introduction to MPEG-2"(Chapman & Hall, December, 1996)에 있다.
픽쳐 유형
특히, MPEG 표준(MPEG-1, MPEG-2, MPEG-4)은 픽쳐(프레임) 인트라(I), 예측(P) 및 양방향성(B)의 3가지 유형을 규정한다.
전형적으로, 인트라(I) 픽쳐는 그들 자체적으로 공간 영역에서만 개별적으로 코딩된다. 인트라 픽쳐는 인코딩을 위해 다른 픽쳐를 참조하지 않고 그 픽쳐는 다른 픽쳐의 수신과는 무관하게 인코딩될 수 있기 때문에, 인트라 픽쳐는 압축된 비디오에서의 액세스 포인트로서 사용된다. 인트라 픽쳐는 일반적으로 공간 영역으로 압축되고, 따라서, 다른 유형의 픽쳐에 비해 크기가 더 크다.
예측(P) 픽쳐는 바로 이전의 I-픽쳐 또는 P-픽쳐에 대하여 코딩되는 픽쳐이 다. 이러한 기술을 전방 예측이라 한다. P-픽쳐에서, 각각의 매크로블록은 이전의 I-픽쳐 또는 P-픽쳐에서 참조으로 사용된 화소를 가르키는 하나의 움직임 벡터를 가질 수 있다. P-픽쳐는 B-픽쳐와 미래의 P-픽쳐에 대하여 참조 픽쳐로서 사용될 수 있기 때문에, 코딩 에러를 전파할 수 있다. 따라서, GOP에서의 P-픽쳐의 개수는 종종 제한되어 더욱 선명한 비디오를 가능하게 한다.
양방향성(B) 픽쳐는 바로 다음의 I-픽쳐 및/또는 P-픽쳐뿐만 아니라, 바로 이전의 I-픽쳐 및/또는 P-픽쳐를 이용하여 코딩되는 픽쳐이다. 이러한 기술을 양방향성 예측이라 한다. B-픽쳐에서, 각각의 매크로블록은 이전의 I-픽쳐 또는 P-픽쳐에서 참조으로서 사용되는 화소를 지칭하는 하나의 움직임 벡터와, 다음 I-픽쳐 또는 P-픽쳐에서 참조으로서 사용되는 화소를 지칭하는 다른 움직임 벡터를 가질 수 있다. 매크로블록은 움직임 벡터에 의해 참조으로 되는 2개의 매크로블록을 평균화하여 얻어지는 경우에, B-픽쳐에서의 각각의 매크로블록은 최대 2개의 움직임 벡터를 가질 수 있기 때문에, 결과적으로 노이즈가 감소한다. 압축의 효율성 측면에서, B-픽쳐는 가장 효율적이며, P-픽쳐는 다소 나쁘며, I-픽쳐는 가장 효율성이 적다. 전형적으로, B-픽쳐는 상호 예측에 있어서 참조 픽쳐로서 사용되지 않기 때문에, 에러를 전파하지 않는다.
비디오 스트림 합성
MPEG 스트림(MPEG-1, MPEG-2 및 MPEG-4)에서의 I-프레임의 개수는 랜덤 액세스에 필요한 응용과 비디오 시퀀스에서의 장면 절단(scene cuts)의 위치에 따라서 변할 수 있다. 랜덤 액세스가 중요한 응용에서는, I-프레임이 자주 사용되는데, 예를 들면, 초당 2회 사용될 수도 있다. 한 쌍의 참조(I 또는 P) 프레임 간의 B-프레임의 개수는 인코더의 메모리 용량과 인코딩되는 자료의 특성 등의 요인에 따라서 또한 변할 수 있다. 픽쳐의 전형적인 디스플레이 순서는 Barry G. Haskell , Atul Puri , Arun N. Netravali 의 " Digital Video : An Introduction to MPEG -2 (Digital Multimedia Standards Series )"와 " Generic Coding of Moving Pictures and Associated Audio Information - Part 2: Videos " ISO / IEC 13818-2 ( MPEG -2), 1994(www.iso.org를 참조)에 있다. 픽쳐의 시퀀스는 B-프레임을 재구성하는데 필요한 참조 픽쳐가 관련 B-픽쳐에 앞서 전송되도록 인코더에서 재정렬된다. 픽쳐의 전형적인 인코딩된 순서는 Barry G. Haskell , Atul Puri , Arun N. Netravali 의 "Digital Video : An Introduction to MPEG -2 ( Digital Multimedia Standards Series)"" Generic Coding of Moving Pictures and Associated Audio Information - Part 2: Videos " ISO / IEC 13818-2 ( MPEG -2), 1994(www.iso.org를 참조)에 있다.
움직임 보상
더욱 높은 압축비를 달성하기 위해서, 비디오의 시간적인 중복은 움직임 보상으로 불리는 기술에 의해 제거된다. 움직임 보상은 각각의 매크로블록이 참조 매크로블록과 코딩되는 매크로블록과의 움직임 벡터와, 참조 매크로블록과 코딩된 매크로블록과의 에러를 가지는 매크로 블록 레벨에서 P-픽쳐와 B-픽쳐에 사용된다. P-픽쳐에서의 매크로블록의 움직임 보상은 이전의 참조 픽쳐(I-픽쳐 또는 P-픽쳐)에서의 매크로블록만을 이용할 수 있으며, B-픽쳐에서의 매크로블록은 이전 픽쳐와 미래 픽쳐 둘 다의 조합을 참조 픽쳐(I-픽쳐 또는 P-픽쳐)으로서 사용할 수 있다. 움직임 보상의 관점에 대한 보다 확대된 설명은 Barry G. Haskell , Atul Puri , Arun N. Netravali 의 " Digital Video : An Introduction to MPEG -2 ( Digital Multimedia Standards Series )"와 " Generic Coding of Moving Pictures and Associated Audio Information - Part 2: Videos " ISO / IEC 13818-2 ( MPEG -2), 1994(www.iso.org를 참조)에 있다.
MPEG-2 시스템 층
MPEG-2 시스템의 주된 기능은 몇몇 유형의 멀티미디어 정보를 하나의 스트림으로 조합하는 수단을 제공하는 것이다. 몇몇 기본 스트림(ES)으로부터의 데이터 패킷(오디오, 비디오, 텍스트 데이터 및 다른 데이터 등)은 단일 스트림 내에 인터리빙된다. ES는 패킷의 길이 또는 주파수를 단순히 변경함으로써 고정 비트율 또는 가변 비트율로 전송될 수 있다. ES는 단일 소스로부터의 압축된 데이터와 소스 정보의 동기화, 식별 및 특징화를 위해서 필요한 보조 데이터로 구성되어 있다. ES 자체는 고정 길이 또는 가변 길이의 패킷으로 먼저 패킷화되어 패킷 기본 스트림(PES)을 형성한다.
MPEG-2 시스템 코딩은 2개의 형태, 즉, 프로그램 스트림(PS)과 트랜스포트 스트림(TS)으로 표시된다. PS는 DVD 미디어 등의 상대적으로 에러가 없는 환경에서 사용되며, TS는 디지털 방송 등과 같이 에러가 있을 수 있는 환경에서 사용된다. 일반적으로, PS는 프로그램이 여러 ES의 조합인 하나의 프로그램을 가지고 있다. PS는 다중화된 데이터(multiplexed data)의 팩으로 구성된다. 각각의 팩은 패킷 헤더와, 다양한 ES로부터의 여러 개의 멀티플렉스 PES 패킷과, 다른 서술 데이터로 구성되어 있다. TS는 상대적으로 긴 가변 길이의 PES 패킷을 추가로 패킷화하는 188 바이트의 TS 패킷으로 구성되어 있다. 각각의 TS 패킷은 TS 헤더와, 옵션적으로 보조 데이터(적응 필드라 함)와, 전형적으로 하나 이상의 PES 패킷으로 구성되어 있다. 일반적으로, TS 헤더는 에러 검출, 타이밍 및 다른 기능을 위해서 동기(동기화) 바이트, 플래그 및 표시자, 패킷 식별자(PID) 및 다른 정보로 구성되어 있다. TS 패킷의 헤더 및 적응 필드는 스크램블되지 않아야 한다.
예를 들어, 오디오 및 비디오 스트림을 포함하는 ES 간의 적절한 동기화를 유지하기 위해서, 동기화는 타임 스탬프와 클록 참조를 사용하여 일반적으로 달성된다. 프레젠테이션과 디코딩을 위한 타임 스탬프는 일반적으로 90kHz의 단위이며, 이는 특정 프레젠테이션 단위(비디오 픽쳐 등)가 디코더에 의해 디코딩되어 출력 장치에 제공되어야 하는 27 MHz의 해상도를 가진 클록 참조에 따른 적절한 시간을 나타낸다. 오디오 및 비디오의 프레젠테이션 시간을 포함하는 타임 스탬프는 일반적으로 PES 패킷 헤더에 존재할 수 있는 프레젠테이션 타임 스탬프(PTS)라 하며, 디코딩된 픽쳐가 디스플레이를 위해 출력 장치에 전달되는 시간을 표시하며, 디코딩 시간을 나타내는 타임 스탬프는 디코딩 타임 스탬프(DTS)라 한다. 트랜스포트 스트림(TS) 내의 프로그램 클록 참조(PCR)와 프로그램 스트림(PS) 내의 시스템 클록 참조(SCR)는 시스템 시간 클록의 샘플링 값을 나타낸다. 일반적으로, PCR과 SCR의 정의는 구별이 있지만 동일한 것으로 간주할 수 있다. TS 패킷의 적응 필드 내에 존재할 수 있는 PCR은 하나의 프로그램에 대해 클록 참조를 제공하며, 여기서, 프로그램은 공통의 시간 베이스를 가진 ES 세트로 구성되며, 동기화된 디코딩 및 프레젠테이션을 위한 것이다. 하나의 TS 내에 다수의 프로그램이 있을 수 있으며, 각각은 독립적인 시간 베이스와 개별적인 세트의 PCR를 가질 수 있다. 디코더의 예시적인 동작에 대한 설명으로서, 디코더의 시스템 시간 클록은 전송된 PCR(또는 SCR)의 값으로 설정되며, 프레임은 디코더의 시스템 시간 클록이 프레임의 PTS의 값과 일치할 때 디스플레이된다. 일관성 및 명확성을 위해서, 이하의 명세서는 PCR의 용어를 사용할 것이다. 그러나, 특별히 달리 설명하지 않는 한 동일한 설명 및 응용이 SCR 또는 다른 등가 또는 대체물에도 적용한다. MPEG-2 시스템 층에 대한 더욱 광범위한 설명은 " Generic Coding of Moving Pictures and Associated Audio Information - Part 2: Systems " ISO / IEC 13818-1 ( MPEG -2) 1994에 있다.
MPEG-1과 MPEG-2의 차이
MPEG-2 비디오 표준은 순차 주사 비디오와 비월 주사 비디오 둘 다를 지원하며, MPEG-1 비디오 표준은 순차 주사 비디오만을 지원한다. 순차 주사에서, 비디오는 순차적인 래스터 주사 프레임의 스트림으로서 디스플레이된다. 각각의 프레임은 순차적으로 디스플레이의 최상부로부터 바닥부까지 디스플레이되는 스캔 라인과 함께 픽쳐를 완전히 채우는 화상 데이터를 포함한다. "프레임 비율"은 비디오 스트림에서의 초당 프레임 개수를 나타낸다. 비월 주사에서, 비디오는 2배의 프레임 비율에서 교대의 비월되는(또는 인터리빙된) 상부 및 하부 래스터 필드의 스트림으로서 디스플레이되며, 이 때 두 개의 필드가 매 프레임을 형성한다. 최상부 필드("상위 필드" 또는 "홀수 필드"라 함)는 홀수의 스캔 라인(디스플레이의 최상부에서 스캔 라인 1로 시작함)에 대한 비디오 화상 데이터를 포함하며, 바닥부 필드는 짝수 스캔 라인에 대한 비디오 화상을 포함한다. 최상부와 바닥부 필드는 전송되어 교번 방식으로 디스플레이되며, 각각의 디스플레이된 프레임은 최상부 필드와 바닥부 필드를 포함한다. 비월 주사(interlaced) 비디오는 각각의 라인을 스크린 상에 순서대로 페인트하는 비월 주사를 사용하지 않는(non-interlaced) 비디오와는 상이하다. 비월 비디오 방법은 신호를 전송할 때 대역폭을 절약하도록 개발되었지만, 결과적으로는 비교할만한 비비월(순차) 비디오보다 덜 상세한 화상으로 될 수 있다.
또한 MPEG-2 비디오 표준은 DCT 블록 코딩 및 움직임 예측에 대해 프레임 기반 및 필드 기반의 방법 모두를 지원하며, MPEG-1 비디오 표준은 DCT에 대해 프레임 기반의 방법만을 지원한다. 전형적으로, 필드 DCT 방법에 의해서 코딩된 블록은 프레임 DCT 방법에 의해 코딩된 블록에 비해 큰 움직임 성분을 갖는다.
MPEG-4
MPEG-4는 장면 합성을 위해서 계층적으로 구성된 객체에 대한 개선된 그래픽 콘텐츠를 생성하기 위해 광범위한 툴 세트와의 상호작용성(interactivity)을 가능하게 하는 시청각(AV) 인코더/디코더(코덱) 프레임워크이다. MPEG-4 비디오 표준은 비디오 압축의 목적으로 1993년에 시작하였고 새로운 세대의 코딩된 장면 프레젠테이션을 제공하는 것이다. 예를 들어, MPEG-4는 비주얼 객체의 집합체로서 장면을 인코딩하며, 여기서, 객체(자연 또는 합성)는 개별적으로 코딩되어 합성을 위 해 장면의 설명과 함께 전송된다. 따라서, MPEG-4는 각각의 비디오 객체(VO)가 형태, 텍스트 및 움직임 등의 특성으로 특징화되는 MPEG-4에 규정된 VO를 기반으로 한 비디오 데이터의 객체 기반 표현에 의존한다. 시청각 장면을 생성하기 위한 이들 VO의 합성을 기술하기 위하여, 몇몇 VO는 그래프의 노드가 VO인 장면 그래프로서의 멀티미디어 시나리오의 모델링을 가능하게 하는 BIFS(Binary Format for Scene)를 가진 장면을 형성하도록 구성되어 있다. BIFS는 양방향성, 합성 및 자연 오디오 또는 비디오의 혼합/정합, 스케일링, 로테이션, 드래그, 드랍 등을 포함하는 객체의 조작/합성을 제공하기 위해 요구에 따라 장면 그래프로부터 노드를 동적으로 추가 또는 제거하는 계층 구조의 형태로 장면을 기술한다. 따라서, MPEG-4 스트림은 BIFS 구문, 비디오/오디오 객체 및 동기화 구성, 디코더 구성 등의 다른 기본적 정보로 구성된다. BIFS는 스케쥴링, 시간 및 공간 영역에서의 좌표화, 동기화, 양방향성의 처리에 대한 정보를 포함하기 때문에, MPEG-4 스트림을 수신하는 클라이언트는 오디오/비디오 ES를 합성하는 BIFS 정보를 먼저 디코딩할 필요가 있다. 디코딩된 BIFS 정보에 기초하여, 디코더는 다른 가능한 보충 데이터뿐만 아니라 관련 시청각 데이터에 액세스한다. MPEG-4 객체 기반 표현을 장면에 적용하기 위해서, 장면에 포함된 객체를 먼저 검출하여 세그먼트화하여야 하는데, 이는 현 기술의 화상 분석 기술을 이용하여 쉽게 자동화할 수 없다.
H.264(AVC)
AVC 또는 MPEG-4 파트 10으로 불리는 H.264는 가장 새로운 국제 비디오 코딩 표준이다. MPEG-2 등의 비디오 코딩 표준은 위성, 케이블 및 지상파 송출을 통해 HDTV 신호를 전송할 수 있게 하며, 여러 디지털 저장 장치(디스크 드라이브, CD 및 DVD 등)에 비디오 신호를 저장할 수 있게 한다. 그러나, H.264에 대한 필요성은 MPEG-2 등의 종래의 비디오 코딩 표준에 비해 코딩 효율성을 향상시키기 위해서 발생하였다.
종래의 비디오 코딩 표준에 비해, H.264는 비디오 코딩 효율성을 향상시키는 특징을 가지고 있다. H.264는 종래의 비디오 코딩 표준에 비해 움직임 보상 블록 크기와 형태의 선택에 있어서 더 많은 융통성을 가질 수 있는 4×4 만큼 작은 블록 크기로 가변 블록 크기의 정확한 쿼터 샘플 움직임 보상을 가능하게 한다.
H.264는 인접한 미래 픽쳐와 이전 픽쳐의 조합을 단순히 참조하는 MPEG-1 및 MPEG-2에서의 P-픽쳐 또는 B-픽쳐에 비해 움직임 보상을 참조하는 픽쳐를 인코더가 선택할 수 있는 개량된 참조 픽쳐 선택 기술을 갖는다. 따라서, 종래의 비디오 코딩 표준에서의 움직임 보상에 대한 픽쳐의 순서 사이의 엄격한 의존도에 비해 참조와 디스플레이 목적의 픽쳐 순서에 보다 높은 융통성이 제공된다.
다른 비디오 코딩 표준에는 없는 H.264의 다른 기술은 H.264가 인코더에 의해 지시된 양만큼 움직임 보상 예측 신호를 가중하고 오프셋하여, 코딩 효율적으로 상당히 개선할 수 있다는 점이다.
종래의 모든 주요 코딩 표준(JPEG, MPEG-1, MPEG-2 등)은 변환 코딩을 위해 8×8의 블록 크기를 이용하지만, H.264 설계는 변환 코딩을 위해 4×4의 블록 크기를 이용한다. 이로써, 인코더는 보다 적응적인 방식으로 신호를 나타내어, 보다 정확한 움직임 보상과 아티팩트 감소를 가능하게 한다. 또한, H.264는 컨텍스트 기반의 적응성을 이용하여 종래 표준에 비해 엔트로피 코딩의 성능을 향상시키는 2개의 엔트로피 코딩 방법(컨텍스트-적응성 가변 길이 코딩(CAVLC)과 컨텍스트-적응성 2진 산술 코딩(CABAC)이라 함)을 이용한다.
H.264는 여러 네트워크 환경에 있어서의 데이터 에러/손실에 대한 강건성을 제공한다. 예를 들어, 파라미터 세트 설계는 보다 유연한 방식으로 핸들링하기 위해 개별적으로 전송되는 강건한 헤더 정보를 제공하여, 몇 비트의 정보가 전송 동안에 손실될 지라도, 디코딩 프로세스에서 심각한 영향이 관찰되지 않게 한다. 데이터 강건성을 제공하기 위해서, H.264는 픽쳐를 슬라이스 그룹으로 분할하며, 여기서, 각각의 슬라이스는 MPEG-1 및 MPEG-2와 유사하게 다른 슬라이스와 별개로 디코딩될 수 있다. 그러나, MPEG-2에서의 슬라이스 구조는 H.264에 비해 덜 유연하여, 헤더 데이터 양의 증가와 예측 효과성의 감소로 인해 코딩 효율성을 감소시킨다.
강건성을 향상시키기 위해서, H.264는 픽쳐와 관련된 주된 정보가 손실되면, 손실 영역에 대한 중복 정보를 수신하여 픽쳐를 복원할 수 있도록, 픽쳐의 영역이 중복 인코딩되도록 한다. 또한, H.264는 전송을 위한 코딩 정보의 중요도에 따라서 각각의 슬라이스의 구문을 다수의 상이한 구획으로 분리한다.
ATSC/DVB
ATSC는 디지털 HDTV 및 SDTV를 포함한 DTV에 대한 국제적으로 비영리 조직이 개발한 자발적 표준이다. ATSC 디지털 TV 표준, 개정 B(ATSC 표준 A/53B)는 MPEG-2 인코딩에 기초한 디지털 비디오에 대한 표준을 규정하며, 예를 들어, 19,29Mbps 에서 1920×1080 화소/셀(2,073,600 화소)만큼 큰 비디오 프레임을 가능하게 한다. 디지털 비디오 방송 프로젝트(DVB - 35 나라에 걸친 300개의 방송국, 제작업체, 네트워크 운영자, 소프트웨어 개발업자, 규제 기관 등)는 DTV에 대한 유사한 국제 표준을 제공한다. 유럽 내에서의 케이블, 위성 및 지상파 TV 네트워크의 디지털화는 디지털 비디오 방송(DVB) 계열의 표준을 기반으로 하지만, 미국과 한국은 디지털 TV 방송을 위해 ATSC를 이용한다.
ATSC와 DVB 호환의 디지털 스트림을 보기 위해서, 사용자의 TV 세트와 내부적으로 연결 또는 연관될 수 있는 디지털 STB가 TV 시장을 침투하기 시작했다. 본 명세서에 있어서, STB 용어는 퍼스널 컴퓨터(PC)와 모바일 장치를 포함한, TV 프로그램의 일부분을 수신, 저장, 처리, 반복, 편집, 수정, 디스플레이, 재생 또는 수행하기 위한 모든 그러한 디스플레이, 메모리, 또는 인터페이스 장치를 지칭한다. 이러한 새로운 소비자 장치를 이용하여, TV 시청자는 방송 프로그램을 그들의 디지털 비디오 리코더(DVR)의 로컬 또는 다른 관련 데이터 저장부에 MPEG-2 등의 디지털 비디오 압축 형태로 기록할 수 있다. 일반적으로, DVR은 예를 들어, 관련 저장부 또는 자신의 로컬 저장부 또는 하드 디스크에 기록 기능을 가진 STB로서 생각된다. DVR에 의해, TV 시청자는 그들이 원하는 방식으로(시스템의 제한 범위 내에서, 또한, 그들이 원하는 시간에(일반적으로, "온 디멘드"라고 함), 프로그램을 시청할 수 있다. 디지털 기록된 비디오의 성질로 인해서, 시청자는 고속 재생 및 되감기 등의 종래의 비디오 카셋트 리코더(VCR) 타입 제어에 추가로, 기록된 프로그램의 특정 포인트에 바로 액세스하는 기능("랜덤 액세스"라고 함)을 가질 수 있다.
표준 DVR에서, 입력 장치는 고주파(RF) 튜너, 일반적인 네트워크(예, 인터넷, WAN, 및/또는 LAN), 또는 CD와 DVD 등의 보조 판독 전용 디스크로부터 ATSC, DVB, 디지털 멀티미디어 방송(DMB) 및 디지털 위성 시스템(DSS)(이들 대부분은 MPEG-2 TS를 기반으로 함) 등의 다수의 디지털 형태로 비디오 스트림을 획득한다.
일반적으로, DVR 메모리 시스템은 입력 장치의 디멀티플렉서를 또한 제어할 수 있는 프로세서의 제어하에 동작한다. 일반적으로, 프로세서는 시청자가 조작한 사용자 제어 장치로부터 수신한 커맨드에 응답하도록 프로그래밍된다. 디멀티플렉서에게 동조 및 복조된 채널 신호로부터 프레임의 하나 이상의 시퀀스를 공급하라는 커맨드 신호를 전송하며, 이들은 랜덤 액세스 메모리에 압축 형태로 조립되고 디스플레이 장치에 디스플레이하기 위해 메모리를 통해 압축 해제기/디코더에 공급되는 것과 같이, 사용자 제어 장치를 이용하여, 시청자는 시청할 (또한 버퍼에 기록된) 채널을 선택할 수 있다.
DVB 서비스 정보(SI, Service Information)와 ATSC 프로그램 특정 정보 프로토콜(PSIP, Program Specific Information Protocol)은 제각기 DTV 신호를 DVB와 ATSC 시스템에 연결시키는 핵심 역할을 한다. ATSC(또는 DVB)는 PSIP(또는 SI)가 방송 신호를 수반할 수 있게 하며, 디지털 STB와 시청자가 증가된 개수의 디지털 서비스를 네비게이팅하는 것을 돕고자 하는 것이다. ATSC-PSIP와 DVB-SI는 " ATSC Standard A/53C with Amendment No . 1: ATSC Digital Television Standard ", Rev . C, " ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable " Rev . B 2003년 3월 18일(www.atsc.org를 참조), "ETSI EN 300 468 Digital Video Broadcasting ( DVB ); Specification for Service Information ( SI ) in DVB Systems "(www.etsi.org를 참조)에 상세히 설명되어 있다.
DVB-SI와 ATSC-PSIP 내에서, 이벤트 정보 테이블(EIT)은 프로그램("이벤트") 정보를 제공하는 수단으로서 특히 중요하다. DVB와 ATSC의 호환성에 있어서, 현재 방영 프로그램과 다음 프로그램에 대한 정보를 제공하는 것이 필수적이다. EIT는 프로그램 제목, 시작 시각, 방영 시간, 설명 및 성인 등급 등의 정보를 제공하는데 사용될 수 있다.
" ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable " Rev . B, 2003년 3월 18일(www.atsc.org를 참조) 문헌에서, PSIP는 ATSC의 자발적 표준이며, 그 표준의 한정된 부분만이 연방 통신 위원회(FCC)에서 현재 요구하는 것이라는 것을 알아야 한다. PSIP는 디지털 TV의 지상파 방송을 위해 TS 내에서 동작하도록 설계된 테이블의 집합체이다. 그 용도는 특정 TS에 있는 모든 가상 채널에 대한 시스템과 이벤트 레벨에서의 정보를 기술하는 것이다. 일반적으로, 베이스 테이블의 패킷은 베이스 패킷 식별자(PID 또는 베이스 PID)로 라벨 표기된다. 베이스 테이블은 시스템 타임 테이블(STT), 등급 지역 테이블(RRT), 마스터 가이드 테이블(MGT), 가상 채널 테이블(VCT), EIT 및 익스텐트 텍스트 테이블(ETT)을 포함하며, PSIP 테이블의 집합체는 전형적인 디지털 TV 서비스의 구성 요소를 기술한다.
STT는 일자에 대한 참조를 수신기에 표시하기 위한 가장 단순하고 가장 소형의 PSIP 내의 테이블이다. 시스템 시각 테이블은 하나의 TS 패킷에 맞는 소형의 데이터 구조이며 일자 기능의 참조(reference)로서 동작한다. 수신기 또는 STB는 이러한 테이블을 이용하여 디스플레이 일자뿐만 아니라 여러 동작 및 스케줄 이벤트를 관리할 수 있다. 일자 기능의 참조는 1초 내의 정확도로 1980년 1월 6일 오전 12시 정각부터, 현재의 GPS 시간에 기초하여 STT 내의 system_time 필드에 의해 시스템 시간으로 주어진다. DVB는 시간 및 일 테이블(TDT)로 불리는 유사한 테이블을 가진다. 시간의 TDT 참조은, " ETSI EN 300 468 Digital Video Broadcasting (DVB); Specification for Service Information ( SI ) in DVB systems " (www.etsi.org를 참조)에 부록 C로 기재되어 있는 바와 같이, 협정 세계시(UTC)와 개정된 율리우스 일(MJD)을 기초로 한다.
등급 지역 테이블(RTT)은 레이팅 시스템을 갖춘 각 국가에서 사용하기 위해 등급 시스템을 전송하도록 설계되었다. 미국에서, 이 등급 시스템은 부적절하지만 종종 "V-칩" 시스템이라 하며, 적절한 제목은 "TVPG(Televison Parental Guidelines)"이다. 다국 시스템에 대한 규정이 또한 만들어졌다.
마스터 가이드 테이블(MGT)은 PSIP 표준을 포함하는 다른 테이블에 대한 인덱싱 정보를 제공한다. 또한, 디코딩 동안에 메모리 할당에 필요한 테이블 크기를 규정하고, 갱신될 필요가 있는 테이블을 식별하는 버전 번호를 규정하고, 테이블에 라벨 표시하는 패킷 식별자를 생성한다. 예시적인 마스터 가이드 테이블(MGT)과 그 용도는 " ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable , Rev .B 18 March 2003"(www.atsc.org를 참조)에서 찾을 수 있다.
또한, 지상파 VCT(TVCT)로 불리는 가상 채널 테이블(VCT)은 온라인 상태 또는 향후 온라인 상태일 수 있는 모든 채널의 리스트와, 그들의 속성을 포함한다. 주어진 속성 중에는 채널 명과, 채널 번호와, 캐리어 주파수와, 서비스가 물리적으로 전달되는 방법을 식별하는 변조 모드가 있다. 또한, VCT는 특정의 로컬 채널을 나타내는데 중요한 소스 식별자(ID)를 포함한다. 각각의 EIT는 각각이 3시간 동안 자신의 프로그래밍을 어느 마이너 채널이 가지는지를 식별하는 소스 ID를 포함한다. 따라서, 소스 ID는 프로그래밍 서비스를 목표로 하는데 사용될 수 있는 URL 방법으로 간주할 수 있다. 소스 ID 유형 URL 등의 통상의 인터넷 URL에서의 인터넷 도메인 명과 같은 대다수는 자기 자신을 참조 서비스의 물리적인 위치와 관련시킬 필요가 없으며, 소스 ID의 규정에 새로운 레벨의 유연성을 제공한다. 또한, VCT는 아날로그 TV, 디지털 TV 또는 다른 데이터가 공급되고 있는지를 나타내는 서비스 유형에 대한 정보를 포함한다. 또한, 서비스의 패킷을 식별하는 PID를 나타내는 기술어(descriptor)와, 확장된 채널명 정보에 대한 기술어를 포함한다.
EIT 테이블은 각각의 가상 채널에 대한 프로그램 스케줄 정보에 관한 정보를 가진 PSIP 테이블이다. 일반적으로, EIT의 각각의 인스턴스는 3시간의 범위를 커버하고, 이벤트 방영 시간, 이벤트 제목, 옵션 프로그램 콘텐츠 조언 데이터, 옵션 자막 서비스 데이터 및 오디오 서비스 기술어 등의 정보를 제공한다. 현재, EIT-0 내지 EIT-127까지의 최대 128개의 EIT가 있으며, 이들 각각은 3시간의 시간 간격 동안에 이벤트 또는 TV 프로그램을 기술한다. EIT-0은 "현재" 3시간의 프로그래밍을 나타내며, 일반적으로, 현재 프로그래밍에 대한 자막, 등급 정보 및 다른 필수 적이고 옵션의 데이터를 포함할 때 몇몇 특수한 조건을 가진다. EIT의 현재 최대 개수는 128이기 때문에, 프로그래밍의 최대 16일까지 사전에 광고될 수 있다. 최하로, 처음 4개의 EIT는 모든 TS에 항상 존재해야 하며, 24개가 권고된다. 각각의 EIT-k는 다수의 인스턴스를 가지며, 각각의 인스턴스는 VCT의 가상 채널을 갖는다. 현재의 EIT 테이블은 방송되고 있고 미래에 제한된 시간 동안 입수할 수 있는 현재 이벤트와 미래의 이벤트에 대한 정보만을 포함한다. 그러나, 사용자는 이전에 방송한 프로그램에 대해 보다 상세히 알고자 할 수도 있다.
ETT 테이블은 이벤트 및/또는 채널에 대한 다양한 언어의 상세한 설명을 포함하는 옵션 테이블이다. ETT 테이블내의 상세한 설명은 고유 식별자에 의해 이벤트 또는 채널에 매핑된다.
" ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable " Rev .B, 18 March 2003(www.atsc.org를 참조)의 문헌에는, 다수의 ETT와, VCT 내의 가상 채널을 설명하는 하나 이상의 채널 ETT 섹션과, 각각이 EIT-k내의 이벤트를 설명하는 ETT-k가 있다는 것을 기재하고 있다. 제목에 대한 문자의 개수가 EIT에서 제한되어 있기 때문에, 전체 이벤트에 대한 추가 정보를 전송하고자 하는 경우에는 ETT가 사용된다. 이들 ETT는 모두 MGT 내에 리스트되어 있다. ETT-k는 관련 EIT-k에서 각각의 이벤트에 대한 테이블 인스턴스를 포함한다. 명칭이 암시하듯이, ETT의 목적은 텍스트 메시지를 반송하는 것이다. 예를 들어, VCT의 채널에 있어서, 메시지는 채널 정보, 비용, 개봉 박두 및 다른 관련 데이터를 기술할 수 있다. 유사하게, EIT에 리스트된 영화 등의 이벤트 에 있어서, 전형적인 메시지는 영화 자체를 설명하는 단문의 단락일 수 있다. ETT는 ATSC 시스템에서는 옵션이다.
PSIP 테이블은 짧은 반복 사이클을 가진 짧은 테이블과 긴 사이클 시간을 가진 큰 테이블의 조합을 갖는다. 하나의 테이블의 전송은 다음 섹션이 전송되기 전에 완료되어야 한다. 따라서, 큰 테이블의 전송은, 고속 사이클 테이블이 지정된 시간에 달성할 있도록 단시간 내에 완료되어야 한다. 이에 대해서는 " ATSC Recommended Practice : Program and System Information Protocol Implementation Guidelines for Broadcasters "(www.atsc.org/standards/a_69.pdf를 참조)에 충분히 설명되어 있다.
DVD
디지털 비디오(또는 다목적) 디스크(DVD)는 엔터테인먼트 및 컴퓨터 사용 모두에 적합한 다용도 광 디스크 저장 기술이다. 엔터테인먼트 제품으로서의 DVD는 일반적으로 VCR, 디지털 테이프 및 CD 등의 대체물에 비해 양호하게 고화질의 비디오로 홈 시어터를 경험할 수 있게 한다.
DVD는 엔터테인먼트를 위해서 소비자가 사전 녹화된 영화 장치를 이용하는 방식에 급격한 변화를 가져왔다. MPEG-2 등의 비디오 압축 표준을 이용하여, 콘텐츠 제공업자는 하나의 DVD 디스크 상에 2시간 이상의 고화질 비디오를 일반적으로 저장할 수 있다. 양면의 이중층 디스크에서는, DVD가 VHS TV 화질 비디오의 대략 30 시간에 해당하는 대략 8시간의 압축 비디오를 수용할 수 있다. 또한, DVD는 와이드 스크린 영화 지원과, 각각이 8개의 채널만큼 많이 갖고 있는 최대 8개의 디지 털 오디오 트랙과, 온 스크린 메뉴와 단순한 대화식 특징과, 최대 9개의 카메라 앵글과, 즉시 되감기 및 고속 재생 기능과, 제목명의 다국어 식별 텍스트와, 비디오의 앨범명, 노래명 및 자동 심리스-브랜칭(Seamless-Branching) 등의 개선된 기능을 갖는다. 또한, DVD는 화상과 텍스트 등의 추가 정보와 함께 세그먼트의 시작과 지속 시간을 규정함으로써(제한되지 않지만, 효과적인 랜덤 액세스 뷰잉을 제공), 구획 선택 특징으로 그들의 원하는 장면을 획득하는 유용한 대화식 방법을 사용자가 갖게 한다. 광학 포맷으로서, DVD 화질은 비디오 테이프(자기 저장 미디어)에 비해, 시간이 지남에 따른 또한 반복 사용으로 인한 저하는 없다. 현재의 DVD 리코딩 포맷은 NTSC 아날로그 콤포지트 비디오보다는, 4:2:2 컴포넌트 디지털 비디오를 이용하여, 현재의 종래의 NTSC와 비교하여 화질을 상당히 개선시킨다.
TV-Anytime 및 MPEG-7
TV 시청자는 현재 방송되고 있고 방송될 제목, 시작 시각 및 종료 시각 등의 프로그램 정보를 예를 들어 EPG를 통해 현재 제공받고 있다. 이때에, EPG는 방송되고 있고 미래에 제한된 시간 동안 입수할 수 있는 현재 및 미래의 이벤트에 대한 정보만을 포함한다. 그러나, 사용자는 이미 방송된 프로그램에 대해 보다 상세히 알고자 할 수도 있다. 이러한 요구는 방송 프로그램의 리코딩을 가능하게 한 DVR의 기능으로 인해 발생하였다. 전용 EPG 데이터 포맷에 기초한 상업적 DVR 서비스는 회사 TiVo(www.tivo.com를 참조)에 의해서와 같이 시행중이다.
EPG 방법을 통해 현재 전달된 프로그램 제목 또는 대강의 줄거리 등의 단순한 서비스 정보는 사용자가 채널을 선택하고 프로그램을 녹화하도록 안내하기에 충 분할 것으로 보인다. 그러나, 사용자는 DVR의 녹화된 프로그램 내에서 특정의 세그먼트에 신속하게 액세스하고자 한다. 현재의 DVD 영화의 경우에는, 사용자가 "막별 장면 선택" 인터페이스를 통해 비디오의 특정 부분에 액세스할 수 있다. 녹화된 프로그램의 특정 세그먼트로의 액세스는 "비디오 인덱싱"으로 불리는 프로세스를 통해 생성될 수 있는 각 세그먼트의 제목, 카테고리, 시작 위치 및 지속 시간의 세그먼트 정보를 필요로 한다. 프로그램의 세그먼트 정보 없이 특정의 세그먼트에 액세스하기 위해서, 시청자는 현재 고속 재생 버튼을 이용하는 것과 같이, 시작부부터 프로그램 전체를 선형으로 탐색해야 하며, 이러한 탐색은 성가시고 시간 소비적인 프로세스이다.
TV-Anytime
개인 사용자에 의해 액세스가능한 소비자 전자 장비에 대한 AV 콘텐츠와 데이터의 로컬 저장은 다양한 잠재적인 새로운 응용과 서비스를 열어준다. 현재, 사용자는 방송 프로그램 스케줄을 이용하여 그들의 관심 콘텐츠를 쉽게 리코딩하여 프로그램을 나중에 시청할 수 있으며, 이로써, 지상파, 케이블, 위성, 인터넷 등의 여러 입력 소스에 접속된 장치를 통해 보다 고급 및 개인 맞춤형 콘텐츠 및 서비스를 이용할 수 있다. 따라서, 이들 종류의 소비자 장치는 새로운 비즈니스 모델을 3개의 주 공급자 그룹, 즉, 콘텐츠 작성자/소유자, 서비스 제공업자/방송국 및 관련된 제 3 자 등에게 제공한다. 글로벌 TV-Anytime 포럼(www.tv-anytime.org를 참조)은 소비자 전자 플랫폼의 대중 시장의 고용량 디지털 로컬 저장에 기초하여 시청각 서비스 및 다른 서비스를 가능하게 하는 사양(specifications)을 개발하고자 하는 기관 협회이다. 포럼은 1999년 9월에 형성된 이후 일련의 공개 사양을 개발해 왔다.
TV-Anytime 포럼은 새로운 잠재적인 비즈니스 모델을 확인하고, 사용자가 그들의 개인 저장 시스템 상의 콘텐츠를 탐색, 선택 및 올바르게 이용할 수 있는 CRID 식별자를 이용한 콘텐츠 참조 방법을 소개하였다. CRID는 특히 특정의 새로운 비즈니스 모델을 가능하게 하기 때문에, TV-Anytime 시스템의 중요 부분이다. 그러나, 하나의 잠재적인 이슈는, 상술한 3개의 주 공급자 그룹 간에 규정된 비즈니스 관계가 없는 경우에는, 콘텐츠로의 매핑이 부정확하고/하거나 미승인될 수 있다는 것이다. 이는 결과적으로 사용자가 열악한 체험을 하게 할 수 있다. 콘텐츠 참조의 핵심 개념은 실제 콘텐츠 아이템(예를 들어, 로케이터)을 검색하는데 필요한 정보로부터 콘텐츠 아이템(예를 들어, CRID)으로의 참조를 분리하는 것이다. CRID에 의한 분리로 콘텐츠 참조와 콘텐츠의 위치 간의 1 대 다수 매핑이 가능하다. 따라서, 탐색 및 선택은 CRID를 생성하고, 이는 다수의 CRID 또는 다수의 로케이터로 리졸빙(resolving)된다. TV-Anytime 시스템에서, 주 공급자 그룹은 CRID를 발신하여 리졸빙할 수 있다. 이상적으로, 콘텐츠 메타데이터의 유연성과 재활용 가능성을 제공하기 때문에, 방송 시스템으로의 CRID의 도입이 바람직하다. ATSC-PSIP와 DVB-SI 등의 기존의 방송 시스템에서, EIT 테이블 내의 각 이벤트(즉, 프로그램)는 고정 16 비트 이벤트 식별자(EID)로 식별된다. 그러나, CRID는 고급의 리졸빙 메카니즘을 필요로 한다. 리졸빙 메카니즘은 공급자 그룹이 보유한 리졸빙 서버에 소비자 장치를 접속하는 네트워크에 일반적으로 의존한다. 불행하게 도, 리졸빙 서버와 네트워크를 적절히 설립하는 데에는 오랜 시간이 걸릴 수 있다.
또한, TV-Anytime은 공급자 그룹과 소비자 장치 간에 교환될 수 있는 메타데이터의 메타데이터 포맷을 규정한다. TV-Anytime 환경에서, 메타데이터는 제목, 대강의 줄거리, 스케줄 방송 시간 및 세그먼트 정보 등의 콘텐츠에 대한 기술 데이터뿐만 아니라 사용자 기호와 이력에 대한 정보를 포함한다. 특히, 기술 데이터는 전자 콘텐츠 가이드로서 간주되기 때문에 TV-Anytime 시스템에서는 필수적인 구성 요소이다. TV-Anytime 메타데이터에 의해, 소비자는 상이한 형태의 콘텐츠를 브라우징, 네비게이팅 및 선택할 수 있다. 몇몇 메타데이터는 로컬 및 원격으로 전체 콘텐츠 범위에 대한 깊이 있는 기술, 개인 맞춤형 추천 및 상세한 설명을 제공할 수 있다. TV-Anytime 메타데이터에서, 프로그램 정보와 스케줄 정보는 스케줄 정보가 CRID를 통해 대응 프로그램 정보를 참조하는 방식으로 분리된다. TV-Anytime에서 프로그램 정보를 스케줄 정보로 분리하면, 각각의 실례가 프로그램 정보의 공통 세트를 공유할 수 있기 때문에, 프로그램이 반복되거나 재방송될 때마다 유용한 효율성 이득을 또한 제공한다.
TV-Anytime 메타데이터의 스키마 또는 데이터 포맷은 일반적으로 XML 스키마로 기술되며, TV-Anytime 메타데이터의 모든 실례는 XML로 또한 기술된다. XML은 장황하기 때문에, TV-Anytime 메타데이터의 실례는 대용량의 데이터 또는 고대역폭을 필요로 한다. 예를 들어, TV-Anytime 메타데이터의 실례의 크기는 ATSC-PSIP 또는 DVB-SI 사양에 따른 등가의 EIT(이벤트 정보 테이블) 테이블보다 5 내지 20 배 클 수 있다. 대역폭 문제를 해결하기 위해서, TV-Anytime은 TV-Anytime 메타데 이터를 등가의 2진 포맷으로 변환하는 압축/인코딩 메카니즘을 제공한다. TV-Anytime 압축 사양에 따르면, TV-Anytime 메타데이터의 XML 구조는 MPEG-7에 의해 채택된 XML의 효율적인 2진 인코딩 포맷의 BiM을 이용하여 코딩된다. 시각/일자 및 로케이터 필드는 또한 자신의 지정 코덱을 가진다. 또한, 효율적인 Zlib 압축이 전달층에서 달성되도록 하기 위해서, 스트링은 각각의 전달 유닛 내에서 연결된다. 그러나, TV-Anytime에서 3개의 압축 기술을 이용함에도 불구하고, 압축된 TV-Anytime 메타데이터 실례의 크기는, 스트링이 짧을 때, 특히 100보다 적은 문자일 때 Zlib의 성능이 빈약하기 때문에, ATSC-PSIP 또는 DVB-SI의 등가의 EIT보다 심하게 작다. TV-Anytime에서의 Zlib 압축은 세그먼트의 제목 또는 디렉터의 기술 등의 작은 데이터 단위인 각각의 TV-Anytime 단편에 대해 실행되기 때문에, 일반적으로 Zlib의 양호한 성능을 기대할 수 없다.
MPEG-7
통상 "멀티미디어 콘텐츠 기술 인터페이스"로 불리는 MPEG-7은 멀티미디어 콘텐츠를 기술하기 위해 다양한 세트의 툴을 제공하는 표준이다. MPEG-7은 멀티미디어 콘텐츠로의 효과적이고 효율적인 액세스(탐색, 필터링 및 브라우징)를 가능하게 하는 메타데이터의 구성 요소와 그들의 구성 및 관계에 대한 포괄적인 시청각 기술 툴 세트를 제공한다. MPEG-7은 XML 스키마 언어를 DDL로서 이용하여 기술어와 기술 스키마 모두를 규정한다. 사용자 이력 등의 MPEG-7 사양의 일부는 TV-Anytime 사양에 포함된다.
비주얼 리듬 생성
비주얼 리듬(VR)은 비디오의 비주얼 콘텐츠에 대한 정보를 포함(전달)하는 단일 화상(비주얼 타임라인)을 생성하고, 비디오가 프레임 단위로 서브샘플링되는 공지의 기술이다. VR은 예를 들어, 샷 검출에 있어서 유용하다. 비주얼 리듬 화상은 각 프레임을 횡단하는 사선 등의 샘플링 경로를 따라 존재하는 샘플링 화소에 의해 통상적으로 획득된다. 그 프레임에 대해 하나의 라인 화상이 생성되고, 결과적인 라인 화상들은 하나 다음에 하나식으로, 통상적으로 좌측에서 우측으로 적층된다. 단일의 화소 폭을 가진 비주얼 리듬의 각 수직 슬라이스는 소정의 경로를 따라 화소의 서브세트를 샘플링함으로써 각 프레임으로부터 획득된다. 이러한 방식으로, 비주얼 리듬 화상은 시청자/운영자가 커트, 와이프, 디졸브, 페이드, 카메라 움직임, 객체 움직임, 프래쉬광, 줌 등을 포함하는 여러 상이한 형태의 비디오 효과를 구별하고 분류(편집 및 다른 방법으로)할 수 있는 패턴 또는 비주얼 특징을 포함한다. 상이한 비디오 효과는 비주얼 리듬 화상에서 상이한 패턴으로서 자기 자신을 표명한다. 샷 경계와 샷 간의 변이는 비디오로부터 생성된 비주얼 리듬 화상을 관측함으로써 검출될 수 있다. 비주얼 리듬은 본 출원인에게 양도되었으며 또한 계류중인 미국 특허 출원 제 09/911,293 호(2001년 7월 23일 출원, 2002/0069218로 공개)에 추가로 설명되어 있다.
쌍방향 TV
쌍방향 TV는 TV 시청자의 시청 경험을 개선하기 위해 다양한 매체와 서비스를 조합하는 기술이다. 쌍방향 TV를 통해서, 시청자는 아날로그 TV에서와 같이 픽쳐에 디스플레이되는 것을 수동적으로 시청하는 종래의 방식이 아니라, 콘텐츠/서 비스 공급자가 의도한 방식으로 TV 프로그램에 참여할 수 있다. 쌍방향 TV는 뉴스 틱커, 주식 시세, 날씨 서비스 및 T 커머스 등의 다양한 종류의 쌍방향 TV 응용을 제공한다. 쌍방향 TV에 대한 공개 표준 중 하나는 쌍방향 디지털 응용과 그 응용을 수신하여 방영하는 단말기(예, DVR)와의 일반적인 인터페이스를 제공하는 멀티미디어 홈 플랫폼(MHP)(미국에서는, MHP가 ACAP의 등가물과, ATSC 활동성과, OCAP에서 오픈케이블 컨소시엄이 지정한 오픈 케이블 응용 프로그램 플랫폼을 구비함)이다. 콘텐츠 제작자는 MHP 응용 프로그램 인터페이스(API) 세트를 이용하여 대부분 JAVA로 기록된 MHP 응용 프로그램을 제작한다. MHP API 세트는 프리미티브 MPEG 액세스, 미디어 제어, 튜너 제어, 그래픽, 통신 등을 위해서 다양한 API 세트를 포함한다. MHP 방송국과 네트워크 운영자는 MHP 호환의 가전 제품 또는 STB를 가진 사용자에게 전달될 수 있도록, 콘텐츠 제작자에 의해 생성된 MHP 응용 프로그램을 패킹하여 전달할 책임이 있다. MHP 응용 프로그램은 MHP 기반의 서비스를 디지털 저장 미디어-커맨드 및 제어(DSM-CC) 객체 주기 전송 형태의 MPEG-2 TS에 삽입함으로써 STB에 전달된다. 그 다음, MHP 호환의 DVR은 자바 비주얼 머신을 이용하여 MPEG-2 TS의 MHP 응용 프로그램을 수신하여 처리한다.
TV 프로그램의 실시간 인덱싱
생방송의 "신속 메타데이터 서비스"로 불리는 시나리오는 상술한 미국 특허 출원 제 10/369,333 호(2003년 2월 19일 출원)와 미국 특허 출원 제 10/368,304 호(2003년 2월 18일 출원)에 기재되어 있으며, 여기에서는, 프로그램이 방송되고 녹화되고 있는 동안에 방송 프로그램의 기술 메타데이터가 DVR에 또한 전달된다. 축 구 등의 스포츠 게임의 생방송의 경우에, TV 시청자는 라이브 게임을 시청하면서 그들의 좋아하는 선수의 플레이뿐만 아니라 게임의 하이라이트 이벤트를 선택적으로 시청하고 검토하고자 한다. 프로그램을 기술하는 메타데이터 없이는, 시청자가 고속 재생 등의 종래의 제어 방식을 이용하여 하이라이트 이벤트 또는 객체(예를 들어, 스포츠 게임의 경우에는 선수 또는 특정 장면 또는 영화의 배우)에 대응하는 비디오 세그먼트를 알아내는 것은 쉽지 않다.
본 명세서에 기재된 바와 같이, 메타데이터는 의미론적으로(semantically) 중요한 하이라이트 이벤트 또는 객체에 대응하는 각 비디오 세그먼트에 대한 시작 시각 위치 등의 시간 위치, 지속 시간 및 텍스트 기술을 포함한다. 메타데이터는 소정의 간격으로 또는 새로운 하이라이트 이벤트 또는 객체가 발생할 때마다 또는 방송할 때마다 실시간으로 생성되어 시청자에게 점차 전달되면, 하이라이트 이벤트 또는 객체에 의한 콘텐츠의 네비게이션 등의 보다 많은 정보 및 쌍방향의 TV 시청 경험을 위해서 메타데이터가 DVR의 로컬 저장부 또는 다른 장치에 저장될 수 있다. 또한, 녹화된 비디오의 전체 또는 일부는 이러한 추가 데이터를 이용하여 재생될 수 있다. 메타데이터는 대응하는 방송 TV 프로그램이 종료하는 직후에 단 1회 전달될 수 있으며, 연속적인 메타데이터 자료는 전달되어 이전에 전달된 메타데이터를 갱신, 확장 또는 정정할 수 있다. 대안으로, 메타데이터는 이벤트(사전 녹화된 영화 등)의 방송에 앞서 전달되며, 방송될 때 프로그램과 연관된다. 또한, 이로써, 메타데이터의 방송 전, 방송 후 및 방송 동안의 여러 조합이 본 명세서에 의해서 고려된다.
신속 메타데이터 서비스의 중요 구성 요소 중 하나는 방송 TV 프로그램의 실시간 인덱싱이다. 비디오를 쌍방향 인덱싱 및 브라우징하는 시스템을 기재한 미국 특허 제 6,278,446 호("Liou")와 비디오 카탈로그 편집자 시스템을 기재한 미국 특허 제 6,360,234 호("Jain") 등에서, 비디오 인덱싱의 여러 방법을 제안하였다. 그러나, 이들 현존 및 기존의 시스템 및 방법은 특히 실시간 인덱싱 시스템에 있어서 그들의 공언하고 의도한 목표를 충족시키는데 부족하다.
종래의 다양한 방법이 자막 텍스트를 디코딩하고, 샷을 검출하여 클러스터링하고, 키 프레임을 선택하고, 페이스 또는 음성을 인식하려고 시도(이들 모두는 비디오와 동기화될 수 있음)함으로써 낮은 레벨의 메타데이터를 기껏해야 생성할 수 있다. 그러나, 화상 이해와 음성 인식에 대한 현 상태의 기술을 이용하여도, 여러 어쩔수 없는 이유로 하이라이트를 정확하게 검출하고, 이벤트 또는 객체의 의미론적으로 중요하고 실행상 유용한 하이라이트 요약을 생성하기 어렵다.
첫 번째로, 상술한 바와 같이, 의미론적으로 중요한 다양한 하이라이트를 자동으로 인식하는 것이 어렵다. 예를 들어, "터치다운"의 키워드는 터치다운 하이라이트를 자동으로 찾기 위해서 디코딩된 자막 텍스트로부터 식별되며, 그 결과 다수의 오류 알람이 발생한다.
따라서, 본 개시 내용에 따르면, 의미론적으로 중요하고 실행상 유용한 하이라이트를 생성하기 위해서는 처음의 대략 메타데이터 전달을 위해서 일반적으로 방송 후이지만 바람직하게 방송 동안에(일반적으로 방송 이벤트로부터 약간 지연됨), 사람 또는 다른 복잡한 분석 시스템 운영자의 개입을 여전히 필요로 한다. 보다 많은 확대된 메타데이터 세트가 나중에 제공되며, 물론 사전 녹화된 이벤트는 프로그램 방송 전, 방송 동안 및 방송 후에 전달된 대략 또는 확대된 메타데이터 세트를 가질 수 있다. 원하는 경우에, 나중에 전달된 메타데이터 세트는 이미 전송된 메타데이터, 나중에 전송된 메타데이터를 증가, 주석을 달거나 대체할 수 있다.
두 번째로, 종래의 방법은 실시간의 구별된 하이라이트를 수동으로 마킹하는 효율적인 방법을 제공하지 못한다. 일련의 하이라이트가 단기간에 발생하는 경우를 고려하자. 새로운 하이라이트의 제목 및 추가의 텍스트 기술에 운영자가 타이핑하는 시간이 걸리기 때문에, 바로 다음의 이벤트를 놓칠 가능성이 있다.
미디어 로컬리제이션
임의의 주어진 시간적 오디오-비주얼 스트림 또는 파일 내에서의 미디어 로컬리제이션은 스트림의 시간 포인트를 지정하는 바이트 위치 정보 또는 미디어 시각 정보 중 하나를 이용하여 일반적으로 기술하였다. 환언하면, 오디오-비주얼 스트림 내의 특정 비디오 프레임의 위치를 기술하기 위해서, 바이트 오프셋(예를 들어, 비디오 스트림의 시작부로부터 스킵되는 바이트의 개수)이 사용되었다. 대안으로, 오디오-비주얼 스트림의 시작부로부터의 상대적인 시간 포인트를 기술하는 미디어 시각이 또한 사용되었다. 예를 들어, 쌍방향 인터넷 또는 초고속 네트워크를 통한 비디오 온 디멘드(VOD)의 경우에, 각각의 오디오-비주얼 프로그램의 시작 위치와 종료 위치는, 각각의 프로그램이 VOD 서버의 저장부에 개별적인 미디어 파일의 형태로 저장되고 각각의 오디오-비주얼 프로그램이 각각의 클라이언트의 요구에 따라 스트리밍을 통해 전달되기 때문에, 0의 미디어 시각과 오디오-비주얼 프로 그램의 길이에 의하여 명백하게 규정된다. 따라서, 클라이언트 측에서의 사용자는 메타데이터에서 설명한 바와 같이, 선택된 오디어-비주얼 스트림 내의 적절한 시간적 위치 또는 비디오 프레임으로의 액세스를 얻을 수 있다.
그러나, TV 방송에 있어서, 디지털 스트림 또는 아날로그 스트림은 계속해서 방송되기 때문에, 각각의 방송 프로그램의 시작과 종료 위치는 명확하게 규정되지 않는다. 미디어 시각 또는 바이트 오프셋은 미디어 파일의 시작을 참조하여 일반적으로 규정되기 때문에, 쌍방향 응용 프로그램 또는 이벤트를 관련시키기 위해서, 또한, 오디오-비주얼 프로그램 내의 특정 위치로 액세스하기 위해서, 미디어 시각 또는 바이트 오프셋을 이용하여 방송 프로그램의 특정 시각의 위치를 기술하는 것은 애매하다.
방송 스트림에서의 프레임 정확 미디어 로컬리제이션 또는 액세스를 달성하는 기존의 해결책 중 하나는 PTS를 이용하는 것이다. PTS는 MPEG-2에서 규정된 바와 같이 PES 패킷 헤더에 존재할 수 있는 필드이며, 이는 프레젠테이션 단위가 시스템 타겟 디코더에 제공되는 시각을 나타낸다. 그러나, PTS만을 이용하는 것은 PTS의 최대값이 대략 26.5 시간에 해당하는 제한된 시간을 단순히 나타낼 수 있기 때문에, 방송 프로그램의 특정 시간 포인트 또는 프레임의 고유 표현을 제공하기에는 충분하지 않다. 따라서, 방송 스트림 내의 임의의 주어진 프레임을 유일하게 나타내기 위해서는 추가 정보가 필요할 것이다. 한편, 프레임 정확한 표현 또는 액세스가 필요하지 않으면, PST를 이용할 필요가 없으며, 따라서, 다음의 이슈를 피할 수 있다. 즉, PTS의 사용은 PES 층의 분석을 필요로 하며, 따라서, 계산적으 로 비용이 많이 든다. 또한, 방송 스트림이 스크램블되면, PST에 액세스하기 위해서는 디스크램블 프로세스가 필요하다. MPEG-2 시스템 사양은 페이로드에 포함된 PES가 스크램블되는지 여부를 표시하는 TS 패킷 페이로드의 스크램블 모드에 대한 정보를 포함한다. 또한, 대부분의 디지털 방송 스트림은 스크램블되기 때문에, 실시간 인덱싱 시스템은 스트림이 스크램블 되는 경우에 인증된 디스크램블러 없이 프레임 정확도로 스트림에 액세스할 수 없다.
방송 프로그램의 미디어 로컬리제이션의 다른 기존의 해결책은 미디어 단편에 기지의 시각 참조를 제공하는 MPEG-2 DSM-CC NPT(Normal Play Time)를 이용하는 것이다. MPEG-2 DSM-CC NPT는 " ISO / IEC 13818-6 Information technology - Generic coding of moving pictures and associated audio information -- Part 6: Extensions for DSM - CC "(www.iso.org를 참조)에 충분히 설명되어 있다. DVB-MHP 방송 환경에서의 TV-Anytime 메타데이터의 응용에 있어서, NPT는 시각 기술을 위해서 사용되어야 한다고 제안되었고, 이에 대해서는 " ETSI TS 102 812: DVB Multimedia Home Plateform ( MHP ) Specification "(www.etsi.org를 참조)와, A McParland, J. Morris , M. Leban , S. Rarnall , A. Hickman , A. Ashley , M. Haataja , F.dejong의 " MyTV : A practical implementation of TV - Anytime on DVB and the internet"(International Broadcasting Convention , 2001)에 상세히 설명되어 있다. 그러나, 제안된 구현예에서는, 헤드 단부와 수신 클라이언트 장치 둘 다는 NPT를 적절히 다룰 수 있도록 요구받기 때문에, 시간에 대한 매우 복잡한 제어를 낳는다.
메타데이터 생성, 비디오 인덱싱/네비게이션 및 방송 모니터링의 방법이 공지되어 있다. 이들의 예는 미국 특허 제 6,357,042 호와, 미국 특허 출원 제 10/756,858 호(2001년 1월 10일 출원, US 2001/0014210 A1로 공개)와, 미국 특허 제 5,986,692 호에서 찾을 수 있다.
용어집
달리 언급되어 있지 않으면, 그들의 사용의 문맥으로부터 자명한 바와 같이, 본 명세서에 사용된 용어, 약어, 두문자어 또는 과학적인 기호 및 표기는 명세서와 가장 관련된 기술 분야에서의 통상의 의미로 주어진다. 다음의 용어, 약어 및 두문자어는 본 명세서에 포함된 설명에 사용될 수 있다.
ACAP
ACAP(Advanced Common Application Platform)는 OCAP(CableLabs OpenCable) 표준과 ATSC의 이전의 DTV 응용 프로그램 소프트웨어 환경(DASE) 사양과의 조합의 결과이다. ACAP에 대한 보다 상세한 설명은 "Candidate Standard: Advanced Common Application Platform (ACAP)"(www.atsc.org를 참조)에서 찾을 수 있다.
API
API(Application Program Interface)는 2개의 소프트웨어 응용 프로그램 간에 인터페이스를 제공하는 수단으로서 응용 프로그램에 의해 참조될 수 있는 소프트웨어 콜 및 루틴 세트이다. API에 대한 설명 및 예는 Dan Appleman의 "Dan Appleman's Visual Basic Programmer's guide to the Win32 API"(Sams, February, 1999)에서 찾을 수 있다.
ATSC
ATSC(Advanced Television Systems Committee.Inc)는 디지털 TV의 자발적인 표준을 개발하는 국제적인 비영리 기관이다. 미국과 한국 등의 국가는 디지털 방송을 위해서 ATSC를 채택하고 있다. ATSC에 대한 보다 상세한 설명은 "ATSC Standard A/53C with Amendment No. 1: ATSC Digital Television Standard, Rev.C"(www.atsc.org를 참조)에서 찾을 수 있다. 보다 상세한 설명은 Richard S.Chernock, Regis J.Crinon, Michael A.Dolan,Jr., John R. Mick의 "Data Broadcasting: Understanding the ATSC Data Broadcast Standard"(McGraw-Hill Professional, April 2001)에서 찾을 수 있으며, 또한, Mark Massel의 "Digital Television, DVB-T COFDM 및 ATSC 8-VSB"(Digitaltvbook.com, October 2000)에서 또한 입수가능하다. 대안으로, 디지털 비디오 방송(DVB)은 디지털 TV와 데이터 서비스의 글로벌 방송을 위해서, 유럽 및 다른 국가에서 채택한 글로벌 표준을 설계하는데 전념한 업계 콘소시엄이다.
AV
시청각
AVC
AVC(Advanced Video Coding)(H.264)는 ITU-T VCEG와 ISO/IEC MPEG의 가장 최근의 비디오 코딩 표준이다. AVC에 대한 설명은 Wiegand, T., Sullivan, G.J., Bjntegaard, G., Luthra, A.의 "Overview of the H.264/AVC video coding standard"의 비디오 기술의 회로 및 시스템, IEEE 트랜잭션, 권 13, Issue:7, 2003 년 7월, 페이지 560-576에서 찾을 수 있으며, 다른 설명은 "ISO/IEC 14496-10: Information technology - Coding of audio-visual objects - Part 10: Advanced Video Coding"(www.iso.org를 참조)에서 찾을 수 있으며, 또 다른 설명은 (Wiley) Lain E.G.Richardson의 "H.264 and MPEG-4 Video Compression"에서 찾을 수 있으며, 이들 모두는 본 명세서에서 참조로 포함된다. MPEG-1와 MPEG-2는 AVC의 대안 또는 파생물이며, 디지털 비디오 압축용으로 고려되거나 채택되고 있다.
BD
BD(Blue-ray Disc)는 비디오, 멀티미디어, 게임, 오디오 및 다른 응용 프로그램 용도의 고용량 CD 크기의 저장 매체 디스크이다. BD의 상세한 설명은 "White paper for Blue-ray Disc Format" www.bluraydisc.com/assets/downloadablefile /general_bluraydiscformat-12834.pdf를 참조)에서 찾을 수 있다. DVD(디지털 비디오 디스크), CD(콤팩트 디스크), 미니디스크, 하드 드라이브, 자기 테이블, 회로 기반(플래쉬 RAM)의 데이터 저장 매체는 아날로그 또는 디지털 포맷으로의 저장용의 BD의 대체물 또는 파생물이다.
BIFS
BIFS(Binary Format For Scene)는 비디오 객체를 합성하여 MPEG-4의 장면을 형성하는 방법을 기술한 계층적 구조의 형태의 장면 그래프이다. BIFS의 상세한 설명은 Iain E.G.Richardson의 "H.264 and MPEG-4 Video Compression"(John Wiley & Sons, August, 2003)와, Touradj Ebrahimi, Fernando Pereira의 "The MPEG-4 Book"(Prentice Hall PTR, July, 2002)에서 찾을 수 있다.
BiM
MPEG-7의 2진 메타데이터(BiM) 포맷. BiM의 상세한 설명은 "ISO/IEC 15938-1: Multimedia Context Description Interface - Part 1 Systems"(www.iso.ch를 참조)에서 찾을 수 있다.
BNF
BNF(Backus Naur Form)는 프로그래밍 언어 등의 구조문 언어의 구문론과 문법을 기술하는 정상적인 메타데이터 구문이다. BNF의 상세한 설명은 M.Marcotty & H.Ledgard의 "The world of Programming Languages"(Springer-Verlag 1986)에서 찾을 수 있다.
bslbf
비트 스트링, 좌측 비트 우선. 비트 스트링은 좌측을 우선 순위로 1과 0의 스트링으로 기록된다. bslbf에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information - Part 1: Systems" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
CA
CA(Conditional Access)는 시청자만이 시청하기 위해 지불한 프로그램을 시청할 수 있도록 비디오, 오디오 등의 콘텐츠에 미승인 사용자가 액세스하는 것을 차단하기 위한 시스템이다. CA에 대한 상세한 설명은 MarketResearch.com의 "Conditional access for digital TV: Opportunities and challenges in Europe and the US"(2002)에서 찾을 수 있다.
codec
enCOder/DECoder는 인코더와 디코더의 짧은 단어이다. 인코더는 데이터 압축을 위해서 데이터를 인코딩하는 장치이다. 압축기는 인코더를 대신에 사용되는 단어이다. 디코더는 데이터 압축을 위해서 인코딩되는 데이터를 디코딩하는 장치이다. 압축 해제기는 디코더 대신에 사용되는 단어이다. 코덱은 다른 형태의 코딩 및 디코딩 장치로 불린다.
COFDM
COFDM(Coded Octal Frequency Division Multiplex)은 유럽에서 대부분 사용되는 변조 방식이며, 디지털 비디오 방송(DVB)의 표준 세트에 의해 지원된다. 미국에서, ATSC는 등가의 변조 표준으로서 8-VSB(8 레벨 잔류 측파대)를 선택하였다. COFDM에 대한 상세한 설명은 Mark Massel의 "Digital Television, DVB-T COFDM and ATSC 8-VSB"(Digitaltvbook.com, October 2000)에서 찾을 수 있다.
CRC
CRC(Cyclic Redundancy Check)는 전송동안에 데이터에 에러가 발생하였는지 여부를 체크하는 32 비트 값으로서, ISO/IEC 13818-1의 부록 A(www.iso.org를 참조)에 추가로 설명되어 있다.
CRID
CRID(Content Reference IDentifier)는 다양한 네트워크에 걸쳐 분포된 프로그램의 위치와 프로그램의 메타데이터 간을 브리지하도록 고안된 식별자이다. CRID에 대한 상세한 설명은 "Specification Series:S-4 N: Content Referencing" (http://tv-anytime.org)에서 찾을 수 있다.
DAB
라디오를 통해 콤팩트 디스크(CD) 음질의 사운드, 텍스트, 데이터 및 비디오를 제공하는 지상파 네트워크의 디지털 오디오 방송(DAB). DAB에 대한 상세한 설명은 www.worlddab,org/about.aspx에서 찾을 수 있다. 보다 상세한 설명은 W.Hoeg, Thomas Lauterbach의 "Digital Audio Broadcasting: Principles and Applications of Digital Radio"(John Wiley and Sons, Ltd)에서 또한 찾을 수 있다.
DASE
DTV 응용 프로그램 소프트웨어 환경(DASE)은 셋톱 박스 등의 디지털 TV 수신기에서의 개선된 기능의 플랫폼을 규정하는 ATSC의 표준이다. DASE에 대한 상세한 설명은 "ATSC Standard A/100: DTV Application Software Environment - Level 1 (DASE-1)"(www.atsc.org를 참조)에서 찾을 수 있다.
DCT
DCT(Discrete Cosine Transform)는 공간 도메인으로부터 주파수 도메인으로의 변환 함수, 임의 유형의 변환 코딩이다. DCT에 대한 상세한 설명은 Alan V.Oppenheim, Ronald W.Schafer, John R.Buck의 "Discrete-Time Signal Processing"(Prentice Hall, 2nd edition, February 1999)에서 찾을 수 있다. 웨이블릿 변환은 JPEG-2000와 AVC(Advanced Video Coding) 등의 여러 압축 표준의 대체 또는 파생물이다. 웨이블릿에 대한 상세한 설명은 C. Sidney Burrus, Ramesh A. Gopinath의 "Introduction on Wavelets and Wavelets Transforms"(Prentice Hall, 1st edition, August 1997)에서 찾을 수 있다. DCT는 MPEG-4 표준에서와 같이, 비디오 압축 등의 다른 변환 기능과 웨이블릿과 조합될 수 있으며, Iain E.G.Richardson의 "H.264 and MPEG-4 Video Compression"(John Wiley & Sons, August 2003)와 Touradj Ebrahimi, Fernando Pereira의 "The MPEG-4 Book"(Prentice Hall, July 2002)에 충분히 기재되어 있다.
DCCT
DCCT(Directed Channel Change Table)는 시청 경험이 개선될 수 있을 때 방송국이 시청자에게 채널을 변경할 것을 추천하는 것을 가능하게 하는 테이블이다. DCCT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
DDL
DDL(Description Definition Language)은 새로운 기술 방법과 가능하다면, 기술어를 생성할 수 있는 언어로서, 기존의 기술 방법을 확장하고 변경할 수 있다. DDL에 대한 상세한 설명은 B. S. Manjunath, Philippe Salembier와 Thoma Sikora의 "Introduction to MPEG-7: Multimedia Content Description Language"(John Wiley & Sons, June 2002)에서 찾을 수 있다. 특히 대안으로, DDL은 데이터베이스 설계자 또는 데이터베이스 관리자가 데이터베이스 방법을 규정하는데 사용되는 데이터 정의 언어로서 해석될 수 있다. DDL에 대한 상세한 설명은 R.Elmasri와 S.B.Navathe의 "Fundamentals of Database Systems"(Addison Wesley, July 2003)에서 찾을 수 있다.
DirecTV
DirecTV는 TV용 디지털 위성 서비스를 제공하는 회사이다. DirecTV에 대한 상세한 설명은 www.directv.com/에서 찾을 수 있다. Dish Network (www. dishnetwork.com), Voom(www.voom.vom) 및 SkyLife(www.skylife.co.kr)는 다른 디지털 위성 서비스를 제공하는 다른 회사이다.
DMB
한국에서 상업화된 디지털 멀티미디어 방송(DMB)은 고속으로 이동하는 휴대용 수신기(소형 TV, PDA 및 휴대 전화)에 다양한 정보(예를 들어, 뉴스, 교통 정보)뿐만 아니라 CD 음질의 오디오, 비디오, TV 프로그램을 제공하는 새로운 멀티미디어 방송 서비스이다.
DSL
디지털 가입자 회선(DSL)은 인터넷에 접속되어 사용되는 고속 데이터 회선이다. ADSL와 VDSL 등의 다른 유형의 DSL이 개발되었다.
DSM-CC
디지털 저장 미디어 - 커맨드 및 제어(DSM-CC)는 멀티미디어 광대역 서비스의 전송을 위해 개발된 표준이다. DSM-CC에 대한 상세한 설명은 "ISO/IEC 13818-6, Information technology - Generic coding of moving pictures and associated audio information -- Part 6: Extensions for DSM-CC"(www.iso.org를 참조)dptj 찾을 수 있다.
DSS
디지털 위성 시스템(DSS)은 디지털 데이터를 방송하는 위성 네트워크이다. DSS의 일예는 디지털 TV 신호를 방송하는 DirecTV이다. DSS는 특히 TV와 컴퓨터가 정보와 엔터테인먼트의 조합 또는 단일 매체로 집중할 때 더 중요하게 될 것으로 기대된다(www.webopedia.com를 참조).
DTS
디코딩 타임 스탬프(DTS)는 디코딩의 의도 시간을 나타내는 타임 스탬프이다. DTS에 대한 보다 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information-Part 1:Systems" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
DTV
디지털 TV(DTV)는 오디오, 비디오 및/또는 관련 정보를 나타내는 아날로그 신호보다는 디지털 신호를 수신하는 것을 특징으로 하는 현재의 아날로그 TV를 확대하거나 대체한 대안의 오디오-비주얼 디스플레이 장치이다. 비디오 디스플레이 장치는 음극선관(CRT), 액정 디스플레이(LCD), 플라즈마 및 여러 프로젝션 시스템을 포함한다. 디지털 TV는 Herve Benoit의 "Digital Television: MPEG-1, MPEG-2 and Principles of the DVB System"(Butterworth-Heinemann, June, 1997)에 충분히기재되어 있다.
DVB
디지털 비디오 방송은 유럽 등 여러 국가에서 주로 채택한 디지털 TV 방송의 사양이다. DVB에 대한 상세한 설명은 Ulrich Reimers의 "DVB: The Family of International Standards for Digital Video Broadcasting"(www.dvb.org를 참조)에서 찾을 수 있다. ATSC는 DVB의 대체 또는 파생물로서, 미국과 한국 등의 여러 국가에서 디지털 방송을 위해서 고려되거나 채택되고 있다.
DVD
디지털 비디오 디스크(DVD)는 비디오, 멀티미디어, 게임, 오디오 및 다른 응용 프로그램 용의 고용량의 CD 크기의 저장 매체 디스크이다. DVD에 대한 상세한 설명은 "An Introduction to DVD Formats"(www.disctronics.co.uk/downloads/ tech_docs/dvdintroduction.pdf를 참조)와 Tony Hendley의 "Video Discs Compact Discs and Digital Optical Discs Systems"(Information Today, June 1985)에서 찾을 수 있다. CD(콤팩트 디스크), 미니디스크, 하드 드라이브, 자기 테이블, 회로 기반(플래쉬 RAM) 데이터 저장 매체는 아날로그 또는 디지털 포맷으로 저장하기 위한 DVD의 대체 또는 파생물이다.
DVR
디지털 비디오 리코더(DVR)는 일반적으로 예를 들어, 관련 저장부 또는 로컬 저장부 또는 하드 디스크에서의 녹화 기능을 가진 STB로서 간주된다. DVR에 대한 상세한 설명은 Yankee Group의 "Digital Video Recorders: The Revolution Reamins On Pause"(MarketReaerch.com, April 2001)에서 찾을 수 있다.
EIT
이벤트 정보 테이블(EIT)은 소정의 가상 채널 상에서의 시작 시각, 지속 시간, 제목 등의 이벤트에 관련된 필수 정보를 포함하는 테이블이다. EIT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
EPG
전자 프로그램 가이드(EPG)는 짧은 설명과 함께 현재 프로그램과 미래의 프로그램에 대한 정보를 제공한다. EPG는 인쇄된 TV 프로그램 가이드와 등가의 전자 장치이다. EPG에 대한 상세한 설명은 Datamonitor의 "The evolution of the EPG: Electronic program guide development in Europe and the US" (MarketReaearch.com)에서 찾을 수 있다.
ES
기본 스트림(ES)은 시퀀스 헤더 및 시퀀스의 하위 부분과 함께 비디오 또는 오디오 데이터를 포함하는 스트림이다. ES에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information - Part 1: Systems" ISO/IEC 13818-1 (MPEG-2), 1994(www.iso.org를 참조)에서 찾을 수 있다.
ESD
이벤트 세그먼트 기술어(ESD, Event Segment Descriptor)는 프로그램 또는 이벤트의 세그먼트화 정보를 기술하기 위해 프로그램 및 시스템 정보 프로토콜(PSIP)와 시스템 정보(SI)에 사용되는 기술어이다.
ETM
확장형 텍스트 메시지(ETM)는 몇몇 상이한 언어로 설명을 나타내는데 사용되는 스트링 데이터 구조이다. ETM에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Infromation Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
ETT
확장형 텍스트 테이블(ETT)은, 필요한 경우 가상 채널 및 이벤트의 보충적 기술을 제공하는 확장형 텍스트 메시지(ETM)를 포함한다. ETM에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Infromation Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
FCC
연방 통신 위원회(FCC)는 연방 의회에서 직접 관할하는 독립적인 미국 정부 기관이다. FCC는 1934년에 통신 법령에 의해 설립되어 라디오, 텔레비젼, 유선, 위성 및 케이블에 의한 주간 및 국제 통신을 조정하는 역할을 하고 있다. 보다 많은 정보는 그들의 웹 사이트(www.fcc.gov/aboutus.html를 참조)에서 찾을 수 있다.
F/W
펌웨어(F/W)는 예를 들어, 전자 장치 또는 시스템 상에서 프로그램을 동작(또는 운용)하기 위해 전자 제어기 장치(마이크로제어기 또는 마이크로프로세서 등)와 연결될 수 있는 상태 메모리(프로그래밍가능 판독 전용 메모리(PROM))에 내장된 컴퓨터 프로그램 등의, 하드웨어(H/W)와 소프트웨어(S/W)의 조합이다. 보다 상세한 설명은 Ed Sutter의 "Embedded Systems Firmware Demystified"(CMP Books 2002)에서 찾을 수 있다.
GPS
GPS(Global Positioning Satellite)는 3차원 위치와 시각 정보를 제공하는 위성 시스템이다. GPS 시각은 1차 시각 소스로서 확대되어 사용된다. UTC(협정 세계시), NTP(네트워크 타임 프로토콜) 프로그램 클록 참조(PCT) 및 개정된 율리우스 일(MJD)은 GPS 시각의 대체 또는 파생물으로서 시각 정보를 제공하기 위해 고려되거나 채택되고 있다.
GUI
GUI(Graphical User Interface)는 윈도우, 버튼, 스크롤 바, 화상, 영화, 마우스 등의 구성 요소를 이용하는 전자 장치와 사용자 간의 그래픽 인터페이스이다.
HD-DVD
HD-DVD(High Definition-Digital Video Disc)는 비디오, 멀티미디어, 게임, 오디오 및 다른 응용 프로그램에 대한 고용량의 CD 크기의 저장 매체 디스크이다. HD-DVD에 대한 상세한 설명은 DVD 포럼(www.dvdforum.org/를 참조)에서 찾을 수 있다. CD(콤팩트 디스크), 미니디스크, 하드 드라이브, 자기 테이프, 회로 기반(플래쉬 RAM 등)의 데이터 저장 매체는 아날로그 또는 디지털 포맷으로 저장하기 위한 HD-DVD의 대체 또는 파생물이다.
HDTV
HDTV(High Definition Televison)는 우수한 디지털 화질(해상도)을 제공하는 디지털 TV이다. 1080i(비월의 1920×1080 화소), 1080p(순차 1920×1080 화소) 및 720p(16:9 종횡비의 순차 포맷의 1280×720 화소)는 일반적으로 채택된 HDTV 포맷이다. "비월" 또는 "순차"는 HDTV의 주사 모드를 지칭하며, 이에 대해서는 "ATSC Standard A/53C with Amendment No. 1: ATSC Digital Television Standard" Rev.C, 21 May 2004(www.atsc.org를 참조)에 상세히 설명되어 있다.
Huffman Coding
허프만 코딩(Huffman Coding)은 다른 영역에서뿐만 아니라, 디지털 화상 및 비디오에서의 다른 변환 기능 또는 인코딩 알고리즘(DCT, 웨이블릿 등)과의 조합하여 또는 단독으로 사용될 수 있는 데이터 압축 방법이다. 허프만 코딩에 대한 상세한 설명은 Khalid Sayood의 "Introduction to Data Compression"(Morgan Kaufmann, Second Edition, Febraury, 2000)에서 찾을 수 이TEk.
H/W
하드웨어(H/W)는 전자 또는 다른 장치의 물리적인 구성 요소이다. H/W에 대한 상세한 설명은 Steve Ettlinger의 "The Hardware Cyclopedia (Running Press Book, 2003)에서 찾을 수 있다.
infomercial
인포머셜(Infomercial)은 새로운 프로그램 티저, 대중 광고, 파격 세일, 광고 및 커머셜 등의 시청각(또는 부분) 프로그램 또는 세그먼트 제공 정보 및 커머셜을 포함한다.
IP
IETF RFC791에 의해 정의된 인터넷 프로토콜(IP)은 컴퓨터가 서로 통신할 수 인터넷의 기초가 되는 통신 프로토콜이다. IP에 대한 상세한 설명은 IETF RFC 791 인터넷 프로토콜 다파 인터넷 프로그램 프로토콜 사양(www.ietf.org/rfc/rfc0791 .txt를 참조)에서 찾을 수 있다.
ISO
ISO(국제 표준화 기구)는 표준을 조정하는 국제 표준 협회이다. 보다 많은 정보는 그들의 웹 사이트(www.iso.org를 참조)에서 찾을 수 있다.
ISDN
ISDN(통합 서비스 디지털 네트워크)는 음성, 비디오 및 데이터 통신을 지원하는 표준 전화 회선을 통한 디지털 전화 방식이다.
ITU-T
ITU-T(International Telecommunication Union(ITU) Telecommunication Standardization Sector(ITU-T))는 원격 통신 분야의 표준으리 규정하는 ITU의 3개의 섹터 중 하나이다. 보다 많은 정보는 그들의 웹 사이트(www.real.com itu.int/ITU-T를 참조)에서 찾을 수 있다.
JPEG
JPEG(Joint Photographic Experts Group)는 정지 화상 압축의 표준이다. JPEG에 대한 상세한 설명은 "ISO/IEC International Standard 10918-1"(www.jpeg.org/jpge/를 참조)에서 찾을 수 있다. 여러 MPEG, 휴대용 네트워크 그래픽(PNG), GIF, XBM(X 비트맵 포맷), 비트맵(BMP)은 JPEG의 대체 또는 파생물이며, 여러 화상 압축에서 고려되거나 채택된다.
key frame
키 프레임(키 프레임 화상)은 복수의 화상을 포함하는 비디오 프로그램으로부터 유추된 단일의 정지 화상이다. 키 프레임에 대한 상세한 설명은 Hyun Sung Chang, Sanghoon Sull, Sang Uk Lee의 "Efficient video indexing scheme for content-based retrieval"(Transactions on Circuit and System for Video Technology, April, 2002)에서 찾을 수 있다.
LAN
LAN(Local Area Network)은 상대적으로 작은 영역에 걸친 데이터 통신 네트워크이다. 대부분의 LAN은 단일 빌딩 또는 빌딩 그룹으로 한정되어 있다. 그러나, 하나의 LAN이 예를 들어, 전화 회선과 무선파 등을 통해 임의의 거리에 걸쳐 다른 LAN에 접속되어 WAN(Wide Area Network)를 형성할 수 있다. 보다 많은 정보가 Charles E.Spurgeon의 "Ethernet: The Definitive Guide"(O'Reilly & Associates)에서 찾을 수 있다.
MHz(Mhz)
초당 백만 사이클을 나타내는 신호 주파수의 측정 단위
MGT
MGT(마스터 가이드 테이블)는 PSIP를 포함하는 테이블에 대한 정보를 제공한다. 예를 들어, MGT는 갱신될 필요가 있는 테이블을 확인하는 버전수와, 메모리 할당을 위한 테이블 크기와 트랜스포트 스트림에서 테이블을 확인하는 패킷 식별자를 제공한다. MGT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
MHP
MHP(멀티미디어 홈 플랫폼)는 쌍방향 디지털 응용 프로그램과 단말기 간의 표준 인터페이스이다. MHP에 대한 상세한 설명은 "ETSI TS 102 812: DVB Multimedia Home Platform (MHP) Specification"(www.etsi.org를 참조)에서 찾을 수 있다. OCAP(Open Cable Application Platform), ACAP(Advanced Common Application Platform), DAVIC(Digital Audio Visual Council) 및 HAVi(Home Audio Video Interoperability)는 MHP의 대체 또는 파생물로서 여러 디지털 응용 프로그램에 있어서의 인터페이스 옵션으로서 고려되거나 채택된다.
MJD
MJD(개정된 율리우스 일)는 율리우스 달력으로부터 유추되는 일 넘버링 시스템이다. 개시일을 12시간 대신에 0시간으로 설정하고, 일 넘버링시에 디지트의 개수를 감소시키는 것이 소개되었다. UTC(협정 세계시), GPS(위성 항법 시스템) 시각, 네트워크 타임 프로토콜(NTP) 및 프로그램 클록 참조(PCR)은 PCR의 대체 또는 파생물로서 시각 정보를 제공하는데 있어서 고려되거나 채택된다.
MPEG
MPEG(Moving Picture Experts Group)는 주로 콤팩트 디스크에서의 디지털 동 화상 인코딩 전용의 표준 기관이다. 보다 많은 정보는 그들의 웹 사이트(www.mpeg.org를 참조)를 참조하라.
MPEG-2
MPEG-2(Moving Picture Experts Group - Standard 2)는 비월/비비월 프레임을 코딩하기 위해 설계된 디지털 비디오 압축 표준이다. MPEG-2는 현재 DTV 방송 및 DVD에 사용되고 있다. MPEG-2에 대한 상세한 설명은 www.mpeg.org에서 찾을 수 있으며, 또한, Barry G.Haskell, Atul Puri, Arun N. Netravali의 "Digital Video: An Introduction to MPEG-2 (Digital Multimedia Standards Series)"(Springer, 1996)에서 찾을 수 있다.
MPEG-4
MPEG-4(Moving Picture Experts Group - Standard 4)는 저자가 멀티미디어 프레젠테이션으로 미디어 객체를 작성하고 정의할 수 있게 함으로써 쌍방향성과, 미디어 객체가 동기화되고 전송시에 서로 관련되는 방법과, 사용자가 미디어 객체와 상호 작용할 수 있는 방법을 지원하는 비디오 압축 표준이다. MPEG-4에 대한 상세한 설명은 Iain E.G. Richardson의 "H.264 and MPEG-4 Video Compression"(John Wiley & Sons, August, 2003)와, Touradj Ebrahimi, Fernando Pereira의 "The MPEG-4 Book"(Prentice Hall PTR, July, 2002)에서 찾을 수 있다.
MPEG-7
"MCDI(Multimedia Content Description Interface)"로 일반적으로 불리는 MPEG-7(Moving Picture Experts Group - Standard 7)는 멀티미디어 콘텐츠 데이터 를 기술하기 위한 표준이다. MPEG-7에 대한 상세한 설명은 B.S.Manjunath, Philippe Salembier 및 Thomas Sikora의 "Introduction to MPEG-7: Multimedia Content Description Language"(John Wiley & Sons, June, 2002)와, "ISO/IEC 15938-5:2003 Information technology -- Multimedia content description interface -- Part 5: Multimedia description schemes"(www.iso.ch를 참조)뿐만 아니라, MPEG 홈 페이지(http://mpeg.tilab.com)와, MPEG-7 콘소시엄 웹사이트(www.mp7c.org)와 MPEG-7 연합 웹 사이트(www.mpeg-industry.com)에서 찾을 수 있다.
NPT
NPT(정상 플레이타임)는 미디어 단편에 기지의 시각 참조를 제공하기 위해 MPEG-2 민간 부서의 특정의 기술어에 내장된 타임 코드이다. NPT에 대한 상세한 설명은 "ISO/IEC 13818-6, Information Technology - Generic Coding of Moving Pictures and Associated Audio Information -- Part 6: Extensions for DSM-CC"(www.iso.org를 참조)에서 찾을 수 있다.
NTP
NTP(네트워크 타임 프로토콜)은 TCP/IP 네트워크를 통해 시각을 송신 및 수신하는 신뢰성 있는 방법을 제공하는 프로토콜이다. NTP에 대한 상세한 설명은 "RFC(Request for Comments) 1305 Network Time Protocol (Version 3) Specification"(www.faqs.org/rfcs/rfc1305.html)에서 찾을 수 있다. UTC(Universal Time Coordinates), GPS(Global Positioning Systems) 시각, PCR(Program Clock Reference) 및 MJD(Modified Julian Date)는 NTP에 대한 대안 또는 보조이며, 시각 정보를 제공하기 위해 고려되거나 채택된다.
NTSC
NTSC(National Television System Committee)는 미국에서 텔레비전과 비디오 표준을 설정하는 역할을 한다(유럽 및 다른 국가에서는, 주된 TV 표준은 PAL 및 SECAM이다). 보다 상세한 정보는 www.ntsc-tv.com 상의 설명 프로그램(tutorial)을 보고 얻게 된다.
OpenCable
CableLabs에 의해 관리되는 OpenCable는 케이블을 통해 쌍방향 서비스를 제공하는 리서치 및 개발 콘소시엄이다. 보다 많은 정보는 그들의 그들의 웹 사이트 www.opencable.com를 참조하여 얻을 수 있다.
PC
퍼스널 컴퓨터(PC)
PCR
트랜스포트 스트림(TS)의 프로그램 클록 참조(PCR)은 오디오와 비디오의 올바른 표시와 디코딩 시각을 위해 사용될 수 있는 시스템 타임 클록의 샘플링 값을 나타낸다. PCR에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다. SCR(시스템 클록 참조)은 MPEG 프로그램 스트림에 사용된 PCR의 대체 또는 파생물이다.
PES
패킷화된 기본 스트림(PES)은 기본 스트림(ES)으로부터의 바이트를 수반하는 PES 패킷 헤더로 구성된 스트림이다. PES에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
PID
패킷 식별자(PID)는 단일 또는 다중 프로그램 트랜스포트 스트림(TS) 내의 프로그램 또는 보조 데이터의 기본 스트림(ES)을 식별하는데 사용된 고유 정수값이다. PID에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
PS
MPEG-2 시스템 층이 지정하는 프로그램 스트림(PS)은 DVD 미디어 등의 상대적으로 에러가 없는 환경에서 사용된다. PS에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
PSI
프로그램 지시 정보(PSI)는 특정 프로그램에 속하는 트랜스포트 스트림 패킷의 식별 및 역다중화을 가능하게 하는 MPEG-2 데이터이다. PSI에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
PSIP
디지털 방송을 위해 ATSC를 이용하는 국가(미국과 한국 등)에서 DVR 등의 소비자 장치에 EPG 정보를 전송하기 위한 ATSC 데이터 테이블의 프로그램 및 시스템 정보 프로토콜(PSIP). 디지털 비디오 방송 시스템 정보(DVB-SI)는 ATSC-PSIP의 대체 또는 파생물이며 유럽에서 사용되는 디지털 비디오 방송(DVB) 용도로 고려되거나 채택된다. PSIP에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
PSTN
공중 교환식 전화망(PSTN)은 상호접속된 음성 지향의 공중 전화망의 세계적인 집합체이다.
PTS
프레젠테이션 타임 스탬프(PTS)는 오디오 및/비디오의 프레젠테이션 시각을 나타내는 타임 스탬프이다. PTS에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
PVR
퍼스널 비디오 리코더(PVR)는 DVR과 호환가능하게 공통으로 사용되는 용어이다.
ReplayTV
ReplayTV는 사용자의 TV 시청 경험을 최대화하는 DVR 업계를 선도하는 회사이다. ReplayTV에 대한 상세한 설명은 http://digitalnetworksna.com과 http://replaytv.com에서 찾을 수 있다.
RF
고주파(RF)는 고주파 전파와 연관된 전자기 스펙트럼 내의 임의의 주파수를 지칭한다.
RRT
등급 지역 테이블(RRT)은 ATSC 표준에서의 프로그램 등급 정보를 제공하는 테이블이다. RRT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
SCR
프로그램 스트림(PS)의 시스템 클록 참조(SCR)은 오디오와 비디오의 올바른 프레젠테이션과 디코딩 시각에 사용될 수 있는 시스템 시각 클록의 샘플링 값을 나타낸다. SCR에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다. PCR(프로그램 클록 참조)은 SCR의 대체 또는 파생물이다.
SDTV
표준 화질 TV(SDTV0는 HDTV의 비디오 화질을 얻지 못하지만 NTSC 픽쳐에 비해 적어도 동일 또는 우수한 디지털 TV의 동작의 하나의 모드이다. SDTV는 일반적으로 4:3 또는 16:9의 종횡비를 가지며, 일반적으로 서라운드 사운드를 포함한다. 초당 프레임(fps)의 변화, 해상도의 라인 및 480p와 480i의 다른 요인은 ATSC 표준의 12 SDTV 포맷을 구성한다. 480p와 480i 각각은 ATSC Standard A/53C with Amendment No. 1: ATSC Digital Television Standard, Rev.C 21 May 2004(www.atsc.org를 참조)에 상세히 설명된 480 순차 및 480 비월 포맷을 나타낸다.
SGML
표준화된 범용 표시 언어(SGML)는 텍스트를 전자 형태로 나타내는 방법과는 독립적인 장치와 시스템의 정의에 대한 국제 표준이다. SGML에 대한 상세한 설명은 "Learning and Using SGML"(www.w3.org/MarkUp/SGML/를 참조)와 David Hunter의 "Beginnig XML"(Wrox, December, 2001)에서 찾을 수 있다.
SI
DVB에 대한 시스템 정보(DVB-SI)는 DVB 호환 디지털 TV에 EPG 정보 데이터를 제공한다. DVB-SI에 대한 상세한 설명은 "ETSI EN 300 468 Digital Video Broadcasting (DVB); Specification for Service Information (SI) in DVB Systems"(www.etsi.org를 참조)에서 찾을 수 있다. ATSC-PSIP는 DVB-SI의 대체 또는 파생물이며, 미국과 한국 등의 ATSC를 이용하는 국가에 서비스 정보를 제공하는데 고려되거나 채택된다.
STB
셋톱 박스(STB)는 퍼스널 컴퓨터(PC)와 휴대 장치를 포함한, 프로그램의 DFL부를 수신, 저장, 처리, 반복, 편집, 수정, 디스플레이, 재생 또는 수행하도록 된 디스플레이, 메모리 또는 인터페이스 장치이다.
STT
시스템 타임 테이블(STT)은 시각과 일자 정보를 ATSC에 제공하도록 정의된 소형의 테이블이다. 디지털 비디오 방송(DVB)은 시각 및 일자 테이블(TDT)로 불리는 유사한 테이블을 갖는다. STT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
S/W
소프트웨어는 전자 장치가 특정의 활동을 동작 또는 실행할 수 있게 하는 컴퓨터 프로그램 또는 명령어 집합이다. S/W에 대한 상세한 설명은 Robert W.Sebesta의 "Concepts of Programming Languages"(Addison Wesley)에서 찾을 수 있다.
TCP
전송 제어 프로토콜(TCP)은 신뢰할 수 있는 스트림 전송 및 가상 접속 서비스를 응용 프로그램에 제공하기 위해 인터넷 엔지니어링 태스크 포스(IETF) RFC(Request for Comments) 793에 의해 정의된다. TCP에 대한 상세한 설명은 "Transmission Control Protocol Darpa Internet Program Protocol Specification" (www.ietf.org/rfc/rfc0793.txt를 참조)에서 찾을 수 있다.
TDT
TDT(Time Date Table)는 디지털 비디오 방송(DVB)에서 시각과 일자를 나타내는 것과 관련된 정보를 제공하는 테이블이다. STT는 시각과 일자 정보를 ATSC에 제공하기 위한 TDT의 대체 또는 파생물이다. TDT에 대한 상세한 설명은 "ETSI EN 300 468 Digital Video Broadcasting (DVB); Specification for Service Information (SI) in DVB systems"(www.etsi.org를 참조)에서 찾을 수 있다.
TiVo
TiVo는 개척된 소비자 DVR에 방송을 통한 디지털 콘텐츠를 제공하는 회사이다. TiVo에 대한 상세한 설명은 http://tivo.com에서 찾을 수 있다.
TOC
TOC(Table of Contents)는 바람직하게 원하는 특정 부분 또는 하위 부분 또는 세그먼트를 신속하게 가리키고 접근하기 위해 단일 프레젠테이션(책, 비디오, 오디오, AV 또는 다른 참조 또는 엔터테인먼트 프로그램 또는 콘텐츠 등)의 일부 또는 하위 부분에 대한 특징, 위치 또는 참조의 목록화를 지칭한다.
TS
MPEG-2 시스템 층에 의해 지시된 트랜스포트 스트림(TS)은 에러가 있음직한 환경, 예를 들어, 방송 네트워크에 사용된다. PES 패킷을 추가로 패킷화하는 TS 패킷은 188 바이트 길이를 갖는다. TS에 대한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
TV
TV, 일반적으로, 픽쳐 및 오디오 프레젠테이션 또는 출력 장치. 일반적인 형태는 일반적으로 스피커를 구비한 음극선관(CRT), 플라즈마, 액정 및 다른 프로젝트 및 다이렉트 시청 시스템을 포함한다.
TV-Anytime
TV-Anytime은 TV-Anytime 포럼에 의해 개발된 오디오-비주얼 및 다른 데이터 서비스를 가능하게 하는 공개 사양 또는 표준의 시리즈이다. TV-Anytime에 대한 상세한 설명은 TV-Anytime 포럼의 홈 페이지(www.tv-anytime.org를 참조)에서 찾을 수 있다.
TVPG
TVPG(Televison Parental Guidelines)는 TV 프로그램의 콘텐츠 및 연령 적절성에 대한 보다 많은 정보를 부모에게 제공하는 가이드라인이다. TVPG에 대한 상세한 설명은 www.tvguidelines.org/default.asp에서 찾을 수 있다.
uimsbf
uimsbf(unsigned integer, most significant-bit first). 부호없는 정수는 최상위 비트 우선(최좌측 비트가 최상위 비트임)의 순서로 하나 이상의 1과 0으로 구성된다. uimsbf에 대한 상세한 설명은 "Generic Coding of Moving Pictures and Associated Audio Information Part 1:System" ISO/IEC 13818-1 (MPEG-2), 1994(http://iso.org)에서 찾을 수 있다.
UTC
그리니치 평균시와 같은 협정 세계시(UTC)는 전세계의 상이한 시간대에 사용되는 공식적인 시간이다.
VCR
비디오 카세트 리코더(DVR). DVR은 VCR의 대체 또는 파생물이다.
VCT
가상 채널 테이블(VCT)은 ATSC와 DVB에서 가상 채널의 네비게이팅과 튜닝에 필요한 정보를 제공하는 테이블이다. VCT에 대한 상세한 설명은 "ATSC Standard A/65B: Program and System Information Protocol for Terrestrial Broadcast and Cable" Rev.B, 18 March 2003(www.atsc.org를 참조)에서 찾을 수 있다.
VOD
비디오 온 디멘드(VOD)는 TV 시청자가 비디오 프로그램을 선택할 수 있고 케이블 또는 위성 TV 네트워크 등의 네트워크를 통한 채널을 통해 그들에게 전송된 비디오 프로그램을 얻을 수 있게 하는 서비스이다.
VR
비디오의 비주얼 리듬(VR)은 단일 화상 또는 프레임, 즉, 각각의 화상 시퀀스의 특정 그룹의 화소를 샘플링하고 시간에 따른 샘플을 시간적으로 축적함으로써 구성된 비디오 세그먼트의 전체 3차원 콘텐츠의 2차원 요약이다. VR에 대한 상세한 설명은 H. Kim, J. Lee 및 S. M. Song의 Proceedings of IEEE International Conference on Multimedia Computing and Systems, 827-834, 1999년 6월 "An Efficient Graphical Shot Verifier Incorporating Visual Rhythm" 에서 찾을 수 있다.
VSB
레벨 잔류 측파대(VSB)는 신호를 변조하는 방법이다. VSB에 대한 상세한 설명은 Mark Massel의 "Digital Television, DVB-T COFDM and ATSC 8-VSB" (Digitaltvbooks.com, October 2000)에서 찾을 수 있다.
WAN
광대역 네트워크(WAN)는 LAN에서 행해지는 것보다 넓은 범위의 네트워크이다. 보다 많은 정보는 Charles E. Spurgeon의 "Ethernet: The Definitive Guide"(O'Reilly & Associates)에서 찾을 수 있다.
W3C
월드 와이드 웹 콘소시엄(W3C)은 웹 경험을 개선하는 다양한 기술을 개발한 기관이다. W3C에 대한 상세한 설명은 www.w3c.org에서 찾을 수 있다.
XML
W3C에 의해 정의된 XML(eXtensible Markup Language)는 SGML으로부터 유추된 단순하고 유연한 텍스트 포맷이다. XML에 대한 상세한 설명은 Elliotte Rusy Harold, W.Scott Means의 "XML in a Nutshell"(O'Reilly, 2004)에서 찾을 수 있다.
XML 스키마
XML 문서의 구조, 내용 및 구문을 정의하는 수단을 제공하기 위해 W3C에 의해 정의된 스키마 언어. XML 스키마에 대한 상세한 설명은 Priscilla Walmsley의 "Definitive XML Schema"(Prentice Hall, 2001)에서 찾을 수 있다.
Zlib
하드웨어 및 소프트웨어와는 무관하게 사용하기 위한 프리의 범용 무손실 데이터 압축 라이버리이다. 보다 많은 정보는 www.gzip.org/zlib에서 얻을 수 있다.
일반적으로, 전송된 세그먼트와 정보를 이용하여 DVR에 녹화될 수 있는 프로그램의 세그먼트에 효율적으로 랜덤 액세스하기 위해서, 종래의 프로그램 가이드(예를 들어, ATSC-PSIP 또는 DVB-SI EPG)와 연관된 DVR 등에 방송 또는 다른 전송된 프로그램의 세그먼트화 정보를 효율적으로 전송하는 기술(방법, 장치, 시스템)이 제공된다. 세그먼트화 정보는 방송 프로그램의 세그먼트의 세그먼트 제목, 시간적인 시작 위치와 지속 시간을 포함할 수 있다.
일반적으로, EPG 등의 기존의 프로그램 가이드에 대한 세그먼트 정보를 지정하는 2개의 예시적인 기술이 제공된다. 제 1 기술예에서, 세그먼트화 정보는 PSIP에 사용하기 위한 확장형 텍스트 테이블(ETT) 내의 확장형 텍스트 메시지(ETM)와 SI에 사용하기 위한 단문/확장형 이벤트 서술자 또는 프로그램에 삽입된다. 제 2 기술예에서, 이벤트의 세그먼트화 정보는 새로운 메타데이터 구조(서술자)를 이용하여, 이벤트 정보 테이블(EIT) 등의 PSIP 및 SI 테이블에 삽입된다.
세그먼트화 정보는 다양한 방식으로 TV 시청자의 STB에 전송하기 위해 전송될 수 있다.
일반적으로, 특히, 프로그램에 대한 세그먼트화 정보가 실시간으로 인덱싱될 때, 프로그램 가이드를 통해 세그먼트화 정보를 점진적으로 전송하는 제 1 기술이 제공된다. 세그먼트에 대한 세그먼트화 정보는 중요한 사건 또는 이벤트가 발생하는 즉시 프로그램 가이드 내에 삽입된다. 또한, 세그먼트 또는 세그먼트 그룹에 대한 세그먼트화 정보는 프로그램 가이드 내에 주기적으로 삽입될 수 있다.
일반적으로, 프로그램이 종료된 직후에 세그먼트화 정보를 종래의 프로그램 가이드를 통해 전송하는 제 2 기술이 제공된다. 이러한 경우에, 프로그램 가이드는 현재 및 가까운 미래의 프로그램에 대한 정보뿐만 아니라, 이미 방송되었던 프로그램에 대한 정보를 제공할 수 있어야 한다. 기존의 프로그램 가이드는 확장되어 추가 기능을 제공한다.
이로써, STB 사용자는 DVD 장면 선택과 유사한 방식으로 STB에 전송된 세그먼트화 정보에 기초하여 녹화 프로그램을 브라우징할 수 있다.
일반적으로, 시청자의 DVR에 대한 EIT의 세그먼트화 정보 기술어(descriptor) 또는 ETT의 ETM 스트링에 의해 제공된 세그먼트 등의 정보를 분석하는 기술이 제공된다.
일반적으로, ETT의 ETM 스트링 또는 ETT의 세그먼트화 정보 기술어 등을 통해 수신 세그먼트화 정보에 기초하여 세그먼트화 정보를 디스플레이하는 기술이 제공된다.
일반적으로, 원격 제어로 포워드 및 백워드 키를 이용하여 프로그램의 세그먼트를 고속 액세스하여 디스플레이하는 기술이 제공된다.
일반적으로, 인포머셜을 처리하여 나타내는 기술이 제공된다.
일반적으로, 세그먼트화 정보를 스크램블링하는 기술이 제공된다.
일반적으로, 타겟(청취자 또는 시청자)의 DVR에서 하나 이상의 프로그램의 적어도 일부를 자동으로 녹화하기 위해서 기존의 프로그램 가이드에 특정의 방송 프로그램의 적어도 일부를 녹화하기 위한 트리거 정보를 지정하는 기술이 제공된다.
일반적으로, 방송 프로그램의 프레임 관련 정보를 전송하여 디스플레이하는 기술이 제공된다.
본 발명의 기술에 따르면, 방송 스트림에서의 프레임의 정확한 위치를 표현하거나 위치 판단하는 방법은 방송 스트림의 미디어 로케이터로서 방송 시각을 이용하는 단계를 포함한다. 미디어 로케이터로서 방송 시각을 이용하는 단계는 시스템 시각 마커 및 프로그램 클록 참조(PCR)을 이용하는 단계를 포함할 수 있다.
본 발명의 기술에 따르면, AV 프로그램 내의 시간적인 위치로의 액세스를 제공하는 방법은 AV 프로그램에 대한 세그먼트화 정보를 생성하는 단계와, 전자 프로그램 가이드(EPG)를 통해 AV 프로그램에 대한 세그먼트화 정보를 전송하는 단계를 포함한다. EPG는 과거의 AV 프로그램에 대한 정보뿐만 아니라, 현재 및 미래의 AV 프로그램에 대한 정보를 포함한다. AV 프로그램에 대한 세그먼트화 정보는 AV 프로그램 내의 각각의 세그먼트 또는 서브 세그먼트의 적어도 하나의 시작 위치를 기술한다.
본 발명의 기술에 따르면, 이용가능한 AV 프로그램의 디스플레이를 위해서 전자 프로그램 가이드를 이용하는 방법은 EPG 내에 포함된 세그먼트화 정보에 기초하여 브라우징하기 위한 쌍방향 그래픽 사용자 인터페이스(GUI)를 생성하는 단계를 포함한다. GUI는 AV 프로그램의 위치로부터의 섬네일(thumbnail) 이미지를 포함할 수 있다. AV 프로그램은 백워드 또는 포워드로 시간적인 순서로 세그먼트의 시작 위치로부터 랜덤하게 액세스되어 플레이된다.
본 명세서에 기재된 기술의 다른 목적, 특징 및 장점은 다음의 상세한 설명으로부터 자명해질 것이다.
본 명세서에 기재된 기술의 실시예에 대한 상세한 설명은 첨부 도면을 참조하여 설명될 것이다. 도면은 제한하는 것이 아니라 예시적인 것이며, 예시된 실시예에 대한 기술을 한정하지 않는 것으로 이해해야 한다.
본 발명은 프로그램 가이드 정보(일반적으로 디지털 방송의 EPG 정보)의 프로세싱에 관한 것이며, 보다 상세하게는, 방송 TV 프로그램의 비디오 세그먼트에 대한 정보를 다양한 DTV 방송 표준에 현재 정의된 프로그램 및 시스템 정보 프로토콜(PSIP) 및 서비스 정보(SI) 등의 종래의 프로그램 가이드 사양을 통해 관련 데이터 저장부를 구비한 STB에 전송하는 기술에 관한 것이다.
예를 들어, 사용자의 TV 세트 내부에 접속되거나 연결될 수 있는 STB 등과 같이 전송된 콘텐츠를 처리하여 디스플레이하기 위해서 여러 장치가 사용될 수 있다. 전형적으로, 오늘날의 STB 기능은 임의 개수의 채널로 프로그램을 제공할 수 있는 방송국으로부터 아날로그 및/또는 디지털 신호를 수신하는 기능과, 수신된 신호를 디코딩하는 기능과 디코딩된 신호를 디스플레이하는 기능을 포함한다.
1. 미디어 로컬리제이션
인덱싱 시스템과 클라이언트 DVR 모두에 유일하게 접근(access) 가능한 방송 프로그램(또는 스트림)에서의 위치를 표현하거나(represent) 가리키는(locate) 것은 비디오 브라우징, TV 광고 교체 및 특정 프레임에 관련된 정보 서비스를 포함하는 다양한 응용에서 중요하다. 방송 프로그램을 로컬리제이션할 때의 기존의 문제점을 극복하기 위해서, 방송 스트림에 대한 미디어 로케이터로서 방송 시각을 이용하는 해결책이 상술의 미국 특허 출원 제 10/369,333 호(2003년 2월 19일)에 기재되어 있으며, 이는 DVB-MHP내의 DSM-CC NPT의 구현의 복잡성을 요구하고 PTS의 단순 이용의 비유일성 문제점을 야기하는 방법에 비해 방송 스트림 내의 타임 라인을 나타내는 단순하고 이해가능한 방법이다. 방송 시각은 프로그램을 방송용으로 현재 방영하는 현재 시각이다. 지상파 DTV 방송국, 위성/케이블 DTV 서비스 공급자 및 DMB 서비스 공급자에 의해 MPEG-2 TS 또는 다른 소유 또는 등가의 트랜스포트 패킷 구조로 다중화 또는 방송되는 방송 스트림 또는 프로그램, 시각 정보 또는 위치 마커의 미디어 로케이터로서 이용하는 기술이 본 명세서에 기재되어 있다. 예를 들어, 각각 ATSC/OpenCable(일반적으로 매초당 한번 방송)의 STT의 system_time 필드 또는 DVB(30초당 한번 방송)의 TDT의 UTC_time 필드에서 방송 스트림에 반송되는 시각에 대한 정보를 이용하는 기술이 기재되어 있다. 디지털 오디오 방송(DAB), DMB 또는 다른 등가의 방송에 있어서, 그들의 TS에서 방송되는 시각에 대한 유사한 정보가 이용될 수 있다. 본 명세서에서, 방송 스트림(예를 들어, STT의 system_time 필드 또는 상술한 다른 등가의 필드)에서 반송된 시각에 대한 이러한 정보를 총칭적으로 "시스템 타임 마커"라고 부른다.
방송 스트림에서의 특정 위치 또는 프레임을 로컬리제이션하는 예시적인 기술은 주기적으로 방송되는 STT 내의 system_time 필드(TDT 또는 다른 등가의 UTC_time 필드)를 이용하는 것이다. 보다 상세하게는, 프레임의 위치는, 비디오 스트림 내의 대응하는 PTS에 따라서 프레임이 제공되거나 디스플레이되는 순간으로부터 STT 내의 가장 근접한(대안으로, 가장 근접하지만 프레임의 시간적인 위치에 앞서는) system_time를 이용함으로써 기술되어 로컬리제이션될 수 있다. 대안으로, 프레임의 위치는 프레임의 인코딩된 데이터가 시작하는 비트 스트림 위치로부터 가장 근접한 STT 내의 system_time를 이용함으로써 로컬리제이션될 수 있다. 이러한 system_time 필드의 단순한 이용은 일반적으로, STT의 전송 간격이 1초 내이며 이러한 STT 내에서 반송되는 system_time 필드가 1초 내에서 정확하기 때문에서, 프레임이 정확하게 스트림에 액세스할 수 없게 한다는 것을 알아야 한다. 따라서, 스트림은 1초의 정확도 내에서만 액세스될 수 있으며, 이는 대부분의 실제 응용에서 만족스럽다. STT 내의 system_time 필드를 이용하여 로컬리제이션된 프레임의 위치가 1초내에서 정확함에도 불구하고, 로컬리제이션된 프레임 위치 전의 임의의 시각에 플레이되어 특정의 프레임이 디스플레이될 수 있게 한다는 것을 알아야 한다. 또한, 방송 STT 또는 다른 등가에 대한 정보는 나중에 로컬리제이션을 위해서 이용하기 위해서, AV 스트림 자체와 함께 저장될 수 있다는 것을 알아야 한 다.
방송 스트림에서의 특정 위치 또는 프레임에 대한 (근접의) 프레임의 정확한 액세스 또는 로컬리제이션을 달성하는 다른 방법이 기재되어 있다. 디스플레이되는 특정 위치 또는 프레임은 STT 내의 system_time(또는 TDT 또는 다른 등가의 UTC_time)을 타임 마커 및 타임 마커에 대한 상대적인 시각으로서 이용함으로써 로컬리제이션된다. 보다 상세하게는, 특정 위치에 대한 로컬리제이션은 로컬리제이션되는 특정 위치 또는 프레임에 앞서는 바람직하게 먼저 발생하고 가장 근접한 특정 위치인 STT 내의 system_time를 타임 마커로서 이용하여 달성된다. 추가로, 본 명세서에서 단독으로 사용된 타임 마커는 일반적으로 프레임 정확도를 제공하지 못하기 때문에, 타임 마커에 대한 특정 위치의 상대적인 시각은 이러한 정확도 또는 다른 등가의 정확도로 이용가능하다면 PCR, STB의 내부 시스템 클록 등의 클록을 이용하여 바람직하게 최소한 또는 대략 30Hz의 해상도로 계산된다. 방송 STT 또는 등가에 대한 정보는 로컬리제이션을 위해서 나중에 이용하기 위해서 AV 스트림 자체와 함께 또한 저장될 수 있다는 것을 알아야 한다.
도 1은 STT내의 system_time 및 상대적인 시각을 이용하여 프레임(102)을 로컬리제이션하는 방법을 도시하고 있다. 위치(108, 109, 110)는 각각 방송 STT에 대응한다. STT가 0.7초마다 한번 방송된다고 가정한다. 109 및 110에서의 STT는 반올림으로 인해 system_time와 동일 값을 가질 수 있으며, 108에서의 STT는 개별적인 system_time를 갖는다. 102에 있어서의 system_time 또는 타임 마커는 102에 앞서는 먼저 발생하고 가장 근접한 STT를 찾아서 얻게 되는 109에서의 STT이다. 상대적인 시각은 최소한 또는 대략 30Hz의 해상도로 system_time(109)를 포함하는 STT의 최종 바이트를 반송하는 TS 패킷의 위치로부터 계산된다. 위치(102)에 있어서의 상대적인 시각(106)은 90kHz의 해상도로 105와 101 사이의 PCR 값의 차에 의해 계산될 수 있다. 대안으로, 특정 위치에 대한 로컬리제이션은 이용가능하다면 이러한 정확도를 가진 PCR, STB의 내부 시스템 클록 또는 다른 등가 등의 클록을 이용함으로써 바람직하게 최소한 또는 대략의 30Hz의 해상도로 STT 내의 system_time 값(또는 TDT 또는 다른 등가의 UTC_time)을 보간 또는 외삽함으로써 달성될 수 있다.
방송 스트림에서의 특정 위치 또는 프레임에 대한 (근접의) 프레임의 정확한 액세스 또는 로컬리제이션을 달성하는 다른 방법이 기재되어 있다. 디스플레이되는 특정 위치 또는 프레임에 대한 로컬리제이션 정보는 STT 내의 system_time(또는 TDT 또는 다른 등가의 UTC_time) 모두를 타임 마커 및 타임 마커에 대한 상대적인 바이트 오프셋으로서 이용함으로써 얻게 된다. 보다 상세하게는, 특정 위치에 대한 로컬리제이션은 로컬리제이션되는 특정 위치 또는 프레임에 앞서는 바람직하게 먼저 발생하고 가장 근접한 특정 위치 또는 프레임인 STT 내의 system_time를 타임 마커로서 이용하여 달성된다. 또한, 타임 마커에 대한 상대적인 바이트 오프셋은 대응하는 system_time 값을 포함하는 STT의 최종 바이트를 반송하는 제 1 패킷으로부터 상대적인 바이트 오프셋을 계산하여 얻게 될 수 있다. 또한, 방송 STT 또는 다른 등가에 대한 정보는 로컬리제이션을 위해서 나중에 이용하기 위해서 AV 스트림 자체와 함께 또한 저장될 수 있다는 것을 알아야 한다. 도 1은 STT 내의 system_time 및 상대적인 바이트 오프셋을 이용하여 프레임(102)을 로컬리제이션하는 방법을 도시한다. 또한, STT는 0.7초마다 한번 방송된다는 것을 알아야 한다. 109와 110에서의 STT는 반올림으로 인해 system_time과 동일 값을 가지며, 108에서의 STT는 개별적인 system_time를 갖는다. 102에 있어서의 system_time 또는 타임 마커는 102에 앞서는 먼저 발생하는 가장 근접한 STT을 찾아서 얻게 된 109에 있어서의 STT이다. 위치(104)는 인코딩된 프레임 데이터가 시작하는 녹화된 비트 스트림의 바이트 위치이다. 위치(101)는 system_time(109)를 포함하는 STT의 최종 바이트를 반송하는 TS 패킷의 위치에 대응하는 녹화된 비트 스트림의 바이트 위치이다. 상대적인 바이트 오프셋(107)은 바이트 위치(104)를 104로부터 감산하여 얻게 된다.
프레임의 정확한 로컬리제이션의 다른 방법은 STT 내의 system_time 필드(또는 TDT 또는 다른 등가의 UTC_time 필드) 및 PCR를 모두 이용하는 것이다. 디스플레이되는 특정 위치 또는 프레임에 대한 로컬리제이션 정보는 서술되는 위치 또는 프레임에 대한 STT 및 PTS의 syste_time를 이용하여 달성된다. 일반적으로, PCR의 값이 27MHz의 해상도로 선형으로 증가하기 때문에, 프레임의 정확한 액세스에 이용될 수 있다. 그러나, 최대 비트 카운트가 달성될 때 PCR는 다시 0으로 되돌아가기 때문에, 프레임의 PTS에 앞서는 바람직하게 가장 근접한 프레임인 STT 내의 system_time을 타임 마커로서 이용하여 프레임을 고유하게 식별할 수 있다. 도 1은 프레임(102)을 로컬리제이션하는 system_time(110)의 대응값과 PCR(111)을 도시한다. 또한, 방송 STT 또는 다른 등가에 대한 정보는 로컬리제이션을 위해서 나중 에 이용하기 위해서 AV 스트림 자체와 함께 또한 저장될 수 있다는 것을 알아야 한다.
2. 세그먼트화 정보를 프로그램 가이드 내에 삽입
TV 및 다른 비디오 시청자는 EPG를 통해서 예를 들어, 현재 방송중이거나 방송될 프로그램에 대한 정보, 즉, 제목과 시작 및 종료 시각을 현재 가지고 있다. 현재의 디지털 방송 시스템에서, EPG는 각각 ATSC 및 DVB 등의 다양한 DTV 방송 표준에서 현재 정의된 PSIP 및 SI 등의 종래의 프로그램 가이드 구성에 의해 제공된다. 서비스 정보에 대한 이러한 표준은 디지털 케이블 및 위성 협회에 의해서 또한 사용된다. 이때에, EPG는 미래에 제한된 시간동안 이용가능한 현재 방송중이고 가까운 기간의 미래의 이벤트(프로그램)인 프로그램(이벤트)에 대한 정보만을 포함한다. 그러나, 사용자는 이미 방송된 프로그램에 대해 보다 상세히 알고 싶어한다. 이러한 요구는 추후 재생을 위해서 방송 프로그램의 녹화를 가능하게 한 DVR의 기능으로 인해 발생하였다.
본 명세서에서는 각각 ATSC 및 DVB 등의 DTV 방송 표준 하에서 현재 제공되고 있는 PSIP 및 SI 등의 프로그램 가이드를 통해서 세그먼트화 정보를 전송하는 기술이 제공된다. PSIP 및 SI를 이용하여 프로그램에 관련된 세그먼트화 정보를 전송하는 예가 설명될 것이다. 그러나, 이러한 기술을 제공하기 전에, 세그먼트화 정보가 상세히 설명된다.
세그먼트화는 비디오 프로그램 등 내에서 시간적인 간격(즉, 세그먼트)을 정의하여 액세스하는 기능을 지칭한다. 세그먼트는 비디오 또는 프로그램 또는 콘텐 츠 내의 연속적인 프레임 세트 또는 서브세트이다. 세그먼트는 다수의 서브 세그먼트로 분할될 수 있으며, 서브 세그먼트는 또한, 다수의 서브 서브 세그먼트로 분할될 수 있으며, 나머지도 마찬가지다. 특정의 서브 세그먼트가 단일의 세그먼트에 속하도록 제한되면, 세그먼트와 서브 세그먼트 간의 포함 관계는 트리 구조로 표현될 수 있다. 트리에서, 특정 세그먼트의 모든 서브 세그먼트(동일 모 노드를 가진 모든 자 노드)는 연대순으로 정렬된다. 즉, 동일 세그먼트에 속하는 2개의 서브 세그먼트의 쌍에 있어서, 다른 서브 세그먼트를 시간적으로 앞서는 하나의 서브 세그먼트는 다른 서브 세그먼트에 앞서 배치되고, 예를 들어, 다른 하나의 서브 세그먼트의 좌측에 그래픽적으로 도시된다. 프로그램의 세그먼트화 정보는 세그먼트, 서브 세그먼트 및 그들의 포함 관계에 대한 정보이다. 일반적으로, 프로그램의 세그먼트화 정보는 각각의 세그먼트 또는 서브 세그먼트의 제목, 시작 위치 및 지속 시간을 최소한 기술한다. 세그먼트화 정보를 이용함으로써, 특정의 세그먼트 또는 서브 세그먼트에 쉽게 액세스하기 위해서 트리 구조를 브라우징하고 네비게이팅할 수 있다.
도 2는 단일 비디오 프로그램에 속하는 세그먼트의 예시적인 계층적 트리 구조를 도시한다. 트리는 트리가 비어 있지 않을 때 루트(202)로 불리는 특별한 노드를 가진 노드의 집합이다. 각각의 노드는 다수의 자 노드 또는 자 노드를 전혀 갖지 않으며 또한 고유의 모 노드(루트 노드를 제외)를 가진다. 예를 들어, 노드(206)의 자 노드는 노드(212, 214, 216)이며, 노드(206)의 모 노드는 루트 노드(202)이다. 노드의 깊이(레벨)는 루트로부터 지정 노드까지의 고유 경로의 길이로 서 정의된다. 예를 들어, 루트 노드(202)의 레벨은 0이며, 노드(204)의 레벨은 1이며, 노드(212)의 레벨은 2이다. 루트 노드(202)는 전체 프로그램을 나타내는 세그먼트이다. 루트 노드(202)로 표현되는 세그먼트는 각각 노드(204, 206, 208, 210)로 표현되는 4개의 서브 세그먼트로 구성된다. 4개의 노드는 연대순으로 정렬되고, 좌측에서 우측으로 그래픽으로 도시된다. 따라서, 서브 세그먼트(204)는 206에 앞서며, 서브 세그먼트(206)는 208에 앞서며, 최종적으로 서브 세그먼트(208)는 210에 앞선다. 세그먼트(206)는 3개의 서브 세그먼트(212, 214, 216)로 추가 분할되며, 세그먼트(208)는 3개의 서브 세그먼트(218, 220, 222)로 분할되며, 서브 세그먼트(220)는 서브 서브 세그먼트(224, 226, 228)로 분할된다. 용이하게 하기 위해서, 서브 서브 세그먼트와 그들의 서브 세그먼트는 일반적으로 "서브 세그먼트"라 한다.
세그먼트의 트리 구조는 정렬된 트리이기 때문에, 동일 모 노드를 가진 각각의 자 노드에 일련 번호를 할당하여, 최좌측의 자 노드의 일련 번호는 1이며, 다음 자 노드의 일련 번호는 그들의 연대적인 순서에 따라서 1만큼 증가될 수 있다. 따라서, 동일 모 노드를 가진 자 노드에 있어서, 각각의 노드는 앞서는 임의의 자 노드보다 낮은 일련 번호를 가진다. 예를 들어, 루트 노드(202)를 그들의 모 노드로서 가진 4개의 자 노드에 있어서, 최좌측 노드(204)는 일련 번호로서 1을 가지며, 다른 3개의 노드(206, 208, 210)는 그들의 일련 번호로서 각각 2, 3, 4를 갖는다. 그들의 모 노드로서의 루트 노드(202)의 세 번째 자 노드(208)를 가진 3개의 자 노드에 있어서, 트리 노드(218, 220, 222)는 그들의 일련 번호를 각각 1, 2, 3을 갖 는다. 루트 노드(202)는 모 노드를 가지고 있지 않기 때문에 임의의 일련 번호를 가지고 있지 않다는 것을 알아야 한다. 루트 노드(202)를 제외하고, 계층적 트리에 위치한 노드의 위치 또는 연대적인 순서는 각 노드의 일련 번호로부터 얻은 계층적 일련 번호에 의해서 고유하게 식별될 수 있다. 임의의 주어진 노드의 계층적 일련 번호는 "."(점)를 가진 루트 노드(22)로부터 임의의 주어진 노드까지의 경로를 따라 배치된 노드의 모든 일련 번호를 연결함으로써 얻게 된다.
각 노드의 계층적 일련 번호는 도 2에서 각 노드 내에 표시된다. 예를 들어, 루트 노드(202)의 세 번째 서브 세그먼트(208)는 계층적 일련 번호로서 3을 가지며, 세그먼트(208)의 두 번째 서브 세그먼트(220)는 계층적 일련 번호로서 3.2를 갖는다. 또한, 계층적 일련 번호가 3.2인 세그먼트(220)의 세 번째 서브 세그먼트(228)는 계층적 일련 번호로서 3.2.3을 갖는다. 루트 노드(202)는 계층적 일련 번호를 가지고 있지 않다는 것을 알아야 한다. 동일 트리 내에 위치한 2개의 세그먼트에 있어서, 그들의 연대기적 순서와 포함 관계는 루트 노드로부터 임의의 주어진 노드까지의 경로를 따라서 위치한 노드의 모든 일련 번호를 연결시킴으로써 얻게 된 2개의 계층적 일변 번호를 비교함으로써 결정될 수 있다. 프래그먼트는 하나의 세그먼트 또는 세그먼트 세트이다. 프로그램의 세그먼트화 정보는 프래그먼트의 단위로 전송되며, 프래그먼트는 하나의 세그먼트 또는 세그먼트 세트로서 정의된다. 도 2에서, 세그먼트는 5개의 프래그먼트(230, 232, 234, 236, 238)로 분할된다.
녹화된 프로그램이 다양한 참조 위치 또는 프레임에 용이하게 (랜덤 액세스 등) 액세스 또는 브라우징되도록, 이벤트(프로그램)에 대한 세그먼트화 정보를 사용자에게 제공하는 바람직하며 이에 대해서 이하에 설명된다.
세그먼트화 정보를 기술하는 하나의 방법은 MPEG-7 또는 TV-Anytime 등의 메타데이터 사양에 대한 국제 표준을 이용하는 것과 디지털 방송 TS에서 세그먼트화 정보에 대한 메타데이터를 다중화하는 것이다. 세그먼트화 메타데이터는 AV 콘텐츠와 함께 제공되거나, 바람직하게 방송 또는 녹화 전, 도중 또는 이후에 비디오 인덱서 등에 의해 생성될 수 있으며, 이전에 또는 나중에 다시 제공되거나 갱신될 수 있다. 세그먼트화 메타데이터는 세그먼트가 속하는 프로그램에 대한 참조, 세그먼트의 콘텐츠의 기술, 및 세그먼트의 위치(시작 위치와 지속 시간)를 포함하는 것이 바람직하다. 세그먼트화 메타데이터에 의해 전체 프로그램을 식별할 수 있을 뿐만 아니라, AV 스트림 내의 세그먼트를 그들의 시작 및 종료 시각에 의해 식별할 수 있다. 표 1은 한국에서 현재 방송되고 있는 "서바이벌 잉글리쉬"라는 교육 프로그램에 대한 도 4a에 도시된 콘텐츠의 테이블을 기술하기 위해서, MPEG-7 및 TV-Anytime 각각에 의해 지정된 세그먼트화 정보의 예시적인 크기를 나타낸다.
표 1. 다양한 메타데이터 포맷에 따른 세그먼트화 정보의 데이터 크기
Figure 112006015285258-pat00001
대역폭 문제점을 극복하기 위해서, MPEG-7는 BiM으로 불리는 XML 문서에 대한 효율적인 2진 인코딩 포맷을 제공하며, TV-Anytime은 TV-Anytime 메타데이터의 XML 실례를 등가의 2진 포맷으로 변환하는 개선된 압축/인코딩 메카니즘을 제공한 다. 그러나, 본 명세서의 배경 기술에서 이미 설명한 바와 같이 TV-Anytime에서 3개의 압축 기술을 이용함에도 불구하고, 압축된 메타데이터 파일 또는 패킷의 크기는 세그먼트화 정보를 포함하는 원래의 텍스트 데이터 파일 또는 패킷의 크기에 비해 거의 작지 않다.
따라서, ATSC-PSIP 또는 DVB-SI 등의 종래의 프로그램 가이드 구성을 확장함으로써 세그먼트화 정보를 제공하는 새로운 기술이 제공된다. 이 기술은 MPEG-7 및 TV-Anytime에 기초한 것보다 크기가 더 작은 세그먼트화 정보를 제공하며, 현재의 디지털 방송 시스템 소프트웨어를 약간 변경할 필요가 있다. PSIP 및 SI 등의 현재의 프로그램 가이드 프로토콜이 이러한 세그먼트화 정보를 포함하기 위해서 확장될 때, 사용자는 시청하거나 녹화하는 이용가능한 프로그램의 디스플레이를 위해서 프로그램 가이드를 스크롤할 뿐만 아니라 사용자의 DVR에 녹화된 특정의 프로그램에 대한 세그먼트화 정보를 스크롤할 수 있다. 세그먼트화 정보는 DVR에 저장된 관심있는 커머셜 또는 다른 작은 서브 파일에 액세스하는데 또한 사용될 수 있다.
대안으로, 또한 조합하여, 세그먼트화 정보는 다음의 3가지 방법 중 하나, 즉, ⅰ) MPEG-2 PES 패킷에 의해 반송되는 DSM-CC 섹션을 통해, ⅱ) MEPG-2 TS 내의 새로운 PID를 정의함으로써, 또는 ⅲ) DVB-MHP (멀티미디어 홈 플랫폼) 또는 OpenCable-OCAP(OpenCable Application Platform) 또는 ATSC-ACAP 또는 다른 적절한 시스템 등의 데이터 방송 채널을 이용함으로써 이송될 수 있다.
ATSC 및 DVB에 의해 각각 보급된 PSIP 및 SI 사양 등의 기존의 프로그램 가이드는 단순히 이벤트(방송 프로그램)의 단순한 텍스트 서술 자체만을 제공하고, 이벤트의 세그먼트가 녹화될 때 직접 액세스될 수 있도록 이벤트의 세그먼트화 정보를 기술하는 방법을 제공하지 못한다. 또한, 기존의 프로그램 가이드는 현재 방송되고 있는 프로그램과, 미래의 몇몇 제한된 시간 동안에 이용가능한 프로그램에 대한 정보만을 제공한다.
사전 재생되거나 사전 녹화된 드라마 및 교육 프로그램 등의 프로그램이 방송 전에 이용가능하면, 프로그램은 예를 들어 비디오 스트림/프로그램의 시작부로부터의 상대적인 시간 포인트를 기술하는 미디어 시각을 참조하여 방송하기 전에 인덱싱될 수 있다. 이러한 경우에, 최종의 세그먼트화 정보는 예를 들어, 사전 인덱싱된 세그먼트화 정보의 시간적 위치가 그들의 대응하는 스케줄 방송 시간으로 변형되어야 함에도 불구하고, TV 시청자의 STB로 방송될 프로그램 가이드 내에 포함될 수 있다. 대안으로, 시간적인 위치의 원래의 기술은 프로그램의 실제 시작(방송) 시각에 대하여 조정될 수 있다. 그러나, 뉴스, 실시간 사건 및 스포츠 게임 등의 프로그램을 방송 전에 이용할 수 없다면, 프로그램은 방송되고 있는 동안에 실시간으로 인덱싱되거나, 방송 후에 인덱싱될 수 있으며, 인덱스는 시청자 STB에 전송되거나 이용가능하게 된다.
프로그램 가이드의 세그먼트화 정보를 전송하는 하나의 방법은 세그먼트화 정보를 점진적으로 또는 순차적으로 전송하는 것이다. 세그먼트화 정보는 중요한 사건이 발생할 때마다, 바람직하게, 프로그램이 종료하기 전에, 증분의 세그먼트화 정보를 프로그램 가이드 내에 삽입함으로써 점진적으로 공급될 수 있다. 그러나, 방송 프로그램이 종료된 후에 세그먼트화 정보가 공급되면, 프로그램 가이드는 과 거에 방송되었던 프로그램의 세그먼트화 정보를 제공할 수 있어야 한다. 불행하게도, 프로그램 가이드는 기본적으로 개봉 박두의 방송 스케줄이기 때문에, 기존의 프로그램 가이드는 현재 방송되고 있는 프로그램에 대한 정보와, 미래의 몇몇 시간 동안에 이용가능한 정보만을 제공한다. 따라서, 본 명세서의 기술은 예를 들어, 이러한 문제점을 극복하기 위해 현재의 프로그램 가이드의 기능을 확장하는데 유용하다.
프로그램 가이드에 기본적으로 사용되는 메타데이터의 사양에 대한 표준은 MPEG-2 TS에 반송된 패킷 내에 포함된 관련 메타데이터 테이블의 전송을 위한 표준 프로토콜을 정의하는 동일 목적을 가지고 있기 때문에, 이러한 표준은 하나의 표준을 다른 표준에 적응하기 위한 기재된 등가의 기술을 당업자라면 이해할 수 있도록, DVB-SI 및 ATSC-PSIP 모두에 대한 구조와 매우 유사하다. 따라서, PSIP 및 SI를 기초로 하여 주로 기재된 본 발명은 ATSC, DVB, OpenCable, DAB(디지털 오디오 방송), DMB(디지털 멀티미디어 방송) 등이 채택한 기존 및 미래의 프로그램 가이드 관련 표준 모두에 용이하게 적용될 수 있다.
프로그램의 세그먼트화 정보를 PSIP 및 SI 등의 기존의 프로그램 가이드에 삽입하는 2개의 주요 방법이 있다.
먼저, PSIP의 경우에 세그먼트화 정보를 ETT에 삽입하는 기술과, SI의 경우에 EIT에 포함된 단문/확장형 이벤트 서술어에 삽입하는 기술이 본 명세서에 기재되어 있다. EIT 내의 ETT와 단문/확장형 이벤트 서술어는 이벤트에 대한 옵션의 텍스트 기술을 포함하며, 이벤트의 줄거리 등의 가상 채널 및 이벤트(방송 프로그 램)의 상세한 설명을 제공하는데 사용된다. 본 발명의 신규성은, 적절한 단순 분석 소프트웨어를 포함하는 DVR에서 녹화된 프로그램의 특정 세그먼트로의 고속 액세스를 제공하기 위해 텍스트 정보가 분석되어 디스플레이될 뿐만 아니라, TV 시청자에 의해 판독되어 프로그램에 대한 상세한 설명을 얻을 수 있도록, ETT 또는 단문/확장형 이벤트 서술어에 텍스트 세그먼트화 정보를 삽입하는 것이다. 예를 들어, 세그먼트화 정보는 표 2에서와 같이 BNF(Backus Naur Form) 구문으로 기술될 수 있다.
표 2. ETT 또는 단문/확장형 이벤트 기술어에 삽입된 세그먼트화 정보에 대한 BNF 구문
Figure 112006015285258-pat00002
{ * }는 반복을 의미하며, [ * ]는 10진 디지트(0-9)를 의미하며, <CHAR>는 임의의 문자 세트 내의 단일 문자를 의미하며, <LF>는 개행 문자를 나타낸다.
세그먼트 정보는 genre_category의 옵션 세트와 segment_string 세트를 포함한다. 장르 카테고리는 segment_string 세트에 열거된 세그먼트에 대한 장르의 유형을 식별하는 도 3에서와 같은 직접 채널 변경 테이블(DCCT)에 대한 카테고리 장르 코딩 할당 테이블로부터의 텍스트이다. 시청 경험이 개선될 수 있을 때 방송국 이 TV 시청자에게 채널을 변경할 것을 추천하도록, 도 3의 DCCT에 대한 카테고리 장르 코딩 할당 테이블은 TV 시청자가 그들의 STB를 테이블 내의 관심 장르 중 하나 이상에 설정하는데 원래 사용된다.
genre_categories 세트는 세그먼트 스트링의 장르 카테고리를 기술하기 위해서 논리합(ANDed)된다. 장르 카테고리는, 장르 카테고리가 segment_string 내의 개별적인 세그먼트로 정의될 때를 제외하고 현재의 ETT 내의 segment_string를 통해 정의된 모든 세그먼트에 적용된다.
세그먼트의 segment_string는 필수의 segment_start_time 필드와 옵션의 segment_duration, hierarchical_sequence_number, genre_category 세트 및 segment_message_text 세트 필드를 포함한다. segment_start_time 필드는 절대적인 시간 또는 상대적인 시간으로 세그먼트의 시작 시각을 바람직하게 기술한다. segment_start_time 필드가 절대적인 시간으로 기술되면, PSIP 내에 정의된 STT 또는 SI 내의 TDT 내에 포함된 방송 시각을 이용하는 것이 바람직하다. 상대적인 시간의 경우에, segment_start_time 필드는 PSIP와 SI 내의 EIT에 의해 기술된 대응 이벤트의 시작 시각에 대한 오프셋 시각을 바람직하게 포함한다. 옵션의 segment_duration 필드는 초당 세그먼트의 지속 시간을 나타내는 양적인 값(바람직하게, 정수)이다. 옵션의 hierarchical_sequence_number 필드는 세그먼트화 정보의 트리 구조 내에 위치한 세그먼트의 위치를 나타낸다. 옵션의 segment_message_text 필드는 세그먼트 제목 등의 세그먼트에 대한 텍스트 기술을 포함한다.
도 4a 및 도 4b는 표 2에 지정된 BNF 구문에 기초하여 생성된 세그먼트화 정보 메타데이터를 도시한다. 도 4a에서, 각 세그먼트의 segment_string 필드는 시작 시각(402), 계층적 일련 번호(404) 및 세그먼트 메시지 텍스트(406)를 제공한다. 필드(404, 406)는 표 2의 세그먼트화 정보의 사양에 따라서 옵션임을 알아야 한다. 따라서, 가장 단순한 경우에, 각 세그먼트의 시작 시각만이 주어지며, 이는 각 세그먼트의 시작부로 신속하게 점핑하는 것과 같이, 비디오 또는 다른 프로그램의 고속 브라우징에 있어서 유용할 수 있다. 도 4b에서, 메타데이터는 프래그먼트(230, 232, 234, 236, 238)에 대응하는 5개의 프래그먼트(410, 412, 414, 416, 418)로 분할되며, 이들 각각은 도 2에 그래픽으로 도시되어 있다. 도 2 및 도 4b의 프래그먼트는 그들이 프래그먼트를 이송하기 위해 대역폭을 최소화하면서 시간적으로 중첩(일치하는 세그먼트 정보가 상이한 프래그먼트에 포함되지 않음)하지 않도록 분할된다. 노드의 계층적 일련 번호를 이용하여, 세그먼트의 전체 트리 구조는 수신 DVR에서 재구성될 수 있다. 그러나, 프래그먼트는, 프래그먼트가 실시간 인덱싱의 특성으로 인해 전체 트리의 제 1 레벨에서 서브 트리로 위치하도록, 일반적으로 구성될 수 있다. 따라서, 전체 비디오 이벤트 또는 프로그램은 하나 이상의 관련 서브 세그먼트를 포함하는 서브 세그먼트(204, 206, 208, 228)의 시작 시각 및/또는 프래그먼트(230, 232, 234, 236, 238)의 시작 시각을 식별하여 점핑함으로써 중요한 이벤트에 대한 시작 시각의 랜덤 액세스를 위해서 분할될 수 있다.
도 5a는 프로그램의 ETT 내에 포함된 전형적인 상세한 설명을 나타내는 GUI 스크린샷을 도시한다. 하이라이트된 커서(504)에 의해 표시된 프로그램의 세그먼트화 정보를 갖지 않은 상세한 설명(예를 들어, 프로그램 줄거리)이 종래의 DVR 또는 STB의 윈도우(502)에 도시되어 있다. 도 5b는 ETT에 삽입된 본 명세서에 기재된 세그먼트화 정보 또는 표 2를 기초로 하여 생성된 단문/확장형 이벤트 서술어를 적절한 분석 소프트웨어를 갖지 않는 종래의 STB의 디스플레이 상에서 찾을 수 있는 방법에 대한 예시적인 GUI 스크린샷을 도시한다. 하이라이트된 커서(504)로 나타낸 프로그램에 대한 윈도우(502)에 도시된 세그먼트화 정보는 세그먼트화 정보를 해석할 수 없는 종래의 DVR 또는 STB에 이벤트의 몇몇 상세한 설명을 사실상 제공한다는 것을 알 수 있다. 따라서, 종래의 DVR 또는 STB(표 2의 포맷의 세그먼트화 정보를 조정할 수 있는 적절한 분석 소프트웨어가 없이)가 녹화된 프로그램의 랜덤 또는 특정 부분으로의 고속 액세스 권한을 사용자에게 제공할 수 없음에도 불구하고, 종래의 DVR 또는 STB는 차례 정보 (TOC, Table of Contents) 또는 섹션의 시작부로 점프할 수 있는 유사한 기능을 이용하여, 사용자에게 TOC 또는 등가의 정보를 여전히 제공할 수 있다. 따라서, 본 명세서에 기재된 기술은 종래의 STB 및 DVR과 역으로 호환가능하며, 세그먼트화 정보를 분석하는 소프트웨어가 종래의 DVR에 내장되면, 사용자는 TOC 등을 통해서와 같이, 각 세그먼트로 고속 액세스하여 녹화 프로그램을 또한 브라우징할 수 있다.
대안으로, 프로그램 또는 콘텐츠에 대한 세그먼트화 정보를 현재의 PSIP 및 SI에 삽입하는 다른 기술은 PSIP 및 SI 등에 정의된 EIT에 포함된 새로운 기술어("이벤트 세그먼트 기술어(ESD, Event Segment Descriptor)"라 함)를 정의함으로써 제공된다. ESD가 이하에 상세히 설명될 것이다. 표 2에 기술된 것과 동일한 이름을 가진 ESD 내의 필드가 동일한 방식으로 정의된다는 것을 알아야 한다. 예시적인 ESD는 상술한 바와 같이, 특히 표 3을 참조하여, 특정의 바람직한 변수를 이용하여 이하에 기재될 것이다.
ESD는 프로그램 또는 이벤트의 세그먼트화 정보를 기술하는데 사용된다. ESD는 헤더와, 헤더가 descriptor_tag 필드로부터 max_level_of_hierarchy 필드 다음의 reserved_future_use 필드까지의 세그먼트화 정보에 대한 일반적인 정보를 포함하는 데이터 부분을 바람직하게 포함하며, 데이터 부분은 세그먼트화 정보를 상세히 기술하는 기술어의 나머지 부분에 대응한다.
표 3에 도시된 예시적인 ESD는 예시적인 바람직한 필드를 갖는다. descriptor_tag 필드는 ESD로서 기술어를 식별하기 위해 8 비트의 부호가 없는 정수이며, PSIP 또는 SI에서 현재 정의된 기술어에 대해서 예약되지 않은 값으로 각각 정의되어야 한다. descriptor_length 필드는 이러한 필드 바로 다음 내지 이벤트 세그먼트 기술어의 종료까지의 필드에 대한 길이(바이트 단위)를 나타내는 8 비트 정수이다. num_segments 필드는 현재 이벤트 세그먼트 기술어 내에 포함된 세그먼트의 총 개수를 나타내는 8 비트의 부호가 없는 정수이다. genre_category_count는 genre_category 필드에 의해 정의된 장르 카테고리의 총 개수를 나타내는 2 비트의 부호가 없는 정수이다.
genre_category에 대한 값은 도 3에 도시된 바와 같이, PSIP의 DCCT에 이용된 카테고리 장르 코드 할당으로부터 이용될 수 있다. 장르 카테고리는 장르 카테 고리를 기술하도록 논리합될 수 있다. 예를 들어, 장르 카테고리 "광고"와 "자동차"는 차량 커머셜에 있어서 현재의 기술어 내의 세그먼트가 차량 커머셜에 속함을 지시하기 위해서 논리합된다. 다른 예로서, 장르 카테고리 "스포츠"와 "엔터테인먼트"는 예를 들어, 테니스 게임을 지시하기 위해서 논리합된다. 장르 유형을 지정함으로써, DVR 사용자는 그들이 관심있는 장르의 유형을 지정함으로써 관심있는 세그먼트를 용이하게 선택할 수 있다. 다음과 같이, 이벤트 세그먼트 기술어 내의 genre_category에 대한 필드를 정의하는 3가지 방식(다른 방식이 당업자라면 알 수 있는 바와 같이 고려될 수 있음)이 있다.
1. 장르 카테고리에 대한 필드가 기술어의 헤드에만 정의될 때, 지정된다면, genre_category 세트는 현재의 기술어 내의 모든 세그먼트 세트에 적용된다.
2. genre_category의 필드가 기술의 데이터 부분에만 정의될 때, 지정된다면, genre_category 세트는 현재의 이벤트 세그먼트 기술어 내의 대응하는 세그먼트에 적용된다.
3. genre_category의 필드가 기술어의 헤더와 데이터 부분 모두에 정의될 때, 헤더에 지정된다면, genre_category 세트는 현재의 기술어 내의 모든 세그먼트 세트에 적용된다. 다른 genre_category 세트가 기술어의 데이터 부분 내의 세그먼트에 대해서 지정되면, 헤더에 지정된 카테고리 세트를 뒤엎고, 대응하는 세그먼트에 적용된다. (대안으로, 제 1 세트가 추후 세트를 뒤엎거나, 제어기 또는 마스터 세트가 앞선 세트를 뒤엎는데 사용될 수 있다.
장르 카테고리는 장르 카테고리가 개별적인 세그먼트로 정의되는 경우를 제 외하고 현재의 기술어 내의 모든 세그먼트에 적용된다. 이러한 경우는, 주요 장르 카테고리가 프로그램의 장르 유형을 지정할 수 있도록, 또한 이들 사이의 개별적인 세그먼트로 정의된 장르 카테고리가 광고의 장르 유형을 지정할 수 있도록, 예를 들어, 광고에 속하는 세그먼트가 단일 프로그램 내(시작과 종료부 사이)에서 발생할 때 발생한다.
segment_duration_flag는 현재의 기술어 내의 세그먼트 정보가 현재 기술어 내의 개별적인 세그먼트에 대한 지속 시간 정보를 포함하는지를 표시하는 플래그이다. 예를 들어, 현재의 세그먼트 기술어가 지속 시간 정보를 포함할 때, segment_duration_flag는 "1"로 설정되고, 그렇지 않으면 "0"으로 설정된다. segment_duration_flag가 "0"으로 설정될 때, 세그먼트의 지속 시간 정보가 존재하지 않을지라도, 사용자가 관심있는 세그먼트에 도달할 수 있게 하기 위해서, 현재의 기술어 내의 세그먼트에 대한 시작 시각의 색인을 여전히 제공한다.
frame_accurate_flag는 현재의 기술어 내의 세그먼트 정보가 프레임의 정확한 세그먼트 정보를 제공하는지 여부를 나타내는 플래그이다. 예를 들어, frame_accurate_flag가 "1"로 설정될 때, 현재의 이벤트 세그먼트 기술어는 프레임의 정확한 정보를 제공한다는 것을 표시하며, 그렇지 않으면 "0"으로 설정된다. frame_accurate_flag가 "1"로 설정되는 경우에, event_segment_descriptor는 ATSC 스트림이 초당 60 프레임까지의 프레임율을 갖는다고 고려하여, 일반적으로 60Hz의 해상도로 추가의 시각 정보를 제공한다.
command_mode 필드는 수신 클라이언트의 현재 기술어에 포함된 세그먼트에 대해서 어는 커맨드가 수행되는 지를 식별하는 플래그이다. 예를 들어, 커맨드 모드 필드가 "1"로 설정되면, 수신 클라이언트에 현재의 기술어 내의 세그먼트 정보가 추가/변가되어야 함을 표시하며, "0"로 설정되면, DVR에 저장된 세그먼트 정보를 제거한다. 커맨드 모드 필드를 조정하는 과정이 이하에 상세히 설명될 것이다.
max_level_of_hierarchy 필드는 현재의 이벤트 세그먼트 기술어에 기재된 세그먼트에 대응하는 노드의 최대 레벨을 지정하는 3 비트 필드이다. 이 필드는 세그먼트를 계층적으로 기술하는데 사용될 수 있는 옵션의 필드이다.
표 3. EIT 테이블에 삽입된 이벤트 세그먼트 기술어(ESD)에 대한 비트 스트림 구문
Figure 112006015285258-pat00003
표 3의 바깥쪽 루프는 현재의 ESD 내에 포함된 세그먼트 각각을 기술한다. 따라서, 각각의 주어진 세그먼트에 대한 정보는 다음 필드에 기재된다. 옵션의 내부 루프는 레벨의 오름 순서에 따라서, 프로그램에 대한 세그먼트의 전체 계층적 구조에서의 루트로부터 임의의 주어진 세그먼트까지의 경로를 따라 배치된 세그먼트의 모든 일련 번호의 리스트가 주어진다.
8 비트 정수의 sequence_number 필드는 표 2의 sequence_number 필드와 동일한 방식으로 바람직하게 정의된 일련 번호가 주어진다. 따라서, 주어진 세그먼트의 계층적 일련 번호는 레벨의 올림 순서에 따라서 "."(점)을 가진 루트로부터 주어진 세그먼트까지의 경로를 따르는 모든 일련 번호의 모두(또는 서브세트)를 연결함으로써 얻을 수 있다. 예를 들어, d를 max_level_of_hierarchy 필드에 의해 주어진 값으로 하고, n을 세그먼트의 레벨이라 한다. d 일련 번호는 표 3의 내부 루프에 주어진 세그먼트에 대해서 항상 지정되어야 하기 때문에, 세그먼트는 d=n이면 레벨의 올림 순서로 n개의 일련 번호를 가질 수 있다. 세그먼트의 레벨이 계층의 최대 레벨보다 적으면(n<d), n개의 일련 번호만이 올림 순서의 레벨의 값을 가질 수 있으며, 그렇지 않으면, d-n개의 일련 번호의 나머지가 "0x00" 값을 가진다.
seqment_start_time 필드는 1980년 1월 6일 00:00:00 협정 세계시 이후 GPS 초의 개수로서 이러한 세그먼트의 시작 시각을 나타내는 32 비트의 부호가 없는 정수값을 포함한다(옵션으로, segment_start_time 필드는 DVB-SI(ETSI EN 300 468)의 부록 C에 정의된 바와 같이, UTC와 MJD의 40 비트 필드로서 정의됨).
segment_duration_base는 초 단위의 세그먼트의 지속 시간을 정의하는 16 비트 필드의 부호가 없는 정수를 포함한다.
relative_segment_start_time는 바람직하게 적어도 또는 대략 60 Hz의 해상도로 segment_start_time 필드에 정의된 값과 동일한 시스템 시각을 가진 STT의 최종 바이트를 수반한 TS 패킷의 1차 도착 시각의 상대적인 시각을 포함한다. relative_segment_start_time은 프레임의 정확한 액세스를 위한 segment_start_ time으로부터의 상대적인 시각이 주어진다.
segment_duration_extension는 바람직하게 적어도 또는 대략 60 Hz의 해상도로 세그먼트의 지속 시간을 주기 위해서 segment_duration_base에 정의된 값에 대한 확장을 포함한다.
segment_message_length 필드는 바로 다음의 segment_message_text()의 길이를 지정하는 8 비트의 부호가 없는 정수를 포함한다.
마지막으로, segment_message_text()는 PSIP 내의 복수의 스트링 구조와 SI 내의 단일의 스트링 구조 등의 임의의 스트링의 포맷으로 세그먼트를 설명하기 위한 것이다.
상술한 ESD의 비트 스트림 구문은 기술어로 세그먼트가 기술되는 방법의 예이며, 미디어 로컬리제이션에서 이미 설명한 바와 같이, 특정의 위치 또는 프레임을 로컬리제이션하는 다른 방법이 사용될 수 있음을 알아야 한다. 예를 들어, 표 3의 ESD에 대한 비트 스트림 구문은, 특정 위치 또는 프레임을 나타내거나 로컬리제이션하기 위해서, 각각 segment_start_time 필드와 relative_segment_start_time 필드를 통해 STT의 system_time를 타임 마커 및 타임 마커에 대한 상대적 시각으로서 이용한다. segment_start_time 필드와 relative_segment_start_time 필드의 값은 예를 들어, 표현을 위해서 segment_start_time 필드의 절대값이 1초보다 적도록 조정될 수 있다. 대안으로, 디스플레이되는 특정 위치 또는 프레임에 대한 로컬리제이션 정보는 STT 내의 system_time(또는 TDT 또는 등가 내의 UTC_time)를 타임 마커와 타임 마커에 대한 상대적인 바이트 오프셋으로서 이용함으로써 얻을 수 있 다. 이러한 경우에, relative_segment_start_time 필드는 segment_start_time 필드에 정의된 값을 포함하는 STT의 최종 바이트를 수반하는 제 1 패킷으로부터의 상대적인 바이트 오프셋을 나타내는 필드로서 재정의될 수 있다. 또한, 디스플레이되는 특정 위치 또는 프레임에 대한 로컬리제이션 정보는 기술되는 위치 또는 프레임에 대한 STT 및 PTS의 system_time를 이용함으로써 달성될 수 있다. 이러한 경우에, relative_segment_start_time 필드는 PCR 값을 대응하는 세그먼트의 시작 시각으로 나타내는 필드로 재정의될 수 있다.
도 6a 및 도 6b는 표 3에 지정된 비트 스트림 구문에 기초하여 생성된 세그먼트화 정보 메타데이터의 예시적인 개략적 버전을 도시한다. 도 6a는 프로그램이 이미 시청(및 사전 인덱싱)되었다면, 일반적으로 대응하는 비디오 프로그램이 방송되기 전 또는 이후에, 또는 방송 도중에, 전체 메타데이터가 한번에 모두 전송되는 경우를 도시한다. 도 6a에서, 필드(606)는 segment_start_time를 나타내고, 필드(607)는 segment_duration_base를 나타내며, 필드(608)는 개별적인 세그먼트에 속하는 segment_message_text를 나타낸다. 도 6a에서, 참조 번호(601)는 현재 기술어(602)에서의 세그먼트의 총 개수인 값 "7"을 가진 num_segments 필드의 값을 나타낸다. 참조 번호(603)는 command_mode 필드를 나타낸다. 예를 들어, command_mode(603)는 command_mode 필드가 추가/변경을 위해서 '1'로 설정될 때 'A'로 표현되며, command_mode 필드가 삭제를 위해서 '0'으로 설정될 때 'D'로 표현된다. 이러한 예에서, command_mode(603)는 'A'이기 때문에, 현재의 기술어(602) 내의 세그먼트가 수신 DVR에 추가/변경되어야 함을 나타낸다. 필드(604)와 필드(605)는 genre_category를 나타낸다. 필드(604)는 기술어의 헤더에 지정된 genre_category를 나타내며, 필드(605)는 개별적인 세그먼트의 데이터 부분에 지정된 genre_category를 나타낸다.
헤더(604)에 지정된 장르 카테고리는 장르 카테고리가 개별적인 세그먼트에 정의되는 경우를 제외하고 현재 기술어의 모든 세그먼트에 적용된다. 따라서, 현재 기술어(602)의 모든 세그먼트는, "Ford Ranger 4×4"의 제목을 가진 세그먼트에 있어서 genre_category가 도 3의 genre_category 값 0×28에 대응하는 "ADVERTISEMENT"로 지정되는 경우를 제외하고, 도 3의 genre_category 값 0×20에 대응하는 카테고리 "EDUCATION"에 속한다. 예를 들어, 주요 장르 카테고리가 프로그램의 장르 유형을 지정하고, 이들 사이의 개별적인 세그먼트에 정의된 장르 카테고리가 광고의 장르 유형을 지정하는 단일 프로그램 내에서 광고에 속하는 세그먼트가 발생하는 경우에 이러한 경우가 발생한다. 추가로, 하나 이상의 카테고리는 특정의 세그먼트에 사용될 수 있다.
도 6b는 프래그먼트 단위로 점진적으로 전송될 수 있는 5개의 프래그먼트에 메타데이터가 합성되는 다른 경우를 도시한다. 일반적으로, 이러한 상황은 비디오 프로그램이 방송 도중에 실시간으로 인덱싱되는 경우 또는 인덱스의 갱신 부분이 DVR에 전송되는 경우에 발생한다. 각 프래그먼트는 바람직하게 이벤트 세그먼트 기술어(609, 610, 611, 612, 613)를 통해 여러회 반복되어 전송된다. 예를 들어, 프래그먼트는 num_segments 필드(614)가 '2'의 값을 가지고, command_mode 필드가 'A'의 값을 가지며 genre_category 필드(6160가 "EDUCATION"의 값을 가질 때 기술 어(609)에 전송된다.
도 6c 및 도 6d는 세그먼트에 대한 command_mode 동작의 예를 도시한다.
도 6c는 과거에 전송되었던 세그먼트 정보에 대해서 수정이 행해지는 방법을 도시한다. 이미 전송되어 DVR에 저장된 세그먼트 정보를 수정하기 위해서, 세그먼트에 대한 텍스트의 올바른 수정된 시작 시각 및/또는 지속 시간을 포함하는 기술어는 커맨드 모드 "추가"와 함께 전송된다. 커맨드 모드 "추가"와 함께 전송된 세그먼트 정보의 세그먼트가 이미 전송되어 DVR에 저장된 세그먼트 정보로부터의 다른 세그먼트와 시간적으로 겹치면, 나중에 전송된 세그먼트 정보에 포함된 세그먼트로 대체된다. 예를 들어, 과거에 기술어(617)를 통해 전송된 세그먼트 정보를 수정하기 위해서, 기술어(618)는 세그먼트(621)의 지속 시간을 변경하고 추가 세그먼트(620)를 DVR에 추가하기 위해서 전송된다. 기술어(618) 내의 세그먼트(619)가 이미 전송되어 DVR에 저장된 세그먼트(621)와 시간적으로 겹치기 때문에, 세그먼트(621)는 삭제되고 619로 대체된다. 또한, DVR에 저장된 세그먼트와 겹치지 않기 때문에, 기술어(618) 내의 세그먼트(620)는 DVR에 추가된다. 라인(622)은 블록(624, 626, 628, 630, 632, 634, 636, 638, 640)이 세그먼트를 나타내는 프로그램의 타임 라인이다(블록은 블록의 좌측이 세그먼트의 시작 시각에 위치되고 블록의 우측은 세그먼트의 종료 시각에 위치되도록 타임 라인(622)에 매핑됨). 타원체(642, 644, 646, 648, 650)는 그룹화되어 하나의 프래그먼트를 형성하는 하나 이상의 세그먼트 세트를 나타내며, 화살표는 각 세그먼트의 시작 시각을 나타내는 다른 표현이다. 예를 들어, 프래그먼트(642)는 세그먼트(624, 646)를 그룹화하여 형성 되며, 프래그먼트(648)는 세그먼트(636, 638)를 그룹화하여 형성된다.
도 6d는 이전에 전송된 세그먼트로부터 세그먼트를 삭제하는 프로세스의 유사한 예를 도시한다. 상술한 세그먼트의 수정 프로세스와 유사하게, 커맨드 모드"삭제" 하에서 전송된 세그먼트와 겹치는 이전에 전송된 세그먼트 정보로부터의 세그먼트는 DVR로부터 삭제된다. 예를 들어, 도 6d는 기술어(622)를 통해 전송되어 DVR에 저장된 세그먼트(623)를 삭제하는 프로세스를 도시하고 있다. 기술어(624)는 624 내의 세그먼트 정보 중 세그먼트(625)와 겹치는 세그먼트는 DVR로부터 삭제되어야 함을 의미하는 커맨드 모드 "D"와 함께 전송된다. 따라서, DVR에 저장된 세그먼트(623)는, 기술어(624) 내의 세그먼트(625)와 시간적으로 겹치기 때문에, 삭제된다.
오버래핑 기술이 삭제 및 추가/변경될 세그먼트 정보를 식별하는데 사용됨에도 불구하고, 계층적 일련 번호는 계층적 일련 번호가 사용될 때 추가 또는 삭제를 위해서 세그먼트를 식별하는데 또한 사용될 수 있다. 이러한 경우에, 동일한 계층적 일련 번호를 가진 세그먼트 정보는 상술한 과정과 유사한 세그먼트 정보의 식별에 이용된다.
3. 세그먼트화 정보의 전송 시간
세그먼트화 정보를 PSIP 또는 SI에 삽입하거나 다양한 대안을 이용하는 상술한 예시적인 기술이 주어지면, 세그먼트화 정보는 다양한 방식으로 사용자의 STB로 전송될 수 있다. 메타데이터는 이벤트(사전 녹화된 영화 등)의 방송 전에 전송되며, 방송될 때 프로그램과 연관된다. 또한, 메타데이터의 방송 전송 전, 후, 및 도중의 여러 조합이 고려된다. 보다 많은 광범위한 메타데이터 세트가 나중에 제공될 수 있으며, 물론, 사전 녹화된 이벤트가 프로그램이 방송되기 전, 도중, 또는 이후에 전송된 대략 또는 광범위한 메타데이터를 가질 수 있다. 추후에 전송된 메타데이터 세트는 원하는 경우에, 이미 전송된 메타데이터, 추후에 전송된 메타데이터를 추가하거나, 주석을 달거나, 대체할 수 있다.
먼저, SI와 PSIP 둘 다는 ETT 내에 포함된 정보 또는 EIT 내의 단문/확장형 이벤트 기술어를 변경할 수 있기 때문에, 세그먼트화 정보가 프로그램 가이드를 통해 프래그먼트 단위로 점진적으로 또는 순차적으로 전송될 수 있도록, 프로그램에 대한 세그먼트화 정보가 실시간으로 인덱싱된다고 가정한다. 이러한 경우에, 세그먼트화 정보는 ETT 또는 EIT 내의 단문/확장형 이벤트 기술어 내에 삽입되고, 세그먼트 또는 세그먼트 그룹에 대한 세그먼트화 정보는, 중요한 세그먼트가 임의의 또는 바람직한 시간 간격으로 주기적으로 발생할 때마다 현재 세그먼트에 대해서 ETT 또는 EIT 내의 단문/확장형 이벤트 기술어에 증분의 세그먼트 정보를 삽입함으로써 프로그램 가이드에 삽입된다. 세그먼트화 정보가 EIT의 이벤트 세그먼트 기술어에 삽입되는 경우에, PSIP의 경우에는 EIT-0 내에 또한, SI의 경우에는 현재/후속의 EIT 내에 포함된 대응하는 현재의 세그먼트의 이벤트 세그먼트 기술어에 삽입될 수 있으며, 이는 프로그램 가이드의 생성을 위해서 현재의 이벤트와 연관된 데이터를 포함한다. 이러한 경우에, PSIP 또는 SI를 통해서 점진적으로 전송된 프로그램의 세그먼트화 정보를 유지하기 위해서, STB는 정보를 이용하는 로컬 저장부에 증분의 세그먼트화 정보를 저장 또는 축적해야 한다.
세그먼트화 정보를 점진적으로 전송하는 장점은, 다음 증분을 위한 세그먼트화 정보가 이용가능하기 전에 소량의 세그먼트화 정보만이 전송될 필요가 있기 때문에 보다 적은 대역폭을 차지한다는 점이다. 또한, 프로그램이 녹화되고 있는 동안에 튜너는 특정 주파수/채널로 튜닝되도록 유지하기 때문에, 각각의 프로그램에 대하여 프로그램 가이드에 점진적으로 삽입된 세그먼트화 정보는 녹화 도중에 이용가능하다. 예를 들어, 도 7에 도시된 바와 같이, 300 바이트 크기에 대응하는 세그먼트화 정보의 일부만이 예를 들어, 다음 증분의 세그먼트화 정보가 전송될 때까지 1:30 am 내지 1:41의 TS 스트림에 다중화된다. 200 바이트 크기에 대응하는 다음 증분의 세그먼트화 정보가 1:41에 인덱서에 의해 생성된다고 가정하면, TS 스트림에 단독으로 다중화되어 전송된다. 따라서, 전체 세그먼트화 정보를 전송하기 위해 차지한 대역폭은 1:30 a.m.으로부터 1:41 a.m.까지의 300 바이트와, 1:41 a.m.으로부터 1:49 a.m.까지의 200 바이트와, 1:49 a.m.으로부터 1:56 a.m.까지의 100 바이트이다. 따라서, 완전한 세그먼트화 정보가 한번에 전송되었다면 대략 600 바이트를 취할 수 있는, 전체 세그먼트화 정보를 전송하기 위해 차지한 최대 순시 대역폭은 300 바이트이다.
두 번째로, 세그먼트화 정보 또는 프로그램에 대한 일부 또는 갱신된 부분은 각각의 방송 프로그램이 종료된 이후의 시간에 전송될 수 있다. 이 경우에, 바람직하게 프로그램 가이드를 통해서 전송된 세그먼트화 정보는 과거에 전송되었던 프로그램에 대한 정보를 포함할 수 있어야 한다. 즉, EPG는 현재 및 미래의 프로그램에 대한 정보를 제공할 수 있을 뿐만 아니라, 이미 방송되었던 프로그램에 대한 정보 역시 제공할 수 있어야 한다. 그러나, 현재의 EPG 사양은 미래에 소정의 시간 동안 이용가능한 이벤트 및 현재 시청하고 있는 이벤트에 관한 정보만을 포함하고 강조한다. 따라서, 각각의 방송 프로그램이 종료된 후에 세그먼트화 정보를 전송할 때 발생할 수 있는 문제점은 PSIP 및 SI에 있어서 상세히 설명될 것이며, 이러한 문제점을 극복하는 바람직한 예시적인 방법이 주어진다. 다른 방법은 당업자에게는 자명하다.
PSIP에 관련하여, 각각의 방송 프로그램이 종료된 후에 세그먼트화 정보가 전송될 때 문제점이 발생할 수 있다. PSIP는 각각의 EIT가 3 시간 동안의 이벤트 정보를 제공하는 최대 128개의 EIT(EIT-0 내지 EIT-127)를 지원한다. EIT 테이블에 있어서의 시작 시각은 부득히 EIT-0이 현재의 3 시간 간격을 커버하는 경우에, 다음의 UTC 시간, 0:00(자정), 3:00, 6:00, 9:00, 12:00(정오), 15:00, 18:00 및 21:00 중 하나여야 한다. EIT-0은 프로그래밍의 현재 3 시간을 항상 나타내며, EIT-1은 다음 3시간을 나타내고, 나머지도 동일하다. 방송국이 UTC 시각 2:00에 시작하고 UTC 시각 2:55에 종료하는 이벤트를 반송하고자 결정하는 경우를 고려한다. 세그먼트화 정보는 3:00까지 공급될 수 없다면, 대응하는 프로그램의 EIT가 이용가능하지 않기 때문에, 세그먼트화 정보는 삽입될 수 없다. 여기서, EIT-0은 3:00으로부터의 이벤트만을 기술한다. 따라서, 이러한 문제점을 극복하는 2가지 방법이 기재된다.
먼저, 프로그램에 대한 세그먼트화 정보가 EIT 테이블 내의 ESD를 통해 전송된다고 하면, EIT-(i)가 현재 3 시간 간격 전의 3i 시간으로부터의 과거 3 시간 간 격을 커버하도록 EIT를 정의함으로써 문제점이 극복될 수 있다. 지정된 테이블이 TS 내에 위치될 수 있도록, 마스터 가이드 테이블(MGT)은 테이블 유형(table_type 필드를 통해)과 패킷 식별자(PID) 값을 지정한다. 예를 들어, MGT 내의 table_type 필드는 EIT-0 내지 EIT-127까지의 EIT 테이블을 지정하기 위해서 0x0100 내지 0x17F까지의 값을 이용한다. 그러나, EIT-(-i)(EIT-(-1), EIT-(-2),...)의 추가 EIT 테이블을 정의하기 위해서, table_type 필드의 고유값은 각 i개의 추가 EIT를 지정하는데 필요하다. EIT-(-i)를 할당하기 위해 PSIP 내의 table_type 필드에 이용가능한 값이 사설 또는 미래의 ATSC 이용(0x0006-0x00FF, 0x0180-0x017F, 0x0280-0x0300, 0x0400-0x0FFF, 0x0400-0x13FF, 0x1500-0xFFFF)에 대해서 예약된 범위에서만 이용가능하기 때문에, 새로운 EIT-(-i) 테이블 각각을 정의하기 위해서 새로운 값이 그 범위에서 선택될 필요가 있다. 또한, table_type 필드의 값은 세그먼트화 정보가 동일한 방식으로 EIT를 통해 전송되어야 하는 경우에 지정될 필요가 있다. MGT 내의 table_type 필드는 0x0200 내지 0x27F까지의 값을 이용하여 ETT-O 내지 ETT-127까지의 ETT 테이블을 지정하고, table_type 필드의 고유값은 사설 또는 미래의 ATSC 이용(0x0006-0x00FF, 0x0180-0x017F, 0x0280-0x0300, 0x0400-0x0FFF, 0x0400-0x13FF, 0x1500-0xFFFF)에 대해서 예약된 범위에서 각 i개의 추가 ETT에 대해서 지정된다. 따라서, 현재의 UTC 시각이 3:05이면, EIT-(-1)은 UTC 시각 12:00 내지 UTC 시각 3:00까지의 3시간 간격을 커버하고, EIT-0은 UTC 시각 3:00 내지 UTC 시각 6:00까지의 3시간 간격을 커버하며, 나머지는 동일하다.
따라서, 세그먼트화 정보는 현재 시각으로부터의 프로그램의 과거 3i 시간 동안 EIT 또는 ETT를 통해 전송될 수 있다. 그러나, 실제로, 실시간 인덱싱 툴에 의해 세그먼트화 정보가 종료된 후 3시간 내에 제공될 수 있기 때문에, 최소로 주가 정의 한다면 적어도 현재의 3 시간 간격 전의 과거 3시간 간격을 커버하는 EIT-(-1)은 정의할 필요가 있다. 따라서, 16 비트의 부호가 없는 정수는 0x00FF 내지 0x017F까지 EIT-(-1) 내지 EIT-(-127)를 통해 테이블 유형 개수의 선형성을 형성하는 Ox00FF로 EIT-(-1)의 유형을 지정할 수 있다. 유사하게, 앞선(과거 3시간 이상) 간격을 커버할 수 있으며, 이는 본 발명의 범위 내에 있는 것으로 간주된다.
각각의 방송 프로그램이 종료된 후에 세그먼트화 정보가 전송될 때 발생하는이러한 문제점을 극복하는 다른 방법은, 대응하는 이벤트를 커버하는 EIT가 이미 존재하지 않으면(과거, 지남), 현재의 3시간 간격의 EIT-0에 종료된 이벤트의 세그먼트화 정보를 삽입하는 것이다. 예를 들어, 현재의 UTC 시각이 3:05이고, 2:00부터 2;55 UTC 시각까지 경과된 이벤트에 대한 세그먼트화 정보를 전송하고자 하면, 이벤트는 3:00부터 6:00 UTC 시각까지의 이벤트를 커버하는 EIT-0에 강제적으로 삽입된다. 이러한 방법이 EIT-0이 현재의 3시간 간격에서 발생하는 이벤트에 대한 정보만을 포함한다는 점에서 PSIP와 충분히 호환가능하지 않지만, 제안된 특징을 지원할 수 없는 STB가 이러한 이벤트를 폐기하고, PSIP에 지정된 EIT-0에 의해 커버될 수 있는 이벤트만을 처리하고 이용할 수 있을 것으로 예상된다.
SI에 있어서, EIT 스케줄 정보는 실제 TS에 대한 16개의 EIT 서브 테이블 및 다른 TS에 대한 다른 16개의 EIT 서브 테이블로 구성된다. 각각의 서브 테이블은 4,096 바이트의 최대 크기를 가진 256개의 데이터 섹션을 가질 수 있으며, 이는 8 섹션의 32개의 세그먼트로 각각 분할된다. EIT 서브 테이블의 용어 "세그먼트"는 이벤트 세그먼트 기술어 내의 세그먼트화 정보의 "세그먼트"와 혼동되지 않아야 한다. EIT 스케줄 정보의 EIT 서브 테이블은 실제 TSDP 대한 table_id 0x50(다른 TS에 대한 0x60)의 세그먼트 #0이 "오늘"의 자정(UTC 시각)과 02:59:59(UTC 시각) 사이에서 시작하는 이벤트에 대한 정보를 포함하며, 세그먼트 #1은 03:00:00와 05:59:59 UTC 시각 사이에서 시작하는 이벤트를 포함하며, 나머지도 동일하다. 따라서, 제 1 서브 테이블(다른 TS에 대한 table_id 0x50 또는 0x60)은 UTC 시각 오늘 자정에 시작하는 처음 4일의 스케줄에 대한 정보를 포함한다. 따라서, 현재의 3 시간 간격에 대한 정보만을 포함하는 PSIP 내의 EIT-0에 비해 현재의 간격은 자정과 02:59:59 사이의 기간 내에 있지 않는 한, 제 1 서브 테이블은 현재의 3 시간 간격과 또한 과거 3시간 간격의 정보를 포함한다. 따라서, SI 내의 제 1 EIT 서브 테이블이 현재의 3시간 간격의 정보와 "오늘" 자정부터 현재의 3시간 간격까지의 이벤트에 대한 정보를 포함한다. 그러나, 방송국이 UTC 시각 23:00에서 시작하여 어제 UTC 시각 23:55에 종료하는 이벤트를 반송하기로 결정하는 경우를 고려한다. 오늘 00:00 UTC 시각에 세그먼트화 정보가 공급될 수 없다면, 제 1 서브 테이블(실제 TS에 대한 table_id 0x50 또는 다른 TS에 대한 0x60)이 자정 UTC 시각에 시작하는 이벤트의 정보를 포함하기 때문에, 대응하는 프로그램에 대한 EIT의 제 1 서브 테이블이 이용불가능하기 때문에, 세그먼트화 정보는 삽입될 수 없다. 따라서, 이러한 문제점을 극복하기 위한 2가지 방법이 기재되고 제공된다.
먼저, EIT 내의 이벤트 세그먼트 기술어를 통해 프로그램에 대한 세그먼트화 정보가 바람직하게 전송된다고 하면, 실제 TS에 대한 table_id 0x50의 세그먼트 #(-i)가 오늘 자정(UTC 시각 00:00) 전의 3i 시간부터의 3시간 간격을 커버하도록 SI 내의 EIT 서브 테이블을 정의함으로써 이러한 문제점을 극복할 수 있다. 따라서, 세그먼트 #(-1)는 어제의 UTC 시각 21:00부터 UTC 시각 23:59까지의 3시간 간격을 커버하며, 세그먼트 #(-2)는 UTC 시각 18:00부터 UTC 시각 20:59까지의 3시간 간격을 커버하며, 나머지도 동일하다. 따라서, 세그먼트화 정보는 현재의 3시간 간격으로부터 프로그램의 과거 3i 시간동안 EIT를 통해 전송될 수 있다. 그러나, 실제로, 세그먼트 #(-1)만이 정의되는데 필요하며, 이는 실시간 인덱싱에 의해 종료된 후의 3시간 내에 세그먼트화 정보가 제공될 수 있기 때문에, 오늘 자정 전의 과거 3시간 간격을 커버한다(그러나, 방송이 종료된 3시간 이상동안 갱신에 대한 세그먼트화 정보를 전송할 수 있는 장점이 여전히 있다).
문제점을 극복하는 다른 방법은, 대응하는 이벤트를 커버하는 EIT 서브 테이블은 이미 존재하면, 세그먼트 #0에 종료된 이벤트의 세그먼트화 정보를 삽입하는 것이다. 예를 들어, 현재의 UTC 시각이 01:15이고, 어제의 23:00부터 23:55 UTC 시각까지의 경과된 이벤트에 대한 세그먼트화 정보를 전송하고자 하면, 자정부터 03:00 UTC 시각까지의 이벤트를 커버하는 세그먼트 #0에 이벤트를 강제적으로 삽입한다. 이러한 방법은 제 1 테이블의 세그먼트 #0가 오늘 자정부터의 현재의 3시간 간격에서 차지하는 이벤트에 대한 정보만을 포함해야 한다는 점에서 SI와 충분히 호환되지 않지만, 제안된 특징을 지원할 수 없는 STB가 이러한 이벤트를 폐기하고, SI 내에 지정된 제 1 EIT 서브 테이블의 세그먼트 #0에 의해 커버될 수 있는 이벤트만을 처리하고 이용할 수 있는 것으로 기대된다.
PSIP와 SI에 있어서 각각의 방송 프로그램이 종료된 후에 전체 세그먼트화 정보를 전송할 때 발생할 수 있는 상술한 문제점과 함께, 사용자가 녹화후에 채널을 변경하면 추가의 튜너가 필요할 수 있다. PSIP는 TS 내의 디지털 채널 및 다른 TS 내의 디지털 채널 모두가 옵션임을 PSIP 테이블이 강제적으로 기술하고 있음을 명시한다. 따라서, DVB는 실제 TS의 디지털 채널에 대한 DVB 테이블과 다른 TS의 디지털 채널의 테이블만을 강제적으로 포함함을 명시한다. 따라서, 사용자가 세그먼트화 정보가 도착하기 전에 녹화된 TS와는 다른 TS로 변경하는 이벤트에서는, 대응하는 TS로부터 세그먼트화 정보가 도착할 때까지 녹화된 트랜스포트로 튜닝되도록 유지될 필요가 있으며, 제 2 튜너(또는 제 3, 또는 다른 추가)가 관심 있는 다른 TS로 튜닝하는데 이용된다. DVR 내의 다수의 튜너와 다수의 튜너를 제어하는 것은 공지되어 있으며, 따라서, 추가로 상세히 설명되지 않을 것이다.
4. DVR의 그래픽 유저 인터페이스
상술한 STB에 대한 세그먼트화 정보 데이터 포맷과 전송 방법하에서의 세그먼트화 정보의 성공적인 수신으로, 수신된 세그먼트화 정보에 기초하여 브라우징하기 위해 쌍방향 그래픽 유저 인터페이스(GUI)를 생성하는 예시적인 2가지 방법이 하드웨어(H/W) 또는 소프트웨어(S/W) 또는 펌웨어(F/W) 또는 그 조합에 의해 생성될 수 있는 비디오 파일의 특정 위치로부터의 섬네일 이미지를 이용하여 상세히 기재되어 있다.
도 8은 STB에 있어서 녹화된 프로그램에 대한 세그먼트화 정보를 나타내는 예시적인 프로그램의 표현(온 스크린 디스플레이(OSD)의 스크린 샷)이다. 경계 박스(802)는 STB에서 녹화된 프로그램의 제목을 나타내며, 804는 대응하는 프로그램의 세그먼트의 텍스트 기술을 나타낸다. 사용자는 하이라이트된 커서(806)를 상하로 이동하여 재생을 위한 세그먼트의 디스플레이된 텍스트 기술에 기초하여 관심 있는 세그먼트를 선택할 수 있으며, 대응하는 대표적인 섬네일 이미지(812)가 경계 박스(814)에 의해 하이라이트될 수 있다. 진행 바(908)는 녹화된 프로그램의 총 길이를 나타내도록 디스플레이되며, 바(908)의 최상부 및/또는 위 및/또는 아래의 다른 소형 바(810)는 녹화된 비디오의 총 길이 중에서 세그먼트의 일부(하이라이트된 커서(806)에 의해 현재 표시된)가 차지하는 대략 길이를 나타낸다. 바(908)에 대한 바(810)의 상대적인 위치는 전체 프로그램에서의 세그먼트의 위치를 나타낸다. 하이라이트 경계 박스(814)와 바(810)는 바람직하게 하이라이트 커서(806)의 이동에 상대적으로 이동할 수 있으며, 이들 모두는 동기화된다. 옵션으로, 다른 가시적인 식별자 중 하나(섬네일(812), 소형 바(810))는 다른 가시적인 식별자 및/또는 텍스트의 적절한 표시(806으로 하이라이트된 814 등)로 액세스 또는 선택될 수 있다.
비디오 세그먼트에 기초하여 섬네일을 생성하는 기술은 본원과 동일 출원인으로서 공동 계류중인 상술한 미국 특허 출원 제 10/361,794 호(2003년 2월 10일, US2004/0126021로 공개)와 미국 특허 출원 제 10/365,576 호(2003년 2월 12일 출원, 2004/0128317로 공개)에 기재되어 있다.
상술한 예시적인 GUI가 각 세그먼트의 텍스트 기술을 나타내고 있지만, 대표적인 섬네일 이미지는 각 세그먼트의 텍스트 기술로 또는 없이 녹화 프로그램에 대한 스토리보드를 생성하기 위해 세그먼트의 전송된 시간적 위치에 기초하여 각 세그먼트에 대하여 생성될 수 있다. 추가로, 섬네일(812 등)은 정적인 단일 이미지 프레임으로서 도시되어 있지만, 상술한 미국 특허 출원 제 10/365,576 호(2003년 2월 12일 출원, 2004/0128317로 공개)에 기재된 바와 같이 애니메이션되거나 짧은 비디오 클립일 수 있다.
도 9는 세그먼트화 정보에 기초하여 STB 내의 녹화된 프로그램에 대한 스토리보드를 나타내는 예시적인 프로그램 가이드의 표현(OSD의 스크린 샷)이다. 박스(902)는 STB에 녹화된 프로그램의 제목을 나타낸다. 사용자는 하이라이트된 경계 박스(904)를 상하, 좌우로 이동시켜, 재생을 위한 디스플레이된 섬네일 이미지에 기초하여 관심 있는 세그먼트를 선택할 수 있다. 바(908)는 902로 표시된 녹화된 프로그램의 총 길이를 나타내도록 디스플레이되며, 바(908)의 최상부 및/또는 위 및/또는 아래의 다른 소형 바(906)는 녹화된 비디오의 총 길이 중에서 세그먼트의 일부(하이라이트된 경계 박스(904)로 현재 표시된)가 차지하는 대략 길이를 나타낸다. 도 9의 GUI는 각 세그먼트의 텍스트 기술을 필요로 하지 않기 때문에, 세그먼트의 시간적인 위치는 세그먼트화 정보에 의해 주어질 필요가 있으며, 결과적으로, 세그먼트화 정보를 전송하기 위해 차지한 대역폭의 양을 절약할 수 있다. 비교할만한 스토리보드를 제공하는 기술이 상술한 미국 특허 출원 제 10/365,576 호(2003년 2월 12일 출원, 2004/0128317로 공개)에 기재되어 있다.
옵션 이미지, 애니메이션 또는 비디오(816)(도 8에서), 910(도 9에서)는 이미지 또는 비디오가 이미지, 애니메이션 또는 비디오를 방송 스트림으로 다중화하여 전송될 수 있는 경우에 배너로서 브라우저 인터페이스에 추가될 수 있으며, 또는 방송 스트림 내에 포함된 방송중인 커머셜로부터 얻게 되는 이미지, 애니메이션 또는 비디오일 수 있다. 대안으로, 배너에 있어서의 이미지, 애니메이션 또는 비디오를 예를 들어, TV 프로그램과 함께 녹화된 광고로부터 얻게 된다.
도 8 및 도 9에서와 같이, 세그먼트화 정보를 브라우징하는 개별적인 스크린 없이, 세그먼트가 용이하게 액세스되도록 이벤트(프로그램)에 대한 세그먼트화 정보를 사용자에게 제공하는 다른 방법은, 비디오가 백워드 또는 포워드의 시간적인 순서로 세그먼트의 시작 위치로부터 랜덤하게 액세스되고 플레이될 수 있도록, 원격 제어 장치에서의 세그먼트 스킵 동작을 위한 전용 키를 제공하는 방법이 있다. 전용 세그먼트 스킵 백워드 키를 눌려서 이전 세그먼트의 시작 위치로부터의 이전 세그먼트의 재생을 초기화할 수 있다. 예를 들어, 전용 세그먼트 스킵 포워드 키를 누르면, 전송된 세그먼트화 정보에 기초하여 다음 세그먼트의 시작 위치로부터의 다음 세그먼트의 재생을 초기화할 수 있다.
5. DVR에서의 세그먼트화 정보의 프로세싱
PSIP 및/또는 SI 메타데이터 또는 다른 사양을 따르는 DTV 신호의 프로그램의 세그먼트화 정보를 전송하여 디스플레이하는 상술한 방법이 주어지면, TV 시청자의 STB에 수신된 메타 데이터가 사용하기 위해 처리되는 방법이 상세히 설명될 것이다.
도 10은 메타데이터가 EPG를 통해 전송될 때 세그먼트화 정보 메타데이터가 DVR에서 처리되는 예시적인 방법을 나타내는 흐름도이다. ETT 또는 EIT 내의 단문/확장형 기술어를 통해 세그먼트화 정보를 전송하는 방법 둘 다를 고려하면, 메타데이터가 수신될 때(단계 1000), EPG 엔진은 먼저 TT 또는 EIT에 대해서 정의된 version_number 필드의 변화에 기초하여 프로그램에 대한 EPG 데이터(EIT 또는 ETT의 데이터)가 갱신되는지 여부를 체크한다(단계 1010). 데이터에 대한 갱신된 데이터가 검출되면, EPG 엔진은 대응하는 프로그램이 녹화되고 있는지 여부를 찾기 위해서 녹화된 리스트를 체크한다(단계 1020). 프로그램에 대한 갱신된 EPG 데이터가 검출되지 않으면, 프로그램은 루프 백된다. 대응하는 프로그램이 녹화되고 있을 때(긍정의 결과, 단계 1020), EPG 엔진은 새로운 또는 증분의 세그먼트화 정보가 존재하는지 여부를 체크한다(단계 1030). 그렇다면(긍정의 결과, 단계 1030), 표 3에서와 같이, 커맨드 모드에 기초한 다양한 동작에 대한 세그먼트 정보를 체크하고, 그 정보를 추출하여(단계 1040), DVR에 저장한다(단계 1050). 도시된 바와 같이, 부정적인 결과에 기초하여 모든 단계는 루프 백된다.
6. 인포머셜의 프로세싱 및 프레젠테이션
TV 산업의 변화가 EPG에 기초한 방송 TV 프로그램의 용이한 스케줄 녹화를 사용자에게 제공하는 DVR의 보급으로 인하여 막 시작하려하고 있다. 전형적인 TV 사용자는 종래의 TV 시청 방식에 더 이상 만족하지 않으며, 예를 들어, DVD 장면 선택과 유사한 방식으로, TV를 시청하는 새로운 방식을 요구할 것이다.
TV 시청자가 DVR에 녹화된 상업적인 TV 광고를 스킵할 수 있는 광고 스킵 (Ad-skipping) 기술은 방송 업계의 사업 모델을 위협하고 있다. TiVo 또는 SONICblue's ReplayTV 등의 DVR를 이용하여, DVR 사용자의 대부분은 프라임타임 동안에 방영되는 TV 광고를 고속 포워딩하며 스킵하는 것으로 알려져 있다. 또한, 최신 모델의 DVR은 원격 제어기(리모콘) 상의 30초 스킵 포워드 버튼 등의 지능 기능과, 광고를 보다 용이하게 스킵하는 자동 광고 스킵 기능을 종종 포함하기도 한다.
오리건주 컨설팅 업체인 Bandon에 따르면, 평균적으로 DVR 사용자의 거의 30%가 광고를 고속 포워딩하며, 케이블 사용자의 65.3%가 광고를 스킵한다. 패스트푸드, 신용 카드 및 개봉 박두의 네트워크 프로모션에 있어서, 그 숫자는 예상외로 높으며, DVR 소유자의 93% 이상은 이러한 분류의 광고를 피하기 위해 고속 포워딩한다. 반면에, 맥주 광고의 경우 시청자의 단지 32.7%가 이 광고를 고속 포워딩하는 것으로 조사되었다. 또한, 소비자에게 직접 호소하는 처방약 광고와 영화 예고편의 경우, 시청자들의 46.9%와 47.3%가 각각 이들 광고를 스킵하는 것으로 조사되었다 (2002년 7월 3일, Christopher Saunders의 "PVR Users Skip 71% of Ads" 문헌으로부터)(www. clickz.com/news/print.php/1380621를 참조). 따라서 커머셜 스킵 기능을 피할 수 없는 경우에, DVR 사용자에게 광고를 제공하는 새로운 발상이 필요하다.
그러나, TV 시청자와 방송사업자 모두를 만족시킬 수 있는, 광고 수입으로 유지되는 TV 산업에 있어서 아직 희망이 남아있다. 사용자가 그들이 원하는 것을 연속적으로 "고속 시청(speed viewing)"하기 위해 리모콘의 버튼을 눌러 광고를 스 킵하여도, 사용자는 관련 프로그래밍과 광고에 대한 필요성을 여전히 느낄 것이다. 예를 들어, DVR 사용자는 새로운 프로그램 티저(teaser), 공익 광고, 특정 기간에 행해지는 파격 세일, 콘텐츠에 직접 관련된 광고 등과 같은 정보와 광고, 즉 인포머셜(infomercial)이 포함된 DVR에 녹화된 TV 프로그램에서 이들 인포머셜만을 분류된 세그먼트/클립으로 편하게 보고자 할 것이다.
이렇게 하기 위해서는, DVR 하드 드라이브 내의 광고 및 프로그래밍 콘텐츠의 녹화를 용이하게 하고, 저장된 프로그램에 대한 세그먼트화 정보를 제공하고, 다른 프로그램 및 TV 네비게이팅 시스템에서 이러한 저장된 콘텐츠를 쉽게 접근할 수 있는 새로운 TV 방식이 개발될 필요가 있다.
TV-Anytime 또는 MPEG-7 등의 다른 표준에 기초하여 구현될 수도 있지만, ATSC-PSIP의 event_segment_descriptor()에 기초한 예시적인 방법이 기재되어 있으며, 이 방법으로 사용자는 녹화된 스트림으로부터 커머셜, 광고 등을 포함하는 관심 있는 인포머셜을 검색, 선택 및/또는 시청할 수 있다. 사람들은 그들이 관심없는 광고를 스킵하는 경향이 있지만, 사람들은 여전히 그들의 관심 범위 내에서는 광고를 시청하고자 한다. 그들의 타깃, 주제 및 목적(상술한 바와 같이)에 따라서, 시청 광고의 퍼센트 차이만큼 볼 수 있다.
DVR 사용자가 그들의 DVR에 저장된 다른 광고와는 구별되는 그들의 관심 있는 인포머셜을 보는 것을 돕기 위해서, event_segment_descriptor의 세그먼트 정보는 인포머셜 세그먼트의 식별로서 사용되는 표 3 등의 genre_category 필드의 카테고리 장르 코드 "0x28"(광고) 또는 "0x53"(정보)와 함께 전송된다. 상세한 카테고 리화에 있어서, 인포머셜 세그먼트는 표 3에서와 같이 DCCT의 카테고리 장르 코드 할당 테이블에 지정된 최대 2개의 다른 코드를 더 가질 수 있다. 따라서, 장르 코드를 통해서, 특정 기간에 행해지는 파격 세일, 콘텐츠에 연관된 광고(예를 들어, 휴가/자동차), 회사 및 제품명(예를 들어, 도요타), 광고 지속 시간(예를 들어, 30초 이하 또는 1분 이상의 모든 광고) 및 새로운 프로그램 티저 등의 인포머셜을 용이하게 네비게이팅하기 위해서 카테고리 및 의도 정보(category and intention information)가 제공될 수 있다. 그러나, 광고를 네비게이팅하기 위해서는, 특히, 일반적인 프로그램을 분류하기 위해 다양한 장르 유형을 제공하는 것에 주로 초점을 두고 있는 카테고리 장르 코드 할당을 그대로 광고에 적용하는 경우에는, 사용자에게는 가장 관심 있는 광고 카테고리 특히, "프로모션", "캠페인", "세일", "새로운 프로그램 티저", "새로운 영화 개봉", "화장품", "전자 제품", "가정용", "인터넷" 및 "통신" 등 광고의 분류를 위한 추가의 카테고리가 제공되어야 한다.
도 11은 인포머셜(커머셜, 광고 등을 포함) 가이드의 예시적인 GUI의 표현(스크린 샷)이다. 먼저, 인포머셜 가이드의 (리모콘 상의) 전용 키를 누르면, GUI(1101)는 DVR 사용자가 그들의 관심 있는 인포머셜을 선택할 수 있도록 디스플레이 장치(1102) 상에 디스플레이된다. GUI(1101)의 좌측 상의 윈도우(1103)는 DVR에 녹화되거나 다운로드된 인포머셜의 상위 카테고리를 전용으로 디스플레이한다. 인포머셜의 상위 카테고리는 표 3에 도시된 카테고리 장르 테이블 중 하나로부터 선택된다. 사용자는 전용 입력 장치를 이용하여 하이라이트 커서(1105)를 이동시켜 관심 있는 상위 카테고리를 선택할 수 있다. GUI(1101)의 우측 상의 윈도 우(1104)는 1103에 도시된 보다 상세한 카테고리를 전용으로 디스플레이한다. 따라서, 입력 장치의 전용 키를 통해서, 사용자가 윈도우(103)로부터 상위 카테고리를 선택하면, 1103으로부터의 선택된 genre_category와 함께 인포머셜 세그먼트의 추가적인 상세한 genre_category가 윈도우(104)에 디스플레이될 수 있다. 사용자는 윈도우(1104)로부터 관심 있는 상세한 genre_category를 선택한다. 윈도우(114)로부터 genre_category를 선택하여, 인포머셜 세그먼트의 제목을 나타내는 윈도우(1204)를 가진 도 12의 예시적인 GUI(1201) 등의 새로운 GUI는 디스플레이 장치(1202) 상에 디스플레이될 수 있다. 인포머셜 세그먼트의 제목은 표 3에서와 같이, 세그먼트의 segment_message_ text() 필드를 통해 전송된 텍스트일 수 있다는 것을 알아야 한다. 인포머셜 세그먼트의 제목은 윈도우(1203)의 텍스트가 1204에서 인포머셜 세그먼트를 유추하는 카테고리 및 서브 카테고리를 나타내는 경우에 사용자가 그들의 관심 있는 인포머셜을 선택하도록 가이드한다.
도 13 및 도 14는 DVR의 인포머셜을 처리하는 전체 프로세스를 도시한다. 도 14는 인포머셜을 디스플레이하고 플레이하는 프로세스의 흐름도를 도시하며, 도 14는 인포머셜 관련 메타데이터를 분석하여 저장하는 프로세스의 흐름도를 도시한다. 도 14에서, DVR은 ATSC-PSIP 및 DVB-SI 등의 1424에서 EPG 정보를 수신하여 1422에서 인포머셜 관련 세그먼트화 메타데이터를 분석하여 저장하기 시작하며, EPG 메타데이터는 1426에서 인포머셜 관련 세그먼트화 정보를 체크한다. 예를 들어, ATSC-PSIP 또는 DVB-SI의 EIT 내의 event_segment_descriptor()를 확인하여, 세그먼트 또는 세그먼트 세트의 genre_category의 값이 "0x28"(광고) 또는 "0x53"( 정보)인지를 체크한다. 그렇다면, 1428에서, 대응하는 인포머셜 메타데이터는 EPG로부터 추출되어, PID, 메이저/마이너 채널 번호, 세그먼트 또는 전체 세그먼트의 제 1 프레임의 가시적인 특징, 녹화 시작 시각 및 인포머셜 메타데이터가 참조하는 비디오 스트림의 시작 시각 등의 추가 정보와 함께 DVR의 데이터베이스에 저장된다. 인포머셜 세그먼트를 관리함에 있어서, DVR이 일치하는 버전의 인포머셜 세그먼트의 사본을 유지할 필요가 있다. 일치하는 버전의 인포머셜 세그먼트의 사본이 이용가능하지 않으면, 프로그램 중간의 인포머셜 세그먼트가 인포머셜 세그먼트를 포함하는 프로그램의 삭제로 인해서 손실되는 경우가 발생한다. 따라서, 사용자는 포함된 프로그램이 삭제되어도 특정 제품에 관한 인포머셜 세그먼트를 유지하고 저장할 수 있다. 도 13은 인포머셜을 디스플레이하고 플레이하는 프로세스를 도시한다. 프로세스는 1320에서 인포머셜 관련 세그먼트화 정보를 분석하고 저장하기 위해 스레드(1306)를 분기하여 시작한다. 사용자가 1308에서 인포머셜의 사용자 인터페이스에 대해 요청하면, 도 11 및 도 12에 도시된 GUI 등의 그래픽 유저 인터페이스는 1310에서 디스플레이 장치 상에 디스플레이된다. 사용자의 요청이 있을 때, 1312에서, 선택된 인포머셜의 비디오 파일은 1428에 저장된 데이터베이스에 기초하여 DVR의 로컬 또는 관련 저장부에서 검색된다. DVR이 DVR의 로컬 저장부에서 대응하는 비디오 파일을 찾을 수 없다면, 1316에서 DVR이 인터넷에 접속된 경우, 1314에서 저장된 데이터베이스에서 이용 가능한 정보에 기초하여 비디오 서버로부터 대응하는 비디오 파일을 다운로드할 수 있다. 인포머셜 세그먼트에 관련된 상세한 정보는 프레젠테이션을 위해서 비디오 파일과 함께 얻을 수 있다. 1318에서, 인포머셜에 대한 프로세스의 최종 단계는 선택된 인포머셜 세그먼트를 플레이하는 것이다.
사용자는 도 11의 GUI를 통해 관심 있는 인포머셜을 선택하여 상세히 보기 위해서 인포머셜의 유형을 선택할 수 있지만, 사용자는 그 선택된 장르 유형에 속하는 모든 인포머셜이 디스플레이 장치 상에 연속적으로 플레이되도록 카테고리 장르 유형으로부터 하나 이상의 장르 유형을 선택할 수 있다. 따라서, 사용자가 자동차에 관심 있다면, 사용자는 특정 모델을 검색하지 않아도 "자동차"의 부제 상에서 이용가능한 모든 인포머셜을 찾을 수 있다. 인포머셜의 이러한 옵션의 프레젠테이션은 새로운 영화 개봉에 있어서 바람직하게 이용될 수 있다. 새로운 영화가 공표되었을 때 사용자가 새로운 영화의 제목을 알지 못하기 때문에, 사용자는 장르 카테고리 "새로운 영화 개봉"을 단순히 선택하여 새로운 영화 개봉에 속하는 모든 인포머셜을 계속해서 찾을 수 있어 추후에 보고자 하는 영화를 선택할 수 있다.
대안으로, DVR에 저장된 광고는 사용자가 DVR로 생방송/녹화 프로그램을 시청하는 동안에 플레이될 수 있다. 본 명세서에 기재된 교시에 기초하여, 생방송/녹화 프로그램의 원 광고가 DVR에 저장된 사용자 이력으로부터 장르 유형에 속하는 하나 이상의 다른 광고로 대체/삽입될 수 있도록 사용자 이력을 분석하여 얻음으로써 또한, 사용자에 의해 지정된 사용자 선호의 트랙을 유지하는 직접적인 문제가 있다.
인포머셜의 옵션 프레젠테이션에 의해, 녹화하기로 설정된 스케줄 프로그램뿐만 아니라, 전체 녹화 기간(프로그램의 외측) 전체로부터 수집된 인포머셜로부터 특정 카테고리의 광고를 시청자가 선택적으로 볼 수 있다. 환언하면, 시스템은 타깃 유형 광고를 검색하여 선택적으로 녹화할 수 있다.
상기에서 서술한 ATSC-PSIP의 event_segment_descriptor()에 기초하여 인포머셜 정보를 EPG를 통해 DVR에 제공하는 방법은 하나의 예시적인 방법에 불과하다. event_segment_descriptor()에서 제공하는 정보와 등가의 정보를 방송사업자 혹은 제3의 서비스 제공자가 시청자 DVR에 연결된 인터넷 혹은 다른 데이터 네트워크를 통해서도 제공할 수 있다.
7. 세그먼트화 정보의 스크램블링
몇몇의 경우에, 세그먼트화 정보는 (콘텐츠가 스크램블 또는 암호화되는 동일한 이유로) 값 자체를 보호하기 위해서 또한, 광고 스킵을 오용하는 것을 방지하기 위해서 스크램블링되거나 암호화되어야 한다. 환언하면, 세그먼트화 정보는 공급자에 의해서 인증되고 허가된 사람에게만 액세스되어야 한다. PSIP의 경우에 세그먼트화 정보가 스크램블링되는 예가 기재되어 있다.
PSIP 사양에는 EIT 테이블을 수반하는 TS 패킷에 대한 제한이 있다. EIT 테이블을 수반하는 TS 패킷에 대한 하나의 제한은, EIT 테이블을 수반하는 TS가 스크램블링되지 않아야 함을 나타내는 "00" 값을 TS 헤더 내의 transport_scrambling_control 필드 비트가 갖는다는 점이다. 따라서, event_segment_descriptor()를 통해 EIT 테이블 내측에 수반된 세그먼트화 정보는 현재 스크램블링되지 않을 것이다. 현 기술을 확대 또는 변경함으로써 세그먼트화 정보의 스크램블링을 가능하게 하는 다양한 접근 방법이 이하에 기재된다.
제 1 접근 방법은 EIT 테이블이 TS 패킷 레벨에서 스크램블링될 수 있도록, PSIP 사양을 변경하거나 변경된 사양을 허용하는 것이다. 따라서, EIT 테이블을 수반하는 TS 패킷은 표 4에 정의된 바와 같이 현재 허용되고 있는 값 "00"에 추가로 "10" 또는 "11"의 값을 가질 수 있다.
표 4. Transport_scrambling_control 필드 값 정의
Figure 112006015285258-pat00004
PSIP는 ETI 테이블을 스크램블링되지 않도록 현재 제한하고 있지만, ETI 스케줄 테이블이 PSI(프로그램 지정 정보)에서 식별될 수 있는 경우에, DVB-SI는 현재의 EIT 스케줄 테이블이 스크램블링될 수 있게 한다. Service_id 값 0xFFF는 스크램블링된 EIT를 식별하는데 할당되며, 이러한 서비스에 대한 프로그램 맵 섹션은 사설 스트림으로서 EIT를 기술하고, PID 값과, 옵션으로, 관련 조건 액세스(CA) 스트림을 식별하는 다른 사설 스트림을 부여하는 하나 이상의 CA_descriptors를 포함한다. 따라서, 공개된 이벤트 세그먼트화 정보를 스크램블링하고자 하는 경우에는, 스크램블링된 EIT 스케줄 테이블을 포함하는 TS 내에 이벤트 세그먼트 기술어를 삽입할 수 있다.
세그먼트화 정보를 스크램블링하는 제 2 접근 방법은 세그먼트화 정보 테이블(SIT)로 예시적으로 불리는 새로운 테이블을 정의하는 것이다. SIT 테이블은 TS 레벨로 스크램블링될 수 있는 이벤트에 있어서의 세그먼트에 대한 정보를 포함하는 독립적인 테이블이다.
SIT 섹션은 미래의 ATSC 사용을 위해서 현재 예약된 0xE6부터 OxFE까지의 테이블을 가진 사설 섹션(private section)에 수반되어야 한다. 이벤트에 대한 SIT 섹션은 MGT 내의 대응하는 엔트리의 필드 table_type_PID에 의해 지정된 PID로 홈 물리적 전송 채널(가상 채널 또는 이벤트를 수반하는 물리적 전송 채널)에 수반된다. table_type_PID 값은 0x0006-0x00FF, 0x180-0x1FF, 0x280-0x300, 0x1000-0x13FF, 0x1500-0xFFF로 미래의 ATSC 사용을 위해서 현재 예약된 값을 가져야 한다. 이러한 특정 PID는 SIT 스트림 용도로만 바람직하게 예약된다. 다음의 제한은 SIT 섹션을 수반하는 TS 패킷에 적용된다.
STT에 대한 PID는 MGT에서의 대응하는 엔트리의 필드 field_type_PID와 동일한 값을 가지며, MGT에 리스트된 table_type_PID 값의 집합 중에서 유일하다. transport_scrambling_control 비트는 표 4에 도시된 값을 가질 수 있다.
TS 패킷에 걸친 스크램블링 방법 동작이 사용되면(transport_scrambling_ control_field가 '01' 또는 '11'임), 스크램블링된 데이터와 스크램블링되지 않은 데이터 사이의 전이가 패킷 경계에서 발생하도록, 섹션의 종료로부터 패킷의 종료까지 채우는 채움 메카니즘을 이용할 필요가 있다. adaptation_field_control는 '01' 값을 가져야 한다. SIT에 대한 예시적인 비트 스트림 구문이 표 5에 도시된 바와 같다.
표 5. SIT에 대한 비트 스트림 구문
Figure 112006015285258-pat00005
table_id는 이러한 섹션을 SIT에 속하는 것으로서 식별한다. 이러한 1 비트 필드는 '1'로 설정될 수 있다. 섹션은 섹션 길이 필드를 넘어서 포괄적 섹션 구문을 따름을 나타낸다. private_indicator는 '1'로 설정될 수 있는 1 비트 필드이다.
section_length는 섹션의 종료까지의 section_length 필드를 바로 뒤따르는 섹션의 남은 바이트 수를 지정하는 12 비트 필드를 포함한다. section_length의 값은 4093보다 크지 않다(12 비트만이 section_length 필드에 대한 최대값을 4093 생성하는 section_length 필드를 지정하도록 할당된다).
SIT_table_id_extension는 테이블이 공통의 PID 값을 가진 TS 패킷을 보일 때 각 SIT 실례의 고유성을 설정하는 16 비트의 부호가 없는 정수값을 포함한다. SIT의 table_id_extension는 공통의 PID 값을 갖는 트랜스포트 스트림 패킷에 나타 나는 개별적인 SIT 실례가 고유의 SIT_table_ID_extension 값을 갖는 값으로 설정될 수 있다.
version_number는 버전수를 나타내는 5 비트 필드를 포함한다. 버전수는 SIT 내의 데이터가 변할 때 "1 modulo 32" 만큼 증분될 수 있다.
current_next_indicator는 항상 1로 설정되는 1 비트 지시자를 포함한다.
section_number는 항상 0x00일 수 있는 8 비트 값을 포함한다.
last_section_number는 항상 0x00이여야 하는 8 비트 값을 포함한다.
protocol_version는 추후에 현재의 프로토콜에서 정의된 것과는 다르게 구성될 수 있는 파라미터를 이러한 테이블 유형이 수반할 수 있게 기능하는 8 비트의 부호가 없는 정수를 포함한다. 현재, protocol_version에 대한 유효값은 0이다.
SIM_id는 이러한 SIT 정보의 32 비트 식별자를 포함한다. 이러한 식별자는 표 6에 도시된 룰에 의해 할당된다.
표 6. SIM_id
Figure 112006015285258-pat00006
descriptor_length는 다음의 세그먼트화 정보 기술어의 길이이다. 많은 기술어가 포함될 수 있지만, 현재의 SIT 테이블은 event_segment_descriptor()를 포함할 수 있다.
CRC_32는 전체 SIT 섹션을 처리한 후에 ISO-13818-1 "MPEG-2 Systems"에 정의된 디코더의 레지스터로부터의 0의 출력을 확보하는 CRC(Cyclic Redundancy Check) 값을 포함하는 32 비트 필드를 포함한다.
제 3 접근 방법은, 구조에 대한 지식을 가지고 있지 않는 사람은 세그먼트화 정보에 액세스할 수 없도록, 세그먼트화 정보를 전송하고 기술어의 구조가 세그먼트화 정보 공급자에 의해 임의로 정의되도록 하기 위해서, 기술어에 대한 기술어 태그 개수만을 정의함으로써 임의로 구성된 이벤트 세그먼트 기술어를 정의하는 것이다. 표 7은 임의로 구성된 이벤트 세그먼트 기술어의 구문을 도시한다.
표 7. 임의로 구성된 이벤트 세그먼트 기술어의 구문
Figure 112006015285258-pat00007
임의로 구성된 이벤트 세그먼트 기술어는 이러한 기술어를 이벤트 세그먼트 기술어로서 식별하는 0x88의 기술어 태그 필드 값을 갖는다. 기술어 길이는 이벤트 세그먼트 기술어의 종료를 지나 이러한 필드를 바로 뒤따르는 필드에 대한 길이(바이트 단위)이다.
SI_system_ID는 이러한 기술어에 전달된 정보에 대한 세그먼트화 정보 시스템 응용 프로그램의 유형을 식별하는데 사용된 16 비트 값을 포함한다. 이러한 기술어에 전달된 코딩 정보는 private_data_type으로 임의로 정의된다.
광고 스킵을 감소시키는 다른 접근 방법은 단기간에 STB에 결정적인 정보를 전송하여 오용될 위험성을 감소시키는 것이다. 도 15는 EIT-0이 TS에 전송되는 사 이클을 도시한다. 이러한 실시예에서, 광고의 스킵은 도 15에 도시된 바와 같이 적절한 시간에 종종 인포머셜 세그먼트화 정보만을 전송함으로써 효과적으로 감소된다. 예를 들어, 블록 1502는 ESD를 가진 EIT-0를 나타내며, 블록 1501은 인포머셜 세그먼트화 정보를 포함하는 ESD를 가진 EIT-0를 나타낸다. 인포머셜 세그먼트화 정보를 포함하는 ESD는 주기 1503 동안에 3회만 전송되기 때문에, 인포머셜 세그먼트화 정보는 다른 시기에 이용할 수 없다. 따라서, DVR은 대응하는 커머셜을 포함하는 TV 프로그램의 일부분을 로컬 또는 관련 저장부에 먼저 카피하고, 커머셜을 TV 프로그램 상에 나타내는 전송 및 저장된 세그먼트화 정보를 삭제함으로써, 전송된 정보를 전송되는 즉시 처리하도록 동작될 필요가 있다.
8. DVR에서의 자동 녹화를 통한 타깃 광고
타깃 대상(target audience)에 대해서 방송 TV 프로그램의 자동 녹화를 가능하게 하는 방법 및 시스템이 기재되어 있다. TV 홈 쇼핑 공급자는 그들의 특정 TV 홈 쇼핑 프로그램이 적절한 타깃 대상에게 전달되게 함으로써 이익을 증가시키고자 한다. 예를 들어, VIP 고객에게 전달되는 호화로운 제품의 TV 홈 쇼핑 프로그램은, 다수의 사람들이 그 제품을 구입하기에는 너무 고가여서 보통의 사람들에게 반감을 유발할 수 있기 때문에, 일반적으로 심야에 방송된다. 따라서, 잠재적인 VIP 고객이 주문을 위해서 그들의 관심 있는 광고 제품을 시청하는 것이 불편할 수 있다. 본 명세서에 기재되고 제공된 바와 같이, 종래의 프로그램 가이드 프로토콜을 통해 특정의 TV 홈 쇼핑 프로그램 혹은 다른 특정 프로그램 등을 STB의 저장장치에 자동으로 녹화하고, TV 시청자가 녹화된 프로그램을 그들이 원하는 시간에 시청할 수 있게 하는 기술이 제공된다. 이를 이용해 홈 쇼핑 채널 공급자는 수입을 증가시킬 수 있다. 또한, 본 명세서에 기재된 기술을 이용하여, 메타데이터 정보가 전화 번호 및/또는 다른 접촉 정보 및/또는 가격 정보 및/또는 제품과 관련된 다른 정보 등의 추가 정보를 포함하는 경우에, 이들 정보를 쉽게 브라우징할 수 있다.
방송중인 특정 프로그램의 자동 녹화는 예를 들어, ATSC-PSIP 및 DVB-SI 등의 EPG 프로토콜 내에 각각 내장된 데이터를 통해서 트리거된다. 프로그램의 자동 녹화를 트리거하는 데이터는 EIT에 포함되는 새로운 기술어를 바람직하게 정의함으로써 삽입된다. 이러한 기술어는 이하에 상세히 설명되는 "녹화 기술어(recording descriptor)"라고 한다.
녹화 기술어는 프로그램의 녹화를 자동으로 트리거하는데 필요한 정보를 기술하는데 사용된다. 표 8의 예시적인 녹화 기술어는 다음의 필드를 포함한다.
descriptor_tag는 녹화 기술어로서 기술어를 식별하는 8 비트의 부호가 없는 정수를 포함하며, PSIP 또는 SI 내의 현재 정의된 기술어에 대해서 예약되지 않은 값으로 정의되어야 한다.
descriptor_length 필드는 recording_descriptor의 종료후 이러한 필드를 바로 뒤따르는 필드에 대한 길이(바이트 단위)를 지시하는 8 비트 정수를 포함한다.
recording_flag 필드는 프로그램이 녹화되어야 하는지 여부를 지시하는 1 비트의 부호가 없는 정수를 포함한다.
provider_identifier는 프로그램의 자동 녹화를 트리거하기를 원하는 프로그램 공급자를 고유하게 식별하는 8 비트의 부호가 없는 정수를 포함한다. 이러한 필드는, 프로그램이 항상 자동으로 녹화될 수 있는 상태로 DVR가 무료 또는 거의 무료이지 않는 한 공지 없이, 몇몇 DVR 소유자가 그들의 DVR에 프로그램을 녹화하기를 원한다는 사실을 고려한다. 따라서, 특정 프로그램이 DVR에 녹화되기를 원하는 TV 홈 쇼핑 공급자 등의 공급자는 DVR의 소유권을 가지며, 이러한 경우에, 경쟁 공급자로부터 전송된 다른 프로그램이 DVR에 녹화되는 것을 원하지 않을 수 있다.
표 8. EIT 테이블 내에 삽입된 recording_descriptor의 비트 스트림 구문
Figure 112006015285258-pat00008
주어진 녹화 기술어에 대해, TV 시청자의 STB에 수신된 이 데이터가 프로그램 녹화를 위해서 어떻게 처리되어야 하는 지 그 방법이 이하에 상세히 설명될 것이다. 도 16은 프로그램의 자동 녹화가 트리거되는 방법을 나타내는 흐름도이다.
먼저, 1600에서 DVR이 EPG를 수신하고, 1610에서 recording_descriptor이 존재하는지를 확인한다. 그렇다면(긍정적인 결과, 단계 1610), 단계 1620에서, 대응하는 프로그램이 자동으로 녹화되었는지를 식별하기 위해서 녹화 기술어 내의 recording_flag를 확인한다. 두 번째로, 자동 녹화를 위해서 recording_flag가 설정되어도, 단계1630에서 provider_identifier 필드에 주어진 공급자가 프로그램의 자동 녹화를 허용하지 않으면 DVR의 응용 프로그램에 의해서 녹화가 거절된다. provider_identifier 필드에 제공된 공급자가 프로그램의 자동 녹화를 허용하면, 단계 1640에서 녹화가 개시된다. 대안으로, 프로그램을 녹화하는 권한을 요청하는 시청자에게 공지가 주어질 수 있으며, 이러한 녹화의 자동 공지가 바람직하다. 모든 단계는 도시된 바와 같이, 부정적인 결과에 기초하여 루프 백된다.
방송 TV 프로그램의 자동 녹화에 있어서, 사용자의 선호도를 이용할 수 있다. 예를 들어, DVR의 사용자 이력은 DVR에서와 같이 부분적으로 또는 서버에서와 같이 원격으로 분석되어 사용자의 선호도를 추정하고, 사용자 선호도는 어느 프로그램을 녹화할지를 선택하는데 사용될 수 있다. 대안으로, TV 홈 쇼핑 공급자 등이 그들 고객의 사용자 선호도를 가지고 있다면, 사용자 선호도에 관련된 정보가 자동 녹화를 위해서 네트워크를 통해서 DVR에 전송될 수 있다. 대안으로, 사용자 선호도는 사용자가 지정할 수 있다.
9. 프레임과 연관된 콘텐츠 관련 정보의 전송 및 프레젠테이션
PPL는 일반적으로 효과적인 광고 방법이다. 영화(스티븐 스필버그 감독의 "마이너리티 리포트" 등)에서, 자동차, 향수, 시계, 음료수 및 신용 카드 등의 여러 PPL 광고가 있다. PPL은 출판된 "오프라 윈프리 쇼" 및 "섹스 앤드 더 시티" 등의 TV 쇼에서 또한 큰 사업이다. TV 시청자는 매매, 배포자, 소매인 등에 대한 보다 많은 정보를 알고자 한다. TV 시청자가 TV 프로그램을 시청하는 동안에, 그들은 종종 상품을 구매하고자 한다. 그러나, 대부분의 시청자는 방송의 제한된 특성으로 인해 상품에 대한 정보가 부족하다.
TV 시청자가 TV 또는 AV 프로그램을 시청할 때 TV 시청자가 프레임 또는 프레임 세트(AV 세그먼트)와 연관된 콘텐츠(예를 들어, 목적, 아이템, 개념 등)에 대 한 정보를 검색할 수 있는 것이 바람직하다. 예를 들어, 시청자는 시청하는 도중에 영화의 장면에 나오는 배우의 이름 또는 스포츠 게임에 있어서의 선수의 이름을 알고 싶어할 수 있다. 한편으로, TV 서비스 또는 콘텐츠 공급자는 프레임의 콘텐츠 또는 현재 시청하는 시각(예, 저녁 식사 시간)에 관련된 광고를 제공하고자 한다.
이용가능한 녹화된 AV 프로그램/스트림 또는 생방송 TV의 특정 프레임/시각을 나타내고 로컬리제이션/지시하는 단순한 방법이 있다면, 시청자는 프레임에 나타난 제품, 배우, 선수 등에 대한 콘텐츠 관련 정보를 검색하여 프레임과 관련된 아이템을 구매할 수 있다. 환언하면, 시청자 또는 정보 공급자에 의해 선택된 타깃 프레임의 콘텐츠에 관련된 정보(또는 시청 시각)는, 시청자에 의해 지시된 타깃 프레임을 정확하게 로컬리제이션하는 방법에 관한 정보가 정보 공급자에게 전송되면 백 채널(back channel)을 통해서 (제 3 자) 정보 또는 메타데이터 서비스 공급자에 의해 STB 또는 DVR에 전송될 수 있다. 설명을 위해서, 용어 "백 채널"은 인터넷, 인트라넷, 공중 교환식 전화망(PSTN), 디지털 가입자 회선(DSL), 통합형 서비스 디지털 네트워크(ISDN), 케이블 모뎀 등의 유선/무선 데이터 네트워크를 지칭한다. 타깃 AV 프레임(또는 AV 세그먼트)과 관련된 콘텐츠 관련 정보 또는 시청 시간에 따른 정보를 전송하여 제공하는 방법 및 장치가 본 명세서에 기재된다. 본 명세서에서, 타깃 프레임을 식별하거나 로컬리제이션하는 방법에 대한 정보는 "콘텐츠 로케이터"라고 하며, 이는 일반적으로 시청자가 프레임 관련 정보(frame-associated information) 서버에게 요청한다. 프레임 관련 정보는 타깃 프레임에 관련된 정보(타깃 프레임 이전 또는 이후의 단시간)에 타깃 프레임을 연결하는 콘텐츠 로케이터를 이용하여 검색된다. 타깃 프레임의 콘텐츠 로케이터는 예를 들어, 다음 중 하나 또는 그 조합을 통해서 타깃 프레임을 식별하거나 가리킬 수 있는 정보를 이용함으로써 정의되거나 표현될 수 있다.
1. "섹션 1 미디어 로컬리제이션"에 기재된 미디어 로케이터로부터 얻은 타깃 프레임의 방송 시각
2. 인터넷을 통해 얻은 타깃 프레임의 방송 시각(NTP, UTC 시각, GPS 시각). 타깃 프레임의 인터넷 시각은 콘텐츠 로케이터에서 사용될 수 있다. 샘플의 인터넷 시각은 콘텐츠 로케이터의 AV 프로그램의 각 프레임과 연관될 수 있다.
3. 타깃 프레임의 미디어 시각
4. 타깃 프레임의 비트스트림. 타깃 프레임의 압축 비디오 또는 오디오 스트림의 일부가 콘텐츠 로케이터에 사용될 수 있다.
5. AV 특징 벡터(컬러, 히스토그램, 비주얼 리듬 등) 또는 기술어를 포함하는 타깃 프레임과 관련된 메타데이터
6. 타깃 프레임의 채널 번호
7. 타깃 프레임의 프로그램 제목
8. 멀티미디어 북마크. 멀티미디어 북마크와 연관된 시각 포인터 또는 미디어 로케이터(예를 들어, 상술한 STT 내의 system_time 필드 등)와 함께 섬네일 이미지 등의 콘텐츠 특징이 콘텐츠 로케이터에 사용될 수 있다.
도 17a 내지 도 17d는 AV 프로그램이 방송 네트워크를 통해(또는, 인터넷 등 의 데이터 네트워크를 통한 스트리밍을 이용하여) STB 또는 DVR에 전송될 때, AV 프로그램의 프레임 관련 정보(frame-associated information)를 제공하는 예시적인 프레임 관련 정보 서비스 구조를 도시하는 도면이다. 현재 방송 중이거나 녹화되는 지에 따라서, 유사한 구조가 프로그램이 시청되는 시각과 관련된 정보를 제공하는데 적용될 수 있다. 예를 들어, 타깃 프레임의 미디어 시각을 이용하여, 프레임 관련 정보를 제공하는 구조가 DVD에 저장된 AV 프로그램, 블루 레이 디스크(BD), 고화질-디지털 비디오 디스크(HD-DVD) 또는 다른 저장 매체에 적용될 수 있다.
도 17a는 프레임 관련 정보가 방송국으로부터 STB로 방송되는 예시적인 서비스 구조를 도시하는 도면이다. 본 명세서에서, 동일 AV 스트림이 STB(또는 DVR)(1706)과 프레임 관련 정보 서버(1710) 모두에서 이용가능하다는 것을 알아야 한다. 서버(1701)는 AV 스트림의 프레임과 관련된 콘텐츠 관련 정보의 (실시간) 인덱서 또는 생성기를 포함하는 다양한 모듈과, 콘텐츠 관련 정보뿐만 아니라 (방송) 스트림을 녹화 또는 저장하는 저장부 또는 데이터베이스(DB)로 구성될 수 있다. 현재 프로그램의 프레임 관련 정보를 가진 프레임 관련 정보 서버(1710)는 방송 AV 스트림(1702)과 정보를 다중화하는 멀티플렉서(1712)로 정보를 전송한다. 다중화된 스트림은 방송 네트워크(1704)를 통해 STB(1706)로 전송된다. STB 클라이언트는 녹화 기능을 가지고 있지 않기 때문에, 방송국은 방송하기 전에 또는 실시간으로 생성되는 현재 방송하고 있는 또는 타깃 AV 프로그램의 프레임 관련 정보를 전송한다. 사전 생성된 프레임 관련 정보는 콘텐츠 로케이터를 이용하여 현재 프레임과 동기화되고, 실시간 인덱싱 또는 생성된 프레임 관련 정보는 실시간 자막 생성에서와 같이 잠복될 수 있다.
도 17b는 (제 3 자) 정보 서비스 공급자로부터 STB에 프레임 관련 정보를 전송하는 다른 서비스 구조를 도시하는 도면이다. 콘텐츠 로케이터를 백 채널(1708)을 통해 서비스 공급자의 프레임 관련 정보 서버(1710)에 전송함으로써, 백 채널(1708)을 통해서 서버(1710)로부터 자동으로 또는 시청자의 요청에 의해 프레임 관련 정보를 수신하며, STB(1706)는 방송 네트워크(1704)를 통해서 현재 방송 스트림(1702)을 수신한다.
도 17c는 방송국으로부터 프레임 관련 정보를 방송하는 다른 서비스 구조를 도시하는 도면이다. 방송 AV 프로그램의 프레임 관련 정보를 가진 프레임 관련 정보 서버(1710)는 정보와 방송 AV 스트림(1702)을 다중화하는 멀티플렉서(1712)에 정보를 전송한다. 녹화 기능을 가진 DVR(1706) 또는 STB는 방송 네트워크(1704)를 통해서 다중화된 스트림을 수신하고, 그 스트림을 저장부에 기록한다. DVR은 녹화 기능을 가지고 있기 때문에, 방송국은 과거 프로그램뿐만 아니라 현재 프로그램의 프레임 관련 정보를 전송할 수 있다.
도 17d는 (제 3 자) 정보 공급자로부터 프레임 관련 정보를 얻는 다른 바람직한 서비스 구조를 도시하는 도면이다. DVR(1706)은 방송 네트워크(1704)를 통해서 방송 스트림(1702)을 수신하여 로컬 저장부(1714)에 저장한다. 시청자가 생방송 또는 녹화 프로그램을 시청하는 동안에 프레임 관련 정보를 요청하면, DVR(1706)은 백 채널(1708)을 통해서 타깃 프레임의 콘텐츠 로케이터를 프레임 관련 정보 서버(1710)에 전송한다. 콘텐츠 로케이터를 이용하여, 서버(1710)는 프레 임 관련 정보의 데이터베이스를 검색하고 백 채널(1708)을 통해서 타깃 프레임과 관련된 정보를 DVR(1706)으로 반환한다. 콘텐츠 로케이터를 이용하여, 타깃 프레임은 서버(1710)에 의해 식별될 수 있다는 것을 알아야 한다. 대안으로, 서버(1710)로부터 전송된 타깃 프레임과 관련된 콘텐츠 관련 정보의 전체 또는 일부가 로컬 저장부(1714)에 저장될 수 있으며, 이용가능한 콘텐츠 관련 정보의 리스트가 시청자에게 제공될 수 있다.
도 18a 내지 도 18d는 방송 네트워크(또는 데이터 네트워크)를 통해서 전송된 AV 프로그램의 타깃 프레임에 관련된 정보를 처리하는 도 17a 내지 도 17에 상세히 설명된 예시적인 클라이언트 STB 또는 DVR를 설명하는 블록도이다.
도 18a는 방송 네트워크를 통해서 방송 스트림으로 다중화된 프레임 관련 정보를 처리하기 위한 예시적인 클라이언트 STB의 블록도이다. 방송 네트워크(1804)를 통해서, MPEG-2 TS 등과 같은 방송 스트림은 AV 스트림 및 그들의 프레임 관련 정보를 STB로 전송한다. 튜너/디멀티플렉서(1802)는 STB 사용자에 의해 선택된 채널에 대한 방송 신호를 수신하여 복조하고, 방송 스트림을 AV 스트림 및 프레임 관련 정보로 역다중화한다. AV 스트림은 AV 디코더(1806)에 의해 디코딩되어 디스플레이 장치(1818) 상에 디스플레이된다. 배우 또는 아이템(반지, 귀걸이, 옷 등)의 이름 등 현재 디스플레이되는 프레임에 관련된 프레임 관련 정보가 이용가능할 때, 처리 유닛(1812)은 1802로부터의 프레임 관련 정보를 처리하고, 디스플레이 장치(1818) 상에 아이콘 등의 지시자를 디스플레이한다. 정보 처리 유닛(1812)은 이 아이콘이 디스플레이되어야 할 때를 설정할 수 있다. 예를 들어, 현재 프레임이 특정 제품에 대한 시청자의 사전 요청 정보(예를 들어, "항상 도요타 RAV4를 검색하고 정보를 나에게 보내라") 또는 사용자의 과거 구매 습관 및 요청 유형(예를 들어, "당신은 적색 및 청색 신발을 이미 구매하였거나 혹은 항상 찾아왔기 때문에 이 제품을 보고자 할 것이다")으로부터 얻게 되는 사용자 선호도(도 18a에 도시 되지 않은 STB의 메모리에 저장됨)에 관련된 제품에 대한 정보를 갖고 있을 때, 정보 처리 유닛(1812)은 시청자에게 이 아이콘을 표시하도록 설정될 수 있다. 정보 처리 유닛(1812)은 시청자가 정보를 반복적으로 얻도록 설정될 수 있다(예를 들어, "나는 지금 구매할 준비가 되어 있지 않다. 그래서, 나의 정보 갱신을 유지하고 나에게 다시 요청해라"). 정보 처리 유닛(1812)은 현재 디스플레이된 프레임이 정보 공급자에 의해 지정된 제품을 포함할 때 아이콘을 나타내도록 또한 설정될 수 있다. AV 스트림을 시청하는 동안에 지시자가 디스플레이될 때 시청자가 현재 프레임에 대한 상세한 정보를 보고자 하면, 시청자는 유저 인터페이스(1814)를 통해서 정보 처리 유닛(1812)에 요청을 전송할 수 있으며, 정보 처리 유닛(1812)은 프레임 관련 정보를 디스플레이 장치(1818) 상에 디스플레이한다. 방송국은 실시간 생성으로 인해 지연된 프레임 관련 정보를 전송할 수 있기 때문에, 시청자는 현재 프레임을 선택할 수 있으며, 정보 처리 유닛(1812)은 지연된 프레임 관련 정보가 전송되기를 대기하고, 프레임 관련 정보를 디스플레이 장치(1818) 상에 디스플레이한다.
도 18b는 백 채널을 통해서 프레임 관련 정보 서비스 공급자로부터의 프레임 관련 정보를 처리하는 다른 STB의 블록도이다. AV 스트림은 방송 네트워크(1804)로부터 전송된다. 튜너/디멀티플렉서(1802)는 STB 사용자에 의해 선택된 채널의 방송 신호를 수신하고 복조하여, 그 방송 스트림을 AV 스트림으로 역다중화한다. AV 스트림이 AV 디코더(1806)에 의해 디코딩되어 디스플레이 장치(1818) 상에 디스플레이된다. 정보 처리 유닛(1812)은 채널 번호와 시스템 타임 마커 또는 비디오 북마크의 조합 등의 상술한 현재 디스플레이된 타깃 프레임의 콘텐츠 로케이터를 네트워크 인터페이스(1810) 및 백 채널(1808)을 통해서 프레임 관련 정보 서버(1820)에 전송한다. 프레임 관련 정보 서버(1820)는 데이터베이스를 검색하여 타깃 프레임과 관련된 프레임 관련 정보를 정보 처리 유닛(1812)으로 전송한다. 정보 처리 유닛(1812)은, 현재 프레임과 관련된 정보가 이용가능할 때, 디스플레이 장치(1818) 상에 지시자를 디스플레이한다. 정보 처리 유닛(1812)은 지시자가 디스플레이될 때의 구성으로 여러 방식으로 설정될 수 있다. 시청자가 AV 스트림을 시청하는 동안에 현재 프레임의 상세한 설명을 보고자 하면, 시청자는 유저 인터페이스(1816)를 통해서 정보 처리 유닛(1812)에 자신의 요청을 전송하고, 정보 처리 유닛(1812)은 그 요청을 디스플레이 장치(1818) 상에 디스플레이한다. 정보 공급자는 프레임 관련 정보의 실시간 생성으로 인해 지연된 정보를 전송할 수 있기 때문에, 시청자는 현재 프레임을 선택하고, 정보 처리 유닛(1812)은 나중에 제공된 정보를 대기하거나 프레임 관련 정보 서버를 검색하여 그 정보를 디스플레이 장치(1812) 상에 디스플레이한다. 이러한 검색은 한번, 주기적, 또는 종종 행해져서 갱신 정보를 얻는다.
도 18c는 방송 네트워크를 통해서 방송 스트림으로 다중화된 프레임 관련 정보를 처리하는 다른 DVR의 블록도이다. 방송 네트워크(1804)를 통해서, MPEG-2 TS 등의 방송 스트림은 AV 스트림 및 그들의 프레임 관련 정보를 DVR로 전송한다. 튜너/디멀티플렉서(1802)는 DVR 사용자에 의해 선택된 채널의 방송 신호를 수신하여 복조하고, 방송 스트림을 AV 스트림과 프레임 관련 정보로 역다중화한다. AV 스트림은 하드 디스크 등의 로컬 저장부(1816)에 저장되고, AV 디코더(1806)에 의해 디코딩되고, 디스플레이 장치(1818) 상에 디스플레이된다. 정보 처리 유닛(1812)은 1802로부터의 프레임 관련 정보를 로컬 저장부(1816)에 또한 저장한다. 생방송 프로그램의 현재 디스플레이된 프레임의 프레임 관련 정보를 시청자가 원하면, 정보 처리 유닛(1812)은 그 정보를 검색한다. 녹화된 프로그램의 현재 디스플레이된 프레임의 프레임 관련 정보를 시청자가 원하면, 시청자는 유저 인터페이스(1814)에 자신의 요청을 전송하고, 정보 처리 유닛(1812)은 저장부(1816)로부터의 프레임 관련 정보를 검색하고, 그 정보를 디스플레이 장치(1818) 상에 디스플레이한다.
도 18d는 백 채널을 통해서 프레임 관련 정보 서비스 공급자로부터의 프레임 관련 정보를 처리하는 다른 바람직한 클라이언트 DVR의 블록도이다. AV 스트림은 방송 네트워크(1804)로부터 전송된다. 튜너/디멀티플렉서(1802)는 DVR 사용자에 의해 선택된 채널의 방송 신호를 수신하여 복조하고, 그 방송 스트림을 AV 스트림 및 프레임 관련 정보로 역다중화한다. AV 스트림은 로컬 저장부(1816)에 저장되고, AV 디코더(1806)에 의해 디코딩되고, 디스플레이 장치(1818) 상에 디스플레이된다. 정보 처리 유닛(1812)은 네트워크 인터페이스(1810) 및 백 채널(1808)을 통해서 프레임 관련 정보 서버(1820)에 현재 디스플레이된 프레임의 콘텐츠 로케이터를 전송한다. 그 다음, 프레임 관련 정보 서버(1820)는 타깃 프레임과 관련된 프 레임 관련 정보를 검색하여 정보 처리 유닛(1812)으로 전송한다. 현재 프레임과 관련된 정보가 이용가능하면, 정보 처리 유닛(1812)은 디스플레이 장치(1818) 상에 지시자를 디스플레이한다. 대안으로, 서버(1820)로부터 전송된 타깃 프레임과 관련된 콘텐츠 관련 정보의 전체 또는 일부는 로컬 저장부(1816)에 저장되고 시청자에 의해 나중에 액세스될 수 있다. 정보 처리 유닛(1812)은 지시자가 디스플레이될 때의 구성으로 다양한 방식으로 설정될 수 있다. 시청자가 생방송 프로그램의 현재 디스플레이된 프레임의 프레임 관련 정보를 원하면, 정보 처리 유닛(1812)은 도 18b에 도시된 바와 같이 정보를 검색한다. 시청자가 녹화된 프로그램의 타깃 프레임의 프레임 관련 정보를 원하면, 시청자는 자신의 요청을 유저 인터페이스(1814)에 전송하고, 정보 처리 유닛(1812)은 백 채널(1808)을 통해 프레임 관련 정보 서버로부터 또는 대안으로, 저장된 정보가 이용가능하면 로컬 저장부(1816)로부터 프레임 관련 정보를 검색하고, 그 프레임 관련 정보를 디스플레이 장치(1818) 상에 디스플레이한다.
도 19a, 도 19b, 도 19c, 도 19d는 TV 시청자의 예시적인 GUI이다. 이들 GUI는 프레임 관련 정보를 원하는 TV 시청자에게 유용하다. 시청자가 시청하는 도중에 현재 디스플레이된 프레임과 관련된 정보가 이용가능할 때, 아이콘(1902)는 도 19a에 도시된 디스플레이 장치(1904) 상에 포함(embedded)되거나, 오버레이되거나, 오프 스크린(예를 들어, 레터 박스의 블랙 영역으로)에 디스플레이되거나, 또는 투명하게(예를 들어, 낮은 밝기 10%에서와 같이 항상 스크린의 세트 부분) 디스플레이될 수 있다. 도 19b는 시청자에 의해 선택된 아이템을 나타내는 예시적인 GUI이다. 시청자가 프레임 관련 정보를 검색하고자 하면, 시청자는 전용 버튼(리모콘 상의) 등의 유저 인터페이스를 이용하여 볼 수 있다. 그 다음, 도 18a 내지 도 18d의 정보 처리 유닛(1812)은 현재 프레임의 콘텐츠 로케이터를 얻고, 방송 스트림, 프레임 관련 정보 서버 또는 저장부로부터 프레임 관련 정보를 검색한다. 정보 처리 유닛은 프레임 관련 정보의 아이템 리스트를 디스플레이하거나 오버레이하거나, 비디오를 중지시키고 정보 페이지로 이동하거나, 나중에 나타낸다. 시청자가 리스트된 아이템의 상세한 설명을 보고자 하면, 시청자는 스크린(1906) 상의 선택된 아이템의 컬러/패턴을 변경하거나, 리모콘 상의 숫자 키패드를 이용하거나, 마우스 또는 터치 스크린 등의 포인팅 장치를 이용하여 원하는 아이템을 직접 클릭하여 관심 있는 아이템을 선택할 수 있다. 도 19c는 시청자의 관심 있는 아이템을 선택하기 위한 다른 예시적인 GUI이다. 시청자는 아이템(1907)을 직접 선택하고, 터치 스크린, 마우스의 다른 커서, 또는 다른 지시자 등의 포인팅 장치를 이용하여 상세한 설명을 볼 수 있다. 도 19d는 가게 이름(1908), 인터넷 주소(1910), 가격(1912) 등의 선택된 아이템(1906)의 상세한 설명을 디스플레이하는 예시적인 GUI를 도시한다. 시청자가 하이라이트된 커서(1914)를 이용하여 상세한 설명 중 하나를 선택하면, 웹 브라우저 등의 새로운 상세한 정보 페이지가 디스플레이될 수 있다. 비즈니스 모델 측면에서, 하이라이트된 커서(1914)에 의해 선택된 가게는 각 클릭에 있어서 가게에 관련된 웹 페이지에 접속하도록 되어 있다.
당업자라면 본 명세서에 기재된 기술에 대해 다양한 수정 및 변경이 행해질 수 있다는 것을 알 수 있다. 따라서, 다양한 수정 및 변경이 첨부한 청구 범위 및 그 등가의 범위 내에 있다면, 본 발명은 기술의 수정 및 변경을 커버한다.
본 발명에 따르면, 전송된 세그먼트 정보를 이용하여 DVR에 녹화될 수 있는 프로그램의 세그먼트에 효율적으로 랜덤 액세스하기 위해서, 종래의 프로그램 가이드(예를 들어, ATSC-PSIP 또는 DVB-SI EPG)와 연관된 DVR 등에 방송 또는 다른 전송된 프로그램의 세그먼트화 정보를 효율적으로 전송하는 기술(방법, 장치, 시스템)이 제공된다.

Claims (36)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 셋톱박스(Set Top Box:STB)에서 인포머셜을 제공하는 방법에 있어서,
    상기 STB에서 인포머셜 관련 메타데이터를 수신하여 저장하는 단계와,
    상기 인포머셜에 대한 사용자 요청에 응답하여, 사용자 인터페이스를 제공하는 단계와,
    상기 사용자 인터페이스를 통해 인포머셜이 선택되면, 상기 선택된 인포머셜을 로컬 저장부에서 검색하는 단계와,
    상기 인포머셜 관련 메타데이터를 이용하여 상기 선택된 인포머셜을 제공하는 단계
    를 포함하는 인포머셜 제공 방법.
  22. 제 21 항에 있어서,
    상기 인포머셜 관련 메타데이터를 수신하여 저장하는 단계는, 상기 인포머셜 관련 메타 데이터를 서비스 제공자로부터 수신하여, 상기 인포머셜 메타데이터가 참조하는 AV 프로그램의 주/부채널 번호와 저장 시작 시간을 포함하는 부가 정보와 함께 상기 STB의 데이터베이스에 저장하는 단계를 포함하는
    인포머셜 제공 방법.
  23. 제 22 항에 있어서,
    상기 인포머셜의 사본을 상기 STB의 로컬 저장부에 저장하는 단계를 더 포함하는
    인포머셜 제공 방법.
  24. 제 23 항에 있어서,
    상기 선택된 인포머셜이 상기 STB의 로컬 저장부에 저장되어 있지 않은 경우, 비디오 서버로부터 상기 선택된 인포머셜을 다운로드하여 상기 STB의 로컬 저장부에 저장하는 단계를 더 포함하는
    인포머셜 제공 방법.
  25. 제 22 항에 있어서,
    상기 STB에서 사용자가 생방송 또는 녹화된 프로그램을 시청하는 동안 상기 DVR에 저장된 상기 선택된 인포머셜을 재생하는 단계를 더 포함하는
    인포머셜 제공 방법.
  26. 제 22 항에 있어서,
    상기 STB에서 사용자 이력을 분석하여, 생방송/저장된 프로그램의 원래 광고를 상기 STB에 저장된 상기 사용자 이력으로부터 선호하는 유형에 속하는 하나 이상의 다른 광고로 대체하는 단계를 더 포함하는
    인포머셜 제공 방법.
  27. 제 21 항에 있어서,
    사용자 인터페이스를 제공하는 상기 단계는 인포머셜 가이드의 GUI를 제공하는 단계를 포함하는
    인포머셜 제공 방법.
  28. 제 27 항에 있어서,
    상기 인포머셜에 대한 사용자 요청은 입력장치의 특정 버튼을 이용하여 행해지는
    인포머셜 제공 방법.
  29. 제 27 항에 있어서,
    상기 인포머셜 가이드의 GUI를 제공하는 상기 단계는 GUI의 첫 번째 창에 인포머셜의 최상위 카테고리를 디스플레이하고, 선택된 카테고리에 대한 상세한 정보를 나타내는 하위 카테고리를 그 다음 창에 디스플레이하는 방식으로, 인포머셜의 카테고리를 상위 카테고리로부터 하위 카테고리로 순차적으로 디스플레이하는 단계를 포함하는
    인포머셜 제공 방법.
  30. 제 29 항에 있어서,
    상기 상위 및 하위 카테고리의 각각의 선택은 커서의 이동 또는 입력장치를 통해 행해지는
    인포머셜 제공 방법.
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 제 29 항에 있어서,
    상기 GUI의 최종 창에는 상기 인포머셜 세그먼트의 제목을 나타내는
    인포머셜 제공 방법.
  36. 제 21 항에 있어서,
    상기 인포머셜 관련 메타데이터는 인터넷 또는 EPG를 통해 제공되는
    인포머셜 제공 방법.
KR1020060020122A 2005-03-01 2006-03-02 인포머셜 제공 방법 KR100798551B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/069,767 2005-03-01
US11/069,767 US20050193408A1 (en) 2000-07-24 2005-03-01 Generating, transporting, processing, storing and presenting segmentation information for audio-visual programs

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020070086308A Division KR100904100B1 (ko) 2005-03-01 2007-08-27 프레임 관련 정보 제공 방법, 프레임 관련 정보 수신 방법및 프레임 관련 정보 검색 시스템

Publications (2)

Publication Number Publication Date
KR20060099413A KR20060099413A (ko) 2006-09-19
KR100798551B1 true KR100798551B1 (ko) 2008-01-28

Family

ID=37630656

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020060020122A KR100798551B1 (ko) 2005-03-01 2006-03-02 인포머셜 제공 방법
KR1020070086308A KR100904100B1 (ko) 2005-03-01 2007-08-27 프레임 관련 정보 제공 방법, 프레임 관련 정보 수신 방법및 프레임 관련 정보 검색 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020070086308A KR100904100B1 (ko) 2005-03-01 2007-08-27 프레임 관련 정보 제공 방법, 프레임 관련 정보 수신 방법및 프레임 관련 정보 검색 시스템

Country Status (1)

Country Link
KR (2) KR100798551B1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100754225B1 (ko) 2006-08-07 2007-09-03 삼성전자주식회사 디지털 방송의 인터랙티브 서비스 저장 및 재생 방법과, 그장치
KR101294383B1 (ko) * 2006-12-12 2013-08-08 엘지전자 주식회사 영상표시기기의 북마크 설정 장치 및 방법
KR101505519B1 (ko) 2007-10-16 2015-03-25 삼성전자 주식회사 컨텐츠 출력 장치 및 방법
KR101422027B1 (ko) * 2008-01-10 2014-07-23 엘지전자 주식회사 단말기 및 이것의 방송 제어 방법
KR101530382B1 (ko) * 2008-07-23 2015-06-22 엘지전자 주식회사 프로그램 자동 예약 녹화장치 및 방법
KR101496328B1 (ko) 2008-08-06 2015-02-26 삼성전자주식회사 멀티미디어 컨텐츠에 관한 연관정보의 생성 방법, 제공방법 및 그 장치
KR101500498B1 (ko) * 2008-08-13 2015-03-09 주식회사 케이티 스트리밍 동영상의 오프닝 점프 서비스 방법 및 시스템
KR101550886B1 (ko) 2009-03-27 2015-09-08 삼성전자 주식회사 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
JP5824465B2 (ja) * 2010-02-19 2015-11-25 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Httpストリーミングにおける適応のための方法と装置
KR101666919B1 (ko) * 2010-08-13 2016-10-24 엘지전자 주식회사 전자 기기 및 전자 기기의 제어 방법
US9596453B2 (en) 2010-06-14 2017-03-14 Lg Electronics Inc. Electronic device and control method thereof
KR20120021246A (ko) * 2010-08-31 2012-03-08 (주)휴맥스 Http 스트리밍을 위한 미디어 정보 파일의 전송 및 수신 방법
EP2723086B1 (en) * 2011-06-20 2020-01-15 LG Electronics Inc. Media content transceiving method and transceiving apparatus using same
US20140089803A1 (en) * 2012-09-27 2014-03-27 John C. Weast Seek techniques for content playback

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101190A (ja) 1999-07-29 2001-04-13 Jisedai Joho Hoso System Kenkyusho:Kk 受信装置および受信方法
KR20030027946A (ko) * 2001-06-06 2003-04-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 프로그램 시작 및 종료 세그먼트들을 찾기 위한 개선된epg
KR20040058458A (ko) * 2002-12-26 2004-07-05 한국전자통신연구원 방송 프로그램에 정보 제공을 위한 메타데이터 송/수신장치 및 그 방법
KR20040104481A (ko) * 2002-03-05 2004-12-10 캐논 가부시끼가이샤 동화상 관리 방법 및 장치
KR20050002681A (ko) * 2000-07-24 2005-01-10 비브콤 인코포레이티드 멀티미디어 북마크와 비디오의 가상 편집을 위한 시스템및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020074328A (ko) * 2001-03-20 2002-09-30 서치캐스트 주식회사 키프레임을 이용한 동영상 재생방법 및 그 장치
KR100625088B1 (ko) * 2001-11-15 2006-09-18 (주)아이엠비씨 동영상 객체정보제공시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101190A (ja) 1999-07-29 2001-04-13 Jisedai Joho Hoso System Kenkyusho:Kk 受信装置および受信方法
KR20050002681A (ko) * 2000-07-24 2005-01-10 비브콤 인코포레이티드 멀티미디어 북마크와 비디오의 가상 편집을 위한 시스템및 방법
KR20030027946A (ko) * 2001-06-06 2003-04-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 프로그램 시작 및 종료 세그먼트들을 찾기 위한 개선된epg
KR20040104481A (ko) * 2002-03-05 2004-12-10 캐논 가부시끼가이샤 동화상 관리 방법 및 장치
KR20040058458A (ko) * 2002-12-26 2004-07-05 한국전자통신연구원 방송 프로그램에 정보 제공을 위한 메타데이터 송/수신장치 및 그 방법

Also Published As

Publication number Publication date
KR20070101826A (ko) 2007-10-17
KR100904100B1 (ko) 2009-06-24
KR20060099413A (ko) 2006-09-19

Similar Documents

Publication Publication Date Title
KR100798551B1 (ko) 인포머셜 제공 방법
KR100899051B1 (ko) 방송 프로그램의 실제 시작 시간 제공 시스템, 방송프로그램의 실제 시작 시간 검출 방법 및 장치, 방송프로그램 녹화 방법 및 장치, 녹화 프로그램 재생 방법
US20050193425A1 (en) Delivery and presentation of content-relevant information associated with frames of audio-visual programs
US20050193408A1 (en) Generating, transporting, processing, storing and presenting segmentation information for audio-visual programs
US20050204385A1 (en) Processing and presentation of infomercials for audio-visual programs
US20050203927A1 (en) Fast metadata generation and delivery
US20050210145A1 (en) Delivering and processing multimedia bookmark
US20220076709A1 (en) Multimedia Distribution System
van Beek et al. Metadata-driven multimedia access
JP5703317B2 (ja) ローカルコンテンツを含むカスタムビデオモザイクページを生成するためのシステムおよび方法
CN102415095B (zh) 记录并且呈现由拼接的段形成的节目的数字视频录像机
US20050097599A1 (en) Alternative advertising in prerecorded media
US20040034874A1 (en) Pop-up PVR advertising
US20090320063A1 (en) Local advertisement insertion detection
US20090320060A1 (en) Advertisement signature tracking
JP2009194925A (ja) 拡張プログラムガイドを適応的に形成し処理するマルチメディアシステム
KR100711608B1 (ko) 홈단말에서 실시간 필터링된 방송 비디오 관리 시스템 및그 방법
US20160295248A1 (en) Aggregating media content
CA2615008A1 (en) Method and apparatus for providing commercials suitable for viewing when fast-forwarding through a digitally recorded program
Kang et al. Metadata broadcasting for personalized service: A practical solution
Lee et al. Personalized TV services based on TV-anytime for personal digital recorder
KR100825191B1 (ko) Av 프로그램 인덱싱 방법 및 그래픽 유저 인터페이스 장치
US20160295244A1 (en) Aggregating media content
Chadwick TV Anytime and TV Anywhere
KR100959184B1 (ko) 디지털 tv 방송 저장 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130111

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140116

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150710

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee