KR20050086692A - 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치 - Google Patents

자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치 Download PDF

Info

Publication number
KR20050086692A
KR20050086692A KR1020057008819A KR20057008819A KR20050086692A KR 20050086692 A KR20050086692 A KR 20050086692A KR 1020057008819 A KR1020057008819 A KR 1020057008819A KR 20057008819 A KR20057008819 A KR 20057008819A KR 20050086692 A KR20050086692 A KR 20050086692A
Authority
KR
South Korea
Prior art keywords
data
items
character
font
memory
Prior art date
Application number
KR1020057008819A
Other languages
English (en)
Inventor
해럴드 췰러
덕 아돌프
좁스트 호렌트럽
랄프 오스터맨
하트머트 피터스
Original Assignee
톰슨 라이센싱 에스.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 에스.에이. filed Critical 톰슨 라이센싱 에스.에이.
Publication of KR20050086692A publication Critical patent/KR20050086692A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/44504Circuit details of the additional information generator, e.g. details of the character or graphics signal generator, overlay mixing circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42653Internal components of the client ; Characteristics thereof for processing graphics

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

자막 처리는 픽셀 데이터나 문자 데이터에 기초할 수 있다. 문자 데이터는 아주 효율적인 인코딩을 가능하게 하지만, 문자 스트링들만으로는, 자막 처리가 비디오상에 오버레이될 그래픽 표현으로 전환될 수 없다. 의도적 문자 세트, 폰트 및, 예를 들어, 폰트 사이즈가 자막 처리 비트스트림내에서 명시적으로 코딩되거나 그에 관한 암시적인 가정이 있어야 한다. 픽셀-기반 자막 처리에서는, 자막 처리 프레임들을 AV 스크린상의 픽셀 값들의 (통상적으로 직사각형) 영역들로 기술하는 것에 의해, 자막 처리 데이터를 위해 상당히 증가된 대역폭의 비용을 지불하고, 자막 처리 프레임들이 그래픽 표현들의 형태로 직접 전달된다. 본 발명에 따르면, 글리프들이 한번만 전송되면 되고 그후에는 AV 이벤트 동안의 비교적 간결한 문자 참조들에 의해 참조되기 때문에, 픽셀-기반 자막 처리 레터링의 효율적인 구현을 가능하게 하는 폰트 메모리가 사용된다. 이런 식으로, 본 발명은 순수한 픽셀-기반 및 순수한 문자-기반 자막 처리 방식들의 이점들을 실질적으로 조합하면서, 그들의 개별적인 단점들을 대부분 방지한다.

Description

자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및 장치 {METHOD AND APPARATUS FOR CODING/DECODING ITEMS OF SUBTITLING DATA}
본 발명은 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및 장치에 관한 것으로서, 보다 구체적으로는, 블루레이(Blu-ray) 디스크 광학 저장 및 레코딩을 위한 자막 처리 및 그래픽에 관한 것이다.
미리 기록된 오디오-비주얼(AV;Audio-Visual) 자료에 대한 자막 처리 분야에는, 충돌하는 요구 사항들이 존재한다: 한편으로, 자막 처리 데이터는 효율적으로 인코딩되어야 하는데, 상당량의 자막 처리 서비스가 임의의 소정 AV 자료에 대해 제공되어야 하는 경우에 특히 그러하다. 이 경우에는, 적어도 평균적으로, 매 자막 처리 문자당 소수의 비트들만이 이용 가능할 수 있다.
다른 한편으로, 전문적인 콘텐츠의 소유자들은 스크린상의 자막 처리 문자들의 외관에 대해 완전한 제어를 갖고 싶어하며, 부가적으로, 간단한 페이딩(fading)으로부터 진짜 애니메이션들까지 특수 디스플레이 효과들의 풍성한 세트를 자유롭게 쓸 수 있기를 원한다. 이와 같이 높은 설계 자유도 및 코맨드는 통상적으로 높은 또는 아주 높은 자막 처리 대역폭으로만 실현될 수 있다.
미리-기록된 AV 데이터 신호들을 개개의 자막 처리 정보로 자막 처리하기 위한 현재의 최첨단 기술에는 2가지의 주된 접근 방법들이 존재한다: 자막 처리는 픽셀 데이터나 문자 데이터에 기초할 수 있다. 어느 경우에서든, 자막 처리 방식들은, 예를 들어, AV 시간 축을 따라 자막 처리 요소들의 동기화를 처리하는 일반적인 프레임워크를 구비한다.
문자-기반 자막 처리 접근 방법, 예를 들어, 유럽식의 아날로그 또는 디지털 TV에 대한 TELETEXT 시스템(ETSI: ETS 300 706 Enhanced Teletext specification, May 1997 참고)에서, 스트링들은 레터 코드들, 예를 들어, 본질적으로 아주 효율적인 인코딩을 허용하는, ASCII(ISO/IEC 8859: American Standard Code for Information Interchange - ASCII 참고) 또는 UNICODE(ISO/IEC 10646: Information technology --Universal Multiple-Octet Coded Character Set(UCS) 참고)의 시퀀스들로써 기술된다. 그러나 문자 스트링들만으로는, 자막이, 비디오상에 오버레이될 그래픽 표현으로 변환될 수 없다. 이를 위해서는, 의도적인 문자 세트, 폰트 및 소정의 폰트 파라미터들, 특히 폰트 사이즈가 자막 처리 비트스트림내에서 명시적으로 코딩되거나 적당하게 정의된 자막 처리 문맥내에서 그들에 관한 암시적인 가정이 이루어져야 한다. 또한, 이러한 접근 방법에서의 모든 자막 처리는, 사용되는 특정 폰트 또는 폰트들의 레터들 및 기호들로 표현될 수 있는 것으로 한정된다.
'기본적인 오브젝트, 문자' 또는 '복합 오브젝트, 문자 스트링'의 오브젝트 유형들을 가진 DVB 자막 처리 스펙(ETSI: ETS 300 743 Digital Video Broadcasting (DVB); Subtitling systems, Sep 1997, 및 EP-A-0 745 307: Van der Meer et al, Subtitling transmission system 참고)이 문자-기반 자막 처리에 대한 또 하나의 최신식 일례를 구성한다.
픽셀-기반 자막 처리 접근 방법에서는, 자막 처리 프레임들을 AV 스크린상의 픽셀 값들의 (통상적으로 직사각형) 영역들로 기술하는 것에 의해, 자막 처리 프레임들이 그래픽 표현들의 형태로 직접 전달된다. 비디오상에 겹쳐진 자막 처리 평면에서 무엇인가가 가시화될 때마다 그리고 가시화될 경우에는 언제나, 그것의 픽셀 값들이 인코딩되어, 적절한 동기화 정보와 함께, 자막 처리 비트스트림에 제공되어야 한다. 제3자 정의형 폰트들에 내재된 제한들을 제거하는 것은 분명하지만, 픽셀-기반 접근 방법은 적당한 자막 처리 데이터를 위해 상당히 증가된 대역폭의 패널티를 수반한다. DVD의 '서브-픽쳐(Sub-picture)' 개념(DVD Forum: DVD Specifications for Read-Only Disc / Part 3 Video Specifications / Version 1.0 August 1996 참고) 뿐만 아니라 DVB 자막 처리의 '비트맵 오브젝트' 개념(상술한 ETS 300 743 및 EP-A-0745 307 참고)에서 픽셀-기반 자막 처리 방식들의 예들을 찾아볼 수 있다.
발명의 개요
본 발명에 의해 해결되어야 할 문제는, 필요한 정보를 전달하기 위해 요구되는 데이터량을 크게 증가시키지 않으면서, 문자-기반 자막 처리의 효율적인 인코딩을 픽셀-기반 자막 처리로 실현될 수 있는 자막 처리 문자들의 외관에 대한 완전 제어와 조합하는 것이다. 이 문제는 청구항들(제1항 및 제7항)에 개시되어 있는 방법들에 의해 해결된다. 청구항 제4항에는 제1항의 방법을 이용하는 장치가 개시되어 있다.
본 발명은 픽셀-기반 자막 처리 방식에 기초한다. 이러한 자막 처리 시스템은, 폰트 지원을 다른 픽셀-기반 자막 처리 방식에 포함할 수 있게 하는 몇가지 컴포넌트들을 포함한다. 이러한 폰트 지원은,
a.1) 한 세트의 폰트 문자들을 픽셀 데이터 형태로 효율적으로 기술하기 위한 폰트 기술 데이터(Font Describing Data)용 구조;
a.2) 사용될 소정 폰트를 고유하게 식별하기 위한 폰트 식별 데이터(Font Identification Data)용 구조;
a.3) 전반적인 메모리 영역의 일부로서, 폰트 문자들을 보유하는데 전용되며 AV 출력에 직접적으로 드러나지는 않는, 폰트 메모리를 갖는다는 개념; 및
a.4) 폰트 메모리에 저장되어 있는 폰트 또는 폰트들 중에서 개개의 폰트 문자들을 효율적으로 참조하기 위한 문자 참조 데이터(Character Referencing Data)용 구조를 포함한다.
폰트 기술 데이터 뿐만 아니라 문자 참조 데이터는 AV 데이터와 함께 전송되거나 저장됨으로써 거의 분리될 수 없는 혼합 포맷을 갖거나, 완전히 별개의 전송 채널들 또는 저장 로케이션들을 사용하거나, 또는 양자의 혼합이다. 디코더 측에서, 폰트 기술 데이터는 폰트 메모리로 로딩될 한 세트의 임의적인 문자 글리프들 (glyphs; 문자의 그래픽 표현) 또는 다른 그래픽 구축 블록들을 발생시킨다. 개별적인 각각의 경우에서 사용될 문자 글리프들의 수 및 디자인은 완전히 콘텐츠 제공자의 제어하에 있다.
본 발명에 따르면, 폰트 기술 데이터는, 각각이 폰트의 하나 이상의 문자들에 대한 문자 파라미터 세트들을 구비하는 하나 이상의 문자 파라미터 부분들 및 각각이 폰트의 하나 이상의 문자들에 대한 픽셀 데이터를 구비하는 하나 이상의 문자 픽셀 데이터 부분들로 이루어진다. 문자의 픽셀 데이터는 문자 어레이, 즉, 픽셀 값들의 직사각형 어레이로 표현되는데, 어레이는 문자 특유의 폭과 높이를 가진다. 상기 문자 파라미터 세트들 각각은,
c.1) 문자 어레이의 폭;
c.2) 문자 어레이의 높이;
c.3) 픽셀 데이터를 포함하고 있는 문자 픽셀 데이터 부분에 대한 문자의 픽셀 데이터의 시작 어드레스;
c.4) 어레이의 경계들과 문자 참조 포인트간의 수평 오프셋;
c.5) 경계들과 문자 참조 포인트간의 수직 오프셋; 및
c.6) 문자와 이 문자에 선행하거나 이 문자를 뒤따르는 문자들간의 수평 거리를 기술하는 수평 증분의 임의 조합을 포함한다.
폰트 메모리의 창의적인 사용은, 글리프들이 한번만 전송되면 되고 그후에는 AV 이벤트 동안의 비교적 간결한 참조 문자들에 의해 참조되기 때문에, 픽셀-기반 자막 처리 레터링의 효율적인 구현을 제공한다.
한편, 글리프들은 픽셀-기반 형태로 효과적으로 제공되기 때문에, 자막 처리의 외관은 전체적으로 콘텐츠 제공자의 제어하에 놓이게 되고, 문자-기반 방식들에 통상적으로 수반되는, 폰트 식별, 폰트 선택, 폰트의 파라미터화, 및 문자 렌더링의 모든 문제들이 바람직하게 방지된다.
이런 식으로, 본 발명은 순수한 픽셀-기반 및 순수한 문자-기반 자막 처리 방식들의 이점들을 실질적으로 조합하면서, 그들의 개별적인 단점들을 대부분 극복한다.
기본적으로, 본 발명의 방법은 자막 처리 데이터의 항목들을 디코딩하기에 적합하고,
- 비디오 또는 오디오-비주얼 데이터 신호의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들을 검색하는 단계;
- 상기 문자 참조 데이터의 항목들로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하는 단계;
- 폰트 메모리로부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하는 단계; 및
- 상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리에 기입하는 단계를 포함한다.
기본적으로, 본 발명의 장치는 자막 처리 데이터의 항목들을 디코딩하기에 적합하고,
- 비디오 또는 오디오-비주얼 데이터 신호의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리를 사용해 참조 문자들을 가시화해야 할 상기 데이터 신호의 픽쳐들에서의 장소 및/또는 시간 및/또는 방법에 관한 정보를 기술하는, 문자 참조 데이터의 항목들을 검색하기 위한 수단; 및
- 상기 문자 참조 데이터의 항목들로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하고;
폰트 메모리로부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하며;
상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리에 기입하기 위한 수단을 포함한다.
개개의 종속 청구항들에, 본 발명의 바람직한 추가적 실시예들이 개시되어 있다.
도 1 본 발명의 데이터 구조;
도 2 본 발명의 자막 처리 시스템의 블록도; 및
도 3 'font_id'를 DVD-ST 'object_data_segment'에 매입하기 위한 예시적인 데이터 구조를 나타내는, 첨부된 도면들을 참조하여 본 발명의 실시예들을 설명한다.
실시예들
도 1에 도시되어 있는 바와 같이, 폰트 기술 데이터(102) 뿐만 아니라 문자 참조 데이터(103)는 관련 AV 데이터(101)와 함께 전송, 저장, 또는 기록됨으로써, 전송 또는 저장은 거의 분리될 수 없는 혼합과 완전 별개의 전송 채널들 또는 저장 로케이션들의 사용간의 어떤 것일 수 있다.
디코더 측에서는, 도 2에 나타낸 바와 같이, 자막 처리 스트림(201)이 데이터 분리 수단(202)을 통과하는데, 데이터 분리 수단(202)은 문자 참조 데이터(203) 및 폰트 기술 데이터(204)를 제공한다. 폰트 기술 데이터를 프로세싱 수단으로 전달함으로써, 폰트 기술 데이터(204)는 폰트 메모리(208)로 로딩될 한 세트의 임의적인 문자 글리프들 또는 다른 그래픽 구축 블록들을 발생시킨다.
바람직하게도, 각각의 개별적인 사용 상황에서 사용될 문자 글리프들의 수 및 디자인은 완전히 콘텐츠 제공자의 제어하에 있다.
선택적으로, 이와 같이 기술되어 폰트 메모리(208)로 로딩되는 폰트에 대해, 상술한 폰트 식별 데이터가 관련될 수 있다.
문자 참조 데이터(203)는 문자 참조 데이터 프로세싱 수단(206)으로 하여금 문자 기술 데이터(209)로 지시된 문자 글리프들 세트의 개별적인 서브세트들을 폰트 메모리(208)로부터, 전반적인 시스템 메모리의 일부일 수 있는, 디스플레이 메모리(207)로 카피하게 한다. 디스플레이 메모리(207)의 콘텐츠는 비디오상에 오버레이되어 가시적인 자막으로 된다.
선택적으로, 문자 참조 데이터는 폰트 식별 데이터에 대한 참조들을 포함함으로써, 자막 처리 디코더로 하여금, 특정 자막 처리 스트림을 렌더링하는데 필요한 폰트가 여전히 폰트 메모리(208)로 로딩되어야 하는지, 아니면 이미 즉시 이용 가능한 상태인지 여부를 판단하게 할 수 있다.
제안된 자막 처리 시스템의 가능한 용도들 및 동작 모드들은,
b.1) 긴 AV 프로그램 전체에 걸쳐 사용하기 위한 하나 이상 폰트의 미리-로딩;
b.2) 레터들 중 하나 이상에 대한 하나 이상의 변화를 포함하는 폰트들의 사용으로써, 하부 픽셀의 정확한 레터 배치 또는 강조 (볼드/이탤릭) 지원을 포함하지만 이에 한정되지 않는 폰트들의 사용; 및
b.3) 예를 들어, 아시아 폰트들과 같이, 큰 폰트들의 드문 서브세트들이 사용되는 경우들에서의 AV 자료의 일부분들(예를 들어, 무비 챕터들)에 대한 폰트 서브세트들의 로딩 중 하나를 포함하지만, 이에 한정되는 것은 아니다.
폰트 기술 데이터의 부가적인 구조를 위해, 특정 실시예의 몇가지 변경예들이 다음과 같이 제안된다.
제 1 변경예에서는, 폰트가, 개개의 문자들이 가변 폭을 갖는 비례 폰트라면, 모든 문자 어레이들은 외관상 균일한 폭이 되도록 수평적으로 늘여지고, 늘여진 결과적 문자 어레이들은 폰트 어레이로 수직적으로 연결된다. 다음으로, 폰트 어레이는 관용적인 방식으로 라인-스캐닝되어 단일 문자 픽셀 데이터 부분을 형성한다.
다른 변경예에서는, 모든 문자 어레이들은 외관상 균일한 높이가 되도록 수직적으로 늘여지고, 늘여진 결과적 문자 어레이들은 폰트 어레이로 수평적으로 연결된다. 다음으로, 폰트 어레이는 단일 문자 픽셀 데이터 부분으로 관용적인 방식으로 라인-스캐닝된다.
상기 양자 변경예 모두의 경우, 단일 문자 픽셀 데이터 부분에는 폰트의 모든 문자들에 대한 문자 파라미터 세트들을 구비하는 단일 문자 파라미터 부분이 선행된다.
또 다른 변경예에서는, 폰트의 모든 문자들에 대해, 문자 파라미터 세트들 및 문자 어레이들을 교대로 연결하는 것에 의해, 폰트 기술 데이터가 생성된다.
또 다른 변경예에서는, 먼저 모든 문자 파라미터 세트들을 단일 문자 파라미터 부분으로 연결하고 그 부분에 모든 문자 어레이들을 구비하는 단일 문자 픽셀 데이터 부분을 첨부하는 것에 의해, 폰트 기술 데이터가 생성된다.
상기한 모든 변경들을 선택적으로 확장할 수 있는, 또 다른 변경예에서는, UNICODE(ISO/IEC 10646: Information technology -- Universal Multiple-Octet Coded Character Set(UCS) 참고) 코드가 폰트의 일부 문자들 또는 모든 문자들과 관련되어, UNICODE 코드가, 문제의 문자와 관련되어 있는 폰트 기술 데이터의 그 부분내의 식별 가능한 위치에 삽입되고 포함된다.
상기한 모든 변경들을 선택적으로 확장할 수 있는, 또 다른 변경에서는, 비-반복적인 문자 식별자가 폰트의 모든 문자와 관련되어, 식별자가, 문제의 문자와 관련되어 있는 폰트 기술 데이터의 그 부분내의 식별 가능한 위치에 삽입되고 포함된다.
상기한 모든 변경들에서, 폰트 기술 데이터는,
d.1) 매 데이터 항목당 하나의 코드 워드를 사용해 직접적으로 전송되거나,
d.2) 런 길이 코딩(runlength coding)에 의해 압축되거나,
d.3) PNG(W3C recommendation, PNG(Portable Network Graphics) Specification, Version 1. 0, 1996, http://www.w3.org/TR/REC-png.pdf 참고)에서 사용된 'zlib' 방법과 같은 무손실 압축을 위한 다른 방법들에 의해 압축될 수 있다.
폰트 식별 데이터의 구조를 위해, 특정 실시예의 몇가지 변경들이 다음과 같이 제안된다. 제 1 변화에서는, 폰트 식별 데이터 구조가 'PFR(Portable Font Resource)' 시스템(Bitstream Inc.: TrueDoc PER Specification, http://www.bitstream.com/pfrspec/index. html 참고)에서 정의된 'font_id'로서 구현된다.
다른 변경예에서는, PFR 'font_id' 형태의 폰트 식별 데이터 구조가, 도 3에 도시된 바와 같은 데이터 구조를 사용해, 상술된 DVB 자막 처리 시스템으로 구현된다.
또 다른 변경예에서는, 폰트 식별 데이터 구조가 (ISO/IEC 11578: 1996, Information technology - Open Systems Interconnection - Remote Procedure Call(RPC)의 UUID)에서 정의된 "UUI(Universally Unique Identifier)"로서 구현된다.
본 발명의 맥락에서, 문자 참조 데이터는, 그룹 배치 데이터가 각각 수반되는 하나 이상의 문자 참조 그룹들의 시퀀스로 이루어지고, 각각의 문자 참조 그룹은, 문자 배치 데이터가 각각 수반되는 하나 이상의 참조 문자들의 시퀀스로 이루어진다.
그룹 배치 데이터는 바람직하게도,
e.1) 비디오 이미지의 원점에 상대적인 그룹 참조 포인트의 절대적 수평 및 수직 좌표들;
e.2) 이전 문자 참조 그룹의 그룹 참조 포인트에 상대적인 상대적 수평 및 수직 좌표들; 및
e.3) 상술된 여타 참조 포인트에 상대적인 상대적 수평 및 수직 좌표들 중 하나로서 구현될 수 있다.
참조 문자들은 바람직하게도,
f.1) 폰트 기술 데이터내의 지시된 문자에 대한 암시적 위치를 의미하는 문자 인덱스들;
f.2) 임의 종류의 명확한 문자 식별자들;
f.3) ASCII 코드들이 문자들에 대해 명확하게 할당되었다면, ASCII 코드들; 및
f.4) UNICODE 코드들이 문자들에 대해 명확하게 할당되었다면, UNICODE 코드들 중 하나로서 구현될 수 있다.
문자 배치 데이터는 바람직하게도,
g.1) 개별적인 추가적 문자 배치 데이터가 불필요한 자동 진행(automatic advance)으로서, 이전 문자에 대한 문자 참조 포인트의 위치로부터 그리고 문제의 문자에 대한 수평 증분으로부터 추론될 수 있는, 자동 진행;
g.2) 문자 위치 오프셋 데이터를 가진 자동 진행으로서, 이 경우, 문자의 수평 뿐만 아니라 수직 위치를 위해, 이전 문자에 대한 문자 참조 포인트의 위치로부터 그리고 문제의 문자에 대한 수평 증분으로부터 추론된 제 1 값은 문자 배치 데이터에서 개별적으로 기술되는 제 2 값과 가산되는, 자동 진행;
g.3) 이전 문자에 대한 문자 참조 포인트와 관련하여 적용되는 상대적 문자 배치 데이터; 및
g.4) 비디오 이미지의 원점과 관련하여 적용되는 절대적 문자 배치 데이터 중 하나로서 구현될 수 있다.

Claims (8)

  1. 자막 처리 데이터의 항목들을 디코딩하는 방법으로서,
    비디오 또는 오디오- 비주얼 데이터 신호(101)의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방식 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들(103, 203)을 검색하는 단계(202)와,
    상기 문자 참조 데이터의 항목들(103, 203)로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하는 단계(206)와,
    폰트 메모리로(208)부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하는 단계(206)와,
    상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리(207)에 기입하는 단계
    를 포함하는 디코딩 방법.
  2. 제 1 항에 있어서,
    상기 문자 참조 데이터의 항목들(103, 203) 중 대응되는 것들에 관련된 폰트 기술 데이터의 항목들(102, 204)을 검색하는 단계(202)와,
    상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 단계(205)가,
    상기 문자 참조 데이터의 항목들(103, 203)을 검색하는 단계 이전에 수행되는 디코딩 방법.
  3. 제1 항 또는 제2 항에 있어서,
    상기 문자 기술 데이터의 항목들(103, 203)을 검색하는 단계 후,
    상기 참조 문자들의 상기 픽셀 데이터가 이미 상기 폰트 메모리(208)에 저장되어 있는지의 여부를 점검하는 단계(208)와,
    상기 픽셀 데이터가 상기 폰트 메모리에 저장되어 있지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)을 검색하는 단계(202)와,
    상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 단계
    를 수행하는 디코딩 방법.
  4. 자막 처리 데이터의 항목들을 디코딩하는 장치로서,
    비디오 또는 오디오-비주얼 데이터 신호(101)의 대응되는 부분들과 관련되어 있으며, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하는, 문자 참조 데이터의 항목들(103, 203)을 검색하는 수단(202)과,
    상기 문자 참조 데이터의 항목들(103, 203)로부터 문자 선택 정보 및 문자 배치 정보의 항목들을 도출하고, 폰트 메모리로(208)부터 상기 문자 선택 정보의 항목들에 의해 지시되는 상기 참조 문자들의 픽셀 데이터를 판독하며, 상기 픽셀 데이터를 상기 문자 배치 정보의 항목들에 의해 지시되는 상기 디스플레이 메모리(207)에 기입하는 수단
    을 포함하는 디코딩 장치.
  5. 제4 항에 있어서,
    상기 검색하는 수단(202)은, 상기 문자 참조 데이터의 항목들(103, 203)을 검색하기 전에, 상기 문자 참조 데이터의 항목들(103, 203) 중 대응되는 것들에 관련된 폰트 기술 데이터의 항목들(102, 204)을 검색하고,
    상기 디코딩 장치는,
    상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리(208)에 기입하는 수단(205)을 더 포함하는 디코딩 장치.
  6. 제4 항 또는 제5 항에 있어서,
    상기 문자 기술 데이터의 항목들(103, 203)을 검색한 후에, 상기 참조 문자들의 상기 픽셀 데이터가 이미 상기 폰트 메모리(208)에 저장되어 있는지의 여부를 점검하는 수단을 더 포함하고,
    상기 픽셀 데이터가 상기 폰트 메모리에 저장되어 있지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)이 검색되어 상기 폰트 메모리(208)에 기입되는 디코딩 수단.
  7. 자막 처리 데이터를 인코딩하는 방법으로서,
    비디오 또는 오디오-비주얼 데이터 신호(101)에 문자 참조 데이터의 항목들(103, 203) 및 폰트 기술 데이터의 항목들(102, 204)을 포함하는 관련된 자막 처리 데이터를 첨부하는 단계를 포함하며,
    그에 의해, 상기 문자 참조 데이터의 항목들(103, 203)은, 문자들의 시퀀스들 뿐만 아니라 디스플레이 메모리(207)를 이용하여 참조 문자들을 가시화하는 시간 및/또는 방법 및/또는 상기 데이터 신호의 픽쳐들에서의 위치에 관한 정보를 기술하고,
    상기 문자 참조 데이터의 항목들(103, 203)은 문자 선택 정보 및 문자 배치 정보의 항목들을 포함하며,
    상기 문자 선택 정보의 항목들은 자막 처리 디코더에서 폰트 메모리로부터 상기 참조 문자들의 픽셀 데이터를 판독하는데 사용될 수 있고, 상기 문자 배치 정보의 항목들은 상기 자막 처리 디코더에서 상기 픽셀 데이터를 상기 디스플레이 메모리에 기입하는데 사용될 수 있으며,
    그에 의해, 상기 폰트 기술 데이터의 항목들(102, 204)은, 상기 참조 문자들의 상기 픽셀 데이터가 상기 폰트 메모리에 이미 저장되어 있는지의 여부를 점검하고, 그렇지 않다면, 상기 참조 문자들을 포함하는 폰트 기술 데이터의 이러한 항목들(102, 204)을 검색하여 상기 폰트 기술 데이터의 항목들을 상기 폰트 메모리에 기입하기 위해, 상기 자막 처리 디코더의 상기 폰트 메모리에 기입될 수 있는 인코딩 방법.
  8. 비디오 또는 오디오-비주얼 데이터 신호(101) 및 제7 항에 따른 방법을 사용해 디코딩되는 관련 자막 처리 데이터를 포함하는 데이터 캐리어.
KR1020057008819A 2002-11-18 2003-11-06 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치 KR20050086692A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02090382A EP1420580A1 (en) 2002-11-18 2002-11-18 Method and apparatus for coding/decoding items of subtitling data
EP02090382.9 2002-11-18

Publications (1)

Publication Number Publication Date
KR20050086692A true KR20050086692A (ko) 2005-08-30

Family

ID=32116316

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057008819A KR20050086692A (ko) 2002-11-18 2003-11-06 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치

Country Status (9)

Country Link
US (1) US20060056819A1 (ko)
EP (2) EP1420580A1 (ko)
JP (1) JP2006515965A (ko)
KR (1) KR20050086692A (ko)
CN (1) CN100471242C (ko)
AU (1) AU2003293661A1 (ko)
BR (1) BR0316338A (ko)
MX (1) MXPA05005298A (ko)
WO (1) WO2004047431A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE517413T1 (de) 2003-04-09 2011-08-15 Lg Electronics Inc Aufzeichnungsmedium mit datenstruktur zur verwaltung der wiedergabe von textuntertiteldaten und verfahren und vorrichtungen zum aufzeichnen und wiedergeben
CN1781148B (zh) * 2003-04-29 2012-03-21 Lg电子株式会社 具有管理图形数据再现的数据结构的记录介质以及记录和再现的方法和装置
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
KR20050078907A (ko) 2004-02-03 2005-08-08 엘지전자 주식회사 고밀도 광디스크의 서브타이틀 재생방법과 기록재생장치
EP2113922B1 (en) 2004-03-26 2010-09-01 LG Electronics Inc. Recording medium and method and apparatus for reproducing and recording text subtitle streams
CN100420295C (zh) * 2004-07-26 2008-09-17 上海乐金广电电子有限公司 Dvd子画面解码时的存储器使用方法
WO2006092993A1 (ja) * 2005-02-28 2006-09-08 Matsushita Electric Industrial Co., Ltd. 字幕表示装置
CN101300843B (zh) * 2005-11-02 2012-04-18 松下电器产业株式会社 数字广播系统、接收装置、以及送出装置
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
US20080159713A1 (en) * 2006-12-28 2008-07-03 Mediatek Inc. Digital Video Recorder, Multimedia Storage Apparatus, And Method Thereof
EP2223232A4 (en) 2007-11-16 2015-02-25 Sonic Ip Inc Hierarchical and reduced index structures for multimedia files
KR20110056476A (ko) * 2008-06-06 2011-05-30 디브이엑스, 인크. 향상된 메타데이터 구조들을 사용하는 멀티미디어 배포 및 재생 시스템들 및 방법들
CN101764940B (zh) * 2008-11-04 2013-05-01 新奥特(北京)视频技术有限公司 一种基于像素空间掩码矩阵模型的字幕渲染方法
US8510303B2 (en) 2009-01-07 2013-08-13 Divx, Llc Singular, collective and automated creation of a media guide for online content
US20110169622A1 (en) * 2009-07-16 2011-07-14 Patent Navigation Inc. Enhanced communication through vibration
CA2782825C (en) 2009-12-04 2016-04-26 Divx, Llc Elementary bitstream cryptographic material transport systems and methods
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US8818171B2 (en) 2011-08-30 2014-08-26 Kourosh Soroushian Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates
KR102163151B1 (ko) 2011-08-30 2020-10-08 디빅스, 엘엘씨 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US10452715B2 (en) 2012-06-30 2019-10-22 Divx, Llc Systems and methods for compressing geotagged video
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9967305B2 (en) 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
GB2557194A (en) * 2016-11-29 2018-06-20 Sony Corp A decoder, encoder, computer program and method
CN106686408B (zh) * 2016-12-06 2022-04-29 海信视像科技股份有限公司 一种Teletext信息的传输方法和装置
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950005937B1 (ko) * 1992-10-12 1995-06-07 주식회사엘지전자 캡션자막 표시 제어장치와 표시 제어방법
ATE188327T1 (de) * 1994-12-14 2000-01-15 Koninkl Philips Electronics Nv Übertragungssystem für untertitel
EP0765082A3 (en) * 1995-09-25 1999-04-07 Sony Corporation Subtitle signal encoding/decoding
KR100218434B1 (ko) * 1996-06-21 1999-09-01 구자홍 디브이디 재생기의 문자 표시 장치 및 방법
WO1998021890A1 (en) * 1996-11-12 1998-05-22 Thomson Consumer Electronics, Inc. System and method for receiving and rendering multi-lingual text on a set top box
JP3670934B2 (ja) * 2000-06-01 2005-07-13 三洋電機株式会社 デジタルテレビ放送受信機における文字データの表示方法

Also Published As

Publication number Publication date
CN1729684A (zh) 2006-02-01
WO2004047431A1 (en) 2004-06-03
US20060056819A1 (en) 2006-03-16
CN100471242C (zh) 2009-03-18
AU2003293661A1 (en) 2004-06-15
EP1563677A1 (en) 2005-08-17
JP2006515965A (ja) 2006-06-08
EP1420580A1 (en) 2004-05-19
MXPA05005298A (es) 2005-07-25
BR0316338A (pt) 2005-09-27

Similar Documents

Publication Publication Date Title
KR20050086692A (ko) 자막 처리 데이터의 항목들을 코딩/디코딩하는 방법 및장치
EP0745307B1 (en) Subtitling transmission system
EP1614108B1 (en) Recording medium having a data structure for managing reproduction of text subtitle data and methods and apparatuses of recording and reproducing
EP1079610B1 (en) Moving-picture processing method, and apparatus therefor
EP1628477A1 (en) Reproduction device and program
EP1939882B1 (en) Information storage medium containing subtitles and processing apparatus therefor
EP0779008B1 (en) Transmission of graphic images
CN1813470A (zh) 位图数据流的行程长度编码方法
KR20000034385A (ko) 에이 티브이의 캡션 처리 장치
KR20000013907U (ko) 에이 티브이의 캡션 처리 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application