KR20000064909A - Navigation and navigation equipment through video material with multiple key-frame parallel representations - Google Patents

Navigation and navigation equipment through video material with multiple key-frame parallel representations Download PDF

Info

Publication number
KR20000064909A
KR20000064909A KR1019980708181A KR19980708181A KR20000064909A KR 20000064909 A KR20000064909 A KR 20000064909A KR 1019980708181 A KR1019980708181 A KR 1019980708181A KR 19980708181 A KR19980708181 A KR 19980708181A KR 20000064909 A KR20000064909 A KR 20000064909A
Authority
KR
South Korea
Prior art keywords
keyframes
navigation
video
keyframe
video material
Prior art date
Application number
KR1019980708181A
Other languages
Korean (ko)
Other versions
KR100552248B1 (en
Inventor
마르코 파올로 체카렐리
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Priority claimed from PCT/IB1998/000091 external-priority patent/WO1998034182A2/en
Publication of KR20000064909A publication Critical patent/KR20000064909A/en
Application granted granted Critical
Publication of KR100552248B1 publication Critical patent/KR100552248B1/en

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/50Tuning indicators; Automatic tuning control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/45Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup
    • G11B2220/455Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup said record carriers being in one device and being used as primary and secondary/backup media, e.g. HDD-DVD combo device, or as source and target media, e.g. PC and portable player
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4331Caching operations, e.g. of an advertisement for later insertion during playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/45Picture in picture, e.g. displaying simultaneously another television channel in a region of the screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)

Abstract

표시된 키이프레임들의 선택적인 억세싱을 비디오 물질에 실질적인 억세스를 제어하기 위하여 상기 억세스된 키이프레임들의 맵핑 표시로써 허용하는 동안 복수개의 키이-프레임 병렬 표시에 의하여 비디오 물질을 통한 항법.Navigation through the video material by means of a plurality of key-frame parallel representations while allowing selective access of the displayed keyframes as a mapping representation of the accessed keyframes to control substantial access to the video material.

상기 방법이 스크린상에 시간적으로 정리된 방식으로 키이프레임들을 배열하기 위한 제 1 동작 모드와 표시된 바와 같이 인접하는 키이프레임들간 다중 선택가능한 입도들로 키이프레임들을 배열하기 위한 제 2 동작 모드사이에서 선택되도록 단일 사용자 인터페이스 조직이내에서 허용되는 것.The method selects between a first mode of operation for arranging keyframes in a temporally arranged manner on a screen and a second mode of operation for arranging keyframes with multiple selectable granularities between adjacent keyframes as indicated. To be permitted within a single user interface organization.

Description

복수개의 키이-프레임 병렬 표시에 의한 비디오 물질을 통한 항법 및 항법 장치Navigation and navigation equipment through video material with multiple key-frame parallel representations

키이프레임들은 유도 알고리즘을 통하여 유저(user)의 것에서 그것의 수용상 비디오 재료로부터 유래될 수 있거나, 또는 키이프레임들은 예컨대 각각의 비디오 촬영이 키이프레임으로 시작하는 비디오 프로바이더와 같은 것으로 불리워질 수 있다. 제 3 방식은 상기 프레임들이 표준 비디오 속도에 관련하듯이 서로 균일한 시간 간격들로 연속되는 것이다. 본 발명은, 키이프레임들이, 유저들에게 그것들이 상기 재료를 더욱 용이하게 억세스할 수 있게 하기 위하여, 연속적인 표시에 대한 선택 또는 비선택을 위하여, 또는 편집하기 위하여 유용한 신뢰도와 결합된다는 것과, 관념 이상의 다이내믹한 개관을 주기 위하여 당연히 사용된다는 것을 알려줄 것이다.Keyframes may be derived from its acceptable video material at the user's through a derivation algorithm, or keyframes may be called, for example, such as a video provider where each video shoot begins with a keyframe. . The third way is that the frames are contiguous with each other at uniform time intervals as related to the standard video speed. The idea is that the keyframes are combined with reliability useful for selection or non-selection or editing of successive displays, in order to make them more accessible to users. It will of course be used to give a dynamic overview of the above.

디지털을 위한 계획이며 비디오 영상들의 압축된 부호화에 따른 특별한 문제점은 다량의 미디어상에 그것에 대한 저장이 일반적으로 즉시 억세스가 허용되지 않는다는 것이며, 특히 프레임당 저장크기에서 표시가능한 것과 같은 선형 저장 밀도가 불균일성이라는 것이다. 더 작은 용량 및 증가된 억세스 용이성을 가지며 제 2 저장 매체로 테이프와 같은 고용량 메인 저장 매체를 부가하는 것이 제안되어져 왔다. 그러한 경우에, 발췌되고, 수정되며, 또한 재배열된 형태에서 연속적인 표시를 위한 비디오 재료의 편집 뿐만아니라 신속한 순방향 및 역방향과 같은 트릭 모드(trick mode)의 실행은 유저 인터페이스의 면에서 보여진 바와 같이 저장 기술 측면에서 인지될 뿐만아니라 둘다 상당한 어려움을 발생시킨다.A particular problem with the scheme for digital and compressed coding of video images is that storage on it on a large amount of media is generally not immediately accessible, especially linear storage densities such as displayable at storage sizes per frame. Is called. It has been proposed to add high capacity main storage media such as tape to the second storage medium with smaller capacity and increased accessibility. In such cases, the execution of trick modes such as fast forward and reverse as well as editing of video material for continuous display in excerpted, modified, and rearranged forms is shown in terms of the user interface. Not only are they recognized in terms of storage technology, but both pose significant difficulties.

본 발명은 청구항 제 1 항의 전제부에 따른 방법에 관한 것이다. 비디오 표시의 표시부분들과 같은 즉 다음의 선택적인 플레이백(playback)을 위해 기록되는 키이프레임들의 사용법이 다른 경우에서는 제안되어져 왔다. 비디오가 "온(on)" 상태로 있는 것을 의미하는 연속적인 비디오 스트림(video stream)은 만화영화, 일련의 정지영상, 또는 상호 작용하는 연속 영상들을 포함한다. 특성은 필름, 뉴스, 또는 예컨대 쇼핑 리스트와 같이 다양할 수 있다. 본 기술의 설명은 S.W. Smoliar 와 H.J. Zhang 에 의해 IEEE Multimedia, Summer 1994의 62-72쪽에 기재된 ' Content-Based Video Indexing and Retrieval'이라는 제목의 논문에서 나타난다.The invention relates to a method according to the preamble of claim 1. The use of keyframes that are recorded, such as the display portions of a video display, ie for the next optional playback, has been proposed in other cases. A continuous video stream, meaning that the video is in an "on" state, includes a cartoon movie, a series of still images, or interactive continuous images. Characteristics can vary, such as films, news, or shopping lists, for example. The description of this technology is described in S.W. Smoliar and H.J. Zhang appears in a paper titled 'Content-Based Video Indexing and Retrieval' on pages 62-72 of IEEE Multimedia, Summer 1994.

도 1은 TV-레코더 결합의 블록도.1 is a block diagram of a TV-recorder combination.

도 2는 비디오 레코딩의 모범적인 구조도.2 is an exemplary structural diagram of video recording.

도 3은 스크롤링 모자이크(scrolling mosaic) 유저 인터페이스의 설계도.3 is a schematic diagram of a scrolling mosaic user interface.

도 4는 스크롤링 리스트 유저 인터페이스의 설계도.4 is a schematic diagram of a scrolling list user interface.

도 5는 더욱 광범위한 그래픽 유저 인터페이스.5 is a more extensive graphical user interface.

도 6은 설명 자막의 표시도.6 is a display diagram of an explanatory caption.

도 7은 시스템 동작의 상태도.7 is a state diagram of system operation.

결과적으로, 다른 것들 사이에서, 본 발명의 목적은 메인 저장 매체를 지속적으로 억세스하기 위한 필요성을 제거함과 동시에, 본래의 비디오 재료 뿐만아니라 저장 조직의 더욱 자연적인 감각을 유저에게 제공하는 것 뿐만아니라 더욱 좋은 유연성을 조직에 도입하는 것이다. 그러므로, 현재, 그것의 측면중 하나에 따른 본 발명은 청구항 제 1 항의 나머지에 따라 특징지워진다. 시간적으로 정리된 방식에서 프레임을 표시하는 것은, 예컨대 프레임들이 표준 비디오 속도에 관련한 것으로써 서로 균일한 시간 간격들로 계속된다면 간단한 방식에서의 신속한 순방향 및 신속한 역방향에 영향을 미칠 수 있다. 더욱이, 프레임들간 정확히 맞는 때에 다양한 입도를 갖는 계층적 레벨의 용이한 변화는 용이한 억세싱 및 편집이 허용된다. 그 동일한 것은 키이프레임들 또는 적어도 그것의 소부분이 필름 촬영 개시로부터 또는 원래의 필름 편집자에 의해 생성된 다른 관련된 일로부터 유출된다면 옳다. 이러한 방식에서는, 클러스터링(clustering) 동작이 자동적으로 영향을 받게 된다. 편리하게도, 상기 방법은 다른 키이프레임들과 관련하여 다중-크기 포맷에서 현재 선택된 키이프레임을 확대시킴과 동시에 강조 하며, 더욱이 상기 항법이 해로운 비디오 엇갈림 효과를 검출하며 만일 그렇다면 수직 제거에 의해 상기 효과를 감소시키는 것을 포함한다. 반면에, 상대적으로 조금 작은 키이프레임들내 비디오 왜곡은 허용되어져 왔고, 만일 특별한 키이프레임이 확대된다면, 화상 향상을 위하여 여분의 조치들이 취해져야 한다. 발명자는, 비록 표준 표시 조건들하에서 존재하는 질적 레벨을 항상 달성하는 것은 아니지만, 이러한 개선이 유쾌하고 유익한 화질의 향상을 준다는 것을 인식해 왔다.As a result, among other things, the object of the present invention is not only to provide the user with a more natural sense of storage organization, but also to provide the user with a more natural sense of storage organization as well as eliminating the need for continuous access to the main storage medium. Introducing good flexibility into the organization. Therefore, at present, the invention according to one of its aspects is characterized according to the remainder of claim 1. Displaying frames in a temporally organized manner can affect rapid forward and rapid reverse in a simple manner if, for example, the frames continue at uniform time intervals with respect to one another, relative to the standard video speed. Moreover, easy changes of hierarchical levels with varying granularity when exactly fitting between frames allow for easy accessing and editing. The same is true if the keyframes or at least a small portion thereof is leaked from the start of filming or from other related work created by the original film editor. In this way, the clustering operation is automatically affected. Conveniently, the method highlights and simultaneously simultaneously enlarges the currently selected keyframe in a multi-size format with respect to other keyframes, and furthermore the navigation detects a harmful video staggering effect and if so eliminates the effect by vertical elimination. Reducing. On the other hand, video distortion in relatively small keyframes has been allowed, and if a particular keyframe is enlarged, extra steps must be taken to improve the picture. The inventors have recognized that, although not always achieving the quality level present under standard display conditions, this improvement gives a pleasant and beneficial improvement in picture quality.

본 발명은 또한 기술 된 것과 같은 방법의 단계들을 수행하도록 배치된 장치에 관한 것이다. 더욱이 본 발명의 이로운 측면들에서 종속항에서 기술되어져 있다.The invention also relates to an apparatus arranged to perform the steps of the method as described. Furthermore, in the advantageous aspects of the invention are described in the dependent claims.

다양한 이점들, 특히, 일반의 커스터머(customer) 및 자택 이용에 배타적으로 속한 것을 제외한 것을 다음에 설명한다:Various benefits are described below, particularly those that are exclusive to general customer and home use:

ㆍ 키이프레임은 전형적인 TV 뷰잉(시청) 거리에 위치된 사용자에 의해서 서로 구별할 수 있는 그러한 방식으로 표시되어야만 한다.Keyframes must be displayed in such a way that they can be distinguished from one another by a user located at a typical TV viewing (viewing) distance.

ㆍ 동시에 표시된 키이프레임의 수가 디지털 비디오 재료의 내용의 중요한 부분의 개요를 사용자에게 제공하는데 충분해야 한다.The number of keyframes displayed at the same time should be sufficient to provide the user with an overview of the important part of the content of the digital video material.

ㆍ 키이프레임은 아스팩트비를 유지하는 것과 같이 왜곡되지 않은 양식에서 표시되어야 한다.Keyframes should be displayed in an undistorted form, such as to maintain aspect ratio.

ㆍ 가급적이면, TV 세트 자체의 원격 제어 장치는 유저 제어 장치로서 동작한다.Preferably, the remote control device of the TV set itself operates as a user control device.

ㆍ 피드백 정보는 전형적인 뷰잉(시청) 거리로부터 인지될 수 있어야 한다.Feedback information should be recognizable from typical viewing (viewing) distances.

ㆍ "끌기 및 놓기(drag and drop)"과 같은 컴퓨터 개념들은 일반적으로 필요하지 않다.Computer concepts such as "drag and drop" are generally not necessary.

ㆍ 설비들이 지속적으로 사용되기 보다는 단지 때때로 사용되기 편리해야 한다.• Facilities should be convenient to use only occasionally, rather than being used continuously.

ㆍ 유저 인터페이스가 익숙한 비디오 표시의 선형 모델을 반영해야 한다.The user interface should reflect the linear model of the familiar video representation.

(특별한 실시예)(Special Example)

도 1은 본 발명에 따른 TV-레코더 결합을 보이는 도면이다. 항목 20은 TV-세트 표시판과 관련된 인접한 제어 및 전원을 나타낸다. 항목 22는 안테나 또는 케이블 배전과 같은 신호 배전 본체의 또다른 형태를 갖는 커넥션을 나타낸다. 이러한 항목은 적절하다면 디지털 비디오 정보의 유도 또는 수신신호로부터의 디지털 신호 부분도 역시 포함한다. 항목 34는 도 1의 다양한 서브시스템들 간의 비디오 스트림 및 관련된 정보의 루팅을 나타낸다. 상기 루팅은 라인(35)상의 제어 신호들을 통하여 제어 박스(28)에 의해 제어된다. 후자(라인 35)는 단일 양방향 내부연결로써 되어 왔지만 사실상 소정 개수의 일방향 또는 양방향 라인들로 이루어질 수 있다. 제어 박스는 라인(30)상에서 표시판(20)으로부터의 검출 신호들을 수신하며, 또한 서브시스템(38,40)을 제어함과 동시에 그들로부터의 검출 신호들을 수신한다. 블록(38)은 다중-기가바이트(multi-gigabyte) 영역내 매우 높은 저장 용량을 갖는 선형 테이프 레코더이다. 블록(40)은 높은 저장 용량을 갖는 자기 디스크 레코더이지만, 그럼에도 불구하고 단지 레코더(38)의 소부분이다; 다른 한편으로, 레코더(40)에서 억세스는 크로스-트랙 점핑(cross-track jumping)을 통하여 매우 신속하다. 더불어, 블록들(38 및 40)은 두 개의 레벨 저장 조직으로 형성되고 컴퓨터 메모리 캐시 시스템과 다소 유사하며, 적어도 한번에 모든 비디오 표시의 항목을 저장한다. 항목(24)은 원격 제어 장치를 나타내며, 무선(26)을 경유하여 표시 장치(20)과 통신하고, 간접적으로 서브시스템(28)과 통신하며, 더 나아가서 서브시스템(38 및 40)과 통신한다.1 shows a TV-recorder combination according to the invention. Item 20 represents an adjacent control and power source associated with the TV-set display panel. Item 22 represents a connection with another form of signal distribution body, such as antenna or cable distribution. This item also includes the part of the digital signal from the received or derived signal of the digital video information, as appropriate. Item 34 represents the routing of video streams and related information between the various subsystems of FIG. 1. The routing is controlled by control box 28 via control signals on line 35. The latter (line 35) has been made as a single bidirectional interconnect, but may in fact consist of any number of unidirectional or bidirectional lines. The control box receives detection signals from display panel 20 on line 30 and also receives detection signals from them while controlling subsystems 38 and 40. Block 38 is a linear tape recorder with a very high storage capacity in a multi-gigabyte area. Block 40 is a magnetic disk recorder with high storage capacity, but nevertheless is only a small part of recorder 38; On the other hand, the access in the recorder 40 is very rapid through cross-track jumping. In addition, blocks 38 and 40 are formed of a two level storage organization and somewhat similar to a computer memory cache system, storing items of all video representations at least once. Item 24 represents a remote control device, communicates with display device 20 via radio 26, indirectly communicates with subsystem 28, and further communicates with subsystems 38 and 40. .

도 2는 비디오 표시의 모범적인 구조를 보인다. 비디오 물질 기능성을 달성하기 위하여, 바아(bar,60)는 프레임들 또는 MPEG 부호화와 같은 일련의 압축된 비디오 물질중의 하나의 형태에서 비디오 자체를 포함한다. 비록 실질적인 저장 필요성들이 재생 시간을 넘어서 균일하게 될 필요가 없다 할지라도, 정보는 비디오 시간 경과와 같은 바아를 따라서 저장된다. 산재된 키이프레임들이 68과 같은 어두운 수직 줄무늬로 나타나고 있다. 키이프레임은 다음 키이프레임까지의 간격에서 전형적인 비디오 전체가 되고 표시되도록 사용된다. 키이프레임은 "내용물 표" 내에 라벨 또는 포함물을 부가하는 것을 통하여 각각의 새로운 촬영의 제 1 프레임으로써 비디오 프로바이더에 의해 선택될 수 있다. 다른 방도로, 어떠한 알고리즘을 통하여 수신기는 비디오 내용물이 하나의 프레임에서 다음 프레임으로 갑자기 변화하는 것을 검출한다. 본 발명은 관련된 알고리즘들도 당연히 적용된다. 도시하는 바와 같이, 그들의 배열은 불균일할 수 있다. 다른 메커니즘은 연속적인 키이프레임들이 매 2 내지 3초와 같은 전술한 간격들에서 상호 지속되는 것이다. 본 실시예에서, 표시(62)로 단지 키이프레임들은 나타내어진다. 더욱이, 키이프레임은 약간 계층적으로 구성되며, 표시(64)는 높이 관련된 키이프레임들의 한정된 세트만을 가진다. 이 계층구조는 다중 레벨이 되며, 표시(66)는 비디오 표시(60)의 모두에 대해 단지 단일 키이프레임만이 관련된다. 키이프레임들의 다양한 레벨들은 위에 기술된 조직들중 하나로 상이하게 결정될 수 있으며, 나란히 존재할 수도 있다.2 shows an exemplary structure of a video display. To achieve video material functionality, bar 60 includes the video itself in one of a series of compressed video materials, such as frames or MPEG encoding. Although the actual storage needs need not be made uniform beyond the playback time, the information is stored along the same bar as the video time lapse. Interspersed keyframes appear as dark vertical stripes, such as 68. Keyframes are used to become the entire typical video and display it at intervals up to the next keyframe. The keyframe may be selected by the video provider as the first frame of each new shot through adding a label or inclusion in the "content table". Alternatively, through some algorithm the receiver detects that the video content suddenly changes from one frame to the next. The present invention also naturally applies to related algorithms. As shown, their arrangement can be non-uniform. Another mechanism is that consecutive keyframes persist with each other at the aforementioned intervals, such as every two to three seconds. In this embodiment, only keyframes are represented by the display 62. Moreover, the keyframes are organized slightly hierarchically, and the indication 64 has only a limited set of height related keyframes. This hierarchy is multi-level, and the display 66 involves only a single keyframe for all of the video displays 60. The various levels of keyframes may be determined differently in one of the organizations described above, or may exist side by side.

도 1에서 저장 맵핑은 비디오 표시의 메인 몸체가 테이프 레코더(38)내에 저장된다는 것으로 영향을 받을 수 있으며, 반면에 적어도 키이프레임이 디스크 레코더(40)내에서 재생되며, 될 수 있는한 관련된 키이프레임에 따라 즉시 짧은 비디오 및/또는 음성부분(오디오) 간격들과 함께 재생될 수 있다. 그러한 간격 길이는 선형 테이프 레코더(38)의 시간 지연과 대응되며, 따라서 그것에 의하여 실시간 억세스를 달성할 수 있다. 자연적으로, 비디오 표시는 본질적으로 필름과 같은 선형이 될 수 있다. 다른 용법은 소정의 저장 간격들이 현재의 소비자에 의해서 사용될 수 있도록 만화영화, 정지영상, 또는 다른 영상들을 포함하는 것이다. 키이프레임의 가능한 작용은 그것을 억제하는 것이다. 이것은 문제의 키이프레임 이전의 시간 간격과 키이플레임 이후의 시간 간격을 유효하게 결합한다. 리셋 특징은 다시 그 간격을 결합하지 않는다. 또한, 키이프레임들의 다양한 종류는 고정된 시간 간격에 의해 서로 분리되는 종류와 같이 억제 당할 수 있다. 키이프레임들의 다양한 다른 종류들은 프로바이더에 의해 도입된 종류들 대 수신에서 논리 알고리즘에 의해 생성되는 종류과 같이, 하나의 표시로 이용할 수 있다.The storage mapping in FIG. 1 can be influenced by the fact that the main body of the video representation is stored in the tape recorder 38, while at least keyframes are played in the disc recorder 40, as far as possible associated keyframes. Can be immediately played with short video and / or voice portion (audio) intervals. Such interval length corresponds to the time delay of the linear tape recorder 38, whereby real time access can be achieved. Naturally, the video display can be essentially film-like. Another usage is to include cartoons, still images, or other images so that certain storage intervals can be used by the current consumer. The possible action of the keyframe is to suppress it. This effectively combines the time interval before the keyframe in question and the timeframe after the keyframe. The reset feature does not combine that interval again. In addition, various kinds of keyframes may be suppressed, such as those separated from each other by fixed time intervals. Various other kinds of keyframes may be used as an indication, such as those introduced by a provider versus those generated by a logic algorithm at reception.

도 3은 스크롤링 모자이크 유저 인터페이스의 설계를 보인다. 모든 스크린은 왼쪽 최상부로부터 오른쪽 하부로 시작되는 20 키이프레임들을 표시한다: 각 키이프레임은 보여진 키이프레임들의 전체 계층내에서 그것의 번호를 가진다. 실제적으로, 키이프레임(144)은 직각 제어 커서에 의해 강조 된다. 사용자는 커서 장치상의 항법 제어를 통하여 최상부 및 최하부 바아들로 표시된 버튼 상부에서 뿐만아니라 표신된 키이프레임들 상부에서 자유로이 커서를 이동시킬 수 있도록 원격 제어를 활성화시킨다. 만일 유저가 제어 커서를 최상부 왼쪽 코너내에서 왼쪽으로 이동시킨다면, 표시판은 20 키이프레임들에 의해 뒤로 건너뛴다. 최하부 오른편 코너내에서 오른쪽으로 이동시키는 것은 20 키이프레임들 상부로 순방향으로 건너뛰도록 한다. 스크린의 최상부 바아를 억세싱하는 것은 표시의 다른 부분들을 억세싱하도록 제어하며, 후자는 다섯 개의 동등한 길이 부분들로 분할된다: 블랙 수평 바아는 여기에 전체 표시로 표시된 20개의 키이프레임들에 의해 덮혀진 전체 시간을 가리킨다.3 shows a design of a scrolling mosaic user interface. Every screen displays 20 keyframes starting from the top left to the bottom right: each keyframe has its number within the entire hierarchy of keyframes shown. In practice, keyframe 144 is highlighted by a right angle control cursor. The user activates the remote control via navigation control on the cursor device to move the cursor freely on top of the displayed keyframes as well as on top of the buttons indicated by the top and bottom bars. If the user moves the control cursor to the left in the top left corner, the display is skipped back by 20 keyframes. Moving to the right within the bottom right corner allows forward skipping above the 20 keyframes. Accessing the top bar of the screen controls access to other parts of the display, the latter being divided into five equal length parts: the black horizontal bar is covered by 20 keyframes shown here in full display. Indicates the total time spent.

다른 기능들은 특별한 키이프레임과 최하부 버튼들중 하나를 연속적으로 우선 선택함으로써 초기화된다. "뷰우 프로그램(view program)"은 커서-억세스된 키이프레임에서 시작점을 제어한다. "뷰우 세그먼트(view segment)"도 동일하게 제어되나, 단지 단일 세그먼트만이 실행되며, 다음 키이프레임에서 종료한다. "x에서 y로의 뷰우"는 두 개의 커서-억세스된 키이프레임들의 시간내에서 가장 이른 시작점을 제어하며, 상기 두 개의 시간내에 가장 늦은 곳에서 종료한다. 다른 모드들은 키이프레임-선택 기능성들과 더불어 실행가능하다. 예들은 신속한-순방향 또는 늦은-순방향이며, 사용자가 어떠한 사건들에 대해 특별한 간격을 점검하도록 허용하며 또한 신속/느림 역방향이 어떠한 비디오 효과들을 달성할 수 있도록 허용한다. 표시하는 동안에, 특별한 키이프레임에 속하는 시간내에서 순간적으로 지나면서, 다음 키이프레임과 관련된 순간에 도달하기 까지는 후자는 활성화되고 유효하게 비디오 스트림을 표시한다. 그 결과, 후자는 활성 프레임으로 된다. 상기 특징은 유저가 광고와 같은 어떤 세그먼트들을 제외하는 바와 같이 간격 표시 시퀀스를 위한 비디오 레코더를 똑바르게 프로그램하도록 하며, 또는 반대로, 느림-순방향으로 어떠한 항목들에 주의를 끌게끔 한다. 표시 동안에, 음성부분(오디오)은 도시되지 않은 제어 버튼을 통하여 활성화 또는 억제될 수 있다. 다른 방도로, 제어는 오디오를 하나로 보내도록 하며, 반면에 비디오 커서는 불연속적이며, 적절한 밝음을 통하여 간격에서 간격으로만 단계화한다.The other functions are initialized by successively selecting one of the special keyframes and one of the bottom buttons. The "view program" controls the starting point in the cursor-accessed keyframe. The "view segment" is also controlled in the same way, but only a single segment is executed, ending at the next keyframe. The "view from x to y" controls the earliest starting point in time of the two cursor-accessed keyframes and ends at the latest in the two times. Other modes are viable with keyframe-selective functionality. Examples are fast-forward or late-forward, allow the user to check a particular interval for certain events and also allow the fast / slow reverse to achieve any video effects. During display, passing momentarily within the time belonging to a particular keyframe, the latter becomes active and validly displaying the video stream until the moment associated with the next keyframe is reached. As a result, the latter becomes the active frame. This feature allows the user to program the video recorder for the interval indication sequence straightly as excluding certain segments such as an advertisement, or vice versa, to draw attention to certain items in a slow-forward direction. During the display, the audio portion (audio) can be activated or suppressed via a control button not shown. In the other way, control causes the audio to be sent as one, while the video cursor is discontinuous and only steps from interval to interval with adequate brightness.

도 4는 스크롤링 리스트 유저 인터페이스의 모범적인 설계이다. 여기서, 최하부에서 전체 스크린은 5개의 키이프레임으로 표시되며, 직각 제어 커서에 의해 강조 되는 키이프레임(145)은 스크린의 가장자리를 따라 움직인다. 키이프레임(145)은 또한 배경에서 아주 큰 크기로 표시된다. 비록 버튼 위치들이 상이하지만 제어 인터페이스는 도 3과 동일하다. 다른 방도로, 확대된 키이프레임은 다중-키이프레임 바아내에서 억제된다.4 is an exemplary design of a scrolling list user interface. Here, at the bottom, the entire screen is represented by five keyframes, and the keyframe 145 highlighted by the orthogonal control cursor moves along the edge of the screen. Keyframe 145 is also displayed in very large size in the background. Although the button positions are different, the control interface is the same as in FIG. 3. Alternatively, the enlarged keyframe is suppressed within the multi-keyframe bar.

도 5는 매우 광범위한 그래픽 유저 인터페이스를 보인다. 우선, 왼쪽 및 오른쪽은 실행(play), 종료(stop), 커트(cut), 페이스트(paste), 신속 역방향(fast reverse), 줌 +(zoom +), 줌 -(zoom -), 신속 순방향(fast forward)을 위한 제어 버튼들의 열이다. 버튼 행은 상호간에 어떠한 관계들이 거의 없으며, 각각 상이한 장면들 또는 촬영들에 속하는 9개의 키이프레임들의 시퀀스를 가진다. 비록 키이프레임의 계층적 조직내에서 단계화되어 있지만, 장면 대 동적인 장면상의 좋은 개요가 모이게 된다. 내부-키이프레임 거리는 예컨대, 10초가 되지만, 더 크고 더 작은 공간들이 실행될 수 있다. 특히 연속적인 키이프레임들간에 짧은 거리를 가지면, 신속한 순방향과 같은 특성들은 아주 잘 실현된다. 반면에, 비디오가 하나의 키이프레임으로부터 다음으로 건너뛰는 동안, 동일한 공간 크기는 모든 오디오의 플래이백을 위해 사용될 수 있다. 지금, 중앙 키이프레임은 또한 확대된 방식으로 나타내어진다. 충분히 낮은 입도를 가지며 밀접하게 공간 위치된 키이프레임들을 실행시킬 때, 신속한 순방향(또는 뒷방향) 모드의 그러한 효과를 위하여 상기 확대된 키이프레임은 다이나믹 방식으로 표시된다. 다음 키이프레임의 재료 여기서 보이는 범선을 도달시킴과 동시에, 하부 열은 한 위치에서 왼쪽으로 전환하며, 따라서 왼쪽의 "태양"은 보이지 않게 되고 새로운 키이프레임은 오른쪽으로부터 진입한다. 배경 저장 매체로부터 표시상에 맵핑되는 바와 같이, 그러한 표시(디스플레이)는 특히 표준 비디오보다 더욱 빠른 프레임 비율로 이루어질 수 있다. 역방향 조직은 신속한 역방향을 가능케 한다.5 shows a very broad graphical user interface. First, left and right are play, stop, cut, paste, fast reverse, zoom +, zoom-, zoom forward ( row of control buttons for fast forward). The button row has little relationship to each other and has a sequence of nine keyframes, each belonging to different scenes or shots. Although staged within the hierarchical organization of keyframes, a good overview of scene dynamics is gathered. The inner-keyframe distance is, for example, 10 seconds, but larger and smaller spaces can be implemented. Especially with short distances between successive keyframes, properties such as fast forward are very well realized. On the other hand, while the video skips from one keyframe to the next, the same space size can be used for the playback of all audio. Now, the central keyframe is also represented in an enlarged manner. When executing closely spaced keyframes with sufficiently low granularity, the enlarged keyframe is displayed in a dynamic manner for such an effect of a fast forward (or backward) mode. Material of the next keyframe Upon reaching the sailboat shown here, the bottom row switches from one position to the left, so that the "sun" on the left is invisible and the new keyframe enters from the right. As mapped onto a display from a background storage medium, such a display (display) may be made at a particularly faster frame rate than standard video. Reverse organization allows for rapid reverse.

도 6은 도 5를 참조하여 토론된 바와 같은 일반적인 포맷에서의 설명 자막의 표시를 보인다. 중앙 영역에서, 공간(50)은 실질적인 프레임에 쓰여져 왔다; 공간(52)은 농아를 위해 언어에서 문구로 변환된 것과 같은 또는 실질적인 언어를 위해 사용된 것보다 또다른 언어로의 변역과 같은 유출된 설명 자막 또는 비디오 표시에 관련되거나 다른 관련된 정보를 표시하는데 쓰여져 왔다. 스크린 하부에서 7개의 키이프레임들에 관련된 범위에서만 단지 유출되는 설명 자막은 필요로하지 않는다. 그들의 관련성은 더욱 많은 것에 미칠 수 있다. 더욱이, 각각의 키이프레임은 타임 코드(54) 또는 그 상부에 놓인 다른 관련 데이터들을 가진다. 제어 버튼들(56,58)의 두 개의 열들은 왼쪽에서 응용 동작들에 쓰여지며 오른쪽에서 내부-프로그램 조작자들에 쓰여져 왔다. 스크린의 최상부는 실질적인 비디오 프로그램의 주제(60)가 표시된다.FIG. 6 shows a representation of descriptive captions in a general format as discussed with reference to FIG. 5. In the central area, the space 50 has been written in a substantial frame; Space 52 is used to display related or other relevant information related to leaked descriptive subtitles or video displays, such as translated from language to phrases for deaf or translated into another language than used for actual languages. come. At the bottom of the screen, there is no need for explanatory subtitles that only leak out in the range of seven keyframes. Their relevance can span more. Moreover, each keyframe has a time code 54 or other related data placed thereon. Two columns of control buttons 56, 58 have been written to application operations on the left side and to internal-program operators on the right side. The top of the screen shows the subject 60 of the actual video program.

실질적으로 활성 키이프레임 영역에서 정확하게 실행되는 비디오 커서의 다이내믹 표시를 갖기 위한 배열의 근본적인 원리는 그러한 다이내믹성이 사건의 전개를 유저로 하여금 더욱더 잘 이해시키도록 할 때 프레임들의 정적 표시가 전체적으로 비디오 표시의 다이내믹성을 충분히 시사하지 못한다는 것이다. 그러므로, 의미론이 다음과 같이 증가된다. 시스템이 키이프레임, 소정 시간량에 대해 무의미해진 이후, 커서 '동봉하다'가 어떤 관련된 오디오 및 더 나은 효과들을 포함하는 '살아돌아오다'로 되는데, 그것은 소규모로 디지털 재료를 실행하기 시작하기 때문이다. 만일 플레이백 동안 다음 키이프레임이 도달하면, 유저가 시스템과 상호 작용을 시작(재시작)할 때까지, 커서가 유저 인터페이스내에 표시된 다음 키이프레임으로 자동적으로 '건너뛰기'할 것이다. 일반적으로, 여기서 전술된 조직이 상이하며 비디오 스트링 전체와 분리된 정보를 통하여 읽혀지도록 된다. 어느 키이프레임으로부터 다음 키이프레임으로 건너뛰는 동안 단지 음성부분(오디오)이 다이내믹 방식내에서 실행될 지라도, 유저는 특히 낮은 저장 필요성에서 하부에 놓인 비디오에 대해 더 좋은 표시를 얻는다.The fundamental principle of an arrangement for having a dynamic representation of a video cursor that is executed correctly in the active keyframe area is that the static representation of the frame as a whole is such that when such dynamics allow the user to better understand the evolution of the event. It is not enough to suggest dynamics. Therefore, semantics is increased as follows. After the system becomes meaningless for keyframes, a certain amount of time, the cursor 'enclose' becomes 'recovery', which includes some associated audio and better effects, because it starts running digital material on a small scale. . If the next keyframe arrives during playback, the cursor will automatically 'skip' to the next keyframe displayed in the user interface until the user initiates (resumes) interaction with the system. In general, the organization described above is different and is to be read through information separate from the entire video string. Although only the audio part (audio) is run in a dynamic manner while skipping from one keyframe to the next, the user gets a better indication of the underlying video, especially with low storage needs.

이러한 관점에서, 도 7은 시스템 동작의 상태도이다. 다중 키이프레임들을 표시하는 동안, 상태(100)에서, 시스템이 유저로부터의 입력을 기다린다. 그러한 입력은 표시된 키이프레임들 사이에 건너뛰기를 암시하며, 또다른 세트의 키이프레임으로 건너뛰며, 관련된 간격을 표시하기 위하여 키이프레임을 선택하는 것을 암시한다. 임의의 그러한 입력은 화살표(104)에 영향을 주며 새로운 시간 간격을 시작한다. n 초(20 초와 같은) 동안 임의의 그러한 입력이 부재라면, 화살표(108)에 영향을 주며, 따라서 상태(102)에 도달한다. 그것내에서, 시스템은 다이내믹 비디오 커서 프레임을 진행한다. 유저 입력이 수신되지 않는 동안은, 화살표(110)에 영향을 주며, 시스템은 표시가능한 비디오 재료가 이용가능하게 되는 한 계속된다. 그러나 유저 입력이 수신된다면, 화살표(106)이 영향을 받으며, 그리고 시스템은 다이내믹 비디오 커서 프레임의 실질적인 내용물에서 또는 실질적인 간격의 시작점중에서 택일하여 중지된다.In this regard, FIG. 7 is a state diagram of system operation. While displaying multiple keyframes, in state 100, the system waits for input from the user. Such input implies skipping between the displayed keyframes, skipping to another set of keyframes, and selecting a keyframe to indicate the associated interval. Any such input affects arrow 104 and starts a new time interval. If any such input is absent for n seconds (such as 20 seconds), then the arrow 108 is affected, thus reaching state 102. Within it, the system advances the dynamic video cursor frame. While no user input is received, arrow 110 is affected and the system continues as long as displayable video material is available. However, if user input is received, arrow 106 is affected, and the system alternatively stops at the substantial content of the dynamic video cursor frame or at the beginning of the substantial interval.

("엇갈림(INTERLACING)" 효과에 의해 영향을 받는 키이프레임들의 검출 및 필터링)(Detection and filtering of keyframes affected by the "INTERLACING" effect)

비디오 프로그램의 내용물을 산만하게 갖는데 사용된 키이프레임들중 몇몇은 높은 행위를 갖는 시퀀스로부터 추출되어져 오고 있다. 정상적으로 엇갈리게된 부호화 모드로 부호화된 비디오 시퀀스의 경우에 어려운 지그재그 효과를 발생시키는 이것은 완전한 프레임을 형성하는데 기여하는 두 개의 영역들을 이루는 프레임의 경우이며, 여기서 짝수 라인들이 하나의 영역에 속하며 홀수 라인들이 다른 하나의 영역에 속한다. 이러한 문제는 화상이 확대되며 라인들이 두꺼운 블록들이 될 때 작은 키이프레임들에서 더욱 분명하고 어려우며, 여기서 그 효과는 매우 가시적이다.Some of the keyframes used to distract the content of a video program have been extracted from sequences with high behavior. In the case of a video sequence encoded in the normal staggered coding mode, this creates a difficult zigzag effect, which is the case of a frame consisting of two regions that contribute to forming a complete frame, where even lines belong to one region and odd lines differ It belongs to one area. This problem is more apparent and difficult in small keyframes when the image is enlarged and the lines become thick blocks, where the effect is very visible.

우선, 그러한 엇갈림 효과에 의해 영향받는 키이프레임들은 검출되어야 한다. 이러한 효과는 영상의 행들상에서 관찰될 수 있으며 휘도 변화들이 고주파수 값을 야기시킨다. 이것은 공간적인 주파수 스펙트럼을 분리시키므로써 많은 서브 대역들로 이용될 수 있고, 그리고 나서 단지 고주파수 요소들을 고려한다.First, keyframes affected by such a staggering effect must be detected. This effect can be observed on the rows of the image and changes in luminance cause high frequency values. This can be used with many subbands by separating the spatial frequency spectrum, and then only considering the high frequency components.

실질적으로, 우리가 검출하고저하는 그 효과는 짝수와 홀수 라인들사이에 휘도의 변화값으로 주어져야 하고, 그러므로 그 결과 화상의 가장 큰 샘플링 주파수가 주어져야 한다. 계산되어져야 하는 유일한 계수는 열들상의 주파수 변환(FFT 또는, 더 좋게는 DCT)의 가장 높은 주파수 요소이다. 화상이 엇갈림에 기인한 지그재그 효과에 의해 영향을 받을 때, 이러한 요소는 높은 값을 가진다.In practice, the effect we detect and degrade should be given by the change in luminance between even and odd lines, and therefore the largest sampling frequency of the picture. The only coefficient that must be calculated is the highest frequency component of the frequency transform (FFT or, more preferably, DCT) on the columns. When the image is affected by the zigzag effect due to staggering, this element has a high value.

그러나, 이러한 효과는 또한 대상물에 상응하여 움직임으로 가시화될 수 있으며, 특히 수평 방향에서의 요소들로 가시화될 수 있다. 이것이 또한 상세하고 현저한 차이가 있는 패턴들에서 높은 값들을 산출하여 결과적으로 거짓 정의 수를 산출하기 때문에, 그러므로 우리는 계수들의 총합을 고려하지 않는다.However, this effect can also be visualized in motion corresponding to the object, in particular with elements in the horizontal direction. We therefore do not consider the sum of the coefficients, since this also yields high values in detailed and noticeable differences in the pattern, resulting in a false positive number.

더욱 좋은 결과가 몇몇 서브-부분들에서 영상을 분리함으로써 얻어질 수 있으며, 면적당 가장 큰값을 고려할 수 있다. 예를들면, 각각의 두 개의 가장 높은 값들이 합쳐짐으로써 총합이 높은 세밀한 영상들보다 민감하지 않게 돈다.Better results can be obtained by separating the image in some sub-parts, taking into account the largest value per area. For example, the two highest values of each add up to make the total less sensitive than the finer details.

결과적으로, 낮은 수직 해상도가 지그재그 효과보다 어렵지 않기 때문에, 이 영상을 필터링하는 가장 간단한 방법은 단지 하나의 영역만을 고려하는 것이며 그리고 나서 그것을 2의 인자에 의해 수직적으로 업샘플링하는 것이다. 다음 단락에서 언급되는 바와 같이, 보간 필터는 결과 화상을 보이기 전에 적용될 수 있다.As a result, since the low vertical resolution is not more difficult than the zigzag effect, the simplest way to filter this image is to consider only one area and then upsample it vertically by a factor of two. As mentioned in the next paragraph, an interpolation filter can be applied before showing the resulting picture.

따라서, 검출 및 정정이 다음과 같이 영향을 미친다. 제 1 단계는 짝수 또는 홀수중 하나의 열들의 절반을 제거함으로써 하나의 영역을 버리는 것이다.; 그리고, 2의 인자에 의한 업샘플링은 보간 필터에 의해 뒤따르는 키이프레임의 본래 크기를 회복하기 위하여 상기 열들에 따라 실행된다. 이러한 경우에, 필터는 간단한 선형 보간을 수행한다.Therefore, detection and correction affect as follows. The first step is to discard one region by removing half of the rows of either even or odd; Upsampling by a factor of 2 is then performed according to the columns to restore the original size of the keyframe followed by the interpolation filter. In this case, the filter performs simple linear interpolation.

(업샘플링 및 보간법)(Upsampling and interpolation)

TV-뷰잉(시청) 거리에서 용이하게 보이게 하기 위하여, 키이프레임은 보간 필터에 의해 뒤따르는 업샘플링으로 거의 가득찬 스크린 크기로 확대되어져야 한다. 반면에 일반적으로 키이프레임은 낮은 해상도를 가지며, 그것은 매우 높은 인자에 의해 확대되어져야 한다. 이것은, 픽셀들이 큰 블록들이 되기 때문에, 더 처리된다면, 그 결과가 보기 좋지 않게 되는 것을 의미한다. 그러므로, 화상은 필터링되어져야 하나, 우리는 높은 해상도를 보여주는 좋은 화질의 화상을 생성하는 것을 필요로 하기 때문에 선택적 이점을 찾아내야 하고, 짧은 응답 시간을 갖도록 적용을 위한 신속한 처리도 역시 찾아내야 한다.To make it easier to see at TV-viewing distances, the keyframes should be enlarged to a screen size that is almost full with upsampling followed by an interpolation filter. On the other hand, in general, keyframes have a low resolution, which must be magnified by a very high factor. This means that since the pixels are large blocks, the more processed the result will be. Therefore, the picture must be filtered, but we need to find an optional advantage because we need to create a good quality picture showing high resolution, and also find a fast process for the application to have a short response time.

그 논점은 확대가 비행중 화상에 실행되어져야 한다는 것이며, 너무 많은 저장 공간을 필요로 하기 때문에, 하드디스크상에 저장되며 재사용되기 위하여 영상이 단 한번에 확대되고 필터링될 수 없다는 것을 의미한다. 그러므로, 업샘플링 및 필터링 처리는 인정될 수 있는 결과를 동시에 유지하는 동안 가능한한 신속하게 이루어져야 한다. 보통 일상의 보간 필터가 사용될 수 있다(참조. 디지털 신호 처리에 관한 어느 책; 관련된 논문은 IEEE Trans. Comput. 196, v25, 196-102쪽에 발표된 H.C Andrews, C.L. Patterson의 불연속 영상의 디지털 보간법을 들 수 있다)The argument is that magnification must be performed on images in flight, and because it requires too much storage space, it means that images cannot be magnified and filtered at once to be stored and reused on the hard disk. Therefore, the upsampling and filtering process should be done as quickly as possible while simultaneously maintaining acceptable results. Ordinary everyday interpolation filters can be used (see any book on digital signal processing; related papers include digital interpolation of discontinuous images by HC Andrews, CL Patterson, published in IEEE Trans. Comput. 196, v25, 196-102). Can be heard)

화질을 향상시키기 위한 다른 기술들은 더욱 잘 사용될 수 있다. 그들 중, 잔물결(wavelet)-기초된 해상도 및 차원 분열 도형 접근법들은 더 높은 계산 요지를 이끄는 것처럼 보이지만, 가시적인 질에서 현저한 결과를 보인다. 사실상, 차원 분열 도형 접근법 압축 기술은 독립적인 해상도로 잘 알려져 있다: 더 높은 해상도상에서 상세한 것들은 동일한 복호 처리를 반복하여 적용함으로써 재현되거나 시뮬레이션될 수 있다. 저장될 수 있는 이러한 경우는 차원 분열 도형 압축 화상이며, 높은 압축 인자를 산출하고 있다. 유사하게, 잔물결 변환을 사용함으로써, 더욱 높은 스케일상에서 고주파수 요소들이 흐림 효과없이 더욱 높은 해상도 영상을 얻을 수 있는 것이 예견된다.Other techniques for improving picture quality can be used better. Among them, wavelet-based resolution and dimensional fission graphics approaches seem to lead to higher computational points, but with significant results in visible quality. In fact, the dimensional fission diagram approach compression technique is well known for independent resolution: details at higher resolutions can be reproduced or simulated by repeatedly applying the same decoding process. This case that can be stored is a dimensional cleavage figure compressed image, yielding a high compression factor. Similarly, by using the ripple transform, it is envisaged that high frequency elements on higher scales can obtain higher resolution images without blurring.

(설명 자막들에 기초된 비디오 프로그램들에서 본문상 검색)(Text search in video programs based on descriptive subtitles)

현재의 비디오 전달에서, 설명 자막들은 종종 프로그램에 따라 전달된다(종종 아날로그 시스템을 위한 수직 블랭킹 간격에서 또는 디지털 전달내 분리 간단 스트림에서). 이것은 보통 청취 불능인 사람들을 위하며 보통 외국어로 분류되거나 동조하지 않는 프로그램들에 사용된다. 그러한 정보는 보통 스크린상에 이중 인화되나, 또한 저장 매체상에 기록될 수도 있다. 이러한 방법에서, 프로그램 언어,, 및 때때로 농아들을 위한 약간의 소리 묘사도 역시 검색 조작들로 이용될 수 있다.In current video delivery, descriptive subtitles are often delivered programmatically (often at vertical blanking intervals for analog systems or in separate simple streams in digital delivery). It is usually used for people who are unable to listen and are usually used for programs that are not classified or tuned into foreign languages. Such information is usually double printed on the screen, but may also be recorded on the storage medium. In this way, the programming language, and sometimes some sound description for the deaf, can also be used as search operations.

프로그램이 기록되고 있을 때 이러한 종류의 정보 추출은 실시간에서 일어난다. 이러한 기술이 키이프레임 추출 루틴과 결합된다면, 화상과 그 관련된 본문 예컨대, 대화문이 연결시킬 수 있고, 키이프레임으로부터 프로그램의 부분이 추출되어지는 것으로 일어난다. 이러한 방법에서, 현재의 본문 회복 기술로, 우리는 특별한 키이워드에 기초한 본문 회복을 실행시킬 수 있다. 그 적용의 특별한 툴(tool)은 키이워드에 기초한 간단한 질문과 그들의 구성을 지금 "웹(Web)" 검색 장치에 일반적으로 사용되는 바와 같이 실행시킬 수 있는 가능성을 제공하는 것이다.This kind of information extraction takes place in real time when the program is being recorded. If this technique is combined with a keyframe extraction routine, the picture and its associated text, such as a dialogue, can be linked, resulting in the portion of the program being extracted from the keyframe. In this way, with current text recovery techniques, we can implement text recovery based on special key words. A special tool of its application is to offer simple questions based on keywords and the possibility to implement their configuration as is now commonly used in "Web" search devices.

한 예로서, 뉴스 프로그램이 기록되어지는 것을 가정한다. 만일 프랑스에 관련된 뉴스를 회복시키려면, 단어 "프랑스"가 삽입될 때, 그 시스템은 자동적으로 프로그램의 본문에서 이 단어를 찾을 것이다. 그결과 양성이라면, 유저는 키이워드를 찾은 곳에서 특별한 부분의 설명 자막과 그 프로그램의 특별한 부분에 관련된 키이프레임으로 줄 것이다. 유저는 이때 특별히 지적된 부분에서 롬을 시작하는 프로그램을 시청하기 시작할 수 있다. 만일 키이프레임들이 질문의 결과로써 찾아진다면, 그들은 도 5에서와 같이 스크린의 하부상에 모두 보여질 것이며, 따라서 유저는 더 큰 윈도우상에서 일대일로 관련된 본문을 분석할 수 있다. 물론 유사한 키이워드들(Franch, Paris)이 만일 그 결과가 음성이라면 사용될 수 있다. 이러한 시스템은 특별한 팀 또는 스포츠를 포함하는 보고서들을 추출하는데 스포츠 프로그램들에서도 유용하게 이용될 수 있다.As an example, assume that a news program is recorded. If you want to recover news about France, when the word "France" is inserted, the system will automatically find this word in the body of the program. If the result is positive, the user will be given a description subtitle of the special part where the key word was found and a keyframe associated with that particular part of the program. The user can then start watching the program that starts the ROM at the particular pointed out portion. If keyframes are found as a result of the query, they will all be shown on the bottom of the screen as in Figure 5, so the user can analyze the related text one-to-one on a larger window. Of course similar keywords (Franch, Paris) can be used if the result is negative. Such a system can be usefully used in sports programs to extract reports that include a particular team or sport.

많은 다른 응용들이 예를들면 단어들이 대화문들내에 사용되는지 좋지 않은 단어들의 리스트에 포함되는지 아닌지를 점검함으로써 영화가 아이들 시청을 위해 허락된 것이지 아닌지를 점검하는 데 용이하다.Many other applications are easy to check whether a movie is allowed for children's viewing, for example by checking whether words are used in conversations or included in a list of bad words.

그러한 시스템의 가능한 확장은,A possible extension of such a system is

· 만일 본문이 비디오로부터 분리되어 이용될 수 없다면, 정지 영상상에 OCR 기술에 의한 바와 같은, 스크린으로부터 본문을 추출하는 것,If the text cannot be used separately from the video, extracting the text from the screen, such as by OCR technology on still images,

· 프로그램으로부터 대화문을 추출할 수 있도록 언어 인지 기술을 이용하는 것을 포함한다.• Use language recognition techniques to extract dialogue from the program.

이러한 경우에 상기 시스템은 항상 방송국에 의해 제공된 서비스에 독립적이 될 수 있으며, 따라서 설명 자막이 제공되지 않는 경우 조차도, 본문 회복이 적어도 약간의 특별한 키이워드들상에서 항상 가능하게 될 것이며 그 시스템은 인식하려고 훈련될 수 있다.In this case the system can always be independent of the service provided by the broadcaster, so even if no explanatory subtitles are provided, body recovery will always be possible on at least some special keywords and the system tries to recognize it. Can be trained.

본 발명은 비디오 키이프레임으로 사용이 적합하다.The present invention is suitable for use as video keyframes.

Claims (8)

비디오 물질에 대한 실질적인 억세스를 제어하기 위하여 억세스된 키이프레임들의 맵핑을 표시함으로써 표시된 키이프레임들의 선택적인 억세싱을 허용하는 복수개의 키이-프레임의 하나 또는 그 이상의 시리즈의 병렬 표시에 의한 비디오 물질을 통한 항법에 있어서,Through video material by parallel representation of one or more series of a plurality of key-frames allowing selective accessing of displayed keyframes by indicating a mapping of accessed keyframes to control substantial access to the video material. In navigation, 상기 방법이 단일 사용자 인터페이스 조직내에서, 스크린 상에 시간적으로 정리된 방식으로 키이프레임들을 배열하기 위한 제 1 동작 모드와, 표시된 바와 같이 인접하는 키이프레임들간에 불균일하고 선택가능한 입도로 키이프레임들을 배열하기 위한 제 2 동작 모드 사이에서 선택되도록 허용하는 것을 특징으로 하는 항법.The method arranges the keyframes in a single user interface organization with a first mode of operation for arranging the keyframes in a temporally arranged manner on the screen and with non-uniform and selectable granularity between adjacent keyframes as indicated. Navigation between the second modes of operation for 제 1 항에 있어서, 상기 시간적으로 정리된 방식 동안 시간적으로 집중된 키이프레임에 관련한 음성부분 간격을 점진적으로 플레이 백하는 항법.2. The navigation method of claim 1, wherein progressively playing back the speech portion intervals associated with the temporally focused keyframes during the temporally organized manner. 제 2 항에 있어서, 연속하는 음성부분 간격들이 불연속적으로 위치된 키이프레임들의 시퀀스에 관련하여 실질적으로 연속적인 음성부분 표시를 구성하는 항법.3. The navigation of claim 2, wherein successive speech segment intervals constitute a substantially continuous speech segment representation with respect to a sequence of discontinuously located keyframes. 제 1 항에 있어서, 상기 제 2 동작모드에서 실질적으로 억세스된 키이프레임에 관련된 음성부분 간격을 플레이 백하는 항법.2. The navigation method of claim 1, wherein the navigation of the voice portion intervals associated with the keyframes substantially accessed in the second mode of operation. 제 1 항에 있어서, 현재 선택된 키이프레임을 다중-크기 포맷에서 다른 키이프레임들에 대하여 확대시킴과 동시에 강조하며, 상기 항법이 해로운 비디오 엇갈림 효과를 검출하며 만일 그렇다면 수직 제거에 의해 상기 효과를 감소시키는 것을 더 포함하는 것을 특징으로 하는 항법.2. The method of claim 1, wherein the currently selected keyframe is enlarged and emphasized with respect to other keyframes in a multi-size format, and the navigation detects a harmful video staggering effect and if so reduces the effect by vertical elimination. Navigation further comprising. 제 1 항에 있어서, 현재 선택된 키이프레임을 다중-크기 포맷에서 다른 키이프레임들에 대하여 확대시킴과 동시에 강조하며, 상기 항법이 업샘플링 필터를 표시 이전에 영상에 적용하는 것을 더 포함하는 것을 특징으로 하는 항법.2. The method of claim 1, wherein the currently selected keyframe is enlarged and emphasized with respect to other keyframes in a multi-size format, wherein the navigation further comprises applying an upsampling filter to the image prior to display. Navigation. 제 1 항에 있어서, 설명 자막 또는 관련된 키이프레임 또는 연속적인 키이프레임들에 관해 추출된 다른 관련된 정보를 현실화된 키이프레임에 관련되어 더 표시하는 항법.The navigation system of claim 1, further displaying descriptive captions or other related information extracted about related keyframes or successive keyframes in relation to a materialized keyframe. 상기 제 1 항에 청구된 방법을 수행하기 위하여 배치된 장치.An apparatus arranged to carry out the method as claimed in claim 1.
KR1019980708181A 1997-02-03 1998-01-22 Method and apparatus for navigating through video material by multiple key-frames parallel display KR100552248B1 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP97200286.9 1997-02-03
EP97200286 1997-02-03
EP97201802.2 1997-06-16
EP97201802 1997-06-16
PCT/IB1998/000091 WO1998034182A2 (en) 1997-02-03 1998-01-22 A method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel

Publications (2)

Publication Number Publication Date
KR20000064909A true KR20000064909A (en) 2000-11-06
KR100552248B1 KR100552248B1 (en) 2006-06-15

Family

ID=27238396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980708181A KR100552248B1 (en) 1997-02-03 1998-01-22 Method and apparatus for navigating through video material by multiple key-frames parallel display

Country Status (3)

Country Link
EP (1) EP0914638A2 (en)
JP (1) JP2000516006A (en)
KR (1) KR100552248B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101537592B1 (en) * 2008-09-03 2015-07-22 엘지전자 주식회사 Mobile terminal and method for controlling the same

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7954056B2 (en) 1997-12-22 2011-05-31 Ricoh Company, Ltd. Television-based visualization and navigation interface
US7596755B2 (en) 1997-12-22 2009-09-29 Ricoh Company, Ltd. Multimedia visualization and integration environment
US8635531B2 (en) 2002-02-21 2014-01-21 Ricoh Company, Ltd. Techniques for displaying information stored in multiple multimedia documents
US7747655B2 (en) 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US8249423B2 (en) * 2008-05-08 2012-08-21 Sony Ericsson Mobile Communications Ab Electronic devices and methods that insert addressable chapter marks relative to advertising content in video streams
GB2477800A (en) * 2010-02-16 2011-08-17 Nds Ltd Video trick mode playback

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101537592B1 (en) * 2008-09-03 2015-07-22 엘지전자 주식회사 Mobile terminal and method for controlling the same
US9678587B2 (en) 2008-09-03 2017-06-13 Lg Electronics Inc. Terminal, controlling method thereof and recordable medium for the same
US10126866B2 (en) 2008-09-03 2018-11-13 Lg Electronics Inc. Terminal, controlling method thereof and recordable medium for the same

Also Published As

Publication number Publication date
JP2000516006A (en) 2000-11-28
KR100552248B1 (en) 2006-06-15
EP0914638A2 (en) 1999-05-12

Similar Documents

Publication Publication Date Title
US6222532B1 (en) Method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel
WO1998034182A2 (en) A method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel
JP3667262B2 (en) Video skimming method and apparatus
EP2127368B1 (en) Concurrent presentation of video segments enabling rapid video file comprehension
US6340971B1 (en) Method and device for keyframe-based video displaying using a video cursor frame in a multikeyframe screen
KR100411437B1 (en) Intelligent news video browsing system
KR101058054B1 (en) Extract video
Smith et al. Video skimming and characterization through the combination of image and language understanding techniques
CN100423572C (en) Apparatus and method for reproducing image
US6647535B1 (en) Methods and systems for real-time storyboarding with a web page and graphical user interface for automatic video parsing and browsing
CN100367786C (en) Display of closed captioned information during video trick modes
WO2006126391A1 (en) Contents processing device, contents processing method, and computer program
KR20030017997A (en) Method and system for selecting a position in an image sequence
CN102256095A (en) Electronic apparatus, video processing method, and program
JP2005524916A (en) Scalable video summarization
JP2006279827A (en) Summary-reproducing apparatus and control method for summary-reproducing apparatus
KR101440168B1 (en) Method for creating a new summary of an audiovisual document that already includes a summary and reports and a receiver that can implement said method
US20040181545A1 (en) Generating and rendering annotated video files
CN100551014C (en) The method of contents processing apparatus, contents processing
KR100552248B1 (en) Method and apparatus for navigating through video material by multiple key-frames parallel display
JPH11220689A (en) Video software processor and medium for storing its program
WO1998034181A2 (en) A method and device for keyframe-based video displaying using a video cursor frame in a multikeyframe screen
JPH1169281A (en) Summary generating device and video display device
KR20020023063A (en) A method and apparatus for video skimming using structural information of video contents
JP4609711B2 (en) Image processing apparatus and method, and program

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110207

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee