JP5346338B2 - Method for indexing video and apparatus for indexing video - Google Patents
Method for indexing video and apparatus for indexing video Download PDFInfo
- Publication number
- JP5346338B2 JP5346338B2 JP2010513897A JP2010513897A JP5346338B2 JP 5346338 B2 JP5346338 B2 JP 5346338B2 JP 2010513897 A JP2010513897 A JP 2010513897A JP 2010513897 A JP2010513897 A JP 2010513897A JP 5346338 B2 JP5346338 B2 JP 5346338B2
- Authority
- JP
- Japan
- Prior art keywords
- interest
- region
- data stream
- video data
- indexing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000000153 supplemental effect Effects 0.000 claims 4
- 230000000747 cardiac effect Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001824 photoionisation detection Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229920001690 polydopamine Polymers 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4728—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、ビデオを索引化する方法及びビデオを索引化する装置に関する。 The present invention relates to a method for indexing video and an apparatus for indexing video.
いくつかのピクチャ処理アプリケーションは、ピクチャ品質を向上させるために関心領域(ROI)の検出を使用する。例えば、符号化アプリケーションは多くの場合、関心領域を復号化し、前述の領域を符号化するために、より多くの資源を活用する。 Some picture processing applications use region of interest (ROI) detection to improve picture quality. For example, an encoding application often uses more resources to decode a region of interest and to encode the aforementioned region.
種々の方法が、ピクチャにおける関心領域の検出を可能にする。特に、視覚パラメータを考慮に入れ、ピクチャ又はビデオを視る際に人間の眼が永く残る領域の画定を可能にするピクチャ又はビデオの顕著性マップの確立に基づく手法が知られている。 Various methods allow detection of a region of interest in a picture. In particular, methods are known that take into account visual parameters and are based on the establishment of a saliency map of a picture or video that allows the definition of a region where the human eye will remain long when viewing the picture or video.
関心領域の検出は現在、主に、(例えば、前述の領域の量子化ステップを削減することにより、)より多くの帯域幅を与えることにより、符号化中に関心領域を特権化するように、符号化前に使用される。 Region-of-interest detection is currently primarily used to privilege the region of interest during encoding by providing more bandwidth (eg, by reducing the quantization step of the aforementioned region). Used before encoding.
移動端末(携帯電話機、PDA、ゲーム・コンソール、ポータブルDVDプレイヤなど)の出現、ディスプレイ及び画面の手法の進展、及び新規サービスの台頭が全て組み合わさって、表示容量が低い端末上でビデオを表示することが必要になっている。例えば、携帯電話機上でテレビを受信することができることにより、寸法が小さな画面上に高密度のピクチャを表示するうえで問題が生じている。 The appearance of mobile terminals (cell phones, PDAs, game consoles, portable DVD players, etc.), the development of display and screen techniques, and the rise of new services are all combined to display video on terminals with low display capacity. It is necessary. For example, since a television can be received on a mobile phone, there is a problem in displaying a high-density picture on a screen having a small size.
本発明は、主に、関心領域の検出でなく、種々のアプリケーションについて考慮に入れ、移動端末であってもなくても、低い表示容量を備えた端末上でのピクチャ表示の問題を少なくとも解決することが可能な、装置又はアプリケーションへの前述の関心領域の伝送に関する。 The present invention primarily takes into account various applications rather than region of interest detection, and at least solves the problem of picture display on terminals with low display capacity, whether mobile terminals or not. It relates to the transmission of the aforementioned region of interest to a device or application.
この目的で、本発明は、符号化ビデオ・データ・ストリームを索引化する方法を提案している。本発明によれば、ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、方法は、
符号化ビデオ・ストリームを受信する工程と、
記録サポート上に符号化ビデオ・ストリームする工程と、
関心領域の位置情報を復号化する工程と、
ピクチャ毎に関心領域を選択する工程と、
ビデオ・データを復号化する工程と、
ピクチャ毎に選択された関心領域からビデオ・データ・ストリームの所定数の関心領域を選択する工程と、
選択された関心領域を記録する工程と
を含む。
For this purpose, the present invention proposes a method for indexing an encoded video data stream. According to the invention, the video data stream contains information about the location of the region of interest for each picture, and the method comprises:
Receiving an encoded video stream;
Encoding the video stream on the recording support;
Decoding position information of the region of interest;
Selecting a region of interest for each picture;
Decoding the video data;
Selecting a predetermined number of regions of interest in the video data stream from regions of interest selected for each picture;
Recording the selected region of interest.
好ましい実施例では、記録する工程中に、
選択され、復号化されるにつれ、選択された関心領域が一時メモリに記録され、
選択された関心領域が全て、一時メモリに記録されると、選択された関心領域が永続的メモリ・サポート(503)に転送される。
In a preferred embodiment, during the recording process,
As selected and decrypted, the selected region of interest is recorded in temporary memory,
Once all the selected regions of interest have been recorded in temporary memory, the selected regions of interest are transferred to the permanent memory support (503).
好ましくは、記録される前に、関心領域は、選択された関心領域全てに均一のサイズを得るためにフォーマッティングされる。 Preferably, before being recorded, the region of interest is formatted to obtain a uniform size for all selected regions of interest.
好ましくは、方法は、暗号化鍵により、関心領域の位置を暗号化する工程を含む。 Preferably, the method includes the step of encrypting the location of the region of interest with an encryption key.
好ましくは、方法は、ユーザによる支払いにより、復号鍵を得る工程を含む。 Preferably, the method includes the step of obtaining a decryption key by payment by the user.
好ましくは、ビデオ・データ・ストリームは符号化標準H.264/AVCに応じて符号化され、位置情報は付加拡張情報(SEI)タイプ・メッセージに含まれる。 Preferably, the video data stream is encoded standard H.264. The position information is included in a supplementary extended information (SEI) type message.
好ましい実施例によれば、SEIメッセージは、リアルタイム・プロトコル・パケット(RTP)にカプセル化され、RTPパケットは暗号化される。 According to a preferred embodiment, SEI messages are encapsulated in real-time protocol packets (RTP) and RTP packets are encrypted.
好ましくは、関心領域位置情報に関する付加拡張情報タイプ・メッセージは、参照する各ピクチャの前後の符号化データに挿入される。 Preferably, the additional extended information type message regarding the region-of-interest position information is inserted into encoded data before and after each picture to be referred to.
好ましい実施例によれば、位置情報は、
各ピクチャにおける関心領域の数と、
ピクチャの寸法毎の関心領域毎の座標と、
関心領域毎の表面と、
ピクチャの他の関心領域に対する関心領域の重要度に対する重みと、
関心領域毎のコンテンツに関する情報と、
前述の情報の何れかの組合せ
から選ばれる情報を含む。
According to a preferred embodiment, the location information is
The number of regions of interest in each picture,
Coordinates for each region of interest for each dimension of the picture,
A surface for each region of interest;
A weight for the importance of the region of interest relative to other regions of interest in the picture;
Information about content for each area of interest,
Information selected from any combination of the foregoing information is included.
好ましくは、ピクチャ毎の関心領域の選択工程は、関心領域の重要度に対する重みに応じて関心領域を選択する。 Preferably, the region of interest selection step for each picture selects the region of interest according to the weight for the importance of the region of interest.
好ましくは、ビデオ符号化標準は、柔軟なマクロブロック配列を使用し、関心領域は他のピクチャ・データとは無関係に、スライス群に符号化され、関心領域の位置情報は、関心領域が符号化されるスライス群番号を含む。 Preferably, the video coding standard uses a flexible macroblock arrangement, the region of interest is encoded into slices independently of other picture data, and the location information of the region of interest is encoded by the region of interest. The slice group number to be processed.
好ましくは、付加拡張情報メッセージは、一関心領域に関係しているかを、スライス群毎に示す識別子を含む。 Preferably, the additional extended information message includes an identifier for each slice group indicating whether or not it relates to one region of interest.
好ましくは、方法はSEIメッセージを読み出す更なる工程を含み、ビデオ・データの復号化の工程は関心領域を含むスライス群のみを復号化する。 Preferably, the method includes the further step of reading out the SEI message, and the step of decoding the video data decodes only the slice group including the region of interest.
本発明は、符号化ビデオ・データ・ストリームを索引化する装置にも関する。本発明によれば、ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、装置は、
符号化ビデオ・ストリームを受信する手段と、
記録サポート上に符号化ビデオ・ストリームを記録する手段と、
関心領域の位置情報を復号化する手段と、
ビデオ・データを復号化する手段と、
ピクチャ毎に関心領域を選択する手段と、
ピクチャ毎に選択された関心領域からビデオ・データ・ストリームの所定数の関心領域を選択する手段と、
選択された関心領域を記録する手段
とを備える。
The invention also relates to an apparatus for indexing an encoded video data stream. According to the invention, the video data stream contains information about the location of the region of interest for each picture,
Means for receiving an encoded video stream;
Means for recording the encoded video stream on a recording support;
Means for decoding position information of the region of interest;
Means for decoding the video data;
Means for selecting a region of interest for each picture;
Means for selecting a predetermined number of regions of interest in the video data stream from regions of interest selected for each picture;
Means for recording the selected region of interest.
ピクチャの関心領域の検出は一般に、符号化前に行われる。このデータは次いで、符号化を容易にするために使用される。関心領域の位置が、ピクチャの復号化中に、特に、表示容量が制限された装置上の表示中に、関心のあるということを本願の発明者は認識している。実際に、受信端末は、関心領域のみの表示を選び、完全なピクチャの表示に対して前述の領域のより良好な可視性を有することを可能にすることができる。 Detection of a region of interest in a picture is generally performed before encoding. This data is then used to facilitate encoding. The inventor of the present application recognizes that the position of the region of interest is of interest during decoding of a picture, particularly during display on a device with limited display capacity. In fact, the receiving terminal can choose to display only the region of interest and allow it to have better visibility of the aforementioned region for the complete picture display.
本発明は、限定列挙でないが、添付図面を参照して実施例及び実現形態により、更に深く理解し、例証されよう。 The present invention will be more fully understood and illustrated by way of example and implementation with reference to the accompanying drawings, but not limiting enumeration.
図1は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による符号化装置を示す。前述の好ましい実施例では、ビデオ・ストリームが符号化される。 FIG. 1 illustrates the H.264 implementation of the preferred embodiment of the present invention. 1 shows an encoding device according to the H.264 / AVC encoding standard. In the preferred embodiment described above, the video stream is encoded.
現在のフレームFnが、符号化器によって符号化されるために符号化器の入力に供給される。前述のフレームは、スライスの形式で符号化される、すなわち、前述のフレームは、16×16画素群に対応する特定数のマクロブロックをそれぞれが含むサブユニットに分割される。各マクロブロックはイントラ・モード又はインター・モードで符号化される。イントラ・モードであってもインター・モードであっても、マクロブロックは、再構成されたフレームに基づいて符号化される。モジュール109は、ピクチャのコンテンツに応じて、現在のピクチャの符号化モードをイントラ・モードに決定する。イントラ・モードでは、P(図2に示す)は、先行して符号化され、復号化され、再構成された(図2中のuF’n、uはフィルタリングされていない)現在のフレームFnのサンプルを含む。インター・モードでは、Pは、1つ又は複数のF’n−1フレームに基づいた動き推定から生じる。
The current frame F n is supplied to the encoder input for encoding by the encoder. The aforementioned frames are encoded in the form of slices, i.e. the aforementioned frames are divided into subunits each containing a specific number of macroblocks corresponding to a 16x16 pixel group. Each macroblock is encoded in intra mode or inter mode. Whether in intra mode or inter mode, the macroblock is encoded based on the reconstructed frame. The
動き推定モジュール101は、現在のフレームFnと少なくとも1つの先行フレームF’n−1との間の動きの推定を確立する。この動き推定から、動き補償モジュール102は、現在のピクチャFnがインター・モードで符号化しなければならない場合、フレームPを生成する。
The
減算器103は、信号Dn(すなわち、符号化する対象のピクチャFnと、ピクチャPとの間の差)を生成する。次いで、このピクチャは、モジュール104においてDCT変換によって変換される。変換されたピクチャが次いで、量子化モジュール105によって量子化される。次いで、ピクチャがモジュール111によって再編成される。CABAC(コンテキストベースの適応的二進算術符号化)型エントロピ符号化モジュール112は次いで、各ピクチャを符号化する。
The
モジュール106及び107(それぞれ、量子化モジュール及び逆変換モジュール)は、変換及び量子化に続く逆量子化及び逆変換の後、差D’nが再構成されることを可能にする。
ピクチャが、モジュール109により、イントラ・モードで符号化されると、イントラ予測モジュール108はピクチャを符号化する。uF’nピクチャ、並びにD’n信号及びP信号の和が、加算器の出力114で得られる。このモジュール108は、再構成されたフィルタリングされていないF’nのピクチャを入力で受け取る。
When the picture is encoded in intra mode by
フィルタ・モジュール110は、uF’nピクチャから再構成され、フィルタリングされたF’nピクチャを得ることが可能である。
エントロピ復号化モジュール112は、NALタイプのユニットでカプセル化された符号化スライスを送信する。NALは、例えば、ヘッダに関する情報、及びスライスを含む。NALタイプ・ユニットはモジュール113に送信される。
The
モジュール116は、関心領域が求められることを可能にする。現在、いくつかの手法により、関心領域がピクチャ内で位置特定されることを可能にする。顕著性マップの確立に基づいた手法が特に知られている。例えば、トムソン・ライセンシング(Thompson Licensing)社により、西暦2006年7月13日付けで出願された特許出願の国際公開2006/07263号パンフレット(西暦2006年7月13日付け公開
)には、顕著性マップを作成する効果的な方法が開示されている。
手段116は次いで、ビデオのピクチャ毎に顕著性マップを確立する。前述の顕著性マップを確立するために、ユーザによって入力されるパラメータも考慮に入れ得る。例えば、ビデオが関係するイベントに応じて、撮影されたシーンの特定の重要な対象を規定し、特に、スポーツ・イベントの場合、それがサッカーの試合に関係している旨を規定することが可能である。効果的には、これにより、イベントに応じて顕著性ゾーンを重み付ける顕著性マップを得ることが可能になる。サッカーの試合では、スタンドではなくボールに焦点を当てることが好ましい。
関心領域モジュールはしたがって、1つ又は複数の顕著性ゾーン(関心領域としても表される)が抽出されることを可能にする。前述の関心領域は次いで、ピクチャ上で地理的に位置特定される。 The region of interest module thus allows one or more saliency zones (also represented as regions of interest) to be extracted. The aforementioned region of interest is then geographically located on the picture.
前述の関心領域は、ピクチャの高さ及び幅に応じて座標によって識別される。前述のサイズは、関心領域毎に抽出することも可能である。意味情報の要素と関連付けることも可能である。実際に、サッカーの試合の場合、ユーザが、表示する対象のいくつかの関心領域の選択肢から、表示する対象の関心領域を選択することが可能な場合、関心領域に関する情報を必要とし得る。 The aforementioned region of interest is identified by coordinates according to the height and width of the picture. The aforementioned size can be extracted for each region of interest. It can also be associated with elements of semantic information. In fact, in the case of a soccer game, if the user is able to select a region of interest to display from a selection of several regions of interest to display, information about the region of interest may be required.
モジュール115は、SEI(「付加拡張情報」)タイプ・メッセージにコード化するために関心領域に関する情報を受け取る。
SEIメッセージは、以下の表に示すように符号化される。 The SEI message is encoded as shown in the following table.
user_data_payload_byte:SEIメッセージの一部を含む8ビット
通常、この場合、
payloadSize=17(バイト)、よって、UUIDは16であり、固有データは1である。
user_data_payload_byte: 8 bits containing part of the SEI message
payloadSize = 17 (bytes), so the UUID is 16 and the unique data is 1.
user_data_payload_byte: user_data_payload_byte:
roi_x_16:16個の画素の倍数での、関心領域のピクチャにおけるXの位置
roi_y_16:16個の画素の倍数で、関心領域のピクチャにおけるYの位置
roi_w_16:関心領域のピクチャ内の幅(16画素の倍数)
roi_h_16:関心領域のピクチャ内の高さ(16画素の倍数)
semantic_information:関心領域を特徴付ける題名
相対的重み:基本的に最も関心の高い関心領域が分かるようにピクチャの関心領域毎の重みを表す。
roi_h — 16: height of the region of interest in the picture (multiple of 16 pixels)
semantic_information: Title that characterizes the region of interest Relative weight: Basically represents the weight of each region of interest in the picture so that the region of interest of highest interest is known.
Macroblock_alignment:関心領域が存在する開始マクロブロックの数、マクロブロック数、幅、及び高さでの、関心領域のサイズを表す。 Macroblock_alignment: Represents the size of the region of interest in the number of starting macroblocks, the number of macroblocks, the width, and the height where the region of interest exists.
関心領域が、顕著性マップを使用して検出されると、顕著性レートが、関心領域毎に得られ、顕著性マップを得る手法によって予め求められた特定の閾値よりも顕著性が高い場合、領域は顕著であるとして分類される。よって、SEIメッセージでは、関心領域は、固定閾値よりも顕著性が高い領域全ての顕著性の昇順で分類される。
モジュール113は、SEIメッセージをデータ・ストリームに挿入し、そうして符号化されたビデオ・ストリームを伝送ネットワークに送出する。
When a region of interest is detected using a saliency map, a saliency rate is obtained for each region of interest, and if the saliency is higher than a specific threshold previously determined by the technique for obtaining the saliency map Regions are classified as prominent. Therefore, in the SEI message, the region of interest is classified in ascending order of the saliency of all the regions that are more saliency than the fixed threshold.
SEIメッセージは、参照するピクチャそれぞれよりも前に伝送される。 The SEI message is transmitted before each referenced picture.
他の実施例では、2つ以上のピクチャ間で少なくとも1つの関心領域の位置が変動した場合にのみ、SEIメッセージを伝送することも可能である。よって、復号化中、復号化器は、復号化する対象のピクチャの直前であっても、前述のSEIメッセージに現在のピクチャが先行しない場合に先行して受信されたピクチャに関する場合でも、直近に受信されたSEIメッセージを考慮に入れる。 In other embodiments, the SEI message can be transmitted only when the position of at least one region of interest varies between two or more pictures. Thus, during decoding, the decoder will be in the immediate vicinity whether it is immediately before the picture to be decoded or if it is related to a previously received picture if the current picture does not precede the SEI message. Take into account the received SEI message.
図2は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による符号化方法を示す。 FIG. 2 illustrates the H.264 implementation of the preferred embodiment of the present invention. 2 illustrates an encoding method according to the H.264 / AVC encoding standard.
工程E1中、放送する対象のビデオに関連付けられた顕著性マップが求められる。関心領域を示す前述の顕著性マップを求めるために、ビデオ・コンテンツに関する情報は、顕著性マップの確立中にこの情報を考慮に入れるために受け取ることも可能である。特に、スポーツ・イベントの間、ボールの位置は、ユーザの関心領域に対応し、この場合、ボールが位置しているピクチャのゾーンを特権化する。ビデオが、テレビ中継レポートの放送に対応する場合、例えば、既知のピクチャ処理手法を使用して顔を検出することにより、司会者を含むゾーンを特権化することにより、関心領域を求めるものとし得る。 During step E1, a saliency map associated with the video to be broadcast is determined. In order to determine the aforementioned saliency map indicating the region of interest, information about the video content may also be received to take this information into account during establishment of the saliency map. In particular, during a sporting event, the position of the ball corresponds to the user's region of interest, in which case the picture zone in which the ball is located is privileged. If the video corresponds to the broadcast of a television broadcast report, the region of interest may be determined, for example, by privileged the zone containing the moderator by detecting faces using known picture processing techniques. .
E1工程の終了時に、ビデオ・コンテンツに関する1つ又は複数の関心領域がよって、得られる。 At the end of the E1 process, one or more regions of interest for the video content are thus obtained.
工程E2中に、ピクチャ内の関心領域の座標が求められる。関心領域のサイズは、画素においても求めることが可能であり、コンテンツ上の意味情報を各関心領域と関連付けることが可能である。 During step E2, the coordinates of the region of interest in the picture are determined. The size of the region of interest can also be obtained in pixels, and the semantic information on the content can be associated with each region of interest.
並列に、工程E3中に、ビデオ・ストリームは、H.264符号化標準に応じて符号化される。符号化中、関心領域として検出されたゾーンが特権化される。符号化レベルにおける関心領域を特権化するために、より低い量子化ステップが施される。 In parallel, during step E3, the video stream is H.264. It is encoded according to the H.264 encoding standard. During encoding, zones detected as regions of interest are privileged. In order to privilege the region of interest at the coding level, a lower quantization step is applied.
工程E2に続いて、工程E4中、SEIメッセージが、関心領域に関連付けられた意味情報及び位置から作成される。そうして作成されたSEIメッセージは、表1及び表2において上述されたSEIメッセージによる。 Subsequent to step E2, during step E4, an SEI message is created from the semantic information and location associated with the region of interest. The SEI message thus created is based on the SEI message described above in Tables 1 and 2.
工程E5中、ストリームは、H.264標準による符号化ストリームを得るためにストリームにSEIメッセージを挿入することによって構成される。 During step E5, the stream is H.264. In order to obtain an encoded stream according to the H.264 standard, it is constructed by inserting an SEI message into the stream.
そうして符号化されたビデオ・ストリームは、工程E6中に、リアルタイムで、又は遅らせて復号化装置に送信され、復号化装置は局所又は遠隔であり得る。 The encoded video stream is then transmitted to the decoding device in real time or delayed during step E6, which may be local or remote.
図3は、H.264/AVC符号化標準により、本発明による復号化装置の好ましい実施例を表す。 FIG. The H.264 / AVC coding standard represents a preferred embodiment of the decoding device according to the invention.
モジュール209は、入力においてSEIメッセージを受信する。モジュール209は、別々のSEIメッセージを抽出する。有用データのNALはエントロピ復号化モジュール201に送信される。
SEIメッセージはモジュール210によって解析される。このモジュールは、関心領域を表すSEIメッセージのコンテンツの復号化を可能にする。各ピクチャの関心領域はよって、単純なやり方で、かつ、macroblock_alignmentというフィールドに含まれる情報を使用して各ピクチャの復号化前に復号化装置のレベルで識別される。
The SEI message is parsed by
マクロブロックは、係数の組を得るために再配列モジュール202に送信される。前述の係数は、モジュール203における逆量子化、及びモジュール204における逆DCT変換を経る。モジュール204の出力では、D’nのマクロブロックが得られ、D’nはDnの変形されたバージョンである。予測ブロックPを加算器205により、D’nに加算してマクロブロックuF’nを再構成する。ブロックPは、インター・モードにおける符号化中に、先行する復号化フレームの、モジュール208によって行われる動き補償後に、又は、イントラ・モードにおける符号化の場合、モジュール207による、マクロブロックuF’nのイントラ予測後に得られる。フィルタ206は、歪みの影響を削減するために信号uF’nに施され、再構成されたフレームF’nが一連のマクロブロックから生成される。
The macroblock is sent to the
SEIメッセージに含まれる関心領域に関する情報を使用して、関心領域を表すブロックがストリームにおいて、表示前に検出され、前述のブロックが識別され、ユーザの選択に応じてクロッピングし、PDAや携帯電話機などの装置に、表示するために送信することが可能である。 Using information about the region of interest included in the SEI message, blocks representing the region of interest are detected in the stream before display, the aforementioned blocks are identified, cropped according to the user's choice, such as a PDA or mobile phone Can be sent to other devices for display.
例えば、意味情報を入力することにより、表示したいマクロブロックを選ぶためにユーザに選択を任せることも可能である。例えば、「ボール」を入力し、この場合、ボールを含む関心領域が表示される。この意味情報に関連付けられた関心領域が存在しない場合、関心領域全てを表示することが可能である。種々の関心領域を画面上にモザイクの形式で表示することが可能である。単一の関心領域が表示されると、前述の関心領域は、全画面を占めるように画面上にズームで表示される。 For example, by inputting semantic information, it is possible to leave the selection to the user to select a macroblock to be displayed. For example, “Ball” is input, and in this case, a region of interest including the ball is displayed. If there is no region of interest associated with this semantic information, it is possible to display the entire region of interest. It is possible to display various regions of interest on the screen in the form of a mosaic. When a single region of interest is displayed, the region of interest is displayed on the screen in a zoom so as to occupy the entire screen.
復号化装置はよって、ユーザに対する関心情報を含んでいる可能性が高いマクロブロックのみを復号化する。このようにして、復号化は、より高速になり、復号化装置のレベルで、かつ、したがって、受信側で必要とする資源が少なくなる。受信装置が、処理容量が限定的な移動端末である場合、このことは特に効果的である。 The decoding device thus only decodes macroblocks that are likely to contain interest information for the user. In this way, the decoding is faster and requires less resources at the level of the decoding device and therefore on the receiving side. This is particularly effective when the receiving device is a mobile terminal with limited processing capacity.
図4は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による復号化方法を示す。 FIG. 4 shows an H.264 implementation of the preferred embodiment of the present invention. 2 shows a decoding method according to the H.264 / AVC coding standard.
前述の方法は、表示容量が限定的な移動端末において実現することが可能である。 The above-described method can be realized in a mobile terminal having a limited display capacity.
工程S1中、必要な表示のタイプが選択される。選択は、移動端末上に存在しているユーザ・インタフェースによって行われる。完全ピクチャ・モードで機能することにされる場合、送信器によって送信されるにつれ、ビデオ・ストリーム全体が表示される。あるいは、ピクチャの関心領域のみを表示することにされる。この特定のモードは、本発明の特徴を構成する。関心領域を表示することにした場合、工程S2に移り、さもなければ、工程S8に移る。各種SEIメッセージを、他のアプリケーションのビデオ・ストリームに挿入することが可能であり、この場合、工程S8前、又は工程S8中、SEIメッセージ解析の工程が存在し得る。 During step S1, the required display type is selected. The selection is made by means of a user interface that exists on the mobile terminal. If it is decided to work in full picture mode, the entire video stream is displayed as it is transmitted by the transmitter. Alternatively, only the region of interest of the picture is displayed. This particular mode constitutes a feature of the present invention. If the region of interest is to be displayed, the process moves to step S2, otherwise the process moves to step S8. Various SEI messages can be inserted into the video streams of other applications, in which case there may be a step of SEI message analysis before or during step S8.
工程S2中、ユーザは、関心領域の使用法を選択する。特に、ユーザは、
表示したい関心領域の最大数、
画面上に種々の関心領域を表示したい態様(例えば、モザイクの形式)、
関心領域に対して望まれるズームの度合いを選択することが可能であり、
キーワードを使用して、「意味情報」フィールドがキーワードを含む関心領域
を選択することが可能である。この場合、ピクチャ毎に、キーワードを含むピクチャ毎に単一の関心領域(この場合、顕著度が最大の関心領域)を表示することが必要であるか、又はキーワードを含むいくつかの関心領域を表示することが必要であるかを規定することも可能である。
During step S2, the user selects how to use the region of interest. In particular, users
The maximum number of regions of interest you want to display,
A mode of displaying various regions of interest on the screen (for example, mosaic format),
It is possible to select the degree of zoom desired for the region of interest,
Using keywords, it is possible to select a region of interest whose "semantic information" field contains the keyword. In this case, for each picture, it is necessary to display a single region of interest (in this case, the region of greatest saliency) for each picture containing the keyword, or several regions of interest containing the keyword It is also possible to define whether it is necessary to display.
工程S3中、ストリームに存在しているSEIメッセージは、受信されるにつれて解析される。SEIメッセージは、ピクチャ符号化前に検出されたピクチャの関心領域の位置を符号化するために使用される。よって、ピクチャ毎に、ピクチャの視覚特性により、若しくはピクチャ・コンテンツにより、又は両方により、1つ又は複数の関心領域が存在し得る。SEIメッセージは、前述した表1及び表2によって符号化される。SEIメッセージに関する情報は、時間上、対応するピクチャの表示まで記録される。 During step S3, SEI messages present in the stream are analyzed as they are received. The SEI message is used to encode the position of the region of interest of the picture detected before picture encoding. Thus, for each picture, there may be one or more regions of interest, depending on the visual characteristics of the picture, or by the picture content, or both. The SEI message is encoded according to Tables 1 and 2 described above. Information about the SEI message is recorded until the display of the corresponding picture in time.
工程S4中、ピクチャは全て、復号化標準に従って復号化される。 During step S4, all pictures are decoded according to the decoding standard.
工程S5中、復号化された関心領域は、S2工程中にユーザが選択したものによって処理される。ユーザが、ピクチャの主関心領域のズームを選択した場合、工程S6中、最大表示サイズに達するようにゾーンが拡大される。ユーザが、関心領域のモザイクを選択した場合、ピクチャは関心領域で再構成され、それぞれの関心領域は、表示に選択された関心領域の数及び画面サイズによって拡大される。ユーザがキーワードを規定した場合、キーワードを含む関心領域が表示され、ズームされる。 During step S5, the decoded region of interest is processed according to what the user selected during step S2. If the user chooses to zoom the main region of interest of the picture, the zone is enlarged to reach the maximum display size during step S6. If the user selects a mosaic of regions of interest, the picture is reconstructed with regions of interest, and each region of interest is magnified by the number of regions of interest selected for display and the screen size. When the user defines a keyword, the region of interest containing the keyword is displayed and zoomed.
工程S7中、関心領域が、ユーザの望みに応じて、移動端末の画面上に表示される。 During step S7, the region of interest is displayed on the screen of the mobile terminal according to the user's desire.
工程S8中、ユーザによる、関心領域のみを表示する旨の非選択に続いて、ビデオ・ストリーム全体が、表示のために復号化される。 During step S8, following the deselection by the user to display only the region of interest, the entire video stream is decoded for display.
図5は、本発明のビデオ索引化アプリケーションを示す。 FIG. 5 illustrates the video indexing application of the present invention.
図5は、パーソナル・レコーダ(PVR)タイプの装置500を部分的に示す。PVR500は、その入力で圧縮ビデオ・ストリームを受信する。上述の実施例によれば、このビデオ・データ・ストリームは、H.264符号化標準に従っている。圧縮ビデオ・ストリームは、特に、表1及び表2で上述したようなSEIメッセージを含む。
FIG. 5 partially shows a personal recorder (PVR)
このビデオ・データ・ストリームは、記録サポート503に部分的に送信される。記録サポートは、ハード・ディスク、ホログラフィック・サポート、メモリ・カード、又は「ブルー・レイ」ディスクとみなし得る。この記録サポートは他の実施例では遠隔であり得る。
This video data stream is partially transmitted to the
ビデオ・データ・ストリームは、(例えば、テレビ受像機上に表示されるために)リアルタイムで復号化するために復号化器501に別の部分において送信される。既知の装置では、ストリームは、ユーザがリアルタイムで視たい場合、復号化器501に送信される。否定の場合、記録が要求された場合、復号化されないが、単純に記録される。
The video data stream is transmitted in another part to
本発明は、この局面によれば、リアルタイムでの視聴が要求されない場合でも、ビデオ・データ・ストリームの部分の復号化を提供する。ビデオ・ストリームの部分の場合、特に、関心領域又は特定の関心領域である。 The present invention, according to this aspect, provides for decoding a portion of a video data stream even when real-time viewing is not required. In the case of parts of a video stream, in particular a region of interest or a specific region of interest.
復号化器501が、記録が要求されたビデオ・ストリームを受信すると、データは、記録サポート503に送信される。記録サポート503は、受信されるにつれ、データを記録する。同時に、復号化器501は、ビデオ・データ・ストリームを受信し、SEIメッセージを漸次、復号化する。復号化された関心領域は、記録サポート503に送信する前に、一時的に記録する役割を果たすビデオ索引化モジュール502に送信される。
When the
図6は、復号化器501及び索引化モジュール502によって実現される方法を示す。
FIG. 6 shows the method implemented by the
工程T1中、ビデオ・データ・ストリームは復号化器501によって受信される。工程T2中、復号化器501は、ビデオ・データ・ストリームに存在しているSEIメッセージを復号化する。復号化されたSEIメッセージは、表1及び表2に上述されたようなSEIメッセージである。復号化器は、他のSEIメッセージを復号化することも可能であるが、これは本発明の目的でない。各SEIメッセージは、表1及び表2に上述したようなピクチャ毎に1つ又は複数の関心領域を表すことが可能である。工程T3中、復号化器501は、各SEIメッセージを解析し、各ピクチャを復号化する。この工程中、SEIメッセージにおいて示された重みは、どの関心領域がピクチャ毎に記録されるかを選択するために使用される。好ましい実施例では、顕著性が最大の(すなわち、重みが最高の)関心領域が維持される。
During step T1, the video data stream is received by the
関心領域が復号化されると、工程T4中に、索引化モジュール502に送信される。ピクチャ(全てのピクチャ)毎の関心領域の記録に対する関心は低い。情報量が大きく、効率的なビデオ索引化を可能にしないからである。よって、索引化モジュールは、ビデオを索引化するためにどのピクチャを使用するかを決定する。上述の好ましい実施例によれば、約10のみのピクチャが、1.5時間のビデオについて選択される。他の実施例では、ピクチャの数が大きくなることが想定される。前述の10個のピクチャは、等間隔で撮られる。前述の選択されたピクチャは、索引化モジュール502に含まれるRAMタイプのメモリ(図示せず)に一時的に記録される。最善のやり方で表示されるために、ピクチャは、工程T5中にズーミングされる。すなわち、全て、同じサイズであるように拡大される。好ましい実施例では、このサイズはピクチャのサイズであり得る。そのために、それらは、一時メモリにおいて読み出され、拡大後に再記録される。別の実施例では、ピクチャは、一時メモリにおける記録前に拡大される。
Once the region of interest is decoded, it is sent to the
別の実施例によれば、画像はディスプレイ上のモザイクとして提示される。したがって、拡大される代わりに、画像は、全てについて同様に、1つの単一サイズに縮小される。 According to another embodiment, the image is presented as a mosaic on the display. Thus, instead of being enlarged, the image is reduced to one single size for all as well.
ビデオ全体が受信され、記録サポート503において記録されると、索引化ピクチャは、一時メモリから記録サポート503に転送され、ファイルに記録される。
When the entire video is received and recorded at the
次いで、所望の使用によれば、関心領域は、索引化に使用される。上記索引化により、ユーザがデータベースの内容を照会したい場合に、レコーダがビデオの画像を表示することが可能になる。 Then, according to the desired use, the region of interest is used for indexing . By the indexing, if the user wants to query the contents of the database, the recorder it is capable ing for displaying an image of the video.
本発明の別の局面によれば、SEIメッセージの符号化中に関心領域の位置データを暗号化することも可能である。よって、復号鍵を有するユーザのみが、関心領域にアクセスし、関心領域の視覚化にアクセスするか、又は、関心領域の位置情報により、ビデオ・ストリームの索引にアクセスすることが可能である。この暗号化工程(図2を参照)は、工程E4’(図示せず)になるが、工程E4後に挿入される。 According to another aspect of the present invention, it is possible to encrypt the position data of the region of interest during the encoding of the SEI message. Thus, only the user with the decryption key can access the region of interest, access the visualization of the region of interest, or access the index of the video stream with the location information of the region of interest. This encryption step (see FIG. 2) becomes step E4 '(not shown), but is inserted after step E4.
復号鍵の取得は、例えば、番組放送者からの有料サービスの対象であり得る。 The acquisition of the decryption key can be, for example, a pay service target from a program broadcaster.
これを行うために、関心領域に関するSEIメッセージは、RTP(リアルタイム・プロトコル)タイプ・パケットにカプセル化され、別のビデオ・ポート上に送信される。時間CTSタイプ・ラベルは、対応するピクチャと、関心領域に関するSEIメッセージとを関係付けることが可能である。効果的には、この送信モードは、ビデオでなく、SEIメッセージを含むRTPパケットのみを暗号化することを可能にする。 To do this, the SEI message for the region of interest is encapsulated in RTP (Real Time Protocol) type packets and sent on another video port. The temporal CTS type label can relate the corresponding picture to the SEI message for the region of interest. Effectively, this transmission mode makes it possible to encrypt only RTP packets that contain SEI messages, not video.
復号は、端末受信器のレベルで行われる。 Decoding is performed at the terminal receiver level.
MPEG−2 TSカプセル化の場合、使用される暗号化標準はDVB−CSAであり、関心領域に関するSEIメッセージは、ビデオのものとは別のPIDにカプセル化される。関心領域に関するSEIメッセージは、PESパケット・ヘッダのPTS(タイムスタンプ)を介して、対応するピクチャに関係付けられる。この送信モードは、ビデオPIDではなく、関心領域に関するSEIメッセージを含むPIDのみの暗号化を可能にする。 In the case of MPEG-2 TS encapsulation, the encryption standard used is DVB-CSA, and the SEI message for the region of interest is encapsulated in a PID different from that of the video. The SEI message for the region of interest is related to the corresponding picture via the PTS (Time Stamp) in the PES packet header. This transmission mode allows encryption of only PIDs containing SEI messages regarding the region of interest, not video PIDs.
別の実施例では、ビデオ・ストリームは、ピクチャの別々の部分を無関係に符号化し、よって、無関係に復号化することを可能にするFMO(柔軟なマクロブロック配列)を使用してH.264/AVC符号化標準によって符号化される。FMOモードは「スライス群」を使用する。「スライス群」は標準に規定されている。この実施例では、関心領域は、ピクチャの残りとは別の群において符号化される。PPSタイプのNALは、「スライス群」のマップを含む。関心領域が符号化された「スライス群」を示す、後述のものなどのSEIメッセージが挿入される。 In another embodiment, the video stream is encoded in H.264 using FMO (Flexible Macroblock Array), which allows independent portions of pictures to be encoded independently and thus decoded independently. It is encoded according to the H.264 / AVC encoding standard. The FMO mode uses “slice group”. The “slice group” is defined in the standard. In this embodiment, the region of interest is encoded in a different group than the rest of the picture. The PPS type NAL includes a map of “slice groups”. An SEI message such as that described below is inserted, indicating a “slice group” in which the region of interest is encoded.
以下の表は、この実施例によって使用されるSEIメッセージの形式を示す。 The following table shows the format of the SEI message used by this example.
user_data_payload_byte:SEIメッセージの一部を含む8ビット
通常、この場合、
payloadSize=17(バイト)。よって、UUIDは16であり、固有データは1である。
user_data_payload_byte: 8 bits containing part of the SEI message
payloadSize = 17 (bytes). Therefore, the UUID is 16 and the unique data is 1.
user_data_payload_byte: user_data_payload_byte:
関心領域を表すslice_group毎に、意味情報、相対重み、及び関係するマクロブロックを規定することが可能である。 For each slice_group representing a region of interest, semantic information, relative weights, and related macroblocks can be defined.
よって、関心領域に対応するマクロブロックのみを、無関係に識別され、符号化されるにつれ、受信中に復号化することが可能である。 Thus, only the macroblock corresponding to the region of interest can be decoded during reception as it is independently identified and encoded.
Claims (14)
前記パーソナル・レコーダ装置が復号化器用の符号化ビデオ・データ・ストリームを受信する工程と、
記録サポートが前記記録サポート上に前記符号化ビデオ・データ・ストリームを記録する工程と、
復号化器が関心領域の位置情報を復号化する工程と、
ビデオ索引化モジュールがピクチャ毎に関心領域を選択する工程と、
前記復号化器が符号化ビデオ・データ・ストリームを復号化する工程と、
前記ビデオ索引化モジュールがピクチャ毎に前記選択された関心領域から前記ビデオ・データ・ストリームの所定数の関心領域を選択する工程と、
前記記録サポートが前記記録サポート上に前記ビデオ・データ・ストリームの前記選択された関心領域を記録する工程と
を含む、索引化する方法。 A method for indexing an encoded video data stream by a personal recorder device , wherein the video data stream includes information about the location of a region of interest in each picture, the method comprising:
The personal recorder device receiving an encoded video data stream for a decoder;
Recording support recording the encoded video data stream on the recording support;
A decoder decoding position information of the region of interest;
A step of video indexing module selects the region of interest for each picture,
A step of the decoder to decode the encoded video data stream,
The step of the video indexing module selects a predetermined number of regions of interest of the video data stream from said selected region of interest for each picture,
The recording support comprising: recording the selected region of interest of the video data stream on the recording support.
前記ビデオ・データ・ストリームが復号化され、前記ビデオ・データ・ストリームの前記関心領域が選択されるにつれ、前記ビデオ・データ・ストリームの前記選択された関心領域が一時メモリに記録され、
前記ビデオ・データ・ストリームの前記選択された関心領域が前記一時メモリに記録されると、前記ビデオ・データ・ストリームの前記選択された関心領域が記録サポートに転送される、索引化する方法。 The indexing method of claim 1, wherein the recording support records the selected region of interest of the video data stream.
As the video data stream is decoded and the region of interest of the video data stream is selected, the selected region of interest of the video data stream is recorded in temporary memory;
The indexing method, wherein when the selected region of interest of the video data stream is recorded in the temporary memory, the selected region of interest of the video data stream is transferred to a recording support.
前記ビデオ索引化モジュールが前記ビデオ・データ・ストリームの所定数の関心領域を選択する工程と、前記記録サポートが前記ビデオ・データ・ストリームの前記選択された関心領域を記録する工程との間に、前記ビデオ・データ・ストリームの前記選択された関心領域の一様なサイズを得るために前記ビデオ・データ・ストリームの前記選択された関心領域を前記パーソナル・レコーダ装置がズーミングする工程を含む、索引化する方法。 The indexing method according to claim 1, wherein the method comprises:
Between the video indexing module selecting a predetermined number of regions of interest in the video data stream and the recording support recording the selected regions of interest in the video data stream. Indexing comprising zooming the selected region of interest of the video data stream with the personal recorder device to obtain a uniform size of the selected region of interest of the video data stream how to.
各ピクチャにおける関心領域の数、
ピクチャ幅及びピクチャ高さに応じた、関心領域それぞれの座標、
関心領域それぞれの前記幅及び前記高さ、
前記ピクチャの他の領域に対する前記関心領域の相対的重み、
関心領域それぞれの内容に関する情報、及び
情報の何れかの組合せ
から選ばれる情報を含む、索引化する方法。 The indexing method according to claim 1, wherein the position information is
The number of regions of interest in each picture,
The coordinates of each region of interest according to picture width and picture height,
The width and height of each region of interest;
The relative weights of the associated cardiac region to other areas of the picture,
A method of indexing comprising information about the content of each region of interest and information selected from any combination of information.
ビデオ符号化標準は、柔軟なマクロブロック配列を使用し、前記関心領域は、他のピクチャ・データと無関係にスライス群に符号化され、前記関心領域の位置情報は、前記関心領域が符号化されたスライス群番号を含む、索引化する方法。 A method for indexing according to any one of claims 6 to 10, comprising:
The video coding standard uses a flexible macroblock arrangement, the region of interest is encoded into slice groups independently of other picture data, and the location information of the region of interest is encoded in the region of interest. Indexing method including the slice group number.
符号化ビデオ・データ・ストリームを受信する手段と、
記録サポート上に前記符号化ビデオ・データ・ストリームを記録する手段と、
前記関心領域の位置情報を復号化する手段と、
ビデオ・データ・ストリームを復号化する手段と、
ピクチャ毎に関心領域を選択する手段と、
ピクチャ毎に選択された関心領域から前記ビデオ・データ・ストリームの所定数の関心領域を選択する手段と、
前記ビデオ・データ・ストリームの前記選択された関心領域を記録する手段と
を備える、索引化する装置。 An apparatus for indexing an encoded video data stream, wherein the video data stream includes information regarding the location of a region of interest for each picture, the apparatus comprising:
Means for receiving an encoded video data stream;
Means for recording the encoded video data stream on a recording support;
Means for decoding position information of the region of interest;
Means for decoding the video data stream;
Means for selecting a region of interest for each picture;
Means for selecting a predetermined number of regions of interest in the video data stream from regions of interest selected for each picture;
Means for recording the selected region of interest of the video data stream.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0756181 | 2007-06-29 | ||
FR0756181 | 2007-06-29 | ||
PCT/EP2008/058050 WO2009003885A2 (en) | 2007-06-29 | 2008-06-25 | Video indexing method, and video indexing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010532121A JP2010532121A (en) | 2010-09-30 |
JP5346338B2 true JP5346338B2 (en) | 2013-11-20 |
Family
ID=39204994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010513897A Expired - Fee Related JP5346338B2 (en) | 2007-06-29 | 2008-06-25 | Method for indexing video and apparatus for indexing video |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP2174500A2 (en) |
JP (1) | JP5346338B2 (en) |
KR (1) | KR101488548B1 (en) |
CN (1) | CN101690228B (en) |
WO (1) | WO2009003885A2 (en) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5305451B2 (en) * | 2009-06-03 | 2013-10-02 | 独立行政法人情報通信研究機構 | Hologram encoding apparatus and hologram decoding apparatus, and hologram encoding program and hologram decoding program |
JP2011009949A (en) | 2009-06-24 | 2011-01-13 | Toshiba Corp | Video processor and video processing method |
CN103096049A (en) * | 2011-11-02 | 2013-05-08 | 华为技术有限公司 | Video processing method and system and associated equipment |
WO2013077236A1 (en) * | 2011-11-21 | 2013-05-30 | Canon Kabushiki Kaisha | Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium |
CN103246658B (en) * | 2012-02-03 | 2017-02-08 | 展讯通信(上海)有限公司 | Index table building method and coding method |
PL2842313T3 (en) | 2012-04-13 | 2017-06-30 | Ge Video Compression, Llc | Scalable data stream and network entity |
CA3214600A1 (en) * | 2012-06-29 | 2014-01-03 | Ge Video Compression, Llc | Video data stream concept |
US9247225B2 (en) * | 2012-09-25 | 2016-01-26 | Intel Corporation | Video indexing with viewer reaction estimation and visual cue detection |
CN105075271A (en) * | 2013-04-08 | 2015-11-18 | 索尼公司 | Region of interest scalability with SHVC |
US10721530B2 (en) | 2013-07-29 | 2020-07-21 | Koninklijke Kpn N.V. | Providing tile video streams to a client |
US9532086B2 (en) | 2013-11-20 | 2016-12-27 | At&T Intellectual Property I, L.P. | System and method for product placement amplification |
US20150237351A1 (en) * | 2014-02-18 | 2015-08-20 | Penne Lee | Techniques for inclusion of region of interest indications in compressed video data |
US10397666B2 (en) | 2014-06-27 | 2019-08-27 | Koninklijke Kpn N.V. | Determining a region of interest on the basis of a HEVC-tiled video stream |
US10694192B2 (en) | 2014-06-27 | 2020-06-23 | Koninklijke Kpn N.V. | HEVC-tiled video streaming |
US10715843B2 (en) | 2015-08-20 | 2020-07-14 | Koninklijke Kpn N.V. | Forming one or more tile streams on the basis of one or more video streams |
EP3360330B1 (en) | 2015-10-08 | 2021-03-24 | Koninklijke KPN N.V. | Enhancing a region of interest in video frames of a video stream |
US10582201B2 (en) * | 2016-05-19 | 2020-03-03 | Qualcomm Incorporated | Most-interested region in an image |
WO2018043143A1 (en) * | 2016-08-30 | 2018-03-08 | ソニー株式会社 | Transmitting device, transmitting method, receiving device and receiving method |
EP3542530B1 (en) | 2016-11-17 | 2023-04-05 | Intel Corporation | Suggested viewport indication for panoramic video |
CN108810600B (en) * | 2017-04-28 | 2020-12-22 | 华为技术有限公司 | Video scene switching method, client and server |
US10771163B2 (en) * | 2017-10-24 | 2020-09-08 | Mediatek Inc. | Apparatus and method for decoding ROI regions in image |
US11523185B2 (en) | 2019-06-19 | 2022-12-06 | Koninklijke Kpn N.V. | Rendering video stream in sub-area of visible display area |
CN111510752B (en) * | 2020-06-18 | 2021-04-23 | 平安国际智慧城市科技股份有限公司 | Data transmission method, device, server and storage medium |
CN113747151B (en) * | 2021-07-30 | 2024-04-12 | 咪咕文化科技有限公司 | Video encoding and decoding method, device, equipment and computer readable storage medium |
CN116074585B (en) * | 2023-03-03 | 2023-06-23 | 乔品科技(深圳)有限公司 | Super-high definition video coding and decoding method and device based on AI and attention mechanism |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07148155A (en) * | 1993-11-26 | 1995-06-13 | Toshiba Corp | Computerized tomographic apparatus |
US20020044696A1 (en) * | 1999-11-24 | 2002-04-18 | Sirohey Saad A. | Region of interest high resolution reconstruction for display purposes and a novel bookmarking capability |
US6549674B1 (en) * | 2000-10-12 | 2003-04-15 | Picsurf, Inc. | Image compression based on tiled wavelet-like transform using edge and non-edge filters |
US6909745B1 (en) * | 2001-06-05 | 2005-06-21 | At&T Corp. | Content adaptive video encoder |
FR2833132B1 (en) * | 2001-11-30 | 2004-02-13 | Eastman Kodak Co | METHOD FOR SELECTING AND SAVING A SUBJECT OF INTEREST IN A DIGITAL STILL IMAGE |
JP3966461B2 (en) * | 2002-08-09 | 2007-08-29 | 株式会社リコー | Electronic camera device |
JP2005110145A (en) * | 2003-10-02 | 2005-04-21 | Ricoh Co Ltd | Code string converter, code string converting method, photographing system, image display system, monitoring system, program, and information recording |
US20060045381A1 (en) * | 2004-08-31 | 2006-03-02 | Sanyo Electric Co., Ltd. | Image processing apparatus, shooting apparatus and image display apparatus |
US7598977B2 (en) * | 2005-04-28 | 2009-10-06 | Mitsubishi Electric Research Laboratories, Inc. | Spatio-temporal graphical user interface for querying videos |
EP1748385A3 (en) * | 2005-07-28 | 2009-12-09 | THOMSON Licensing | Method and device for generating a sequence of images of reduced size |
US8024768B2 (en) * | 2005-09-15 | 2011-09-20 | Penthera Partners, Inc. | Broadcasting video content to devices having different video presentation capabilities |
KR101255226B1 (en) * | 2005-09-26 | 2013-04-16 | 한국과학기술원 | Method and Apparatus for defining and reconstructing ROIs in Scalable Video Coding |
-
2008
- 2008-06-25 KR KR1020107002047A patent/KR101488548B1/en not_active IP Right Cessation
- 2008-06-25 CN CN200880022001.9A patent/CN101690228B/en not_active Expired - Fee Related
- 2008-06-25 JP JP2010513897A patent/JP5346338B2/en not_active Expired - Fee Related
- 2008-06-25 EP EP08761351A patent/EP2174500A2/en not_active Ceased
- 2008-06-25 WO PCT/EP2008/058050 patent/WO2009003885A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN101690228A (en) | 2010-03-31 |
WO2009003885A2 (en) | 2009-01-08 |
JP2010532121A (en) | 2010-09-30 |
CN101690228B (en) | 2012-08-08 |
KR20100042632A (en) | 2010-04-26 |
WO2009003885A3 (en) | 2009-03-26 |
EP2174500A2 (en) | 2010-04-14 |
KR101488548B1 (en) | 2015-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5346338B2 (en) | Method for indexing video and apparatus for indexing video | |
US10911786B2 (en) | Image processing device and method | |
US9918108B2 (en) | Image processing device and method | |
US20180176468A1 (en) | Preferred rendering of signalled regions-of-interest or viewports in virtual reality video | |
US11297354B2 (en) | Encoding apparatus, decoding apparatus and transmission control method | |
EP1878260B1 (en) | Method for scalably encoding and decoding video signal | |
EP2384002B1 (en) | Moving picture decoding method using additional quantization matrices | |
US8509434B2 (en) | Method and apparatus for protecting scalable video coding contents | |
WO2013129618A1 (en) | Image processing device and method | |
CA3022221A1 (en) | Apparatus and method for image processing for suppressing a reduction of coding efficiency | |
US20060062299A1 (en) | Method and device for encoding/decoding video signals using temporal and spatial correlations between macroblocks | |
WO2015194394A1 (en) | Image encoding apparatus and method, and image decoding apparatus and method | |
KR100630983B1 (en) | Image processing method, and image encoding apparatus and image decoding apparatus capable of employing the same | |
EP1879388A1 (en) | Video information recording device, video information recording method, video information recording program, and recording medium containing the video information recording program | |
JPWO2013031315A1 (en) | Image processing apparatus and image processing method | |
JP7345051B2 (en) | Video encoding with support for subpictures, slices, and tiles | |
WO2016157924A1 (en) | Image processing device, image processing method, program and recording medium | |
JP2006311079A (en) | Image bit stream conversion apparatus | |
JP2017216749A (en) | Image processing system and image processing method | |
WO2022050166A1 (en) | Reproduction device, transmission device, reproduction method, and transmission method | |
JP5387520B2 (en) | Information processing apparatus and information processing method | |
RU2809689C2 (en) | Image encoding method and device for loop filtering control | |
RU2628198C1 (en) | Method for interchannel prediction and interchannel reconstruction for multichannel video made by devices with different vision angles | |
JP2021197734A (en) | Encoder, decoder, encoding method, and decoding method | |
JP2021197733A (en) | Encoder, decoder, encoding method, and decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121106 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130816 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5346338 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |