JP2011109350A - Stereoscopic video encoder - Google Patents
Stereoscopic video encoder Download PDFInfo
- Publication number
- JP2011109350A JP2011109350A JP2009261487A JP2009261487A JP2011109350A JP 2011109350 A JP2011109350 A JP 2011109350A JP 2009261487 A JP2009261487 A JP 2009261487A JP 2009261487 A JP2009261487 A JP 2009261487A JP 2011109350 A JP2011109350 A JP 2011109350A
- Authority
- JP
- Japan
- Prior art keywords
- eye image
- encoding
- picture
- image encoding
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、立体映像符号化装置に関する。 The present invention relates to a stereoscopic video encoding apparatus.
従来、2眼式立体映像テレビにおいては、2台のカメラにより異なる2方向から撮像された左眼用画像と右眼用画像を生成し、これを同一画面に合成して表示することで立体映像として表示する。このような立体映像を記録する場合、左眼用画像と右眼用画像をそれぞれ記録するのでは、従来の2倍のデータ量となってしまう。 2. Description of the Related Art Conventionally, in a twin-lens stereoscopic video TV, a left-eye image and a right-eye image captured from two different directions by two cameras are generated, and these are combined and displayed on the same screen to display a stereoscopic video. Display as. When such a stereoscopic video is recorded, if the left-eye image and the right-eye image are recorded respectively, the data amount is twice as much as that of the conventional art.
全体のデータ量を削減する方法として、副画像(例えば、右眼用画像)を主画像(例えば、左眼用画像)との視点間の冗長度を利用した視差補償予測を用いる圧縮符号化を行うことが提案されている(特許文献1)。主画像は、動き補償予測で符号化される。副画像には、視差補償予測と動き補償予測の両方を適用可能であり、視差補償予測と動き補償予測の予測精度の評価値を算出し、その評価値に応じて、視差補償予測か動き補償予測かを決定する。 As a method of reducing the entire data amount, compression coding using parallax compensation prediction using redundancy between viewpoints between a sub-image (for example, a right-eye image) and a main image (for example, a left-eye image) is performed. It has been proposed to do this (Patent Document 1). The main image is encoded by motion compensation prediction. Both the parallax compensation prediction and the motion compensation prediction can be applied to the sub-image, and an evaluation value of the prediction accuracy of the parallax compensation prediction and the motion compensation prediction is calculated, and the parallax compensation prediction or the motion compensation is calculated according to the evaluation value. Decide whether to predict.
2眼式立体映像の左眼用画像と右眼用画像を符号化する場合、従来の2倍に相当する処理を必要とする。各画像の符号化に伴う参照用画像を格納するメモリを共有する場合、そのメモリに必要とされる伝送帯域幅も高くなる。左眼用画像と右眼用画像で画面間双方向予測符号化を同時に処理する場合が最もメモリアクセスが集中し、それに応じた周波数の高いクロックでメモリアクセスを行う必要がある。これは、消費電力の観点からも好ましくない。 When encoding a left-eye image and a right-eye image of a binocular stereoscopic video, a process corresponding to twice the conventional method is required. When a memory for storing a reference image accompanying the encoding of each image is shared, the transmission bandwidth required for the memory also increases. When the inter-screen bi-directional predictive encoding is simultaneously processed for the left-eye image and the right-eye image, the memory access is most concentrated, and it is necessary to perform the memory access with a clock having a high frequency corresponding to the memory access. This is not preferable from the viewpoint of power consumption.
本発明は、このような不都合を緩和する立体映像符号化装置を提示することを目的とする。 It is an object of the present invention to provide a stereoscopic video encoding device that alleviates such inconvenience.
本発明に係る立体映像符号化装置は、左眼用映像信号と右眼用映像信号を符号化する立体映像符号化装置であって、左眼用映像信号を符号化する左眼用画像符号化手段と、右眼用映像信号を符号化する右眼用画像符号化手段と、前記左眼用画像符号化手段及び前記右眼用画像符号化手段により共有され、符号化に伴うデータを記憶するメモリ手段と、前記左眼用画像符号化手段及び前記右眼用画像符号化手段における符号化のピクチャタイプを、画面内符号化、画面間順方向予測符号化及び画面間双方向予測符号化の何れかに制御するピクチャタイプ制御手段とを有し、前記ピクチャタイプ制御手段は、前記左眼用画像符号化手段及び前記右眼用画像符号化手段において画面間双方向予測符号化のタイミングが同時にならないように前記ピクチャタイプを制御することを特徴とする。 A stereoscopic video encoding apparatus according to the present invention is a stereoscopic video encoding apparatus that encodes a left-eye video signal and a right-eye video signal, and that encodes a left-eye video signal. Means, a right-eye image encoding unit that encodes a right-eye video signal, a left-eye image encoding unit, and a right-eye image encoding unit, and stores data associated with the encoding. The picture type of the encoding in the memory means and the left-eye image encoding means and the right-eye image encoding means is set to intra-screen encoding, inter-screen forward prediction encoding, and inter-screen bidirectional prediction encoding. Picture type control means for controlling the picture type control means, wherein the picture type control means simultaneously performs inter-screen bi-directional predictive encoding timing in the left-eye image encoding means and the right-eye image encoding means. So that it does not become And controlling the Yataipu.
本発明によれば、左眼用画像符号化と右眼用画像符号化において画面間双方向予測符号化が同時にならないようにピクチャタイプを制御することで、メモリ手段へのアクセスを緩和出来る。例えば、より低周波数のクロックでメモリを駆動することが可能となり、符号化における消費電力の低減が期待できる。 According to the present invention, access to the memory means can be eased by controlling the picture type so that inter-screen bi-directional predictive encoding is not performed simultaneously in left-eye image encoding and right-eye image encoding. For example, it becomes possible to drive the memory with a clock having a lower frequency, and a reduction in power consumption in encoding can be expected.
以下、図面を参照して、本発明の実施例を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の一実施例である立体映像符号化装置の概略構成ブロック図を示す。左眼用映像信号を符号化する左眼用画像符号化部101と、右眼用映像信号を符号化する右眼用画像符号化部102は、メモリI/F103を介してメモリ104を共有している。メモリ104には符号化に伴うデータが一時的に記憶される。メモリI/F103は、左眼用画像符号化部101及び右眼用画像符号化部102からのメモリアクセスを調停してメモリ104への読み出し及び書き込みを行う。左眼用画像符号化部101と右眼用画像符号化部102は、符号化におけるピクチャタイプを制御するピクチャタイプ制御部105からの指示に従うピクチャタイプで、それぞれ左眼用画像及び右眼用画像を符号化する。本実施例では、ピクチャタイプは、画面内符号化ピクチャ(Iピクチャ)、画面間順方向予測符号化ピクチャ(Pピクチャ)及び画面間双方向予測符号化(Bピクチャ)の3種類からなる。
FIG. 1 is a block diagram showing a schematic configuration of a stereoscopic video encoding apparatus according to an embodiment of the present invention. The left-eye
左眼用画像符号化部101と右眼用画像符号化部102は、MPEG−4 AVC(ISO/IEC 14496-10)方式に対応し、同じ構成からなる。図2は、左眼用画像符号化部101及び右眼用画像符号化部102の概略構成ブロック図を示す。図2に示す画像符号化部は、符号化対象画面を16×16画素ブロックに分割したマクロブロック単位で処理する。
The left-eye
予測方法決定部201は、ピクチャタイプ制御部105から指示されたピクチャタイプに応じた符号化対象画面内の各マクロブロックに対する予測方法を決定する。具体的には、予測方法決定部201は、入力映像信号とメモリ104から読み出した符号化済み画素値とから簡易的な画面内予測又は動き検出を含む画面間予測処理を行い、符号化効率が最適となる予測方式を決定する。符号化対象マクロブロックがIスライスの場合、画面内予測画素ブロックサイズ及び予測モードを決定する。Pスライス又はBスライスの場合には、画面内予測又は画面間予測の内、符号化効率の高い方を選択する。そして、画面間予測の場合には画面内予測画素ブロックサイズ及び画面内予測モード等の画面内予測符号化用パラメータを決定する。画面間予測の場合には、参照画像フレーム、マクロブロック分割パターン、及び動きベクトル等の画面間予測符号化用パラメータを決定する。
The prediction
予測処理部202は、予測方法決定部201により指定される予測符号化用パラメータに応じて、メモリ104からの符号化済み画像から予測画像を生成し、局所復号化部204に出力する。予測処理部202はまた、符号化対象画像(画素ブロック)と予測画像との差分となる予測残差信号を生成し、直交変換量子化部203に出力する。
The
直交変換量子化部203は、指定された画素ブロック単位(8×8画素又は、4×4画素ブロック単位)で整数精度離散コサイン変換及び離散アダマール変換による直交変換処理を行う。離散アダマール変換は、特定の整数精度離散コサイン変換で得られる直流(DC)成分に適用される。輝度成分については、16×16画素ブロック単位で画面内予測処理が行われた場合の直流(DC)成分に適用される。色差信号については、各画素ブロックを整数精度離散コサイン変換した結果のDC(直流)成分に適用される。
The orthogonal
直交変換量子化部203は、直交変換で得られた変換係数を、指定された量子化パラメータに応じた量子化ステップで量子化し、量子化変換係数データをエントロピー符号化部205と局所復号化部204に供給する。
The orthogonal
局所復号化部204は、直交変換量子化部203からの量子化変換係数データを逆量子化及び逆直交変換し、予測処理部202からの予測画像データを加算して、局所復号化する。こうして復号化された画像データは、メモリ104に格納される。メモリ104に格納された画像データは、以降の画面内予測処理に利用される。更に、復号化されデブロッキングフィルタ処理が施された画像データも、メモリ104に格納され、以降の画面間予測処理に利用される。
The
エントロピー符号化部205は、直交変換量子化部203からの量子化変換係数データをエントロピー符号化する。エントロピー符号化には、コンテキスト適応型可変長符号化(CAVLC:Context-based Adaptive Variable Length Coding)等がある。他に、コンテキスト適応型2値算術符号化(CABAC:Context-based Adaptive Binary Arithmetic Coding)を採用しても良い。エントロピー符号化部205による符号化データは、多重化処理部206に供給される。
The
多重化処理部206は、エントロピー符号化部205からの符号化映像データに、図示しないシステムデータ(スライスヘッダ等)を多重化し、符号化データとして出力する。
The
Iピクチャ、Pピクチャ及びBピクチャの内、2枚のピクチャを参照可能なBピクチャによる符号化処理が、メモリ104に対するメモリアクセスが最も多い。例えば、図3(a)に示すように、左眼用画像と右眼用画像とで同様のGOP(Group Of Pictures)構造で符号化する場合を考える。そして、Iピクチャの符号化に伴うメモリ104へのデータ伝送量に対し、Pピクチャの符号化に伴うデータ伝送量が2倍、Bピクチャの符号化に伴うデータ伝送量が4倍であると仮定する。図3(a)の下のグラフに示すように、Bピクチャの符号化処理タイミングでのメモリアクセスが極端に集中する。
Among the I picture, P picture, and B picture, the
そこで、ピクチャタイプ制御部105は、Bピクチャによる符号化処理が左眼用画像と右眼用画像とで同時に発生しないようなGOP構造でピクチャタイプを制御する。図3(b)は、ピクチャタイプ制御部105により制御される左眼用画像と右眼用画像のGOP構造の一例を示す。この例では、右眼用画像の3フレーム目にPピクチャを配置することで、左眼用画像と右眼用画像とで同時にBピクチャ符号化タイミングにならないようにしている。
Therefore, the picture
このように、左眼用画像と右眼用画像とで異なるGOP構造で符号化することで、符号化におけるメモリアクセスを平準化できる。すなわち、図3(b)の下のグラフに示すように、図3(a)に対してメモリ104に要求される最大伝送帯域を抑えることが可能となる。
As described above, by encoding with the GOP structure different between the left-eye image and the right-eye image, memory access in the encoding can be leveled. That is, as shown in the lower graph of FIG. 3B, it is possible to suppress the maximum transmission band required for the
図4は、本発明の第2実施例の概略構成ブロック図を示す。左眼用画像を符号化する左眼用画像符号化部401と、右眼用画像を符号化する右眼用画像符号化部402は、メモリI/F403を介してメモリ404を共有している。メモリI/F403は、左眼用画像符号化部401及び右眼用画像符号化部402からのメモリアクセスを調停してメモリ404への読み出し及び書き込みを行う。左眼用画像符号化部401と右眼用画像符号化部402は、符号化におけるピクチャタイプを制御するピクチャタイプ制御部405からの指示に従うピクチャタイプで、それぞれ左眼用画像及び右眼用画像を符号化する。本実施例では、ピクチャタイプは、画面内符号化ピクチャ(Iピクチャ)、画面間順方向予測符号化ピクチャ(Pピクチャ)及び画面間双方向予測符号化(Bピクチャ)の3種類からなる。
FIG. 4 shows a schematic block diagram of a second embodiment of the present invention. The left-eye
左眼用画像符号化部401及び右眼用画像符号化部402の詳細は、左眼用画像符号化部101及び右眼用画像符号化部102と同じであるので、説明を省略する。
Details of the left-eye
ピクチャタイプ制御部405は、Bピクチャによる符号化処理が左眼用画像と右眼用画像とで同時に発生しないように、以下に説明するように左眼用画像符号化部401及び右眼用画像符号化部402を制御する。
As will be described below, the picture
図5は、左眼用画像符号化と右眼用画像符号化のGOP構造が同じである場合において、ピクチャタイプ制御部405による左眼用画像と右眼用画像の符号化処理タイミング例を示す。この例では、右眼用画像の符号化タイミングを1画面分遅延させている。これにより、左眼用画像と右眼用画像とでBピクチャの符号化タイミングが同時になることがない。なお、上記1画面分の遅延以外に、左眼用画像符号化および右眼用画像符号化の一方の符号化タイミングを3画面や5画面といった所定画面分遅延させるようにして制御しても良い。
FIG. 5 shows an example of timing for encoding the left-eye image and the right-eye image by the picture
このように左眼用画像と右眼用画像とで異なるタイミングで符号化することで符号化におけるメモリアクセスを平準化できる。図5の下のグラフに示すように、図3(a)に対してメモリ104に要求される最大伝送帯域を抑えることが可能となる。
In this way, the memory access in the encoding can be leveled by encoding the left-eye image and the right-eye image at different timings. As shown in the lower graph of FIG. 5, it is possible to suppress the maximum transmission bandwidth required for the
101:左眼用画像符号化部
102:右眼用画像符号化部
104:メモリ
105:ピクチャタイプ制御部
101: Left-eye image encoding unit 102: Right-eye image encoding unit 104: Memory 105: Picture type control unit
Claims (3)
左眼用映像信号を符号化する左眼用画像符号化手段と、
右眼用映像信号を符号化する右眼用画像符号化手段と、
前記左眼用画像符号化手段及び前記右眼用画像符号化手段により共有され、符号化に伴うデータを記憶するメモリ手段と、
前記左眼用画像符号化手段及び前記右眼用画像符号化手段における符号化のピクチャタイプを、画面内符号化、画面間順方向予測符号化及び画面間双方向予測符号化の何れかに制御するピクチャタイプ制御手段
とを有し、
前記ピクチャタイプ制御手段は、前記左眼用画像符号化手段及び前記右眼用画像符号化手段において画面間双方向予測符号化のタイミングが同時にならないように前記ピクチャタイプを制御する
ことを特徴とする立体映像符号化装置。 A stereoscopic video encoding device that encodes a left-eye video signal and a right-eye video signal,
Left-eye image encoding means for encoding the left-eye video signal;
Right-eye image encoding means for encoding a right-eye video signal;
Memory means for storing data associated with encoding, shared by the left-eye image encoding means and the right-eye image encoding means;
The picture type of encoding in the left-eye image encoding means and the right-eye image encoding means is controlled to any one of intra-frame encoding, inter-screen forward prediction encoding, and inter-screen bidirectional prediction encoding. And a picture type control means for
The picture type control means controls the picture type so that the timing of inter-picture bi-directional predictive encoding does not coincide in the left-eye image encoding means and the right-eye image encoding means. Stereoscopic video encoding device.
When the GOP structure of the encoded video data generated by the left-eye image encoding unit and the right-eye image encoding unit is the same, the picture type control unit is configured to perform the left-eye image encoding unit. 2. The stereoscopic video encoding apparatus according to claim 1, wherein one of the right-eye image encoding means is controlled to be delayed by a predetermined screen.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009261487A JP2011109350A (en) | 2009-11-17 | 2009-11-17 | Stereoscopic video encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009261487A JP2011109350A (en) | 2009-11-17 | 2009-11-17 | Stereoscopic video encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011109350A true JP2011109350A (en) | 2011-06-02 |
Family
ID=44232370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009261487A Withdrawn JP2011109350A (en) | 2009-11-17 | 2009-11-17 | Stereoscopic video encoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011109350A (en) |
-
2009
- 2009-11-17 JP JP2009261487A patent/JP2011109350A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9838691B2 (en) | Method and apparatus for encoding video, and decoding method and apparatus | |
EP3056003B1 (en) | Signaling for sub-decoded picture buffer (sub-dpb) based dpb operations in video coding | |
US9288506B2 (en) | Signaling view synthesis prediction support in 3D video coding | |
US9648335B2 (en) | Bitstream restrictions on picture partitions across layers | |
EP2923492B1 (en) | Adaptive luminance compensation in three dimensional video coding | |
EP2941876B1 (en) | Multi-resolution decoded picture buffer management for multi-layer coding | |
KR101909331B1 (en) | Target output layers in video coding | |
KR20150095808A (en) | Inside view motion prediction among texture and depth view components with asymmetric spatial resolution | |
KR20160096624A (en) | Signaling of simplified depth coding (sdc) for depth intra- and inter-prediction modes in 3d video coding | |
WO2008136607A1 (en) | Method and apparatus for encoding and decoding multi-view video data | |
WO2005117449A1 (en) | Method and device for encoding digital video data | |
JP5760953B2 (en) | Moving picture decoding apparatus, moving picture encoding apparatus, moving picture decoding method, and moving picture encoding method | |
KR20150105434A (en) | View synthesis in 3d video | |
KR20120058616A (en) | Dynamic reference frame reordering for frame sequential stereoscopic video encoding | |
US20110243468A1 (en) | Image coding apparatus | |
JP2012050067A (en) | Predictive coding apparatus for moving image, control method thereof, and computer program | |
US8687910B2 (en) | Image filtering method using pseudo-random number filter and apparatus thereof | |
JP2011109350A (en) | Stereoscopic video encoder | |
JP2011109349A (en) | Stereoscopic video encoder | |
WO2013071948A1 (en) | Method of and apparatus for compression encoding a picture in a picture sequence | |
JP4926912B2 (en) | Video encoding apparatus and method | |
RU2777967C1 (en) | Deblocking filter for the boundaries of subsections that arise under the influence of the intra-subsection coding tool | |
JP5147546B2 (en) | Video encoding device and video decoding device | |
JP2017063347A (en) | Multi-viewpoint image encoding device, multi-viewpoint image encoding method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130205 |