JP5355606B2 - Stereo video encoding method, apparatus, and program - Google Patents

Stereo video encoding method, apparatus, and program Download PDF

Info

Publication number
JP5355606B2
JP5355606B2 JP2011046557A JP2011046557A JP5355606B2 JP 5355606 B2 JP5355606 B2 JP 5355606B2 JP 2011046557 A JP2011046557 A JP 2011046557A JP 2011046557 A JP2011046557 A JP 2011046557A JP 5355606 B2 JP5355606 B2 JP 5355606B2
Authority
JP
Japan
Prior art keywords
base view
view
inter
encoding
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011046557A
Other languages
Japanese (ja)
Other versions
JP2012186544A (en
Inventor
裕江 岩崎
卓 佐野
隆之 大西
淳 嵯峨田
一人 上倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011046557A priority Critical patent/JP5355606B2/en
Publication of JP2012186544A publication Critical patent/JP2012186544A/en
Application granted granted Critical
Publication of JP5355606B2 publication Critical patent/JP5355606B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a stereo video encoding method which realizes high compression of stereo video by an inter-view prediction, even when a base view and non-base views are encoded independently of each other by using an existing encoder. <P>SOLUTION: A stereo video encoding method is the one which accepts data consisting of a base view and non-base views as its input and outputs them as one bit stream. An inter-view prediction vector is generated by an inter-view prediction of a base view and non-base views, and the inter-view prediction vector is superposed, as data, on the non-base views to generate superposed non-base views. The superposed non-base views and the base view are combined to generate new non-base views. The base view is encoded by a specific encoding method, and the new non-base views are encoded by a specific encoding method, from this encoded data is removed the encoded data of the base view. The encoded base view and the encoded data which has had the encoded data of the base view removed are multiplexed, from which one bit stream is output. <P>COPYRIGHT: (C)2012,JPO&amp;INPIT

Description

本発明は、ステレオ動画像のデジタル信号をリアルタイムに映像符号化するステレオ動画像符号化方法、装置およびプログラムに関するものである。   The present invention relates to a stereo video encoding method, apparatus, and program for encoding a digital video of a stereo video in real time.

動画像のデジタル信号を圧縮符号化する技術としてのH.264ハイプロファイルは、Blu−ray、ワンセグなどに用いられている。このような符号化技術を用いてステレオ動画像、すなわち2視点動画像を圧縮するために、ベースビューと非ベースビューを独立な動画像として符号化した場合には、十分な圧縮効率を実現できない。ステレオ動画像の圧縮効率を高めるためには、ビュー間予測を実現することが不可欠である。   As a technique for compressing and encoding a digital signal of a moving image, H.264 is used. H.264 High Profile is used for Blu-ray, One Seg, and the like. In order to compress a stereo moving image, that is, a two-viewpoint moving image using such an encoding technique, when the base view and the non-base view are encoded as independent moving images, sufficient compression efficiency cannot be realized. . In order to increase the compression efficiency of stereo moving images, it is essential to realize inter-view prediction.

例えば、ビュー間予測を利用したステレオ動画像のデジタル信号を圧縮符号化する技術として、Blu−rayなどでも採用されているH.264ステレオハイプロファイルが注目されている。H.264ステレオハイプロファイルでは、左目映像と右目映像をそれぞれ1個のベースビューと1個の非ベースビューとして符号化することができる。ベースビューは、H.264ハイプロファイルとの互換性を保ち、H.264ハイプロファイルとして復号することができる。非ベースビューは、他のビューに含まれるフレームを参照(ビュー間予測)して符号化される。ビュー間予測を用いることで、ステレオ動画像の高圧縮を実現できる(非特許文献1)。   For example, as a technique for compressing and encoding a digital signal of a stereo moving image using inter-view prediction, H.264, which is also adopted in Blu-ray and the like. H.264 stereo high profile is attracting attention. H. In the H.264 stereo high profile, the left-eye video and the right-eye video can be encoded as one base view and one non-base view, respectively. The base view is H.264. H.264 high profile compatibility is maintained. H.264 can be decoded as a high profile. The non-base view is encoded with reference to a frame included in another view (inter-view prediction). By using inter-view prediction, high compression of a stereo moving image can be realized (Non-Patent Document 1).

Anthony Vetro, Thomas Wiegand, Gary J. Sullivan : Overview of the Stereo and Multiview Video Coding Extensions of the H.264/MPEG−4 AVC Standard, Proceedings of the IEEE Vol. 99, No. 4, April 2011 (To be issued)Anthony Vetro, Thomas Wiegand, Gary J. et al. Sullivan: Overview of the Stereo and Multiview Video Coding Extensions of the H.C. H.264 / MPEG-4 AVC Standard, Proceedings of the IEEE Vol. 99, no. 4, April 2011 (To be issued)

しかしながら、H.264ステレオハイプロファイルでは、特に実装についての規定はなく、ベースビューと非ベースビューを独立して符号化しない場合、非ベースビューからベースビューを共有しなければならないため、既存のH.264ハイプロファイル符号化方法などの既存の符号化器が利用できないという問題があった。   However, H.C. In the H.264 stereo high profile, there is no particular provision on the implementation, and if the base view and the non-base view are not encoded independently, the base view must be shared from the non-base view. There is a problem that an existing encoder such as the H.264 high profile encoding method cannot be used.

そこで、本発明は、H.264ハイプロファイルの符号化装置の外部でビュー間予測を行い、非ベースビューのビュー間予測ベクトルデータを非ベースビューに付加情報として画像データに重畳し、非ベースビューを符号化するH.264ハイプロファイルの符号化装置に入力することにより、既存のH.264ハイプロファイルの符号化装置でベースビューと非ベースビューを独立に符号化してもビュー間予測によるステレオ動画像の高圧縮を実現するステレオ動画像符号化方法、装置およびプログラムを提供する。   Therefore, the present invention relates to H.264. H.264 performs inter-view prediction outside the H.264 high profile encoding apparatus, superimposes inter-view prediction vector data of a non-base view on image data as additional information on the non-base view, and encodes the non-base view. H.264 high profile encoding device by inputting into the existing H.264 encoding device. The present invention provides a stereo video encoding method, apparatus, and program for realizing high compression of a stereo video by inter-view prediction even when a base view and a non-base view are independently encoded by an H.264 high profile encoding apparatus.

上述した課題を解決するために、本発明は、ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置における映像符号化方法であって、前記映像符号化装置が、前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成する第1のステップと、前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを出力する第2のステップと、前記重畳済非ベースビューと第1のステップで用いたベースビューとを合わせて新たな非ベースビューとして出力する第3のステップと、前記第1のステップで用いたベースビューを特定の符号化方式で符号化する第4のステップと、前記第3のステップで出力される非ベースビューを特定の符号化方式で符号化する第5のステップと、前記第5のステップによる符号化データから、前記第1のステップで用いたベースビューの符号化データを削除する第6のステップと、前記第4のステップと前記第6のステップによる符号化データを多重化し、1つのビットストリームを出力する第7のステップとを実行する。 In order to solve the above-described problems, the present invention inputs two types of video data, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream. A video encoding method in a video encoding device, wherein the video encoding device generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view, and the inter-view prediction A second step of superimposing data on a non-base view and outputting a superimposed non-base view, and a new non-base view by combining the superimposed non-base view and the base view used in the first step And a fourth step for encoding the base view used in the first step with a specific encoding method. And flop, and a fifth step of encoding the non-base view that is output by the third step in a particular coding scheme, from the encoded data by said fifth step, used in the first step The sixth step of deleting the encoded data of the base view, and the seventh step of multiplexing the encoded data of the fourth step and the sixth step and outputting one bit stream are executed.

また、本発明は、上述の映像符号化方法において、前記第1のステップでは、ベースビューのGOP構造でIピクチャとなるタイミングで入力された画像を用いてビュー間予測をし、前記映像符号化装置が、さらに、前記第4のステップにおいて符号化する際に用いたパラメータを前記第5のステップの符号化において用いる第9のステップと、前記第5のステップにおいて第9のステップで用いられたパラメータによって符号化を行う第10のステップと、を備えることを特徴とする。
In the video encoding method described above, in the video encoding method described above, in the first step, inter-view prediction is performed using an image input at a timing of an I picture in a GOP structure of a base view, and the video encoding is performed. The apparatus was further used in the ninth step in the fifth step and the ninth step in the fifth step using the parameters used in the encoding in the fourth step. And a tenth step of performing encoding using parameters.

また、本発明は、上述の映像符号化方法において、第9のステップおよび第10のステップにおけるパラメータとしてピクチャ単位で符号化するための時刻情報及び前記ベースビューの画像を符号化した時に使用した符号化パラメータを用いることを特徴とする。   Further, the present invention provides the above-described video encoding method, the time information for encoding in units of pictures as parameters in the ninth step and the tenth step, and the code used when the base view image is encoded It is characterized by using a conversion parameter.

また、本発明は、上述の映像符号化方法において、前記符号化パラメータは、量子化マトリクスや量子化値を決定するためのパラメータを含むことを特徴とする。   The present invention is also characterized in that, in the video encoding method described above, the encoding parameter includes a parameter for determining a quantization matrix and a quantization value.

また、本発明は、ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置であって、前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成するビュー間予測部と、前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを生成するとともに、前記重畳済非ベースビューと前記ビュー間予測部で用いられたベースビューとを合わせて新たな非ベースビューとして生成するビュー間予測ベクトル重畳部と、前記ビュー間予測部で用いられたベースビューを特定の符号化方式で符号化する第1の符号化部と、前記ビュー間予測ベクトル重畳部によって生成された新たな非ベースビューを特定の符号化方式で符号化する第2の符号化部と、第2の符号化部によって得られた符号化データから、前記ビュー間予測部で用いられたベースビューの符号化データを削除するベースビューストリーム削除部と、前記第1の符号化部によって得られた符号化データと前記ベースビューストリーム削除部によって得られた符号化データとを多重化し、1つのビットストリームを出力する多重化部とを備えることを特徴とする。   The present invention also relates to a video encoding device that inputs two types of video data, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream. An inter-view prediction unit that generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view, and superimposes the inter-view prediction vector on a non-base view to generate a superimposed non-base view And an inter-view prediction vector superimposing unit that generates a new non-base view by combining the superimposed non-base view and the base view used in the inter-view prediction unit, and a base used in the inter-view prediction unit Generated by a first encoding unit that encodes a view using a specific encoding method and the inter-view prediction vector superimposing unit. A second encoding unit that encodes the new non-base view using a specific encoding method, and a base view used by the inter-view prediction unit from encoded data obtained by the second encoding unit. A base view stream deleting unit that deletes the encoded data of the first encoding unit, the encoded data obtained by the first encoding unit, and the encoded data obtained by the base view stream deleting unit, And a multiplexing unit that outputs a stream.

また、本発明は、上述の映像符号化方法の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラムである。   The present invention is also a video encoding program for causing a computer to execute processing used to realize the above-described video encoding method.

以上説明したように、この発明によれば、既存の符号化装置を用いてベースビューと非ベースビューを独立に符号化する場合であっても、ビュー間予測によるステレオ動画像の高圧縮を実現することができる。
また、本発明によれば、上記二つの符号化装置の間でパラメータを同一にすることができ、その結果、符号化劣化を発生させないようすることができる。
As described above, according to the present invention, even when a base view and a non-base view are independently encoded using an existing encoding device, high compression of a stereo moving image by inter-view prediction is realized. can do.
In addition, according to the present invention, it is possible to make the parameters the same between the two encoding apparatuses, and as a result, it is possible to prevent encoding degradation.

この発明の一実施形態によるステレオ動画像符号化装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the stereo moving image encoder by one Embodiment of this invention. ビュー間予測ベクトルを生成して非ベースビューに重畳する動作を説明する図である。It is a figure explaining the operation | movement which produces | generates an inter-view prediction vector and superimposes on a non-base view. H.264ハイプロファイル符号化装置7とH.264ハイプロファイル符号化装置8との間でデータを送受信する方法を説明する図である。H. H.264 high profile encoder 7 and H.264. It is a figure explaining the method of transmitting / receiving data between H.264 high profile encoding apparatuses 8. FIG. パラメータ33、パラメータ34について説明する図である。It is a figure explaining the parameter 33 and the parameter 34. FIG. 時刻情報および符号化パラメータ43、時刻情報および符号化パラメータ44について具体的に説明する図である。It is a figure which demonstrates concretely about the time information and the encoding parameter 43, the time information, and the encoding parameter 44. FIG.

以下、本発明の一実施形態によるステレオ動画像符号化装置について図面を参照して説明する。図1は、この発明の一実施形態によるステレオ動画像符号化装置の構成を示す概略ブロック図である。   A stereo video encoding apparatus according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing the configuration of a stereo video encoding apparatus according to an embodiment of the present invention.

1は、ベースビューの画像フレーム、2は、非ベースビューの画像フレームであり、ビュー間予測部3に入力されるステレオ画像フレームである。ここで、ベースビューは、例えば、左目画像に対応し、非ベースビューは、右目画像に対応している。ビュー間予測部3は、非ベースビューからベースビューに対する予測ベクトルを算出する。   Reference numeral 1 denotes a base-view image frame, and reference numeral 2 denotes a non-base-view image frame, which is a stereo image frame input to the inter-view prediction unit 3. Here, the base view corresponds to, for example, the left eye image, and the non-base view corresponds to the right eye image. The inter-view prediction unit 3 calculates a prediction vector for the base view from the non-base view.

4は、予測ベクトルを非ベースビューに重畳するビュー間予測ベクトル重畳部である。5は、ベースビューの画像フレームであり、図1のベースビューの画像フレーム1と同じものである。6は、ビュー間予測ベクトル重畳部4で処理された重畳済非ベースビューとビュー間予測部3で使われたベースビューの画像をあわせた新たな非ベースビューである。7は、ベースビューをH.264ハイプロファイルで符号化するH.264ハイプロファイル符号化装置である。   Reference numeral 4 denotes an inter-view prediction vector superimposing unit that superimposes a prediction vector on a non-base view. Reference numeral 5 denotes a base-view image frame, which is the same as the base-view image frame 1 of FIG. 6 is a new non-base view in which the superimposed non-base view processed by the inter-view prediction vector superimposing unit 4 and the base view image used by the inter-view prediction unit 3 are combined. 7 shows the base view as H.264. H.264 encoding with high profile H.264 high profile encoding device.

8は、重畳済非ベースビューをH.264ハイプロファイルで符号化するH.264ハイプロファイル符号化装置である。9は、ベースビューと非ベースビューを符号化する時に、H.264ハイプロファイル符号化装置7とH.264ハイプロファイル符号化装置8との間でデータを送受信するデータパスである。10は、H.264ステレオハイプロファイルのヘッダにシンタックスを入れ替えるシンタックス修正部である。通常、ヘッダなどのシンタックスなどは、プログラムを入れ替えることで実現可能である。シンタックス修正部10は、重畳済非ベースビューのH.264ハイプロファイルのビットストリームの該当部分をH.264ステレオハイプロファイルのヘッダに書き換えるものである。   8 shows the superimposed non-base view as H.264. H.264 encoding with high profile H.264 high profile encoding device. 9 encodes a base view and a non-base view. H.264 high profile encoder 7 and H.264. 2 is a data path for transmitting / receiving data to / from the H.264 high profile encoding device 8. 10 is H. This is a syntax correction unit that replaces the syntax with the header of the H.264 stereo high profile. Usually, syntax such as a header can be realized by replacing programs. The syntax correction unit 10 is configured to display the H.264 of the superimposed non-base view. H.264 High Profile Bitstream The header is rewritten to a H.264 stereo high profile header.

11は、余分に入力されたベースビュー部分のストリームを取り除くベースビューストリーム削除部である。このことにより、非ベースビューのビットストリーム(13)のみを出力する。12は、ベースビューのビットストリームであり、13は、非ベースビューのビットストリームである。14は、ベースビューのビットストリーム12と非ベースビューのビットストリーム13とを多重化する多重化部である。15は、多重化部14によって多重化されたH.264ステレオハイプロファイルのビットストリームである。   Reference numeral 11 denotes a base view stream deletion unit that removes an extra input base view stream. As a result, only the non-base view bit stream (13) is output. Reference numeral 12 denotes a base view bit stream, and reference numeral 13 denotes a non-base view bit stream. Reference numeral 14 denotes a multiplexing unit that multiplexes the base view bit stream 12 and the non-base view bit stream 13. 15 is an H.264 multiplexed by the multiplexing unit 14. This is a bit stream of H.264 stereo high profile.

図2に、ベースビューと非ベースビューからビュー間予測ベクトルを生成し、当該ビュー間予測ベクトルを当該非ベースビューに重畳する方法を具体的に図示する。
この図において、21は、一連のベースビューのシーケンスであり、22は、一連の非ベースビューのシーケンスである。23および25は、ベースビューの符号化におけるGOP(Group Of Pictures)でIピクチャとなるタイミングのピクチャであり、ベースビューのシーケンス21に含まれる。24は、ピクチャ23と同時に入力される非ベースビューのピクチャであり、非ベースビューのシーケンス22に含まれている。26は、ピクチャ25と同時に入力される非ベースビューのピクチャであり、非ベースビューのシーケンス22に含まれている。
FIG. 2 specifically illustrates a method of generating an inter-view prediction vector from a base view and a non-base view and superimposing the inter-view prediction vector on the non-base view.
In this figure, 21 is a sequence of a series of base views, and 22 is a sequence of a series of non-base views. Reference numerals 23 and 25 are pictures at the timing of becoming I pictures in GOP (Group Of Pictures) in base view encoding, and are included in the base view sequence 21. Reference numeral 24 denotes a non-base view picture input simultaneously with the picture 23, and is included in the non-base view sequence 22. 26 is a non-base view picture input simultaneously with the picture 25 and is included in the non-base view sequence 22.

27は、ビュー間予測部を示し、23と24などのIピクチャで符号化されるタイミングのピクチャに対して、ビュー間予測を行う。ビュー間予測の間隔をあけることにより、ビュー間予測での時間あたりの演算量を削減し、回路規模を小さくすることができる。28は、ビュー間予測部27で求めたビュー間予測ベクトルを非ベースビューの画像データに重畳して、非ベースビューのH.264ハイプロファイルで符号化するビュー間予測ベクトル重畳部である。   Reference numeral 27 denotes an inter-view prediction unit, which performs inter-view prediction on pictures at timings encoded with I pictures such as 23 and 24. By providing an inter-view prediction interval, the amount of computation per time in inter-view prediction can be reduced, and the circuit scale can be reduced. 28 superimposes the inter-view prediction vector obtained by the inter-view prediction unit 27 on the image data of the non-base view, so It is an inter-view prediction vector superimposing unit that encodes with H.264 high profile.

ビュー間予測部27は、図1のビュー間予測部3、ビュー間予測ベクトル重畳部28は、図1のビュー間予測ベクトル重畳部4に相当する。   The inter-view prediction unit 27 corresponds to the inter-view prediction unit 3 in FIG. 1, and the inter-view prediction vector superimposing unit 28 corresponds to the inter-view prediction vector superimposing unit 4 in FIG.

図3に、図1のH.264ハイプロファイル符号化装置7と図1のH.264ハイプロファイル符号化装置8との間でデータを送受信する方法を具体的に図示する。
31は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。32は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。33は、図2のピクチャ23、ピクチャ25を符号化する時のパラメータであり、H.264ハイプロファイル符号化装置31に記憶されている。34は、図2のピクチャ24、ピクチャ26を符号化する時に使用するパラメータであり、H.264ハイプロファイル符号化装置32に記憶されている。
In FIG. H.264 high profile encoding device 7 and the H.264 high profile encoding device 7 of FIG. A method for transmitting and receiving data to and from the H.264 high profile encoding device 8 is specifically illustrated.
31 is an H.264 encoding base view. H.264 high profile encoding device. 32 is an H.32 encoding non-base view. H.264 high profile encoding device. 33 is a parameter for encoding picture 23 and picture 25 in FIG. H.264 high profile encoding device 31. 34 is a parameter used when coding the picture 24 and the picture 26 in FIG. H.264 high profile encoding device 32.

35は、ベースビューと非ベースビューを符号化する時にH.264ハイプロファイル符号化装置31とH.264ハイプロファイル符号化装置32との間でデータを送受信するデータパスである。具体的には、データパス35は、H.264ハイプロファイル符号化装置31とH.264ハイプロファイル符号化装置32のホスト間でのデータ送受信を実現する。データパス35は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。   35 is an H.35 code when encoding a base view and a non-base view. H.264 high profile encoding device 31 and H.264. 2 is a data path for transmitting and receiving data to and from the H.264 high profile encoding device 32. Specifically, the data path 35 is H.264. H.264 high profile encoding device 31 and H.264. Data transmission / reception between the hosts of the H.264 high profile encoding device 32 is realized. For example, the data path 35 transmits and receives data for each picture. In order to realize this encoding by data transmission / reception, the input of a series of pictures to the non-base view is delayed.

H.264ハイプロファイル符号化装置31は、図1のH.264ハイプロファイル符号化装置7、H.264ハイプロファイル符号化装置32は、図1のH.264ハイプロファイル符号化装置8に相当する。   H. The H.264 high profile encoding device 31 is similar to the H.264 high profile encoding device 31 shown in FIG. H.264 high profile encoding device 7, H.264. The H.264 high profile encoding device 32 is similar to the H.264 high profile encoding device 32 shown in FIG. This corresponds to the H.264 high profile encoding device 8.

図4は、図3のパラメータ33、パラメータ34について具体的なパラメータを説明するための図である。
41は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。42は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。43は、図2のピクチャ23、ピクチャ25を符号化する時の時刻情報および符号化パラメータである。44は、図2のピクチャ24、ピクチャ26を符号化する時に使用する時刻情報および符号化パラメータである。
FIG. 4 is a diagram for explaining specific parameters for the parameters 33 and 34 in FIG.
41 is an H.264 encoding base view. H.264 high profile encoding device. 42 encodes a non-base view. H.264 high profile encoding device. 43 is time information and encoding parameters when encoding the picture 23 and the picture 25 in FIG. Reference numeral 44 denotes time information and encoding parameters used when encoding the picture 24 and the picture 26 in FIG.

45は、ベースビューと非ベースビューを符号化する時にデータを送受信するデータパスである。具体的には、データパス45は、H.264ハイプロファイル符号化装置41とH.264ハイプロファイル符号化装置42のホスト間でのデータ送受信を実現する。データパス45は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。   Reference numeral 45 denotes a data path for transmitting and receiving data when encoding the base view and the non-base view. Specifically, the data path 45 is H.264. H.264 high profile encoder 41 and H.264. Data transmission / reception between the hosts of the H.264 high profile encoding device 42 is realized. For example, the data path 45 transmits and receives data for each picture. In order to realize this encoding by data transmission / reception, the input of a series of pictures to the non-base view is delayed.

H.264ハイプロファイル符号化装置41は、図3のH.264ハイプロファイル符号化装置31、H.264ハイプロファイル符号化装置42は、図3のH.264ハイプロファイル符号化装置32に相当する。   H. The H.264 high profile encoding apparatus 41 is similar to the H.264 high profile encoding apparatus 41 shown in FIG. H.264 high profile encoder 31, H.264. The H.264 high profile encoding device 42 is similar to the H.264 high profile encoding device 42 shown in FIG. This corresponds to the H.264 high profile encoding device 32.

図5は、図4の時刻情報および符号化パラメータ43、時刻情報および符号化パラメータ44について具体的に説明する図である。
51は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。52は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。53は、図2のピクチャ23、ピクチャ25を符号化する時の時刻情報および量子化マトリクス、量子化を決定するためのパラメータである。54は、図2のピクチャ24、ピクチャ26を符号化する時に使用する時刻情報および量子化マトリクス、量子化を決定するためのパラメータである。
FIG. 5 is a diagram specifically explaining the time information and the encoding parameter 43, the time information and the encoding parameter 44 of FIG.
51 is an H.264 encoding base view. H.264 high profile encoding device. 52 is an H.264 encoding non-base view. H.264 high profile encoding device. 53 are parameters for determining time information, quantization matrix, and quantization when coding the picture 23 and the picture 25 in FIG. 54 are parameters for determining time information, a quantization matrix, and quantization used when coding the picture 24 and the picture 26 in FIG.

55は、ベースビューと非ベースビューを符号化する時にH.264ハイプロファイル符号化装置51とH.264ハイプロファイル符号化装置52との間でデータを送受信するデータパスである。具体的には、データパス55は、H.264ハイプロファイル符号化装置51とH.264ハイプロファイル符号化装置52のホスト間でのデータ送受信を実現する。データパス55は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。   55 is an H.55 code when encoding a base view and a non-base view. H.264 high profile encoder 51 and H.264. 2 is a data path for transmitting / receiving data to / from the H.264 high profile encoding device 52. Specifically, the data path 55 is H.264. H.264 high profile encoder 51 and H.264. Data transmission / reception between the hosts of the H.264 high profile encoding device 52 is realized. For example, the data path 55 transmits and receives data for each picture. In order to realize this encoding by data transmission / reception, the input of a series of pictures to the non-base view is delayed.

H.264ハイプロファイル符号化装置51は、図4のH.264ハイプロファイル符号化装置41、H.264ハイプロファイル符号化装置52は、図4のH.264ハイプロファイル符号化装置42に相当する。   H. The H.264 high profile encoding device 51 is similar to the H.264 high profile encoding device 51 shown in FIG. H.264 high profile encoding device 41, H.264. The H.264 high profile encoding device 52 is similar to the H.264 high profile encoding device 52 shown in FIG. This corresponds to the H.264 high profile encoding device 42.

上述した実施形態において、ベースビューと非ベースビューは、独立した符号化装置で符号化する。ここでは、H.264ハイプロファイルで符号化する場合について説明する。ベースビューを入力画像として、H.264ハイプロファイルに符号化する方法では、非ベースビューでビュー間予測に用いられる参照画像となるベースビューを符号化するための情報を保持する。ベースビューと非ベースビューのビュー間予測の予測ベクトルは、非ベースビューの画像データに付加情報として入力する。非ベースビューとビュー間予測の予測ベクトルを付加された非ベースビューと非ベースビューの参照画像となるベースビューを入力画像として、H.264ハイプロファイルに符号化する方法では、ビュー間予測ベクトル、参照画像となるベースビューを符号化した情報を用いて、H.264ハイプロファイルで符号化する。   In the above-described embodiment, the base view and the non-base view are encoded by independent encoding devices. Here, H. A case of encoding with H.264 high profile will be described. Using the base view as an input image, In the H.264 high profile encoding method, information for encoding a base view serving as a reference image used for inter-view prediction in a non-base view is retained. A prediction vector for inter-view prediction between the base view and the non-base view is input as additional information to the image data of the non-base view. A base view that is a reference image of a non-base view and a non-base view to which a non-base view and a prediction vector for inter-view prediction are added is used as an input image. In the method of encoding to H.264 high profile, information obtained by encoding the inter-view prediction vector and the base view serving as the reference image is used. H.264 encoding with high profile.

ビュー間予測の参照画像となるベースビューは、ベースビューで符号化する時に保持したデータを用いて、同一の符号化を行う。非ベースビューとビュー間予測の予測ベクトルを付加された非ベースビューと非ベースビューの参照画像となるベースビューをH.264ハイプロファイルで符号化したビットストリームから、非ベースビューの参照画像となるベースビューのビットストリームを削除し、非ベースビューのみのビットストリームとする。さらに、ベースビューおよび非ベースビューのビットストリームを多重化して、1つのビットストリームとする。これにより、H.264ハイプロファイルの符号化方法および装置を2つ用いて、ステレオ動画像の高圧縮を可能とする。   The base view, which is a reference image for inter-view prediction, performs the same encoding using the data stored when encoding with the base view. A base view that is a reference image of a non-base view and a non-base view to which a prediction vector of a non-base view and inter-view prediction is added is referred to as H.264. The bit stream of the base view that becomes the reference image of the non-base view is deleted from the bit stream encoded by the H.264 high profile, and the bit stream is made only of the non-base view. Furthermore, the base view and non-base view bit streams are multiplexed into one bit stream. As a result, H.C. The H.264 high profile encoding method and apparatus are used to enable high compression of stereo moving images.

また、図1におけるステレオ動画像符号化装置の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより符号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。   Further, by recording a program for realizing the function of the stereo moving image encoding apparatus in FIG. 1 on a computer-readable recording medium, and causing the computer system to read and execute the program recorded on the recording medium. An encoding process may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices.

また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

1、5 ベースビューの画像フレーム
2 非ベースビューの画像フレーム
3、27 ビュー間予測部
4、28 ビュー間予測ベクトル重畳部
6 新たな非ベースビュー
7、8、31、32、41、42、51、52 H.264ハイプロファイル符号化装置
9、35、45、55 データパス
10 シンタックス修正部
11 ベースビューストリーム削除部
12 ベースビューのビットストリーム
13 非ベースビューのビットストリーム
14 多重化部
15 ビットストリーム
21 ベースビューのシーケンス
22 非ベースビューのシーケンス
23、25、26 ピクチャ
33、34 パラメータ
43、44 時刻情報および符号化パラメータ
53、54 時刻情報および量子化マトリクス、量子化を決定するためのパラメータ
1, 5 Base-view image frame 2 Non-base-view image frame 3, 27 Inter-view prediction unit 4, 28 Inter-view prediction vector superimposition unit 6 New non-base view 7, 8, 31, 32, 41, 42, 51 52H. H.264 high profile encoding device 9, 35, 45, 55 Data path 10 Syntax modification unit 11 Base view stream deletion unit 12 Base view bit stream 13 Non-base view bit stream 14 Multiplexing unit 15 Bit stream 21 Base view Sequence 22 Sequence of non-base view 23, 25, 26 Picture 33, 34 Parameter 43, 44 Time information and encoding parameter 53, 54 Time information, quantization matrix, parameter for determining quantization

Claims (6)

ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置における映像符号化方法であって、
前記映像符号化装置が、
前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成する第1のステップと、
前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを出力する第2のステップと、
前記重畳済非ベースビューと第1のステップで用いたベースビューとを合わせて新たな非ベースビューとして出力する第3のステップと、
前記第1のステップで用いたベースビューを特定の符号化方式で符号化する第4のステップと、
前記第3のステップで出力される非ベースビューを特定の符号化方式で符号化する第5のステップと、
前記第5のステップによる符号化データから、前記第1のステップで用いたベースビューの符号化データを削除する第6のステップと、
前記第4のステップと前記第6のステップによる符号化データを多重化し、1つのビットストリームを出力する第7のステップと
を実行する映像符号化方法。
A video encoding method in a video encoding apparatus that receives data of two types of video, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream,
The video encoding device is
A first step of generating an inter-view prediction vector by inter-view prediction of the base view and the non-base view;
A second step of superimposing data on the inter-view prediction vector on a non-base view and outputting a superimposed non-base view;
A third step of outputting the superimposed non-base view and the base view used in the first step as a new non-base view;
A fourth step of encoding the base view used in the first step with a specific encoding method;
A fifth step of encoding the non-base view output in the third step with a specific encoding method;
A sixth step of deleting the encoded data of the base view used in the first step from the encoded data in the fifth step;
A video encoding method for executing the seventh step of multiplexing the encoded data of the fourth step and the sixth step and outputting one bit stream.
前記第1のステップでは、ベースビューのGOP構造でIピクチャとなるタイミングで入力された画像を用いてビュー間予測をし、
前記映像符号化装置が、さらに、
前記第4のステップにおいて符号化する際に用いたパラメータを前記第5のステップの符号化において用いる第9のステップと、
前記第5のステップにおいて第9のステップで用いられたパラメータによって符号化を行う第10のステップと、
を備えることを特徴とする請求項1記載の映像符号化方法。
In the first step, inter-view prediction is performed using an image input at the timing of becoming an I picture in the GOP structure of the base view,
The video encoding device further includes:
A ninth step in which the parameters used in the encoding in the fourth step are used in the encoding in the fifth step;
A tenth step of performing encoding according to the parameters used in the ninth step in the fifth step;
The video encoding method according to claim 1, further comprising:
第9のステップおよび第10のステップにおけるパラメータとしてピクチャ単位で符号化するための時刻情報及び前記ベースビューの画像を符号化した時に使用した符号化パラメータを用いる
ことを特徴とする請求項2記載の映像符号化方法。
The time information for encoding in units of pictures and the encoding parameter used when the base view image is encoded are used as parameters in the ninth step and the tenth step, respectively. Video encoding method.
前記符号化パラメータは、量子化マトリクスや量子化値を決定するためのパラメータを含むことを特徴とする請求項3に記載の映像符号化方法。   The video encoding method according to claim 3, wherein the encoding parameter includes a parameter for determining a quantization matrix and a quantization value. ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置であって、
前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成するビュー間予測部と、
前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを生成するとともに、前記重畳済非ベースビューと前記ビュー間予測部で用いられたベースビューとを合わせて新たな非ベースビューとして生成するビュー間予測ベクトル重畳部と、
前記ビュー間予測部で用いられたベースビューを特定の符号化方式で符号化する第1の符号化部と、
前記ビュー間予測ベクトル重畳部によって生成された新たな非ベースビューを特定の符号化方式で符号化する第2の符号化部と、
第2の符号化部によって得られた符号化データから、前記ビュー間予測部で用いられたベースビューの符号化データを削除するベースビューストリーム削除部と、
前記第1の符号化部によって得られた符号化データと前記ベースビューストリーム削除部によって得られた符号化データとを多重化し、1つのビットストリームを出力する多重化部と
を備えることを特徴とする映像符号化装置。
A video encoding device that inputs data of two types of video, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream,
An inter-view prediction unit that generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view;
The inter-view prediction vector is superimposed on the non-base view to generate a superimposed non-base view, and a new non-base view is combined with the base view used by the inter-view prediction unit. An inter-view prediction vector superimposing unit generated as a base view;
A first encoding unit that encodes the base view used in the inter-view prediction unit using a specific encoding method;
A second encoding unit that encodes a new non-base view generated by the inter-view prediction vector superimposing unit using a specific encoding method;
A base view stream deletion unit that deletes encoded data of the base view used in the inter-view prediction unit from the encoded data obtained by the second encoding unit;
A multiplexing unit that multiplexes the encoded data obtained by the first encoding unit and the encoded data obtained by the base-view stream deletion unit, and outputs one bit stream. A video encoding device.
請求項1から請求項4のうちいずれか1項に記載の映像符号化方法の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラム。   A video encoding program for causing a computer to execute processing used to realize the video encoding method according to any one of claims 1 to 4.
JP2011046557A 2011-03-03 2011-03-03 Stereo video encoding method, apparatus, and program Active JP5355606B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011046557A JP5355606B2 (en) 2011-03-03 2011-03-03 Stereo video encoding method, apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011046557A JP5355606B2 (en) 2011-03-03 2011-03-03 Stereo video encoding method, apparatus, and program

Publications (2)

Publication Number Publication Date
JP2012186544A JP2012186544A (en) 2012-09-27
JP5355606B2 true JP5355606B2 (en) 2013-11-27

Family

ID=47016246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011046557A Active JP5355606B2 (en) 2011-03-03 2011-03-03 Stereo video encoding method, apparatus, and program

Country Status (1)

Country Link
JP (1) JP5355606B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3693407B2 (en) * 1996-04-04 2005-09-07 シャープ株式会社 Multi-view image encoding apparatus and decoding apparatus
JP2007180982A (en) * 2005-12-28 2007-07-12 Victor Co Of Japan Ltd Device, method, and program for decoding image
BRPI1004210A2 (en) * 2009-02-27 2016-02-23 Panasonic Corp recording medium, device and playback, and integrated circuit
JP4947389B2 (en) * 2009-04-03 2012-06-06 ソニー株式会社 Image signal decoding apparatus, image signal decoding method, and image signal encoding method
JP4984181B2 (en) * 2009-06-22 2012-07-25 ソニー株式会社 Playback apparatus and playback method
DK2453661T3 (en) * 2009-07-10 2017-10-30 Panasonic Ip Man Co Ltd PLAYBACK, RECORDING PROCEDURE AND SYSTEM, INCLUDING A RECORDING MEDIUM AND PLAYBACK

Also Published As

Publication number Publication date
JP2012186544A (en) 2012-09-27

Similar Documents

Publication Publication Date Title
KR101719079B1 (en) Indication and activation of parameter sets for video coding
TWI520575B (en) Indication of frame-packed stereoscopic 3d video data for video coding
CN110178379B (en) Method and apparatus for signaling important video information in file format
JP2017022723A (en) Activation of parameter sets for multiview video coding (mvc) compatible three-dimensional video coding (3dvc)
CN110784711B (en) Method and device for generating merging candidate list for video sequence coding or decoding
CN113574873B (en) Method and computer device for decoding a subcode stream of an encoded video stream
TW201424404A (en) Supplemental enhancement information message coding
TW201408078A (en) Parameter sets in video coding
CN110896486B (en) Method and apparatus for encoding and decoding using high-level syntax architecture
JP2014515201A (en) Post-filtering in full resolution frame compatible stereoscopic video coding
JP2022507669A (en) How to identify random access points and picture types
JP2022513715A (en) Wrap-around padding method for omnidirectional media coding and decoding
JP2017507539A (en) Method for coding recovery point supplemental enhancement information (SEI) messages and region refresh information SEI messages in multi-layer coding
JP2022522841A (en) Signaling adaptive image sizes in video bitstreams
JP2022521943A (en) How to pad with sub-regional partitions in a video stream, equipment and computer programs
JP2022510325A (en) Methods, systems, and computer programs for decoding coded video streams
JP2022510181A (en) Identification of tiles from the network abstraction unit header
JP2022521519A (en) Signaling interconnector predictions in video bitstreams
CN113273152B (en) Method, apparatus and computer readable medium for media decoding
JP7061202B2 (en) Concatenated coding unit in a flexible tree structure
CN113508582B (en) Video encoding and decoding methods, devices and readable media
JP2022525056A (en) Video coding methods, equipment and computer programs
JP7342125B2 (en) Network abstraction layer unit header
JP5355606B2 (en) Stereo video encoding method, apparatus, and program
CN112995680A (en) Method and apparatus for reconstructing a coded enhancement layer picture

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130520

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130520

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130827

R150 Certificate of patent or registration of utility model

Ref document number: 5355606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350