JP5355606B2 - Stereo video encoding method, apparatus, and program - Google Patents
Stereo video encoding method, apparatus, and program Download PDFInfo
- Publication number
- JP5355606B2 JP5355606B2 JP2011046557A JP2011046557A JP5355606B2 JP 5355606 B2 JP5355606 B2 JP 5355606B2 JP 2011046557 A JP2011046557 A JP 2011046557A JP 2011046557 A JP2011046557 A JP 2011046557A JP 5355606 B2 JP5355606 B2 JP 5355606B2
- Authority
- JP
- Japan
- Prior art keywords
- base view
- view
- inter
- encoding
- base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
Description
本発明は、ステレオ動画像のデジタル信号をリアルタイムに映像符号化するステレオ動画像符号化方法、装置およびプログラムに関するものである。 The present invention relates to a stereo video encoding method, apparatus, and program for encoding a digital video of a stereo video in real time.
動画像のデジタル信号を圧縮符号化する技術としてのH.264ハイプロファイルは、Blu−ray、ワンセグなどに用いられている。このような符号化技術を用いてステレオ動画像、すなわち2視点動画像を圧縮するために、ベースビューと非ベースビューを独立な動画像として符号化した場合には、十分な圧縮効率を実現できない。ステレオ動画像の圧縮効率を高めるためには、ビュー間予測を実現することが不可欠である。 As a technique for compressing and encoding a digital signal of a moving image, H.264 is used. H.264 High Profile is used for Blu-ray, One Seg, and the like. In order to compress a stereo moving image, that is, a two-viewpoint moving image using such an encoding technique, when the base view and the non-base view are encoded as independent moving images, sufficient compression efficiency cannot be realized. . In order to increase the compression efficiency of stereo moving images, it is essential to realize inter-view prediction.
例えば、ビュー間予測を利用したステレオ動画像のデジタル信号を圧縮符号化する技術として、Blu−rayなどでも採用されているH.264ステレオハイプロファイルが注目されている。H.264ステレオハイプロファイルでは、左目映像と右目映像をそれぞれ1個のベースビューと1個の非ベースビューとして符号化することができる。ベースビューは、H.264ハイプロファイルとの互換性を保ち、H.264ハイプロファイルとして復号することができる。非ベースビューは、他のビューに含まれるフレームを参照(ビュー間予測)して符号化される。ビュー間予測を用いることで、ステレオ動画像の高圧縮を実現できる(非特許文献1)。 For example, as a technique for compressing and encoding a digital signal of a stereo moving image using inter-view prediction, H.264, which is also adopted in Blu-ray and the like. H.264 stereo high profile is attracting attention. H. In the H.264 stereo high profile, the left-eye video and the right-eye video can be encoded as one base view and one non-base view, respectively. The base view is H.264. H.264 high profile compatibility is maintained. H.264 can be decoded as a high profile. The non-base view is encoded with reference to a frame included in another view (inter-view prediction). By using inter-view prediction, high compression of a stereo moving image can be realized (Non-Patent Document 1).
しかしながら、H.264ステレオハイプロファイルでは、特に実装についての規定はなく、ベースビューと非ベースビューを独立して符号化しない場合、非ベースビューからベースビューを共有しなければならないため、既存のH.264ハイプロファイル符号化方法などの既存の符号化器が利用できないという問題があった。 However, H.C. In the H.264 stereo high profile, there is no particular provision on the implementation, and if the base view and the non-base view are not encoded independently, the base view must be shared from the non-base view. There is a problem that an existing encoder such as the H.264 high profile encoding method cannot be used.
そこで、本発明は、H.264ハイプロファイルの符号化装置の外部でビュー間予測を行い、非ベースビューのビュー間予測ベクトルデータを非ベースビューに付加情報として画像データに重畳し、非ベースビューを符号化するH.264ハイプロファイルの符号化装置に入力することにより、既存のH.264ハイプロファイルの符号化装置でベースビューと非ベースビューを独立に符号化してもビュー間予測によるステレオ動画像の高圧縮を実現するステレオ動画像符号化方法、装置およびプログラムを提供する。 Therefore, the present invention relates to H.264. H.264 performs inter-view prediction outside the H.264 high profile encoding apparatus, superimposes inter-view prediction vector data of a non-base view on image data as additional information on the non-base view, and encodes the non-base view. H.264 high profile encoding device by inputting into the existing H.264 encoding device. The present invention provides a stereo video encoding method, apparatus, and program for realizing high compression of a stereo video by inter-view prediction even when a base view and a non-base view are independently encoded by an H.264 high profile encoding apparatus.
上述した課題を解決するために、本発明は、ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置における映像符号化方法であって、前記映像符号化装置が、前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成する第1のステップと、前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを出力する第2のステップと、前記重畳済非ベースビューと第1のステップで用いたベースビューとを合わせて新たな非ベースビューとして出力する第3のステップと、前記第1のステップで用いたベースビューを特定の符号化方式で符号化する第4のステップと、前記第3のステップで出力される非ベースビューを特定の符号化方式で符号化する第5のステップと、前記第5のステップによる符号化データから、前記第1のステップで用いたベースビューの符号化データを削除する第6のステップと、前記第4のステップと前記第6のステップによる符号化データを多重化し、1つのビットストリームを出力する第7のステップとを実行する。 In order to solve the above-described problems, the present invention inputs two types of video data, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream. A video encoding method in a video encoding device, wherein the video encoding device generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view, and the inter-view prediction A second step of superimposing data on a non-base view and outputting a superimposed non-base view, and a new non-base view by combining the superimposed non-base view and the base view used in the first step And a fourth step for encoding the base view used in the first step with a specific encoding method. And flop, and a fifth step of encoding the non-base view that is output by the third step in a particular coding scheme, from the encoded data by said fifth step, used in the first step The sixth step of deleting the encoded data of the base view, and the seventh step of multiplexing the encoded data of the fourth step and the sixth step and outputting one bit stream are executed.
また、本発明は、上述の映像符号化方法において、前記第1のステップでは、ベースビューのGOP構造でIピクチャとなるタイミングで入力された画像を用いてビュー間予測をし、前記映像符号化装置が、さらに、前記第4のステップにおいて符号化する際に用いたパラメータを前記第5のステップの符号化において用いる第9のステップと、前記第5のステップにおいて第9のステップで用いられたパラメータによって符号化を行う第10のステップと、を備えることを特徴とする。
In the video encoding method described above, in the video encoding method described above, in the first step, inter-view prediction is performed using an image input at a timing of an I picture in a GOP structure of a base view, and the video encoding is performed. The apparatus was further used in the ninth step in the fifth step and the ninth step in the fifth step using the parameters used in the encoding in the fourth step. And a tenth step of performing encoding using parameters.
また、本発明は、上述の映像符号化方法において、第9のステップおよび第10のステップにおけるパラメータとしてピクチャ単位で符号化するための時刻情報及び前記ベースビューの画像を符号化した時に使用した符号化パラメータを用いることを特徴とする。 Further, the present invention provides the above-described video encoding method, the time information for encoding in units of pictures as parameters in the ninth step and the tenth step, and the code used when the base view image is encoded It is characterized by using a conversion parameter.
また、本発明は、上述の映像符号化方法において、前記符号化パラメータは、量子化マトリクスや量子化値を決定するためのパラメータを含むことを特徴とする。 The present invention is also characterized in that, in the video encoding method described above, the encoding parameter includes a parameter for determining a quantization matrix and a quantization value.
また、本発明は、ステレオ画像の一方の画像であるベースビューと他方の画像である非ベースビューとの2種類の映像のデータを入力として1つのビットストリームとして出力する映像符号化装置であって、前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成するビュー間予測部と、前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを生成するとともに、前記重畳済非ベースビューと前記ビュー間予測部で用いられたベースビューとを合わせて新たな非ベースビューとして生成するビュー間予測ベクトル重畳部と、前記ビュー間予測部で用いられたベースビューを特定の符号化方式で符号化する第1の符号化部と、前記ビュー間予測ベクトル重畳部によって生成された新たな非ベースビューを特定の符号化方式で符号化する第2の符号化部と、第2の符号化部によって得られた符号化データから、前記ビュー間予測部で用いられたベースビューの符号化データを削除するベースビューストリーム削除部と、前記第1の符号化部によって得られた符号化データと前記ベースビューストリーム削除部によって得られた符号化データとを多重化し、1つのビットストリームを出力する多重化部とを備えることを特徴とする。 The present invention also relates to a video encoding device that inputs two types of video data, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream. An inter-view prediction unit that generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view, and superimposes the inter-view prediction vector on a non-base view to generate a superimposed non-base view And an inter-view prediction vector superimposing unit that generates a new non-base view by combining the superimposed non-base view and the base view used in the inter-view prediction unit, and a base used in the inter-view prediction unit Generated by a first encoding unit that encodes a view using a specific encoding method and the inter-view prediction vector superimposing unit. A second encoding unit that encodes the new non-base view using a specific encoding method, and a base view used by the inter-view prediction unit from encoded data obtained by the second encoding unit. A base view stream deleting unit that deletes the encoded data of the first encoding unit, the encoded data obtained by the first encoding unit, and the encoded data obtained by the base view stream deleting unit, And a multiplexing unit that outputs a stream.
また、本発明は、上述の映像符号化方法の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラムである。 The present invention is also a video encoding program for causing a computer to execute processing used to realize the above-described video encoding method.
以上説明したように、この発明によれば、既存の符号化装置を用いてベースビューと非ベースビューを独立に符号化する場合であっても、ビュー間予測によるステレオ動画像の高圧縮を実現することができる。
また、本発明によれば、上記二つの符号化装置の間でパラメータを同一にすることができ、その結果、符号化劣化を発生させないようすることができる。
As described above, according to the present invention, even when a base view and a non-base view are independently encoded using an existing encoding device, high compression of a stereo moving image by inter-view prediction is realized. can do.
In addition, according to the present invention, it is possible to make the parameters the same between the two encoding apparatuses, and as a result, it is possible to prevent encoding degradation.
以下、本発明の一実施形態によるステレオ動画像符号化装置について図面を参照して説明する。図1は、この発明の一実施形態によるステレオ動画像符号化装置の構成を示す概略ブロック図である。 A stereo video encoding apparatus according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing the configuration of a stereo video encoding apparatus according to an embodiment of the present invention.
1は、ベースビューの画像フレーム、2は、非ベースビューの画像フレームであり、ビュー間予測部3に入力されるステレオ画像フレームである。ここで、ベースビューは、例えば、左目画像に対応し、非ベースビューは、右目画像に対応している。ビュー間予測部3は、非ベースビューからベースビューに対する予測ベクトルを算出する。 Reference numeral 1 denotes a base-view image frame, and reference numeral 2 denotes a non-base-view image frame, which is a stereo image frame input to the inter-view prediction unit 3. Here, the base view corresponds to, for example, the left eye image, and the non-base view corresponds to the right eye image. The inter-view prediction unit 3 calculates a prediction vector for the base view from the non-base view.
4は、予測ベクトルを非ベースビューに重畳するビュー間予測ベクトル重畳部である。5は、ベースビューの画像フレームであり、図1のベースビューの画像フレーム1と同じものである。6は、ビュー間予測ベクトル重畳部4で処理された重畳済非ベースビューとビュー間予測部3で使われたベースビューの画像をあわせた新たな非ベースビューである。7は、ベースビューをH.264ハイプロファイルで符号化するH.264ハイプロファイル符号化装置である。
8は、重畳済非ベースビューをH.264ハイプロファイルで符号化するH.264ハイプロファイル符号化装置である。9は、ベースビューと非ベースビューを符号化する時に、H.264ハイプロファイル符号化装置7とH.264ハイプロファイル符号化装置8との間でデータを送受信するデータパスである。10は、H.264ステレオハイプロファイルのヘッダにシンタックスを入れ替えるシンタックス修正部である。通常、ヘッダなどのシンタックスなどは、プログラムを入れ替えることで実現可能である。シンタックス修正部10は、重畳済非ベースビューのH.264ハイプロファイルのビットストリームの該当部分をH.264ステレオハイプロファイルのヘッダに書き換えるものである。
8 shows the superimposed non-base view as H.264. H.264 encoding with high profile H.264 high profile encoding device. 9 encodes a base view and a non-base view. H.264 high profile encoder 7 and H.264. 2 is a data path for transmitting / receiving data to / from the H.264 high
11は、余分に入力されたベースビュー部分のストリームを取り除くベースビューストリーム削除部である。このことにより、非ベースビューのビットストリーム(13)のみを出力する。12は、ベースビューのビットストリームであり、13は、非ベースビューのビットストリームである。14は、ベースビューのビットストリーム12と非ベースビューのビットストリーム13とを多重化する多重化部である。15は、多重化部14によって多重化されたH.264ステレオハイプロファイルのビットストリームである。
図2に、ベースビューと非ベースビューからビュー間予測ベクトルを生成し、当該ビュー間予測ベクトルを当該非ベースビューに重畳する方法を具体的に図示する。
この図において、21は、一連のベースビューのシーケンスであり、22は、一連の非ベースビューのシーケンスである。23および25は、ベースビューの符号化におけるGOP(Group Of Pictures)でIピクチャとなるタイミングのピクチャであり、ベースビューのシーケンス21に含まれる。24は、ピクチャ23と同時に入力される非ベースビューのピクチャであり、非ベースビューのシーケンス22に含まれている。26は、ピクチャ25と同時に入力される非ベースビューのピクチャであり、非ベースビューのシーケンス22に含まれている。
FIG. 2 specifically illustrates a method of generating an inter-view prediction vector from a base view and a non-base view and superimposing the inter-view prediction vector on the non-base view.
In this figure, 21 is a sequence of a series of base views, and 22 is a sequence of a series of non-base views.
27は、ビュー間予測部を示し、23と24などのIピクチャで符号化されるタイミングのピクチャに対して、ビュー間予測を行う。ビュー間予測の間隔をあけることにより、ビュー間予測での時間あたりの演算量を削減し、回路規模を小さくすることができる。28は、ビュー間予測部27で求めたビュー間予測ベクトルを非ベースビューの画像データに重畳して、非ベースビューのH.264ハイプロファイルで符号化するビュー間予測ベクトル重畳部である。
ビュー間予測部27は、図1のビュー間予測部3、ビュー間予測ベクトル重畳部28は、図1のビュー間予測ベクトル重畳部4に相当する。
The
図3に、図1のH.264ハイプロファイル符号化装置7と図1のH.264ハイプロファイル符号化装置8との間でデータを送受信する方法を具体的に図示する。
31は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。32は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。33は、図2のピクチャ23、ピクチャ25を符号化する時のパラメータであり、H.264ハイプロファイル符号化装置31に記憶されている。34は、図2のピクチャ24、ピクチャ26を符号化する時に使用するパラメータであり、H.264ハイプロファイル符号化装置32に記憶されている。
In FIG. H.264 high profile encoding device 7 and the H.264 high profile encoding device 7 of FIG. A method for transmitting and receiving data to and from the H.264 high
31 is an H.264 encoding base view. H.264 high profile encoding device. 32 is an H.32 encoding non-base view. H.264 high profile encoding device. 33 is a parameter for encoding
35は、ベースビューと非ベースビューを符号化する時にH.264ハイプロファイル符号化装置31とH.264ハイプロファイル符号化装置32との間でデータを送受信するデータパスである。具体的には、データパス35は、H.264ハイプロファイル符号化装置31とH.264ハイプロファイル符号化装置32のホスト間でのデータ送受信を実現する。データパス35は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。
35 is an H.35 code when encoding a base view and a non-base view. H.264 high
H.264ハイプロファイル符号化装置31は、図1のH.264ハイプロファイル符号化装置7、H.264ハイプロファイル符号化装置32は、図1のH.264ハイプロファイル符号化装置8に相当する。
H. The H.264 high
図4は、図3のパラメータ33、パラメータ34について具体的なパラメータを説明するための図である。
41は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。42は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。43は、図2のピクチャ23、ピクチャ25を符号化する時の時刻情報および符号化パラメータである。44は、図2のピクチャ24、ピクチャ26を符号化する時に使用する時刻情報および符号化パラメータである。
FIG. 4 is a diagram for explaining specific parameters for the
41 is an H.264 encoding base view. H.264 high profile encoding device. 42 encodes a non-base view. H.264 high profile encoding device. 43 is time information and encoding parameters when encoding the
45は、ベースビューと非ベースビューを符号化する時にデータを送受信するデータパスである。具体的には、データパス45は、H.264ハイプロファイル符号化装置41とH.264ハイプロファイル符号化装置42のホスト間でのデータ送受信を実現する。データパス45は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。
H.264ハイプロファイル符号化装置41は、図3のH.264ハイプロファイル符号化装置31、H.264ハイプロファイル符号化装置42は、図3のH.264ハイプロファイル符号化装置32に相当する。
H. The H.264 high
図5は、図4の時刻情報および符号化パラメータ43、時刻情報および符号化パラメータ44について具体的に説明する図である。
51は、ベースビューを符号化するH.264ハイプロファイル符号化装置である。52は、非ベースビューを符号化するH.264ハイプロファイル符号化装置である。53は、図2のピクチャ23、ピクチャ25を符号化する時の時刻情報および量子化マトリクス、量子化を決定するためのパラメータである。54は、図2のピクチャ24、ピクチャ26を符号化する時に使用する時刻情報および量子化マトリクス、量子化を決定するためのパラメータである。
FIG. 5 is a diagram specifically explaining the time information and the
51 is an H.264 encoding base view. H.264 high profile encoding device. 52 is an H.264 encoding non-base view. H.264 high profile encoding device. 53 are parameters for determining time information, quantization matrix, and quantization when coding the
55は、ベースビューと非ベースビューを符号化する時にH.264ハイプロファイル符号化装置51とH.264ハイプロファイル符号化装置52との間でデータを送受信するデータパスである。具体的には、データパス55は、H.264ハイプロファイル符号化装置51とH.264ハイプロファイル符号化装置52のホスト間でのデータ送受信を実現する。データパス55は、例えば、ピクチャ毎にデータ送受信をする。このデータ送受信による符号化を実現するために、非ベースビューへの一連のピクチャの入力を遅延させる。
55 is an H.55 code when encoding a base view and a non-base view. H.264
H.264ハイプロファイル符号化装置51は、図4のH.264ハイプロファイル符号化装置41、H.264ハイプロファイル符号化装置52は、図4のH.264ハイプロファイル符号化装置42に相当する。
H. The H.264 high
上述した実施形態において、ベースビューと非ベースビューは、独立した符号化装置で符号化する。ここでは、H.264ハイプロファイルで符号化する場合について説明する。ベースビューを入力画像として、H.264ハイプロファイルに符号化する方法では、非ベースビューでビュー間予測に用いられる参照画像となるベースビューを符号化するための情報を保持する。ベースビューと非ベースビューのビュー間予測の予測ベクトルは、非ベースビューの画像データに付加情報として入力する。非ベースビューとビュー間予測の予測ベクトルを付加された非ベースビューと非ベースビューの参照画像となるベースビューを入力画像として、H.264ハイプロファイルに符号化する方法では、ビュー間予測ベクトル、参照画像となるベースビューを符号化した情報を用いて、H.264ハイプロファイルで符号化する。 In the above-described embodiment, the base view and the non-base view are encoded by independent encoding devices. Here, H. A case of encoding with H.264 high profile will be described. Using the base view as an input image, In the H.264 high profile encoding method, information for encoding a base view serving as a reference image used for inter-view prediction in a non-base view is retained. A prediction vector for inter-view prediction between the base view and the non-base view is input as additional information to the image data of the non-base view. A base view that is a reference image of a non-base view and a non-base view to which a non-base view and a prediction vector for inter-view prediction are added is used as an input image. In the method of encoding to H.264 high profile, information obtained by encoding the inter-view prediction vector and the base view serving as the reference image is used. H.264 encoding with high profile.
ビュー間予測の参照画像となるベースビューは、ベースビューで符号化する時に保持したデータを用いて、同一の符号化を行う。非ベースビューとビュー間予測の予測ベクトルを付加された非ベースビューと非ベースビューの参照画像となるベースビューをH.264ハイプロファイルで符号化したビットストリームから、非ベースビューの参照画像となるベースビューのビットストリームを削除し、非ベースビューのみのビットストリームとする。さらに、ベースビューおよび非ベースビューのビットストリームを多重化して、1つのビットストリームとする。これにより、H.264ハイプロファイルの符号化方法および装置を2つ用いて、ステレオ動画像の高圧縮を可能とする。 The base view, which is a reference image for inter-view prediction, performs the same encoding using the data stored when encoding with the base view. A base view that is a reference image of a non-base view and a non-base view to which a prediction vector of a non-base view and inter-view prediction is added is referred to as H.264. The bit stream of the base view that becomes the reference image of the non-base view is deleted from the bit stream encoded by the H.264 high profile, and the bit stream is made only of the non-base view. Furthermore, the base view and non-base view bit streams are multiplexed into one bit stream. As a result, H.C. The H.264 high profile encoding method and apparatus are used to enable high compression of stereo moving images.
また、図1におけるステレオ動画像符号化装置の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより符号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。 Further, by recording a program for realizing the function of the stereo moving image encoding apparatus in FIG. 1 on a computer-readable recording medium, and causing the computer system to read and execute the program recorded on the recording medium. An encoding process may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices.
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.
1、5 ベースビューの画像フレーム
2 非ベースビューの画像フレーム
3、27 ビュー間予測部
4、28 ビュー間予測ベクトル重畳部
6 新たな非ベースビュー
7、8、31、32、41、42、51、52 H.264ハイプロファイル符号化装置
9、35、45、55 データパス
10 シンタックス修正部
11 ベースビューストリーム削除部
12 ベースビューのビットストリーム
13 非ベースビューのビットストリーム
14 多重化部
15 ビットストリーム
21 ベースビューのシーケンス
22 非ベースビューのシーケンス
23、25、26 ピクチャ
33、34 パラメータ
43、44 時刻情報および符号化パラメータ
53、54 時刻情報および量子化マトリクス、量子化を決定するためのパラメータ
1, 5 Base-view image frame 2 Non-base-
Claims (6)
前記映像符号化装置が、
前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成する第1のステップと、
前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを出力する第2のステップと、
前記重畳済非ベースビューと第1のステップで用いたベースビューとを合わせて新たな非ベースビューとして出力する第3のステップと、
前記第1のステップで用いたベースビューを特定の符号化方式で符号化する第4のステップと、
前記第3のステップで出力される非ベースビューを特定の符号化方式で符号化する第5のステップと、
前記第5のステップによる符号化データから、前記第1のステップで用いたベースビューの符号化データを削除する第6のステップと、
前記第4のステップと前記第6のステップによる符号化データを多重化し、1つのビットストリームを出力する第7のステップと
を実行する映像符号化方法。 A video encoding method in a video encoding apparatus that receives data of two types of video, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream,
The video encoding device is
A first step of generating an inter-view prediction vector by inter-view prediction of the base view and the non-base view;
A second step of superimposing data on the inter-view prediction vector on a non-base view and outputting a superimposed non-base view;
A third step of outputting the superimposed non-base view and the base view used in the first step as a new non-base view;
A fourth step of encoding the base view used in the first step with a specific encoding method;
A fifth step of encoding the non-base view output in the third step with a specific encoding method;
A sixth step of deleting the encoded data of the base view used in the first step from the encoded data in the fifth step;
A video encoding method for executing the seventh step of multiplexing the encoded data of the fourth step and the sixth step and outputting one bit stream.
前記映像符号化装置が、さらに、
前記第4のステップにおいて符号化する際に用いたパラメータを前記第5のステップの符号化において用いる第9のステップと、
前記第5のステップにおいて第9のステップで用いられたパラメータによって符号化を行う第10のステップと、
を備えることを特徴とする請求項1記載の映像符号化方法。 In the first step, inter-view prediction is performed using an image input at the timing of becoming an I picture in the GOP structure of the base view,
The video encoding device further includes:
A ninth step in which the parameters used in the encoding in the fourth step are used in the encoding in the fifth step;
A tenth step of performing encoding according to the parameters used in the ninth step in the fifth step;
The video encoding method according to claim 1, further comprising:
ことを特徴とする請求項2記載の映像符号化方法。 The time information for encoding in units of pictures and the encoding parameter used when the base view image is encoded are used as parameters in the ninth step and the tenth step, respectively. Video encoding method.
前記ベースビューと前記非ベースビューのビュー間予測によりビュー間予測ベクトルを生成するビュー間予測部と、
前記ビュー間予測ベクトルを非ベースビューにデータを重畳し、重畳済非ベースビューを生成するとともに、前記重畳済非ベースビューと前記ビュー間予測部で用いられたベースビューとを合わせて新たな非ベースビューとして生成するビュー間予測ベクトル重畳部と、
前記ビュー間予測部で用いられたベースビューを特定の符号化方式で符号化する第1の符号化部と、
前記ビュー間予測ベクトル重畳部によって生成された新たな非ベースビューを特定の符号化方式で符号化する第2の符号化部と、
第2の符号化部によって得られた符号化データから、前記ビュー間予測部で用いられたベースビューの符号化データを削除するベースビューストリーム削除部と、
前記第1の符号化部によって得られた符号化データと前記ベースビューストリーム削除部によって得られた符号化データとを多重化し、1つのビットストリームを出力する多重化部と
を備えることを特徴とする映像符号化装置。 A video encoding device that inputs data of two types of video, a base view that is one image of a stereo image and a non-base view that is the other image, and outputs the data as one bit stream,
An inter-view prediction unit that generates an inter-view prediction vector by inter-view prediction of the base view and the non-base view;
The inter-view prediction vector is superimposed on the non-base view to generate a superimposed non-base view, and a new non-base view is combined with the base view used by the inter-view prediction unit. An inter-view prediction vector superimposing unit generated as a base view;
A first encoding unit that encodes the base view used in the inter-view prediction unit using a specific encoding method;
A second encoding unit that encodes a new non-base view generated by the inter-view prediction vector superimposing unit using a specific encoding method;
A base view stream deletion unit that deletes encoded data of the base view used in the inter-view prediction unit from the encoded data obtained by the second encoding unit;
A multiplexing unit that multiplexes the encoded data obtained by the first encoding unit and the encoded data obtained by the base-view stream deletion unit, and outputs one bit stream. A video encoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046557A JP5355606B2 (en) | 2011-03-03 | 2011-03-03 | Stereo video encoding method, apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011046557A JP5355606B2 (en) | 2011-03-03 | 2011-03-03 | Stereo video encoding method, apparatus, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012186544A JP2012186544A (en) | 2012-09-27 |
JP5355606B2 true JP5355606B2 (en) | 2013-11-27 |
Family
ID=47016246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011046557A Active JP5355606B2 (en) | 2011-03-03 | 2011-03-03 | Stereo video encoding method, apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5355606B2 (en) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3693407B2 (en) * | 1996-04-04 | 2005-09-07 | シャープ株式会社 | Multi-view image encoding apparatus and decoding apparatus |
JP2007180982A (en) * | 2005-12-28 | 2007-07-12 | Victor Co Of Japan Ltd | Device, method, and program for decoding image |
BRPI1004210A2 (en) * | 2009-02-27 | 2016-02-23 | Panasonic Corp | recording medium, device and playback, and integrated circuit |
JP4947389B2 (en) * | 2009-04-03 | 2012-06-06 | ソニー株式会社 | Image signal decoding apparatus, image signal decoding method, and image signal encoding method |
JP4984181B2 (en) * | 2009-06-22 | 2012-07-25 | ソニー株式会社 | Playback apparatus and playback method |
DK2453661T3 (en) * | 2009-07-10 | 2017-10-30 | Panasonic Ip Man Co Ltd | PLAYBACK, RECORDING PROCEDURE AND SYSTEM, INCLUDING A RECORDING MEDIUM AND PLAYBACK |
-
2011
- 2011-03-03 JP JP2011046557A patent/JP5355606B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012186544A (en) | 2012-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101719079B1 (en) | Indication and activation of parameter sets for video coding | |
TWI520575B (en) | Indication of frame-packed stereoscopic 3d video data for video coding | |
CN110178379B (en) | Method and apparatus for signaling important video information in file format | |
JP2017022723A (en) | Activation of parameter sets for multiview video coding (mvc) compatible three-dimensional video coding (3dvc) | |
CN110784711B (en) | Method and device for generating merging candidate list for video sequence coding or decoding | |
CN113574873B (en) | Method and computer device for decoding a subcode stream of an encoded video stream | |
TW201424404A (en) | Supplemental enhancement information message coding | |
TW201408078A (en) | Parameter sets in video coding | |
CN110896486B (en) | Method and apparatus for encoding and decoding using high-level syntax architecture | |
JP2014515201A (en) | Post-filtering in full resolution frame compatible stereoscopic video coding | |
JP2022507669A (en) | How to identify random access points and picture types | |
JP2022513715A (en) | Wrap-around padding method for omnidirectional media coding and decoding | |
JP2017507539A (en) | Method for coding recovery point supplemental enhancement information (SEI) messages and region refresh information SEI messages in multi-layer coding | |
JP2022522841A (en) | Signaling adaptive image sizes in video bitstreams | |
JP2022521943A (en) | How to pad with sub-regional partitions in a video stream, equipment and computer programs | |
JP2022510325A (en) | Methods, systems, and computer programs for decoding coded video streams | |
JP2022510181A (en) | Identification of tiles from the network abstraction unit header | |
JP2022521519A (en) | Signaling interconnector predictions in video bitstreams | |
CN113273152B (en) | Method, apparatus and computer readable medium for media decoding | |
JP7061202B2 (en) | Concatenated coding unit in a flexible tree structure | |
CN113508582B (en) | Video encoding and decoding methods, devices and readable media | |
JP2022525056A (en) | Video coding methods, equipment and computer programs | |
JP7342125B2 (en) | Network abstraction layer unit header | |
JP5355606B2 (en) | Stereo video encoding method, apparatus, and program | |
CN112995680A (en) | Method and apparatus for reconstructing a coded enhancement layer picture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130520 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130520 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5355606 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |