JP2009164937A - Motion image multiplexing method, file reading method and apparatus, program thereof and computer-readable recording medium - Google Patents
Motion image multiplexing method, file reading method and apparatus, program thereof and computer-readable recording medium Download PDFInfo
- Publication number
- JP2009164937A JP2009164937A JP2008001010A JP2008001010A JP2009164937A JP 2009164937 A JP2009164937 A JP 2009164937A JP 2008001010 A JP2008001010 A JP 2008001010A JP 2008001010 A JP2008001010 A JP 2008001010A JP 2009164937 A JP2009164937 A JP 2009164937A
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- frame
- file
- encoded data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
Description
本発明は,フレーム間予測符号化方式を使った画像符号化データの多重化に関する技術である。 The present invention is a technique related to multiplexing of encoded image data using an inter-frame predictive encoding method.
映像符号化には,スケーラブル符号化や多視点映像符号化といった,レイヤ符号化を適用する符号化方式がある。スケーラブル符号化では,SNRスケーラビリティや空間スケーラビリティ等の機能を実現できる。SNRスケーラビリティとは,ベースレイヤの符号化データに対して符号化データを追加することで画像の画品質を向上する機能であり,空間スケーラビリティとは,ベースレイヤの符号化データに対して符号化データを追加することで画像の空間解像度を向上する機能である。 Video coding includes coding methods that apply layer coding, such as scalable coding and multi-view video coding. In scalable coding, functions such as SNR scalability and spatial scalability can be realized. The SNR scalability is a function that improves the image quality of an image by adding the encoded data to the base layer encoded data. The spatial scalability is the encoded data for the base layer encoded data. This is a function that improves the spatial resolution of an image by adding.
スケーラブル符号化の概念図を図13に示す。図13に示すように,復号画像あるいは符号化情報をレイヤ間で再利用することにより,符号量の削減が図られている。 A conceptual diagram of scalable encoding is shown in FIG. As shown in FIG. 13, the amount of code is reduced by reusing a decoded image or encoded information between layers.
近年では,映像符号化方式H.264の拡張方式としてSVCと呼ぶ方式がAnnexGとして標準化されている(非特許文献1参照)。 In recent years, the video encoding method H.264 has been improved. As a H.264 extension method, a method called SVC is standardized as Annex G (see Non-Patent Document 1).
また,多視点映像符号化においてもレイヤ符号化が適用される。近年では,やはり映像符号化方式H.264の拡張方式としてMVCと呼ぶ方式が標準化されようとしている。MVCでは,複数の視点映像をまとめて符号化する仕組みが採用されている。動画像の符号化では動き補償符号化が利用されるが,多視点映像の場合には,動き補償に加えて,視点映像間でフレーム間予測符号化を適用する視差補償符号化を利用する。MVCでは視差補償を利用することで,個別に視点映像を符号化するよりも圧縮効率を向上できる。また,MVCでは,アプリケーションとして自由視点映像といった,視聴者が自由に視点位置を選択できる映像表現を想定している(非特許文献2,非特許文献3参照)。
Layer coding is also applied in multi-view video coding. In recent years, the video encoding system H.264 A method called MVC is being standardized as an H.264 extension method. In MVC, a mechanism for collectively encoding a plurality of viewpoint videos is employed. In motion picture encoding, motion compensation encoding is used. In the case of multi-view video, in addition to motion compensation, disparity compensation encoding that applies inter-frame prediction encoding between viewpoint videos is used. In MVC, by using parallax compensation, the compression efficiency can be improved as compared to encoding the viewpoint video individually. In addition, MVC assumes a video expression that allows a viewer to freely select a viewpoint position, such as a free viewpoint video as an application (see
このため,映像シーンを非常に多くのカメラで撮影しておき,視聴者が見たい視点位置の映像を選択するような利用方法が想定されている。すなわち,撮影した多くの視点映像データのうち,いくつかを選択して復号して再生することが想定されている。このように非常に多くの視点映像からいくつかの視点映像を選択して復号する機能を視点映像スケーラビリティと呼ぶ。MVCは多視点映像を想定した符号化方式ではあるが,まとめて符号化する対象はカメラ映像に限定されない。すなわち,一般的に複数の動画像をまとめて圧縮する符号化方式と考えることができる。 For this reason, it is assumed that the video scene is photographed by a large number of cameras and the video at the viewpoint position that the viewer wants to view is selected. That is, it is assumed that some of the captured viewpoint video data are selected, decoded, and reproduced. Such a function of selecting and decoding several viewpoint videos from a very large number of viewpoint videos is called viewpoint video scalability. MVC is an encoding method that assumes multi-view video, but the target to be encoded together is not limited to camera video. That is, it can be considered as a coding method that generally compresses a plurality of moving images together.
このMVCでは,前述のとおり,非常に多くの動画像からいくつかの動画像を選択して復号することを実現するため,スケーラブル符号化のように1つのベースレイヤに対してレイヤ構造を持つのではなく,複数のベースレイヤに対してレイヤ構造を持つような構成となる。 As described above, this MVC has a layer structure for one base layer as in scalable coding in order to select and decode several moving images from a large number of moving images. Instead, the configuration is such that a plurality of base layers have a layer structure.
図14はMVCの参照関係の例,図15はMVCの符号化データの構成例を示す図である。例えば,図14に示すような参照関係がある場合には,MVCの符号化データは同じ時刻のフレームについて図15に示すような構成になる。この同じ時刻のフレームの固まりをアクセスユニットと呼ぶ。MVCではベースレイヤに相当するレイヤが複数存在する。MVCでは動画像間の参照関係をサブセットSPS(subset_seq _parameter _set )の中のMVC拡張部分で記述する。サブセットSPSは符号化データ中に含まれ,複数設定できる。各フレームでは,利用するサブセットSPSを指定することができる。 FIG. 14 is a diagram showing an example of reference relationship of MVC, and FIG. 15 is a diagram showing a configuration example of encoded data of MVC. For example, when there is a reference relationship as shown in FIG. 14, the encoded data of MVC has a configuration as shown in FIG. 15 for frames at the same time. This group of frames at the same time is called an access unit. In MVC, there are a plurality of layers corresponding to the base layer. In MVC, a reference relationship between moving images is described by an MVC extension in a subset SPS (subset_seq_parameter_set). The subset SPS is included in the encoded data, and a plurality of subsets can be set. In each frame, a subset SPS to be used can be designated.
さらに,MVCでは非常に多くの視点映像を扱うため,高い圧縮効率が望まれる。撮影した映像を圧縮するのではなく,ある一部の視点映像の空間解像度やビット深度を小さくすることで情報量を減らして圧縮できれば,圧縮効率を向上できる。また,色空間についても,全ての視点映像で同一にする必要はない。撮影に利用するカメラによっては,得られる映像信号の色空間は異なる場合がある。ここで想定する「色空間が異なる」ことの意味は,3色であればRGBやYUV等で色空間が正に異なることや,また,グレースケールと3色のように色数が異なることや,色が同じであっても特定の色だけサンプリング周波数が異なることを指す。このように,MVCでは,空間解像度,ビット深度,色空間の異なる複数の視点映像をまとめて符号化する場合がある。視点映像ごとに空間解像度やビット深度や色空間を指定できるが,このような映像信号の表現情報はパラメータセットとして符号化データの中に含まれる(非特許文献4参照)。 Furthermore, since MVC handles a large number of viewpoint videos, high compression efficiency is desired. The compression efficiency can be improved if the amount of information can be reduced by reducing the spatial resolution and bit depth of a certain viewpoint video rather than compressing the shot video. Also, the color space need not be the same for all viewpoint videos. Depending on the camera used for shooting, the color space of the obtained video signal may be different. The meaning of “different color spaces” assumed here means that if there are three colors, the color spaces are exactly different for RGB, YUV, etc., and that the number of colors is different, such as grayscale and three colors. , It means that the sampling frequency differs by a specific color even if the colors are the same. As described above, in MVC, a plurality of viewpoint videos having different spatial resolution, bit depth, and color space may be encoded together. Although spatial resolution, bit depth, and color space can be specified for each viewpoint video, such video signal expression information is included in the encoded data as a parameter set (see Non-Patent Document 4).
一方,このような映像符号化データをファイル化して保存するために,ファイルフォーマット技術が利用される。ファイルフォーマットとは,符号化データを多重化するための技術でもあり,符号化データストリームを構造化しておくことで,特定の情報に関する符号化データを低遅延で取り出す機能を有する。一般的にファイルフォーマットでは,各種のデータストリームをトラックに格納して,トラックの情報を特定の時刻を単位に分割して多重化する。各トラックには,映像または音声の符号化データの他に,CGデータや著作権情報などのメタデータが格納される。 On the other hand, a file format technique is used to store such encoded video data as a file. The file format is also a technique for multiplexing encoded data, and has a function of extracting encoded data related to specific information with low delay by structuring the encoded data stream. Generally, in a file format, various data streams are stored in a track, and track information is divided and multiplexed in units of specific times. Each track stores metadata such as CG data and copyright information in addition to video or audio encoded data.
もっとも簡単なファイルフォーマットとしては,AVIフォーマットが挙げられる。AVIフォーマットは,映像データと音声データを1フレーム単位に多重化する。そのほかにも国際標準化されているフォーマットとして,ISOメディアファイルフォーマットが挙げられる。ISOフォーマットでは,フレームに相当するものとしてサンプルを定義し,サンプルを単位にトラックを分割して多重化する。 The simplest file format is the AVI format. In the AVI format, video data and audio data are multiplexed in units of one frame. Another ISO standard file format is an international standardized format. In the ISO format, a sample is defined as being equivalent to a frame, and a track is divided and multiplexed in units of samples.
ISOメディアファイルフォーマットでは,符号化データの他に,フレーム番号等の時刻情報とフレーム先頭のファイル中の位置情報を管理情報として,別のトラックとして構成することができる。ファイルを再生する場合には,この管理情報を記録したトラックを調べることで,フレームの先頭位置情報を知ることができ,所望のフレームの先頭に低遅延でアクセスすることが可能となる。 In the ISO media file format, in addition to the encoded data, time information such as a frame number and position information in the file at the head of the frame can be configured as separate tracks as management information. When playing back a file, by checking the track in which this management information is recorded, it is possible to know the start position information of the frame, and to access the start of the desired frame with low delay.
ファイル中におけるトラックや管理情報の関係の例を図16に示す。符号化データトラックには,各動画像の符号化データが格納され,管理情報トラックには,各時刻におけるフレームの位置情報等が格納される。前述したSVC用にもファイルフォーマットが提案されている。SVCもトラックを単位にファイルを構成する(非特許文献5参照)。
MVCで空間解像度やビット深度や色空間が異なる視点映像がある場合に,特定の空間解像度やビット深度や色空間の視点映像のみを取り出すことができることは好適である。例えば,特定の空間解像度やビット深度や色空間の符号化データのみを復号できるような復号器を持っている場合に,一部の視点映像だけでも復号して画像を表示できるからである。 When there is a viewpoint video with different spatial resolution, bit depth, and color space in MVC, it is preferable that only a viewpoint video with a specific spatial resolution, bit depth, or color space can be extracted. For example, when a decoder capable of decoding only encoded data in a specific spatial resolution, bit depth, or color space is provided, an image can be displayed by decoding only a part of viewpoint videos.
各視点映像の空間解像度やビット深度や色空間の情報はパラメータセットに記述されて符号化データの中に多重化されている。したがって,所望の空間解像度やビット深度や色空間の視点映像の符号化データを取り出す場合には,該当するパラメータセットの情報を符号化データ中から探し出す必要がある。このため,特にファイルに蓄積されている場合には,ファイルの先頭からパラメータセットを順次探して復号する必要があり,大きな負荷がかかっていた。 Information on the spatial resolution, bit depth, and color space of each viewpoint video is described in a parameter set and multiplexed in the encoded data. Therefore, when extracting encoded data of a viewpoint video in a desired spatial resolution, bit depth, or color space, it is necessary to search for information of the corresponding parameter set from the encoded data. For this reason, particularly when the data is stored in a file, it is necessary to sequentially search and decode the parameter set from the beginning of the file, which is a heavy load.
すなわち,本発明の課題は以下のとおりである。複数の動画像をまとめて符号化する場合に,色空間や空間解像度やビット深度の異なる動画像をまとめて符号化することを想定する。例えば撮影されるカメラの性能によって,これらの値は異なることがあり得る。このような動画像の符号化において,符号化データ中に個々の色空間や空間解像度やビット深度の情報を含めることができる。しかしながら,従来の符号化データの構成では,復号側では,これらの情報は符号化データを復号しなければ分からないため,所望の色空間や空間解像度やビット深度の動画像の符号化データを取り出すためには,大きな負荷がかかるという問題があった。 That is, the subject of this invention is as follows. When a plurality of moving images are encoded together, it is assumed that moving images having different color spaces, spatial resolutions, and bit depths are encoded together. For example, these values can vary depending on the performance of the camera being photographed. In such moving image encoding, information on individual color space, spatial resolution, and bit depth can be included in the encoded data. However, in the conventional encoded data configuration, since the decoding side does not know this information unless the encoded data is decoded, the encoded data of the moving image having the desired color space, spatial resolution, and bit depth is extracted. Therefore, there was a problem that a large load was applied.
本発明は,このような所望の色空間や空間解像度やビット深度の動画像の符号化データを取り出すときの負荷を低減する新しい技術手段を提供することを目的とする。 An object of the present invention is to provide a new technical means for reducing the load when extracting encoded data of a moving image having such a desired color space, spatial resolution, and bit depth.
本発明は,以上の課題を次のように解決する。符号化データを多重化するファイルフォーマット技術がある。このファイルフォーマット技術では,符号化データと管理情報に分けて,管理情報に各フレームの先頭位置情報を格納することが行われている。本発明では,このような管理情報に,フレーム先頭位置情報のほかに,色空間情報や空間解像度情報やビット深度情報も含める。これにより,管理情報を読み取るだけで,所望の色空間や空間解像度やビット深度のフレームの先頭位置を知ることができるため,そのようなフレームの符号化データを低負荷で取り出すことができる。 The present invention solves the above problems as follows. There is a file format technique for multiplexing encoded data. In this file format technique, the head position information of each frame is stored in the management information separately into encoded data and management information. In the present invention, such management information includes color space information, spatial resolution information, and bit depth information in addition to the frame head position information. As a result, it is possible to know the head position of a frame having a desired color space, spatial resolution, and bit depth simply by reading the management information, so that encoded data of such a frame can be extracted with a low load.
具体的には,本発明は,異なる色空間を持つ複数の動画像の間で予測符号化して作成された符号化データを多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームの色空間を示す色空間情報とを多重化し,符号化データの特定の位置に設定することを特徴とする。 Specifically, the present invention is a multiplexing method for multiplexing encoded data created by predictive encoding between a plurality of moving images having different color spaces to form a file, and comprising a frame of a moving image Position information in the first file, a moving picture number for distinguishing moving pictures, and color space information indicating the color space of the frame are multiplexed and set at a specific position of encoded data.
この多重化方法によれば,符号化データ中の特定の位置にある情報を復号することで,すべての符号化データを復号することなく,ファイルから所望の色空間の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望の色空間の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれる色空間情報を探索して復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding information at a specific position in the encoded data, the start position of the frame of the moving image frame in the desired color space from the file without decoding all the encoded data. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of the moving image in the desired color space is known in advance, the desired moving image can be recorded with low delay without searching for and decoding the color space information included in the encoded data. The encoded data can be decoded and reproduced.
また,本発明は,異なる色空間を持つ複数の動画像の間で予測符号化して作成された符号化データを多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームの色空間を示す色空間情報を第一のトラックとし,符号化データを第二のトラックとして,第一のトラックと第二のトラックをそれぞれ独立に多重化することを特徴とする。 The present invention also relates to a multiplexing method for forming a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different color spaces, and comprising a file at the head of a frame of a moving image. The position information in the image, the moving image number for distinguishing the moving image, and the color space information indicating the color space of the frame are set as the first track, the encoded data as the second track, the first track and the second track The tracks are multiplexed independently of each other.
この多重化方法によれば,第一トラックに含まれる色空間情報を復号することで,第二トラックの符号化データを復号することなく,ファイルから所望の色空間の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望の色空間の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれる色空間情報を復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding the color space information included in the first track, the start position of the frame of the moving image frame in the desired color space from the file without decoding the encoded data of the second track. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of the moving image in the desired color space is known in advance, the encoded data of the desired moving image can be obtained with low delay without decoding the color space information included in the encoded data. Can be decoded and played back.
また,本発明は,異なる空間解像度を持つ複数の動画像の間で予測符号化して作成された符号化データを多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームの空間解像度情報を多重化し,符号化データの特定の位置に設定することを特徴とする。 The present invention also relates to a multiplexing method for forming a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions. It is characterized in that the position information in it, the moving picture number for distinguishing moving pictures, and the spatial resolution information of the frame are multiplexed and set at a specific position of the encoded data.
この多重化方法によれば,符号化データ中の特定の位置にある情報を復号することで,すべての符号化データを復号することなく,ファイルから所望の空間解像度の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望の空間解像度の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれる空間解像度情報を探索して復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding information at a specific position in the encoded data, the start position of the frame of the moving image frame having a desired spatial resolution from the file without decoding all the encoded data. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of a moving image having a desired spatial resolution is known in advance, the desired moving image can be recorded with low delay without searching for and decoding the spatial resolution information included in the encoded data. The encoded data can be decoded and reproduced.
また,本発明は,異なる空間解像度を持つ複数の動画像の間で予測符号化して作成された符号化データを多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームの空間解像度情報を第一のトラックとし,符号化データを第二のトラックとして,第一のトラックと第二のトラックをそれぞれ独立に多重化することを特徴とする。 The present invention also relates to a multiplexing method for forming a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions. The position information in the image, the moving image number for distinguishing the moving image, the spatial resolution information of the frame as the first track, the encoded data as the second track, the first track and the second track, respectively. It is characterized by multiplexing independently.
この多重化方法によれば,第一トラックに含まれる空間解像度情報を復号することで,第二トラックの符号化データを復号することなく,ファイルから所望の空間解像度の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望の空間解像度の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれる空間解像度情報を復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding the spatial resolution information contained in the first track, the start position of the frame of the moving image frame having a desired spatial resolution from the file without decoding the encoded data of the second track. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of a moving image having a desired spatial resolution is known in advance, the encoded data of the desired moving image can be obtained with low delay without decoding the spatial resolution information included in the encoded data. Can be decoded and played back.
また,本発明は,異なるビット深度を持つ複数の動画像の間で予測符号化して作成された符号化データを 多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームのビット深度情報を多重化し,符号化データの特定の位置に設定することを特徴とする。 The present invention also relates to a multiplexing method for forming a file by multiplexing encoded data created by predictive coding between a plurality of moving images having different bit depths, and comprising a file at the head of a frame of a moving image. It is characterized in that the position information in it, the moving image number for distinguishing moving images, and the bit depth information of the frame are multiplexed and set at a specific position of the encoded data.
この多重化方法によれば,符号化データ中の特定の位置にある情報を復号することで,すべての符号化データを復号することなく,ファイルから所望のビット深度の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望のビット深度の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれるビット深度情報を探索して復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding the information at a specific position in the encoded data, the start position of the frame of the moving image frame of the desired bit depth from the file without decoding all the encoded data. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of a moving image having a desired bit depth is known in advance, the desired moving image can be recorded with low delay without searching for and decoding the bit depth information included in the encoded data. The encoded data can be decoded and reproduced.
また,本発明は,異なるビット深度を持つ複数の動画像の間で予測符号化して作成された符号化データを多重化してファイルを構成する多重化方法であって,動画像のフレーム先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームのビット深度情報を第一のトラックとし,符号化データを第二のトラックとして,第一のトラックと第二のトラックをそれぞれ独立に多重化することを特徴とする。 The present invention also relates to a multiplexing method for forming a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different bit depths, and comprising a file at the head of a frame of a moving image Position information, moving image number for distinguishing moving images, bit depth information of the frame as the first track, encoded data as the second track, first track and second track respectively It is characterized by multiplexing independently.
この多重化方法によれば,第一トラックに含まれるビット深度情報を復号することで,第二トラックの符号化データを復号することなく,ファイルから所望のビット深度の動画像のフレームの先頭位置を求めて,そのフレームの符号化データを取り出すことができる。同時に,符号化データを復号することなく,その動画像の動画像番号も求めることができる。これにより,所望のビット深度の動画像の動画像番号が予め分かっている場合に,符号化データ中に含まれるビット深度情報を復号することなく,低遅延で,所望の動画像の符号化データを復号して再生することができる。 According to this multiplexing method, by decoding the bit depth information included in the first track, the start position of the frame of the moving image frame having a desired bit depth from the file without decoding the encoded data of the second track. And the encoded data of the frame can be extracted. At the same time, the moving image number of the moving image can be obtained without decoding the encoded data. As a result, when the moving image number of a moving image having a desired bit depth is known in advance, the encoded data of the desired moving image can be obtained with low delay without decoding the bit depth information included in the encoded data. Can be decoded and played back.
なお,以上では,フレーム単位に管理情報を設定する例について説明したが,本発明において,フレームを分割したスライス単位に管理情報を設定してもよい。この場合には,管理情報はフレーム先頭位置の代わりに,スライス先頭位置情報を含む。また,多重化や読み取りもフレーム単位ではなく,スライス単位で行う。 Although an example in which management information is set for each frame has been described above, in the present invention, management information may be set for each slice obtained by dividing a frame. In this case, the management information includes slice head position information instead of the frame head position. In addition, multiplexing and reading are performed not on a frame basis but on a slice basis.
本発明によれば,色空間や空間解像度やビット深度の異なる複数の動画像をまとめて符号化した符号化データを多重化したファイルの中から,符号化データを復号することなく低演算負荷で,特定の色空間や空間解像度やビット深度の動画像の符号化データを取り出すことができる。 According to the present invention, from a file obtained by multiplexing encoded data obtained by collectively encoding a plurality of moving images having different color spaces, spatial resolutions, and bit depths, the encoded data can be reduced without decoding. , Encoded data of a moving image having a specific color space, spatial resolution, or bit depth can be extracted.
以下,図面を用いて本発明の多重化方法と,多重化されたファイルを読み込んで再生する方法の実施例を説明する。 Embodiments of a multiplexing method of the present invention and a method of reading and reproducing a multiplexed file will be described below with reference to the drawings.
第1の実施例では,フレーム先頭の位置情報と動画像番号と色空間情報を管理情報として多重化し,全ての符号化データを多重化した最後に設定する場合の例を示す。動画像はA,B,C,Dの4つあり,予め符号化されていて,各動画像におけるフレーム先頭の位置情報は分かっているものとする。 The first embodiment shows an example in which the frame head position information, moving image number, and color space information are multiplexed as management information, and all encoded data are set at the end of multiplexing. It is assumed that there are four moving images A, B, C, and D, which are encoded in advance, and the position information of the frame head in each moving image is known.
図1に多重化装置の構成を示す。図1に示す多重化装置10は,動画像A,B,C,Dの符号化データをそれぞれ入力する動画像A符号化データ入力部101,動画像B符号化データ入力部102,動画像C符号化データ入力部103,動画像D符号化データ入力部104と,各動画像のフレーム先頭の動画像中の位置情報をそれぞれ入力する動画像Aフレーム位置情報入力部106,動画像Bフレーム位置情報入力部107,動画像Cフレーム位置情報入力部108,動画像Dフレーム位置情報入力部109と,動画像間の参照関係を示す情報を入力する参照関係データ入力部105と,動画像の色空間情報を入力する色空間データ入力部117と,動画像の符号化データやフレーム位置情報の入力を切り替えるデータ切り替え部110と,符号化データを多重化する符号化データ多重化部111と,動画像番号を設定する動画像番号設定部112と,色空間情報を設定する色空間情報設定部113と,フレーム位置の先頭情報を設定するフレーム先頭位置情報設定部114と,管理情報を多重化する管理情報多重化部116と,符号化データと管理情報を多重化するファイル多重化部115とから構成される。
FIG. 1 shows the configuration of the multiplexing apparatus. A multiplexing
以上のうち,動画像番号設定部112では,動画像A,B,C,Dに対してそれぞれ動画像番号0,1,2,3を設定するものとする。動画像AからDまでのフレーム位置情報入力部106〜109は,次のフレームの位置情報を入力するものとする。フレーム先頭位置情報設定部114は,各動画像のフレーム位置情報をカウントし,符号化データ多重化部111で符号化データを多重化した後における各フレームの位置情報を設定するものとする。色空間情報設定部113は,色空間がYUVの3色の場合には色空間情報として1を設定し,グレースケールの場合には色空間情報として0を設定するものとする。ファイル多重化部115は,符号化データ多重化部111で作成された符号化データの後に,管理情報多重化部116で作成された管理情報を設定するものとする。符号化データ多重化部111は,参照関係データがある場合には各動画像の符号化データの前に多重化するものとする。
Among the above, the moving image
データ切り替え部110は,参照関係データに従い,次のように符号化データとファイル先頭位置情報を切り替えるものとする。動画像AからDまで順に,まず独立して復号できる動画像かどうかを判定する。独立して復号できる場合には,そのまま選択する。独立して復号できない場合には,参照する動画像の符号化データを既に選択したかどうかを判定する。既に選択した場合には,そのまま選択し,まだ選択していない場合には,参照する動画像が全て選択されるまで,その動画像を選択しない。
The
動画像間の参照関係は全て動画像AとCは独立して復号でき,動画像Bは動画像Aを参照し,動画像Dは動画像Cを参照するものとする。 As for the reference relationship between the moving images, the moving images A and C can be decoded independently, the moving image B refers to the moving image A, and the moving image D refers to the moving image C.
動画像の色空間は動画像AとBはYUV3色であり,動画像CとDはグレースケールであるとする。 As for the color space of the moving image, the moving images A and B are YUV three colors, and the moving images C and D are grayscale.
以上の前提で動画像A,B,C,Dの各フレームを多重化する場合には,動画像の各フレームは,次のように多重化される。 When the frames of moving images A, B, C, and D are multiplexed on the above assumption, the frames of the moving images are multiplexed as follows.
まず,先頭フレームについては,次のように多重化される。参照関係データ入力部105は,動画像間の参照関係データを入力する。データ切り替え部110は,参照関係データに従って符号化データを多重化する順序を決定する。ここでは,次の順序に決定する。動画像Aは独立して復号できるため,まず動画像Aを選択する。動画像Bは動画像Aのみを参照するため,次に動画像Bを選択する。動画像Cは独立して復号できるため,次に動画像Cを選択する。そして動画像Dを選択する。符号化データ多重化部111は,参照関係データを多重化する。フレーム先頭位置情報設定部114は,参照関係データのデータサイズ分だけファイルサイズを加算する。
First, the first frame is multiplexed as follows. The reference relationship
多重化する順序に従い,データ切り替え部110は,符号化データとフレーム先頭位置情報を切り替える。まず動画像Aを選択する。動画像A符号化データ入力部101は,符号化データを1フレーム分入力し,動画像Aフレーム位置情報入力部106は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号0を設定する。色空間情報設定部113は,色空間データ入力部117からの入力に基づき,色空間情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と色空間情報を多重化する。
In accordance with the order of multiplexing, the
続いてデータ切り替え部110は,動画像Bを選択する。動画像B符号化データ入力部102は,符号化データを1フレーム分入力し,動画像Bフレーム位置情報入力部107は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号1を設定する。色空間情報設定部113は,色空間情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と色空間情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Cを選択する。動画像C符号化データ入力部103は,符号化データを1フレーム分入力し,動画像Cフレーム位置情報入力部108は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号2を設定する。色空間情報設定部113は,色空間情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と色空間情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Dを選択する。動画像D符号化データ入力部104は,符号化データを1フレーム分入力し,動画像Dフレーム位置情報入力部109は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号3を設定する。色空間情報設定部113は,色空間情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と色空間情報を多重化する。
Subsequently, the
以上の動画像A,B,C,Dの処理を多重化するフレーム全てについて続ける。最後に,ファイル多重化部115は,符号化データ多重化部111で得られる符号化データと,管理情報多重化部116で得られる管理情報を多重化してファイルを作成する。以上の処理でファイルに多重化することができる。
The above processing of the moving images A, B, C, and D is continued for all the frames to be multiplexed. Finally, the
本実施例では,予め符号化して得られた符号化データとファイル先頭位置情報から多重化してファイルを作成する例を示したが,符号化データを作成しつつファイルを構成してもよい。 In the present embodiment, an example is shown in which a file is created by multiplexing from encoded data obtained by encoding in advance and file head position information, but a file may be configured while creating encoded data.
次に,多重化されたファイルから特定の動画像で所望の色空間の符号化データを取り出すファイル読み込み方法について動作を説明する。図2にファイル読み込み装置の構成を示す。図2に示すように,ファイル読み込み装置20は,ファイルを読み込むファイル入力部201と,管理情報を読み取る管理情報読み取り部202と,管理情報から所望の色空間情報を探索する色空間情報探索部204と,管理情報から動画像番号を判定する動画像番号判定部203と,管理情報からフレーム先頭位置情報を読み取るフレーム先頭位置情報設定部205と,フレーム先頭位置情報に従ってファイルから符号化データを読み取る符号化データ読み取り部206とで構成される。
Next, the operation of a file reading method for extracting encoded data of a desired color space with a specific moving image from a multiplexed file will be described. FIG. 2 shows the configuration of the file reading apparatus. As shown in FIG. 2, the
図1の多重化装置10で作成されたファイルからグレースケールの動画像Cの符号化データを読み取る場合の動作を示す。
The operation when reading the encoded data of the grayscale moving image C from the file created by the multiplexing
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。色空間情報探索部204は,第1フレームで色空間情報がグレースケールの動画像の管理情報を探索する。動画像番号判定部203は,探索して得られた管理情報の動画像番号が2であるかどうかを判定する。最初に探索される動画像番号は2であるので,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームで色空間情報探索部204で探索されて動画像番号判定部203で判定される管理情報の動画像番号は3であるので,そのフレームは復号しない。
The
以後のフレームについても,同様に動画像Cの符号化データを読み取る。 Similarly, the encoded data of the moving image C is read for the subsequent frames.
ここで動画像Cの符号化データのみを読み取るようにしたが,特定の色空間の動画像の符号化データを全て読み取るようにしてもよい。この場合のファイル読み込み装置の構成は図3のファイル読み込み装置21のようになり,図2の構成から動画像番号判定部203を省いた構成となる。この場合に,グレースケールの動画像の符号化データを読み取るときには,次のように処理される。
Although only the encoded data of the moving image C is read here, all the encoded data of the moving image in a specific color space may be read. The configuration of the file reading device in this case is the same as that of the
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。色空間情報探索部204は,第1フレームで色空間情報がグレースケールの動画像の管理情報を探索する。最初に探索される動画像番号2のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームで探索される動画像番号3のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。
The
以後のフレームについても,同様にグレースケールの動画像の符号化データを読み取る。 For the subsequent frames, the encoded data of the gray scale moving image is similarly read.
このように本実施例によれば,符号化データ中に含まれる色空間情報を復号することなく,特定の色空間情報の符号化データを取り出すことができる。 As described above, according to the present embodiment, encoded data of specific color space information can be extracted without decoding the color space information included in the encoded data.
なお本実施例では,グレースケールの動画像の符号化データを読み込む場合の処理を示したが,YUV3色の動画像の符号化データを読み込むようにしてもよい。 In this embodiment, the processing for reading the encoded data of the grayscale moving image is shown, but the encoded data of the YUV three-color moving image may be read.
なお,本実施例の多重化装置10では,符号化データの後に管理情報を設定したが,ファイルにトラックの構造が設定されている場合には,管理情報を第一トラックに設定し,符号化データを第二トラックに設定してもよい。
In the
図4に,ファイル中におけるトラックや管理情報の構成例を示す。作成されたファイルには,符号化データトラック30と管理情報トラック40とがあり,符号化データトラック30には,動画像A符号化データ31,動画像B符号化データ32,…が格納される。また,管理情報トラック40には,各時刻Tnごとの管理情報41,42,43,…が格納され,これらには各々,フレーム先頭位置情報,動画像番号,色空間情報などの情報が格納される。
FIG. 4 shows a configuration example of tracks and management information in a file. The created file includes an encoded
第2の実施例では,異なる空間解像度の動画像データを多重化し,特定の空間解像度の符号化データを読み込む場合の例を示す。第2の実施例では,フレーム先頭の位置情報と動画像番号と空間解像度情報を管理情報として多重化し,全ての符号化データを多重化した最後に設定する場合の例を示す。第1の実施例と同様に,動画像はA,B,C,Dの4つあり,予め符号化されていて,各動画像におけるフレーム先頭の位置情報は分かっているものとする。 The second embodiment shows an example in which moving image data having different spatial resolutions are multiplexed and encoded data having a specific spatial resolution is read. The second embodiment shows an example in which the position information at the beginning of the frame, the moving image number, and the spatial resolution information are multiplexed as management information and set at the end of multiplexing all the encoded data. As in the first embodiment, it is assumed that there are four moving images A, B, C, and D, which are encoded in advance, and the position information of the frame head in each moving image is known.
図5に多重化装置の構成を示す。図5に示す多重化装置11は,動画像A,B,C,Dの符号化データをそれぞれ入力する動画像A符号化データ入力部101,動画像B符号化データ入力部102,動画像C符号化データ入力部103,動画像D符号化データ入力部104と,各動画像のフレーム先頭の動画像中の位置情報をそれぞれ入力する動画像Aフレーム位置情報入力部106,動画像Bフレーム位置情報入力部107,動画像Cフレーム位置情報入力部108,動画像Dフレーム位置情報入力部109と,動画像間の参照関係を示す情報を入力する参照関係データ入力部105と,動画像の空間解像度情報を入力する空間解像度データ入力部119と,動画像の符号化データやフレーム位置情報の入力を切り替えるデータ切り替え部110と,符号化データを多重化する符号化データ多重化部111と,動画像番号を設定する動画像番号設定部112と,空間解像度情報を設定する空間解像度情報設定部118と,フレーム位置の先頭情報を設定するフレーム先頭位置情報設定部114と,管理情報を多重化する管理情報多重化部116と,符号化データと管理情報を多重化するファイル多重化部115とから構成される。
FIG. 5 shows the configuration of the multiplexing apparatus. The
以上のうち,動画像番号設定部112では,動画像A,B,C,Dに対してそれぞれ動画像番号0,1,2,3を設定するものとする。動画像AからDまでのフレーム位置情報入力部106〜109は,次のフレームの位置情報を入力するものとする。フレーム先頭位置情報設定部114は,各動画像のフレーム位置情報をカウントし,符号化データ多重化部111で符号化データを多重化した後における各フレームの位置情報を設定するものとする。空間解像度情報設定部118は,空間解像度がVGA(横640縦480画素)の場合には空間解像度情報として1を設定し,QVGA(横320縦240画素)の場合には空間解像度情報として0を設定するものとする。ファイル多重化部115は,符号化データ多重化部111で作成された符号化データの後に,管理情報多重化部116で作成された管理情報を設定するものとする。符号化データ多重化部111は,参照関係データがある場合には各動画像の符号化データの前に多重化するものとする。
Among the above, the moving image
データ切り替え部110は,参照関係データに従い,次のように符号化データとファイル先頭位置情報を切り替えるものとする。動画像AからDまで順に,まず独立して復号できる動画像かどうかを判定する。独立して復号できる場合には,そのまま選択する。独立して復号できない場合には,参照する動画像の符号化データを既に選択したかどうかを判定する。既に選択した場合には,そのまま選択し,まだ選択していない場合には,参照する動画像が全て選択されるまで,その動画像を選択しない。
The
動画像間の参照関係は,全て動画像AとCは独立して復号でき,動画像Bは動画像Aを参照し,動画像Dは動画像Cを参照するものとする。 Regarding the reference relationship between the moving images, all of the moving images A and C can be decoded independently, the moving image B refers to the moving image A, and the moving image D refers to the moving image C.
動画像の空間解像度は動画像AとBはVGAであり,動画像CとDはQVGAであるとする。 As for the spatial resolution of the moving image, the moving images A and B are VGA, and the moving images C and D are QVGA.
以上の前提で動画像A,B,C,Dの各フレームを多重化する場合には,動画像の各フレームは,次のように多重化される。 When the frames of moving images A, B, C, and D are multiplexed on the above assumption, the frames of the moving images are multiplexed as follows.
まず,先頭フレームについては,次のように多重化される。参照関係データ入力部105は,動画像間の参照関係データを入力する。データ切り替え部110は,参照関係データに従って符号化データを多重化する順序を決定する。ここでは,次の順序に決定する。動画像Aは独立して復号できるため,まず動画像Aを選択する。動画像Bは動画像Aのみを参照するため,次に動画像Bを選択する。動画像Cは独立して復号できるため,次に動画像Cを選択する。そして動画像Dを選択する。符号化データ多重化部111は,参照関係データを多重化する。フレーム先頭位置情報設定部114は,参照関係データのデータサイズ分だけファイルサイズを加算する。
First, the first frame is multiplexed as follows. The reference relationship
多重化する順序に従い,データ切り替え部110は,符号化データとフレーム先頭位置情報を切り替える。まず動画像Aを選択する。動画像A符号化データ入力部101は,符号化データを1フレーム分入力し,動画像Aフレーム位置情報入力部106は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号0を設定する。空間解像度情報設定部118は,空間解像度データ入力部119からの入力に基づき,空間解像度情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と空間解像度情報を多重化する。
In accordance with the order of multiplexing, the
続いてデータ切り替え部110は,動画像Bを選択する。動画像B符号化データ入力部102は,符号化データを1フレーム分入力し,動画像Bフレーム位置情報入力部107は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号1を設定する。空間解像度情報設定部118は,空間解像度情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と空間解像度情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Cを選択する。動画像C符号化データ入力部103は,符号化データを1フレーム分入力し,動画像Cフレーム位置情報入力部108は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号2を設定する。空間解像度情報設定部118は,空間解像度情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と空間解像度情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Dを選択する。動画像D符号化データ入力部104は,符号化データを1フレーム分入力し,動画像Dフレーム位置情報入力部109は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号3を設定する。空間解像度情報設定部118は,空間解像度情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号と空間解像度情報を多重化する。
Subsequently, the
以上の動画像A,B,C,Dの処理を多重化するフレーム全てについて続ける。最後に,ファイル多重化部115は,符号化データ多重化部111で得られる符号化データと,管理情報多重化部116で得られる管理情報を多重化してファイルを作成する。以上の処理でファイルに多重化することができる。
The above processing of the moving images A, B, C, and D is continued for all the frames to be multiplexed. Finally, the
本実施例では,予め符号化して得られた符号化データとファイル先頭位置情報から多重化してファイルを作成する例を示したが,符号化データを作成しつつファイルを構成してもよい。 In the present embodiment, an example is shown in which a file is created by multiplexing from encoded data obtained by encoding in advance and file head position information, but a file may be configured while creating encoded data.
次に,多重化されたファイルから特定の動画像で所望の空間解像度の符号化データを取り出すファイル読み込み方法について動作を説明する。図6にファイル読み込み装置の構成を示す。図6に示すファイル読み込み装置22は,ファイルを読み込むファイル入力部201と,管理情報を読み取る管理情報読み取り部202と,管理情報から所望の空間解像度情報を探索する空間解像度情報探索部207と,管理情報から動画像番号を判定する動画像番号判定部203と,管理情報からフレーム先頭位置情報を読み取るフレーム先頭位置情報設定部205と,フレーム先頭位置情報に従ってファイルから符号化データを読み取る符号化データ読み取り部206とで構成される。
Next, the operation of a file reading method for extracting encoded data having a desired spatial resolution from a multiplexed file with a specific moving image will be described. FIG. 6 shows the configuration of the file reading apparatus. 6 includes a
図5の多重化装置11で作成されたファイルからQVGAの動画像Cの符号化データを読み取る場合の動作を示す。
The operation when reading the encoded data of the moving image C of QVGA from the file created by the multiplexing
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。空間解像度情報探索部207は,第1フレームで空間解像度情報がQVGAの動画像の管理情報を探索する。動画像番号判定部203は,探索して得られた管理情報の動画像番号が2であるかどうかを判定する。最初に探索される動画像番号は2であるので,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームで空間解像度情報探索部207で探索されて動画像番号判定部203で判定される管理情報の動画像番号は3であるので,そのフレームは復号しない。
The
以後のフレームについても,同様に動画像Cの符号化データを読み取る。 Similarly, the encoded data of the moving image C is read for the subsequent frames.
ここで動画像Cの符号化データのみを読み取るようにしたが,特定の空間解像度の動画像の符号化データを全て読み取るようにしてもよい。この場合のファイル読み込み装置の構成は図7のファイル読み込み装置23のようになり,図6の構成から動画像番号判定部203を省いた構成となる。この場合に,QVGAの動画像の符号化データを読み取るときには,次のように処理される。
Although only the encoded data of the moving picture C is read here, all the encoded data of the moving picture having a specific spatial resolution may be read. The configuration of the file reading device in this case is the same as that of the
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。空間解像度情報探索部207は,第1フレームで空間解像度情報がQVGAの動画像の管理情報を探索する。最初に探索される動画像番号2のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームで探索される動画像番号3のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。
The
以後のフレームについても,同様にQVGAの動画像の符号化データを読み取る。 For the subsequent frames, the encoded data of the QVGA moving image is similarly read.
このように本実施例によれば,符号化データ中に含まれる空間解像度情報を復号することなく,特定の空間解像度情報の符号化データを取り出すことができる。 As described above, according to the present embodiment, encoded data of specific spatial resolution information can be extracted without decoding the spatial resolution information included in the encoded data.
なお本実施例では,QVGAの動画像の符号化データを読み込む場合の処理を示したが,VGAの動画像の符号化データを読み込むようにしてもよい。 In this embodiment, the process for reading the encoded data of the QVGA moving image is shown. However, the encoded data of the VGA moving image may be read.
なお,本実施例の多重化装置11では,符号化データの後に管理情報を設定したが,ファイルにトラックの構造が設定されている場合には,管理情報を第一トラックに設定し,符号化データを第二トラックに設定してもよい。
In the
図8に,ファイル中におけるトラックや管理情報の構成例を示す。作成されたファイルには,符号化データトラック30と管理情報トラック40とがあり,符号化データトラック30には,動画像A符号化データ31,動画像B符号化データ32,…が格納される。また,管理情報トラック40には,各時刻Tnごとの管理情報41,42,43,…が格納され,これらには各々,フレーム先頭位置情報,動画像番号,空間解像度情報などの情報が格納される。
FIG. 8 shows a configuration example of tracks and management information in a file. The created file includes an encoded
第3の実施例では,異なるビット深度の動画像データを多重化し,特定のビット深度の符号化データを読み込む場合の例を示す。第3の実施例では,フレーム先頭の位置情報と動画像番号とビット深度情報を管理情報として多重化し,全ての符号化データを多重化した最後に設定する場合の例を示す。第1の実施例と同様に,動画像はA,B,C,Dの4つあり,予め符号化されていて,各動画像におけるフレーム先頭の位置情報は分かっているものとする。 The third embodiment shows an example in which moving image data having different bit depths is multiplexed and encoded data having a specific bit depth is read. The third embodiment shows an example in which the frame head position information, moving picture number, and bit depth information are multiplexed as management information and set at the end of multiplexing all encoded data. As in the first embodiment, it is assumed that there are four moving images A, B, C, and D, which are encoded in advance, and the position information of the frame head in each moving image is known.
図9に多重化装置の構成を示す。図9に示す多重化装置12は,動画像A,B,C,Dの符号化データをそれぞれ入力する動画像A符号化データ入力部101,動画像B符号化データ入力部102,動画像C符号化データ入力部103,動画像D符号化データ入力部104と,各動画像のフレーム先頭の動画像中の位置情報をそれぞれ入力する動画像Aフレーム位置情報入力部106,動画像Bフレーム位置情報入力部107,動画像Cフレーム位置情報入力部108,動画像Dフレーム位置情報入力部109と,動画像間の参照関係を示す情報を入力する参照関係データ入力部105と,動画像のビット深度情報を入力するビット深度データ入力部121と,動画像の符号化データやフレーム位置情報の入力を切り替えるデータ切り替え部110と,符号化データを多重化する符号化データ多重化部111と,動画像番号を設定する動画像番号設定部112と,ビット深度情報を設定するビット深度情報設定部120と,フレーム位置の先頭情報を設定するフレーム先頭位置情報設定部114と,管理情報を多重化する管理情報多重化部116と,符号化データと管理情報を多重化するファイル多重化部115とから構成される。
FIG. 9 shows the configuration of the multiplexing apparatus. The multiplexing
以上のうち,動画像番号設定部112では,動画像A,B,C,Dに対してそれぞれ動画像番号0,1,2,3を設定するものとする。動画像AからDまでのフレーム位置情報入力部106〜109は,次のフレームの位置情報を入力するものとする。フレーム先頭位置情報設定部114は,各動画像のフレーム位置情報をカウントし,符号化データ多重化部111で符号化データを多重化した後における各フレームの位置情報を設定するものとする。ビット深度情報設定部120は,ビット深度が10ビットの場合にはビット深度情報として1を設定し,8ビットの場合にはビット深度情報として0を設定するものとする。ファイル多重化部115は,符号化データ多重化部111で作成された符号化データの後に,管理情報多重化部116で作成された管理情報を設定するものとする。符号化データ多重化部111は,参照関係データがある場合には各動画像の符号化データの前に多重化するものとする。
Among the above, the moving image
データ切り替え部110は,参照関係データに従い,次のように符号化データとファイル先頭位置情報を切り替えるものとする。動画像AからDまで順に,まず独立して復号できる動画像かどうかを判定する。独立して復号できる場合には,そのまま選択する。独立して復号できない場合には,参照する動画像の符号化データを既に選択したかどうかを判定する。既に選択した場合には,そのまま選択し,まだ選択していない場合には,参照する動画像が全て選択されるまで,その動画像を選択しない。
The
動画像間の参照関係は,全て動画像AとCは独立して復号でき,動画像Bは動画像Aを参照し,動画像Dは動画像Cを参照するものとする。 Regarding the reference relationship between the moving images, all of the moving images A and C can be decoded independently, the moving image B refers to the moving image A, and the moving image D refers to the moving image C.
動画像のビット深度は動画像AとBは10ビットであり,動画像CとDは8ビットであるとする。 The bit depth of moving images is 10 bits for moving images A and B, and 8 bits for moving images C and D.
以上の前提で動画像A,B,C,Dの各フレームを多重化する場合には,次のように多重化される。 When the frames of the moving images A, B, C, and D are multiplexed based on the above premise, they are multiplexed as follows.
まず,先頭フレームについては次のように多重化される。参照関係データ入力部105は,動画像間の参照関係データを入力する。データ切り替え部110は,参照関係データに従って符号化データを多重化する順序を決定する。ここでは,次の順序に決定する。動画像Aは独立して復号できるため,まず動画像Aを選択する。動画像Bは動画像Aのみを参照するため,次に動画像Bを選択する。動画像Cは独立して復号できるため,次に動画像Cを選択する。そして動画像Dを選択する。符号化データ多重化部111は,参照関係データを多重化する。フレーム先頭位置情報設定部114は,参照関係データのデータサイズ分だけファイルサイズを加算する。
First, the first frame is multiplexed as follows. The reference relationship
多重化する順序に従い,データ切り替え部110は,符号化データとフレーム先頭位置情報を切り替える。まず動画像Aを選択する。動画像A符号化データ入力部101は,符号化データを1フレーム分入力し,動画像Aフレーム位置情報入力部106は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号0を設定する。ビット深度情報設定部120は,ビット深度データ入力部121からの入力に基づき,ビット深度情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号とビット深度情報を多重化する。
In accordance with the order of multiplexing, the
続いてデータ切り替え部110は,動画像Bを選択する。動画像B符号化データ入力部102は,符号化データを1フレーム分入力し,動画像Bフレーム位置情報入力部107は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号1を設定する。ビット深度情報設定部120は,ビット深度情報として1を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号とビット深度情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Cを選択する。動画像C符号化データ入力部103は,符号化データを1フレーム分入力し,動画像Cフレーム位置情報入力部108は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号2を設定する。ビット深度情報設定部120は,ビット深度情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号とビット深度情報を多重化する。
Subsequently, the
続いてデータ切り替え部110は,動画像Dを選択する。動画像D符号化データ入力部104は,符号化データを1フレーム分入力し,動画像Dフレーム位置情報入力部109は,次のフレームのフレーム位置情報を入力する。符号化データ多重化部111は,符号化データを多重化する。フレーム先頭位置情報設定部114は,入力されたフレーム位置情報をファイルサイズに加算し,ファイルのフレーム位置情報として設定する。動画像番号設定部112は,動画像番号3を設定する。ビット深度情報設定部120は,ビット深度情報として0を設定する。管理情報多重化部116は,フレーム位置情報と動画像番号とビット深度情報を多重化する。
Subsequently, the
以上の動画像A,B,C,Dの処理を多重化するフレーム全てについて続ける。最後に,ファイル多重化部115は,符号化データ多重化部111で得られる符号化データと,管理情報多重化部116で得られる管理情報を多重化してファイルを作成する。以上の処理でファイルに多重化することができる。
The above processing of the moving images A, B, C, and D is continued for all the frames to be multiplexed. Finally, the
本実施例では,予め符号化して得られた符号化データとファイル先頭位置情報から多重化してファイルを作成する例を示したが,符号化データを作成しつつファイルを構成してもよい。 In the present embodiment, an example is shown in which a file is created by multiplexing from encoded data obtained by encoding in advance and file head position information, but a file may be configured while creating encoded data.
次に,多重化されたファイルから特定の動画像で所望のビット深度の符号化データを取り出すファイル読み込み方法について動作を説明する。図10にファイル読み込み装置の構成を示す。図10に示すファイル読み込み装置24は,ファイルを読み込むファイル入力部201と,管理情報を読み取る管理情報読み取り部202と,管理情報から所望のビット深度情報を探索するビット深度情報探索部208と,管理情報から動画像番号を判定する動画像番号判定部203と,管理情報からフレーム先頭位置情報を読み取るフレーム先頭位置情報設定部205と,フレーム先頭位置情報に従ってファイルから符号化データを読み取る符号化データ読み取り部206とで構成される。
Next, the operation of a file reading method for extracting encoded data having a desired bit depth from a multiplexed file with a specific moving image will be described. FIG. 10 shows the configuration of the file reading apparatus. 10 includes a
図9の多重化装置12で作成されたファイルから8ビットの動画像Cの符号化データを読み取る場合の動作を示す。
The operation when reading the encoded data of the 8-bit moving image C from the file created by the multiplexing
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。ビット深度情報探索部208は,第1フレームでビット深度情報が8ビットの動画像の管理情報を探索する。動画像番号判定部203は,探索して得られた管理情報の動画像番号が2であるかどうかを判定する。最初に探索される動画像番号は2であるので,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームでビット深度情報探索部208で探索されて動画像番号判定部203で判定される管理情報の動画像番号は3であるので,そのフレームは復号しない。
The
以後のフレームについても,同様に動画像Cの符号化データを読み取る。 Similarly, the encoded data of the moving image C is read for the subsequent frames.
ここで動画像Cの符号化データのみを読み取るようにしたが,特定のビット深度の動画像の符号化データを全て読み取るようにしてもよい。この場合のファイル読み込み装置の構成は図11のファイル読み込み装置25のようになり,図10の構成から動画像番号判定部203を省いた構成となる。この場合に,8ビットの動画像の符号化データを読み取るときには,次のように処理される。
Although only the encoded data of the moving picture C is read here, all the encoded data of the moving picture having a specific bit depth may be read. In this case, the configuration of the file reading device is the same as that of the
ファイル入力部201は,ファイルを入力する。管理情報読み取り部202は,ファイルの後半にある管理情報を読み取る。ビット深度情報探索部208は,第1フレームでビット深度情報が8ビットの動画像の管理情報を探索する。最初に探索される動画像番号2のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。次に第1フレームで探索される動画像番号3のフレームについて,フレーム先頭位置情報設定部205は,このフレームのフレーム先頭位置情報を設定する。符号化データ読み取り部206は,設定されたファイル位置から符号化データを読み取る。このとき,フレーム先頭位置情報設定部205で得られる次のフレームの先頭位置までを読み取る。
The
以後のフレームについても,同様に8ビットの動画像の符号化データを読み取る。 Similarly, for the subsequent frames, the encoded data of the 8-bit moving image is read.
このように本実施例によれば,符号化データ中に含まれるビット深度情報を復号することなく,特定のビット深度情報の符号化データを取り出すことができる。 As described above, according to the present embodiment, encoded data of specific bit depth information can be extracted without decoding the bit depth information included in the encoded data.
なお本実施例では,8ビットの動画像の符号化データを読み込む場合の処理を示したが,10ビットの動画像の符号化データを読み込むようにしてもよい。 In the present embodiment, the process for reading encoded data of 8-bit moving images is shown. However, encoded data of 10-bit moving images may be read.
なお,本実施例の多重化装置12では,符号化データの後に管理情報を設定したが,ファイルにトラックの構造が設定されている場合には,管理情報を第一トラックに設定し,符号化データを第二トラックに設定してもよい。
In the
図12に,ファイル中におけるトラックや管理情報の構成例を示す。作成されたファイルには,符号化データトラック30と管理情報トラック40とがあり,符号化データトラック30には,動画像A符号化データ31,動画像B符号化データ32,…が格納される。また,管理情報トラック40には,各時刻Tnごとの管理情報41,42,43,…が格納され,これらには各々,フレーム先頭位置情報,動画像番号,ビット深度情報などの情報が格納される。
FIG. 12 shows a configuration example of tracks and management information in a file. The created file includes an encoded
以上の実施例で異なる色空間や空間解像度やビット深度の動画像の符号化データを多重化する装置と,特定の動画像を読み取る装置の動作の例を示した。本発明は,色空間や空間解像度やビット深度のうち,いずれかが異なるのではなく,組み合わせて異なる場合にも適用できる。例えば,色空間と空間解像度が同時に異なる場合の動画像の符号化データを多重化してもよい。この場合の多重化では,管理情報として,色空間情報と空間解像度情報が同時に多重化される。 In the above embodiment, an example of the operation of a device that multiplexes encoded data of moving images having different color spaces, spatial resolutions, and bit depths and a device that reads a specific moving image has been shown. The present invention can also be applied to a case where any one of color space, spatial resolution, and bit depth is not different but is different in combination. For example, encoded data of moving images in the case where the color space and the spatial resolution are different may be multiplexed. In this case, the color space information and the spatial resolution information are multiplexed simultaneously as management information.
また,以上の実施例の説明では,フレーム単位に管理情報を設定する例について説明したが,フレームを分割したスライス単位に管理情報を設定してもよい。この場合には,管理情報はフレーム先頭位置の代わりに,スライス先頭位置情報を含む。また,多重化や読み取りもフレーム単位ではなく,スライス単位で行う。すなわち,上記実施例の説明において,フレームをスライスに読み替えて本発明を実施することも可能である。 In the above description of the embodiment, an example in which management information is set in units of frames has been described. However, management information may be set in units of slices obtained by dividing a frame. In this case, the management information includes slice head position information instead of the frame head position. In addition, multiplexing and reading are performed not on a frame basis but on a slice basis. That is, in the description of the above embodiment, the present invention can be implemented by replacing a frame with a slice.
以上の多重化装置およびファイル読み込み装置による処理は,コンピュータとソフトウェアプログラムとによって実現することもでき,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。 The above processing by the multiplexing device and the file reading device can be realized by a computer and a software program, and the program can be provided by being recorded on a computer-readable recording medium or provided through a network. It is.
10,11,12 多重化装置
101 動画像A符号化データ入力部
102 動画像B符号化データ入力部
103 動画像C符号化データ入力部
104 動画像D符号化データ入力部
105 参照関係データ入力部
106 動画像Aフレーム位置情報入力部
107 動画像Bフレーム位置情報入力部
108 動画像Cフレーム位置情報入力部
109 動画像Dフレーム位置情報入力部
110 データ切り替え部
111 符号化データ多重化部
112 動画像番号設定部
113 色空間情報設定部
114 フレーム先頭位置情報設定部
115 ファイル多重化部
116 管理情報多重化部
117 色空間データ入力部
118 空間解像度情報設定部
119 空間解像度データ入力部
120 ビット深度情報設定部
121 ビット深度データ入力部
20,21,22,23,24,25 ファイル読み込み装置
201 ファイル入力部
202 管理情報読み取り部
203 動画像番号判定部
204 色空間情報探索部
205 フレーム先頭位置情報設定部
206 符号化データ読み取り部
207 空間解像度情報探索部
208 ビット深度情報探索部
10, 11, 12
Claims (22)
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報を多重化する過程と,
前記多重化した情報を,各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に設定してファイルを構成する過程と,
を有することを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different color spaces,
A process of multiplexing position information in a frame or slice head file of a moving image, a moving image number for distinguishing the moving image, and color space information indicating a color space of the frame or slice;
A process of configuring the multiplexed information at a specific position different from the encoded data to be decoded of each moving image frame or slice, and configuring a file;
A method for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報を第一のトラックとし,
各フレームまたはスライスの符号化データを第二のトラックとして,
前記第一のトラックと前記第二のトラックとをそれぞれ独立に多重化してファイルを構成する
ことを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different color spaces,
The position information in the frame or slice head file of the moving image, the moving image number for distinguishing the moving image, and the color space information indicating the color space of the frame or slice are set as the first track,
The encoded data of each frame or slice as the second track
A method for multiplexing moving images, wherein the first track and the second track are multiplexed independently to form a file.
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度情報を多重化する過程と,
前記多重化した情報を,各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に設定してファイルを構成する過程と,
を有することを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions,
A process of multiplexing position information in a frame or slice head file of a moving image, a moving image number for distinguishing the moving image, and spatial resolution information of the frame or slice;
A process of configuring the multiplexed information at a specific position different from the encoded data to be decoded of each moving image frame or slice, and configuring a file;
A method for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度情報を第一のトラックとし,
各フレームまたはスライスの符号化データを第二のトラックとして,
前記第一のトラックと前記第二のトラックとをそれぞれ独立に多重化してファイルを構成する
ことを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions,
The first track is the position information in the frame or slice head file of the moving image, the moving image number for distinguishing the moving image, and the spatial resolution information of the frame or slice.
The encoded data of each frame or slice as the second track
A method for multiplexing moving images, wherein the first track and the second track are multiplexed independently to form a file.
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度情報を多重化する過程と,
前記多重化した情報を,各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に設定してファイルを構成する過程と,
を有することを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different bit depths,
A process of multiplexing position information in a frame or slice head file of a moving image, a moving image number for distinguishing the moving image, and bit depth information of the frame or slice;
A process of configuring the multiplexed information at a specific position different from the encoded data to be decoded of each moving image frame or slice, and configuring a file;
A method for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度情報を第一のトラックとし,
各フレームまたはスライスの符号化データを第二のトラックとして,
前記第一のトラックと前記第二のトラックとをそれぞれ独立に多重化してファイルを構成する
ことを特徴とする動画像の多重化方法。 A multiplexing method for constructing a file by multiplexing encoded data created by predictive encoding between a plurality of moving images having different bit depths,
The position information in the frame or slice head file of the moving image, the moving image number for distinguishing the moving image, and the bit depth information of the frame or slice as the first track,
The encoded data of each frame or slice as the second track
A method for multiplexing moving images, wherein the first track and the second track are multiplexed independently to form a file.
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報を多重化した管理情報を作成する管理情報多重化部と,
各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に前記管理情報多重化部で作成された管理情報を設定するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different color spaces to constitute a file,
Management information multiplexing for creating management information by multiplexing position information in the frame or slice head file of a moving image, a moving image number for distinguishing the moving image, and color space information indicating the color space of the frame or slice Part,
A file multiplexing unit for setting the management information created by the management information multiplexing unit at a specific position different from the encoded data to be decoded for each moving image frame or slice;
An apparatus for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報を第一のトラックとして多重化する管理情報多重化部と,
各フレームまたはスライスの符号化データを第二のトラックとして多重化する符号化データ多重化部と,
前記第一のトラックと前記第二のトラックとを多重化してファイルを構成するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different color spaces to constitute a file,
Management information multiplexing that multiplexes the position information in the frame or slice head file of the moving image, the moving image number for distinguishing the moving image, and the color space information indicating the color space of the frame or slice as the first track. Part,
An encoded data multiplexing unit that multiplexes encoded data of each frame or slice as a second track;
A file multiplexing unit configured to multiplex the first track and the second track to form a file;
An apparatus for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度情報を多重化した管理情報を作成する管理情報多重化部と,
各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に前記管理情報多重化部で作成された管理情報を設定するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions to form a file,
A management information multiplexing unit for creating management information in which position information in a moving image frame or slice head file, a moving image number for distinguishing moving images, and spatial resolution information of the frame or slice are multiplexed;
A file multiplexing unit for setting the management information created by the management information multiplexing unit at a specific position different from the encoded data to be decoded for each moving image frame or slice;
An apparatus for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度情報を第一のトラックとして多重化する管理情報多重化部と,
各フレームまたはスライスの符号化データを第二のトラックとして多重化する符号化データ多重化部と,
前記第一のトラックと前記第二のトラックとを多重化してファイルを構成するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions to form a file,
A management information multiplexing unit for multiplexing position information in a frame or slice head file of a moving image, a moving image number for distinguishing the moving image, and spatial resolution information of the frame or slice as a first track;
An encoded data multiplexing unit that multiplexes encoded data of each frame or slice as a second track;
A file multiplexing unit configured to multiplex the first track and the second track to form a file;
An apparatus for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度情報を多重化した管理情報を作成する管理情報多重化部と,
各動画像のフレームまたはスライスの復号対象となる符号化データとは別の特定の位置に前記管理情報多重化部で作成された管理情報を設定するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different bit depths to form a file,
A management information multiplexing unit that creates position information in a frame or slice head file of a moving image, a moving image number that distinguishes the moving image, and management information that multiplexes the bit depth information of the frame or slice;
A file multiplexing unit for setting the management information created by the management information multiplexing unit at a specific position different from the encoded data to be decoded for each moving image frame or slice;
An apparatus for multiplexing moving images, comprising:
動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度情報を第一のトラックとして多重化する管理情報多重化部と,
各フレームまたはスライスの符号化データを第二のトラックとして多重化する符号化データ多重化部と,
前記第一のトラックと前記第二のトラックとを多重化してファイルを構成するファイル多重化部と,
を備えることを特徴とする動画像の多重化装置。 A multiplexing device that multiplexes encoded data created by predictive encoding between a plurality of moving images having different bit depths to form a file,
A management information multiplexing unit that multiplexes the position information in the frame or slice head file of the moving image, the moving image number for distinguishing the moving image, and the bit depth information of the frame or slice as the first track;
An encoded data multiplexing unit that multiplexes encoded data of each frame or slice as a second track;
A file multiplexing unit configured to multiplex the first track and the second track to form a file;
An apparatus for multiplexing moving images, comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報とが含まれる管理情報データを読み込む過程と,
予め設定した色空間情報を持つ管理情報を前記管理情報データから探索する過程と,
探索した管理情報中の予め設定した色空間情報となるフレームまたはスライスの先頭位置情報を読み取る過程と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る過程と,
を有することを特徴とする動画像のファイル読み込み方法。 A method for reading encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different color spaces and management information data thereof are multiplexed and stored. There,
Management information data including position information in the frame or slice head file of the moving image, a moving image number for distinguishing the moving image, and color space information indicating the color space of the frame or slice is read from the file. Process,
Searching for management information having color space information set in advance from the management information data;
The process of reading the start position information of the frame or slice that becomes the preset color space information in the searched management information,
The process of reading the encoded data of the read frame or slice head position,
A method of reading a moving image file, comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度を示す空間解像度情報とが含まれる管理情報データを読み込む過程と,
予め設定した空間解像度情報を持つ管理情報を前記管理情報データから探索する過程と,
探索した管理情報中の予め設定した空間解像度情報となるフレームまたはスライスの先頭位置情報を読み取る過程と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る過程と,
を有することを特徴とする動画像のファイル読み込み方法。 A method for reading encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions and management information data thereof are multiplexed and stored. There,
Management information data including position information in the frame or slice head file of the moving image, a moving image number for distinguishing the moving image, and spatial resolution information indicating the spatial resolution of the frame or slice is read from the file. Process,
Searching for management information having spatial resolution information set in advance from the management information data;
The process of reading the start position information of the frame or slice that becomes the preset spatial resolution information in the searched management information,
The process of reading the encoded data of the read frame or slice head position,
A method of reading a moving image file, comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度を示すビット深度情報とが含まれる管理情報データを読み込む過程と,
予め設定したビット深度情報を持つ管理情報を前記管理情報データから探索する過程と,
探索した管理情報中の予め設定したビット深度情報となるフレームまたはスライスの先頭位置情報を読み取る過程と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る過程と,
を有することを特徴とする動画像のファイル読み込み方法。 A method for reading encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different bit depths and management information data thereof are multiplexed and stored. There,
Management information data including position information in a moving image frame or slice head file, a moving image number for distinguishing moving images, and bit depth information indicating the bit depth of the frame or slice is read from the file. Process,
Searching for management information having a preset bit depth information from the management information data;
The process of reading the head position information of the frame or slice that becomes the preset bit depth information in the searched management information,
The process of reading the encoded data of the read frame or slice head position,
A method of reading a moving image file, comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの色空間を示す色空間情報とが含まれる管理情報データを読み込む管理情報読み取り部と,
予め設定した色空間情報を持つ管理情報を前記管理情報データから探索する色空間情報探索部と,
探索した管理情報中の予め設定した色空間情報となるフレームまたはスライスの先頭位置情報を読み取るフレームまたはスライス先頭位置情報設定部と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る符号化データ読み取り部と,
を備えることを特徴とする動画像のファイル読み込み装置。 A device that reads encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different color spaces and management information data thereof are multiplexed and stored. There,
Management information data including position information in the frame or slice head file of the moving image, a moving image number for distinguishing the moving image, and color space information indicating the color space of the frame or slice is read from the file. A management information reading unit;
A color space information search unit for searching for management information having preset color space information from the management information data;
A frame or slice head position information setting unit for reading the head position information of a frame or slice that is preset color space information in the searched management information;
An encoded data reading unit for reading the encoded data of the read frame or slice head position;
A moving image file reading apparatus comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスの空間解像度を示す空間解像度情報とが含まれる管理情報データを読み込む管理情報読み取り部と,
予め設定した空間解像度情報を持つ管理情報を前記管理情報データから探索する空間解像度情報探索部と,
探索した管理情報中の予め設定した空間解像度情報となるフレームまたはスライスの先頭位置情報を読み取るフレームまたはスライス先頭位置情報設定部と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る符号化データ読み取り部と,
を備えることを特徴とする動画像のファイル読み込み装置。 A device that reads encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different spatial resolutions and management information data thereof are multiplexed and stored. There,
Management information data including position information in the frame or slice head file of the moving image, a moving image number for distinguishing the moving image, and spatial resolution information indicating the spatial resolution of the frame or slice is read from the file. A management information reading unit;
A spatial resolution information search unit for searching for management information having preset spatial resolution information from the management information data;
A frame or slice head position information setting section for reading the head position information of a frame or slice that is preset spatial resolution information in the searched management information;
An encoded data reading unit for reading the encoded data of the read frame or slice head position;
A moving image file reading apparatus comprising:
前記ファイルから,動画像のフレームまたはスライス先頭のファイル中の位置情報と,動画像を区別する動画像番号と,該フレームまたはスライスのビット深度を示すビット深度情報とが含まれる管理情報データを読み込む管理情報読み取り部と,
予め設定したビット深度情報を持つ管理情報を前記管理情報データから探索するビット深度情報探索部と,
探索した管理情報中の予め設定したビット深度情報となるフレームまたはスライスの先頭位置情報を読み取るフレームまたはスライス先頭位置情報設定部と,
読み取ったフレームまたはスライス先頭位置の符号化データを読み取る符号化データ読み取り部と,
を備えることを特徴とする動画像のファイル読み込み装置。 A device that reads encoded data to be decoded from a file in which encoded data created by predictive encoding between a plurality of moving images having different bit depths and management information data thereof are multiplexed and stored. There,
Management information data including position information in a moving image frame or slice head file, a moving image number for distinguishing moving images, and bit depth information indicating the bit depth of the frame or slice is read from the file. A management information reading unit;
A bit depth information search unit for searching for management information having preset bit depth information from the management information data;
A frame or slice head position information setting unit for reading the head position information of a frame or a slice that is a preset bit depth information in the searched management information;
An encoded data reading unit for reading the encoded data of the read frame or slice head position;
A moving image file reading apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008001010A JP5128963B2 (en) | 2008-01-08 | 2008-01-08 | Multiplexing method of moving image, method and apparatus for reading file, program thereof and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008001010A JP5128963B2 (en) | 2008-01-08 | 2008-01-08 | Multiplexing method of moving image, method and apparatus for reading file, program thereof and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009164937A true JP2009164937A (en) | 2009-07-23 |
JP5128963B2 JP5128963B2 (en) | 2013-01-23 |
Family
ID=40967011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008001010A Active JP5128963B2 (en) | 2008-01-08 | 2008-01-08 | Multiplexing method of moving image, method and apparatus for reading file, program thereof and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5128963B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013511889A (en) * | 2009-11-18 | 2013-04-04 | トムソン ライセンシング | Method and system for 3D content distribution with flexible parallax selection |
JP2017509278A (en) * | 2014-02-10 | 2017-03-30 | エルジー エレクトロニクス インコーポレイティド | Broadcast signal transmission / reception method and apparatus for 3D broadcasting service |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5011383B2 (en) | 2007-05-16 | 2012-08-29 | 電気化学工業株式会社 | Electron source |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264834A (en) * | 2002-03-08 | 2003-09-19 | Canon Inc | Encoder, encoding method, program, and storage medium |
JP2004206742A (en) * | 2002-12-24 | 2004-07-22 | Hitachi Ltd | Recording or reproducing device |
JP2005259244A (en) * | 2004-03-11 | 2005-09-22 | Casio Comput Co Ltd | Compressed data recorder, and compressed data reproduction device and method |
WO2006080739A1 (en) * | 2004-10-12 | 2006-08-03 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding multi-view video using image stitching |
WO2007047736A2 (en) * | 2005-10-19 | 2007-04-26 | Thomson Licensing | Multi-view video coding using scalable video coding |
JP2007266749A (en) * | 2006-03-27 | 2007-10-11 | Sanyo Electric Co Ltd | Encoding method |
-
2008
- 2008-01-08 JP JP2008001010A patent/JP5128963B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264834A (en) * | 2002-03-08 | 2003-09-19 | Canon Inc | Encoder, encoding method, program, and storage medium |
JP2004206742A (en) * | 2002-12-24 | 2004-07-22 | Hitachi Ltd | Recording or reproducing device |
JP2005259244A (en) * | 2004-03-11 | 2005-09-22 | Casio Comput Co Ltd | Compressed data recorder, and compressed data reproduction device and method |
WO2006080739A1 (en) * | 2004-10-12 | 2006-08-03 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding multi-view video using image stitching |
WO2007047736A2 (en) * | 2005-10-19 | 2007-04-26 | Thomson Licensing | Multi-view video coding using scalable video coding |
JP2007266749A (en) * | 2006-03-27 | 2007-10-11 | Sanyo Electric Co Ltd | Encoding method |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013511889A (en) * | 2009-11-18 | 2013-04-04 | トムソン ライセンシング | Method and system for 3D content distribution with flexible parallax selection |
JP2017509278A (en) * | 2014-02-10 | 2017-03-30 | エルジー エレクトロニクス インコーポレイティド | Broadcast signal transmission / reception method and apparatus for 3D broadcasting service |
Also Published As
Publication number | Publication date |
---|---|
JP5128963B2 (en) | 2013-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6410913B2 (en) | Image encoding device, image encoding method and program, image decoding device, image decoding method and program | |
JP5555775B2 (en) | Video format for digital video recorder | |
JP5909305B2 (en) | Encoding method and encoding apparatus | |
JP5909306B2 (en) | Decoding method and decoding apparatus | |
WO2013146636A1 (en) | Image encoding device, image decoding device, image encoding method, image decoding method and program | |
JP5128963B2 (en) | Multiplexing method of moving image, method and apparatus for reading file, program thereof and computer-readable recording medium | |
JP5171270B2 (en) | Multiplexing method and apparatus for moving picture, and program and computer-readable recording medium | |
US20230300350A1 (en) | Image encoding/decoding method and apparatus for performing sub-bitstream extraction process on basis of maximum time identifier, and computer-readable recording medium storing bitstream | |
WO2016111199A1 (en) | Image processing device, image processing method, and program, and recording medium | |
JP2017147749A (en) | Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100331 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121101 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5128963 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151109 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |