JPWO2008053557A1 - Moving image re-encoding device, moving image re-encoding method, moving image re-encoding program, and recording medium storing moving image re-encoding program - Google Patents
Moving image re-encoding device, moving image re-encoding method, moving image re-encoding program, and recording medium storing moving image re-encoding program Download PDFInfo
- Publication number
- JPWO2008053557A1 JPWO2008053557A1 JP2008541969A JP2008541969A JPWO2008053557A1 JP WO2008053557 A1 JPWO2008053557 A1 JP WO2008053557A1 JP 2008541969 A JP2008541969 A JP 2008541969A JP 2008541969 A JP2008541969 A JP 2008541969A JP WO2008053557 A1 JPWO2008053557 A1 JP WO2008053557A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- encoding
- encoded
- images
- groups
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
- H04N19/194—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Abstract
【課題】符号化した動画像を一旦復号して、再度符号化する動画像再符号化装置において、遅延時間やメモリが削減されるとともに適切な符号量を予測する。【解決手段】入力ビットストリームを復号部101で復号した際に得られるピクチャタイプから、符号化情報解析部102内のGOP構造予測部200において、例えば8つのGOP内のPピクチャ枚数をカウントし、最大値と最小値を持つGOPを除いた6つのGOPからPピクチャ枚数とBピクチャ枚数の平均値を算出し、それを予測したGOP構造とする。符号化部103では、予測したGOP構造を参照して再符号化を行う。【選択図】図1In a moving image re-encoding apparatus that once decodes an encoded moving image and re-encodes it, a delay time and memory are reduced and an appropriate code amount is predicted. A GOP structure prediction unit in a coding information analysis unit counts, for example, the number of P pictures in eight GOPs from a picture type obtained when an input bit stream is decoded by a decoding unit. An average value of the number of P pictures and the number of B pictures is calculated from six GOPs excluding the GOP having the maximum value and the minimum value, and a predicted GOP structure is obtained. The encoding unit 103 performs re-encoding with reference to the predicted GOP structure. [Selection] Figure 1
Description
本発明は、一度符号化された動画像を符号化方式やビットレートなどを変更して再度符号化する動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラムおよび動画像再符号化プログラムを格納した記録媒体に関する。 The present invention relates to a moving image re-encoding device, a moving image re-encoding method, a moving image re-encoding program, and a moving image that re-encode a moving image that has been encoded once by changing an encoding method, a bit rate, or the like. The present invention relates to a recording medium storing a re-encoding program.
動画像をデジタル化して記録または放送されることが多くなっている。しかし動画像はデータ量が膨大であるために、通常、符号化によりデータ量を少なくして記録または放送されている。そのような動画像の符号化の方式としてMPEG(Moving Picture Experts Group)−2などが用いられる。 In many cases, moving images are digitized and recorded or broadcast. However, since moving images have an enormous amount of data, they are usually recorded or broadcast with a reduced amount of data by encoding. MPEG (Moving Picture Experts Group) -2 or the like is used as such a moving image encoding method.
MPEG−2などで符号化された動画像を、記録する記録媒体の容量や伝送する通信回線の速度などに応じてビットレートを変換して再符号化したり、近年登場したMPEG−4やH.264などのMPEG−2よりも高効率な符号化方式で再符号化したりすることがある。 A moving picture encoded by MPEG-2 or the like is re-encoded by converting the bit rate according to the capacity of a recording medium to be recorded or the speed of a communication line to be transmitted, or recently introduced MPEG-4 or H.264. In some cases, re-encoding may be performed using a higher-efficiency encoding method than MPEG-2 such as H.264.
このような、一度符号化した動画像を一旦復号して再度符号化する装置として例えば特許文献1に記載のトランスコーダがある。特許文献1に記載のトランスコーダは、復号部1が入力された順に復号したIフレーム、Pフレーム、Bフレームを、復号した順のまま再度IフレームはIフレーム、PフレームはPフレーム、BフレームはBフレームとして符号化することで、遅延時間やメモリの削減を可能としている。
上述した特許文献1に記載のトランスコーダは、復号した際に画像を表示順に並べ替える並べ替え器を有しないので表示順に並べ替えるための遅延時間やメモリが削減できる。しかしながら、ビットレートや符号化方式を変えて再符号化する場合は、復号前のビットストリームと再符号化時に割当てる符号量が異なることが多く、前記特許文献1には再符号化時に割当てる符号量に関する記載はないために、例えば適切な符号量が割当てられないことから画質が低下する可能性があった。
Since the transcoder described in
適切な符号量を割当てるためには、例えば1GOP(Group Of Pictures)分などある程度まとまった画像をメモリ等に記憶することで、適切な符号量を割当てることができるが、このようにすると、多くのメモリが必要となることによるコスト上昇に加え、遅延時間が大きくなってしまう。 In order to assign an appropriate code amount, for example, an appropriate code amount can be assigned by storing a certain amount of images such as 1 GOP (Group Of Pictures) in a memory or the like. In addition to the increase in cost due to the need for memory, the delay time increases.
そこで、本発明は、例えば符号化した動画像をビットレートや符号化方式を変更して再符号化する際に、遅延時間やメモリが削減されるとともに適切な符号量を予測して符号化することができる動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラムおよび動画像再符号化プログラムを格納した記録媒体を提供することを課題とする。 Therefore, for example, when re-encoding an encoded moving image by changing a bit rate or an encoding method, the present invention reduces the delay time and memory and encodes an appropriate code amount. An object is to provide a moving image re-encoding device, a moving image re-encoding method, a moving image re-encoding program, and a recording medium storing the moving image re-encoding program.
上記課題を解決するために、請求項1に記載の発明は、画面内符号化画像と、前方向予測符号化画像と、双方向予測符号化画像のうち少なくとも前記画面内符号化画像が1枚以上含まれる画像群から構成されるビットストリームが入力され該ビットストリームを復号し、画像データおよび符号化情報を得る復号手段と、前記復号手段が復号した前記画像データおよび前記符号化情報に基づいて再度前記画像データを符号化する符号化手段と、を有した動画像再符号化装置において、前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化手段に出力する画像群構造予測手段を有することを特徴としている。
In order to solve the above-mentioned problem, the invention according to
請求項8記載の発明は、画面内符号化画像と、前方向予測符号化画像と、双方向予測符号化画像のうち少なくとも前記画面内符号化画像が1枚以上含まれる画像群から構成されるビットストリームが入力され該ビットストリームを復号し、画像データおよび符号化情報を得て、復号した前記画像データおよび前記符号化情報に基づいて再度前記画像データを符号化する動画像再符号化方法において、前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化時に用いることを特徴としている。
The invention according to
請求項9に記載の発明は、画面内符号化画像と、前方向予測符号化画像と、双方向予測符号化画像のうち少なくとも前記画面内符号化画像が1枚以上含まれる画像群から構成されるビットストリームが入力され該ビットストリームを復号し、画像データおよび符号化情報を得る復号手段と、前記復号手段が復号した前記画像データおよび前記符号化情報に基づいて再度前記画像データを符号化する符号化手段としてコンピュータに機能させる動画像再符号化プログラムにおいて、前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化手段に出力する画像群構造予測手段としてコンピュータに機能させることを特徴としている。
The invention according to
100 動画像再符号化装置
101 復号部(復号手段)
102 符号化情報解析部
103 符号化部(符号化手段)
200 GOP構造予測部(画像群構造予測手段)
201 符号化フレームレート予測部(フレームレート予測手段)
202 GOP符号量予測部(符号量予測手段)DESCRIPTION OF
102 Encoding
200 GOP structure prediction unit (image group structure prediction means)
201 Coding frame rate prediction unit (frame rate prediction means)
202 GOP code amount prediction unit (code amount prediction means)
以下、本発明の一実施形態にかかる動画像再符号化装置を説明する。本発明の一実施形態にかかる動画像再符号化装置は、画像群構造予測手段が、再符号化時に参照するための、画像群における前方向予測符号化画像と双方向予測符号化画像の枚数を画像群の構造として予測する際に、複数の画像群における前方向予測符号化画像の数の最大値を持つ画像群または最小値を持つ画像群のうち少なくともいずれか一方の画像群を一つ以上除いた複数の画像群の前方向予測符号化画像の平均値と双方向予測符号化画像の平均値を画像群の構造として予測し、符号化手段が、その画像群の構造に基づいて再符号化する。このようにすることにより、一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群に影響されることなく、より平均的な画像群の構造を予測することができるのでより適切な符号量を予測することが出来る。また、画像群の構造予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。 Hereinafter, a moving image re-encoding device according to an embodiment of the present invention will be described. The moving image re-encoding device according to an embodiment of the present invention includes the number of forward-predictive encoded images and bidirectional predictive-encoded images in an image group for reference by the image group structure predicting unit during re-encoding. Is predicted as the structure of the image group, at least one of the image group having the maximum value or the image group having the minimum value of the number of forward prediction encoded images in the plurality of image groups is one. The average value of the forward prediction encoded images and the average value of the bidirectional predictive encoded images of the plurality of image groups excluded as described above are predicted as the structure of the image group, and the encoding unit re-generates based on the structure of the image group. Encode. By doing so, it is possible to predict the structure of a more average image group without being affected by the image group having the extreme number of forward-predicted encoded images that appear temporarily. A large amount of code can be predicted. Further, since it is not necessary to hold an extra image for the structure prediction of the image group, the delay time and the memory amount are reduced.
また、画像群構造予測手段が、カウントされた複数の画像群各々における前方向予測符号化画像の数のうち最大値および最小値を持つ画像群をそれぞれ一つ以上除いた複数の画像群における前方向予測符号化画像および双方向予測符号化画像の平均値を画像群の構造として符号化手段に出力しても良い。このようにすることにより、最大値方向と最小値方向の両方に一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群に影響されることなく、より精度良く平均的な画像群の構造を予測することができる。 In addition, the image group structure prediction means includes a front of a plurality of image groups obtained by excluding one or more image groups each having a maximum value and a minimum value from the number of forward prediction encoded images in each of the plurality of counted image groups. The average value of the direction prediction encoded image and the bidirectional prediction encoded image may be output to the encoding means as the structure of the image group. By doing in this way, an average image can be obtained with higher accuracy without being affected by an image group having an extreme number of forward-predictive encoded images that temporarily appear in both the maximum value direction and the minimum value direction. The structure of the group can be predicted.
また、画像群構造予測手段が、カウントされた複数の画像群各々における前方向予測符号化画像の数のうち、大きい順に複数の画像群を除いた複数の画像群における前方向予測符号化画像および双方向予測符号化画像の平均値を画像群の構造として符号化手段に出力しても良い。このようにすることにより、最大値方向に一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群が複数存在してもそれらに影響されることなく、より精度良く平均的な画像群の構造を予測することができる。 Further, the image group structure prediction means includes a forward prediction encoded image in a plurality of image groups excluding the plurality of image groups in descending order among the counted number of forward prediction encoded images in each of the plurality of image groups, and You may output the average value of a bi-directional predictive coding image to a coding means as a structure of an image group. By doing in this way, even if there are a plurality of image groups having the number of extreme forward predictive encoded images that temporarily appear in the maximum value direction, it is not affected by them and the average can be obtained with higher accuracy. The structure of the image group can be predicted.
また、画像群構造予測手段が、カウントされた複数の画像群各々における前方向予測符号化画像の数のうち、小さい順に複数の画像群を除いた複数の画像群における前方向予測符号化画像および双方向予測符号化画像の平均値を画像群の構造として符号化手段に出力しても良い。このようにすることにより、最小値方向に一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群が複数存在してもそれらに影響されることなく、より精度良く平均的な画像群の構造を予測することができる。 Further, the image group structure prediction means includes a forward prediction encoded image in a plurality of image groups excluding the plurality of image groups in order from the smallest number of forward prediction encoded images in each of the plurality of counted image groups, and You may output the average value of a bi-directional predictive coding image to a coding means as a structure of an image group. By doing this, even if there are a plurality of image groups having the number of extreme forward predictive encoded images that temporarily appear in the minimum value direction, the average is more accurate without being affected by them. The structure of the image group can be predicted.
また、画像群構造予測手段が、複数の画像群各々における双方向予測符号化画像の数をカウントし、カウントされた複数の画像群各々における前方向予測符号化画像の数のうち、最大値または最小値を持つ画像群が夫々複数ある場合は、複数の最大値または最小値を持つ画像群のうち、カウントされた複数の画像群における双方向予測符号化画像の平均値から離れた値をもつ画像群を除いた複数の画像群における前方向予測符号化画像および双方向予測符号化画像の平均値を画像群の構造として符号化手段に出力しても良い。このようにすることにより、前方向予測符号化画像の最大値または最小値を持つ画像群が複数あっても、双方向予測符号化画像の極端な値を持つ方を除くことが出来るので、前方向予測符号化画像だけでなく双方向予測符号化画像においても、より精度良く平均的な画像群の構造を予測することができる。 Further, the image group structure prediction means counts the number of bidirectional prediction encoded images in each of the plurality of image groups, and the maximum value or the number of forward prediction encoded images in each of the plurality of image groups counted When there are a plurality of image groups each having a minimum value, among the plurality of image groups having the maximum value or the minimum value, the image group has a value far from the average value of the bi-directional predictive encoded images in the counted plurality of image groups. The average value of the forward prediction encoded image and the bidirectional predictive encoded image in a plurality of image groups excluding the image group may be output to the encoding means as the structure of the image group. By doing this, even if there are a plurality of image groups having the maximum value or the minimum value of the forward prediction encoded image, it is possible to exclude the one having the extreme value of the bidirectional predictive encoded image. The structure of the average image group can be predicted with higher accuracy not only in the direction prediction encoded image but also in the bidirectional prediction encoded image.
また、符号化情報に基づいて、複数の画像群各々における符号化された画像の数および複数の画像群各々における表示されるべき画像の数を夫々カウントし、複数の画像群各々における符号化された画像の数と複数の画像群各々における表示されるべき画像の数との比と、符号化情報から、符号化手段が1秒間に再符号化すべき画像枚数(符号化フレームレート)を予測するフレームレート予測手段を有しても良い。このようにすることにより、符号化された画像の数だけでなく表示されるべき画像の数も参照しているので、再表示情報(リピートピクチャ情報)を持つ画像が多い場合は再符号化する際に実質的な符号化フレームレートを精度良く予測することが出来るのでより適切な符号量を予測することが出来る。 In addition, based on the encoding information, the number of encoded images in each of the plurality of image groups and the number of images to be displayed in each of the plurality of image groups are counted, respectively. From the ratio between the number of images to be displayed and the number of images to be displayed in each of the plurality of image groups, and the encoding information, the number of images (encoding frame rate) to be re-encoded by the encoding unit per second is predicted. You may have a frame rate estimation means. In this way, since not only the number of encoded images but also the number of images to be displayed are referred to, if there are many images having redisplay information (repeat picture information), reencoding is performed. In this case, since a substantial encoding frame rate can be accurately predicted, a more appropriate code amount can be predicted.
また、画像群構造予測手段が予測した画像群の構造と、フレームレート予測手段が予測した符号化フレームレートと、予め設定された再符号化のビットレートと、に基づいて符号化手段が符号化する際の画像群当たりの符号量を予測する符号量予測手段を有しても良い。このようにすることにより、再符号化する際に画像群構造やリピートピクチャを考慮した実質的な画像群当たりの符号量を精度良く予測することが出来る。 In addition, the encoding unit encodes based on the structure of the image group predicted by the image group structure prediction unit, the encoded frame rate predicted by the frame rate prediction unit, and a preset re-encoding bit rate. Code amount prediction means for predicting the code amount per image group at the time of image processing may be provided. By doing so, it is possible to accurately predict the code amount per image group in consideration of the image group structure and the repeat picture when re-encoding.
また、本発明の一実施形態にかかる動画像再符号化方法は、再符号化時に参照するために画像群における前方向予測符号化画像と双方向予測符号化画像の枚数を画像群の構造として予測する際に、複数の画像群における前方向予測符号化画像の数の最大値を持つ画像群または最小値を持つ画像群のうち少なくともいずれか一方の画像群を一つ以上除いた複数の画像群の前方向予測符号化画像の平均値と双方向予測符号化画像の平均値を予測した画像群の構造として、その画像群の構造に基づいて再符号化する。このようにすることにより、一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群に影響されることなく、より平均的な画像群の構造を予測することができる。また、画像群予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。 In addition, the moving image re-encoding method according to the embodiment of the present invention uses the number of forward prediction encoded images and bidirectional predictive encoded images in the image group as a structure of the image group for reference during re-encoding. A plurality of images excluding at least one image group of at least one of an image group having a maximum value or an image group having a minimum value of the number of forward prediction encoded images in a plurality of image groups when performing prediction Based on the structure of the image group, re-encoding is performed as the structure of the image group in which the average value of the forward prediction encoded image of the group and the average value of the bidirectional predictive encoded image are predicted. By doing in this way, it is possible to predict a more average image group structure without being influenced by an image group having an extreme number of forward-predictive encoded images that appear temporarily. Further, since there is no need to hold an extra image for the image group prediction, the delay time and the memory amount are reduced.
また、本発明の一実施形態にかかる動画像再符号化プログラムは、画像群構造予測手段が、再符号化時に参照するための、画像群における前方向予測符号化画像と双方向予測符号化画像の枚数を画像群の構造として予測する際に、複数の画像群における前方向予測符号化画像の数の最大値を持つ画像群または最小値を持つ画像群のうち少なくともいずれか一方の画像群を一つ以上除いた複数の画像群の前方向予測符号化画像の平均値と双方向予測符号化画像の平均値を予測した画像群の構造とし、符号化手段が、その画像群の構造に基づいて再符号化するようにコンピュータに機能させる。このようにすることにより、一時的に現れた極端な前方向予測符号化画像の枚数を持つ画像群に影響されることなく、より平均的な画像群の構造を予測することができる。また、画像群予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。 In addition, the moving image re-encoding program according to the embodiment of the present invention includes a forward-predictive encoded image and a bi-directional predictive-encoded image in an image group that the image group structure prediction unit refers to when re-encoding. When predicting the number of images as the structure of the image group, at least one of the image group having the maximum value or the image group having the minimum value of the number of forward prediction encoded images in the plurality of image groups is selected. The average value of the forward prediction encoded images and the average value of the bidirectional predictive encoded images of a plurality of image groups excluding one or more are set as the predicted image group structure, and the encoding unit is based on the structure of the image group. And let the computer function to re-encode. By doing in this way, it is possible to predict a more average image group structure without being influenced by an image group having an extreme number of forward-predictive encoded images that appear temporarily. Further, since there is no need to hold an extra image for the image group prediction, the delay time and the memory amount are reduced.
また、請求項9に記載の動画像再符号化プログラムを記録媒体に格納してもよい。このようにすることにより、動画像再符号化プログラムを機器に組み込む以外に単体でも流通させることができる。
Further, the moving image re-encoding program according to
本発明の一実施例にかかる動画像再符号化装置100を図1乃至図10を参照して説明する。動画像再符号化装置100は、入力端子110から入力される動画像が符号化されたビットストリームをビットレートや符号化方式を変更して再符号化して出力端子115から出力する装置である。動画像再符号化装置100は、図1に示すように復号部101と、符号化情報解析部102と、符号化部103と、入力端子110と設定データ端子111と、出力端子115とを備えている。
A moving
復号手段としての復号部101は、入力端子110から入力されるビットストリームを復号し、画像データ113を符号化部103へ出力するとともに、符号化情報112を符号化部103および符号化情報解析部102へ出力する。例えば、MPEG−2方式によって符号化されたビットストリームが入力された場合は、該ビットストリームを復号し、復号された画像データ113(輝度や色差データなど)を符号化部103へ出力する。入力ビットストリーム中のヘッダ情報などは符号化情報112として符号化情報解析部102および符号化部103へ出力する。
The
符号化情報112は、例えば、ピクチャタイプ(Iピクチャか、Pピクチャか、Bピクチャか)やフィールド再表示情報またはフレーム再表示情報およびフレームレート情報(画面上に表示する際のフレームレートで、例えばNTSCであれば29.97フレーム/秒)などが出力される。Iピクチャ、Pピクチャ、BピクチャはMPEGなどで用いられる符号化された画像の分類であり、Iピクチャは画面内符号化が施された画像、Pピクチャは前方向予測符号化が施された画像、Bピクチャは双方向予測符号化が施された画像を示している。
The
符号化情報解析部102では、図2に示すようにGOP構造予測部200と、符号化フレームレート予測部201と、GOP符号量予測部202とを備えており、設定データ端子111から入力される設定データおよび符号化情報112が入力され、前記設定データおよび符号化情報112に基づいて符号化部103において再符号化する際の割当て符号量を算出し、解析結果情報114として符号化部103へ出力する。
The encoding
設定データ端子111は、動画像再符号化装置100の初期設定時に設定されるパラメータ、例えば出力ビットストリームのビットレートなどが入力される。
The setting
解析結果情報114は、例えば、GOP単位の割当て符号量やGOP内のPピクチャ予測枚数およびBピクチャ予測枚数や符号化フレームレートなどが出力される。画像群としてのGOPとはGroup Of Picturesの略で、少なくとも1枚以上のIピクチャから構成される単位である(通常、複数のピクチャから構成されることが多い)。GOP構造とはGOP内のIピクチャ、PピクチャおよびBピクチャの枚数構成である。図3にGOP構造の例を示す。GOPはIピクチャから始まり、次のIピクチャの1枚前のピクチャまでが1GOPとなる。図3では1GOPは12枚のピクチャで構成されており、GOP内のIピクチャは1枚、Pピクチャは3枚、Bピクチャは8枚である。
As the analysis result
画像群構造予測手段としてのGOP構造予測部200は、符号化情報112が入力され、それに基づいてGOP構造を予測し、GOP構造情報210を出力する。
The GOP
GOP構造予測部200におけるGOP構造の予測方法を図4のフローチャートを参照して説明する。
A GOP structure prediction method in the GOP
まず、ステップS101において、GOP構造の初期値を設定し、ステップS102へ進む。GOP構造の初期値とは、動画像が入力される前に設定されるIピクチャ、Pピクチャ、Bピクチャの枚数である。これらは、予測の初期値であって実際に入力される動画像の各ピクチャの枚数と一致しなくともよい。初期値は予めGOP構造予測部200内部に持っておいても良いし、設定データ端子111から設定するようにしても良い。
First, in step S101, an initial value of the GOP structure is set, and the process proceeds to step S102. The initial value of the GOP structure is the number of I pictures, P pictures, and B pictures set before moving pictures are input. These are initial values of prediction and do not need to match the number of pictures of the moving image actually input. The initial value may be previously stored in the GOP
次に、ステップS102において、復号部101に入力された画像のピクチャタイプが符号化情報112を経由して入力されステップS103に進む。
Next, in step S102, the picture type of the image input to the
次に、ステップS103において、復号部101に入力された画像のピクチャタイプがIピクチャか否かを判断してIピクチャである場合(YESの場合)はステップS106に進み、そうでない場合(NOの場合)はステップS104に進む。
Next, in step S103, it is determined whether or not the picture type of the image input to the
次に、ステップS104において、復号部101に入力された画像のピクチャタイプがPピクチャか否かを判断してPピクチャである場合(YESの場合)はステップS108に進み、そうでない場合(NOの場合)はステップS105に進む。
Next, in step S104, it is determined whether the picture type of the image input to the
次に、ステップS105において、IピクチャでもなくPピクチャでもないということは、復号部101に入力された画像のピクチャタイプはBピクチャであると判断して現在のGOPにおけるBピクチャの枚数に1を加算してステップS102に戻る。
Next, in step S105, if it is neither an I picture nor a P picture, it is determined that the picture type of the image input to the
ステップS106においては、Iピクチャが入力されたと判断する。Iピクチャから次のIピクチャの前の画像までが1GOPの範囲なのでIピクチャ検出でGOPの先頭を検出したとして、直前の過去複数のGOPにおけるPピクチャ枚数の最大値と最小値を持つGOPを1つずつ除いて、それらPピクチャ枚数の最大値と最小値のGOPを1つずつ除いた過去複数のGOPのPピクチャ枚数の平均値とBピクチャ枚数の平均値を算出しステップS107に進む。すなわち、複数のGOPにおけるPピクチャの枚数のうち、最大値および最小値を持つGOPをそれぞれ一つ以上除いた複数のGOPにおけるPピクチャおよびBピクチャの平均値を算出している。つまり、最小値か最大値を持つGOPのうち少なくともいずれか一方のGOPを一つ以上除いた複数のGOPにおけるPピクチャおよびBピクチャの平均値を算出している。 In step S106, it is determined that an I picture has been input. Since the range from the I picture to the previous image of the next I picture is in the range of 1 GOP, assuming that the top of the GOP is detected by I picture detection, the GOP having the maximum value and the minimum value of the number of P pictures in the previous plurality of GOPs is 1 The average value of the number of P pictures and the average number of B pictures of a plurality of past GOPs, excluding one by one and removing the maximum and minimum GOPs of the P pictures one by one, proceeds to step S107. That is, the average value of P pictures and B pictures in a plurality of GOPs is calculated by removing one or more GOPs having the maximum value and the minimum value from the number of P pictures in the plurality of GOPs. That is, the average value of the P picture and the B picture in a plurality of GOPs excluding at least one of the GOPs having the minimum value or the maximum value is calculated.
ステップS106を、図5と図6を参照して詳細に説明する。図5は、直前の過去複数のGOPとして8GOPを保持した場合の例である。入力されたIピクチャを含むGOPを現在のGOPとすると、現在のGOPから時間的に近い順にGOP[0]、GOP[1]、GOP[2]、GOP[3]、GOP[4]、GOP[5]、GOP[6]、GOP[7]とし、各GOPにおけるPピクチャの枚数をNp[0]、Np[1]、Np[2]、Np[3]、Np[4]、Np[5]、Np[6]、Np[7]とし、各GOPにおけるBピクチャの枚数をNb[0]、Nb[1]、Nb[2]、Nb[3]、Nb[4]、Nb[5]、Nb[6]、Nb[7]とする。すなわち、常に直前のGOPから数えて8GOP分のPピクチャとBピクチャの枚数を保持する。そして、各GOPにおけるPピクチャの枚数とBピクチャの枚数が図6のようになっていた場合は、Pピクチャ枚数の最大値であるNp[2]と最小値であるNp[6]を除いてPピクチャの平均値AVR_NpとBピクチャの平均値AVR_Nbを求めると図6に示すようにそれぞれ4と10という値が求まる。
Step S106 will be described in detail with reference to FIGS. FIG. 5 shows an example in which 8 GOPs are held as a plurality of previous GOPs. Assuming that the GOP including the input I picture is the current GOP, GOP [0], GOP [1], GOP [2], GOP [3], GOP [4], GOP are in order of time from the current GOP. [5], GOP [6], GOP [7], and the number of P pictures in each GOP is Np [0], Np [1], Np [2], Np [3], Np [4], Np [ 5], Np [6], Np [7], and the number of B pictures in each GOP is Nb [0], Nb [1], Nb [2], Nb [3], Nb [4], Nb [5 ], Nb [6], and Nb [7]. That is, the number of P pictures and B pictures for 8 GOPs from the immediately preceding GOP is always held. If the number of P pictures and the number of B pictures in each GOP are as shown in FIG. 6, except for Np [2], which is the maximum value of P pictures, and Np [6], which is the minimum value. When the average value AVR_Np of the P picture and the average value AVR_Nb of the B picture are obtained,
次に、ステップS107において、ステップS106で算出したPピクチャとBピクチャの平均値(AVR_Np、AVR_Nb)をGOP構造情報210としてGOP符号量予測部202に出力しステップS102に戻る。
Next, in step S107, the average value (AVR_Np, AVR_Nb) of the P picture and B picture calculated in step S106 is output to the GOP code
ステップS108においては、復号部101に入力された画像のピクチャタイプはPピクチャであることから現在のGOPにおけるPピクチャの枚数に1を加算しステップS102に戻る。
In step S108, since the picture type of the image input to the
フレームレート予測手段としての符号化フレームレート予測部201は、符号化情報112が入力され、それを基づいて符号化フレームレートを算出し、符号化フレームレート情報211を出力する。
An encoding frame
符号化フレームレート予測部201における符号化フレームレートの算出方法を図7のフローチャートを参照して説明する。
A method of calculating the encoding frame rate in the encoding frame
まず、ステップS201において、表示ピクチャ枚数と符号化ピクチャ枚数の初期値を設定し、ステップS202へ進む。これらは、予測の初期値であって実際に入力される表示ピクチャ枚数や符号化ピクチャ枚数と一致しなくともよい。初期値は予め符号化フレームレート予測部201に持っておいても良いし、設定データ端子111から設定するようにしてもよい。
First, in step S201, initial values of the number of displayed pictures and the number of encoded pictures are set, and the process proceeds to step S202. These are initial values of prediction and do not need to match the number of display pictures or the number of encoded pictures that are actually input. The initial value may be stored in advance in the encoding frame
表示ピクチャ枚数と、符号化ピクチャ枚数について図8を参照して説明する。表示されるべき画像の数としての表示ピクチャ枚数とは、復号して画面に表示する際のピクチャ枚数を示し、符号化された画像の数としての符号化ピクチャ枚数とは、実際に符号化されているピクチャ枚数である。復号部101で復号した際に、フィールド再表示情報またはフレーム再表示情報が検出されたピクチャは、符号化ピクチャ枚数は1枚であるが表示ピクチャ枚数としては1枚以上となる。図8の場合は、1秒間の表示ピクチャ枚数を矢印の間の12枚とすると、フレームレートは12フレーム/秒、符号化フレームレートは8フレーム/秒となる。また、符号化情報112に含まれるフレームレート情報は表示ピクチャのフレームレートを指している。ここで再表示情報を検出せずにフレームレート情報のみから符号化ピクチャ12枚に対して1秒分の符号量を割当てた場合、1枚当たりの符号量は1秒分の1/12となる。しかし、再表示情報を検出すれば、1秒あたり符号化ピクチャが8枚であることが分かるために、1枚当たりの割当て符号量が1秒分の1/8に増大する。したがって、再表示情報を用いることで再符号化時にリピートピクチャ枚数を除いた実際の符号化ピクチャ枚数を再符号化の対象として符号量を割当てることで、適切な符号の割当てが可能となる。
The number of displayed pictures and the number of encoded pictures will be described with reference to FIG. The number of displayed pictures as the number of images to be displayed indicates the number of pictures when decoded and displayed on the screen, and the number of encoded pictures as the number of encoded images is actually encoded. It is the number of pictures. The picture for which field redisplay information or frame redisplay information is detected when decoding is performed by the
次に、ステップS202において、復号部101に入力された画像のピクチャタイプが符号化情報112を経由して入力されステップS203に進む。
Next, in step S202, the picture type of the image input to the
次に、ステップS203において、復号部101に入力された画像のピクチャタイプがIピクチャか否かを判断してIピクチャである場合(YESの場合)はステップS204に進み、そうでない場合(NOの場合)はステップS206に進む。
Next, in step S203, it is determined whether or not the picture type of the image input to the
ステップS204においては、Iピクチャが入力されたと判断する。Iピクチャから次のIピクチャの前の画像までが1GOPの範囲なのでIピクチャ検出でGOPの先頭を検出したとして、直前の過去複数のGOPにおける符号化ピクチャ枚数と表示ピクチャ枚数から符号化フレームレートを算出しステップS205に進む。 In step S204, it is determined that an I picture has been input. Since the range from the I picture to the previous image of the next I picture is in the range of 1 GOP, assuming that the top of the GOP is detected by I picture detection, the encoding frame rate is calculated from the number of encoded pictures and the number of displayed pictures in the previous plurality of GOPs. The calculation proceeds to step S205.
符号化フレームレートは、coded_frame_rateを符号化フレームレート、numをデータを保持しておくGOP数、i=0,1,…,(num-1)、Nc[i]を直前から数えて過去i番目のGOPにおける符号化ピクチャ枚数、Nd[i]を過去i番目のGOPにおける表示ピクチャ枚数、frame_rateを符号化情報112に含まれるフレームレート情報とすると、例えば数1に示す式で表される。
The encoded frame rate is the past i-th counted coded_frame_rate, num is the number of GOPs holding data, i = 0,1, ..., (num-1), Nc [i] is counted immediately before When the number of encoded pictures in the GOP, Nd [i] is the number of displayed pictures in the past i-th GOP, and frame_rate is the frame rate information included in the encoded
すなわち、符号化ピクチャ枚数と表示ピクチャ枚数との比と、符号化情報112に含まれるフレームレート情報から予測した符号化フレームレートを算出している。
That is, a predicted encoded frame rate is calculated from the ratio between the number of encoded pictures and the number of displayed pictures and the frame rate information included in the encoded
ステップS204を、図9を参照して詳細に説明する。図9は、直前の過去複数のGOPとして8GOPを保持した場合の例である。入力されたIピクチャを含むGOPを現在のGOPとすると、現在のGOPから時間的に近い順にGOP[0]、GOP[1]、GOP[2]、GOP[3]、GOP[4]、GOP[5]、GOP[6]、GOP[7]とし、各GOPにおける符号化ピクチャ枚数をNc[0]、Nc[1]、Nc[2]、Nc[3]、Nc[4]、Nc[5]、Nc[6]、Nc[7]とし、各GOPにおける表示ピクチャ枚数をNd[0]、Nd[1]、Nd[2]、Nd[3]、Nd[4]、Nd[5]、Nd[6]、Nd[7]とする。すなわち、常に直前のGOPから数えて8GOP分の符号化ピクチャ枚数と表示ピクチャ枚数を保持する。これらを数1に当てはめると、Nc[0]〜Nc[7]まで総数を、Nd[0]〜Nd[7]まで総数で割った値にフレームレート情報を掛けることで予測した符号化フレームレートとして求めることができる。
Step S204 will be described in detail with reference to FIG. FIG. 9 shows an example when 8 GOPs are held as a plurality of previous GOPs. Assuming that the GOP including the input I picture is the current GOP, GOP [0], GOP [1], GOP [2], GOP [3], GOP [4], GOP are in order of time from the current GOP. [5], GOP [6], GOP [7], and the number of encoded pictures in each GOP is Nc [0], Nc [1], Nc [2], Nc [3], Nc [4], Nc [ 5], Nc [6], Nc [7], and the number of displayed pictures in each GOP is Nd [0], Nd [1], Nd [2], Nd [3], Nd [4], Nd [5] , Nd [6] and Nd [7]. That is, the number of encoded pictures and the number of displayed pictures are always held for 8 GOPs from the immediately preceding GOP. When these are applied to
次に、ステップS205において、ステップS204で算出した符号化フレームレート(coded_frame_rate)を符号化フレームレート情報211としてGOP符号量予測部202に出力しステップS206に進む。
Next, in step S205, the encoded frame rate (coded_frame_rate) calculated in step S204 is output to the GOP code
次に、ステップS206において、符号化情報112から現在のGOPの符号化ピクチャ枚数と表示ピクチャ枚数にそれぞれ1または(1+リピートピクチャ枚数)を加算してステップS202に戻る。すなわち、符号化ピクチャ枚数には常に1を加算し、表示ピクチャ枚数には(1+リピートピクチャ枚数)を加算する。
Next, in step S206, 1 or (1 + the number of repeat pictures) is added to the number of encoded pictures and the number of displayed pictures of the current GOP from the
符号量予測手段としてのGOP符号量予測部202は、入力される符号化情報112、GOP構造情報210、符号化フレームレート情報211および設定データ端子111より設定される出力目標ビットレートに基づいてGOPの割当て符号量を算出し、GOP構造情報210に含まれるPピクチャ予測枚数、Bピクチャ予測枚数と、符号化フレームレート情報211に含まれる符号化フレームレートとともに解析結果情報114として符号化部103へ出力する。
The GOP code
GOP符号量予測部202の動作を図10のフローチャートを参照して説明する。
The operation of the GOP code
まず、ステップS301において、復号部101に入力された画像のピクチャタイプが符号化情報112を経由して入力されステップS302に進む。
First, in step S301, the picture type of the image input to the
次に、ステップS302において、復号部101に入力された画像のピクチャタイプがIピクチャか否かを判断してIピクチャである場合(YESの場合)はステップS303に進み、そうでない場合(NOの場合)はステップS301に戻る。
Next, in step S302, it is determined whether or not the picture type of the image input to the
次に、ステップS303において、GOP構造情報210が更新されたか否かを判断し、更新された場合(YESの場合)はステップS304に進み、そうでない場合(NOの場合)は更新されるまで待機する。
Next, in step S303, it is determined whether or not the
次に、ステップS304において、符号化フレームレート情報211が更新されたか否かを判定し、更新された場合(YESの場合)はステップS305に進み、そうでない場合(NOの場合)は更新されるまで待機する。
Next, in step S304, it is determined whether or not the encoded
次に、ステップS305において、符号化情報112、GOP構造情報210、符号化フレームレート情報211および設定データ端子111より設定される出力目標ビットレートに基づいてGOP当たりの割当て符号量を算出しステップS306へ進む。
Next, in step S305, the allocated code amount per GOP is calculated based on the encoded
GOP当たりの割当て符号量GOP_bitsは、AVR_NpをGOP構造予測部200で予測した平均Pピクチャ枚数、AVR_NbをGOP構造予測部200で予測した平均Bピクチャ枚数、coded_frame_rateを符号化フレームレート予測部201で予測した符号化フレームレート、bitrateを設定データ端子111より予め設定される出力目標ビットレートとすると、例えば数2に示す式で表される。
The allocated code amount GOP_bits per GOP is the average number of P pictures predicted by the GOP
数2に示した式中の1となっている部分はIピクチャの枚数を意味しており、フィールド符号化時は、1フレームが2フィールドであることから、GOP内の平均Iフィールド枚数の1/2を算出してそれに置き換えればよい。(この場合、AVR_NpおよびAVR_Nbも夫々フィールド枚数の1/2で算出される。)
The portion of 1 in the equation shown in
次に、ステップS306において、ステップS305で算出したGOP当たりの割当て符号量(GOP_bits)とGOP構造情報210と符号化フレームレート情報211とを解析結果情報114として符号化部103に出力しステップS301に戻る。
Next, in step S306, the allocated code amount (GOP_bits) per GOP calculated in step S305, the
符号化手段としての符号化部103は、符号化情報112、解析結果情報114および設定データ端子111から入力される初期設定に基づいて復号部101から入力される画像データ113を再符号化し、出力ビットストリームを出力端子115から出力する。すなわち、符号化情報解析部102で予測したGOP当たりの割当て符号量に基づいて符号量制御を行ったり、PピクチャとBピクチャの予測枚数から各ピクチャへの符号量の割当てなどを行う。また、符号化情報112や符号化部103内部での情報などから符号量制御に変化を加えてもよい。例えば、解析結果情報114のGOP当たり割当て符号量などを得た上で、入力される画像データ113の複雑度を基にGOPやピクチャの割当て符号量を増減してもよい。
The
本実施例によれば、GOP構造予測部200において、8つのGOP内のPピクチャ枚数のうち、最大値と最小値を持つGOPを除いた6つのGOPからPピクチャ枚数とBピクチャ枚数の平均値を算出し、それを予測したGOP構造とする。符号化フレームレート予測部201において、符号化ピクチャ枚数と表示ピクチャ枚数と符号化情報112から得られたフレームレートから符号化フレームレートを算出し、それを予測した符号化フレームレートとする。そして、予測したGOP構造と予測した符号化フレームレートと設定データ端子111から設定したビットレートからGOP当たりの符号量を算出し、それを予測した符号量とする。符号化部103では、前記予測したGOP構造と、予測した符号化フレームレートと、予測した符号量を参照して再符号化を行う。このようにすることで、GOP構造やフレームレートおよび符号量の予測精度が上がるとともに、GOP構造予測やフレームレート予測および符号量予測のために複数の画像をメモリに記憶することが必要ないために遅延時間やメモリ量の削減が出来る。
According to the present embodiment, in the GOP
なお、上述した実施例においてGOP構造予測部200は、GOP毎のPピクチャの枚数のうち最大値を持つGOPと最小値を持つGOPを除いて、PピクチャとBピクチャのGOPの平均枚数を算出していたが、図11に示すようにPピクチャの最大値または最小値が複数あった場合は、Bピクチャの枚数を比較して、Bピクチャの平均値からの差異が大きいGOPを除くようにしてもよい。図11では、Pピクチャの最大値がNp[2]とNp[3]であって、最小値がNp[6]とNp[7]であるため、Nb[2]とNb[3]およびNb[6]とNb[7]のBピクチャの枚数を比較しBピクチャの平均値(Nb[0]〜Nb[7]の平均値)からの差異が大きいNb[2]を含むGOPを最大値として、Nb[6]を含むGOPを最小値として、それぞれ除いてPピクチャの平均枚数AVR_NpとBピクチャの平均枚数AVR_Nbを求める。また、このような方法をとらずに複数の最大値や複数の最小値をとるGOPからそれぞれ任意に1つずつGOPを選択して削除しても良い。
In the above-described embodiment, the GOP
また、GOP構造を予測する際に除くGOPは、最大値または最小値のうちいずれか一方のみでも良い。さらに、複数のGOPにおける前方向予測符号化画像の枚数のうち大きい順に複数除いても良いし、小さい順に複数除いても良い。図11で例えるとNp[2]とNp[3]の両方を除いてもよいし、Np[6]とNp[7]の両方を除いても良い。 Further, the GOP excluded when predicting the GOP structure may be only one of the maximum value and the minimum value. Furthermore, a plurality of forward-predicted encoded images in a plurality of GOPs may be removed in descending order, or a plurality may be removed in ascending order. For example, in FIG. 11, both Np [2] and Np [3] may be removed, or both Np [6] and Np [7] may be removed.
また、上述した実施例では動画像再符号化装置100として説明したが、コンピュータ上で動作するプログラムとすることもできる。すなわち、動画像再符号化装置100をCPUとRAM、ROMに置き換えて、ROMに動画像再符号化プログラムを記録しておき、CPUに復号部101、符号化部103、符号化情報解析部102の機能を持たせる。図12に動画像再符号化プログラムのフローチャートを示す。
In the above-described embodiment, the moving
まず、復号手段としてのステップS401で入力ビットストリームを復号する。次に、画像群構造予測手段としてのステップS402でGOP構造予測を行う。ステップS402の内容は図4のフローチャートと同様である。次に、フレームレート予測手段としてのステップS403で符号化フレームレートを予測する。ステップS403の内容は図7のフローチャートと同様である。次に、符号量予測手段としてのステップS404でGOP当たりの割当て符号量を予測する。ステップS404の内容は図10のフローチャートと同様である。そして、符号化手段としてのステップS405で再符号化を行う。以上のステップをピクチャ単位で繰り返すことで動画像再符号化プログラムとして機能することができる。 First, the input bit stream is decoded in step S401 as decoding means. Next, GOP structure prediction is performed in step S402 as image group structure prediction means. The content of step S402 is the same as that of the flowchart of FIG. Next, the encoding frame rate is predicted in step S403 as a frame rate prediction means. The content of step S403 is the same as that of the flowchart of FIG. Next, the allocated code amount per GOP is predicted in step S404 as the code amount predicting means. The content of step S404 is the same as that of the flowchart of FIG. Then, re-encoding is performed in step S405 as encoding means. By repeating the above steps for each picture, it is possible to function as a moving image re-encoding program.
また、上述した実施例ではピクチャをフレームとして説明したが、フィールドでも実施可能である。 In the above-described embodiment, the picture is described as a frame, but the present invention can also be implemented in the field.
また、本発明における復号手段と符号化手段は、MPEG−1,2,4やH.264など画面内符号化画像と、前方向予測符号化画像と、双方向予測符号化画像のうち少なくとも前記画面内符号化画像が1枚以上含まれる画像群から構成されるビットストリームとなる動画像の符号化方式であれば、いずれの組合せでもよい。勿論、同じ符号化方式間でビットレートの変換に用いても良い。 The decoding means and the encoding means in the present invention are MPEG-1, 2, 4 and H.264. H.264 or other intra-coded image, forward prediction encoded image, and moving image that is a bit stream composed of an image group including at least one intra-coded image among bidirectional predictive encoded images Any combination may be used as long as it is an encoding method. Of course, you may use for the bit rate conversion between the same encoding systems.
また、動画像を放送局で放送する際や通信回線に送信する際に本発明を適用すれば、放送波や通信回線の帯域に合わせた符号化方式やビットレートで低遅延かつ低コストに動画像を再符号化することができる。また、例えば地上デジタル放送など符号化された動画像を、ハードディスクレコーダやDVDレコーダやBlu−rayレコーダおよびHD DVDレコーダなどに記録する際に本発明を適用すれば、再符号化前よりも高効率な符号化方式に低遅延かつ低コストに記録することができる。 In addition, if the present invention is applied when broadcasting a moving image at a broadcasting station or transmitting it to a communication line, a moving image with a low delay and a low cost can be obtained with an encoding method or bit rate that matches the band of the broadcast wave or communication line. The image can be re-encoded. Further, for example, when the present invention is applied when recording an encoded moving image such as terrestrial digital broadcasting on a hard disk recorder, a DVD recorder, a Blu-ray recorder, an HD DVD recorder, or the like, it is more efficient than before re-encoding. Can be recorded with a low delay and a low cost.
前述した実施例によれば、以下の動画像再符号化装置、動画像再符号化方法および動画像再符号化プログラムが得られる。 According to the embodiment described above, the following moving image re-encoding device, moving image re-encoding method, and moving image re-encoding program can be obtained.
(付記1)Iピクチャと、Pピクチャと、Bピクチャのうち少なくともIピクチャが1枚以上含まれるGOPから構成されるビットストリームが入力され該ビットストリームを復号し、画像データ113および符号化情報112を得る復号部101と、
復号部101が復号した画像データ113および符号化情報112に基づいて再度画像データ113を符号化する符号化部103と、を有した動画像再符号化装置100において、
符号化情報112に基づいて、複数のGOP各々におけるPピクチャの数をカウントし、カウントされた複数のGOP各々におけるPピクチャの数の最大値または最小値を持つGOPのうち少なくともいずれか一方のGOPを一つ以上除いた複数のGOPにおけるPピクチャおよびBピクチャの平均値を予測したGOPの構造として符号化部103に出力するGOP構造予測部200を有することを特徴とする動画像再符号化装置100。(Supplementary note 1) A bit stream composed of a GOP including at least one I picture among I pictures, P pictures, and B pictures is input, the bit stream is decoded, and
In the moving
Based on the
この動画像再符号化装置100によれば、一時的に現れた極端なPピクチャの枚数を持つGOPに影響されることなく、より平均的なGOPの構造を予測することができる。また、GOPの構造予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。
According to the moving image
(付記2)Iピクチャと、Pピクチャと、Bピクチャのうち少なくともIピクチャが1枚以上含まれるGOPから構成されるビットストリームが入力され該ビットストリームを復号し、画像データ113および符号化情報112を得て、復号した画像データ113および符号化情報112に基づいて再度画像データ113を符号化する動画像再符号化方法において、
符号化情報112に基づいて、複数のGOP各々におけるPピクチャの数をカウントし、カウントされた複数のGOP各々におけるPピクチャの数の最大値または最小値を持つGOPのうち少なくともいずれか一方のGOPを一つ以上除いた複数のGOPにおけるPピクチャおよびBピクチャの平均値を予測したGOPの構造として符号化時に用いることを特徴とする動画像再符号化方法。(Supplementary note 2) A bit stream composed of a GOP including at least one I picture among an I picture, a P picture, and a B picture is input, the bit stream is decoded, and
Based on the
この動画像再符号化方法によれば、一時的に現れた極端なPピクチャの枚数を持つGOPに影響されることなく、より平均的なGOPの構造を予測することができる。また、GOPの構造予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。 According to this moving image re-encoding method, it is possible to predict a more average GOP structure without being influenced by a GOP having an extreme number of P pictures that appear temporarily. Further, since there is no need to hold an extra image for the GOP structure prediction, the delay time and the amount of memory are reduced.
(付記3)Iピクチャと、Pピクチャと、Bピクチャのうち少なくともIピクチャが1枚以上含まれるGOPから構成されるビットストリームが入力され該ビットストリームを復号し、画像データ113および符号化情報112を得るステップS401と、
ステップS401が復号した画像データ113および符号化情報112に基づいて再度画像データ113を符号化するステップS405と
してコンピュータに機能させる動画像再符号化プログラムにおいて、
符号化情報112に基づいて、複数のGOP各々におけるPピクチャの数をカウントし、カウントされた複数のGOP各々におけるPピクチャの数の最大値または最小値を持つGOPのうち少なくともいずれか一方のGOPを一つ以上除いた複数のGOPにおけるPピクチャおよびBピクチャの平均値を予測したGOPの構造としてステップS405に出力するステップS402としてコンピュータに機能させることを特徴とするコンピュータ読み取り可能な動画像再符号化プログラム。(Supplementary Note 3) A bit stream composed of a GOP including at least one I picture among an I picture, a P picture, and a B picture is input and decoded, and the
In the moving image re-encoding program that causes the computer to function as step S405 that re-encodes the
Based on the
この動画像再符号化プログラムによれば、一時的に現れた極端なPピクチャの枚数を持つGOPに影響されることなく、より平均的なGOPの構造を予測することができる。また、GOPの構造予測のために余分な画像を保持する必要が無いので遅延時間やメモリ量が削減される。 According to this moving image re-encoding program, it is possible to predict a more average GOP structure without being affected by a GOP having an extreme number of P pictures that appear temporarily. Further, since there is no need to hold an extra image for the GOP structure prediction, the delay time and the amount of memory are reduced.
なお、前述した実施例は本発明の代表的な形態を示したに過ぎず、本発明は、実施例に限定されるものではない。すなわち、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。 In addition, the Example mentioned above only showed the typical form of this invention, and this invention is not limited to an Example. That is, various modifications can be made without departing from the scope of the present invention.
Claims (10)
前記復号手段が復号した前記画像データおよび前記符号化情報に基づいて再度前記画像データを符号化する符号化手段と、を有した動画像再符号化装置において、
前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化手段に出力する画像群構造予測手段を有することを特徴とする動画像再符号化装置。A bit stream composed of an image group including at least one of the intra-coded images among the intra-coded image, the forward predictive coded image, and the bidirectional predictive coded image is input to the bit stream. Decoding means for obtaining image data and encoded information;
In the moving image re-encoding device, the encoding unit that encodes the image data again based on the image data and the encoding information decoded by the decoding unit,
Based on the encoding information, the number of the forward prediction encoded images in each of the plurality of image groups is counted, and the maximum number of the forward prediction encoded images in each of the plurality of the image groups thus counted Or the average value of the forward prediction encoded image and the bidirectional predictive encoded image in a plurality of the image groups excluding at least one of the image groups of the image group having the minimum value, A moving image re-encoding apparatus comprising: an image group structure prediction unit that outputs the predicted structure of the image group to the encoding unit.
前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化時に用いることを特徴とする動画像再符号化方法。A bit stream composed of an image group including at least one of the intra-coded images among the intra-coded image, the forward predictive coded image, and the bidirectional predictive coded image is input to the bit stream. In the moving image re-encoding method, the image data and the encoding information are obtained, and the image data is encoded again based on the decoded image data and the encoding information.
Based on the encoding information, the number of the forward prediction encoded images in each of the plurality of image groups is counted, and the maximum number of the forward prediction encoded images in each of the plurality of the image groups thus counted Or the average value of the forward prediction encoded image and the bidirectional predictive encoded image in a plurality of the image groups excluding at least one of the image groups of the image group having the minimum value, A moving image re-encoding method, which is used at the time of encoding as the predicted structure of the image group.
前記復号手段が復号した前記画像データおよび前記符号化情報に基づいて再度前記画像データを符号化する符号化手段と
してコンピュータに機能させる動画像再符号化プログラムにおいて、
前記符号化情報に基づいて、複数の前記画像群各々における前記前方向予測符号化画像の数をカウントし、カウントされた複数の前記画像群各々における前記前方向予測符号化画像の数の最大値または最小値を持つ前記画像群のうち少なくともいずれか一方の前記画像群を一つ以上除いた複数の前記画像群における前記前方向予測符号化画像および前記双方向予測符号化画像の平均値を、予測した前記画像群の構造として前記符号化手段に出力する画像群構造予測手段としてコンピュータに機能させることを特徴とするコンピュータ読み取り可能な動画像再符号化プログラム。A bit stream composed of an image group including at least one of the intra-coded images among the intra-coded image, the forward predictive coded image, and the bidirectional predictive coded image is input to the bit stream. Decoding means for obtaining image data and encoded information;
In a moving image re-encoding program that causes a computer to function as an encoding unit that encodes the image data again based on the image data and the encoding information decoded by the decoding unit,
Based on the encoding information, the number of the forward prediction encoded images in each of the plurality of image groups is counted, and the maximum number of the forward prediction encoded images in each of the plurality of the image groups thus counted Or the average value of the forward prediction encoded image and the bidirectional predictive encoded image in a plurality of the image groups excluding at least one of the image groups of the image group having the minimum value, A computer-readable moving image re-encoding program that causes a computer to function as an image group structure prediction unit that outputs the predicted structure of the image group to the encoding unit.
A computer-readable recording medium storing the moving image re-encoding program according to claim 9.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/321959 WO2008053557A1 (en) | 2006-11-02 | 2006-11-02 | Moving picture re-encoding device, moving picture re-encoding method, moving picture re-encoding program, and recording medium containing the moving picture re-encoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2008053557A1 true JPWO2008053557A1 (en) | 2010-02-25 |
Family
ID=39343916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008541969A Pending JPWO2008053557A1 (en) | 2006-11-02 | 2006-11-02 | Moving image re-encoding device, moving image re-encoding method, moving image re-encoding program, and recording medium storing moving image re-encoding program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2008053557A1 (en) |
WO (1) | WO2008053557A1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011009949A (en) * | 2009-06-24 | 2011-01-13 | Toshiba Corp | Video processor and video processing method |
EP2413535B1 (en) * | 2010-07-30 | 2012-09-19 | Deutsche Telekom AG | Method for estimating the type of the group of picture structure of a plurality of video frames in a video stream |
CN113055673B (en) * | 2021-04-23 | 2023-06-23 | 北京汇钧科技有限公司 | Video stream processing method and device, electronic equipment and storage medium |
CN115119009B (en) * | 2022-06-29 | 2023-09-01 | 北京奇艺世纪科技有限公司 | Video alignment method, video encoding device and storage medium |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261631A (en) * | 1996-03-27 | 1997-10-03 | Sony Corp | Target code amount control method |
JPH10174098A (en) * | 1996-12-12 | 1998-06-26 | Sony Corp | Video data compressor and its method |
JP2000341691A (en) * | 1999-05-31 | 2000-12-08 | Toshiba Corp | Transcoder device |
JP2001238215A (en) * | 2000-02-21 | 2001-08-31 | Victor Co Of Japan Ltd | Moving picture coding apparatus and its method |
JP2002218464A (en) * | 2001-01-15 | 2002-08-02 | Yamaha Corp | Method, device and program for performing transcoding of moving image coded data and recording medium |
JP2004532540A (en) * | 2001-03-05 | 2004-10-21 | インタービデオインコーポレイテッド | System and method for error resilient coding |
JP2005341601A (en) * | 2005-06-08 | 2005-12-08 | Mitsubishi Electric Corp | Motion picture encoder |
JP2006287864A (en) * | 2005-04-05 | 2006-10-19 | Nippon Hoso Kyokai <Nhk> | Coding apparatus and coding program |
-
2006
- 2006-11-02 WO PCT/JP2006/321959 patent/WO2008053557A1/en active Application Filing
- 2006-11-02 JP JP2008541969A patent/JPWO2008053557A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261631A (en) * | 1996-03-27 | 1997-10-03 | Sony Corp | Target code amount control method |
JPH10174098A (en) * | 1996-12-12 | 1998-06-26 | Sony Corp | Video data compressor and its method |
JP2000341691A (en) * | 1999-05-31 | 2000-12-08 | Toshiba Corp | Transcoder device |
JP2001238215A (en) * | 2000-02-21 | 2001-08-31 | Victor Co Of Japan Ltd | Moving picture coding apparatus and its method |
JP2002218464A (en) * | 2001-01-15 | 2002-08-02 | Yamaha Corp | Method, device and program for performing transcoding of moving image coded data and recording medium |
JP2004532540A (en) * | 2001-03-05 | 2004-10-21 | インタービデオインコーポレイテッド | System and method for error resilient coding |
JP2006287864A (en) * | 2005-04-05 | 2006-10-19 | Nippon Hoso Kyokai <Nhk> | Coding apparatus and coding program |
JP2005341601A (en) * | 2005-06-08 | 2005-12-08 | Mitsubishi Electric Corp | Motion picture encoder |
Also Published As
Publication number | Publication date |
---|---|
WO2008053557A1 (en) | 2008-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100754205B1 (en) | Multi-view video encoding apparatus and method | |
KR102058759B1 (en) | Signaling of state information for a decoded picture buffer and reference picture lists | |
JP3866538B2 (en) | Video coding method and apparatus | |
JP4358215B2 (en) | Video encoding apparatus and method | |
JP5286581B2 (en) | Moving picture coding control method, moving picture coding apparatus, and moving picture coding program | |
JPH09214962A (en) | Moving video image compression system having vacant/ full buffer look ahead bit allocator | |
JP5064305B2 (en) | Bit rate conversion apparatus and conversion method | |
US20120207219A1 (en) | Picture encoding apparatus, picture encoding method, and program | |
JPWO2009063554A1 (en) | Encoding device and decoding device | |
KR100796857B1 (en) | Moving image encoding method and apparatus | |
KR101389919B1 (en) | Moving image encoding control method, moving image encoding apparatus and moving image encoding program | |
JP4788250B2 (en) | Moving picture signal encoding apparatus, moving picture signal encoding method, and computer-readable recording medium | |
JPWO2008053557A1 (en) | Moving image re-encoding device, moving image re-encoding method, moving image re-encoding program, and recording medium storing moving image re-encoding program | |
US6226326B1 (en) | Coding device and coding method | |
KR100950525B1 (en) | Transcoding apparatus and method, target bit allocation, complexity prediction apparatus and method of picture therein | |
JP2008153907A (en) | Image encoding apparatus, information terminal including the same, and image encoding method | |
JP2012253516A (en) | Image encoder and image encoding method | |
JP4285431B2 (en) | Video information editing apparatus, method and program | |
US20090185620A1 (en) | Video encoding apparatus and method for the same | |
JP4073541B2 (en) | Video re-encoding device | |
JP4871848B2 (en) | Video re-encoding device | |
JP4231045B2 (en) | Video coding method and apparatus | |
JP2007208377A (en) | Moving picture encoder and method therefor, and program | |
JPH114445A (en) | Image coder and its method | |
JP4755239B2 (en) | Video code amount control method, video encoding device, video code amount control program, and recording medium therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120619 |