JP2008219205A - Picture information encoder and picture information encoding method - Google Patents
Picture information encoder and picture information encoding method Download PDFInfo
- Publication number
- JP2008219205A JP2008219205A JP2007050779A JP2007050779A JP2008219205A JP 2008219205 A JP2008219205 A JP 2008219205A JP 2007050779 A JP2007050779 A JP 2007050779A JP 2007050779 A JP2007050779 A JP 2007050779A JP 2008219205 A JP2008219205 A JP 2008219205A
- Authority
- JP
- Japan
- Prior art keywords
- size
- image information
- orthogonal transform
- flag
- transform size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動画画像情報を可変の直交変換サイズ単位で直交変換して符号化した画像圧縮情報を出力する画像情報符号化装置及び画像情報符号化方法に関し、特に、MPEG、H.26x等のように、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルTV、インターネット、携帯電話などのネットワークメディアを介して受信する際に、若しくは光、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いられる画像情報符号化装置及び画像情報符号化方法に関する。 The present invention relates to an image information encoding apparatus and image information encoding method for outputting compressed image information obtained by orthogonally transforming moving image information in units of variable orthogonal transform sizes, and in particular, MPEG, H.26x, etc. As described above, when receiving image information (bitstream) compressed by orthogonal transformation such as discrete cosine transformation or Karhunen-Labe transformation and motion compensation via network media such as satellite broadcasting, cable TV, the Internet, and cellular phones. The present invention also relates to an image information encoding apparatus and an image information encoding method used when processing on a storage medium such as an optical, magnetic disk, or flash memory.
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEGなどの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。 In recent years, image information has been handled as digital data. At that time, MPEG is used for the purpose of efficient transmission and storage of information, and compression is performed by orthogonal transform such as discrete cosine transform and motion compensation using redundancy unique to image information. An apparatus conforming to the above-described method is becoming widespread in both information distribution of broadcasting stations and information reception in general households.
特に、MPEG2(ISO/IEC 13818−2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度(SD:Standard Definition)画像及び高精細(HD:High Definition)画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。 In particular, MPEG2 (ISO / IEC 13818-2) is defined as a general-purpose image coding system, and includes both interlaced scanning images and progressive scanning images, standard definition (SD) images, and high definition (HD: HD). High Definition) A standard that covers images and is currently widely used in a wide range of professional and consumer applications. By using the MPEG2 compression method, for example, a standard resolution interlaced scanning image having 720 × 480 pixels is 4 to 8 Mbps, and a high resolution interlaced scanning image having 1920 × 1088 pixels is 18 to 22 Mbps. (Bit rate) can be assigned to achieve a high compression rate and good image quality.
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496−2としてその規格が国際標準に承認された。 MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but did not support encoding methods with a lower code amount (bit rate) than MPEG1, that is, a higher compression rate. With the widespread use of mobile terminals, the need for such an encoding system is expected to increase in the future, and the MPEG4 encoding system has been standardized accordingly. Regarding the image coding system, the standard was approved as an international standard as ISO / IEC 14496-2 in December 1998.
さらに、近年、当初テレビ会議用の画像符号化を目的として、H.26L(ITU−T Q6/16 VCEG)という標準の規格化が進んでいる。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced−Compression Video Codingとして行われている。標準化のスケジュールとしては、2003年3月にはH.264及びMPEG−4 Part10(Advanced Video Coding)という名の元に国際標準となった。 Furthermore, in recent years, the standardization of a standard called H.26L (ITU-T Q6 / 16 VCEG) has been advanced for the purpose of image coding for an initial video conference. H. 26L is known to achieve higher encoding efficiency, although a larger amount of computation is required for encoding and decoding than conventional encoding methods such as MPEG2 and MPEG4. In addition, as part of MPEG4 activities, this H.264 Based on H.26L Standardization that incorporates functions not supported by H.26L and achieves higher coding efficiency is performed as Joint Model of Enhanced-Compression Video Coding. As a standardization schedule, in March 2003, H.264 H.264 and MPEG-4 Part 10 (Advanced Video Coding) have become international standards.
ここで、AVC規格に基づいた画像圧縮情報を出力とする画像情報符号化装置100の概略構成を図2のブロック図に示す。
Here, a schematic configuration of the image
この画像情報符号化装置100は、A/D変換部101、画面並べ替えバッファ102、加算器103、直交変換部104、量子化部105、可逆符号化部106、蓄積バッファ107、逆量子化部108、逆直交変換部109、デブロックフィルタ110、フレームメモリ111、イントラ予測部112、動き予測・補償部113、レート制御部114などからなる。
The image
この図2に示す画像情報符号化装置100において、A/D変換部101は、入力された画像信号をデジタル信号に変換して画面並べ替えバッファ102に供給する。そして、画面並べ替えバッファ102は、当該画像情報符号化装置100から出力する画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。
In the image
ここで、イントラ符号化、すなわち、単一のフレームを用いて符号化が行われる画像情報に関しては、入力画像情報と、イントラ予測部112により生成される画素値の差分情報が直交変換部104に入力され、直交変換部104において、離散コサイン変換、カルーネン・レーベ変換等の直交変換が施される。直交変換部104は、直交変換により得られる変換係数を量子化部105に供給する。
Here, with respect to image information that is intra-encoded, that is, encoded using a single frame, the difference between the input image information and the pixel value generated by the
量子化部105は、直交変換部104から供給される変換係数に対して量子化処理を施し、量子化した変換係数を可逆符号化部106に供給する。
The
可逆符号化部106は、量子化部105から供給される量子化された変換係数に対して、可変長符号化、算術符号化等の可逆符号化を施す。この可逆符号化部106により可逆符号化された変換係数は、蓄積バッファ107に蓄積され、画像圧縮情報として出力される。
The
量子化部105の挙動は、レート制御部114によって制御される。また、量子化部105は、量子化した変換係数を逆量子化部108に供給する。さらに、逆直交変換部109において逆直交変換処理が施されて、復号画像情報となり、デブロックフィルタ110においてブロック歪の除去が施された後、その情報はフレームメモリ111に蓄積される。イントラ予測部112において、当該ブロック/マクロブロックに対して適用されたイントラ予測モードに関する情報は、可逆符号化部106に伝送され、画像圧縮情報におけるヘッダ情報の一部として符号化される。
The behavior of the
一方、インター符号化、すなわち、複数のフレームを用いて符号化が行われる画像情報に関しては、画面並べ替えバッファ102からの画像情報は動き予測・補償部113に入力される。動き予測・補償部113は、同時に参照される画像情報をフレームメモリ111から読み出し、動き予測・補償処理を施して参照画像情報を生成し、この参照画像情報を加算器103に供給する。加算器103は、画面並べ替えバッファ102からの画像情報を参照画像情報との差分信号に変換する。動き予測・補償部113は、同時に動きベクトル情報を可逆符号化部106に供給する。可逆符号化部106は、その動きベクトル情報に対して可変長符号化、算術符号化といった可逆符号化処理を施し、画像圧縮情報のヘッダ部に挿入される情報を形成する。その他の処理はイントラ符号化を施される画像圧縮情報と同様である。
On the other hand, with respect to image information that is inter-encoded, that is, encoded using a plurality of frames, the image information from the
次に、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償により画像圧縮を実現する画像情報復号装置200の概略構成を図3のブロック図を示す。
Next, a block diagram of FIG. 3 shows a schematic configuration of an image
この画像情報復号装置200は、蓄積バッファ201、可逆復号部202、逆量子化部203、逆直交変換部204、加算器205、画面並べ替えバッファ206、D/A変換部207、フレームメモリ208、動き補償・補償部209、イントラ予測部210、デブロックフィルタ211などからなる。
The image
この図3に示す画像情報復号装置200において、蓄積バッファ201は、入力された画像圧縮情報を一時的に格納して、可逆復号部202に転送する。可逆復号部202は、蓄積バッファ201から転送されてくる画像圧縮情報に対して、定められた画像圧縮情報のフォーマットに基づき、可変長復号、算術復号等の処理を施す。また、可逆復号部202は、当該フレームがイントラ符号化されたものである場合、画像圧縮情報のヘッダ部に格納されたイントラ予測モード情報についても復号し、その情報をイントラ予測部210に供給する。さらに、可逆復号部202は、当該フレームがインター符号化されたものである場合、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部209に供給する。
In the image
逆量子化部203は、可逆復号部202から供給される量子化された変換係数を逆量子化し、変換係数として逆直交変換部204に供給する。逆直交変換部204は、逆量子化部203から供給される変換係数に対して、定められた方式に基づき、4次の逆直交変換を施す。
The
ここで、当該フレームがイントラ符号化されたものである場合には、逆直交変換処理が施された画像情報は、加算器205に供給され、イントラ予測部210において生成された予測画像情報と合成され、更に、デブロックフィルタ211においてブロック歪の除去が施された後、画面並べ替えバッファ206に格納され、D/A変換部207によりD/A変換処理の後に出力される。
Here, when the frame is intra-coded, the image information subjected to the inverse orthogonal transform process is supplied to the
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償部209は、可逆復号部202により可逆復号処理が施された動きベクトル情報、及び、フレームメモリ208に格納された画像情報を元に参照画像情報を生成し、加算器205に供給する。加算器205は、この参照画像情報と逆直交変換部204の出力とを合成する。その他の処理はイントラ符号化されたフレームと同様である。
On the other hand, if the frame is inter-coded, the motion prediction /
ところで、AVCではそもそも4×4DCTしか存在しなかった。これは、DCTサイズを小さくすることでモスキートノイズの伝播が抑えられるという効果があったためである。しかし、標準解像度(SD:Standard Definition)画像やそれ以下の画像サイズではその効果が高いが、高精細(HD:High Definition)画像では4×4DCTではGrain noiseなどのテクスチャーが忠実に再現できず8×8DCTの方がより忠実に再現できることが後にわかった。 By the way, in AVC, only 4 × 4 DCT existed in the first place. This is because the propagation of mosquito noise can be suppressed by reducing the DCT size. However, although the effect is high in a standard definition (SD) image or an image size smaller than that, a texture such as grain noise cannot be faithfully reproduced in a 4 × 4 DCT in a high definition (HD) image. It was later found that x8DCT can be reproduced more faithfully.
そこで、2004年には、原画をより忠実に再現することを目的に従来のプロファイルに加えてFidelity Range ExtentionとしてHigh Profileが追加された。従来のMain Profileとの大きな相違点は、DCTサイズを8×8と4×4をマクロブロック単位で切り替えることができる、Scaling List Matrixと呼ばれる量子化マトリクスを使用することができるということである。 Therefore, in 2004, High Profile was added as a Fidelity Range Extension in addition to the conventional profile for the purpose of reproducing the original image more faithfully. A major difference from the conventional Main Profile is that a quantization matrix called a scaling list matrix that can switch the DCT size between 8 × 8 and 4 × 4 in units of macroblocks can be used.
8×8DCTの導入により高精細(HD:High Definition)画像におけるGrain noiseなどのテクスチャー(模様)の再現性が向上している。Scaling List Matrixの導入により人間の視覚特性に適した画質向上が図られている。 With the introduction of 8 × 8 DCT, the reproducibility of texture (pattern) such as Grain noise in a high definition (HD) image is improved. The introduction of Scaling List Matrix has improved image quality suitable for human visual characteristics.
8×8DCTと4×4DCTを切り替えるためには、PPS(Picture parameter set)における変換サイズフラグ(transform_size_8×8_flag)を[1]に設定する必要がある。これによりマクロブロック毎にDCTサイズを切り替えることができる。 In order to switch between 8 × 8 DCT and 4 × 4 DCT, it is necessary to set the transform size flag (transform_size — 8 × 8_flag) in PPS (Picture parameter set) to [1]. As a result, the DCT size can be switched for each macroblock.
マクロブロックのDCTサイズはMacroblock layer syntaxにおけるtransform_size_8×8_flagにより切り替えることができる。このフラグが[0]であれば4×4DCT、[1]であれば8×8DCTである。8×8DCTの場合は動き補償のブロックサイズが8×8以上でなければならない。 The DCT size of the macro block can be switched by transform_size_8 × 8_flag in Macroblock layer syntax. If this flag is [0], it is 4 × 4 DCT, and if it is [1], it is 8 × 8 DCT. In the case of 8 × 8 DCT, the block size of motion compensation must be 8 × 8 or more.
このように、High Profileを追加し、DCTサイズの切り替えが可能になったのであるが、HDでもエッジ部分もしくは極端に複雑なテクスチャーでは8×8DCTを使用することによるモスキートノイズが観測され、主観画質が悪いという現象が発生する。入力画像情報をより忠実に再現しつつ、モスキートノイズなどの量子化劣化を最小限にするためにDCTサイズを切り替えなければならないという問題点がある。また8×8DCT、4×4DCTの両方を考慮した動き予測およびイントラ予測を行わなければならないため計算量の増加という問題点がある。 In this way, the High Profile is added and the DCT size can be switched. However, in HD, mosquito noise due to the use of 8 × 8 DCT is observed in the edge portion or extremely complex texture, and the subjective image quality The phenomenon that is bad occurs. There is a problem that the DCT size must be switched in order to minimize the quantization deterioration such as mosquito noise while reproducing the input image information more faithfully. In addition, since motion prediction and intra prediction considering both 8 × 8 DCT and 4 × 4 DCT must be performed, there is a problem that the amount of calculation increases.
そこで、本発明の目的は、上述の如き従来の問題点に鑑み、計算量を削減しつつ、入力画像情報をより忠実に再現しつつ、モスキートノイズなどの量子化劣化を最小限にすることができる画像情報符号化装置及び画像情報符号化方法を提供することにある
本発明の更に他の目的、本発明によって得られる具体的な利点は、以下に説明される実施の形態の説明から一層明らかにされる。
Therefore, in view of the conventional problems as described above, an object of the present invention is to minimize quantization degradation such as mosquito noise while reducing the amount of calculation and reproducing the input image information more faithfully. Another object of the present invention and specific advantages obtained by the present invention are further apparent from the description of embodiments described below. To be.
本発明では、上述の課題を解決するために、直交変換サイズ判定手段により、入力画像情報の特徴量を利用して直交変換サイズの判定を行い、前もって直交変換サイズを決定することで、DCTサイズ判定部を導入する。特徴量は入力マクロブロックにおける画像のエッジ部分もしくは複雑なテクスチャーを表現できるものであれば良く、例えば、マクロブロックアクティビティ、マクロブロック分散、マクロブロックに含まれるエッジの数などである。 In the present invention, in order to solve the above-described problem, the orthogonal transform size determination means determines the orthogonal transform size using the feature amount of the input image information, and determines the orthogonal transform size in advance, thereby determining the DCT size. Introduce a judgment unit. The feature amount may be anything that can represent the edge portion of the image or a complex texture in the input macroblock, such as macroblock activity, macroblock variance, and the number of edges included in the macroblock.
すなわち、本発明は、動画画像情報を可変の直交変換サイズ単位で直交変換して符号化した画像圧縮情報を出力する画像情報符号化装置であって、入力された動画画像情報について、所定画素数単位の画像特徴量に基づいて、上記直交変換サイズを判定する直交変換サイズ判定手段を備え、この直交変換サイズ判定手段による判定結果に応じて上記直交変換サイズを切り換えて直交変換を行うことを特徴とする。 That is, the present invention is an image information encoding device that outputs image compression information obtained by encoding and transforming moving image information in units of variable orthogonal transform sizes. The input moving image information includes a predetermined number of pixels. An orthogonal transform size determining unit that determines the orthogonal transform size based on a unit image feature amount is provided, and the orthogonal transform is performed by switching the orthogonal transform size according to a determination result by the orthogonal transform size determining unit And
また、本発明は、動画画像情報を可変の直交変換サイズ単位で直交変換して符号化した画像圧縮情報を出力する画像情報符号化方法であって、入力された動画画像情報について、所定画素数単位の画像特徴量に基づいて、上記直交変換サイズを判定し、その判定結果に応じて上記直交変換サイズを切り換えて直交変換を行うことを特徴とする。 The present invention is also an image information encoding method for outputting compressed image information obtained by encoding moving image information by performing orthogonal transform in variable orthogonal transform size units, and for input moving image information, a predetermined number of pixels is provided. The orthogonal transform size is determined based on the unit image feature amount, and the orthogonal transform is performed by switching the orthogonal transform size according to the determination result.
本発明では、直交変換サイズ判定手段により、マクロブロックアクティビティ、マクロブロック分散、マクロブロックに含まれるエッジの数などの入力画像情報の特徴量を利用して直交変換サイズの判定を行い、前もって直交変換サイズを決定することで、計算量を削減しつつ、入力画像情報をより忠実に再現しつつ、モスキートノイズなどの量子化劣化を最小限にすることができる。 In the present invention, the orthogonal transform size determination means determines the orthogonal transform size using the feature amount of the input image information such as the macroblock activity, the macroblock variance, the number of edges included in the macroblock, and the orthogonal transform in advance. By determining the size, it is possible to minimize the deterioration of quantization such as mosquito noise while reproducing the input image information more faithfully while reducing the amount of calculation.
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明は以下の例に限定されるものではなく、本発明の要旨を逸脱しない範囲で、任意に変更可能であることは言うまでもない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Needless to say, the present invention is not limited to the following examples, and can be arbitrarily changed without departing from the gist of the present invention.
本発明は、例えば図1に示すような構成の画像情報符号化装置10に適用される。
The present invention is applied to, for example, an image
この画像情報符号化装置10は、A/D変換部11、画面並べ替えバッファ12、DCTサイズ判定部13、加算器14、直交変換部15、量子化部16、可逆符号化部17、蓄積バッファ18、逆量子化部19、逆直交変換部20、デブロックフィルタ21、フレームメモリ22、イントラ予測部23、動き予測・補償部24、レート制御部25などからなる。
The image
この図1に示す画像情報符号化装置10において、A/D変換部11は、入力された動画像信号をデジタル信号に変換して画面並べ替えバッファ12に供給する。
In the image
画面並べ替えバッファ12は、A/D変換部11によりデジタル信号に変換された入力画像情報について、当該画像情報符号化装置10から出力する画像圧縮情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行い、並べ替え済みの入力画像情報をDCTサイズ判定部13を介して加算器14、直交変換部15、イントラ予測部23及び動き予測・補償部24に供給する。
The
DCTサイズ判定部13は、画面並べ替えバッファ12から供給される入力画像情報について、例えば、マクロブロックアクティビティ、マクロブロック分散、マクロブロックに含まれるエッジの数などの特徴量を用いてDCTサイズを判定し、判定結果に応じてDCTサイズを示す変換サイズフラグ(transform_size_8×8_flag)を変更する。
The DCT
加算器14は、DCTサイズ判定部13を介して供給される入力画像情報とイントラ若しくはインター予測画像情報との差分値をマクロブロック毎に生成する。
The
ここで、イントラ符号化、すなわち、単一のフレームを用いて符号化が行われる画像情報に関しては、入力画像情報と、イントラ予測部23により生成されるイントラ予測画像情報の差分値が直交変換部15に入力される。また、インター符号化、すなわち、複数のフレームを用いて符号化が行われる画像情報に関しては、入力画像情報と、動き補償・予測部24により生成される参照画像情報の差分値が直交変換部15に入力される。
Here, with respect to image information that is intra-encoded, that is, encoded using a single frame, the difference value between the input image information and the intra-predicted image information generated by the
直交変換部15は、加算器14から供給されるマクロブロック毎の差分値について、可変の変換サイズ単位で離散コサイン変換、カルーネン・レーベ変換等の直交変換、ここでは、離散コサイン変換(DCT)を行い、得られる直交変換(DCT)係数を量子化部16に供給する。この直交変換部15における可変の変換サイズは、DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)で示される変換サイズに切り替えられる。ここで、上記変換サイズフラグ(transform_size_8×8_flag)は、[1]の場合に、直交変換サイズが8×8であることを示し、[0]の場合に、直交変換サイズが4×4であることを示す。
The
量子化部16は、直交変換部15から供給される変換係数に対して量子化処理を施し、量子化した変換係数を可逆符号化部17及び逆量子化部19に供給する。
The
量子化部16の挙動は、レート制御部25によって制御されている。
The behavior of the
可逆符号化部17は、量子化部16から供給される量子化された変換係数に対して、可変長符号化、算術符号化等の可逆符号化、例えば、CABAC(Context−Adaptive Binary Arithmetic Coding)符号化を施す。この可逆符号化部17により可逆符号化された変換係数は、蓄積バッファ18に蓄積され、画像圧縮情報として出力される。
The
また、逆量子化部19は、量子化部16から供給される量子化された直交変換係数の逆量子化処理を行い、直交変換係数を逆直交変換部20に供給する。
The inverse quantization unit 19 performs an inverse quantization process on the quantized orthogonal transform coefficient supplied from the
逆直交変換部20は、逆量子化部19から供給される直交変換係数の逆直交変換処理を行い、得られる復号画像情報をデブロックフィルタ21を介してフレームメモリ22に供給する。
The inverse
デブロックフィルタ21は、復号画像情報に含まれるブロック歪を除去する。
The
フレームメモリ22は、復号画像情報を蓄積する。
The
イントラ予測部23は、フレームメモリ22から、隣接する、既に符号化済の画像情報を取り出して、これを元に、DCTサイズに適したイントラ予測処理のみを行う。ここで、このイントラ予測部23は、DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)が[1]の際には、Intra8×8のみのイントラ予測を行う。
The
動き予測・補償部24は、DCTサイズ判定部13による判定結果に応じて、必要なブロックサイズのみ、参照画像情報に対して動きベクトルの探索及びインター予測画像情報の生成を行い、DCTサイズが事前にわからない場合は、ブロックサイズをDCTサイズ判定部13にフィードバックする。ここで、この動き予測・補償部24は、DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)が[1]の場合に、上記8×8サイズのみの動き予測を行い、また、DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)が[0]の場合には、Intra4×4又はIntra16×16のイントラ予測を行う。
The motion prediction /
レート制御部25は、フィードバック制御により量子化部16の動作の制御を行い、出力となる画像圧縮情報の符号量制御を行う。
The
次に、本発明の特徴となるDCTサイズ判定部13における動作原理について説明する。
Next, the operation principle of the DCT
DCTサイズ判定部13では、マクロブロック単位の特徴量よりDCTサイズを判定する。特徴量は例えばマクロブロックアクティビティ、マクロブロック分散、マクロブロックに含まれるエッジの数などである。
The DCT
マクロブロックアクティビティMBACTは、次のように計算する。 The macroblock activity MBACT is calculated as follows.
ここで、Pkは原画の輝度信号ブロック内画素値である。ここで、sblkはマクロブロックに含まれる4つの8×8画素ブロックを表している。DCTサイズの判定は、例えば次のようにある閾値Thactを用いて判定する。 Here, P k is a pixel value in the luminance signal block of the original image. Here, sblk represents four 8 × 8 pixel blocks included in the macroblock. The DCT size is determined using a certain threshold Th act as follows, for example.
また、マクロブロック分散MBVARは次のように計算する。 The macroblock distribution MBVAR is calculated as follows.
ここで、Pkは原画の輝度信号ブロック内画素値である。DCTサイズの判定は、例えば閾値Thvarを用いて次のように判定する。 Here, P k is a pixel value in the luminance signal block of the original image. The determination of the DCT size is performed as follows using, for example, the threshold value Th var .
また、マクロブロックエッジMBEDGEは、次のように計算する。エッジ検出には、どのような方法を使用しても良いが、ここではsobelオペレーションを示す。 The macroblock edge MBEDGE is calculated as follows. Any method may be used for edge detection, but here a sobel operation is shown.
上記係数を入力画像情報のi行j列に乗算し合計したものをghsij、ghvijとしたとき、注目画素のsobelオペレーション後の画素値gijは次の式で表される。 When g hsij and g hvij are obtained by multiplying the above-mentioned coefficients by i rows and j columns of the input image information and obtaining the sum as g hsij and g hvij , the pixel value g ij after the sobel operation of the target pixel is expressed by the following equation.
ここで、閾値Thsobel以上の値の画素値の数をマクロブロックごとに集計したMBEDGEは次のように表される。 Here, MBEDGE in which the number of pixel values greater than or equal to the threshold value Th sobel is tabulated for each macroblock is expressed as follows.
ここで、Ekはブロック内sobelオペレーション後の画素値が閾値Thsobel以上の場合[1]それ以外[0]の値をとるものである。DCTサイズの判定は例えば次のようにある閾値Thedgeを用いて判定する。 Here, E k takes the value [1] when the pixel value after the intra-block sobel operation is equal to or greater than the threshold Th sobel [0]. The DCT size is determined using, for example, a certain threshold Th edge as follows.
この処理に使用するエッジ検出方法はsobelオペレーションのみに限定されず、さまざまなエッジ検出方法を利用することができる。また、マクロブロック内のエッジの数だけでなく、縦、横それぞれのエッジの数を別々に評価してよい。 The edge detection method used for this process is not limited to the sobel operation, and various edge detection methods can be used. Further, not only the number of edges in the macroblock but also the number of vertical and horizontal edges may be evaluated separately.
次に、イントラ予測部23における動作原理について説明する。
Next, the operation principle in the
DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)の値が[0]の場合は、DCTサイズが4×4であるために、DCTサイズが8×8であるIntra8×8の予測は行わず、[1]の場合は、DCTサイズが8×8であるのでDCTサイズが4×4であるIntra4×4およびInra16×16の予測は行わない。これにより計算量の削減が行える。
When the value of the transform size flag (transform_size_8 × 8_flag) given by the DCT
さらに、動き予測・補償部24における動作原理について説明する。
Further, the operation principle in the motion prediction /
DCTサイズ判定部13により与えられる変換サイズフラグ(transform_size_8×8_flag)の値が[1]の場合は、DCTサイズが8×8であるため、動き補償のブロックサイズが8×8以上でなければならない。そのため、8×8未満の動き予測を行う必要がないため計算の削減を行うことが可能になる。
When the value of the transform size flag (transform_size_8 × 8_flag) given by the DCT
しかし、ハードウェアの構成によりパイプライン処理によりDCTサイズ判定部13でのDCTサイズ判定より先に動き補償を行っている場合に関しては、選択された動き補償のブロックサイズが8×8未満の場合は、変換サイズフラグ(transform_size_8×8_flag)は[0]である必要があるため、その情報をDCTサイズ判定部13にフィードバックする必要がある。これによりシンタックス上矛盾のないDCTサイズ判定を行うことができる。
However, regarding the case where motion compensation is performed prior to the DCT size determination in the DCT
11 A/D変換部、12 画面並べ替えバッファ、13 DCTサイズ判定部、14 加算器、15 直交変換部、16 量子化部、17 可逆符号化部、18 蓄積バッファ、19 逆量子化部、20 逆直交変換部、21 デブロックフィルタ、22 フレームメモリ、23 イントラ予測部、24 動き予測・補償部、25 レート制御部、 11 A / D conversion unit, 12 screen rearrangement buffer, 13 DCT size determination unit, 14 adder, 15 orthogonal transform unit, 16 quantization unit, 17 lossless encoding unit, 18 accumulation buffer, 19 inverse quantization unit, 20 Inverse orthogonal transform unit, 21 deblock filter, 22 frame memory, 23 intra prediction unit, 24 motion prediction / compensation unit, 25 rate control unit,
Claims (10)
入力された動画画像情報について、所定画素数単位の画像特徴量に基づいて、上記直交変換サイズを判定する直交変換サイズ判定手段を備え、
この直交変換サイズ判定手段による判定結果に応じて上記直交変換サイズを切り換えて直交変換を行うことを特徴とする画像情報符号化装置。 An image information encoding device that outputs compressed image information obtained by encoding and transforming moving image information in units of variable orthogonal transform sizes,
The input moving image information includes an orthogonal transform size determination unit that determines the orthogonal transform size based on an image feature amount in a predetermined number of pixels.
An image information encoding apparatus, wherein orthogonal transform is performed by switching the orthogonal transform size according to a determination result by the orthogonal transform size determining means.
上記直交変換サイズ判定手段は、入力された動画画像情報について、マクロブロック単位の画像特徴量に基づいて、上記直交変換サイズを判定し、その判定結果に応じて変換サイズフラグ(transform_size_8×8_flag)を変更することで上記直交変換サイズを4×4もしくは8×8に切り替えることを特徴とする請求項1記載の画像情報符号化装置。 An image information encoding device that outputs image compression information based on MPEG-4, AVC encoding method, etc.
The orthogonal transform size determination means determines the orthogonal transform size of the input moving image information based on the image feature amount in units of macroblocks, and sets a transform size flag (transform_size_8 × 8_flag) according to the determination result. 2. The image information encoding apparatus according to claim 1, wherein the orthogonal transform size is switched to 4 × 4 or 8 × 8 by changing.
上記予測・補償手段により動き予測を行う前に上記直交変換サイズ判定手段による判定結果に基づいて直交変換サイズを決定してしまうことで、上記予測・補償手段は、上記直交変換サイズが8×8であることを示す上記変換サイズフラグ(transform_size_8×8_flag)が[1]の場合に、上記8×8サイズのみの動き予測を行うことを特徴とする請求項2記載の画像情報符号化装置。 Predicting / compensating means for performing motion prediction / compensation processing on the moving image information to be orthogonally transformed,
By determining the orthogonal transform size based on the determination result by the orthogonal transform size determination unit before performing the motion prediction by the prediction / compensation unit, the prediction / compensation unit has the orthogonal transform size of 8 × 8. 3. The image information encoding apparatus according to claim 2, wherein when the transform size flag (transform_size — 8 × 8_flag) indicating that it is “1”, motion prediction only for the 8 × 8 size is performed. 4.
上記直交変換サイズ判定手段は、上記予測・補償手段により動き予測を行った後に直交変換サイズを決定する場合に、上記変換サイズフラグ(transform_size_8×8_flag)が[1]で、かつ、動き予測により決定された動き補償のサイズが8×8ブロックサイズ未満の場合に上記変換サイズフラグ(transform_size_8×8_flag)を[0]に変更することを特徴とする請求項2記載の画像情報符号化装置。 Predicting / compensating means for performing motion prediction / compensation processing on the moving image information to be orthogonally transformed,
When the orthogonal transform size is determined after motion prediction is performed by the prediction / compensation unit, the orthogonal transform size determination unit determines that the transform size flag (transform_size_8 × 8_flag) is [1] and is determined by motion prediction. 3. The image information encoding apparatus according to claim 2, wherein the transform size flag (transform_size_8 × 8_flag) is changed to [0] when the size of the motion compensation performed is less than the 8 × 8 block size.
上記イントラ予測手段によりイントラ予測を行う前に上記直交変換サイズ判定手段による判定結果に基づいてDCTサイズを決定してしまうことで、上記イントラ予測手段は、上記変換サイズフラグ(transform_size_8×8_flag)が[1]の際には、Intra8×8のみのイントラ予測を行うことを特徴とする請求項2記載の画像情報符号化装置。 Intra prediction means for performing motion intra prediction processing on the moving image information to be orthogonally transformed,
By determining the DCT size based on the determination result by the orthogonal transform size determination means before performing the intra prediction by the intra prediction means, the intra prediction means has the transform size flag (transform_size_8 × 8_flag) set to [ 3. The image information encoding apparatus according to claim 2, wherein intra prediction of only Intra 8 × 8 is performed in the case of 1].
上記イントラ予測手段によりイントラ予測を行う前に上記直交変換サイズ判定手段による判定結果に基づいてDCTサイズを決定してしまうことで、上記イントラ予測手段は、上記変換サイズフラグ(transform_size_8×8_flag)が[0]の際には、Intra4×4又はIntra16×16のイントラ予測を行うことを特徴とする請求項2記載の画像情報符号化装置。 Intra prediction means for performing motion intra prediction processing on the moving image information to be orthogonally transformed,
By determining the DCT size based on the determination result by the orthogonal transform size determination means before performing the intra prediction by the intra prediction means, the intra prediction means has the transform size flag (transform_size_8 × 8_flag) set to [ 0], the intra prediction of Intra4 × 4 or Intra16 × 16 is performed.
入力された動画画像情報について、所定画素数単位の画像特徴量に基づいて、上記直交変換サイズを判定し、
その判定結果に応じて上記直交変換サイズを切り換えて直交変換を行うことを特徴とする画像情報符号化方法。 An image information encoding method for outputting compressed image information obtained by orthogonally transforming and encoding moving image information in variable orthogonal transform size units,
For the input video image information, the orthogonal transformation size is determined based on the image feature amount in a predetermined number of pixels,
An image information encoding method, wherein orthogonal transform is performed by switching the orthogonal transform size according to the determination result.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007050779A JP2008219205A (en) | 2007-02-28 | 2007-02-28 | Picture information encoder and picture information encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007050779A JP2008219205A (en) | 2007-02-28 | 2007-02-28 | Picture information encoder and picture information encoding method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008219205A true JP2008219205A (en) | 2008-09-18 |
Family
ID=39838761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007050779A Withdrawn JP2008219205A (en) | 2007-02-28 | 2007-02-28 | Picture information encoder and picture information encoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008219205A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009049779A (en) * | 2007-08-21 | 2009-03-05 | Toshiba Corp | Information processor and inter-prediction mode determination method |
WO2010052833A1 (en) * | 2008-11-07 | 2010-05-14 | 三菱電機株式会社 | Image encoding device and image decoding device |
JPWO2010116869A1 (en) * | 2009-04-08 | 2012-10-18 | シャープ株式会社 | Moving picture encoding apparatus and moving picture decoding apparatus |
US8737482B2 (en) | 2007-02-16 | 2014-05-27 | Kabushiki Kaisha Toshiba | Information processing apparatus and inter-prediction mode determining method |
JP2015156700A (en) * | 2009-07-06 | 2015-08-27 | トムソン ライセンシングThomson Licensing | Method and apparatus for spatially varying residue coding |
US9357219B2 (en) | 2009-04-08 | 2016-05-31 | Sharp Kabushiki Kaisha | Video encoding apparatus and video decoding apparatus |
US10645423B2 (en) | 2017-11-29 | 2020-05-05 | Fujitsu Limited | Video image encoding device and video image encoding method |
-
2007
- 2007-02-28 JP JP2007050779A patent/JP2008219205A/en not_active Withdrawn
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8737482B2 (en) | 2007-02-16 | 2014-05-27 | Kabushiki Kaisha Toshiba | Information processing apparatus and inter-prediction mode determining method |
US8848798B2 (en) | 2007-08-21 | 2014-09-30 | Kabushiki Kaisha Toshiba | Information processing apparatus and inter-prediction mode determination method |
JP2009049779A (en) * | 2007-08-21 | 2009-03-05 | Toshiba Corp | Information processor and inter-prediction mode determination method |
WO2010052833A1 (en) * | 2008-11-07 | 2010-05-14 | 三菱電機株式会社 | Image encoding device and image decoding device |
JPWO2010052833A1 (en) * | 2008-11-07 | 2012-03-29 | 三菱電機株式会社 | Image encoding apparatus and image decoding apparatus |
US8855203B2 (en) | 2009-04-08 | 2014-10-07 | Sharp Kabushiki Kaisha | Video encoding apparatus and video decoding apparatus |
JPWO2010116869A1 (en) * | 2009-04-08 | 2012-10-18 | シャープ株式会社 | Moving picture encoding apparatus and moving picture decoding apparatus |
US9357219B2 (en) | 2009-04-08 | 2016-05-31 | Sharp Kabushiki Kaisha | Video encoding apparatus and video decoding apparatus |
US9762933B2 (en) | 2009-04-08 | 2017-09-12 | Sharp Kabushiki Kaisha | Video decoding apparatus and video encoding apparatus |
US9992509B2 (en) | 2009-04-08 | 2018-06-05 | Sharp Kabushiki Kaisha | Video decoding apparatus, video decoding method, video encoding apparatus, and video encoding method |
US10645410B2 (en) | 2009-04-08 | 2020-05-05 | Sharp Kabushiki Kaisha | Video decoding apparatus |
JP2015156700A (en) * | 2009-07-06 | 2015-08-27 | トムソン ライセンシングThomson Licensing | Method and apparatus for spatially varying residue coding |
US9736500B2 (en) | 2009-07-06 | 2017-08-15 | Thomson Licensing | Methods and apparatus for spatially varying residue coding |
US10645423B2 (en) | 2017-11-29 | 2020-05-05 | Fujitsu Limited | Video image encoding device and video image encoding method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4617644B2 (en) | Encoding apparatus and method | |
EP2324638B1 (en) | System and method for video encoding using adaptive loop filter | |
US8249147B2 (en) | Image decoding device, image decoding method, and image decoding program | |
KR101246294B1 (en) | Method of and apparatus for video intraprediction encoding/decoding | |
JP5942990B2 (en) | Image processing apparatus and method | |
JP2004140473A (en) | Image information coding apparatus, decoding apparatus and method for coding image information, method for decoding | |
JP2011130410A (en) | Encoding method, decoding method and apparatus thereof | |
KR20120079180A (en) | Dynamic image decoding method and device | |
KR20040054776A (en) | Reduced-complexity video decoding using larger pixel-grid motion compensation | |
KR20140048885A (en) | Image processing device and method | |
US20150030068A1 (en) | Image processing device and method | |
JP2008219205A (en) | Picture information encoder and picture information encoding method | |
TW201631967A (en) | Gradual updating using transform coefficients for encoding and decoding | |
JP4254147B2 (en) | Image information encoding method and apparatus, program, and recording medium | |
JP5375938B2 (en) | Decoding apparatus and method | |
JP2008004984A (en) | Image processor and method, program, and recording medium | |
JP4924708B2 (en) | Decoding apparatus and method | |
WO2017082304A1 (en) | Information compression device, information compression method, recording medium, and encoding device | |
JP2008004983A (en) | Image processing apparatus and method, program, and recording medium | |
KR100710338B1 (en) | Multi-format video decoder and deblocking filtering method | |
JP5375935B2 (en) | Encoding apparatus and method | |
JP4983908B2 (en) | Decoding apparatus and method | |
JP5375936B2 (en) | Decoding apparatus and method | |
JP5375937B2 (en) | Encoding apparatus and method | |
Sato et al. | Consideration on intra-prediction for pipeline processing in H. 264/MPEG-4 AVC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100511 |