JP4510696B2 - Image processing apparatus and image processing method - Google Patents

Image processing apparatus and image processing method Download PDF

Info

Publication number
JP4510696B2
JP4510696B2 JP2005144554A JP2005144554A JP4510696B2 JP 4510696 B2 JP4510696 B2 JP 4510696B2 JP 2005144554 A JP2005144554 A JP 2005144554A JP 2005144554 A JP2005144554 A JP 2005144554A JP 4510696 B2 JP4510696 B2 JP 4510696B2
Authority
JP
Japan
Prior art keywords
moving image
variable
recording
encoding
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005144554A
Other languages
Japanese (ja)
Other versions
JP2006324806A5 (en
JP2006324806A (en
Inventor
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005144554A priority Critical patent/JP4510696B2/en
Priority to US11/409,313 priority patent/US8363717B2/en
Priority to EP06113162A priority patent/EP1725039A1/en
Publication of JP2006324806A publication Critical patent/JP2006324806A/en
Publication of JP2006324806A5 publication Critical patent/JP2006324806A5/ja
Application granted granted Critical
Publication of JP4510696B2 publication Critical patent/JP4510696B2/en
Priority to US13/733,216 priority patent/US20130177074A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は画像処理装置及び画像処理方法に関し、特に、画像信号を符号化処理するために用いて好適な技術に関する。 The present invention relates to an image processing apparatus and an image processing method , and more particularly to a technique suitable for use in encoding an image signal.

従来、動画像データを符号化して情報量を圧縮する技術として、MPEG方式が知られている。MPEG方式は、同一フレーム内の画像データのみで符号化を行うフレーム内符号化と、参照フレームとの差分(予測誤差)を符号化するフレーム間予測符号化とを組み合わせた符号化方式である。   Conventionally, the MPEG system is known as a technique for compressing the amount of information by encoding moving image data. The MPEG system is an encoding system that combines intra-frame encoding that encodes only image data in the same frame and inter-frame predictive encoding that encodes a difference (prediction error) from a reference frame.

予測符号化における予測残差や変換符号化における直交変換係数は、発生する信号のレベル分布にかなり偏りがある。そこで、信号レベルの発生頻度に合わせて異なった長さの符号を割り当てると、データ量の平均値は固定長の符号に対して短くできる。可変長の符号はハフマン符号などによって決められ、データの発生頻度に偏りがあるほど全体のデータ量は下げられる。このように、可変長符号を用いると、再生信号の品質を同等に保ちながら、固定長符号化より平均データ量を少なくすることができる。   Prediction residuals in predictive coding and orthogonal transform coefficients in transform coding are considerably biased in the level distribution of generated signals. Therefore, if codes having different lengths are assigned in accordance with the occurrence frequency of the signal level, the average data amount can be shortened with respect to the fixed-length codes. The variable-length code is determined by a Huffman code or the like, and the total data amount is lowered as the data generation frequency is biased. As described above, when the variable-length code is used, the average data amount can be reduced as compared with the fixed-length encoding while maintaining the quality of the reproduction signal equal.

ところが、前述の予測符号化方法をデジタルTVや、デジタルビデオディスクなどの画像蓄積に応用する際には、前記符号量が各ピクチャによって異なるため画像データの転送速度(以下、データレートと称する)の制御をどのようにするかが問題になる。   However, when the above predictive encoding method is applied to image storage such as a digital TV or a digital video disc, the code amount differs depending on each picture, so that the transfer rate of image data (hereinafter referred to as data rate) is increased. How to control is a problem.

データレートの制御方法にはgroup of picture(GOP)と呼ばれる、所定区間内(通常、十数フレーム)の平均ビット数をほぼ一定に制御することで、転送する符号化量を一定にするものがある。   The data rate control method is called group of picture (GOP), which controls the average number of bits in a predetermined section (usually more than a dozen frames) to keep the coding amount to be transferred constant. is there.

すなわち、1フレーム分の画像データを、所定の画素数からなるマクロブロックと呼ばれるブロックに分割して、動き補償予測、直交変換、量子化などをマクロブロック単位で行うことで、前記フレームをマクロブロック単位で符号化しており、このときの量子化で用いられる量子化幅によってGOP内の平均ビット数をほぼ一定に制御して、画像データの符号化後のデータレートを制御している(特許文献1参照)。   That is, image data for one frame is divided into blocks called macroblocks having a predetermined number of pixels, and motion compensation prediction, orthogonal transformation, quantization, and the like are performed in units of macroblocks. The data rate after encoding of image data is controlled by controlling the average number of bits in the GOP to be almost constant by the quantization width used in the quantization at this time (Patent Literature). 1).

また、符号化を行う際、ブロック毎に画像の複雑度(アクティビティ)という要素を利用して、画面内の各ブロックに対して割り当てる符号量を調整することも考えられている。アクティビティとは入力画像の特徴を示す要素であり、限られた符号量内で画像の特徴に応じた高画質な再生画像を得るための工夫が行われている。   In addition, when encoding, it is also considered to adjust the amount of code assigned to each block in the screen using an element called image complexity (activity) for each block. An activity is an element indicating the characteristics of an input image, and is devised to obtain a high-quality reproduced image corresponding to the characteristics of the image within a limited code amount.

特開平7−184195号公報JP-A-7-184195

しかしながら、前記データレート制御方法において前記アクティビティは符号化しようとしているフレームに割り当てられるビット数を考慮せずに求められ、ビット数を考慮して求められる前記参照量子化幅に外乱として与えられるため、アクティビティの値が小さいマクロブロックが多い場合に発生符号量がフレームに割り当てられるビット数をオーバーしてしまう問題があった。   However, in the data rate control method, the activity is obtained without considering the number of bits allocated to the frame to be encoded, and is given as a disturbance to the reference quantization width obtained in consideration of the number of bits. When there are many macroblocks with small activity values, there is a problem that the amount of generated code exceeds the number of bits allocated to a frame.

例えば、動画像データをMPEG方式で符号化してリアルタイムにディスク媒体などに記録する記録装置においては、ある誤差範囲内で記録媒体の記録可能時間を保証する必要があるが、このように発生符号量が変動する場合には、記録可能時間を保証できないという問題があった。   For example, in a recording apparatus that encodes moving image data by the MPEG method and records it on a disk medium or the like in real time, it is necessary to guarantee the recordable time of the recording medium within a certain error range. When the value fluctuates, there is a problem that the recordable time cannot be guaranteed.

本発明は前述の問題点にかんがみ、記録媒体に設定された記録時間を保証した画像符号化を行うことができるようにすることを目的としている。   The present invention has been made in view of the above-described problems, and an object of the present invention is to enable image encoding that guarantees a recording time set on a recording medium.

本発明の画像処理装置は、動画像信号を入力する入力手段と、前記入力手段により入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成する変数生成手段と、前記変数生成手段により生成された第1の変数に基づいて量子化幅を設定する量子化幅設定手段と、前記入力手段により入力された動画像信号を直交変換し、直交変換係数を生成する直交変換手段と、前記直交変換手段により生成された直交変換係数を、前記量子化幅設定手段により設定された量子化幅で量子化し、量子化係数を生成する量子化手段と、前記量子化手段により生成された量子化係数を可変長符号化する可変長符号化手段と、前記可変長符号化手段から出力された符号化動画像データを前記記録媒体に記録する記録手段とを有し、前記変数生成手段は、前記記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、前記第1の変数の値を所定値に固定することを特徴とする。
また、本発明の画像処理装置の他の特徴とするところは、動画像信号を入力する入力手段と、前記動画像信号を符号化して符号化動画像データを生成する符号化手段と、前記符号化手段により生成された符号化動画像データに係る動画像の複雑度を検出する複雑度検出手段と、前記符号化手段により符号化された符号化動画像データを記録する記録媒体の記録残容量を検出する残量検出手段と、前記複雑度検出手段により検出された複雑度の情報に基づいて前記符号化手段を制御する第1のモードと、前記複雑度検出手段により検出された複雑度の情報を用いずに前記符号化手段を制御する第2のモードとを有し、前記第1のモードまたは第2のモードで前記符号化手段を制御して、前記符号化手段から出力される符号化動画像データの符号量を調整する制御手段と、前記制御手段により符号量を調整された符号化動画像データを前記記録媒体に記録する記録手段とを有し、前記制御手段は、前記残量検出手段の出力に基づいて前記第1のモードと第2のモードとを切り替えることを特徴とする。
The image processing apparatus according to the present invention includes an input unit that inputs a moving image signal, an image complexity related to the moving image signal input by the input unit, and a remaining recording capacity of a recording medium that records the moving image signal. Variable generating means for generating a first variable based on the above, a quantization width setting means for setting a quantization width based on the first variable generated by the variable generating means, and a moving image input by the input means An orthogonal transform unit that orthogonally transforms an image signal to generate an orthogonal transform coefficient, and an orthogonal transform coefficient generated by the orthogonal transform unit are quantized with a quantization width set by the quantization width setting unit, and quantized Quantization means for generating coefficients, variable length encoding means for variable length encoding the quantized coefficients generated by the quantization means, and encoded moving image data output from the variable length encoding means Record Have a recording means for recording the body, said variable generating means, when the remaining recording capacity of the recording medium is smaller than a predetermined threshold value, fixing the value of the first variable to a predetermined value It is characterized by.
Another feature of the image processing apparatus according to the present invention is that an input unit that inputs a moving image signal, an encoding unit that encodes the moving image signal to generate encoded moving image data, and the code Complexity detecting means for detecting the complexity of the moving image related to the encoded moving image data generated by the encoding means, and the remaining recording capacity of the recording medium for recording the encoded moving image data encoded by the encoding means A first mode for controlling the encoding means based on complexity information detected by the complexity detection means, and a level of complexity detected by the complexity detection means. A second mode for controlling the encoding means without using information, and controlling the encoding means in the first mode or the second mode to output a code output from the encoding means Sign of video data And control means for recording the encoded moving image data whose code amount is adjusted by the control means on the recording medium, the control means based on the output of the remaining amount detection means Switching between the first mode and the second mode.

本発明の画像処理方法は、動画像信号を入力する入力工程と、前記入力工程において入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成する変数生成工程と、前記変数生成工程において生成された第1の変数に基づいて量子化幅を設定する量子化幅設定工程と、前記入力工程において入力された動画像信号を直交変換し、直交変換係数を生成する直交変換工程と、前記直交変換工程において生成された直交変換係数を、前記量子化幅設定工程において設定された量子化幅で量子化し、量子化係数を生成する量子化工程と、前記量子化工程において生成された量子化係数を可変長符号化する可変長符号化工程と、前記可変長符号化工程から出力された符号化動画像データを前記記録媒体に記録する記録工程とを有し、前記変数生成工程は、前記記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、前記第1の変数の値を所定値に固定することを特徴とする。
また、本発明の画像処理方法の他の特徴とするところは、動画像信号を入力する入力工程と、前記動画像信号を符号化して符号化動画像データを生成する符号化工程と、前記符号化工程において生成された符号化動画像データに係る動画像の複雑度を検出する複雑度検出工程と、前記符号化工程において符号化された符号化動画像データを記録する記録媒体の記録残容量を検出する残量検出工程と、前記複雑度検出工程において検出された複雑度の情報に基づいて前記符号化工程の符号化動作を制御する第1のモードと、前記複雑度検出工程において検出された複雑度の情報を用いずに前記符号化工程の符号化動作を制御する第2のモードとを有し、前記第1のモードまたは第2のモードで前記符号化工程を制御して、前記符号化工程において出力される符号化動画像データの符号量を調整する制御工程と、前記制御工程において符号量を調整された符号化動画像データを前記記録媒体に記録する記録工程とを有し、前記制御工程においては、前記残量検出工程の出力に基づいて前記第1のモードと第2のモードとを切り替えることを特徴とする。
The image processing method of the present invention includes an input step for inputting a moving image signal, an image complexity related to the moving image signal input in the input step, and a recording remaining capacity of a recording medium for recording the moving image signal. A variable generation step for generating a first variable based on the first step, a quantization width setting step for setting a quantization width based on the first variable generated in the variable generation step, and a moving image input in the input step An orthogonal transformation step of orthogonally transforming an image signal to generate an orthogonal transformation coefficient, and an orthogonal transformation coefficient generated in the orthogonal transformation step are quantized with a quantization width set in the quantization width setting step, and quantized A quantization step for generating coefficients, a variable-length encoding step for variable-length encoding the quantization coefficient generated in the quantization step, and encoded video data output from the variable-length encoding step The have a recording step of recording on the recording medium, the variable generation step, when the remaining recording capacity of the recording medium is smaller than a predetermined threshold value, the value of the first variable to a predetermined value It is fixed .
According to another aspect of the image processing method of the present invention, an input step of inputting a moving image signal, an encoding step of encoding the moving image signal to generate encoded moving image data, and the code A complexity detecting step for detecting the complexity of the moving image related to the encoded moving image data generated in the encoding step, and a recording remaining capacity of the recording medium for recording the encoded moving image data encoded in the encoding step A first mode for controlling the encoding operation of the encoding step based on the complexity information detected in the complexity detection step, and a detection in the complexity detection step. A second mode for controlling the encoding operation of the encoding step without using complexity information, and controlling the encoding step in the first mode or the second mode, In the encoding process A control step of adjusting the code amount of the encoded moving image data to be output; and a recording step of recording the encoded moving image data adjusted in the code amount in the control step on the recording medium, the control step Is characterized in that the first mode and the second mode are switched based on the output of the remaining amount detection step.

本発明によれば、記録媒体の残量を監視しておき、記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、量子化幅を設定する第1の変数の値を所定値に固定するようにしたので、記録媒体の容量が残り少なくなった時に、参照量子化幅に外乱として与えられるアクティビティの影響を適応的に軽減したり、あるいは無効化したりすることができる。これにより、アクティビティの値が小さいマクロブロックが多い場合に、フレームに割り当てられるビット数をオーバーしてしまい、記録媒体で求められている記録時間を保証できなくなる問題を解決することができる。 According to the present invention, the remaining amount of the recording medium is monitored, and when the remaining recording capacity of the recording medium becomes smaller than a predetermined threshold, the value of the first variable for setting the quantization width is set to a predetermined value. since so as to fix the, when the capacity of the recording medium is running low, the effects of the activity, given as a disturbance in the reference quantization step size can be or adaptively reduce or, or disabled. As a result, when there are many macroblocks with small activity values, the number of bits allocated to the frame is exceeded, and the problem that the recording time required for the recording medium cannot be guaranteed can be solved.

(第1の実施の形態)
以下に、図1を参照しながら、本発明にかかる画像符号化装置の好適な一実施の形態について詳細に説明する。
図1は、本発明に係る画像符号化装置のブロック図である。図1に示すように、本発明に係る画像符号化装置はブロック分割部1、動き補償部2、直交変換部3、量子化部4、可変長符号化部5、記録部5a、ビット割り当て部6、参照量子化幅決定部7、アクティビティ計算部8、乗算部9、平均値計算部10、アクティビティ制御部11を備えている。
(First embodiment)
Hereinafter, a preferred embodiment of an image encoding apparatus according to the present invention will be described in detail with reference to FIG.
FIG. 1 is a block diagram of an image encoding apparatus according to the present invention. As shown in FIG. 1, the image coding apparatus according to the present invention includes a block division unit 1, a motion compensation unit 2, an orthogonal transformation unit 3, a quantization unit 4, a variable length coding unit 5, a recording unit 5a, and a bit allocation unit. 6, a reference quantization width determination unit 7, an activity calculation unit 8, a multiplication unit 9, an average value calculation unit 10, and an activity control unit 11.

前記ブロック分割部1は、入力された原画像データを所定の画素数(16×16画素)からなるマクロブロックに分割し、このマクロブロックの画像データ(以下、MBデータと称する)を前記動き補償部2に出力するとともに、前記アクティビティ計算部8に出力する。   The block dividing unit 1 divides the input original image data into macroblocks having a predetermined number of pixels (16 × 16 pixels), and the image data of the macroblock (hereinafter referred to as MB data) is the motion compensation. Output to the unit 2 and output to the activity calculation unit 8.

前記動き補償部2には、図示しない逆量子化部、逆直交変換部、動き補償部などが備えられており、ブロック分割部1から入力された今回のMBデータと参照画像データとの予測誤差を直交変換部3に出力する。すなわち、前記動き補償部2では、前記量子化部4により得られた前回の量子化されたMBデータを、逆量子化部にて逆量子化し、逆直交変換部にて逆直交変換して、前回のMBデータの復元値(復元画像データ)を求める。この復元画像データは、動き補償部2にてフレーム間予測の参照画像データとして用いられる。   The motion compensation unit 2 includes a dequantization unit, an inverse orthogonal transform unit, a motion compensation unit, and the like (not shown), and a prediction error between the current MB data input from the block division unit 1 and the reference image data. Is output to the orthogonal transform unit 3. That is, in the motion compensation unit 2, the previous quantized MB data obtained by the quantization unit 4 is inversely quantized by an inverse quantization unit, and inverse orthogonal transform is performed by an inverse orthogonal transform unit, The restoration value (restored image data) of the previous MB data is obtained. This restored image data is used as reference image data for inter-frame prediction in the motion compensation unit 2.

次に、前記直交変換部3は、予測誤差データをDCT(discrete cosine transform:離散コサイン変換)などの2次元直交変換によって、符号化に適したデータ(以下、変換係数と称する)に変換する。そして、この変換係数を量子化部4に出力する。   Next, the orthogonal transform unit 3 transforms the prediction error data into data suitable for encoding (hereinafter referred to as transform coefficients) by two-dimensional orthogonal transform such as DCT (discrete cosine transform). Then, the transform coefficient is output to the quantization unit 4.

量子化部4では、入力された変換係数を後述する乗算部9より得られる量子化幅によって量子化する。この量子化幅によって、変換係数の取り得る値の数(以後、レベル数と呼ぶ)が制御される。つまり、量子化幅が大きいと、レベル数が減り、これによって、0の個数が増加し、0以外の有意係数が減る。そのため、可変長符号化部5におけるハフマン符号化後の符号化データ量も減る。また、量子化幅が小さいと、0の個数が減って有意係数が増加するので、可変長符号化部5におけるハフマン符号化後の符号化データ量も増える。   The quantization unit 4 quantizes the input transform coefficient with a quantization width obtained from a multiplication unit 9 described later. The number of values that the transform coefficient can take (hereinafter referred to as the number of levels) is controlled by this quantization width. That is, if the quantization width is large, the number of levels decreases, thereby increasing the number of zeros and reducing the significant coefficient other than zero. Therefore, the amount of encoded data after Huffman encoding in the variable length encoding unit 5 is also reduced. Also, if the quantization width is small, the number of 0s decreases and the significant coefficient increases, so that the amount of encoded data after Huffman encoding in the variable length encoding unit 5 also increases.

すなわち、この量子化幅を制御することで、符号化データ量を制御することができるので、可変長符号化部5による符号化後のデータ転送速度(以下、データレートと称する)を制御することができる。そして、前記量子化部4にて量子化された変換係数は、可変長符号化部5に出力されるとともに、前記動き補償部2に出力される。   That is, since the amount of encoded data can be controlled by controlling the quantization width, the data transfer rate after encoding by the variable length encoding unit 5 (hereinafter referred to as the data rate) is controlled. Can do. Then, the transform coefficient quantized by the quantization unit 4 is output to the variable length encoding unit 5 and also to the motion compensation unit 2.

前記可変長符号化部5では、量子化部4において量子化された変換係数を、可変長符号化(ハフマン符号化)する。この符号化された変換係数(以下、符号化データと称する)を、図示しないバッファメモリに出力し、このバッファメモリから記録部5aが一定のデータレートで読み出し、記録媒体12に記録する。また、この符号化データは、変長符号化部5から後述するビット割り当て部6に可転送される。 The variable length coding unit 5 performs variable length coding (Huffman coding) on the transform coefficient quantized by the quantization unit 4. The encoded transform coefficient (hereinafter referred to as encoded data) is output to a buffer memory (not shown), and the recording unit 5a reads out from the buffer memory at a constant data rate and records it on the recording medium 12. Further, the coded data is variable transferred to the bit allocation unit 6 to be described later from the variable-length coding unit 5.

アクティビティ制御部11は、記録媒体12の記録容量(記録可能な領域の残量)w、及び現在までの記録時間tを検出する。アクティビティ制御部11は、この記録容量wと予め設定してある複数の閾値を用いてアクティビティ計算部8が計算するアクティビティを段階的に制御する。本実施の形態では、閾値としてTh1,Th2(但し、Th1>Th2)の2つの閾値を持っている場合を例に挙げて説明する。   The activity control unit 11 detects the recording capacity (remaining area of the recordable area) w of the recording medium 12 and the recording time t up to now. The activity control unit 11 controls the activity calculated by the activity calculation unit 8 step by step using the recording capacity w and a plurality of preset threshold values. In the present embodiment, a case where there are two threshold values, Th1 and Th2 (where Th1> Th2), will be described as an example.

ここで、各閾値Th1,Th2(但し、Th1>Th2)は予め設定された所定の基準値WTH1,WTH2(但し、WTH1,WTH2)と記録時間tとを用いて、
TH1=WTH1×t、TH2=WTH2×tと表される。
記録容量wと閾値Th1,Th2(但し、Th1>Th2)には以下の関係が成り立つ時、
Here, each of the threshold values Th1, Th2 (where Th1> Th2) is determined using a predetermined reference value W TH1 , W TH2 (where W TH1 , W TH2 ) and a recording time t,
TH1 = W TH1 × t and TH2 = W TH2 × t.
When the following relationship holds between the recording capacity w and the threshold values Th1 and Th2 (where Th1> Th2):

Figure 0004510696
Figure 0004510696

(i)の場合は、記録媒体の記録容量が残り僅かであると判断し、第2のアクティビティ
制御フラグflg2をONにし、アクティビティ計算部8に出力する。なお、この条件を満たしていない時にはflg2はOFFにしておく。
In the case of (i), it is determined that the recording capacity of the recording medium is small, and the second activity control flag flg2 is turned on and output to the activity calculation unit 8. When this condition is not satisfied, flg2 is turned off.

(ii)の場合には、記録媒体の記録容量が残り少なくなってきたと判断し、第1のアクテ
ィビティ制御フラグflg1をONにし、アクティビティ計算部8に出力する。なお、この条件を満たしていない時にはflg1はOFFにしておく。
In the case of (ii), it is determined that the recording capacity of the recording medium has been reduced, and the first activity control flag flg1 is turned on and output to the activity calculation unit 8. When this condition is not satisfied, flg1 is turned off.

(iii)の場合には、記録媒体の記録容量に充分な余裕があるものと判断し、アクティビティ計算部8に対して特に何も出力しないものとする。本実施の形態では閾値の数を2個に設定していたが、閾値の数を更に増やすことにより、記録媒体の記憶残量の判断を更に段階的に変化させることもできる。 In the case of (iii), it is determined that the recording capacity of the recording medium has a sufficient margin, and nothing is output to the activity calculation unit 8 in particular. In this embodiment, the number of thresholds is set to two. However, by further increasing the number of thresholds, the determination of the remaining storage capacity of the recording medium can be further changed stepwise.

アクティビティ計算部8は、マクロブロック単位にアクティビティを求めるようになっており、j番目のマクロブロックのアクティビティactjは次式(数2)によって求められる。 The activity calculation unit 8 obtains an activity for each macroblock, and the activity act j of the jth macroblock is obtained by the following equation (Equation 2).

Figure 0004510696
Figure 0004510696

ここで、vari,jは、j番目のマクロブロックを4つのブロックに分割した時に、i番目のサブブロックの画素値の分散値である。つまり、マクロブロックが16画素×16画素からなれば、そのサブブロックは8画素×8画素となり、その画素数は64個となり、この64個の画素に対して前記の分散値が求められる。 Here, var i , j is a dispersion value of the pixel value of the i-th sub-block when the j-th macro block is divided into four blocks. That is, if the macroblock is composed of 16 pixels × 16 pixels, the sub-block is 8 pixels × 8 pixels, the number of pixels is 64, and the variance value is obtained for these 64 pixels.

なお、前記アクティビティ計算部8において行われるアクティビティの計算は、画素値の分散値の代わりに画素値のダイナミックレンジを用いてもよい。このようにして求めたアクティビティは平均値計算部10により得られる量子化幅の平均値で次式(数3)のように正規化されたアクティビティNactjに変換される。 The activity calculation performed in the activity calculation unit 8 may use a dynamic range of pixel values instead of a variance value of pixel values. The activity obtained in this way is converted into an activity Nact j normalized by the average value of the quantization width obtained by the average value calculation unit 10 as in the following equation (Equation 3).

Figure 0004510696
Figure 0004510696

ここで、avgは平均値計算部10により得られた量子化幅の平均値であり、mは任意の自然数である。但し、平均値avgは、符号化の初期では定められた初期値が設定されている。正規化されたアクティビティNactjは後述の参照量子化幅決定部7から出力される参照量子化幅と共に乗算部9に出力される。 Here, avg is an average value of the quantization width obtained by the average value calculation unit 10, and m is an arbitrary natural number. However, as the average value avg, a predetermined initial value is set at the initial stage of encoding. The normalized activity Nact j is output to the multiplication unit 9 together with a reference quantization width output from a reference quantization width determination unit 7 described later.

なお、前記アクティビティは、マクロブロックの画素値の分散によって計算される。例えば、マクロブロックに平坦部が含まれる場合には、そのマクロブロックのアクティビティは小さくなり、平坦部中にエッジを含む場合には、アクティビティは大きくなる。また、アクティビティを乗算部9に出力する際には平均値計算部10より出力される前フレームの量子化幅の平均値に基づいて、正規化され出力される。そして乗算部9にて、前記参照量子化幅決定部7により得られた参照量子化幅を正規化されたアクティビティにより補正して量子化幅を決定する。   The activity is calculated by the variance of the pixel values of the macroblock. For example, when a flat portion is included in a macroblock, the activity of the macroblock is reduced, and when an edge is included in the flat portion, the activity is increased. Further, when the activity is output to the multiplication unit 9, the activity is normalized and output based on the average value of the quantization width of the previous frame output from the average value calculation unit 10. Then, the multiplication unit 9 corrects the reference quantization width obtained by the reference quantization width determination unit 7 with the normalized activity to determine the quantization width.

ただし、前記アクティビティ制御部11からの出力である前記アクティビティ制御フラグのいずれかがONになっている場合にはどちらのフラグが立っているかにより、アクティビティの計算結果を変化させる。   However, when any of the activity control flags output from the activity control unit 11 is ON, the activity calculation result is changed depending on which flag is set.

本実施の形態では、前記第1のアクティビティ制御フラグflg1、第2のアクティビティ制御フラグflg2を用いて前記アクティビティ制御部11の閾値が2つである場合について説明する。第1のアクティビティ制御フラグflg1あるいは第2のアクティビティ制御フラグflg2がONである時のNactjは次式(数4)でNact´jに変更され、乗算部9に出力される。 In the present embodiment, a case will be described in which the activity control unit 11 has two thresholds using the first activity control flag flg1 and the second activity control flag flg2. Nact j when the first activity control flag flg1 or second activity control flag flg2 is ON is changed to Nact' j by the following equation (Equation 4), is output to the multiplier 9.

Figure 0004510696
Figure 0004510696

ここで、decは0.1≦dec≦1.0の定数である。
まず、第2のアクティビティ制御フラグflg2がONである場合には記録媒体の記録容量が残り僅かであると判断し、アクティビティによるデータレート制御への外乱を無くすためNactjが1.0より小さいときには、1.0に設定してから乗算部9に出力する。ただし、Nactjが1.0以上である時は、そのまま出力する。あるいは、Nactjの計算を行わず、常時1.0を出力するようにしてもよい。
Here, dec is a constant satisfying 0.1 ≦ dec ≦ 1.0.
First, when the second activity control flag flg2 is ON, it is determined that the recording capacity of the recording medium is small, and when Nact j is smaller than 1.0 in order to eliminate disturbance to the data rate control due to the activity, 1.0 Is output to the multiplication unit 9. However, when Nact j is 1.0 or more, it is output as it is. Alternatively, 1.0 may always be output without calculating Nact j .

一方、第1のアクティビティ制御フラグflg1がONである場合には記録媒体12の記録容量が残り少なくなってきたと判断し、アクティビティによるデータレート制御への外乱の影響を小さくするため、正規化されたアクティビティNactjが1.0より小さい場合には補正値decを加えたNact´jを乗算部9に出力する。 On the other hand, when the first activity control flag flg1 is ON, it is determined that the recording capacity of the recording medium 12 has decreased, and the normalized activity is reduced in order to reduce the influence of disturbance on the data rate control due to the activity. Nact j is the case less than 1.0 outputs a Nact' j plus the correction value dec to the multiplier 9.

本実施の形態では、閾値の数を2個に設定していたが、閾値の数を更に増やして、記録媒体の記憶残量の判断を更に段階的に変化させることもできる。その際には記録媒体の残量に応じて段階的にdecを変えていけばよい。   In the present embodiment, the number of thresholds is set to two. However, it is possible to further increase the number of thresholds and change the remaining storage capacity of the recording medium in a stepwise manner. In that case, it is sufficient to change dec step by step according to the remaining amount of the recording medium.

前記乗算部9では、参照量子化幅を正規化されたアクティビティNactjを掛け合わせることで補正して、量子化幅を決定するようになっている。そして、この量子化幅は量子化部4に出力されるとともに、平均値計算部10に出力される。 The multiplication unit 9 corrects the reference quantization width by multiplying it by the normalized activity Nact j to determine the quantization width. The quantization width is output to the quantization unit 4 and is also output to the average value calculation unit 10.

平均値計算部10は、1フレーム分の量子化幅の平均値を計算し、この量子化幅を前記ビット割り当て部6に出力するとともに、前記アクティビティ計算部8に出力するようになっている。   The average value calculation unit 10 calculates the average value of the quantization width for one frame, and outputs this quantization width to the bit allocation unit 6 and also to the activity calculation unit 8.

また、ビット割り当て部6は、可変長符号化部5による前フレームまでの発生ビット数等の符号化データと、可変長符号化部5に与えられたデータレートをもとに、これから符号化しようとしているフレームに割り当てるビット数を決定する。   In addition, the bit allocation unit 6 will perform encoding based on the encoded data such as the number of generated bits up to the previous frame by the variable length encoding unit 5 and the data rate given to the variable length encoding unit 5. The number of bits to be assigned to the frame being determined is determined.

前記参照量子化幅決定部7は、前マクロブロックまでの発生ビット数と、割り当てられたビット数とをもとにマクロブロック毎に参照量子化幅qI j、qP j、qB jを決定する。ここで、jはマクロブロックの番号を表し、I、P、Bはピクチャのタイプを表す。例えば、Iピクチャのj番目のブロックにおけるバッファフルネスdI jを次式(数5)によって求める。 The reference quantization width determination unit 7 sets the reference quantization widths q I j , q P j , and q B j for each macro block based on the number of generated bits up to the previous macro block and the allocated number of bits. decide. Here, j represents a macroblock number, and I, P, and B represent picture types. For example, the buffer fullness d I j in the jth block of the I picture is obtained by the following equation (Equation 5).

Figure 0004510696
Figure 0004510696

上式3により得られたdI jにもとづいて、参照量子化幅qI jを次式(数6)によって求める。 Based on d I j obtained by the above equation 3, the reference quantization width q I j is obtained by the following equation (Equation 6).

Figure 0004510696
Figure 0004510696

ここで、dI 0は初期のバッファフルネスであり、前回のIピクチャを符号化したときの最後のバッファフルネスdI MBcntである。但し、初期値は任意の定数である。また、Bjはj番目のブロックまでに画像内で発生した全ビット数、MBcntは画像中のマクロブロックの総数、rは反応パラメータである。上式5は各マクロブロックにTiビットが均等に割り当てられた時、前マクロブロックまでの発生までの割り当てビット数と実際の発生ビット数との差を、仮想バッファフルネスに反映させている。 Here, d I 0 is the initial buffer fullness, and is the last buffer fullness d I MBcnt when the previous I picture was encoded. However, the initial value is an arbitrary constant. B j is the total number of bits generated in the image up to the j-th block, MB cnt is the total number of macroblocks in the image, and r is a reaction parameter. When the above equation 5 allocated equally is T i bits in each macroblock, a difference between the actual number of generated bits and the allocation bit number to generate up to the previous macroblock, are reflected in the virtual buffer fullness .

したがって、上式5および上式6によれば、前マクロブロックの発生ビット数が大きいと仮想バッファフルネスが大きくなり、これによって参照量子化幅が大きくなる。この結果、参照量子化幅決定部7は、以降のフレームの発生ビット数を小さくするように働く。   Therefore, according to the above formulas 5 and 6, if the number of bits generated in the previous macroblock is large, the virtual buffer fullness is increased, thereby increasing the reference quantization width. As a result, the reference quantization width determination unit 7 works to reduce the number of bits generated in subsequent frames.

一方、前マクロブロックの発生ビット数が小さいと仮想バッファフルネスが小さくなり、これによって参照量子化幅が小さくなる。この結果、参照量子化幅決定部7は、以降のフレームの発生ビット数を大きくするように働く。なお、Pピクチャ、Bピクチャにおいても同様の方法を用いて参照量子化幅を決定する。   On the other hand, when the number of bits generated in the previous macroblock is small, the virtual buffer fullness is reduced, and thereby the reference quantization width is reduced. As a result, the reference quantization width determination unit 7 works to increase the number of generated bits in subsequent frames. Note that the reference quantization width is determined using the same method for the P picture and the B picture.

次に、前述のように構成した本実施の形態の画像処理装置の概略動作を、図3のフローチャートを参照しながら説明する。
図3に示したように、処理が開始されると、最初のステップS41において、動画像信号が入力されたか否かを判定する。この判定の結果、動画像信号が入力されるとステップS42に進み、入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成する。
Next, the schematic operation of the image processing apparatus of the present embodiment configured as described above will be described with reference to the flowchart of FIG.
As shown in FIG. 3, when the process is started, it is determined in the first step S41 whether or not a moving image signal has been input. If a moving image signal is input as a result of this determination, the process proceeds to step S42, and the first based on the complexity of the image related to the input moving image signal and the remaining recording capacity of the recording medium on which the moving image signal is recorded. Generate variables for.

次に、ステップS43に進み、ステップS42において生成された第1の変数に基づいて量子化幅を設定する。次に、ステップS44に進み、前記入力された動画像信号を直交変換し、マクロブロックの画像データを変換した直交変換係数を生成する。   Next, it progresses to step S43 and sets a quantization width | variety based on the 1st variable produced | generated in step S42. In step S44, the input moving image signal is orthogonally transformed to generate an orthogonal transformation coefficient obtained by transforming the macroblock image data.

次に、ステップS45に進み、ステップS44において生成された直交変換係数を、前記ステップS43において設定された量子化幅で量子化し、量子化係数を生成する。次に、ステップS46に進み、ステップS45において生成された量子化係数を可変長符号化する。   In step S45, the orthogonal transform coefficient generated in step S44 is quantized with the quantization width set in step S43 to generate a quantized coefficient. Next, the process proceeds to step S46, and the quantization coefficient generated in step S45 is variable-length encoded.

次に、ステップS47に進み、ステップS46で可変長符号化された符号化動画像データを記録媒体12に記録する。その後、ステップS48において、全ての画像処理が終了したか否かを判定し、処理が残っている場合にはステップS42に戻って前述した処理を繰り返し行う。そして、ステップS48の判定の結果、処理が残っていなかったら終了する。   Next, the process proceeds to step S47, and the encoded moving image data subjected to variable length encoding in step S46 is recorded on the recording medium 12. Thereafter, in step S48, it is determined whether or not all image processing has been completed. If processing remains, the process returns to step S42 to repeat the above-described processing. If the result of determination in step S48 is that there is no process left, the process ends.

以上のように、本実施の形態の画像符号化装置によれば、入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成し、生成した第1の変数に基づいて量子化幅を設定するようにしたので、記録媒体12の容量が残り少なくなった時に、データレート制御に外乱として与えられるアクティビティの影響を無効化、あるいは発生符号量をより減少させる方向に影響させることができる。これにより、データレート制御を確実に行うことが可能となり、記録媒体で求められている記録時間を保証することができる。   As described above, according to the image encoding device of the present embodiment, the first encoding is based on the complexity of the image related to the input moving image signal and the remaining recording capacity of the recording medium that records the moving image signal. Since the quantization width is set based on the generated first variable, the influence of the activity given as a disturbance to the data rate control is invalidated when the capacity of the recording medium 12 is reduced. Or the direction of further reducing the amount of generated code. As a result, the data rate control can be performed reliably, and the recording time required for the recording medium can be guaranteed.

(第2の実施の形態)
次に、図2を参照しながら、本発明に係る画像符号化装置のもう一つの実施の形態について詳細に説明する。ただし、第2の実施の形態に係る画像符号化装置は第1の実施の形態とほぼ同じ構造を有するが、入力部53を持つ点及びアクティビティ制御部51のアクティビティ制御方法が異なる。
(Second Embodiment)
Next, another embodiment of the image coding apparatus according to the present invention will be described in detail with reference to FIG. However, the image coding apparatus according to the second embodiment has substantially the same structure as that of the first embodiment, but has an input unit 53 and an activity control method of the activity control unit 51.

まず、ブロック分割部41、動き補償部42、直交変換部43、量子化部44、可変長符号化部45、記録部45a、については同様の動作を行うため、説明を省く。アクティビティ制御部51は記録媒体52の記録容量(記録可能な領域の残量)w及び現在までの記録時間tを検出する。また、アクティビティ制御部51は、入力部53からユーザの設定する動画画質に相当する記録モードmodeを同時に検出する。アクティビティ制御部51はこの記録モードmodeと前記記録容量wに応じて複数の閾値を設定し段階的にアクティビティの制御を行う。   First, the block division unit 41, the motion compensation unit 42, the orthogonal transformation unit 43, the quantization unit 44, the variable length coding unit 45, and the recording unit 45a perform the same operations, and thus the description thereof is omitted. The activity control unit 51 detects the recording capacity (remaining area of the recordable area) w of the recording medium 52 and the recording time t up to now. Further, the activity control unit 51 simultaneously detects a recording mode mode corresponding to the moving image quality set by the user from the input unit 53. The activity control unit 51 sets a plurality of thresholds according to the recording mode mode and the recording capacity w, and controls the activity step by step.

本実施の形態では記録モードmodeとして、
高画質モード mode=high
標準記録モード mode=mid
低画質モード mode=low
のような3種のモードを持つ場合について説明する。
In this embodiment, as the recording mode mode,
High image quality mode = high
Standard recording mode mode = mid
Low quality mode mode = low
A case where there are three types of modes will be described.

まず、各モードにおける予め設定された所定の基準値whigh,wmid,wlowをwhigh>wmid >wlowとなるように設定し、閾値をThhigh=whigh×t、THmid= wmid×t、Thlow=wlow×tとする。これは記録モードmodeが画質、即ち平均ビットレートを表しているからである。例えばmode=highの時はmode=mid、mode=lowに比べ、平均ビットレートが大きくなり、より早く記録媒体の容量が少なくなってしまうため、閾値の値を他のモードに比べ大きく設定してある。 First, predetermined reference values w high , w mid , w low set in each mode are set so that w high > w mid > w low, and thresholds are set to Th high = w high × t, TH mid = Let w mid × t and Th low = w low × t. This is because the recording mode mode represents the image quality, that is, the average bit rate. For example, when mode = high, the average bit rate increases compared to mode = mid and mode = low, and the capacity of the recording medium decreases sooner. Therefore, the threshold value is set to be larger than in other modes. is there.

このように、記録モードmodeに応じて基準となる閾値を設定した上で前記第1の実施の形態の数1のような場合わけを行う。第1の実施の形態のように閾値を各モードが2つ持っているものとすると本実施の形態において、前記数1に相当する式は次式のように求められる。   In this way, after setting a reference threshold value in accordance with the recording mode mode, the case of Equation 1 in the first embodiment is performed. Assuming that each mode has two threshold values as in the first embodiment, in the present embodiment, the equation corresponding to the above equation 1 is obtained as the following equation.

Figure 0004510696
Figure 0004510696

3種の記録モードmodeがあるため、flglow1、flglow2、flgmid1、flgmid2、flghigh1、flghigh2の6つのフラグがあるものの、各フラグを求める方法については各モード別に第1の実施の形態と同様の方法を行えばよいため省く。また、以降のアクティビティ計算部48、平均値計算部50、乗算部49、ビット割り当て部46、参照量子化幅決定部47については同様の動作を行うため、詳細な説明を省略する。 Since there are three recording mode modes, there are six flags: flg low 1, flg low 2, flg mid 1, flg mid 2, flg high 1, flg high 2. A method similar to that of the first embodiment may be performed separately and is omitted. The subsequent activity calculation unit 48, average value calculation unit 50, multiplication unit 49, bit allocation unit 46, and reference quantization width determination unit 47 perform the same operations, and thus detailed description thereof is omitted.

本実施の形態では記録モードmodeとして3つのモードを設定していたが、モードの数を増やして画質に応じたアクティビティ制御を更に段階的に行ってもよい。また、逆にモードの数を減らして画質に応じたアクティビティ制御の段階数を減らしてもよい。   In the present embodiment, three modes are set as the recording mode mode. However, the number of modes may be increased, and activity control corresponding to the image quality may be performed stepwise. Conversely, the number of modes may be reduced to reduce the number of stages of activity control corresponding to the image quality.

以下に、第2の実施の形態の画像処理装置の概略動作、図4のフローチャートを参照しながらを説明する。
図4に示したように、処理が開始されると、ステップS51において、動画像信号が入力されたか否かを判定する。この判定の結果、動画像信号が入力されたらステップS52に進み、ステップS51において入力された動画像信号を符号化して符号化動画像データを生成する。次に、ステップS53に進み、ステップS52において生成された符号化動画像データに係る動画像の複雑度を検出する。
The schematic operation of the image processing apparatus according to the second embodiment will be described below with reference to the flowchart of FIG.
As shown in FIG. 4, when the process is started, it is determined in step S51 whether or not a moving image signal has been input. If a moving image signal is input as a result of this determination, the process proceeds to step S52, and the moving image signal input in step S51 is encoded to generate encoded moving image data. Next, proceeding to step S53, the complexity of the moving image related to the encoded moving image data generated at step S52 is detected.

次に、ステップS54に進み、ステップS52において符号化された符号化動画像データを記録する記録媒体52の記録残容量を検出する。また、ステップS54において、入力部53から入力されるユーザが設定した動画画質に相当する記録モードmodeを同時に検出する。   Next, proceeding to step S54, the remaining recording capacity of the recording medium 52 on which the encoded moving image data encoded at step S52 is recorded is detected. In step S54, a recording mode mode corresponding to the moving image quality set by the user input from the input unit 53 is simultaneously detected.

次に、ステップS55に進み、ステップS54において検出された記録残量が所定の残量よりも大きいか否かを判定する。この判定の結果、記録残量が所定の残量よりも大きい場合にはステップS56に進み、小さい場合にはステップS57に進む。   Next, the process proceeds to step S55, and it is determined whether or not the remaining recording capacity detected in step S54 is greater than a predetermined remaining capacity. As a result of the determination, if the remaining recording amount is larger than the predetermined remaining amount, the process proceeds to step S56, and if smaller, the process proceeds to step S57.

ステップS56においては、第1のモードで符号化を実行する。本実施の形態における第1のモードは、ステップS53で算出した複雑度の情報、及びユーザにより設定された記録モードmode、記録媒体52の記録容量wに応じてアクティビティの制御を行い、符号化動作を制御する。   In step S56, encoding is executed in the first mode. In the first mode of the present embodiment, the activity is controlled according to the complexity information calculated in step S53, the recording mode mode set by the user, and the recording capacity w of the recording medium 52, and an encoding operation is performed. To control.

一方、ステップS57においては、第2のモードで符号化を実行する。本実施の形態における第2のモードは、ステップS53で算出した複雑度の情報を用いることなく前記符号化工程における符号化動作を制御する。   On the other hand, in step S57, encoding is performed in the second mode. In the second mode of the present embodiment, the encoding operation in the encoding step is controlled without using the complexity information calculated in step S53.

次に、ステップS58に進み、ステップS56またはステップS57において符号化された動画像データを記録媒体52に記録する処理を行う。その後、ステップS59において、全ての画像処理が終了したか否かを判定し、処理が残っている場合にはステップS52に戻って前述した処理を繰り返し行う。そして、ステップS59の判定の結果、処理が残っていなかったら終了する。   Next, the process proceeds to step S58, and a process of recording the moving image data encoded in step S56 or step S57 on the recording medium 52 is performed. Thereafter, in step S59, it is determined whether or not all image processing has been completed. If processing remains, the processing returns to step S52 and the above-described processing is repeated. If the result of determination in step S59 is that no processing remains, the processing ends.

本実施の形態によれば、記録媒体52の記録残量に応じて動作モードを切り替えるようにしたので、ユーザが設定した記録モードmodeで記録し、記録媒体52の記録容量が少なくなった段階で記録方法を切り替えるようにすることができ、画質に応じたアクティビティ制御を行うことができる。   According to the present embodiment, since the operation mode is switched according to the remaining recording capacity of the recording medium 52, recording is performed in the recording mode mode set by the user, and when the recording capacity of the recording medium 52 decreases. The recording method can be switched, and activity control according to the image quality can be performed.

(本発明に係る他の実施の形態)
前述した本発明の実施の形態における画像処理装置を構成する各手段、並びに画像処理方法の各ステップは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
(Another embodiment according to the present invention)
Each means constituting the image processing apparatus and each step of the image processing method in the embodiment of the present invention described above can be realized by operating a program stored in a RAM or ROM of a computer. This program and a computer-readable recording medium recording the program are included in the present invention.

また、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施の形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。   Further, the present invention can be implemented as, for example, a system, apparatus, method, program, or recording medium, and can be applied to a system composed of a plurality of devices. Moreover, you may apply to the apparatus which consists of one apparatus.

なお、本発明は、前述した実施の形態の機能を実現するソフトウェアのプログラム(実施の形態では、図3、図4に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。   In the present invention, a software program (in the embodiment, a program corresponding to the flowcharts shown in FIGS. 3 and 4) for realizing the functions of the above-described embodiments is directly or remotely supplied to a system or apparatus. In addition, it includes the case where the system or the computer of the apparatus is also achieved by reading and executing the supplied program code.

したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。   Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリター(interpreter)により実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。   In that case, as long as it has the function of a program, it may be in the form of an object code, a program executed by an interpreter, script data supplied to the OS, or the like.

プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。   As a recording medium for supplying the program, for example, floppy (registered trademark) disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, CD-RW, magnetic tape, nonvolatile memory card ROM, DVD (DVD-ROM, DVD-R) and the like.

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。   As another program supply method, a client computer browser is used to connect to an Internet homepage, and the computer program itself of the present invention or a compressed file including an automatic installation function is downloaded from the homepage to a recording medium such as a hard disk. Can also be supplied.

また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。   It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, the present invention includes a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer.

また、本発明のプログラムを暗号化してCD−ROM等の記録媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。   In addition, the program of the present invention is encrypted, stored on a recording medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. It is also possible to execute the encrypted program by using the key information and install the program on a computer.

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施の形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現され得る。   In addition to the functions of the above-described embodiments being realized by the computer executing the read program, the OS running on the computer based on the instructions of the program is used for the actual processing. The functions of the above-described embodiment can be realized by performing some or all of the processes.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現される。   Furthermore, after the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion board or The CPU or the like provided in the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.

本発明の第1の実施の形態における画像符号化装置の概略の構成を示すブロック図である。It is a block diagram which shows the schematic structure of the image coding apparatus in the 1st Embodiment of this invention. 本発明の第2の実施の形態における画像符号化装置の概略の構成を示すブロック図である。It is a block diagram which shows the structure of the outline of the image coding apparatus in the 2nd Embodiment of this invention. 本発明の画像処理方法の第1の動作例を説明するフローチャートである。It is a flowchart explaining the 1st operation example of the image processing method of this invention. 本発明の画像処理方法の第2の動作例を説明するフローチャートである。It is a flowchart explaining the 2nd operation example of the image processing method of this invention.

符号の説明Explanation of symbols

1 ブロック分割部
2 動き補償部
3 直交変換部
4 量子化部
5 可変長符号化部
5a 記録部
6 ビット割り当て部
7 参照量子化幅決定部
8 アクティビティ計算部
9 乗算部
10 平均値計算部
11 アクティビティ制御部
12 記録媒体
41 ブロック分割部
42 動き補償部
43 直交変換部
44 量子化部
45 可変長符号化部
45a 記録部
46 ビット割り当て部
47 参照量子化幅決定部
48 アクティビティ計算部
49 乗算部
50 平均値計算部
51 アクティビティ制御部
52 記録媒体
53 入力部






















DESCRIPTION OF SYMBOLS 1 Block division part 2 Motion compensation part 3 Orthogonal transformation part 4 Quantization part 5 Variable length encoding part 5a Recording part 6 Bit allocation part 7 Reference quantization width determination part 8 Activity calculation part 9 Multiplication part 10 Average value calculation part 11 Activity Control unit 12 Recording medium 41 Block division unit 42 Motion compensation unit 43 Orthogonal transformation unit 44 Quantization unit 45 Variable length encoding unit 45a Recording unit 46 Bit allocation unit 47 Reference quantization width determination unit 48 Activity calculation unit 49 Multiplication unit 50 Average Value calculation unit 51 Activity control unit 52 Recording medium 53 Input unit






















Claims (7)

動画像信号を入力する入力手段と、
前記入力手段により入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成する変数生成手段と、
前記変数生成手段により生成された第1の変数に基づいて量子化幅を設定する量子化幅設定手段と、
前記入力手段により入力された動画像信号を直交変換し、直交変換係数を生成する直交変換手段と、
前記直交変換手段により生成された直交変換係数を、前記量子化幅設定手段により設定された量子化幅で量子化し、量子化係数を生成する量子化手段と、
前記量子化手段により生成された量子化係数を可変長符号化する可変長符号化手段と、
前記可変長符号化手段から出力された符号化動画像データを前記記録媒体に記録する記録手段とを有し、
前記変数生成手段は、前記記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、前記第1の変数の値を所定値に固定
することを特徴とする画像処理装置。
An input means for inputting a moving image signal;
Variable generating means for generating a first variable based on the complexity of the image related to the moving image signal input by the input means and the remaining recording capacity of the recording medium for recording the moving image signal;
Quantization width setting means for setting a quantization width based on the first variable generated by the variable generation means;
Orthogonal transformation means for orthogonally transforming the moving image signal input by the input means to generate an orthogonal transformation coefficient;
Quantizing means for quantizing the orthogonal transform coefficient generated by the orthogonal transform means with a quantization width set by the quantization width setting means, and generating a quantization coefficient;
Variable-length coding means for variable-length coding the quantization coefficient generated by the quantization means;
The encoded moving image data output from said variable length coding means have a recording means for recording on the recording medium,
The image processing apparatus , wherein the variable generation means fixes the value of the first variable to a predetermined value when a remaining recording capacity of the recording medium becomes smaller than a predetermined threshold value. .
前記変数生成手段は、前記可変長符号化手段から出力された符号化動画像データの符号量と目標符号量との差に応じて第2の変数を更に生成し、前記量子化幅設定手段は前記第1の変数と第2の変数とに基づいて前記量子化幅を設定することを特徴とする請求項1に記載の画像処理装置。   The variable generation unit further generates a second variable according to a difference between a code amount of the encoded moving image data output from the variable length encoding unit and a target code amount, and the quantization width setting unit includes The image processing apparatus according to claim 1, wherein the quantization width is set based on the first variable and the second variable. 前記変数生成手段は、前記記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、前記第1の変数の値を所定値に固定して、前記第2の変数のみにより前記量子化幅が設定されるようにすることを特徴とする請求項2に記載の画像処理装置。   The variable generation means fixes the value of the first variable to a predetermined value when the remaining recording capacity of the recording medium becomes smaller than a predetermined threshold, and performs the quantization only by the second variable. The image processing apparatus according to claim 2, wherein a width is set. 動画像信号を入力する入力手段と、
前記動画像信号を符号化して符号化動画像データを生成する符号化手段と、
前記符号化手段により生成された符号化動画像データに係る動画像の複雑度を検出する複雑度検出手段と、
前記符号化手段により符号化された符号化動画像データを記録する記録媒体の記録残容量を検出する残量検出手段と、
前記複雑度検出手段により検出された複雑度の情報に基づいて前記符号化手段を制御する第1のモードと、前記複雑度検出手段により検出された複雑度の情報を用いずに前記符号化手段を制御する第2のモードとを有し、前記第1のモードまたは第2のモードで前記符号化手段を制御して、前記符号化手段から出力される符号化動画像データの符号量を調整する制御手段と、
前記制御手段により符号量を調整された符号化動画像データを前記記録媒体に記録する記録手段とを有し、
前記制御手段は、前記残量検出手段の出力に基づいて前記第1のモードと第2のモードとを切り替えることを特徴とする画像処理装置。
An input means for inputting a moving image signal;
Encoding means for generating encoded moving image data by encoding the moving image signal;
Complexity detecting means for detecting the complexity of the moving image related to the encoded moving image data generated by the encoding means;
A remaining amount detecting means for detecting a remaining recording capacity of a recording medium for recording the encoded moving image data encoded by the encoding means;
A first mode for controlling the encoding means based on the complexity information detected by the complexity detection means; and the encoding means without using the complexity information detected by the complexity detection means And controlling the encoding means in the first mode or the second mode to adjust the code amount of the encoded moving image data output from the encoding means Control means to
Recording means for recording the encoded moving image data, the code amount of which has been adjusted by the control means, on the recording medium,
The image processing apparatus characterized in that the control means switches between the first mode and the second mode based on the output of the remaining amount detection means.
前記制御手段は、前記記録媒体の記録残容量が所定の閾値よりも大きい場合に前記第1のモードを選択し、前記所定の閾値よりも小さい場合に前記第2のモードを選択することを特徴とする請求項に記載の画像処理装置。 The control means selects the first mode when the remaining recording capacity of the recording medium is larger than a predetermined threshold, and selects the second mode when the remaining capacity is smaller than the predetermined threshold. The image processing apparatus according to claim 4 . 動画像信号を入力する入力工程と、
前記入力工程において入力された動画像信号に係る画像の複雑さと、前記動画像信号を記録する記録媒体の記録残容量とに基づいて第1の変数を生成する変数生成工程と、
前記変数生成工程において生成された第1の変数に基づいて量子化幅を設定する量子化幅設定工程と、
前記入力工程において入力された動画像信号を直交変換し、直交変換係数を生成する直交変換工程と、
前記直交変換工程において生成された直交変換係数を、前記量子化幅設定工程において設定された量子化幅で量子化し、量子化係数を生成する量子化工程と、
前記量子化工程において生成された量子化係数を可変長符号化する可変長符号化工程と、
前記可変長符号化工程から出力された符号化動画像データを前記記録媒体に記録する記録工程とを有し、
前記変数生成工程は、前記記録媒体の記録残容量が所定の閾値よりも小さくなった場合に、前記第1の変数の値を所定値に固定
することを特徴とする画像処理方法。
An input process for inputting a moving image signal;
A variable generating step for generating a first variable based on the complexity of the image related to the moving image signal input in the input step and the remaining recording capacity of the recording medium for recording the moving image signal;
A quantization width setting step for setting a quantization width based on the first variable generated in the variable generation step;
An orthogonal transform step of orthogonally transforming the moving image signal input in the input step to generate an orthogonal transform coefficient;
A quantization step of quantizing the orthogonal transformation coefficient generated in the orthogonal transformation step with the quantization width set in the quantization width setting step, and generating a quantization coefficient;
A variable-length encoding step for variable-length encoding the quantization coefficient generated in the quantization step;
The encoded moving image data output from the variable length coding process have a recording step of recording on the recording medium,
The image processing method characterized in that the variable generation step fixes the value of the first variable to a predetermined value when a remaining recording capacity of the recording medium becomes smaller than a predetermined threshold value. .
動画像信号を入力する入力工程と、
前記動画像信号を符号化して符号化動画像データを生成する符号化工程と、
前記符号化工程において生成された符号化動画像データに係る動画像の複雑度を検出する複雑度検出工程と、
前記符号化工程において符号化された符号化動画像データを記録する記録媒体の記録残容量を検出する残量検出工程と、
前記複雑度検出工程において検出された複雑度の情報に基づいて前記符号化工程の符号化動作を制御する第1のモードと、前記複雑度検出工程において検出された複雑度の情報を用いずに前記符号化工程の符号化動作を制御する第2のモードとを有し、前記第1のモードまたは第2のモードで前記符号化工程を制御して、前記符号化工程において出力される符号化動画像データの符号量を調整する制御工程と、
前記制御工程において符号量を調整された符号化動画像データを前記記録媒体に記録する記録工程とを有し、
前記制御工程においては、前記残量検出工程の出力に基づいて前記第1のモードと第2のモードとを切り替えることを特徴とする画像処理方法。
An input process for inputting a moving image signal;
An encoding step of encoding the moving image signal to generate encoded moving image data;
A complexity detection step of detecting the complexity of the moving image related to the encoded moving image data generated in the encoding step;
A remaining amount detecting step for detecting a remaining recording capacity of a recording medium for recording the encoded moving image data encoded in the encoding step;
The first mode for controlling the encoding operation of the encoding step based on the complexity information detected in the complexity detection step, and without using the complexity information detected in the complexity detection step A second mode for controlling the encoding operation of the encoding step, and controlling the encoding step in the first mode or the second mode to output in the encoding step A control step of adjusting the code amount of the moving image data;
A recording step of recording the encoded moving image data whose code amount is adjusted in the control step on the recording medium,
In the control step, the first mode and the second mode are switched based on an output of the remaining amount detection step.
JP2005144554A 2005-05-17 2005-05-17 Image processing apparatus and image processing method Expired - Fee Related JP4510696B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005144554A JP4510696B2 (en) 2005-05-17 2005-05-17 Image processing apparatus and image processing method
US11/409,313 US8363717B2 (en) 2005-05-17 2006-04-24 Image processing apparatus
EP06113162A EP1725039A1 (en) 2005-05-17 2006-04-26 Image processing apparatus
US13/733,216 US20130177074A1 (en) 2005-05-17 2013-01-03 Image Processing Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005144554A JP4510696B2 (en) 2005-05-17 2005-05-17 Image processing apparatus and image processing method

Publications (3)

Publication Number Publication Date
JP2006324806A JP2006324806A (en) 2006-11-30
JP2006324806A5 JP2006324806A5 (en) 2008-07-03
JP4510696B2 true JP4510696B2 (en) 2010-07-28

Family

ID=37544172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005144554A Expired - Fee Related JP4510696B2 (en) 2005-05-17 2005-05-17 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP4510696B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012200319B2 (en) 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355772A (en) * 1998-06-10 1999-12-24 Victor Co Of Japan Ltd Video signal encoder
JP2001025015A (en) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd Moving image encoder and method therefor
JP2001197437A (en) * 2000-01-07 2001-07-19 Hitachi Ltd Method and device for video recording

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355772A (en) * 1998-06-10 1999-12-24 Victor Co Of Japan Ltd Video signal encoder
JP2001025015A (en) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd Moving image encoder and method therefor
JP2001197437A (en) * 2000-01-07 2001-07-19 Hitachi Ltd Method and device for video recording

Also Published As

Publication number Publication date
JP2006324806A (en) 2006-11-30

Similar Documents

Publication Publication Date Title
US8363717B2 (en) Image processing apparatus
KR100484148B1 (en) Advanced method for rate control and apparatus thereof
JP5360430B2 (en) Deblocking filter processing apparatus and deblocking filter processing method
JP2008283560A (en) Information processing apparatus and method thereof
JP2921358B2 (en) Image coding device
JPWO2006098226A1 (en) Encoding device and moving image recording system provided with encoding device
US8243802B2 (en) Moving picture encoding apparatus, moving picture encoding method, moving picture encoding program, moving picture decoding apparatus, moving picture decoding method, and moving picture decoding program
JP4908943B2 (en) Image coding apparatus and image coding method
JP4795223B2 (en) Image processing device
JP4928176B2 (en) Video encoding apparatus and video encoding method
JP4510696B2 (en) Image processing apparatus and image processing method
US8306110B2 (en) Moving image coding apparatus and method using copy pictures depending on virtual buffer verifier occupancy
JP2007306370A (en) Image coding recorder
WO2008007717A1 (en) Dynamic image decoding device and dynamic image encoding device
JP2768260B2 (en) Image coding control method
JP2005045736A (en) Method and device for encoding image signal, encoding controller, and program
JP4590306B2 (en) Image processing device
JP2007300557A (en) Image encoding device and image encoding method
KR100678843B1 (en) Intra-prame qvantomizing system for mpeg encoder and method thereof
JP5197329B2 (en) Encoding apparatus and encoding method
JP2007043495A (en) Image processing device and image processing method
JP2002218464A (en) Method, device and program for performing transcoding of moving image coded data and recording medium
JPH07131789A (en) Picture coding system
JP4478480B2 (en) Video encoding apparatus and method
JP2004064126A (en) Image coding apparatus and image coding method, and computer program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080516

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4510696

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees