WO2009125475A1 - 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体 - Google Patents

映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体 Download PDF

Info

Publication number
WO2009125475A1
WO2009125475A1 PCT/JP2008/056944 JP2008056944W WO2009125475A1 WO 2009125475 A1 WO2009125475 A1 WO 2009125475A1 JP 2008056944 W JP2008056944 W JP 2008056944W WO 2009125475 A1 WO2009125475 A1 WO 2009125475A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
field
motion vector
macroblock
cost
Prior art date
Application number
PCT/JP2008/056944
Other languages
English (en)
French (fr)
Inventor
卓 佐野
裕江 岩崎
長沼 次郎
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to CN200880128433.8A priority Critical patent/CN102017635B/zh
Priority to EP08740047A priority patent/EP2290988B1/en
Priority to US12/936,626 priority patent/US8811486B2/en
Priority to CA2720698A priority patent/CA2720698C/en
Priority to PCT/JP2008/056944 priority patent/WO2009125475A1/ja
Publication of WO2009125475A1 publication Critical patent/WO2009125475A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Definitions

  • the present invention relates to a video encoding method in which video data including one frame with two fields is divided into macroblocks of a predetermined size and compressed, and a bit stream is output.
  • encoding is performed in both the frame macroblock mode and the field macroblock mode, and an efficient method is selected.
  • an efficient method is selected.
  • the CPU load increases and a huge amount of processing time is required.
  • the chip area and power consumption increase, making implementation difficult.
  • the present invention aims to solve the above problems. For this reason, in the present invention, when encoding video data in a rectangular area, the frame macroblock mode and the field macroblock mode can be adaptively selected from the input image or the result of motion estimation. As a result, the present invention makes it possible to reduce the amount of calculation or the scale of hardware without reducing the encoding efficiency.
  • JP 11-298904 A JP 11-298904 A
  • the present invention has the following aspects, for example.
  • the following means are provided: Use.
  • a rectangle of horizontal M pixels and vertical 2 M pixels is divided into two rectangles of horizontal M pixels and vertical M pixels, a motion search is performed for each of the two rectangles, and an encoding cost (hereinafter referred to as a frame search cost).
  • a frame search cost an encoding cost
  • a rectangle of horizontal M pixels and vertical 2M pixels is divided into a horizontal M pixel and an odd-numbered vertical M pixel region, and a horizontal M pixel and an even-numbered vertical M pixel region.
  • D When the evaluation value of the magnitude of the motion vector calculated by the third means is larger than a predetermined threshold, the frame search cost calculated by the first means and the field search cost calculated by the second means A fourth means for comparing and selecting the smaller value.
  • the evaluation value of the magnitude of the motion vector includes the maximum value, the minimum value, or the average of the absolute values of the horizontal and vertical components of the motion vector calculated for each frame macroblock, field macroblock, or block obtained by dividing them. A value can be used.
  • the maximum value, the minimum value, or the average value in the Manhattan distance of the motion vector calculated for the frame macroblock, the field macroblock, or a block unit obtained by dividing the frame macroblock may be used. it can.
  • a maximum value, a minimum value, or an average value among the lengths of the motion vectors calculated for the frame macro block, the field macro block, or the block unit obtained by dividing the frame macro block may be used. it can.
  • the frame macro block mode / field macro block mode can be selected by the above means to reduce the calculation amount and the memory transfer amount.
  • the above aspect is a video encoding method for compressing video data in which one frame is composed of two fields by dividing the video data into macroblocks of a predetermined size, and outputting a bitstream. It has means for judging whether to encode in the block mode or in the field macroblock mode from the motion search result and the input image information. Depending on the judgment result, the encoding in the frame macroblock mode or the field macro is performed. Since encoding is performed in the block mode, the following advantages occur.
  • the above video encoding method is realized by software, the CPU load can be reduced and the processing time can be reduced.
  • the above video encoding method is realized by hardware, it can be realized with a smaller chip area and power consumption.
  • FIG. 1 is an explanatory diagram of an encoding target area according to an embodiment.
  • FIG. 2 is an explanatory diagram of a frame macroblock used in one embodiment.
  • FIG. 3 is an explanatory diagram of a field macroblock used in one embodiment.
  • FIG. 4 is a flowchart showing processing in the first embodiment.
  • FIG. 5 is a flowchart showing processing in the second embodiment.
  • FIG. 6 is a flowchart showing processing in the third embodiment.
  • FIG. 7 is a diagram illustrating a configuration example of a video encoding device according to an embodiment.
  • FIG. 8 is a diagram illustrating an example of block division.
  • FIG. 9 is an explanatory diagram of the sum of absolute differences between adjacent pixels used in one embodiment.
  • FIG. 1 shows an example of an encoding target block cut out from one frame in the present embodiment described below.
  • 1 represents an input image frame.
  • Encoding target video data (hereinafter referred to as encoding target region) 2 is obtained by dividing a part of an input image frame 1 into M ⁇ 2M rectangles as shown in FIG.
  • FIG. 2 is an explanatory diagram of a frame macroblock used in the present embodiment.
  • Reference numeral 3 in FIG. 2 represents a frame macroblock.
  • FIG. 4 is a flowchart of a video encoding method using the frame macroblock mode / field macroblock mode determination method according to the first embodiment of the present invention.
  • reference numeral 11 denotes a first means (unit), which performs a motion search process on a frame macroblock extracted from an input image to be encoded, sets the calculated motion vector to MV_frm, and sets the encoding cost.
  • Mcost_frm Let Mcost_frm.
  • reference numeral 12 denotes a second means, which performs a motion search process on the field macroblock extracted from the input image to be encoded, and sets the calculated motion vector as MV_fld and the encoding cost as Mcost_fld. . Since the motion search process performed here is to detect a rough motion of the video, it may be a rough search with an integer pixel accuracy.
  • reference numeral 13 denotes a third means.
  • the maximum absolute value (hereinafter referred to as the horizontal or vertical component) of all or part of the motion vectors calculated by the first means 11 and the second means 12 is shown. , MV_max). Note that instead of the maximum value, a minimum value or an average value may be used as an evaluation value of the magnitude of the motion vector.
  • the fourth means which compares MV_max calculated by the third means 13 with the magnitude of the threshold T.
  • the threshold value T is a parameter for determining whether the target area is a stationary area or a moving area, and is set with 1 pixel per 1/30 seconds as a guide. This threshold value setting is a guide and can be set arbitrarily.
  • Reference numeral 17 in the figure denotes seventh means.
  • the fourth means 14 determines that MV_max is not larger than the threshold value T and is a still area, the adjacent pixels in the vertical direction in each of the frame macroblock and field macroblock
  • the difference absolute value sum (hereinafter referred to as Pcost_frm and Pcost_fld, respectively) is calculated, and the magnitudes of the two values are compared.
  • FIG. 5 is a flowchart of a video encoding method using the frame macroblock mode / field macroblock mode determination method according to the second embodiment of the present invention.
  • reference numeral 21 denotes a first means, which performs a motion search process on the frame macroblock extracted from the input image to be encoded, and sets the calculated motion vector as MV_frm and the encoding cost as Mcost_frm.
  • reference numeral 22 denotes a second means, which performs a motion search process on the field macroblock extracted from the input image to be encoded, and sets the calculated motion vector as MV_fld and the encoding cost as Mcost_fld. . Since the motion search process performed here is to detect a rough motion of the video, it may be a rough search with an integer pixel accuracy.
  • reference numeral 23 denotes a third means, which calculates the Manhattan distance minimum value (hereinafter referred to as MV_min) of all or part of the motion vectors calculated by the first means 21 and the second means 22. To do. Note that the maximum value or the average value may be used as the evaluation value of the magnitude of the motion vector instead of the minimum value.
  • the threshold value T is a parameter for determining whether the target area is a stationary area or a moving area, and is set with 1 pixel per 1/30 seconds as a guide. This threshold value setting is a guide and can be set arbitrarily.
  • Reference numeral 27 in the drawing denotes seventh means.
  • the fourth means 24 determines that MV_min is not larger than the threshold value T and is a still area, the adjacent pixels in the vertical direction in each of the frame macroblock and the field macroblock
  • the difference absolute value sum (hereinafter referred to as Pcost_frm and Pcost_fld, respectively) is calculated, and the magnitudes of the two values are compared.
  • FIG. 6 is a flowchart of a video encoding method using the frame macroblock mode / field macroblock mode determination method according to the third embodiment of the present invention.
  • reference numeral 31 denotes a first means, which performs a motion search process on a frame macroblock extracted from an input image to be encoded, and sets the calculated motion vector as MV_frm and the encoding cost as Mcost_frm.
  • reference numeral 32 denotes a second means, which performs a motion search process on the field macroblock extracted from the input image to be encoded, and sets the calculated motion vector as MV_fld and the encoding cost as Mcost_fld. . Since the motion search process performed here is to detect a rough motion of the video, it may be a rough search with an integer pixel accuracy.
  • Reference numeral 33 in the figure denotes third means, which calculates an average value (hereinafter referred to as MV_ave) of the lengths of all or part of motion vectors calculated by the first means 31 and the second means 32. To do. Note that instead of the average value, the minimum value or the maximum value may be used as the evaluation value of the magnitude of the motion vector.
  • the threshold value T is a parameter for determining whether the target area is a stationary area or a moving area, and is set with 1 pixel per 1/30 seconds as a guide. This threshold value setting is a guide and can be set arbitrarily.
  • Reference numeral 37 in the figure denotes seventh means.
  • the fourth means 34 determines that MV_ave is not larger than the threshold value T and is a still area, the vertical adjacent pixels in each of the frame macroblock and the field macroblock
  • the difference absolute value sum (hereinafter referred to as Pcost_frm and Pcost_fld, respectively) is calculated, and the magnitudes of the two values are compared.
  • FIG. 7 is a diagram illustrating a configuration example of a video encoding device according to the present invention.
  • the motion search unit 101 corresponds to the first means 11, 21, 31 and the second means 12, 22, 32 in FIGS. 4 to 6.
  • the motion vector evaluation value calculation unit 102 corresponds to the third means 13, 23, and 33.
  • the motion vector threshold value determination unit 103 and the Mcost frame / field determination unit 104 correspond to the fourth means 14, 24, and 34.
  • the adjacent pixel difference absolute value sum calculation unit 105 and the Pcost frame / field determination unit 106 correspond to the seventh means 17, 27, and 37.
  • the frame macroblock encoding unit 107 corresponds to the fifth means 15, 25, 35 and the eighth means 18, 28, 38.
  • the field macroblock encoding unit 108 corresponds to the sixth means 16, 26, 36 and the ninth means 19, 29, 39.
  • the motion search unit 101 performs a motion search process for each of the frame macroblock and the field macroblock, and sets the calculated motion vectors as MV_frm and MV_fld and the encoding costs as Mcost_frm and Mcost_fld. Since the motion search process performed here is to detect a rough motion of the video, it may be a rough search with an integer pixel accuracy.
  • the motion vector evaluation value calculation unit 102 calculates an evaluation value MV_eva of the size of all or part of the motion vectors calculated by the motion search unit 101.
  • the absolute value maximum value MV_max is calculated from the horizontal and vertical components of the motion vector as the evaluation value MV_eva.
  • the minimum value MV_min is calculated as the evaluation value MV_eva from the Manhattan distance of the motion vector.
  • an average value MV_ave of motion vector lengths is calculated as the evaluation value MV_eva.
  • the motion vector threshold value determination unit 103 compares the MV_eva calculated by the motion vector evaluation value calculation unit 102 with a predetermined threshold value T for determining whether the target region is a stationary region or a moving region.
  • the motion vector threshold determination unit 103 notifies the comparison result to the Mcost frame / field determination unit 104 and the Pcost frame / field determination unit 106.
  • the Mcost frame / field determining unit 104 compares the coding costs Mcost_frm and Mcost_fld calculated by the motion search unit 101. If the encoding cost Mcost_frm is smaller, the Mcost frame / field determination unit 104 determines the application of the frame macroblock mode, and instructs the frame macroblock encoding unit 107 to encode the target region in the frame macroblock mode. Output.
  • the frame macroblock encoding unit 107 encodes the target area in the frame macroblock mode and outputs the encoded stream.
  • the Mcost frame / field determination unit 104 determines to apply the field macroblock mode and instructs the field macroblock encoding unit 108 to encode the target region in the field macroblock mode. Is output.
  • the field macroblock encoding unit 108 encodes the target area in the field macroblock mode and outputs the encoded stream.
  • the difference absolute value sum calculation unit 105 between adjacent pixels calculates the difference absolute value sum Pcost_frm between the adjacent pixels in the frame macroblock in the vertical direction and the difference absolute value sum Pcost_fld between the adjacent pixels in the field macroblock in the vertical direction.
  • the Pcost frame / field determination unit 106 compares the two values of Pcost_frm and Pcost_fld. If Pcost_frm is smaller, Pcost frame / field determination unit 106 determines to apply the frame macroblock mode, and outputs an instruction to frame macroblock encoding unit 107 to encode the target region in the frame macroblock mode. .
  • the frame macroblock encoding unit 107 encodes the target area in the frame macroblock mode and outputs the encoded stream.
  • Pcost frame / field determination unit 106 determines application of field macroblock mode, and instructs field macroblock encoding unit 108 to encode the target region in field macroblock mode. Output.
  • the field macroblock encoding unit 108 encodes the target area in the field macroblock mode and outputs the encoded stream.
  • the motion search unit 101 performs a motion search process on each of the frame macroblock and the field macroblock, calculates a motion vector, and calculates a frame search cost Mcost_frm and a frame search cost Mcost_fld as encoding costs. .
  • search costs for example, the sum of the following two values can be calculated and used.
  • FIG. 8 shows an example of block division when the motion search unit 101 performs motion search.
  • the motion search unit 101 divides a 16 ⁇ 16 pixel macroblock into blocks as shown in FIG. 8, for example, and performs a motion search for each block.
  • 8 ⁇ 16 blocks obtained by dividing the 16 ⁇ 16 pixel macroblock shown in FIG. 8 (A) into two in the vertical direction as shown in FIG. 8 (B), and 2 in the horizontal direction as shown in FIG. 8 (C).
  • the following method can be used as a method of calculating the evaluation value of the magnitude of the motion vector.
  • the maximum value, the minimum value, or the average value is obtained from the absolute values of the horizontal and vertical components of the motion vector and used as an evaluation value.
  • a maximum value, a minimum value, or an average value is obtained from the Manhattan distance of the motion vector and used as an evaluation value.
  • FIG. 9 is an explanatory diagram of the sum of absolute differences between adjacent pixels in the vertical direction calculated by the difference absolute value sum calculation unit 105 between adjacent pixels.
  • the difference absolute value sum calculation unit 105 between adjacent pixels calculates the adjacent pixels in the vertical direction as shown in Expression (1) for each of the frame macroblock 3 described in FIG. 2 or the field macroblock 4 described in FIG.
  • the sum of absolute differences between them (hereinafter referred to as S_frm0, S_frm1, S_fld0, S_fld1) is calculated.
  • ABS (a) indicates an absolute value of a
  • the sum of absolute differences for each macroblock (hereinafter referred to as “Pcost_frm” and “Pcost_fld”, respectively) is calculated and sent to the Pcost frame / field determination unit 106. send.
  • the Pcost frame / field determination unit 106 compares the two values and determines the frame macroblock mode / field macroblock mode.
  • Pcost_frm S_frm0 + S_frm1
  • Pcost_fld S_fld0 + S_fld1
  • the video encoding process described above can be realized by hardware or firmware, and can also be realized by a computer and a software program.
  • the program is recorded on a computer-readable recording medium and provided. It can also be provided through a network.
  • the present invention relates to a video encoding process, and enables a reduction in load during execution of software and downsizing of hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 映像符号化装置の動き探索部は、フレームマクロブロックおよびフィールドマクロブロックのそれぞれに対して動き探索を行い、動きベクトルとそれぞれの探索コストを算出する。動きベクトル評価値算出部は、動きベクトルの大きさの評価値を求める。動きベクトル閾値判定部において前記動きベクトルの大きさの評価値と、所定の閾値とを比較することにより、対象領域が動領域か静止領域かを判定する。対象領域が動領域の場合、探索コストの大小比較でフレーム/フィールドマクロブロックモードの適用が決定される。対象領域が静止領域の場合、フレームマクロブロックとフィールドマクロブロックの垂直方向隣接画素間差分絶対値和の大小によって、フレーム/フィールドマクロブロックモードが決定される。

Description

映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体
 本発明は、2つのフィールドで1つのフレームが構成される映像データを規定の大きさのマクロブロックに分割して圧縮し、ビットストリームを出力する映像符号化方式に関するものである。
 従来、2つのフィールドで1つのフレームが構成される映像データの符号化では、フレームマクロブロックモード、フィールドマクロブロックモード双方で符号化を行い、発生ビット量を比較してモード決定を行っている。また、特許文献1に記載されている「映像符号化方法、映像符号化装置、および映像符号化プログラムを記録した記録媒体」のように符号化過程を二重にし、第1過程の結果からモード決定を行う手法も提案されている。
 従来の映像符号化方式では、フレーム/フィールドマクロブロックモードの判定を行う場合に、以下のような問題が生じる。
 通常の映像符号化装置では、フレームマクロブロックモード、フィールドマクロブロックモード双方のモードで符号化を行い、効率の良い方式を選択している。この場合、符号化処理を複数回行う必要があるため、例えばソフトウェアによって処理する場合には、CPU負荷が増大し、膨大な処理時間が必要となる。また、ハードウェアによって実現する場合には、チップ面積や消費電力が増大し、実現が困難となる。
 本発明は、上記問題点を解決することを目的とする。このために、本発明においては、矩形領域の映像データを符号化する場合に、入力画像または動き予測を行った結果からフレームマクロブロックモード、フィールドマクロブロックモードを適応的に選択可能とする。これにより、本発明は、符号化効率を低下させずに、計算量あるいはハードウェアの規模の削減を可能とする。
特開平11-298904号公報
 本発明は、上記課題を解決するため、例えば、以下の側面を有する。
 第1の側面においては、2つのフィールドで1つのフレームが構成される映像データを規定の大きさのマクロブロックに分割して圧縮し、ビットストリームを出力する映像符号化方式において、以下の手段を用いる。
(a)水平M画素、垂直2M画素の矩形を、水平M画素と垂直M画素の矩形2つに分割し、2つの矩形それぞれに対し動き探索を行い、符号化コスト(以下、フレーム探索コストと呼ぶ)、および動きベクトルを算出する第1の手段。
(b)水平M画素、垂直2M画素の矩形を、水平M画素で奇数行の垂直M画素の領域と、水平M画素で偶数行の垂直M画素の領域とに分割し、2つの矩形それぞれに対し動き探索を行い、符号化コスト(以下、フィールド探索コストと呼ぶ)、および動きベクトルを算出する第2の手段。
(c)第1の手段および第2の手段の動き探索により決定された動きベクトルの大きさの評価値を算出する第3の手段。
(d)第3の手段で算出した動きベクトルの大きさの評価値が所定の閾値より大きい場合、第1の手段で算出したフレーム探索コストと、第2の手段で算出したフィールド探索コストとを比較し、値の小さい方を選択する第4の手段。
(e)第4の手段でフレーム探索コストが選択された場合、当該マクロブロックをフレームマクロブロックモードとして符号化を行う第5の手段。
(f)第4の手段でフィールド探索コストが選択された場合、当該マクロブロックをフィールドマクロブロックモードとして符号化を行う第6の手段。
(g)第3の手段で算出した動きベクトルの大きさの評価値が所定の閾値以下であった場合、フレームマクロブロック、フィールドマクロブロックのそれぞれにおいて垂直方向隣接画素間差分絶対値和を算出し、値の小さい方を選択する第7の手段。
(h)第7の手段でフレーム画素コストが選択された場合、当該マクロブロックをフレームマクロブロックモードとして符号化を行う第8の手段。
(i)第7の手段でフィールド画素コストが選択された場合、当該マクロブロックをフィールドマクロブロックモードとして符号化を行う第9の手段。
 動きベクトルの大きさの評価値としては、フレームマクロブロック、フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの水平、垂直成分それぞれの絶対値の中の最大値または最小値または平均値を用いることができる。
 また、動きベクトルの大きさの評価値として、フレームマクロブロック、フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルのマンハッタン距離の中の最大値または最小値または平均値を用いることもできる。
 また、動きベクトルの大きさの評価値として、フレームマクロブロック、フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの長さの中の最大値または最小値または平均値を用いることもできる。
 上記の側面においては、以上の手段により、フレームマクロブロックモード/フィールドマクロブロックモードを選択し、演算量やメモリ転送量を削減することができる。
 また、上記の側面は、2つのフィールドで1つのフレームが構成される映像データを規定の大きさのマクロブロックに分割して圧縮し、ビットストリームを出力する映像符号化方式であって、フレームマクロブロックモードで符号化するか、あるいは、フィールドマクロブロックモードで符号化するかを、動き探索結果および入力画像情報から判断する手段を持ち、その判断結果により、フレームマクロブロックモードによる符号化またはフィールドマクロブロックモードによる符号化を行うので、以下に示すような利点が生じる。
・上記の映像符号化方式をソフトウェアによって実現する場合、CPU負荷を軽減し、処理時間を削減することができる。
・上記の映像符号化方式をハードウェアによって実現する場合、より小さなチップ面積や消費電力で実現が可能となる。
図1は、一実施形態における符号化対象領域の説明図である。 図2は、一実施形態で用いるフレームマクロブロックの説明図である。 図3は、一実施形態で用いるフィールドマクロブロックの説明図である。 図4は、第1の実施形態における処理を示すフローチャートである。 図5は、第2の実施形態における処理を示すフローチャートである。 図6は、第3の実施形態における処理を示すフローチャートである。 図7は、一実施形態に係る映像符号化装置の構成例を示す図である。 図8は、ブロック分割の例を示す図である。 図9は、一実施形態で用いる隣接画素間差分絶対値和の説明図である。
符号の説明
 1  入力画像フレーム
 2  符号化対象領域
 3  フレームマクロブロック
 4  フィールドマクロブロック
 101  動き探索部
 102  動きベクトル評価値算出部
 103  動きベクトル閾値判定部
 104  Mcostフレーム/フィールド判定部
 105  隣接画素間差分絶対値和算出部
 106  Pcostフレーム/フィールド判定部
 107  フレームマクロブロック符号化部
 108  フィールドマクロブロック符号化部
 以下、図面を参照しつつ、本発明の好適な実施形態について説明する。ただし、本発明は以下の各実施形態に限定されるものではなく、例えばこれら実施形態の構成要素同士を適宜組み合わせてもよい。
 また、本実施形態では、マクロブロックサイズのサイズがM×M画素(M=16)である場合の例について説明する。
 図1は、以下で説明する本実施形態における1つのフレームから切り出される符号化対象ブロックの例を示している。図中の1は、入力画像フレームを表している。符号化対象の映像データ(以下、符号化対象領域という)2は、入力画像フレーム1の一部を、図1に示すようにM×2Mの矩形に分割したものである。
 図2は、本実施形態で用いるフレームマクロブロックの説明図である。図2に示す符号化対象領域2のM×2M(M=16)の符号化対象ブロックを、垂直方向に並ぶ、それぞれM×Mの2つのブロックに分割したものをフレームマクロブロックと呼ぶ。図2中の符号3がフレームマクロブロックを表している。
 図3は、本発明で用いるフィールドマクロブロックの説明図である。図3に示す符号化対象領域2のM×2M(M=16)の符号化対象ブロックに対し、符号化対象領域2の偶数行で構成されるM×Mのブロックと、符号化対象領域2の奇数行で構成されるM×Mのブロックとに分割したものをフィールドマクロブロックと呼ぶ。図中の4がフィールドマクロブロックを表している。
 図4は、本発明の第1の実施形態によるフレームマクロブロックモード/フィールドマクロブロックモード判定手法を用いた映像符号化方法のフローチャートである。
 図中の11は第1の手段(ユニット)を示しており、符号化対象の入力画像から抽出したフレームマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_frm、符号化コストをMcost_frmとする。図中の12は第2の手段を示しており、符号化対象の入力画像から抽出したフィールドマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_fld、符号化コストをMcost_fldとする。ここで行う動き探索処理は、映像のおおまかな動きを検出するものなので、整数画素精度程度の粗い探索でよい。
 図中の13は第3の手段を示しており、第1の手段11および第2の手段12で算出した全てまたは一部の動きベクトルの水平、垂直成分の中から絶対値の最大値(以下、MV_maxとする)を算出する。なお、最大値ではなく、最小値または平均値を動きベクトルの大きさの評価値として用いてもよい。
 図中の14は第4の手段を示しており、第3の手段13で算出されたMV_maxと閾値Tの大小を比較する。閾値Tは、対象領域が静止領域か動領域かを判定するパラメータであり、1/30秒当たり1画素を目安に設定する。なお、この閾値設定は目安であり、任意に設定可能である。MV_maxが閾値Tよりも大きい場合、対象領域は動領域と判断され、第1の手段11および第2の手段12で算出された符号化コストMcost_frm、Mcost_fldを比較し、コストの小さい方のマクロブロックモードを採用する。
 図中の15は第5の手段を示しており、第4の手段14でMcost_frmが小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の16は第6の手段を示しており、第4の手段14でMcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
 図中の17は第7の手段を示しており、第4の手段14でMV_maxが閾値Tよりも大きくなく、静止領域と判断された場合、フレームマクロブロック、フィールドマクロブロックそれぞれにおいて垂直方向隣接画素間差分絶対値和(以下、それぞれをPcost_frm、Pcost_fldとする)を算出し、2つの値の大小を比較する。
 図中の18は第8の手段を示しており、第7の手段17でPcost_frmが小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の19は第9の手段を示しており、第7の手段17でPcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
  図5は、本発明の第2の実施形態によるフレームマクロブロックモード/フィールドマクロブロックモード判定手法を用いた映像符号化方法のフローチャートである。
 図中の21は第1の手段を示しており、符号化対象の入力画像から抽出したフレームマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_frm、符号化コストをMcost_frmとする。図中の22は第2の手段を示しており、符号化対象の入力画像から抽出したフィールドマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_fld、符号化コストをMcost_fldとする。ここで行う動き探索処理は、映像のおおまかな動きを検出するものなので、整数画素精度程度の粗い探索でよい。
 図中の23は第3の手段を示しており、第1の手段21および第2の手段22で算出した全てまたは一部の動きベクトルのマンハッタン距離の最小値(以下、MV_minとする)を算出する。なお、最小値ではなく、最大値または平均値を動きベクトルの大きさの評価値として用いてもよい。
 図中の24は第4の手段を示しており、第3の手段23で算出されたMV_minと閾値Tの大小を比較する。閾値Tは、対象領域が静止領域か動領域かを判定するパラメータであり、1/30秒当たり1画素を目安に設定する。なお、この閾値設定は目安であり、任意に設定可能である。MV_minが閾値Tよりも大きい場合、対象領域は動領域と判断され、第1の手段21および第2の手段22で算出された符号化コストMcost_frm、Mcost_fldを比較し、コストの小さい方のマクロブロックモードを採用する。
 図中の25は第5の手段を示しており、第4の手段24でMcost_frmが小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の26は第6の手段を示しており、第4の手段24でMcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
 図中の27は第7の手段を示しており、第4の手段24でMV_minが閾値Tよりも大きくなく、静止領域と判断された場合、フレームマクロブロック、フィールドマクロブロックそれぞれにおいて垂直方向隣接画素間差分絶対値和(以下、それぞれをPcost_frm、Pcost_fldとする)を算出し、2つの値の大小を比較する。
 図中の28は第8の手段を示しており、第7の手段27でPcost_frmが小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の29は第9の手段を示しており、第7の手段27でPcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
  図6は、本発明の第3の実施形態によるフレームマクロブロックモード/フィールドマクロブロックモード判定手法を用いた映像符号化方法のフローチャートである。
 図中の31は第1の手段を示しており、符号化対象の入力画像から抽出したフレームマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_frm、符号化コストをMcost_frmとする。図中の32は第2の手段を示しており、符号化対象の入力画像から抽出したフィールドマクロブロックに対して動き探索処理を行い、算出された動きベクトルをMV_fld、符号化コストをMcost_fldとする。ここで行う動き探索処理は、映像のおおまかな動きを検出するものなので、整数画素精度程度の粗い探索でよい。
 図中の33は第3の手段を示しており、第1の手段31および第2の手段32で算出した全てまたは一部の動きベクトルの長さの平均値(以下、MV_aveとする)を算出する。なお、平均値ではなく、最小値または最大値を動きベクトルの大きさの評価値として用いてもよい。
 図中の34は第4の手段を示しており、第3の手段33で算出されたMV_aveと閾値Tの大小を比較する。閾値Tは、対象領域が静止領域か動領域かを判定するパラメータであり、1/30秒当たり1画素を目安に設定する。なお、この閾値設定は目安であり、任意に設定可能である。MV_aveが閾値Tよりも大きい場合、対象領域は動領域と判断され、第1の手段31および第2の手段32で算出された符号化コストMcost_frm、Mcost_fldを比較し、コストの小さい方のマクロブロックモードを採用する。
 図中の35は第5の手段を示しており、第4の手段34でMcost_frmが小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の36は第6の手段を示しており、第4の手段34でMcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
 図中の37は第7の手段を示しており、第4の手段34でMV_aveが閾値Tよりも大きくなく、静止領域と判断された場合、フレームマクロブロック、フィールドマクロブロックそれぞれにおいて垂直方向隣接画素間差分絶対値和(以下、それぞれをPcost_frm、Pcost_fldとする)を算出し、2つの値の大小を比較する。
 図中の38は第8の手段を示しており、第7の手段37でPcost_frm、が小さいと判断された場合、フレームマクロブロックモードで対象領域を符号化する。図中の39は第9の手段を示しており、第7の手段37でPcost_fldが小さいと判断された場合、フィールドマクロブロックモードで対象領域を符号化する。
 図7は、本発明に係る映像符号化装置の構成例を示す図である。
 図7において、動き探索部101は、図4ないし図6における第1の手段11、21、31および第2の手段12、22、32に相当する。動きベクトル評価値算出部102は、第3の手段13、23、33に相当する。動きベクトル閾値判定部103およびMcostフレーム/フィールド判定部104は、第4の手段14、24、34に相当する。隣接画素間差分絶対値和算出部105およびPcostフレーム/フィールド判定部106は、第7の手段17、27、37に相当する。フレームマクロブロック符号化部107は、第5の手段15、25、35および第8の手段18、28、38に相当する。フィールドマクロブロック符号化部108は、第6の手段16、26、36および第9の手段19、29、39に相当する。
 動き探索部101は、フレームマクロブロック、フィールドマクロブロックのそれぞれに対して動き探索処理を行い、算出された動きベクトルをMV_frm、MV_fld、符号化コストをMcost_frm、Mcost_fldとする。ここで行う動き探索処理は、映像のおおまかな動きを検出するものなので、整数画素精度程度の粗い探索でよい。
 動きベクトル評価値算出部102は、動き探索部101で算出した全てまたは一部の動きベクトルの大きさの評価値MV_evaを算出する。なお、第1の実施形態では、この評価値MV_evaとして、動きベクトルの水平、垂直成分の中から絶対値の最大値MV_maxを算出している。第2の実施形態では、この評価値MV_evaとして、動きベクトルのマンハッタン距離の中から最小値MV_minを算出している。第3の実施形態では、この評価値MV_evaとして、動きベクトルの長さの平均値MV_aveを算出している。
 動きベクトル閾値判定部103は、動きベクトル評価値算出部102で算出されたMV_evaと、対象領域が静止領域か動領域かを判定するための所定の閾値Tとの大小を比較する。動きベクトル閾値判定部103は、比較結果を、Mcostフレーム/フィールド判定部104およびPcostフレーム/フィールド判定部106に通知する。
 MV_evaが閾値Tよりも大きく、対象領域が動領域と判定された場合、Mcostフレーム/フィールド判定部104は、動き探索部101で算出された符号化コストMcost_frm、Mcost_fldを比較する。符号化コストMcost_frmのほうが小さければ、Mcostフレーム/フィールド判定部104はフレームマクロブロックモードの適用を決定し、フレームマクロブロック符号化部107にフレームマクロブロックモードで対象領域を符号化するように指示を出力する。フレームマクロブロック符号化部107は、フレームマクロブロックモードで対象領域を符号化し、その符号化ストリームを出力する。
 符号化コストMcost_fldのほうが小さい場合、Mcostフレーム/フィールド判定部104は、フィールドマクロブロックモードの適用を決定し、フィールドマクロブロック符号化部108にフィールドマクロブロックモードで対象領域を符号化するように指示を出力する。フィールドマクロブロック符号化部108は、フィールドマクロブロックモードで対象領域を符号化し、その符号化ストリームを出力する。
 一方、隣接画素間差分絶対値和算出部105は、フレームマクロブロックの垂直方向隣接画素間差分絶対値和Pcost_frmおよびフィールドマクロブロックの垂直方向隣接画素間差分絶対値和Pcost_fldをそれぞれ算出する。
 動きベクトル閾値判定部103がMV_evaが閾値Tよりも大きくなく、対象領域が静止領域と判定する場合、Pcostフレーム/フィールド判定部106は、Pcost_frmとPcost_fldの2つの値の大小を比較する。Pcost_frmのほうが小さければ、Pcostフレーム/フィールド判定部106は、フレームマクロブロックモードの適用を決定し、フレームマクロブロック符号化部107にフレームマクロブロックモードで対象領域を符号化するように指示を出力する。フレームマクロブロック符号化部107は、フレームマクロブロックモードで対象領域を符号化し、その符号化ストリームを出力する。また、Pcost_fldのほうが小さい場合、Pcostフレーム/フィールド判定部106は、フィールドマクロブロックモードの適用を決定し、フィールドマクロブロック符号化部108にフィールドマクロブロックモードで対象領域を符号化するように指示を出力する。フィールドマクロブロック符号化部108は、フィールドマクロブロックモードで対象領域を符号化し、その符号化ストリームを出力する。
 動き探索部101は、フレームマクロブロック、フィールドマクロブロックのそれぞれに対して動き探索処理を行い、動きベクトルを算出するともとに、符号化コストとして、フレーム探索コストMcost_frmとフレーム探索コストMcost_fldを算出する。なお、これらの探索コストとして、例えば以下の2つの値の和を算出して用いることができる。
・当該ブロックと動きベクトルが示す参照ブロックのそれぞれの画素値の差分値の絶対値または差分値の二乗の値の合計値。
・当該ブロックの動きベクトルと、その周囲の符号化済みの動きベクトルから算出される予測ベクトルとの差分に応じたコスト値。
 図8は、動き探索部101において動き探索を行うときのブロック分割の例を示している。動き探索部101は、16×16画素のマクロブロックを、例えば図8に示すようなブロックに分割して、各ブロックについて動き探索を行う。図8(A)に示す16×16画素のマクロブロックに対し、図8(B)に示すように垂直方向に2分割した8×16ブロック、図8(C)に示すように水平方向に2分割した16×8ブロック、図8(D)に示すように4分割した8×8ブロックがあり、さらに8×8ブロックの場合には、図8(E)~(H)に示すように、それぞれのブロックに対して8×8、4×8、8×4、4×4の4種類の分割を選択することができる。1マクロブロック当りの動きベクトルの本数が最大になるのは、全て4×4ブロックが選択された場合であり、その場合の動きベクトルの本数は16本である。
 動きベクトル評価値算出部102において、動きベクトルの大きさの評価値の算出方法としては、以下の方法を用いることができる。
(1)動きベクトルの水平、垂直成分それぞれの絶対値の中から最大値または最小値または平均値を求めて、評価値とする。
(2)動きベクトルのマンハッタン距離の中から最大値または最小値または平均値を求めて、評価値とする。
  マンハッタン距離=(水平成分絶対値)+(垂直成分絶対値)
(3)動きベクトルの長さ、またはその二乗の中から最大値または最小値または平均値を求めて、評価値とする。
  動きベクトルの長さの二乗=(水平成分) +(垂直成分) 
  図9は、隣接画素間差分絶対値和算出部105が算出する垂直方向の隣接画素間差分絶対値和の説明図である。
 隣接画素間差分絶対値和算出部105は、図2で説明したフレームマクロブロック3または図3で説明したフィールドマクロブロック4のそれぞれに対して、式(1)に示すように垂直方向の隣接画素間の差分絶対値の和(以下、S_frm0、S_frm1、S_fld0、S_fld1とする)を算出する。ここで、ABS(a)はaの絶対値を示しており、im、n はマクロブロック内の(m、n)成分(m=1、…、16、n=1、…、16)を表している。
Figure JPOXMLDOC01-appb-M000001
 その後,式(2),式(3)に示すように,各マクロブロック毎の差分絶対値の和(以下,それぞれをPcost_frm,Pcost_fldとする)を算出して,Pcostフレーム/フィールド判定部106へ送る。Pcostフレーム/フィールド判定部106は,2つの値の比較を行い,フレームマクロブロックモード/フィールドマクロブロックモードの判定を行う。
Pcost_frm=S_frm0+S_frm1   (2)
Pcost_fld=S_fld0+S_fld1   (3) 
 以上説明した映像符号化の処理は,ハードウェアまたはファームウェアによって実現することができるとともに,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
 なお、上記の各実施形態では、符号化対象領域2がM×2M(M=16)の縦長の矩形領域として説明を行ったが、符号化対象領域2はこれに限定されない。例えば、横長の矩形領域であってもよい。
 以上、本発明の好ましい実施例を説明したが、本発明はこれら実施例に限定されることはない。本発明の趣旨を逸脱しない範囲で、構成の付加、省略、置換、およびその他の変更が可能である。本発明は前述した説明によって限定されることはなく、添付のクレームの範囲によってのみ限定される。
 本発明は、映像符号化処理に関するものであり、ソフトウェアの実行時における負荷の低減や、ハードウェアの小型化を可能とする。

Claims (12)

  1.  2つのフィールドで1つのフレームが構成される映像データを規定の大きさのマクロブロックに分割して圧縮し、ビットストリームを出力する映像符号化方法において、
     符号化対象領域の水平M画素、垂直2M画素の矩形を、水平M画素と垂直M画素の2つの矩形のフレームマクロブロックに分割し、2つのフレームマクロブロックのそれぞれに対して動き探索を行い、動きベクトルとその動きベクトルを用いたときの符号化コストであるフレーム探索コストとを算出する第1の過程と、
     前記水平M画素、垂直2M画素の矩形を、水平M画素で奇数行の垂直M画素の領域と、水平M画素で偶数行の垂直M画素の領域の2つの矩形のフィールドマクロブロックに分割し、2つのフィールドマクロブロックのそれぞれに対して動き探索を行い、動きベクトルとその動きベクトルを用いたときの符号化コストであるフィールド探索コストとを算出する第2の過程と、
     前記第1の過程および前記第2の過程における動き探索により決定された動きベクトルの大きさの評価値を算出する第3の過程と、
     前記第3の過程で算出した動きベクトルの大きさの評価値が所定の閾値より大きい場合、前記第1の過程で算出したフレーム探索コストと、前記第2の過程で算出したフィールド探索コストとを比較し、値の小さい方のコストを選択する第4の過程と、
     前記第4の過程でフレーム探索コストが選択された場合、当該符号化対象領域をフレームマクロブロックモードとして符号化を行う第5の過程と、
     前記第4の過程でフィールド探索コストが選択された場合、当該符号化対象領域をフィールドマクロブロックモードとして符号化を行う第6の過程と、
     前記第3の過程で算出した動きベクトルの大きさの評価値が所定の閾値以下であった場合、フレームマクロブロックの垂直方向隣接画素間差分絶対値和を算出してフレーム画素コストとし、フィールドマクロブロックの垂直方向隣接画素間差分絶対値和を算出してフィールド画素コストとし、値の小さい方のコストを選択する第7の過程と、
     前記第7の過程でフレーム画素コストが選択された場合、当該符号化対象領域をフレームマクロブロックモードとして符号化を行う第8の過程と、
     前記第7の過程でフィールド画素コストが選択された場合、当該符号化対象領域をフィールドマクロブロックモードとして符号化を行う第9の過程とを有する映像符号化方法。 
  2.  前記動きベクトルの大きさの評価値は、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの水平成分および垂直成分それぞれの絶対値の中の最大値または最小値または平均値である請求項1記載の映像符号化方法。
  3.  前記動きベクトルの大きさの評価値は、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルのマンハッタン距離の中の最大値または最小値または平均値である請求項1記載の映像符号化方法。
  4.  前記動きベクトルの大きさの評価値は、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの長さの中の最大値または最小値または平均値である請求項1記載の映像符号化方法。
  5.  請求項1に記載された映像符号化方法を、コンピュータに実行させるための映像符号化プログラム。
  6.  請求項1に記載された映像符号化方法を、コンピュータに実行させるための映像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
  7.   複数の符号化対象領域からフレームが構成される映像データを圧縮、出力する映像符号化装置において、
     前記符号化対象領域を分割して得たフレームマクロブロックに基づき第1の動きベクトルと符号化コストであるフレーム探索コストとを算出し、前記符号化対象領域を分割して得たフィールドマクロブロックに基づき第2の動きベクトルと符号化コストであるフィールド探索コストとを算出する探索ユニットと、
     前記第1及び第2の動きベクトルに基づき前記符号化対象領域が動領域であるか、静止領域であるかを判定する動きベクトル判定ユニットと、
     前記符号化対象領域が動領域の場合に、前記フィールド探索コストより前記フレーム探索コストのほうが小さければ該符号化対象領域をフレームマクロブロックモードで符号化、出力し、逆の場合は該符号化対象領域をフィールドマクロブロックモードで符号化、出力する第1のフレーム/フィールド判定ユニットと、
     前記符号化対象領域が静止領域の場合、前記フレームマクロブロックのフレーム画素コストと、前記フィールドマクロブロックのフィールド画素コストとを算出するフレーム/フィールド画素コスト算出ユニットと、
     前記フレーム画素コストが前記フィールド画素コストより小さい場合に該符号化対象領域をフレームマクロブロックモードで符号化、出力し、逆の場合は該符号化対象領域をフィールドマクロブロックモードで符号化、出力する第2のフレーム/フィールド判定ユニットと、を備える映像符号化装置。
  8. 前記動きベクトル判定ユニットは、
     前記第1及び第2の動きベクトルの大きさの評価値を算出する動きベクトル評価値算出ユニットと、
     前記第1及び第2の動きベクトルの大きさの評価値が所定の閾値より大きい場合に前記符号化対象領域を動領域と判定し、前記所定の閾値以下の場合に前記符号化対象領域を静止領域と判定する動きベクトル閾値判定ユニットとを具備する
     請求項7に記載の映像符号化装置。
  9.  前記フレーム/フィールド画素コスト算出ユニットは、前記フレーム画素コストを前記フレームマクロブロックの垂直方向隣接画素間差分絶対値和から算出し、前記フィールド画素コストを前記フィールドマクロブロックの垂直方向隣接画素間差分絶対値和から算出する、請求項7に記載の映像符号化装置。
  10.  前記動きベクトル評価値算出ユニットは、前記動きベクトルの大きさの評価値を、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの水平成分および垂直成分それぞれの絶対値の中の最大値または最小値または平均値として算出する請求項7に記載の映像符号化装置。
  11.  前記動きベクトル評価値算出ユニットは、前記動きベクトルの大きさの評価値を、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルのマンハッタン距離の中の最大値または最小値または平均値として算出する請求項7に記載の映像符号化装置。
  12.  前記動きベクトル評価値算出ユニットは、前記動きベクトルの大きさの評価値を、前記フレームマクロブロック、前記フィールドマクロブロックまたはそれらを分割したブロック単位に算出された動きベクトルの長さの中の最大値または最小値または平均値として算出する請求項7に記載の映像符号化装置。
PCT/JP2008/056944 2008-04-08 2008-04-08 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体 WO2009125475A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN200880128433.8A CN102017635B (zh) 2008-04-08 2008-04-08 视频编码方法、视频编码装置、视频编码程序及其记录介质
EP08740047A EP2290988B1 (en) 2008-04-08 2008-04-08 Video encoding method, video encoding equipment, video encoding program and its recording medium
US12/936,626 US8811486B2 (en) 2008-04-08 2008-04-08 Video encoding method, video encoding apparatus, video encoding program and storage medium of the same
CA2720698A CA2720698C (en) 2008-04-08 2008-04-08 Video encoding method, video encoding apparatus, video encoding program and storage medium of the same
PCT/JP2008/056944 WO2009125475A1 (ja) 2008-04-08 2008-04-08 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/056944 WO2009125475A1 (ja) 2008-04-08 2008-04-08 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体

Publications (1)

Publication Number Publication Date
WO2009125475A1 true WO2009125475A1 (ja) 2009-10-15

Family

ID=41161618

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/056944 WO2009125475A1 (ja) 2008-04-08 2008-04-08 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体

Country Status (5)

Country Link
US (1) US8811486B2 (ja)
EP (1) EP2290988B1 (ja)
CN (1) CN102017635B (ja)
CA (1) CA2720698C (ja)
WO (1) WO2009125475A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134602A (zh) * 2015-09-21 2022-09-30 谷歌有限责任公司 低时延两次视频代码化

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9135683B2 (en) * 2013-09-05 2015-09-15 Arecont Vision, Llc. System and method for temporal video image enhancement
GB2524249B (en) * 2014-03-17 2021-01-20 Sony Interactive Entertainment Inc Image Processing
EP3648059B1 (en) * 2018-10-29 2021-02-24 Axis AB Video processing device and method for determining motion metadata for an encoded video
US11350103B2 (en) * 2020-03-11 2022-05-31 Videomentum Inc. Methods and systems for automated synchronization and optimization of audio-visual files

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0846971A (ja) * 1994-07-29 1996-02-16 Sharp Corp 動画像符号化装置
JPH09102910A (ja) * 1995-10-03 1997-04-15 Nippon Hoso Kyokai <Nhk> 動画像処理装置および方法
JP2006074499A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化プログラム
JP2006165840A (ja) * 2004-12-06 2006-06-22 Renesas Technology Corp 動き補償画像符号化装置及び符号化方法
JP2007027805A (ja) * 2005-07-12 2007-02-01 Nippon Telegr & Teleph Corp <Ntt> 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
WO2007129433A1 (ja) * 2006-04-17 2007-11-15 Toshihiro Minami 動画像符号化装置および動画像符号化方法
JP2008098796A (ja) * 2006-10-10 2008-04-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3242362B2 (ja) 1998-04-13 2001-12-25 日本電信電話株式会社 映像符号化装置、および映像符号化プログラムを記録した記録媒体
WO2000070879A1 (en) * 1999-05-13 2000-11-23 Stmicroelectronics Asia Pacific Pte Ltd. Adaptive motion estimator
US7609763B2 (en) * 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US20050259734A1 (en) * 2004-05-21 2005-11-24 Timothy Hellman Motion vector generator for macroblock adaptive field/frame coded video data
US7558428B2 (en) * 2004-09-13 2009-07-07 Microsoft Corporation Accelerated video encoding using a graphics processing unit
US20060222251A1 (en) * 2005-04-01 2006-10-05 Bo Zhang Method and system for frame/field coding

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0846971A (ja) * 1994-07-29 1996-02-16 Sharp Corp 動画像符号化装置
JPH09102910A (ja) * 1995-10-03 1997-04-15 Nippon Hoso Kyokai <Nhk> 動画像処理装置および方法
JP2006074499A (ja) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像符号化プログラム
JP2006165840A (ja) * 2004-12-06 2006-06-22 Renesas Technology Corp 動き補償画像符号化装置及び符号化方法
JP2007027805A (ja) * 2005-07-12 2007-02-01 Nippon Telegr & Teleph Corp <Ntt> 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
WO2007129433A1 (ja) * 2006-04-17 2007-11-15 Toshihiro Minami 動画像符号化装置および動画像符号化方法
JP2008098796A (ja) * 2006-10-10 2008-04-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of EP2290988A4
VIDEO ENCODING METHOD, VIDEO ENCODING APPARATUS AND STORAGE MEDIUM STORING VIDEO ENCODING PROGRAM

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134602A (zh) * 2015-09-21 2022-09-30 谷歌有限责任公司 低时延两次视频代码化

Also Published As

Publication number Publication date
CA2720698C (en) 2014-02-11
EP2290988B1 (en) 2013-03-27
US8811486B2 (en) 2014-08-19
CN102017635A (zh) 2011-04-13
CA2720698A1 (en) 2009-10-15
US20110096840A1 (en) 2011-04-28
EP2290988A1 (en) 2011-03-02
EP2290988A4 (en) 2012-02-22
CN102017635B (zh) 2013-05-15

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
EP2536148B1 (en) Predictive coding method for motion vector, predictive decoding method for motion vector, video coding device, video decoding device, and programs therefor
JP2005191706A (ja) 動画像符号化方法及びその装置
JP4195057B2 (ja) 適応動きベクトルの探索領域を決定する方法、および適応動きベクトルの探索領域を決定する画像圧縮装置。
US20120320985A1 (en) Motion vector predictive encoding method, motion vector predictive decoding method, moving picture encoding apparatus, moving picture decoding apparatus, and programs thereof
US8090029B2 (en) Dynamic image encoding device and method
WO2009125475A1 (ja) 映像符号化方法、映像符号化装置、映像符号化プログラムおよびその記録媒体
US10462479B2 (en) Motion picture encoding device, motion picture encoding method, and storage medium storing motion picture encoding program
JP5748225B2 (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
JPWO2006100946A1 (ja) 画像信号再符号化装置及び画像信号再符号化方法
JP5178616B2 (ja) シーンチェンジ検出装置および映像記録装置
JP2011239365A (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP4373423B2 (ja) 映像符号化方法,映像符号化装置,映像符号化プログラムおよびその記録媒体
KR101073938B1 (ko) 색차공간 예측을 이용한 영상부호화방법
KR102570374B1 (ko) 영상 부호화 장치, 영상 부호화 방법, 영상 부호화 프로그램, 영상 복호 장치, 영상 복호 방법, 및 영상 복호 프로그램
JP4868539B2 (ja) 動画像符号化装置および復号装置
JP2010278519A (ja) 動きベクトル検出装置
US9277213B2 (en) Video encoding device
JP4165752B2 (ja) 画像データへの秘匿データ挿入方式および秘匿データ検出方式
JP2013017128A (ja) イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム
JP4643736B2 (ja) 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007027805A (ja) 映像符号化装置、映像符号化方法、映像符号化プログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体
CN117061753A (zh) 预测帧间编码的运动矢量的方法和装置
JP2004242055A (ja) 信号処理装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200880128433.8

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08740047

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2720698

Country of ref document: CA

Ref document number: 2008740047

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 12936626

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: JP