WO2012121234A1 - 映像符号化装置、映像符号化方法および映像符号化プログラム - Google Patents

映像符号化装置、映像符号化方法および映像符号化プログラム Download PDF

Info

Publication number
WO2012121234A1
WO2012121234A1 PCT/JP2012/055630 JP2012055630W WO2012121234A1 WO 2012121234 A1 WO2012121234 A1 WO 2012121234A1 JP 2012055630 W JP2012055630 W JP 2012055630W WO 2012121234 A1 WO2012121234 A1 WO 2012121234A1
Authority
WO
WIPO (PCT)
Prior art keywords
region
encoding
motion
inter
determined
Prior art date
Application number
PCT/JP2012/055630
Other languages
English (en)
French (fr)
Inventor
尚紀 小野
清水 淳
正樹 北原
清介 京地
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to RU2013140686/07A priority Critical patent/RU2551473C2/ru
Priority to KR1020137023353A priority patent/KR101623064B1/ko
Priority to EP12754752.9A priority patent/EP2670143B1/en
Priority to CA2828695A priority patent/CA2828695A1/en
Priority to ES12754752.9T priority patent/ES2609303T3/es
Priority to BR112013022577A priority patent/BR112013022577A2/pt
Priority to CN201280011680.6A priority patent/CN103430546B/zh
Priority to US14/001,841 priority patent/US9445089B2/en
Priority to JP2013503549A priority patent/JP5613319B2/ja
Publication of WO2012121234A1 publication Critical patent/WO2012121234A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape

Definitions

  • the present invention relates to a video encoding technique for improving the image quality of an encoder, and more particularly, to a video encoding device, a video encoding method, and a video encoding program that suppress a calculation amount in motion search and encoding mode selection.
  • video coding represented by H.264 / AVC (ISO / IEC 14496-10 “MPEG-4 Part 10 Advanced Video Coding”)
  • encoding is performed by closing the information in the frame using the correlation in the spatial direction.
  • Compression using adaptively switching between intra coding and inter coding which uses time-direction correlation and uses information between frames, depending on the nature of the image to be coded Improving efficiency.
  • inter-coding motion compensation technology is used, and the position where the region to be encoded exists in the past or future frame called the reference frame, that is, the reference frame and the encoding target frame A motion vector indicating how much has moved between is searched.
  • the coding efficiency can be improved by coding the difference signal from the reference frame, not the signal itself in the coding target region.
  • a technique called full search is generally used in which evaluation values are calculated while shifting one pixel at a time for all block patterns within the search range of a reference frame.
  • the amount of computation required for block matching is enormous compared to other encoding processes.
  • the calculation amount of motion search increases according to the size of the search range.
  • the search range is simply narrowed uniformly in order to reduce the amount of calculation, there is a problem that an appropriate motion vector cannot be detected when there is a region with a large motion, resulting in a decrease in coding efficiency. .
  • the unit of the block to be encoded is a 16 ⁇ 16 pixel rectangular block called a macroblock.
  • a macro block is allowed to be divided into the following blocks. (1) One motion vector is used in 16 ⁇ 16 blocks. (2) Two motion vectors are used by dividing into two 16 ⁇ 8 blocks. (3) Divide into two 8 ⁇ 16 blocks and use two motion vectors. (4) Divide into four 8 ⁇ 8 blocks, and allow the following divisions (4-1) to (4-4) for each 8 ⁇ 8 block. (4-1) One motion vector is used in 8 ⁇ 8 blocks. (4-2) Divide into two 8 ⁇ 4 blocks and use two motion vectors. (4-3) Divide into two 4 ⁇ 8 blocks and use two motion vectors. (4-4) Divide into 4 4 ⁇ 4 blocks and use 4 motion vectors.
  • H.P. In addition to inter coding, H.264 / AVC has intra coding. In order to determine which coding to use, intra coding is performed to calculate the code amount, and the code amount by inter coding is used. It is necessary to compare with. The load required to select these modes is also a factor in increasing the amount of calculation in video encoding.
  • the amount of calculation has been performed by estimating the amount of motion for each region and appropriately narrowing the search range for regions with small motion.
  • This method is effective because, for example, in a video where the camera is fixed, such as a TV conference, a stationary region such as a background and a moving region are clearly separated.
  • a conventional technique for estimating a motion amount for each region and controlling a search range there is a technique described in Patent Document 1, for example.
  • Patent Document 1 the calculation amount of motion search is suppressed by reducing the motion search range based on the correlation evaluation result between the encoding target frame and the reference frame.
  • Patent Document 1 there is a possibility of image quality degradation due to the limitation of the motion search range without considering the information amount for the motion vector.
  • the calculation load due to the coding mode determination is not reduced.
  • the motion search calculation amount is reduced by reducing the motion search range for a region having a high correlation.
  • the amount of motion vector information is not considered in determining the search range.
  • the encoding target includes a motion vector in addition to the pixel value of the encoding target area.
  • a prediction vector called PMV is calculated using a median value of motion vectors calculated in peripheral blocks of the encoding target block, and a difference value between the motion vector detected in the encoding target block and PMV is calculated. Encode.
  • the PMV is a large value
  • the search range is narrowed using only the correlation evaluation result
  • the information amount of the motion vector is increased, thereby reducing the coding efficiency.
  • the conventional technique has a problem that the amount of code of the motion vector may increase and the amount of calculation associated with the coding mode determination cannot be reduced.
  • the present invention has been made in view of such circumstances, and a video encoding device that can more effectively suppress the amount of computation in video encoding associated with motion search and encoding mode determination than the conventional technology,
  • An object is to provide a video encoding method and a video encoding program.
  • the present invention is a video encoding device that uses intra encoding and inter encoding with motion compensation for an input video signal, and the input video signal to be encoded has a still region or a minute motion.
  • a determination unit that determines whether the region is accompanied or normal region, and a first encoding that performs inter-coding of a motion vector (0, 0) on the region determined to be a still region by the determination unit
  • a second encoding unit that performs motion search and inter coding within a search range limited to a region determined to be a region with minute motion by the determination unit, and a normal
  • a third encoding unit that performs motion search and inter-encoding in a normal search range for a region determined to be a region with motion.
  • the present invention is characterized in that the determination unit performs the region determination using a similarity between the reference frame and the encoding target frame and a motion vector in a peripheral region.
  • the present invention is characterized in that the region determined as the still region is encoded by limiting the inter coding mode.
  • the present invention is characterized in that encoding is performed by limiting an inter coding mode to a region determined to be a region with minute motion.
  • the present invention is characterized by further comprising a determining unit that determines whether or not to perform intra coding on the stationary region or the region determined as the region with minute movement.
  • the present invention relates to a video coding method using intra coding and inter coding with motion compensation for an input video signal, and the input video signal to be coded has a still region or a minute motion.
  • a determination step for determining whether the region is a region accompanied by a normal motion, and a first encoding for performing inter-coding of a motion vector (0, 0) on the region determined to be a still region by the determination step A second encoding step for performing motion search and inter coding within a limited search range with respect to the region determined to be a region with minute motion by the determination step, and a normal step by the determination step.
  • a third encoding step for performing motion search and inter-encoding in a normal search range with respect to the region determined to be a region with motion. .
  • the present invention is characterized in that the determination step performs the region determination using a similarity between a reference frame and an encoding target frame and a motion vector in a peripheral region.
  • the present invention is characterized in that the region determined as the still region is encoded by limiting the inter coding mode.
  • the present invention is characterized in that encoding is performed by limiting an inter coding mode to a region determined to be a region with minute motion.
  • the present invention is characterized by further comprising a determination step for determining whether or not to perform intra coding on the static region or the region determined to be a region with minute motion.
  • the present invention relates to a video encoding program for causing a computer on a video encoding apparatus using intra encoding and inter encoding with motion compensation to an input video signal to perform video encoding processing.
  • a determination step for determining whether a certain input video signal is a still region, a region with a minute motion, or a region with a normal motion, and a motion vector ( (0, 0) inter-encoding, and motion search and inter-encoding within a limited search range with respect to the region determined to be a region with minute motion by the determination step.
  • the present invention by using the value of the peripheral vector for the region determination, it is possible to suppress the calculation amount associated with the motion search while suppressing the encoding efficiency decrease due to the increase in the motion vector code amount. can get. In addition, it is possible to obtain the effect that the amount of calculation associated with the selection of the coding mode can be similarly suppressed.
  • FIG. 1 is a block diagram showing the configuration of the embodiment.
  • reference numeral 100 denotes an encoding unit that performs video encoding.
  • the encoding process in the encoding unit 100 is performed by the information of the region determination unit 102, the motion vector memory 103, and the encoding mode determination unit 114. Except for exchanges, conventional MPEG-2, H.264, etc. H.264 is the same as other video encoding apparatuses.
  • the known functions and configurations that the encoding unit 100 normally has are conventionally described unless they are directly related to the description of the present invention. Easy to do.
  • the prediction residual signal generation unit 120 After the input video signal stored in the frame memory 101 is input to the prediction residual signal generation unit 120 and changed to a prediction residual signal that is a residual with the prediction signal output from the intra / inter mode determination unit 119. , Input to the orthogonal transform unit 104, and output transform coefficients by orthogonal transform.
  • the transform coefficient is input to the quantization unit 105, and the quantization unit 105 quantizes it according to the quantization step size set from the encoding control unit 109.
  • the quantized transform coefficient is input to the variable length coding unit 106, and the variable length coding unit 106 performs variable length coding.
  • the encoded data output from the variable length encoding unit 106 is multiplexed by the multiplexing unit 107 and stored in the buffer unit 108.
  • the encoded data is output from the buffer unit 108.
  • the encoding control unit 109 controls the generated code amount in the quantization unit 105 from the encoded data amount stored in the buffer unit 108.
  • the quantized transform coefficient is inversely quantized by the inverse quantization unit 110 and inversely orthogonal transformed by the inverse orthogonal transform unit 111 to generate a decoded prediction residual signal.
  • This decoded prediction residual signal is added by the adder 121 with a prediction signal obtained by intra or inter coding to generate a decoded signal.
  • the decoded signal is stored in the local decoded image memory 112 for use as a reference image in predictive coding of the subsequent frame.
  • the input video signal stored in the frame memory 101 is also input to the area determination unit 102 in addition to the above-described encoding process, and the area determination unit 102 inputs the motion vector of the peripheral area input from the input video and the motion vector memory 103. Based on the information, it is determined whether it is a static region, a region with minute motion or a region with normal motion, and the motion search control signal that selects the search range and inter coding mode based on the determination result is motion-searched Input to the unit 113.
  • the motion search unit 113 is determined based on the motion search control signal input from the region determination unit 102 using the input video signal from the frame memory 101 and the local decoded image stored in the local decoded image memory 112.
  • the motion search process is performed according to the search range and the encoding mode.
  • the motion compensation unit 115 refers to the local decoded image memory 112 according to the detected motion vector, and generates a prediction signal by inter coding.
  • the inter mode determination unit 116 determines an inter coding mode based on the processing result of the motion compensation unit 115.
  • Intra coding is performed in addition to inter coding, but prior to that, the coding mode determination unit 114 calculates an evaluation value such as a region determination result from the region determination unit 102 and a sum of absolute differences obtained by motion search. To determine whether to implement intra coding.
  • the intra coding unit 117 performs or does not perform intra coding according to the mode control signal that is the processing result of the coding mode determination unit 114.
  • intra coding is implemented using the input video signal input from the frame memory 101, and the intra mode determination part 118 determines intra coding mode based on the result.
  • the intra / inter mode determination unit 119 determines which mode to use based on the results of the intra mode and the inter mode, and outputs a prediction signal of the determined mode. However, when the encoding mode determination unit 114 determines not to implement the intra mode, the inter mode is always selected according to the control signal from the encoding mode determination unit 114.
  • FIG. 2 is a flowchart showing the processing operation for determining the search range and coding mode of motion search.
  • the similarity ⁇ DC uses a sum of absolute differences between pixels of the reference frame and the encoding target frame. However, in order to reduce the amount of calculation, one pixel or a target pixel for calculating the absolute difference is selected. It is possible to skip two pixels.
  • ⁇ DC 0
  • the motion vector is determined as (0, 0) without performing a motion search.
  • the inter coding mode is fixed (step S3).
  • the motion vector is (0, 0) in all blocks, so there is no point in changing the encoding mode.
  • H.264 / AVC it is efficient to use a block size of 16 ⁇ 16 with the smallest number of motion vectors.
  • step S8 it is determined whether ⁇ DC is smaller than the threshold Th_DC (step S8). If ⁇ DC is smaller than the threshold Th_DC as a result of this determination,
  • the motion search is performed with a narrow search range (step S12).
  • the search range to be set for example, a minimum search range including the same motion vector as that of PMV can be considered.
  • the inter coding mode is not particularly limited. However, in the case of minute motion, it is expected that there is almost no difference in the motion vector obtained by each block even if the block size is divided. In order to suppress the calculation amount, the block size may be fixed to 16 ⁇ 16 with the smallest number of motion vectors, and motion search in other inter coding modes may not be performed.
  • an evaluation value Cost obtained by motion search is calculated (step S4).
  • the sum of absolute differences is used as the evaluation value Cost.
  • it is determined whether or not Cost is smaller than the threshold Th_Cost (step S5). If the cost is smaller, the coding mode is fixed to the inter mode and intra coding is not performed, thereby reducing the amount of calculation associated with the mode selection (step S6). ). If Cost is not smaller than the threshold Th_Cost, intra coding is performed, and the mode determination is performed by comparing the efficiency of the intra mode and the inter mode (step S7). If ⁇ DC is larger than the threshold Th_DC, or if the value of
  • the region is a static region, a region with minute motion, or a region with normal motion
  • the motion vector is determined as (0, 0) without performing a motion search while restricting the inter coding mode for the region determined to be a still region.
  • a motion search is performed with a limited search range.
  • whether to perform intra coding is determined by comparing the evaluation value calculated by motion search with a threshold value. For a region determined to be a region with normal motion, motion search is performed within the normal search range.
  • the value of the peripheral vector is used to determine whether the region is a still region, a region with minute motion, or a region with normal motion.
  • the calculation amount of the motion search is suppressed by limiting the motion region in a narrow range for the still region and the region with a minute motion.
  • the inter coding mode for the still region the amount of computation associated with the inter mode selection is suppressed.
  • intra / inter mode selection is performed by deciding whether or not to perform intra coding only by comparing the evaluation value calculated by motion search and a threshold without performing intra coding. It is possible to reduce the amount of calculation associated with.
  • a video encoding process is performed by recording a program for realizing the function of the processing unit in FIG. 1 on a computer-readable recording medium, causing the computer system to read and execute the program recorded on the recording medium. May be performed.
  • the “computer system” includes an OS and hardware such as peripheral devices.
  • the “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM or a CD-ROM, and a hard disk incorporated in a computer system.
  • the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.
  • RAM volatile memory
  • the program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium.
  • the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
  • the program may be for realizing a part of the functions described above. Furthermore, what can implement
  • video encoding processing it can be applied to applications where it is indispensable to suppress the amount of computation in motion search and encoding mode selection.

Abstract

 入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化装置であって、符号化対象である入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定部と、判定部により静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化部と、判定部により微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化部と、判定部により通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化部とを備えた映像符号化装置。

Description

映像符号化装置、映像符号化方法および映像符号化プログラム
 本発明は、符号化器の画質を向上させる映像符号化技術に関し、特に、動き探索及び符号化モード選択における演算量を抑止する映像符号化装置、映像符号化方法および映像符号化プログラムに関する。
 本願は、2011年3月9日に、日本に出願された特願2011-051354号に基づき優先権を主張し、その内容をここに援用する。
 H.264/AVC(ISO/IEC 14496-10”MPEG-4 Part 10 Advanced Video Coding”)に代表される映像符号化においては、空間方向の相関を利用してフレーム内の情報に閉じて符号化を行うイントラ符号化と、時間方向の相関を利用してフレーム間の情報を用いて符号化を行うインター符号化を、符号化対象である画像の性質に応じて適応的に切り替えて使用することで圧縮効率の向上を図っている。インター符号化においては動き補償技術が用いられており、符号化対象となる領域が、参照フレームとよばれる過去あるいは未来のフレームにおいてどの位置に存在したか、すなわち、参照フレームと符号化対象フレームとの間でどれだけ動いたかを示す動きベクトルを探索する。この場合、参照フレームにおいて、その動きベクトル分だけ離れた位置に似通った領域が存在し、その領域との差分値は非常に小さくなることが期待できる。これを利用して、符号化対象領域の信号そのものではなく、参照フレームとの差分信号を符号化することで符号化効率を向上させることができる。
 動きベクトルを求める動き探索処理においては、ブロックマッチングと呼ばれる手法が広く用いられている。H.264/AVCでは符号化の単位として画面を分割した矩形ブロック領域が使用されている。参照フレームにおける符号化対象ブロック位置を中心とする探索範囲において、符号化対象ブロックとの画素値の差分絶対値和等の評価値を算出し、最小値を取るブロックパターン位置と、符号化対象ブロック位置との距離を動きベクトルとする。ブロックマッチングにおいては、参照フレームの探索範囲内全てのブロックパターンに対して、1画素ずつずらしながら評価値を算出する全探索と呼ばれる手法が一般的である。
 しかしながら、ブロックマッチングに要する演算量はその他の符号化処理と比較して膨大となる。特に、ブロックマッチングを、リアルタイムでのライブ映像配信などへ符号化装置を適用する場合、動き探索の演算量を減らすことは必須である。動き探索の演算量は探索範囲の広さに応じて増加する。しかし、演算量を低減するために探索範囲を単純に一様に狭めてしまうと、動きの大きい領域が存在する場合に適切な動きベクトルが検出できず、符号化効率が低下するという問題がある。
 また、H.264/AVCのインター符号化においては、ブロックサイズを変更することによる複数の符号化モードが許可されている。符号化するブロックの単位はマクロブロックと呼ばれる16×16画素の矩形ブロックである。マクロブロックは、以下のブロックに分割することが許されている。
(1)16×16ブロックで一つの動きベクトルを使用する。
(2)二つの16×8ブロックに分割して二つの動きベクトルを使用する。
(3)二つの8×16ブロックに分割して二つの動きベクトルを使用する。
(4)四つの8×8ブロックに分割し、それぞれの8×8ブロックに対して以下(4-1)~(4-4)の分割を許可する。
(4-1)8×8ブロックで一つの動きベクトルを使用する。
(4-2)二つの8×4ブロックに分割して二つの動きベクトルを使用する。
(4-3)二つの4×8ブロックに分割して二つの動きベクトルを使用する。
(4-4)四つの4×4ブロックに分割して四つの動きベクトルを使用する。
 最適な符号化モード選択を実施するためには、許可されているブロック分割全てに対して動きベクトルを検出する必要がある。さらに前述のように、H.264/AVCにはインター符号化以外にもイントラ符号化があり、どちらの符号化を使用するかを決定するためにはイントラ符号化を実施して符号量を算出し、インター符号化による符号量と比較する必要がある。これらモード選択に要する負荷も映像符号化における演算量増加の要因となっている。
 従来、動き探索の負荷を軽減するために、領域毎に動き量を推定し、動きが小さい領域に対しては探索範囲を適切に狭めることによって演算量を削減することが行われていた。この方法は、例えば、TV会議などのようにカメラが固定されている映像においては、背景等の静止領域と動領域がはっきり分かれているため効果的である。領域毎に動き量を推定し、探索範囲を制御する従来技術として、例えば特許文献1に記載されている技術がある。特許文献1では、符号化対象フレームと参照フレームとの相関評価結果に基づき、動き探索範囲を縮小することで動き探索の演算量を抑えている。
 しかしながら、特許文献1では、動きベクトルに対する情報量を考慮せずに動き探索範囲を制限していることによる画質劣化の可能性がある。またインターモードの選択方法やイントラ/インター符号化の判定については言及されていないため、符号化モード判定を実施することによる演算負荷は軽減されない。
特開平8-32969号公報
 動き探索における演算量を削減することは、符号化装置の高速化に対して必須であるが、探索範囲を一様に狭めてしまうと、符号化効率が低下するという問題がある。また、H.264/AVCのように符号化モードが多い方式においては、モード選択に伴う演算量を削減することも考慮する必要がある。
 特許文献1に記載の技術では、符号化対象フレームと参照フレームとの相関評価結果に基づき、相関が高い領域については動き探索範囲を縮小することによって動き探索の演算量を抑える方式であるが、探索範囲の決定において動きベクトルの情報量を考慮していない。符号化対象は、符号化対象領域の画素値以外にも動きベクトルも含まれている。H.264/AVCでは、符号化対象ブロックの周辺ブロックで算出された動きベクトルの中央値を用いてPMVと呼ばれる予測ベクトルを算出し、符号化対象ブロックで検出された動きベクトルとPMVとの差分値を符号化する。
 PMVが大きい値であるにも関わらず、相関評価の結果のみを用いて探索範囲を狭めた場合、動きベクトルの情報量が大きくなることで符号化効率が低下する。また、インターモードの選択方法やイントラ/インター符号化の判定については言及されていないため、符号化モード判定のためには符号化方式で許可されているモードそれぞれに対して符号化を実施する必要があり、これに伴う演算負荷は軽減されない。以上のように、従来技術にあっては、動きベクトルの符号量が増加する可能性があること、および、符号化モード判定に伴う演算量の軽減がなされないという問題点がある。
 本発明は、このような事情に鑑みてなされたもので、動き探索および符号化モード判定に伴う映像符号化における演算量を、従来技術よりも効果的に抑止することができる映像符号化装置、映像符号化方法および映像符号化プログラムを提供することを目的とする。
 本発明は、入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化装置であって、符号化対象である入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定部と、前記判定部により静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化部と、前記判定部により微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化部と、前記判定部により通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化部とを備えたことを特徴とする。
 本発明は、前記判定部は、参照フレームと符号化対象フレームとの類似度および周辺領域における動きベクトルを用いて前記領域判定を行うことを特徴とする。
 本発明は、前記静止領域と判定された領域に対してインター符号化モードを限定して符号化を行うことを特徴とする。
 本発明は、前記微小な動きを伴う領域と判定された領域に対してインター符号化モードを限定して符号化を行うことを特徴とする。
 本発明は、前記静止領域または前記微小な動きを伴う領域と判定された領域に対してイントラ符号化を実施するか否かを決定する決定部をさらに備えることを特徴とする。
 本発明は、入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化方法であって、符号化対象である入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定ステップと、前記判定ステップにより静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化ステップと、前記判定ステップにより微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化ステップと、前記判定ステップにより通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化ステップとを有することを特徴とする。
 本発明は、前記判定ステップは、参照フレームと符号化対象フレームとの類似度および周辺領域における動きベクトルを用いて前記領域判定を行うことを特徴とする。
 本発明は、前記静止領域と判定された領域に対してインター符号化モードを限定して符号化を行うことを特徴とする。
 本発明は、前記微小な動きを伴う領域と判定された領域に対してインター符号化モードを限定して符号化を行うことを特徴とする。
 本発明は、前記静止領域または前記微小な動きを伴う領域と判定された領域に対してイントラ符号化を実施するか否かを決定する決定ステップをさらに有することを特徴とする。
 本発明は、入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化装置上のコンピュータに映像符号化処理を行わせる映像符号化プログラムであって、符号化対象である入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定ステップと、前記判定ステップにより静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化ステップと、前記判定ステップにより微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化ステップと、前記判定ステップにより通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化ステップとを前記コンピュータに行わせることを特徴とする。
 本発明によれば、領域の判定に周辺ベクトルの値を利用することで、動きベクトル符号量の増加による符号化効率低下を抑えつつ、動き探索に伴う演算量を抑止することができるという効果が得られる。また、符号化モード選択に伴う演算量も同様に抑止することができるという効果も得られる。
本発明の第一の実施形態の構成を示すブロック図である。 本発明の第一の実施形態における動き探索の探索範囲および符号化モード決定の処理動作を示すフローチャートである。
 以下、図面を参照して、本発明の一実施形態による映像符号化方法、映像符号化装置および映像符号化プログラムを説明する。図1は同実施形態の構成を示すブロック図である。この図において、符号100は、映像の符号化を行う符号化部であり、符号化部100における符号化処理は、領域判定部102、動きベクトルメモリ103、符号化モード決定部114との情報のやり取りを除いては、従来のMPEG-2、H.264その他の映像符号化を行う装置と同様である。なお、図1を参照して符号化部100の構成を説明するに際して、符号化部100が従来から普通に有する公知の機能・構成については、本発明の説明に直接関わりがない限り、その説明を簡単に行う。
 フレームメモリ101に蓄えられた入力映像信号は、予測残差信号生成部120に入力し、イントラ/インターモード決定部119から出力される予測信号との残差である予測残差信号に変更した後、直交変換部104に入力し、直交変換による変換係数を出力する。変換係数は、量子化部105に入力し、量子化部105において、符号化制御部109から設定される量子化ステップサイズに従って量子化する。この量子化された変換係数は、可変長符号化部106に入力し、可変長符号化部106において可変長符号化する。可変長符号化部106から出力する符号化データは、多重化部107において多重化し、バッファ部108に格納する。バッファ部108からは符号化ストリームとして出力する。
符号化制御部109は、バッファ部108に格納された符号化データ量から量子化部105における発生符号量を制御する。
 一方、量子化された変換係数は、逆量子化部110において逆量子化し、逆直交変換部111において逆直交変換することにより復号予測残差信号を生成する。この復号予測残差信号は、加算器121でイントラあるいはインター符号化による予測信号と加算し、復号信号を生成する。復号信号は、続くフレームの予測符号化における参照画像として用いるために、ローカルデコード画像メモリ112に格納する。
 また、フレームメモリ101に蓄積された入力映像信号は、前述の符号化処理以外に領域判定部102にも入力し、領域判定部102は入力映像および動きベクトルメモリ103から入力する周辺領域の動きベクトル情報に基づいて、静止領域か微小な動きを伴う領域か通常の動きを伴う領域かの判定を実施し、判定結果に基づいて探索範囲およびインター符号化モードを選別する動き探索制御信号を動き探索部113に入力する。
 動き探索部113はフレームメモリ101からの入力映像信号とローカルデコード画像メモリ112に格納されているローカルデコード画像とを用いて、領域判定部102から入力された動き探索制御信号に基づいて決定された探索範囲および符号化モードに従って動き探索処理を実施する。動き補償部115は検出された動きベクトルに従って、ローカルデコード画像メモリ112を参照し、インター符号化による予測信号を生成する。インターモード決定部116は、動き補償部115の処理結果に基づいてインター符号化モードを決定する。
 インター符号化に加えてイントラ符号化が実施されるが、それに先立って、符号化モード決定部114は、領域判定部102からの領域判定結果および動き探索により求まる差分絶対値和などの評価値を用いてイントラ符号化を実施するか否かを決定する。イントラ符号化部117は符号化モード決定部114の処理結果であるモード制御信号に応じて、イントラ符号化を実施する、あるいは実施しない。イントラ符号化を実施する場合は、フレームメモリ101から入力された入力映像信号を用いてイントラ符号化を実施し、イントラモード決定部118はその結果に基づいてイントラ符号化モードを決定する。
 イントラ/インターモード決定部119は、イントラモードとインターモードの結果に基づいていずれのモードを用いるか決定し、決定されたモードの予測信号を出力する。ただし、符号化モード決定部114においてイントラモードを実施しないと決定された場合は、符号化モード決定部114からの制御信号に従って必ずインターモードを選択する。
 次に、図2を参照して、動き探索の探索範囲および符号化モード決定の処理動作について説明する。図2は、動き探索の探索範囲および符号化モード決定の処理動作を示すフローチャートである。まず、参照フレームと符号化対象フレームの同位置との類似度ΔDCを計算する(ステップS1)。なお、類似度ΔDCは参照フレームと符号化対象フレームの画素間における差分絶対値和を用いることが一般的であるが、演算量を減らすために差分絶対値を計算する対象の画素を1画素あるいは2画素飛ばしとしてもよい。次に、ΔDCの値が0であるか否かを判定し(ステップS2)、ΔDC=0の場合、静止領域と判断して動き探索は実施せずに動きベクトルを(0,0)と決定し、インター符号化モードに固定する(ステップS3)。静止領域の場合は、ブロックサイズを分割しても全てのブロックで動きベクトルは(0,0)となるため符号化モードを変更する意味はなく、H.264/AVCにおいては最も動きベクトル数の少ないブロックサイズ16×16を用いるのが効率的である。
 一方、ΔDCが0より大きい場合、ΔDCが閾値Th_DCより小さいか否かを判定する(ステップS8)。この判定の結果、ΔDCが閾値Th_DCより小さい場合、周辺ベクトルの中央値から算出される|PMV|を算出し(ステップS9)、|PMV|の値が0であるか否かを判定する(ステップS10)。この判定の結果、|PMV|が0であれば、ΔDCが0の場合と同様、静止領域と判断して動き探索は実施せずに動きベクトルを(0,0)と決定し、インター符号化モードに固定する(ステップS3)。
 |PMV|の値が0より大きい場合、|PMV|が閾値Th_PMVより小さいか否かを判定する(ステップS11)。この判定の結果、|PMV|が閾値Th_PMVより小さい場合、微小な動きを持つ領域と判断して、探索範囲を狭く設定して動き探索を実施する(ステップS12)。設定される探索範囲としては、例えば、PMVと同じ動きベクトルを含む最小の探索範囲などが考えられる。図2においてはインター符号化モードについては特に制限していないが、微小な動きの場合はブロックサイズを分割しても各ブロックで求まる動きベクトルにはほとんど差がないことが予想されるため、さらに演算量を抑制するために、最も動きベクトル数の少ないブロックサイズ16×16に固定してしまい、他のインター符号化モードでの動き探索は実施しないようにしてもよい。
 ステップS3あるいはステップS12を実施した後、動き探索により求められる評価値Costを算出する(ステップS4)。一般に、ブロックマッチング手法においては、評価値Costは差分絶対値和が使用される。そして、Costが閾値Th_Costより小さいか否かを判定し(ステップS5)、小さい場合は符号化モードはインターモード固定としてイントラ符号化は実施しないことでモード選択に伴う演算量を削減する(ステップS6)。Costが閾値Th_Costより小さくない場合は、イントラ符号化を実施し、イントラモードとインターモードの効率を比較してモード判定を行う(ステップS7)。また、ΔDCが閾値Th_DCより大きい場合、あるいは、|PMV|の値がTh_PMVより大きい場合は、通常の探索範囲で動き探索を行い、符号化モードを限定することもしない(ステップS13)。
 以上説明したように、符号化対象領域に対して、参照フレームとの類似度および周辺ベクトルの値を用いて、静止領域か微小な動きを伴う領域か通常の動きを伴う領域かを判定し、静止領域と判定された領域に対してはインターの符号化モードを制限しつつ、動き探索を行うことなく動きベクトルを(0,0)と決定する。また微小な動きを持つ領域と判定された領域に対しては探索範囲を制限して動き探索を行う。また、これらの領域については、イントラ符号化を実施するか否かを、動き探索で算出された評価値と閾値との比較で決定する。通常の動きを伴う領域と判断された領域に対しては、通常の探索範囲で動き探索を行う。
 このような手法を用いることにより、静止領域か、微小な動きを伴う領域か、または通常の動きを伴う領域かの判定に、参照フレームとの類似度に加えて周辺ベクトルの値を利用することで、動きベクトルの情報量が大きくなることを抑えつつ、静止領域及び微小な動きを伴う領域については、狭い範囲での動き探索に限定することにより、動き探索の演算量を抑える。また、静止領域について、インターの符号化モードを制限することでインターモード選択に伴う演算量を抑える。さらに、これらの領域について、イントラ符号化を実施せずに、動き探索で算出された評価値と閾値との比較のみでイントラ符号化の実施/非実施を決定することで、イントラ/インターモード選択に伴う演算量を抑えることができる。
 なお、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより映像符号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
 また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
 動き探索および符号化モード判定に伴う演算量を、効果的に抑止することができる映像符号化装置を提供することができる。
 映像符号化処理において、動き探索及び符号化モード選択における演算量を抑止することが不可欠な用途に適用できる。
 100  符号化部
 101  フレームメモリ
 102  領域判定部
 103  動きベクトル
 104  直交変換部
 105  量子化部
 106  可変長符号化部
 107  多重化部
 108  バッファ部
 109  符号化制御部
 110  逆量子化部
 111  逆直交変換部
 112  ローカルデコード画像メモリ
 113  動き探索部
 114  符号化モード決定部
 115  動き補償部
 116  インターモード決定部
 117  イントラ符号化部
 118  イントラモード決定部
 119  イントラ/インターモード決定部
 120  予測残差信号生成部
 121  加算器

Claims (11)

  1.  入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化装置であって、
     符号化対象である前記入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定部と、
     前記判定部により静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化部と、
     前記判定部により微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化部と、
     前記判定部により通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化部と
     を備えた映像符号化装置。
  2.  前記判定部は、参照フレームと符号化対象フレームとの類似度および周辺領域における動きベクトルを用いて前記静止領域か、前記微小な動きを伴う領域か、前記通常の動きを伴う領域かを判定する請求項1に記載の映像符号化装置。
  3.  前記静止領域と判定された領域に対してインター符号化モードを限定して符号化を行う請求項1または請求項2記載の映像符号化装置。
  4.  前記微小な動きを伴う領域と判定された領域に対してインター符号化モードを限定して符号化を行う請求項1から3のいずれか1項に記載の映像符号化装置。
  5.  前記静止領域または微小な動きを伴う領域と判定された領域に対してイントラ符号化を実施するか否かを決定する決定部をさらに備えた請求項1から4のいずれか1項に記載の映像符号化装置。
  6.  入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化方法であって、
     符号化対象である前記入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定ステップと、
     前記判定ステップにより静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化ステップと、
     前記判定ステップにより微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化ステップと、
     前記判定ステップにより通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化ステップと
     を有する映像符号化方法。
  7.  前記判定ステップは、参照フレームと符号化対象フレームとの類似度および周辺領域における動きベクトルを用いて前記静止領域か、前記微小な動きを伴う領域か、前記通常の動きを伴う領域かの判定を行う請求項6に記載の映像符号化方法。
  8.  前記静止領域と判定された領域に対してインター符号化モードを限定して符号化を行う請求項6または請求項7記載の映像符号化方法。
  9.  前記微小な動きを伴う領域と判定された領域に対してインター符号化モードを限定して符号化を行う請求項6から8のいずれか1項に記載の映像符号化方法。
  10.  前記静止領域または微小な動きを伴う領域と判定された領域に対してイントラ符号化を実施するか否かを決定する決定ステップをさらに有する請求項6から9のいずれか1項に記載の映像符号化方法。
  11.  入力映像信号に対してイントラ符号化および動き補償を伴うインター符号化を用いる映像符号化装置上のコンピュータに映像符号化処理を行わせる映像符号化プログラムであって、
     符号化対象である入力映像信号に対して静止領域か、微小な動きを伴う領域か、通常の動きを伴う領域かを判定する判定ステップと、
     前記判定ステップにより静止領域と判定された領域に対して動きベクトル(0,0)のインター符号化を行う第1の符号化ステップと、
     前記判定ステップにより微小な動きを伴う領域と判定された領域に対して制限された探索範囲内において動き探索およびインター符号化を行う第2の符号化ステップと、
     前記判定ステップにより通常の動きを伴う領域と判断された領域に対して通常の探索範囲で動き探索およびインター符号化を行う第3の符号化ステップと
     を前記コンピュータに行わせる映像符号化プログラム。
PCT/JP2012/055630 2011-03-09 2012-03-06 映像符号化装置、映像符号化方法および映像符号化プログラム WO2012121234A1 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
RU2013140686/07A RU2551473C2 (ru) 2011-03-09 2012-03-06 Устройство кодирования видео, способ кодирования видео и программа кодирования видео
KR1020137023353A KR101623064B1 (ko) 2011-03-09 2012-03-06 영상 부호화 장치, 영상 부호화 방법 및 영상 부호화 프로그램
EP12754752.9A EP2670143B1 (en) 2011-03-09 2012-03-06 Video encoding device, video encoding method and video encoding program
CA2828695A CA2828695A1 (en) 2011-03-09 2012-03-06 Video encoding device, video encoding method and video encoding program
ES12754752.9T ES2609303T3 (es) 2011-03-09 2012-03-06 Dispositivo de codificación de vídeo, procedimiento de codificación de vídeo y programa de codificación de vídeo
BR112013022577A BR112013022577A2 (pt) 2011-03-09 2012-03-06 dispositivo de codificação de vídeo, método de codificação de vídeo e programa de codificação de vídeo
CN201280011680.6A CN103430546B (zh) 2011-03-09 2012-03-06 视频编码装置、视频编码方法以及视频编码程序
US14/001,841 US9445089B2 (en) 2011-03-09 2012-03-06 Video encoding device, video encoding method and video encoding program
JP2013503549A JP5613319B2 (ja) 2011-03-09 2012-03-06 映像符号化装置、映像符号化方法および映像符号化プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-051354 2011-03-09
JP2011051354 2011-03-09

Publications (1)

Publication Number Publication Date
WO2012121234A1 true WO2012121234A1 (ja) 2012-09-13

Family

ID=46798192

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/055630 WO2012121234A1 (ja) 2011-03-09 2012-03-06 映像符号化装置、映像符号化方法および映像符号化プログラム

Country Status (11)

Country Link
US (1) US9445089B2 (ja)
EP (1) EP2670143B1 (ja)
JP (1) JP5613319B2 (ja)
KR (1) KR101623064B1 (ja)
CN (1) CN103430546B (ja)
BR (1) BR112013022577A2 (ja)
CA (1) CA2828695A1 (ja)
ES (1) ES2609303T3 (ja)
RU (1) RU2551473C2 (ja)
TW (1) TWI511531B (ja)
WO (1) WO2012121234A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015226111A (ja) * 2014-05-26 2015-12-14 キヤノン株式会社 画像処理装置、画像処理装置の制御方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6391694B2 (ja) 2015-07-31 2018-09-19 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd ビデオ符号化方法及びシステム
JP6240328B2 (ja) 2015-07-31 2017-11-29 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd オプティカルフロー場を構築する方法
EP3207708B1 (en) 2015-07-31 2021-10-13 SZ DJI Technology Co., Ltd. Method and system of modifying search areas
CN106993187B (zh) 2017-04-07 2019-09-06 珠海全志科技股份有限公司 一种可变帧率的编码方法及装置
US11263261B2 (en) * 2020-02-14 2022-03-01 Alibaba Group Holding Limited Method and system for characteristic-based video processing
CN117376571A (zh) * 2022-06-30 2024-01-09 深圳市中兴微电子技术有限公司 图像处理方法、电子设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05328333A (ja) * 1992-05-15 1993-12-10 Toshiba Corp 動きベクトル検出装置
JPH0832969A (ja) 1994-07-12 1996-02-02 Canon Inc 動きベクトル検出装置
JP2000188735A (ja) * 1998-12-21 2000-07-04 Hitachi Ltd 動きベクトル検出装置及びこれを用いた動画像符号化装置
JP2002223419A (ja) * 2000-10-20 2002-08-09 Matsushita Electric Ind Co Ltd 順次走査変換方法および順次走査変換装置
JP2003244707A (ja) * 2002-01-26 2003-08-29 Lg Electronics Inc 動きベクトル検索領域の適応的決定方法
WO2005036887A1 (ja) * 2003-10-14 2005-04-21 Nec Corporation 動きベクトル探索方法、動きベクトル探索装置および動きベクトル探索プログラム
JP2009055144A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 動き補償付きテンポラルフィルタ処理装置,処理方法,処理プログラムおよびコンピュータ読み取り可能な記録媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020196854A1 (en) * 2001-06-15 2002-12-26 Jongil Kim Fast video encoder using adaptive hierarchical video processing in a down-sampled domain
JP3977716B2 (ja) * 2002-09-20 2007-09-19 株式会社東芝 動画像符号化/復号化方法及び装置
US7020201B2 (en) * 2002-11-20 2006-03-28 National Chiao Tung University Method and apparatus for motion estimation with all binary representation
JP3880985B2 (ja) * 2004-08-05 2007-02-14 松下電器産業株式会社 動きベクトル検出装置および動きベクトル検出方法
EP1734768A1 (en) * 2005-06-15 2006-12-20 Matsushita Electric Industrial Co., Ltd. Adaptive video with intra/inter mode decision based on network congestion
US7830961B2 (en) * 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
US8107748B2 (en) * 2005-09-16 2012-01-31 Sony Corporation Adaptive motion search range
US7852940B2 (en) * 2005-10-20 2010-12-14 Qualcomm Incorporated Scalable motion estimation for video encoding
KR101083379B1 (ko) * 2007-03-14 2011-11-14 니폰덴신뎅와 가부시키가이샤 움직임 벡터 탐색 방법 및 장치 그리고 프로그램을 기록한 기록매체
JP4212109B2 (ja) * 2007-03-20 2009-01-21 パナソニック株式会社 撮影装置および撮影方法
WO2010150486A1 (ja) * 2009-06-22 2010-12-29 パナソニック株式会社 画像符号化方法及び画像符号化装置
JP5489557B2 (ja) * 2009-07-01 2014-05-14 パナソニック株式会社 画像符号化装置及び画像符号化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05328333A (ja) * 1992-05-15 1993-12-10 Toshiba Corp 動きベクトル検出装置
JPH0832969A (ja) 1994-07-12 1996-02-02 Canon Inc 動きベクトル検出装置
JP2000188735A (ja) * 1998-12-21 2000-07-04 Hitachi Ltd 動きベクトル検出装置及びこれを用いた動画像符号化装置
JP2002223419A (ja) * 2000-10-20 2002-08-09 Matsushita Electric Ind Co Ltd 順次走査変換方法および順次走査変換装置
JP2003244707A (ja) * 2002-01-26 2003-08-29 Lg Electronics Inc 動きベクトル検索領域の適応的決定方法
WO2005036887A1 (ja) * 2003-10-14 2005-04-21 Nec Corporation 動きベクトル探索方法、動きベクトル探索装置および動きベクトル探索プログラム
JP2009055144A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 動き補償付きテンポラルフィルタ処理装置,処理方法,処理プログラムおよびコンピュータ読み取り可能な記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2670143A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015226111A (ja) * 2014-05-26 2015-12-14 キヤノン株式会社 画像処理装置、画像処理装置の制御方法
US9948932B2 (en) 2014-05-26 2018-04-17 Canon Kabushiki Kaisha Image processing apparatus and control method of image processing apparatus

Also Published As

Publication number Publication date
US20130336387A1 (en) 2013-12-19
ES2609303T3 (es) 2017-04-19
JP5613319B2 (ja) 2014-10-22
TWI511531B (zh) 2015-12-01
TW201244498A (en) 2012-11-01
CN103430546A (zh) 2013-12-04
EP2670143B1 (en) 2016-09-28
RU2551473C2 (ru) 2015-05-27
KR20130126698A (ko) 2013-11-20
KR101623064B1 (ko) 2016-05-20
EP2670143A4 (en) 2014-12-17
JPWO2012121234A1 (ja) 2014-07-17
BR112013022577A2 (pt) 2016-12-06
US9445089B2 (en) 2016-09-13
RU2013140686A (ru) 2015-04-20
CA2828695A1 (en) 2012-09-13
EP2670143A1 (en) 2013-12-04
CN103430546B (zh) 2017-08-04

Similar Documents

Publication Publication Date Title
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
JP5613319B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
WO2010035370A1 (ja) 動画像符号化方法および動画像復号化方法
JP2007013298A (ja) 画像符号化装置
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
JP5670226B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
JP2020113923A (ja) 動画像符号化プログラム、及び動画像符号化装置
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP2009055143A (ja) 動画像符号化における動き評価装置,方法およびそのプログラム並びにその記録媒体
KR100790757B1 (ko) H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법
JP2016187134A (ja) 予測モード判定方法及び予測モード判定プログラム
JP5788952B2 (ja) 動画像復号化方法
KR101786921B1 (ko) 고속 움직임 추정을 위한 장치 및 방법
JP5864022B2 (ja) 動画像復号化方法
JP6178698B2 (ja) 映像符号化装置
JP5887020B1 (ja) 動画像復号化方法
JP6080726B2 (ja) 動画像符号化装置及び画面内予測モード決定方法及びプログラム
JP5990133B2 (ja) 映像符号化装置及び映像符号化方法
KR101786957B1 (ko) 고속 움직임 추정을 위한 장치 및 방법
JPWO2009128208A1 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法
JP2016136741A (ja) 動画像復号化方法
JP2015228687A (ja) 予測ベクトルの算出方法
JP2013197628A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
JP2011066596A (ja) 映像信号符号化方法,映像信号復号方法,映像信号符号化装置,映像信号復号装置およびそれらのプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12754752

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
ENP Entry into the national phase

Ref document number: 2013503549

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14001841

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2828695

Country of ref document: CA

REEP Request for entry into the european phase

Ref document number: 2012754752

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2012754752

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 20137023353

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2013140686

Country of ref document: RU

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112013022577

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112013022577

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20130904