JP6339977B2 - Video encoding apparatus and video encoding program - Google Patents

Video encoding apparatus and video encoding program Download PDF

Info

Publication number
JP6339977B2
JP6339977B2 JP2015141395A JP2015141395A JP6339977B2 JP 6339977 B2 JP6339977 B2 JP 6339977B2 JP 2015141395 A JP2015141395 A JP 2015141395A JP 2015141395 A JP2015141395 A JP 2015141395A JP 6339977 B2 JP6339977 B2 JP 6339977B2
Authority
JP
Japan
Prior art keywords
block size
cost
motion
candidate
size candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015141395A
Other languages
Japanese (ja)
Other versions
JP2017028337A (en
Inventor
優也 大森
優也 大森
卓 佐野
卓 佐野
大西 隆之
隆之 大西
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015141395A priority Critical patent/JP6339977B2/en
Publication of JP2017028337A publication Critical patent/JP2017028337A/en
Application granted granted Critical
Publication of JP6339977B2 publication Critical patent/JP6339977B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動き予測を用いて映像符号化を行う映像符号化装置及び映像符号化プログラムに関する。   The present invention relates to a video encoding device and a video encoding program that perform video encoding using motion prediction.

映像符号化技術は、MPEG−2、MPEG−4、MPEG−4/AVCが多く用いられており、最近では次世代の映像符号化規格であるHEVC(High Efficiency Video Coding)が規格化され、今後の普及が見込まれる。映像符号化規格では、1つのピクチャ内に閉じた情報を用いて符号化を行う画面内符号化と、時間的に連続した複数のピクチャを用いて符号化を行う画面間符号化が用いられている。画面間符号化には画面間の差分値を削減するために動き予測処理を行い、差分値と動きベクトル情報を符号化することで情報量を削減している。   MPEG-2, MPEG-4, and MPEG-4 / AVC are often used as video encoding technologies. Recently, the next generation video encoding standard, HEVC (High Efficiency Video Coding), has been standardized. Is expected to spread. In the video coding standard, intra-frame coding that performs coding using information closed in one picture and inter-screen coding that performs coding using a plurality of temporally continuous pictures are used. Yes. In inter-frame coding, motion prediction processing is performed to reduce the difference value between the screens, and the information amount is reduced by encoding the difference value and the motion vector information.

画面間符号化における動き予測では、映像の正しい動きを捉えて動き予測を行い符号化すべき情報を小さくするため、動きベクトルの検出処理に膨大な演算量を必要とする。少ない演算量で高精度な動きベクトルを得る手法としては、階層的動きベクトル検出法等が用いられる。階層的動きベクトル検出法では、符号化対象ブロックの大まかな動きを捕える事前動き予測処理を行い、事前動き予測処理から得られた探索結果を元にして再度より高精度な動き予測を行うことで、動きベクトル探索に要する演算量を削減している。   In motion prediction in inter-frame coding, a motion vector is detected and motion prediction is performed to reduce the information to be encoded, so that a large amount of calculation is required for motion vector detection processing. As a technique for obtaining a highly accurate motion vector with a small amount of calculation, a hierarchical motion vector detection method or the like is used. In the hierarchical motion vector detection method, a preliminary motion prediction process that captures the rough motion of the encoding target block is performed, and a higher-precision motion prediction is performed again based on the search result obtained from the preliminary motion prediction process. The amount of calculation required for motion vector search is reduced.

また、動き予測処理では符号化ブロックごとにピクチャ間の動きベクトルを検出しているが、MPEG−4/AVC、HEVCでは各符号化ブロックのサイズを複数のブロックサイズ候補の中から選択することができる。MPEG−4/AVCでは、符号化処理はマクロブロックという16×16画素単位で行われ、予測処理単位は16×16、8×8、4×4の3種類のブロックサイズ候補が選択できる。HEVCでは、符号化処理はコーディングユニット(CU)という単位で64×64、32×32、16×16、8×8の4種類のブロックサイズ候補で行われ、画面間予測においてはCUをさらに8種類の形状に分割してプレディクションユニット(PU)という単位で処理を行う。各ブロックサイズで動きベクトル探索を行うことで、より効率の高い画面間符号化が可能できる。   In the motion prediction process, a motion vector between pictures is detected for each coding block. In MPEG-4 / AVC and HEVC, the size of each coding block can be selected from a plurality of block size candidates. it can. In MPEG-4 / AVC, encoding processing is performed in units of 16 × 16 pixels called macroblocks, and three types of block size candidates of 16 × 16, 8 × 8, and 4 × 4 can be selected as prediction processing units. In HEVC, encoding processing is performed with four types of block size candidates of 64 × 64, 32 × 32, 16 × 16, and 8 × 8 in units of coding units (CU), and an additional CU is used for inter-screen prediction. The process is divided into different shapes and processed in units called prediction units (PU). By performing motion vector search with each block size, more efficient inter-frame coding can be performed.

一方で、複数のブロックサイズ候補の全てを考慮して動きベクトル探索を行い最も高効率な画面間予測方法を決定する処理は、単一のブロックサイズに限定された動き予測処理の場合に比較し、演算処理量が大幅に増大するという問題がある。これに対し、小さいブロックサイズから順次統合してコストを比較していくのではなく、任意の2点のブロックサイズのコストを算出して比較することでブロックサイズを早期に決定し、動き予測に要する演算量を削減する手法が考案されている(例えば、特許文献1参照)。   On the other hand, the process of determining the most efficient inter-frame prediction method by performing a motion vector search considering all of the plurality of block size candidates is compared with the case of the motion prediction process limited to a single block size. There is a problem that the amount of calculation processing increases significantly. On the other hand, instead of sequentially integrating costs starting from a small block size, the cost of any two block sizes is calculated and compared to determine the block size at an early stage for motion prediction. A technique for reducing the amount of calculation required has been devised (see, for example, Patent Document 1).

特開2014−127891号公報JP 2014-127891 A

しかしながら、特許文献1に記載の手法はRD(Rate Distortion)コストを用いるためコスト値取得に対象ブロックの符号化結果が必要であり、また、階層的動きベクトル検出法と併用する場合最後の階層の動き探索時までブロックサイズを絞込まないため、演算量が膨大となる。さらに、特許文献1に記載の映像符号化装置は符号化対象ブロックによって動き予測に要する演算量が変化するため、ハードウェア実装の観点では、ハードウェア規模増大やハードウェアの使用効率低下につながるという問題がある。   However, since the method described in Patent Document 1 uses an RD (Rate Distortion) cost, an encoding result of the target block is necessary for cost value acquisition, and when used in combination with the hierarchical motion vector detection method, Since the block size is not narrowed down until motion search, the amount of calculation becomes enormous. Furthermore, since the amount of calculation required for motion prediction varies depending on the encoding target block in the video encoding device described in Patent Document 1, from the viewpoint of hardware implementation, it leads to an increase in hardware scale and a decrease in hardware usage efficiency. There's a problem.

本発明は、このような事情に鑑みてなされたもので、符号化効率の低下を抑えつつ演算量の削減を行うことができる映像符号化装置及び映像符号化プログラムを提供することを目的とする。   The present invention has been made in view of such circumstances, and an object of the present invention is to provide a video encoding device and a video encoding program capable of reducing the amount of calculation while suppressing a decrease in encoding efficiency. .

本発明の一態様は、入力映像信号のピクチャの時間的相関を利用し、符号化対象ピクチャについて符号化ブロック単位に動き予測を行って差分信号の符号化処理を行う映像符号化装置であって、前記符号化対象ピクチャと動き予測先の復号映像信号の参照ピクチャを用いて、対象符号化ブロックの大まかな動きを捕える事前動き予測処理を全符号化ブロックサイズそれぞれについて行い、各符号化ブロックサイズにおける事前動き予測処理コストを算出する事前動き予測処理手段と、前記事前動き予測処理コストに基づいて、第1の符号化ブロックサイズ候補におけるブロックサイズ候補コストと第2の符号化ブロックサイズ候補におけるブロックサイズ候補コストを決定するブロックサイズ候補コスト手段と、前記入力映像信号の符号化済みピクチャの動きベクトル情報に基づいて、動き統計パラメータを決定するパラメータ決定手段と、前記動き統計パラメータと、前記符号化対象ピクチャの参照構造における階層の深さとに基づいて、コスト比較オフセット値を設定するオフセット値設定手段と、前記第1の符号化ブロックサイズ候補におけるブロックサイズ候補コストと、前記第2の符号化ブロックサイズ候補におけるブロックサイズ候補コストと、前記コスト比較オフセット値とに基づいて、前記符号化対象ピクチャの符号化ブロックのサイズ候補を全ブロックサイズ候補の中から第1のブロックサイズ候補または第2のブロックサイズ候補のいずれかに決定するブロックサイズ候補決定手段と、決定された符号化ブロックサイズ候補を用いて、前記符号化対象ピクチャの動き予測処理を行いブロックサイズ決定及び動きベクトル決定を行う動き探索手段とを備える映像符号化装置である。   One aspect of the present invention is a video encoding apparatus that performs temporal prediction of a picture to be encoded, performs motion prediction for each encoding block, and encodes a differential signal using a temporal correlation of a picture of an input video signal. Then, using the reference picture of the encoding target picture and the decoded picture signal of the motion prediction destination, a pre-motion prediction process for capturing a rough motion of the target encoding block is performed for each of all encoding block sizes, and each encoding block size is determined. A pre-motion prediction processing means for calculating a pre-motion prediction processing cost in the block, and a block size candidate cost in the first coding block size candidate and a second coding block size candidate based on the pre-motion prediction processing cost Block size candidate cost means for determining a block size candidate cost, and the encoded input video signal A cost comparison offset value is set based on parameter determination means for determining a motion statistical parameter based on the motion vector information of the picture, the motion statistical parameter, and the depth of the hierarchy in the reference structure of the encoding target picture. Based on the offset value setting means, the block size candidate cost in the first encoded block size candidate, the block size candidate cost in the second encoded block size candidate, and the cost comparison offset value, the code Block size candidate determining means for determining a coding block size candidate of the encoding target picture as one of the first block size candidate and the second block size candidate from all block size candidates, and the determined coding block Using the size candidates, the encoding target picture A video encoding apparatus and a motion search unit to perform block size determination and motion vector decision performs motion prediction processing.

本発明の一態様は、前記映像符号化装置であって、前記パラメータ決定手段は、前記入力映像信号の指定された符号化済みピクチャにおける全ての動きベクトルを算出し、前記動きベクトルの絶対値和を前記符号化対象ピクチャの動き統計パラメータとして決定する。   One aspect of the present invention is the video encoding device, wherein the parameter determination unit calculates all motion vectors in a specified encoded picture of the input video signal, and sums absolute values of the motion vectors. Are determined as motion statistics parameters of the picture to be encoded.

本発明の一態様は、前記映像符号化装置であって、前記パラメータ決定手段は、前記入力映像信号の指定された符号化済みピクチャにおける全ての動きベクトルを算出し、前記動きベクトルの分散値を前記符号化対象ピクチャの動き統計パラメータとして決定する。   One aspect of the present invention is the video encoding device, wherein the parameter determining unit calculates all motion vectors in a specified encoded picture of the input video signal, and calculates a variance value of the motion vector. It is determined as a motion statistical parameter of the picture to be encoded.

本発明の一態様は、前記映像符号化装置であって、前記ブロックサイズ候補決定手段は、前記第2のブロックサイズ候補における動きベクトルのコストと前記コスト比較オフセット値との和を算出し、算出した前記和と前記第1のブロックサイズ候補における動きベクトルのコストとを比較した結果、前記第1のブロックサイズ候補におけるコストの方が大きいと判定された場合、前記符号化対象ピクチャのブロックサイズ候補を第2のブロックサイズ候補とし、前記第1のブロックサイズ候補におけるコストの方が小さいと判定された場合、前記符号化対象ピクチャのブロックサイズ候補を第1のブロックサイズ候補とする。   One aspect of the present invention is the video encoding device, wherein the block size candidate determining unit calculates a sum of a cost of a motion vector and the cost comparison offset value in the second block size candidate. If the cost of the first block size candidate is determined to be larger as a result of comparing the sum and the cost of the motion vector in the first block size candidate, the block size candidate of the encoding target picture Is the second block size candidate, and if it is determined that the cost of the first block size candidate is smaller, the block size candidate of the coding target picture is set as the first block size candidate.

本発明の一態様は、コンピュータを、前記映像符号化装置として機能させるための映像符号化プログラムである。   One aspect of the present invention is a video encoding program for causing a computer to function as the video encoding device.

本発明によれば、符号化ブロックサイズ候補が複数存在するような動き予測部を有する映像符号化方式において、符号化対象ピクチャの参照構造における階層の深さと符号化済みピクチャの動きベクトル情報に基づいてブロックサイズ候補を適切に決定することで、符号化効率の低下を抑えつつ演算量を削減することができるという効果が得られる。   According to the present invention, in a video encoding system having a motion prediction unit in which there are a plurality of encoding block size candidates, based on the layer depth in the reference structure of the encoding target picture and the motion vector information of the encoded picture. By appropriately determining the block size candidates, it is possible to reduce the amount of calculation while suppressing a decrease in encoding efficiency.

本発明の一実施形態による映像符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the video coding apparatus by one Embodiment of this invention. 図1に示すインター予測処理部102の構成の示すブロック図である。It is a block diagram which shows the structure of the inter prediction process part 102 shown in FIG. 図2に示すインター予測処理部102の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the inter prediction process part 102 shown in FIG. ランダム・アクセス符号化モードにおける画面間参照構造を示す図である。It is a figure which shows the reference structure between screens in random access encoding mode. 図2に示すブロックサイズ候補決定部202の構成を示すブロック図である。It is a block diagram which shows the structure of the block size candidate determination part 202 shown in FIG. 図5に示すブロックサイズ候補決定部202の動作を示すフローチャートである。6 is a flowchart showing an operation of a block size candidate determination unit 202 shown in FIG. 5. 図5に示す候補コスト生成部301の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of the candidate cost production | generation part 301 shown in FIG. 図5に示すオフセット決定部302の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of the offset determination part 302 shown in FIG. 図5に示す候補コスト比較部303の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of the candidate cost comparison part 303 shown in FIG.

以下、図面を参照して、本発明の一実施形態による映像符号化装置を説明する。以下で用いる「符号化ブロック」については、MPEG−2やH.264/AVC規格ではマクロブロックのことを示し、HEVCについてはコーディングユニット(CU)又はプレディクションユニット(PU)のことを指し示す。図1は同実施形態による映像符号化装置の構成を示すブロック図である。図1に示す映像符号化装置100において、インター予測処理102が従来技術と異なる部分であり、他の部分はH.264/AVCやHEVC等の映像符号化装置として用いられている従来の一般的な構成と同様である。   Hereinafter, a video encoding apparatus according to an embodiment of the present invention will be described with reference to the drawings. The “encoded block” used below is MPEG-2 or H.264. The H.264 / AVC standard indicates a macro block, and HEVC indicates a coding unit (CU) or a prediction unit (PU). FIG. 1 is a block diagram showing a configuration of a video encoding apparatus according to the embodiment. In the video encoding apparatus 100 shown in FIG. 1, the inter prediction process 102 is a part different from the prior art, and the other part is H.264. This is the same as the conventional general configuration used as a video encoding device such as H.264 / AVC or HEVC.

映像符号化装置100は、符号化対象の映像信号(原画像)を入力とし、入力映像信号のピクチャをブロックに分割してブロックごとに符号化し、そのビットストリームを符号化ストリームとして出力する。この符号化のため、予測残差信号生成部103は、入力映像信号とイントラ予測処理部あるいはインター予測処理部の出力である予測信号との差分を求め、それを予測残差信号として出力する。   The video encoding apparatus 100 receives a video signal (original image) to be encoded as an input, divides a picture of the input video signal into blocks, encodes each block, and outputs the bit stream as an encoded stream. For this encoding, the prediction residual signal generation unit 103 obtains a difference between the input video signal and the prediction signal output from the intra prediction processing unit or the inter prediction processing unit, and outputs it as a prediction residual signal.

変換・量子化処理部104は、予測残差信号を入力とし、入力された予測残差信号に対して離散コサイン変換等の直交変換を行い、変換係数を量子化し、その量子化された変換係数を出力する。エントロピー符号化処理部105は、量子化された変換係数を入力とし、入力された量子化された変換係数をエントロピー符号化し、符号化ストリームとして出力する。   The transform / quantization processing unit 104 receives the prediction residual signal, performs orthogonal transform such as discrete cosine transform on the input prediction residual signal, quantizes the transform coefficient, and the quantized transform coefficient Is output. The entropy encoding processing unit 105 receives the quantized transform coefficient as input, entropy-encodes the input quantized transform coefficient, and outputs it as an encoded stream.

一方、量子化された変換係数は、逆量子化・逆変換処理部106にも入力され、ここで逆量子化と逆直交変換され、予測残差復号信号を出力する。復号信号生成部107は、逆量子化・逆変換処理部106の出力である予測残差復号信号とイントラ予測処理部101またはインター予測処理部102の出力である予測信号とを加算し、符号化した符号化対象ブロックの復号信号を生成する。この復号信号は、インター予測処理部102で参照画像として用いるために、ループフィルタ処理部108に入力される。ループフィルタ処理部108では復号信号に対して符号化歪みを低減するフィルタリング処理を行い、このフィルタリング処理後の画像を参照画像としてインター予測処理部102に入力する。   On the other hand, the quantized transform coefficient is also input to the inverse quantization / inverse transform processing unit 106, where inverse quantization and inverse orthogonal transform are performed, and a prediction residual decoded signal is output. The decoded signal generation unit 107 adds the prediction residual decoded signal output from the inverse quantization / inverse conversion processing unit 106 and the prediction signal output from the intra prediction processing unit 101 or the inter prediction processing unit 102 to perform encoding. The decoded signal of the encoding target block is generated. This decoded signal is input to the loop filter processing unit 108 for use as a reference image by the inter prediction processing unit 102. The loop filter processing unit 108 performs filtering processing for reducing the coding distortion on the decoded signal, and inputs the image after the filtering processing to the inter prediction processing unit 102 as a reference image.

本実施形態は、図1に示すインター予測処理部102において、ブロックサイズ候補を適切に絞り込んで動き探索処理を行うことで、符号化効率を低下させずにインター予測処理に要する処理量を削減するものである。   In the present embodiment, the inter prediction processing unit 102 shown in FIG. 1 performs motion search processing by appropriately narrowing down block size candidates, thereby reducing the processing amount required for the inter prediction processing without reducing the coding efficiency. Is.

以下の説明は、HEVC規格に基づいた実施形態として説明する。以下の実施形態は、HEVCにおける64×64、32×32、16×16、8×8の4種類のブロックサイズ候補から、3種類のブロックサイズ候補に絞り込む手法である。実施形態における処理は64×64の領域単位で実行される。以下の実施形態の中で用いているコスト値とは、原画像と動きベクトルが指し示す参照画像との差分絶対値和(SAD)もしくは差分値に2次元アダマール変換を行った値の差分絶対値和(SATD)と、動きベクトルを符号化した際に生じる符号量を簡易的に見積もった動きベクトルコスト値の和で表される値を表している。   The following description will be described as an embodiment based on the HEVC standard. The following embodiment is a method of narrowing down from four types of block size candidates of 64 × 64, 32 × 32, 16 × 16, and 8 × 8 in HEVC to three types of block size candidates. The processing in the embodiment is executed in units of 64 × 64 areas. The cost value used in the following embodiments refers to the sum of absolute differences (SAD) between the original image and the reference image indicated by the motion vector, or the sum of absolute differences obtained by performing two-dimensional Hadamard transformation on the difference values. (SATD) and a value represented by the sum of motion vector cost values obtained by simply estimating the amount of code generated when the motion vector is encoded.

次に、図1に示すインター予測処理部102の構成と動作を説明する。図2は、図1に示すインター予測処理部102の構成の示すブロック図である。インター予測処理部102は、事前動きを予測する事前動き予測処理部201と、ブロックサイズ候補を決定するブロックサイズ候補決定部202と、動き探索を行う動き探索処理部203とを備える。   Next, the configuration and operation of the inter prediction processing unit 102 illustrated in FIG. 1 will be described. FIG. 2 is a block diagram illustrating a configuration of the inter prediction processing unit 102 illustrated in FIG. 1. The inter prediction processing unit 102 includes a pre-motion prediction processing unit 201 that predicts pre-motion, a block size candidate determination unit 202 that determines block size candidates, and a motion search processing unit 203 that performs motion search.

次に、図3を参照して、図2に示すインター予測処理部102の動作を説明する。図3は、図2に示すインター予測処理部102の動作を示すフローチャートである。まず、事前動き予測処理部201は、入力映像信号(原画像)とループフィルタ処理部108より入力される復号信号を入力とし、入力映像信号の大まかな動きを捕える事前動き探索を行う(ステップS1)。   Next, the operation of the inter prediction processing unit 102 shown in FIG. 2 will be described with reference to FIG. FIG. 3 is a flowchart showing the operation of the inter prediction processing unit 102 shown in FIG. First, the prior motion prediction processing unit 201 receives an input video signal (original image) and a decoded signal input from the loop filter processing unit 108 as input, and performs a prior motion search for capturing a rough motion of the input video signal (step S1). ).

事前動き予測処理部201は、入力映像信号中の対象となる64×64領域における各ブロックサイズそれぞれで動き探索を行い、各ブロックサイズごとの動きベクトル及びそれに伴うコスト値を算出し、出力する。64×64ブロックサイズのコスト値とは、対象の64×64領域を分割せずに64×64ブロックとして処理した場合のコスト値である。32×32ブロックサイズのコスト値とは、対象の64×64領域を縦横それぞれ2分割した際の、4つの32×32ブロックにおける各コスト値である。16×16ブロックサイズのコスト値とは、対象の64×64領域を縦横それぞれ4分割した際の、16つの16×16ブロックにおける各コスト値である。8×8ブロックサイズのコスト値とは、対象の64×64領域を縦横それぞれ8分割した際の、64つの8×8ブロックにおける各コスト値である。また、事前動き予測処理部201は、入力映像信号(原画像)のフレーム番号から、TemporalIDを算出して符号化情報とし、この符号化情報をブロックサイズ候補決定部202に出力する。   The prior motion prediction processing unit 201 performs a motion search for each block size in a target 64 × 64 region in the input video signal, calculates a motion vector for each block size, and a cost value associated therewith, and outputs the motion vector. The cost value of the 64 × 64 block size is a cost value when the target 64 × 64 region is processed as 64 × 64 blocks without being divided. The cost value of the 32 × 32 block size is a cost value in four 32 × 32 blocks when the target 64 × 64 region is divided into two parts in the vertical and horizontal directions. The cost value of the 16 × 16 block size is each cost value in 16 16 × 16 blocks when the target 64 × 64 region is divided into four in each of the vertical and horizontal directions. The cost value of the 8 × 8 block size is each cost value in 64 8 × 8 blocks when the target 64 × 64 region is divided into 8 parts in the vertical and horizontal directions. Further, the prior motion prediction processing unit 201 calculates TemporalID from the frame number of the input video signal (original image) as encoded information, and outputs the encoded information to the block size candidate determining unit 202.

次に、ブロックサイズ候補決定部202は、事前動き予測処理部201で算出された各ブロックサイズのコスト値と、動き探索処理部203で算出される符号化済みの過去のフレームである符号化済みピクチャにおける特定の場合の動きベクトル統計値、及び当該ピクチャの符号化情報を入力とし、ブロックサイズ候補の絞り込み処理を行う(ステップS2)。絞り込み処理とは、候補数を減らす処理のことである。例えば、後述するように複数のブロックサイズ候補を2つの候補のグループにし、いずれかの候補に決定することを指す。後述する説明では2つの候補のグループにし、いずれかの候補に決定する例で説明するが、候補数を減らす処理であればよく、これに限るものではない。事前動き予測処理部201で探索した結果である、各ブロックサイズごとの動きベクトル、及びブロックサイズ候補決定部202で絞り込まれたブロックサイズ候補は、動き探索処理部203に対してそれぞれ出力する。   Next, the block size candidate determination unit 202 encodes the cost value of each block size calculated by the prior motion prediction processing unit 201 and the encoded past frame calculated by the motion search processing unit 203. The motion vector statistical value in a specific case in the picture and the coding information of the picture are input, and the block size candidate narrowing process is performed (step S2). The narrowing-down process is a process for reducing the number of candidates. For example, as will be described later, this refers to making a plurality of block size candidates into a group of two candidates and determining one of the candidates. In the description to be described later, an example in which two candidates are grouped and determined as one of the candidates will be described. However, the processing is not limited to this as long as the number of candidates is reduced. The motion vector for each block size and the block size candidates narrowed down by the block size candidate determination unit 202, which are the results of searching by the prior motion prediction processing unit 201, are output to the motion search processing unit 203, respectively.

次に、動き探索処理部203は事前動き予測処理部201で探索した結果を基に、ブロックサイズ候補決定部202で絞り込まれた候補内のサイズで動き探索処理を行う(ステップS3)。最終的に決定した動きベクトル情報と予測差分画像は予測残差信号生成部103へと出力される。さらに当該符号化対象ピクチャが特定の場合のみ、動き探索処理部203は決定した動きベクトルの統計値を算出しブロックサイズ候補決定部202へ出力する。   Next, the motion search processing unit 203 performs a motion search process with the size within the candidates narrowed down by the block size candidate determination unit 202 based on the result of the search by the prior motion prediction processing unit 201 (step S3). The finally determined motion vector information and the prediction difference image are output to the prediction residual signal generation unit 103. Further, only when the picture to be encoded is specific, the motion search processing unit 203 calculates a statistical value of the determined motion vector, and outputs it to the block size candidate determination unit 202.

以下、動き探索処理部203が決定した動きベクトルの統計値を算出しブロックサイズ候補決定部202へ出力する、特定の場合について説明する。HEVCにおけるランダム・アクセス符号化モードでは、時間軸上過去のピクチャだけでなく未来のピクチャからも予測可能とすることで、高い画面間符号化効率を得ることが可能である。図4は、ランダム・アクセス符号化モードにおける画面間参照構造を示す図である。図4では、各ピクチャが参照のパターンによって4つの階層に分類され、それぞれの階層にTemporalID(時間識別子)とよばれる値を割り振っている。TemporalID=0のピクチャから次のTemporalID=0のピクチャまでをGOP(Group of Picture)と呼ぶ。   Hereinafter, a specific case where the statistical value of the motion vector determined by the motion search processing unit 203 is calculated and output to the block size candidate determination unit 202 will be described. In the random access coding mode in HEVC, it is possible to obtain high inter-frame coding efficiency by making prediction possible not only from past pictures on the time axis but also from future pictures. FIG. 4 is a diagram showing an inter-screen reference structure in the random access encoding mode. In FIG. 4, each picture is classified into four layers according to the reference pattern, and a value called TemporalID (time identifier) is assigned to each layer. A picture from the picture with TemporalID = 0 to the next picture with TemporalID = 0 is called GOP (Group of Picture).

図4は、GOPのサイズが8の場合のランダム・アクセス符号化モードの例を表している。動き探索処理部203では、当該符号化対象ピクチャの符号化順序がTemporalID=0のピクチャの1つ前の場合のみ、当該符号化対象ピクチャにおける全ての動きベクトルの分散を算出し、動きベクトル統計値としてブロックサイズ候補決定部202へ出力する。   FIG. 4 shows an example of the random access encoding mode when the GOP size is 8. The motion search processing unit 203 calculates the variance of all motion vectors in the current encoding target picture only when the encoding order of the current encoding target picture is one immediately before the picture with TemporalID = 0, and calculates motion vector statistics Is output to the block size candidate determination unit 202.

ここでは動きベクトル統計値として動きベクトルの分散を算出したが、動きベクトルの算術平均や二乗和や絶対値和を動きベクトル統計値として出力する方法であってもよい。動きベクトル統計値として動きベクトルの分散を用いる場合は、画面間の動きが1ピクチャ内で均一的かばらけているかによって特定のブロックサイズ候補を選ばれやすくする効果が見込める。動きベクトル統計値として動きベクトルの絶対値和を用いる場合は、画面間の動きが全体的に大きいか小さいかによって特定のブロックサイズ候補が選ばれやすくする効果が見込める。   Here, the variance of the motion vector is calculated as the motion vector statistical value. However, a method of outputting the arithmetic mean, square sum, or absolute value sum of the motion vector as the motion vector statistical value may be used. When motion vector dispersion is used as a motion vector statistic value, an effect of facilitating selection of a specific block size candidate can be expected depending on whether the motion between screens is uniformly distributed within one picture. When the sum of absolute values of motion vectors is used as the motion vector statistic value, an effect of easily selecting a specific block size candidate can be expected depending on whether the motion between screens is large or small as a whole.

次に、図5を参照して、図2に示すブロックサイズ候補決定部202の構成を説明する。図5は、図2に示すブロックサイズ候補決定部202の構成を示すブロック図である。ブロックサイズ候補決定部202は、候補コスト生成部301、オフセット決定部302、候補コスト比較部303を備えている。   Next, the configuration of the block size candidate determination unit 202 shown in FIG. 2 will be described with reference to FIG. FIG. 5 is a block diagram showing a configuration of the block size candidate determination unit 202 shown in FIG. The block size candidate determination unit 202 includes a candidate cost generation unit 301, an offset determination unit 302, and a candidate cost comparison unit 303.

次に、図6を参照して、図5に示すブロックサイズ候補決定部202の動作を説明する。図6は、図5に示すブロックサイズ候補決定部202の動作を示すフローチャートである。まず、候補コスト生成部301は、各ブロックサイズのコストを入力とし、ブロックサイズ候補のコストを算出する(ステップS11)。候補コスト生成部301は、算出したコスト(候補コスト1、候補コスト2)を候補コスト比較部303へ出力する。   Next, the operation of the block size candidate determination unit 202 shown in FIG. 5 will be described with reference to FIG. FIG. 6 is a flowchart showing the operation of the block size candidate determination unit 202 shown in FIG. First, the candidate cost generation unit 301 receives the cost of each block size as input, and calculates the cost of the block size candidate (step S11). The candidate cost generation unit 301 outputs the calculated costs (candidate cost 1 and candidate cost 2) to the candidate cost comparison unit 303.

一方、オフセット決定部302は、動き探索処理部203で算出された符号化済みピクチャの動きベクトル統計値と、符号化対象ピクチャの符号化情報とを入力として、符号化済みピクチャの動きベクトル統計値と、符号化対象ピクチャの符号化情報に基づいて、コスト比較のオフセット値を算出する(ステップS12)。オフセット決定部302は、算出したコスト比較オフセット値を候補コスト比較部303へ出力する。   On the other hand, the offset determination unit 302 receives the motion vector statistical value of the encoded picture calculated by the motion search processing unit 203 and the encoding information of the encoding target picture, and receives the motion vector statistical value of the encoded picture. Then, an offset value for cost comparison is calculated based on the encoding information of the encoding target picture (step S12). The offset determination unit 302 outputs the calculated cost comparison offset value to the candidate cost comparison unit 303.

次に、候補コスト比較部303は、2つのコスト(候補コスト1、候補コスト2)とコスト比較オフセット値を入力とし、2つのコストに基づいて比較を行い、ブロックサイズ候補を決定する(ステップS13)。候補コスト比較部303は、決定したブロックサイズ候補を動き探索処理部203へ出力する。   Next, the candidate cost comparison unit 303 receives two costs (candidate cost 1 and candidate cost 2) and a cost comparison offset value as inputs, and performs comparison based on the two costs to determine a block size candidate (step S13). ). Candidate cost comparison unit 303 outputs the determined block size candidates to motion search processing unit 203.

次に、図7を参照して、図5に示す候補コスト生成部301の詳細な動作を説明する。図7は、図5に示す候補コスト生成部301の詳細な動作を示すフローチャートである。まず、候補コスト生成部301は、事前動き予測処理部201で算出された各ブロックサイズのコスト値を入力する(ステップS21)。そして、候補コスト生成部301は、ブロックサイズ候補1のコスト値(候補コスト1)を算出する(ステップS22)。ブロックサイズ候補1は64×64のブロックサイズのみとする。ブロックサイズ候補1のコスト値は、事前動き予測処理部201で算出された64×64ブロックサイズのコスト値とする。   Next, detailed operation of the candidate cost generation unit 301 shown in FIG. 5 will be described with reference to FIG. FIG. 7 is a flowchart showing a detailed operation of the candidate cost generation unit 301 shown in FIG. First, the candidate cost generation unit 301 inputs the cost value of each block size calculated by the prior motion prediction processing unit 201 (step S21). Then, the candidate cost generation unit 301 calculates the cost value (candidate cost 1) of the block size candidate 1 (step S22). The block size candidate 1 is only a block size of 64 × 64. The cost value of the block size candidate 1 is a cost value of 64 × 64 block size calculated by the prior motion prediction processing unit 201.

続いて、候補コスト生成部301は、ブロックサイズ候補2のコスト値(候補コスト2)を算出する(ステップS23)。ブロックサイズ候補2は32×32、16×16、8×8の3つのブロックサイズとする。64×64領域を縦横4分割した際の16×16領域において、16×16ブロックサイズのコスト値と、16×16領域を縦横2分割した4つの8×8ブロックサイズのコスト値の和を比較し、16×16ブロックサイズのコスト値が小さい場合は16×16領域のコスト値を16×16ブロックサイズのコスト値とし、16×16ブロックサイズのコスト値が大きい場合は16×16領域のコスト値を4つの8×8ブロックサイズのコスト値の和とする。以上の16×16領域コスト算出処理を16つの16×16領域で行う。   Subsequently, the candidate cost generation unit 301 calculates the cost value (candidate cost 2) of the block size candidate 2 (step S23). Block size candidate 2 has three block sizes of 32 × 32, 16 × 16, and 8 × 8. Compare the cost value of the 16x16 block size and the sum of the cost values of the four 8x8 block sizes obtained by dividing the 16x16 area into 2 parts vertically and horizontally in the 16x16 area when the 64x64 area is divided into 4 parts. When the cost value of the 16 × 16 block size is small, the cost value of the 16 × 16 area is set as the cost value of the 16 × 16 block size, and when the cost value of the 16 × 16 block size is large, the cost of the 16 × 16 area is Let the value be the sum of the cost values of four 8 × 8 block sizes. The above 16 × 16 area cost calculation processing is performed on 16 16 × 16 areas.

64×64領域を縦横2分割した際の32×32領域において、32×32ブロックサイズのコスト値と、32×32領域を縦横2分割した4つの16×16領域コストの和を比較し、32×32ブロックサイズのコスト値が小さい場合は32×32領域のコスト値を32×32ブロックサイズのコスト値とし、32×32ブロックサイズのコスト値が大きい場合は32×32領域のコスト値を4つの16×16領域コストの和とする。対象の64×64領域を縦横2分割した4つの32×32領域全てで上記の32×32領域コスト算出手順を行い、4つの32×32領域コスト値の和をブロックサイズ候補2のコスト値とする。   In the 32 × 32 area when the 64 × 64 area is divided into 2 parts vertically and horizontally, the cost value of the 32 × 32 block size is compared with the sum of the four 16 × 16 area costs obtained by dividing the 32 × 32 area into 2 parts vertically and horizontally. When the cost value of the × 32 block size is small, the cost value of the 32 × 32 region is set as the cost value of the 32 × 32 block size, and when the cost value of the 32 × 32 block size is large, the cost value of the 32 × 32 region is set to 4. The sum of the two 16 × 16 area costs. The above 32 × 32 region cost calculation procedure is performed for all four 32 × 32 regions obtained by dividing the target 64 × 64 region into two vertically and horizontally, and the sum of the four 32 × 32 region cost values is used as the cost value of block size candidate 2. To do.

最後に、候補コスト生成部301は、算出したブロックサイズ候補1、2のコスト値を出力する(ステップS24)。   Finally, the candidate cost generation unit 301 outputs the calculated cost values of the block size candidates 1 and 2 (step S24).

次に、図8を参照して、図5に示すオフセット決定部302の詳細な動作を説明する。図8は、図5に示すオフセット決定部302の詳細な動作を示すフローチャートである。まず、動き探索処理部203が算出したピクチャ単位の動きベクトル分散の最新値σMV と、閾値THとを比較し、動きベクトル分散の最新値σMV が閾値THより小さいか否かを判定する(ステップS31)。この判定の結果、動きベクトル分散σMV が閾値THより小さい場合、すなわち物体の動きが1ピクチャ内で均一的な場合、コスト比較オフセット値λoffsetを0に設定する(ステップS32)。 Next, the detailed operation of the offset determination unit 302 shown in FIG. 5 will be described with reference to FIG. FIG. 8 is a flowchart showing a detailed operation of the offset determination unit 302 shown in FIG. First, the latest value σ MV 2 of the motion vector variance for each picture calculated by the motion search processing unit 203 is compared with the threshold value TH, and it is determined whether or not the latest value σ MV 2 of the motion vector variance is smaller than the threshold value TH. (Step S31). As a result of this determination, if the motion vector variance σ MV 2 is smaller than the threshold value TH, that is, if the motion of the object is uniform within one picture, the cost comparison offset value λ offset is set to 0 (step S32).

一方、動きベクトル分散σMV が閾値THより大きい場合、すなわち物体の動きが1ピクチャ内でばらけている場合、コスト比較オフセット値λoffsetを0でない実数(例えば、α・TemporalID)に設定する(ステップS33)。この場合のλoffsetは負の実数を用いるとよい。これにより動きがばらけているピクチャではブロックサイズ候補1、すなわち64×64のブロックサイズが選ばれやすくなり、この結果としてブロックサイズが動きのばらけによって小さくなりすぎることを防ぎ、符号量削減が望める。 On the other hand, when the motion vector variance σ MV 2 is larger than the threshold value TH, that is, when the motion of the object varies within one picture, the cost comparison offset value λ offset is set to a non-zero real number (for example, α · TemporalID). (Step S33). In this case, a negative real number may be used for λ offset . This makes it easy to select block size candidate 1, that is, a block size of 64 × 64 for a picture with scattered motion, and as a result, the block size is prevented from becoming too small due to motion variation, and the code amount can be reduced. I can hope.

また、この場合のλoffsetの決定方法としては、符号化情報より当該符号化対象ピクチャのTemporalIDを取得し、コスト比較オフセット値λoffsetをTemporalIDの定数倍α・TemporalIDに設定するとよい。αは負の実数定数がよい。TemporalIDが大きいピクチャでは動き予測の精度が高い傾向があるが、コスト比較オフセット値λoffsetをTemporalIDの定数倍α・TemporalIDに設定することで、TemporalIDが大きいピクチャではブロックサイズ候補1、すなわち64×64のブロックサイズが選ばれやすくなり、より大きなブロックで動き予測が行われることで符号量削減が望める。 Also, as a method for determining λ offset in this case, it is preferable to obtain TemporalID of the picture to be encoded from the encoding information and set the cost comparison offset value λ offset to a constant multiple α · TemporalID of TemporalID. α is preferably a negative real constant. Although the accuracy of motion prediction tends to be high for a picture with a large Temporal ID, the cost comparison offset value λ offset is set to a constant multiple α · Temporal ID of the Temporal ID. The block size can be easily selected, and the amount of code can be reduced by performing motion prediction on a larger block.

ここでは、動き探索処理部203で算出された動きベクトル統計値が閾値THより大きい場合のコスト比較オフセット値λoffsetをTemporalIDの定数倍α・TemporalIDとしたが、TemporalIDごとに適切なλoffsetを固定値として予め用意しておき、符号化対象ピクチャのTemporalIDに応じてλoffsetを切り替えるようにしてもよい。 Here, the cost comparison offset value λ offset when the motion vector statistical value calculated by the motion search processing unit 203 is larger than the threshold value TH is set to a constant multiple α · TemporalID of TemporalID, but an appropriate λ offset is fixed for each TemporalID. A value may be prepared in advance, and λ offset may be switched according to the Temporal ID of the encoding target picture.

また、ここでは動きベクトル統計値と閾値THの大小を比較してコスト比較オフセット値λoffsetの計算式の切り替えを行ったが、GOP構造を考慮するために動きベクトル統計値をGOPサイズで割った値と閾値THを比較してλoffsetの計算式を切り替えるようにしてもよい。これにより、動きベクトル統計値がGOPサイズと比較されたスケーリング済みの値となり、GOPサイズの大小によって閾値THを変化させる必要がなくなる。 Also, here, the calculation formula of the cost comparison offset value λ offset is switched by comparing the motion vector statistical value with the threshold TH, but the motion vector statistical value is divided by the GOP size in order to consider the GOP structure. The calculation formula of λ offset may be switched by comparing the value with the threshold value TH. As a result, the motion vector statistical value becomes a scaled value compared with the GOP size, and there is no need to change the threshold TH depending on the size of the GOP size.

候補コスト生成部301で算出された2つの候補コスト値とオフセット決定部302で算出されたコスト比較オフセット値は、候補コスト比較部303へ入力され、符号化ブロックのサイズ候補を2つのブロックサイズ候補の内のいずれかに決定する。   The two candidate cost values calculated by the candidate cost generation unit 301 and the cost comparison offset value calculated by the offset determination unit 302 are input to the candidate cost comparison unit 303, and the encoded block size candidates are set as two block size candidates. Determine one of the following.

次に、図9を参照して、図5に示す候補コスト比較部303の詳細な動作を説明する。図9は、図5に示す候補コスト比較部303の詳細な動作を示すフローチャートである。まず、候補コスト比較部303は、ブロックサイズ候補1、2のコスト値とコスト比較オフセット値とを入力とする(ステップS41)。   Next, detailed operation of the candidate cost comparison unit 303 shown in FIG. 5 will be described with reference to FIG. FIG. 9 is a flowchart showing a detailed operation of the candidate cost comparison unit 303 shown in FIG. First, the candidate cost comparison unit 303 receives the cost value and the cost comparison offset value of the block size candidates 1 and 2 (step S41).

次に、候補コスト比較部303は、ブロックサイズ候補1の候補コスト値とオフセット決定部302で決定されたコスト比較オフセット値の和と、ブロックサイズ候補2の候補コスト値とを比較し、ブロックサイズ候補1コスト値+コスト比較オフセット値<ブロックサイズ候補2コスト値であるか否かを判定する(ステップS42)。この判定の結果、ブロックサイズ候補2の候補コスト値が大きい場合はブロックサイズ候補を候補1に決定し(ステップS43)、ブロックサイズ候補2の候補コスト値が小さい場合はブロックサイズ候補を候補2に決定する(ステップS44)。   Next, the candidate cost comparison unit 303 compares the sum of the candidate cost value of the block size candidate 1 and the cost comparison offset value determined by the offset determination unit 302 with the candidate cost value of the block size candidate 2 to determine the block size. It is determined whether or not candidate 1 cost value + cost comparison offset value <block size candidate 2 cost value (step S42). As a result of this determination, if the candidate cost value of block size candidate 2 is large, the block size candidate is determined as candidate 1 (step S43), and if the candidate cost value of block size candidate 2 is small, the block size candidate is set as candidate 2. Determine (step S44).

以上説明したように、符号化ブロックサイズ候補が複数存在するような動き予測部を有する映像符号化方式において、符号化対象ピクチャの参照構造における階層の深さ、すなわちTemporalIDと、符号化済みピクチャの動きベクトルの統計値情報に基づき、ブロックサイズ候補のコスト比較におけるオフセット値を決定し、コスト比較によりブロックサイズ候補を適切に絞り込むことで、動き探索に要する演算量を削減することが可能となる。   As described above, in the video encoding system having a motion prediction unit in which there are a plurality of encoding block size candidates, the depth of the hierarchy in the reference structure of the encoding target picture, that is, TemporalID, and the encoded picture By determining an offset value in cost comparison of block size candidates based on statistical value information of motion vectors and appropriately narrowing down the block size candidates by cost comparison, it is possible to reduce the amount of calculation required for motion search.

前述した実施形態における映像符号化装置100の全部または一部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。   You may make it implement | achieve all or one part of the video encoding apparatus 100 in embodiment mentioned above with a computer. In that case, a program for realizing this function may be recorded on a computer-readable recording medium, and the program recorded on this recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included and a program held for a certain period of time. Further, the program may be a program for realizing a part of the above-described functions, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system. It may be realized using hardware such as PLD (Programmable Logic Device) or FPGA (Field Programmable Gate Array).

以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。   As mentioned above, although embodiment of this invention has been described with reference to drawings, the said embodiment is only the illustration of this invention, and it is clear that this invention is not limited to the said embodiment. is there. Therefore, additions, omissions, substitutions, and other modifications of the components may be made without departing from the technical idea and scope of the present invention.

動き探索処理に要する演算量が限られている映像符号化装置及び映像符号化プログラムに適用できる。   The present invention can be applied to a video encoding device and a video encoding program in which the amount of computation required for motion search processing is limited.

102・・・インター予測処理部、201・・・事前動き予測処理部、202・・・ブロックサイズ候補決定部、203・・・動き探索処理部、301・・・候補コスト生成部、302・・・オフセット決定部、303・・・候補コスト比較部   DESCRIPTION OF SYMBOLS 102 ... Inter prediction process part, 201 ... Prior motion prediction process part, 202 ... Block size candidate determination part, 203 ... Motion search process part, 301 ... Candidate cost generation part, 302 ... Offset determination unit, 303 ... Candidate cost comparison unit

Claims (5)

入力映像信号のピクチャの時間的相関を利用し、符号化対象ピクチャについて符号化ブロック単位に動き予測を行って差分信号の符号化処理を行う映像符号化装置であって、
前記符号化対象ピクチャと動き予測先の復号映像信号の参照ピクチャを用いて、対象符号化ブロックの大まかな動きを捕える事前動き予測処理を全符号化ブロックサイズそれぞれについて行い、各符号化ブロックサイズにおける事前動き予測処理コストを算出する事前動き予測処理手段と、
前記事前動き予測処理コストに基づいて、第1の符号化ブロックサイズ候補におけるブロックサイズ候補コストと第2の符号化ブロックサイズ候補におけるブロックサイズ候補コストを決定するブロックサイズ候補コスト手段と、
前記入力映像信号の符号化済みピクチャの動きベクトル情報に基づいて、動き統計パラメータを決定するパラメータ決定手段と、
前記動き統計パラメータと、前記符号化対象ピクチャの参照構造における階層の深さとに基づいて、コスト比較オフセット値を設定するオフセット値設定手段と、
前記第1の符号化ブロックサイズ候補におけるブロックサイズ候補コストと、前記第2の符号化ブロックサイズ候補におけるブロックサイズ候補コストと、前記コスト比較オフセット値とに基づいて、前記符号化対象ピクチャの符号化ブロックのサイズ候補を全ブロックサイズ候補の中から第1のブロックサイズ候補または第2のブロックサイズ候補のいずれかに決定するブロックサイズ候補決定手段と、
決定された符号化ブロックサイズ候補を用いて、前記符号化対象ピクチャの動き予測処理を行いブロックサイズ決定及び動きベクトル決定を行う動き探索手段と
を備える映像符号化装置。
A video encoding device that performs a temporal prediction of a picture of an input video signal, performs a motion prediction for each coding block for a coding target picture, and performs a coding process of a differential signal,
Using the encoding target picture and a reference picture of the decoded video signal of the motion prediction destination, a pre-motion prediction process for capturing a rough motion of the target encoding block is performed for each of all the encoding block sizes. A prior motion prediction processing means for calculating a prior motion prediction processing cost;
Block size candidate cost means for determining a block size candidate cost in the first encoded block size candidate and a block size candidate cost in the second encoded block size candidate based on the prior motion prediction processing cost;
Parameter determining means for determining a motion statistical parameter based on motion vector information of a coded picture of the input video signal;
Offset value setting means for setting a cost comparison offset value based on the motion statistic parameter and the depth of the hierarchy in the reference structure of the encoding target picture;
Based on the block size candidate cost in the first encoded block size candidate, the block size candidate cost in the second encoded block size candidate, and the cost comparison offset value, encoding of the encoding target picture A block size candidate determining means for determining a block size candidate as a first block size candidate or a second block size candidate from among all block size candidates;
A video encoding device comprising: motion search means for performing motion prediction processing of the encoding target picture and determining a block size and a motion vector by using the determined encoding block size candidate.
前記パラメータ決定手段は、
前記入力映像信号の指定された符号化済みピクチャにおける全ての動きベクトルを算出し、前記動きベクトルの絶対値和を前記符号化対象ピクチャの動き統計パラメータとして決定する請求項1に記載の映像符号化装置。
The parameter determination means includes
The video encoding according to claim 1, wherein all motion vectors in a specified encoded picture of the input video signal are calculated, and an absolute value sum of the motion vectors is determined as a motion statistical parameter of the encoding target picture. apparatus.
前記パラメータ決定手段は、
前記入力映像信号の指定された符号化済みピクチャにおける全ての動きベクトルを算出し、前記動きベクトルの分散値を前記符号化対象ピクチャの動き統計パラメータとして決定する請求項1に記載の映像符号化装置。
The parameter determination means includes
2. The video encoding device according to claim 1, wherein all motion vectors in a specified encoded picture of the input video signal are calculated, and a variance value of the motion vector is determined as a motion statistical parameter of the encoding target picture. .
前記ブロックサイズ候補決定手段は、
前記第2のブロックサイズ候補における動きベクトルのコストと前記コスト比較オフセット値との和を算出し、算出した前記和と前記第1のブロックサイズ候補における動きベクトルのコストとを比較した結果、前記第1のブロックサイズ候補におけるコストの方が大きいと判定された場合、前記符号化対象ピクチャのブロックサイズ候補を第2のブロックサイズ候補とし、前記第1のブロックサイズ候補におけるコストの方が小さいと判定された場合、前記符号化対象ピクチャのブロックサイズ候補を第1のブロックサイズ候補とする請求項1から3のいずれか1項に記載の映像符号化装置。
The block size candidate determination means includes
As a result of calculating the sum of the cost of the motion vector in the second block size candidate and the cost comparison offset value, and comparing the calculated sum with the cost of the motion vector in the first block size candidate, When it is determined that the cost of one block size candidate is higher, the block size candidate of the encoding target picture is set as a second block size candidate, and it is determined that the cost of the first block size candidate is lower 4. The video encoding device according to claim 1, wherein if the block size is selected, the block size candidate of the encoding target picture is set as a first block size candidate. 5.
コンピュータを、請求項1から4のいずれか1項に記載の映像符号化装置として機能させるための映像符号化プログラム。   A video encoding program for causing a computer to function as the video encoding device according to any one of claims 1 to 4.
JP2015141395A 2015-07-15 2015-07-15 Video encoding apparatus and video encoding program Active JP6339977B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015141395A JP6339977B2 (en) 2015-07-15 2015-07-15 Video encoding apparatus and video encoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015141395A JP6339977B2 (en) 2015-07-15 2015-07-15 Video encoding apparatus and video encoding program

Publications (2)

Publication Number Publication Date
JP2017028337A JP2017028337A (en) 2017-02-02
JP6339977B2 true JP6339977B2 (en) 2018-06-06

Family

ID=57946018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015141395A Active JP6339977B2 (en) 2015-07-15 2015-07-15 Video encoding apparatus and video encoding program

Country Status (1)

Country Link
JP (1) JP6339977B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7093157B2 (en) 2014-06-12 2022-06-29 オーガニック キミヤ サナイ ヴェ ティジャレット アー.シェー. How to make an HMA with a non-adhesive coating

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102445899B1 (en) 2017-12-29 2022-09-21 인텔렉추얼디스커버리 주식회사 Video coding method and apparatus using sub-block level intra prediction
JP7450078B1 (en) 2023-02-15 2024-03-14 Nttイノベーティブデバイス株式会社 Video encoding device and video encoding method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074520A (en) * 2004-09-02 2006-03-16 Matsushita Electric Ind Co Ltd Motion vector detecting device
JP2009272702A (en) * 2008-04-30 2009-11-19 Canon Inc Motion vector searching apparatus and control method thereof
JP2015073192A (en) * 2013-10-02 2015-04-16 日本電信電話株式会社 Video encoder and video encoding program
WO2016140090A1 (en) * 2015-03-04 2016-09-09 ソニー株式会社 Image coding device and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7093157B2 (en) 2014-06-12 2022-06-29 オーガニック キミヤ サナイ ヴェ ティジャレット アー.シェー. How to make an HMA with a non-adhesive coating

Also Published As

Publication number Publication date
JP2017028337A (en) 2017-02-02

Similar Documents

Publication Publication Date Title
EP1797722B1 (en) Adaptive overlapped block matching for accurate motion compensation
KR101228651B1 (en) Method and apparatus for performing motion estimation
US10291925B2 (en) Techniques for hardware video encoding
Zhang et al. Low complexity HEVC INTRA coding for high-quality mobile video communication
Correa et al. Coding tree depth estimation for complexity reduction of HEVC
US9591313B2 (en) Video encoder with transform size preprocessing and methods for use therewith
US9294764B2 (en) Video encoder with intra-prediction candidate screening and methods for use therewith
JP2007053561A (en) Device and method for encoding image
TWI401967B (en) Method for scalable video coding, scalable video coding apparatus, program for scalable video coding, and computer readable storage medium storing program for scalable video coding
CN111164972A (en) System and method for controlling video encoding at frame level
CN111164980A (en) System and method for controlling video encoding within image frames
JP6339977B2 (en) Video encoding apparatus and video encoding program
CN114339218A (en) Image encoding method, image encoding device, electronic apparatus, and readable storage medium
EP2890128A1 (en) Video encoder with block merging and methods for use therewith
KR20160132865A (en) Systems and methods for low complexity encoding and background detection
JP6435029B2 (en) Video encoding apparatus and video encoding program
JP6259272B2 (en) Video encoding apparatus and video encoding program
US20150208082A1 (en) Video encoder with reference picture prediction and methods for use therewith
Correa et al. Complexity control of HEVC through quadtree depth estimation
JPWO2016194380A1 (en) Moving picture coding apparatus, moving picture coding method, and recording medium storing moving picture coding program
EP2899975A1 (en) Video encoder with intra-prediction pre-processing and methods for use therewith
Shang et al. Low-complexity intra-coding scheme for HEVC
WO2020129681A1 (en) Encryption device and program
Shen et al. Fast multiframe motion estimation algorithm in H. 264
JP5970507B2 (en) Video encoding apparatus and video encoding program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170830

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180511

R150 Certificate of patent or registration of utility model

Ref document number: 6339977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150