JP6663191B2 - Encoding setting information determination device and program - Google Patents
Encoding setting information determination device and program Download PDFInfo
- Publication number
- JP6663191B2 JP6663191B2 JP2015172853A JP2015172853A JP6663191B2 JP 6663191 B2 JP6663191 B2 JP 6663191B2 JP 2015172853 A JP2015172853 A JP 2015172853A JP 2015172853 A JP2015172853 A JP 2015172853A JP 6663191 B2 JP6663191 B2 JP 6663191B2
- Authority
- JP
- Japan
- Prior art keywords
- motion
- prediction block
- encoding
- setting information
- surf feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000033001 locomotion Effects 0.000 claims description 107
- 239000013598 vector Substances 0.000 claims description 83
- 238000006073 displacement reaction Methods 0.000 claims description 36
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 11
- 230000001174 ascending effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Description
本発明は、映像を符号化する際の設定情報を決定する符号化設定情報決定装置及びプログラムに関する。 The present invention relates to an encoding setting information determining device and a program for determining setting information when encoding a video.
映像の符号化方式として、ITU−T H.264/MPEG−4 AVC(以下、単に「AVC」と称する。)や、ITU−T H.265/MPEG−H HEVC(以下、単に「HEVC」と称する。)などが知られている。これらの符号化方式では、インター予測(フレーム間予測、画面間予測)、及びイントラ予測(フレーム内予測、画面内予測)が用いられる。インター予測は時間的に前後する参照フレームから予測画像を生成し、原画像との差分を符号化する予測符号化方式である。イントラ予測はフレーム内符号化されるブロックに対して、符号化済みの隣接ブロックの画素から予測画像を生成し、原画像との差分を符号化する予測符号化方式である。 As a video encoding method, ITU-TH. H.264 / MPEG-4 AVC (hereinafter, simply referred to as “AVC”) and ITU-T H.264. H.265 / MPEG-H HEVC (hereinafter simply referred to as “HEVC”) and the like are known. In these coding systems, inter prediction (inter-frame prediction, inter-screen prediction) and intra prediction (intra-frame prediction, intra-screen prediction) are used. The inter prediction is a prediction encoding method that generates a prediction image from a temporally preceding and succeeding reference frame and encodes a difference from an original image. Intra prediction is a predictive coding method for generating a predictive image from pixels of an adjacent block that has been coded for a block to be intra-coded, and coding a difference from the original image.
非特許文献1には、HEVCでは、符号化ツリーユニット(CTU:Coding Tree Unit)を階層的に4分木分割することで可変サイズの符号化ユニット(CU:Coding Unit)を生成することが開示されている。CUのサイズは、64×64画素、32×32画素、16×16画素、及び8×8画素の4種類である。インター予測を行う場合には、各CUを更にインター予測用の予測ユニット(PU:Prediction Unit)に分割し、該PUごとに予測処理を行う。また、イントラ予測を行う場合には、各CUを更にイントラ予測用のPUに分割し、該PUごとに予測処理を行う。
Non-Patent
また、特許文献1には、複数カメラ撮像映像の符号化演算量を削減するために、複数カメラ撮影映像の各々においてSURF特徴量を用いた特徴点抽出を行い、撮影範囲が重複する領域のマクロブロックについては隣接カメラベクトルに基づいて探索範囲が狭くなるように補正してブロックマッチングを行うことが開示されている。 Japanese Patent Application Laid-Open No. H11-163873 discloses a technique for extracting feature points using SURF feature amounts in each of a plurality of camera-captured videos in order to reduce the amount of coding operation of the plurality of camera-captured videos. It is disclosed that block matching is performed for blocks so that the search range is corrected based on the adjacent camera vector so that the search range becomes narrower.
しかしながら、従来の符号化方法では、「複数の電車が高速走行する」、「多数のピンポン玉が跳ねる」というように、多数のオブジェクトが大きい動きをするような映像では、インター予測の精度が低いため、符号化画質が低くなるおそれがある。 However, according to the conventional encoding method, the accuracy of inter prediction is low in a video in which a large number of objects move greatly, such as “a plurality of trains run at high speed” and “a large number of ping-pong balls bounce”. Therefore, the encoded image quality may be reduced.
また、特許文献1に記載の技術は、複数カメラ撮影映像の符号化演算量を削減するためのものであって、SURF特徴点の複数フレーム間マッチングを用いて動き推定を行って符号化効率を向上させるものではない。
Further, the technique described in
かかる事情に鑑みてなされた本発明の目的は、多数のオブジェクトが大きい動きをする映像の符号化効率を向上させるための符号化設定情報を決定することが可能な符号化設定情報決定装置及びプログラムを提供することにある。 An object of the present invention made in view of such circumstances is an encoding setting information determining apparatus and a program capable of determining encoding setting information for improving encoding efficiency of a video in which a large number of objects move greatly. Is to provide.
上記課題を解決するため、本発明に係る符号化設定情報決定装置は、映像を符号化する際の設定情報を決定する符号化設定情報決定装置であって、映像を入力して、SURF(Speeded-Up Robust Features)特徴点のフレーム間マッチングにより、SURF特徴点ごとに動きベクトルを生成する動き推定部と、符号化ブロックごとにSURF特徴点を計数し、計数したSURF特徴点の数に基づき、前記符号化ブロックと同一又は前記符号化ブロックを分割したサイズの予測ブロックを決定する予測ブロックサイズ設定部と、前記予測ブロックごとに、前記SURF特徴点ごとの動きベクトルの平均値又は中央値を算出し、前記予測ブロックごとの動き探索の初期変位ベクトルと決定する初期変位ベクトル設定部と、前記予測ブロックごとに、前記SURF特徴点ごとの動きベクトルを用いて、動き探索範囲を決定する動き探索範囲設定部と、を備え、前記予測ブロックサイズ設定部は、前記予測ブロックのサイズを、SURF特徴点の数が多い符号化ブロックほど小さくなるように決定し、前記動き探索範囲設定部は、前記初期変位ベクトルを前記動きベクトルの平均値とした場合は、予測ブロックに対応する全ての動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、該予測ブロックの初期変位ベクトルに対する動き探索範囲とし、前記初期変位ベクトルを前記動きベクトルの中央値とした場合は、予測ブロックに対応する動きベクトルのうち大きさが第1四分位数から第3四分位数の動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、該予測ブロックの初期変位ベクトルに対する動き探索範囲とすることを特徴とする。 In order to solve the above-mentioned problem, an encoding setting information determining apparatus according to the present invention is an encoding setting information determining apparatus that determines setting information when encoding a video. -Up Robust Features) A motion estimator that generates a motion vector for each SURF feature point by inter-frame matching of feature points, and a SURF feature point is counted for each coding block, and based on the counted number of SURF feature points, A prediction block size setting unit that determines a prediction block having the same size as the coding block or a size obtained by dividing the coding block; and calculating an average value or a median value of the motion vectors for each SURF feature point for each prediction block. An initial displacement vector setting unit that determines an initial displacement vector for motion search for each of the prediction blocks; Using the motion vector for each RF feature points, comprising a motion estimation range setting unit for determining a motion estimation range, and the prediction block size setting unit, the size of the prediction block, the number of SURF feature points is often code When the initial displacement vector is the average value of the motion vectors, the motion search range setting unit sets the start points of all the motion vectors corresponding to the prediction block to the center of the prediction block. When moving to a point, the range including the end point of the motion vector is set as a motion search range for the initial displacement vector of the prediction block, and when the initial displacement vector is set as the median value of the motion vector, Move the start point of the motion vector whose size is the first quartile to the third quartile among the corresponding motion vectors to the center point of the prediction block The range including the end point of the motion vector when the motion vector is set is a motion search range for the initial displacement vector of the prediction block .
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記符号化設定情報決定装置として機能させることを特徴とする。 According to another aspect of the present invention, there is provided a program for causing a computer to function as the encoding setting information determination device.
本発明によれば、多数のオブジェクトが大きい動きをする映像の符号化効率を向上させるための符号化設定情報を決定することが可能になる。 ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to determine the encoding setting information for improving the encoding efficiency of the video in which many objects move greatly.
以下、本発明の実施形態について、図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(第1の実施形態)
本発明の第1の実施形態に係る符号化設定情報決定装置について、以下に説明する。図1は、本発明の第1の実施形態に係る符号化設定情報決定装置の構成例を示すブロック図である。図1に示す例では、符号化設定情報決定装置1は、動き推定部11と、予測ブロックサイズ設定部12とを備える。
(First embodiment)
The encoding setting information determination device according to the first embodiment of the present invention will be described below. FIG. 1 is a block diagram illustrating a configuration example of the encoding setting information determination device according to the first embodiment of the present invention. In the example illustrated in FIG. 1, the coding setting
動き推定部11は、映像(原画像群)を入力して、フレーム間(符号化対象フレームと参照フレームとの間)でSURF特徴点のマッチングを行うことにより、SURF(Speeded-Up Robust Features)特徴点ごとに、SURF特徴点を始点とする動きベクトルを生成する。そして、SURF特徴点の位置及び動きベクトルの方向(水平及び垂直方向の位置ずれ量)を示す動きベクトル情報を予測ブロックサイズ設定部12に出力する。なお、予測ブロックサイズ設定部12では動きベクトルの方向を示す情報は不要であるため、予測ブロックサイズ設定部12に対してはSURF特徴点の位置を示す情報のみを出力するようにしてもよい。
The
動き推定部11は、SURF特徴量を用いた動き推定を行うことにより、拡大・縮小、回転、照明変動などを検出でき、「火花が飛び散る映像」のような動きがランダムな映像であっても高精度に動き推定が可能となり、ランダムな動きが多い映像におけるインター予測精度(動き推定精度)を向上させることが可能となる。
The
図2は、動き推定部11におけるSURF特徴量の算出方法を説明する図である。SURF特徴量は、原画像に分散値を可変としたガウシアンフィルタを適用した画像において、ヘッセ(Hessian)行列値の極大点を探すことで複数のSURF特徴点を抽出する。図2では左上図に示すように、8×8画素のブロックの中心点をSURF特徴点としている。つぎに、各SURF特徴点においてハールウェーブレット(Haar wavelet)を用いて強度の強い角度を3/π間隔で求める。そして、強度の強い方向を原方向として、図2の右下図に示すように2×2画素の領域ごとに、ハールウェーブレットを用いて水平方向の微分値dx及び垂直方向の微分値dyを求めることにより、Σdx、Σ|dx|、Σdy、及びΣ|dy|の4つの特徴量を算出する。
FIG. 2 is a diagram illustrating a method of calculating a SURF feature amount in the
図2に示すようにSURF特徴点を中心とする8×8画素のブロック単位で特徴量を算出すると、8×8画素のブロックには2×2画素の領域が4×4個存在するので、1つのSURF特徴点において64(=4×4×4)次元の特徴量が得られる。なお、SURFの詳細については、例えば、H. Bay, A. Ess, T. Tuytelaars, and L. V. Gool, "Speeded-Up Robust Features (SURF)", Elsevier, vol. 110, Issue 3, p. 346-359, Jun. 2008を参照されたい。 As shown in FIG. 2, when the feature amount is calculated in units of 8 × 8 pixels with the SURF feature point at the center, there are 4 × 4 2 × 2 pixel regions in the 8 × 8 pixel block. For one SURF feature point, 64 (= 4 × 4 × 4) -dimensional feature amounts are obtained. For details of SURF, see, for example, H. Bay, A. Ess, T. Tuytelaars, and LV Gool, "Speeded-Up Robust Features (SURF)", Elsevier, vol. 110, Issue 3, p. 346- 359, Jun. 2008.
SURF特徴量を用いる場合、動き推定部11は、符号化対象フレームと参照フレームとの間でSURF特徴量のマッチングを行うことにより、SURF特徴点ごとに動きベクトルを求める。具体的には、符号化対象フレーム内の任意のSURF特徴点Aにおける特徴量に対して64次元のユークリッド距離が最小となる参照フレーム内のSURF特徴点Bをマッチング点として抽出し、SURF特徴点AB間の水平方向及び垂直方向の位置ずれ量を動きベクトルとして算出する。
When using the SURF feature, the
図3は、参照フレーム間の予測構造例を示す図である。動き推定部11は、インター予測の参照フレームを、参照フレーム間の予測構造情報を基に判定する。図3に示す例では、P1ピクチャを符号化対象フレームとすると、I0ピクチャが参照フレームとなるため、P1ピクチャとI0ピクチャ位置の原画像間でSURF特徴量によるマッチングを行う。また、B2ピクチャを符号化対象フレームとすると、I0ピクチャとP1ピクチャが参照フレームとなるため、B2ピクチャとI0ピクチャ位置、及びB2ピクチャとP1ピクチャ位置の原画像間で動き推定を行う。
FIG. 3 is a diagram illustrating an example of a prediction structure between reference frames. The
なお、参照フレームの予測構造情報の入力は必須ではなく、参照フレームの予測構造情報を入力しないで、常に符号化対象フレームの1フレーム前(過去)の時間位置との原画像間で動き推定を行うようにしてもよい。 The input of the prediction structure information of the reference frame is not essential, and the motion estimation is always performed between the original image and the time position one frame before (past) the encoding target frame without inputting the prediction structure information of the reference frame. It may be performed.
図1に戻ると、予測ブロックサイズ設定部12は、フレームを分割した符号化ブロックのサイズを示す符号化ブロックサイズ情報を入力する。そして、予測ブロックサイズ設定部12は、所定サイズの符号化ブロックごとにSURF特徴点を計数し、計数したSURF特徴点の数に基づき予測ブロックのサイズを決定し、決定した予測ブロックのサイズを示す予測ブロックサイズ情報を外部の符号化装置(図示せず)に設定情報として出力する。予測ブロックのサイズは符号化ブロックと同一又は符号化ブロックを分割したサイズである。
Returning to FIG. 1, the predicted block
符号化装置は、符号化設定情報決定装置1により決定された予測ブロックサイズを設定し、予測ブロックごとに予測処理を行う。SURF特徴点の数が多いほど当該符号化ブロックは空間高周波成分が多いと考えられるが、予測ブロックサイズ設定部12はSURF特徴点の数が多い符号化ブロックほど予測ブロックのサイズを小さくするため、微小動きを高精度かつ高確度に検出することができる。
The encoding device sets the prediction block size determined by the encoding setting
符号化方式がAVCである場合、例えば符号化ブロックサイズを16×16画素とする。SURF特徴点の総数をNS、符号化ブロックの数をNBとすると、符号化ブロック内のSURF特徴点数が(NS/NB)×2以上であれば予測ブロックサイズ(マクロブロックサイズ)を4×4画素と設定し、(NS/NB)×2未満で(NS/NB)×1以上であれば予測ブロックサイズを8×8画素と設定し、(NS/NB)×1未満であれば予測ブロックサイズを16×16画素と設定する。 When the coding method is AVC, for example, the coding block size is set to 16 × 16 pixels. Assuming that the total number of SURF feature points is N S and the number of coding blocks is N B , if the number of SURF feature points in the coding block is (N S / N B ) × 2 or more, the prediction block size (macro block size) Is set to 4 × 4 pixels, and if less than (N S / N B ) × 2 and not less than (N S / N B ) × 1, the prediction block size is set to 8 × 8 pixels, and (N S / N) B ) If less than × 1, the prediction block size is set to 16 × 16 pixels.
また、符号化方式がHEVCである場合、符号化ブロックサイズをCUのサイズとする。例えばSURF特徴点の総数をNS、CUブロックの数をNBとすると、CU内のSURF特徴点数が(NS/NB)×2以上であれば予測ブロックサイズ(PUサイズ)を4×4画素と設定し、(NS/NB)×2未満で(NS/NB)×1.5以上であれば予測ブロックサイズを8×8画素と設定し、(NS/NB)×1.5未満で(NS/NB)×1以上であれば予測ブロックサイズを16×16画素と設定し、(NS/NB)×1未満で(NS/NB)×0.5以上であれば予測ブロックサイズを32×32画素と設定し、(NS/NB)×0.5未満であれば予測ブロックサイズを64×64画素と設定する。なおPUサイズがCUサイズを超える場合は、PUとCUを同じサイズとする。 When the encoding method is HEVC, the encoding block size is set to the size of the CU. For example, assuming that the total number of SURF feature points is N S and the number of CU blocks is N B , if the number of SURF feature points in the CU is (N S / N B ) × 2 or more, the prediction block size (PU size) is 4 × If it is set to 4 pixels, and if it is less than (N S / N B ) × 2 and (N S / N B ) × 1.5 or more, the prediction block size is set to 8 × 8 pixels, and (N S / N B) ) × 1.5 and (N S / N B ) × 1 or more, the prediction block size is set to 16 × 16 pixels, and if it is less than (N S / N B ) × 1, (N S / N B ) If it is not less than × 0.5, the prediction block size is set to 32 × 32 pixels, and if it is less than (N S / N B ) × 0.5, the prediction block size is set to 64 × 64 pixels. If the PU size exceeds the CU size, the PU and the CU have the same size.
上述したように、符号化設定情報決定装置1は、符号化ブロックごとにSURF特徴点を計数する。そして、SURF特徴点の数が多い符号化ブロックほど空間高周波成分が多いとみなせるため、SURF特徴点の数が多い符号化ブロックほど予測ブロックのサイズが小さくなるように決定する。したがって、符号化設定情報決定装置1により決定されたサイズの予測ブロックを用いて符号化することにより、多数のオブジェクトが大きい動きをする映像の符号化効率を向上させることが可能となる。
As described above, the coding setting
(第2の実施形態)
つぎに、本発明の第2の実施形態に係る符号化設定情報決定装置について説明する。図4は、第2の実施形態に係る符号化設定情報決定装置の構成例を示すブロック図である。図4に示す例では、符号化設定情報決定装置2は、動き推定部11と、予測ブロックサイズ設定部12と、初期変位ベクトル設定部13と、動き探索範囲設定部14とを備える。第2の実施形態の符号化設定情報決定装置2は第1の実施形態の符号化設定情報決定装置1と比較して、初期変位ベクトル設定部13及び動き探索範囲設定部14を更に備える点が相違する。なお、本実施形態では符号化設定情報決定装置2は初期変位ベクトル設定部13及び動き探索範囲設定部14を備えるが、いずれか一方のみを備える構成としてもよい。
(Second embodiment)
Next, an encoding setting information determination device according to a second embodiment of the present invention will be described. FIG. 4 is a block diagram illustrating a configuration example of an encoding setting information determination device according to the second embodiment. In the example illustrated in FIG. 4, the encoding setting
動き推定部11は、第1の実施形態と同様に、映像を入力してフレーム間でSURF特徴点のマッチングを行うことにより、SURF特徴点ごとに動きベクトルを生成する。そして動きベクトル情報を予測ブロックサイズ設定部12、初期変位ベクトル設定部13、及び動き探索範囲設定部14に出力する。
As in the first embodiment, the
予測ブロックサイズ設定部12は、第1の実施形態と同様に、所定サイズの符号化ブロックごとにSURF特徴点を計数し、計数したSURF特徴点の数に基づき、符号化ブロック以下のサイズの予測ブロックサイズを決定する。そして予測ブロックサイズ情報を外部の符号化装置に設定情報として出力するとともに、初期変位ベクトル設定部13、及び動き探索範囲設定部14に出力する。
As in the first embodiment, the prediction block
初期変位ベクトル設定部13は、動き推定部11により生成された動きベクトル情報、及び予測ブロックサイズ設定部12により生成された予測ブロックサイズ情報を入力して、各予測ブロック内に含まれる全ての動きベクトルの平均値又は中央値を算出し、動き探索の初期変位ベクトルとする。そして、初期変位ベクトル設定部13は、初期変位ベクトルを示す情報を外部の符号化装置に設定情報として出力する。なお、予測ブロックに対応する動きベクトルが存在しない(すなわち、予測ブロック内にSURF特徴点が存在しない)場合には、その旨を示す情報を外部に出力する。
The initial displacement
図5は、初期変位ベクトル設定部13の処理を説明する図である。図5に示すように予測ブロックP内に3つのSURF特徴点A,B,Cが存在した場合、初期変位ベクトル設定部13は、SURF特徴点Aを始点とする動きベクトル、SURF特徴点Bを始点とする動きベクトル、及びSURF特徴点Cを始点とする動きベクトルの平均値又は中央値を初期変位ベクトルとして算出する。
FIG. 5 is a diagram illustrating the process of the initial displacement
動き探索範囲設定部14は、動き推定部11により生成された動きベクトル情報、及び予測ブロックサイズ設定部12により生成された予測ブロックサイズ情報を入力して、予測ブロックごとに、対応する動きベクトル(予測ブロックに含まれる特徴点を始点とする動きベクトル)を用いて動き探索範囲を決定する。そして、動き探索範囲設定部14は、動き探索範囲を示す情報を外部の符号化装置に設定情報として出力する。なお、予測ブロックに対応する動きベクトルが存在しない(すなわち、予測ブロック内にSURF特徴点が存在しない)場合には、その旨を示す情報を外部に出力する。
The motion search
具体的には、動き探索範囲設定部14は、初期変位ベクトル設定部13が初期変位ベクトルを動きベクトルの平均値とした場合は、予測ブロックに対応する全ての動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、当該予測ブロックの初期変位ベクトルに対する動き探索範囲とする。また、動き探索範囲設定部14は、初期変位ベクトル設定部13が初期変位ベクトルを動きベクトルの中央値とした場合は、予測ブロックに対応する動きベクトルのうち大きさが第1四分位数から第3四分位数の動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、当該予測ブロックの初期変位ベクトルに対する動き探索範囲情報とする。ここで、第1四分位数は、データを小さい順に並べたときの、小さいほうから数えて全体の1/4の順位の値であり、第3四分位数は、データを小さい順に並べたときの、小さいほうから数えて全体の3/4の順位の値である。
Specifically, when the initial displacement
上述したように、符号化設定情報決定装置2は、符号化設定情報決定装置1と同様に、符号化ブロックごとにSURF特徴点を計数し、SURF特徴点の数が多い符号化ブロックほど予測ブロックのサイズが小さくなるように決定するため、符号化設定情報決定装置2により決定されたサイズの予測ブロックを用いて符号化することにより、多数のオブジェクトが大きい動きをする映像の符号化効率を向上させることが可能となる。
As described above, the coding setting
また、符号化設定情報決定装置2は、予測ブロック内に含まれる動きベクトルを用いて動き探索の初期変位ベクトルを決定する。したがって、符号化設定情報決定装置2により決定された初期変位ベクトルを用いることにより、大きな動きであってもブロックマッチングによる動き検出を行うことができ、動き推定の精度を向上させることが可能となる。
In addition, the coding setting
また、符号化設定情報決定装置2は、予測ブロック内に含まれる動きベクトルを用いて動き探索範囲を決定する。したがって、符号化設定情報決定装置2により決定された動き探索範囲を用いてブロックマッチングを行うことにより、動き探索範囲を絞ることができ、動き検出の速度を向上させることが可能となる。
Further, the coding setting
なお、上述した符号化設定情報決定装置1又は2として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、符号化設定情報決定装置1又は2の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
Note that a computer can be suitably used to function as the above-described encoding setting
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many changes and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be construed as being limited by the above-described embodiment, and various modifications and changes can be made without departing from the scope of the claims. For example, a plurality of constituent blocks described in the embodiment can be combined into one, or one constituent block can be divided.
1,2 符号化設定情報決定装置
11 動き推定部
12 予測ブロックサイズ設定部
13 初期変位ベクトル設定部
14 動き探索範囲設定部
1, 2 coding setting
Claims (2)
映像を入力して、SURF(Speeded-Up Robust Features)特徴点のフレーム間マッチングにより、SURF特徴点ごとに動きベクトルを生成する動き推定部と、
符号化ブロックごとにSURF特徴点を計数し、計数したSURF特徴点の数に基づき、前記符号化ブロックと同一又は前記符号化ブロックを分割したサイズの予測ブロックを決定する予測ブロックサイズ設定部と、
前記予測ブロックごとに、前記SURF特徴点ごとの動きベクトルの平均値又は中央値を算出し、前記予測ブロックごとの動き探索の初期変位ベクトルと決定する初期変位ベクトル設定部と、
前記予測ブロックごとに、前記SURF特徴点ごとの動きベクトルを用いて、動き探索範囲を決定する動き探索範囲設定部と、
を備え、
前記予測ブロックサイズ設定部は、前記予測ブロックのサイズを、SURF特徴点の数が多い符号化ブロックほど小さくなるように決定し、
前記動き探索範囲設定部は、
前記初期変位ベクトルを前記動きベクトルの平均値とした場合は、予測ブロックに対応する全ての動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、該予測ブロックの初期変位ベクトルに対する動き探索範囲とし、
前記初期変位ベクトルを前記動きベクトルの中央値とした場合は、予測ブロックに対応する動きベクトルのうち大きさが第1四分位数から第3四分位数の動きベクトルの始点を予測ブロックの中心点に移動させたときの、該動きベクトルの終点を含む範囲を、該予測ブロックの初期変位ベクトルに対する動き探索範囲とすることを特徴とする符号化設定情報決定装置。 An encoding setting information determination device that determines setting information when encoding a video,
A motion estimator that receives a video and generates a motion vector for each SURF feature point by performing inter-frame matching of SURF (Speeded-Up Robust Features) feature points;
A prediction block size setting unit that counts SURF feature points for each coding block and determines a prediction block having the same size as the coding block or a size obtained by dividing the coding block based on the counted number of SURF feature points,
An initial displacement vector setting unit that calculates an average value or a median value of motion vectors for each SURF feature point for each prediction block, and determines an initial displacement vector for motion search for each prediction block;
A motion search range setting unit that determines a motion search range using a motion vector for each SURF feature point for each of the prediction blocks;
With
The prediction block size setting unit determines the size of the prediction block to be smaller for a coded block having a larger number of SURF feature points ,
The motion search range setting unit,
When the initial displacement vector is the average value of the motion vectors, when moving the start points of all the motion vectors corresponding to the prediction block to the center point of the prediction block, the range including the end point of the motion vector, The motion search range for the initial displacement vector of the prediction block,
When the initial displacement vector is the median of the motion vectors, the start point of the motion vector whose magnitude is from the first quartile to the third quartile among the motion vectors corresponding to the prediction block is An encoding setting information determining device , wherein a range including an end point of the motion vector when the motion vector is moved to a center point is set as a motion search range for an initial displacement vector of the prediction block .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015172853A JP6663191B2 (en) | 2015-09-02 | 2015-09-02 | Encoding setting information determination device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015172853A JP6663191B2 (en) | 2015-09-02 | 2015-09-02 | Encoding setting information determination device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017050713A JP2017050713A (en) | 2017-03-09 |
JP6663191B2 true JP6663191B2 (en) | 2020-03-11 |
Family
ID=58279626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015172853A Active JP6663191B2 (en) | 2015-09-02 | 2015-09-02 | Encoding setting information determination device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6663191B2 (en) |
-
2015
- 2015-09-02 JP JP2015172853A patent/JP6663191B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017050713A (en) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210021855A1 (en) | Image processing method and image processing device | |
EP3029937B1 (en) | Method and encoder for video encoding of a sequence of frames | |
JP2018201189A5 (en) | ||
CN1675848A (en) | Method and apparatus for performing high quality fast predictive motion search | |
JP2009147807A (en) | Image processing apparatus | |
WO2021093060A1 (en) | Video encoding method, system, and apparatus | |
KR101445009B1 (en) | Techniques to perform video stabilization and detect video shot boundaries based on common processing elements | |
JP2013532926A (en) | Method and system for encoding video frames using multiple processors | |
US10034016B2 (en) | Coding apparatus, computer system, coding method, and computer product | |
US20150062371A1 (en) | Encoding apparatus and method | |
TWI489876B (en) | A Multi - view Video Coding Method That Can Save Decoding Picture Memory Space | |
WO2019037471A1 (en) | Video processing method, video processing device and terminal | |
EP3131295A1 (en) | Video encoding method and system | |
JP5178616B2 (en) | Scene change detection device and video recording device | |
JP2008219141A (en) | Motion vector detector, image encoder and imaging apparatus employing the same | |
CN106303545B (en) | Data processing system and method for performing motion estimation in a sequence of frames | |
JP6663191B2 (en) | Encoding setting information determination device and program | |
Yang et al. | Spatio-temporal LBP based moving object segmentation in compressed domain | |
CN110519597B (en) | HEVC-based encoding method and device, computing equipment and medium | |
US10516896B2 (en) | Encoding device, encoding method, and storage medium | |
US9414067B2 (en) | Methods and systems for detection of block based video dropouts | |
JP5970507B2 (en) | Video encoding apparatus and video encoding program | |
JP2016213657A (en) | Encoded block size determination device, encoding device, and program | |
JP6588745B2 (en) | Scene change detection device and program thereof | |
US9948932B2 (en) | Image processing apparatus and control method of image processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6663191 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |