JP6110724B2 - Image processing apparatus, encoding apparatus, and encoding program - Google Patents
Image processing apparatus, encoding apparatus, and encoding program Download PDFInfo
- Publication number
- JP6110724B2 JP6110724B2 JP2013096584A JP2013096584A JP6110724B2 JP 6110724 B2 JP6110724 B2 JP 6110724B2 JP 2013096584 A JP2013096584 A JP 2013096584A JP 2013096584 A JP2013096584 A JP 2013096584A JP 6110724 B2 JP6110724 B2 JP 6110724B2
- Authority
- JP
- Japan
- Prior art keywords
- motion vector
- unit
- block
- target block
- processing target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 134
- 239000013598 vector Substances 0.000 claims description 145
- 238000000034 method Methods 0.000 description 27
- 238000013139 quantization Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、画像の奥行き情報に基づいて画像を処理する画像処理装置、符号化装置、及び符号化プログラムに関する。 The present invention relates to an image processing apparatus, an encoding apparatus, and an encoding program that process an image based on image depth information.
近年、奥行き情報を取得できる深度センサを搭載したカメラが盛んに研究開発されている。例えば、RGBにD(奥行き)を加えた画像情報を取得するRGB―Dセンサを搭載したカメラの一例として、Microsoft社のKinect(登録商標)がある。このような背景から、2次元の画像信号と、奥行き情報とを有する動画像情報の利用が増加することが予想される。 In recent years, a camera equipped with a depth sensor capable of acquiring depth information has been actively researched and developed. For example, there is Microsoft's Kinect (registered trademark) as an example of a camera equipped with an RGB-D sensor for acquiring image information obtained by adding D (depth) to RGB. From such a background, it is expected that the use of moving image information having a two-dimensional image signal and depth information will increase.
また、動画情報を効率的に処理する規格であるH.264/AVC(Advanced Video Coding)やH.265/HEVC(High Efficiency Video Coding)の映像の圧縮符号化方式では、映像の各フレームをブロックと呼ばれる矩形領域に分割して符号化が行われる。 In addition, H.264, which is a standard for efficiently processing moving image information. H.264 / AVC (Advanced Video Coding) and H.264. In the H.265 / HEVC (High Efficiency Video Coding) video compression encoding method, each frame of the video is divided into rectangular areas called blocks, and encoding is performed.
この映像の圧縮の手法の1つとして、ブロックの動きベクトルを用いた画像予測が利用される。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術などを用いて求められるブロック単位の空間的なずれを示す値である。この動きベクトルを用いて予測画像と、処理対象の画像との差分値を求めることにより、映像のデータ量を削減することが可能である。 As one of the video compression methods, image prediction using a block motion vector is used. The motion vector is a value indicating a spatial deviation in units of blocks obtained using a block matching technique or the like that searches for a position most similar to the processing target block from the reference image in units of blocks. By obtaining a difference value between the predicted image and the image to be processed using this motion vector, it is possible to reduce the amount of video data.
上記の標準においても、動きベクトルが用いられている。なお、動きベクトルの検出手法自体は、規格として定義されていないが、例えばブロック毎にブロックマッチング法を用いて行われている(例えば、非特許文献1参照)。 In the above standards, motion vectors are also used. Note that the motion vector detection method itself is not defined as a standard, but is performed using, for example, a block matching method for each block (see, for example, Non-Patent Document 1).
図1は、動きベクトルの検出例を示している。動画像情報は、複数のフレームを含む。例えば、基準フレーム110は、時刻t=0のときの動画像のフレームを表している。そして、参照フレーム120は、時刻t=−1における動画像のフレームを表している。各々のフレームは、複数のブロックで構成されている。基準フレーム110に存在する処理対象ブロック112の動きベクトルを探索するために、参照フレーム120には、探索範囲121が設定される。ブロックマッチング法を利用した場合には、基準フレーム上の処理対象ブロックの画像と、参照フレーム上の同じ空間位置を中心として設定した上記探索範囲内のブロックの画像SAD(Sum of Absolute Distance:予測誤差の絶対値和)又はSSD(Sum of Square Distance:二乗誤差和)を計算する。この値が最も小さい参照フレーム上のブロックと基準フレーム上の処理対象ブロック位置差から動きベクトルが決定される。
FIG. 1 shows an example of motion vector detection. The moving image information includes a plurality of frames. For example, the
なお、H.264/AVC及びH.265/HEVCの標準では、基準フレームと参照フレームを縦横2倍又は4倍にして、原画像から見て1/2又は1/4画素精度の動きベクトル検出が行われる。 H. H.264 / AVC and H.264. In the H.265 / HEVC standard, the base frame and the reference frame are vertically or horizontally doubled or quadrupled, and motion vector detection with 1/2 or 1/4 pixel accuracy is performed as viewed from the original image.
動きベクトルの検出確度は、映像の圧縮効率などに影響を与えるため、より確度の高い動きベクトルの検出手法が望まれている。 Since the motion vector detection accuracy affects the compression efficiency of the video, a motion vector detection method with higher accuracy is desired.
上述したようにブロックマッチングなどの手法を用いた動きベクトルの検出においては、基準フレームの処理対象ブロックと、参照フレームのブロックが異なるオブジェクトに属するにもかかわらず、両者の輝度又は色等が近似しているために、ブロックマッチングの結果が最小となる場合あり得る。この場合には、検出された動きベクトルは、本来のオブジェクトの動きを反映していないものとなる。特に、H.264/AVC及びH.265/HEVCの標準で、時間ダイレクトモードが採用された場合、例えば1フレーム隣のフレームの動きベクトルを2倍にスケーリングすることで2フレーム隣のフレームとの間の動きベクトルを予測することがある。この場合、そもそもオブジェクトが異なっているために、2フレーム隣のフレームとの間の動きベクトルは、本来の動きベクトルとは更に乖離してしまうこととなる。その結果は、符号化された画質の低下となって現れる。 As described above, in motion vector detection using a technique such as block matching, although the processing target block of the base frame and the block of the reference frame belong to different objects, the luminance or color of both approximates each other. Therefore, the result of block matching may be minimized. In this case, the detected motion vector does not reflect the original motion of the object. In particular, H.C. H.264 / AVC and H.264. When the temporal direct mode is adopted in the standard of H.265 / HEVC, a motion vector between two adjacent frames may be predicted, for example, by scaling the motion vector of the adjacent frame by two times. . In this case, since the objects are different from each other, the motion vector between the two adjacent frames is further deviated from the original motion vector. The result appears as a reduction in the encoded image quality.
なお、例えば色情報などを用いて、同一オブジェクトであるか否かの判定を行うことはできるが、その判定精度には限界があった。例えばオブジェクトが異なっていても、これらのオブジェクトの色が同じであれば、これらのオブジェクトは同一オブジェクトと判定されてしまう。 Although it is possible to determine whether or not they are the same object using, for example, color information, the determination accuracy has a limit. For example, even if the objects are different, if these objects have the same color, these objects are determined to be the same object.
そこで、本発明は、奥行き情報を用いて、より確度の高い動きベクトルの検出を行うことによって、画質の向上を図ることができる画像処理装置、符号化装置、及び符号化プログラムを提供することを目的とする。 Therefore, the present invention provides an image processing device, an encoding device, and an encoding program that can improve image quality by detecting motion vectors with higher accuracy using depth information. Objective.
本発明の一態様における画像処理装置は、奥行き情報を含む画像に対してブロック単位で処理を行う画像処理装置であって、基準フレームの複数のブロックのうちの何れかである処理対象ブロックと、参照される参照フレームの画像の一致度に基づいて、前記処理対象ブロックの動きベクトルの複数の候補を特定する、動きベクトル候補特定部と、前記処理対象ブロックの奥行き情報と、前記動きベクトルを求めた参照フレームの対応するブロックの奥行き情報とを用いて、前記処理対象ブロックと、前記参照フレームの対応するブロックとが、同一のオブジェクトに属するか否かを判定するオブジェクト判定部と、前記動きベクトルの複数の候補の各々に対応する前記一致度と前記オブジェクト判定部の判定結果とに基づいて、前記処理対象ブロックの動きベクトルを決定する、動きベクトル決定部と、を有する。 An image processing apparatus according to an aspect of the present invention is an image processing apparatus that performs processing in units of blocks on an image including depth information, and includes a processing target block that is one of a plurality of blocks of a reference frame; Based on the matching degree of the image of the reference frame to be referenced, a motion vector candidate specifying unit that specifies a plurality of motion vector candidates of the processing target block, depth information of the processing target block, and the motion vector are obtained. Using the depth information of the corresponding block of the reference frame, an object determination unit that determines whether the processing target block and the corresponding block of the reference frame belong to the same object, and the motion vector Based on the degree of coincidence corresponding to each of the plurality of candidates and the determination result of the object determination unit. Determining the motion vector of the block has a motion vector determination unit.
また、前記基準フレーム及び前記参照フレームの奥行き情報にクラスタリングの処理を施す、奥行き情報クラスタリング部を更に有し、前記オブジェクト判定部は、前記クラスタリングの結果を用いて、前記判定を行ってもよい。 In addition, a depth information clustering unit that performs clustering processing on the depth information of the base frame and the reference frame may be further included, and the object determination unit may perform the determination using a result of the clustering.
また、前記動きベクトル決定部は、前記動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合、前記同一のオブジェクトに属すると判定された動きベクトルのうち、前記一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定するか、又は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合、前記一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定してもよい。 The motion vector determination unit may belong to the same object when a block of a reference frame related to the plurality of motion vector candidates is determined to belong to the same object as the processing target block. Among the motion vectors determined as the motion vector of the processing target block, or any block of the reference frame related to a plurality of motion vector candidates When it is determined that the block does not belong to the same object as the processing target block, the motion vector having the highest degree of matching may be determined as the motion vector of the processing target block.
また、前記動きベクトル決定部は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、前記処理対象ブロックが更に複数のサブブロックに分割できる場合、前記サブブロックを、処理対象ブロックとして、当該画像処理装置の処理を繰り返してもよい。 The motion vector determination unit may determine that any block of the reference frame related to a plurality of motion vector candidates does not belong to the same object as the processing target block, and the processing target block is When the image processing apparatus can be further divided into a plurality of sub-blocks, the processing of the image processing apparatus may be repeated with the sub-block as a processing target block.
また、本発明の他の態様における符号化装置は、上記画像処理装置を備えてもよい。 An encoding apparatus according to another aspect of the present invention may include the image processing apparatus.
また、本発明の他の態様における符号化プログラムは、コンピュータを、上記符号化装置として機能させる。 An encoding program according to another aspect of the present invention causes a computer to function as the encoding apparatus.
本発明によれば、奥行き情報を用いて動きベクトルを、より的確に検出し、画質の向上を図ることができる。 According to the present invention, it is possible to more accurately detect a motion vector using depth information and improve image quality.
以下、各実施例について、添付図面を参照しながら詳細に説明する。 Hereinafter, each embodiment will be described in detail with reference to the accompanying drawings.
[実施例1]
まず、実施例1における画像処理装置について説明する。実施例1における画像処理装置は、奥行き情報を用いて動きベクトルを決定する装置である。この画像処理装置は、集積回路により実装されてもよい。また、記憶媒体に記憶されたプログラムをコンピュータが読み込んで、このプログラムをコンピュータが実行することにより実装されてもよい。
[Example 1]
First, the image processing apparatus according to the first embodiment will be described. The image processing apparatus according to the first embodiment is an apparatus that determines a motion vector using depth information. This image processing apparatus may be implemented by an integrated circuit. Further, the program may be implemented by reading a program stored in a storage medium by a computer and executing the program by the computer.
<構成>
図2は、実施例1における画像処理装置10の構成の一例を示すブロック図である。図2に示す画像処理装置10は、動きベクトル候補特定部140と、奥行き情報クラスタリング部150と、オブジェクト判定部160と、動きベクトル決定部170とを有する。
<Configuration>
FIG. 2 is a block diagram illustrating an example of the configuration of the
動きベクトル候補特定部140には、基準フレームと参照フレームの画像情報が入力される。参照フレームは、複数であってもよい。動きベクトル候補特定部140は、基準フレームの画像をブロック分割(例えば16×16画素サイズに分割)する。基準フレームの分割された複数のブロックのうちの1つを、順に処理対象ブロックとして選択する。そして、処理対象ブロックについて、参照フレームの画像を探索することによって動きベクトルを検出する。動きベクトルの検出には、例えば既存の手法であるブロックマッチング法を用いてもよい。
The motion vector
なお、本実施例では、処理対象ブロック毎にSAD又はSSDの値がn番目までに小さい動きベクトルを動きベクトルの複数の候補として検出することが望ましい。nの値は、例えば3を用いてもよい。動きベクトルの複数の候補は、動きベクトル決定部170と、オブジェクト判定部160に出力する。また、動きベクトルを求めたときの処理対象ブロックと、参照フレームのブロックの位置情報をオブジェクト判定部160に出力する。
In this embodiment, it is desirable to detect a motion vector having a SAD or SSD value as small as the nth for each processing target block as a plurality of motion vector candidates. For example, 3 may be used as the value of n. The plurality of motion vector candidates are output to the motion
奥行き情報クラスタリング部150は、例えば、基準フレームと参照フレームの各奥行き情報をクラスタリングする。ここで、奥行き情報は、画素毎、又は撮像時に決定されるブロック領域毎に存在する。奥行き情報クラスタリング部150は、奥行き情報を示す奥行き深度が例えば256段階である場合、クラスタ数k=8に設定し、K−means法を適用して奥行き情報のクラスタリングを行う。
For example, the depth
奥行き深度の段階数は、深度センサの性能に従うため256に限られない。クラスタ数kは、予め適切な値が設定されていればよい。 The number of stages of depth and depth is not limited to 256 in order to follow the performance of the depth sensor. An appropriate value may be set in advance for the number k of clusters.
また、奥行き情報クラスタリング部150は、奥行き情報のヒストグラムを求め、このヒストグラムが取る値の範囲をクラスタ数kに等分割し、奥行き情報を分類してもよい。
In addition, the depth
奥行き情報クラスタリング部150は、上述のK−means法による奥行き情報のクラスタリング、又は、奥行き情報のヒストグラムから求めた奥行き情報の分類を用いることができる。奥行き情報クラスタリング部150は、各画素位置又は各所定領域の奥行き情報のクラスタリング結果として、奥行き降順に番号を付与して、このクラスタリング結果を示すクラスタリング情報(例えば0〜7)をオブジェクト判定部160に出力する。
The depth
オブジェクト判定部160は、動きベクトルが算出された処理対象ブロックと、対応する参照フレームのブロックが同一のオブジェクトに属するか否かの判定を行う。オブジェクト判定部160は、取得部162と奥行き判定部164とを備える。
The
取得部162は、ブロック毎に、クラスタリング情報の代表値を取得する。取得部162は、ブロック毎にクラスタリング情報を平均化し、端数を四捨五入する整数化を行うことで、ブロック毎に1つの奥行き情報(代表値)を取得する。なお、取得部162は、ブロック毎に、クラスタリング情報の中央値や最頻値を代表値としてもよい。取得部162は、ブロック内の奥行き情報の代表値を、ブロックの奥行き代表情報として奥行き判定部164に出力する。
The
奥行き判定部164は、取得部162から取得した、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報が所定範囲内に属するか否かを判定する。例えば、奥行き判定部164は、処理対象ブロック奥行き情報と、対応する参照フレームのブロックの奥行き代表情報との差が所定値以内にあるか否かを判定してもよい。
The
奥行き判定部164は、所定値を0にすれば、奥行き情報が同じクラスタに属するか否かを判定でき、所定値を例えば1などにすれば、奥行き情報同士が類似するか否かを判定できる。
The
奥行き判定部164は、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報の差が所定値以内であれば、処理対象ブロックと、対応する参照フレームのブロックは、同一オブジェクトに属すると判定する。また、奥行き判定部164は、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報との差が所定値より大きければ、処理対象ブロックと、対応する参照フレームのブロックは、同一オブジェクトに属しないと判定する。
The
なお、オブジェクト判定部160は、奥行き情報のクラスタリング情報を用いずに、ブロック内の奥行き情報から直接に代表値を決定し、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報の代表値の差が所定値以内であるかを判定してもよい。
The
オブジェクト判定部160は、奥行き判定部164の判定結果を動きベクトル決定部170に出力する。
The
動きベクトル決定部170は、オブジェクト判定部160からの情報を用いて、処理対象ブロックに対する動きベクトルの複数の候補から、処理対象ブロックの動きベクトルを決定する。
The motion
図3は、動きベクトル決定部170の細部の構成の例を示している。動きベクトル決定部170は、第1決定部171、第2決定部172、第3決定部173、選択部174、及び測定部175を備える。
FIG. 3 shows an example of a detailed configuration of the motion
なお、選択部174は、動きベクトル候補特定部140からの情報及びオブジェクト判定部160からの情報を、第1決定部171、第2決定部172、第3決定部173の何れかに、選択的に伝達するように動作してもよい。
Note that the
また、選択部174は、後に説明する測定部からの情報に基づいて、選択的に伝達する機能が制御される。選択部174は、オペレータなどの外部からの設定によって、選択的に伝達するように設定されてもよい。
In addition, the function of selectively transmitting the
第1決定部171は、一致度が最も高い動きベクトル、すなわち、ブロック間のSAD(Sum of Absolute Difference)又はSSD(Sum of Squared Difference)が最小となる動きベクトルを、処理対象ブロックの動きベクトルとして採用すべきか否かを決定する。すなわち、第1決定部171は、一致度が最も高い動きベクトルに関して、処理対象ブロックと、対応する参照フレームのブロックとが同一のオブジェクトに属しないと前記オブジェクト判定部において判定された場合、一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルとして採用することを却下する決定を行ってもよい。一致度が最も高い動きベクトルであっても、処理対象ブロックと、対応する参照フレームのブロックとが同一のオブジェクトに属しないと判断される場合には、この動きベクトルを採用することは、適切な判断ではないからである。
The first determining
第1決定部171は、却下を行わない場合には、一致度が最も高い動きベクトルを出力する。第1決定部171が、却下を行った場合には、nullが出力されてもよい。例えば、レジストレーション超解像の処理においては、動きベクトルとしてnullが許容されている。なお、H.264/AVC、又はH.265/HEVCの標準においては、nullは適切ではないとされているため、後述する第2決定部172の処理を行ってもよい。
The
第2決定部172は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、同一のオブジェクトに属すると判定された動きベクトルのうち、一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定する。なお、第2決定部172は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
The second determining
第3決定部173は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、第2決定部172と同じ処理を行ってもよい。第3決定部173は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、処理対象ブロックが更に複数のサブブロックに分割できる場合、サブブロックを、処理対象ブロックとして、動きベクトルの検出の処理を繰り返す処理(図2及び図3の処理)を、例えば動きベクトル候補特定部140に指示してもよい(176)。例えば、16×16画素サイズのブロックを用いてベクトルの検出の処理を行っていた場合には、このブロックを8×8画素サイズの4つのブロックに分割して、同様に動きベクトルの検出の処理を行う。なお、更なるブロックの分割が行えない場合には、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
The
なお、上記の更なるブロック分割が行われた場合には、このブロック分割に係る指示176をビットストリームに含めるために、この指示176を、図5と共に後に説明するエントロピー符号化部204に出力し、符号化するとともに、上述のように動きベクトル候補特定部140に指示してもよい。
In addition, when the above further block division is performed, this
そして、ブロックの復号化においては、このブロック分割に係る符号化された指示176が復号化されて利用される。
In block decoding, the encoded
また、画像を量子化した後の情報(例えば、図5における量子化部203からの量子化データ180)が、測定部175に入力される。第3決定部が選択部174において選択されている場合に、測定部175は、量子化データ180に係る単位時間当たりの情報量を随時測定する。例えば、量子化データ180に係る単位時間当たりの情報量が増加する傾向であれば、選択部が第1決定部171、又は第2決定部172を選択する様、選択部に指令を発してもよい。この処理を行う理由は、例えば、ブロック分割が頻繁に発生する場合には、ブロック分割に係る指示176を表すデータが、量子化データ180に係る単位時間当たりの情報量を増加させる要因となり得るため、この単位時間当たりの情報量を所定の量以下に止めることが望ましいからである。
Further, information after the image is quantized (for example, quantized
以上の構成を有することで、動き情報を利用して、動きベクトルをより的確に検出し、画質の向上を図ることができる。 With the above configuration, it is possible to detect motion vectors more accurately using motion information and improve image quality.
<動作>
次に、実施例1における画像処理装置10の動作について図4及び図5を用いて説明する。
<Operation>
Next, the operation of the
図4は、実施例1の基準フレームの1つの処理対象ブロックに対する処理の概要を示している。 FIG. 4 shows an overview of processing for one processing target block of the reference frame of the first embodiment.
ステップS102で、動きベクトル候補特定部140は、処理対象ブロックに対する動きベクトルの複数の候補を特定する。
In step S102, the motion vector
ステップS104で、奥行き情報クラスタリング部150は、基準フレーム及び参照フレームの奥行き情報のクラスタリング処理を行う。クラスタリング処理は、K−means法を利用してもよい。奥行き情報クラスタリング部150は、奥行き情報のクラスタリング結果として、奥行きを降順に番号を付与して、各画素位置又は各所定領域に対して、このクラスタリング結果を示すクラスタリング情報(例えば0〜7)を出力してもよい。
In step S104, the depth
ステップS106で、オブジェクト判定部160は、取得部162において、関連する各ブロックについて、ブロックの奥行きを代表する代表値を取得する。取得部162は、ブロック毎にクラスタリング情報を平均化し、端数を四捨五入する整数化を行うことで、ブロック毎に1つの奥行き情報(代表値)を取得する。なお、取得部162は、ブロック毎に、クラスタリング情報の中央値や最頻値を代表値としてもよい。
In step S <b> 106, the
ステップS108で、奥行き判定部は、動きベクトルの複数の候補の各々に関連する処理対象ブロックと、参照フレーム内の対応するブロックが同一オブジェクトに属するか否かを判定する。 In step S108, the depth determination unit determines whether or not the processing target block associated with each of the plurality of motion vector candidates and the corresponding block in the reference frame belong to the same object.
ステップS110において、動きベクトル決定部170は、一致度が最も高い値を有する第一候補の動きベクトルが取得された2つのブロックが同一オブジェクトに属すると判定された場合には、その第一候補の動きベクトルを、処理対象ブロックの動きベクトルとして決定する。
In step S110, when it is determined that the two blocks from which the motion vector of the first candidate having the highest degree of coincidence is acquired belong to the same object, the motion
上記以外の場合には、既に説明したように以下のようになる。 In cases other than the above, as described above, the operation is as follows.
まず、第1決定部171は、NULLを出力する。
First, the
第2決定部172は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、同一のオブジェクトに属すると判定された動きベクトルのうち、一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定してもよい。なお、第2決定部172は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
The second determining
第3決定部173は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、第2決定部172と同じ処理を行う。第3決定部173は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、処理対象ブロックが更に複数のサブブロックに分割できる場合、サブブロックに分割し、このサブブロックを、処理対象ブロックとして、動きベクトルの検出の処理を繰り返す処理(図2及び図3の処理)の指示176を出力する。
The
以上、実施例1によれば、奥行き情報を利用することにより、同一オブジェクトと判定されたブロックに基づいて、動きベクトルを検出することが可能となり、より的確に動きベクトルを検出でき、画質の向上を図ることができる。 As described above, according to the first embodiment, by using the depth information, a motion vector can be detected based on blocks determined to be the same object, and the motion vector can be detected more accurately, thereby improving the image quality. Can be achieved.
[実施例2]
実施例2では、実施例1における画像処理装置10を動きベクトル計算部213に含む符号化装置について説明する。実施例2では、入力される情報に奥行き情報が含まれているとする。
[Example 2]
In the second embodiment, an encoding device including the
<構成>
図5は、実施例2における符号化装置20の概略構成の一例を示すブロック図である。図5に示す例では、符号化装置20は、前処理部200と、予測誤差信号生成部201と、直交変換部202と、量子化部203と、エントロピー符号化部204と、逆量子化部205と、逆直交変換部206と、復号画像生成部207と、ループフィルタ部209と、復号画像記憶部210と、イントラ予測部211と、インター予測部212と、動きベクトル計算部213と、予測画像選択部215とを有する。各部についての概略を以下に説明する。
<Configuration>
FIG. 5 is a block diagram illustrating an example of a schematic configuration of the
前処理部200は、ピクチャタイプに合わせてピクチャを並べ替え、ピクチャタイプ及びフレーム毎のフレーム画像等を順次出力する。また、前処理部200は、ブロック分割なども行い、ブロック分割の境界情報をループフィルタ部209に出力してもよい。また、前処理部200は、原画に含まれる奥行き情報を動きベクトル計算部213に出力する。
The
予測誤差信号生成部201は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。
The prediction error
予測誤差信号生成部201は、そのブロックデータと、予測画像選択部215から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部201は、生成された予測誤差信号を直交変換部202に出力する。
The prediction error
直交変換部202は、入力された予測誤差信号を直交変換処理する。直交変換部202は、変換された係数値を示す信号を量子化部203に出力する。
The
量子化部203は、直交変換部202からの出力信号を量子化する。量子化部203は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部204及び逆量子化部205に出力する。量子化部203は、量子化パラメータのQP値をループフィルタ部209に出力する。量子化部の出力信号は、量子化データ180として、動きベクトル計算部213に出力されてもよい。
The
エントロピー符号化部204は、量子化部203からの出力信号や、動きベクトル計算部213から出力された動きベクトル情報やループフィルタ部209からのフィルタ係数などをエントロピー符号化して出力する。
The
また、エントロピー符号化部204は、イントラ予測部211から取得したイントラ予測方向の差分値や、インター予測部212から取得した動きベクトルと予測ベクトルの差分値などをエントロピー符号化する。
Also, the
また、エントロピー符号化部204は、動きベクトル決定部170内の第3決定部173から取得した、ブロック再分割に関する情報を符号化してもよい。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
In addition, the
逆量子化部205は、量子化部203からの出力信号を逆量子化してから逆直交変換部206に出力する。逆直交変換部206は、逆量子化部205からの出力信号を逆直交変換処理してから復号画像生成部207に出力する。これら逆量子化部205及び逆直交変換部206によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
The
復号画像生成部207は、イントラ予測部211で画面内予測された画像或いはインター予測部212で動き補償された画像のブロックデータと、逆量子化部205及び逆直交変換部206により復号処理された予測誤差信号とを加算する。復号画像生成部207は、加算して生成した復号画像のブロックデータを、ループフィルタ部209に出力する。
The decoded
ループフィルタ部209は、例えばALF(Adaptive Loop Filter)やデブロッキングフィルタである。ループフィルタ部209は、フィルタ処理結果を復号画像記憶部210に出力し、蓄積された1画像分のフィルタ処理結果を参照画像として記憶させる。
The
復号画像記憶部210は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部211、インター予測部212及び動きベクトル計算部213に出力する。
The decoded
イントラ予測部211は、符号化対象画像の処理対象ブロックに対して、既に符号化された参照画素から予測画像のブロックデータを生成する。イントラ予測部211は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。予測方向については、符号化済みブロックの予測方向との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
The
インター予測部212は、復号画像記憶部210から取得した参照画像のデータを動きベクトル計算部213から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。動きベクトルについては、符号化済みブロックの動きベクトル(予測ベクトル)との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
The
動きベクトル計算部213は、実施例1における画像処理装置10の構成を有し、奥行き情報と、符号化対象画像におけるブロックデータと、復号画像記憶部210から取得する参照画像とを用いて、動きベクトルを求める。
The motion
動きベクトル計算部213は、求めた動きベクトルをインター予測部212に出力し、参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部204に出力する。
The motion
イントラ予測部211とインター予測部212から出力されたブロックデータは、予測画像選択部215に入力される。
The block data output from the
予測画像選択部215は、イントラ予測部211とインター予測部212から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部201に出力される。
The predicted
なお、図5に示す符号化装置20の構成は一例であり、必要に応じて各構成を組み合わせたり、各構成を適宜変更したりしてもよい。
Note that the configuration of the
以上、実施例2によれば、画像符号化時に、奥行き情報を用いて画質の向上を図ることができる。 As described above, according to the second embodiment, it is possible to improve the image quality using the depth information at the time of image coding.
[実施例3]
図6は、実施例3における画像処理装置40の概略構成の一例を示すブロック図である。図6に示す画像処理装置40は、上述した実施例1及び2で説明した画像処理装置10、符号化装置20をソフトウェアで実装した画像処理装置の一例である。
[Example 3]
FIG. 6 is a block diagram illustrating an example of a schematic configuration of the
図6に示すように、画像処理装置40は、制御部401と、主記憶部402と、補助記憶部403と、ドライブ装置404と、ネットワークI/F部406と、入力部407と、表示部408とを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
As shown in FIG. 6, the
制御部401は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPU(Central Processing Unit)である。また、制御部401は、主記憶部402又は補助記憶部403に記憶された画像処理のプログラムを実行する演算装置である。制御部401は、入力部407や記憶装置からデータを受け取り、演算、加工した上で、表示部408や記憶装置などに出力する。
The
また、制御部401は、画像処理のプログラムを実行することで、実施例1及び2で説明した処理を実現することができる。
Further, the
主記憶部402は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部402は、制御部401が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
The
補助記憶部403は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
The
ドライブ装置404は、記録媒体405、例えばフレキシブルディスクからプログラムを読み出し、記憶部にインストールする。
The
また、記録媒体405に、所定のプログラムを格納し、この記録媒体405に格納されたプログラムはドライブ装置404を介して画像処理装置40にインストールされる。インストールされた所定のプログラムは、画像処理装置40により実行可能となる。
A predetermined program is stored in the
ネットワークI/F部406は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像処理装置40とのインターフェースである。
The network I /
入力部407は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部408の表示画面上でキーの選択等を行うためのマウスやスライドパット等を有する。表示部408は、LCD(Liquid Crystal Display)等により構成され、制御部401から入力される表示データに応じた表示が行われる。
The
なお、図3に示す画像処理装置10の各部は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
Each unit of the
また、図5に示す復号画像記憶部210は、例えば主記憶部402又は補助記憶部403により実現され、図5に示す復号画像記憶部210以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
Further, the decoded
また、図6に示す復号情報記憶部305及びフレームメモリ311は、例えば主記憶部402又は補助記憶部403により実現されうる。図6に示す復号情報記憶部305及びフレームメモリ311以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
Further, the decoded information storage unit 305 and the frame memory 311 illustrated in FIG. 6 can be realized by the
画像処理装置40で実行されるプログラムは、実施例1及び2で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部401が補助記憶部403からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部402上にロードされ、1又は複数の各部が主記憶部402上に生成されるようになっている。
The program executed by the
このように、上述した実施例1及び2で説明した画像処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、実施例1及び2で説明した処理を実現することができる。 As described above, the image processing described in the first and second embodiments may be realized as a program for causing a computer to execute the image processing. The processing described in the first and second embodiments can be realized by installing this program from a server or the like and causing the computer to execute the program.
また、このプログラムを記録媒体405に記録し、このプログラムが記録された記録媒体405をコンピュータや携帯端末などの処理装置に読み取らせて、前述した画像処理を実現させることも可能である。
It is also possible to record the program in the
なお、記録媒体405は、CD−ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
Note that the
また、上述した各実施例で説明した画像処理は、1つ又は複数の集積回路に実装されてもよい。なお、実施例3における画像処理装置40は、上記の通り、画像処理装置10、符号化装置20の少なくとも1つの装置としての機能を有してもよい。
Further, the image processing described in each of the above embodiments may be implemented in one or a plurality of integrated circuits. Note that the
また、上述した各実施例における画像処理装置10、符号化装置20、及び画像処理装置40は、奥行き情報を用いて動きベクトルを検出する符号化技術、及びこの符号化技術によって符号化されたビットストリームの復号に対して適用可能であり、H.264/AVCやH.265/HEVCだけに限られるものではない。
In addition, the
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。 Each embodiment has been described in detail above. However, the present invention is not limited to the specific embodiment, and various modifications and changes other than the above-described modification are possible within the scope described in the claims. .
10 画像処理装置
20 符号化装置
40 画像処理装置
140 動きベクトル候補特定部
150 奥行き情報クラスタリング部
160 オブジェクト判定部
162 取得部
164 奥行き判定部
170 動きベクトル決定部
171 第1決定部
172 第2決定部
173 第3決定部
174 選択部
175 測定部
204 エントロピー符号化部
213 動きベクトル計算部
301 エントロピー復号部
401 制御部
402 主記憶部
403 補助記憶部
DESCRIPTION OF
Claims (6)
基準フレームの複数のブロックのうちの何れかである処理対象ブロックと、参照される参照フレームの画像の一致度に基づいて、前記処理対象ブロックの動きベクトルの複数の候補を特定する、動きベクトル候補特定部と、
前記処理対象ブロックの奥行き情報と、前記動きベクトルを求めた参照フレームの対応するブロックの奥行き情報とを用いて、前記処理対象ブロックと、前記参照フレームの対応するブロックとが、同一のオブジェクトに属するか否かを判定するオブジェクト判定部と、
前記動きベクトルの複数の候補の各々に対応する前記一致度と前記オブジェクト判定部の判定結果とに基づいて、前記処理対象ブロックの動きベクトルを決定する、動きベクトル決定部と、
を有する画像処理装置。 An image processing apparatus that performs processing in units of blocks on an image including depth information,
A motion vector candidate that specifies a plurality of motion vector candidates of the processing target block based on the degree of coincidence between the processing target block that is one of the plurality of blocks of the reference frame and the image of the reference frame that is referred to A specific part,
The processing target block and the corresponding block of the reference frame belong to the same object by using the depth information of the processing target block and the depth information of the corresponding block of the reference frame for which the motion vector is obtained. An object determination unit for determining whether or not,
A motion vector determination unit that determines a motion vector of the processing target block based on the degree of coincidence corresponding to each of the plurality of motion vector candidates and the determination result of the object determination unit;
An image processing apparatus.
前記オブジェクト判定部は、前記クラスタリングの結果を用いて、前記判定を行う、
請求項1記載の画像処理装置。 A depth information clustering unit that performs clustering processing on the depth information of the base frame and the reference frame;
The object determination unit performs the determination using a result of the clustering.
The image processing apparatus according to claim 1.
前記動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合、前記同一のオブジェクトに属すると判定された動きベクトルのうち、前記一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定するか、又は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合、前記一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定する、
請求項1又は2記載の画像処理装置。 The motion vector determination unit
When there is a motion vector determined to belong to the same object as the block to be processed, the block of the reference frame related to the plurality of motion vector candidates, among the motion vectors determined to belong to the same object, The motion vector having the highest degree of coincidence is determined as the motion vector of the processing target block, or any block of the reference frame related to a plurality of motion vector candidates belongs to the same object as the processing target block. If it is determined not to, the motion vector having the highest degree of coincidence is determined as the motion vector of the processing target block.
The image processing apparatus according to claim 1 or 2.
複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、前記処理対象ブロックが更に複数のサブブロックに分割できる場合、前記サブブロックを、処理対象ブロックとして、当該画像処理装置の処理を繰り返す指示を出力する請求項1又は2記載の画像処理装置。 The motion vector determination unit
When it is determined that none of the reference frames related to a plurality of motion vector candidates belong to the same object as the processing target block, and the processing target block can be further divided into a plurality of sub-blocks The image processing apparatus according to claim 1, wherein an instruction to repeat the processing of the image processing apparatus is output with the sub-block as a processing target block.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013096584A JP6110724B2 (en) | 2013-05-01 | 2013-05-01 | Image processing apparatus, encoding apparatus, and encoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013096584A JP6110724B2 (en) | 2013-05-01 | 2013-05-01 | Image processing apparatus, encoding apparatus, and encoding program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014220571A JP2014220571A (en) | 2014-11-20 |
JP6110724B2 true JP6110724B2 (en) | 2017-04-05 |
Family
ID=51938688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013096584A Active JP6110724B2 (en) | 2013-05-01 | 2013-05-01 | Image processing apparatus, encoding apparatus, and encoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6110724B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113678431A (en) * | 2019-03-25 | 2021-11-19 | 索尼互动娱乐股份有限公司 | Image transmission/reception system, image transmission device, image reception device, image transmission/reception method, and program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6567469B1 (en) * | 2000-03-23 | 2003-05-20 | Koninklijke Philips Electronics N.V. | Motion estimation algorithm suitable for H.261 videoconferencing applications |
WO2008010929A2 (en) * | 2006-07-18 | 2008-01-24 | Thomson Licensing | Methods and apparatus for adaptive reference filtering |
JP4938884B2 (en) * | 2010-09-30 | 2012-05-23 | シャープ株式会社 | Prediction vector generation method, image encoding method, image decoding method, prediction vector generation device, image encoding device, image decoding device, prediction vector generation program, image encoding program, and image decoding program |
JP5357199B2 (en) * | 2011-03-14 | 2013-12-04 | 日本電信電話株式会社 | Image encoding method, image decoding method, image encoding device, image decoding device, image encoding program, and image decoding program |
WO2012153440A1 (en) * | 2011-05-09 | 2012-11-15 | シャープ株式会社 | Prediction vector generation method, prediction vector generation device, prediction vector generation program, image encoding method, image encoding device, image encoding program, image decoding method, image decoding device, and image decoding program |
-
2013
- 2013-05-01 JP JP2013096584A patent/JP6110724B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014220571A (en) | 2014-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10291925B2 (en) | Techniques for hardware video encoding | |
JP6073405B2 (en) | Video decoding method and apparatus | |
TWI536811B (en) | Method and system for image processing, decoding method, encoder and decoder | |
TWI660623B (en) | Motion vector prediction decoding method and prediction decoding device | |
US11025913B2 (en) | Encoding video using palette prediction and intra-block copy | |
KR102314547B1 (en) | Method and apparatus for encoding or decoding video data with subpixel motion vector refinement | |
JP5216710B2 (en) | Decryption processing method | |
US11323700B2 (en) | Encoding video using two-stage intra search | |
JP6042001B2 (en) | Moving picture coding apparatus and moving picture coding method | |
JP2019110530A (en) | Method and device for encoding video data | |
CN107770527B (en) | Data compression method and apparatus using neighboring encoding parameters and nearest encoding parameters | |
JP6110724B2 (en) | Image processing apparatus, encoding apparatus, and encoding program | |
JP2019110529A (en) | Method and device for encoding video data | |
JP2017050744A (en) | Image encoding apparatus, image encoding method and program | |
JP2013207402A (en) | Image encoding device and program | |
JP5698629B2 (en) | Image processing apparatus, filter processing method, and program | |
JP6101067B2 (en) | Image processing apparatus and image processing program | |
JP2014143515A (en) | Image processing apparatus and image processing program | |
JP2018186456A (en) | Image encoding apparatus, image encoding method, and program | |
JP2019057886A (en) | Encoder, encoding method, and program | |
JP2019016896A (en) | Image processing system, and image processing method | |
JP2008072608A (en) | Apparatus and method for encoding image | |
JP2007243391A (en) | Animation image encoder | |
JP6159139B2 (en) | Image processing apparatus, encoding apparatus, and program | |
JP2016021710A (en) | Image encoding method and image encoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6110724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |