JP2018129688A - Video encoding device, video encoding/decoding system, and video encoding program - Google Patents
Video encoding device, video encoding/decoding system, and video encoding program Download PDFInfo
- Publication number
- JP2018129688A JP2018129688A JP2017021623A JP2017021623A JP2018129688A JP 2018129688 A JP2018129688 A JP 2018129688A JP 2017021623 A JP2017021623 A JP 2017021623A JP 2017021623 A JP2017021623 A JP 2017021623A JP 2018129688 A JP2018129688 A JP 2018129688A
- Authority
- JP
- Japan
- Prior art keywords
- roi
- information
- unit
- syntax
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、映像信号を符号化する映像符号化装置、映像信号を符号・復号する映像符号復号システム、及び映像符号化プログラムに関する。 The present invention relates to a video encoding device that encodes a video signal, a video encoding / decoding system that encodes / decodes a video signal, and a video encoding program.
近年、監視カメラの普及は進み、さらなる高解像度化、高フレームレート化、多視点化が望まれている。しかし、高解像度化、高フレームレート化、多視点化は、動画像のデータ量の著しい増加を引き起こし、通信コストやストレージコストの増加を招く。 In recent years, surveillance cameras have become popular, and further higher resolution, higher frame rate, and multi-viewpoint are desired. However, increasing the resolution, increasing the frame rate, and increasing the number of viewpoints cause a significant increase in the amount of moving image data, resulting in increased communication costs and storage costs.
この問題を緩和するため、動画像中から例えば「顔」が表示されている特定の領域をROI(Region of Interest)として検出し、このROIに対して多くのビット数を割り当てて画像圧縮符号化処理を施すようにした画像処理装置が提案されている(例えば、特許文献1参照)。 In order to alleviate this problem, for example, a specific region in which “face” is displayed is detected as a ROI (Region of Interest) from a moving image, and a large number of bits are assigned to this ROI to perform image compression coding. An image processing apparatus that performs processing has been proposed (see, for example, Patent Document 1).
当該画像処理装置では、符号量と映像品質を制御するパラメータをブロック毎に設定するという圧縮部の機能を利用して、ROI以外の領域、つまり背景領域の情報量をROIの情報量よりも削減するように、圧縮部に与えるパラメータを制御することにより、データ量を削減している。 In the image processing apparatus, the information amount of the area other than the ROI, that is, the background area is reduced from the information amount of the ROI by using the function of the compression unit that sets the parameter for controlling the code amount and the video quality for each block. As described above, the data amount is reduced by controlling the parameters given to the compression unit.
一方、例えば価格や互換性等の事情により、符号量と映像品質を制御するパラメータをブロック毎に設定するという機能を備えていない圧縮部を用いる場合には、上記したような方法で情報量の削減を図ることはできない。 On the other hand, when using a compression unit that does not have a function of setting a parameter for controlling the code amount and video quality for each block due to circumstances such as price and compatibility, the amount of information is It cannot be reduced.
そこで、圧縮部に依存せずに背景領域の情報量を削減する為に、背景領域に低域通過フィルタによるフィルタリング処理を施して高周波成分の情報を取り除くことで背景領域の情報量を削減するようにした画像符号化装置が提案されている(例えば、特許文献2参照)。この画像符号化装置では、低域通過フィルタによるフィルタリングにより、画像信号の情報量を削減しつつ、ブロック境界に発生するアーティファクトの発生を抑制している。 Therefore, in order to reduce the amount of information in the background area without depending on the compression unit, the amount of information in the background area is reduced by filtering the background area with a low-pass filter to remove high-frequency component information. An image coding apparatus has been proposed (see, for example, Patent Document 2). In this image encoding device, the generation of artifacts occurring at block boundaries is suppressed while reducing the amount of image signal information by filtering with a low-pass filter.
ところで、上記したような従来の画像処理では、以下の問題が生じる。すなわち、復号に必要な演算量を少なくするために、他のピクチャを参照せずに各フレーム内で画像信号を圧縮する、いわゆるフレーム内符号化を実施した場合には、他のピクチャの参照を許容するフレーム間符号化に比べて符号量が著しく増加する。よって、大幅な符号量の削減を図ることが困難になる。 By the way, the following problems occur in the conventional image processing as described above. In other words, in order to reduce the amount of computation required for decoding, when so-called intraframe coding is performed in which an image signal is compressed within each frame without referring to other pictures, reference to other pictures is performed. Compared with the allowable interframe coding, the code amount is significantly increased. Therefore, it becomes difficult to reduce the code amount significantly.
一方、フレーム間符号を行った場合には、符号量の削減を図ることができるものの、復号時の演算量が大きくなるという問題が生じる。すなわち、フレーム間符号の施された符号化画像信号に対して、ROIを含む任意のピクチャを復号する際に、当該ピクチャが他のピクチャを参照している場合には、ROIに対する復号を行う前に、この他のピクチャを復号しておく必要がある。更に、当該他のピクチャが更に別のピクチャを参照している場合、この別のピクチャを先に復号しておく必要が生じる。このように、フレーム間符号を行った場合、ROIを含む任意のピクチャを復号する際に、1つ以上のピクチャを予め復号しておかなければならない為、ROIの復号に必要となる演算量が大きくなるという問題が生じる。 On the other hand, when inter-frame coding is performed, the amount of code can be reduced, but there is a problem that the amount of calculation at the time of decoding becomes large. That is, when an arbitrary picture including an ROI is decoded with respect to an encoded image signal subjected to inter-frame coding, if the picture refers to another picture, before decoding the ROI In addition, it is necessary to decode other pictures. Further, when the other picture refers to another picture, it is necessary to decode this other picture first. As described above, when inter-frame coding is performed, when decoding any picture including ROI, one or more pictures must be decoded in advance. Therefore, the amount of calculation required for ROI decoding is small. The problem of becoming larger arises.
そこで、本発明は、符号量の削減及び演算量の削減を両立させることが可能な映像符号化装置、映像符号復号システム、及び映像符号化プログラムを提供することを目的とする。 Therefore, an object of the present invention is to provide a video encoding device, a video encoding / decoding system, and a video encoding program capable of achieving both a reduction in code amount and a reduction in calculation amount.
本発明に係る映像符号化装置は、入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成する映像符号化装置であって、ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成するROI設定部と、前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成するエンコーダ部と、を有し、前記エンコーダ部は、前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施す。 A video encoding apparatus according to the present invention is a video encoding apparatus that generates a bitstream signal by performing compression encoding processing on an input image signal, and sets an ROI (Region Of Interest) in a picture, and the picture A ROI setting unit that generates ROI information representing the position and size of the ROI within the network, and receives the input image signal and the ROI information, and performs compression encoding processing on the input image signal based on the ROI information An encoder unit that generates a bitstream signal, and the encoder unit performs compression coding processing on an image block included in the ROI in a picture in the input image signal based on the ROI information. Intra coding is performed, and for the image blocks included in the non-ROI, the intra coding and intra coding are performed as the compression coding processing. Applied by selecting one of the over coding.
本発明に係る映像符号復号システムは、入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成する映像符号化装置と、前記ビットストリーム信号に対して復号処理を施す映像復号装置と、を含む画像符号復号システムであって、前記映像符号化装置は、ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成するROI設定部と、復号に必要となるパラメータセットを含む上位シンタックス情報を生成する上位シンタックス生成部と、前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施して得られたエレメンタリーストリーム信号と、前記上位シンタックス情報とを多重化したビットストリーム信号を出力するエンコーダ部と、を有し、前記エンコーダ部は、前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施し、前記映像復号装置は、前記ビットストリーム信号を受け、前記ビットストリーム信号から前記上位シンタックス情報に含まれる前記パラメータセット、及び前記エレメンタリーストリーム信号に対応したアクセスユニットを抽出する復号画像選択部と、前記アクセスユニットに対して前記パラメータセットに基づく復号処理を施して出力画像を生成する映像復号部と、を含む。 A video encoding / decoding system according to the present invention includes: a video encoding device that performs compression encoding processing on an input image signal to generate a bitstream signal; and a video decoding device that performs decoding processing on the bitstream signal. An image encoding / decoding system including: an ROI setting unit configured to set an ROI (Region Of Interest) in a picture and generate ROI information indicating a position and a size of the ROI in the picture An upper syntax generation unit that generates upper syntax information including a parameter set necessary for decoding, and receives the input image signal and the ROI information, and compresses and encodes the input image signal based on the ROI information A bit stream signal obtained by multiplexing an elementary stream signal obtained by processing and the upper syntax information An encoder unit for outputting, based on the ROI information, the encoder unit performs intra coding as the compression coding process on an image block included in the ROI in a picture in the input image signal. For the image blocks included in the non-ROI, one of the intra coding and the inter coding is selected as the compression coding processing, and the video decoding device receives the bit stream signal, A decoded image selection unit that extracts the parameter set included in the higher-level syntax information from the bit stream signal and an access unit corresponding to the elementary stream signal, and a decoding process based on the parameter set for the access unit And a video decoding unit that generates an output image.
本発明に係る映像符号化プログラムは、入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成する情報処理装置の制御部が実行する映像符号化プログラムであって、ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成する第1のステップと、前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成する第2のステップと、を有し、前記第2のステップでは、前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施す。 A video encoding program according to the present invention is a video encoding program executed by a control unit of an information processing apparatus that generates a bitstream signal by performing compression encoding processing on an input image signal, and includes a ROI (Region A first step of generating ROI information representing the position and size of the ROI within the picture, receiving the input image signal and the ROI information, and receiving the input based on the ROI information A second step of generating a bitstream signal by performing compression coding processing on the image signal, and in the second step, based on the ROI information, the ROI in the picture in the input image signal Intra coding is performed as the compression coding process for the included image block, and for the image block included in the non-ROI Applied by selecting one of said intra-coded and inter-coded as serial compression coding processing.
本発明では、ピクチャ内においてROIを設定し、そのピクチャ内でのROIの位置及びサイズを表すROI情報を生成し、当該ROI情報D01に基づいて入力画像信号に対して圧縮符号化処理を施すにあたり、以下の処理を行う。つまり、ROI情報に基づき、ROIに含まれる画像ブロックには圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロック群に対してはイントラ符号化及びインター符号化のうちの一方を選択して施す。 In the present invention, an ROI is set in a picture, ROI information representing the position and size of the ROI in the picture is generated, and an input image signal is compressed and encoded based on the ROI information D01. The following processing is performed. That is, based on the ROI information, the image block included in the ROI is subjected to intra coding as a compression coding process, and one of the intra coding and the inter coding is performed on the image block group included in the non-ROI. Select and apply.
これにより、ピクチャ内の全ての画像ブロックをイントラ符号化によって圧縮符号化する場合に比して、符号量を削減することが可能となる。また、ピクチャ内の全ての画像ブロックをインター符号化によって圧縮符号化する場合に比して演算量を削減することが可能となる。 As a result, it is possible to reduce the code amount as compared with a case where all image blocks in a picture are compression-encoded by intra-encoding. In addition, the amount of calculation can be reduced as compared with the case where all image blocks in a picture are compression-encoded by inter-encoding.
よって、本発明によれば、符号量の削減及び演算量の削減を両立させることが可能となる。 Therefore, according to the present invention, it is possible to achieve both a reduction in code amount and a reduction in calculation amount.
以下、本発明の実施例を図面を参照しつつ詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明に係る映像符号化装置X1の構成を示すブロック図である。図1に示すように、映像符号化装置X1は、ROI設定部301及びエンコーダ部U1を含む。エンコーダ部U1は、イントラ予測モード指定部102、及び予測モード可変エンコーダ部U2を含む。予測モード可変エンコーダ部U2は、予測モード判定部103、エンコーダコア部U3、上位シンタックス生成部106及びビットストリーム生成部307を含む。
FIG. 1 is a block diagram showing a configuration of a video encoding device X1 according to the present invention. As shown in FIG. 1, the video encoding device X1 includes a
以下に、上記したROI設定部301、イントラ予測モード指定部102、予測モード可変エンコーダ部U2、予測モード判定部103、エンコーダコア部U3、上位シンタックス生成部106及びビットストリーム生成部307の動作について、図2に示す映像符号化処理を示すフロー図に沿って説明する。
Hereinafter, the operations of the
先ず、ROI設定部301が、各画素の輝度レベルを表す画素値の系列を含む入力画像信号E1を受け、当該入力画像信号E1によって表されるピクチャに対してROIを設定し、設定したROIのピクチャ内での位置及びサイズを表すROI情報D01を生成する(ステップS101)。
First, the
例えば、ROI設定部301は、特定のオブジェクトとして人の顔の検出を行う顔検出アルゴリズムを用いて、入力画像信号E1中から人の顔が表示される領域をROIとして検出する。そして、ROI設定部301は、ピクチャ内でのROIの位置(座標)及びサイズを表すROI情報D01を設定する。尚、ROI設定部301は、入力画像信号E1に依存せず、ユーザによって任意に指定されたROIを設定し、そのROIのピクチャ内での位置及びサイズを表すROI情報D01を生成しても良い。ROI設定部301は、当該ROI情報D01をイントラ予測モード指定部102及びエンコーダコア部U3に供給する。
For example, the
次に、イントラ予測モード指定部102が、ROI情報D01に基づきROIに含まれる画像ブロックに対してはイントラ予測モードを指定するイントラ予測モード指定信号D02を生成する(ステップS102)。例えば、エンコーダコア部U3が画像符号方式としてH.264/MPEG(Moving Picture Experts Group)−4 AVCを採用している場合、イントラ予測モード指定信号D02は、例えば16画素×16画素からなる画像ブロック(以下、イントラマクロブロック又はイントラMBと称する)単位でイントラ予測モードを指定する。イントラ予測モード指定部102は、イントラ予測モード指定信号D02を予測モード判定部103に供給する。
Next, the intra prediction
次に、予測モード判定部103が、イントラ予測モード指定信号D02の有無に応じて予測モードを判定し、判定した予測モードを示す予測モード情報D03を生成する(ステップS103)。すなわち、予測モード判定部103は、イントラ予測モード指定信号D02によってイントラ予測モードに指定された画像ブロックに対してはイントラ予測モードを示す予測モード情報D03を生成する。
Next, the prediction
一方、イントラ予測モード指定信号D02によってイントラ予測モードに指定されていない画像ブロックに対しては、予測モード判定部103は、各種の予測モードのうちから適切な予測モード(イントラ予測モード又はインター予測モード)を判定し、判定した予測モードを示す予測モード情報D03を生成する。例えば、予測モード判定部103は、入力画像信号E1によって表されるピクチャに基づき、イントラ予測モード及びインター予測モードのうちの一方の予測モードを選択し、選択した方の予測モードを示す予測モード情報D03を生成する。予測モード判定部103は、予測モード情報D03をエンコーダコア部U3に供給する。
On the other hand, for an image block that is not designated as the intra prediction mode by the intra prediction mode designation signal D02, the prediction
次に、エンコーダコア部U3が、予測モード情報D03に従って入力画像信号E1に圧縮符号化処理を施して得られたエレメンタリーストリーム信号D05を出力する(ステップS105)。エンコーダコア部U3は、前処理部305A及び圧縮部305Bを含む。前処理部305Aは、入力画像信号E1及びROI情報D01を受け、入力画像信号E1に以下のような前処理を施すことにより、画像品質を制御する。
Next, the encoder core unit U3 outputs an elementary stream signal D05 obtained by subjecting the input image signal E1 to compression coding processing according to the prediction mode information D03 (step S105). The encoder core unit U3 includes a
すなわち、前処理部305Aは、入力画像信号E1に含まれる画素値の系列に対して、ROI情報D01に基づきROI以外の領域(以下、背景領域又は非ROIと称する)に該当すると判定された画素値には、ROIに該当すると判定された画素値に比べて少ない符号量となるような符号化処理を施す。かかる符号化処理は、例えばガウシアンフィルタ等を用いて入力画像信号E1を畳み込むことによって、入力画像信号E1の高周波成分を抑圧する処理である。
That is, the
前処理部305Aは、入力画像信号E1に上記のような前処理を施して得られた前処理画像信号を圧縮部305Bに供給する。すなわち、前処理部305Aにより、ROIを含むピクチャに対しては画像品質を抑えて符号量の削減を図るという、画像品質の制御が為される。
The
圧縮部305Bは、予測モード情報D03及び上位シンタックスに基づき、前処理画像信号に上記した画像符号方式に従った圧縮符号化処理を施して得られたエレメンタリーストリーム信号D05を、ビットストリーム生成部307に供給する。尚、この画像符号方式としては、復号側においてROIを含むピクチャのみを復号することでROIを抽出することが可能となる例えばH.264/MPEG−4 AVC(Advanced Video Coding)、或いはH.265/MPEG−H HEVC(High Efficiency Video Coding)等を用いる。
Based on the prediction mode information D03 and the upper syntax, the
かかる構成により、エンコーダコア部U3は、ROI情報D01、予測モード情報D03、及び後述する制約付きイントラを示す上位シンタックスに基づき、入力画像信号E1に圧縮符号化処理を施す。すなわち、エンコーダコア部U3は、入力画像信号E1によって表されるピクチャ内のROIに該当するブロックに対しては、予測モード情報D03によって示されるイントラ予測モードに従って、イントラ符号化処理を施す。この際、制約付きイントラを示す上位シンタックスに応じて、ROIに含まれる画像ブロックの周辺の画素値を用いてイントラ符号化を行う場合には、エンコーダコア部U3は、かかる周辺の画素値として、既にイントラ符号化された画素値又は所定値のみを用いる。 With this configuration, the encoder core unit U3 performs compression coding processing on the input image signal E1 based on the ROI information D01, the prediction mode information D03, and higher-order syntax indicating a restricted intra, which will be described later. That is, the encoder core unit U3 performs an intra coding process on the block corresponding to the ROI in the picture represented by the input image signal E1 according to the intra prediction mode indicated by the prediction mode information D03. At this time, in the case of performing intra coding using the pixel values around the image block included in the ROI according to the upper syntax indicating the restricted intra, the encoder core unit U3 uses the surrounding pixel values as the surrounding pixel values. Only pixel values that have already been intra-coded or predetermined values are used.
一方、当該ピクチャ内においてROIに該当しない領域、つまり非ROI(背景領域)に該当するブロック群に対しては、エンコーダコア部U3は、予測モード情報D03によって示されるイントラ予測モード又はインター予測モードに従った符号化処理を施す。つまり、予測モード情報D03がイントラ予測モードを示す場合には、エンコーダコア部U3は、入力画像信号E1によって表されるピクチャ内の非ROIのブロックにイントラ符号化処理を施す。また、予測モード情報D03がインター予測モードを示す場合には、エンコーダコア部U3は、入力画像信号E1によって表されるピクチャ内の非ROIのブロックにインター符号化処理を施す。 On the other hand, for an area that does not correspond to ROI in the picture, that is, a block group that corresponds to a non-ROI (background area), the encoder core unit U3 switches to the intra prediction mode or the inter prediction mode indicated by the prediction mode information D03. The encoding process is performed accordingly. That is, when the prediction mode information D03 indicates the intra prediction mode, the encoder core unit U3 performs an intra coding process on the non-ROI block in the picture represented by the input image signal E1. When the prediction mode information D03 indicates the inter prediction mode, the encoder core unit U3 performs inter coding processing on the non-ROI block in the picture represented by the input image signal E1.
エンコーダコア部U3は、上記した圧縮符号化処理によって得られたエレメンタリーストリーム信号D05を、ビットストリーム生成部307に供給する。
The encoder core unit U3 supplies the elementary stream signal D05 obtained by the compression encoding process described above to the bit
次に、上位シンタックス生成部106が、復号時に必要となる情報を含み且つ制約付きイントラを示す上位シンタックスを生成する(ステップS106)。例えば、エンコーダコア部U3の画像符号方式が上記したH.264/MPEG−4 AVC、或いはH.265/MPEG−H HEVCである場合、上位シンタックス生成部106は、SPS(Sequence Parameter Set)及びPPS(Picture Parameter Set)を上位シンタックスとして生成する。SPSは、シーケンス全体の符号化に係る情報を示すパラメータセットであり、PPSは、ピクチャ全体の符号化に係る情報を示すパラメータセットである。尚、例えばエンコーダコア部U3がH.264/MPEG−4 AVC、或いはH.265/MPEG−H HEVC等のような制約付きイントラの指定に対応した画像符号方式を採用している場合、上位シンタックス生成部106は、PPSにより、制約付きイントラの指定を行う。制約付きイントラでは、イントラMB周辺の画素値がインター符号化されたものである場合には、それを使用せず、当該イントラMB周辺のイントラ符号化された画素値のみを用いてイントラMBをイントラ符号化する。この際、イントラMB周辺にイントラ符号化された画素値が存在しない場合には、制約付きイントラでは、所定の固定値を用いてイントラMBをイントラ符号化する。 Next, the higher-order syntax generation unit 106 generates higher-order syntax that includes information necessary for decoding and indicates a restricted intra (step S106). For example, the image coding method of the encoder core unit U3 is the above-described H.264. H.264 / MPEG-4 AVC or H.264 In the case of H.265 / MPEG-H HEVC, the upper syntax generation unit 106 generates SPS (Sequence Parameter Set) and PPS (Picture Parameter Set) as upper syntax. SPS is a parameter set indicating information related to encoding of the entire sequence, and PPS is a parameter set indicating information related to encoding of the entire picture. For example, the encoder core unit U3 is H.264. H.264 / MPEG-4 AVC or H.264 When the image coding method corresponding to the restricted intra designation such as H.265 / MPEG-H HEVC is adopted, the upper syntax generation unit 106 designates the restricted intra using the PPS. In the intra with restrictions, when the pixel values around the intra MB are inter-coded, the intra MB is not used but is used only with the intra-coded pixel values around the intra MB. Encode. At this time, if there is no intra-coded pixel value around the intra MB, the intra MB is intra-coded using a predetermined fixed value in the restricted intra.
上位シンタックス生成部106は、これらSPS及びPPS等のパラメータセットを上位シンタックスとして表す上位シンタックス情報D06をビットストリーム生成部307に供給する。
The upper syntax generation unit 106 supplies the bit
尚、エンコーダコア部U3が、複数の上位シンタックスのうちから、圧縮符号化処理で用いる上位シンタックスをピクチャ又はスライス単位で選択可能な画像符号方式を採用している場合、上位シンタックス生成部106は、以下のように上位シンタックス情報D06をビットストリーム生成部307に供給する。
In addition, when the encoder core unit U3 employs an image coding method in which the upper syntax used in the compression encoding process can be selected in units of pictures or slices from among a plurality of upper syntaxes, the upper syntax generation unit 106 supplies the upper syntax information D06 to the
つまり、上位シンタックス生成部106は、エンコーダコア部U3がピクチャ又はスライス毎に上位シンタックスを選択する度に、その選択された上位シンタックスを示す上位シンタックス情報D06をビットストリーム生成部307に供給する。スライスは、1ピクチャ内の複数のマクロブロックからなる処理単位を表す。
That is, each time the encoder core unit U3 selects an upper syntax for each picture or slice, the upper syntax generation unit 106 transmits upper syntax information D06 indicating the selected upper syntax to the
上位シンタックス生成部106は、エンコーダコア部U3が例えばMPEG−2等のように、制約付きイントラが想定されていない画像符号方式を採用している場合には、その画像符号方式で規定されている通常の上位シンタックスを生成する。 If the encoder core unit U3 employs an image coding method that does not assume a restricted intra, such as MPEG-2, the higher-order syntax generation unit 106 is defined by the image coding method. Generate the normal high-level syntax.
尚、上位シンタックス生成部106、予測モード判定部103、及びエンコーダコア部U3は、共にワーキングメモリMに接続されており、当該ワーキングメモリMを介して各種の画像情報や符号化情報を共有している。
Note that the upper syntax generation unit 106, the prediction
次に、ビットストリーム生成部307が、エンコーダコア部U3から供給されたエレメンタリーストリーム信号D05、及び上位シンタックス情報D06を多重化したビットストリーム信号D07を生成する(ステップS107)。
Next, the bit
以上のように、映像符号化装置X1では、ROI設定部301がROIを設定し、ピクチャ内でのROIの位置及びサイズを表すROI情報D01を生成する。そして、エンコーダ部U1が、入力画像信号E1及びROI情報D01を受け、当該ROI情報D01に基づいて入力画像信号E1に対して圧縮符号化処理を施してビットストリーム信号D07を生成する。この際、エンコーダ部U1は、ROI情報D01に基づき、入力画像信号E1によるピクチャ内のROIに含まれる画像ブロックには圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロック群に対してはイントラ符号化及びインター符号化のうちの一方を選択して施すようにしている。
As described above, in the video encoding device X1, the
これにより、ピクチャ内の全ての画像ブロックをイントラ符号化によって圧縮符号化する場合に比して、符号量を削減することが可能となる。また、ピクチャ内の全ての画像ブロックをインター符号化によって圧縮符号化する場合に比して演算量を削減することが可能となる。 As a result, it is possible to reduce the code amount as compared with a case where all image blocks in a picture are compression-encoded by intra-encoding. In addition, the amount of calculation can be reduced as compared with the case where all image blocks in a picture are compression-encoded by inter-encoding.
よって、映像符号化装置X1によれば、符号量の削減及び演算量の削減を両立させることが可能となる。 Therefore, according to the video encoding device X1, it is possible to achieve both a reduction in code amount and a reduction in calculation amount.
以下に、上記した映像符号化装置X1を採用した映像処理システムについて説明する。 Hereinafter, a video processing system employing the video encoding device X1 will be described.
図3は、映像処理システムの一例としてのROI識別システムRISの構成を示すブロック図である。 FIG. 3 is a block diagram showing a configuration of an ROI identification system RIS as an example of a video processing system.
ROI識別システムRISは、例えばビデオカメラ等によって撮影して得られた入力画像信号E1を受け、当該入力画像信号E1によって表されているピクチャ中から特定のROIを識別するシステムである。尚、特定のROIとは、予め登録されている例えば人の顔を含むROIである。 The ROI identification system RIS is a system that receives an input image signal E1 obtained by photographing with a video camera or the like, for example, and identifies a specific ROI from the picture represented by the input image signal E1. The specific ROI is an ROI including a human face registered in advance, for example.
図3に示すように、ROI識別システムRISは、映像符号復号システムVCDと、ROI認識装置X4と、を有する。 As shown in FIG. 3, the ROI identification system RIS includes a video code decoding system VCD and an ROI recognition device X4.
映像符号復号システムVCDは、図1に示される映像符号化装置X1の他に、復号画像選択装置X2及び映像復号化装置X3を含む。 The video code decoding system VCD includes a decoded image selection device X2 and a video decoding device X3 in addition to the video encoding device X1 shown in FIG.
映像符号化装置X1は、上記した入力画像信号E1を受け、当該入力画像信号E1に前述した圧縮符号化処理を施してビットストリーム信号D07を生成する。映像符号化装置X1は、このビットストリーム信号D07を、LAN(Local Area Network)、或いは公衆回線等の任意の通信路を介して復号画像選択装置X2に供給する。 The video encoding device X1 receives the above-described input image signal E1, and performs the above-described compression encoding processing on the input image signal E1 to generate the bit stream signal D07. The video encoding device X1 supplies the bit stream signal D07 to the decoded image selection device X2 via an arbitrary communication path such as a LAN (Local Area Network) or a public line.
復号画像選択装置X2は、かかるビットストリーム信号D07、及び起動イベントE2を受け、以下の復号画像選択処理を行う。 The decoded image selection device X2 receives the bit stream signal D07 and the activation event E2, and performs the following decoded image selection processing.
図4は、かかる復号画像選択処理の一例を表すフロー図である。図4に示すように、先ず、復号画像選択装置X2は、ビットストリーム信号D07から、上位シンタックス情報D06としてのパラメータセット(SPS、PPS)を抽出し、保持する(ステップS501)。 FIG. 4 is a flowchart showing an example of such a decoded image selection process. As shown in FIG. 4, first, the decoded image selection device X2 extracts and holds a parameter set (SPS, PPS) as the upper syntax information D06 from the bit stream signal D07 (step S501).
次に、復号画像選択装置X2は、ビットストリーム信号D07から、当該ビットストリーム信号D07に含まれるエレメンタリーストリーム信号D05を復号の処理単位毎に区切ったアクセスユニットの系列を得る(ステップS5021)。次に、復号画像選択装置X2は、アクセスユニット毎にそのアクセスユニットに対応したピクチャにROIが含まれているか否かを判定する(ステップS5022)。 Next, the decoded image selection device X2 obtains, from the bit stream signal D07, an access unit sequence obtained by dividing the elementary stream signal D05 included in the bit stream signal D07 for each decoding processing unit (step S5021). Next, the decoded image selection device X2 determines whether or not the ROI is included in the picture corresponding to the access unit for each access unit (step S5022).
なお、アクセスユニットに対応したピクチャにROIが含まれているか否かを判定する方法としては、ビットストリーム信号D07を復号、あるいはアクセスユニットのみを復号し、その復号結果に基づきROIの検出を行ってROIが含まれているか否かの判定を行う。或いは、先ず、映像符号化装置X1のビットストリーム生成部307において、ROI情報D01を多重化したビットストリーム信号D07を復号画像選択装置X2に供給する。
As a method for determining whether or not the picture corresponding to the access unit includes the ROI, the bit stream signal D07 is decoded or only the access unit is decoded and the ROI is detected based on the decoding result. It is determined whether or not the ROI is included. Alternatively, first, the bit
この多重化の方法としては、例えばH.264/MPEG−4 AVC、或いはH.265/MPEG−H HEVCの場合、"User unregistered SEI message"を使用する。そして、復号画像選択装置X2側で当該ビットストリーム信号D07からROI情報D01を抽出することにより、ROIが含まれているか否かの判定を行うのである。 As this multiplexing method, for example, H.264. H.264 / MPEG-4 AVC or H.264 In the case of H.265 / MPEG-H HEVC, “User unregistered SEI message” is used. Then, the ROI information D01 is extracted from the bit stream signal D07 on the decoded image selection device X2 side to determine whether or not the ROI is included.
ステップS5022において、アクセスユニットに対応するピクチャにROIが含まれていると判定された場合、復号画像選択装置X2は、上記したステップS501で保持したパラメータセットを表すパラメータセット情報D08、及びアクセスユニットの系列を表すアクセスユニット系列D09を映像復号装置X3に供給する(ステップS5023)。 If it is determined in step S5022 that the ROI is included in the picture corresponding to the access unit, the decoded image selection device X2 receives the parameter set information D08 representing the parameter set held in step S501 described above, and the access unit The access unit sequence D09 representing the sequence is supplied to the video decoding device X3 (step S5023).
そして、かかるステップS5023の終了後、復号画像選択装置X2は、図4に示す復号画像選択処理を終了する。 And after completion | finish of this step S5023, the decoding image selection apparatus X2 complete | finishes the decoding image selection process shown in FIG.
また、上記ステップS5022において、アクセスユニットに対応するピクチャにROIが含まれていないと判定されたときも、復号画像選択装置X2は、図4に示す復号画像選択処理を終了する。よって、この際、復号画像選択装置X2は、ビットストリーム信号D07を受けたにも拘わらず、映像復号装置X3へのパラメータセット情報D08及びアクセスユニット系列D09の供給は行わない。 Also, when it is determined in step S5022 that the picture corresponding to the access unit does not include the ROI, the decoded image selection device X2 ends the decoded image selection process shown in FIG. Therefore, at this time, the decoded image selection device X2 does not supply the parameter set information D08 and the access unit sequence D09 to the video decoding device X3 even though it receives the bit stream signal D07.
映像復号装置X3は、アクセスユニット系列D09に、パラメータセット情報D08に基づく復号処理を施して得られた出力画像信号E3を、ROI認識装置X4に供給する。尚、映像復号装置X3は、アクセスユニット系列D09がフレーム間符号化されたものであっても、参照ピクチャの復号を行うことなくアクセスユニット系列D09に復号処理を施す。 The video decoding device X3 supplies the output image signal E3 obtained by subjecting the access unit sequence D09 to decoding processing based on the parameter set information D08, to the ROI recognition device X4. Note that the video decoding device X3 performs a decoding process on the access unit sequence D09 without decoding the reference picture even if the access unit sequence D09 is inter-frame encoded.
つまり、映像復号装置X3は、参照ピクチャの復号を行う代わりに任意の仮想ピクチャを生成し、この仮想ピクチャを参照ピクチャとみなして復号を行う。尚、仮想ピクチャとは、例えば、全ての画素値を最低の輝度値「0」、又は中間の輝度値「128」、或いは最大の輝度値「255」等に固定したピクチャである。 That is, the video decoding device X3 generates an arbitrary virtual picture instead of decoding the reference picture, and performs decoding by regarding the virtual picture as a reference picture. Note that the virtual picture is, for example, a picture in which all pixel values are fixed to a minimum luminance value “0”, an intermediate luminance value “128”, a maximum luminance value “255”, or the like.
ROI認識装置X4は、出力画像信号E3及び登録画像信号E4を受ける。尚、登録画像信号E4は、例えば予め登録されている一人又は複数の人の顔と、その顔を識別する為の識別情報(例えば氏名)とを表す画像信号である。ROI認識装置X4は、例えば顔認識エンジンを利用して、出力画像信号E3中に含まれるROIに、登録画像信号E4にて表される顔が含まれているか否かを判定する。ROI認識装置X4は、出力画像信号E3中に、登録画像信号E4にて表される顔が含まれていると判定した場合には、その顔に対応した識別情報を出力する。 The ROI recognition device X4 receives the output image signal E3 and the registered image signal E4. The registered image signal E4 is an image signal representing, for example, one or more faces registered in advance and identification information (for example, name) for identifying the faces. The ROI recognition device X4 determines whether the face represented by the registered image signal E4 is included in the ROI included in the output image signal E3 by using, for example, a face recognition engine. When the ROI recognition apparatus X4 determines that the face represented by the registered image signal E4 is included in the output image signal E3, the ROI recognition device X4 outputs identification information corresponding to the face.
以上のように、映像符号復号システムVCDでは、復号画像選択装置X2により、アクセスユニットの系列中から、ROIを含むピクチャに対応したアクセスユニットのみを選択して映像復号装置X3に供給するようにている。よって、映像復号装置X3はROIを含むピクチャのみを復号するので、図3においてROI認識装置X4を一例とした下流のシステムで必要となる、ROIを復号する為に必要となる演算量を抑えることが可能となる。 As described above, in the video code decoding system VCD, the decoded image selection device X2 selects only the access unit corresponding to the picture including the ROI from the access unit sequence and supplies it to the video decoding device X3. Yes. Therefore, since the video decoding device X3 decodes only the picture including the ROI, the amount of calculation required for decoding the ROI, which is necessary in the downstream system in FIG. 3 using the ROI recognition device X4 as an example, is suppressed. Is possible.
ところで、図4に示す復号画像選択処理では、アクセスユニットに対応したピクチャにROIが含まれている場合には、常に、当該ROIを含むピクチャに対応したアクセスユニットを映像復号装置X3に供給する。しかしながら、起動イベントE2を受けたときにのみ、ROIを含むピクチャに対応したアクセスユニットを映像復号装置X3に供給しても良い。 By the way, in the decoded image selection process shown in FIG. 4, when the ROI is included in the picture corresponding to the access unit, the access unit corresponding to the picture including the ROI is always supplied to the video decoding device X3. However, the access unit corresponding to the picture including the ROI may be supplied to the video decoding device X3 only when the activation event E2 is received.
図5は、かかる点に鑑みて為された復号画像選択処理の他の一例を示すフロー図である。図5において、復号画像選択装置X2は、ビットストリーム信号D07をデータベースに蓄積する(ステップS601)。ここで、起動イベントE2を受けると、復号画像選択装置X2は、データベースからビットストリーム信号D07に含まれるパラメータセット、及びROIを含むアクセスユニットのみを抽出する。そして、復号画像選択装置X2は、抽出したパラメータセットを表すパラメータセット情報D08、及びROIを含むアクセスユニットの系列からなるアクセスユニット系列D09を出力する。 FIG. 5 is a flowchart showing another example of the decoded image selection process performed in view of such points. In FIG. 5, the decoded image selection device X2 accumulates the bit stream signal D07 in the database (step S601). Here, when receiving the activation event E2, the decoded image selection device X2 extracts only the parameter unit included in the bit stream signal D07 and the access unit including the ROI from the database. Then, the decoded image selection device X2 outputs parameter set information D08 representing the extracted parameter set, and an access unit sequence D09 including an access unit sequence including the ROI.
復号画像選択装置X2は、図5に示される復号画像選択処理を行うことにより、起動イベントE2が発せられたときにのみ、ROIの含まれるピクチャに対応したアクセスユニットのみをデータベースから検索し、これを復号対象とする。これにより、図4に示される復号画像選択処理を採用した場合に比してROIの復号に必要な演算量が削減される。尚、図5に示される復号画像選択処理を採用した場合にも、図4に示される復号画像選択処理を採用した場合と同様に、ROI認識装置X4においてROIを含むピクチャのみを認識対象とすることができる。よって、データベースに蓄積した過去のROIを低演算量で復号できるので、再認識処理の実用性を図ることが可能となる。 The decoded image selection device X2 searches the database for only the access unit corresponding to the picture including the ROI only when the activation event E2 is issued by performing the decoded image selection process shown in FIG. Is the decryption target. As a result, the amount of calculation required for ROI decoding is reduced as compared with the case where the decoded image selection processing shown in FIG. 4 is adopted. Even when the decoded image selection process shown in FIG. 5 is adopted, only the picture including the ROI is recognized in the ROI recognition device X4 as in the case where the decoded image selection process shown in FIG. 4 is adopted. be able to. Therefore, since past ROIs accumulated in the database can be decoded with a small amount of computation, it is possible to achieve practicality of re-recognition processing.
図6は、本発明に係る映像符号化装置X1の他の構成を示すブロック図である。尚、図6に示す構成では、上位シンタックス指定部204を新たに加え、上位シンタックス生成部106に代えて上位シンタックス生成部106aを採用した点を除く他の構成は、図1に示されるものと同一である。よって、以下に、上位シンタックス指定部204及び上位シンタックス生成部106aを中心に動作の説明を行う。
FIG. 6 is a block diagram showing another configuration of the video encoding device X1 according to the present invention. In the configuration shown in FIG. 6, other configurations except that a higher
上位シンタックス生成部106aは、制約付きイントラを指定した上位シンタックス(制約付き上位シンタックスと称する)と共に、制約を受けない通常のイントラを指定した上位シンタックス(通常シンタックスと称する)を生成する。上位シンタックス生成部106aは、制約付き上位シンタックス及び通常シンタックスを表す上位シンタックス情報D06をビットストリーム生成部307に供給する。
The high-order
上位シンタックス指定部204は、ROI情報D01を受け、当該ROI情報D01に基づき、圧縮符号化処理に用いる上位シンタックス(通常シンタックス、制約付き上位シンタックス)を指定する上位シンタックス指定信号D04を生成し、エンコーダコア部U3に供給する。
The upper
エンコーダコア部U3は、ROI情報D01、予測モード情報D03及び上位シンタックス指定信号D04によって指定された上位シンタックスに基づき、入力画像信号E1に圧縮符号化処理を施す。エンコーダコア部U3は、かかる圧縮符号化処理によって得られたエレメンタリーストリーム信号D05を、ビットストリーム生成部307に供給する。
The encoder core unit U3 performs compression coding processing on the input image signal E1 based on the upper syntax specified by the ROI information D01, the prediction mode information D03, and the higher syntax specification signal D04. The encoder core unit U3 supplies the elementary stream signal D05 obtained by the compression encoding process to the bit
図7は、図6に示す構成を有する映像符号化装置X1で実施される映像符号化処理を示すフロー図である。尚、図7に示すフローでは、上記したステップS105及びS106に代えてS105a及びS106aを採用し、更にステップS103の後にステップS104を追加した点を除く他のステップ(S101〜S103、S107)は、図2に示すフローと同一である。よって、ステップS104、S105a及びS106aを中心に各動作を説明する。 FIG. 7 is a flowchart showing a video encoding process performed by the video encoding device X1 having the configuration shown in FIG. In the flow shown in FIG. 7, S105a and S106a are adopted instead of the above-described steps S105 and S106, and other steps (S101 to S103, S107) except that step S104 is added after step S103 are as follows. This is the same as the flow shown in FIG. Therefore, each operation will be described focusing on steps S104, S105a, and S106a.
すなわち、ステップS103の実行後、上位シンタックス指定部204が、ROI情報D01に基づき、ROIが含まれるピクチャについては制約付きイントラを指定し、ROIが含まれていないピクチャについては制約を受けない通常のイントラを指定する上位シンタックス指定信号D04を生成する(ステップS104)。尚、ROIのみで構成されるピクチャに対しては、いずれの上位シンタックスを指定しても良い。
That is, after execution of step S103, the higher-level
次に、エンコーダコア部U3が、予測モード情報D03及び上位シンタックス指定信号D04に基づく圧縮符号化処理を入力画像信号E1に施して得られたエレメンタリーストリーム信号D05を出力する(ステップS105a)。ここで、上位シンタックス指定信号D04が制約付きイントラを指定した上位シンタックスを示す場合、エンコーダコア部U3は、イントラ予測モードで符号化すると決定したブロックを、制約付きイントラで符号化する。そして、エンコーダコア部U3は、エレメンタリーストリーム信号D05中の所定の位置に、制約付きイントラを指定した上位シンタックス示すインデックスを含ませる。例えば、H.264/MPEG−4 AVCの場合、スライスヘッダに、使用する上位シンタックスを指定する領域があるので、その領域に制約付きイントラを指定した上位シンタックスを示すインデックスを含ませる。 Next, the encoder core unit U3 outputs an elementary stream signal D05 obtained by subjecting the input image signal E1 to compression encoding processing based on the prediction mode information D03 and the upper syntax designation signal D04 (step S105a). Here, when the higher-order syntax designation signal D04 indicates the higher-order syntax designating the restricted intra, the encoder core unit U3 codes the block determined to be coded in the intra prediction mode, with the restricted intra. Then, the encoder core unit U3 includes an index indicating the upper syntax specifying the restricted intra at a predetermined position in the elementary stream signal D05. For example, H.M. In the case of H.264 / MPEG-4 AVC, the slice header has an area for designating the upper syntax to be used. Therefore, an index indicating the upper syntax for designating the restricted intra is included in the area.
また、上位シンタックス指定信号D04が通常の上位シンタックスを示す場合には、エンコーダコア部U3は、イントラ予測モードで符号化すると決定したブロックを、制約無しの通常のイントラで符号化する。そして、エンコーダコア部U3は、エレメンタリーストリーム信号D05中の所定の位置に、通常の上位シンタックス示すインデックスを含ませる。 Further, when the upper syntax designation signal D04 indicates the normal higher syntax, the encoder core unit U3 encodes the block determined to be encoded in the intra prediction mode, with the normal intra without restriction. Then, the encoder core unit U3 includes an index indicating a normal higher-order syntax at a predetermined position in the elementary stream signal D05.
次に、上位シンタックス生成部106aが、制約付きイントラを指定した上位シンタックス、及び通常の上位シンタックスを生成し、両者を示す上位シンタックス情報D06を生成する(ステップS106a)。ここで、制約付きイントラを指定した上位シンタックスと、通常の上位シンタックスとの差は、制約付きイントラを指定しているか否かである。例えば、H.264/MPEG−4 AVCの場合、PPSに含まれる"constrained_intra_pred_flag"によってその差が表される。
Next, the upper
尚、上位シンタックスとしては、PPSだけではなく、例えばH.264ではSPS等を含むことも考えられる。その場合、PPS以外の上位シンタックスについては、制約付きイントラを指定した上位シンタックスと、通常の上位シンタックスとを個別に生成するのではなく、1つの上位シンタックスを、制約付きイントラを指定した上位シンタックスと、通常の上位シンタックスとで共通化しても良い。 Note that the upper syntax includes not only PPS but also H.264. H.264 may include SPS and the like. In this case, for higher-level syntax other than PPS, a higher-level syntax specifying a constrained intra and a normal higher-level syntax are not generated separately, but a single higher-level syntax is specified as a constrained intra. The higher-level syntax and the normal higher-level syntax may be shared.
また、制約付きイントラを指定した上位シンタックスで表される情報群内に、通常の上位シンタックスで表される情報群に含まれる情報片と同一の情報片が存在する場合には、この同一の情報片を、制約付きイントラを指定した上位シンタックスと、通常の上位シンタックスとで共有しても良い。すなわち、上位シンタックス生成部106aは、先ず、制約付きイントラを指定した上位シンタックスを生成する。そして、上記同一の情報片を省いた通常の上位シンタックスを生成し、この生成した通常の上位シンタックスに上記同一の情報片を含ませたものを最終的な通常の上位シンタックスとする。これにより、上位シンタックス生成部106aでの動作負荷が軽減される。
If the same information piece as the information piece included in the information group represented by the normal upper syntax exists in the information group represented by the upper syntax specifying the restricted intra, this same These pieces of information may be shared between the upper syntax specifying the restricted intra and the normal higher syntax. That is, the upper
以上のように、実施例2の構成では、非ROIのみで構成されているが故に制約付きイントラの必要性がないピクチャ又はスライスについては、通常のイントラMBとして符号化している。ここで、制約付きイントラよりも通常のイントラの方が符号効率が高い傾向にあるため、制約付きイントラの必要性が無いピクチャやスライスに対しては、通常のイントラMBとして符号化することにより符号量の削減が図られる。 As described above, in the configuration of the second embodiment, a picture or a slice that does not need a restricted intra because it is configured only by a non-ROI is encoded as a normal intra MB. Here, since a normal intra tends to have higher code efficiency than a constrained intra, a picture or a slice that does not require a constrained intra is encoded by encoding as a normal intra MB. The amount can be reduced.
尚、上記した実施例1及び2では、例えば前処理部305Aを設けることにより、ROIを含むピクチャに対しては画像品質を抑えて符号量の削減を図る処理を施すようにしているが、必ずしも、このような画像品質を抑える品質制御を行う必要はない。この際、予測モード可変エンコーダ部U2はROI情報D01を受ける必要がなくなり、エンコーダコア部U3の前処理部305Aが不要となる。
In the first and second embodiments described above, for example, by providing the
また、互いに異なる基準で設定した2種類のROIのうちの一方を制約付きイントラでの符号化対象とし、他方を上記したような品質制御の対象として圧縮符号化処理を施すようにしても良い。この際、ROI設定部301は、互いに異なる基準で設定した2系統のROIを表すROI情報D01を生成する。そして、ROI情報D01にて表されるROIのうちで有用度が最大となるROIを制約付きイントラの符号化対象とし、その他のROIを品質制御を優先とした符号化の対象とする。
Further, one of the two types of ROIs set based on different standards may be set as the encoding target in the restricted intra, and the other may be subjected to the compression encoding process as the quality control target as described above. At this time, the
尚、有用度が最大となるROIとは、例えばサイズが最大となるROIである。ここで、複数のROIのうちで、制約付きイントラで符号化するROIを限定する方法の一例を以下に説明する。すなわち、着目するROIが動画像の前後のピクチャに含まれるか否かを判定し、含まれる場合にはそれぞれの有用度(例えばROIのサイズ)を計算する。そして、その有用度が最大であるか否かを判定し、最大であると判定されたROIを制約付きイントラの符号化対象とする。 The ROI having the maximum usefulness is, for example, the ROI having the maximum size. Here, an example of a method for limiting the ROI to be encoded with the restricted intra from among the plurality of ROIs will be described below. That is, it is determined whether or not the ROI of interest is included in the pictures before and after the moving image, and when included, the usefulness (for example, the size of the ROI) is calculated. Then, it is determined whether or not the usefulness is the maximum, and the ROI determined to be the maximum is set as the encoding target of the restricted intra.
このように、例えば実施例1及び2の方法で、制約付きイントラで符号化するROIを、品質制御の対象とするROIよりも厳しい基準で設定したものとすることで、ROIの復号に必要な演算量を最小にしつつ、符号量の増加を最小限に抑えることが可能となる。 As described above, for example, by using the method of the first and second embodiments, the ROI to be encoded with the restricted intra is set based on a stricter standard than the ROI targeted for quality control, which is necessary for the ROI decoding. It is possible to minimize the increase in the code amount while minimizing the calculation amount.
また、実施例1及び2では、ROI設定部301は、ユーザによって指定された領域をROIとして設定する、或いは入力画像信号E1から検出したROIをROIとして設定している。ユーザによって指定された領域をROIとして設定する場合には、入力画像信号E1をROI設定部301に供給する必要は無い。
In the first and second embodiments, the
また、ROIを設定する方法としては、上記した方法に限定されない。例えば赤外線カメラで撮影した画像や、深度センサで撮影した画像を用いてROIの設定を行うようにしても良い。この際、赤外線カメラで撮影した画像や、深度センサで撮影した画像を表す信号を入力画像信号E1としてROI設定部301に供給する。
Further, the method for setting the ROI is not limited to the method described above. For example, the ROI may be set using an image taken with an infrared camera or an image taken with a depth sensor. At this time, an image captured by an infrared camera or a signal representing an image captured by a depth sensor is supplied to the
また、図1及び図6に示される映像符号化装置X1による映像符号化処理をハードウェアで実現しているが、当該映像符号化処理をソフトウェアで実現しても良い。 Moreover, although the video encoding process by the video encoding device X1 shown in FIGS. 1 and 6 is realized by hardware, the video encoding process may be realized by software.
図8は、この映像符号化処理をソフトウェアで実現する情報処理装置の構成の一例を示すブロック図である。当該情報処理装置は、制御部としてのCPU(Central Processing Unit)1001、RAM(Random Access Memory)1002、ROM(Read Only Memory)1003及び入出力部1004を含む。ROM1003には、図2又は図7に示される映像符号化処理に従ったプログラムが記憶されている。CPU1001は、ROM1003に記憶されているプログラムを実行することにより、入出力部1004を介して入力された入力画像信号E1に基づきビットストリーム信号D07を生成し、これを入出力部1004を介して出力する。
FIG. 8 is a block diagram showing an example of the configuration of an information processing apparatus that implements this video encoding processing by software. The information processing apparatus includes a central processing unit (CPU) 1001, a random access memory (RAM) 1002, a read only memory (ROM) 1003, and an input /
102 イントラ予測モード指定部
103 予測モード判定部
106 上位シンタックス生成部
307 ビットストリーム生成部
U1 エンコーダ部
U2 予測モード可変エンコーダ部
U3 エンコーダコア部
X1 映像符号化装置
X2 復号画像選択装置
X3 映像復号装置
X4 ROI認識装置
VCD 映像符号復号システム
102 Intra prediction
Claims (18)
ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成するROI設定部と、
前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成するエンコーダ部と、を有し、
前記エンコーダ部は、
前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施すことを特徴とする映像符号化装置。 A video encoding device that generates a bitstream signal by performing compression encoding processing on an input image signal,
An ROI setting unit that sets ROI (Region Of Interest) in a picture and generates ROI information indicating the position and size of the ROI in the picture;
An encoder unit that receives the input image signal and the ROI information, and performs a compression encoding process on the input image signal based on the ROI information to generate a bitstream signal;
The encoder unit is
Based on the ROI information, the image block included in the ROI in the picture in the input image signal is subjected to intra encoding as the compression encoding process, and the image block included in the non-ROI is subjected to the compression. A video encoding apparatus, wherein one of the intra encoding and the inter encoding is selected and applied as an encoding process.
前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対してイントラ予測モードを指定するイントラ予測モード指定信号を生成するイントラ予測モード指定部と、
前記イントラ予測モード指定信号が生成された場合にはイントラ予測モードを示し、前記イントラ予測モード指定信号が生成されていない場合には前記イントラ予測モード又はインター予測モードを示す予測モード情報を生成する予測モード判定部と、
前記予測モード情報が前記イントラ予測モードを示す場合には前記入力画像信号に前記イントラ符号化を施し、前記予測モード情報が前記インター予測モードを示す場合には前記入力画像信号に前記インター符号化を施してエレメンタリーストリーム信号を生成するエンコーダコア部と、
復号に必要となる情報を上位シンタックスとして表す上位シンタックス情報を生成する上位シンタックス生成部と、
前記エレメンタリーストリーム信号と前記上位シンタックス情報とを多重化した信号を前記ビットストリーム信号として生成するビットストリーム生成部と、を含むことを特徴とする請求項1に記載の映像符号化装置。 The encoder unit is
An intra prediction mode designating unit that generates an intra prediction mode designating signal for designating an intra prediction mode for an image block included in the ROI in a picture in the input image signal based on the ROI information;
When the intra prediction mode designation signal is generated, the intra prediction mode is indicated. When the intra prediction mode designation signal is not generated, the prediction mode information indicating the intra prediction mode or the inter prediction mode is generated. A mode determination unit;
When the prediction mode information indicates the intra prediction mode, the intra coding is performed on the input image signal, and when the prediction mode information indicates the inter prediction mode, the inter coding is performed on the input image signal. An encoder core unit for generating an elementary stream signal,
An upper syntax generation unit that generates upper syntax information representing information necessary for decoding as upper syntax;
The video encoding apparatus according to claim 1, further comprising: a bit stream generation unit that generates a signal obtained by multiplexing the elementary stream signal and the upper syntax information as the bit stream signal.
前記制約付きイントラは、前記ROIに含まれる画像ブロックの周辺の画素値を用いて前記イントラ符号化を行う際の前記周辺の画素値として、既に前記イントラ符号化された画素値又は所定値のみを用いることを促すものであることを特徴とする請求項2又は3に記載の映像符号化装置。 The upper syntax generation unit generates the upper syntax information representing the upper syntax for designating a restricted intra;
The constrained intra uses only the intra-encoded pixel value or the predetermined value as the peripheral pixel value when performing the intra-encoding using the peripheral pixel value of the image block included in the ROI. 4. The video encoding apparatus according to claim 2, wherein the video encoding apparatus is urged to be used.
前記上位シンタックス生成部は、前記エンコーダコア部が前記上位シンタックスを選択する度に、選択した前記上位シンタックスを示す前記上位シンタックス情報を生成することを特徴とする請求項4に記載の映像符号化装置。 The encoder core unit selects the upper syntax used in the compression encoding process from a plurality of upper syntaxes in units of pictures or slices,
The high-order syntax generation unit generates the high-order syntax information indicating the selected high-order syntax every time the encoder core unit selects the high-order syntax. Video encoding device.
前記ROI情報に基づき、前記ROI及び前記非ROIを共に含むピクチャに対しては前記制約付きイントラを指定する第1の上位シンタックスを示し、前記非ROIのみを含むピクチャに対しては制約無しのイントラを指定する第2の上位シンタックスを示す上位シンタックス指定信号を生成する上位シンタックス指定部を含み、
前記エンコーダコア部は、前記上位シンタックス指定信号によって指定された前記上位シンタックスに従って前記入力画像信号に前記圧縮符号化処理を施し、
前記上位シンタックス生成部は、前記第1の上位シンタックス、及び前記第2の上位シンタックスを夫々表す前記上位シンタックス情報を生成することを特徴とする請求項2〜5のいずれか1に記載の映像符号化装置。 The encoder unit is
Based on the ROI information, the first upper syntax designating the restricted intra is specified for a picture including both the ROI and the non-ROI, and there is no restriction for a picture including only the non-ROI. An upper syntax specifying unit for generating an upper syntax specifying signal indicating a second upper syntax for specifying an intra;
The encoder core unit performs the compression encoding process on the input image signal according to the upper syntax specified by the upper syntax specifying signal,
6. The high-order syntax generation unit generates the high-order syntax information that represents the first high-order syntax and the second high-order syntax, respectively. 6. The video encoding device described.
前記上位シンタックス指定信号が前記第1の上位シンタックスを示す場合には、前記イントラ符号化の対象となる画像ブロックに前記制約付きイントラに従った符号化を施すと共に、前記第1の上位シンタックスを示すインデックスを前記エレメンタリーストリーム信号中に含ませ、
前記上位シンタックス指定信号が前記第2の上位シンタックスを示す場合には、前記イントラ符号化の対象となる画像ブロックに対しては前記制約無しのイントラに従った符号化を施すと共に、前記第2の上位シンタックスを示す前記インデックスを前記エレメンタリーストリーム信号中に含ませることを特徴とする請求項6に記載の映像符号化装置。 The encoder core part is
When the higher syntax designation signal indicates the first higher syntax, the image block to be subjected to the intra coding is encoded according to the restricted intra and the first higher syntax. An index indicating a tax is included in the elementary stream signal,
When the higher-order syntax designation signal indicates the second higher-order syntax, the image block to be subjected to the intra coding is encoded according to the intra without restriction, and the first The video encoding apparatus according to claim 6, wherein the index indicating a higher-order syntax of 2 is included in the elementary stream signal.
前記第1の上位シンタックスを生成すると共に前記同一の情報片を省いた上位シンタックスを生成し、前記同一の情報片を省いた上位シンタックスに、前記第1の上位シンタックスに含まれる前記同一の情報片を含ませたものを前記第2の上位シンタックスとすることを特徴とする請求項6又は7に記載の映像符号化装置。 When generating the first and second upper syntaxes, the upper syntax generation unit is represented by the second upper syntax in an information group represented by the first upper syntax. If there is an information piece identical to the information piece included in the information group,
The first high-order syntax is generated, and the high-order syntax in which the same piece of information is omitted is generated. The high-order syntax in which the same piece of information is omitted is included in the first high-order syntax. The video encoding apparatus according to claim 6 or 7, wherein the same information piece is included in the second upper syntax.
前記ROI情報に基づき、前記入力画像信号に含まれる前記ROIと前記非ROIとを異なる映像品質で圧縮をする処理部を含むことを特徴とする請求項2〜8のいずれか1に記載の映像符号化装置。 The encoder unit is
The video according to any one of claims 2 to 8, further comprising a processing unit that compresses the ROI and the non-ROI included in the input image signal with different video quality based on the ROI information. Encoding device.
前記イントラ予測モード指定部は、前記ROI情報に基づき前記第1のROIに含まれる画像ブロックに対して前記イントラ予測モードを指定し、
前記処理部は、前記ROI情報に基づき前記第2のROIを含むピクチャに対して前記圧縮を行うことを特徴とする請求項9に記載の映像符号化装置。 The ROI setting unit sets a first ROI and a second ROI different from the first ROI, a position and a size in the picture of the first ROI, and a picture in the second ROI Generating information representing the position and size in the ROI information,
The intra prediction mode designating unit designates the intra prediction mode for an image block included in the first ROI based on the ROI information,
The video encoding device according to claim 9, wherein the processing unit performs the compression on a picture including the second ROI based on the ROI information.
前記映像符号化装置は、
ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成するROI設定部と、
復号に必要となるパラメータセットを含む上位シンタックス情報を生成する上位シンタックス生成部と、
前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施して得られたエレメンタリーストリーム信号と、前記上位シンタックス情報とを多重化したビットストリーム信号を出力するエンコーダ部と、を有し、
前記エンコーダ部は、前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施し、
前記映像復号装置は、
前記ビットストリーム信号を受け、前記ビットストリーム信号から前記上位シンタックス情報に含まれる前記パラメータセット、及び前記エレメンタリーストリーム信号に対応したアクセスユニットを抽出する復号画像選択部と、
前記アクセスユニットに対して前記パラメータセットに基づく復号処理を施して出力画像を生成する映像復号部と、を含むことを特徴とする画像符号復号システム。 An image encoding / decoding system including: a video encoding device that performs compression encoding processing on an input image signal to generate a bitstream signal; and a video decoding device that performs decoding processing on the bitstream signal,
The video encoding device includes:
An ROI setting unit that sets ROI (Region Of Interest) in a picture and generates ROI information indicating the position and size of the ROI in the picture;
An upper syntax generation unit that generates upper syntax information including a parameter set necessary for decoding;
A bit stream obtained by multiplexing the elementary stream signal obtained by receiving the input image signal and the ROI information and subjecting the input image signal to compression encoding processing based on the ROI information, and the upper syntax information An encoder unit for outputting a signal,
The encoder unit performs intra coding as the compression coding process on an image block included in the ROI in the picture in the input image signal based on the ROI information, and converts the image block included in the non-ROI to the image block included in the non-ROI For the compression encoding process, one of the intra encoding and inter encoding is selected and applied,
The video decoding device includes:
A decoded image selection unit that receives the bit stream signal and extracts the parameter set included in the higher-level syntax information from the bit stream signal and an access unit corresponding to the elementary stream signal;
And a video decoding unit that generates an output image by performing a decoding process on the access unit based on the parameter set.
前記パラメータセットを保持しつつ、前記アクセスユニットに対応するピクチャ中に前記ROIが含まれるか否かを判定し、前記ROIが含まれていると判定された場合に、保持した前記パラメータ及び前記アクセスユニットを前記映像復号部に供給することを特徴とする請求項12〜15のいずれか1に記載の画像符号復号システム。 The decoded image selection unit includes:
While holding the parameter set, it is determined whether or not the ROI is included in a picture corresponding to the access unit. If it is determined that the ROI is included, the held parameter and the access are determined. The image code decoding system according to claim 12, wherein a unit is supplied to the video decoding unit.
起動イベントが与えられたときに前記データベースから前記パラメータセット、及び前記ROIを含むアクセスユニットのみを取り出して夫々を前記映像復号部に供給することを特徴とする請求項12〜15のいずれか1に記載の画像符号復号システム。 The decoded image selection unit includes a database for storing the bit stream signal,
16. The method according to claim 12, wherein when an activation event is given, only the access unit including the parameter set and the ROI is extracted from the database, and each is supplied to the video decoding unit. The image encoding / decoding system described.
ピクチャ内にROI(Region Of Interest)を設定し、前記ピクチャ内での前記ROIの位置及びサイズを表すROI情報を生成する第1のステップと、
前記入力画像信号及び前記ROI情報を受け、前記ROI情報に基づいて前記入力画像信号に圧縮符号化処理を施してビットストリーム信号を生成する第2のステップと、を有し、
前記第2のステップでは、前記ROI情報に基づき、前記入力画像信号におけるピクチャ内の前記ROIに含まれる画像ブロックに対しては前記圧縮符号化処理としてイントラ符号化を施し、非ROIに含まれる画像ブロックに対しては前記圧縮符号化処理として前記イントラ符号化及びインター符号化のうちの一方を選択して施すことを特徴とする映像符号化プログラム。 A video encoding program executed by a control unit of an information processing apparatus that performs compression encoding processing on an input image signal to generate a bitstream signal,
A first step of setting an ROI (Region Of Interest) in a picture and generating ROI information representing the position and size of the ROI in the picture;
Receiving the input image signal and the ROI information, and performing a compression encoding process on the input image signal based on the ROI information to generate a bitstream signal, and
In the second step, based on the ROI information, an image block included in the ROI in a picture in the input image signal is subjected to intra encoding as the compression encoding process, and an image included in a non-ROI A video encoding program, wherein one of the intra encoding and inter encoding is selected and applied to a block as the compression encoding processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017021623A JP2018129688A (en) | 2017-02-08 | 2017-02-08 | Video encoding device, video encoding/decoding system, and video encoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017021623A JP2018129688A (en) | 2017-02-08 | 2017-02-08 | Video encoding device, video encoding/decoding system, and video encoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018129688A true JP2018129688A (en) | 2018-08-16 |
Family
ID=63174426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017021623A Pending JP2018129688A (en) | 2017-02-08 | 2017-02-08 | Video encoding device, video encoding/decoding system, and video encoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018129688A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220224918A1 (en) * | 2019-05-29 | 2022-07-14 | Sumitomo Electric Industries, Ltd. | Video transport system, video transmission device, video reception device, video distribution method, video transmission method, video reception method, and non-transitory computer readable recording medium |
-
2017
- 2017-02-08 JP JP2017021623A patent/JP2018129688A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220224918A1 (en) * | 2019-05-29 | 2022-07-14 | Sumitomo Electric Industries, Ltd. | Video transport system, video transmission device, video reception device, video distribution method, video transmission method, video reception method, and non-transitory computer readable recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5026092B2 (en) | Moving picture decoding apparatus and moving picture decoding method | |
EP1429564A1 (en) | Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same | |
TWI790409B (en) | Video coding and decoding | |
JP2011130410A (en) | Encoding method, decoding method and apparatus thereof | |
JP2023065581A (en) | video encoding and decoding | |
KR20140129607A (en) | Method and apparatus for processing moving image | |
JP5475409B2 (en) | Moving picture coding apparatus and moving picture coding method | |
US20210014489A1 (en) | Intra prediction device, image encoding device, image decoding device and program | |
US11240510B2 (en) | Blurring privacy masks | |
JP6480310B2 (en) | Video encoding method, video encoding apparatus, and video encoding program | |
KR100972222B1 (en) | Video encoding method and device, video decoding method and device, and recording medium containing the programs thereof | |
US9736485B2 (en) | Encoding apparatus, encoding method, and image capture apparatus | |
US8687910B2 (en) | Image filtering method using pseudo-random number filter and apparatus thereof | |
JP2018129688A (en) | Video encoding device, video encoding/decoding system, and video encoding program | |
JP2008166916A (en) | Intra prediction encoder and intra prediction coding method | |
KR20210126940A (en) | Device for encoding and decoding for 2d image for 3d image generation | |
KR20020066498A (en) | Apparatus and method for coding moving picture | |
RU2793802C2 (en) | Video encoder, video decoder and corresponding methods | |
JP5147546B2 (en) | Video encoding device and video decoding device | |
JP5573385B2 (en) | Moving picture coding apparatus and moving picture coding method | |
JP5911982B2 (en) | Image decoding method | |
JP5750191B2 (en) | Image decoding method | |
KR20140130269A (en) | Method and apparatus for processing moving image | |
GB2589735A (en) | Video coding and decoding | |
GB2597616A (en) | Video coding and decoding |