JP5325164B2 - Coding block size and position estimation method and program - Google Patents

Coding block size and position estimation method and program Download PDF

Info

Publication number
JP5325164B2
JP5325164B2 JP2010119798A JP2010119798A JP5325164B2 JP 5325164 B2 JP5325164 B2 JP 5325164B2 JP 2010119798 A JP2010119798 A JP 2010119798A JP 2010119798 A JP2010119798 A JP 2010119798A JP 5325164 B2 JP5325164 B2 JP 5325164B2
Authority
JP
Japan
Prior art keywords
block size
frequency
video signal
horizontal
vertical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010119798A
Other languages
Japanese (ja)
Other versions
JP2011250038A (en
Inventor
太一 河野
和久 山岸
淳 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010119798A priority Critical patent/JP5325164B2/en
Publication of JP2011250038A publication Critical patent/JP2011250038A/en
Application granted granted Critical
Publication of JP5325164B2 publication Critical patent/JP5325164B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号化ブロックサイズ及び位置推定方法並びにプログラムに関する。特に、本発明は、映像信号から、映像符号化の離散コサイン変換の処理単位である矩形ブロック(符号化ブロック)の水平方向及び垂直方向のサイズを示す符号化ブロックサイズと、符号化ブロックの境界線の位置を示す符号化ブロック位置とを推定するための技術に関する。   The present invention relates to a coding block size and position estimation method and a program. In particular, the present invention relates to a coding block size indicating a horizontal size and a vertical size of a rectangular block (coding block) which is a processing unit of discrete cosine transform of video coding from a video signal, and a boundary between the coding blocks. The present invention relates to a technique for estimating a coding block position indicating a line position.

情報技術の発展により、デジタル映像メディアを利用したサービス(IPTVサービス、TV会議システムなど)や商品(ブルーレイ、DVDなど)が普及している。これらの映像メディアは、一般にデータ量の削減のため、情報圧縮(映像符号化)が行われるが、映像符号化に伴い、映像メディアに劣化(ブロック状の歪(ブロックノイズ)、ぼけ、ちらつきなど)が生じ、映像メディアに対して人間が知覚する品質(ユーザ体感品質(QoE:Quality of Experience))が低下する。   With the development of information technology, services using digital video media (IPTV services, video conferencing systems, etc.) and products (Blu-ray, DVD, etc.) are becoming popular. In general, information compression (video coding) is performed on these video media to reduce the amount of data. However, with video coding, the video media deteriorates (block-like distortion (block noise), blur, flicker, etc.). ), And the quality perceived by humans for video media (QoE: Quality of Experience (QoE)) decreases.

上記のように映像品質が低下したことを適切に把握するためには、映像メディアに対するユーザ体感品質を評価可能な映像客観品質評価技術が必須である。   In order to appropriately grasp that the video quality has deteriorated as described above, a video objective quality evaluation technique capable of evaluating the user experience quality for the video media is essential.

映像客観品質評価技術は、映像信号(つまり、画素信号)、パケットヘッダ情報、ビットストリーム情報(つまり、動きベクトルなどの符号化情報)、または、これらの組み合わせを入力とし、ユーザ体感品質を評価する技術である。特に、映像符号化、ネットワーク及び受信端末による品質劣化を考慮するためには、受信した映像を用いて品質評価をすることが重要である。   In the video objective quality evaluation technology, a video signal (that is, pixel signal), packet header information, bit stream information (that is, encoded information such as a motion vector), or a combination thereof is input, and the user experience quality is evaluated. Technology. In particular, it is important to evaluate the quality using the received video in order to consider quality degradation due to video coding, the network, and the receiving terminal.

映像信号を用いる映像客観品質評価技術の中には、符号化ブロックサイズ及び符号化ブロック位置の情報を基にユーザ体感品質を評価するものがある(例えば、非特許文献1、2及び3)。   Among video objective quality evaluation techniques using video signals, there are techniques for evaluating the user experience quality based on information on the encoding block size and the encoding block position (for example, Non-Patent Documents 1, 2, and 3).

しかしながら、非特許文献1、2及び3に示される技術は、映像メディアのフォーマット変換やパケット損失劣化などによる映像信号の空間的なずれが発生した場合、符号化ブロックサイズ及び符号化ブロック位置を事前に把握することが難しい。このような場合、符号化ブロックサイズ及び符号化ブロック位置を推定する技術が必要になる。   However, the techniques disclosed in Non-Patent Documents 1, 2, and 3 are adapted to determine the encoding block size and encoding block position in advance when a spatial shift of the video signal occurs due to video media format conversion or packet loss degradation. Difficult to grasp. In such a case, a technique for estimating the encoding block size and the encoding block position is required.

前述のように、映像符号化により映像品質は低下する。そのため、映像符号化された映像信号に発生したブロックノイズを低減させ、映像品質を向上させるブロックノイズ除去フィルタが開発されている。   As described above, video quality is degraded by video coding. For this reason, a block noise removal filter that reduces block noise generated in a video signal that has been encoded and improves video quality has been developed.

ブロックノイズ除去技術は、画素信号の画素空間又は周波数空間からブロックノイズを推定し減算することにより、ブロックノイズを低減させる技術である。フィルタ強度を上げ過ぎると、ブロックノイズだけではなく原映像の精細度の情報まで削減してしまい、映像メディアに劣化が生じてしまうため、フィルタ強度の最適化技術も重要になる。   The block noise removal technique is a technique for reducing block noise by estimating and subtracting block noise from the pixel space or frequency space of the pixel signal. If the filter strength is increased too much, not only block noise but also information on the definition of the original video will be reduced, and the video media will be deteriorated. Therefore, a filter strength optimization technique is also important.

ブロックノイズ除去フィルタ及びフィルタ強度の最適化には、符号化ブロックサイズ及び符号化ブロック位置の情報を基にしているものがある(例えば、非特許文献4及び5)。   Some optimization of the block noise removal filter and the filter strength is based on information on the encoding block size and the encoding block position (for example, Non-Patent Documents 4 and 5).

しかしながら、これらの技術は、映像メディアのフォーマット変換やパケット損失劣化などによる映像信号の空間的なずれが発生した場合、符号化ブロックサイズ及び符号化ブロック位置を事前に把握することが難しい。このような場合、符号化ブロックサイズ及び符号化ブロック位置を推定する技術が必要になる。   However, in these techniques, it is difficult to grasp the coding block size and the coding block position in advance when a video signal spatial shift occurs due to video media format conversion or packet loss degradation. In such a case, a technique for estimating the encoding block size and the encoding block position is required.

このように、映像客観品質評価技術やブロックノイズ除去フィルタにおいて、符号化ブロックサイズ及び符号化ブロック位置が適切にわからないことで、品質推定精度が低下するといった問題や、ブロックノイズを除去できないといった問題がある。   As described above, in the video objective quality evaluation technique and the block noise removal filter, there is a problem that the quality estimation accuracy is deteriorated because the coding block size and the coding block position are not properly known, and the block noise cannot be removed. is there.

これらの課題を解決するために、以下のような解決策が提案されている。非特許文献6は、映像信号にエッジ抽出フィルタを適用し、生成したエッジ映像信号と、図1に示すようなグリッド画像との相互相関を利用して符号化ブロック位置を推定する方法を記載している。また、非特許文献7は、ブロックノイズ量抽出フィルタを利用して符号化ブロックサイズ及び符号化ブロック位置を推定する方法を記載している。   In order to solve these problems, the following solutions have been proposed. Non-Patent Document 6 describes a method of applying an edge extraction filter to a video signal and estimating a coding block position using a cross-correlation between the generated edge video signal and a grid image as shown in FIG. ing. Non-Patent Document 7 describes a method for estimating a coding block size and a coding block position using a block noise amount extraction filter.

河野,山岸,岡本,"IPTVサービスを対象としたNR型メディアレイヤモデルの提案," 信学技報, CQ2009-76, Jan. 2010.Kono, Yamagishi, Okamoto, "Proposal of NR-type media layer model for IPTV service," IEICE Technical Report, CQ2009-76, Jan. 2010. O. Sugimoto1, S. Naito, S. Sakazawa, and A. Koike, "Objective perceptual video quality measurement method based on hybrid no reference framework," IEEE International Conference on Image Processing (ICIP), pp.2237-2240, Nov. 2009.O. Sugimoto1, S. Naito, S. Sakazawa, and A. Koike, "Objective perceptual video quality measurement method based on hybrid no reference framework," IEEE International Conference on Image Processing (ICIP), pp.2237-2240, Nov. 2009. S. Qiu, H. Rui, and L. Zhang, "No-reference perceptual quality assessment for streaming video based on simple end-to-end network measures, proceedings of the international conference on networking and services (ICNS) 2006.S. Qiu, H. Rui, and L. Zhang, "No-reference perceptual quality assessment for streaming video based on simple end-to-end network measures, proceedings of the international conference on networking and services (ICNS) 2006. S. Liu and A. C. Bovik, "Efficient DCT-domain blind measurement and reduction of blocking artifacts," IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, no. 12, pp.1139-1149, 2002.S. Liu and A. C. Bovik, "Efficient DCT-domain blind measurement and reduction of blocking artifacts," IEEE Transactions on Circuits and Systems for Video Technology, vol. 12, no. 12, pp. 1139-1149, 2002. 杉山, 相良, 横山, "符号化ブロックひずみ軽減のためのひずみ量客観評価方法," 電子情報通信学会論文誌A, Vol.J91-A, No.6, pp.643-646, 2008.Sugiyama, Sagara, Yokoyama, "Distortion amount objective evaluation method for coding block distortion reduction," IEICE Transactions A, Vol.J91-A, No.6, pp.643-646, 2008. R. Dosselmann, X. D. Yang, "A Prototype No-Reference Video Quality System," Proceedings of the Fourth Canadian Conference on Computer and Robot Vision, p.411-417, May 2007R. Dosselmann, X. D. Yang, "A Prototype No-Reference Video Quality System," Proceedings of the Fourth Canadian Conference on Computer and Robot Vision, p.411-417, May 2007 大川,相良,杉山,"フォーマット変換画像からの符号化ブロック位置検出," 映情学技報, vol.33, No.10, pp.33-36, Feb. 2010.Okawa, Sagara, Sugiyama, "Detection of coding block position from format-converted images," ITEJ Technical Report, vol.33, No.10, pp.33-36, Feb. 2010.

しかしながら、非特許文献6は、映像信号の空間的なずれのみを想定した符号化ブロック位置推定技術であり、符号化ブロックサイズを事前に把握する必要がある。そのため、映像信号がフォーマット変換(例えば、1440x1080から1920x1080への変換)などにより拡大または縮小された場合、符号化ブロックサイズも拡大または縮小されるため、符号化ブロックサイズを知ることができないといった問題がある。   However, Non-Patent Document 6 is a coding block position estimation technique that assumes only a spatial shift of a video signal, and it is necessary to grasp the coding block size in advance. Therefore, when the video signal is enlarged or reduced by format conversion (for example, conversion from 1440x1080 to 1920x1080) etc., the encoding block size is also enlarged or reduced, so that the encoding block size cannot be known. is there.

また、非特許文献7は、予め符号化ブロックサイズ及び符号化ブロック位置を複数指定し、その中から符号化ブロックサイズ及び符号化ブロック位置を推定する技術である。しかし、図2に示すように映像フォーマットの種類は非常に多いといった問題があることに加え、映像フォーマットを変換した場合は、事前に、符号化ブロックサイズ及び符号化ブロック位置を指定することができないといった問題がある。   Non-Patent Document 7 is a technique in which a plurality of coding block sizes and coding block positions are designated in advance, and the coding block size and coding block position are estimated from them. However, as shown in FIG. 2, in addition to the problem that the types of video formats are very large, when the video format is converted, the encoding block size and the encoding block position cannot be designated in advance. There is a problem.

本発明は、例えば、映像信号のフォーマット変換やパケット損失劣化などによる映像信号の空間的ずれが生じて、符号化ブロックサイズ及び符号化ブロック位置に関する情報が未知の場合であっても、符号化ブロックサイズ及び符号化ブロック位置を推定することを目的とする。   Even if the information about the encoding block size and the encoding block position is unknown due to a spatial shift of the video signal due to, for example, format conversion of the video signal or degradation of packet loss, the present invention The purpose is to estimate the size and coding block position.

上記の課題を解決するため、本発明の符号化ブロックサイズ及び位置推定方法は、
映像信号から、映像符号化の離散コサイン変換の処理単位である符号化ブロックの水平方向及び垂直方向のサイズを示す符号化ブロックサイズと、符号化ブロックの境界線の位置を示す符号化ブロック位置とを推定する装置における符号化ブロックサイズ及び位置推定方法であって、
エッジ抽出部が、前記映像信号のフレーム毎にエッジ抽出フィルタを適用し、前記映像信号からエッジ映像信号を抽出するエッジ抽出ステップと、
周波数抽出部が、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の水平方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の水平方向の周波数に対応する振幅値を示す水平方向の周波数情報を抽出し、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の垂直方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の垂直方向の周波数に対応する振幅値を示す垂直方向の周波数情報を抽出する周波数抽出ステップと、
水平方向符号化ブロックサイズ抽出部が、水平方向の周波数の振幅値の比較に基づいて水平方向の符号化ブロックサイズを抽出する水平方向符号化ブロックサイズ抽出ステップと、
垂直方向符号化ブロックサイズ抽出部が、垂直方向の周波数の振幅値の比較に基づいて垂直方向の符号化ブロックサイズ抽出する垂直方向符号化ブロックサイズ抽出ステップと、
符号化ブロック位置抽出部が、前記水平方向の符号化ブロックサイズと前記垂直方向の符号化ブロックサイズと前記エッジ映像信号とに基づいて符号化ブロック位置を抽出する符号化ブロック位置抽出ステップと、
を有することを特徴とする。
In order to solve the above problems, the coding block size and position estimation method of the present invention are:
From the video signal, a coding block size indicating the size in the horizontal direction and the vertical direction of the coding block, which is a processing unit of discrete cosine transform of video coding, and a coding block position indicating the position of the boundary line of the coding block; A coding block size and position estimation method in an apparatus for estimating
An edge extraction step in which an edge extraction unit applies an edge extraction filter to each frame of the video signal to extract an edge video signal from the video signal;
A frequency extraction unit applies a Fourier transform to each frame of the edge video signal, and arranges a one-dimensional array of amplitude values corresponding to the array number, where the horizontal frequency of the obtained edge video signal is an array number as a one-dimensional array, it averaged in every frame for each of the elements, to extract frequency information of the horizontal direction showing the amplitude value corresponding to the horizontal frequency of the edge image signal, Fourier for each frame of the edge image signal Applying the transformation, a one-dimensional array of amplitude values corresponding to the array number with the vertical frequency of the obtained edge video signal as the array number is averaged over all frames for each element of the array, A frequency extraction step of extracting vertical frequency information indicating an amplitude value corresponding to a vertical frequency of the edge video signal;
A horizontal encoding block size extraction unit, wherein the horizontal encoding block size extraction unit extracts a horizontal encoding block size based on a comparison of horizontal frequency amplitude values ;
Is vertical coding block size extracting unit, and the vertical direction coding block size extracting a vertical encoding block size based on a comparison of the amplitude value of the frequency in the vertical direction,
An encoding block position extraction unit that extracts an encoding block position based on the encoding block size in the horizontal direction, the encoding block size in the vertical direction, and the edge video signal;
It is characterized by having.

また、本発明のプログラムは、
映像信号から、映像符号化の離散コサイン変換の処理単位である符号化ブロックの水平方向及び垂直方向のサイズを示す符号化ブロックサイズと、符号化ブロックの境界線の位置を示す符号化ブロック位置とを推定するための装置を、
前記映像信号のフレーム毎にエッジ抽出フィルタを適用し、前記映像信号からエッジ映像信号を抽出するエッジ抽出手段、
前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の水平方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の水平方向の周波数に対応する振幅値を示す水平方向の周波数情報を抽出し、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の垂直方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の垂直方向の周波数に対応する振幅値を示す垂直方向の周波数情報を抽出する周波数抽出手段、
水平方向の周波数の振幅値の比較に基づいて水平方向の符号化ブロックサイズを抽出する水平方向符号化ブロックサイズ抽出手段、
垂直方向の周波数の振幅値の比較に基づいて垂直方向の符号化ブロックサイズを抽出する垂直方向符号化ブロックサイズ抽出手段、及び
前記水平方向の符号化ブロックサイズと前記垂直方向の符号化ブロックサイズと前記エッジ映像信号とに基づいて符号化ブロック位置を抽出する符号化ブロック位置抽出手段、
として機能させることを特徴とする。
The program of the present invention is
From the video signal, a coding block size indicating the size in the horizontal direction and the vertical direction of the coding block, which is a processing unit of discrete cosine transform of video coding, and a coding block position indicating the position of the boundary line of the coding block; A device for estimating
Applying an edge extraction filter for each frame of the video signal, and extracting an edge video signal from the video signal;
A Fourier transform is applied to each frame of the edge video signal, and a one-dimensional array of amplitude values corresponding to the array number with the horizontal frequency of the obtained edge video signal as the array number is assigned to each element of the array. as a one-dimensional array by averaging the frames of the extracted frequency information in the horizontal direction showing the amplitude value corresponding to the horizontal frequency of the edge image signal, applying a Fourier transform to each frame of the edge image signal, A one-dimensional array of amplitude values corresponding to the array number, where the vertical frequency of the obtained edge video signal is an array number, is set as a one-dimensional array that is averaged over all frames for each element of the array. A frequency extracting means for extracting vertical frequency information indicating an amplitude value corresponding to a vertical frequency;
Horizontal coding block size extracting means for extracting a horizontal encoding block size based on a comparison of the amplitude values of the horizontal frequency,
Vertical-direction encoded block size extraction means for extracting a vertical-direction encoded block size based on comparison of amplitude values of vertical frequency, and the horizontal-direction encoded block size and the vertical-direction encoded block size; Coding block position extracting means for extracting a coding block position based on the edge video signal;
It is made to function as.

本発明によれば、符号化ブロックサイズ及び符号化ブロック位置に関する情報が未知の場合であっても、符号化ブロックサイズ及び符号化ブロック位置を推定することが可能になる。   According to the present invention, it is possible to estimate the encoding block size and the encoding block position even when the information regarding the encoding block size and the encoding block position is unknown.

グリッド画像の例Grid image example 映像フォーマットの例Example of video format 水平方向周波数情報及び垂直方向周波数情報を示す図The figure which shows horizontal direction frequency information and vertical direction frequency information 2次元周波数情報を示す図Diagram showing two-dimensional frequency information 基準画素位置と符号化ブロック境界線との関係を示す図The figure which shows the relationship between a reference pixel position and an encoding block boundary line 符号化ブロックサイズ及び位置推定装置のブロック図Block diagram of coding block size and position estimation device 符号化ブロックサイズ及び位置推定方法のフローチャートEncoding block size and position estimation method flowchart

以下、図面を参照して本発明の実施形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明の実施形態では、映像符号化により符号化ブロック位置に現れるエッジ状の歪(ブロックノイズ)を基に、符号化ブロックサイズ及び符号化ブロック位置を推定する。より具体的には、ブロックノイズによって発生したエッジは水平方向及び垂直方向に一定の周波数(符号化ブロック周波数)を有する。そのため、符号化ブロック周波数の振幅値が近隣の周波数の振幅値よりも高くなる。本発明の実施形態では、符号化ブロック周波数の振幅値に基づいて、符号化ブロックサイズ及び符号化ブロック位置を推定する。この符号化ブロックサイズ及び位置推定方法について以下に説明する。   In the embodiment of the present invention, the coding block size and the coding block position are estimated based on edge distortion (block noise) appearing at the coding block position by video coding. More specifically, an edge generated by block noise has a constant frequency (encoded block frequency) in the horizontal direction and the vertical direction. Therefore, the amplitude value of the coding block frequency becomes higher than the amplitude value of the neighboring frequency. In the embodiment of the present invention, the encoding block size and the encoding block position are estimated based on the amplitude value of the encoding block frequency. The encoding block size and position estimation method will be described below.

まず、入力された映像信号のフレーム毎にエッジ抽出フィルタ(例えば、Canny edge detector、Sobelフィルタ、Laplacianフィルタ、Prewittフィルタなど)を適用し、エッジ映像信号を生成する。   First, an edge extraction filter (for example, Canny edge detector, Sobel filter, Laplacian filter, Prewitt filter, etc.) is applied to each frame of the input video signal to generate an edge video signal.

符号化により発生したエッジを含むエッジ映像信号から、符号化ブロックのサイズを抽出するため、エッジ映像信号の水平方向の周波数情報(水平方向周波数情報)と垂直方向の周波数情報(垂直方向周波数情報)を得る。水平方向周波数情報及び垂直方向周波数情報は、図3に示すように、水平方向及び垂直方向の配列番号を周波数とし、その配列番号に対応する振幅値の1次元配列で表現できる。以下に、2通りの水平方向周波数情報及び垂直方向周波数情報の算出方法を説明する。   In order to extract the size of a coding block from an edge video signal including edges generated by encoding, horizontal frequency information (horizontal frequency information) and vertical frequency information (vertical frequency information) of the edge video signal are extracted. Get. As shown in FIG. 3, the horizontal direction frequency information and the vertical direction frequency information can be represented by a one-dimensional array of amplitude values corresponding to the array numbers, with the array numbers in the horizontal direction and the vertical direction as frequencies. Hereinafter, a method for calculating two types of horizontal frequency information and vertical frequency information will be described.

第1の算出方法は、エッジ映像信号の各フレームに対し、フーリエ変換のような2次元の周波数抽出フィルタを適用し、水平方向及び垂直方向の周波数情報(2次元周波数情報)を抽出する。2次元周波数情報は、図4に示すように、水平方向及び垂直方向の配列番号を周波数とし、その配列番号に対応する振幅値の2次元配列である。2次元周波数情報の水平方向の配列番号が0である1次元配列の各要素を、全フレームにおいて平均した1次元配列を水平方向周波数情報とする。2次元周波数情報の垂直方向の配列番号が0である1次元配列の各要素を、全フレームにおいて平均した1次元配列を垂直方向周波数情報とする。   In the first calculation method, a two-dimensional frequency extraction filter such as Fourier transform is applied to each frame of the edge video signal to extract horizontal and vertical frequency information (two-dimensional frequency information). As shown in FIG. 4, the two-dimensional frequency information is a two-dimensional array of amplitude values corresponding to the array numbers with the array numbers in the horizontal direction and the vertical direction as frequencies. The one-dimensional array obtained by averaging the elements of the one-dimensional array whose array number in the horizontal direction of the two-dimensional frequency information is 0 is used as the horizontal frequency information. The one-dimensional array obtained by averaging the elements of the one-dimensional array whose vertical array number is 0 in the two-dimensional frequency information is used as the vertical frequency information.

第2の算出方法は、エッジ映像信号の各フレームの各水平方向画素列に対し、フーリエ変換のような1次元の周波数抽出フィルタを適用し、水平方向の周波数情報を抽出する。この周波数情報は、水平方向の配列番号を周波数とし、その配列番号に対応する振幅値の1次元配列である。抽出した周波数情報の各要素を、全てのフレームの全ての水平方向画素列において平均した1次元配列を水平方向周波数情報とする。また、エッジ映像信号の各フレームの各垂直方向画素列に対し、フーリエ変換のような1次元の周波数抽出フィルタを適用し、垂直方向の周波数情報を抽出する。この周波数情報は、垂直方向の配列番号を周波数とし、その配列番号に対応する振幅値の1次元配列である。抽出した周波数情報の各要素を、全てのフレームの全ての垂直方向画素列において平均した1次元配列を垂直方向周波数情報とする。   In the second calculation method, horizontal frequency information is extracted by applying a one-dimensional frequency extraction filter such as Fourier transform to each horizontal pixel column of each frame of the edge video signal. This frequency information is a one-dimensional array of amplitude values corresponding to the array number with the array number in the horizontal direction as a frequency. A one-dimensional array in which each element of the extracted frequency information is averaged in all horizontal pixel columns of all frames is set as horizontal frequency information. In addition, a one-dimensional frequency extraction filter such as Fourier transform is applied to each vertical pixel column of each frame of the edge video signal to extract vertical frequency information. This frequency information is a one-dimensional array of amplitude values corresponding to the array number, with the array number in the vertical direction as a frequency. A one-dimensional array obtained by averaging the elements of the extracted frequency information in all the vertical pixel columns of all the frames is defined as the vertical frequency information.

ブロックノイズは、符号化ブロックの境界線に発生しているため、ブロックノイズによって発生したエッジは水平方向及び垂直方向に一定の周波数(符号化ブロック周波数)を有する。そのため、符号化ブロック周波数の振幅値が近隣の周波数の振幅値よりも高くなる。ある配列番号の振幅値からその配列番号の近隣の配列番号の振幅値の平均値又は中間値を減算した値をその配列番号のピーク強度と定義し、また、ピーク強度が最大となる配列番号をピーク周波数と定義し、水平方向周波数情報のピーク周波数を水平方向符号化ブロック周波数とする。水平方向符号化ブロック周波数は全配列番号の範囲の中で抽出されてもよいが、一般にブロックノイズの発生の有無によらず映像信号の低周波数成分の振幅値は極端に高くなる。原映像信号の性質に起因するピーク周波数を水平方向符号化ブロック周波数として誤って抽出しないために、配列番号の閾値を設定し、閾値よりも高い配列番号の範囲から、水平方向符号化ブロック周波数を抽出してもよい。すなわち、水平方向符号化ブロック周波数は、所定の配列番号の範囲の中で抽出されてもよい。なお、所定の配列番号は、全配列番号の範囲でもよく、予め指定した配列番号の範囲でもよい。   Since block noise is generated at the boundary line of the encoded block, an edge generated by the block noise has a constant frequency (encoded block frequency) in the horizontal direction and the vertical direction. Therefore, the amplitude value of the coding block frequency becomes higher than the amplitude value of the neighboring frequency. A value obtained by subtracting an average value or an intermediate value of the amplitude values of neighboring SEQ ID NOs from the amplitude value of a certain SEQ ID NO is defined as the peak intensity of the SEQ ID NO. It is defined as a peak frequency, and the peak frequency of the horizontal frequency information is defined as a horizontal encoding block frequency. Although the horizontal encoding block frequency may be extracted within the range of all array numbers, generally, the amplitude value of the low frequency component of the video signal becomes extremely high regardless of the presence or absence of occurrence of block noise. In order not to accidentally extract the peak frequency due to the nature of the original video signal as the horizontal encoding block frequency, set a threshold of the array number, and set the horizontal encoding block frequency from the range of the array number higher than the threshold. It may be extracted. That is, the horizontal encoding block frequency may be extracted within a predetermined array number range. The predetermined sequence number may be a range of all sequence numbers or a range of sequence numbers designated in advance.

垂直方向周波数情報から、同様の方法で抽出した配列番号を垂直方向符号化ブロック周波数とする。水平方向の総画素数を水平方向符号化ブロック周波数で割った値が符号化ブロックの横のサイズである水平方向符号化ブロックサイズになり、垂直方向の総画素数を垂直方向符号化ブロック周波数で割った値が符号化ブロックの縦のサイズである垂直方向符号化ブロックサイズになる。   The array element number extracted by the same method from the vertical direction frequency information is set as the vertical direction encoding block frequency. The value obtained by dividing the total number of pixels in the horizontal direction by the horizontal direction coding block frequency is the horizontal direction coding block size, which is the horizontal size of the coding block, and the total number of pixels in the vertical direction is represented by the vertical direction coding block frequency. The divided value becomes the vertical encoding block size which is the vertical size of the encoding block.

次に、図5に示すように、エッジ映像信号のフレーム内のある画素位置を基準画素位置としたときに、基準画素位置から水平方向符号化ブロックサイズの倍数画素水平方向に離れた垂直線群と基準画素位置から垂直方向符号化ブロックサイズの倍数画素垂直方向に離れた水平線群を符号化ブロック境界線とする。フレーム内の所定の範囲内で、エッジ映像信号にブロックノイズ量抽出フィルタ(例えば、非特許文献1、2及び3など)を適用し、得られるブロックノイズ量が最大になる基準画素位置のときの符号化ブロック境界線の位置を符号化ブロック位置とする。なお、フレーム内の所定の範囲は、フレーム内の全範囲でもよく、フレーム内の指定した範囲でもよい。   Next, as shown in FIG. 5, when a certain pixel position in the frame of the edge video signal is set as the reference pixel position, a group of vertical lines separated from the reference pixel position in the horizontal direction by a multiple of the horizontal encoded block size. A group of horizontal lines separated from the reference pixel position in the vertical direction by a pixel that is a multiple of the vertical direction encoded block size is defined as an encoded block boundary line. A block noise amount extraction filter (for example, Non-Patent Documents 1, 2, and 3) is applied to the edge video signal within a predetermined range in the frame, and the obtained block noise amount is the maximum at the reference pixel position. The position of the encoding block boundary line is set as the encoding block position. The predetermined range in the frame may be the entire range in the frame or a specified range in the frame.

<実施形態:符号化ブロックサイズ及び位置推定装置の説明>
次に、本発明の実施形態を実現する符号化ブロックサイズ及び位置推定装置について説明する。図5は、本発明の実施形態の一例である符号化ブロックサイズ及び位置推定装置10のブロック図である。符号化ブロックサイズ及び位置推定装置10は、エッジ抽出部100と、符号化ブロックサイズ抽出部110と、符号化ブロック位置抽出部120とを有する。符号化ブロックサイズ抽出部110は、周波数抽出部111と、水平方向符号化ブロックサイズ抽出部112と、垂直方向符号化ブロックサイズ抽出部113とを有する。
<Embodiment: Description of Coding Block Size and Position Estimation Device>
Next, a coding block size and position estimation device that realizes an embodiment of the present invention will be described. FIG. 5 is a block diagram of an encoding block size and position estimation apparatus 10 that is an example of an embodiment of the present invention. The coding block size and position estimation apparatus 10 includes an edge extraction unit 100, a coding block size extraction unit 110, and a coding block position extraction unit 120. The encoding block size extraction unit 110 includes a frequency extraction unit 111, a horizontal direction encoding block size extraction unit 112, and a vertical direction encoding block size extraction unit 113.

エッジ抽出部100は、ディスプレイ(又はセットトップなど)の出力受信映像信号をキャプチャする、或いは、映像ファイルを読み込む。映像信号内には、輝度信号や色差信号を表す画素値が存在する。キャプチャした映像信号内の輝度信号に、エッジ抽出フィルタを適用し、エッジ映像信号を生成し、周波数抽出部111及び符号化ブロック位置抽出部120に入力する。本実施形態では、エッジ抽出フィルタとしてCanny Edge Detectorを使用するが、Sobelフィルタ、Laplacianフィルタ、Prewittフィルタなどを使用してもよい。本実施形態では、輝度信号を用いて、エッジ映像信号を抽出するが、色差信号又は輝度信号と色差信号の両方を用いてもよい。   The edge extraction unit 100 captures an output received video signal from a display (or a set top or the like) or reads a video file. In the video signal, there are pixel values representing luminance signals and color difference signals. An edge extraction filter is applied to the luminance signal in the captured video signal to generate an edge video signal, which is input to the frequency extraction unit 111 and the encoded block position extraction unit 120. In this embodiment, the Canny Edge Detector is used as the edge extraction filter, but a Sobel filter, a Laplacian filter, a Prewitt filter, or the like may be used. In this embodiment, an edge video signal is extracted using a luminance signal, but a color difference signal or both a luminance signal and a color difference signal may be used.

周波数抽出部111は、入力されたエッジ映像信号に、周波数抽出フィルタを適用し、水平方向周波数情報及び垂直方向周波数情報を抽出し、それぞれ水平方向符号化ブロックサイズ抽出部112及び垂直方向符号化ブロックサイズ抽出部113に入力する。本実施形態では、周波数抽出フィルタとして、離散フーリエ変換を用いる。水平方向周波数情報及び垂直方向周波数情報は、図3に示すように、水平方向及び垂直方向の配列番号を周波数とし、その配列番号に対応する振幅値の1次元配列である。以下に、2通りの水平方向周波数情報及び垂直方向周波数情報の算出方法を説明する。   The frequency extraction unit 111 applies a frequency extraction filter to the input edge video signal to extract horizontal frequency information and vertical frequency information, and the horizontal encoding block size extraction unit 112 and the vertical encoding block, respectively. Input to the size extraction unit 113. In the present embodiment, discrete Fourier transform is used as the frequency extraction filter. As shown in FIG. 3, the horizontal frequency information and the vertical frequency information are one-dimensional arrays of amplitude values corresponding to the array numbers with the array numbers in the horizontal and vertical directions as frequencies. Hereinafter, a method for calculating two types of horizontal frequency information and vertical frequency information will be described.

第1の算出方法は、エッジ映像信号の各フレームに対し、2次元の離散フーリエ変換を次式のように適用する。   In the first calculation method, a two-dimensional discrete Fourier transform is applied to each frame of the edge video signal as follows.

Figure 0005325164
ここでF(u,v,f)は、図4に示すように、エッジ映像信号のf番目のフレームの水平方向の周波数がu、垂直方向の周波数がvのときの振幅値、Hは垂直方向の総画素数、Wは水平方向の総画素数、y(w,h,f)は、エッジ映像信号のf番目のフレームの画素位置(w,h)の輝度値、exp()は底がネイピア数eである指数関数を示す。F(u,v,f)は複素数を含むため、次式のように絶対値を算出し、実数に変換する。
Figure 0005325164
Here, F (u, v, f) is an amplitude value when the horizontal frequency of the f-th frame of the edge video signal is u and the vertical frequency is v, as shown in FIG. 4, and H is vertical. The total number of pixels in the direction, W is the total number of pixels in the horizontal direction, y (w, h, f) is the luminance value of the pixel position (w, h) of the f-th frame of the edge video signal, and exp () is the bottom Indicates an exponential function with Napier number e. Since F (u, v, f) includes a complex number, an absolute value is calculated and converted to a real number as in the following equation.

Figure 0005325164
abs()は、絶対値を出力する関数を示す。F'(u,v,f)の垂直方向の周波数vが0である1次元配列を次式のように、全てのフレームにおいて平均した水平方向符号化ブロック周波数Fw(u)を算出する。
Figure 0005325164
abs () indicates a function that outputs an absolute value. The horizontal coding block frequency Fw (u) obtained by averaging the one-dimensional array in which the frequency v in the vertical direction of F ′ (u, v, f) is 0 as shown in the following equation is calculated.

Figure 0005325164
ここでNはフレームの総数を示す。同様に、F'(u,v,f)の水平方向の周波数uが0である1次元配列を次式のように、全てのフレームにおいて平均した垂直方向符号化ブロック周波数Fh(v)を算出する。
Figure 0005325164
Here, N indicates the total number of frames. Similarly, the vertical coding block frequency Fh (v) is calculated by averaging the one-dimensional array in which the horizontal frequency u of F ′ (u, v, f) is 0 as shown in the following equation. To do.

Figure 0005325164
第2の算出方法は、エッジ映像信号の各フレームの各水平画素列に対し、1次元の離散フーリエ変換を次式のように適用する。
Figure 0005325164
In the second calculation method, a one-dimensional discrete Fourier transform is applied to each horizontal pixel column of each frame of the edge video signal as follows.

Figure 0005325164
ここでFwtmp(u,h,f)は、エッジ映像信号のf番目のフレームのh行目の水平方向の周波数がuのときの振幅値を示す。F(u,v,f)は複素数を含むため、次式のように絶対値を算出し、実数に変換する。
Figure 0005325164
Here, Fwtmp (u, h, f) indicates an amplitude value when the horizontal frequency in the h-th row of the f-th frame of the edge video signal is u. Since F (u, v, f) includes a complex number, an absolute value is calculated and converted to a real number as in the following equation.

Figure 0005325164
Fwtmp'(u,h,f)を次式のように、全てのフレームの全ての水平画素列において平均した水平方向符号化ブロック周波数Fw(u)を算出する。
Figure 0005325164
A horizontal encoding block frequency Fw (u) obtained by averaging Fwtmp ′ (u, h, f) in all horizontal pixel columns of all frames is calculated as follows.

Figure 0005325164
同様に、垂直方向に対しても次式のように垂直方向符号化ブロック周波数Fw(u)を算出する。
Figure 0005325164
Similarly, also in the vertical direction, the vertical direction encoded block frequency Fw (u) is calculated as in the following equation.

Figure 0005325164
Figure 0005325164

Figure 0005325164
Figure 0005325164

Figure 0005325164
ここでFhtmp(w,v,f)は、エッジ映像信号のf番目のフレームのw列目の垂直方向の周波数がvのときの振幅値を示す。
Figure 0005325164
Here, Fhtmp (w, v, f) represents an amplitude value when the vertical frequency of the w-th column of the f-th frame of the edge video signal is v.

水平方向符号化ブロックサイズ抽出部112は、入力された水平方向周波数情報から水平方向符号化ブロックサイズを抽出し、符号化ブロック位置抽出部120に入力する。水平方向符号化ブロックサイズの抽出方法を詳述する。   The horizontal encoded block size extracting unit 112 extracts the horizontal encoded block size from the input horizontal frequency information and inputs the extracted horizontal encoded block size to the encoded block position extracting unit 120. A method of extracting the horizontal encoding block size will be described in detail.

水平方向周波数情報Fw(u)から、次式のようにDw(u)を算出する。   From the horizontal frequency information Fw (u), Dw (u) is calculated as in the following equation.

Figure 0005325164
或いは、次式のようにDw(u)を算出してもよい。
Figure 0005325164
Alternatively, Dw (u) may be calculated as in the following equation.

Figure 0005325164
ここでm(m≧1)は定数であり、予め設定される。本実施形態では、mは5とする。また、median()は、入力された集合の中間値を出力する関数を示す。このとき、uの範囲は、mからW-m-1になるが、一般に低周波数成分の振幅値が極端に高くなっており、適切にブロックノイズによる振幅のピークを抽出できない場合がある。そのため、予め閾値Tを設定し、uの範囲をTからW-m-1にしてもよい。Dw(u)が最大になるuを水平符号化ブロック周波数umaxとする。水平符号化ブロックサイズCwは水平符号化ブロック周波数umaxから次式のように算出する。
Figure 0005325164
Here, m (m ≧ 1) is a constant and is set in advance. In this embodiment, m is 5. Median () indicates a function that outputs an intermediate value of the input set. At this time, the range of u is from m to Wm-1, but generally the amplitude value of the low frequency component is extremely high, and there is a case where the peak of amplitude due to block noise cannot be extracted appropriately. Therefore, the threshold value T may be set in advance, and the range of u may be changed from T to Wm-1. Let u be the horizontal coding block frequency umax where Dw (u) is maximized. The horizontal coding block size Cw is calculated from the horizontal coding block frequency umax as follows.

Figure 0005325164
Dw(umax)の値が極端に小さい場合、ブロックノイズが発生しておらず、符号化ブロックの周波数を適切に抽出できていない可能性がある。そのため、閾値を設定し、Dw(umax)がその閾値以下のときは、ブロックノイズが発生していないとし、符号化ブロックサイズ及び符号化ブロック位置を出力せずに、ブロックノイズが発生していないという情報を出力する。本実施形態は、映像品質の定量化や改善のための技術であり、映像品質に影響を与える主要因であるブロックノイズを定量化又は低減させるための情報として。符号化ブロックサイズ及び符号化ブロック位置を推定している。従って、映像品質の定量化においては、ブロックノイズが発生していない場合は、ブロックノイズ量を下限値に設定するなどの処理を行えばよい。また、ブロックノイズ除去フィルタにおいても、ブロックノイズが発生していない映像に対しては、ブロックノイズを除去する必要がないため、フィルタを適用しないなどの処理を行えばよい。
Figure 0005325164
When the value of Dw (umax) is extremely small, there is a possibility that block noise is not generated and the frequency of the encoded block cannot be extracted properly. Therefore, when a threshold value is set and Dw (umax) is less than or equal to the threshold value, block noise is not generated, and no block noise is generated without outputting the encoded block size and encoded block position. Is output. This embodiment is a technique for quantifying and improving video quality, and as information for quantifying or reducing block noise, which is a main factor affecting video quality. The encoding block size and the encoding block position are estimated. Therefore, in the quantification of video quality, when block noise is not generated, processing such as setting the block noise amount to a lower limit value may be performed. Also in the block noise removal filter, since it is not necessary to remove block noise for an image in which block noise is not generated, processing such as not applying the filter may be performed.

垂直方向符号化ブロックサイズ抽出部113は、入力された垂直方向周波数情報から垂直方向符号化ブロックサイズを抽出し、符号化ブロック位置抽出部120に入力する。垂直方向符号化ブロックサイズの抽出方法を詳述する。   The vertical direction encoded block size extracting unit 113 extracts the vertical direction encoded block size from the input vertical direction frequency information, and inputs the extracted vertical direction encoded block size to the encoded block position extracting unit 120. A method for extracting the vertical encoded block size will be described in detail.

垂直方向周波数情報Fh(v)から、次式のようにDh(v)を算出する。   From the vertical frequency information Fh (v), Dh (v) is calculated as in the following equation.

Figure 0005325164
或いは、次式のようにDh(v)を算出してもよい。
Figure 0005325164
Alternatively, Dh (v) may be calculated as in the following equation.

Figure 0005325164
このとき、vの範囲は、mからH-m-1になるが、一般に低周波数成分の振幅値が極端に高くなっており、適切にブロックノイズによる振幅のピークを抽出できない場合がある。そのため、予め閾値Tを設定し、vの範囲をTからH-m-1にしてもよい。Dh(v)が最大になるvを垂直符号化ブロック周波数vmaxとする。垂直符号化ブロックサイズChは垂直符号化ブロック周波数vmaxから次式のように算出する。
Figure 0005325164
At this time, the range of v is from m to Hm-1, but generally the amplitude value of the low frequency component is extremely high, and there is a case where the peak of amplitude due to block noise cannot be extracted appropriately. Therefore, the threshold value T may be set in advance, and the range of v may be changed from T to Hm-1. Let v at which Dh (v) is maximized be the vertical coding block frequency vmax. The vertical coding block size Ch is calculated from the vertical coding block frequency vmax as follows.

Figure 0005325164
Dh(vmax)の値が極端に小さい場合、ブロックノイズが発生しておらず、符号化ブロックの周波数を適切に抽出できていない可能性がある。そのため、閾値を設定し、Dh(vmax)がその閾値以下のときは、ブロックノイズが発生していないとし、符号化ブロックサイズ及び符号化ブロック位置を出力せずに、ブロックノイズが発生していないという情報を出力する。本実施形態は、映像品質の定量化や改善のための技術であり、映像品質に影響を与える主要因であるブロックノイズを定量化又は低減させるための情報として。符号化ブロックサイズ及び符号化ブロック位置を推定している。従って、映像品質の定量化においては、ブロックノイズが発生していない場合は、ブロックノイズ量を下限値に設定するなどの処理を行えばよい。また、ブロックノイズ除去フィルタにおいても、ブロックノイズが発生していない映像に対しては、ブロックノイズを除去する必要がないため、フィルタを適用しないなどの処理を行えばよい。
Figure 0005325164
When the value of Dh (vmax) is extremely small, there is a possibility that block noise is not generated and the frequency of the coding block cannot be extracted appropriately. Therefore, when a threshold is set and Dh (vmax) is less than or equal to the threshold, no block noise is generated, and no block noise is generated without outputting the encoded block size and encoded block position. Is output. This embodiment is a technique for quantifying and improving video quality, and as information for quantifying or reducing block noise, which is a main factor affecting video quality. The encoding block size and the encoding block position are estimated. Therefore, in the quantification of video quality, when block noise is not generated, processing such as setting the block noise amount to a lower limit value may be performed. Also in the block noise removal filter, since it is not necessary to remove block noise for an image in which block noise is not generated, processing such as not applying the filter may be performed.

符号化ブロック位置抽出部120は、入力されたエッジ映像信号と水平方向符号化ブロックサイズと垂直方向符号化ブロックサイズから符号化ブロック位置を抽出する。符号化ブロック位置の抽出方法を詳述する。   The encoded block position extraction unit 120 extracts an encoded block position from the input edge video signal, the horizontal direction encoded block size, and the vertical direction encoded block size. A method for extracting a coding block position will be described in detail.

まず、エッジ映像信号の各フレーム内の任意の画素を暫定的に基準画素位置とする。図5に示すように、基準画素位置から垂直方向に水平方向符号化ブロックサイズChの倍数画素離れた水平線群及び基準画素位置から水平方向に垂直方向符号化ブロックサイズCwの倍数画素離れた垂直線群を符号化ブロック境界線とする。基準画素位置を水平方向及び垂直方向に並行移動したときに、エッジ映像信号にブロックノイズ抽出フィルタを適用して得られるブロックノイズ量が最大になる基準画素位置を符号化ブロック位置とする。本実施形態では、ブロックノイズ抽出フィルタとして、非特許文献1に記載のものを用いる。ブロックノイズ抽出フィルタとしては、非特許文献2や非特許文献3に記載のものなどを用いてもよい。   First, an arbitrary pixel in each frame of the edge video signal is temporarily set as a reference pixel position. As shown in FIG. 5, a horizontal line group vertically separated from the reference pixel position by a multiple of the horizontal encoded block size Ch and a vertical line separated from the reference pixel position by a multiple of the vertical encoded block size Cw in the horizontal direction. Let the group be the encoding block boundary. When the reference pixel position is moved in parallel in the horizontal direction and the vertical direction, the reference pixel position at which the block noise amount obtained by applying the block noise extraction filter to the edge video signal is maximized is set as the encoding block position. In this embodiment, the block noise extraction filter described in Non-Patent Document 1 is used. As the block noise extraction filter, those described in Non-Patent Document 2 and Non-Patent Document 3 may be used.

<実施形態:符号化ブロックサイズ及び位置推定方法の説明>
次に、本発明の実施形態に係る符号化ブロックサイズ及び位置推定方法について説明する。図6は、本発明の実施形態に係る符号化ブロックサイズ及び位置推定方法のフローチャートである。
<Embodiment: Description of Coding Block Size and Position Estimation Method>
Next, a coding block size and position estimation method according to the embodiment of the present invention will be described. FIG. 6 is a flowchart of a coding block size and position estimation method according to an embodiment of the present invention.

ステップS10において、エッジ抽出部100は、映像信号をキャプチャし、キャプチャした映像信号から、エッジ映像信号を抽出し、周波数抽出部111及び符号化ブロック位置抽出部120に入力する。   In step S10, the edge extraction unit 100 captures the video signal, extracts the edge video signal from the captured video signal, and inputs the edge video signal to the frequency extraction unit 111 and the encoded block position extraction unit 120.

ステップS11において、周波数抽出部111は、入力されたエッジ映像信号から水平方向周波数情報及び垂直方向周波数情報を抽出し、それぞれ水平方向符号化ブロックサイズ抽出部112及び垂直方向符号化ブロックサイズ抽出部113に入力する。   In step S11, the frequency extraction unit 111 extracts the horizontal direction frequency information and the vertical direction frequency information from the input edge video signal, and the horizontal direction encoding block size extraction unit 112 and the vertical direction encoding block size extraction unit 113, respectively. To enter.

ステップS12において、水平方向符号化ブロックサイズ抽出部112は、入力された水平方向周波数情報から水平方向符号化ブロックサイズを抽出し、符号化ブロック位置抽出部120に入力する。   In step S <b> 12, the horizontal direction encoded block size extracting unit 112 extracts the horizontal direction encoded block size from the input horizontal direction frequency information and inputs the extracted horizontal direction encoded block size to the encoded block position extracting unit 120.

ステップS13において、垂直方向符号化ブロックサイズ抽出部113は、入力された垂直方向周波数情報から垂直方向符号化ブロックサイズを抽出し、符号化ブロック位置抽出部120に入力する。   In step S <b> 13, the vertical coding block size extraction unit 113 extracts the vertical coding block size from the input vertical frequency information, and inputs the vertical coding block size to the coding block position extraction unit 120.

ステップS14において、符号化ブロック位置抽出部120は、入力されたエッジ映像信号と水平方向周波数情報と垂直方向周波数情報から符号化ブロック位置を抽出する。   In step S14, the coding block position extraction unit 120 extracts a coding block position from the input edge video signal, horizontal frequency information, and vertical frequency information.

従って、最終的な出力として、水平方向符号化ブロックサイズ抽出部112より、水平方向符号化ブロックサイズ、垂直方向符号化ブロックサイズ抽出部113より、垂直方向符号化ブロックサイズ、符号化ブロック位置抽出部120より、符号化ブロック位置を得ることができる。最終的な出力は、上記の3つの情報以外にも、水平方向符号化ブロックサイズ、垂直方向ブロックサイズ及び符号化ブロック位置から、符号化ブロックの境界線の全ての画素位置情報に変換したものでもよい。   Therefore, as the final output, from the horizontal direction encoding block size extraction unit 112, the horizontal direction encoding block size, from the vertical direction encoding block size extraction unit 113, from the vertical direction encoding block size, the encoding block position extraction unit From 120, the encoded block position can be obtained. In addition to the above three pieces of information, the final output may be converted from the horizontal encoding block size, the vertical block size, and the encoding block position to all pixel position information on the boundary line of the encoding block. Good.

<実施形態の効果>
以上のように、本発明の実施形態によれば、映像信号のフォーマット変換やパケット損失劣化などによる映像信号の空間的ずれが生じて符号化ブロックサイズが未知の場合においても、符号化ブロックサイズ及び符号化ブロック位置を把握することが可能になる。
<Effect of embodiment>
As described above, according to the embodiment of the present invention, even when the coding block size is unknown due to a spatial shift of the video signal due to the format conversion of the video signal or packet loss degradation, the coding block size and It becomes possible to grasp the encoding block position.

これより、映像信号のフォーマット変換やパケット損失劣化などによる映像信号の空間的ずれが発生している映像に対しても、適切にユーザ体感品質を推定することができる。したがって、IPTVサービスなどのメディア信号を用いたサービスに対して、ユーザ体感品質に即した品質設計や品質管理を実施することにより、高品質なサービスが提供でき、サービスの市場価値の向上が望める。   As a result, the user experience quality can be appropriately estimated even for a video in which a spatial shift of the video signal occurs due to the format conversion of the video signal or the packet loss degradation. Therefore, it is possible to provide high-quality services and improve the market value of services by implementing quality design and quality management in accordance with user experience quality for services using media signals such as IPTV services.

上記のように、本発明は、映像信号のフォーマット変換やパケット損失劣化などによる映像信号の空間的ずれが発生している映像に対して適用できるため、符号化サイズ及び符号化ブロック位置を考慮してブロックノイズ除去フィルタを適用することができ、映像信号のブロックノイズを低減させることができる。   As described above, the present invention can be applied to a video in which a spatial shift of the video signal due to video signal format conversion or packet loss degradation occurs, so the coding size and the coding block position are considered. Thus, a block noise removal filter can be applied, and block noise of the video signal can be reduced.

したがって、モニタに出力されるメディア信号を品質よく表示させることにより、ユーザの顧客満足度を高めることができ、サービスや商品の市場価値が向上する。   Therefore, by displaying the media signal output to the monitor with high quality, the user satisfaction of the user can be increased, and the market value of the service and the product is improved.

説明の便宜上、本発明の実施形態に係る符号化ブロックサイズ及び位置推定装置は機能的なブロック図を用いて説明しているが、本発明の符号化ブロックサイズ及び位置推定装置は、ハードウェア、ソフトウェア又はそれらの組み合わせで実現されてもよい。例えば、符号化ブロックサイズ及び位置推定装置の各機能部がソフトウェアで実現され、コンピュータ内に実現されてもよい。また、実施形態の各構成要素が必要に応じて組み合わせて使用されてもよい。   For convenience of explanation, the coding block size and position estimation apparatus according to the embodiment of the present invention is described using a functional block diagram, but the coding block size and position estimation apparatus of the present invention is hardware, It may be realized by software or a combination thereof. For example, each functional unit of the encoding block size and position estimation device may be realized by software and may be realized in a computer. Moreover, each component of the embodiment may be used in combination as necessary.

以上、本発明の実施形態について説明したが、本発明は、上記の実施形態に限定されることなく、特許請求の範囲内において、種々の変更・応用が可能である。   Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

本発明は、映像信号から得られる物理量からユーザ体感品質を推定する映像品質客観評価技術に適用することができる。また、本発明は、映像符号化により発生するブロックノイズを低減させるブロックノイズ除去フィルタ技術に適用することができる。   The present invention can be applied to a video quality objective evaluation technique for estimating a user experience quality from a physical quantity obtained from a video signal. Further, the present invention can be applied to a block noise removal filter technique that reduces block noise generated by video coding.

10 符号化ブロックサイズ及び位置推定装置
100 エッジ抽出部
110 符号化ブロックサイズ抽出部
111 周波数抽出部
112 水平方向符号化ブロックサイズ抽出部
113 垂直方向符号化ブロックサイズ抽出部
120 符号化ブロック位置抽出部
DESCRIPTION OF SYMBOLS 10 Encoding block size and position estimation apparatus 100 Edge extraction part 110 Encoding block size extraction part 111 Frequency extraction part 112 Horizontal direction encoding block size extraction part 113 Vertical direction encoding block size extraction part 120 Encoding block position extraction part

Claims (5)

映像信号から、映像符号化の離散コサイン変換の処理単位である符号化ブロックの水平方向及び垂直方向のサイズを示す符号化ブロックサイズと、符号化ブロックの境界線の位置を示す符号化ブロック位置とを推定する装置における符号化ブロックサイズ及び位置推定方法であって、
エッジ抽出部が、前記映像信号のフレーム毎にエッジ抽出フィルタを適用し、前記映像信号からエッジ映像信号を抽出するエッジ抽出ステップと、
周波数抽出部が、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の水平方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の水平方向の周波数に対応する振幅値を示す水平方向の周波数情報を抽出し、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の垂直方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の垂直方向の周波数に対応する振幅値を示す垂直方向の周波数情報を抽出する周波数抽出ステップと、
水平方向符号化ブロックサイズ抽出部が、水平方向の周波数の振幅値の比較に基づいて水平方向の符号化ブロックサイズを抽出する水平方向符号化ブロックサイズ抽出ステップと、
垂直方向符号化ブロックサイズ抽出部が、垂直方向の周波数の振幅値の比較に基づいて垂直方向の符号化ブロックサイズ抽出する垂直方向符号化ブロックサイズ抽出ステップと、
符号化ブロック位置抽出部が、前記水平方向の符号化ブロックサイズと前記垂直方向の符号化ブロックサイズと前記エッジ映像信号とに基づいて符号化ブロック位置を抽出する符号化ブロック位置抽出ステップと、
を有する符号化ブロックサイズ及び位置推定方法。
From the video signal, a coding block size indicating the size in the horizontal direction and the vertical direction of the coding block, which is a processing unit of discrete cosine transform of video coding, and a coding block position indicating the position of the boundary line of the coding block; A coding block size and position estimation method in an apparatus for estimating
An edge extraction step in which an edge extraction unit applies an edge extraction filter to each frame of the video signal to extract an edge video signal from the video signal;
A frequency extraction unit applies a Fourier transform to each frame of the edge video signal, and arranges a one-dimensional array of amplitude values corresponding to the array number, where the horizontal frequency of the obtained edge video signal is an array number as a one-dimensional array, it averaged in every frame for each of the elements, to extract frequency information of the horizontal direction showing the amplitude value corresponding to the horizontal frequency of the edge image signal, Fourier for each frame of the edge image signal Applying the transformation, a one-dimensional array of amplitude values corresponding to the array number with the vertical frequency of the obtained edge video signal as the array number is averaged over all frames for each element of the array, A frequency extraction step of extracting vertical frequency information indicating an amplitude value corresponding to a vertical frequency of the edge video signal;
A horizontal encoding block size extraction unit, wherein the horizontal encoding block size extraction unit extracts a horizontal encoding block size based on a comparison of horizontal frequency amplitude values ;
Is vertical coding block size extracting unit, and the vertical direction coding block size extracting a vertical encoding block size based on a comparison of the amplitude value of the frequency in the vertical direction,
An encoding block position extraction unit that extracts an encoding block position based on the encoding block size in the horizontal direction, the encoding block size in the vertical direction, and the edge video signal;
A coding block size and position estimation method comprising:
前記水平方向符号化ブロックサイズ抽出ステップは、
ある配列番号の振幅値から当該配列番号の近隣の配列番号の振幅値の平均値又は中間値を減算した値を当該配列番号のピーク強度としたときに、前記水平方向の周波数情報の所定の配列番号の範囲の中で、ピーク強度が最大になる配列番号を示すピーク周波数を抽出し、水平方向の総画素数を前記ピーク周波数で割算することにより、前記水平方向の符号化ブロックサイズを抽出する、請求項に記載の符号化ブロックサイズ及び位置推定方法。
The horizontal encoding block size extraction step includes:
A predetermined array of frequency information in the horizontal direction when a value obtained by subtracting an average value or an intermediate value of amplitude values of adjacent array element numbers from an amplitude value of an array element number is the peak intensity of the array element number Within the range of numbers, extract the peak frequency indicating the array number that maximizes the peak intensity, and divide the total number of pixels in the horizontal direction by the peak frequency to extract the encoded block size in the horizontal direction. The encoding block size and position estimation method according to claim 1 .
前記垂直方向符号化ブロックサイズ抽出ステップは、
ある配列番号の振幅値から当該配列番号の近隣の配列番号の振幅値の平均値又は中間値を減算した値を当該配列番号のピーク強度としたときに、前記垂直方向の周波数情報の所定の配列番号の範囲の中で、ピーク強度が最大になる配列番号を示すピーク周波数を抽出し、垂直方向の総画素数を前記ピーク周波数で割算することにより、前記垂直方向の符号化ブロックサイズを抽出する、請求項又はに記載の符号化ブロックサイズ及び位置推定方法。
The vertical encoding block size extraction step includes:
A predetermined array of frequency information in the vertical direction when a value obtained by subtracting an average value or an intermediate value of amplitude values of adjacent array element numbers from an amplitude value of an array element number is the peak intensity of the array element number Within the range of numbers, extract the peak frequency indicating the array number that maximizes the peak intensity, and divide the total number of pixels in the vertical direction by the peak frequency to extract the encoded block size in the vertical direction The encoding block size and position estimation method according to claim 1 or 2 .
前記符号化ブロック位置抽出ステップは、
前記エッジ映像信号のフレーム内のある画素位置を基準画素位置とし、前記基準画素位置から水平方向に前記水平方向の符号化ブロックサイズの倍数の画素数離れている垂直線群と、前記基準画素位置から垂直方向に前記垂直方向の符号化ブロックサイズの倍数の画素数離れている水平線群を符号化ブロック境界線としたときに、フレーム内の所定の範囲内で、前記エッジ映像信号にブロックノイズ量を抽出するブロックノイズ量抽出フィルタを適用して得られるブロックノイズ量が最大となる基準画素位置を抽出することにより、前記符号化ブロック位置を抽出する、請求項1乃至のうちいずれか1項に記載の符号化ブロックサイズ及び位置推定方法。
The encoded block position extracting step includes:
A vertical line group having a pixel position in a frame of the edge video signal as a reference pixel position, and a number of pixels that is a multiple of the encoded block size in the horizontal direction in the horizontal direction from the reference pixel position, and the reference pixel position When a horizontal line group that is a number of pixels that is a multiple of the encoded block size in the vertical direction from the vertical direction is defined as an encoded block boundary line, the amount of block noise in the edge video signal is within a predetermined range within the frame. by block noise amount obtained by applying the block noise amount extraction filter for extracting extracts the reference pixel position having the largest, it extracts the coded block position, any one of claims 1 to 3 The encoding block size and position estimation method described in 1.
映像信号から、映像符号化の離散コサイン変換の処理単位である符号化ブロックの水平方向及び垂直方向のサイズを示す符号化ブロックサイズと、符号化ブロックの境界線の位置を示す符号化ブロック位置とを推定するための装置を、
前記映像信号のフレーム毎にエッジ抽出フィルタを適用し、前記映像信号からエッジ映像信号を抽出するエッジ抽出手段、
前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の水平方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の水平方向の周波数に対応する振幅値を示す水平方向の周波数情報を抽出し、前記エッジ映像信号の各フレームに対しフーリエ変換を適用し、得られるエッジ映像信号の垂直方向の周波数を配列番号とした当該配列番号に対応する振幅値の1次元配列を、配列の要素毎に全てのフレームにおいて平均した1次元配列として、前記エッジ映像信号の垂直方向の周波数に対応する振幅値を示す垂直方向の周波数情報を抽出する周波数抽出手段、
水平方向の周波数の振幅値の比較に基づいて水平方向の符号化ブロックサイズを抽出する水平方向符号化ブロックサイズ抽出手段、
垂直方向の周波数の振幅値の比較に基づいて垂直方向の符号化ブロックサイズを抽出する垂直方向符号化ブロックサイズ抽出手段、及び
前記水平方向の符号化ブロックサイズと前記垂直方向の符号化ブロックサイズと前記エッジ映像信号とに基づいて符号化ブロック位置を抽出する符号化ブロック位置抽出手段、
として機能させるためのプログラム。
From the video signal, a coding block size indicating the size in the horizontal direction and the vertical direction of the coding block, which is a processing unit of discrete cosine transform of video coding, and a coding block position indicating the position of the boundary line of the coding block; A device for estimating
Applying an edge extraction filter for each frame of the video signal, and extracting an edge video signal from the video signal;
A Fourier transform is applied to each frame of the edge video signal, and a one-dimensional array of amplitude values corresponding to the array number with the horizontal frequency of the obtained edge video signal as the array number is assigned to each element of the array. as a one-dimensional array by averaging the frames of the extracted frequency information in the horizontal direction showing the amplitude value corresponding to the horizontal frequency of the edge image signal, applying a Fourier transform to each frame of the edge image signal, A one-dimensional array of amplitude values corresponding to the array number, where the vertical frequency of the obtained edge video signal is an array number, is set as a one-dimensional array that is averaged over all frames for each element of the array. A frequency extracting means for extracting vertical frequency information indicating an amplitude value corresponding to a vertical frequency;
Horizontal coding block size extracting means for extracting a horizontal encoding block size based on a comparison of the amplitude values of the horizontal frequency,
Vertical-direction encoded block size extraction means for extracting a vertical-direction encoded block size based on comparison of amplitude values of vertical frequency, and the horizontal-direction encoded block size and the vertical-direction encoded block size; Coding block position extracting means for extracting a coding block position based on the edge video signal;
Program to function as.
JP2010119798A 2010-05-25 2010-05-25 Coding block size and position estimation method and program Expired - Fee Related JP5325164B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010119798A JP5325164B2 (en) 2010-05-25 2010-05-25 Coding block size and position estimation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010119798A JP5325164B2 (en) 2010-05-25 2010-05-25 Coding block size and position estimation method and program

Publications (2)

Publication Number Publication Date
JP2011250038A JP2011250038A (en) 2011-12-08
JP5325164B2 true JP5325164B2 (en) 2013-10-23

Family

ID=45414773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010119798A Expired - Fee Related JP5325164B2 (en) 2010-05-25 2010-05-25 Coding block size and position estimation method and program

Country Status (1)

Country Link
JP (1) JP5325164B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0222562D0 (en) * 2002-09-28 2002-11-06 Koninkl Philips Electronics Nv Method and apparatus for encoding image and or audio data
JP4566803B2 (en) * 2005-04-13 2010-10-20 三菱電機株式会社 Spatial synchronization recovery method and apparatus for digital watermark detection for moving images
JP4749377B2 (en) * 2006-04-18 2011-08-17 パイオニア株式会社 Block noise removal device
JP2010004111A (en) * 2008-06-18 2010-01-07 Nec Electronics Corp Image processor, image processing method, and program

Also Published As

Publication number Publication date
JP2011250038A (en) 2011-12-08

Similar Documents

Publication Publication Date Title
KR101097673B1 (en) Noise detection and estimation techniques for picture enhancement
EP1865726A1 (en) A Method and Device for Measuring MPEG Noise Strength of Compressed Digital Image
Jakhetiya et al. A prediction backed model for quality assessment of screen content and 3-D synthesized images
JP2011182423A (en) Method for measuring multimedia video communication quality
Jaiswal et al. Exploitation of inter-color correlation for color image demosaicking
EP2664140B1 (en) Method and apparatus for removing image blocking artifact by using transformation coefficient
CN111127359A (en) Underwater image enhancement method based on selective compensation color and three-interval balance
US20130121419A1 (en) Temporal luminance variation detection and correction for hierarchical level frame rate converter
Ghadiyaram et al. A no-reference video quality predictor for compression and scaling artifacts
Sandić-Stanković et al. Fast blind quality assessment of DIBR-synthesized video based on high-high wavelet subband
Tandon et al. CAMBI: Contrast-aware multiscale banding index
JP4194029B2 (en) Automatic image degradation detection device
Chen et al. A universal reference-free blurriness measure
JP5325164B2 (en) Coding block size and position estimation method and program
Sung et al. Color filter array demosaicking by using subband synthesis scheme
Okarma Video quality assessment using the combined full-reference approach
JP5292343B2 (en) Image quality objective evaluation apparatus, method and program
Amor et al. A quality evaluation model for calculating block and blur effects generated by H. 264 and MPEG2 codecs
Zhang et al. Joint denoising and demosaicking of noisy cfa images based on inter-color correlation
Bae et al. A new edge directed interpolation algorithm using accurate estimation of edge directional covariance
Klima et al. Image quality and QoE in multimedia systems
JP5234812B2 (en) Video quality estimation apparatus, method, and program
Hsia et al. High-efficiency TV video noise reduction through adaptive spatial–temporal frame filtering
Sadaka et al. Efficient perceptual attentive super-resolution
Tajima et al. Chromatic interpolation based on anisotropy-scale-mixture statistics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130719

R150 Certificate of patent or registration of utility model

Ref document number: 5325164

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees