JP4590975B2 - Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program - Google Patents
Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program Download PDFInfo
- Publication number
- JP4590975B2 JP4590975B2 JP2004233360A JP2004233360A JP4590975B2 JP 4590975 B2 JP4590975 B2 JP 4590975B2 JP 2004233360 A JP2004233360 A JP 2004233360A JP 2004233360 A JP2004233360 A JP 2004233360A JP 4590975 B2 JP4590975 B2 JP 4590975B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- thinning
- movement amount
- moving image
- movement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラムに関する。特に、動画像の圧縮および伸張処理を実行する構成において、人間の視覚特性を利用した適切な圧縮、伸張を行なうことにより、効率的なデータ量の削減を実現し、画質劣化を最小限に抑え、高品質な画像復元を実現可能とした動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラムに関する。 The present invention relates to a moving image conversion apparatus, a moving image restoration apparatus and method, and a computer program. In particular, in a configuration that performs compression and decompression processing of moving images, by appropriately compressing and decompressing using human visual characteristics, it is possible to efficiently reduce the amount of data and minimize image quality degradation. The present invention relates to a moving picture conversion apparatus, a moving picture restoration apparatus and method, and a computer program that can realize high-quality image restoration.
動画像データは、フラッシュメモリ、ハードディスク、DVDなどの記憶媒体への保存、あるいはネットワークを介した配信などにおいて、データ量を削減するためのデータ変換、すなわち圧縮処理が行なわれる。特に、近年、動画像データの高品質化、例えばHD(High Difinition)データなど、データ品質の改善が進んでおり、このデータの高品質化に伴ってデータ量が急激に増大している。このような状況において、動画像データの圧縮、復元処理における圧縮効率の改善や、復元データの品質劣化防止に関する技術について多くの検討、研究がなされている。 The moving image data is subjected to data conversion, that is, compression processing for reducing the amount of data when stored in a storage medium such as a flash memory, a hard disk, or a DVD, or distributed via a network. In particular, in recent years, the quality of moving image data has been improved, for example, HD (High Definition) data has been improved, and the amount of data has increased rapidly with the improvement of the quality of this data. Under such circumstances, many studies and studies have been made on techniques for improving the compression efficiency in the compression and decompression processing of moving image data and preventing the quality degradation of the decompressed data.
動画像のデータ量の圧縮方法としては、MPEGなどのインターフレーム符号化とイントラフレーム符号化を組み合わせた動画像符号化が代表的である。ところで、MPEGによる動画像符号化の符号化効率を向上するために、動画像に対して前処理を行う手法が数多く提案されている。 A typical method for compressing the data amount of moving images is moving image encoding that combines inter-frame encoding such as MPEG and intra-frame encoding. By the way, in order to improve the coding efficiency of moving picture coding by MPEG, many techniques for pre-processing moving pictures have been proposed.
例えば、特許文献1は、順次走査方式の動画像の画素を半数に間引くことにより飛び越し走査方式の動画像へと変換した後に圧縮することで、画質の劣化を抑えつつ符号化効率の向上を可能とした構成を開示している。また、特許文献2は、前処理としてローパスフィルタを画像に適用することで、符号化後のブロック歪みの発生を抑制した構成を開示している。
For example,
しかし、これらの従来技術に開示されたデータ圧縮方法においては、以下のような問題がある。
(1)特許文献1(特開2000−32470)に開示された方式では、前処理終了時点でデータ量を半分にすることが可能で最終的な符号化効率の大幅な向上が期待できるが、動画の局所的な特性、すなわち、動きのある領域と無い領域の特徴を利用せずに一様な間引きを行っているため、画像全体に対して均一な劣化を生じさせてしまう。
(2)特許文献2(特開2001−352546)の方式は、特に低ビットレートで符号化した場合に発生するブロック歪みの抑制を意図したものであり、高ビットレートの符号化時にこの手法を適用することで符号化効率の向上や画質の劣化の抑制が可能であるとは限らない。
(1) In the method disclosed in Patent Document 1 (Japanese Patent Laid-Open No. 2000-32470), the amount of data can be halved at the end of preprocessing, and a significant improvement in final coding efficiency can be expected. Since uniform thinning is performed without using the local characteristics of the moving image, that is, the features of the moving area and the non-moving area, the entire image is deteriorated uniformly.
(2) The method of Patent Document 2 (Japanese Patent Laid-Open No. 2001-352546) is intended to suppress block distortion that occurs particularly when encoding is performed at a low bit rate, and this method is used when encoding at a high bit rate. By applying this, it is not always possible to improve the encoding efficiency and suppress the deterioration of the image quality.
上述のように、いくつかの従来技術において、画像の劣化を抑えつつ符号化効率の向上を図る構成が開示されているが、これまでに開示されている圧縮方法では、圧縮画像データを復元し、再生した場合の画質劣化を十分に抑えるには至っていない。 As described above, some conventional techniques disclose configurations that improve the encoding efficiency while suppressing image degradation. However, the compression methods disclosed so far restore compressed image data. However, image quality deterioration when reproduced is not sufficiently suppressed.
本発明は、上記の問題に鑑みてなされたものであり、人間の視覚特性を利用した適切な圧縮、伸張を行なうことにより、効率的なデータ量の削減を実現し、画質劣化を最小限に抑え、高品質な画像復元を実現可能とした動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and by performing appropriate compression and decompression utilizing human visual characteristics, it is possible to efficiently reduce the amount of data and minimize image quality degradation. It is an object of the present invention to provide a moving image conversion apparatus, a moving image restoration apparatus and method, and a computer program that can suppress and realize high-quality image restoration.
本発明の第1の側面は、
動画像データのデータ変換処理を実行する動画像変換装置であり、
動画像データを構成するフレーム毎にブロック分割処理を実行するブロック分割部と、
前記ブロック分割部において分割された各ブロックにおける被写体移動量を検出する移動量検出部と、
前記ブロック分割部の分割したブロックデータと、前記移動量検出部の検出した移動量情報とを入力し、ブロックデータの間引き処理を実行するブロック処理部とを有し、
前記ブロック処理部は、
間引き処理対象のブロックが、前記移動量検出部の検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較し、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更し、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行し、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成であり、
前記ブロック処理部は、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成であり、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なう構成であることを特徴とする動画像変換装置にある。
The first aspect of the present invention is:
A moving image conversion apparatus that executes data conversion processing of moving image data,
A block division unit that executes block division processing for each frame constituting the moving image data;
A movement amount detection unit for detecting a subject movement amount in each block divided by the block division unit;
A block processing unit that inputs the block data divided by the block dividing unit and the movement amount information detected by the movement amount detection unit, and executes block data thinning processing;
The block processing unit
The block to be thinned out is compared with the movement amount detected by the movement amount detection unit and the first threshold value and the second threshold value that are defined in advance to determine the processing mode.
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And change the thinning mode to be executed according to whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the amount of movement is medium, execute a space thinning process and a time direction thinning process,
In the time direction thinning process when the movement amount is medium, the thinning process is performed by changing the thinning target frame based on the movement amount information.
The block processing unit
In the execution of the time direction thinning process, the thinning process is performed by changing the thinning target frame based on the movement amount information.
Formula defining the pre-defined super-resolution effect generation condition , that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. The moving image conversion apparatus is characterized in that the thinning process is performed.
さらに、本発明の動画像変換装置の一実施態様において、前記ブロック処理部は、前記移動量が第1閾値未満の前記移動量が中または小の場合に実行する時間方向間引き処理の実行において、前記超解像効果発生条件を満足する移動量と間引き態様との対応関係に従って設定した間引き態様変更点となる移動量閾値であり、前記第1閾値未満の閾値である第3閾値と前記移動量情報との比較を実行し、前記移動量情報が前記第3閾値以上である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値未満である場合に比較して少なく設定し、前記移動量情報が前記第3閾値未満である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値以上である場合に比較して多く設定した時間軸方向の間引き処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the moving image conversion apparatus of the present invention, the block processing unit performs the time-direction thinning process that is executed when the movement amount whose movement amount is less than a first threshold is medium or small . A third threshold that is a movement amount threshold that is a thinning mode change point set according to a correspondence relationship between a movement amount that satisfies the super-resolution effect generation condition and a thinning mode, and a third threshold that is a threshold value less than the first threshold and the movement amount When the movement amount information is equal to or greater than the third threshold value , the thinning target frames that are continuous on the time axis are compared with the case where the movement amount information is less than the third threshold value. When the movement amount information is less than the third threshold value , the number of thinning target frames continuous on the time axis is set larger than when the movement amount information is greater than or equal to the third threshold value. Axial Characterized in that it is configured to perform a decimation process.
さらに、本発明の動画像変換装置の一実施態様において、前記ブロック処理部は、圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する構成である場合、前記移動量情報が前記第3閾値以上である場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、前記移動量情報が前記第3閾値未満である場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the moving image conversion apparatus of the present invention, when the block processing unit is configured to execute a temporal direction thinning process with a compression rate of 1/2 in units of four consecutive frames, the movement amount information Is equal to or greater than the third threshold value , the first frame and the third frame are left, the second and fourth frames are thinned out, and a time-axis direction thinning process is performed . If it is less than the threshold value , the first frame and the fourth frame are left, and the thinning process in the time axis direction for thinning out the second and third frames is performed.
さらに、本発明の第2の側面は、
時間方向の間引き処理データを含む動画像変換データの復元処理を実行する動画像復元装置であり、
時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間部を有し、
前記ブロック補間部は、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であり、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間部は、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なう構成であることを特徴とする動画像復元装置にある。
Furthermore, the second aspect of the present invention provides
A moving image restoration device that executes restoration processing of moving image conversion data including thinning processing data in the time direction,
Block interpolation that inputs moving image conversion data that has been thinned in the time direction in units of blocks, calculates pixel values of multiple blocks corresponding to frames in different time axis directions, and generates a restored block of multiple frames Part
The block interpolation unit
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames And moving image data restoration,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
The block interpolation unit
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. A moving image restoration apparatus is characterized in that moving image data restoration is performed by selecting so that movement between frames is closer in time.
さらに、本発明の動画像復元装置の一実施態様において、前記ブロック補間部は、移動を伴う補間が実行されたブロックについてフィルタ処理による帯域制限処理を実行する構成を有することを特徴とする。 Furthermore, in one embodiment of the moving image restoration apparatus of the present invention, the block interpolation unit has a configuration in which a band limiting process by a filter process is performed on a block on which an interpolation with a movement is performed.
さらに、本発明の動画像復元装置の一実施態様において、前記動画像復元装置は、復元対象ブロックの移動量に基づいて、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、前記ブロック補間部は、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする。 Furthermore, in an embodiment of the moving image restoration apparatus of the present invention, the moving image restoration device determines whether or not the block is data that has been thinned out in the time direction based on the movement amount of the restoration target block. The block interpolating unit moves the restoration block by the amount of movement between the frames according to the movement amount information for the block that has been thinned out in the time direction selected based on the determination, thereby restoring moving image data. It is the structure to perform.
さらに、本発明の動画像復元装置の一実施態様において、前記動画像復元装置は、時間方向の間引きがなされたデータであるか否かを示すフラグに基づいて、復元対象ブロックが時間方向の間引きがなされたデータであるか否かを判定し、前記ブロック補間部は、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする> Furthermore, in one embodiment of the moving image restoration apparatus of the present invention, the moving image restoration apparatus is configured to reduce the block to be restored in the time direction based on a flag indicating whether or not the data has been thinned in the time direction. The block interpolation unit reconstructs the block that has been thinned in the time direction selected based on the determination by the amount of movement between frames according to the amount of movement information. The feature is that the moving image data is restored by moving the block>
さらに、本発明の動画像復元装置の一実施態様において、前記動画像復元装置は、移動量検出部を有し、該移動量検出部の検出した移動量に従って、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、前記ブロック補間部は、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、前記移動量に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする。 Furthermore, in an embodiment of the moving image restoration apparatus of the present invention, the moving image restoration device has a movement amount detection unit, and the block is thinned out in the time direction according to the movement amount detected by the movement amount detection unit. The block interpolation unit determines whether or not the data is a restored block by the amount of movement between frames according to the amount of movement of the block that has been thinned in the time direction selected based on the determination. The moving image data is restored by moving the image data.
さらに、本発明の動画像復元装置の一実施態様において、前記移動量検出部は、異なるフレームの対応ブロックに基づく動きベクトルを検出する処理を実行し、前記ブロック補間部は、前記動きベクトルに基づいて、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする。 Furthermore, in an embodiment of the moving image restoration apparatus of the present invention, the movement amount detection unit performs a process of detecting a motion vector based on a corresponding block of a different frame, and the block interpolation unit is based on the motion vector. Thus, the moving image data is restored by moving the restoration block by the amount of movement between frames.
さらに、本発明の第3の側面は、
動画像データのデータ変換処理を実行する動画像変換方法であり、
動画像データを構成するフレーム毎にブロック分割処理を実行するブロック分割ステップと、
前記ブロック分割ステップにおいて分割された各ブロックにおける被写体移動量を検出する移動量検出ステップと、
前記ブロック分割ステップにおいて分割したブロックデータと、前記移動量検出ステップにおいて検出した移動量情報とを入力し、ブロックデータの間引き処理を実行するブロック処理ステップとを有し、
前記ブロック処理ステップは、
間引き処理対象のブロックが、前記移動量検出ステップにおいて検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較し、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更し、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行し、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行ない、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更した間引き処理として、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なうことを特徴とする動画像変換方法にある。
Furthermore, the third aspect of the present invention provides
A moving image conversion method for executing data conversion processing of moving image data,
A block division step for executing a block division process for each frame constituting the moving image data;
A movement amount detection step of detecting a subject movement amount in each block divided in the block division step;
A block processing step for inputting the block data divided in the block division step and the movement amount information detected in the movement amount detection step, and executing a block data thinning process;
The block processing step includes:
Compare the movement amount detected in the movement amount detection step with the first threshold value and the second threshold value defined in advance for determining the processing mode, as the block to be thinned out,
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And change the thinning mode to be executed according to whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the amount of movement is medium, execute a space thinning process and a time direction thinning process,
In the time direction decimation process when the movement amount is medium, the decimation process is performed by changing the decimation target frame based on the movement amount information,
In the execution of the time direction thinning process, as a thinning process in which the thinning target frame is changed based on the movement amount information,
Formula defining the pre-defined super-resolution effect generation condition, that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. The moving image conversion method is characterized by performing a thinning process.
さらに、本発明の動画像変換方法の一実施態様において、前記ブロック処理ステップは、前記移動量が第1閾値未満の前記移動量が中または小の場合に実行する時間方向間引き処理の実行において、前記超解像効果発生条件を満足する移動量と間引き態様との対応関係に従って設定した間引き態様変更点となる移動量閾値であり、前記第1閾値未満の閾値である第3閾値と前記移動量情報との比較を実行し、前記移動量情報が前記第3閾値以上である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値未満である場合に比較して少なく設定し、前記移動量情報が前記第3閾値未満である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値値以上である場合に比較して多く設定した時間軸方向の間引き処理を実行することを特徴とする。 Furthermore, in one embodiment of the moving image conversion method of the present invention, the block processing step includes performing a time direction thinning process that is executed when the movement amount is less than or equal to a first threshold and the movement amount is medium or small . A third threshold that is a movement amount threshold that is a thinning mode change point set according to a correspondence relationship between a movement amount that satisfies the super-resolution effect generation condition and a thinning mode, and a third threshold that is a threshold value less than the first threshold and the movement amount When the movement amount information is equal to or greater than the third threshold value , the thinning target frames that are continuous on the time axis are compared with the case where the movement amount information is less than the third threshold value. less set, in case the moving amount information is less than the third threshold, the thinning-out object consecutive frames in the time axis, the movement amount information is set larger as compared with the case where the third threshold value or more values And executes thinning processing between axis.
さらに、本発明の動画像変換方法の一実施態様において、前記ブロック処理ステップは、圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する場合、前記移動量情報が前記第3閾値以上である場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、前記移動量情報が前記第3閾値未満である場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行することを特徴とする。 Furthermore, in an embodiment of the moving image conversion method of the present invention, in the block processing step, when the time direction thinning process with a compression rate of 1/2 is executed in units of four consecutive frames, the movement amount information is the first value . If it is 3 thresholds or more, the first frame and the third frame are left, the time axis direction thinning process is performed to thin out the second and fourth frames, and the movement amount information is less than the third threshold . In some cases, the first frame and the fourth frame are left and the thinning process in the time axis direction is performed to thin out the second and third frames.
さらに、本発明の第4の側面は、
時間方向の間引き処理データを含む動画像変換データの復元処理を実行する動画像復元方法であり、
時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間ステップを有し、
前記ブロック補間ステップは、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうステップであり、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間ステップは、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なうステップであることを特徴とする動画像復元方法にある。
Furthermore, the fourth aspect of the present invention provides
A moving image restoration method for executing restoration processing of moving image conversion data including thinning processing data in the time direction,
Block interpolation that inputs moving image conversion data that has been thinned in the time direction in units of blocks, calculates pixel values of multiple blocks corresponding to frames in different time axis directions, and generates a restored block of multiple frames Has steps,
The block interpolation step includes:
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames And restoring the moving image data,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
The block interpolation step includes:
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. In the moving image restoration method, the moving image data restoration is performed by selecting the movement between frames closer to each other in time.
さらに、本発明の動画像復元方法の一実施態様において、前記ブロック補間ステップは、移動を伴う補間が実行されたブロックについてフィルタ処理による帯域制限処理を実行するステップを有することを特徴とする。 Furthermore, in an embodiment of the moving image restoration method of the present invention, the block interpolation step includes a step of executing a band limiting process by a filter process for a block on which an interpolation with a movement has been executed.
さらに、本発明の動画像復元方法の一実施態様において、前記動画像復元方法は、さらに、復元対象ブロックの移動量に基づいて、該ブロックが時間方向の間引きがなされたデータであるか否かを判定するステップを有し、前記ブロック補間ステップは、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする。 Furthermore, in an embodiment of the moving image restoration method of the present invention, the moving image restoration method further determines whether or not the block is data that has been thinned out in the time direction based on the movement amount of the restoration target block. The block interpolation step moves the restoration block by the amount of movement between frames according to the amount of movement information for the block that has been thinned out in the time direction selected based on the determination. , Moving image data restoration is performed.
さらに、本発明の動画像復元方法の一実施態様において、前記動画像復元方法は、さらに、時間方向の間引きがなされたデータであるか否かを示すフラグに基づいて、復元対象ブロックが時間方向の間引きがなされたデータであるか否かを判定するステップを有し、前記ブロック補間ステップは、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする。 Furthermore, in an embodiment of the moving image restoration method of the present invention, the moving image restoration method further includes: the restoration target block is set in the time direction based on a flag indicating whether or not the data is thinned out in the time direction. Determining whether or not the data has been thinned out, and the block interpolation step is performed between the frames according to the movement amount information for the block that has been thinned in the time direction selected based on the determination. The moving image data is restored by moving the restoration block by the movement amount .
さらに、本発明の動画像復元方法の一実施態様において、前記動画像復元方法は、さらに、移動量検出ステップを有し、該移動量検出ステップにおいて検出した移動量に従って、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、前記ブロック補間ステップは、前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、前記移動量に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする。 Furthermore, in one embodiment of the moving image restoration method of the present invention, the moving image restoration method further includes a movement amount detection step, and the block is moved in the time direction according to the movement amount detected in the movement amount detection step. it is determined whether the thinning is made data, the block interpolation step, for a block in which the thinning of the selected time direction based on the determination has been made, only the amount of movement between frames in accordance with the moving amount Moving image data is restored by moving the restoration block.
さらに、本発明の動画像復元方法の一実施態様において、前記移動量検出ステップは、異なるフレームの対応ブロックに基づく動きベクトルを検出する処理を実行するステップであり、前記ブロック補間ステップは、前記動きベクトルに基づいて、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする。 Furthermore, in one embodiment of the moving image restoration method of the present invention, the movement amount detecting step is a step of executing a process of detecting a motion vector based on a corresponding block of a different frame, and the block interpolation step is the motion interpolation step. Based on the vector, moving image data is restored by moving the restoration block by the movement amount between frames.
さらに、本発明の第5の側面は、
動画像変換装置において、動画像データのデータ変換処理を実行させるコンピュータ・プログラムであり、前記データ変換処理は、
ブロック分割部に、動画像データを構成するフレーム毎にブロック分割処理を実行させるブロック分割ステップと、
移動量検出部に、前記ブロック分割ステップにおいて分割された各ブロックにおける被写体移動量を検出させる移動量検出ステップと、
ブロック処理部に、前記ブロック分割ステップにおいて分割したブロックデータと、前記移動量検出ステップにおいて検出した移動量情報とを入力し、ブロックデータの間引き処理を実行させるブロック処理ステップとを前記動画像変換装置に実行させ、
前記ブロック処理ステップにおいては、
間引き処理対象のブロックが、前記移動量検出ステップにおいて検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較させ、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更させ、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行させ、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なわせ、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更した間引き処理として、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なわせることを特徴とするコンピュータ・プログラムにある。
Furthermore, the fifth aspect of the present invention provides
In the moving image conversion device, a computer program for executing a data conversion process of moving image data, the data conversion process ,
A block dividing step for causing the block dividing unit to execute a block dividing process for each frame constituting the moving image data;
A movement amount detection step for causing a movement amount detection unit to detect a subject movement amount in each block divided in the block division step;
The block processor, the block data obtained by dividing in the block dividing step, the moving amount detecting inputs the movement amount information detected in step, the moving image conversion apparatus and a block processing step for executing the decimation process of the block data To run
In the block processing step ,
The block to be thinned out is compared with the movement amount detected in the movement amount detection step with the first threshold value and the second threshold value that are defined in advance to determine the processing mode,
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And changing the thinning mode to be executed depending on whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the movement amount is medium, the space thinning process and the time direction thinning process are executed,
In the time direction thinning process when the movement amount is medium, the thinning target frame is changed based on the movement amount information, and the thinning process is performed.
In the execution of the time direction thinning process, as a thinning process in which the thinning target frame is changed based on the movement amount information,
Formula defining the pre-defined super-resolution effect generation condition, that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. in a computer program, characterized in that to perform thinning processing Te.
さらに、本発明の第6の側面は、
動画像復元装置において、時間方向の間引き処理データを含む動画像変換データの復元処理を実行させるコンピュータ・プログラムであり、前記動画像データの復元処理は、
ブロック補間部に、時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成させるブロック補間ステップを前記動画像復元装置に実行させ、
前記ブロック補間ステップにおいては、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なわせ、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間ステップにおいては、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なわせることを特徴とするコンピュータ・プログラムにある。
Furthermore, the sixth aspect of the present invention provides
In the moving image restoration apparatus, the computer program for executing the restoration processing of the moving image conversion data including the thinning processing data in the time direction, the restoration processing of the moving image data,
The moving image conversion data that has been thinned out in the time direction is input to the block interpolator in units of blocks, and pixel values of a plurality of blocks corresponding to different frames in the time axis direction are calculated by interpolation processing, and a plurality of frames are restored. The moving image restoration apparatus executes a block interpolation step for generating
In the block interpolation step ,
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames Let the video data be restored ,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
In the block interpolation step ,
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. selected and so as to be more temporally move between near frames, in the computer program characterized by causing a moving image data reconstruction.
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能な汎用コンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記憶媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータ・システム上でプログラムに応じた処理が実現される。 The computer program of the present invention is, for example, a storage medium or communication medium provided in a computer-readable format to a general-purpose computer system capable of executing various program codes, such as a CD, FD, MO, etc. Or a computer program that can be provided by a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づく、より詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.
本発明の動画像変換装置および方法によれば、移動量に応じて、時間方向間引きの態様を変更することで超解像効果を持つデータを生成することが可能となり、データ量は削減されているにもかかわらず、復号化時の画像劣化を抑制した高品質なデータを生成することができる。 According to the moving image conversion apparatus and method of the present invention, it is possible to generate data having a super-resolution effect by changing the mode of thinning in the time direction according to the movement amount, and the data amount is reduced. Nevertheless, it is possible to generate high-quality data in which image degradation during decoding is suppressed.
本発明の動画像変換装置および方法によれば、動画像データを構成するフレーム毎にブロック分割を行い、各ブロックにおける被写体移動量を検出し、移動量に基づいて決定した態様の空間間引き処理または時間方向間引き処理の少なくともいずれかの間引き処理を実行する構成とし、時間方向間引き処理の実行においては、移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成としたので、移動量に応じた最適な時間方向間引き、すなわち超解像効果を持つデータを生成が可能となり、データ量は削減されているにもかかわらず、復号化時の画像劣化を抑制した高品質なデータを生成することができる。 According to the moving image conversion apparatus and method of the present invention, block division is performed for each frame constituting moving image data, a subject movement amount in each block is detected, and spatial thinning processing in a mode determined based on the movement amount or Since at least one of the time direction thinning-out processes is executed, and in the execution of the time direction thinning-out process, the thinning process is performed by changing the thinning target frame based on the movement amount information. It is possible to generate data with the optimal time-direction decimation, that is, the super-resolution effect, and generate high-quality data that suppresses image degradation during decoding, even though the amount of data is reduced can do.
さらに、本発明の動画像復元装置および方法によれば、時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間部において、補間処理対象のブロック対応の移動量情報を入力し、該移動量情報に従ってフレーム間で復元ブロックを移動させて、動画像データ復元を行なう構成としたので、超解像効果を持つ復元データの生成が可能となり、画像劣化を抑制した高品質な復号データを生成することができる。 Furthermore, according to the moving image restoration apparatus and method of the present invention, moving image conversion data that has been subjected to thinning processing in the time direction is input in units of blocks, and pixel values of a plurality of blocks corresponding to different frames in the time axis direction are interpolated. In the block interpolation unit that calculates by processing and generates a restoration block of a plurality of frames, the movement amount information corresponding to the block to be interpolated is input, and the restoration block is moved between frames according to the movement amount information. Since the restoration is configured, restoration data having a super-resolution effect can be generated, and high-quality decoded data in which image degradation is suppressed can be generated.
以下、図面を参照しながら、本発明の動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラムの構成について説明する。なお、説明は、以下の項目に従って行なう。
(1)超解像効果を利用した動画像変換装置の基本構成
(2)本発明に従った動画像圧縮処理を実行する装置および方法
(3)本発明に従った動画像伸張処理を実行する装置および方法
Hereinafter, the configuration of a moving image conversion apparatus, a moving image restoration apparatus and method, and a computer program according to the present invention will be described with reference to the drawings. The description will be made according to the following items.
(1) Basic configuration of moving image conversion apparatus using super-resolution effect (2) Apparatus and method for executing moving image compression processing according to the present invention (3) Executing moving image expansion processing according to the present invention Apparatus and method
[(1)超解像効果を利用した動画像変換装置の基本構成]
まず、本発明のベースとなる超解像効果を利用した動画像圧縮を実行する動画像変換装置の基本構成について説明する。なお、この基本構成は、本出願人が先に出願した特願2003−412501号に詳細を記載しているものであり、画像を小領域(ブロック)に分割し、各領域の移動速度に応じて画素数の間引きや、フレームレートの間引きを適応的に行うことでデータ量の圧縮を実現した構成である。
[(1) Basic configuration of moving image conversion apparatus using super-resolution effect]
First, a basic configuration of a moving image conversion apparatus that performs moving image compression using the super-resolution effect as a base of the present invention will be described. This basic configuration is described in detail in Japanese Patent Application No. 2003-412501 filed earlier by the present applicant, and the image is divided into small areas (blocks), and according to the moving speed of each area. Thus, the amount of data is compressed by adaptively performing the thinning of the number of pixels and the thinning of the frame rate.
図1に特願2003−412501号に記載した動画像変換装置10の構成例を示す。この動画像変換装置10は、超解像効果を利用した動画像変換処理を行うことにより、データ量の削減による画質劣化を観測者が知覚しないようにデータ量の削減を行うことができる構成としたものである。
FIG. 1 shows a configuration example of the moving
なお、超解像効果とは、観測者が、空間方向に離散的にサンプリングされた移動被写体を追従視する際に、表示画素数以上の解像度を知覚するという視覚的効果である。これは、人間は、ある時間内に呈示された複数の画像が加算されたものを知覚するという視覚特性を持つためである。この特性は、ブロックの法則として知られる視覚の時間的積分機能に起因しており、例えば、"視覚情報ハンドブック,日本視覚学会編,pp.219−220"などに記載されている。ブロックの法則が成り立つ積分時間は、背景光の強度などの呈示条件によって変化するが、およそ25ms乃至100msであるという報告がある。 Note that the super-resolution effect is a visual effect in which the observer perceives a resolution higher than the number of display pixels when following the moving subject discretely sampled in the spatial direction. This is because a human has a visual characteristic of perceiving an addition of a plurality of images presented within a certain time. This characteristic is attributed to a visual temporal integration function known as a block law, and is described in, for example, “Visual Information Handbook, Japanese Visual Society, pp. 219-220”. There is a report that the integration time for which the block law is established varies depending on the presentation conditions such as the intensity of the background light, but is approximately 25 ms to 100 ms.
図1に示す動画像変換装置10は、時間的積分機能によって引き起こされる超解像効果を利用した動画像変換処理を行うことにより、画質劣化を観測者が知覚しないようにデータを削減する圧縮を行う構成としたものである。図1の動画像変換装置10の構成について説明する。
The moving
ブロック分割部11は、入力された動画像の各フレームを、所定画素の区分領域としてのブロックに分割し移動量検出部12に供給する。移動量検出部12は、ブロック分割部11から供給された各ブロックについての移動量を検出し、ブロックとその移動量を、ブロック処理部13に送信する。ブロック処理部13は、移動量検出部12から供給されたブロックに対して、その移動量に応じた動画像変換処理、すなわち圧縮処理を施し、データ量を削減する。ブロック処理部13は、その処理の結果得られた、データ量が削減されたブロックについてのデータを、出力部14に供給する。出力部14は、ブロック処理部13から供給された、データ量が削減されたブロックについてのデータを、ストリームデータとしてまとめて出力する。
The
次に、図2を参照して、各部の詳細について説明する。ブロック分割部11の画像蓄積部21には、動画像変換装置10に供給された動画像のフレームが入力される。画像蓄積部21は、入力されたフレームを蓄積する。画像蓄積部21は、蓄積したフレームの数がN枚(Nは正の整数)になる度に、そのN枚のフレームを、ブロック分割部22に供給するとともに、N枚のフレームの中のM番目に記憶したフレーム(以下、M番目のフレームと称する)を、移動量検出部12(移動量検出部31)に供給する。例えば、N=4とする。
Next, details of each unit will be described with reference to FIG. The frame of the moving image supplied to the moving
ブロック分割部22は、画像蓄積部21から供給されたN枚のフレーム(連続するN枚のフレーム)のそれぞれを、ある大きさ(例えば8×8、16×16)のブロックに分割し、移動量検出部12(ブロック分配部32)に出力する。ブロック分割部22はまた、N枚のフレームの中の、画像蓄積部21でP番目に記憶されたフレーム(以下、P番目のフレームと称する)の各ブロックを移動量検出部12(移動量検出部31)に供給する。P番目のフレームは、M番目のフレームと異なるフレームである。
The
次に、移動量検出部12について説明する。移動量検出部12の移動量検出部31は、ブロック分割部11のブロック分割部22から供給されたP番目のフレームの各ブロックの動きベクトルを、画像蓄積部21から供給されたM番目のフレームを参照して例えばフレーム間のブロックマッチング処理を実行して検出し、検出した動きベクトルをブロック分配部32に供給する。動きベクトルは、フレーム間の水平方向(X軸方向)および垂直方向(Y軸方向)の移動量を表している。なお、移動量検出部31は、移動量検出の精度を向上させるために画像を拡大し、拡大画像を適用した移動量検出を行なう構成としてもよい。
Next, the movement
移動量検出部12のブロック分配部32には、ブロック分割部22から、N個単位でブロック(N枚のフレームのそれぞれの同一位置にある合計N個のブロック)が供給され、移動量検出部31から、そのN個のブロックの中のP番目のフレームのブロックの移動量が供給される。ブロック分配部32は、供給されたN個のブロックと移動量を、ブロック処理部13の、その移動量に対応する処理を行うブロック処理部51乃至53の中のいずかに供給する。
The
具体的にはブロック分配部32は、移動量検出部31から供給された、1フレーム間の水平方向(X軸方向)または垂直方向(Y軸方向)の移動量が2ピクセル(画素)以上である場合、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量を、ブロック処理部51に出力する。また、1フレーム間の水平方向と垂直方向の移動量がともに2ピクセル未満で、かつ1ピクセル以上の場合、ブロック分配部32は、N個のブロックと移動量を、ブロック処理部53に出力する。移動量がそのほかの場合には、ブロック分配部32は、N個のブロックと移動量をブロック処理部52に供給する。
Specifically, the
すなわちブロック分配部32は、移動量検出部21から供給された移動量に基づき、最適なフレームレートおよび空間解像度を決定し、そのフレームレートおよび空間解像度にしたがって画像データを変換する処理を行うブロック処理部51〜53に、ブロック画像を分配する。
That is, the
次に、ブロック処理部13の詳細を説明する。ブロック処理部13は、上述したように3個のブロック処理部51乃至53で構成されている。ブロック処理部51は、移動量検出部12のブロック分配部32から供給された、連続するN(例えばN=4)枚のフレームのそれぞれの同一位置にある合計N個のブロック(水平方向または垂直方向の移動量が2ピクセル以上である場合のN個のブロック)に対して、画素数を、同様にブロック分配部32から供給された移動量に応じて間引く処理(空間方向間引き処理)を行う。
Next, details of the
具体的には、1フレーム間の水平方向の移動量が2ピクセル(画素)以上である場合、ブロック処理部51は、処理対象のブロックが図3(a)に示すように4×4ピクセルで構成されているとき、水平方向の4画素のうち1つの画素値のみを選択して代表値とする。図3(b)の例では、P00乃至P30の4画素のうちP10のみを代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P01乃至P31の4画素に対してはP11を代表値(標本点)とし、P02乃至P32の4画素に対してはP12を代表値(標本点)とし、P03乃至P33の4画素に対してはP13を代表値(標本点)とする。
Specifically, when the amount of horizontal movement between one frame is 2 pixels (pixels) or more, the
1フレーム間の垂直方向の移動量が2ピクセル以上である場合、ブロック処理部51は、ブロックが図3(a)に示すように4×4ピクセルで構成されているとき、垂直方向の4画素のうち1つの画素値を標本点として有効とする。図3(c)の例では、P00乃至P03の4画素のうちP01のみを標本点として有効にする。その他の画素値は無効とする。同様に、P10乃至P13の4画素に対してはP11を標本点とし、P20乃至P23の4画素に対してはP21を標本点とし、P30乃至P33の4画素に対してはP31を標本点とする。
When the amount of movement in the vertical direction between one frame is 2 pixels or more, the
ブロック処理部51は、このような空間方向間引き処理を、供給された連続するN(例えばN=4)枚のフレームのそれぞれの同一位置にある合計N=4個のブロックに対してそれぞれ施すので、各ブロックのデータ量が1/4に削減され、4個のブロック全体のデータ量が1/4に削減される。ブロック処理部51は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
The
次に、図2に示すブロック処理部52の実行する処理について説明する。図2に示すブロック処理部52は、移動量検出部12のブロック分配部32から供給された連続するN枚のフレームのそれぞれの同一位置ある合計Nブロック(水平方向と垂直方向の移動量がともに1ピクセル未満である場合のN個のブロック)に対して、フレーム数を間引く処理(時間方向間引き処理)を行う。
Next, processing executed by the
具体的にはブロック処理部52は、図4に示すように、連続する4枚のフレームF1乃至F4のそれぞれの同一位置ある4個のブロックBiを、その中の1つのブロック(この例の場合、フレームF1のブロックBi)にするフレーム数の間引き(4フレーム間のフレーム数の間引き)を行う。ブロック処理部52は、このような時間方向間引き処理により、データ量が1/4に削減された4個のブロックについてのデータ(1個のブロック)を、出力部14に供給する。選択された1つのブロックの画素データが4フレームに対応する標本点データとなる。
Specifically, as shown in FIG. 4, the
ブロック処理部53は、移動量検出部12のブロック分配部32から供給された、連続するN枚のフレームのそれぞれの同一位置にある合計N個のブロック(水平方向と垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合のN個のブロック)に対して、画素数の間引き処理(空間方向間引き処理)とフレーム数の間引き処理(時間方向間引き処理)をそれぞれ行う。
The
ブロック処理部53は、ブロック処理部51における間引き処理とは異なり、図5に示すように、1フレーム間の水平方向の移動量が1ピクセル以上で、2ピクセル未満である場合、ブロック処理部53は、処理対象のブロックが図5(a)に示すように4×4ピクセルで構成されているとき、水平方向の4画素のうち2つの画素値のみを選択して代表値とする。図5(b)の例では、P00乃至P30の4画素のうちP00とP20のみを代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P01乃至P31の4画素に対してはP01とP21のみを代表値(標本点)とし、P02乃至P32の4画素に対してはP02とP22のみ代表値(標本点)とし、P03乃至P33の4画素に対してはP03とP23のみ代表値(標本点)とする。
Unlike the thinning-out process in the
1フレーム間の垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合、ブロック処理部53は、処理対象ブロックが図5(a)に示すように4×4ピクセルで構成されているとき、垂直方向の4画素のうち2つの画素値を有効とする。図5(c)の例では、P00乃至P03の4画素のうちP00およびP02を代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P10乃至P13の4画素に対してはP10およびP12を代表値(標本点)とし、P20乃至P23の4画素に対してはP20およびP22を代表値(標本点)とし、P30乃至P33の4画素に対してはP30およびP32を代表値(標本点)とする。
When the amount of vertical movement between one frame is 1 pixel or more and less than 2 pixels, the
さらにブロック処理部53は、フレーム数の間引き処理を行う。具体的にはブロック処理部53は、連続する4枚のフレームF1乃至F4のそれぞれの同一位置ある4個のブロックに対して、その中の2つのブロックを有効にするフレーム数の間引き処理を実行する。フレーム数の間引き処理においては、ブロック処理部53は、ブロック処理部52における間引き処理と異なり、図6に示すように、連続する4枚のフレームF1乃至F4のぞれぞれの同一位置にある合計4個のブロックBiを、その中のいずれか2つ(図の例では、フレームF1、F3の2個のブロック)にするフレーム数の間引き(2フレーム間のフレーム数の間引き)を行う。選択された2つのブロックの画素データが4フレームに対応する標本点データとなる。この場合、図5を参照して説明した空間方向の間引きにおいて、すでに1ブロックに8つの標本点選択が実行済みであり、2ブロックから総計16の標本点が選択され、これらが4フレームに対応する標本点データとして設定されることになる。
Furthermore, the
ブロック処理部53は、図5を参照して説明したデータ量を1/2とする空間方向間引き処理と、図6を参照して説明したデータ量を1/2とする時間方向間引き処理を、供給された4個のブロックに対して施すので、結果として4個のブロックのデータ量が(1/2)×(1/2)=1/4に削減される。ブロック処理部53は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
The
出力部14は、ブロック処理部13のブロック処理部51乃至53のそれぞれから供給された、データ量が削減されたN個のブロックについてのデータからストリームデータを生成する。
The
本出願人は、先に出願済みの特願2003−412501において、上述した動画像変換装置を提案した、この動画像変換装置は、人間の視覚特性を鑑みて、動画像の微小領域毎に移動速度情報に応じて最適なフレームレートと空間解像度を決定してデータ量の圧縮を行う構成であり、人間の視覚系における時間積分機能を利用し、動被写体を目で追いかけるときに生じる超解像効果に基づいて、移動量に応じて移動方向に空間的な間引き処理を行うことでデータ量の削減を行う構成である。 The present applicant has proposed the above-described moving image conversion device in Japanese Patent Application No. 2003-412501 filed earlier, and this moving image conversion device moves for each minute region of the moving image in view of human visual characteristics. This is a configuration that compresses the amount of data by determining the optimal frame rate and spatial resolution according to the speed information, and uses the time integration function in the human visual system to generate super-resolution when chasing a moving subject with the eyes Based on the effect, the data amount is reduced by performing spatial thinning processing in the moving direction according to the moving amount.
[(2)本発明に従った動画像圧縮処理を実行する装置および方法]
上述の動画像変換装置におけるデータ圧縮方法において、時間方向間引きを行なうと、以下のような問題が発生する場合がある。
(1)時間方向に間引かれたブロックと間引かれなかったブロックの互いの動きが不自然になる。
(2)時間方向に間引かれたブロックがある程度の高周波成分を持っていると、フリッカー状のノイズが発生する。
以下では、上記問題点を解決したデータ圧縮を実現する本発明に従った動画像圧縮処理を実行する装置および方法について説明する。
[(2) Apparatus and method for executing moving image compression processing according to the present invention]
In the data compression method in the above-described moving image conversion apparatus, the following problems may occur when time direction thinning is performed.
(1) The movement of the blocks thinned out in the time direction and the blocks not thinned out become unnatural.
(2) Flicker-like noise is generated when a block thinned out in the time direction has a certain high-frequency component.
Hereinafter, an apparatus and a method for executing a moving image compression process according to the present invention that realizes data compression that solves the above-described problems will be described.
本実施形態における動画像変換装置の概略構成について説明する。図7は、本発明の一実施形態としての動画像変換装置の構成を示すブロック図である。図7に示すように、本実施形態の動画像変換装置は、処理対象となる動画像データを入力し、ブロック分割手段100において、動画像を構成するフレーム毎に所定領域のブロックに分割し、ブロックデータをn個存在する動画像圧縮手段102〜104へ出力する。ブロック合成手段105は、ブロックに分割され動画像圧縮手段によって処理された各ブロックの圧縮データをフレーム単位で合成してフレーム単位の圧縮動画像データとして符号化器106へ出力する。符号化器106は、MPEG圧縮等の動画の圧縮を行うことのできる既存の符号化器であり、圧縮フレームデータに対してさらにMPEG等のデータ圧縮を実行し、ネットワークへの出力、あるいは記憶媒体への格納等のために出力する。
A schematic configuration of the moving image conversion apparatus according to the present embodiment will be described. FIG. 7 is a block diagram showing a configuration of a moving image conversion apparatus as an embodiment of the present invention. As shown in FIG. 7, the moving image conversion apparatus according to the present embodiment inputs moving image data to be processed, and the
本実施形態におけるブロック分割手段100および動画像圧縮手段102〜104の構成について図8以下を参照して説明する。図8は本実施形態におけるブロック分割手段100および動画像圧縮手段102〜104の構成を示すブロック図である。
Configurations of the
処理対象となる動画像は、ブロック分割手段100内の画像蓄積部200において、Nフレーム分蓄積される。なお、本実施例ではN=4である。蓄積されたフレームはブロック分割部201においてある大きさのブロック、例えば8pixel×8pixelや16pixel×16pixel等のブロックに分解され、ブロック分配部203に送られる。また、この時の分割されたフレームのブロックサイズは移動量検出部202へ送られる。
The moving images to be processed are accumulated for N frames in the
移動量検出部202は、画像蓄積部200に蓄積されたフレームの内M番目とM+1番目のフレームを取得し、ブロック分割部201からのフレームが分割されたブロックのサイズに合わせたブロック単位で、既存の手法、例えばブロックマッチング手法等を用いてフレームの各々のブロックに関する動きベクトルを検出する。なお、本実施例ではM=2である。
The movement
さらに、検出された移動量を復号化に使用するため、移動量検出部202の検出した移動量情報は、出力207にて符号化器106に出力し、符号化器106において符号化される動画像と共に符号化する。なお、本実施例では、移動量検出部202は、Nフレーム中の連続する2フレームを用いたブロックマッチングによって移動量を算出する構成としたが、移動量検出部202の実行する移動量検出処理は、その他の方法を適用してもよい。さらに、2フレームに基づく移動量検出構成ではなく、Nフレーム中の全フレームという選択も含むどのようなフレームの組み合わせに基づいて移動量を算出しても良い。
Furthermore, since the detected movement amount is used for decoding, the movement amount information detected by the movement
ブロック分配部203は、各ブロックに対して異なる圧縮処理を行うブロック処理部2−4〜206へブロックを振り分ける処理を実行する。ブロック分配部203の入力は移動量検出部202から出力される各々のブロックの移動量と、ブロック分割部201から出力されるブロックに分割されたNフレーム分の画像データである。
The
ブロック分配部203は入力されたNフレーム分のブロックを、各ブロックの移動量に従い、ブロック処理部204〜206のいずれかに出力する。さらに、ブロック分配条件を復号化に使用する場合には、ブロック分配条件を、例えばブロック分配フラグとして設定した出力209を符号化器106に出力し符号化される動画像と共に符号化する。
The
ブロック分配部203は、ブロックの分配条件として移動量検出部202の検出した移動量情報を適用する。本実施例では、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が2ピクセルを超えた場合にはブロック処理部a204、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が2ピクセル未満、かつ1ピクセル以上の場合にはブロック処理部c206へ出力し、そのほかの場合にはブロック処理部b205へ出力する。
The
なお、ブロック分配部203における出力先決定のための上記条件はあくまでも本実施例のための一例であり、他の条件を適用してもよい。ブロック処理部208内の各々のブロック処理部204〜206は、ブロック分配部203から処理対象となるブロックデータと対応する移動量情報を受け取り、データ圧縮処理としての間引き処理を実行する。
Note that the above conditions for determining the output destination in the
ブロック処理部a204は入力されたブロックの画素数を、処理対象ブロックデータと同時に入力された対応する移動量に応じて空間間引き処理を実行する。本実施例では、水平方向の移動量が2ピクセル以上であるときにはブロック内の画素を1x4ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる4つの画素の内いずれかの値にすることで画素数の間引きを実現している。また、垂直方向の移動量が2ピクセル以上であるときにはブロック内の画素を4x1ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる4つの画素の内いずれかの値にする。これらの処理は、先に図3を参照して説明した処理と同様の処理である。さらに垂直・水平方向の移動量がともに2ピクセル以上であるときには、ブロック内の画素を2x2ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる4つの画素の内いずれかの値にする。 The block processing unit a204 performs a spatial thinning process on the number of pixels of the input block according to the corresponding movement amount input simultaneously with the processing target block data. In this embodiment, when the amount of movement in the horizontal direction is 2 pixels or more, the pixels in the block are divided into sets of 1 × 4 pixel units, and the pixel value of each set is one of the four pixels included in each set. In this way, the number of pixels is reduced. When the amount of movement in the vertical direction is 2 pixels or more, the pixels in the block are divided into sets of 4 × 1 pixels, and the pixel value of each set is set to one of the four pixels included in each set. These processes are similar to the processes described above with reference to FIG. Furthermore, when the amount of movement in the vertical and horizontal directions is 2 pixels or more, the pixels in the block are divided into sets of 2 × 2 pixels, and the pixel values of each set are any one of the four pixels included in each set. To.
本来、4画素の値を全て同一にすることは著しい画質の劣化を招くが、ブロック処理部a204は、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が2ピクセルを超えたブロックについてのみ、これらの空間間引きを行なう構成であり、前述のブロックの法則として知られる視覚の時間的積分機能に起因して、超解像効果がもたらされ、観測者が、空間方向に離散的にサンプリングされた移動被写体を追従視する際に、表示画素数以上の解像度を知覚するという視覚的効果が発生し、観測者は、ほとんど画質の劣化を感ずることがない。すなわち、ブロックが十分な高速で移動しており、かつ動画像のフレームレートが十分大きければ、画質の劣化を人間が知覚することはできない。 Originally, making the values of all four pixels the same causes a significant deterioration in image quality, but the block processing unit a204 has a larger value of more than two pixels in the horizontal or vertical movement amount between one frame. This is a configuration that performs these spatial decimation only for blocks, and due to the temporal temporal integration function known as the block law described above, a super-resolution effect is brought about, and the observer is discrete in the spatial direction. When following a moving sample sampled in a visual manner, a visual effect of perceiving a resolution higher than the number of display pixels occurs, and the observer hardly perceives image quality degradation. That is, if the block is moving at a sufficiently high speed and the frame rate of the moving image is sufficiently large, human being cannot perceive the deterioration of the image quality.
ブロック処理部b205は入力されたブロックのフレーム数の間引き処理、すなわち時間方向の間引き処理を実行する。入力されるブロックはNフレーム画像中の同一位置ブロックN個である。本実施例では、あるブロックの水平方向、垂直方向の移動量がともに1ピクセル未満であった場合、入力された4個のブロックの全画素値を4個のブロックのうちいずれかのブロックの値にする。この処理は、先に図4を参照して説明した処理に相当する。 The block processing unit b205 executes a thinning process for the number of frames of the input block, that is, a thinning process in the time direction. The input blocks are N blocks at the same position in the N frame image. In this embodiment, when the movement amount of a certain block in both the horizontal direction and the vertical direction is less than one pixel, all the pixel values of the four input blocks are the values of any one of the four blocks. To. This process corresponds to the process described above with reference to FIG.
ブロック処理部c206は入力されたブロックの画素数とフレーム数の間引きを実行する。すなわち空間間引き処理と、時間方向の間引き処理との両者を実行する。基本的な動作はブロック処理部a204の空間間引き処理と、ブロック処理部b205の時間方向間引き処理とを組み合わせた処理を実行する。 The block processing unit c206 thins out the number of pixels and the number of frames of the input block. That is, both spatial thinning processing and temporal thinning processing are executed. The basic operation is a combination of the spatial thinning process of the block processing unit a204 and the time direction thinning process of the block processing unit b205.
ブロック処理部c206は、画素数の間引き量とフレーム数の間引き量が、ブロック処理部a204の空間間引き処理と、ブロック処理部b205の時間方向間引き処理とは異なる。まず空間間引きとしての画素数の間引き量に関しては、ブロック処理部a204のように4ピクセル単位で行うのではなく2ピクセル単位で行われる。つまりブロック処理部a204においては1x4、4x1、2x2の3通りの間引き方法が存在したが、ブロック処理部c206の実行する空間間引き処理は、1x2および2x1の2通りのみが存在する。すなわち、水平方向の移動量が1〜2ピクセルである場合、ブロック内の画素を1x2ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる2つの画素の内いずれかの値にすることで画素数の間引きを実現している。また、垂直方向の移動量が1〜2ピクセルであるときにはブロック内の画素を2x1ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる2つの画素の内いずれかの値にする。この処理は、先に、図5を参照して説明した処理に相当する。 In the block processing unit c206, the thinning-out amount of the number of pixels and the thinning-out amount of the frame number are different from the spatial thinning processing of the block processing unit a204 and the temporal thinning processing of the block processing unit b205. First, the amount of thinning out of pixels as space thinning is not performed in units of 4 pixels as in the block processing unit a204 but in units of 2 pixels. That is, in the block processing unit a204, there are three thinning methods 1x4, 4x1, and 2x2, but there are only two thinning methods 1x2 and 2x1 performed by the block processing unit c206. That is, when the amount of movement in the horizontal direction is 1 to 2 pixels, the pixels in the block are divided into sets of 1 × 2 pixel units, and the pixel value of each set is set to one of the two pixels included in each set. By doing so, the number of pixels is reduced. When the vertical movement amount is 1 to 2 pixels, the pixels in the block are divided into sets of 2 × 1 pixels, and the pixel value of each set is set to one of the two pixels included in each set. . This process corresponds to the process described above with reference to FIG.
また、ブロック処理部c206は、時間方向の間引き処理、すなわち、フレーム数の間引きも実行するが、ブロック処理部b205のように4フレーム単位で行うのではなく2フレーム単位で行うということに違いがある。この処理は、先に図6を参照して説明した処理に相当する。 In addition, the block processing unit c206 also performs temporal direction decimation processing, that is, decimation of the number of frames, but the difference is that it is performed in units of 2 frames instead of in units of 4 frames as in the block processing unit b205. is there. This process corresponds to the process described above with reference to FIG.
さらに、本実施例のブロック処理部c206は、時間方向の間引き処理、すなわち、フレーム数の間引き処理の態様を、ブロックの移動量により異ならせて実行する。図9に本実施形態におけるブロック処理部c206の構成のブロック図を示す。 Further, the block processing unit c206 according to the present embodiment executes the temporal thinning process, that is, the aspect of the frame number thinning process, depending on the movement amount of the block. FIG. 9 shows a block diagram of a configuration of the block processing unit c206 in the present embodiment.
図9を参照してブロック処理部c206の処理について説明する。ブロック処理部c206に入力されたブロックはブロック蓄積部301にNフレーム分蓄積される。ここで蓄積されるブロックは、画像蓄積部200(図8参照)に蓄積されるフレーム数と等しいことが望ましい。
The process of the block processing unit c206 will be described with reference to FIG. The blocks input to the block processing unit c206 are stored in the
ブロック蓄積部301に蓄積されたブロックは、ブロック処理部c(1)305において空間間引き処理、すなわち、画素数の間引き処理が行われる。ここで行われる空間間引き処理が前述の1x2および2x1の2通りの空間間引きである。すなわち、水平方向の移動量が1〜2ピクセルである場合、ブロック内の画素を1x2ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる2つの画素の内いずれかの値にすることで画素数の間引きを実現している。また、垂直方向の移動量が1〜2ピクセルであるときにはブロック内の画素を2x1ピクセル単位の集合に分け、各集合の画素値を各集合に含まれる2つの画素の内いずれかの値にする。この処理は、先に、図5を参照して説明した処理に相当する。
The blocks accumulated in the
空間間引き処理が行われたブロックは、Nフレーム分をまとめてブロック分配部302へ出力され、ブロック分配部302はブロック移動量にしたがってNフレーム分のブロックをブロック処理部c(2)303またはブロック処理部c(3)304へ出力する。
The blocks subjected to the spatial decimation processing are collectively output to the
ブロック分配部302における分配条件として、本実施例では1フレーム間の水平または垂直方向の移動量のうち値の大きい方が1.25ピクセル未満であればブロック処理部c(2)303、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が1.25ピクセル以上であればブロック処理部c(3)304へ出力する。
As a distribution condition in the
ブロック処理部c206には1フレーム間の水平または垂直方向の移動量のうち値の大きい方が2ピクセル未満、かつ1ピクセル以上のブロックのみが分配されているため、最終的には、
1フレーム間の水平または垂直方向の移動量のうち値の大きい方が、
1ピクセル以上1.25ピクセル未満であればブロック処理部c(2)303、
1.25ピクセル以上2ピクセル未満であればブロック処理部c(3)304、
へ、それぞれのブロックが出力され、それぞれのブロック処理部において異なる態様で、時間方向間引き処理が実行される。
Since the block processing unit c206 distributes only blocks with a larger value of less than 2 pixels and more than 1 pixel in the horizontal or vertical movement amount between one frame, finally,
The larger the amount of horizontal or vertical movement between one frame,
If it is 1 pixel or more and less than 1.25 pixel, the block processing unit c (2) 303,
If it is 1.25 pixels or more and less than 2 pixels, the block processing unit c (3) 304,
Each block is output, and the time direction thinning process is executed in a different manner in each block processing unit.
ブロック処理部c(2)303と、ブロック処理部c(3)304で実行する具体的な時間方向間引き処理について、図10、図11を参照して説明する。 A specific time direction thinning process executed by the block processing unit c (2) 303 and the block processing unit c (3) 304 will be described with reference to FIGS.
まず、図10を参照して、ブロック処理部c(2)303の実行する時間方向間引き処理について説明する。ブロック処理部c(2)303は、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が、1ピクセル以上1.25ピクセル未満のブロックに対する時間方向間引き処理を実行する。 First, with reference to FIG. 10, the time direction thinning process performed by the block processing unit c (2) 303 will be described. The block processing unit c (2) 303 performs temporal direction thinning processing on a block having a larger value among horizontal and vertical movement amounts between one frame and one pixel or more and less than 1.25 pixels.
ブロック処理部c(2)303への入力は連続する4フレームの同一位置から得られる4つのブロック321〜324である。ブロック321〜324は、ブロック321が1番目のフレーム、ブロック322が2番目のフレーム、ブロック323が3番目のフレーム、ブロック324が4番目のフレームから得られたものであり、ブロック321〜324の順に時系列に並んでいる。
The input to the block processing unit c (2) 303 is four
ブロック処理部c(2)303に入力されたブロック321〜324は、既に、ブロック処理部c(1)305(図9参照)において、空間間引き処理が施されている。図10には、ブロック321〜324に横方向2×1での空間間引き結果として各ブロックに代表画素(標本点)として残された画素326〜329を示す。図10に示すとおり、空間間引きの結果、各ブロックの表画素(標本点)として残された画素326〜329はそれぞれ同じ値となっている。
The
ブロック処理部c(2)303はこの入力ブロック321〜324を時間方向へ1/2に間引く処理を行う。ブロック処理部c(2)303は、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が、1ピクセル以上1.25ピクセル未満のブロックに対する時間方向間引き処理を実行する。本実施例では、ブロック処理部c(2)303において、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引くことで時間方向の間引き処理を実行する。時間方向間引き処理結果がブロック331〜334である。
The block processing unit c (2) 303 performs a process of thinning out the input blocks 321 to 324 in half in the time direction. The block processing unit c (2) 303 performs temporal direction thinning processing on a block having a larger value among horizontal and vertical movement amounts between one frame and one pixel or more and less than 1.25 pixels. In the present embodiment, the block processing unit c (2) 303 executes the thinning process in the time direction by leaving the first frame and the fourth frame and thinning out the second and third frames. The time direction thinning processing results are
図10に示すように、時間軸方向に間引かれた結果、ブロック331と334が残され、ブロック332と333が間引かれる。この空間間引きによって、4フレーム分のブロックには、代表画素(標本点)336,337のみが残り、時間方向の間引きによって、データ量が1/2に削減される。この空間間引きによって、データ量が1/2に削減される。このブロックは、ブロック処理部c(1)305(図9参照)において、データを1/2とする空間間引き処理が施されているので、結果としてデータ量は1/4となる。 As shown in FIG. 10, as a result of thinning out in the time axis direction, blocks 331 and 334 are left, and blocks 332 and 333 are thinned out. By this spatial decimation, only representative pixels (sample points) 336 and 337 remain in the block for four frames, and the data amount is reduced to ½ by decimation in the time direction. This space decimation reduces the amount of data by half. Since this block has been subjected to spatial thinning processing that reduces the data to 1/2 in the block processing unit c (1) 305 (see FIG. 9), the data amount is reduced to 1/4 as a result.
次に、ブロック処理部c(3)304の実行する時間方向間引き処理について説明する。ブロック処理部c(3)304は、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が、1.25ピクセル以上2ピクセル未満のブロックに対する時間方向間引き処理を実行する。 Next, the time direction thinning process executed by the block processing unit c (3) 304 will be described. The block processing unit c (3) 304 performs temporal direction thinning processing on a block having a larger value in the horizontal or vertical movement amount between one frame and having a value of 1.25 pixels or more and less than 2 pixels.
ブロック処理部c(3)304への入力は、図11に示す連続する4フレームの同一位置から得られる4つのブロック351〜354である。またブロック351〜354は、ブロック351〜354の順に時系列に並んでいる。
The input to the block processing unit c (3) 304 is four
ブロック処理部c(3)304に入力されたブロック351〜354は、既に、ブロック処理部c(1)305(図9参照)において、空間間引き処理が施されている。図11には、ブロック351〜354に横方向2×1での空間間引き結果として各ブロックに代表画素(標本点)として残された画素356〜359を示す。図11に示すとおり、空間間引きの結果、各ブロックの表画素(標本点)として残された画素356〜359はそれぞれ同じ値となっている。
The
ブロック処理部c(3)304はこの入力ブロック351〜354を時間方向へ1/2に間引く処理を行う。本実施例では、ブロック処理部c(3)304において、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引くことで時間方向の間引き処理を実行する。時間方向間引き処理結果がブロック361〜364である。
The block processing unit c (3) 304 performs a process of thinning out the input blocks 351 to 354 by half in the time direction. In this embodiment, the block processing unit c (3) 304 executes the thinning process in the time direction by leaving the first frame and the third frame and thinning out the second and fourth frames. The time direction thinning processing results are
図11に示すように、時間軸方向に間引かれた結果、ブロック361と363が残され、ブロック362と364が間引かれる。この空間間引きによって、4フレーム分のブロックには、代表画素(標本点)366,367のみが残り、時間方向の間引きによって、データ量が1/2に削減される。このブロックは、ブロック処理部c(1)305(図9参照)において、データを1/2とする空間間引き処理が施されているので、結果としてデータ量は1/4となる。 As shown in FIG. 11, as a result of thinning out in the time axis direction, blocks 361 and 363 are left, and blocks 362 and 364 are thinned out. By this spatial decimation, only representative pixels (sample points) 366 and 367 remain in the block for four frames, and the data amount is reduced to ½ by decimation in the time direction. Since this block has been subjected to spatial thinning processing that reduces the data to 1/2 in the block processing unit c (1) 305 (see FIG. 9), the data amount is reduced to 1/4 as a result.
このように、ブロック処理部は、例えば、圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する構成である場合、移動量が大きい場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、移動量が小さい場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行する。より、一般的に説明すると、ブロック処理部は、時間方向間引き処理の実行において、移動量が大きい場合は、時間軸に連続する間引き対象フレームを少なく設定し、移動量が小さい場合は、時間軸に連続する間引き対象フレームを多く設定した時間軸方向の間引き処理を実行する。 As described above, for example, when the block processing unit is configured to perform the temporal direction thinning process with a compression ratio of 1/2 as processing units of four consecutive frames, when the movement amount is large, the first frame and the third frame If the movement amount is small, the first and fourth frames are left, and the second and third frames are left out. The thinning process in the time axis direction is executed. More generally, in the execution of the time direction thinning process, when the movement amount is large, the block processing unit sets a small number of frames to be thinned consecutive to the time axis, and when the movement amount is small, the block processing unit sets the time axis. A thinning process in the time axis direction in which a large number of frames to be thinned out is set is executed.
次に、図12に示すフローチャートに従って、ブロック処理部c206の処理について説明する。ブロック処理部c206は、ステップS101において、入力ブロックをNフレーム分蓄積する。ここで蓄積されるブロックは、画像蓄積部200(図8参照)に蓄積されるフレーム数と等しいことが望ましい。蓄積されたブロックは、ステップS102において画素数の間引き処理が行われる。ここで行われる空間間引き処理が前述の1x2および2x1の2通りの空間間引きであり、データ量が1/2に削減される。 Next, processing of the block processing unit c206 will be described according to the flowchart shown in FIG. In step S101, the block processing unit c206 accumulates the input blocks for N frames. It is desirable that the number of blocks stored here is equal to the number of frames stored in the image storage unit 200 (see FIG. 8). The accumulated block is subjected to thinning-out processing in step S102. The spatial thinning process performed here is the above-described two types of spatial thinning of 1 × 2 and 2 × 1, and the data amount is reduced to ½.
空間間引き処理が行われたブロックは、ステップS103において、ブロックの移動速度に基づく時間間引き処理態様の振り分けが実行される。この分配条件として、本実施例では1フレーム間の水平または垂直方向の移動量のうち値の大きい方が、
1ピクセル以上1.25ピクセル未満であればブロック処理部c(2)303、
1.25ピクセル以上2ピクセル未満であればブロック処理部c(3)304、
として振り分けられ、それぞれのブロック処理部において異なる態様で、時間方向間引き処理が実行される。
In the block subjected to the spatial thinning process, in step S103, the time thinning process mode based on the movement speed of the block is executed. As this distribution condition, in this embodiment, the larger one of the horizontal or vertical movement amounts between one frame is as follows.
If it is 1 pixel or more and less than 1.25 pixel, the block processing unit c (2) 303,
If it is 1.25 pixels or more and less than 2 pixels, the block processing unit c (3) 304,
The time direction thinning process is executed in a different manner in each block processing unit.
ステップS104では、ブロック処理部c(2)303において、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が1ピクセル以上1.25ピクセル未満のブロックに対して、図10を参照して説明した時間方向間引き処理、すなわち、連続する4フレーム中、第1および第4フレームの画素データを残し、第2および第3フレームの画素データを削除する態様の時間方向間引き処理が実行される。 In step S104, in the block processing unit c (2) 303, refer to FIG. 10 for blocks in which the larger value of the horizontal or vertical movement amount between one frame is 1 pixel or more and less than 1.25 pixels. As described above, the time direction thinning process is performed, that is, the pixel data of the first and fourth frames are left and the pixel data of the second and third frames are deleted in four consecutive frames. The
また、ステップS105では、ブロック処理部c(3)304において、1フレーム間の水平または垂直方向の移動量のうち値の大きい方が1.25ピクセル以上2ピクセル未満のブロックに対して、図11を参照して説明した時間方向間引き処理、すなわち、連続する4フレーム中、第1および第3フレームの画素データを残し、第2および第4フレームの画素データを削除する態様の時間方向間引き処理が実行される。 In step S105, the block processing unit c (3) 304 applies a block having a larger value of 1.25 pixels or more and less than 2 pixels to the horizontal or vertical movement amount between one frame. The time direction thinning process described with reference to the above, that is, the time direction thinning process in which the pixel data of the first and third frames is left and the pixel data of the second and fourth frames is deleted in four consecutive frames. Executed.
このように、本発明の動画像変換装置においては、1フレーム間の水平または垂直方向の移動量のうち値の大きい方について、
(a)移動量2ピクセル以上のブロック:データ量を1/4とする空間間引き処理(図3参照)、
(b1)移動量1.25ピクセル以上2ピクセル未満のブロック:データ量を1/2とする空間間引き処理(図5参照)と、データ量を1/2とする時間方向間引き処理であり連続する4フレーム中、第1および第3フレームの画素データを残し、第2および第4フレームの画素データを削除する態様の時間方向間引き処理(図11参照)、
(b2)移動量1ピクセル以上1.25ピクセル未満のブロック:データ量を1/2とする空間間引き処理(図5参照)と、データ量を1/2とする時間方向間引き処理であり連続する4フレーム中、第1および第4フレームの画素データを残し、第2および第3フレームの画素データを削除する態様の時間方向間引き処理(図10参照)、
(c)移動量1ピクセル未満のブロック:データ量を1/4とする時間方向間引き処理(図4参照)、
上記4種類の異なる態様での間引き処理を行なうことになる。
As described above, in the moving image conversion apparatus of the present invention, the larger one of the horizontal or vertical movement amounts between one frame is as follows.
(A) A block having a movement amount of 2 pixels or more: spatial thinning processing (refer to FIG. 3) to reduce the data amount to 1/4
(B1) A block having a movement amount of 1.25 pixels or more and less than 2 pixels: a space thinning process (see FIG. 5) that reduces the data amount to 1/2 and a time direction thinning process that reduces the data amount to 1/2. In the four frames, the pixel data of the first and third frames are left, and the time direction thinning process (see FIG. 11) of the mode of deleting the pixel data of the second and fourth frames,
(B2) A block having a movement amount of 1 pixel or more and less than 1.25 pixels: a space thinning process (see FIG. 5) for reducing the data amount to 1/2 and a time direction thinning process for reducing the data amount to 1/2. In the four frames, the pixel data of the first and fourth frames are left, and the pixel data of the second and third frames are deleted in the time direction thinning process (see FIG. 10).
(C) Block with movement amount less than 1 pixel: time direction decimation processing (refer to FIG. 4) to reduce the data amount to 1/4.
The thinning process is performed in the above four different modes.
先に説明した「(1)超解像効果を利用した動画像変換装置の基本構成」における処理態様と異なる点は、空間方向間引きと、時間方向間引きを組み合わせて実行するブロック処理部c206(図8参照)での処理であり、このブロック処理部c206において、移動量に応じて異なる態様の時間方向間引き(図10、図11参照)を行なう点である。このように時間方向の間引き態様をブロックの移動量に応じて異なる態様で実行することにより、先に説明した「(1)超解像効果を利用した動画像変換装置の基本構成」における問題点、すなわち、
(1)時間方向に間引かれたブロックと間引かれなかったブロックの互いの動きが不自然になる。
(2)時間方向に間引かれたブロックがある程度の高周波成分を持っていると、フリッカー状のノイズが発生する。
という問題点が解決され、高品質な符号化データの生成が可能となる。
A difference from the processing mode in “(1) Basic configuration of moving image conversion apparatus using super-resolution effect” described above is that a block processing unit c206 (FIG. 8), and this block processing unit c206 performs time direction decimation (see FIGS. 10 and 11) in a different manner depending on the movement amount. As described above, by executing the thinning mode in the time direction in different modes depending on the movement amount of the block, the problem in “(1) Basic configuration of moving image conversion apparatus using super-resolution effect” described above. That is,
(1) The movement of the blocks thinned out in the time direction and the blocks not thinned out become unnatural.
(2) Flicker-like noise is generated when a block thinned out in the time direction has a certain high-frequency component.
Thus, it is possible to generate high quality encoded data.
ブロック処理部c206において、ブロックの移動量に応じて異なる態様の時間方向間引き(図10、図11参照)を行なうことで、高品質な符号化データの生成が可能となる理由について説明する。なお、ここで、高品質な符号化データとは、前述のブロックの法則として知られる視覚の時間的積分機能に起因する超解像効果が発揮されるデータである。超解像効果が発揮されるデータであれば、観測者が、空間方向に離散的にサンプリングされた移動被写体を追従視する際に、画質の劣化を感ずることがない。ブロック処理部c206において、ブロックの移動量に応じて異なる態様の時間方向間引き(図10、図11参照)を行なうことで、超解像効果が発揮されるデータを生成することが可能となる。 The reason why the block processing unit c206 can generate high-quality encoded data by performing temporal direction decimation (see FIGS. 10 and 11) in different modes according to the movement amount of the block. Here, high-quality encoded data is data that exhibits a super-resolution effect due to the visual temporal integration function known as the above-mentioned block law. If the data exhibits the super-resolution effect, the observer will not perceive deterioration in image quality when following the moving subject discretely sampled in the spatial direction. In the block processing unit c206, it is possible to generate data that exhibits the super-resolution effect by performing temporal direction decimation (see FIGS. 10 and 11) in a different manner depending on the movement amount of the block.
空間方向に間引いた際に発生する高調波は、他のフレームにおいて発生する高調波により互いに打ち消されることで超解像効果は現れる。この時の条件は、速度v pixel/frameで動く対象物をm pixelで空間方向に間引いた場合に、下式(式1)を満足する場合である、
上記(式1)の条件を満足すれば、空間方向にm pixelの間引きを行っても、超解像効果により高調波が打ち消され、人間は劣化を知覚できないことが知られている。ここで、視覚の時間特性には積分機能が存在するので、その積分期間内に折り返し成分を打ち消しあう、(式1)式を満足する複数組のフレームが存在すれば、打ち消しあう組み合わせのフレームだけを残し、他のフレームを削除することにより時間軸方向にフレームを間引くことが可能となる。 It is known that if the condition of the above (Equation 1) is satisfied, even if thinning out of m pixels is performed in the spatial direction, harmonics are canceled by the super-resolution effect, and humans cannot perceive deterioration. Here, since there is an integration function in the visual time characteristic, if there are multiple sets of frames that satisfy the expression (Equation 1) that cancel the aliasing components within the integration period, only the combination frames that cancel each other. It is possible to thin out the frames in the time axis direction by leaving other frames and deleting other frames.
しかしながら、時間軸方向に間引くフレームを固定してしまうと、式(式1)を満足する打ち消しあうフレームの組み合わせは、ブロックの移動速度に依存して変化するので、ブロックの移動速度によっては高調波を打ち消すことができず、フリッカー状のノイズ等の主観的な画像劣化を生じる結果となる。 However, if the frame to be thinned out in the time axis direction is fixed, the combination of frames that cancel each other satisfying the equation (Equation 1) changes depending on the moving speed of the block. Cannot be canceled out, resulting in subjective image deterioration such as flicker noise.
そこで、実施例に示すように、ブロックの移動速度に合わせて間引くフレームを変えることにより、式(式1)を満足する組み合わせのフレームを選択して間引くようにする。その結果、フリッカー状のノイズ等の主観的な画像劣化を抑制することが可能となる。以上のようにして本実施例の動画像処理装置による前処理を施され復号化された動画像は、符号化時に施された圧縮処理によりデータ量は削減されているにもかかわらず、復号化時の画像劣化を抑制することができる。 Therefore, as shown in the embodiment, by changing the frame to be thinned out according to the moving speed of the block, a combination of frames satisfying the equation (Equation 1) is selected and thinned out. As a result, subjective image deterioration such as flicker noise can be suppressed. The moving image that has been preprocessed and decoded by the moving image processing apparatus according to the present embodiment as described above is decoded even though the data amount is reduced by the compression processing performed at the time of encoding. It is possible to suppress image degradation at the time.
さらに、図13〜図16を参照して、本発明の間引き態様によって超解像効果の得られる理由について説明する。 Further, the reason why the super-resolution effect can be obtained by the thinning-out mode of the present invention will be described with reference to FIGS.
速度v pixel/frameで動く対象物をm pixelで空間方向に間引いた場合に、超解像効果の得られる条件は、前述の式(式1)を満足する場合である。前述の式(式1)を、オイラーの公式で展開すると、以下の式(式2)が得られる。
上記式(式2a),(式2b)を満足すれば、m pixelで空間方向に間引いた場合に、超解像効果が得られ、人間は、画像の劣化を知覚できないことが示されている。図13に、時間間引きをしない条件における空間間引き量:m=2ピクセル、移動量:v=1〜2ピクセル/フレームの超解像条件の変化を示す。ここで、視覚の時間特性により積分されるフレーム数を8とした。 If the above formulas (Formula 2a) and (Formula 2b) are satisfied, it is shown that a super-resolution effect can be obtained when thinning out in the spatial direction with m pixels, and humans cannot perceive image degradation. . FIG. 13 shows changes in the super-resolution condition when the spatial thinning amount is m = 2 pixels and the movement amount is v = 1 to 2 pixels / frame in a condition where time thinning is not performed. Here, the number of frames integrated by the visual time characteristic is set to 8.
図13において、実線が上記式(式2a)に対応し、点線が上記式(式2b)に対応する。基本的には、式2a,式2bとも=0となることが理想的な条件であるが、−1〜+1の範囲では人間は、ほとんど画像の劣化を感ずることなく、超解像効果にほぼ等しい効果を得ることが可能である。 In FIG. 13, the solid line corresponds to the above formula (Formula 2a), and the dotted line corresponds to the above formula (Formula 2b). Basically, it is an ideal condition that both Equation 2a and Equation 2b are = 0. However, in the range of −1 to +1, humans almost do not feel the deterioration of the image and almost achieve the super-resolution effect. It is possible to obtain the same effect.
図13において、実線および点線のグラフが−1〜+1の範囲にあるのは、移動量:v=1〜1.6ピクセル/フレームの移動量がある場合である。移動量:v=1.6〜2ピクセル/フレームでは、実線および点線のグラフが−1〜+1からはずれ、超解像効果が得られない。 In FIG. 13, the solid line and dotted line graphs are in the range of −1 to +1 when the movement amount is v = 1 to 1.6 pixels / frame. Movement amount: When v = 1.6-2 pixels / frame, the solid line and dotted line graphs deviate from −1 to +1, and the super-resolution effect cannot be obtained.
図14は、連続する8フレーム:t=0〜8T中、
t=0,2T,4T,6Tのフレームを残し、
t=T,3T,5T,7Tのフレームを削除する、
という態様で時間方向間引きを実行した場合のグラフであり、空間間引き量:m=2ピクセル、移動量:v=1〜2ピクセル/フレームの超解像条件の変化を示す。実線が上記式(式2a)に対応し、点線が上記式(式2b)に対応する。この間引き態様は、先に図11を参照して説明した時間方向間引きの態様に相当する。
FIG. 14 shows 8 consecutive frames: t = 0 to 8T,
leaving t = 0, 2T, 4T, 6T frames,
delete frames of t = T, 3T, 5T, 7T,
FIG. 6 is a graph when the temporal thinning is performed in the above-described manner, and shows a change in super-resolution conditions of a spatial thinning amount: m = 2 pixels and a movement amount: v = 1-2 pixels / frame. The solid line corresponds to the above formula (Formula 2a), and the dotted line corresponds to the above formula (Formula 2b). This thinning mode corresponds to the time direction thinning mode described above with reference to FIG.
図14から、実線および点線のグラフが−1〜+1の範囲にあるのは、移動量:v=1.2〜1.8ピクセル/フレームの移動量がある場合である。移動量:v=1.0や、v=2.0ピクセル/フレーム付近では、実線および点線のグラフが−1〜+1からはずれ、超解像効果が得られない。 From FIG. 14, the solid line and dotted line graphs are in the range of −1 to +1 when the movement amount is v = 1.2 to 1.8 pixels / frame. Movement amount: In the vicinity of v = 1.0 or v = 2.0 pixels / frame, the solid line and dotted line graphs deviate from −1 to +1, and the super-resolution effect cannot be obtained.
図15は、連続する8フレーム:t=0〜8T中、
t=0,3T,4T,7Tのフレームを残し、
t=T,2T,5T,8Tのフレームを削除する、
という態様で時間方向間引きを実行した場合のグラフであり、空間間引き量:m=2ピクセル、移動量:v=1〜2ピクセル/フレームの超解像条件の変化を示す。実線が上記式(式2a)に対応し、点線が上記式(式2b)に対応する。この間引き態様は、先に図10を参照して説明した時間方向間引きの態様に相当する。
FIG. 15 shows 8 consecutive frames: t = 0 to 8T.
leaving t = 0, 3T, 4T, and 7T frames,
delete frames of t = T, 2T, 5T, 8T,
FIG. 6 is a graph when the temporal thinning is performed in the above-described manner, and shows a change in super-resolution conditions of a spatial thinning amount: m = 2 pixels and a movement amount: v = 1-2 pixels / frame. The solid line corresponds to the above formula (Formula 2a), and the dotted line corresponds to the above formula (Formula 2b). This thinning mode corresponds to the time direction thinning mode described above with reference to FIG.
図15から、実線および点線のグラフが−1〜+1の範囲にあるのは、移動量:v=1〜1.15ピクセル/フレームの移動量がある場合と、移動量:v=1.6〜1.8ピクセル/フレームの移動量がある場合である。 From FIG. 15, the solid line and dotted line graphs are in the range of −1 to +1 because there is a movement amount: v = 1 to 1.15 pixels / frame, and a movement amount: v = 1.6. This is the case when there is a movement amount of ˜1.8 pixels / frame.
図14、図15から理解されるように、時間方向の間引き態様によって、超解像効果の得られる移動量の範囲が異なっている。従って、計測され移動量に応じて最適な時間方向間引きを実行することで、超解像効果を持つデータを生成することができるということになる。図16は、移動量:v=1.25ピクセルの前後で、時間方向の間引き態様を変更した処理を行った場合のグラフであり、空間間引き量:m=2ピクセル、移動量:v=1〜2ピクセル/フレームの超解像条件の変化を示す。実線が上記式(式2a)に対応し、点線が上記式(式2b)に対応する。 As can be understood from FIGS. 14 and 15, the range of the amount of movement in which the super-resolution effect can be obtained differs depending on the thinning mode in the time direction. Therefore, data having a super-resolution effect can be generated by performing the thinning out in the time direction that is measured according to the measured movement amount. FIG. 16 is a graph in the case where the process of changing the thinning mode in the time direction is performed before and after the movement amount: v = 1.25 pixels. The spatial thinning amount: m = 2 pixels, the movement amount: v = 1. The change in super-resolution condition of ~ 2 pixels / frame is shown. The solid line corresponds to the above formula (Formula 2a), and the dotted line corresponds to the above formula (Formula 2b).
図16に示すグラフは、
移動量:v=1.0〜1.25では、4フレームt=0〜3T中の0,3Tを残し、T,2Tを間引く時間方向間引き処理(図10に相当)
移動量:v=1.25〜2.0では、4フレームt=0〜3T中の0,2Tを残し、T,3Tを間引く時間方向間引き処理(図11に相当)
を実行した場合のグラフである。
The graph shown in FIG.
Movement amount: When v = 1.0 to 1.25, 0 and 3T in 4 frames t = 0 to 3T are left, and time direction thinning processing is performed to thin out T and 2T (corresponding to FIG. 10).
In the movement amount: v = 1.25 to 2.0, 0 and 2T in 4 frames t = 0 to 3T are left, and T and 3T are thinned out (corresponding to FIG. 11).
It is a graph at the time of performing.
このグラフでは、v=1.0〜1.8ピクセル/フレームの範囲において、実線および点線のグラフが−1〜+1の範囲にあり、この範囲において超解像効果が得られることが示される。 In this graph, in the range of v = 1.0 to 1.8 pixels / frame, the solid line and dotted line graphs are in the range of −1 to +1, and it is shown that the super-resolution effect is obtained in this range.
このように、移動量に応じて、時間方向間引きの態様を変更することで超解像効果を持つデータを生成することが可能となり、データ量は削減されているにもかかわらず、復号化時の画像劣化を抑制した高品質なデータを生成することができる。 In this way, it is possible to generate data with a super-resolution effect by changing the mode of thinning out in the time direction according to the amount of movement. It is possible to generate high quality data that suppresses image degradation.
[(3)本発明に従った動画像伸張処理を実行する装置および方法]
次に、本発明に従った動画像伸張処理を実行する装置および方法について説明する。まず、以下において説明する動画像伸張を実行する動画像復元装置において、復元対象となる圧縮された動画像データについて説明する。
[(3) Apparatus and method for executing moving image expansion processing according to the present invention]
Next, an apparatus and method for executing a moving image expansion process according to the present invention will be described. First, a description will be given of compressed moving image data to be restored in a moving image restoration apparatus that performs moving image decompression described below.
以下において説明する動画像復元装置の復元対象データは、上述したブロック毎の移動量に基づいて異なる間引き処理、すなわち空間間引き、時間間引きを実行したデータである。すなわち、先に説明した「(1)超解像効果を利用した動画像変換装置の基本構成」や、[(2)本発明に従った動画像圧縮処理を実行する装置および方法]に従って、ブロックの移動量に応じた空間間引き、時間方向間引き処理を実行した圧縮符号化データの復号、伸張処理を実行する。 The restoration target data of the moving image restoration apparatus described below is data obtained by performing different thinning processing, that is, space thinning and time thinning based on the above-described movement amount for each block. That is, according to the above-described “(1) Basic configuration of moving image conversion apparatus using super-resolution effect” and [(2) Apparatus and method for executing moving image compression processing according to the present invention] Decoding / decompression processing of compression-encoded data that has been subjected to spatial thinning and time-direction thinning processing according to the amount of movement is executed.
すなわち、ブロック分割した動画像フレームデータにおいて、フレーム間の移動量が大である場合は、空間間引き処理を実行し、フレーム間の移動量が小である場合は、時間間引き処理を実行し、その中間である場合は、空間間引きと時間間引きを実行するという動画像の微小領域毎に移動速度情報に応じて最適なフレームレートと空間解像度を決定してデータ量の圧縮を行ったデータの復号、伸張処理を実行する。 That is, in the moving image frame data divided into blocks, when the amount of movement between frames is large, a space thinning process is executed, and when the amount of movement between frames is small, a time thinning process is executed, If it is in the middle, decoding the data with compression of the amount of data by determining the optimal frame rate and spatial resolution according to the moving speed information for each minute area of the moving image to perform spatial thinning and time thinning, Execute decompression processing.
以下において説明する動画像復元装置は、人間の視覚系における時間積分機能を利用し、動被写体を目で追いかけるときに生じる超解像効果に基づいて、移動量に応じて移動方向に空間的な間引き処理を行ったデータの復号、伸張処理を実行する。 The moving image restoration apparatus described below uses a time integration function in the human visual system, and based on the super-resolution effect that occurs when a moving subject is chased with eyes, the moving image restoration device spatially moves in the moving direction according to the moving amount. Decryption / decompression processing of the thinned data is executed.
まず、図17を参照して、復元処理対象となるデータの生成処理、すなわち間引き処理データについて説明する。図17に示すのは、先に[(2)本発明に従った動画像圧縮処理を実行する装置および方法]の欄において、図8を参照して説明した動画像変換装置に対応する構成であり、ブロック分割手段100、ブロック処理部208、ブロック合成手段105、符号化器106の構成は、図7、図8を参照して説明したと同様の処理を実行する構成であるので詳しい説明は省略する。
First, with reference to FIG. 17, a generation process of data to be restored, that is, a thinning process data will be described. FIG. 17 shows a configuration corresponding to the moving image conversion apparatus described above with reference to FIG. 8 in the section [(2) Apparatus and method for executing moving image compression processing according to the present invention]. The
すなわち、ブロック分割した動画像フレームデータにおいて、フレーム間の移動量が大(例えば2ピクセル/フレーム以上)である場合は、ブロック処理部a204において空間間引き処理を実行し、フレーム間の移動量が小(例えば1ピクセル/フレーム未満)である場合は、ブロック処理部b205において時間間引き処理を実行し、その中間(例えば1〜2ピクセル/フレーム)である場合は、ブロック処理部c206において空間間引きと時間間引きを実行する。 That is, in the moving image frame data divided into blocks, when the movement amount between frames is large (for example, 2 pixels / frame or more), the spatial thinning process is executed in the block processing unit a204, and the movement amount between frames is small. If it is (for example, less than 1 pixel / frame), a time thinning process is executed in the block processing unit b205, and if it is in the middle (for example, 1 to 2 pixels / frame), spatial thinning and time are performed in the block processing unit c206. Perform thinning.
各移動量に応じて異なる態様で間引き処理がなされた後、パック処理部371〜373においてパック処理がなされ、その後ブロック合成手段105においてブロック合成がなされる。ブロック合成手段105は異なる間引き処理が行われたブロックをNフレーム分の画像に合成する処理を行う。合成された画像はブロック毎に異なる圧縮処理としての間引き処理が行われた画像フレームデータとなり、その画像は符号化器106に送り符号化される。
After thinning processing is performed in a different manner depending on each moving amount, pack processing is performed in the
ブロック合成手段105の役割は、ブロック処理部204〜206によって処理されたブロックを符号化器106により符号化可能な動画像として合成することにある。本実施例では、処理されたブロックを元のフレームに再構成し240fpsの動画像として符号化を行う。また、別の実施例では、符号化器において符号化可能なフレームレートが240fpsでない場合、本実施例では入力動画像のフレームレートを240fpsとし、ブロック合成手段105において符号化器106において符号化可能な60fps動画像に合成する。ただし、これらのフレームレート値は本実施例のための一例に過ぎず、実際はどのようなフレームレートであっても良い。
The role of the
パック処理部a371、パック処理部b372、パック処理部c373はそれぞれ異なる動作をおこなう。まず第1のパック処理部a371の処理について図18を用いて説明する。パック処理部a371の入力はブロック処理部a204の出力である。ブロック処理部a204の出力は画素の空間間引き処理を施された連続する4フレームそれぞれから得られた4つのブロックである。すなわち、図3を参照して説明した態様での空間間引きが実行された4つのブロックである。 The pack processing unit a371, the pack processing unit b372, and the pack processing unit c373 perform different operations. First, the processing of the first pack processing unit a371 will be described with reference to FIG. The input of the pack processing unit a371 is the output of the block processing unit a204. The output of the block processing unit a204 is four blocks obtained from each of four consecutive frames that have undergone pixel spatial thinning processing. That is, there are four blocks that have been subjected to space thinning in the manner described with reference to FIG.
これらのブロックは図18においてブロック375〜378として表記している。これらのブロックの内部の1x4画素、例えば図18における画素380〜383では、ブロック処理部a204による空間間引きがなされ、全て同じ値に変換されている。具体的には、ブロック375の1x4画素の画素値は全てp1であり、他のブロック376〜378に関しても同様である。第1のパック処理部a371は、これら4つの画素値p1〜p4によって一つの1x4画素の領域を構成することでフレーム数を1/4にする処理を行なう。
These blocks are represented as
すなわち、図18におけるブロック379はパック処理部a371の出力であり、ある1x4画素からなる画素領域384の画素値はp1からp4によって構成される。以上はブロック処理装置が水平方向の間引き処理、つまり、1x4画素に対する間引き処理を行った場合であり、4x1画素、2x2画素の場合においても同様のパック処理がパック処理部a371によって行われる。なお、図18に示す例においては画素値p1〜p4を左から順に並べることで画素領域384を構成したが、画素値を並べる順序については、様々な手法が適用できる。パックアルゴリズムと、復号、画素値補間処理において実行するアンパック処理のアルゴリズムが整合していればよい。
That is, a
次に、第2のパック処理部b372の処理について説明する。パック処理部b372への入力はパック処理部a371と同様に連続する4フレームから得られる4つのブロックであるが、パック処理部a371と異なり、これらのブロックは、時間方向の間引きがなされたフレーム対応のブロック(図4参照)であり、選択された代表画素値は、フレーム共通であり、完全に同一な画素値を持つブロックとなる。従って、4つのブロックのうち適当な1つのブロックをパック処理部b372の出力とするパック処理を実行する。 Next, the processing of the second pack processing unit b372 will be described. The input to the pack processing unit b372 is four blocks obtained from four consecutive frames in the same manner as the pack processing unit a371. Unlike the pack processing unit a371, these blocks correspond to frames that have been thinned out in the time direction. The selected representative pixel value is common to the frames and is a block having completely the same pixel value. Accordingly, a pack process is executed in which an appropriate one of the four blocks is output from the pack processing unit b372.
続いて、第3のパック処理部c373の処理について、図19を参照して説明する。パック処理部c373への入力は他のパック処理装置と同様に連続する4フレームから得られる4つのブロックである。これらは、空間間引きと時間間引きの施されたブロックである。図19に示すように、これらのブロックのうち1番目と2番目のフレームから得られるブロック、すなわち、ブロック385とブロック386は同一の画素値(P1)391,392をもつ。また3番目と4番目のフレームから得られるブロック、すなわち、ブロック387とブロック388も同一の画素値(P3)393,394をもつ。
Next, the process of the third pack processing unit c373 will be described with reference to FIG. The input to the pack processing unit c373 is four blocks obtained from four consecutive frames as in the other pack processing apparatuses. These are blocks subjected to space thinning and time thinning. As shown in FIG. 19, the blocks obtained from the first and second frames, that is, the
パック処理部c373は、2番目のフレーム対応のブロック386と、3番目のフレームから得られるブロック387の2つのブロックを用いて、パック処理を実行する。図18を参照して説明したパック処理部a371は、4画素単位での処理を実行したが、パック処理部c373は、2画素単位の処理となる。すなわち、図19の画素391〜394に示すように、隣接する2画素が同じ値となっており、これらの画素を画素395のように並べて出力ブロック389を構成することでフレームレートを1/4にすることができる。なお、図19では1x2画素単位での間引き処理について示したが、2x1画素単位で処理を行う場合も同様である。さらに、図19の出力ブロック389の画素395は、ではp2を左にp3を右に配置する設定としたが、画素値を並べる順序については、様々な手法が適用できる。パックアルゴリズムと、復号、画素値補間処理において実行するアンパック処理のアルゴリズムが整合していればよい。
The pack processing unit c373 executes the pack process using two blocks, a
次に、図20以下を参照して動画像伸張処理を実行する動画像復元装置の構成および処理について説明する。図20は、動画像復元装置の構成を示すブロック図である。 Next, the configuration and processing of a moving image restoration apparatus that performs moving image expansion processing will be described with reference to FIG. FIG. 20 is a block diagram illustrating a configuration of the moving image restoration apparatus.
本実施形態の動画像復元装置は、先に説明した「(1)超解像効果を利用した動画像変換装置の基本構成」や、[(2)本発明に従った動画像圧縮処理を実行する装置および方法]に従って、ブロックの移動量に応じた空間間引き、時間方向間引き処理を実行した圧縮符号化データの復号、伸張処理を実行する装置である。図20に示す動画像復元装置は、符号化された動画像データを入力して、復号化器400にて復号する。復号化器400における復号処理は、例えばMPEG符号化データの復号処理である。ブロック移動量取得手段402は、復号化器400より復号化されたブロック移動量を動きベクトルとして取得し、取得された動きベクトルをブロック移動量として時間間引きブロック判定手段403および空間間引きブロック判定手段404へ送る。
The moving image restoration apparatus according to the present embodiment executes “(1) basic configuration of moving image conversion apparatus using super-resolution effect” or “(2) moving image compression processing according to the present invention” described above. In accordance with the apparatus and method, the apparatus performs decoding and decompression processing of compression-encoded data that has been subjected to spatial thinning and time-direction thinning processing according to the amount of block movement. The moving image restoration apparatus shown in FIG. 20 receives encoded moving image data and decodes it by the
時間間引きブロック判定手段403は、ブロック移動量取得手段402より送られてきたブロック移動量からフレーム内の各ブロックが時間方向に間引かれているか否か、また、間引かれている場合はどのフレームが間引かれているかを判定し、その判定結果とブロック移動量をブロック補間手段401へ送る。
The time-decimated block determination means 403 determines whether or not each block in the frame is thinned out in the time direction from the block movement amount sent from the block movement amount acquisition means 402, and if it is thinned out, It is determined whether the frame is thinned out, and the determination result and the block movement amount are sent to the
空間間引きブロック判定手段404は、ブロック移動量取得手段402より送られてきたブロック移動量からフレーム内の各ブロックが空間方向に間引かれているか否か、また、間引かれている場合はどのくらい間引かれているかを判定し、その判定結果とブロック移動量をブロック補間手段401へ送る。
The spatial thinning
ブロック補間手段401は、復号化器400から送られてきた復号された動画像内の時間軸方向に間引かれているブロックを、時間間引きブロック判定手段403および空間間引きブロック判定手段404から送られてきた判定結果より判断し、時間軸方向に間引かれていると判定されたフレーム内ブロックに対して、他の間引かれていないフレーム内ブロックから補間を行う。
The
また、動画像復元装置の別の構成を図21に示す。図21に示す動画像復元装置は、ブロック間引き情報取得手段411を有する点が、図20に示す構成と異なる点である。図21に示す動画像復元装置においては、符号化された動画像データを入力して、復号化器400にて復号する。この復号処理は、例えばMPEG符号化データの復号処理である。ブロック移動量取得手段402は、復号化器400より送られてくる復号された動画像から動きベクトルを検出し、検出された動きベクトルをブロック移動量としてブロック補間手段401へ送る。ブロック間引き情報取得手段411は、復号化器400より復号化されたブロック間引き情報を取得し、時間間引きブロック判定手段403および空間間引きブロック判定手段404へ送る。
FIG. 21 shows another configuration of the moving image restoration apparatus. The moving image restoration apparatus shown in FIG. 21 is different from the configuration shown in FIG. 20 in that it includes a block thinning
時間間引きブロック判定手段403は、ブロック間引き情報取得手段411より送られてきたブロック間引き情報から、フレーム内の各ブロックが時間方向に間引かれているか否か、また、間引かれている場合はどのフレームが間引かれているかを判定し、その判定結果とブロック移動量をブロック補間手段401へ送る。
The time decimation
空間間引きブロック判定手段404は、ブロック間引き情報取得手段411より送られてきたブロック間引き情報から、フレーム内の各ブロックが空間方向に間引かれているか否か、また、間引かれている場合はどのくらい間引かれているかを判定し、その判定結果とブロック移動量をブロック補間手段401へ送る。
The spatial thinning
ブロック補間手段401は、復号化器400から送られてきた復号された動画像内の時間軸方向に間引かれているブロックを、時間間引きブロック判定手段403および空間間引きブロック判定手段404から送られてきた判定結果より判断し、時間軸方向に間引かれていると判定されたフレーム内ブロックに対して、他の間引かれていないフレーム内ブロックから補間を行う。
The
続いて、図22以下を参照して、ブロック補間手段401の構成および処理について説明する。図22はブロック補間手段401の構成、および周辺部構成を示すブロック図である。
Next, the configuration and processing of the
復号化器400は、図17を参照して説明した動画像変換装置において符号化された動画像データの復号を実行する。例えばMPEG復号処理を実行する。この復号の結果として得られるデータは、先に図18、図19等を参照して説明したパック処理された間引きデータである。
The
復号化器400は、本実施例の一つである、240fpsの動画像として符号化された動画像が入力された場合は、符号化データを復号し、動画像変換装置における間引き処理時の動画像と同じフレームレートの動画像として出力する。また別の実施例では入力動画像のフレームレートを240fpsとし、符号化時のフレームレートを60fpsとしたため60fpsの動画像に復号化した後240fpsの動画像として出力する。ただし、これらのフレームレート値は本実施例のための一例に過ぎず、実際はどのようなフレームレートであっても良い。
When a moving image encoded as a 240 fps moving image, which is one of the embodiments, is input to the
図23は復号化器400の構成を示すブロック図である。以下、本実施例における復号化器の動作について述べる。図17に示した動画像変換装置における符号化器106において符号化された動画像は、図23に示す動画像復号化部521において復号される。同時に、図17に示した動画像変換装置における移動量検出部202において出力された移動量を示すフラグ207を符号化したブロック移動量情報、または、ブロック分配条件フラグが存在する場合は、図23に示す復号化器400のフラグ復号化部522において復号化される。
FIG. 23 is a block diagram showing a configuration of the
復号化された動画像は、フレーム毎にブロック分割部523においてある大きさ(8pixel×8pixelや16pixel×16pixel等)に分解されアンパック処理部a524、アンパック処理部b525、アンパック処理部c526に送られる。この時、分割されたブロックは、復号化されたブロック移動量、またはブロック分配条件フラグによりアンパック処理部a524〜c526に分配される。
The decoded moving image is decomposed into a certain size (8 pixels × 8 pixels, 16 pixels × 16 pixels, etc.) in the
例えば、ブロック分割部523は、ブロック分配条件フラグを用いて各ブロックをアンパック処理部a524〜c526に分配する。フラグの値が時間方向間引き無しであればアンパック処理部a524へ、時間方向1/2間引きであればアンパック処理部c526へ、時間方向1/4間引きであればアンパック処理部b525へ分配する。
For example, the
また、ブロック移動量を用いた分配を行なう場合は、分配条件は、図17に示した動画像変換装置におけるブロック処理部204〜206における間引き条件と一致させなければならない。本実施例では、ブロックの水平方向、垂直方向の移動量がともに2ピクセル以上であった場合は、空間間引きのみが実行されたブロックであると判定し、空間間引き対応のアンパック処理を実行するアンパック処理部a524へブロックを出力し、水平方向、垂直方向の移動量がともに1ピクセル未満であった場合には、時間方向の間引きのみが実行されたブロックであると判定し、時間間引き対応のアンパック処理を実行するアンパック処理部b525へブロックを出力し、水平方向、垂直方向の移動量のいずれかが2ピクセル未満、1ピクセル以上であった場合には、空間間引きと時間間引きの双方が実効されたブロックであると判定し、これらの間引き対応のアンパック処理を実行するアンパック処理部c526へブロックを出力する。
Further, when performing distribution using the block movement amount, the distribution condition must match the thinning condition in the
アンパック処理部a524〜c526は、それぞれ、図17に示した動画像変換装置におけるパック処理部a371〜c373に対応しており、パック処理部a371〜c373によってパック処理されたブロックをアンパックして元に戻す動作を行う。
The unpack processing units a 524 to
まず、図17に示した動画像変換装置におけるパック処理部a371に対応する、アンパック処理部a524の処理について図18を参照して説明する。アンパック処理部a524の入力は、ブロック分割部523から出力されたブロック、すなわち、図17に示した動画像変換装置におけるパック処理部a371において4フレームから得られた4つのブロックを1つにパックしたブロックである。パックされたブロックは図18において示すブロック379である。
First, processing of the unpack processing unit a 524 corresponding to the pack processing unit a 371 in the moving image conversion apparatus shown in FIG. 17 will be described with reference to FIG. The input of the unpack processing unit a524 is the block output from the
このブロックの内部の1×4画素、例えば図18におけるブロック379の画素384は、図17に示した動画像変換装置におけるパック処理部a371においてパックされた4フレーム分の画素p1〜p4である。アンパック処理部a524はこの4つの画素p1〜p4を4フレーム分のブロックに拡張することでフレーム数を4倍にする。
The 1 × 4 pixels inside this block, for example, the
すなわち、図18におけるブロック379がアンパック処理部a524の入力であり、アンパック処理部a524はブロック379を4フレーム分に拡張してブロック375〜378の4つのブロックを構成し出力する。以上はブロック処理装置が水平方向の間引き処理、つまり、1x4画素に対する間引き処理が行われた場合であり、4x1画素、2x2画素の間引き処理が行われたブロックにおいても同様のアンパック処理がアンパック処理部a524によって行われる。
That is, a
なお、アンパック処理部a524が想定するパックされたブロックの画素p1〜p4の順序は、図17に示した動画像変換装置におけるパック処理部a371において処理した際の画素順と一致させる個とが必要である。 Note that the order of the pixels p1 to p4 of the packed block assumed by the unpack processing unit a524 is required to match the pixel order when processed in the pack processing unit a371 in the moving image conversion apparatus shown in FIG. It is.
次に、図17に示した動画像変換装置における第2のパック処理部b372に対応するアンパック処理を実行するアンパック処理部b525の処理について説明する。図17に示した動画像変換装置における第2のパック処理部b372では、時間方向間引きによって構成される4フレームから得られた4つのブロックのうち適当な1つを出力しているため、アンパック処理部b525では得られた1つのブロックを4つのブロックに単純コピーを行い、4フレーム分に拡張することによってフレーム数を4倍にする。 Next, the process of the unpack processing unit b525 that executes the unpacking process corresponding to the second pack processing unit b372 in the moving image conversion apparatus illustrated in FIG. 17 will be described. Since the second pack processing unit b372 in the moving image conversion apparatus shown in FIG. 17 outputs an appropriate one of the four blocks obtained from the four frames formed by the time direction thinning, the unpacking process is performed. In the part b525, the obtained one block is simply copied to four blocks, and the number of frames is quadrupled by extending it to four frames.
続いて、図17に示した動画像変換装置における第3のパック処理部c373のパック処理に対応するアンパック処理を実行するアンパック処理部c526の処理について図19を参照して説明する。アンパック処理部c526の入力は、ブロック分割部523から出力されたブロックであり、空間間引きおよび時間間引きの双方を間引き処理として実行したブロックに対応する。図17に示した動画像変換装置における第3のパック処理部c373において4フレームから得られた4つのブロックを1つにパックしたブロックである。パックされたブロックは図19において示すブロック389である。
Next, the process of the unpack processing unit c526 that executes the unpacking process corresponding to the packing process of the third pack processing unit c373 in the moving image conversion apparatus shown in FIG. 17 will be described with reference to FIG. The input of the unpack processing unit c526 is a block output from the
このブロックの内部の1×2画素、例えば図19において示すブロック389の画素495は、図17に示した動画像変換装置における第3のパック処理部c373においてパックされた4フレーム分の画素p1〜p2である。アンパック処理部c526はこの2つの画素p1〜p2を4フレーム分のブロックに拡張することでフレーム数を2倍にする。
すなわち、図19におけるブロック389がアンパック処理部c526の入力であり、アンパック処理部c526はブロック389を4フレーム分に拡張してブロック385〜388の4つのブロックを構成し出力する。なお、図では1x2画素単位での間引き処理について示したが、2x1画素単位で処理を行う場合も同様である。ただし、アンパック処理部c526が想定するパックされたブロックが素p1〜p2の各フレームへのコピー先と順序は、図17に示した動画像変換装置における第3のパック処理部c373において処理した際の画素位置と画素順に一致させなければならない。
The 1 × 2 pixels inside this block, for example, the pixel 495 of the
That is, a
以上、説明したように、アンパック処理部a524〜c526においてアンパック処理が実行され、フレームレートを4倍に変換された動画像は、ブロック合成部527に入力されて各フレーム毎に合成され、図17に示した動画像変換装置に入力された動画像と同じフレームレートの動画像として出力される。
As described above, the unpack processing is performed in the unpack processing units a524 to c526, and the moving image whose frame rate has been converted to four times is input to the
図22における復号化器400において復号された動画像は、ブロック補間手段401内の画像蓄積部500において、Lフレーム分蓄積される。なお、後述される移動量検出部508において、蓄積されたフレームからブロック移動量を検出する場合は、移動量検出に必要な分のフレームを蓄積する必要があり、本実施例ではL=5である。また、移動量として復号化器で復号された移動量を用いる場合は、符号化時に用いた画像蓄積部200、すなわち、図17に示した動画像変換装置の画像蓄積部200と同じフレーム数を蓄積することが望ましく、本実施例ではL=4である。
The moving image decoded by the
図22に示すブロック補間手段401内の画像蓄積部500に蓄積されたフレームはブロック分割部501においてある大きさ(8pixel×8pixelや16pixel×16pixel等)に分解されブロック分配部502に送られる。なお、この処理ブロックは、図17に示した動画像変換装置における符号化時に用いたブロック分割部201で分割されたブロックサイズと同じでなければならない。
The frames accumulated in the
画像蓄積部500に蓄積されたフレームとブロック分割部501において分割されたブロックのサイズは、ブロック移動量取得手段402に送られる。ブロック移動量取得手段402は、移動量検出部508において、復号化器400より復号済みのブロック移動量を動きベクトルとして検出して、出力407として動きベクトルをブロック移動量として時間間引きブロック判定手段403へ送る。
The frame accumulated in the
時間間引きブロック判定手段403では、入力されたブロック移動量から時間方向に間引かれているブロックを判定し、各ブロックの時間方向の間引き量と入力されたブロック移動量をブロック分配部502へ出力する。この判定は、図17に示した動画像変換装置におけるブロック分配部203の分配条件のうち、ブロック処理部a204〜c206のいずれかにおいて実行される間引き条件と一致させなければならない。そのため本実施例では、ブロック移動量取得手段402から得られたブロック移動量が、ブロックの水平方向、垂直方向の移動量がともに1ピクセル未満であった場合に時間方向1/4に間引き、水平方向、垂直方向の移動量のいずれかが2ピクセル未満、1ピクセル以上であった場合に時間方向1/2間引きが実行されたものと判定する。
The time-decimation block determination means 403 determines the blocks that are thinned out in the time direction from the input block movement amount, and outputs the thinning-out amount in the time direction of each block and the input block movement amount to the
なお、図21に示した構成を持つ動画像復元装置では、復号化器400において入力データに含まれる時間軸間引きブロック判定フラグを復号し、ブロック間引き情報取得手段411に出力する。ブロック間引き情報取得手段411はブロック移動量取得手段402と時間間引きブロック判定手段403に、取得したフラグを出力する。ブロック移動量取得手段402は時間軸間引きブロック判定フラグからブロック移動量を求める。
In the moving picture restoration apparatus having the configuration shown in FIG. 21, the
図21に示した構成を持つ動画像復元装置では、フラグとして時間方向間引き無し、時間方向1/2間引き、時間方向1/4間引き、の3つのフラグと、上下左右のいずれかの値であるブロック移動方向フラグ使用し、この判定フラグとブロック移動方向フラグと符号化時に用いたブロック分配部203(図17参照)の分配条件からブロックの移動量を取得する。ブロックの移動量はブロック分配部203の分配条件と対応させ、時間方向1/2間引きであれば移動量を1ピクセル移動方向を移動方向フラグの方向とし、時間方向1/4間引きであれば移動量を0ピクセルとした。
In the moving image restoration apparatus having the configuration shown in FIG. 21, three flags of no time direction decimation, 1/2 decimation in time direction, and decimation in 1/4 in time direction are used as flags, and the values are up, down, left, and right. The block movement direction flag is used, and the block movement amount is acquired from the determination flag, the block movement direction flag, and the distribution condition of the block distribution unit 203 (see FIG. 17) used at the time of encoding. The movement amount of the block is made to correspond to the distribution condition of the
また、別の構成例としては、図22に示すブロック移動量取得手段402内の移動量検出部508において、画像蓄積部500に蓄積されたフレームの内R番目とS番目の時間軸方向に間引かれていないフレームを取得し、ブロック分割部501からのフレームが分割されたブロックのサイズに合わせたブロック単位で、既存の手法、例えばブロックマッチング手法等を用いてフレームの各々のブロックに関する動きベクトルを検出する構成としてもよい。本構成例では時間軸に間引かれているか否かの判定に、復号化器400より出力507として出力された復号済みの時間軸間引きブロック判定フラグを使用し、時間方向間引き無しの時はR=2、S=3、時間方向1/2間引きの時はR=1、S=3、時間方向1/4間引きの時はR=1、S=5、とする設定とした。この値は、符号化側で時間軸方向に間引かれていないフレームの値と同じでなければならない。
As another configuration example, in the movement
図22における時間間引きブロック判定手段403では、復号化器400より出力407として出力された復号済みの時間軸間引きブロック判定フラグ、または、ブロック間引き情報取得手段411から出力された時間軸間引きブロック判定フラグを入力し、そのフラグに基づいて各ブロックの時間方向の間引き量をブロック分配部502へ出力する。本実施例では、フラグとして時間方向間引き無し、時間方向1/2間引き、時間方向1/4間引き、の3つのフラグを使用した。
In the time decimation
ブロック分配部502では、入力されたNフレーム分のブロックを時間間引きブロック判定手段403より得られた時間方向の間引き量を元に間引き処理のなされたブロックデータをブロック補間部504〜505のいずれかに出力し、さらに、時間間引きブロック判定手段403より得られた時間方向の間引き量とブロック移動量をも一緒に出力する。また時間方向の間引きがないブロックに関しては、ブロック補間処理を行わないで出力503としてブロック合成部506へ出力する。
In the
本実施例では、ブロック移動量取得手段402の検出したブロック移動量が、ブロックの水平方向、垂直方向の移動量がともに1ピクセル未満であった場合にブロック補間部b505、水平方向、垂直方向の移動量のいずれかが2ピクセル未満、1ピクセル以上であった場合にブロック補間部a504への出力を行った。つまり、時間方向に1/4に間引かれているブロックに関してはブロック補間部b505へ、時間方向に1/2に間引かれているブロックに関してはブロック補間部a504への出力を行い、それぞれのブロック補間部において、間引き態様に応じた補間処理を行なう。
In this embodiment, when the block movement amount detected by the block movement
ブロック合成部506は異なる補間処理が行われた、もしくは行われなかったブロックをNフレーム分の画像に合成する処理を行う。合成された画像はブロック毎に異なる補間処理が行われた、復号された動画像となる。
A
続いて本実施例における、ブロック補間部a504、ブロック補間部b505の実行するブロック補間処理について説明する。図24はブロック補間部b505、図25は、ブロック補間部a504の構成を示すブロック図である。 Next, block interpolation processing executed by the block interpolation unit a504 and the block interpolation unit b505 in this embodiment will be described. 24 is a block diagram showing the configuration of the block interpolation unit b505, and FIG. 25 is a block diagram showing the configuration of the block interpolation unit a504.
まず、図24に示すブロック補間部b505の構成、処理について説明する。復号化されたブロックはブロック蓄積部541においてNフレーム分蓄積される。ブロック蓄積部541において蓄積されたブロックは、ブロック移動処理部542において、ブロック移動量に従って移動される。ブロック移動処理部542は、時間方向に間引かれたブロックをブロック蓄積部541から取得し、ブロック分配部502(図22参照)から出力された時間方向の間引き量とブロック移動量を元に、ブロック移動方向にフレーム上で移動させる。
First, the configuration and processing of the block interpolation unit b505 shown in FIG. 24 will be described. Decoded blocks are stored in the
図26にブロック移動処理部542におけるブロック移動処理の具体例を示す。図26において、P番目のフレームを801、時間方向に次のP+1番目のフレームを802と示し、ブロック803は時間間引きされなかったブロック、ブロック804はアンパック処理部b525、アンパック処理部c526によってブロック803をコピーしたブロックを示す。
FIG. 26 shows a specific example of block movement processing in the block
ブロック移動処理部542は、この様なコピーされたブロックを、ブロック分配部502(図22参照)から取得したブロック移動量分だけフレーム上で移動させる。図26では右方向にQピクセル/フレームの移動方向を取得したとしてブロックをQピクセル右方向へ移動し、移動したブロックがブロック806である。移動の際に生じる隙間809は、ブロックがコピーされた際の画素を残してもよいし、周囲の画素から補間してもよい。
この処理により、時間間引きされたブロックが符号化前のブロックと同じ位置となり、もとの画像が復元できると期待される。
The block
By this processing, the block whose time is thinned out is in the same position as the block before encoding, and it is expected that the original image can be restored.
ブロック合成部543はブロック移動処理が行われたブロックと行われていないブロックをNフレーム分の画像に合成する処理を行う。合成されたNフレーム分のブロックは、ブロック移動処理部542により移動を伴う補間が実行されたブロックについてのみ、帯域制限部544において時間方向にフィルタ処理がなされた後、復号された動画像となる。
The
帯域制限部544においては主にローパスフィルタが用いられるが、本実施例においてはローパスフィルタの特別な場合であるブラー処理、すなわちぼかし処理を行った。本実施例では、ブロック補間部c505(図22参照)に入力されるブロックの移動量は、水平方向、垂直方向の移動量がともに1ピクセル未満のブロックであるため、Nフレームにわたるブロックの移動量が小さい。そのため、ピクセル単位に移動処理を行った場合は移動処理が行われないブロックが生じるため、動きの不自然さをより改善させるためにブラー処理を行った。画像をぼかすブラー処理による副作用の影響は、移動量が小さいため無視できるとした。
In the
本実施例におけるブラー処理は、下式(式3)に従って、入力画素値から出力画素値算出する処理として実行される。
上記式において、in()はブロック合成部543から出力された帯域制限部544の入力画素、out()は出力画素、fはフレーム番号x,yはフレーム内画素座標値、modは剰余演算子である。
In the above equation, in () is the input pixel of the
続いて図25を参照して、ブロック補間部a504について説明する。処理の流れはブロック補間部b505とほぼ同一であるので、異なる点についてのみ説明を行う。ブロック補間部a504においては、ブロック補間部b505と異なり、ブロック移動装置602において、二種類のブロック移動処理部607、608を、ブロック移動選択部606がブロック移動量にしたがって選択して、ブロック移動処理を行う。これは時間方向1/2間引きが行われているブロックの間引かれているフレームがブロック移動速度に依存して変えられている場合があるからである。
Next, the block interpolation unit a504 will be described with reference to FIG. Since the processing flow is almost the same as that of the block interpolation unit b505, only the differences will be described. In the block interpolation unit a504, unlike the block interpolation unit b505, in the
たとえば、先に説明した[(2)本発明に従った動画像圧縮処理を実行する装置および方法]において、図10、図11を参照して説明したように、時間方向の間引きを行なう動画像変換装置において、例えば、圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する場合、移動量が大きい場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、移動量が小さい場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行する場合に対応するものである。 For example, in the above-described [(2) Apparatus and method for executing moving image compression processing according to the present invention], as described with reference to FIGS. In the conversion device, for example, when the time direction thinning process with a compression ratio of 1/2 is executed in units of four consecutive frames, if the movement amount is large, the first frame and the third frame are left, and the second Performs thinning processing in the time axis direction to thin out the fourth frame, and if the amount of movement is small, the thinning processing in the time axis direction to thin out the second and third frames while leaving the first frame and the fourth frame Corresponds to the case of executing.
このように、P〜P+3フレームの4つのフレーム中において、ブロック移動量が1ピクセル/フレーム以上1.25ピクセル/フレーム未満であればP+1、P+2フレームのブロックを間引き、1.25ピクセル/フレーム以上2ピクセル/フレーム未満であればP+1、P+3フレームのブロックを間引くような構成に対応する復元処理を行なうため、復元ブロックの移動方向を間引き処理に対応するように変更可能としたものである。 As described above, in the four frames of P to P + 3 frames, if the block movement amount is 1 pixel / frame or more and less than 1.25 pixels / frame, the blocks of P + 1 and P + 2 frames are thinned out, and 1.25 pixels / frame or more are obtained. Since restoration processing corresponding to a configuration in which blocks of P + 1 and P + 3 frames are thinned out if it is less than 2 pixels / frame, the moving direction of the restoration blocks can be changed to correspond to thinning processing.
ここで、与えられるブロック移動量はフレームが時間軸方向に増加する方向のブロック移動量として与えられるが、P+2フレームのブロックが間引かれている場合、P+2フレームは、より時間的に近いP+3フレームのブロックから補間するほうが望ましい。そこで、P+1、P+2フレームのブロックが間引かれているとき、P+2フレームは逆方向ブロック移動処理部608を使用し、ブロック移動量を逆方向にしてP+3フレームから補間するようにする。
Here, the given block movement amount is given as a block movement amount in the direction in which the frame increases in the time axis direction. When P + 2 frame blocks are thinned out, P + 2 frame is closer in time to P + 3 frame. It is preferable to interpolate from these blocks. Therefore, when the blocks of P + 1 and P + 2 frames are thinned out, the backward block
残りのブロックはブロック補間部b505と同様に、順方向ブロック移動処理部607を用いて、一つ前のフレームのブロックからブロック移動量を用いて補間を行う。続いて、時間間引きされなかったブロックと、時間間引きされブロック移動により補間されたブロックは、画像蓄積部604においてフレームに合成された後Nフレーム分蓄積される。
Similar to the block interpolation unit b505, the remaining blocks are interpolated using the block movement amount from the block of the previous frame using the forward block
画像蓄積部604に一旦蓄積された画像は、ブロック境界補間部605によってブロック移動により生じた隙間に補間処理を行う。隙間補間処理は、図26を参照して説明したブロック移動処理部のブロック移動処理により生じた隙間809を、時間方向間引き量から時間方向に間引かれているブロックを検出し、さらに隙間をブロック移動量から算出することによって求め、その隙間809を周囲の画素から補間したピクセルで埋める。本実施例ではこの補間処理としては周囲画素からの線形補間を行う。
The image once stored in the
この処理により、動きの不自然さをより改善する目的で行う時間方向の帯域制限によってボケてしまうブロック、つまり、ある程度ブロック移動速度が速いブロックに対して、帯域制限を行うことなく自然なブロック補間を行うことができる。 With this process, natural block interpolation is performed without band limitation on blocks that are blurred due to temporal band limitation performed to improve the unnaturalness of motion, that is, blocks that have a relatively high block movement speed. It can be performed.
以上のブロック補間処理において、本実施例では、時間方向1/4間引きの時に帯域制限装置付きのブロック補間部b505において補間処理を行い、時間方向1/2間引きの時に帯域制限装置無しのブロック補間部a504において補間処理を行ったが、これらの分配方法は一例に過ぎない。つまり、両者とも帯域制限部付きのブロック補間部b505において補間処理を行ってもかまわないし、両者とも帯域制限部無しのブロック補間部a504において補間処理を行ってもかまわない。また、時間方向1/4間引きの時に帯域制限部無しのブロック補間部a504において補間処理を行い、時間方向1/2間引きの時に帯域制限部付きのブロック補間部b505において補間処理を行ってもよい。
In the above block interpolation processing, in this embodiment, the interpolation processing is performed in the block interpolator b505 with a band limiting device at the
以上のように、本実施例の動画像復元装置および方法によれば、時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間部において、補間処理対象のブロック対応の移動量情報を入力し、該移動量情報に従ってフレーム間で復元ブロックを移動させて、動画像データ復元を行なう構成としたので、超解像効果を持つ復元データの生成が可能となり、画像劣化を抑制した高品質な復号データを生成することができる。 As described above, according to the moving image restoration apparatus and method of this embodiment, moving image conversion data that has been subjected to thinning processing in the time direction is input in units of blocks, and a plurality of blocks corresponding to different frames in the time axis direction are input. A block interpolation unit that calculates pixel values by interpolation processing and generates a restoration block of a plurality of frames, inputs movement amount information corresponding to the block to be interpolated, and moves the restoration block between frames according to the movement amount information. Since the moving image data is restored, it is possible to generate restored data having a super-resolution effect, and it is possible to generate high-quality decoded data that suppresses image degradation.
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。 The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。 The series of processing described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。 For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.
以上、説明したように、本発明の動画像変換装置および方法によれば、移動量に応じて、時間方向間引きの態様を変更することで超解像効果を持つデータを生成することが可能となり、データ量は削減されているにもかかわらず、復号化時の画像劣化を抑制した高品質なデータを生成することができる。 As described above, according to the moving image conversion apparatus and method of the present invention, it is possible to generate data having a super-resolution effect by changing the mode of thinning in the time direction according to the amount of movement. Even though the amount of data is reduced, it is possible to generate high-quality data that suppresses image degradation during decoding.
本発明の動画像変換装置および方法によれば、動画像データを構成するフレーム毎にブロック分割を行い、各ブロックにおける被写体移動量を検出し、移動量に基づいて決定した態様の空間間引き処理または時間方向間引き処理の少なくともいずれかの間引き処理を実行する構成とし、時間方向間引き処理の実行においては、移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成としたので、移動量に応じた最適な時間方向間引き、すなわち超解像効果を持つデータを生成が可能となり、データ量は削減されているにもかかわらず、復号化時の画像劣化を抑制した高品質なデータを生成することができる。 According to the moving image conversion apparatus and method of the present invention, block division is performed for each frame constituting moving image data, a subject movement amount in each block is detected, and spatial thinning processing in a mode determined based on the movement amount or Since at least one of the time direction thinning-out processes is executed, and in the execution of the time direction thinning-out process, the thinning process is performed by changing the thinning target frame based on the movement amount information. It is possible to generate data with the optimal time-direction decimation, that is, the super-resolution effect, and generate high-quality data that suppresses image degradation during decoding, even though the amount of data is reduced can do.
さらに、本発明の動画像復元装置および方法によれば、時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間部において、補間処理対象のブロック対応の移動量情報を入力し、該移動量情報に従ってフレーム間で復元ブロックを移動させて、動画像データ復元を行なう構成としたので、超解像効果を持つ復元データの生成が可能となり、画像劣化を抑制した高品質な復号データを生成することができる。 Furthermore, according to the moving image restoration apparatus and method of the present invention, moving image conversion data that has been subjected to thinning processing in the time direction is input in units of blocks, and pixel values of a plurality of blocks corresponding to different frames in the time axis direction are interpolated. In the block interpolation unit that calculates by processing and generates a restoration block of a plurality of frames, the movement amount information corresponding to the block to be interpolated is input, and the restoration block is moved between frames according to the movement amount information. Since the restoration is configured, restoration data having a super-resolution effect can be generated, and high-quality decoded data in which image degradation is suppressed can be generated.
10 画像変換装置
11 ブロック分割部
12 移動量検出部
13 ブロック処理部
14 出力部
21 画像蓄積部
22 ブロック分割部
31 移動量検出部
32 ブロック分配部
51〜53 ブロック処理部
100 ブロック分割手段
102〜104 動画像圧縮手段
105 ブロック合成手段
106 符号化器
200 画像蓄積部
201 ブロック分割部
202 移動量検出部
203 ブロック分配部
204〜206 ブロック処理部
207 出力(移動量情報)
208 ブロック処理部
209 出力(ブロック分配フラグ)
301 ブロック蓄積部
302 ブロック分配部
303〜305 ブロック処理部
321〜324 ブロック
326〜329 画素
331〜334 ブロック
336,337 画素
351〜354 ブロック
356〜359 画素
361〜364 ブロック
366,367 画素
371〜373 パック処理部
375〜379 ブロック
380〜384 画素
385〜389 ブロック
391〜395 画素
400 復号化器
401 ブロック補間手段
402 ブロック移動量取得手段
403 時間間引きブロック判定手段
404 空間間引きブロック判定手段
411 ブロック間引き情報取得手段
500 画像蓄積部
501 ブロック分割部
502 ブロック分配部
503 出力
504,505 ブロック補間部
506 ブロック合成部
507 時間軸間引きブロック判定フラグ
508 移動量検出部
521 動画像復号化部
522 フラグ復号化部
523 ブロック分割部
524〜526 アンパック処理部
527 ブロック合成部
541 ブロック蓄積部
542 ブロック移動処理部
543 ブロック合成部
544 帯域制限部
601 ブロック蓄積部
602 ブロック移動処理部
603 ブロック合成部
604 画像蓄積部
605 ブロック境界補間部
606 ブロック移動選択部
607 順方向ブロック移動処理部
608 逆方向ブロック移動処理部
801,802 フレーム
803,804 ブロック
805,806 ブロック
807,808 フレーム
809 隙間
DESCRIPTION OF
208
301
Claims (20)
動画像データを構成するフレーム毎にブロック分割処理を実行するブロック分割部と、
前記ブロック分割部において分割された各ブロックにおける被写体移動量を検出する移動量検出部と、
前記ブロック分割部の分割したブロックデータと、前記移動量検出部の検出した移動量情報とを入力し、ブロックデータの間引き処理を実行するブロック処理部とを有し、
前記ブロック処理部は、
間引き処理対象のブロックが、前記移動量検出部の検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較し、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更し、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行し、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成であり、
前記ブロック処理部は、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なう構成であり、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なう構成であることを特徴とする動画像変換装置。 A moving image conversion apparatus that executes data conversion processing of moving image data,
A block division unit that executes block division processing for each frame constituting the moving image data;
A movement amount detection unit for detecting a subject movement amount in each block divided by the block division unit;
A block processing unit that inputs the block data divided by the block dividing unit and the movement amount information detected by the movement amount detection unit, and executes block data thinning processing;
The block processing unit
The block to be thinned out is compared with the movement amount detected by the movement amount detection unit and the first threshold value and the second threshold value that are defined in advance to determine the processing mode.
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And change the thinning mode to be executed according to whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the amount of movement is medium, execute a space thinning process and a time direction thinning process,
In the time direction thinning process when the movement amount is medium, the thinning process is performed by changing the thinning target frame based on the movement amount information.
The block processing unit
In the execution of the time direction thinning process, the thinning process is performed by changing the thinning target frame based on the movement amount information.
Formula defining the pre-defined super-resolution effect generation condition, that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. A moving image conversion apparatus characterized in that the thinning process is performed.
前記移動量が第1閾値未満の前記移動量が中または小の場合に実行する時間方向間引き処理の実行において、
前記超解像効果発生条件を満足する移動量と間引き態様との対応関係に従って設定した間引き態様変更点となる移動量閾値であり、前記第1閾値未満の閾値である第3閾値と前記移動量情報との比較を実行し、
前記移動量情報が前記第3閾値以上である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値未満である場合に比較して少なく設定し、
前記移動量情報が前記第3閾値未満である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値以上である場合に比較して多く設定した時間軸方向の間引き処理を実行する構成であることを特徴とする請求項1に記載の動画像変換装置。 The block processing unit
In the execution of the thinning process in the time direction that is executed when the movement amount that is less than the first threshold is medium or small ,
A third threshold that is a movement amount threshold that is a thinning mode change point set according to a correspondence relationship between a movement amount that satisfies the super-resolution effect generation condition and a thinning mode, and a third threshold that is a threshold value less than the first threshold and the movement amount Perform a comparison with the information,
If the movement amount information is equal to or greater than the third threshold , set the thinning target frames that are continuous on the time axis to be smaller than when the movement amount information is less than the third threshold ;
When the movement amount information is less than the third threshold value , thinning target frames that are continuous on the time axis are thinned out in the time axis direction that is set more than when the movement amount information is equal to or more than the third threshold value. The moving image conversion apparatus according to claim 1, wherein the moving image conversion apparatus is configured to execute processing.
圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する構成である場合、
前記移動量情報が前記第3閾値以上である場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、
前記移動量情報が前記第3閾値未満である場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行する構成であることを特徴とする請求項2に記載の動画像変換装置。 The block processing unit
When the configuration is such that the time direction decimation processing with a compression rate of 1/2 is executed with four consecutive frames as processing units,
When the movement amount information is equal to or greater than the third threshold , the first frame and the third frame are left, the second and fourth frames are thinned out, and a time-axis direction thinning process is performed.
If the movement amount information is less than the third threshold value , the first frame and the fourth frame remain, and the time-axis direction thinning process is performed to thin out the second and third frames. The moving image conversion apparatus according to claim 2, wherein:
時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間部を有し、
前記ブロック補間部は、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であり、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間部は、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なう構成であることを特徴とする動画像復元装置。 A moving image restoration device that executes restoration processing of moving image conversion data including thinning processing data in the time direction,
Block interpolation that inputs moving image conversion data that has been thinned in the time direction in units of blocks, calculates pixel values of multiple blocks corresponding to frames in different time axis directions, and generates a restored block of multiple frames Part
The block interpolation unit
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames And moving image data restoration,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
The block interpolation unit
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. A moving image restoration apparatus characterized in that moving image data restoration is performed by selecting so that movement between frames is closer in time.
移動を伴う補間が実行されたブロックについてフィルタ処理による帯域制限処理を実行する構成を有することを特徴とする請求項4に記載の動画像復元装置。 The block interpolation unit
5. The moving image restoration apparatus according to claim 4, further comprising: a band limiting process based on a filter process for a block that has undergone interpolation with movement.
復元対象ブロックの移動量に基づいて、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、
前記ブロック補間部は、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする請求項4に記載の動画像復元装置。 The moving image restoration device includes:
Based on the movement amount of the restoration target block, it is determined whether or not the block is data that has been thinned in the time direction,
The block interpolation unit
The block that has been thinned out in the time direction selected based on the determination is configured to perform moving image data restoration by moving the restoration block by the amount of movement between frames according to movement amount information. The moving image restoration apparatus according to claim 4.
時間方向の間引きがなされたデータであるか否かを示すフラグに基づいて、復元対象ブロックが時間方向の間引きがなされたデータであるか否かを判定し、
前記ブロック補間部は、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする請求項4に記載の動画像復元装置。 The moving image restoration device includes:
Based on a flag indicating whether or not the data is thinned out in the time direction, it is determined whether or not the restoration target block is data that has been thinned out in the time direction.
The block interpolation unit
The block that has been thinned out in the time direction selected based on the determination is configured to perform moving image data restoration by moving the restoration block by the amount of movement between frames according to movement amount information. The moving image restoration apparatus according to claim 4.
移動量検出部を有し、該移動量検出部の検出した移動量に従って、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、
前記ブロック補間部は、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、前記移動量に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする請求項4に記載の動画像復元装置。 The moving image restoration device includes:
It has a movement amount detection unit, and determines whether the block is data thinned out in the time direction according to the movement amount detected by the movement amount detection unit,
The block interpolation unit
The block that has been thinned out in the time direction selected based on the determination is configured to perform moving image data restoration by moving the restoration block by the amount of movement between frames according to the amount of movement. The moving image restoration apparatus according to claim 4.
異なるフレームの対応ブロックに基づく動きベクトルを検出する処理を実行し、
前記ブロック補間部は、
前記動きベクトルに基づいて、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なう構成であることを特徴とする請求項8に記載の動画像復元装置。 The movement amount detector
Executes a process for detecting a motion vector based on a corresponding block of a different frame,
The block interpolation unit
9. The moving image restoration apparatus according to claim 8, wherein the moving image data is restored by moving the restoration block by an amount corresponding to the movement amount between frames based on the motion vector.
動画像データを構成するフレーム毎にブロック分割処理を実行するブロック分割ステップと、
前記ブロック分割ステップにおいて分割された各ブロックにおける被写体移動量を検出する移動量検出ステップと、
前記ブロック分割ステップにおいて分割したブロックデータと、前記移動量検出ステップにおいて検出した移動量情報とを入力し、ブロックデータの間引き処理を実行するブロック処理ステップとを有し、
前記ブロック処理ステップは、
間引き処理対象のブロックが、前記移動量検出ステップにおいて検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較し、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更し、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行し、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行ない、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更した間引き処理として、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なうことを特徴とする動画像変換方法。 A moving image conversion method for executing data conversion processing of moving image data,
A block division step for executing a block division process for each frame constituting the moving image data;
A movement amount detection step of detecting a subject movement amount in each block divided in the block division step;
A block processing step for inputting the block data divided in the block division step and the movement amount information detected in the movement amount detection step, and executing a block data thinning process;
The block processing step includes:
Compare the movement amount detected in the movement amount detection step with the first threshold value and the second threshold value defined in advance for determining the processing mode, as the block to be thinned out,
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And change the thinning mode to be executed according to whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the amount of movement is medium, execute a space thinning process and a time direction thinning process,
In the time direction decimation process when the movement amount is medium, the decimation process is performed by changing the decimation target frame based on the movement amount information,
In the execution of the time direction thinning process, as a thinning process in which the thinning target frame is changed based on the movement amount information,
Formula defining the pre-defined super-resolution effect generation condition, that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. A moving image conversion method characterized by performing a thinning process.
前記移動量が第1閾値未満の前記移動量が中または小の場合に実行する時間方向間引き処理の実行において、
前記超解像効果発生条件を満足する移動量と間引き態様との対応関係に従って設定した間引き態様変更点となる移動量閾値であり、前記第1閾値未満の閾値である第3閾値と前記移動量情報との比較を実行し、
前記移動量情報が前記第3閾値以上である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値未満である場合に比較して少なく設定し、
前記移動量情報が前記第3閾値未満である場合は、時間軸に連続する間引き対象フレームを、前記移動量情報が前記第3閾値値以上である場合に比較して多く設定した時間軸方向の間引き処理を実行することを特徴とする請求項10に記載の動画像変換方法。 The block processing step includes:
In the execution of the thinning process in the time direction that is executed when the movement amount that is less than the first threshold is medium or small ,
A third threshold that is a movement amount threshold that is a thinning mode change point set according to a correspondence relationship between a movement amount that satisfies the super-resolution effect generation condition and a thinning mode, and a third threshold that is a threshold value less than the first threshold and the movement amount Perform a comparison with the information,
If the movement amount information is equal to or greater than the third threshold , set the thinning target frames that are continuous on the time axis to be smaller than when the movement amount information is less than the third threshold ;
When the movement amount information is less than the third threshold value , the thinning target frames that are continuous on the time axis are set in a time axis direction that is set more than when the movement amount information is greater than or equal to the third threshold value. The moving image conversion method according to claim 10, wherein thinning processing is executed.
圧縮率1/2の時間方向間引き処理を連続4フレームを処理単位として実行する場合、
前記移動量情報が前記第3閾値以上である場合は、1番目のフレームと3番目のフレームを残し、2番目と4番目のフレームを間引く時間軸方向の間引き処理を実行し、
前記移動量情報が前記第3閾値未満である場合は、1番目のフレームと4番目のフレームを残し、2番目と3番目のフレームを間引く時間軸方向の間引き処理を実行することを特徴とする請求項11に記載の動画像変換方法。 The block processing step includes:
When the time direction thinning process with a compression ratio of 1/2 is executed in units of four consecutive frames,
When the movement amount information is equal to or greater than the third threshold , the first frame and the third frame are left, the second and fourth frames are thinned out, and a time-axis direction thinning process is performed.
When the movement amount information is less than the third threshold value , the first frame and the fourth frame are left, and a thinning process in a time axis direction for thinning out the second and third frames is performed. The moving image conversion method according to claim 11.
時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成するブロック補間ステップを有し、
前記ブロック補間ステップは、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうステップであり、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間ステップは、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なうステップであることを特徴とする動画像復元方法。 A moving image restoration method for executing restoration processing of moving image conversion data including thinning processing data in the time direction,
Block interpolation that inputs moving image conversion data that has been thinned in the time direction in units of blocks, calculates pixel values of multiple blocks corresponding to frames in different time axis directions, and generates a restored block of multiple frames Has steps,
The block interpolation step includes:
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames And restoring the moving image data,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
The block interpolation step includes:
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. A method for restoring a moving image, the step of restoring moving image data by selecting so that the movement between frames is closer in time.
移動を伴う補間が実行されたブロックについてフィルタ処理による帯域制限処理を実行するステップを有することを特徴とする請求項13に記載の動画像復元方法。 The block interpolation step includes:
The moving image restoration method according to claim 13, further comprising a step of performing band limitation processing by filter processing on a block on which interpolation with movement is performed.
復元対象ブロックの移動量に基づいて、該ブロックが時間方向の間引きがなされたデータであるか否かを判定するステップを有し、
前記ブロック補間ステップは、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする請求項13に記載の動画像復元方法。 The moving image restoration method further includes:
Determining whether the block is data that has been thinned in the time direction based on the amount of movement of the restoration target block;
The block interpolation step includes:
The moving image data is restored by moving the restoration block by the amount of movement between frames according to movement amount information for the block that has been thinned in the time direction selected based on the determination. 14. The moving image restoration method according to 13.
時間方向の間引きがなされたデータであるか否かを示すフラグに基づいて、復元対象ブロックが時間方向の間引きがなされたデータであるか否かを判定するステップを有し、
前記ブロック補間ステップは、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、移動量情報に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする請求項13に記載の動画像復元方法。 The moving image restoration method further includes:
Determining whether or not the restoration target block is data that has been thinned in the time direction, based on a flag that indicates whether or not the data has been thinned in the time direction;
The block interpolation step includes:
The moving image data is restored by moving the restoration block by the amount of movement between frames according to movement amount information for the block that has been thinned in the time direction selected based on the determination. 14. The moving image restoration method according to 13.
移動量検出ステップを有し、該移動量検出ステップにおいて検出した移動量に従って、該ブロックが時間方向の間引きがなされたデータであるか否かを判定し、
前記ブロック補間ステップは、
前記判定に基づいて選択された時間方向の間引きがなされたブロックについて、前記移動量に従ってフレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする請求項13に記載の動画像復元方法。 The moving image restoration method further includes:
A movement amount detection step, and according to the movement amount detected in the movement amount detection step, determine whether the block is data that has been thinned in the time direction;
The block interpolation step includes:
The moving image data is restored by moving the restoration block by the amount of movement between frames according to the amount of movement of the block that has been thinned out in the time direction selected based on the determination. 14. The moving image restoration method according to 13.
異なるフレームの対応ブロックに基づく動きベクトルを検出する処理を実行するステップであり、
前記ブロック補間ステップは、
前記動きベクトルに基づいて、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なうことを特徴とする請求項17に記載の動画像復元方法。 The movement amount detection step includes:
Performing a process of detecting motion vectors based on corresponding blocks of different frames;
The block interpolation step includes:
18. The moving image restoration method according to claim 17, wherein the moving image data restoration is performed by moving the restoration block by the amount of movement between frames based on the motion vector.
ブロック分割部に、動画像データを構成するフレーム毎にブロック分割処理を実行させるブロック分割ステップと、
移動量検出部に、前記ブロック分割ステップにおいて分割された各ブロックにおける被写体移動量を検出させる移動量検出ステップと、
ブロック処理部に、前記ブロック分割ステップにおいて分割したブロックデータと、前記移動量検出ステップにおいて検出した移動量情報とを入力し、ブロックデータの間引き処理を実行させるブロック処理ステップとを前記動画像変換装置に実行させ、
前記ブロック処理ステップにおいては、
間引き処理対象のブロックが、前記移動量検出ステップにおいて検出した移動量と、処理態様決定するために予め規定した第1閾値、第2閾値と比較させ、
検出した前記移動量が第1閾値以上である場合は移動量が大、
検出した前記移動量が第1閾値未満であり第2閾値以上である場合は移動量が中、
検出した前記移動量が第2閾値未満である場合は移動量が小、
であると判定し、前記移動量が大、中、小のいずれの分類に属するかに応じて実行する間引き態様を変更させ、
前記移動量が大である場合は、空間間引き処理、
前記移動量が小である場合は、時間方向間引き処理、
前記移動量が中である場合は、空間間引き処理と時間方向間引き処理を実行させ、
前記移動量が中である場合の時間方向間引き処理において、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理を行なわせ、
時間方向間引き処理の実行においては、前記移動量情報に基づいて間引き対象フレームを変更した間引き処理として、
予め規定した超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足する間引き態様を前記移動量情報に基づいて決定し、決定した間引き態様に一致するように間引き対象フレームを変更して間引き処理を行なわせることを特徴とするコンピュータ・プログラム。 In the moving image conversion device, a computer program for executing a data conversion process of moving image data, the data conversion process ,
A block dividing step for causing the block dividing unit to execute a block dividing process for each frame constituting the moving image data;
A movement amount detection step for causing a movement amount detection unit to detect a subject movement amount in each block divided in the block division step;
The block processor, the block data obtained by dividing in the block dividing step, the moving amount detecting inputs the movement amount information detected in step, the moving image conversion apparatus and a block processing step for executing the decimation process of the block data To run
In the block processing step ,
The block to be thinned out is compared with the movement amount detected in the movement amount detection step with the first threshold value and the second threshold value that are defined in advance to determine the processing mode,
If the detected amount of movement is greater than or equal to the first threshold, the amount of movement is large,
If the detected amount of movement is less than the first threshold and greater than or equal to the second threshold, the amount of movement is medium,
If the detected amount of movement is less than the second threshold, the amount of movement is small,
And changing the thinning mode to be executed depending on whether the movement amount belongs to the large, medium, or small classification,
When the amount of movement is large, spatial thinning processing,
When the amount of movement is small, thinning process in the time direction,
When the movement amount is medium, the space thinning process and the time direction thinning process are executed,
In the time direction thinning process when the movement amount is medium, the thinning target frame is changed based on the movement amount information, and the thinning process is performed.
In the execution of the time direction thinning process, as a thinning process in which the thinning target frame is changed based on the movement amount information,
Formula defining the pre-defined super-resolution effect generation condition, that is, the following formula specifying the super-resolution effect generation condition when an object moving at a speed of v pixels / frame is thinned out in the spatial direction by m pixels,
A thinning mode that satisfies the super-resolution effect generation condition shown in the above formulas (formula a) and (formula b) is determined based on the movement amount information, and the thinning target frame is changed so as to match the determined thinning mode. A computer program characterized in that thinning processing is performed .
ブロック補間部に、時間方向の間引き処理のなされた動画像変換データをブロック単位で入力し、時間軸方向の異なるフレームに対応する複数ブロックの画素値を補間処理によって算出し、複数フレームの復元ブロックを生成させるブロック補間ステップを前記動画像復元装置に実行させ、
前記ブロック補間ステップにおいては、
時間間引きされなかったフレームの入力ブロックを、より時間的に近い時間間引きフレームにコピーして復元ブロックを生成し、入力ブロック対応の移動量情報に従って、フレーム間で前記移動量分だけ復元ブロックを移動させて、動画像データ復元を行なわせ、
復元対象となる入力ブロックは、前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、超解像効果発生条件を規定した式、すなわち、速度vピクセル/フレームで動く対象物をmピクセルで空間方向に間引いた場合の超解像効果発生条件を規定した下記式、
上記式(式a),(式b)で示す超解像効果発生条件を満足するように前記移動量情報に基づいて間引き対象フレームを変更して間引き処理がなされたブロックであり、
前記ブロック補間ステップにおいては、
前記移動量情報に基づく間引き処理によって間引かれたフレームを復元するように、復元対象として入力されたブロックの時間方向の間引き処理の態様に応じて、フレーム間での復元ブロックの移動方向を、より時間的に近いフレーム間移動となるように選択して、動画像データ復元を行なわせることを特徴とするコンピュータ・プログラム。 In the moving image restoration apparatus, the computer program for executing the restoration processing of the moving image conversion data including the thinning processing data in the time direction, the restoration processing of the moving image data,
The moving image conversion data that has been thinned out in the time direction is input to the block interpolator in units of blocks, and pixel values of a plurality of blocks corresponding to different frames in the time axis direction are calculated by interpolation processing, and a plurality of frames are restored. The moving image restoration apparatus executes a block interpolation step for generating
In the block interpolation step ,
The input block of frames not decimated time, to generate a copy and restore block frame decimation more temporally close in time, moves according to the movement amount information input block corresponding, the only movement amount restored block between frames Let the video data be restored ,
The input block to be restored is a block that is subjected to thinning processing by changing the thinning target frame based on the movement amount information, and is an expression that defines the super-resolution effect generation condition, that is, the speed v pixel / frame. The following formula specifying the super-resolution effect generation condition when moving objects are thinned out in the spatial direction with m pixels,
It is a block that has been subjected to thinning processing by changing the thinning target frame based on the movement amount information so as to satisfy the super-resolution effect generation condition represented by the above formulas (formula a) and (formula b),
In the block interpolation step ,
In order to restore the frame thinned out by the thinning process based on the movement amount information, the moving direction of the restored block between the frames is changed according to the mode of the thinning process in the time direction of the block input as the restoration target. selected and so as to be more temporally move between near frames, computer program characterized by causing a moving image data reconstruction.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004233360A JP4590975B2 (en) | 2004-08-10 | 2004-08-10 | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004233360A JP4590975B2 (en) | 2004-08-10 | 2004-08-10 | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006054569A JP2006054569A (en) | 2006-02-23 |
JP4590975B2 true JP4590975B2 (en) | 2010-12-01 |
Family
ID=36031773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004233360A Expired - Fee Related JP4590975B2 (en) | 2004-08-10 | 2004-08-10 | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4590975B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5691374B2 (en) * | 2010-10-14 | 2015-04-01 | 富士通株式会社 | Data compression device |
US11836147B2 (en) | 2019-03-25 | 2023-12-05 | Nec Corporation | Information processing apparatus, analysis system, data aggregation method, and computer readable medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02504458A (en) * | 1988-05-20 | 1990-12-13 | エヌ ベー フィリップス フルーイランペンファブリケン | High-definition television transceiver system with reduced data throughput |
JPH07222145A (en) * | 1994-01-31 | 1995-08-18 | Mitsubishi Electric Corp | Picture encoding device |
JP2004023670A (en) * | 2002-06-19 | 2004-01-22 | Nec Corp | Image encoding apparatus and system |
-
2004
- 2004-08-10 JP JP2004233360A patent/JP4590975B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02504458A (en) * | 1988-05-20 | 1990-12-13 | エヌ ベー フィリップス フルーイランペンファブリケン | High-definition television transceiver system with reduced data throughput |
JPH07222145A (en) * | 1994-01-31 | 1995-08-18 | Mitsubishi Electric Corp | Picture encoding device |
JP2004023670A (en) * | 2002-06-19 | 2004-01-22 | Nec Corp | Image encoding apparatus and system |
Also Published As
Publication number | Publication date |
---|---|
JP2006054569A (en) | 2006-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4779434B2 (en) | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program | |
TWI324481B (en) | Method and apparatus for encoding/decoding video signal using reference pictures | |
CA2570090C (en) | Representing and reconstructing high dynamic range images | |
KR102062764B1 (en) | Method And Apparatus For Generating 3K Resolution Display Image for Mobile Terminal screen | |
JP5727873B2 (en) | Motion vector detection device, encoding device, and program thereof | |
EP2265024A2 (en) | Scalable image encoding device and scalable image decoding device | |
US8126281B2 (en) | Image processing apparatus, method, and computer-readable medium for generating motion compensation images | |
JP4565392B2 (en) | Video signal hierarchical decoding device, video signal hierarchical decoding method, and video signal hierarchical decoding program | |
WO2007030716A2 (en) | Bit-rate reduction of multimedia data streams | |
JP2014171097A (en) | Encoder, encoding method, decoder, and decoding method | |
JP4735063B2 (en) | Moving picture conversion apparatus, moving picture conversion method, and computer program | |
JP2015536108A (en) | Video compression method | |
JP2008219876A (en) | Moving image encoding device, moving image encoding method and moving image decoding device | |
EP3373584B1 (en) | Content adaptive and art directable scalable video coding | |
JP2011004345A (en) | Spatial downsampling processor, spatial upsampling processor, encoding apparatus, decoding apparatus, and program | |
KR102345770B1 (en) | Video encoding and decoding method and device using said method | |
JP5691374B2 (en) | Data compression device | |
KR101690253B1 (en) | Image processing method and Apparatus | |
KR101710883B1 (en) | Apparatus and method for compressing and restoration image using filter information | |
JP4590975B2 (en) | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program | |
JP4552691B2 (en) | Moving picture conversion apparatus, moving picture restoration apparatus and method, and computer program | |
JP4412062B2 (en) | Moving picture conversion apparatus, moving picture conversion method, and computer program | |
JP5140637B2 (en) | Spatiotemporal downsampling processing device, spatiotemporal upsampling processing device, encoding device, decoding device, and program | |
JP5255116B2 (en) | Interlaced image encoding method, encoding apparatus, and encoding program | |
JP2016076758A (en) | Reproducer, encoder, and reproduction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070803 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |