JP2007288402A - ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 - Google Patents
ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 Download PDFInfo
- Publication number
- JP2007288402A JP2007288402A JP2006111731A JP2006111731A JP2007288402A JP 2007288402 A JP2007288402 A JP 2007288402A JP 2006111731 A JP2006111731 A JP 2006111731A JP 2006111731 A JP2006111731 A JP 2006111731A JP 2007288402 A JP2007288402 A JP 2007288402A
- Authority
- JP
- Japan
- Prior art keywords
- area
- fade
- dissolve
- image data
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】圧縮動画像データを完全に復号する前に精度良くディゾルブ/フェード区間を検出することができるディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置を提供する。
【解決手段】領域変化方向算出部101が輝度差分情報16を基に領域変化方向17を規定し、参照先領域算出部102が参照可能領域19の数cntをカウントする。ディゾルブ/フェード領域抽出部103が領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20の数fcntをカウントし、判定部104がfcnt/cntと所定のしきい値とを比較して現在のピクチャがディゾルブ/フェード区間であるか否かを判定する。
【選択図】図1
【解決手段】領域変化方向算出部101が輝度差分情報16を基に領域変化方向17を規定し、参照先領域算出部102が参照可能領域19の数cntをカウントする。ディゾルブ/フェード領域抽出部103が領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20の数fcntをカウントし、判定部104がfcnt/cntと所定のしきい値とを比較して現在のピクチャがディゾルブ/フェード区間であるか否かを判定する。
【選択図】図1
Description
本発明は、動き予測を伴った画像圧縮技術によって圧縮された動画像データのディゾルブ/フェード区間を検出する方法、ディゾルブ/フェード区間を検出する装置、プログラム、当該装置を有する復号装置及び再符号化装置に関する。
動画像データからディゾルブ/フェードといった特殊効果を検出することは、特徴的な場面の抽出や、MPEG方式等に効率よく画像圧縮するために非常に重要な技術となる。例えば画像圧縮の際には、検出結果に基づいて重み付き予測等による処理を行うことができる。
ディゾルブとは、画像が徐々に変わっていく効果である。
フェードとは、変化の無い画像(白や黒)から画像がディゾルブする(フェードイン)、或いは変化の無い画像に変化する(フェードアウト)効果であり、ディゾルブの一形態と考えることができる。
ディゾルブ/フェード区間は、動きが小さく、輝度が変化することが特徴である。
ディゾルブとは、画像が徐々に変わっていく効果である。
フェードとは、変化の無い画像(白や黒)から画像がディゾルブする(フェードイン)、或いは変化の無い画像に変化する(フェードアウト)効果であり、ディゾルブの一形態と考えることができる。
ディゾルブ/フェード区間は、動きが小さく、輝度が変化することが特徴である。
一般に動画像データはすでにMPEG方式などによって符号化されたものが多く、そのような動画像からディゾルブやフェードを検出するためには、一旦完全にデコード(復号)を行いベースバンドの画像データに戻した後、映像の明るさ(輝度)が徐々に一定の割合で変化する単調変化性を検出する方法が一般的である。しかし、動画像データのデコードを行うために多くの時間がかかり、また処理量が多くなってしまうために装置の負担が大きい、といった不利益があった。
上記不利益を解消するために、例えば特許文献1に開示されているような、輝度の差分情報を隣接するピクチャ間で比較することにより動画像データを圧縮したままディゾルブ区間を検出することができる技術が開発されている。
特開平9−322171号公報
しかし、上記特許文献1に開示された方法には以下のような不利益がある。
特許文献1に開示された技術においては、隣接するピクチャ同士の同じ位置にある領域の輝度を比較するため、例えばMPEG2のように動き予測を伴う符号化圧縮方式で圧縮された動画像データに対しては、動き予測による参照先の領域のずれが考慮されない。すなわち、動きの有無を考慮せずに輝度の変化のみに基づいてディゾルブ/フェード検出をするので、ズームやパンといった動きを伴った区間(シーン)等を誤って検出してしまい、特徴的な場面の抽出精度や、再び圧縮する際の効率が低下する。
更に特許文献1において、動き予測による参照先の領域のずれを考慮に入れてディゾルブ/フェード検出を行っても、ディゾルブやフェード区間のようにピクチャ全体の輝度が変化するシーンでは動き予測自体が難しい。またエンコーダ(符号化手段)の特性等によって動き予測の結果が大きく左右される。更に、ディゾルブ区間では大きな動きを伴ったシーンがあることが非常に少ないため、動きが大きい場面におけるディゾルブ検出では検出精度が低下する、という不利益がある。
特許文献1に開示された技術においては、隣接するピクチャ同士の同じ位置にある領域の輝度を比較するため、例えばMPEG2のように動き予測を伴う符号化圧縮方式で圧縮された動画像データに対しては、動き予測による参照先の領域のずれが考慮されない。すなわち、動きの有無を考慮せずに輝度の変化のみに基づいてディゾルブ/フェード検出をするので、ズームやパンといった動きを伴った区間(シーン)等を誤って検出してしまい、特徴的な場面の抽出精度や、再び圧縮する際の効率が低下する。
更に特許文献1において、動き予測による参照先の領域のずれを考慮に入れてディゾルブ/フェード検出を行っても、ディゾルブやフェード区間のようにピクチャ全体の輝度が変化するシーンでは動き予測自体が難しい。またエンコーダ(符号化手段)の特性等によって動き予測の結果が大きく左右される。更に、ディゾルブ区間では大きな動きを伴ったシーンがあることが非常に少ないため、動きが大きい場面におけるディゾルブ検出では検出精度が低下する、という不利益がある。
本発明は、上述した不利益を解消するために、圧縮動画像データを完全に復号する前に精度良くディゾルブ/フェード区間を検出することができるディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、そのプログラムを提供することを目的とする。
また、本発明は、当該装置を有する復号装置及び再符号化装置を提供することを目的とする。
また、本発明は、当該装置を有する復号装置及び再符号化装置を提供することを目的とする。
上述した目的を達成するために、本発明のディゾルブ/フェード検出装置は、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、を有する。
本発明のディゾルブ/フェード区間検出方法は、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する第1の工程と、動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする第2の工程と、前記第1の工程において算出された前記参照先領域と前記第2の工程において算出された前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントする第3の工程と、前記前記第2の工程において算出された前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する第4の工程と、を有する。
本発明のプログラムは、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の内、どの領域がディゾルブ/フェード領域であるかを検出する装置に実行させるプログラムであって、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する第1の手順と、動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする第2の手順と、前記第1の手順において算出された前記参照先領域と前記第2の手順において算出された前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントする第3の手順と、前記前記第2の手順において算出された前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する第4の手順と、を前記装置に実行させる。
本発明の復号装置は、画像データ列を復号する復号装置であって、前記画像データ列から、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データを抽出して当該画像データの符号化情報を抽出する符号化情報抽出部と、前記符号化情報を基に、前記画像データ列の内、どの画像がディゾルブ/フェード領域を含む画像であるかを検出し、ディゾルブ/フェード結果として出力するディゾルブ/フェード区間検出部と、前記画像データ列の復号を行う復号部と、を有し、前記ディゾルブ/フェード区間検出部は、前記符号化情報抽出部が抽出した前記符号化情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、を更に有する。
本発明の再符号化装置は、所定の符号化圧縮方式によって圧縮された画像データ列を再符号化する再符号化装置であって、前記画像データ列から、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データを抽出して当該画像データの符号化情報を抽出する符号化情報抽出部と、前記符号化情報を基に、前記画像データ列の内、どの画像がディゾルブ/フェード領域を含む画像であるかを検出し、ディゾルブ/フェード結果として出力するディゾルブ/フェード区間検出部と、前記画像データ列の復号を行う復号部と、前記復号部が復号した前記画像データ列を基に前記所定の符号化圧縮方式とは異なる符号化圧縮方式によって再符号化を行う再符号化部と、を有し、前記ディゾルブ/フェード区間検出部は、前記符号化情報抽出部が抽出した前記符号化情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、動き予測処理のとき参照する前記画像データ内の参照先領域を、当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、を更に有し、前記再符号化部は、前記ディゾルブ/フェード区間検出部が検出した前記ディゾルブ/フェード区間の再符号化の際には、所定の再符号化処理を行う。
本発明によれば、動き予測を伴う動画像圧縮データから、動きベクトルが小さい領域、すなわち画面全体の動きが少ない場面のみを抽出し、その中から輝度が連続して変化している領域をディゾルブ/フェード領域として判定するので、ズームやパンといった動きが比較的大きい区間を誤って検出してしまうことが無く、動き予測が誤っている可能性が高い領域を除外して判定を行うので、精度良くディゾルブ/フェード区間を検出できるディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置を提供することができる。
<第1実施形態>
以下、本発明の第1実施形態のデコーダ200について説明する。
本第1実施形態のデコーダ200は、入力された動画像圧縮データ11のディゾルブ/フェード区間を復号前に検出することによって、復号化の効率低下を避けることができる。
デコーダ200の構成を図1に示す。
図1に示すように、デコーダ200は、符号化情報抽出部201、ディゾルブ/フェード区間検出部202、復号部203を有する。
また、ディゾルブ/フェード区間検出部202は、更に領域変化方向算出部2021、参照先領域算出部2022、ディゾルブ/フェード領域抽出部2023、判定部2024、バッファメモリ2025及び2026を有する。
以下、本発明の第1実施形態のデコーダ200について説明する。
本第1実施形態のデコーダ200は、入力された動画像圧縮データ11のディゾルブ/フェード区間を復号前に検出することによって、復号化の効率低下を避けることができる。
デコーダ200の構成を図1に示す。
図1に示すように、デコーダ200は、符号化情報抽出部201、ディゾルブ/フェード区間検出部202、復号部203を有する。
また、ディゾルブ/フェード区間検出部202は、更に領域変化方向算出部2021、参照先領域算出部2022、ディゾルブ/フェード領域抽出部2023、判定部2024、バッファメモリ2025及び2026を有する。
符号化情報抽出部201は、入力された動画像圧縮データ11に解凍処理及び逆量子化処理を行い、予測符号化ピクチャ12を抽出すると同時に、ディゾルブ/フェード区間検出部202の行うディゾルブ/フェード区間検出処理に必要なパラメータ(輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15)を抽出する。
輝度情報13は、予測符号化ピクチャ12の各領域(マクロブロック)の輝度の情報であり、予測符号化/非予測符号化情報14は、同該領域が予測符号化されているか否かを示す情報であり、動き予測情報15は、当該領域の動きベクトル情報である。
輝度情報13は、予測符号化ピクチャ12の各領域(マクロブロック)の輝度の情報であり、予測符号化/非予測符号化情報14は、同該領域が予測符号化されているか否かを示す情報であり、動き予測情報15は、当該領域の動きベクトル情報である。
ここで、符号化情報抽出部201に入力される動画像圧縮データ11は、MPEG1、MPEG2、MPEG4、H.264/AVC等、動き予測とフレーム或いはフィールド間順方向予測符号化を備えた方式により作成されている必要がある。
予測符号化ピクチャ12は、例えば、フレーム間またはフィールド間予測符号化方式によって圧縮されたPピクチャ画像データ列である。
予測符号化ピクチャ12は、例えばHDD(Hard Disk Drive)やCD−ROM等の記録装置に記録されたデータ、或いはインターネット等のネットワークを経由して伝送されるデータ等である。
予測符号化ピクチャ12は、例えば、フレーム間またはフィールド間予測符号化方式によって圧縮されたPピクチャ画像データ列である。
予測符号化ピクチャ12は、例えばHDD(Hard Disk Drive)やCD−ROM等の記録装置に記録されたデータ、或いはインターネット等のネットワークを経由して伝送されるデータ等である。
符号化情報抽出部201は、予測符号化ピクチャ12から各領域の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出し、ディゾルブ/フェード区間検出部202に出力される。輝度情報13は、領域変化方向算出部2021に入力される。予測符号化/非予測符号化情報14、動き予測情報15は参照先領域算出部2022に入力されると共に、バッファメモリ2025に格納される。
ディゾルブ/フェード区間検出部202は、符号化情報抽出部201が抽出したパラメータ(輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15)を利用して、動画像圧縮データ11のディゾルブ/フェード区間を検出する。
領域変化方向算出部2021は、符号化情報抽出部201が動画像圧縮データ11から抽出した輝度情報13から、予測符号化ピクチャ12の各領域の輝度がどのような傾向で変化しているかを算出する。予測符号化が行われた領域において、フレーム間の輝度情報13の変化を輝度差分情報16として算出し、輝度差分情報16が正であるか、負であるか、0であるかの3レベルに分けて輝度の領域変化方向17を規定する。この際、単純に輝度差分情報16の符号によって領域変化方向17を規定しても良いし、ある所定のしきい値を超えた値を正、しきい値未満を負、その他を0としてもよい。更に細かいレベルに分類する手法を採っても良い。
なお、予測符号化ピクチャ12がPピクチャである場合、予測符号化された領域(インターマクロブロック)は輝度差分情報16を元々有しているので、領域変化方向算出部2021が輝度情報13から輝度差分を算出する必要がなく、ディゾルブ/フェード区間検出部202の処理が早くなる。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部2023に入力され、また同時にバッファメモリ2026に格納される。
なお、予測符号化ピクチャ12がPピクチャである場合、予測符号化された領域(インターマクロブロック)は輝度差分情報16を元々有しているので、領域変化方向算出部2021が輝度情報13から輝度差分を算出する必要がなく、ディゾルブ/フェード区間検出部202の処理が早くなる。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部2023に入力され、また同時にバッファメモリ2026に格納される。
参照先領域算出部2022は、符号化情報抽出部201から入力された予測符号化/非予測符号化情報14、動き予測情報15と、以前にバッファメモリ2025に格納された過去の予測符号化ピクチャ12の予測符号化/非予測符号化情報14、動き予測情報15とを利用して、予測符号化ピクチャ12の各領域において、どの領域から予測されたのかを参照先領域18として算出する。すなわち、予測符号化が行われた領域において、その領域の動き予測情報15を基に参照先領域18を算出する。具体的には、例えば、領域を(i,j)で表し、動き予測情報15を動きベクトル(MHV(i,j),MVV(i,j))で表すとき、参照先領域18は(i−MHV(i,j),j−MVV(i,j))で求められる。ここで、参照先領域18が領域の単位に一致しない場合等でも、最も近い領域を参照先領域18とするなど適宜処理を行って参照先領域18を算出することができる。或いは、参照先領域18が現在の領域から離れている、参照先領域18が予測符号化されていない、等のさまざまな条件下においては、参照先領域18を存在しないと規定することができる。
また、参照先領域算出部2022は、存在する参照先領域18の数を参照可能領域19としてカウントする。
また、参照先領域算出部2022は、存在する参照先領域18の数を参照可能領域19としてカウントする。
ディゾルブ/フェード領域抽出部2023は、領域変化方向算出部2021から入力された領域変化方向17と、以前にバッファメモリ2026に格納された過去のピクチャの領域変化方向17とを利用して、参照先領域18と比較して領域変化方向17が等しく、かつ非0である領域を抽出し、ディゾルブ/フェード領域20としてその数をカウントする。この処理は、すなわち輝度が継続して変化している領域を抽出する処理である。
判定部2024は、参照先領域算出部2022がカウントした参照可能領域19の数(以下cntと称する)に対するディゾルブ/フェード領域抽出部2023がカウントしたディゾルブ/フェード領域20の数(以下fcntと称する)の割合(fcnt/cnt)と所定のしきい値との比較を行い、所定のしきい値よりも当該割合が大きい場合には、その予測符号化ピクチャ12をディゾルブ/フェード領域を含むピクチャ(ディゾルブ/フェード区間)であると判定し、どのピクチャがディゾルブ/フェード区間であるかを示すディゾルブ/フェード結果として出力する。ただし、ここで参照可能領域19が予測符号化ピクチャ12内に占める割合が小さい場合は、そのピクチャにおけるディゾルブ/フェード結果を無効にし、そのピクチャはディゾルブ/フェード区間ではないという判定をしてもよい。
判定部2024が行う判定の一例を図3に示す。
図3はディゾルブ/フェード結果の一例を示す図である。図3では縦軸にある動画像圧縮データのfcnt/cnt、横軸にピクチャフレームをとった図である。図3中の破線がしきい値の一例であり、判定部2024はfcnt/cntがこれを超えているピクチャをディゾルブ/フェード区間であると判定する。すなわち、判定部2024は、図3に示す、しきい値よりディゾルブ/フェード結果が大きい区間をディゾルブ/フェード区間であると判定する。
ここで、しきい値は例えば経験的に決定される所定の値であり、全ての領域に対して一定のしきい値を使用し判定を行う。
図3はディゾルブ/フェード結果の一例を示す図である。図3では縦軸にある動画像圧縮データのfcnt/cnt、横軸にピクチャフレームをとった図である。図3中の破線がしきい値の一例であり、判定部2024はfcnt/cntがこれを超えているピクチャをディゾルブ/フェード区間であると判定する。すなわち、判定部2024は、図3に示す、しきい値よりディゾルブ/フェード結果が大きい区間をディゾルブ/フェード区間であると判定する。
ここで、しきい値は例えば経験的に決定される所定の値であり、全ての領域に対して一定のしきい値を使用し判定を行う。
復号部203は、判定部2024が判定したディゾルブ/フェード結果を参照して、動画像圧縮データ11の精度よい復号を行う。
第1実施形態のデコーダ200の動作例を図2と関連付けて説明する。
図2は、デコーダ200の動作例を示すフローチャートである。
図2は、デコーダ200の動作例を示すフローチャートである。
ステップST1:
符号化情報抽出部201は、入力された動画像圧縮データ11を解凍し、逆量子化を行って予測符号化ピクチャ12を抽出し、予測符号化ピクチャ12の各領域(マクロブロック)の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出する。
符号化された動画像圧縮データを復号(デコード)し再生するためには、順に解凍、逆量子化、逆DCT変換が必要であるが、ステップST2以降の処理において、輝度情報13が必要になるため、本ステップにおいて逆量子化まで済ませておく。何故なら、逆量子化を済ませていないと輝度情報13を参照することができないからである。
ステップST2:
領域変化方向算出部2021は、現在の領域とその領域の過去の輝度情報13を基に輝度差分情報16を算出し、これの符号の基に領域変化方向17を規定する。
符号化情報抽出部201は、入力された動画像圧縮データ11を解凍し、逆量子化を行って予測符号化ピクチャ12を抽出し、予測符号化ピクチャ12の各領域(マクロブロック)の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出する。
符号化された動画像圧縮データを復号(デコード)し再生するためには、順に解凍、逆量子化、逆DCT変換が必要であるが、ステップST2以降の処理において、輝度情報13が必要になるため、本ステップにおいて逆量子化まで済ませておく。何故なら、逆量子化を済ませていないと輝度情報13を参照することができないからである。
ステップST2:
領域変化方向算出部2021は、現在の領域とその領域の過去の輝度情報13を基に輝度差分情報16を算出し、これの符号の基に領域変化方向17を規定する。
ステップST3:
参照先領域算出部2022は、現在の領域の予測符号化/非予測符号化情報14、動き予測情報15と当該領域の過去の予測符号化/非予測符号化情報14、動き予測情報15を基に参照先領域18を算出し、その内予測符号化されているものを参照可能領域19として、その数cntを算出する。
ステップST4:
ディゾルブ/フェード領域抽出部2023は、ステップST2において領域変化方向算出部2021が算出した領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20を抽出してその数fcntをカウントする。
参照先領域算出部2022は、現在の領域の予測符号化/非予測符号化情報14、動き予測情報15と当該領域の過去の予測符号化/非予測符号化情報14、動き予測情報15を基に参照先領域18を算出し、その内予測符号化されているものを参照可能領域19として、その数cntを算出する。
ステップST4:
ディゾルブ/フェード領域抽出部2023は、ステップST2において領域変化方向算出部2021が算出した領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20を抽出してその数fcntをカウントする。
ステップST5:
判定部2024が、参照可能領域19とディゾルブ/フェード領域20から現在の領域がディゾルブ/フェード区間であるか否かを判定する。
ステップST6:
復号部203が、入力された動画像圧縮データ11を復号する。
判定部2024が、参照可能領域19とディゾルブ/フェード領域20から現在の領域がディゾルブ/フェード区間であるか否かを判定する。
ステップST6:
復号部203が、入力された動画像圧縮データ11を復号する。
次に、ディゾルブ/フェード区間検出部202が行う処理の詳細について、図4を参照しながら説明する。
図4は、ディゾルブ/フェード区間検出部202が行う処理の例を示したフローチャートである。
図4は、ディゾルブ/フェード区間検出部202が行う処理の例を示したフローチャートである。
各ステップについて説明する前に、各変数について説明する。
cntは参照可能領域19の数、fcntはディゾルブ/フェード領域20の数、(n,i,j)はn番目(nは正整数)のピクチャ内の座標(i,j)で表される領域、MVH(n,i,j)とMVV(n,i,j)はそれぞれ(n,i,j)領域の水平、垂直動きベクトル、Δy(n,i,j)は(n,i,j)領域の輝度の差分情報である。pred(n,i,j)はn番目の(現在の)予測符号化ピクチャの(n,i,j)領域が予測符号化されているかを0或いは1で保持する(ここでは予測符号化されていない場合を0、そうでない場合を1とする)。領域変化方向17を示すsign(n,i,j)は、n番目の予測符号化ピクチャのΔy(n,i,j)の符号を正、負、0のいずれかで示す。
cntは参照可能領域19の数、fcntはディゾルブ/フェード領域20の数、(n,i,j)はn番目(nは正整数)のピクチャ内の座標(i,j)で表される領域、MVH(n,i,j)とMVV(n,i,j)はそれぞれ(n,i,j)領域の水平、垂直動きベクトル、Δy(n,i,j)は(n,i,j)領域の輝度の差分情報である。pred(n,i,j)はn番目の(現在の)予測符号化ピクチャの(n,i,j)領域が予測符号化されているかを0或いは1で保持する(ここでは予測符号化されていない場合を0、そうでない場合を1とする)。領域変化方向17を示すsign(n,i,j)は、n番目の予測符号化ピクチャのΔy(n,i,j)の符号を正、負、0のいずれかで示す。
ステップST11:
ディゾルブ/フェード区間検出部202は、n番目のピクチャについて、ディゾルブ/フェード領域検出処理を開始する。
ステップST12:
ディゾルブ/フェード区間検出部202は、各変数の初期化を行い、0に設定する。
ディゾルブ/フェード区間検出部202は、n番目のピクチャについて、ディゾルブ/フェード領域検出処理を開始する。
ステップST12:
ディゾルブ/フェード区間検出部202は、各変数の初期化を行い、0に設定する。
ステップST13:
ディゾルブ/フェード区間検出部202は、現在の領域(n,i,j)が予測符号化されている領域であるか否かを判定する。現在の領域(n,i,j)の予測符号化/非予測符号化情報14を基に予測符号化されている領域であるか否かの判定を行い、されている場合はステップST14に進み、そうでないときはステップST23に進む。
ステップST14:
ディゾルブ/フェード区間検出部202は、輝度情報13を基に、参照先領域18との輝度差分情報16:Δy(n,i,j)を算出し、その符号を領域変化方向17:sign(n,i,j)として保持する。また、同時に、ステップST13において領域(n,i,j)は予測符号化された領域であることが明らかになっているので、pred(n,i,j)を1に設定して保持する。
ディゾルブ/フェード区間検出部202は、現在の領域(n,i,j)が予測符号化されている領域であるか否かを判定する。現在の領域(n,i,j)の予測符号化/非予測符号化情報14を基に予測符号化されている領域であるか否かの判定を行い、されている場合はステップST14に進み、そうでないときはステップST23に進む。
ステップST14:
ディゾルブ/フェード区間検出部202は、輝度情報13を基に、参照先領域18との輝度差分情報16:Δy(n,i,j)を算出し、その符号を領域変化方向17:sign(n,i,j)として保持する。また、同時に、ステップST13において領域(n,i,j)は予測符号化された領域であることが明らかになっているので、pred(n,i,j)を1に設定して保持する。
ステップST15:
ディゾルブ/フェード区間検出部202は、領域(n,i,j)の水平方向の動きベクトル(動き予測情報15)MVH(n,i,j)及び垂直方向の動きベクトル(n,i,j)がそれぞれしきい値ベクトルMVthよりも小さいか否かを判定し、水平垂直どちらもしきい値ベクトルMVthよりも小さい場合はステップST16に進み、そうでない場合はステップST21に進む。
しきい値ベクトルMVthの大きさは、例えば所定の経験的に求められた値等でよく、本実施形態では限定しない。
ステップST16:
ディゾルブ/フェード区間検出部202は、参照先のずれを補正するために、領域(n,i,j)の参照先領域18:(n−1,i’,j’)をi’=i−MVH(n,i,j)、j’=j−MVV(n,i,j)で算出する。参照先領域18は、過去のピクチャ(例えばn−1番目のピクチャ)上に存在する。
ディゾルブ/フェード区間検出部202は、領域(n,i,j)の水平方向の動きベクトル(動き予測情報15)MVH(n,i,j)及び垂直方向の動きベクトル(n,i,j)がそれぞれしきい値ベクトルMVthよりも小さいか否かを判定し、水平垂直どちらもしきい値ベクトルMVthよりも小さい場合はステップST16に進み、そうでない場合はステップST21に進む。
しきい値ベクトルMVthの大きさは、例えば所定の経験的に求められた値等でよく、本実施形態では限定しない。
ステップST16:
ディゾルブ/フェード区間検出部202は、参照先のずれを補正するために、領域(n,i,j)の参照先領域18:(n−1,i’,j’)をi’=i−MVH(n,i,j)、j’=j−MVV(n,i,j)で算出する。参照先領域18は、過去のピクチャ(例えばn−1番目のピクチャ)上に存在する。
ステップST17:
ディゾルブ/フェード区間検出部202は、参照先領域18:(n−1,i’,j')が予測符号化されているか否かを参照先領域18の予測符号化/非予測符号化情報14を基に判定し、されている場合はステップST18に進み、そうでない場合はステップST21に進む。
ステップST18:
ディゾルブ/フェード区間検出部202は、参照先領域18が予測を行われた領域である場合は参照可能領域19であるとしてカウントし(参照可能領域19の数cntに1を加算して)、ステップST19に進む。
ディゾルブ/フェード区間検出部202は、参照先領域18:(n−1,i’,j')が予測符号化されているか否かを参照先領域18の予測符号化/非予測符号化情報14を基に判定し、されている場合はステップST18に進み、そうでない場合はステップST21に進む。
ステップST18:
ディゾルブ/フェード区間検出部202は、参照先領域18が予測を行われた領域である場合は参照可能領域19であるとしてカウントし(参照可能領域19の数cntに1を加算して)、ステップST19に進む。
ステップST19:
ディゾルブ/フェード区間検出部202は、領域(n,i,j)と参照先領域18:(n−1,i’,j’)との輝度差分情報16:Δy(n,i,j)と、参照先領域18:(n−1,i’,j’)との輝度の差分情報16:Δy(n−1,i’,j’)とが同一符号かつ0でないことを条件に、ステップST20に進み、上記条件を満たさない場合はステップST21に進む。このステップは、すなわち、輝度が連続して変化しているか否かを判定するステップである。
ステップST20:
ステップST9の条件を満たしていた領域(n,i,j)をディゾルブ/フェード領域20であるとしてカウントし(ディゾルブ/フェード領域20の数fcntに1を加算して)、ステップST21に進む。
ディゾルブ/フェード区間検出部202は、領域(n,i,j)と参照先領域18:(n−1,i’,j’)との輝度差分情報16:Δy(n,i,j)と、参照先領域18:(n−1,i’,j’)との輝度の差分情報16:Δy(n−1,i’,j’)とが同一符号かつ0でないことを条件に、ステップST20に進み、上記条件を満たさない場合はステップST21に進む。このステップは、すなわち、輝度が連続して変化しているか否かを判定するステップである。
ステップST20:
ステップST9の条件を満たしていた領域(n,i,j)をディゾルブ/フェード領域20であるとしてカウントし(ディゾルブ/フェード領域20の数fcntに1を加算して)、ステップST21に進む。
ステップST21:
iが横方向の領域数、すなわち予測符号化ピクチャ12内の横方向のマクロブロック数よりも小さい場合はステップST24に進む。iが予測符号化ピクチャ12内の横方向の領域数と等しくなったら、横一列分の領域の処理が終了したとしてステップST22に進む。
ステップST22
jが縦方向の領域数、すなわち予測符号化ピクチャ12内の縦方向のマクロブロック数よりも小さい場合はステップST25に進み、現在のiに1を加えてステップST13に戻る。jが予測符号化ピクチャ12内の縦方向の領域数と等しくなったら、全ての領域の処理が終了したとしてn番目のピクチャに対する処理は終了する。
iが横方向の領域数、すなわち予測符号化ピクチャ12内の横方向のマクロブロック数よりも小さい場合はステップST24に進む。iが予測符号化ピクチャ12内の横方向の領域数と等しくなったら、横一列分の領域の処理が終了したとしてステップST22に進む。
ステップST22
jが縦方向の領域数、すなわち予測符号化ピクチャ12内の縦方向のマクロブロック数よりも小さい場合はステップST25に進み、現在のiに1を加えてステップST13に戻る。jが予測符号化ピクチャ12内の縦方向の領域数と等しくなったら、全ての領域の処理が終了したとしてn番目のピクチャに対する処理は終了する。
ステップST23:
ステップST3において領域(n,i,j)が予測符号化されていないと明らかになった場合は、pred(n,i,j)を0に保持してステップST21に進む。
ステップST24:
現在のiに1を加えてステップST13に戻る。すなわち、予測符号化ピクチャ12内の横方向の領域全てに上述した処理を行うまで上記ステップST13〜ST20を繰り返す。
ステップST25:
現在のjに1を加えてステップST13に戻る。すなわち、予測符号化ピクチャ12内の領域全てに上述した処理を行うまで上記ステップST13〜ST20を繰り返す。
ステップST3において領域(n,i,j)が予測符号化されていないと明らかになった場合は、pred(n,i,j)を0に保持してステップST21に進む。
ステップST24:
現在のiに1を加えてステップST13に戻る。すなわち、予測符号化ピクチャ12内の横方向の領域全てに上述した処理を行うまで上記ステップST13〜ST20を繰り返す。
ステップST25:
現在のjに1を加えてステップST13に戻る。すなわち、予測符号化ピクチャ12内の領域全てに上述した処理を行うまで上記ステップST13〜ST20を繰り返す。
以上説明したように、以上説明したように、本第1実施形態のデコーダ200はディゾルブ/フェード区間検出部202を有し、ディゾルブ/フェード区間検出部202は、動き予測を伴う動画像圧縮データから、動きベクトルが小さい領域、すなわち画面全体の動きが少ない場面のみを抽出し、その中から輝度が連続して変化している領域をディゾルブ/フェード領域として判定しているので、ズームやパンといった動きが比較的大きい区間を誤って検出してしまうことが無く、動き予測が誤っている可能性が高い領域(動きベクトルが大きい領域)を除外して判定を行うので、精度良くディゾルブ/フェード区間を検出することができる。
また、本第1実施形態のデコーダ200によると、入力された動画像圧縮データ11を完全にデコードせずともディゾルブ/フェード区間を検出できるので、計算量を減らすことができる。
また、予測符号化ピクチャ12にはPピクチャを使用するので、輝度差分情報16を算出する必要がなく、処理を早めディゾルブ/フェード区間検出部202にかかる負荷を小さくすることができる。
また、本第1実施形態のデコーダ200によると、入力された動画像圧縮データ11を完全にデコードせずともディゾルブ/フェード区間を検出できるので、計算量を減らすことができる。
また、予測符号化ピクチャ12にはPピクチャを使用するので、輝度差分情報16を算出する必要がなく、処理を早めディゾルブ/フェード区間検出部202にかかる負荷を小さくすることができる。
本第1実施形態では、判定部2024が、ディゾルブ/フェード領域20(上記図4に関連した説明におけるfcnt)が参照可能領域19(上記図4に関連した説明におけるcnt)に占める割合(fcnt/cnt)と比較を行うしきい値は、本実施形態では所定の値としたが、本発明はこれには限定されない。例えば、各領域の動きベクトルの大きさに合わせてしきい値を変化させ、より検出精度を上げるようにするような構成も考えられる。
<第2実施形態>
第2実施形態では、予測符号化された動画像圧縮データ11を基に、再符号化を行う再符号化装置300について説明する。
具体的には、再符号化装置300は、MPEG1、MPEG2、H264.AVCのように動き予測を伴う動画像圧縮データを入力されて、入力されたデータと同一もしくは異なるフォーマットに再符号化した動画像圧縮データを出力する。
入力されるデータと、再符号化装置300が出力するデータは、本発明では特に限定しない。ただし、入力されるデータは動き予測を伴う動画像圧縮データでなければならない。
<第2実施形態>
第2実施形態では、予測符号化された動画像圧縮データ11を基に、再符号化を行う再符号化装置300について説明する。
具体的には、再符号化装置300は、MPEG1、MPEG2、H264.AVCのように動き予測を伴う動画像圧縮データを入力されて、入力されたデータと同一もしくは異なるフォーマットに再符号化した動画像圧縮データを出力する。
入力されるデータと、再符号化装置300が出力するデータは、本発明では特に限定しない。ただし、入力されるデータは動き予測を伴う動画像圧縮データでなければならない。
図5は、再符号化装置300の構成を示すブロック図である。
再符号化装置300は、図5に示すように、符号化情報抽出部301、ディゾルブ/フェード区間検出部302、復号部303、再符号化部304を有する。
また、ディゾルブ/フェード区間検出部302は、更に領域変化方向算出部3021、参照先領域算出部3022、ディゾルブ/フェード領域抽出部3023、判定部3024、バッファメモリ3025及び3026を有する。
本第2実施形態のディゾルブ/フェード区間検出部302は、第1実施形態のディゾルブ/フェード区間検出部202と同様の構成を有し同様の動作を行う。同様に、ディゾルブ/フェード区間検出部302の各構成要素も第1実施形態で説明したディゾルブ/フェード区間検出部202の各構成要素と同様の動作を行う。すなわち、領域変化方向算出部3021は領域変化方向算出部2021と、参照先領域算出部3022は参照先領域算出部2022と、ディゾルブ/フェード領域抽出部3023はディゾルブ/フェード領域抽出部2023と、判定部3024は判定部2024と、バッファメモリ3025及び3026はバッファメモリ2025及び2026と同様の動作を行う。
再符号化装置300は、図5に示すように、符号化情報抽出部301、ディゾルブ/フェード区間検出部302、復号部303、再符号化部304を有する。
また、ディゾルブ/フェード区間検出部302は、更に領域変化方向算出部3021、参照先領域算出部3022、ディゾルブ/フェード領域抽出部3023、判定部3024、バッファメモリ3025及び3026を有する。
本第2実施形態のディゾルブ/フェード区間検出部302は、第1実施形態のディゾルブ/フェード区間検出部202と同様の構成を有し同様の動作を行う。同様に、ディゾルブ/フェード区間検出部302の各構成要素も第1実施形態で説明したディゾルブ/フェード区間検出部202の各構成要素と同様の動作を行う。すなわち、領域変化方向算出部3021は領域変化方向算出部2021と、参照先領域算出部3022は参照先領域算出部2022と、ディゾルブ/フェード領域抽出部3023はディゾルブ/フェード領域抽出部2023と、判定部3024は判定部2024と、バッファメモリ3025及び3026はバッファメモリ2025及び2026と同様の動作を行う。
符号化情報抽出部301は、入力された動画像圧縮データ11に解凍処理及び逆量子化処理を行い、予測符号化ピクチャ12を抽出すると同時に、ディゾルブ/フェード区間検出部302の行うディゾルブ/フェード区間検出処理に必要なパラメータ(輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15)を抽出する。
ここで、符号化情報抽出部301に入力される動画像圧縮データ11は、MPEG1、MPEG2、MPEG4、H.264/AVC等、動き予測とフレーム或いはフィールド間順方向予測符号化を備えた方式により作成されている必要がある。
予測符号化ピクチャ12は、例えば、フレーム間またはフィールド間予測符号化方式によって圧縮されたPピクチャ画像データ列である。
予測符号化ピクチャ12は、例えばHDD(Hard Disk Drive)やCD−ROM等の記録装置に記録されたデータ、或いはインターネット等のネットワークを経由して伝送されるデータ等である。
ここで、符号化情報抽出部301に入力される動画像圧縮データ11は、MPEG1、MPEG2、MPEG4、H.264/AVC等、動き予測とフレーム或いはフィールド間順方向予測符号化を備えた方式により作成されている必要がある。
予測符号化ピクチャ12は、例えば、フレーム間またはフィールド間予測符号化方式によって圧縮されたPピクチャ画像データ列である。
予測符号化ピクチャ12は、例えばHDD(Hard Disk Drive)やCD−ROM等の記録装置に記録されたデータ、或いはインターネット等のネットワークを経由して伝送されるデータ等である。
符号化情報抽出部301は、予測符号化ピクチャ12から各領域の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出し、ディゾルブ/フェード区間検出部302に出力される。輝度情報13は、領域変化方向算出部3021に入力される。予測符号化/非予測符号化情報14、動き予測情報15は参照先領域算出部3022に入力されると共に、バッファメモリ3025に格納される。
ディゾルブ/フェード区間検出部302は、符号化情報抽出部301が抽出したパラメータ(輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15)を利用して、動画像圧縮データ11のディゾルブ/フェード区間を検出する。
領域変化方向算出部3021は、符号化情報抽出部301が動画像圧縮データ11から抽出した輝度情報13から、予測符号化ピクチャ12の各領域の輝度がどのような傾向で変化しているかを算出する。予測符号化が行われた領域において、輝度情報13の変化を輝度差分情報16として算出し、輝度差分情報16が正であるか、負であるか、0であるかの3レベルに分けて領域変化方向17を規定する。この際、単純に輝度差分情報16の符号によって領域変化方向17を規定しても良いし、ある所定のしきい値を超えた値を正、しきい値未満を負、その他を0としてもよい。更に細かいレベルに分類する手法を採っても良い。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部3023に入力され、また同時にバッファメモリ3026に格納される。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部3023に入力され、また同時にバッファメモリ3026に格納される。
参照先領域算出部3022は、符号化情報抽出部301から入力された予測符号化/非予測符号化情報14、動き予測情報15と、以前にバッファメモリ3025に格納された過去のピクチャの予測符号化/非予測符号化情報14、動き予測情報15とを利用して、予測符号化ピクチャ12の各領域において、どの領域から予測されたのかを参照先領域18として算出する。予測符号化が行われた領域において、その領域の動き予測情報15を基に参照先領域18を算出する。例えば、領域を(i,j)で表し、動き予測情報15を動きベクトル(MHV(i,j),MVV(i,j))で表すとき、参照先領域18は(i−MHV(i,j),j−MVV(i,j))で求められる。ここで、参照先領域18が領域の単位に一致しない場合でも、最も近い領域を参照先領域18とするなど適宜処理を行って参照先領域18を算出する。或いは、参照先領域18が現在の領域から離れている、参照先領域18が予測符号化されていない、等のさまざまな条件化において、参照先領域18を存在しないと規定することができる。
また、参照先領域算出部3022は、存在する参照先領域18の数を参照可能領域19としてカウントする。
また、参照先領域算出部3022は、存在する参照先領域18の数を参照可能領域19としてカウントする。
ディゾルブ/フェード領域抽出部3023は、領域変化方向算出部3021から入力された領域変化方向17と、以前にバッファメモリ3026に格納された過去のピクチャの領域変化方向17とを利用して、参照先領域18と比較して領域変化方向17が等しく、かつ非0である領域を抽出し、ディゾルブ/フェード領域20としてカウントする。この処理は、すなわち輝度が継続して変化している領域を抽出する処理である。
判定部3024は、参照先領域算出部3022がカウントした参照可能領域19の数に対するディゾルブ/フェード領域抽出部3023がカウントしたディゾルブ/フェード領域20の数の割合から、その領域がディゾルブ/フェードであるか否かの判定を行い、ディゾルブ/フェード結果として出力する。ただし、ここで参照可能領域19が予測符号化ピクチャ12内に占める割合が小さい場合は、そのピクチャにおけるディゾルブ/フェード結果を無効にし、そのピクチャはディゾルブ/フェード区間ではないという判定をしてもよい。
復号部303は、入力された動画像圧縮データ11を復号し、復号された復号データを再符号化部304に出力する。
再符号化部304は、復号部303から出力された復号データを基に、ディゾルブ/フェード区間検出部302が出力したディゾルブ/フェード結果に応じてディゾルブ/フェード区間に所定の処理を行いながら、入力された動画像圧縮データ11と同一もしくは異なる圧縮符号化方式で再符号化を行う。
所定の処理は、例えば重み付き処理等、ディゾルブ/フェード区間の再符号化画質が向上する処理である。
再符号化部304は、復号部303から出力された復号データを基に、ディゾルブ/フェード区間検出部302が出力したディゾルブ/フェード結果に応じてディゾルブ/フェード区間に所定の処理を行いながら、入力された動画像圧縮データ11と同一もしくは異なる圧縮符号化方式で再符号化を行う。
所定の処理は、例えば重み付き処理等、ディゾルブ/フェード区間の再符号化画質が向上する処理である。
第2実施形態の再符号化装置300の動作例を図6と関連付けて説明する。
図6は、再符号化装置300の動作例を示すフローチャートである。
図6は、再符号化装置300の動作例を示すフローチャートである。
ステップST31:
符号化情報抽出部301は、入力された動画像圧縮データ11を解凍し、逆量子化を行って予測符号化ピクチャ12を抽出し、予測符号化ピクチャ12の各領域(マクロブロック)の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出する。
ステップST32:
領域変化方向算出部3021は、現在の領域とその領域の過去の輝度情報13を基に輝度差分情報16を算出し、これの符号の基に領域変化方向17を規定する。
符号化情報抽出部301は、入力された動画像圧縮データ11を解凍し、逆量子化を行って予測符号化ピクチャ12を抽出し、予測符号化ピクチャ12の各領域(マクロブロック)の輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15を抽出する。
ステップST32:
領域変化方向算出部3021は、現在の領域とその領域の過去の輝度情報13を基に輝度差分情報16を算出し、これの符号の基に領域変化方向17を規定する。
ステップST33:
参照先領域算出部3022は、現在の領域の予測符号化/非予測符号化情報14、動き予測情報15と当該領域の過去の予測符号化/非予測符号化情報14、動き予測情報15を基に参照先領域18を算出し、その内予測符号化されているものを参照可能領域19として、その数cntを算出する。
ステップST34:
ディゾルブ/フェード領域抽出部3023は、ステップST32において領域変化方向算出部3021が算出した領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20を抽出してその数をカウントする。
参照先領域算出部3022は、現在の領域の予測符号化/非予測符号化情報14、動き予測情報15と当該領域の過去の予測符号化/非予測符号化情報14、動き予測情報15を基に参照先領域18を算出し、その内予測符号化されているものを参照可能領域19として、その数cntを算出する。
ステップST34:
ディゾルブ/フェード領域抽出部3023は、ステップST32において領域変化方向算出部3021が算出した領域変化方向17を基に、その領域がディゾルブ/フェード領域20であるか否かを判定し、予測符号化ピクチャ12全体のディゾルブ/フェード領域20を抽出してその数をカウントする。
ステップST35:
判定部3024が、参照可能領域19とディゾルブ/フェード領域20から現在の領域がディゾルブ/フェード区間であるか否かを判定する。
ステップST36:
復号部303が、入力された動画像圧縮データ11を復号し、復号データを再符号化部304に出力する。
判定部3024が、参照可能領域19とディゾルブ/フェード領域20から現在の領域がディゾルブ/フェード区間であるか否かを判定する。
ステップST36:
復号部303が、入力された動画像圧縮データ11を復号し、復号データを再符号化部304に出力する。
ステップST37:
再符号化部304は、ディゾルブ/フェード区間検出部302が出力したディゾルブ/フェード結果を基に、ディゾルブ/フェード区間に対しては重み付き予測等の特殊な処理を行いながら、入力された復号データを再符号化する。
再符号化部304は、ディゾルブ/フェード区間検出部302が出力したディゾルブ/フェード結果を基に、ディゾルブ/フェード区間に対しては重み付き予測等の特殊な処理を行いながら、入力された復号データを再符号化する。
再符号化装置300のディゾルブ/フェード区間検出部302が行う参照可能領域19の数とディゾルブ/フェード領域20の数を求める処理については、図4に関連付けて第1実施例で説明した処理と同様であるので、ここでは説明を省略する。
以上説明したように、本実施形態の再符号化装置300によれば、再符号化部304がディゾルブ/フェード区間検出部302の出力したディゾルブ/フェード結果を基に、復号部303が復号した復号データを再符号化するので、再符号化時の処理量が軽減され処理時間は短縮され、またディゾルブ/フェード区間に対しては重み付き予測等の処理を行うので、当該区間の再符号化画質を向上させることができる。
<第3実施形態>
本第3実施形態では、ディゾルブ/フェード区間検出装置100の各構成と概略的動作について説明する。
図7は、ディゾルブ/フェード区間検出装置100の構成を示すブロック図である。
ディゾルブ/フェード区間検出装置100は、領域変化方向算出部101、参照先領域算出部102、ディゾルブ/フェード領域抽出部103、判定部104、バッファメモリ105及び106を有する。
<第3実施形態>
本第3実施形態では、ディゾルブ/フェード区間検出装置100の各構成と概略的動作について説明する。
図7は、ディゾルブ/フェード区間検出装置100の構成を示すブロック図である。
ディゾルブ/フェード区間検出装置100は、領域変化方向算出部101、参照先領域算出部102、ディゾルブ/フェード領域抽出部103、判定部104、バッファメモリ105及び106を有する。
ディゾルブ/フェード区間検出装置100には、複数の予測符号化ピクチャ12で構成された動画像圧縮データ11から抽出されたパラメータ(符号化情報):輝度情報13、予測符号化/非予測符号化情報14、動き予測情報15が入力され、ディゾルブ/フェード区間検出装置100はこれらパラメータを基に、動画像圧縮データ11内のディゾルブ/フェード区間を検出する。
以下詳しく説明する。
まず、ディゾルブ/フェード区間検出装置100に入力されたパラメータのうち、輝度情報13は領域変化方向算出部101に入力され、予測符号化/非予測符号化情報14及び動き予測情報15は、予測符号化ピクチャ12毎に分類されてバッファメモリ105に格納されるとともに、参照先領域算出部102に入力される。
まず、ディゾルブ/フェード区間検出装置100に入力されたパラメータのうち、輝度情報13は領域変化方向算出部101に入力され、予測符号化/非予測符号化情報14及び動き予測情報15は、予測符号化ピクチャ12毎に分類されてバッファメモリ105に格納されるとともに、参照先領域算出部102に入力される。
本第3実施形態のディゾルブ/フェード区間検出装置100は、第1実施形態のディゾルブ/フェード区間検出部202と同様の構成を有し同様の動作を行う。同様に、ディゾルブ/フェード区間検出装置100の各構成要素も第1実施形態で説明したディゾルブ/フェード区間検出部202の各構成要素と同様の動作を行う。すなわち、領域変化方向算出部101は領域変化方向算出部2021と、参照先領域算出部102は参照先領域算出部2022と、ディゾルブ/フェード領域抽出部103はディゾルブ/フェード領域抽出部2023と、判定部104は判定部2024と、バッファメモリ105及び106はバッファメモリ2025及び2026と同様の動作を行う。
領域変化方向算出部101は、入力された輝度情報13から、予測符号化ピクチャ12の各領域の輝度がどのような傾向で変化しているかを算出する。予測符号化が行われた領域において、輝度情報13の変化を輝度差分情報16とし、輝度差分情報16が正であるか、負であるか、0であるかの3レベルに分けて領域変化方向17を規定する。この際、単純に輝度差分情報16の符号によって領域変化方向17を規定しても良いし、ある所定のしきい値を超えた値を正、しきい値未満を負、その他を0としてもよい。更に細かいレベルに分類する手法を採っても良い。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部103に入力され、また同時にバッファメモリ106に格納される。
ここで算出された領域変化方向17は、ディゾルブ/フェード領域抽出部103に入力され、また同時にバッファメモリ106に格納される。
参照先領域算出部102は、入力された予測符号化/非予測符号化情報14、動き予測情報15と、以前にバッファメモリ105に格納された過去の予測符号化ピクチャ12の予測符号化/非予測符号化情報14、動き予測情報15とを利用して、予測符号化ピクチャ12の各領域において、どの領域から予測されたのかを参照先領域18として算出する。すなわち、予測符号化が行われた領域において、その領域の動き予測情報15を基に参照先領域18を算出する。具体的には、例えば、領域を(i,j)で表し、動き予測情報15を動きベクトル(MHV(i,j),MVV(i,j))で表すとき、参照先領域18は(i−MHV(i,j),j−MVV(i,j))で求められる。ここで、参照先領域18が領域の単位に一致しない場合等でも、最も近い領域を参照先領域18とするなど適宜処理を行って参照先領域18を算出することができる。或いは、参照先領域18が現在の領域から離れている、参照先領域18が予測符号化されていない、等のさまざまな条件化においては、参照先領域18を存在しないと規定することができる。
また、参照先領域算出部102は、存在する参照先領域18の数を参照可能領域19としてカウントする。
また、参照先領域算出部102は、存在する参照先領域18の数を参照可能領域19としてカウントする。
ディゾルブ/フェード領域抽出部103は、領域変化方向算出部101から入力された領域変化方向17と、以前にバッファメモリ106に格納された過去のピクチャの領域変化方向17とを利用して、参照先領域18と比較して領域変化方向17が等しく、かつ非0である領域を抽出し、ディゾルブ/フェード領域20としてその数をカウントする。この処理は、すなわち輝度が継続して変化している領域を抽出する処理である。
判定部104は、参照先領域算出部102がカウントした参照可能領域19の数に対するディゾルブ/フェード領域抽出部103がカウントしたディゾルブ/フェード領域20の数の割合から、その予測符号化ピクチャ12がディゾルブ/フェード領域を含むピクチャ(ディゾルブ/フェード区間)であるか否かの判定を行い、どのピクチャがディゾルブ/フェード区間であるかを示すディゾルブ/フェード結果として出力する。ただし、ここで参照可能領域19が予測符号化ピクチャ12内に占める割合が小さい場合は、そのピクチャにおけるディゾルブ/フェード結果を無効にし、そのピクチャはディゾルブ/フェード区間ではないという判定をしてもよい。
ディゾルブ/フェード区間検出装置100の動作例については、第1実施形態のディゾルブ/フェード区間検出部202と同様であるので説明を省略する。
以上説明したように、本第1実施形態のディゾルブ/フェード区間検出装置100によれば、動き予測を伴う動画像圧縮データから、動きベクトルが小さい領域、すなわち画面全体の動きが少ない場面のみを抽出し、その中から輝度が連続して変化している領域をディゾルブ/フェード領域として判定しているので、ズームやパンといった動きが比較的大きい区間を誤って検出してしまうことが無く、動き予測が誤っている可能性が高い領域(動きベクトルが大きい領域)を除外して判定を行うので、精度良くディゾルブ/フェード区間を検出することができる。
本発明は上述した実施形態には限定されない。
すなわち、本発明の実施に際しては、本発明の技術的範囲またはその均等の範囲内において、上述した実施形態の構成要素に関し様々な変更、コンビネーション、サブコンビネーション、並びに代替を行ってもよい。
すなわち、本発明の実施に際しては、本発明の技術的範囲またはその均等の範囲内において、上述した実施形態の構成要素に関し様々な変更、コンビネーション、サブコンビネーション、並びに代替を行ってもよい。
本実施形態では、入力された動画像データのPピクチャのみを利用する構成としたが、本発明はこれには限定されない。実施形態中にも述べたように、Pピクチャの場合は輝度差分情報を有しているため計算量が少なくて済む、という利点を有するが、例えばBピクチャを利用しても本発明は実行することができる。ただし、Bピクチャの場合は前方向予測と後方向予測の両方の場合があるため、処理が少し煩雑になる。しかし、ピクチャの予測方向を検出し、前方向の場合は本実施形態と同様の処理を、後方向の場合は符号を逆転して処理を行うことで、本発明をBピクチャの場合にも実行することができる。
100…フェード区間検出装置、2021,3021,101…領域変化方向算出部、2022,3022,102…参照先領域算出部、2023,3023,103…フェード領域抽出部、2024,3024,104…判定部、2025,2026,3025,3026,105,106…バッファメモリ、200…デコーダ、201,301…符号化情報抽出部、202,302…フェード区間検出部、203,303…復号部、300…再符号化装置、304…再符号化部
Claims (9)
- フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、
動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、
前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、
前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、
を有するディゾルブ/フェード区間検出装置。 - 前記領域変化方向算出部は、前記画像データの各領域の有する輝度差分情報を基に前記領域変化方向を算出する
請求項1に記載のディゾルブ/フェード区間検出装置。 - 前記参照先領域算出部が、前記参照先領域が存在するか否かを判断する際に、前記参照先領域がインターマクロブロックであることを条件に参照先領域が存在すると判断する
請求項2に記載のディゾルブ/フェード区間検出装置。 - 前記判定部は、前記参照可能領域の数に対する前記ディゾルブ/フェード領域の数の前記割合と前記しきい値とを比較する際に、当該領域の前記動きベクトルの大きさに応じて前記しきい値を変化させる
請求項3に記載のディゾルブ/フェード区間検出装置。 - フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する第1の工程と、
動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする第2の工程と、
前記第1の工程において算出された前記参照先領域と前記第2の工程において算出された前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントする第3の工程と、
前記前記第2の工程において算出された前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する第4の工程と、
を有するディゾルブ/フェード区間検出方法。 - フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の内、どの領域がディゾルブ/フェード領域であるかを検出する装置に実行させるプログラムであって、
フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データ列の輝度情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する第1の手順と、
動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする第2の手順と、
前記第1の手順において算出された前記参照先領域と前記第2の手順において算出された前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントする第3の手順と、
前記第2の手順において算出された前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する第4の手順と、
を前記装置に実行させるプログラム。 - 画像データ列を復号する復号装置であって、
前記画像データ列から、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データを抽出して当該画像データの符号化情報を抽出する符号化情報抽出部と、
前記符号化情報を基に、前記画像データ列の内、どの画像がディゾルブ/フェード領域を含む画像であるかを検出し、ディゾルブ/フェード結果として出力するディゾルブ/フェード区間検出部と、
前記画像データ列の復号を行う復号部と、
を有し、
前記ディゾルブ/フェード区間検出部は、
前記符号化情報抽出部が抽出した前記符号化情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、
動き予測処理のとき参照する前記画像データ内の参照先領域を当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、
前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、
前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、
を更に有する復号装置。 - 所定の符号化圧縮方式によって圧縮された画像データ列を再符号化する再符号化装置であって、
前記画像データ列から、フレーム間またはフィールド間の画像データについて動き予測を行って圧縮符号化し、圧縮された画像データを抽出して当該画像データの符号化情報を抽出する符号化情報抽出部と、
前記符号化情報を基に、前記画像データ列の内、どの画像がディゾルブ/フェード領域を含む画像であるかを検出し、ディゾルブ/フェード結果として出力するディゾルブ/フェード区間検出部と、
前記画像データ列の復号を行う復号部と、
前記復号部が復号した前記画像データ列を基に前記所定の符号化圧縮方式と同一または異なる符号化圧縮方式によって再符号化を行う再符号化部と、
を有し、
前記ディゾルブ/フェード区間検出部は、
前記符号化情報抽出部が抽出した前記符号化情報に基づいて画像データ内の各領域の輝度の領域変化方向を算出する領域変化方向算出部と、
動き予測処理のとき参照する前記画像データ内の参照先領域を、当該領域の動きベクトルを基に算出し、存在する場合その参照先領域を参照可能領域として前記画像データ内の数をカウントする参照先領域算出部と、
前記参照先領域算出部が算出した前記参照先領域と前記領域変化方向算出部が算出した前記領域変化方向が等しく、かつ前記領域変化方向が0ではない領域を抽出し、当該領域をディゾルブ/フェード領域として前記画像データ内の数をカウントするディゾルブ/フェード領域抽出部と、
前記参照先領域算出部が算出した前記参照可能領域の数に対する前記ディゾルブ/フェード領域抽出部が抽出した前記ディゾルブ/フェード領域の数の割合を所定のしきい値と比較し、前記割合が前記所定のしきい値よりも大きければ当該画像データがディゾルブ/フェード区間のデータであると判定する判定部と、
を更に有し、
前記再符号化部は、前記ディゾルブ/フェード区間検出部が検出した前記ディゾルブ/フェード区間の再符号化の際には、所定の再符号化処理を行う
再符号化装置。 - 前記再符号化部が行う前記所定の再符号化処理は、重み付き予測による再符号化処理である
請求項8に記載の再符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006111731A JP2007288402A (ja) | 2006-04-14 | 2006-04-14 | ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006111731A JP2007288402A (ja) | 2006-04-14 | 2006-04-14 | ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007288402A true JP2007288402A (ja) | 2007-11-01 |
Family
ID=38759772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006111731A Pending JP2007288402A (ja) | 2006-04-14 | 2006-04-14 | ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007288402A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014208688A1 (ja) * | 2013-06-27 | 2014-12-31 | Kddi株式会社 | 映像符号化装置、映像復号装置、映像システム、映像符号化方法、映像復号方法、およびプログラム |
-
2006
- 2006-04-14 JP JP2006111731A patent/JP2007288402A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014208688A1 (ja) * | 2013-06-27 | 2014-12-31 | Kddi株式会社 | 映像符号化装置、映像復号装置、映像システム、映像符号化方法、映像復号方法、およびプログラム |
JP2015012389A (ja) * | 2013-06-27 | 2015-01-19 | Kddi株式会社 | 映像符号化装置、映像復号装置、映像システム、映像符号化方法、映像復号方法、およびプログラム |
CN105379265A (zh) * | 2013-06-27 | 2016-03-02 | 凯迪迪爱通信技术有限公司 | 视频编码装置、视频解码装置、视频系统、视频编码方法、视频解码方法以及程序 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5508534B2 (ja) | シーン切替検出 | |
US8718138B2 (en) | Image encoding apparatus and image encoding method that determine an encoding method, to be used for a block to be encoded, on the basis of an intra-frame-prediction evaluation value calculated using prediction errors between selected reference pixels and an input image | |
TW201249210A (en) | Encoding of video stream based on scene type | |
JP2009201112A (ja) | 直接モード符号化及び復号化方法 | |
JP4514203B2 (ja) | 動きベクトル検出装置及び方法 | |
JP2007053561A (ja) | 画像符号化装置および画像符号化方法 | |
JP2007201558A (ja) | 動画像符号化装置および動画像符号化方法 | |
JP2009290463A (ja) | 符号化装置/復号化装置、符号化方法/復号化方法及びプログラム | |
JP4445463B2 (ja) | 動画像再符号化方法及び装置 | |
US9654775B2 (en) | Video encoder with weighted prediction and methods for use therewith | |
JP2007228560A (ja) | 動画像符号化方法および動画像符号化装置 | |
JP2012054818A (ja) | 画像処理装置と画像処理方法 | |
JP2010258576A (ja) | シーンチェンジ検出装置および映像記録装置 | |
US20100322316A1 (en) | Moving-picture encoding apparatus and decoding apparatus | |
JP2007288402A (ja) | ディゾルブ/フェード区間検出装置、ディゾルブ/フェード区間検出方法、プログラム、復号装置及び再符号化装置 | |
JP4520442B2 (ja) | 動画像再符号化方法,動画像再符号化装置および動画像再符号化プログラム | |
JP5173613B2 (ja) | 動画像符号化装置及びその制御方法 | |
JP2009111647A (ja) | 動きベクトル検出装置および動きベクトル検出方法 | |
JP2007174202A (ja) | 動きベクトル検出装置およびその方法 | |
JP4609411B2 (ja) | 動画像符号化装置及び動画像符号化プログラム | |
JP2008028707A (ja) | 画質評価装置、符号化装置及び画質評価方法 | |
CN110324636B (zh) | 用于对视频流中的帧序列进行编码的方法、设备和系统 | |
JP4507896B2 (ja) | 動画像圧縮装置と動画像圧縮処理方法 | |
JP5322956B2 (ja) | 画像符号化装置および画像符号化方法 | |
US8331452B2 (en) | Image encoding apparatus, method of controlling therefor, and program |