JP2011066682A - 電子機器、シーンチェンジ検出方法及びプログラム - Google Patents

電子機器、シーンチェンジ検出方法及びプログラム Download PDF

Info

Publication number
JP2011066682A
JP2011066682A JP2009215587A JP2009215587A JP2011066682A JP 2011066682 A JP2011066682 A JP 2011066682A JP 2009215587 A JP2009215587 A JP 2009215587A JP 2009215587 A JP2009215587 A JP 2009215587A JP 2011066682 A JP2011066682 A JP 2011066682A
Authority
JP
Japan
Prior art keywords
frame
macroblocks
threshold
scene change
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2009215587A
Other languages
English (en)
Inventor
Yosuke Kaji
洋祐 加治
Koken Tanaka
光謙 田中
Toru Okazaki
透 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009215587A priority Critical patent/JP2011066682A/ja
Publication of JP2011066682A publication Critical patent/JP2011066682A/ja
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化された映像データから、当該符号化データを復号することなく、負荷を軽減しながら、より高精度にシーンチェンジを検出すること。
【解決手段】映像特徴点検出回路31は、符号化された映像信号の各フレームのうち、サイドパネルまたはレターボックスに相当する領域を除く矩形領域に含まれるマクロブロックのマクロブロックタイプ(Motion Forward MB及びMotion Backward MB、Intra MB等)の数の偏りを検出し、シーンチェンジを検出する。シーン解析部12は、当該シーンチェンジ情報を用いて、CM区間の検出等のシーン解析処理を実行する。
【選択図】図7

Description

本発明は、MPEG(Moving Picture Experts Group)方式で符号化された映像コンテンツからシーンチェンジを検出可能な電子機器、シーンチェンジ検出方法及びプログラムに関する。
従来から、例えば記録再生装置等の電子機器において、符号化データから特徴点を検出する技術が知られている。電子機器は、例えば映像コンテンツから当該特徴点をシーンチェンジ点として検出し、それをチャプタポイントとして利用することができる。
このような特徴点検出は、一般的には、符号化データの復号後のベースバンド信号が解析されることで行われる。例えば電子機器は、復号後の映像データ中のあるフレームの輝度成分または色差成分の信号強度についてのヒストグラムと、その直前のフレームについての同様のヒストグラムとを比較し、フレーム間の相関の強弱を判断することでシーンチェンジを検出する。
しかしながら、このように復号後のデータから特徴点を検出する場合には、そのための演算量が大きくなり、システムへの負荷が大きくなる。また特徴点検出処理においては、まずデコーダで符号化データを復号する必要があるため、当該復号処理中は、そのデコーダを例えば映像データの再生といった他の用途に用いることができない。
そこで、符号化データを復号することなく当該符号化データから特徴点を検出する技術が開発されている。
例えば下記特許文献1には、符号化された映像音声データをTSに変換し、そのTSからPESを抽出し、PES中のIピクチャの出現周期を検出して、これが定められた周期より短くなったとき、そのときのIピクチャをシーンチェンジ点として検出する方法が記載されている。また当該特許文献1には、PES中のPピクチャまたはBピクチャのデータ長が、直近の過去の複数フレームにおけるPピクチャまたはBピクチャのデータ長の平均値に係数を乗じた結果の各閾値より大きくなったとき、そのときのPピクチャまたはBピクチャをシーンチェンジ点として検出する方法も記載されている。
また下記特許文献2には、原音信号が圧縮符号化された音声データ中からSF(スケールファクタ)を抽出し、当該SFに基づいて特徴点情報を生成し、復号処理後に復号データに当該特徴点情報に基づいて間引き処理を施すことで、原音信号を変速再生する記録再生装置が記載されている。
特開2002−10254号公報 特開2007−94234号公報
しかしながら、上記特許文献1の技術のうち、Iピクチャの出現周期を検出することでシーンチェンジを検出する方法では、そもそもエンコーダがシーンチェンジの際にIピクチャを強制的に挿入しない仕様の場合には、シーンチェンジを検出することはできない。またPピクチャ及びBピクチャのデータ長の増大を検出することでシーンチェンジを検出する方法では、必ずしも当該データ長の増大がシーンチェンジを直接示すとは言いきれないため、検出精度に問題がある。またこの方法においては、当該データ長に関する閾値を決定するために、各ピクチャのピクチャタイプ及びデータ長を蓄えるメモリが必要となり、結局はシステムに負荷が掛かってしまう。
また、上記特許文献2の技術は音声データに特化した処理であり、当該技術によっては圧縮符号化された映像データからシーンチェンジを検出することはできない。
以上のような事情に鑑み、本発明の目的は、符号化された映像データから、当該符号化データを復号することなく、負荷を軽減しながら、より高精度にシーンチェンジを検出することが可能な電子機器、シーンチェンジ検出方法及びプログラムを提供することにある。
上記目的を達成するため、本発明の一形態に係る電子機器は、通信部と検出部とを有する。上記通信部は、フレーム間予測によりマクロブロック単位で符号化された映像データを受信する。上記検出部は、上記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く、各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かを判断する。また検出部は、当該両矩形領域において当該偏りが生じていると判断した場合に、当該偏りに応じて、上記第1のBフレーム、上記第2のBフレームまたは上記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出する。
この構成により電子機器は、マクロブロックタイプの偏りを検出し、かつ、サイドパネルまたはレターボックスに相当する各領域を処理対象から除くことで、符号化された映像データを復号することなく、高精度かつ低負荷でシーンチェンジを検出することができる。
上記検出部は、上記各矩形領域に含まれるイントラマクロブロックの数を上記前方予測マクロブロックの数または上記後方予測マクロブロックの数に加えて上記偏りを判断してもよい。
これにより電子機器は、シーンチェンジの検出精度をさらに高めることができる。
上記検出部は、上記第2のBフレームにおいて、上記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第1のBフレームにおいて、上記後方予測マクロブロックの数と上記イントラマクロブロックの数との和の割合が上記第1の閾値を超え、かつ、上記前方予測マクロブロックの数の割合が上記第2の閾値に満たない場合に、上記第1のBフレームを上記シーンチェンジフレームとして検出してもよい。
また上記検出部は、上記第2のBフレームにおいて、上記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第1のBフレームにおいて、上記前方予測マクロブロックの数と上記イントラマクロブロックの数との和の割合が上記第1の閾値を超え、かつ、上記後方予測マクロブロックの数の割合が上記第2の閾値に満たない場合に、上記第2のBフレームを上記シーンチェンジフレームとして検出してもよい。
また上記検出部は、上記第1のBフレームにおいて、上記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第2のBフレームにおいて、上記前方予測マクロブロックの数と上記イントラマクロブロックの数との和の割合が上記第1の閾値を超え、かつ、上記後方予測マクロブロックの数の割合が上記第2の閾値に満たない場合に、上記第2のBフレームの直後のフレームを上記シーンチェンジフレームとして検出してもよい。
また上記検出部は、上記第1のBフレームにおいて、上記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第2のBフレームにおいて、上記後方予測マクロブロックの数と上記イントラマクロブロックの数との和の割合が上記第1の閾値を超え、かつ、上記前方予測マクロブロックの数の割合が上記第2の閾値に満たない場合に、上記第2のBフレームを上記シーンチェンジフレームとして検出してもよい。
このように、電子機器は、第1段階として前方予測マクロブロックの数及び後方予測マクロブロックの数の偏りを大まかに判断し、第2段階としてさらにイントラマクロブロックの数も考慮に入れて偏りを詳細に判断することで、より高精度にシーンチェンジを検出することができる。具体的には、Bフレームが時間的により遠いフレームを参照することになる場合にはイントラマクロブロックも考慮に入れることで、エンコーダのより細かいフレーム間予測仕様に対応することができる。
上記検出部は、上記第2のBフレームにおいて、上記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第1のBフレームに含まれるフィールドベースのマクロブロックの数の割合が第3の閾値を越え、かつ、上記第2のBフレームに含まれる上記フィールドベースのマクロブロックの数の割合が第4の閾値に満たない場合に、上記第2のBフレームをシーンチェンジフレームとして検出してもよい。
また上記検出部は、上記第1のBフレームにおいて、上記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、上記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、上記第2のBフレームに含まれるフィールドベースのマクロブロックの数の割合が第3の閾値を越え、かつ、上記第1のBフレームに含まれる上記フィールドベースのマクロブロックの数の割合が第4の閾値に満たない場合に、上記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出してもよい。
このように、電子機器は、トップフィールドとボトムフィールドとの間で発生したシーンチェンジについても検出することができる。
上記検出部は、上記第2のBフレームの直後のPフレームまたはIフレームに非符号化マクロブロックが所定閾値を越えて含まれているか否かを判断し、当該所定閾値を超えて含まれていると判断した場合に、上記第1のBフレーム及び上記第2のBフレームについて上記偏りを判断しなくてもよい。
これにより電子機器は、第2のBフレームの直後のP(I)フレームと、その前のI(P)フレームとの間に明らかに相関がある場合には、第1及び第2のBフレームに関する処理を規制することで、シーンチェンジ検出処理をより高効率かつ高精度に行うことができる。
本発明の他の形態に係るシーンチェンジ検出方法は、フレーム間予測によりマクロブロック単位で符号化された映像データを受信することを含む。上記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かが判断される。上記両矩形領域において上記偏りが生じていると判断した場合に、当該偏りに応じて、上記第1のBフレーム、上記第2のBフレームまたは上記第2のBフレームの直後のフレームがシーンチェンジフレームとして検出される。
本発明のまた別の形態に係るプログラムは、電子機器に、受信ステップと、判断ステップと、検出ステップとを実行させるものである。上記受信ステップは、フレーム間予測によりマクロブロック単位で符号化された映像データを受信する。上記判断ステップは、上記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かを判断する。上記検出ステップは、上記両矩形領域において上記偏りが生じていると判断した場合に、当該偏りに応じて、上記第1のBフレーム、上記第2のBフレームまたは上記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出する。
以上説明したように、本発明によれば、符号化された映像データから、当該符号化データを復号することなく、負荷を軽減しながら、より高精度にシーンチェンジを検出することができる。
本発明の一実施形態に係るPVRのハードウェア構成を示す図である。 本発明の一実施形態に係るPVRの特徴点検出回路及びそれに関係するブロックの構成並びにデータの流れを示した図である。 本発明の一実施形態におけるシーンチェンジ検出処理の概念を示した図である。 本発明の一実施形態において映像特徴点検出回路がシーンチェンジを検出可能な映像信号のGOP構成を示した図である。 本発明の一実施形態における映像特徴点検出回路によるシーンチェンジ検出処理の大まかな流れを示したフローチャートである。 図5におけるM3検出処理の流れを示したフローチャートである。 本発明の一実施形態におけるM3検出処理中のdetect1処理の流れを示したフローチャートである。 本発明の一実施形態におけるM3検出処理中のdetect2処理の流れを示したフローチャートである。 図5におけるM1検出処理の流れを示したフローチャートである。 本発明の一実施形態におけるM3検出処理及びM1検出処理における各closed gop処理の流れを示したフローチャートである。 本発明の一実施形態におけるM3検出処理及びM1検出処理における各リジェクト処理の流れを示したフローチャートである。 本発明の一実施形態において映像特徴点検出回路がMBタイプを利用する領域について説明する図である。 本発明の一実施形態におけるサイドパネル検出処理を概念的に示した図である。 本発明の一実施形態におけるサイドパネル検出処理の流れを示したフローチャートである。 図14におけるフレーム単位サイドパネル検出処理の詳細な流れを示したフローチャートである。 図14におけるGOP単位サイドパネル検出処理の詳細な流れを示したフローチャートである。 本発明の一実施形態におけるレターボックス検出処理を概念的に示した図である。 本発明の一実施形態におけるレターボックス検出処理の流れを示したフローチャートである。 図18におけるフレーム単位レターボックス検出処理の詳細な流れを示したフローチャートである。 図18におけるGOP単位レターボックス検出処理の詳細な流れを示したフローチャートである。
以下、図面を参照しながら、本発明の実施形態を説明する。
[PVRのハードウェア構成]
図1は、本発明の一実施形態に係るPVR(Personal Video Recorder)のハードウェア構成を示す図である。同図に示すように、このPVR100は、デジタルチューナ1、復調部2、デマルチプレクサ3、デコーダ4、記録再生部5、HDD(Hard Disk Drive)8、光ディスクドライブ9、通信部11を有する。またPVR100は、CPU(Central Processing Unit)12、フラッシュメモリ13、RAM(Random Access Memory)14を有する。さらにPVR100は、操作入力部15、グラフィック制御部16、映像D/A(Digital/Analog)コンバータ17、音声D/A(Digital/Analog)コンバータ18、外部インタフェース19及び特徴点検出回路20を有する。
デジタルチューナ1は、CPU12の制御に従って、アンテナ30を介してデジタル放送の特定のチャンネルを選局して、番組のデータを含む放送信号を受信する。この放送信号は、例えばMPEG−2 TSフォーマットで符号化されたMPEGストリーム(TS:トランスポートストリーム)であるが、このフォーマットに限られるものではない。復調部2は、変調された当該放送信号を復調する。
デマルチプレクサ3は、多重化された上記放送信号を、映像信号、音声信号、字幕信号、SI(Service Information)信号等の各信号に分離し、デコーダ4へ供給する。またデマルチプレクサ3は、分離したデコード前の各信号を、特徴点検出回路20へも供給可能である。上記SI信号は、EPG(電子番組表)を表示するためのデータ等を伝送するための信号である。当該EPG情報は、後述のシーン解析処理に用いられる。
デコーダ4は、デマルチプレクサ3で分離された映像信号、音声信号、字幕信号、SI信号をそれぞれデコードする。デコードされた各信号は記録再生部5へ供給される。
記録再生部5は、記録部6及び再生部7を有する。記録部6は、デコーダ4によりデコードされ入力された映像信号及び音声信号を一時的に蓄積して、タイミングやデータ量を制御しながらHDD8や光ディスクドライブ9に出力して記録させる。また記録部6は、HDD8に記録されたコンテンツを読み出して光ディスクドライブ9に出力し、光ディスク10に記録させることも可能である。再生部7は、HDD8や光ディスク10に記録された映像コンテンツの映像信号及び音声信号を読み出し、タイミングやデータ量を制御しながらデコーダ4へ出力して再生させる。
HDD8は、デジタルチューナ1を介して受信した番組や、通信部11によりインターネット等のネットワーク50を介して受信される種々のコンテンツを内蔵のハードディスクに記憶する。これらの記憶されたコンテンツが再生される際には、HDD8は、これらのデータを上記ハードディスクから読み出し、記録再生部5へ出力する。
またHDD8は、各種プログラムやその他のデータ等を記憶する場合もある。これらのプログラムやデータは、それらの実行時及び参照時に、CPU12の指令によりHDD8から読み出され、RAM14へ展開される。
光ディスクドライブ9は、上記HDD8と同様に、当該装着された光ディスク10に上記番組コンテンツ等の各種データを記録し、また記録されたデータを読み出すことが可能である。また上記各種プログラムは、これら光ディスク10等の可般性の記録媒体に記録され、光ディスクドライブ9によりPVR100にインストールされてもよい。
通信部11は、上記ネットワーク50に接続してTCP/IP(Transmission Control Protocol / Internet Protocol)等のプロトコルによりネットワーク50上の他の装置とデータのやり取りを行うためのネットワークインタフェースである。通信部11により受信されたデータが多重化されている場合、デマルチプレクサ3に供給される。また受信されたデータのうち少なくとも一部は、必要に応じて特徴点検出回路20にも供給される。上記EPG情報は、デジタルチューナ1が受信した放送信号からではなく、ネットワーク50上から通信部11により取得されてもよい。
外部インタフェース19は、例えばUSBインタフェースやメモリカードインタフェース等からなり、例えばデジタルビデオカメラ、デジタルスチルカメラ等の外部機器やメモリカード等と接続し、それらからコンテンツ等のデータを読み出す。
CPU12は、必要に応じてRAM14等にアクセスし、映像データの受信処理、記録再生処理、特徴点(シーンチェンジ)検出処理、シーン解析処理等、PVR100の各ブロックの処理を統括的に制御する。
フラッシュメモリ13は、例えばNAND型のものであり、CPU12に実行させるOS、プログラムや各種パラメータなどのファームウェアが固定的に記憶されている不揮発性のメモリである。またフラッシュメモリ13は、特徴点検出処理において特徴点検出回路20とともに動作するプログラム、シーン解析処理に用いられるプログラム、その他の各種プログラム、上記EPG情報等の各種データを記憶する。
RAM14は、CPU12の作業用領域等として用いられ、上記静止画像及び音声情報の抽出処理や変更処理の最中に、OSやプログラム、処理データ等を一時的に保持するメモリである。
操作入力部15は、例えば複数のキーを有するリモートコントローラ21(以下、リモコン21と称する)から、ユーザの操作による各種設定値や指令を入力してCPU12へ出力する。もちろん、操作入力部15は、リモコン21によらずに、PVR100に接続されたキーボードやマウス、PVR100に実装されたスイッチ等で構成されていても構わない。
グラフィック制御部16は、デコーダ4から出力された映像信号やCPU12から出力されるその他の映像データにOSD(On Screen Display)処理等のグラフィック処理を施し、例えばテレビジョン装置(TV)等の表示装置に表示させるための映像信号を生成する。
映像D/Aコンバータ17は、上記グラフィック制御部16から入力されたデジタル映像信号をアナログ映像信号に変換して、表示装置へ出力する。
音声D/Aコンバータ18は、上記デコーダ4から入力されたデジタル音声信号をアナログ音声信号に変換して、TV等へ出力する。
特徴点検出回路20は、上記映像信号、音声信号、字幕信号からそれぞれ特徴点を検出する。検出された特徴点は、その後のシーン解析処理に用いられる。当該特徴点検出回路20の詳細は以下で説明する。
[特徴点検出回路の構成]
図2は、上記特徴点検出回路20及びそれに関係するブロックの構成並びにデータの流れを示した図である。
同図に示すように、特徴点検出回路20は、映像特徴点検出回路31、音声特徴点検出回路32及び字幕特徴点検出回路33を有する。
映像特徴点検出回路31は、デマルチプレクサ3により分離されたデコード前の映像信号を解析し、映像信号の特徴点としてシーンチェンジを検出する。また映像特徴点検出回路31は、当該映像信号の各フレームから、同じく特徴点としてサイドパネル領域及びレターボックス領域を検出する。これらの検出処理の詳細については後述する。
音声特徴点検出回路32は、デマルチプレクサ3により分離されたデコード前の音声信号から、音声信号の特徴点として、無音区間、サンプリング周波数の変化、チャンネル情報の変化(モノラル/ステレオ)等を検出する。
上記無音区間は、例えばAAC(Advanced Audio Coding)符号化情報のグローバルゲインを利用して検出される。上記サンプリング周波数及びチャンネル情報の変化は、上記符号化情報の解析により検出される。しかし、音声特徴点検出回路32は、周波数情報やスケーリングファクター等の符号化情報をさらに解析してもよい。
字幕特徴点検出回路33は、デマルチプレクサ3により分離されたデコード前の字幕信号から、字幕信号の特徴点として、各フレームに対応する区間毎の字幕の有無を判定する。具体的には、字幕特徴点検出回路33は、例えば字幕データで構成されているPES(Packetized Elementary Stream)のサイズを利用して、上記PESのサイズが所定の閾値以上の場合には、当該PESに対応するフレームには字幕が存在すると判定する。
シーン解析部は、上記映像特徴点検出回路31、音声特徴点検出回路32及び字幕特徴点検出回路33により検出された各特徴点と、上記EPG情報とを基に、放送信号中のシーン解析を行う。当該シーン解析部は例えばソフトウェアで構成され、CPU12により実行されるが、別個のハードウェアとして構成されてもよい。
具体的には、シーン解析部は、例えばシーンチェンジと無音区間が一定間隔で連続するシーンや、チャンネル情報が変化するシーンをCM(Commercial Message)区間として検出する。また当該CM区間の尤度は、字幕の有無、サイドパネル及びレターボックスの有無等により補正される。検出されたCM区間は、例えば放送番組の記録時のチャプタ付与や、CMカット等に用いられる。
またシーン解析部は、長い無音区間の後に生じているシーンチェンジを、重要なシーンへの切り替わりとして認識することもできる。当該重要なシーンは、例えばダイジェスト再生や、特定シーンの抽出等に用いられる。
これらのシーン解析情報は、HDD8等へ記憶され、放送番組の記録時や再生時に適宜利用される。
[PVRの動作]
次に、以上のように構成されたPVR100の動作について、特に上記映像特徴点検出回路31の動作を中心に説明する。この動作は、CPU12及びその制御下において実行されるプログラムとも協働して行われる。
(シーンチェンジ検出処理)
まず、映像特徴点検出回路31によるシーンチェンジ検出処理について説明する。
図3は、本実施形態によるシーンチェンジ検出処理の概念を示した図である。
周知の通り、MPEG規格においては、エンコーダは、時間的な相関を利用したフレーム間予測により、入力画像と予測画像との差分画像を符号化することで、情報量を圧縮している。また各フレームは、マクロブロック(以下、MBとも称する)と呼ばれる分割単位で符号化されている。各マクロブロックには、符号化における他フレームの参照態様等に応じて、マクロブロックタイプと呼ばれる属性が割り当てられている。マクロブロックタイプは、可変長符号化(VLC)されてMPEGシンタクスにおけるマクロブロックレイヤの要素の1つとして符号化データに埋め込まれている。
マクロブロックタイプとしては、Inter(イントラ)MB、Motion Forward(前方予測)MB、Motion Backward(後方予測)MB、No Coded(非符号化)MB、No MC Coded MB等がある。イントラMBはフレーム間予測を行わずにフレーム内のマクロブロックのみを符号化するマクロブロックである。Motion Forward MB及びMotion Backward Mbはそれぞれ時間的前のフレーム及び時間的に後のフレームを参照して符号化を行うマクロブロックである。No Coded MBは符号化を全く行わないマクロブロックである。No MC Coded MBは動きベクトルを用いずに他のフレームの空間的に同じ位置を参照して符号化を行うマクロブロックである。
周知の通り、MPEG規格では、フレームは、前方予測のみを用いて符号化されるPフレーム(ピクチャ)、前方予測、後方予測、両方予測のうちいずれかを選択して符号化されるBフレーム、フレーム間予測を用いずに符号化されるIフレームに分類される。
ここで、同じシーン内では、一般的に、Bフレームでは、時間的に近いフレームを参照するか、情報量の圧縮に効果的な双方向予測を行うマクロブロックの数の割合が多くなる。すなわち、Bフレームでは、Motion Forward MB及びMotion Backward MBの割合が一様に高くなる。
一方、同図に示すように、シーンチェンジが起こった場合には、Bフレームは、双方向予測を行っても、情報量を圧縮することはできない。よってこの場合には、Bフレームのマクロブロックにおいて、特定の方向を参照する(特定のマクロブロックタイプを有する)マクロブロックの割合が増加するという減少が起こる。すなわち、マクロブロックタイプの数に偏りが生じることとなる。同図の例では、シーンチェンジがBフレームF6とPフレームF7との間で発生している。よって、BフレームF6はPフレームF7を後方予測により参照しても情報量を圧縮できないため、PフレームF4を前方予測により参照することとなる。したがってBフレームF6のマクロブロックにおいては、Motion Backward(後方予測)MBの割合が増加すると考えられる。
そこで、本実施形態における映像特徴点検出回路31は、このようなマクロブロックタイプの数の偏り、特にMotion Forward MB及びMotion Backward MBの数の偏りを利用することで映像信号からシーンチェンジを検出することとしている。
ここで、映像特徴点検出回路31がシーンチェンジ検出処理において用いる特徴データについて定義する。本実施形態では、映像特徴点検出回路31は、映像信号の各フレームにおける各マクロブロックタイプの総数を特徴データとして用いる。
当該マクロブロックタイプは、以下のように定義される。
・Intra MBの総数:intra
・No Coded MBの総数:no_cod
・Motion Forward MBの総数:fwd
・Motion Backward MBの総数:bwd
・No MC Coded MBの総数:no_mc_cod
・Motion Type Field MBの総数:fld
ここでMotion Type Field MBとは、フレーム単位ではなくフィールド単位で符号化されるマクロブロックをいう。その他のマクロブロックタイプについては上述の通りである。これらのマクロブロックタイプに関する情報は、MPEG2シンタクスにおける上記可変長符号を解くことで得られる。
また、上記マクロブロックタイプの検出は、GOP(Group Of Pictures)構造に応じて実行される。図4は、本実施形態において映像特徴点検出回路31がシーンチェンジを検出可能な映像信号のGOP構成を示した図である。同図に示すように、映像特徴点検出回路31がシーンチェンジを検出可能なGOP構造は、同図(A)に示すようなM=3構造(I/P,B,B,P/I)、または、M=1かつ(I/P,P/I)構造である。すなわち、M=1の場合でも、(P/I,I/I)構造については対象外とされる。これは、当該(P/I,I/I)構造のGOPにおいては、両フレームの特性から、そもそも両フレーム間ではフレーム間予測が実行され得ず、映像特徴点検出回路31が当該2つのフレーム間のシーンチェンジを検出できないからである。
また同図に示すように、本実施形態では、上記GOP構造がM=3の場合における4つのフレームを順にP1,P2,P3,P4と表し、GOP構造がM=1の場合における2つのフレームを順にP1,P2と表す。
図5は、映像特徴点検出回路31のシーンチェンジ検出処理の大まかな流れを示したフローチャートである。
同図に示すように、まず、映像特徴点検出回路31は、入力された映像信号の各フレームにおける各マクロブロックタイプの数を算出する(ステップ51)。続いて映像特徴点検出回路31は、当該映像信号におけるGOP構造を判定する(ステップ52)。
GOP構造がM=3である場合、映像特徴点検出回路31は、そのGOP構造に応じたシーンチェンジ検出処理(M3検出処理)を実行する(ステップ53)。GOP構造がM=1である場合、映像特徴点検出回路31は、そのGOP構造に応じたシーンチェンジ検出処理(M1検出処理)を実行する(ステップ54)。GOP構造がそれら以外の場合、映像特徴点検出回路31は、上記ステップ51へ戻り、処理を繰り返す。
図6は、図5におけるM3検出処理の流れを示したフローチャートである。当該M3検出処理は、上記GOP構造M=3における4つのフレームP1〜P4を一つの処理単位として実行される。
同図に示すように、まず映像特徴点検出回路31は、リジェクト処理を実行する(ステップ61)。当該リジェクト処理については後述する。続いて映像特徴点検出回路31は、当該M3検出処理における第1の検出処理(detect1処理)を実行する(ステップ62)。当該detect1処理についても後述する。
続いて映像特徴点検出回路31は、上記detect1処理によりシーンチェンジが検出されたか否かを判断する(ステップ63)。シーンチェンジが検出された場合(Yes)、映像特徴点検出回路31は、次の処理単位である、同一もしくは異なるGOPにおけるフレームP1〜P4についての処理へ移る。シーンチェンジが検出されなかった場合(No)、映像特徴点検出回路31は、当該M3検出処理における第2の検出処理(detect2処理)を実行する(ステップ64)。当該detect2処理についても後述する。
続いて映像特徴点検出回路31は、上記detect2処理によりシーンチェンジが検出されたか否かを判断する(ステップ65)。シーンチェンジが検出された場合(Yes)、映像特徴点検出回路31は、次の処理単位へ移る。シーンチェンジが検出されなかった場合(No)、映像特徴点検出回路31は、closed gop検出処理を実行する(ステップ66)。当該closed gop検出処理についても後述する。
図7は、上記M3検出処理中のdetect1処理の流れを示したフローチャートである。
同図に示すように、映像特徴点検出回路31は、処理対象のフレームP1〜P4について、まずP3.bwd > TH1かつP3.fwd < TH2であるか否かを判断する(ステップ71)。ここで、上述したように、P3.bwdは、P1〜P4における2番目のBフレームP3におけるMotion Backward MBの総数を示し、P3.fwdは当該P3におけるMotion Forward MBの総数を示す。TH1は例えばフレームP3における総MB数の約70%の数に相当する閾値であり、TH2はBフレームP3における総MB数の約20%の数に相当する閾値である。
すなわち、当該ステップ71においては、BフレームP3のMBのうち、Motion Backward MB の総数がMotion Forward MBの総数に比べて著しく多いか否かが判断されることとなる。換言すれば、BフレームP3と、直後のP/IフレームP4との相関が強く、かつ、直前のI/PフレームP1との相関が弱いか否かが判断される。したがって、P3.bwd > TH1かつP3.fwd < TH2と判断される場合には、BフレームP3とP/IフレームP4とは同じシーンに属し、I/PフレームP1とBフレームP2との間またはBフレームP2とBフレームP3との間でシーンチェンジが発生している可能性が高いことになる。そこで、以下のステップ71〜ステップ75においては、上記ステップ71において大まかに検出されたシーンチェンジの可能性について、より詳細に判断がなされる。
上記ステップ71において、P3.bwd > TH1かつP3.fwd < TH2であると判断された場合(Yes)、まず、映像特徴点検出回路31は、P2.(bwd + intra) > TH1かつP2.fwd < TH2であるか否かを判断する(ステップ72)。ここでP2.(bwd + intra)は、P1〜P4における1番目のBフレームP2におけるMotion Backward MBの総数とIntra MBの総数との和を示す。Motion Backward MBの総数のみならずIntra MBの総数も加えて判断しているのは、前方と後方のうち一方向の(比較的遠い)フレームとしか相関がない場合に、エンコーダによっては、いずれの方向のフレームも参照せずにイントラ符号化を行う仕様のものがあるからである。これ以降のステップにおいてIntra MBの総数も加えた判断がなされている場合、その理由も同様である。
当該ステップ72において、P2.(bwd + intra) > TH1かつP2.fwd < TH2であると判断された場合(Yes)、上記ステップ71のYesの判断に加えて、BフレームP2が、後のP/IフレームP4と強い相関があり、直前のI/PフレームP1と相関が弱いことが判明したことになる。したがってこの場合、映像特徴点検出回路31は、I/PフレームP1とBフレームP2との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type1、ステップ81)。すなわちこの場合には、BフレームP2が、シーンチェンジ後の新たなシーンの冒頭フレーム(シーンチェンジフレーム)となる。
当該ステップ72において、P2.(bwd + intra) > TH1かつP2.fwd < TH2でないと判断された場合(No)、映像特徴点検出回路31は、次に、P2.(fwd + intra) > TH1かつP2.bwd < TH2であるか否かを判断する(ステップ73)。
当該ステップ73においてP2.(fwd + intra) > TH1かつP2.bwd < TH2であると判断された場合(Yes)、上記ステップ71のYesの判断に加えて、BフレームP2が、直前のI/Pと強い相関があり、後のP/IフレームP4と相関が弱いことが判明したとことになる。したがってこの場合、映像特徴点検出回路31は、連続するBフレームP2及びP3の間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type2、ステップ81)。すなわちこの場合には、BフレームP3が上記シーンチェンジフレームとなる。
当該ステップ73において、P2.(fwd + intra) > TH1かつP2.bwd < TH2でないと判断された場合(No)、映像特徴点検出回路31は、次に、P2.fld > TH4かつP3.fld < TH10であるか否かを判断する(ステップ74)。ここでP2.fld及びP3.fldは、上述したとおり、BフレームP2及びP3におけるMotion Type Field MBの総数をそれぞれ示す。TH4は例えばフレームP2における総MB数の約60%の数に相当する閾値であり、TH10はBフレームP3における総MB数の約50%の数に相当する閾値である。
この判断は、インターレース方式を採用するMPEG−2のビデオ規格(ITU-T勧告H.262)においては、シーンチェンジが発生するフレームでは、motion type(動き予測タイプ)がフィールドベースとなるMBの数が増加する場合があるという事実に基づいている。つまり、実際には、トップフィールドとボトムフィールドとの間でシーンチェンジが発生し、両者が重なって見えるような場合、トップフィールドとボトムフィールドとで別個の動き予測がなされることがある。
当該ステップ74において、P2.fld > TH4かつP3.fld < TH10であると判断された場合(Yes)、上記ステップ71のYesの判断に加えて、BフレームP2では、続くBフレームP3に比べて、動き予測がフィールドベースのMBが多いため、当該BフレームP2のトップフィールドとボトムフィールドの間でシーンチェンジが発生していると考えられる。ただし、シーンチェンジの検出精度はフィールド単位ではなくフレーム単位とされるため、映像特徴点検出回路31は、BフレームP2とP3の間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type4、ステップ81)。すなわちこの場合には、BフレームP3が上記シーンチェンジフレームとなる。
当該ステップ74において、P2.fld > TH4かつP3.fld < TH10でないと判断された場合(No)、映像特徴点検出回路31は、次に、P2.intra > TH3であるか否かを判断する(ステップ75)。ここでP2.intraは、上述したように、BフレームP2におけるイントラMBの総数を示す。またTH3は例えばBフレームP2における総MB数の約25%の数に相当する閾値である。
この判断は、上述のように、エンコーダの仕様により、シーンチェンジ時にイントラ符号化が行われる場合に、上記ステップ72及び73において、intra MBとbwd及びfwdとの各合計では上記閾値TH1を超えなかったものの、intra MB単独では十分な数がある場合に、それをシーンチェンジとして検出するために行われる。
すなわち、当該ステップ75において、P2.intra > TH3であると判断された場合、上記ステップ71のYesの判断に加えて、BフレームP2も直前のI/PフレームP1と相関が低いと考えられる。したがって映像特徴点検出回路31は、I/PフレームP1とBフレームP2との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type3、ステップ81)。すなわちこの場合には、BフレームP2が上記シーンチェンジフレームとなる。
上記ステップ71においてP3.bwd > TH1かつP3.fwd < TH2でないと判断された場合(No)及び上記ステップ75においてP2.intra > TH3でないと判断された場合(No)、映像特徴点検出回路31は、次に、P2.fwd > TH1かつP2.bwd < TH2であるか否かを判断する(ステップ76)。
すなわち、当該ステップ76においては、BフレームP2のMBのうち、Motion Forward MB の総数がMotion Backward MBの総数に比べて著しく多いか否かが判断されることとなる。換言すれば、BフレームP2と、直前のI/PフレームP1との相関が強く、かつ、後のP/IフレームP4との相関が弱いか否かが判断される。したがって、P2.fwd > TH1かつP2.bwd < TH2であると判断される場合には、I/PフレームP1とBフレームP2とは同じシーンに属し、BフレームP2とBフレームP3との間またはBフレームP3とP/IフレームP4との間でシーンチェンジが発生している可能性が高いことになる。そこで、以下のステップ77〜ステップ80においては、上記ステップ76において大まかに検出されたシーンチェンジの可能性について、より詳細に判断がなされる。
当該ステップ76においてP2.fwd > TH1かつP2.bwd < TH2であると判断された場合(Yes)、映像特徴点検出回路31は、次に、P3.(fwd + intra) > TH1かつP3.bwd < TH2であるか否かを判断する(ステップ77)。
当該ステップ77において、P3.(fwd + intra) > TH1かつP3.bwd < TH2であると判断された場合(Yes)、上記ステップ76のYesの判断に加えて、BフレームP3が、前のI/PフレームP1と強い相関があり、直後のP/IフレームP4と相関が弱いことが判明したことになる。したがってこの場合、映像特徴点検出回路31は、BフレームP3とP/IフレームP4との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type5、ステップ81)。すなわちこの場合には、P/IフレームP4がシーンチェンジフレームとなる。
当該ステップ77において、P3.(fwd + intra) > TH1かつP3.bwd < TH2でないと判断された場合(No)、映像特徴点検出回路31は、次に、P3.(bwd + intra) > TH1かつP3.fwd < TH2であるか否かを判断する(ステップ78)。
当該ステップ78において、P3.(bwd + intra) > TH1かつP3.fwd < TH2であると判断された場合(Yes)、上記ステップ76のYesの判断に加えて、BフレームP3が、直後のP/Iと強い相関があり、前のI/PフレームP1と相関が弱いことが判明したとことになる。したがってこの場合、映像特徴点検出回路31は、連続するBフレームP2及びP3の間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type6、ステップ81)。すなわちこの場合には、BフレームP3が上記シーンチェンジフレームとなる。
当該ステップ78において、P3.(bwd + intra) > TH1かつP3.fwd < TH2でないと判断された場合(No)、映像特徴点検出回路31は、次に、P3.fld > TH4かつP2.fld < TH10であるか否かを判断する(ステップ79)。
当該ステップ79において、P3.fld > TH4かつP2.fld < TH10であると判断された場合(Yes)、上記ステップ76のYesの判断に加えて、BフレームP3では、直前のBフレームP2に比べて、動き予測がフィールドベースのMBが多いため、当該BフレームP3のトップフィールドとボトムフィールドの間でシーンチェンジが発生していると考えられる。よって、映像特徴点検出回路31は、フレーム精度では、BフレームP3とP4の間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type8、ステップ81)。すなわちこの場合には、P/IフレームP4が上記シーンチェンジフレームとなる。
当該ステップ79において、P3.fld > TH4かつP2.fld < TH10でないと判断された場合(No)、映像特徴点検出回路31は、次に、P3.intra > TH3であるか否かを判断する(ステップ80)。
この判断も、上述のステップ75と同様に、シーンチェンジ時にイントラ符号化が行われる場合に、上記ステップ77及び78において、intra MBとbwd及びfwdとの各合計では上記閾値TH1を超えなかったものの、intra MB単独では十分な数がある場合に、それをシーンチェンジとして検出するために行われる。
すなわち、当該ステップ80において、P3.intra > TH3であると判断された場合、上記ステップ76のYesの判断に加えて、BフレームP3も直後のP/IフレームP4と相関が低いと考えられる。したがって映像特徴点検出回路31は、BフレームP3とP/IフレームP4との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type7、ステップ81)。すなわちこの場合には、P/IフレームP4が上記シーンチェンジフレームとなる。
上記ステップ76及びステップ80においてNoと判断された場合、映像特徴点検出回路31は、当該detect1処理ではシーンチェンジは検出されなかったと判断し(ステップ82)、上記detect2処理へ移る(図6のステップ63のNo)。
上記detect1処理が主に、地上波デジタル放送等の、割り当て帯域が比較的狭い放送システムにおける映像信号を対象にしているのに対して、当該detect2処理は主に、BSデジタル放送等の、割り当て帯域が比較的広い放送システムにおける映像信号を対象にしている。すなわち、広い帯域を使える放送システムでは大容量のデータを送信でき、帯域が狭い放送システムに比べて、映像フレーム中のintra MBの数が増加するという違いがあると考えられるため、そのような映像フレームからは上記detect1処理ではシーンチェンジを検出しきれない場合があると考えられるからである。
図8は、当該detect2処理の流れを示したフローチャートである。
同図に示すように、映像特徴点検出回路31はまず、P4 = P Picture かつP4.intra - P1.intra > TH6であるか否かを判断する(ステップ91)。ここでTH6は、例えばI/PフレームP1及びP/IフレームP4における各総MB数の約40%の数に相当する閾値である。
これは、I/PフレームP1を参照可能なP/IフレームP4におけるintra MBの総数がP1におけるintra MBの総数に比べて著しく多い場合、両フレーム間の相関が低く、両フレーム間のいずれかのフレームでシーンチェンジが発生している可能性が高いという理由から行われる判断である。
したがって、当該ステップ91において、P4 = P Picture かつP4.intra - P1.intra > TH6であると判断された場合(Yes)、映像特徴点検出回路31は、シーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type10、ステップ98)。
当該ステップ91において、P4 = P Picture かつP4.intra - P1.intra > TH6でないと判断された場合(No)、映像特徴点検出回路31は、次に、P4 = P Pictureかつ P4.no_mc_cod - P1.no_mc_cod> TH7であるか否かを判断する(ステップ92)。ここで、P4.no_mc_cod及びP1.no_mc_codは、上述のように、P/IフレームP4及びI/PフレームP1におけるNo MC Coded MBの各総数を示す。またTH7は、例えばI/PフレームP1及びP/IフレームP4における各総MB数の約65%の数に相当する閾値である。
これは、上記ステップ91と同様、P/IフレームP4におけるNo MC Coded MBの総数がP1におけるNo MC Coded MBの総数に比べて著しく多い場合、両フレーム間の相関が低く、両フレーム間のいずれかのフレームでシーンチェンジが発生している可能性が高いという理由から行われる判断である。
したがって、当該ステップ92において、P4 = P Pictureかつ P4.no_mc_cod - P1.no_mc_cod> TH7であると判断された場合(Yes)、映像特徴点検出回路31は、シーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type11、ステップ98)。
当該ステップ92において、P4 = P Pictureかつ P4.no_mc_cod - P1.no_mc_cod> TH7でないと判断された場合(No)、映像特徴点検出回路31は、次に、P4.no_mc_cod + P4.intra > TH8であるか否かを判断する(ステップ93)。ここでTH8は、例えばP/IフレームP4における各総MB数の約90%の数に相当する閾値である。
これは、P/IフレームP4におけるIntra MBの総数及びNo MC Coded MBの総数それぞれ単独では上記閾値TH6及びTH7に満たないが、両者の合計値が相当数に及んでいる場合にはシーンチェンジが発生している可能性が残されているという理由から行われる判断である。
当該ステップ93において、P4がIフレームである場合、映像特徴点検出回路31は、P4に代えてP1のIntra MBの総数及びNo MC Coded MBの総数を用いて判断を行う。また、P1及びP4がともにIピクチャである場合、シーンチェンジの検出は不可能であるため、映像特徴点検出回路31は、シーンチェンジは検出されなかったとして処理を終了する(ステップ99)。
当該ステップ93において、P4.no_mc_cod + P4.intra > TH8であると判断された場合(Yes)、映像特徴点検出回路31は、次に、P2.(fwd + intra) > TH1かつ P2.bwd < TH2であるか否かを判断する(ステップ94)。当該ステップ93において、上記図7のステップ76と比較して、intra MBが加えられているのは、上述したように、異なる放送システムにおける使用帯域の違いを考慮したものである。
当該ステップ94においては、上記ステップ76と同様に、BフレームP2とBフレームP3との間またはBフレームP3とP/IフレームP4との間でシーンチェンジが発生している可能性が高いか否かが大まかに検出される。そして、続くステップ95及びステップ96において、当該シーンチェンジの可能性についてより詳細に判断がなされる。
したがって、当該ステップ94において、P2.(fwd + intra) > TH1かつ P2.bwd < TH2であると判断された場合、次に、映像特徴点検出回路31は、P3.(fwd + intra) > TH1かつ P3.bwd < TH2であるか否かを判断する(ステップ95)。当該ステップ95は、上記図7におけるステップ77と同一である。
したがって、当該ステップ95において、P3.(fwd + intra) > TH1かつ P3.bwd < TH2であると判断された場合(Yes)、映像特徴点検出回路31は、BフレームP3とP/IフレームP4との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type12、ステップ98)。すなわちこの場合には、P/IフレームP4がシーンチェンジフレームとなる。
当該ステップ95においてP3.(fwd + intra) > TH1かつ P3.bwd < TH2でないと判断された場合、映像特徴点検出回路31は、次に、P3.(bwd + intra) > TH1かつP3.fwd < TH2であるか否かを判断する(ステップ96)。当該ステップ96は、上記図7におけるステップ78と同一である。
したがって、当該ステップ96において、P3.(bwd + intra) > TH1かつP3.fwd < TH2であると判断された場合(Yes)、映像特徴点検出回路31は、BフレームP2及びP3の間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type13、ステップ98)。すなわちこの場合には、BフレームP3が上記シーンチェンジフレームとなる。
上記ステップ94において、P4.no_mc_cod + P4.intra > TH8でないと判断された場合(No)、映像特徴点検出回路31は、次に、P3.(bwd + intra) > TH1かつP3.fwd < TH2、かつ、P2.(bwd + intra) > TH1かつP2.fwd < TH2であるか否かを判断する(ステップ97)。
当該ステップ97の条件が満たされている場合(Yes)、BフレームP2及びP3がいずれもP/IフレームP4と相関が高いと考えられる。したがってこの場合映像特徴点検出回路31は、I/PフレームP1とBフレームP2との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(SC Type14、ステップ98)。すなわちこの場合には、BフレームP2が上記シーンチェンジフレームとなる。
上記ステップ96またはステップ97においてNoと判断された場合、映像特徴点検出回路31は、当該detect2処理ではシーンチェンジは検出されなかったと判断し(ステップ99)、上記closed gop処理へ移る(図6のステップ65のNo、ステップ66)。
図9は、図5におけるM1検出処理の流れを示したフローチャートである。当該M1検出処理は、上記GOP構造M=1における2つのフレームP1及びP2を一つの処理単位として実行される。
同図に示すように、映像特徴点検出回路31はまず、上記リジェクト処理を実行した後(ステップ101)、P2.intra > TH5であるか否かを判断する(ステップ102)。ここでTH5は、例えばP/IフレームP2における各総MB数の約70%の数に相当する閾値である。
すなわち、GOP構造M=1の場合は、I/PフレームP1とP/IフレームP2との間の相関が低いとシーンチェンジが発生している可能性が高いため、上記ステップ102の判断のみで足りることになる。
したがって、上記ステップ102においてP2.intra > TH5であると判断された場合、映像特徴点検出回路31は、I/PフレームP1とP/IフレームP2との間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(ステップ103)。すなわちこの場合には、P/IフレームP2が上記シーンチェンジフレームとなる。
上記ステップ102において、P2.intra > TH5でないと判断された場合、映像特徴点検出回路31は、上記closed gop検出処理へ移る(ステップ104)。
次に、上記M3検出処理及びM1検出処理における上記closed gop処理(図6のステップ66、図9のステップ104)について説明する。図10は、M3検出処理及びM1検出処理における各closed gop検出処理の流れを示したフローチャートである。同図(A)は上記M3検出処理におけるclosed gop検出処理、同図(B)は上記M1検出処理におけるclosed gop検出処理をそれぞれ示している。
当該closed gop検出処理は、BフレームがGOPを跨いだ前方フレームへの参照を行わない、すなわち、符号化処理がGOP内で完結しているような符号化態様(closed gop)を検出し、それによりシーンチェンジを検出する処理である。当該closed gopは、GOPヘッダ内"closed gop"フラグのオンオフの確認により検出される。このclosed gop検出処理は、GOPがclosed gopである場合、シーンチェンジが発生している可能性が高いという理由により実行される処理である。
同図(A)に示すように、M3検出処理においては、映像特徴点検出回路31はまず、P1.closed_gop = 0 かつP4.closed_gop = 1であるか否かを判断する(ステップ111)。すなわち、映像特徴点検出回路31は、I/PフレームP1のGOPヘッダのclosed gopフラグがオフであり、かつ、P/IフレームP4の各GOPヘッダのclosed gopフラグがオンであるか否かを判断する。
当該ステップ111において、P1.closed_gop = 0 かつP4.closed_gop = 1である場合(Yes)、上記P/IフレームP4でシーンが完結し、直後のBフレームから新たなシーンが始まると考えられる。したがってこの場合映像特徴点検出回路31は、当該P/IフレームP4と、その直後のBフレームとの間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(ステップ112)。すなわちこの場合には、当該直後のBフレームがシーンチェンジフレームとなる。
同図(B)に示すように、M1検出処理においては、映像特徴点検出回路31はまず、P1.closed_gop = 0 かつP2.closed_gop = 1であるか否かを判断する(ステップ121)。すなわち、映像特徴点検出回路31は、I/PフレームP1のGOPヘッダのclosed gopフラグがオフであり、かつ、P/IフレームP2の各GOPヘッダのclosed gopフラグがオンであるか否かを判断する。
当該ステップ121において、P1.closed_gop = 0 かつP2.closed_gop = 1である場合(Yes)、上記P/IフレームP2でシーンが完結し、直後のI/Pフレームから新たなシーンが始まると考えられる。したがってこの場合映像特徴点検出回路31は、当該P/IフレームP2と、その直後のI/Pフレームとの間でシーンチェンジが発生していると判断し、当該シーンチェンジの検出を出力する(ステップ122)。すなわちこの場合には、当該直後のI/Pフレームがシーンチェンジフレームとなる。
次に、上記M3検出処理及びM1検出処理における上記リジェクト処理について説明する(図6のステップ61、図9のステップ101)。図11は、M3検出処理及びM1検出処理における各リジェクト処理の流れを示したフローチャートである。同図(A)は上記M3検出処理におけるリジェクト検出処理、同図(B)は上記M1検出処理におけるリジェクト検出処理をそれぞれ示している。
当該リジェクト処理は、M3検出処理及びM1検出処理の冒頭で実行され、シーンチェンジの検出の可能性が低いと判断される場合に処理を中止することで、シーンチェンジの検出精度を向上させるための処理である。
同図(A)に示すように、M3検出処理においては、映像特徴点検出回路31はまず、P4.no_cod > TH9であるか否かを判断する(ステップ131)。ここでP4.no_codは、上述したように、P/IフレームP4におけるNo Coded(非符号化)MBの総数を示す。またTH9は、例えばP/IフレームP4における総MB数の約30%の数に相当する閾値である。
この判断は、I/PフレームP1を参照するP/IフレームP4においてNo Coded MBが相当数含まれている場合には、両フレームの相関が極めて高く、両フレーム間でシーンチェンジが発生している可能性が極めて低いという理由から行われるものである。
したがって、上記ステップ131において、P4.no_cod > TH9であると判断された場合(Yes)、映像特徴点検出回路31は、その時点で処理対象としていたフレームP1〜P4についてのシーンチェンジ検出処理を中止(リジェクト)し、次の処理単位であるフレームP1〜P4についてのシーンチェンジ検出処理へと移る(ステップ132)。
また同図(B)に示すように、M1検出処理においては、映像特徴点検出回路31はまず、P2.no_cod > TH9であるか否かを判断する(ステップ141)。当該判断の理由も上記M3検出処理における理由と同様である。
したがって、上記ステップ141において、P2.no_cod > TH9であると判断された場合(Yes)、映像特徴点検出回路31は、その時点で処理対象としていたフレームP1及びP2についてのシーンチェンジ検出処理を中止(リジェクト)し、次の処理単位であるフレームP1及びP2についてのシーンチェンジ検出処理へと移る(ステップ142)。
ところで、本実施形態において、映像特徴点検出回路31は、以上説明したMBタイプによるシーンチェンジ検出処理を行う際、処理対象のフレーム中の一部の領域を、MBタイプを利用しない無効領域としている(クリップ処理)。以下、このクリップ処理について説明する。
図12は、映像特徴点検出回路31がMBタイプを利用する領域について説明する図である。
同図に示すように、映像特徴点検出回路31は、各フレームの水平方向の両端における、サイドパネルに相当する領域及び各フレームの垂直方向の両端における、レターボックスに相当する領域についてはMBタイプを利用せず、それらを除く矩形領域を利用領域としている。すなわち、映像特徴点検出回路31は、当該サイドパネル及びレターボックスにそれぞれ相当する領域に含まれるマクロブロックについては、各MBタイプの総数のカウントから除外している。
サイドパネルに相当する領域には、番組の映像とは関係のない放送局独自の情報が表示されたり、アスペクト比調整のため何も表示されなかったり(黒帯として表示される)することがある。また、レターボックスに相当する領域も、例えばアスペクト比調整のため、黒帯として表示されることがある。映像特徴点検出回路31は、このような、シーンチェンジと関係のないサイドパネル及びレターボックスに相当する領域を処理対象から除外することで、シーンチェンジ検出処理の無駄を省き、またその精度を向上させている。
当該サイドパネル及びレターボックスに相当する領域のサイズは、各フレームの水平方向及び垂直方向の端部からのマクロブロック数により制御される。すなわち、同図に示すように、映像特徴点検出回路31は、各フレームの水平方向及び垂直方向の各端辺をフレーム中央に向かって所定数のマクロブロック分の距離(clip_hor及びclip_vert)だけ進めた各線分によって囲まれる矩形領域を処理対象とし、それ以外の領域、すなわちサイドパネル及びレターボックスに相当する領域を除外する。
(サイドパネル及びレターボックス検出処理)
本実施形態において、映像特徴点検出回路31は、上記クリップ処理とは別に、サイドパネル領域及びレターボックス領域を検出し、その検出情報を、上記シーンチェンジ検出情報と併せて、その後のシーン解析処理に利用している。すなわち、映像特徴点検出回路31は、上記サイドパネル及びレターボックスに相当する領域において、実際に各放送局独自の情報や黒帯が表示されているか否かを判断し、その判断結果を上記シーン解析処理に利用する。以下、サイドパネル領域及びレターボックス領域の検出処理について説明する。
図13は、サイドパネル検出処理を概念的に示した図である。同図に示すように、映像特徴点検出回路31は、各フレームの水平方向の両端辺をフレーム中央に向かって所定数のMB数に相当する距離(sp_hor)だけ進めることにで形成される2つのサイドパネル相当領域が、実際にサイドパネルとして利用されているか否かを検出する。
図14は、サイドパネル検出処理の流れを示したフローチャートである。当該サイドパネル検出処理はGOP単位で行われる。
同図に示すように、映像特徴点検出回路31はまず、1つのGOPに含まれる1つのフレームについて、それがIフレーム(ピクチャ)か否かを判断する(ステップ151)。
当該ステップ151において、上記フレームがIフレームでないと判断された場合(No)、映像特徴点検出回路31は、フレーム単位のサイドパネル検出処理を実行し(ステップ152)、次のフレームへの処理へ移る(ステップ154)。当該フレーム単位のサイドパネル検出処理の詳細は後述する。
上記ステップ151において、上記フレームがIフレームであると判断された場合(Yes)、映像特徴点検出回路31は、GOP単位のサイドパネル検出処理を実行し(ステップ153)、上記ステップ154へ移る。当該GOP単位のサイドパネル検出処理の詳細についても後述する。
図15は、図14におけるフレーム単位サイドパネル検出処理(ステップ152)の詳細な流れを示したフローチャートである。
同図に示すように、映像特徴点検出回路31はまず、処理対象のフレームについて、sp.no_cod + sp.intra > TH_SP2であるか否かを判断する(ステップ161)。ここでsp.no_cod及びsp.intraはそれぞれ、上記サイドパネル領域におけるNo Coded MBの総数及びイントラMBの総数を示す。またTH_SP2は、フレーム単位のサイドパネル判定用の所定の閾値である。
この判断は、各フレームのサイドパネル領域において、番組本編やCMとは関係のない放送局独自の情報が変化せず継続して表示されている場合には、各フレームにおいてNo Coded MBの数が増加すると想定され、また、黒帯で表示されている場合にはイントラ符号化を行ってもデータ量が増加しないためイントラMBの数が増えると想定されるという理由から行われるものである。
当該ステップ161においてsp.no_cod + sp.intra > TH_SP2であると判断された場合(Yes)、映像特徴点検出回路31は、sp_numをインクリメントする(ステップ162)。ここでsp_numは、当該GOPにおいてサイドパネルであると判定されたフレームの数を示す。すなわち、映像特徴点検出回路31は、上記ステップ161においてYesと判断された場合には当該フレームにはサイドパネルが存在すると判断する。
そして映像特徴点検出回路31は、frm_numをインクリメントする(ステップ163)。ここでfrm_numは、1つのGOP内で処理対象としたフレームの数を示す。すなわち、当該frm_numのインクリメントにより次のフレームについてのサイドパネル検出処理へと移ることになる(上記図14のステップ154)。
図16は、図14におけるGOP単位サイドパネル検出処理(ステップ153)の詳細な流れを示したフローチャートである。
同図に示すように、映像特徴点検出回路31はまず、sp_num + TH_SP1 ≧ frm_numであるか否かを判断する(ステップ171)。ここでTH_SP1は、GOP単位のサイドパネル判定用の所定の閾値である。すなわち当該ステップ171では、GOPを構成する全てのフレームのうち、所定数以上のフレームにおいてサイドパネルが検出されたか否かが判断される。
上記ステップ171においてsp_num + TH_SP1 ≧ frm_numであると判断された場合(Yes)、映像特徴点検出回路31は、GOP単位でサイドパネルが検出されたことを示すSP検出フラグをオン(1)に設定する(ステップ172)。そして映像特徴点検出回路31は、上記sp_num及びfrm_numを0にリセットし(ステップ173)、次のGOPについてのサイドパネル検出処理へと移る。
このように、映像特徴点検出回路31は、各GOPについて、Iフレーム以外のフレームが処理対象である場合には当該各フレームからそれぞれサイドパネルを検出し、Iフレームが処理対象となったときに、それまでカウントしたsp_numからGOP単位でのサイドパネルの有無を検出している。これは、上記シーン解析処理においては、1つのフレームにおけるサイドパネルの有無に関する情報よりもむしろ、GOP全体としてのサイドパネルの有無に関する情報が重要となってくるためである。ただし、当該サイドパネル検出処理は、映像信号に含まれる最初のGOPについては実行されない。
図17は、レターボックス検出処理を概念的に示した図である。同図に示すように、映像特徴点検出回路31は、各フレームの垂直方向の両端辺をフレーム中央に向かって所定数のMB数に相当する距離(sp_vert)だけ進めることにで形成される2つのレターボックス相当領域が、実際にレターボックスとして利用されているか否かを検出する。
図18は、レターボックス検出処理の流れを示したフローチャートである。また図19は、図18におけるフレーム単位レターボックス検出処理の詳細な流れを示したフローチャートであり、図20は、図18におけるGOP単位レターボックス検出処理の詳細な流れを示したフローチャートである。
当該レターボックス検出処理も上記サイドパネル検出処理と同様、フレーム単位のレターボックス検出処理とGOP単位のレターボックス検出処理とにより実行される。それらの具体的な処理方法も、上記サイドパネル検出処理と同様に、各フレームのNo Coded MB及びイントラMBの数を用いて実行されるため、詳細な説明は省略する。
以上の処理により検出されたサイドパネル及びレターボックスの有無に関する情報は、上記シーンチェンジ情報とともに、特徴点情報としてシーン解析部へと出力され、シーン解析処理に利用される。
(シーン解析処理)
次に、以上のように映像特徴点検出回路31により検出されたシーンチェンジ情報、サイドパネル/レターボックス情報を含む、特徴点検出回路20から出力される特徴点情報を用いたシーン解析処理について説明する。
シーン解析部(CPU)12は、例えばHDD8に記憶されている上記特徴点情報及びEPG情報を用いて、例えば番組コンテンツからCM区間の検出を行う。具体的には、映像特徴点検出回路31から出力されたシーンチェンジ情報と、音声特徴点検出回路32から出力された無音区間情報を基に、番組コンテンツのうち、シーンチェンジと無音区間が一定間隔で連続しているシーンをCM区間と判断する。また、音声特徴点検出回路32から出力されるチャンネル情報を基に、チャンネル情報が変化したシーンをCM区間の開始点/終了点と判断する。
また、シーン解析部12は、字幕特徴点検出回路33から出力される字幕の有無に関する情報、上記映像特徴点検出回路31が検出したサイドパネル及びレターボックスの有無に関する情報を利用して、上記判断したCM区間の尤度を補正する。すなわち、例えば、字幕やサイドパネル/レターボックスがあるシーンは番組本編である可能性が高いため、シーン解析部12は、シーンチェンジ情報によってCM区間と判断されたシーンであって、かつ、字幕またはサイドパネル/レターボックスが存在しないシーンをCM区間と判断してもよい。またシーン解析部12は、シーンチェンジ情報により判断されたCM区間の開始点及び終了点を、字幕またはサイドパネル/レターボックスの情報を基に補正してもよい。
また、CM区間以外にも、シーン解析部12は、上記特徴点を利用して番組コンテンツからダイジェスト再生用の重要シーンを検出することも可能である。例えばシーン解析部12は、番組コンテンツ中で長い無音区間の直後にシーンチェンジが検出された場合には、重要なシーンへ切り替わったと判断する。
また、シーン解析部12は、上記シーンチェンジ情報を用いてチャプタ付与処理を行うことも可能である。
[まとめ]
以上説明したように、本実施形態によれば、映像特徴点検出回路31は、符号化された映像信号の各フレームに含まれるMBタイプの数の偏りを利用し、かつ、サイドパネル及びレターボックスに相当する領域を処理から除外することで、符号化された映像信号を復号することなく、高精度かつ効率的にシーンチェンジを検出することができる。具体的には、映像特徴点検出回路31は、Motion Forward MB及びMotion Backward MBの総数の偏りのみならず、放送方式の違い等に応じて適宜イントラMBの総数も考慮してシーンチェンジを判断することで、より高精度にシーンチェンジを検出することができる。
映像特徴点検出回路31はまた、MBタイプの数の偏りを利用することで、映像信号の各フレームからサイドパネル/レターボックスの有無を検出することもできる。そしてシーン解析部12は、当該シーンチェンジ情報やサイドパネル/レターボックスの有無に関する情報を用いることで、CM区間検出等のシーン解析処理を高精度に実行することができる。
[変形例]
本発明は上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更され得る。
上述の実施形態において説明した閾値TH1〜TH10の具体的な値は、上述したものに限られず、適宜変更可能である。
上述の実施形態において説明した各フローチャートにおける各ステップの実行順は、上述したものに限られず、適宜変更可能である。
上述の実施形態におけるシーンチェンジ検出処理では、サイドパネルに相当する領域及びレターボックスに相当する領域の双方がMBタイプの検出処理から除外されたが、いずれか一方のみ除外される態様であっても構わない。
上述の実施形態においては、映像特徴点検出回路31が主に放送局からの放送信号からシーンチェンジを検出する例を示したが、映像特徴点検出回路31は、例えばIPTVのようなインターネット経由で送信されてくる映像信号や、光ディスク等の外部メディアから再生される映像信号からシーンチェンジを検出することも勿論可能である。
上述の実施形態においては、本発明をPVRに適用した例を説明した。しかし本発明は、例えばPC(Personal Computer)、テレビジョン装置、ゲーム機器、携帯電話機、その他AV(Audio/Visual)機器等、符号化データを受信可能なあらゆる電子機器に適用可能である。
1…デジタルチューナ
2…復調部
3…デマルチプレクサ
4…デコーダ
5…記録再生部
8…HDD
11…通信部
12…CPU(シーン解析部)
13…フラッシュメモリ
20…特徴点検出回路
31…映像特徴点検出回路
32…音声特徴点検出回路
33…字幕特徴点検出回路
50…ネットワーク
100…PVR

Claims (11)

  1. フレーム間予測によりマクロブロック単位で符号化された映像データを受信する通信部と、
    前記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く、各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かを判断し、当該両矩形領域において当該偏りが生じていると判断した場合に、当該偏りに応じて、前記第1のBフレーム、前記第2のBフレームまたは前記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出する検出部と
    を具備する電子機器。
  2. 請求項1に記載の電子機器であって、
    前記検出部は、前記各矩形領域に含まれるイントラマクロブロックの数を前記前方予測マクロブロックの数または前記後方予測マクロブロックの数に加えて前記偏りを判断する
    電子機器。
  3. 請求項2に記載の電子機器であって、
    前記検出部は、前記第2のBフレームにおいて、前記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第1のBフレームにおいて、前記後方予測マクロブロックの数と前記イントラマクロブロックの数との和の割合が前記第1の閾値を超え、かつ、前記前方予測マクロブロックの数の割合が前記第2の閾値に満たない場合に、前記第1のBフレームを前記シーンチェンジフレームとして検出する
    電子機器。
  4. 請求項2に記載の電子機器であって、
    前記検出部は、前記第2のBフレームにおいて、前記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第1のBフレームにおいて、前記前方予測マクロブロックの数と前記イントラマクロブロックの数との和の割合が前記第1の閾値を超え、かつ、前記後方予測マクロブロックの数の割合が前記第2の閾値に満たない場合に、前記第2のBフレームを前記シーンチェンジフレームとして検出する
    電子機器。
  5. 請求項2に記載の電子機器であって、
    前記検出部は、前記第1のBフレームにおいて、前記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第2のBフレームにおいて、前記前方予測マクロブロックの数と前記イントラマクロブロックの数との和の割合が前記第1の閾値を超え、かつ、前記後方予測マクロブロックの数の割合が前記第2の閾値に満たない場合に、前記第2のBフレームの直後のフレームを前記シーンチェンジフレームとして検出する
    電子機器。
  6. 請求項2に記載の電子機器であって、
    前記検出部は、前記第1のBフレームにおいて、前記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第2のBフレームにおいて、前記後方予測マクロブロックの数と前記イントラマクロブロックの数との和の割合が前記第1の閾値を超え、かつ、前記前方予測マクロブロックの数の割合が前記第2の閾値に満たない場合に、前記第2のBフレームを前記シーンチェンジフレームとして検出する
    電子機器。
  7. 請求項2に記載の電子機器であって、
    前記検出部は、前記第2のBフレームにおいて、前記後方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記前方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第1のBフレームに含まれるフィールドベースのマクロブロックの数の割合が第3の閾値を越え、かつ、前記第2のBフレームに含まれる前記フィールドベースのマクロブロックの数の割合が第4の閾値に満たない場合に、前記第2のBフレームをシーンチェンジフレームとして検出する
    電子機器。
  8. 請求項2に記載の電子機器であって、
    前記検出部は、前記第1のBフレームにおいて、前記前方予測マクロブロックの数の割合が第1の閾値を越え、かつ、前記後方予測マクロブロックの数の割合が第2の閾値に満たない場合であって、さらに、前記第2のBフレームに含まれるフィールドベースのマクロブロックの数の割合が第3の閾値を越え、かつ、前記第1のBフレームに含まれる前記フィールドベースのマクロブロックの数の割合が第4の閾値に満たない場合に、前記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出する
    電子機器。
  9. 請求項2に記載の電子機器であって、
    前記検出部は、前記第2のBフレームの直後のPフレームまたはIフレームに非符号化マクロブロックが所定閾値を越えて含まれているか否かを判断し、当該所定閾値を超えて含まれていると判断した場合に、前記第1のBフレーム及び前記第2のBフレームについて前記偏りを判断しない
    電子機器。
  10. フレーム間予測によりマクロブロック単位で符号化された映像データを受信し、
    前記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く、各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かを判断し、
    前記両矩形領域において前記偏りが生じていると判断した場合に、当該偏りに応じて、前記第1のBフレーム、前記第2のBフレームまたは前記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出する
    シーンチェンジ検出方法。
  11. 電子機器に、
    フレーム間予測によりマクロブロック単位で符号化された映像データを受信するステップと、
    前記受信された映像データに含まれるグループオブピクチャ中の連続する第1のBフレーム及び第2のBフレームのうち、水平方向の両端におけるサイドパネルに相当する領域または垂直方向の両端におけるレターボックスに相当する領域を除く、各矩形領域に含まれる前方予測マクロブロックの数と後方予測マクロブロックの数とにそれぞれ偏りが生じているか否かを判断するステップと、
    前記両矩形領域において前記偏りが生じていると判断した場合に、当該偏りに応じて、前記第1のBフレーム、前記第2のBフレームまたは前記第2のBフレームの直後のフレームをシーンチェンジフレームとして検出するステップと
    を実行させるプログラム。
JP2009215587A 2009-09-17 2009-09-17 電子機器、シーンチェンジ検出方法及びプログラム Abandoned JP2011066682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009215587A JP2011066682A (ja) 2009-09-17 2009-09-17 電子機器、シーンチェンジ検出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009215587A JP2011066682A (ja) 2009-09-17 2009-09-17 電子機器、シーンチェンジ検出方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2011066682A true JP2011066682A (ja) 2011-03-31

Family

ID=43952443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009215587A Abandoned JP2011066682A (ja) 2009-09-17 2009-09-17 電子機器、シーンチェンジ検出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2011066682A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101601788B1 (ko) 2011-10-11 2016-03-21 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 비디오 시퀀스들에서 인지 품질 평가를 위한 장면 변경 검출

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101601788B1 (ko) 2011-10-11 2016-03-21 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 비디오 시퀀스들에서 인지 품질 평가를 위한 장면 변경 검출

Similar Documents

Publication Publication Date Title
US20030123841A1 (en) Commercial detection in audio-visual content based on scene change distances on separator boundaries
US6952451B2 (en) Apparatus and method for decoding moving picture capable of performing simple and easy multiwindow display
JP4928726B2 (ja) ビデオストリーム中の有効エントリポイントの指示
US20130070857A1 (en) Image decoding device, image encoding device and method thereof, and program
US7496281B2 (en) Signal recording apparatus and method and signal reproduction apparatus and method
US20110135286A1 (en) Apparatus and method for extracting key frames and apparatus and method for recording broadcast signals using the same
US8139877B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium including shot generation
US20130039416A1 (en) Image encoding apparatus, image encoding method and program
JP2006287825A (ja) 記録装置
US8311103B2 (en) Image recording apparatus for recording image data with display order field
JPH1155626A (ja) テレビジョン信号符号化装置およびテレビジョン信号記録装置
KR20180101607A (ko) 영상 전환 장치를 구비한 부호화 장치 및 영상 전환 검지 방법을 포함하는 부호화 방법
JP2005175710A (ja) デジタル記録再生装置及びデジタル記録再生方法
US20050122430A1 (en) Image storing/replaying apparatus and method therefor
US8798135B2 (en) Video stream modifier
JP2011066682A (ja) 電子機器、シーンチェンジ検出方法及びプログラム
US20130089146A1 (en) Information processing apparatus and information processing method
US20110080944A1 (en) Real-time video transcoder and methods for use therewith
JP2006060358A (ja) デジタル放送受信機
CA2206454A1 (en) Method and apparatus for coding digital video signals
JP4192149B2 (ja) データ処理装置およびデータ処理方法
KR101391600B1 (ko) 어댑티브 녹화 방법 및 장치
JP2002171530A (ja) スーパーインポーズ機能を備えた再符号化装置および方法
JP2005198203A (ja) 映像信号記録再生装置および方法
JP2005197879A (ja) 映像信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120907

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20130418