JP2020141273A - コマーシャル検出装置 - Google Patents
コマーシャル検出装置 Download PDFInfo
- Publication number
- JP2020141273A JP2020141273A JP2019035742A JP2019035742A JP2020141273A JP 2020141273 A JP2020141273 A JP 2020141273A JP 2019035742 A JP2019035742 A JP 2019035742A JP 2019035742 A JP2019035742 A JP 2019035742A JP 2020141273 A JP2020141273 A JP 2020141273A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- logo
- image data
- range
- channel logo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 162
- 238000012217 deletion Methods 0.000 claims abstract description 22
- 230000037430 deletion Effects 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 42
- 238000012937 correction Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 abstract description 68
- 230000006870 function Effects 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 238000000034 method Methods 0.000 description 15
- 239000000284 extract Substances 0.000 description 3
- 238000002834 transmittance Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000002287 horizontal cell Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
Description
特許文献1には、TVCMを、放送手段や、映像フォーマットに関わらずに、自動的に識別する技術が開示されている。
特許文献2には、チャンネルロゴを用いてTVCMを検出する技術が開示されている。
特許文献3には、静止画を検知することにより、TVCMを検出する技術が開示されている。
非特許文献1には、チャンネルロゴを検出することでTVCMと番組コンテンツを識別する技術が開示されている。
先ず、CMコンテンツは15秒の自然数倍である。そして、CMとCM、CMと番組との間には映像の大きな切り替わり(以下「シーンチェンジ」と略)と、音声がなくなる区間、すなわち無音区間が発生する。これらの条件から、シーンチェンジと音声の無音区間が同時に発生する箇所が15秒の自然数倍で一致する時間軸上の位置を、CMと番組の境目であると認識する。
しかしながら、番組コンテンツの中でもシーンチェンジと音声の無音区間が15秒の自然数倍で一致する場合が往々にして生じることがあり、CM誤検出の要因となっている。
民放TV局は、各々が独自のロゴマークを所有している。このロゴマークをチャンネルロゴと呼ぶ。殆どの場合、チャンネルロゴは登録商標であると共に、可視化されたウォーターマークであり、放送される番組コンテンツの概ね右上あるいは左上に薄く表示される。
非特許文献1に開示される技術では、このチャンネルロゴが表示されているコンテンツが番組コンテンツであると判断されている。
しかしながら、ウォーターマークであるチャンネルロゴは、番組コンテンツの状態によってはその検出が不可能になる場合がある。
このため、特許文献1と非特許文献1を組み合わせても、CM検出の誤検出を実用的に低減させるに至っていない。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
図1は、本発明の第一の実施形態に係るコマーシャル検出装置101の概略図である。
コマーシャル検出装置101は、TV録画装置であると共に、パソコン等の情報処理装置でもある。
コマーシャル検出装置101には、アンテナ102が接続されている。そして、内蔵するTVチューナボード208(図2にて後述)でTV放送電波を受信して復調し、所望の番組コンテンツのデジタル動画データをHDD等の不揮発性ストレージ205(図2にて後述)に録画することで、録画済み動画ファイル301(図3にて後述)を作成する。そしてコマーシャル検出装置101は、後述するCM検出機能を実行することによって、録画済み動画ファイル301に含まれるCMの時間軸上の位置を検出する。
図2は、コマーシャル検出装置101のハードウェア構成を示すブロック図である。
コマーシャル検出装置101は、バス201に接続された、周知のCPU202、ROM203、RAM204、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ205、表示部206、操作部207を備える。
バス201には更に、TV放送電波を受信して復調するTVチューナボード208が接続されている。
不揮発性ストレージ205には、情報処理装置をコマーシャル検出装置101として稼働させるためのプログラムが記憶されている。
図3は、コマーシャル検出装置101のソフトウェア機能を示すブロック図である。
図3に示すコマーシャル検出装置101のソフトウェア機能は、大きく3つの段階に分けられる。
<第一の段階:CM候補時間リスト307の作成>
不揮発性ストレージ205に記憶されている録画済み動画ファイル301は、無音検出部302に読み込まれる。
無音検出部302は、録画済み動画ファイル301に存在する無音区間を検出して、無音検出時間リスト303を作成する。
一方、不揮発性ストレージ205に記憶されている録画済み動画ファイル301は、シーンチェンジ検出部304にも読み込まれる。
シーンチェンジ検出部304は、録画済み動画ファイル301に存在するシーンチェンジを検出して、シーンチェンジ検出時間リスト305を作成する。
ここで、図4を参照して、無音検出時間リスト303を説明する。
図4は、各種テーブルのフィールド構成を示す図である。
無音検出時間リスト303は、無音検出開始時間フィールドと、無音検出終了時間フィールドを有する。
無音検出開始時間フィールドには、無音検出区間の開始時間が格納される。この開始時間は、録画済み動画ファイル301の先頭から見た相対時間である。なお、これ以降に説明する録画済み動画ファイル301上の時間は、全て録画済み動画ファイル301の先頭から見た相対時間である。
無音検出終了時間フィールドには、無音検出区間の終了時間が格納される。この開始時間は、録画済み動画ファイル301の先頭から見た相対時間である。
シーンチェンジ開始時間フィールドは、録画済み動画ファイル301における、シーンチェンジが発生した瞬間のフレームの時間が格納される。
無音検出時間リスト303とシーンチェンジ検出時間リスト305は、CM候補時間検出部306に読み込まれる。
CM候補時間検出部306は、無音検出時間リスト303とシーンチェンジ検出時間リスト305を突き合わせて、無音検出時間内に存在するシーンチェンジ検出時間を抽出する。そして、CM候補時間検出部306は、それら抽出されたシーンチェンジ検出時間とシーンチェンジ検出時間との間が15秒の自然数倍に合致している区間を、CM区間であると推定し、このCM区間に相当する時間をCM候補時間リスト307に出力する。
CM候補時間リスト307は、CM候補開始時間フィールドと、CM候補終了時間フィールドと、削除フラグフィールドを有する。
CM候補開始時間フィールドには、CM候補区間の開始時間が格納される。
CM候補区間とは、録画済み動画ファイル301に存在する無音検出時間の中に含まれるシーンチェンジ時間同士が、15秒の自然数倍に等しい、録画済み動画ファイル301上の時間軸上の区間を指している。すなわち、CM候補区間は、録画済み動画ファイル301の時間軸上で、CMである可能性が高い区間を示している。
なお、CMの長さは最大で4フレーム前後の時間幅を有するため、15秒に±0.15秒程度のマージンを設けて、シーンチェンジを検出することが望ましい。
削除フラグフィールドには、当該CM候補区間に付与する削除フラグが格納される。すなわち、削除フラグフィールドは論理値フィールドであり、論理の真または偽の何れかの値が格納される。そして、削除フラグフィールドの初期状態は、論理の偽である。すなわち、削除フラグフィールドが論理の偽であるということは、当該レコードに削除フラグが付与されていないことを意味する。
再び図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
録画済み動画ファイル301とCM候補時間リスト307は、チャンネルロゴ検出部308に読み込まれる。
チャンネルロゴ検出部308は、先ず、操作部207等から入力されるチャンネル情報309から、録画済み動画ファイル301が放送された民放TV局のチャンネル情報を取得する。
更に、チャンネルロゴ検出部308は、チャンネル情報309でチャンネルロゴアドレス範囲リスト311を検索して、当該民放TV局のチャンネルロゴが表示される、録画済み動画ファイル301における画面上の座標情報を取得する。これ以降、この座標情報をチャンネルロゴ範囲座標情報と呼ぶ。
そして、チャンネルロゴ検出部308は、部分画像データに微分演算処理等を施して、部分画像データに含まれる輪郭を抽出し、部分輪郭画像データを生成する。この処理はウォーターマークの検出処理である。そして、部分輪郭画像データをチャンネルロゴ画像データと比較して、チャンネルロゴの検出を試みる。
CM候補時間修正部312は、チャンネルロゴ検出部308からCM候補時間リスト307の該当するレコードを特定して、CM候補時間リスト307の当該レコードの削除フラグフィールドに論理の真を書き込む。
チャンネルロゴサンプルリスト310は、チャンネル情報フィールドと、チャンネルロゴ画像データフィールドを有する。
チャンネル情報フィールドには、民放TV局のチャンネル情報が格納される。
チャンネルロゴ画像データフィールドには、民放TV局のチャンネルロゴの画像データが格納される。
チャンネル情報フィールドは、上述のチャンネルロゴサンプルリスト310の同名フィールドと同じである。
チャンネルロゴ第一座標フィールドには、民放TV局の画面上における、チャンネルロゴが表示される矩形範囲の左上の座標情報(以下「チャンネルロゴ第一座標」と略)が格納される。
チャンネルロゴ第二座標フィールドには、民放TV局の画面上における、チャンネルロゴが表示される矩形範囲の右下の座標情報(以下「チャンネルロゴ第二座標」と略)が格納される。
再び図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
録画済み動画ファイル301とCM候補時間リスト307は、チャンネルロゴ範囲連続性検出部313に読み込まれる。
ここで、チャンネルロゴ範囲連続性検出部313の動作の詳細について、図を改めて説明する。
チャンネルロゴ範囲切り出し処理部501は、先ず、前述のチャンネルロゴ検出部308と同様に、操作部207等から入力されるチャンネル情報309から、録画済み動画ファイル301が放送された民放TV局のチャンネル情報を取得する。
次に、チャンネル情報309でチャンネルロゴアドレス範囲リスト311を検索して、当該民放TV局のチャンネルロゴが表示される位置を示すチャンネルロゴ範囲座標情報を取得する。このチャンネルロゴ範囲座標情報は、録画済み動画ファイル301における画面上の座標情報である。
つまり、チャンネルロゴ範囲連続性検出部313は、チャンネルロゴ検出部308とは異なり、チャンネルロゴサンプルリスト310を参照しない。
そして、チャンネルロゴ範囲切り出し処理部501は、その時点におけるCM候補時間リスト307のレコードの情報(レコード番号、あるいはCM候補開始時間等、レコードを特定できる情報)を、CM候補時間修正部312に出力する。
第一差分演算処理部506は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の部分領域の割合を算出する。この、部分領域の割合については、図6で詳述する。
第二差分演算処理部507は、CM候補終了直前フレームロゴ範囲画像データ504と、CM候補終了直後フレームロゴ範囲画像データ505の部分領域の割合を算出する。この、部分領域の割合についても、図6で詳述する。
第二差分演算処理部507が出力する第二の部分領域の割合は、第二コンパレータ510のプラス側入力に入力される。第二コンパレータ510は、第二の部分領域の割合を領域割合閾値509と比較して、第二の部分領域の割合が領域割合閾値509を上回る場合には、論理の真を出力する。
ORゲート511の論理出力は、CM候補時間修正部312に出力される。
ここで図6を参照して、第一差分演算処理部506及び第二差分演算処理部507の処理を説明する。
図6は、第一差分演算処理部506のソフトウェア機能を示すブロック図である。なお、前述の通り、第一差分演算処理部506及び第二差分演算処理部507は同一の機能を有するため、図6は第二差分演算処理部507のソフトウェア機能を示すブロック図でもある。したがって図6中、同一の機能ブロックやデータ等については括弧書きで当該同一機能ブロックの符号を付している。
輝度差演算部602は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルの輝度差の絶対値を算出し、輝度差データを出力する。
ピクセルは、RGBやYUV等のカラー、つまり3個の変数を有するデータであるので、先ず、ピクセルの輝度成分を抽出する。RGB形式やYUV形式の色情報を周知のCIELAB形式の色情報に変換してからL*成分を輝度として使用してもよいし、YUV形式の場合には、Y成分をそのまま輝度として使用してもよい。その後、ピクセル相互の輝度の比較を行う。
輝度差演算部602が出力する輝度差データは、第三コンパレータ603のマイナス側入力に入力される。
一方、第三コンパレータ603のプラス側入力には、輝度変化閾値604が入力される。
第三コンパレータ603は、輝度差演算部602が出力する輝度差データが輝度変化閾値604未満であれば、論理の真を出力する。
輝度演算部605は、CM候補開始直後フレームロゴ範囲画像データ503のピクセルの輝度を算出し、輝度データを出力する。
輝度演算部605が出力する輝度データは、第四コンパレータ607のプラス側入力に入力される。
一方、第四コンパレータ607のマイナス側入力には、輝度閾値608が入力される。
第四コンパレータ607は、輝度演算部605が出力する輝度データが輝度閾値608以上であれば、論理の真を出力する。
勾配演算部606は、指定されるピクセルに対し、X方向とY方向に中心差分勾配を算出し、それらのベクトル長(X方向の勾配をGx、Y方向の勾配をGyとしたとき、√(Gx2+Gy2)の値)を算出する。なお、勾配の計算は中心差分勾配の代わりにソーベル勾配演算子を用いる等、他の計算方法も採用し得る。
勾配演算部606が出力する勾配データは、第五コンパレータ609のプラス側入力に入力される。
一方、第五コンパレータ609のマイナス側入力には、勾配閾値610が入力される。
第五コンパレータ609は、勾配演算部606が出力する勾配データが勾配閾値610以上であれば、論理の真を出力する。
第三コンパレータ603の論理出力とORゲート611の論理出力は、ANDゲート612に入力される。
ANDゲート612の出力論理値は、第一アドレス制御部601を通じてフレームロゴ範囲フラグデータ613の該当アドレスのセルに書き込まれる。すなわち、第一アドレス制御部601は、ANDゲート612の出力論理値を、フレームロゴ範囲フラグデータ613の、CM候補開始直前フレームロゴ範囲画像データ502とCM候補開始直後フレームロゴ範囲画像データ503の、該当するアドレスのセルに記憶する。
フレームロゴ範囲フラグデータ613は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503と同一の要素数(セル数)を有するフラグ群である。
(1)CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルの輝度差が輝度変化閾値604未満である。
(2)CM候補開始直後フレームロゴ範囲画像データ503の当該アドレスのピクセルの輝度が輝度閾値608以上である。
(3)CM候補開始直後フレームロゴ範囲画像データ503の当該アドレスのピクセルの勾配が勾配閾値610以上である。
(4)(1)かつ、(2)または(3)を満たす。
移動平均演算部614は、フレームロゴ範囲フラグデータ613の各セルに対し、論理の真を「1」、論理の偽を「0」として、縦8セル×横8セル=64セル単位の移動平均を算出する。そして、フレームロゴ範囲フラグデータ613の約1/64の要素数よりなる部分領域原データ615を出力する。
部分領域原データ615は、フレームロゴ範囲フラグデータ613の約1/64の要素数(セル数)よりなると共に、各セルが小数点の値を有するデータ群である。
なお、本発明の実施形態において、移動平均演算部614は8×8の64個のセル分割を採用しているが、セルあたりのピクセル数を一定にしてもよい。例えば、8ピクセル×8ピクセルの64ピクセルを1つのセルとする。この場合、セルの数は、ロゴ範囲の大きさによって変化することになる。一例として、チャンネルロゴ範囲の大きさが96ピクセル×96ピクセルであれば144個のセルに、128ピクセル×128ピクセルであれば256個のセルに分割することになる。
第六コンパレータ617のマイナス側入力には領域閾値618が入力される。
第六コンパレータ617は、部分領域原データ615の各セルの値が領域閾値618以上であれば、論理の真を出力する。
部分領域フラグデータ619は、部分領域原データ615と同一の要素数(セル数)を有するフラグ群である。
部分領域フラグデータ619は領域割合演算部620に入力される。
領域割合演算部620は、部分領域フラグデータ619の、論理が真のセル数を計数して、部分領域フラグデータ619のセルの全数で除算することにより、セルの全数に対する論理が真のセル数の割合である第一の部分領域の割合を算出して出力する。この第一の部分領域の割合が、第一差分演算処理部506の出力データとなる。
第一コンパレータ508のマイナス側入力には、領域割合閾値509が入力される。
第一コンパレータ508は、第一の部分領域の割合が領域割合閾値509以上であれば、論理の真を出力する。
CM候補開始直前フレームロゴ範囲画像データ502→CM候補終了直前フレームロゴ範囲画像データ504
CM候補開始直後フレームロゴ範囲画像データ503→CM候補終了直後フレームロゴ範囲画像データ505
領域割合演算部620が出力する第一の部分領域の割合→領域割合演算部620が出力する第二の部分領域の割合
第一コンパレータ508→第二コンパレータ510
CM候補時間修正部312は、チャンネルロゴ範囲連続性検出部313から出力される論理出力(図5のORゲート511の出力)が論理の真である場合には、チャンネルロゴ範囲連続性検出部313によって指定されたCM候補時間リスト307のレコードの削除フラグフィールドに論理の真を書き込む。
最終的にチャンネルロゴ範囲連続性検出部313とCM候補時間修正部312による、CM候補時間リスト307に対する削除フラグ付与処理が終了したら、CM候補時間修正部312はCM候補時間リスト307のうち、削除フラグが付されていないレコードのみを抽出して、CM時間リスト314を作成する。
以上、本発明の実施形態に係るコマーシャル検出装置の機能について説明をしたが、これより各々の機能ブロックの存在理由について、チャンネルロゴとCM及び番組コンテンツとの関係を中心に説明する。
図7は、TV受像機等で閲覧できる、民放TV局から放送される番組コンテンツの表示画面P701における、チャンネルロゴの表示態様の一例を示す図である。
図7に示す表示画面P701は、バラエティ番組のタイトル画面を想定している。この表示画面P701の右上に、チャンネルロゴ702が薄いウォーターマークの形態で表示されている。
図7に示すように、民放TV局が番組コンテンツを放送している最中、チャンネルロゴ702は画面の右上あるいは左上に、ウォーターマークとして表示される。
チャンネルロゴは周知のウォーターマークである。ウォーターマークは、文字あるいはロゴマークを透過画像データで用意され、基の画像データと合成されている。
図8中、実線L801は放送局A、点線L802は放送局B、一点鎖線L803は放送局Cの、番組コンテンツ上におけるチャンネルロゴとその周囲の画素の輝度の相関を示している。どの民放TV局も、1次関数で示される。この調査結果から、画面上のチャンネルロゴの画素の輝度は、以下の式で計算できる。
画面上チャンネルロゴ輝度=チャンネルロゴ画像輝度+透過率×背景輝度
図9Aは、ある番組におけるチャンネルロゴ702の表示態様の一例である画面の一部を示す概略図である。
図9Bは、ある番組におけるチャンネルロゴ702の表示態様の一例である画面の、チャンネルロゴ702の部分を拡大した図である。
図9Bを見ると、ワイプ901として表示されている番組出演者の顔902と、チャンネルロゴ702が重なっている。このような場合には、番組出演者、すなわち人間の顔は、狭い面積に輝度勾配の高い箇所が密集しているため、チャンネルロゴ702の検出が困難あるいは不可能になる。
図9Dは、別の番組におけるチャンネルロゴ702の表示態様の一例である画面の、チャンネルロゴ702の部分を拡大した図である。
図9Cでは、一例として番組中で画面全体あるいは画面の大部分の領域に白色等の高輝度領域A903が生じている態様を示している。図9Dを見ると、高輝度領域A903とチャンネルロゴ702が重なっている。
番組コンテンツにおけるチャンネルロゴ702の表示は、周囲の背景より輝度が高くなるように表示されるため、背景の輝度が高いと、チャンネルロゴ702と輝度差が小さくなってしまい、チャンネルロゴ702の検出が困難あるいは不可能になる。
図10において、CM候補区間S1001の先頭は、CM候補区間S1001の開始位置T1002である。CM候補区間S1001の末尾は、CM候補区間S1001の終了位置T1003である。
開始位置T1002の直前には、フレームF1004がある。開始位置T1002の時点には、フレームF1005がある。
終了位置T1003の直前には、フレームF1006がある。終了位置T1003の時点には、フレームF1007がある。
フレームF1005のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補開始直後フレームロゴ範囲画像データ503が含まれている。
フレームF1006のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補終了直前フレームロゴ範囲画像データ504が含まれている。
フレームF1007のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補終了直後フレームロゴ範囲画像データ505が含まれている。
しかし、先に説明したように番組コンテンツの内容によっては、チャンネルロゴの検出が困難あるいは不可能になる場合が多々生じ得る。
図11Bは、番組コンテンツであるCM候補区間S1001における、CM候補開始直後フレームロゴ範囲画像データ503の一例を示す図である。
すなわち、図11A及び図11Bは、番組コンテンツ内においてシーンチェンジが発生している状態における、チャンネルロゴ範囲座標情報によって形成される枠A703の画像データのイメージを示す。
図11Bに示すCM候補開始直後フレームロゴ範囲画像データ503のイメージM1103は、図9Dと同様に、高輝度領域A903とチャンネルロゴ702が重なっているので、チャンネルロゴ702の検出が不可能になっている。その一方で、高輝度領域A903の周辺には、第一模様P1102とは輝度及び/または勾配が異なる第二模様P1104が表示されている。
図11A及び図11Bに示すように、番組コンテンツであるにもかかわらず、CM候補区間S1001としてCM候補時間リスト307に登録されている録画済み動画ファイル301のフレームを調べると、CM候補区間S1001の開始位置及び/または終了位置の前後の2フレームにおいて、シーンチェンジが発生する。しかし、シーンチェンジが発生しても、チャンネルロゴ範囲座標情報の周辺の画像データは、殆ど変わっていないことが判明した。
しかし、当該CM候補区間S1001でチャンネルロゴが検出できない場合、CM候補区間S1001の開始位置及び/または終了位置の前後の2フレームでは、2通りの挙動が確認できた。
すなわち、チャンネルロゴ範囲座標情報の周辺の画像データには、前述の図9Bまたは図9Dに示したような状態が、当該フレームに生じている。
この場合、図11A及び図11Bに示すように、前後2フレームの全体はシーンチェンジによって大きく変化しているが、前後2フレームについて、チャンネルロゴ範囲座標情報(図11A及び図11Bの枠A703)の画像データを切り出して、シーンチェンジによって大きく変化した部分を除外すると、残った領域のピクセルは図9Bに示すような密度勾配が高い領域であるか、図9Dに示すような高輝度領域である。
輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域とは、例えば図9Bにおけるワイプ901と枠A703が重複する箇所であり、例えば図9D、図11A及び図11Bにおける高輝度領域A903と枠A703が重複する箇所である。
この、第一の部分領域の割合が領域割合閾値509以上であれば、CM候補開始直前フレームロゴ範囲画像データ502が属するフレームと、CM候補開始直後フレームロゴ範囲画像データ503が属するフレームは、チャンネルロゴの検出を阻害する何らかの映像が連続して存在していると推測できる。
チャンネルロゴ範囲はフレーム全体に対して小さな面積(データ量)である。これに加えて、特に、移動平均演算部614によって演算の対象となるデータ量が更に約1/64に低減される。
以上より、第一差分演算処理部502の全体的な演算量は、録画済み動画ファイル301の全てのフレームに対して連続性を演算するシーンチェンジ検出部304の演算処理と比べて遥かに少ない演算量であるため、極めて高速に実行できる。
以上説明した、本発明の第一の実施形態に係るコマーシャル検出装置101は、ソフトウェア機能によって、録画済み動画ファイル301に対して、CM検出を実行する装置であった。
特に図3において説明した、本発明のCM検出機能は、少しの工夫を加えることで、TV番組コンテンツを録画している最中においてもCM検出を実行することが可能である。具体的には、個々の処理のステップを可能な範囲で同時並行して実行することにより、CM検出結果が得られるまでの時間を短くすることが可能である。以下に、実施形態のバリエーションとして、それら手法を説明する。
図12の、図3と同一の機能ブロックは同一の符号を付して説明を省略する。
TVチューナボード208は、アンテナ102から放送電波を受信して復調し、動画データストリームを出力する。
TVチューナボード208が出力する動画データストリームは、一旦リングバッファ1202に格納される。
リングバッファ1202に格納された動画データストリームは、所定の容量に達したら、ファイルシステム1203によって読み込まれ、録画中動画ファイル1204に追記録される。
CM仮候補時間リスト1206は、図3のCM候補時間リスト307とは異なり、15秒の自然数倍の区間のチェックが入っていない。
チャンネルロゴ範囲連続性検出部313は、CM仮候補時間リスト1206に基づいて、チャンネルロゴ範囲の連続性を検出する。
図13は、本発明の第三の実施形態に係るコマーシャル検出装置1301のソフトウェア機能を説明するブロック図である。
図13の、図3及び図12と同一の機能ブロックは同一の符号を付して説明を省略する。
チャンネルロゴ検出部308は、一時ファイル1303から部分画像データストリームを読み出し、チャンネルロゴが検出できたらチャンネルロゴを検出した旨の情報をCM候補時間修正部1304に送る。
コマーシャル検出装置101は、第一の段階において、録画済み動画ファイル301に含まれる無音区間とシーンチェンジが一致する箇所(相対時間)を検出して、CM候補時間リスト307を作成する。
次に第二の段階において、チャンネルロゴ検出部308がCM候補区間に含まれるフレームの中からチャンネルロゴを検出して、当該CM候補区間が属するCM候補時間リスト307のレコードに削除フラグを付与する。
また、チャンネルロゴ範囲連続性検出部313の演算量は極めて少ないため、高速な処理が可能である。
Claims (6)
- 動画データに含まれる無音区間とシーンチェンジが一致する箇所を検出して、CMである可能性がある、前記動画データ上の時間軸上の区間であるCM候補区間の情報が記憶されているCM候補時間リストを作成するCM候補時間検出部と、
前記動画データにおける前記CM候補区間に含まれるフレームの中からチャンネルロゴを検出するチャンネルロゴ検出部と、
前記CM候補区間の開始位置及び/または終了位置の前後2フレームにおける、前記動画データにおいて放送局のチャンネルロゴが表示される画面上の座標情報であるチャンネルロゴ範囲座標情報によって特定される部分画像データが連続しているか否かを検出するチャンネルロゴ範囲連続性検出部と、
前記チャンネルロゴ検出部及び前記チャンネルロゴ範囲連続性検出部の検出結果に基づいて、前記CM候補時間リストから番組コンテンツであると判断されるレコードに削除フラグを付与するCM候補時間修正部と
を具備するコマーシャル検出装置。 - 前記CM候補時間リストは、前記CM候補区間の開始時間が格納されるCM候補開始時間フィールドと、前記CM候補区間の終了時間が格納されるCM候補終了時間フィールドと、前記CM候補区間に付与する削除フラグが格納される削除フラグフィールドとを有する、請求項1に記載のコマーシャル検出装置。
- 前記CM候補時間修正部は、前記チャンネルロゴ検出部が前記動画データにおける前記CM候補区間に含まれるフレームの中からチャンネルロゴを検出したことに呼応して、前記CM候補区間が属する前記CM候補時間リストのレコードに削除フラグを付与する、
請求項2に記載のコマーシャル検出装置。 - 前記CM候補時間修正部は、前記チャンネルロゴ範囲連続性検出部が、前記CM候補区間の開始位置の前後2フレームにおける前記部分画像データ、または終了位置の前後2フレームにおける前記部分画像データの何れかが連続していることを検出した場合に、前記CM候補区間が属する前記CM候補時間リストのレコードに削除フラグを付与する、
請求項2または3に記載のコマーシャル検出装置。 - 前記チャンネルロゴ範囲連続性検出部は、チャンネルロゴ範囲切り出し処理部を備え、
前記チャンネルロゴ範囲切り出し処理部は、
前記動画データから、前記CM候補時間リストの前記削除フラグが付されていないレコードによって指定される前記CM候補区間の開始位置の前後2フレームを読み出し、
前記チャンネルロゴ範囲座標情報に従って前記部分画像データを切り出すことにより、CM候補開始直前フレームロゴ範囲画像データと、CM候補開始直後フレームロゴ範囲画像データを出力すると共に、
前記動画データから、前記CM候補時間リストの前記削除フラグが付されていないレコードによって指定される前記CM候補区間の終了位置の前後2フレームを読み出し、
前記チャンネルロゴ範囲座標情報に従って前記部分画像データを切り出すことにより、CM候補終了直前フレームロゴ範囲画像データと、CM候補終了直後フレームロゴ範囲画像データを出力する、
請求項4に記載のコマーシャル検出装置。 - 前記チャンネルロゴ範囲連続性検出部は、
前記CM候補開始直前フレームロゴ範囲画像データと、前記CM候補開始直後フレームロゴ範囲画像データにおいて、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域を部分領域として特定し、チャンネルロゴ範囲における前記部分領域の面積の割合を領域割合として算出し、前記領域割合が所定の領域割合閾値以上であるか、または、
前記CM候補終了直前フレームロゴ範囲画像データと、前記CM候補終了直後フレームロゴ範囲画像データにおいて、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域を部分領域として特定し、チャンネルロゴ範囲における前記部分領域の面積の割合を領域割合として算出し、前記領域割合が所定の領域割合閾値以上であるか、何れかの場合において、指定された前記CM候補区間を除外する、
請求項5に記載のコマーシャル検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019035742A JP7268848B2 (ja) | 2019-02-28 | 2019-02-28 | コマーシャル検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019035742A JP7268848B2 (ja) | 2019-02-28 | 2019-02-28 | コマーシャル検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020141273A true JP2020141273A (ja) | 2020-09-03 |
JP7268848B2 JP7268848B2 (ja) | 2023-05-08 |
Family
ID=72265268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019035742A Active JP7268848B2 (ja) | 2019-02-28 | 2019-02-28 | コマーシャル検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7268848B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2771212C1 (ru) * | 2021-06-02 | 2022-04-28 | Общество с Ограниченной Ответственностью "СТРИМ Лабс" | Способ обнаружения логотипа телеканала в телевизионной трансляции |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003047031A (ja) * | 2001-08-03 | 2003-02-14 | Nec Corp | コマーシャル検出方法及び装置 |
JP2006109126A (ja) * | 2004-10-06 | 2006-04-20 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2007267121A (ja) * | 2006-03-29 | 2007-10-11 | Victor Co Of Japan Ltd | Cm検出装置 |
JP2010130563A (ja) * | 2008-11-28 | 2010-06-10 | Toshiba Corp | 映像解析装置およびプログラム |
-
2019
- 2019-02-28 JP JP2019035742A patent/JP7268848B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003047031A (ja) * | 2001-08-03 | 2003-02-14 | Nec Corp | コマーシャル検出方法及び装置 |
JP2006109126A (ja) * | 2004-10-06 | 2006-04-20 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2007267121A (ja) * | 2006-03-29 | 2007-10-11 | Victor Co Of Japan Ltd | Cm検出装置 |
JP2010130563A (ja) * | 2008-11-28 | 2010-06-10 | Toshiba Corp | 映像解析装置およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2771212C1 (ru) * | 2021-06-02 | 2022-04-28 | Общество с Ограниченной Ответственностью "СТРИМ Лабс" | Способ обнаружения логотипа телеканала в телевизионной трансляции |
Also Published As
Publication number | Publication date |
---|---|
JP7268848B2 (ja) | 2023-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102147230B1 (ko) | 동적 비디오 오버레이 | |
US6157744A (en) | Method and apparatus for detecting a point of change in a moving image | |
EP2109313B1 (en) | Television receiver and method | |
US9955038B2 (en) | Image processing apparatus, image processing method, and program | |
US8421819B2 (en) | Pillarboxing correction | |
KR101237229B1 (ko) | 콘텐츠 처리 장치 및 콘텐츠 처리 방법 | |
KR100866201B1 (ko) | 멀티미디어 휴대형 단말기 사용자를 위한 관심 영역의 추출방법 | |
JP2007274154A (ja) | 映像分割装置、テロップ抽出装置、方法およびプログラム | |
JP2004364234A (ja) | 放送番組内容メニュー作成装置及び方法 | |
JP2007288759A (ja) | ビデオ番組の処理方法、関連装置及び関連媒体 | |
JPH08212231A (ja) | 字幕検出方法および動画像の代表画像抽出装置 | |
KR20070093601A (ko) | 복수개의 크로마키 색을 이용한 영상 출력 장치 및 방법 | |
CN112000908A (zh) | 图片加载方法、装置、系统、电子设备及可读存储介质 | |
JP2008046608A (ja) | ビデオウィンドウ検出器 | |
JP2020141273A (ja) | コマーシャル検出装置 | |
JP4244584B2 (ja) | 重要画像検出装置、重要画像検出方法、プログラム及び記録媒体並びに重要画像検出システム | |
US20070061727A1 (en) | Adaptive key frame extraction from video data | |
JP2007149095A (ja) | 動画像の変化点検出方法及び装置 | |
CN114079815B (zh) | 字幕保护方法、系统、终端设备及存储介质 | |
US20040246259A1 (en) | Music program contents menu creation apparatus and method | |
US7319468B2 (en) | Image display apparatus | |
JP5424737B2 (ja) | 画像再生装置 | |
JP3024574B2 (ja) | 動画像検索装置 | |
JP4613941B2 (ja) | 文字表示領域検出装置及びその方法、並びに携帯端末 | |
JP3624677B2 (ja) | 動画像の特殊効果検出装置及びプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230414 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7268848 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |