JP2020141273A - コマーシャル検出装置 - Google Patents

コマーシャル検出装置 Download PDF

Info

Publication number
JP2020141273A
JP2020141273A JP2019035742A JP2019035742A JP2020141273A JP 2020141273 A JP2020141273 A JP 2020141273A JP 2019035742 A JP2019035742 A JP 2019035742A JP 2019035742 A JP2019035742 A JP 2019035742A JP 2020141273 A JP2020141273 A JP 2020141273A
Authority
JP
Japan
Prior art keywords
candidate
logo
image data
range
channel logo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019035742A
Other languages
English (en)
Other versions
JP7268848B2 (ja
Inventor
紀生 片山
Norio Katayama
紀生 片山
洋 孟
Hiroshi Mo
洋 孟
佐藤 真一
Shinichi Sato
真一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Organization of Information and Systems
Original Assignee
Research Organization of Information and Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Organization of Information and Systems filed Critical Research Organization of Information and Systems
Priority to JP2019035742A priority Critical patent/JP7268848B2/ja
Publication of JP2020141273A publication Critical patent/JP2020141273A/ja
Application granted granted Critical
Publication of JP7268848B2 publication Critical patent/JP7268848B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】少ない演算量でCM誤検出の可能性を極力低減することができる、コマーシャル検出装置を提供する。【解決手段】チャンネルロゴ範囲連続性検出部は、CM候補区間の開始位置及び/または終了位置の前後2フレームにおけるチャンネルロゴ範囲座標情報の画像データを切り出す。そして、それら画像データの輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域の面積割合を、所定の閾値と比較する。閾値と比較して、CM候補区間の開始位置及び/または終了位置の前後2フレームにおけるチャンネルロゴ範囲座標情報の画像データに連続性が認められる場合は、当該CM候補区間を番組コンテンツであると判断して、当該CM候補区間が属するCM候補時間リストのレコードに削除フラグを付与する。【選択図】図3

Description

本発明は、テレビジョン放送(以下「TV放送」と略、また「テレビジョン」は「TV」と略)におけるコマーシャル(以下「CM」と略)の時間軸上の位置を検出するコマーシャル検出装置に関する。
民間TV放送事業者(以下「民放TV局」と略)におけるTV放送の番組コンテンツに含まれるCMの検出は、TV放送番組コンテンツを活用する際の基本的な処理であり、出願人が管理運用する放送映像アーカイブにおいても使用している機能である。
CM検出の技術は、TV放送がビデオ録画装置によって録画される当初から様々な手法が発明され、一部の技術は市販のビデオ録画装置等に搭載されている。
特許文献1には、TVCMを、放送手段や、映像フォーマットに関わらずに、自動的に識別する技術が開示されている。
特許文献2には、チャンネルロゴを用いてTVCMを検出する技術が開示されている。
特許文献3には、静止画を検知することにより、TVCMを検出する技術が開示されている。
非特許文献1には、チャンネルロゴを検出することでTVCMと番組コンテンツを識別する技術が開示されている。
特許4008929号公報 特許3738483号公報 特許4267649号公報
「ロゴ検出型自動CMカットプログラム logoGuilloとは」Wirewriggle、2018年11月26日閲覧、インターネット<http://loggialogic.blogspot.com/2011/11/cm-logoguillo.html>
特許文献1に開示されるCM検出の概略を説明する。
先ず、CMコンテンツは15秒の自然数倍である。そして、CMとCM、CMと番組との間には映像の大きな切り替わり(以下「シーンチェンジ」と略)と、音声がなくなる区間、すなわち無音区間が発生する。これらの条件から、シーンチェンジと音声の無音区間が同時に発生する箇所が15秒の自然数倍で一致する時間軸上の位置を、CMと番組の境目であると認識する。
しかしながら、番組コンテンツの中でもシーンチェンジと音声の無音区間が15秒の自然数倍で一致する場合が往々にして生じることがあり、CM誤検出の要因となっている。
非特許文献1に開示されるCM検出の概略を説明する。
民放TV局は、各々が独自のロゴマークを所有している。このロゴマークをチャンネルロゴと呼ぶ。殆どの場合、チャンネルロゴは登録商標であると共に、可視化されたウォーターマークであり、放送される番組コンテンツの概ね右上あるいは左上に薄く表示される。
非特許文献1に開示される技術では、このチャンネルロゴが表示されているコンテンツが番組コンテンツであると判断されている。
しかしながら、ウォーターマークであるチャンネルロゴは、番組コンテンツの状態によってはその検出が不可能になる場合がある。
このため、特許文献1と非特許文献1を組み合わせても、CM検出の誤検出を実用的に低減させるに至っていない。
本発明はかかる課題を解決し、少ない演算量でCM誤検出の可能性を極力低減することができる、コマーシャル検出装置を提供することを目的とする。
上記課題を解決するために、本発明のコマーシャル検出装置は、動画データに含まれる無音区間とシーンチェンジが一致する箇所を検出して、CMである可能性がある、動画データ上の時間軸上の区間であるCM候補区間の情報が記憶されているCM候補時間リストを作成するCM候補時間検出部と、動画データにおけるCM候補区間に含まれるフレームの中からチャンネルロゴを検出するチャンネルロゴ検出部とを具備する。更に、CM候補区間の開始位置及び/または終了位置の前後2フレームにおける、動画データにおいて放送局のチャンネルロゴが表示される画面上の座標情報であるチャンネルロゴ範囲座標情報によって特定される部分画像データが連続しているか否かを検出するチャンネルロゴ範囲連続性検出部と、チャンネルロゴ検出部及びチャンネルロゴ範囲連続性検出部の検出結果に基づいて、CM候補時間リストから番組コンテンツであると判断されるレコードに削除フラグを付与するCM候補時間修正部とを具備する。
本発明により、少ない演算量でCM誤検出の可能性を極力低減することができる、コマーシャル検出装置を提供することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の第一の実施形態に係るコマーシャル検出装置の概略図である。 コマーシャル検出装置のハードウェア構成を示すブロック図である。 コマーシャル検出装置のソフトウェア機能を示すブロック図である。 各種テーブルのフィールド構成を示す図である。 チャンネルロゴ範囲連続性検出部の機能ブロック図である。 第一差分演算処理部のソフトウェア機能を示すブロック図である。 TV受像機等で閲覧できる、民放TV局から放送される番組コンテンツの表示画面における、チャンネルロゴの表示態様の一例を示す図である。 番組コンテンツの画面内に表示されるチャンネルロゴの画素の輝度と、チャンネルロゴの周囲の背景の輝度のサンプルをプロットしたグラフである。 番組におけるチャンネルロゴの表示態様の一例である画面の一部と、チャンネルロゴの部分を拡大した図である。 録画済み動画ファイルの時間軸上におけるCM候補区間とその前後のフレームを示す概略図である。 番組コンテンツであるCM候補区間における、CM候補開始直前フレームロゴ範囲画像データ及びCM候補開始直後フレームロゴ範囲画像データの一例を示す図である。 本発明の第二の実施形態に係るコマーシャル検出装置のソフトウェア機能を説明するブロック図である。 本発明の第三の実施形態に係るコマーシャル検出装置のソフトウェア機能を説明するブロック図である。
[第一の実施形態:全体構成]
図1は、本発明の第一の実施形態に係るコマーシャル検出装置101の概略図である。
コマーシャル検出装置101は、TV録画装置であると共に、パソコン等の情報処理装置でもある。
コマーシャル検出装置101には、アンテナ102が接続されている。そして、内蔵するTVチューナボード208(図2にて後述)でTV放送電波を受信して復調し、所望の番組コンテンツのデジタル動画データをHDD等の不揮発性ストレージ205(図2にて後述)に録画することで、録画済み動画ファイル301(図3にて後述)を作成する。そしてコマーシャル検出装置101は、後述するCM検出機能を実行することによって、録画済み動画ファイル301に含まれるCMの時間軸上の位置を検出する。
[第一の実施形態:ハードウェア構成]
図2は、コマーシャル検出装置101のハードウェア構成を示すブロック図である。
コマーシャル検出装置101は、バス201に接続された、周知のCPU202、ROM203、RAM204、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ205、表示部206、操作部207を備える。
バス201には更に、TV放送電波を受信して復調するTVチューナボード208が接続されている。
不揮発性ストレージ205には、情報処理装置をコマーシャル検出装置101として稼働させるためのプログラムが記憶されている。
[第一の実施形態:ソフトウェア機能]
図3は、コマーシャル検出装置101のソフトウェア機能を示すブロック図である。
図3に示すコマーシャル検出装置101のソフトウェア機能は、大きく3つの段階に分けられる。
<第一の段階:CM候補時間リスト307の作成>
不揮発性ストレージ205に記憶されている録画済み動画ファイル301は、無音検出部302に読み込まれる。
無音検出部302は、録画済み動画ファイル301に存在する無音区間を検出して、無音検出時間リスト303を作成する。
一方、不揮発性ストレージ205に記憶されている録画済み動画ファイル301は、シーンチェンジ検出部304にも読み込まれる。
シーンチェンジ検出部304は、録画済み動画ファイル301に存在するシーンチェンジを検出して、シーンチェンジ検出時間リスト305を作成する。
[データ構造]
ここで、図4を参照して、無音検出時間リスト303を説明する。
図4は、各種テーブルのフィールド構成を示す図である。
無音検出時間リスト303は、無音検出開始時間フィールドと、無音検出終了時間フィールドを有する。
無音検出開始時間フィールドには、無音検出区間の開始時間が格納される。この開始時間は、録画済み動画ファイル301の先頭から見た相対時間である。なお、これ以降に説明する録画済み動画ファイル301上の時間は、全て録画済み動画ファイル301の先頭から見た相対時間である。
無音検出終了時間フィールドには、無音検出区間の終了時間が格納される。この開始時間は、録画済み動画ファイル301の先頭から見た相対時間である。
シーンチェンジ検出時間リスト305は、シーンチェンジ開始時間フィールドを有する。
シーンチェンジ開始時間フィールドは、録画済み動画ファイル301における、シーンチェンジが発生した瞬間のフレームの時間が格納される。
図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
無音検出時間リスト303とシーンチェンジ検出時間リスト305は、CM候補時間検出部306に読み込まれる。
CM候補時間検出部306は、無音検出時間リスト303とシーンチェンジ検出時間リスト305を突き合わせて、無音検出時間内に存在するシーンチェンジ検出時間を抽出する。そして、CM候補時間検出部306は、それら抽出されたシーンチェンジ検出時間とシーンチェンジ検出時間との間が15秒の自然数倍に合致している区間を、CM区間であると推定し、このCM区間に相当する時間をCM候補時間リスト307に出力する。
ここで再び図4を参照して、CM候補時間リスト307を説明する。
CM候補時間リスト307は、CM候補開始時間フィールドと、CM候補終了時間フィールドと、削除フラグフィールドを有する。
CM候補開始時間フィールドには、CM候補区間の開始時間が格納される。
CM候補区間とは、録画済み動画ファイル301に存在する無音検出時間の中に含まれるシーンチェンジ時間同士が、15秒の自然数倍に等しい、録画済み動画ファイル301上の時間軸上の区間を指している。すなわち、CM候補区間は、録画済み動画ファイル301の時間軸上で、CMである可能性が高い区間を示している。
なお、CMの長さは最大で4フレーム前後の時間幅を有するため、15秒に±0.15秒程度のマージンを設けて、シーンチェンジを検出することが望ましい。
CM候補終了時間フィールドには、CM候補区間の終了時間が格納される。
削除フラグフィールドには、当該CM候補区間に付与する削除フラグが格納される。すなわち、削除フラグフィールドは論理値フィールドであり、論理の真または偽の何れかの値が格納される。そして、削除フラグフィールドの初期状態は、論理の偽である。すなわち、削除フラグフィールドが論理の偽であるということは、当該レコードに削除フラグが付与されていないことを意味する。
以上、録画済み動画ファイル301から、無音検出部302、シーンチェンジ検出部304、CM候補時間検出部306を実行してCM候補時間リスト307を作成するまでが、コマーシャル検出装置101のソフトウェア機能における第一の段階である。
<第二の段階:チャンネルロゴを検出してCM候補時間リスト307に削除フラグを付与する>
再び図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
録画済み動画ファイル301とCM候補時間リスト307は、チャンネルロゴ検出部308に読み込まれる。
チャンネルロゴ検出部308は、先ず、操作部207等から入力されるチャンネル情報309から、録画済み動画ファイル301が放送された民放TV局のチャンネル情報を取得する。
次に、チャンネルロゴ検出部308は、チャンネル情報309でチャンネルロゴサンプルリスト310を検索して、当該民放TV局のチャンネルロゴの画像データであるチャンネルロゴ画像データを取得する。なお、チャンネル情報309は操作部207から手入力で入力する他、録画済み動画ファイル301に埋め込むか、あるいは録画済み動画ファイル301を管理するテーブル等から取得してもよい。
更に、チャンネルロゴ検出部308は、チャンネル情報309でチャンネルロゴアドレス範囲リスト311を検索して、当該民放TV局のチャンネルロゴが表示される、録画済み動画ファイル301における画面上の座標情報を取得する。これ以降、この座標情報をチャンネルロゴ範囲座標情報と呼ぶ。
次にチャンネルロゴ検出部308は、録画済み動画ファイル301のうち、CM候補時間リスト307の各レコードによって指定されるCM候補区間内の各フレームから、チャンネルロゴ範囲座標情報にしたがって部分画像データを切り出す。
そして、チャンネルロゴ検出部308は、部分画像データに微分演算処理等を施して、部分画像データに含まれる輪郭を抽出し、部分輪郭画像データを生成する。この処理はウォーターマークの検出処理である。そして、部分輪郭画像データをチャンネルロゴ画像データと比較して、チャンネルロゴの検出を試みる。
以上の処理によって、CM候補時間リスト307の各レコードによって指定される、録画済み動画ファイル301におけるCM候補区間に、チャンネルロゴが検出された場合には、チャンネルロゴ検出部308は、CM候補時間修正部312にCM候補時間リスト307の該当するレコードを指示する。
CM候補時間修正部312は、チャンネルロゴ検出部308からCM候補時間リスト307の該当するレコードを特定して、CM候補時間リスト307の当該レコードの削除フラグフィールドに論理の真を書き込む。
ここで再び図4を参照して、チャンネルロゴサンプルリスト310とチャンネルロゴアドレス範囲リスト311を説明する。
チャンネルロゴサンプルリスト310は、チャンネル情報フィールドと、チャンネルロゴ画像データフィールドを有する。
チャンネル情報フィールドには、民放TV局のチャンネル情報が格納される。
チャンネルロゴ画像データフィールドには、民放TV局のチャンネルロゴの画像データが格納される。
チャンネルロゴアドレス範囲リスト311は、チャンネル情報フィールドと、チャンネルロゴ第一座標フィールドと、チャンネルロゴ第二座標フィールドを有する。
チャンネル情報フィールドは、上述のチャンネルロゴサンプルリスト310の同名フィールドと同じである。
チャンネルロゴ第一座標フィールドには、民放TV局の画面上における、チャンネルロゴが表示される矩形範囲の左上の座標情報(以下「チャンネルロゴ第一座標」と略)が格納される。
チャンネルロゴ第二座標フィールドには、民放TV局の画面上における、チャンネルロゴが表示される矩形範囲の右下の座標情報(以下「チャンネルロゴ第二座標」と略)が格納される。
なお、チャンネルロゴ第一座標とチャンネルロゴ第二座標で特定されるチャンネルロゴ座標情報は、実際に民放TV局の画面上で表示されるチャンネルロゴの大きさよりも約1.5倍程度大きい範囲を指定する。これは、チャンネルロゴを検出する際に隣接するピクセル同士で微分演算を行う都合上、チャンネルロゴの周囲にマージンが必要になること、及び、チャンネルロゴの表示位置がわずかに変更されても検出可能にするためである。ただし、この矩形範囲を広げ過ぎると、演算量が増加するとともに、チャンネルロゴ以外の内容が入り込む可能性が高まり、チャンネルロゴの検出精度が低下することにつながる。そのため、矩形範囲の大きさは、チャンネルロゴの表示位置の変動に対する柔軟性と、演算量の増加および検出精度の低下との間で、バランスを取って決める必要がある。
<第三の段階:CM候補区間の前後のフレームにおけるチャンネルロゴ範囲の連続性を検出して、CM候補時間リスト307に削除フラグを付与する>
再び図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
録画済み動画ファイル301とCM候補時間リスト307は、チャンネルロゴ範囲連続性検出部313に読み込まれる。
ここで、チャンネルロゴ範囲連続性検出部313の動作の詳細について、図を改めて説明する。
図5は、チャンネルロゴ範囲連続性検出部313の機能ブロック図である。
チャンネルロゴ範囲切り出し処理部501は、先ず、前述のチャンネルロゴ検出部308と同様に、操作部207等から入力されるチャンネル情報309から、録画済み動画ファイル301が放送された民放TV局のチャンネル情報を取得する。
次に、チャンネル情報309でチャンネルロゴアドレス範囲リスト311を検索して、当該民放TV局のチャンネルロゴが表示される位置を示すチャンネルロゴ範囲座標情報を取得する。このチャンネルロゴ範囲座標情報は、録画済み動画ファイル301における画面上の座標情報である。
つまり、チャンネルロゴ範囲連続性検出部313は、チャンネルロゴ検出部308とは異なり、チャンネルロゴサンプルリスト310を参照しない。
次にチャンネルロゴ範囲切り出し処理部501は、録画済み動画ファイル301から、CM候補時間リスト307の削除フラグが付されていないレコードによって指定されるCM候補区間の開始位置の前後2フレームを読み出す。そして、チャンネルロゴ範囲切り出し処理部501は、この前後2フレームに対してチャンネルロゴ範囲座標情報に従って部分画像データを切り出す。これが、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503である。
次にチャンネルロゴ範囲切り出し処理部501は、録画済み動画ファイル301から、CM候補時間リスト307の削除フラグが付されていないレコードによって指定されるCM候補区間の終了位置の前後2フレームを読み出す。そして、チャンネルロゴ範囲切り出し処理部501は、この前後2フレームに対してチャンネルロゴ範囲座標情報に従って部分画像データを切り出す。これが、CM候補終了直前フレームロゴ範囲画像データ504と、CM候補終了直後フレームロゴ範囲画像データ505である。
また、チャンネルロゴ範囲切り出し処理部501は、CM候補時間リスト307のあるレコードに従ってCM候補開始直前フレームロゴ範囲画像データ502、CM候補開始直後フレームロゴ範囲画像データ503、CM候補終了直前フレームロゴ範囲画像データ504、そしてCM候補終了直後フレームロゴ範囲画像データ505を出力する。
そして、チャンネルロゴ範囲切り出し処理部501は、その時点におけるCM候補時間リスト307のレコードの情報(レコード番号、あるいはCM候補開始時間等、レコードを特定できる情報)を、CM候補時間修正部312に出力する。
CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503は、第一差分演算処理部506に入力される。
第一差分演算処理部506は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の部分領域の割合を算出する。この、部分領域の割合については、図6で詳述する。
また、CM候補終了直前フレームロゴ範囲画像データ504と、CM候補終了直後フレームロゴ範囲画像データ505は、第二差分演算処理部507に入力される。
第二差分演算処理部507は、CM候補終了直前フレームロゴ範囲画像データ504と、CM候補終了直後フレームロゴ範囲画像データ505の部分領域の割合を算出する。この、部分領域の割合についても、図6で詳述する。
第一差分演算処理部506が出力する第一の部分領域の割合は、第一コンパレータ508のプラス側入力に入力される。第一コンパレータ508は、第一の部分領域の割合を領域割合閾値509と比較して、第一の部分領域の割合が領域割合閾値509を上回る場合には、論理の真を出力する。
第二差分演算処理部507が出力する第二の部分領域の割合は、第二コンパレータ510のプラス側入力に入力される。第二コンパレータ510は、第二の部分領域の割合を領域割合閾値509と比較して、第二の部分領域の割合が領域割合閾値509を上回る場合には、論理の真を出力する。
第一コンパレータ508及び第二コンパレータ510の出力は、それぞれORゲート511に入力される。すなわち、第一コンパレータ508と第二コンパレータ510の何れか一方または両方が論理の真である場合には、ORゲート511は論理の真を出力する。
ORゲート511の論理出力は、CM候補時間修正部312に出力される。
[第一差分演算処理部506及び第二差分演算処理部507]
ここで図6を参照して、第一差分演算処理部506及び第二差分演算処理部507の処理を説明する。
図6は、第一差分演算処理部506のソフトウェア機能を示すブロック図である。なお、前述の通り、第一差分演算処理部506及び第二差分演算処理部507は同一の機能を有するため、図6は第二差分演算処理部507のソフトウェア機能を示すブロック図でもある。したがって図6中、同一の機能ブロックやデータ等については括弧書きで当該同一機能ブロックの符号を付している。
第一アドレス制御部601は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルを読み出して、輝度差演算部602に出力する。
輝度差演算部602は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルの輝度差の絶対値を算出し、輝度差データを出力する。
ピクセルは、RGBやYUV等のカラー、つまり3個の変数を有するデータであるので、先ず、ピクセルの輝度成分を抽出する。RGB形式やYUV形式の色情報を周知のCIELAB形式の色情報に変換してからL*成分を輝度として使用してもよいし、YUV形式の場合には、Y成分をそのまま輝度として使用してもよい。その後、ピクセル相互の輝度の比較を行う。
輝度差演算部602が出力する輝度差データは、第三コンパレータ603のマイナス側入力に入力される。
一方、第三コンパレータ603のプラス側入力には、輝度変化閾値604が入力される。
第三コンパレータ603は、輝度差演算部602が出力する輝度差データが輝度変化閾値604未満であれば、論理の真を出力する。
第一アドレス制御部601が輝度差演算部602に出力したCM候補開始直後フレームロゴ範囲画像データ503のピクセルは、輝度演算部605及び勾配演算部606にも出力される。
輝度演算部605は、CM候補開始直後フレームロゴ範囲画像データ503のピクセルの輝度を算出し、輝度データを出力する。
輝度演算部605が出力する輝度データは、第四コンパレータ607のプラス側入力に入力される。
一方、第四コンパレータ607のマイナス側入力には、輝度閾値608が入力される。
第四コンパレータ607は、輝度演算部605が出力する輝度データが輝度閾値608以上であれば、論理の真を出力する。
勾配演算部606は、CM候補開始直後フレームロゴ範囲画像データ503のピクセルにおける輝度の勾配を算出し、勾配データを出力する。
勾配演算部606は、指定されるピクセルに対し、X方向とY方向に中心差分勾配を算出し、それらのベクトル長(X方向の勾配をGx、Y方向の勾配をGyとしたとき、√(Gx2+Gy2)の値)を算出する。なお、勾配の計算は中心差分勾配の代わりにソーベル勾配演算子を用いる等、他の計算方法も採用し得る。
勾配演算部606が出力する勾配データは、第五コンパレータ609のプラス側入力に入力される。
一方、第五コンパレータ609のマイナス側入力には、勾配閾値610が入力される。
第五コンパレータ609は、勾配演算部606が出力する勾配データが勾配閾値610以上であれば、論理の真を出力する。
第四コンパレータ607の論理出力と第五コンパレータ609の論理出力は、ORゲート611に入力される。
第三コンパレータ603の論理出力とORゲート611の論理出力は、ANDゲート612に入力される。
ANDゲート612の出力論理値は、第一アドレス制御部601を通じてフレームロゴ範囲フラグデータ613の該当アドレスのセルに書き込まれる。すなわち、第一アドレス制御部601は、ANDゲート612の出力論理値を、フレームロゴ範囲フラグデータ613の、CM候補開始直前フレームロゴ範囲画像データ502とCM候補開始直後フレームロゴ範囲画像データ503の、該当するアドレスのセルに記憶する。
フレームロゴ範囲フラグデータ613は、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503と同一の要素数(セル数)を有するフラグ群である。
すなわち、CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルについて、以下の条件を満たすピクセルに対し、論理の真を、フレームロゴ範囲フラグデータ613の該当するアドレスのセルに出力する。
(1)CM候補開始直前フレームロゴ範囲画像データ502と、CM候補開始直後フレームロゴ範囲画像データ503の、同一アドレスのピクセルの輝度差が輝度変化閾値604未満である。
(2)CM候補開始直後フレームロゴ範囲画像データ503の当該アドレスのピクセルの輝度が輝度閾値608以上である。
(3)CM候補開始直後フレームロゴ範囲画像データ503の当該アドレスのピクセルの勾配が勾配閾値610以上である。
(4)(1)かつ、(2)または(3)を満たす。
フレームロゴ範囲フラグデータ613は、移動平均演算部614に読み込まれる。
移動平均演算部614は、フレームロゴ範囲フラグデータ613の各セルに対し、論理の真を「1」、論理の偽を「0」として、縦8セル×横8セル=64セル単位の移動平均を算出する。そして、フレームロゴ範囲フラグデータ613の約1/64の要素数よりなる部分領域原データ615を出力する。
部分領域原データ615は、フレームロゴ範囲フラグデータ613の約1/64の要素数(セル数)よりなると共に、各セルが小数点の値を有するデータ群である。
なお、本発明の実施形態において、移動平均演算部614は8×8の64個のセル分割を採用しているが、セルあたりのピクセル数を一定にしてもよい。例えば、8ピクセル×8ピクセルの64ピクセルを1つのセルとする。この場合、セルの数は、ロゴ範囲の大きさによって変化することになる。一例として、チャンネルロゴ範囲の大きさが96ピクセル×96ピクセルであれば144個のセルに、128ピクセル×128ピクセルであれば256個のセルに分割することになる。
第二アドレス制御部616は、部分領域原データ615からセル毎にデータを読み出して、第六コンパレータ617のプラス側入力に出力する。
第六コンパレータ617のマイナス側入力には領域閾値618が入力される。
第六コンパレータ617は、部分領域原データ615の各セルの値が領域閾値618以上であれば、論理の真を出力する。
第六コンパレータ617の出力論理値は、第二アドレス制御部616を通じて部分領域フラグデータ619に書き込まれる。
部分領域フラグデータ619は、部分領域原データ615と同一の要素数(セル数)を有するフラグ群である。
部分領域フラグデータ619は領域割合演算部620に入力される。
領域割合演算部620は、部分領域フラグデータ619の、論理が真のセル数を計数して、部分領域フラグデータ619のセルの全数で除算することにより、セルの全数に対する論理が真のセル数の割合である第一の部分領域の割合を算出して出力する。この第一の部分領域の割合が、第一差分演算処理部506の出力データとなる。
領域割合演算部620が出力する第一の部分領域の割合は、第一コンパレータ508のプラス側入力に入力される。
第一コンパレータ508のマイナス側入力には、領域割合閾値509が入力される。
第一コンパレータ508は、第一の部分領域の割合が領域割合閾値509以上であれば、論理の真を出力する。
図6において説明した第一差分演算処理部506及び周辺の各機能ブロック等は、第二差分演算処理部507において以下のように読み替えられる。
CM候補開始直前フレームロゴ範囲画像データ502→CM候補終了直前フレームロゴ範囲画像データ504
CM候補開始直後フレームロゴ範囲画像データ503→CM候補終了直後フレームロゴ範囲画像データ505
領域割合演算部620が出力する第一の部分領域の割合→領域割合演算部620が出力する第二の部分領域の割合
第一コンパレータ508→第二コンパレータ510
再び図3に戻って、コマーシャル検出装置101のソフトウェア機能の説明を続ける。
CM候補時間修正部312は、チャンネルロゴ範囲連続性検出部313から出力される論理出力(図5のORゲート511の出力)が論理の真である場合には、チャンネルロゴ範囲連続性検出部313によって指定されたCM候補時間リスト307のレコードの削除フラグフィールドに論理の真を書き込む。
最終的にチャンネルロゴ範囲連続性検出部313とCM候補時間修正部312による、CM候補時間リスト307に対する削除フラグ付与処理が終了したら、CM候補時間修正部312はCM候補時間リスト307のうち、削除フラグが付されていないレコードのみを抽出して、CM時間リスト314を作成する。
以上説明した、第一の段階、第二の段階、第三の段階のシーケンス制御は、入出力制御部315によって行われる。入出力制御部315は、操作部207の指示にしたがい、処理の開始、中断等を、無音検出部302、シーンチェンジ検出部304、CM候補時間検出部306、チャンネルロゴ検出部308、CM候補時間修正部312、そしてチャンネルロゴ範囲連続性検出部313に指示する。また、処理の進行状況等を表示部206に表示する。
[チャンネルロゴとCM及び番組コンテンツとの関係]
以上、本発明の実施形態に係るコマーシャル検出装置の機能について説明をしたが、これより各々の機能ブロックの存在理由について、チャンネルロゴとCM及び番組コンテンツとの関係を中心に説明する。
図7は、TV受像機等で閲覧できる、民放TV局から放送される番組コンテンツの表示画面P701における、チャンネルロゴの表示態様の一例を示す図である。
図7に示す表示画面P701は、バラエティ番組のタイトル画面を想定している。この表示画面P701の右上に、チャンネルロゴ702が薄いウォーターマークの形態で表示されている。
なお、一点鎖線の枠は、実際には非表示であるが、コマーシャル検出装置のチャンネルロゴアドレス範囲リスト311に格納されているチャンネルロゴ範囲座標情報によって形成される枠A703である。この枠A703の左上の頂点の座標がチャンネルロゴ第一座標であり、右下の頂点の座標がチャンネルロゴ第二座標である。
図7に示すように、民放TV局が番組コンテンツを放送している最中、チャンネルロゴ702は画面の右上あるいは左上に、ウォーターマークとして表示される。
図8は、番組コンテンツの画面内に表示されるチャンネルロゴの画素の輝度と、チャンネルロゴの周囲の背景の輝度のサンプルをプロットしたグラフである。横軸は背景の輝度、縦軸は画面上に表示されるチャンネルロゴの輝度である。輝度はピクセルの値(0〜255)であるため、単位は存在しない。
チャンネルロゴは周知のウォーターマークである。ウォーターマークは、文字あるいはロゴマークを透過画像データで用意され、基の画像データと合成されている。
発明者らは、民放TV局のチャンネルロゴのサンプルを沢山収集して、チャンネルロゴに属する画素の輝度と、チャンネルロゴの周囲のうち、当該画素に最も近い箇所の画素の輝度を調べて、民放TV局毎にグラフにした。これが図8のグラフである。
図8中、実線L801は放送局A、点線L802は放送局B、一点鎖線L803は放送局Cの、番組コンテンツ上におけるチャンネルロゴとその周囲の画素の輝度の相関を示している。どの民放TV局も、1次関数で示される。この調査結果から、画面上のチャンネルロゴの画素の輝度は、以下の式で計算できる。
画面上チャンネルロゴ輝度=チャンネルロゴ画像輝度+透過率×背景輝度
調査の結果、殆どの民放TV局では透過率が0.7以上と高い値であることが判明した。このように高い透過率でチャンネルロゴを画面上に表示すると、背景の状態によってはチャンネルロゴの検出が困難あるいは不可能になる場合がある。
図9Aは、ある番組におけるチャンネルロゴ702の表示態様の一例である画面の一部を示す概略図である。
図9Bは、ある番組におけるチャンネルロゴ702の表示態様の一例である画面の、チャンネルロゴ702の部分を拡大した図である。
図9Aでは、一例としてバラエティ番組によく見受けられるワイプ901という、番組出演者の顔が画面の端に表示されている態様を示している。
図9Bを見ると、ワイプ901として表示されている番組出演者の顔902と、チャンネルロゴ702が重なっている。このような場合には、番組出演者、すなわち人間の顔は、狭い面積に輝度勾配の高い箇所が密集しているため、チャンネルロゴ702の検出が困難あるいは不可能になる。
図9Cは、別の番組におけるチャンネルロゴ702の表示態様の一例である画面の一部を示す概略図である。
図9Dは、別の番組におけるチャンネルロゴ702の表示態様の一例である画面の、チャンネルロゴ702の部分を拡大した図である。
図9Cでは、一例として番組中で画面全体あるいは画面の大部分の領域に白色等の高輝度領域A903が生じている態様を示している。図9Dを見ると、高輝度領域A903とチャンネルロゴ702が重なっている。
番組コンテンツにおけるチャンネルロゴ702の表示は、周囲の背景より輝度が高くなるように表示されるため、背景の輝度が高いと、チャンネルロゴ702と輝度差が小さくなってしまい、チャンネルロゴ702の検出が困難あるいは不可能になる。
図10は、録画済み動画ファイル301の時間軸上におけるCM候補区間S1001とその前後のフレームを示す概略図である。横軸は時間軸を示す。
図10において、CM候補区間S1001の先頭は、CM候補区間S1001の開始位置T1002である。CM候補区間S1001の末尾は、CM候補区間S1001の終了位置T1003である。
開始位置T1002の直前には、フレームF1004がある。開始位置T1002の時点には、フレームF1005がある。
終了位置T1003の直前には、フレームF1006がある。終了位置T1003の時点には、フレームF1007がある。
フレームF1004のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補開始直前フレームロゴ範囲画像データ502が含まれている。
フレームF1005のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補開始直後フレームロゴ範囲画像データ503が含まれている。
フレームF1006のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補終了直前フレームロゴ範囲画像データ504が含まれている。
フレームF1007のチャンネルロゴ範囲座標情報には、部分画像データであるCM候補終了直後フレームロゴ範囲画像データ505が含まれている。
先に説明したように、番組コンテンツの中でも、無音区間とシーンチェンジが一致する場合は多々生じ得る。そこで、図3において説明した第二の段階で、チャンネルロゴ検出部308がCM候補区間S1001に含まれるフレームの中からチャンネルロゴを検出して、当該CM候補区間S1001が属するCM候補時間リスト307のレコードに削除フラグを付与した。
しかし、先に説明したように番組コンテンツの内容によっては、チャンネルロゴの検出が困難あるいは不可能になる場合が多々生じ得る。
図11Aは、番組コンテンツであるCM候補区間S1001における、CM候補開始直前フレームロゴ範囲画像データ502の一例を示す図である。
図11Bは、番組コンテンツであるCM候補区間S1001における、CM候補開始直後フレームロゴ範囲画像データ503の一例を示す図である。
すなわち、図11A及び図11Bは、番組コンテンツ内においてシーンチェンジが発生している状態における、チャンネルロゴ範囲座標情報によって形成される枠A703の画像データのイメージを示す。
図11Aに示すCM候補開始直前フレームロゴ範囲画像データ502のイメージM1101は、図9Dと同様に、高輝度領域A903とチャンネルロゴ702が重なっているので、チャンネルロゴ702の検出が不可能になっている。その一方で、高輝度領域A903の周辺には第一模様P1102が表示されている。
図11Bに示すCM候補開始直後フレームロゴ範囲画像データ503のイメージM1103は、図9Dと同様に、高輝度領域A903とチャンネルロゴ702が重なっているので、チャンネルロゴ702の検出が不可能になっている。その一方で、高輝度領域A903の周辺には、第一模様P1102とは輝度及び/または勾配が異なる第二模様P1104が表示されている。
発明者らは、CM候補区間S1001としてCM候補時間リスト307に登録された番組コンテンツにおいて、チャンネルロゴの検出が困難あるいは不可能になる場合、チャンネルロゴ範囲座標情報の周辺では、どのような状態になっているのかを調べた。
図11A及び図11Bに示すように、番組コンテンツであるにもかかわらず、CM候補区間S1001としてCM候補時間リスト307に登録されている録画済み動画ファイル301のフレームを調べると、CM候補区間S1001の開始位置及び/または終了位置の前後の2フレームにおいて、シーンチェンジが発生する。しかし、シーンチェンジが発生しても、チャンネルロゴ範囲座標情報の周辺の画像データは、殆ど変わっていないことが判明した。
番組コンテンツが放送されている途中、番組コンテンツ内でシーンチェンジと無音区間が重なり、更にその時間間隔が15秒の自然数倍になることがある。このように検出されたCM候補区間S1001は、チャンネルロゴが検出できれば、当該CM候補区間S1001は番組コンテンツであると判断して、チャンネルロゴ検出部308とCM候補時間修正部312がCM候補時間リスト307の該当するレコードに削除フラグを付与する。
しかし、当該CM候補区間S1001でチャンネルロゴが検出できない場合、CM候補区間S1001の開始位置及び/または終了位置の前後の2フレームでは、2通りの挙動が確認できた。
CM候補区間S1001がCMそのものである場合、CM候補区間S1001の開始位置及び/または終了位置の前後2フレームにおける、チャンネルロゴ範囲座標情報の周辺の画像データは、大きく変化している。したがって、前後2フレームについて、チャンネルロゴ範囲座標情報で指定される部分画像データを切り出して、部分領域の割合を得ると、多くの場合、小さな値が得られる。
これに対し、CM候補区間S1001が番組コンテンツである場合、CM候補区間S1001の開始位置及び/または終了位置の前後2フレームにおける、チャンネルロゴ範囲座標情報の周辺の画像データは、殆ど変化しないことが多い。
すなわち、チャンネルロゴ範囲座標情報の周辺の画像データには、前述の図9Bまたは図9Dに示したような状態が、当該フレームに生じている。
この場合、図11A及び図11Bに示すように、前後2フレームの全体はシーンチェンジによって大きく変化しているが、前後2フレームについて、チャンネルロゴ範囲座標情報(図11A及び図11Bの枠A703)の画像データを切り出して、シーンチェンジによって大きく変化した部分を除外すると、残った領域のピクセルは図9Bに示すような密度勾配が高い領域であるか、図9Dに示すような高輝度領域である。
チャンネルロゴ範囲連続性検出部313のチャンネルロゴ範囲切り出し処理部501は、まさにこのチャンネルロゴ範囲座標情報で特定される部分画像データを、CM候補区間S1001の開始位置及び/または終了位置の、前後の2フレームについて切り出す。これが、CM候補開始直前フレームロゴ範囲画像データ502、CM候補開始直後フレームロゴ範囲画像データ503、CM候補終了直前フレームロゴ範囲画像データ504及びCM候補終了直後フレームロゴ範囲画像データ505である。
そして第一差分演算処理部502は、CM候補開始直前フレームロゴ範囲画像データ502及びCM候補開始直後フレームロゴ範囲画像データ503から、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルに対して論理の真を与える、フレームロゴ範囲フラグデータ613を作成する。この処理は、第一アドレス制御部601、輝度差演算部602、第三コンパレータ603、輝度変化閾値604、輝度演算部605、第四コンパレータ607、輝度閾値608、勾配演算部606、第五コンパレータ609、勾配閾値610、ORゲート611、ANDゲート612によって遂行される。
輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域とは、例えば図9Bにおけるワイプ901と枠A703が重複する箇所であり、例えば図9D、図11A及び図11Bにおける高輝度領域A903と枠A703が重複する箇所である。
第一差分演算処理部502は、フレームロゴ範囲フラグデータ613に基づいて、フレームロゴ範囲に対し、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域の割合である第一の部分領域の割合を算出する。この処理は、移動平均演算部614、第二アドレス制御部616、第六コンパレータ617、領域閾値618、領域割合演算部620によって遂行される。
この、第一の部分領域の割合が領域割合閾値509以上であれば、CM候補開始直前フレームロゴ範囲画像データ502が属するフレームと、CM候補開始直後フレームロゴ範囲画像データ503が属するフレームは、チャンネルロゴの検出を阻害する何らかの映像が連続して存在していると推測できる。
チャンネルロゴ範囲はフレーム全体に対して小さな面積(データ量)である。これに加えて、特に、移動平均演算部614によって演算の対象となるデータ量が更に約1/64に低減される。
以上より、第一差分演算処理部502の全体的な演算量は、録画済み動画ファイル301の全てのフレームに対して連続性を演算するシーンチェンジ検出部304の演算処理と比べて遥かに少ない演算量であるため、極めて高速に実行できる。
なお、輝度差演算部602において、輝度の差の絶対値を得る代わりに、輝度の差の2乗を得てもよい。その際、輝度変化閾値604は輝度の差の2乗に併せて適切な値に増やす必要が生じる。
[第二の実施形態:ソフトウェア機能]
以上説明した、本発明の第一の実施形態に係るコマーシャル検出装置101は、ソフトウェア機能によって、録画済み動画ファイル301に対して、CM検出を実行する装置であった。
特に図3において説明した、本発明のCM検出機能は、少しの工夫を加えることで、TV番組コンテンツを録画している最中においてもCM検出を実行することが可能である。具体的には、個々の処理のステップを可能な範囲で同時並行して実行することにより、CM検出結果が得られるまでの時間を短くすることが可能である。以下に、実施形態のバリエーションとして、それら手法を説明する。
図12は、本発明の第二の実施形態に係るコマーシャル検出装置1201のソフトウェア機能を説明するブロック図である。
図12の、図3と同一の機能ブロックは同一の符号を付して説明を省略する。
TVチューナボード208は、アンテナ102から放送電波を受信して復調し、動画データストリームを出力する。
TVチューナボード208が出力する動画データストリームは、一旦リングバッファ1202に格納される。
リングバッファ1202に格納された動画データストリームは、所定の容量に達したら、ファイルシステム1203によって読み込まれ、録画中動画ファイル1204に追記録される。
CM仮候補時間検出部1205は、無音検出時間リスト303とシーンチェンジ検出時間リスト305が合致するタイミングのみを抽出して、CM仮候補時間リスト1206を出力する。
CM仮候補時間リスト1206は、図3のCM候補時間リスト307とは異なり、15秒の自然数倍の区間のチェックが入っていない。
チャンネルロゴ検出部308は、録画中常時稼働し続ける。そして、リングバッファ1202中の動画データストリームを読み込み、チャンネルロゴを検出する度、チャンネルロゴ検出時間リスト1207に出力する。
チャンネルロゴ範囲連続性検出部313は、CM仮候補時間リスト1206に基づいて、チャンネルロゴ範囲の連続性を検出する。
CM候補時間変換部1208は、CM仮候補時間リスト1206と、チャンネルロゴ検出時間リスト1207と、チャンネルロゴ範囲連続性検出部313の検出結果に基づいて、CM時間リスト314を出力する。
図12に示す本発明の第二の実施形態に係るコマーシャル検出装置1201では、チャンネルロゴ検出部308を常時稼働させ、かつ、チャンネルロゴ範囲連続性検出部313をCM仮候補時間リスト1206に適用するという点がポイントである。
[第三の実施形態:ソフトウェア機能]
図13は、本発明の第三の実施形態に係るコマーシャル検出装置1301のソフトウェア機能を説明するブロック図である。
図13の、図3及び図12と同一の機能ブロックは同一の符号を付して説明を省略する。
チャンネルロゴ範囲画像データ抽出部1302は、チャンネル情報309及びチャンネルロゴアドレス範囲リスト311を読み込み、リングバッファ1202中の動画データストリームから、チャンネルロゴアドレス範囲の画像データを抜き出して、ハードディスク装置等の不揮発性ストレージ205上に一時ファイル1303として記録する。
チャンネルロゴ検出部308は、一時ファイル1303から部分画像データストリームを読み出し、チャンネルロゴが検出できたらチャンネルロゴを検出した旨の情報をCM候補時間修正部1304に送る。
図13に示す本発明の第三の実施形態に係るコマーシャル検出装置1301では、不揮発性ストレージ205上に一時ファイル1303を作成し、この一時ファイル1303にチャンネルロゴアドレス範囲の画像データを一時的に記憶する。したがって、チャンネルロゴ範囲連続性検出部313は、第一の実施形態に係るコマーシャル検出装置101と同様に、過去のチャンネルロゴアドレス範囲における連続性の検出処理が可能になる。
本発明の実施形態においては、コマーシャル検出装置101を開示した。
コマーシャル検出装置101は、第一の段階において、録画済み動画ファイル301に含まれる無音区間とシーンチェンジが一致する箇所(相対時間)を検出して、CM候補時間リスト307を作成する。
次に第二の段階において、チャンネルロゴ検出部308がCM候補区間に含まれるフレームの中からチャンネルロゴを検出して、当該CM候補区間が属するCM候補時間リスト307のレコードに削除フラグを付与する。
最後に第三の段階において、チャンネルロゴ範囲連続性検出部313は、CM候補区間の開始位置及び/または終了位置の前後2フレームにおけるチャンネルロゴ範囲座標情報の画像データを切り出す。そして、それら画像データの部分領域の割合を、領域割合閾値509と比較する。領域割合閾値509と比較して、CM候補区間の開始位置及び/または終了位置の前後2フレームにおけるチャンネルロゴ範囲座標情報の画像データに連続性が認められる場合は、当該CM候補区間を番組コンテンツであると判断して、当該CM候補区間が属するCM候補時間リスト307のレコードに削除フラグを付与する。
以上説明したように、特に第三の段階におけるチャンネルロゴ範囲連続性検出部313の機能により、チャンネルロゴが検出できないCM候補区間に対しても、高い精度で番組コンテンツであるかCMかを推定することが可能になる。
また、チャンネルロゴ範囲連続性検出部313の演算量は極めて少ないため、高速な処理が可能である。
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、他の変形例、応用例を含む。
101…コマーシャル検出装置、102…アンテナ、201…バス、202…CPU、203…ROM、204…RAM、205…不揮発性ストレージ、206…表示部、207…操作部、208…TVチューナボード、301…録画済み動画ファイル、302…無音検出部、303…無音検出時間リスト、304…シーンチェンジ検出部、305…シーンチェンジ検出時間リスト、306…CM候補時間検出部、307…CM候補時間リスト、308…チャンネルロゴ検出部、309…チャンネル情報、310…チャンネルロゴサンプルリスト、311…チャンネルロゴアドレス範囲リスト、312…CM候補時間修正部、313…チャンネルロゴ範囲連続性検出部、314…CM時間リスト、315…入出力制御部、501…チャンネルロゴ範囲切り出し処理部、502…CM候補開始直前フレームロゴ範囲画像データ、503…CM候補開始直後フレームロゴ範囲画像データ、504…CM候補終了直前フレームロゴ範囲画像データ、505…CM候補終了直後フレームロゴ範囲画像データ、506…第一差分演算処理部、507…第二差分演算処理部、508…第一コンパレータ、509…領域割合閾値、510…第二コンパレータ、511…ORゲート、601…第一アドレス制御部、602…輝度差演算部、603…第三コンパレータ、604…輝度変化閾値、605…輝度演算部、606…勾配演算部、607…第四コンパレータ、608…輝度閾値、609…第五コンパレータ、610…勾配閾値、611…ORゲート、612…ANDゲート、613…フレームロゴ範囲フラグデータ、614…移動平均演算部、615…部分領域原データ、616…第二アドレス制御部、617…第六コンパレータ、618…領域閾値、619…部分領域フラグデータ、620…領域割合演算部、702…チャンネルロゴ、901…ワイプ、902…顔、1201…コマーシャル検出装置、1202…リングバッファ、1203…ファイルシステム、1204…録画中動画ファイル、1205…CM仮候補時間検出部、1206…CM仮候補時間リスト、1207…チャンネルロゴ検出時間リスト、1208…CM候補時間変換部、1301…コマーシャル検出装置、1302…チャンネルロゴ範囲画像データ抽出部、1303…一時ファイル、1304…CM候補時間修正部

Claims (6)

  1. 動画データに含まれる無音区間とシーンチェンジが一致する箇所を検出して、CMである可能性がある、前記動画データ上の時間軸上の区間であるCM候補区間の情報が記憶されているCM候補時間リストを作成するCM候補時間検出部と、
    前記動画データにおける前記CM候補区間に含まれるフレームの中からチャンネルロゴを検出するチャンネルロゴ検出部と、
    前記CM候補区間の開始位置及び/または終了位置の前後2フレームにおける、前記動画データにおいて放送局のチャンネルロゴが表示される画面上の座標情報であるチャンネルロゴ範囲座標情報によって特定される部分画像データが連続しているか否かを検出するチャンネルロゴ範囲連続性検出部と、
    前記チャンネルロゴ検出部及び前記チャンネルロゴ範囲連続性検出部の検出結果に基づいて、前記CM候補時間リストから番組コンテンツであると判断されるレコードに削除フラグを付与するCM候補時間修正部と
    を具備するコマーシャル検出装置。
  2. 前記CM候補時間リストは、前記CM候補区間の開始時間が格納されるCM候補開始時間フィールドと、前記CM候補区間の終了時間が格納されるCM候補終了時間フィールドと、前記CM候補区間に付与する削除フラグが格納される削除フラグフィールドとを有する、請求項1に記載のコマーシャル検出装置。
  3. 前記CM候補時間修正部は、前記チャンネルロゴ検出部が前記動画データにおける前記CM候補区間に含まれるフレームの中からチャンネルロゴを検出したことに呼応して、前記CM候補区間が属する前記CM候補時間リストのレコードに削除フラグを付与する、
    請求項2に記載のコマーシャル検出装置。
  4. 前記CM候補時間修正部は、前記チャンネルロゴ範囲連続性検出部が、前記CM候補区間の開始位置の前後2フレームにおける前記部分画像データ、または終了位置の前後2フレームにおける前記部分画像データの何れかが連続していることを検出した場合に、前記CM候補区間が属する前記CM候補時間リストのレコードに削除フラグを付与する、
    請求項2または3に記載のコマーシャル検出装置。
  5. 前記チャンネルロゴ範囲連続性検出部は、チャンネルロゴ範囲切り出し処理部を備え、
    前記チャンネルロゴ範囲切り出し処理部は、
    前記動画データから、前記CM候補時間リストの前記削除フラグが付されていないレコードによって指定される前記CM候補区間の開始位置の前後2フレームを読み出し、
    前記チャンネルロゴ範囲座標情報に従って前記部分画像データを切り出すことにより、CM候補開始直前フレームロゴ範囲画像データと、CM候補開始直後フレームロゴ範囲画像データを出力すると共に、
    前記動画データから、前記CM候補時間リストの前記削除フラグが付されていないレコードによって指定される前記CM候補区間の終了位置の前後2フレームを読み出し、
    前記チャンネルロゴ範囲座標情報に従って前記部分画像データを切り出すことにより、CM候補終了直前フレームロゴ範囲画像データと、CM候補終了直後フレームロゴ範囲画像データを出力する、
    請求項4に記載のコマーシャル検出装置。
  6. 前記チャンネルロゴ範囲連続性検出部は、
    前記CM候補開始直前フレームロゴ範囲画像データと、前記CM候補開始直後フレームロゴ範囲画像データにおいて、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域を部分領域として特定し、チャンネルロゴ範囲における前記部分領域の面積の割合を領域割合として算出し、前記領域割合が所定の領域割合閾値以上であるか、または、
    前記CM候補終了直前フレームロゴ範囲画像データと、前記CM候補終了直後フレームロゴ範囲画像データにおいて、輝度変化が小さく、かつ、輝度が高いか勾配が大きいピクセルが多数を占有する領域を部分領域として特定し、チャンネルロゴ範囲における前記部分領域の面積の割合を領域割合として算出し、前記領域割合が所定の領域割合閾値以上であるか、何れかの場合において、指定された前記CM候補区間を除外する、
    請求項5に記載のコマーシャル検出装置。
JP2019035742A 2019-02-28 2019-02-28 コマーシャル検出装置 Active JP7268848B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019035742A JP7268848B2 (ja) 2019-02-28 2019-02-28 コマーシャル検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019035742A JP7268848B2 (ja) 2019-02-28 2019-02-28 コマーシャル検出装置

Publications (2)

Publication Number Publication Date
JP2020141273A true JP2020141273A (ja) 2020-09-03
JP7268848B2 JP7268848B2 (ja) 2023-05-08

Family

ID=72265268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019035742A Active JP7268848B2 (ja) 2019-02-28 2019-02-28 コマーシャル検出装置

Country Status (1)

Country Link
JP (1) JP7268848B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2771212C1 (ru) * 2021-06-02 2022-04-28 Общество с Ограниченной Ответственностью "СТРИМ Лабс" Способ обнаружения логотипа телеканала в телевизионной трансляции

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003047031A (ja) * 2001-08-03 2003-02-14 Nec Corp コマーシャル検出方法及び装置
JP2006109126A (ja) * 2004-10-06 2006-04-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP2007267121A (ja) * 2006-03-29 2007-10-11 Victor Co Of Japan Ltd Cm検出装置
JP2010130563A (ja) * 2008-11-28 2010-06-10 Toshiba Corp 映像解析装置およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003047031A (ja) * 2001-08-03 2003-02-14 Nec Corp コマーシャル検出方法及び装置
JP2006109126A (ja) * 2004-10-06 2006-04-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP2007267121A (ja) * 2006-03-29 2007-10-11 Victor Co Of Japan Ltd Cm検出装置
JP2010130563A (ja) * 2008-11-28 2010-06-10 Toshiba Corp 映像解析装置およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2771212C1 (ru) * 2021-06-02 2022-04-28 Общество с Ограниченной Ответственностью "СТРИМ Лабс" Способ обнаружения логотипа телеканала в телевизионной трансляции

Also Published As

Publication number Publication date
JP7268848B2 (ja) 2023-05-08

Similar Documents

Publication Publication Date Title
KR102147230B1 (ko) 동적 비디오 오버레이
US6157744A (en) Method and apparatus for detecting a point of change in a moving image
EP2109313B1 (en) Television receiver and method
US9955038B2 (en) Image processing apparatus, image processing method, and program
US8421819B2 (en) Pillarboxing correction
KR101237229B1 (ko) 콘텐츠 처리 장치 및 콘텐츠 처리 방법
KR100866201B1 (ko) 멀티미디어 휴대형 단말기 사용자를 위한 관심 영역의 추출방법
JP2007274154A (ja) 映像分割装置、テロップ抽出装置、方法およびプログラム
JP2004364234A (ja) 放送番組内容メニュー作成装置及び方法
JP2007288759A (ja) ビデオ番組の処理方法、関連装置及び関連媒体
JPH08212231A (ja) 字幕検出方法および動画像の代表画像抽出装置
KR20070093601A (ko) 복수개의 크로마키 색을 이용한 영상 출력 장치 및 방법
CN112000908A (zh) 图片加载方法、装置、系统、电子设备及可读存储介质
JP2008046608A (ja) ビデオウィンドウ検出器
JP2020141273A (ja) コマーシャル検出装置
JP4244584B2 (ja) 重要画像検出装置、重要画像検出方法、プログラム及び記録媒体並びに重要画像検出システム
US20070061727A1 (en) Adaptive key frame extraction from video data
JP2007149095A (ja) 動画像の変化点検出方法及び装置
CN114079815B (zh) 字幕保护方法、系统、终端设备及存储介质
US20040246259A1 (en) Music program contents menu creation apparatus and method
US7319468B2 (en) Image display apparatus
JP5424737B2 (ja) 画像再生装置
JP3024574B2 (ja) 動画像検索装置
JP4613941B2 (ja) 文字表示領域検出装置及びその方法、並びに携帯端末
JP3624677B2 (ja) 動画像の特殊効果検出装置及びプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230414

R150 Certificate of patent or registration of utility model

Ref document number: 7268848

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150