JP2007267121A - Cm検出装置 - Google Patents

Cm検出装置 Download PDF

Info

Publication number
JP2007267121A
JP2007267121A JP2006090501A JP2006090501A JP2007267121A JP 2007267121 A JP2007267121 A JP 2007267121A JP 2006090501 A JP2006090501 A JP 2006090501A JP 2006090501 A JP2006090501 A JP 2006090501A JP 2007267121 A JP2007267121 A JP 2007267121A
Authority
JP
Japan
Prior art keywords
time
detected
change
block
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006090501A
Other languages
English (en)
Other versions
JP4547678B2 (ja
Inventor
Shin Nakade
慎 中手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2006090501A priority Critical patent/JP4547678B2/ja
Publication of JP2007267121A publication Critical patent/JP2007267121A/ja
Application granted granted Critical
Publication of JP4547678B2 publication Critical patent/JP4547678B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】CMを含んだ番組を受信/または再生する際に、それぞれの番組中のCM部分を自動的に、極めて高精度で検出可能なCM検出装置を提供する。【解決手段】CM検出装置を、音声信号の音量の谷部を無音区間として検出する無音区間検出部112と、検出した無音区間を所定の条件によって選択する無音区間選択部115と、映像信号の画像間の相関値によってショットチェンジを検出するショットチェンジ検出部111と、検出した各無音区間内に、ショットチェンジが含まれた場合、この含まれたショットチェンジ部をCMチェンジ候補として検出するCMチェンジ候補検出手段113と、検出されたCMチェンジ候補からCMブロック候補を検出するCMブロック候補検出手段114と、検出したCMブロック候補を、番組情報を用いて真のCMブロックか否かを決定するCMブロック決定手段114とで実現する。
【選択図】図1

Description

本発明は、CMを含んで放送される番組コンテンツを受信する際、またはCMを含んで録画された番組コンテンツを再生する際に、それぞれの番組コンテンツ中のCM部分を、自動的に検出するCM検出装置に関するものである。
ビデオディスクレコーダー(VDR)等の番組記録再生装置で番組コンテンツを録画する場合、通常は番組コンテンツ中に挿入されるコマーシャル(以下CMと呼ぶ)も同時に録画される。しかし、CMは番組本編とは関係の無い内容であるため、本編のみを連続して観たいというユーザーニーズがある。このユーザーニーズに対応するため、録画する番組コンテンツ中のCM区間を自動的に検出し、そのCM区間をカットして録画したり、検出したCMと番組本編との切り替り位置にチャプターを打ち、このチャプターを基にCM区間をスキップして再生したりする機能を持つ番組記録装置が存在する。
従来のCM検出技術としては、例えば特許文献1に記載されているような、モノラルモードと音声多重モードという音声モードの違いを検出する方法がある。この方法は、番組本編はモノラルモードで放送されることが多く、CMは音声多重モードで放送されることが多いことに着目したもので、音声多重モードで放送される区間をCM区間として検出する。しかし、近年は番組本編も音声多重モードで放送される番組コンテンツが増えてきているために、この方法が有効となるケースが少なくなっているという問題がある。
上記問題を解決するために、音声モードの違いを用いなくてもCMを検出できる方法として、例えば特許文献2に記載の方法が提案されている。この方法は、無音区間およびショットチェンジを利用したCM区間検出法である。CMを伴う番組コンテンツを放送する場合、一般的に番組本編とCMとの切り替り時点やCM同士の切り替り時点に10〜20ms程度の無音の区間をつけて放送するケースが多い。また、1つのCMの放送時間は15秒、30秒等、一般的に15秒の整数倍にするケースが多い。特許文献2に記載の方法は、これらの放送上の特徴に着目し、無音区間とショットチェンジとを検出することによってCM区間を推定するという提案である。具体的には、無音区間とショットチェンジとが同時に発生したと判断した時点から、次に無音区間とショットチェンジとが同時に発生したと判断する時点までの秒数が、CM放送秒数として予め定められた秒数(15秒の整数倍)と一致した場合にCM候補と判定するものである。
ショットチェンジとは、「ショット(カメラの切り替えなどにより物理的に区切られた映像)」の切り替りのことである。このショットチェンジには「シーン(意味的に区切られた映像)」の切り替りであるシーンチェンジも含まれる。
特許第2858758 特開平10-224722
しかしながら、特許文献2に記載の方法では、CMではなく番組本編の中で無音区間とショットチェンジが同時に発生し、かつ、その発生間隔が15秒の整数倍であった場合、そのすべての区間をCMとして検出してしまう。そのため、例えば30分の番組コンテンツ中に、本来検出すべきCM区間以外にも、番組本編中に上記した条件に合致した区間をCM区間として誤検出してしまうという課題が残る。
また、CMには15秒の整数倍の放送時間の通常のCMの他に、5秒とか10秒という短い放送時間の番組宣伝CMもある。この番組宣伝CMも、番組本編とは無関係の場合が多いので、通常のCMと同様に検出することが望ましいが、特許文献2に記載の方法では検出することができないという課題がある。
本発明は、上記課題を鑑みてなされたものであり、従来の技術よりも、より正確なCM区間の検出が可能なCM検出装置を提供することを目的とする。
そこで上記課題を解決するために本発明は、下記の装置を提供するものである。
(1)所定単位時間の倍数として予め定められている放送時間を有するCMが挿入されている、映像信号と音声信号とで構成される1つ以上の番組コンテンツと、この番組コンテンツの放送チャンネル、放送時間、ジャンルを含む番組情報とが放送又は録画されたコンテンツから、1つ以上の前記CMからなるCMブロックの前記コンテンツへの挿入期間であるCM挿入期間の開始時刻と挿入終了時刻とを検出するCM検出装置において、
前記番組情報を記憶する番組情報保持手段と、(125)
前記コンテンツのうちの音声信号を、所定期間に設定された監視窓に逐次入力させ、この監視窓内での音声信号の音量の変化による谷部を検出し、この谷部を検出した時刻を中心時刻とする前後の所定期間を無音区間として検出すると共に、その谷部の音量をその無音区間の最小音量として検出する無音区間検出手段と、(112)
前記番組情報保持手段から前記コンテンツに含まれる各番組コンテンツ毎の番組情報のうちのジャンルを取得すると共に、前記無音区間検出手段で検出した全ての前記無音区間の最小音量を参照し、その最小音量の小さい方から順番に、それぞれ直近の最小音量の大きい方から小さい方への最小音量の差分値を算出していき、この差分値が、前回までに算出した差分値のうちの最も大きい差分値に対して、予め番組のジャンル毎に設定されている倍率以上の値になる差分値が検出された場合は、この検出された差分値を算出した最小音量間の中間値を閾値として検出し、前記最大倍率での差分値が検出されなかった場合は、前記閾値が検出されるまで前記倍率を漸次小さくして前記閾値の検出処理を繰り返し行って、前記閾値を検出し、この検出した閾値よりも小さい最小音量を有する各無音区間を選択する無音区間選択手段と、(115)
前記選択した無音区間の最小音量と中心時刻とをそれぞれ記憶する無音区間情報保持手段と、(122)
前記コンテンツのうちの映像信号を構成する各画像において、連続する前後の画像間の相関の度合いを示す相関値を算出し、この算出した相関値が予め決定している所定値を下回った時点をショットチェンジとして検出するショットチェンジ検出手段と、(111)
前記ショットチェンジを検出した時刻であるショットチェンジ検出時刻を記憶するショットチェンジ情報保持手段と、(121)
前記無音区間情報保持手段に記憶されている各無音区間の中心時刻を読み出すと共に、前記ショットチェンジ情報保持部に記憶されているショットチェンジ検出時刻を読み出して、読み出した前記各中心時刻から得られる各無音区間内に、前記ショットチェンジ検出時刻が含まれた場合、この含まれたショットチェンジ検出時刻をCMチェンジ候補時刻として検出し、このショットチェンジ検出時刻が含まれた無音区間の最小音量をCMチェンジ候補音量として検出するCMチェンジ候補検出手段と、(113)
検出した前記CMチェンジ候補時刻と前記CMチェンジ候補音量とをCMチェンジ候補情報として記憶するCMチェンジ候補情報保持手段と、(123)
検出された前記CMチェンジ候補時刻のうち一のCMチェンジ候補時刻から、前記CM挿入期間分経過した時刻が、他のCMチェンジ候補時刻と一致した場合に、その一のCMチェンジ候補時刻から他のCMチェンジ候補時刻までの期間をCMブロックとして検出するCMブロック検出手段と、(414)
前記CMブロック検出手段により検出されたCMブロックの開始時刻と終了時刻とをCMブロック情報として記憶するCMブロック情報保持手段と、(124)
を有することを特徴とするCM検出装置。
(2)所定単位時間の倍数として予め定められている放送時間を有するCMが挿入されている、映像信号と音声信号とで構成される1つ以上の番組コンテンツと、この番組コンテンツの放送チャンネル、放送時間、ジャンルを含む番組情報とが放送又は録画されたコンテンツから、1つ以上の前記CMからなるCMブロックの前記コンテンツへの挿入期間であるCM挿入期間の開始時刻と挿入終了時刻とを検出するCM検出装置において、
前記番組情報を記憶する番組情報保持手段と、(125)
前記コンテンツのうちの音声信号を、所定期間に設定された監視窓に逐次入力させ、この監視窓内での音声信号の音量の変化による谷部を逐次検出し、この谷部を検出した時刻を中心時刻とする前後の所定期間を無音区間として検出すると共に、その谷部の音量をその無音区間の最小音量として検出する無音区間検出手段と、(112)
前記番組情報保持手段から前記コンテンツに含まれる各番組コンテンツ毎の番組情報のうちのジャンルを取得すると共に、前記無音区間検出手段で検出した全ての前記無音区間の最小音量を参照し、その最小音量の小さい方から順番に、それぞれ直近の最小音量の大きい方から小さい方への最小音量の差分値を算出していき、この差分値が、前回までに算出した差分値のうちの最も大きい差分値に対して、予め番組のジャンル毎に設定されている倍率以上の値になる差分値が検出された場合は、この検出された差分値を算出した最小音量間の中間値を閾値として検出し、前記最大倍率での差分値が検出されなかった場合は、前記閾値が検出されるまで前記倍率を漸次小さくして前記閾値の検出処理を繰り返し行って、前記閾値を検出し、この検出した閾値よりも小さい最小音量を有する各無音区間を選択する無音区間選択手段と、(115)
前記選択した無音区間の最小音量と中心時刻とをそれぞれ記憶する無音区間情報保持手段と、(122)
前記コンテンツのうちの映像信号を構成する各画像において、連続する前後の画像間の相関の度合いを示す相関値を算出し、この算出した相関値が予め決定している所定値を下回った時点をショットチェンジとして検出するショットチェンジ検出手段と、(111)
前記ショットチェンジを検出した時刻であるショットチェンジ検出時刻を記憶するショットチェンジ情報保持手段と、(121)
前記無音区間情報保持手段に記憶されている各無音区間の中心時刻を読み出すと共に、前記ショットチェンジ情報保持部に記憶されているショットチェンジ検出時刻を読み出して、読み出した前記各中心時刻から得られる各無音区間内に、前記ショットチェンジ検出時刻が含まれた場合、この含まれたショットチェンジ検出時刻をCMチェンジ候補時刻として検出し、このショットチェンジ検出時刻が含まれた無音区間の最小音量をCMチェンジ候補音量として検出するCMチェンジ候補検出手段と、(113)
検出した前記CMチェンジ候補時刻と前記CMチェンジ候補音量とをCMチェンジ候補情報として記憶するCMチェンジ候補情報保持手段と、(123)
検出された前記CMチェンジ候補時刻のうち一のCMチェンジ候補時刻から、前記CM挿入期間分経過した時刻が、他のCMチェンジ候補時刻と一致した場合に、その一のCMチェンジ候補時刻から他のCMチェンジ候補時刻までの期間をCMブロック候補として各番組コンテンツ毎に検出するCMブロック候補検出手段と、(114)
前記番組情報保持手段から前記CMブロック候補を検出した各番組コンテンツ毎の番組情報を取得して、この取得した番組情報のうちの放送チャンネル、放送時間、ジャンルの組み合わせによって前記各番組コンテンツに挿入されるべきCMブロックの個数上限、各CMブロックの時間上限、各CMブロックのトータル時間上限を類推し、これらの各上限値を、前記各番組コンテンツのうち一の番組コンテンツで検出したCMブロック候補の個数、各CMブロック候補の時間、各CMブロック候補のトータル時間のうち少なくとも1つが超えている場合に、各CMブロック候補内のCMチェンジ候補音量を基にして、予め決定してある優先順位に従って、前記上限値を越えたもの対して、その上限値を超えないように各CMブロック候補を削除または時間を削減して前記一の番組コンテンツ内のCMブロックを決定するCMブロック決定手段と、(114)
前記CMブロック決定手段により決定されたCMブロックの開始時刻と終了時刻とをCMブロック情報として記憶するCMブロック情報保持手段と、(124)
を有することを特徴とするCM検出装置。
本発明のCM検出装置によれば、受信/または再生されるあらゆる番組コンテンツにおいて、誤検出の極めて少ないCM検出を行なうことができるという効果を得ることができる。
また音量の平均値等から閾値を計算する必要がなくなるため、リアルタイムでの無音部検出が可能となり、従来例と比較して、使用メモリを減らすことができる効果がある。
また、無音区間中にショットチェンジが起こった時刻をCMチェンジ候補とし、この間隔によってCMブロック候補を検出することで、無音区間の間隔によりCM候補を検出し、その後でショットチェンジにCM候補を取捨選択する特許文献2に記載の従来例よりも、CMブロック候補検出にかける処理量を低減することができる。
本発明のCM検出装置の実施の形態を以下に詳細に説明する。
<全体構成>
図1は、本発明のCM検出装置の実施の形態の構成例を示すブロック図である。
このCM検出装置100は、放送番組コンテンツ受信装置200、または録画コンテンツ再生装置300から出力される、映像信号、音声信号、及びこの映像信号と音声信号に対応する番組コンテンツの放送時間、ジャンル等を示す番組情報を入力とするものである。
ショットチェンジ検出部111は、入力された映像信号の各フレームの特徴量によって、ショットの切り替りであるショットチェンジを検出する。そして、このショットチェンジを検出した時刻であるショットチェンジ時刻を、ショットチェンジ情報としてショットチェンジ情報保持部121に記録する。
無音区間検出部112は、入力された音声信号の音量によって、無音区間を検出する。そして、この無音区間の中心となる位置の時刻を無音区間検出時刻として記憶しておく。ここで検出する「無音区間」とは、音量が0である真の「無音」の区間ではなく、予め設定している条件に合致した、小音量の区間のことである。
番組情報保持部125は、入力された番組情報を記録する。
無音区間選択部115は、無音区間検出部112で検出した無音区間の中から、番組本編とCMとの切り替り位置であるCMチェンジ位置で発生したと予想される無音区間を、番組情報保持部125に記録されている番組情報を用いて選択する。そして、この選択した無音区間の無音区間検出時刻と、この無音区間での最小音量とを無音区間情報として無音区間情報保持部122に記録する。
CMチェンジ候補検出部113は、ショットチェンジ情報保持部121に記録されているショットチェンジ時刻と、無音区間情報保持部122に記録されている無音区間検出時刻及び最小音量とから、CM同士、又はCMと番組本編との切換わりと予想されるCMチェンジ候補を検出する。そして、CMチェンジ候補を検出した無音区間の無音区間検出時刻をCMチェンジ候補時刻とし、同様にこの無音区間での最小音量をこのCMチェンジ候補の音量とし、このCMチェンジ候補時刻とCMチェンジ候補の音量とをCMチェンジ候補情報としてCMチェンジ候補情報保持部123に記録する。
CMブロック候補検出部114は、CMチェンジ候補情報保持部123に記録されているCMチェンジ候補情報を用いて、単体のCM、又は連続する複数のCMが放送される区間であるCMブロック候補を検出する。
CMブロック決定部116は、番組情報保持部125に記録されている番組情報を用いて、CMブロック候補検出部114で検出されたCMブロック候補から、真のCMブロックであると推定されるものを決定し、この決定したCMブロック候補をCMブロックとして決定する。
CMブロック情報保持部124は、CMブロック決定部116で決定されたCMブロックの開始時刻及び終了時刻の情報を記録する。
以上が本実施例のCM検出装置の概略構成である。
[各部の詳細]
次に、上記で説明した構成の各部の詳細について説明する。
<ショットチェンジ検出部111>
ショットチェンジ検出部111では、入力される映像信号の連続するフレーム間でのショットの切り替りであるショットチェンジを検出し、このショットチェンジを検出した時刻を取得する。
ショットチェンジの検出方法としては、連続する2枚のフレームの相関を用いる方法がある。通常の動画の場合、連続する2枚のフレーム間には強い相関があるが、ショットチェンジが発生すると、そのショットチェンジの前後のフレームには相関が無くなるか若しくは非常に弱くなる。この相関の強弱の変化に着目し、この相関の度合いを表す相関値を算出してこの値によってショットチェンジを検出する。
なお、フレームとは動画における1枚の画像を構成する単位を示す意味あいで使用しており、インターレース方式におけるフィールドもフレーム(画像)と同義である。
相関値の算出方法には、例えば
(1)各フレームの信号レベルのヒストグラムの相関を使う方法。
(2)それぞれのフレームの各画素について差分をとり、その積分値を相関値にする方法。
(3)それぞれのフレームを複数の領域に分け、各領域での相関を計算し多数決をとる方法。
などがある。
本実施例では(1)の方法を用いてショットチェンジを検出する場合を説明するが、もちろん(2)(3)の方法を用いても良い。
フレーム内の全画素を用いると計算量が多くなるため、フレーム内の画素を、例えば横方向に20画素おき、縦方向に10画素おきに間引いてサンプリングし、このサンプリングした各画素の色相のレベル及び輝度のレベルを算出する。
色相レベルを36段階に分割し、各段階のレベルの範囲内の色相レベルを有する画素の個数を度数とする色相ヒストグラムを作成する。同様に輝度レベルを32段階に分割し、輝度ヒストグラムを作成する。
この色相ヒストグラムと輝度ヒストグラムについて、連続する2枚のフレームであるFlaとFlbとの相関値を算出する。相関値は下記数式1で求められる。
Figure 2007267121
R :ヒストグラムa(Fla)とヒストグラムb(Flb)との相関値
a(i):ヒストグラムaの要素iの度数
b(i):ヒストグラムbの要素iの度数
n :ヒストグラムa,bの要素数

上記数式1で算出した2枚のフレーム間の色相または輝度のいずれかの相関値が、予め決定した閾値以下であった場合、この2枚のフレーム間でショットチェンジが起こったと判断する。
なお、上記のように、フレーム内の全画素ではなく、間引いてサンプリングした画素のみで相関値を算出した場合でも、ショットチェンジの検出精度としては、全画素を使用した場合に比べてほとんど劣らないことは、詳細な実験によって確認済みである。
<無音区間検出部112>
無音区間検出部112では、入力された音声信号の音量によって、無音区間を検出する。番組本編とCMとの切り替り目、及びCM同士の切り替り目では、音量が非常に低くなる極短い区間が発生することに着目して、この音量が低下する区間を無音区間として検出する。このように、本実施例の説明で使用する「無音区間」とは、音量が0である真の「無音」の区間ではなく、上記で述べたように非常に音量が低くなる区間のことを示す。
番組本編とCMとの切り替り目、及びCM同士の切り替り目の無音区間は、一般的に数100ミリ秒程度である。従って特許文献2に記載の方法のように、録画する番組コンテンツの最初から最後まですべての音声信号を記録し、番組終了後に無音区間を検出する方法では、100ミリ秒単位で音声信号をサンプリングし、そのサンプリングポイントでの音声信号の音量のデータを記録しておく必要がある。しかし、番組の開始から終了までにわたって、100ミリ秒単位でサンプリングした音量データを記録するのは、計算速度の点においても、メモリ使用量の点においても、効率が悪い。また、単純に閾値を設け、音量が閾値より低くなった区間を無音区間とする方法では、ノイズが発生した場合、このノイズが原因で音量があまり低くならず、正確な無音区間を検出できないという課題がある。
そこで、本実施例では、連続してサンプリングした音声信号の音量の変化を監視して、その変化の軌跡が谷状態になった部分の音量データのみを保持するようにした。この方法によれば、音量の絶対値に関係なく、相対的に谷部となった部分を無音区間として検出することができる。
図2はこの谷部検出手法の動作アルゴリズムのイメージを示す図である。
この谷部検出は、図2に示すとおり、Sliding Windowを用いて行なう。
Sliding Windowは、所定区間(窓:Window)を有し、この所定区間内でサンプリングされた音声信号のそれぞれの音量を比較する監視窓である。そして、図2に示すようにこの窓を右方向に移動(Sliding)させる。なお、図2ではこのSliding Window内で音声信号をサンプリングする数は簡単のために3個としている。
なお、図2ではイメージがわかり易いようにSliding Windowが移動するような表現になっているが、実動作おいては、Sliding Windowが移動するわけではない。
Sliding Windowは、ハードウエア(またはソフトウエア)上のリングバッファとして構成され、このリングバッファに音声信号を入力させることで実現する。つまり、このリングバッファの音声信号入力側が上記したSliding Windowの左端となる。そして、例えば、このリングバッファが保持するサンプリングデータ(音量データ)の個数を10個とし、入力される音声信号をサンプリングする周期を100ミリ秒とすると、このリングバッファが保持する音声信号の時間(所定期間)は100ミリ秒×10個=1000ミリ秒となる。
図2の説明に戻る。
Sliding Windowが、図2に示すようにaからdへスライドするとき、この動作を最小値探索モードとする。この最小値探索モードは、それぞれのSliding Windowの左端(最新のサンプリングデータに相当する)でサンプリングする音声信号の音量と、それ以前にサンプリングされている他の2個の音声信号の音量のうちの最小のものとを比較する動作モードである。
例えばaのSliding Windowの場合は、左端でサンプリングしているAでの音量と、それ以前にサンプリングしているC、Dのうち音量の小さいCとを比較する。このAとCの比較の結果はAの方が大きい。この場合はこの最小値探索モードを継続して、1サンプル分スライドしたbで、同様の比較を行なう。そして同様の比較を繰り返しながらdの位置までSliding Windowがスライドすると、このdの位置では、左端でサンプリングしているDでの音量と、それ以前にサンプリングしているE、Fのうち音量の小さいEとを比較するとAの方が小さくなるように比較結果が変化する。
つまり、図2で明らかなように、dの位置でSliding Windowの左端が音声信号の音量の変化が右下がりから左上がりになる谷部分になると、比較結果が逆になることがわかる。このように最小値探索モードでの比較結果が、左端でサンプリングした音量がそれ以前にサンプリングした音量の最小値以下であると判断した時点を谷部であると判断し、この谷部を中心時刻としてその前後それぞれ50ミリ秒(合計100ミリ秒)の区間を無音区間とする。また、この谷部での音量をこの無音区間での最小音量とする。
そして、以降は最大値探索モードに動作モードを切り換える。
この最大値探索モードは、最小値探索モードとは逆に、それぞれのSliding Windowの左端(最新のサンプリングデータに相当する)でサンプリングする音声信号の音量と、それ以前にサンプリングされている他の2個の音声信号の音量のうちの最大のものとを比較する動作モードである。そして、左端でサンプリングした音量が、それ以前にサンプリングした音量のうち最大の音量以上であると判断されるまで、この最大値探索モードで動作させ、この判断がなされたときの左端でのサンプリング位置が山部であると判断する。
そして、以降は再び最小値探索モードに動作モードを切り換える。
このように最小値探索モードと最大値探索モードとを交互に切り替えることで音声信号の山部及び谷部を検出することが可能となる。
<無音区間選択部115>
無音区間選択部115では、無音区間検出部112で検出されたそれぞれの無音区間での最小音量を比較することで、CM同士の切り替り及びCMと番組本編との切り替りで検出した無音区間と、番組本編中で検出した無音区間とを判別して、CM同士の切り替り区間及びCMと番組本編との切り替り区間での無音区間のみを選択し、この選択した無音区間の最小音量と検出時刻とを無音区間情報保持部122に記録する。
無音区間の選択には以下のような方法を用いる。
CM同士の切り替りやCMと番組本編との切り替りで検出した無音区間の最小音量は、音量が非常に小さい。一方、番組本編中で検出した無音区間の最小音量は、CM同士の切り替り及びCMと番組本編との切り替りで検出した無音区間の最小音量と比較して、一般的に大きい。この最小音量の違いに着目して判別する。
以下にその一例を説明する。検出した無音区間を最小音量低いものから順に並べて、その順番の各ステップ間の最小音量の差分値を取っていくと、このステップ間の最小音量の差分値が、それまでのステップ間の最小音量の差分値に比べて大きくなるステップ間が現れる。この大きくなったステップ間で、CM同士及びCMと番組本編との切り替り区間での無音区間と、番組本編で検出した無音区間とを判別できる。具体的には、最小音量の低いものから順番に各ステップ間の最小音量の差分値を取っていったとき、それまでの差分値のうちのもっとも大きい値に比較して値が2倍以上になったとき、この差分値が2倍以上になったステップ間の中央付近の音量のレベルを閾値として、この閾値よりも最小音量が小さい無音区間をCMチェンジ候補検出に用いる。
上記の例では、判断基準として、差分値がそれまでの最も大きな差分値に比較して2倍以上になったときと、固定的な判断基準としているが、判断方法はこの例に限らず、最初は判断基準を大きな倍率にしておいて、この判断基準での閾値が検出されなかったならば徐々にその倍率を下げていくといった方法も考えられる。
また、番組本編中の最小音量は、アニメ、ニュース、スポーツ等、番組のジャンルによってその音量のレベルに違いがある。従って、番組情報保持部に記憶した番組情報から、現在受信中又は再生中の番組のジャンルを参照し、このジャンルによって、CMチェンジ候補検出に用いる無音区間を検出しても良い。
以下にその具体例を説明する。
通常の場合、放送される番組のジャンル毎に、本編中の無音区間での最小音量の大きさに違いがある。スポーツなどの中継番組やバラエティ番組では、本編中でBGMや人の声がなくなり人間の耳には音が聞こえなくなった状態になっても、実際にはノイズがあるためにさほど音量は下がっていないので、無音区間の最小音量も大きい。
一方、CM同士の切り替りやCMと番組本編との切り替りでは、音量が大きく低下する。
また、アニメ番組やニュース番組では、アニメの音声編集の継ぎ目や、ニュース番組のスタジオとVTRの切り替り時は、CM同士の切り替りやCMと番組本編との切り替り程は最小音量が低下しないが、スポーツなどの中継番組やバラエティ番組での無音区間の最小音量よりは音量のレベルが小さい。
従って、無音区間の選別にこのジャンルの情報を用いると、より精度良く無音区間を選別可能である。
具体的には、ジャンルがアニメの場合は、最初の判断基準の倍率を1.5倍、ニュース、ドキュメンタリーの場合は2倍、その他のジャンルは5倍に設定し、それぞれで閾値が検出されなかった場合、判断基準の倍率を閾値が検出されるまで順次、5倍、2倍、1.5倍、1.2倍と小さくしていく。
<CMチェンジ候補検出部113>
CMチェンジ候補検出部113では、ショットチェンジ情報保持部121と無音区間情報保持部122に記録されている情報とから、CMチェンジであると推定されるCMチェンジ候補を検出する。なお、本実施例で用いるCMチェンジとは、CM同士の切り替りおよびCMと番組本編の切り替りのことと定義する。
CMチェンジは次の二つの特徴を有する。一つはCMチェンジの前後の映像間でショットチェンジが起こること、そしてもう一つはCMチェンジの発生する時点は無音区間に含まれることである。
この二つの特徴に着目してCMチェンジ候補を検出する。
図3はCMチェンジ候補の検出方法を示す図である。図で明らかなように、無音区間中にショットチェンジが発生していたら、その時点は、上記二つのCMチェンジの特徴を満たすので、このショットチェンジはCMチェンジ候補であると推定できる。そしてこのCMチェンジ候補の発生時刻をCMチェンジ候補情報としてCMチェンジ候補情報保持部123に記録する。
<CMブロック候補検出部114>
CMブロック候補検出部114では、CMチェンジ候補情報保持部123に記録されているCMチェンジ候補発生時刻を用いて、CMブロックと推定されるCMブロック候補を検出する。なお、本実施例で用いるCMブロックとは、番組本編からCMに切り替ってから再び番組本編に切り替るまでに放送される1つ以上のCMの放送期間のことと定義する。
CMブロックの時間は、そのブロック内で放送される各CMの放送時間の合計時間となる。従って、この合計時間が、15秒の倍数となることに着目し、1つのCMチェンジ候補の発生時刻から60秒後、30秒後、15秒後、の順にその時刻に一致した時刻CMチェンジ候補が発生するか(又は発生していたか)を調べることでCMブロック候補を検出する。なお、ここで言う「一致」とは、完全一致の意味ではなく、実動作上は当然許容誤差を含んだものである。例えば、通常のCMの場合は、15秒毎にプラスマイナス300ミリ秒の誤差を含み得るので、30秒の場合は、誤差はこの2倍のプラスマイナス600ミリ秒の範囲は誤差範囲である。
CMブロック候補の具体的な検出方法を、図4を用いて説明する。
<A_BLK>
まず、最初のCMチェンジ候補の発生時刻aから60秒後にCMチェンジ候補が発生するか否かを調べる。図4によれば、この時刻においてbなるCMチェンジ候補が発生している。次に、引き続きこのbの時刻から60秒後にCMチェンジ候補が発生するか否かを調べる。図4によれば、この時刻にはCMチェンジ候補が発生しなかったので、次に、CMチェンジ候補情報保持部123に記憶されているCMチェンジ候補の発生時刻情報を参照して、bの時刻から30秒後、15秒後の順に過去に遡った時刻にCMチェンジが発生していたか否かを調べる。図4ではいずれの時刻にもCMチェンジ候補は発生していない。従って、最初に検出したaの時刻から60秒後のbの時刻までをCMブロック候補(A_BLK)として確定する。
<無検出>
次に、bのCMチェンジ候補発生時刻からはCMブロック候補を検出しなかったので、bの直後に発生したcのCMチェンジ候補の発生時刻からCMブロックが検出するか否かを上記と同様に調べる。図4では、このcの時刻からも60秒後、30秒後、15秒後、いずれの時刻においてもCMチェンジ候補は発生していない。
<B_BLK>
次に、cのCMチェンジ候補発生時刻からもCMブロック候補を検出しなかったので、cの直後に発生したdのCMチェンジ候補の発生時刻からCMブロックが検出するか否かを上記と同様に調べる。図4では、このdの時刻から15秒後の時刻においてCMチェンジ候補が発生している。次に、引き続きこのdの時刻から60秒後にCMチェンジ候補が発生するか否かを調べる。図4によれば、この時刻にはCMチェンジ候補が発生しなかったので、次に、CMチェンジ候補情報保持部123に記憶されているCMチェンジ候補の発生時刻情報を参照して、dの時刻から30秒後、15秒後の順に過去に遡った時刻にCMチェンジが発生していたか否かを調べる。図4ではいずれの時刻にもCMチェンジ候補は発生していない。従って、最初に検出したdの時刻から15秒後のeの時刻までをCMブロック候補(B_BLK)として確定する。
<C_BLK>
次に、eのCMチェンジ候補発生時刻からはCMブロック候補が検出しなかったので、eの直後に発生したfのCMチェンジ候補の発生時刻からCMブロックが検出するか否かを上記と同様に調べる。図4では、このfの時刻から30秒後の時刻においてCMチェンジ候補が発生している。次に、引き続きこのfの時刻から60秒後にCMチェンジ候補が発生するか否かを調べる。図4によれば、60秒後のhの時刻に再度CMチェンジ候補が発生している。従って、最初に検出したfの時刻から30秒+60秒=90秒後のhの時刻までをCMブロック候補(C_BLK)として確定する。
<CMブロック決定部116>
CMブロック決定部116では、全てのCMブロック候補が検出された後に、CMブロック候補検出部114で検出した各CMブロック候補が真のCMブロックであるか否かを決定する。また、CMブロック候補検出部114では検出できない番組宣伝CM等の特殊なCMの検出も行う。
このCMブロックの決定には以下のCMの特徴を用いる。
(1)番組本編開始直前、終了直後には5秒間または10秒間の番組宣伝CMが入ることがある。
(2)CMブロックは最短30秒である。
(3)番組宣伝CMが無い限り、CMブロックの長さは15秒の整数倍である。
(4)ほぼすべてのCMブロックは複数のCMの連続により構成される。
以上の特徴から真のCMブロックを検出する。
また、チャンネル毎に決まっている、番組の放送時間の違いやジャンルの違いによる各CMブロックのそれぞれの放送時間の上限(ブロック長上限)や、番組中の挿入される全CMのトータルの放送時間の上限(トータル長上限)を予め決定しておく。そして、これらの上限を超えた場合は、誤検出が起こっていると考え、CMブロックを短縮または削除して誤検出を減らす。
以下の真のCMブロックの判断例を説明する。
現在放送されている各CMブロックの期間は、ほとんど30秒以上なので、20秒以下のCMブロック候補は棄却する。
次に、20秒から40秒の長さとなっているCMブロック候補は、そのCMブロック候補開始時刻の15秒後にCMチェンジ候補が発生していたか否かを調べ、発生していた場合はこのCMブロック候補を真のCMブロックであると判断する。これは上記した特徴(4)によるものである。実際に放送される30秒のCMブロックの多くは15秒のCM2つが連続することにより構成されている。そこで、CMブロック候補開始時刻の15秒後にCMチェンジ候補が発生したか否かを調べることにより、2つ以上のCMが連続したCMブロックであるか否かを決定できる。これにより、偶然に30秒間隔で誤検出したCMチェンジ候補によって検出したCMブロック候補を除外することができる。
同様に、40秒から70秒の長さとなっているCMブロック候補では、そのCMブロック開始時刻から15秒後、30秒後にCMチェンジ候補が発生していたか否かを調べ、どちらにもCMチェンジ候補が発生していなかった場合は、このCMブロック候補は真のCMブロックとは判断せずに除外する。また、70秒以上のCMブロック候補はすべて真のCMブロックとする。これは、70秒以上のCMブロック候補は2つ以上の連続したCMを検出しなければ存在しないためである。
続いて、番組情報保持部125で保持している、現在受信中、または再生中の番組コンテンツに対応する番組情報のうち、番組放送時間、ジャンル、チャンネル等を用いて、各CMブロックのそれぞれの放送時間の上限(ブロック長上限)や、番組コンテンツ中に挿入される全CMのトータルの放送時間の上限(トータル長上限)の条件によりCMブロック候補の短縮、削除を行なう。
番組コンテンツ中に挿入するCMブロックの挿入回数やトータルの放送時間は、放映される番組コンテンツの長さ等によって決められている場合がある。例えばプライムタイム(各放送局が定める午後6時から午後11時までの間の連続した3時間半をいう)では、図5のように、番組コンテンツの長さに対するCMのトータル長上限が日本民間放送連盟の放送基準により定められている。
また、経験的に、午後7時から午後11時における、放送時間が60分のジャンルがドラマの番組コンテンツでは、CMブロックの1回の放送時間のブロック長上限は2分30秒で、挿入される回数は最大4回であることや、放送時間が30分でジャンルがアニメの番組コンテンツでは、CMブロックの1回の放送時間のブロック長上限は2分30秒で、挿入される回数は最大3回であることなどの一定のパターンが確認できる。
<CMブロックの時間による判断>
上記のような条件によって決められた各ブロック長上限よりも放送時間が長いCMブロック候補があった場合には、そのCMブロック候補の開始時刻と終了時刻のうち、それぞれの時刻において、CMチェンジ候補情報保持部123に記録されている各CMチェンジ候補の音量が大きい方の時刻を変更する。開始時刻でのCMチェンジ候補の音量のほうが大きければ、その開始時刻の15秒後、30秒後、60秒後後のうち最も近いCMチェンジ候補の発生時刻に開始時刻を変更する。終了時刻でのCMチェンジ候補の音量のほうが大きければ、その15秒前、30秒前、60秒前のうちもっとも近くにあるCMチェンジ候補の発生時刻に終了時刻を変更する。
この例を図6に示す。最上段部の音量の軸では、各CMチェンジ候補の発生時刻での音量を棒グラフで表わしている。この例では、CMブロックのブロック長上限が150秒と決められている番組コンテンツ中で、長さが180秒のCMブロック候補を検出したとする。従って、CMブロック開始時刻または終了時刻のどちらかのCMチェンジ候補が誤検出していると判断する。
まず、CMブロック開始時刻と終了時刻でのCMチェンジ候補の音量を比較する。図6では、終了時刻での音量の方が開始時刻での音量より大きい。従って、この終了時刻の方が誤検出していると判断し、この終了時刻の15秒前、30秒前、60秒前の順に各CMチェンジ候補が発生しているか否かを調べる。図6では、15秒前にCMチェンジ候補があるので、CMブロック候補の終了時刻をこの時刻に変更する。
しかし、まだCMブロック候補の長さは165秒であり、ブロック長上限である160秒より長いため、まだ誤検出していると判断する。そして、再び、開始時刻と新たに設定した終了時刻での音量を比較する。今回は、開始時刻での音量の方が大きい。従って、この開始時刻の方が誤検出していると判断し、この開始時刻の15秒後、30秒後、60秒後の順に各CMチェンジ候補が発生しているか否かを調べる。図6では、30秒前にCMチェンジ候補があるので、CMブロック候補の開始時刻をこの時刻に変更する。
以上の処理により、CMブロック候補の時間が135秒に短縮され、これを真のCMブロックとする。
<CMブロックの個数による判断>
上記は、各CMブロック候補の時間によって真のCMブロックを判断する例であったが、番組コンテンツ中で検出したCMブロック候補の個数によって真のCMブロックを判断する方法もある。内容を以下に説明する。
1つの番組コンテンツ中で検出したCMブロック候補の個数が、予め決められている上限の個数を超えた場合は、各CMブロック候補を比較し、真のCMブロックではないと判断できる順に上限の個数を超えない数までCMブロック候補を除外していく。
例えば、各CMブロック候補中に含まれるCMチェンジ候補の音量を比較し、もっとも音量が大きいCMチェンジ候補を含むCMブロックを除外すれば良い。
以上の処理により、各CMブロックのブロック長上限とブロックの個数の上限が条件を満たしても、まだ番組全体で挿入されるCMブロックの合計時間がトータル長上限を超える場合がある。この場合は、全CMブロックの開始時点と終了時点のCMチェンジ候補の音量のうち最も音量が大きいものを選び、CMブロックの時間を短縮したのと同じ方法で変更する。
<チャンネルによる判断>
放送チャンネルの特徴によってCM検出方法を変更しても良い。
例えばNHKの放送番組は、本編中にCMが挿入されないため、CMブロック検出を行なうのは番組本編開始前と本編終了後のみでよい。そのため、CMブロック検出対象区間が一つの番組の最初から最後までを含む場合は、最初のCMチェンジが含まれるCMブロックと、最後のCMチェンジが含まれるCMブロックのみ検出すれば良い。
また、通常のCMの前後に5秒あるいは10秒の番組宣伝CMが挿入されることがある。番組宣伝CMと通常のCM、および番組宣伝CMと番組本編との間にもCMチェンジ候補が検出される。この番組宣伝CMを各CMブロックの前後で検出する必要がある。通常のCMにおける放送時間の誤差は数フレームであるが、番組宣伝CMは、その放送時間の誤差が通常のCMよりも大きい。従って、番組宣伝CMを検出する際は、通常のCMブロック候補より検出範囲を広くする。例えば、通常のCMの場合は、CMチェンジ候補の検出間隔の単位を15秒プラスマイナス300ミリ秒の区間として検出するが、5秒間の番組宣伝CMを検出する場合は、5秒プラスマイナス500ミリ秒の区間とする。
<最初及び最後のCMブロック検出対応>
最初に検出されたCMチェンジ候補がCM検出区間の開始から60秒以内にあった場合、番組コンテンツの受信または再生の開始時点から最初のCMチェンジ候補までの区間を、CMブロックと判断する。こうすることで番組コンテンツの受信または再生の開始時点がCMブロックの途中であった場合のCMブロックを検出する。
また、最後に検出されたCMチェンジ候補がCM検出区間の終了から60秒前までの間にあった場合、最後のCMチェンジ候補からCM検出区間の終了までの区間をCMブロックと判断する。こうすることでCMブロックの途中で番組コンテンツの受信または再生が終了したために途中で終わってしまうCMブロックを検出する。
以上の各処理によって決定した真のCMブロックのそれぞれの開始時刻と終了時刻とをCMブロック情報として、CMブロック情報保持部124に記憶する。
[実施例]
以下に上記したそれぞれの検出方法を用いてCMブロックを検出する具体的な実施例を説明する。
<実施例1>
実施例1は、上記した検出方法のうち番組情報を用いない場合の実施例である。
図9はこの実施例1のCM検出装置の構成を示すブロック図である。図1のCM検出装置のブロック図から、番組情報保持部125、無音区間選択部115、CMブロック決定部117を省いたものである。またCMブロック候補検出部114は、処理内容は同一であるが名称をCMブロック検出部414に置き換えている。その他の構成部は図1と同様である。
図7は、ドラマ番組のコンテンツ中のCMブロックを検出する際の、無音区間検出部112により検出された時刻を中心とした無音区間と、ショットチェンジ検出部111により検出されたショットチェンジのうち無音区間内で検出したものを示した表である。
CMチェンジ候補検出部113では、ショットチェンジ情報と無音区間情報からCMチェンジ候補を検出する。CMチェンジ候補はショットチェンジの中で、無音区間内にあるものである。検出したCMチェンジ候補の時刻とその時刻が含まれる無音区間での最小音量をCMチェンジ候補情報保持部123に記録する。
番組中に検出された無音区間は、図7に示すとおり全部で63箇所あるが、ショットチェンジと組み合わせて検出したCMチェンジ候補は半分以下の28箇所に減っている。これにより、CMチェンジ候補の間隔によるCM検出処理の時間短縮や本編誤検出の低減の効果が期待できる。
CMブロック検出部414では、このCMチェンジ候補を用いてCMブロックを検出する。
図8は、図7に対応して検出したCMチェンジ候補からCMブロックを検出する際の関係を表した図である。検出したCMチェンジ候補の時刻を左の列に示し、CMチェンジ候補から検出されるCMブロックを右の列に示す。
以下に図8で示したCMブロック検出の内容を説明する。
まず、00:04のCMチェンジ候補を検出した時点から60秒、30秒、15秒後の順にCMチェンジ候補を探索する。しかし、どの間隔でも検出できないため、次のCMチェンジ候補(02:04)の時点で同様の探索を行なう。ここでも検出はできず、また次のCMチェンジ候補(02:14)の時点で同様の探索を行なう。このCMチェンジ候補の時点では、60秒後の03:14にCMチェンジ候補が検出されたため、このCMチェンジ候補の時点(03:14)で同様の探索を行なう。60秒後にはCMチェンジ候補は検出されないが、30秒後の03:44でCMチェンジ候補が検出される。続いて03:44の60秒、30秒、15秒後にCMチェンジ候補を探索するがここではCMチェンジ候補は検出されない。従って、02:14〜03:14の60秒間と03:14〜03:44の30秒間で連続してCMブロック候補が検出されたため、この二つを合わせて90秒間のCMブロックを検出できたことになる。
上記と同様の処理を行って、16:15〜17:45、26:19〜27:19、28:04〜29:49の合計4つのCMブロックが検出できている。
次に、検出された各CMブロックについて、その前後の番組宣伝CMを検出する。02:14の10秒前である02:04にCMチェンジ候補が存在するため02:04〜02:14を番組宣伝CMとし、02:04〜02:14の10秒間を一つのCMブロックとする。また28:04の5秒前である27:59にCMチェンジ候補が存在するため27:59〜28:04を番組宣伝CMとし、27:59〜29:49を一つのCMブロックとする。
次に、受信中又は再生中の番組コンテンツの最初と最後のCMブロックの検出を行なう。最初のCMチェンジ候補は00:04にある。これはCM検出開始60秒以内であるため番組コンテンツの受信又は再生の開始時点(00:00)から00:04までを途中から始まるCMであるとし、この区間をCMブロックとする。最後のCMチェンジ候補は29:49にある。これは受信中又は再生中の番組コンテンツの終了時点(30:00)から、その60秒前までの間にあるため、29:49〜30:00を途中で終わるCMであるとし、この区間をCMブロックとする。また、このCMブロックは27:59〜29:49のCMブロックと連続しているため、27:59〜30:00までを一つのCMブロックとする。
以上の処理により検出された、番組コンテンツの本編開始前及び終了後に1つずつ、本編中に3つ、合計5つのCMブロックの開始時刻、終了時刻をCMブロック情報保持部125に記録する。
この実施例1によるCM検出装置は、CMブロックの検出精度は、図1のブロック図のCM検出装置には及ばないものの、番組情報を用いないため、指定したCM検出区間が1番組全体ではない場合や、複数の番組を含む場合でもCM検出ができるという利点がある。また、番組情報の無いビデオのダビング映像からでもCMの検出ができるという利点もある。
<実施例2>
実施例2は、上記した検出方法のうちCMチェンジ候補の検出には番組情報を使用し、CMブロックの検出には番組情報を用いない場合の実施例である。
図13はこの実施例2のCM検出装置の構成を示すブロック図である。図1のCM検出装置のブロック図から、番組情報保持部125、無音区間選択部115を省いたものである。またCMブロック候補検出部114は、処理内容は同一であるが名称をCMブロック検出部414に置き換えている。その他の構成部は図1と同様である。
30分のアニメ番組におけるCMブロック検出の動作を例に挙げて説明する。
番組情報保持部125は、チャンネル、番組の放送時間、ジャンル等の番組情報を記録する。
無音区間選択部115は、無音区間検出部22で検出された無音区間からCMチェンジ候補検出に用いるものを選択する。
図10は実施例1でサンプルとしたドラマ番組の無音区間の中心時刻および最小音量を、音量が小さい順に並べた表である。この表によると各無音区間の最小音量が0.00056までは音量の差が0.00001から0.00006までと小さいのに対して、0.00056とその次の0.00085の間の差は0.00029と非常に大きくなっている。この間が番組本編中に検出した無音区間(誤検出した無音区間)と、CMチェンジ候補の無音区間との境目であると判断できる。そこで、この間に閾値を設け、最小音量が0.00056までの無音区間の情報を無音区間情報保持部122に記録する。
この方法により選択された無音区間と、ショットチェンジと合わせることでCMチェンジ候補を検出した結果を図11の表に示す。この表より、選択された無音区間はすべてCMチェンジと一致していることが分かる。よって、選択によりCMチェンジ候補検出の精度が向上したことが確認できる。
次に、図12に実施例1で用いたドラマ番組とは別ジャンルの、アニメ番組の無音区間の中心時刻および最小音量を、音量が小さい順に並べた表を示す。このアニメ番組は、ドラマ番組とは異なり最小音量に大きな差がある部分がない。そこで、番組の放送時間およびジャンルから無音区間の個数の閾値を決定し、音量が低いものから順にその数だけ無音区間の情報を無音区間情報保持部122に記録する。
この実施例2に挙げたCM検出方法により本編部分の無音区間(誤検出した無音区間)を除去することで、本編部分をCMブロックとして誤検出してしまうのを減らすことができる。
<実施例3>
実施例3は、上記した検出方法を全て用いた場合の実施例である。
実施の形態で説明した図1がこの実施例3のCM検出装置のブロック図である。
30分のアニメ番組におけるCM検出の動作を例に挙げて説明する。
CMブロック決定部117は、CMブロック候補から番組ジャンル等の番組情報を用いて真CMブロックの選択を行なう。
図14に、CMブロック候補検出部114が検出した30分のアニメ番組の本編中のCMブロック区間に存在するCMチェンジ候補の発生時刻及びこのCMチェンジ候補が含まれる無音区間での最小音量を示す。図14で判る通り、CMブロック候補検出部114は4個のCMブロック候補を検出している。しかし、30分のアニメ番組には本編中に挿入されるCMブロックは3個までという放送上の特徴がある。従って、番組情報のジャンルを参照することにより、CM検出対象の番組が、アニメ番組であると判れば、検出された4個のCMブロック候補のうち少なくとも1つは本編部分がCMブロック候補として誤って検出されてしまっていると判断できる。
そこで検出された各CMブロック候補に含まれるCMチェンジ候補の音量を比較して、最も音量が大きいCMチェンジ候補を含むCMブロック候補を除外する。4つのCMブロック候補の中ではCMブロック2の09:58でのCMチェンジ候補がもっとも音量が大きいため、このCMブロック2は誤検出されたものとして除外する。
この実施例3によれば、CMブロックの検出精度が極めて高いCM検出装置を実現することができる。

本発明の一実施例を示すブロック図である。 無音区間検出法を説明するための図である。 CMチェンジ候補検出処理例を説明するための図である。 CMブロック検出処理例を説明するための図である。 放送基準により定められたCM量の上限を示す図である。 CMを短縮する処理例を説明するための図である。 無音区間および各無音区間中のショットチェンジの時刻を示す図である。 CMチェンジ候補時刻とCMブロック検出処理例を示した図である。 本発明の一実施例を示すブロック図である。 無音区間検出処理により検出された番組の無音区間を音量順に並べた図である。 CMチェンジ候補時刻とCMブロック検出処理例を示す図である。 無音区間検出処理により検出された番組の無音区間を音量順に並べた図である。 本発明の一実施例を示すブロック図である。 CMブロックの区間内に存在するCMチェンジ候補の時刻および各CMチェンジ候補が含まれる無音区間の音量を示す図である。
符号の説明
100 CM検出装置
111 ショットチェンジ検出部
112 無音区間検出部
113 CMチェンジ候補検出部
114 CMブロック候補検出部
115 無音区間選択部
117 CMブロック決定部
121 ショットチェンジ情報保持部
122 無音区間情報保持部
123 CMチェンジ候補情報保持部
124 CMブロック情報保持部
125 番組情報保持部
200 放送番組コンテンツ受信装置
300 録画コンテンツ再生装置
414 CMブロック検出部




Claims (2)

  1. 所定単位時間の倍数として予め定められている放送時間を有するCMが挿入されている、映像信号と音声信号とで構成される1つ以上の番組コンテンツと、この番組コンテンツの放送チャンネル、放送時間、ジャンルを含む番組情報とが放送又は録画されたコンテンツから、1つ以上の前記CMからなるCMブロックの前記コンテンツへの挿入期間であるCM挿入期間の開始時刻と挿入終了時刻とを検出するCM検出装置において、
    前記番組情報を記憶する番組情報保持手段と、
    前記コンテンツのうちの音声信号を、所定期間に設定された監視窓に逐次入力させ、この監視窓内での音声信号の音量の変化による谷部を検出し、この谷部を検出した時刻を中心時刻とする前後の所定期間を無音区間として検出すると共に、その谷部の音量をその無音区間の最小音量として検出する無音区間検出手段と、
    前記番組情報保持手段から前記コンテンツに含まれる各番組コンテンツ毎の番組情報のうちのジャンルを取得すると共に、前記無音区間検出手段で検出した全ての前記無音区間の最小音量を参照し、その最小音量の小さい方から順番に、それぞれ直近の最小音量の大きい方から小さい方への最小音量の差分値を算出していき、この差分値が、前回までに算出した差分値のうちの最も大きい差分値に対して、予め番組のジャンル毎に設定されている倍率以上の値になる差分値が検出された場合は、この検出された差分値を算出した最小音量間の中間値を閾値として検出し、前記最大倍率での差分値が検出されなかった場合は、前記閾値が検出されるまで前記倍率を漸次小さくして前記閾値の検出処理を繰り返し行って、前記閾値を検出し、この検出した閾値よりも小さい最小音量を有する各無音区間を選択する無音区間選択手段と、
    前記選択した無音区間の最小音量と中心時刻とをそれぞれ記憶する無音区間情報保持手段と、
    前記コンテンツのうちの映像信号を構成する各画像において、連続する前後の画像間の相関の度合いを示す相関値を算出し、この算出した相関値が予め決定している所定値を下回った時点をショットチェンジとして検出するショットチェンジ検出手段と、
    前記ショットチェンジを検出した時刻であるショットチェンジ検出時刻を記憶するショットチェンジ情報保持手段と、
    前記無音区間情報保持手段に記憶されている各無音区間の中心時刻を読み出すと共に、前記ショットチェンジ情報保持部に記憶されているショットチェンジ検出時刻を読み出して、読み出した前記各中心時刻から得られる各無音区間内に、前記ショットチェンジ検出時刻が含まれた場合、この含まれたショットチェンジ検出時刻をCMチェンジ候補時刻として検出し、このショットチェンジ検出時刻が含まれた無音区間の最小音量をCMチェンジ候補音量として検出するCMチェンジ候補検出手段と、
    検出した前記CMチェンジ候補時刻と前記CMチェンジ候補音量とをCMチェンジ候補情報として記憶するCMチェンジ候補情報保持手段と、
    検出された前記CMチェンジ候補時刻のうち一のCMチェンジ候補時刻から、前記CM挿入期間分経過した時刻が、他のCMチェンジ候補時刻と一致した場合に、その一のCMチェンジ候補時刻から他のCMチェンジ候補時刻までの期間をCMブロックとして検出するCMブロック検出手段と、
    前記CMブロック検出手段により検出されたCMブロックの開始時刻と終了時刻とをCMブロック情報として記憶するCMブロック情報保持手段と、
    を有することを特徴とするCM検出装置。
  2. 所定単位時間の倍数として予め定められている放送時間を有するCMが挿入されている、映像信号と音声信号とで構成される1つ以上の番組コンテンツと、この番組コンテンツの放送チャンネル、放送時間、ジャンルを含む番組情報とが放送又は録画されたコンテンツから、1つ以上の前記CMからなるCMブロックの前記コンテンツへの挿入期間であるCM挿入期間の開始時刻と挿入終了時刻とを検出するCM検出装置において、
    前記番組情報を記憶する番組情報保持手段と、
    前記コンテンツのうちの音声信号を、所定期間に設定された監視窓に逐次入力させ、この監視窓内での音声信号の音量の変化による谷部を逐次検出し、この谷部を検出した時刻を中心時刻とする前後の所定期間を無音区間として検出すると共に、その谷部の音量をその無音区間の最小音量として検出する無音区間検出手段と、
    前記番組情報保持手段から前記コンテンツに含まれる各番組コンテンツ毎の番組情報のうちのジャンルを取得すると共に、前記無音区間検出手段で検出した全ての前記無音区間の最小音量を参照し、その最小音量の小さい方から順番に、それぞれ直近の最小音量の大きい方から小さい方への最小音量の差分値を算出していき、この差分値が、前回までに算出した差分値のうちの最も大きい差分値に対して、予め番組のジャンル毎に設定されている倍率以上の値になる差分値が検出された場合は、この検出された差分値を算出した最小音量間の中間値を閾値として検出し、前記最大倍率での差分値が検出されなかった場合は、前記閾値が検出されるまで前記倍率を漸次小さくして前記閾値の検出処理を繰り返し行って、前記閾値を検出し、この検出した閾値よりも小さい最小音量を有する各無音区間を選択する無音区間選択手段と、
    前記選択した無音区間の最小音量と中心時刻とをそれぞれ記憶する無音区間情報保持手段と、
    前記コンテンツのうちの映像信号を構成する各画像において、連続する前後の画像間の相関の度合いを示す相関値を算出し、この算出した相関値が予め決定している所定値を下回った時点をショットチェンジとして検出するショットチェンジ検出手段と、
    前記ショットチェンジを検出した時刻であるショットチェンジ検出時刻を記憶するショットチェンジ情報保持手段と、
    前記無音区間情報保持手段に記憶されている各無音区間の中心時刻を読み出すと共に、前記ショットチェンジ情報保持部に記憶されているショットチェンジ検出時刻を読み出して、読み出した前記各中心時刻から得られる各無音区間内に、前記ショットチェンジ検出時刻が含まれた場合、この含まれたショットチェンジ検出時刻をCMチェンジ候補時刻として検出し、このショットチェンジ検出時刻が含まれた無音区間の最小音量をCMチェンジ候補音量として検出するCMチェンジ候補検出手段と、
    検出した前記CMチェンジ候補時刻と前記CMチェンジ候補音量とをCMチェンジ候補情報として記憶するCMチェンジ候補情報保持手段と、
    検出された前記CMチェンジ候補時刻のうち一のCMチェンジ候補時刻から、前記CM挿入期間分経過した時刻が、他のCMチェンジ候補時刻と一致した場合に、その一のCMチェンジ候補時刻から他のCMチェンジ候補時刻までの期間をCMブロック候補として各番組コンテンツ毎に検出するCMブロック候補検出手段と、
    前記番組情報保持手段から前記CMブロック候補を検出した各番組コンテンツ毎の番組情報を取得して、この取得した番組情報のうちの放送チャンネル、放送時間、ジャンルの組み合わせによって前記各番組コンテンツに挿入されるべきCMブロックの個数上限、各CMブロックの時間上限、各CMブロックのトータル時間上限を類推し、これらの各上限値を、前記各番組コンテンツのうち一の番組コンテンツで検出したCMブロック候補の個数、各CMブロック候補の時間、各CMブロック候補のトータル時間のうち少なくとも1つが超えている場合に、各CMブロック候補内のCMチェンジ候補音量を基にして、予め決定してある優先順位に従って、前記上限値を越えたもの対して、その上限値を超えないように各CMブロック候補を削除または時間を削減して前記一の番組コンテンツ内のCMブロックを決定するCMブロック決定手段と、
    前記CMブロック決定手段により決定されたCMブロックの開始時刻と終了時刻とをCMブロック情報として記憶するCMブロック情報保持手段と、
    を有することを特徴とするCM検出装置。

JP2006090501A 2006-03-29 2006-03-29 Cm検出装置 Expired - Fee Related JP4547678B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006090501A JP4547678B2 (ja) 2006-03-29 2006-03-29 Cm検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006090501A JP4547678B2 (ja) 2006-03-29 2006-03-29 Cm検出装置

Publications (2)

Publication Number Publication Date
JP2007267121A true JP2007267121A (ja) 2007-10-11
JP4547678B2 JP4547678B2 (ja) 2010-09-22

Family

ID=38639651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006090501A Expired - Fee Related JP4547678B2 (ja) 2006-03-29 2006-03-29 Cm検出装置

Country Status (1)

Country Link
JP (1) JP4547678B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011009926A (ja) * 2009-06-24 2011-01-13 Mitsubishi Electric Corp 映像音声記録再生装置
JP2011217144A (ja) * 2010-03-31 2011-10-27 Nec Personal Products Co Ltd Cm検出システム、サーバ、cm検出方法、プログラム及び記録媒体
JP2019125939A (ja) * 2018-01-17 2019-07-25 日本電信電話株式会社 コマーシャル境界判定装置、コマーシャル境界判定方法、及びプログラム
JP2020141273A (ja) * 2019-02-28 2020-09-03 大学共同利用機関法人情報・システム研究機構 コマーシャル検出装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000165796A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2003047031A (ja) * 2001-08-03 2003-02-14 Nec Corp コマーシャル検出方法及び装置
WO2005098818A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 特定番組検出装置及び方法並びにプログラム
WO2005125217A1 (ja) * 2004-06-21 2005-12-29 Mitsubishi Denki Kabushiki Kaisha 動画像符号化装置、動画像記録装置、及び動画像再生装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000165796A (ja) * 1998-11-30 2000-06-16 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2003047031A (ja) * 2001-08-03 2003-02-14 Nec Corp コマーシャル検出方法及び装置
WO2005098818A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 特定番組検出装置及び方法並びにプログラム
WO2005125217A1 (ja) * 2004-06-21 2005-12-29 Mitsubishi Denki Kabushiki Kaisha 動画像符号化装置、動画像記録装置、及び動画像再生装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011009926A (ja) * 2009-06-24 2011-01-13 Mitsubishi Electric Corp 映像音声記録再生装置
JP2011217144A (ja) * 2010-03-31 2011-10-27 Nec Personal Products Co Ltd Cm検出システム、サーバ、cm検出方法、プログラム及び記録媒体
JP2019125939A (ja) * 2018-01-17 2019-07-25 日本電信電話株式会社 コマーシャル境界判定装置、コマーシャル境界判定方法、及びプログラム
JP2020141273A (ja) * 2019-02-28 2020-09-03 大学共同利用機関法人情報・システム研究機構 コマーシャル検出装置
JP7268848B2 (ja) 2019-02-28 2023-05-08 大学共同利用機関法人情報・システム研究機構 コマーシャル検出装置

Also Published As

Publication number Publication date
JP4547678B2 (ja) 2010-09-22

Similar Documents

Publication Publication Date Title
US20030016945A1 (en) Apparatus and method for summarizing video information, and processing program for summarizing video information
US6993245B1 (en) Iterative, maximally probable, batch-mode commercial detection for audiovisual content
US20090279840A1 (en) Image Digesting Apparatus
KR101237229B1 (ko) 콘텐츠 처리 장치 및 콘텐츠 처리 방법
US20090088878A1 (en) Method and Device for Detecting Music Segment, and Method and Device for Recording Data
US7742680B2 (en) Apparatus and method for processing signals
US20020197053A1 (en) Apparatus and method for summarizing video information, and processing program for summarizing video information
US8682132B2 (en) Method and device for detecting music segment, and method and device for recording data
KR20000035766A (ko) 정보 처리 장치, 정보 처리 방법, 및 제공 매체
US7149365B2 (en) Image information summary apparatus, image information summary method and image information summary processing program
EP1459518A1 (en) Family histogram based techniques for detection of commercials and other video content
EP1906661A2 (en) Picture recorder and commercial message detection method
JP2007266653A (ja) コマーシャル検出装置、映像再生装置
JPWO2005124782A1 (ja) Avコンテンツ処理装置、avコンテンツ処理方法、avコンテンツ処理プログラムおよびavコンテンツ処理装置に用いる集積回路
JP4547678B2 (ja) Cm検出装置
US20060263045A1 (en) Video image recording and reproducing apparatus and video image recording and reproducing method
JP4259500B2 (ja) 映像音声記録装置
JP4712812B2 (ja) 記録再生装置
US8234278B2 (en) Information processing device, information processing method, and program therefor
JP5249677B2 (ja) 宣伝区間検出装置及び宣伝区間検出プログラム
JP2007267211A (ja) コマーシャル検出方法およびコマーシャル検出装置並びにコマーシャル検出プログラムが記録された記録媒体
JPWO2007013407A1 (ja) ダイジェスト生成装置、ダイジェスト生成方法、ダイジェスト生成プログラムを格納した記録媒体、およびダイジェスト生成装置に用いる集積回路
JP4840325B2 (ja) 映像音声記録装置
JP4408288B2 (ja) ディジタルダビング装置
US7756390B2 (en) Video signal separation information setting method and apparatus using audio modes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100611

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100624

R151 Written notification of patent or utility model registration

Ref document number: 4547678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees