JP4752855B2 - 情報処理装置および方法 - Google Patents

情報処理装置および方法 Download PDF

Info

Publication number
JP4752855B2
JP4752855B2 JP2008058399A JP2008058399A JP4752855B2 JP 4752855 B2 JP4752855 B2 JP 4752855B2 JP 2008058399 A JP2008058399 A JP 2008058399A JP 2008058399 A JP2008058399 A JP 2008058399A JP 4752855 B2 JP4752855 B2 JP 4752855B2
Authority
JP
Japan
Prior art keywords
section
commercial
scene change
candidate
detection unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008058399A
Other languages
English (en)
Other versions
JP2008228302A (ja
Inventor
太郎 水藤
正志 太田
勝成 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008058399A priority Critical patent/JP4752855B2/ja
Publication of JP2008228302A publication Critical patent/JP2008228302A/ja
Application granted granted Critical
Publication of JP4752855B2 publication Critical patent/JP4752855B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、情報処理装置および方法、並びに記録媒体に関し、特に、テレビジョン放送に含まれるコマーシャルを検出する情報処理装置および方法、並びに記録媒体に関する。
例えば、録画されたテレビジョン放送を再生するとき、本編(番組)だけを連続して見たいというユーザのニーズに対応して、コマーシャル(以下、CMと記述する)を早送りする、いわゆるCMカット機能付きVCR(Video Cassette Recorder)が存在する。
そのようなVCRに用いられているCM検出アルゴリズムは、次に示すような、絶対的な、または大多数のCMが有する特徴に基づくものである。すなわち、各CMの開始時および終了時には0.1乃至2.0秒程度の無音区間が存在する、無音区間には画像のシーンチェンジ点が存在する、各CMの所要時間は15秒の整数倍である、CMは音声多重モードがステレオモードである、等の特徴が確認された場合、その部分がCMとして検出される。
また、欧米におけるテレビジョン放送では、本編とCMの間に、ブラックフレームまたはブルーフレームが存在するという絶対的な条件に基づいてCMが検出されている。
したがって、従来のCM検出アルゴリズムによれば、例えば、音声多重モードがモノラルであるCMのように、上述した特徴が含まれていないCMは検出できない課題があった。
また、従来のCM検出アルゴリズムによれば、本編の中に上述した特徴が含まれていた場合、その部分をCMとして検出してしまう課題があった。
さらに、例えば、CMの所要時間が14秒の整数倍となったり、欧米においてブラックフレームやブルーフレームの挿入が廃止される等、従来のアルゴリズムにおいて用いていたCMの特徴が変更、または廃止された場合、CMを検出することができなくなる課題があった。
また、従来のCM検出アルゴリズムにおける無音区間の検出方法は、ある一定区間の音声の平均レベルを求め、その平均レベルが所定の閾値以下である場合、その区間を無音区間として検出していた。このため、テレビジョン放送の受信状況が悪いとき、すなわち、弱電界で音声信号のS/Nが悪い状況と、弱電界ではないときで無音声区間の検出精度が異なるので、結果的に正確にCMを検出できない課題があった。
また、従来のCM検出アルゴリズムにおけるCMの所要時間の計測は、1秒当たり約30フレームとして、フレーム数をカウントすることにより行われているが、実際の放送においては、数フレーム程度の誤差が生じるので、所要時間を判定する閾値には誤差に対応するあそびが設けられている。したがって、そのあそびに起因して、CMの誤検出、または未検出が発生する課題があった。
さらに、CMと本編の間に5秒程度のテレビ局の宣伝用スポットが放送された場合、そのスポットは視聴者にとってはCMと同様なものであるが、上述したCMの特徴を有していないので検出できない課題があった。
本発明はこのような状況に鑑みてなされたものであり、テレビジョン放送に含まれるCMを確実に検出できるようにするものである。
本発明情報処理装置は、テレビジョン信号を受信する受信手段と、前記受信手段により受信したテレビジョン信号のシーンチェンジを検出するシーンチェンジ検出手段と、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間をコマーシャル候補区間として検出するコマーシャル候補区間検出手段と、隣接する複数の前記コマーシャル候補区間のフレーム数の合計の、コマーシャルの標準的なフレーム数に対する誤差が所定範囲内である場合、複数の前記コマーシャル候補区間をコマーシャルブロックとして判定する判定手段と、前記コマーシャルブロックに挟まれた非コマーシャル区間のフレーム数が閾値以下である場合、前記非コマーシャル区間を含む前記コマーシャルブロックの区間をコマーシャル区間として検出するコマーシャル区間検出手段とを備える。
前記テレビジョン信号の無音区間を検出する無音区間検出手段をさらに設けることができる。この場合、前記コマーシャル候補区間検出手段には、前記無音区間検出手段により検出された無音区間において前記シーンチェンジ検出手段により検出されたシーンチェンジ点により区切られる区間であるシーンチェンジ区間を対象とし、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間を前記コマーシャル候補区間として検出させることができる。
前記非コマーシャル区間は隣接する複数のシーンチェンジ区間から成るようにすることができる。
本発明の情報処理方法は、テレビジョン信号を受信し、受信したテレビジョン信号のシーンチェンジを検出し、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間をコマーシャル候補区間として検出し、隣接する複数の前記コマーシャル候補区間のフレーム数の合計の、コマーシャルの標準的なフレーム数に対する誤差が所定範囲内である場合、複数の前記コマーシャル候補区間をコマーシャルブロックとして判定し、前記コマーシャルブロックに挟まれた非コマーシャル区間のフレーム数が閾値以下である場合、前記非コマーシャル区間を含む前記コマーシャルブロックの区間をコマーシャル区間として検出するステップを含む。
本発明情報処理装置および情報処理方法においては、テレビジョン信号が受信され、受信されたテレビジョン信号のシーンチェンジが検出され、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間がコマーシャル候補区間として検出され、隣接する複数の前記コマーシャル候補区間のフレーム数の合計の、コマーシャルの標準的なフレーム数に対する誤差が所定範囲内である場合、複数の前記コマーシャル候補区間がコマーシャルブロックとして判定され、前記コマーシャルブロックに挟まれた非コマーシャル区間のフレーム数が閾値以下である場合、前記非コマーシャル区間を含む前記コマーシャルブロックの区間がコマーシャル区間として検出される。
本発明によれば、テレビジョン放送に含まれるCMを確実に検出することが可能となる。
本発明を適用したVCRの第1の構成例について、図1を参照して説明する。記録系のチューナ2は、端子1から入力されるテレビジョン放送のRF信号を復調し、得られた映像信号、音声信号、AGC信号、および音声多重モードを示す信号(以下、音声多重モード信号と記述する)を、CM検出回路3に出力する。また、チューナ2は、映像信号および音声信号を遅延回路4に出力する。
CM検出回路3は、チューナ2から入力された信号がCMであるか否かを判定し、その結果に対応し、スイッチ6へ制御信号として0または1を出力する。スイッチ6は、制御信号が1である場合、オフとされ、制御信号が0である場合、オンとされる。
遅延回路4は、CM検出回路3の処理に要する時間(本実施の形態においては、1分間)だけ、チューナ2から入力された映像信号および音声信号を遅延して変調回路5に出力する。変調回路5は、遅延回路4から入力された映像信号および音声信号を、所定の方式(例えば、MPEG2方式)で圧縮符号化し、さらに、所定の変調方法(例えば、EFM変調)で変調し、得られた変調信号をスイッチ6を介して書き込み回路7に出力する。書き込み回路7は、入力された変調信号を磁気テープ8に記録する。
再生系の読み取り回路9は、ユーザから入力されるコマンドに対応して、磁気テープ8に記録されている信号を読み取って復調し、図示せぬモニタに供給する。
なお、映像信号および音声信号を記録する媒体は、磁気テープに限定されるものではなく、光ディスク、光磁気ディスク、ハードディスク、半導体メモリ等であってもかまわない。
図2は、図1のCM検出回路3の第1の構成例を示している。このCM検出回路3において、チューナ2から入力される音声多重モード信号は無音閾値決定部11およびCM候補区間検出部16に供給され、映像信号は遅延部14およびシーンチェンジ検出部15に供給され、音声信号はA/D変換部12に供給され、AGC信号は無音閾値決定部11に供給される。
無音閾値決定部11は、音声多重モード信号、A/D変換部12でデジタル化された音声信号、AGC信号、またはシーンチェンジ検出部15から入力される信号のいずれかを用いて無音区間検出処理に用いられる閾値を演算し、無音区間検出部13に供給する。
無音区間検出部13は、A/D変換部12から入力されるデジタル化された音声信号のレベルと、無音閾値決定部11から供給された閾値を比較することにより、無音区間を検出し、その結果をシーンチェンジ検出部15に出力する。
シーンチェンジ検出部15は、同時に入力される2枚のフレーム画像(現フレームと、遅延部14により1フレーム時間(1/30秒)だけ遅延された前フレーム)を比較して、無音区間におけるシーンチェンジの有無を検出し、その結果をCM候補区間検出部16に出力する。
CM候補区間検出部16は、音声多重モード信号と、シーンチェンジ検出部15から供給されたシーンチェンジの情報をフレーム毎に2値化して、内蔵するメモリに記憶し、その情報に基づいてCM候補区間を検出し、CM候補区間においてはスイッチ6への制御信号として1を出力し、CM候補区間以外においては制御信号として0を出力する。なお、CM候補区間検出部16が内蔵するメモリには、過去1分間の情報を記憶させておく、その場合、内蔵されるメモリの容量は、
60(秒)×30(フレーム)×2(データ)×1(ビット)
となる。
次に、CM検出回路3の動作について、図3のフローチャートを参照して説明する。このCM検出処理は、チューナ2からCM検出回路3に各信号が入力されたときに開始される。ステップS1において、CM検出回路3の無音閾値決定部11は、予め演算した(後述)、無音区間検出処理(ステップS2)に用いられる閾値を無音区間検出部13に出力する。
ここで、無音閾値決定処理の詳細について、図4のフローチャートを参照して説明する。ステップS11において、A/D変換部12は、チューナ2から入力された所定の微少時間の音声信号(アナログ)を、所定のサンプリング周波数、所定の量子化レベルでデジタル化し、得られたデジタル音声信号(例えば、図5(A))を無音閾値決定部11に出力する。無音閾値決定部11は、ステップS12において、A/D変換部12から入力されたデジタル音声信号を、図5(B)に示すように絶対値化し、ステップS13において、絶対値化されたサンプルのレベルの平均値(図5(C))を演算する。
ステップS14において、無音閾値決定部11は、ステップS13で得た平均値と、それまで記憶していた閾値とを比較して、小さい方の値を新たな閾値として記憶する。
ステップS15において、無音閾値決定部11は、全てのチャンネルに対してステップS11乃至S14の処理を実行したか否かを判定し、全てのチャンネルに対して処理を実行していないと判定した場合、ステップS16に進む。ステップS16において、無音閾値決定部11は、チューナ2にチャンネル切換信号を出力する。このチャンネル切換信号に対応して、チャンネルが切り替えられる。
その後、ステップS15において、全てのチャンネルに対して、ステップS11乃至S14の処理を実行したと判定された場合、無音閾値決定処理を終了する。なお、この無音閾値決定処理は、常に所定の間隔(例えば、10分毎)で繰り返して実行される。
なお、無音閾値決定処理の方法は、上述した方法以外にも考えられる。例えば、映像信号は存在するが、音声信号のレベルは確実に0となる、各チャンネルの放送開始時刻、および放送終了時刻において、音声信号を受信し、そのレベルnに所定のオフセット値Δを加えた値n+Δを無音閾値としてもよい。ただし、各チャンネルの放送開始時刻および放送終了時刻は既知であるものとする。
また、チューナ2からのAGC信号を用いて無音閾値を決定してもよい。すなわち、チューナ2からのAGC信号のレベルは、図6に示すように、AGC信号のレベルと音声信号のS/Nは反比例の関係にある。したがって、AGC信号のレベルから音声信号のS/Nを推定すれば、推定されたS/Nに対応する閾値を一意的に決定することができる。
さらに、音声信号のバズ成分は、映像信号の輝度レベルに依存しているので、映像信号の輝度レベルの平均値を用いて無音閾値を決定してもよい。例えば、輝度レベルの平均値が高い場合、音声信号のバズ成分が増加し、結果的に一定期間の音声信号のレベルが高くなるので、閾値を通常よりも高めに設定し、輝度レベルの平均値が低い場合、音声信号のバズ成分が減少し、結果的に一定期間の音声信号のレベルが低くなるので、閾値を通常よりも低めに設定する。なお、映像信号の輝度の平均値YAは、次式のように、シーンチェンジ検出部15で演算する。
A=(ΣDij)/n×m
ただし、i=1乃至n,j=1乃至mであり、Dijは、図7に示すように、音声信号に対応する画像の座標(i,j)画素値である。
さらに、音声多重モード信号に基づいて無音閾値を決定してもよい。すなわち、音声多重モードが2カ国語放送からステレオに切り替わるときの音声信号のレベルを無音閾値としてもよい。
図3に戻る。ステップS2において、無音区間検出部13は、ステップS1で無音閾値決定部11から入力された閾値に基づいて無音区間を検出する。この無音区間検出処理の詳細について、図8のフローチャートを参照して説明する。
ステップS21において、A/D変換部12は、チューナ2から入力された、所定の微少時間の音声信号(アナログ)を所定のサンプリング周波数、および所定の量子化レベルでデジタル化し、得られたデジタル音声信号(例えば、図5(A))を無音閾値決定部11に出力する。無音区間検出部13は、ステップS22において、A/D変換部12から入力されたデジタル音声信号を、図5(B)に示すように絶対値化し、ステップS23において、絶対値化されたサンプルのレベルの平均値(図5(C))を演算する。
ステップS24において、無音閾値決定部11は、ステップS23で得た平均値が、無音閾値決定部11から入力された閾値よりも小さいか否かを判定し、平均値が閾値よりも小さいと判定した場合、ステップS25に進む。ステップS25において、無音区間検出部13は、この区間を無音区間と判定し、その情報をシーンチェンジ検出部15に出力する。
反対に、ステップS24において、平均値が閾値よりも小さくないと判定した場合、ステップS26に進む。ステップS26において、無音区間検出部13は、この区間を無音区間ではない(有音区間である)と判定し、その情報をシーンチェンジ検出部15に出力する。
図3のステップS3にリターンする。ステップS3において、シーンチェンジ検出部15は、入力された前後する2枚のフレームにおけるシーンチェンジを検出し、その結果をCM候補区間検出部16に出力する。このシーンチェンジ検出処理の詳細について、図9のフローチャートを参照して説明する。
ステップS31において、シーンチェンジ検出部15は、無音区間検出部13から入力された情報が無音区間を示すものであるか否かを判定し、入力された情報が無音区間を示す情報であると判定した場合、ステップS32に進む。
ステップS32において、シーンチェンジ検出部15は、入力された前後する2枚のフレーム画像の相関値Eを演算する。具体的には、図10に示すように、遅延部14を介して入力された画像(遅延画像)と、遅延部14を介さずに入力された画像(スルー画像)の対応する画素の画素値の差の絶対値の総和が相関値として次式により演算される。
E=Σ|Dij−Sij|
ただし、Dij,Sijは、それぞれ、遅延画像またはスルー画像の座標(i,j)の画素値を表している。なお、この相関値は、フレーム間の相関の程度が小さいくなると、その値は大きくなり、フレーム間の相関の程度が大きくなると、その値は小さくなる。
ところで、相関値Eを演算する他の方法として、遅延画像とスルー画像の画素値のヒストグラムを用いる方法や、遅延画像とスルー画像を所定のブロックに分割し、ブロック毎に相関値を画素値の差分を求める方法を用いてもよい。
ステップS33において、シーンチェンジ検出部15は、ステップS32で得られた相関値が所定の閾値よりも大きいか否かを判定し、相関値が所定の閾値よりも大きい(フレーム間の相関の程度が小さい)と判定した場合、ステップS34に進む。
ステップS34において、シーンチェンジ検出部15は、入力された前後する2枚のフレーム間にはシーンチェンジが存在すると判定して、その情報をCM候補区間検出部16に出力する。
反対に、ステップS33において、相関値が所定の閾値よりも大きくない(フレーム間の相関の程度が大きい)と判定された場合、ステップS35に進む。
ステップS35において、シーンチェンジ検出部15は、入力された前後する2枚のフレーム間にはシーンチェンジがないと判定して、その情報をCM候補区間検出部16に出力する。
なお、ステップS31において、無音区間を示す情報ではないと判定された場合、その情報がCM候補区間検出部16に出力されて、図3のステップS4にリターンする。
ステップS4において、CM候補区間検出部16は、内蔵するメモリに2値化して記憶している過去1分間のフレーム単位の音声多重モード信号およびシ−ンチェンジ検出部15からの情報に基づいてCM候補区間を判定する。
すなわち、CM候補区間検出部16に内蔵されるメモリには、図11に示すように、音声多重モード信号(Audio_Multi[])については、ステレオモードが1、モノラルモードおよび2カ国語モードが0として記録され、シーンチェンジ検出部15から入力された情報(Scene_Change[]))については、シーンチェンジであるフレームが1、シーンチェンジではないフレームが0として記録されている。
CM候補区間検出部16は、内蔵するメモリを参照し、図12(A)に示すように、シーンチェンジを示す信号が1であるフレーム(シーンチェンジ点)毎に区間(いまの場合、シーンチェンジ区間0乃至10)を区切り、各シーンチェンジ区間を構成するフレーム数を30で除算することにより、その区間の時間を演算する。また、CM候補区間検出部16は、図12(B)に示すように、音声多重モード信号が1である連続するフレームをステレオ区間とする。さらに、CM候補区間検出部16は、図12(C)に示すように、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が15秒の整数倍であり、且つ、ステレオ区間である区間をCM候補区間と判定し、CM候補区間においてはスイッチ6への制御信号として1を出力し、CM候補区間以外においてはスイッチ6への制御信号として0を出力する。
なお、スイッチ6は、この制御信号が1であるときオフとされ、0であるときオンとされるが、スイッチ6には、遅延回路4で1分間だけ遅延されたことにより、CM候補区間検出部16からの制御信号に同期している、変調された映像信号および音声信号が変調回路5から入力されているので、スイッチ6の後段には、本編の映像信号および音声信号だけが供給され、CM候補区間の映像信号および音声信号は供給されない。したがって、磁気テープ8には、テレビジョン放送のうちのCM候補区間を除いた本編だけが記録される。
次に、CM候補区間検出部16の他の動作例について説明する。この動作例は、CMが有する絶対的な特徴ではないが、CMの一般的な傾向(CMにおいてはシーンチェンジが複数回行われる)をCM候補区間の検出条件に追加したものである。
この動作例において、CM候補区間検出部16が内蔵するメモリには、図13に示すように、図11に示した情報に、無音区間検出部13の出力である無音区間を示す情報(No_Sound[])(有音部分は0、無音区間は1)が追加されて記録される。なお、この場合、内蔵されるメモリの容量は、
60(秒)×30(フレーム)×3(データ)×1(ビット)
だけ必要となる。
CM候補区間検出部16は、内蔵するメモリを参照し、図14(A)に示すように、無音区間を抽出し、図14(B)に示すように、シーンチェンジ点を抽出して、図14(C)に示すように、無音区間におけるシーンチェンジ点毎にシーンチェンジ区間(図14(C)の場合、シーンチェンジ区間0乃至10)を区切り、各シーンチェンジ区間を構成するフレーム数を30で除算することにより、その区間の時間を演算する。
また、CM候補区間検出部16は、図14(D)に示すように、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が15秒の整数倍となるようにグループ化し、図14(E)に示すように、音声多重モード信号が1である区間を抽出し、図14(F)に示すように、15秒の整数倍にグループ化され、且つ、ステレオ区間である区間(いまの場合、区間a乃至c、および区間d,e)をCM候補区間と判定する。さらに、CM候補区間検出部16は、図14(G)に示すように、隣接するCM候補区間の両端のCM候補区間(いまの場合、CM候補区間a,c,d,e)におけるシーンチェンジの回数を所定の閾値(例えば、1)と比較して、シーンチェンジの回数が閾値よりも大きいCM候補区間(いまの場合、CM候補区間a,c)をCM区間と判定する。なお、CM候補区間a,cに挟まれているCM候補区間bもCM区間と判定される。
CM候補区間検出部16は、CM区間においてはスイッチ6への制御信号として1を出力し、CM区間ではない区間においてはスイッチ6への制御信号として0を出力する。
次に、CM候補区間検出部16のさらに他の動作例について説明する。この動作例は、CMが有する絶対的な特徴が変更された場合(例えば、CMの時間が15秒の整数倍から、14秒の整数倍に変更された等)、特徴の変更に対応してCM候補区間の判定に用いる基準値を変更するものである。
この動作例において、CM候補区間検出部16は、内蔵するメモリ(図11)を参照し、図15(A)に示すように、シーンチェンジを示す信号が1であるフレーム毎にシーンチェンジ区間(いまの場合、シーンチェンジ区間0乃至10)を区切り、各シーンチェンジ区間を構成するフレーム数を30で除算することにより、その区間の時間を演算する。また、CM候補区間検出部16は、図15(B)に示すように、音声多重モード信号が1である連続するフレームをステレオ区間とする。
ここで、CM候補区間検出部16は、ステレオ区間の時間と、そのステレオ区間に隣接するステレオ区間ではない区間の時間を比較し、ステレオ区間の時間が十分に短い場合、そのステレオ区間(例えば、シーンチェンジ区間1乃至4、シーンチェンジ区間8,9)をCM候補区間と判定する。
次に、CM候補区間検出部16は、CM候補区間(シーンチェンジ区間1乃至4)の合計時間が56秒であることから、CMの時間は7秒単位、14秒単位、または28秒単位のいずれかであると判定し、さらに、CM候補区間検出部16は、シーンチェンジが14秒または28秒の間隔で行われていることから、最終的に、CMの時間が14秒の整数倍であると判定する。
以上のような結果(CMの時間が14秒の整数倍であると判定される)が所定の回数以上連続して得られた場合、CM候補区間検出部16は、CMの時間は14秒の整数倍に変更されたと判定して、以後、14秒の整数倍をCM区間検出の基準値として使用する。
なお、CMが有する絶対的な特徴が変更された場合(上述したようなCM時間の変更や欧米におけるブラックフレーム、ブルーフレーム挿入の廃止等)、変更された絶対的な特徴に対応して変更したCM区間判定用の基準値を、装置外部からCM候補区間検出部16に供給するようにしてもよい。この場合、CM候補区間検出部16においては、CM区間検出用の基準値をフラッシュメモリのような書き換え可能な記録媒体に格納しておけばよい。
次に、CM検出回路3の第2の構成例について、図16を参照して説明する。この構成例は、図2に示した構成例にCMブロック検出部21を追加したものである。CMブロック検出部21は、CM候補区間検出部16で検出された単独のCM候補区間のフレーム数を用いて、本編と本編の間に挟まれた複数のCMからなるCMブロックを検出し、その結果に基づいてスイッチ6へ制御信号を出力する。
この構成例によれば、以下に記述するようなCMの特徴を利用してCMブロックを検出することができる。すなわち、複数のCMが連続して放送される場合、個々のCMとしては標準的なフレーム数に対して5フレーム程度の誤差を有しているが、CMブロック(連続する複数のCM)としては、標準的なフレーム数に対する誤差が3フレーム程度である。例えば、15秒間のCMが4本連続して放送される場合、個々のCMのフレーム数は、450±5(=15×30±5)であるが、CMブロックのフレーム数は、1800±20(=15×4×30±5×4)とはならずに、1800±3となる。
次に、その動作について図17,図18を参照して説明する。CMブロック検出部21は、CM候補区間検出部16が検出した各CM候補区間(図17(A)のシーンチェンジ区間1+2,3,4,8,9)について、そのフレーム数をCM候補区間検出部16から読み出し、隣接するCM候補区間のフレーム数を合計して、その値が上述した誤差の許容範囲(±3)に収まっているか否かを判定する。CMブロック検出部21は、合計したフレーム数が誤差の許容範囲に収まっていると判定した場合、その隣接するCM候補区間をCMブロックであると判定し、反対に、合計したフレーム数が誤差の許容範囲に収まっていないと判定した場合、その隣接するCM候補区間をCMブロックではないと判定する。
いまの場合、図17(D)に示すように、隣接するCM候補区間(シーンチェンジ区間1乃至4)のフレーム数の合計は、1803(=453+446+904)であり、標準的なフレーム数1800(=60秒×30フレーム)に対する誤差(3)は、許容範囲内であるので、隣接するCM候補区間(シーンチェンジ区間1乃至4)は、CMブロックであると判定される。
一方、隣接するCM候補区間(シーンチェンジ区間8,9)のフレーム数の合計は、910(=455+455)であり、標準的なフレーム数900(=30秒×30フレーム)に対する誤差(10)は、許容範囲外であるので、隣接するCM候補区間(シーンチェンジ区間8,9)は、CMブロックではないと判定される。
図18(C)に示すようなCM候補区間がCM候補区間検出部16から入力された場合、CMブロック検出部21は、上述した図17の場合と同様に、シーンチェンジ区間1乃至4(CMブロックAとする)、およびシーンチェンジ区間7乃至10(CMブロックBとする)を、CMブロックであると判定する。
さらに、CMブロック検出部21は、CMブロックA,Bに挟まれたCM候補区間ではない区間(シーンチェンジ区間5,6)のフレーム数をCM候補区間検出部16から読み出して、そのフレーム数(いまの場合、150)が所定の閾値(例えば、300フレーム(10秒))以下である場合、その区間は本編ではなく、ユーザにとってはCMと同様なものであると判断して、前後するCMブロックA,Bに包含する。すなわち、CMブロック検出部21は、図18(D)に示すように、シーンチェンジ区間1乃至10を、1つのCMブロックであると判定する。
なお、CMブロック検出部21は、CMブロックにおいてはスイッチ6への制御信号として1を出力し、CMブロック以外においてはスイッチ6への制御信号として0を出力する。
次に、CM検出回路3の第3の構成例について、図19を参照して説明する。この構成例は、図2に示した第1の構成例にCM特徴量検出部31を追加したものである。CM特徴量検出部31には、前後する2枚のフレーム画像(映像信号)、デジタル化された音声信号、CM候補区間検出部16に内蔵されるメモリに記憶されている情報(図11)、およびCM候補区間検出部16が検出したCM候補区間の情報が供給される。CM特徴量検出部31は、供給される情報が、CMの様々な特徴を有しているか否かを判定し、その結果に基づいて、CM区間を検出する。さらに、CM特徴量検出部31は、検出結果に対応してスイッチ6に制御信号を出力する。
CM特徴量検出部31の動作について、図20のフローチャートを参照して説明する。この特徴量検出処理は、CM候補区間検出部16が検出した各CM候補区間に対して実行される。
ステップS41において、CM特徴量検出部31は、評価値を0に初期化する。ステップS42において、CM特徴量検出部31は、CM候補区間検出部16から入力されたCM候補区間のシーンチェンジ回数をカウントして、シーンチェンジ回数が所定の閾値(15秒当たり5回)以上であるか否かを判定し、計測したシーンチェンジ回数が所定の閾値以上であると判定した場合、評価値に1を加算する。反対に、計測したシーンチェンジ回数が所定の閾値以上ではないと判定された場合、評価値への加算は行われない。この処理は、CMにおいては頻繁にシーンチェンジが行われるという、一般的な特徴に基づくものである。
ステップS42において、CM特徴量検出部31は、CM候補区間の音声信号の周期性を検出する。この音声信号の周期性検出処理は、CMにおいてはBGMが用いられるという、一般的な特徴に基づくものである。
この音声信号の周期性検出処理について、図21のフローチャートを参照して説明する。ステップS61において、CM特徴量検出部31は、図22に示すように、A/D変換部12から入力された音声信号のレベルが所定の閾値以上である点とピークとして検出する(図22(B))。ただし、図22(A)は音声信号をアナログで表示している。
ステップS62において、CM特徴量検出部31は、ステップS61で検出したピークが所定の期間(数秒)よりも長く周期性を有しているか否かを判定する。周期性を判定するには、例えば、FFT(Fast Fourier Transform)を用いてもよいし、単にピークの間隔を計測してもよい。検出したピークが所定の期間よりも長く周期性を有していると判定された場合、ステップS63に進む。
ステップS63において、CM特徴量検出部31は、評価値に1を加算する。
ステップS62において、検出したピークが所定の期間よりも長く周期性を有していないと判定された場合、評価値への加算は行われないので、ステップS63はスキップされる。
図20のステップS44にリターンする。ステップS44において、CM特徴量検出部31は、CM候補区間の音声信号および映像信号の連続性を検出する。この連続性検出処理について、図23のフローチャートを参照して説明する。
ステップS71において、CM特徴量検出部31は、音声信号のピークの周期性が、CM候補区間の95%以上の時間よりも長く継続しているか否かを判定する。ピークの周期性の継続時間の計測については、上述したステップS43で得られた情報を利用する。音声信号のピークの周期性が、CM候補区間の95%以上の時間よりも長く継続していると判定された場合、ステップS72に進む。
ステップS72において、CM特徴量検出部31は、評価値に1を加算する。
ステップS73において、CM特徴量検出部31は、前後する2枚の画像の対応する画素の画素値の差分を演算し、その差分が所定に閾値以下である画素、すなわち、2枚の画像間で動きがない画素を検出する。ステップS74において、CM特徴量検出部31は、ステップS73で検出した画素の画素値のヒストグラムを生成し、その最大値を示す画素値を背景の代表色として検出する。なお、ステップS73,S74の処理は、CM候補区間において、所定の間隔で繰り返し実行される。
ステップS75において、CM特徴量検出部31は、ステップS74で検出した複数の背景の代表色を参照し、同じ画素値が連続して背景の代表色として検出されているか否かを判定する。同じ画素値が連続して背景の代表色として検出されていると判定された場合、ステップS76に進む。
ステップS76において、CM特徴量検出部31は、評価値に1を加算する。
なお、ステップS71において、音声信号のピークの周期性が、CM候補区間の95%以上の時間よりも長く継続していないと判定された場合、評価値に加算を行わないので、ステップS72はスキップされる。
また、ステップS75において、同じ画素値が連続して背景の代表色として検出されていないと判定された場合、評価値への加算は行われないので、ステップS76はスキップされる。
図20のステップS45にリターンする。ステップS45において、CM特徴量検出部31は、画像の再現性を検出する。この再現性検出処理は、例えば、15秒間のケチャップのCMが、緑色の森のシーン(3秒)、青色の空のシーン(2秒)、緑色の森のシーン(2秒)、赤色のケチャップのシーン(3秒)、緑色の森のシーン(2秒)、および、赤色のケチャップのシーン(3秒)で構成されるように、CMにおいては、同じ画像が再現されるという、一般的な特徴に基づくものである。
この画像の再現性検出処理について、図24のフローチャートを参照して説明する。ステップS81において、CM特徴量検出部31は、CM候補区間をシーンチェンジ点で区分する。ステップS82において、CM特徴量検出部31は、ステップS81で区分した各シーンの画素値のヒストグラムを16階調で生成し、最大値を示す画素値を、そのシーンの代表色として検出する。
ステップS83において、CM特徴量検出部31は、CM候補区間において、シーンの代表色が再現されているか(異なるシーンで同じ代表色が検出されているか)否かを判定する。シーンの代表色が再現されていると判定された場合、ステップS84に進む。
ステップS84において、CM特徴量検出部31は、評価値に1を加算する。
なお、ステップS83において、シーンの代表色が再現されていないと判定された場合、評価値への加算は行われないので、ステップS84はスキップされる。
図20のステップS46にリターンする。ステップS46において、CM特徴量検出部31は、図26(A)に示すようなテロップ(字幕)を検出する。このテロップ検出処理は、CMの終了時にはテロップが表示するという、一般的な特徴に基づくものである。
このテロップ検出処理について、図25のフローチャートを参照して説明する。ステップS91において、CM特徴量検出部31は、CM候補区間の終了側の所定の時間(例えば、5秒間)の各フレーム画像において、図26(B)に示すように、等しい画素値をもち、且つ、所定の数よりも多く隣接している画素を検出する。
ステップS92において、CM特徴量検出部31は、図26(C)に示すように、ステップS91で検出した画素と等しい画素値をもつ画素を検索して領域化する。
ステップS93において、CM特徴量検出部31は、ステップS92で得られた領域が時間方向に連続しているか(前後するフレームにも同じ領域が存在するか)否かを判定する。領域が時間方向に連続していると判定された場合、ステップS94に進む。
ステップS94において、CM特徴量検出部31は、画像上の全ての領域の重心を検出し、その重心と領域上の各点との距離の平均値を演算して、さらに、その平均値と所定の閾値とを比較することにより、領域が密集しているか否かを判定する。領域が密集していると判定された場合、ステップS95に進む。
ステップS95において、CM特徴量検出部31は、評価値に1を加算する。
なお、ステップS93において、領域が時間方向に連続していないと判定された場合、評価値への加算は行われないので、ステップS95はスキップされる。
図20のステップS47に戻る。ステップS47において、CM特徴量検出部31は、上述したテロップ検出処理と同様に方法を用いて、CM候補区間の開始から終了までの全区間において、画像上に文字(テロップを含む)が所定の時間よりも長く存在するか否かを判定する。画像上に文字が所定の時間よりも長く存在すると判定された場合、評価値に1が加算される。反対に、画像上に文字が所定の時間よりも長く存在しないと判定された場合、評価値への加算は行われない。なお、この処理は、CMにおいては文字が表示されるという、一般的な特徴に基づくものである。
ステップS48において、CM特徴量検出部31は、CM候補区間の開始点および終了点以外の無音区間の割合を検出する。この無音率検出処理は、CMにおいては無音区間が少ないという、一般的な特徴に基づくものである。無音率検出処理について、図27のフローチャートを参照して説明する。
ステップS101において、CM特徴量検出部31は、CM候補区間検出部16に内蔵されているメモリに記憶されている情報(図11)を読み出して、図28に示すように、CM候補区間の開始点および終了点以外の無音区間のフレーム数を検出する。さらに、CM特徴量検出部31は、江検出した無音区間のフレーム数を、CM候補区間を構成する全フレーム数で除算することにより、無音率を演算する。
ステップS102において、CM特徴量検出部31は、ステップS101で演算した無音率が所定の閾値よりも小さいか否かを判定する。無音率が所定の閾値よりも小さいと判定された場合、ステップS103に進む。
ステップS103において、CM特徴量検出部31は、評価値に1を加算する。
なお、ステップS102において、無音率が所定の閾値よりも小さくないと判定された場合、評価値への加算は行われないので、ステップS103はスキップされる。
図20のステップS49にリターンする。ステップS49において、CM特徴量検出部31は、評価値が所定の閾値よりも大きいか否かを判定し、評価値が所定の閾値よりも大きいと判定した場合、ステップS50に進む。ステップS50において、CM特徴量検出部31は、CM候補区間をCM区間であると判定する。
なお、ステップS49において、評価値が所定の閾値よりも大きくないと判定された場合、ステップS51に進む。ステップS51において、CM特徴量検出部31は、CM候補区間をCM区間ではないと判定する。
この判定結果に対応して、CM特徴量検出部31は、CM区間においてはスイッチ6への制御信号として1を出力し、CM区間以外においてはスイッチ6への制御信号として0を出力する。
以上のように、本実施の形態であるVCR(図1)においては、テレビジョン放送のうちの本編だけが磁気テープ8に録画され、CMは録画されない。したがって、この磁気テープ8を再生した場合、本編だけが連続して表示される。
ところで、CMを再生時には早送りするものの、録画はしておきたいというユーザのニーズが存在するので、そのようなニーズに対応する、本発明を適用したVCRの第2の構成例について、図29を参照して説明する。この構成例は、図1に示した構成例からスイッチ6を削除し、CM検出回路3のCM検出結果を書き込み回路7に供給するようにしたものである。
この構成例の記録系において、書き込み回路7は、変調回路5から入力される全て(テレビジョン放送の本編とCM)の映像信号と音声信号を磁気テープ8に記録とともに、CM検出回路3からの情報に基づいて、磁気テープ8の所定の位置に、CMの関する情報(CMの時間的な位置等)を記録する。
再生系において、読み取り回路9は、ユーザから本編だけを再生するコマンド(CMを除去するコマンド)が入力された場合、磁気テープ9の所定の位置に記録されているCMに関する情報に基づいてCMを除去(早送り等)し、本編だけを復調して図示せぬモニタに供給する。
なお、本発明の適用は、VCRに限定されるものではなく、テレビジョン受像機やチューナ等に適用することが可能である。
また、上記各処理を行うコンピュータプログラムは、磁気ディスク、CD-ROM等の情報記録媒体よりなる提供媒体のほか、インターネット、デジタル衛星などのネットワーク提供媒体を介してユーザに提供することができる。
本発明を適用したVCRの第1の構成例を示すブロック図である。 図1のCM検出回路3の第1の構成例を示すブロック図である。 CM検出回路3の動作を説明するフローチャートである。 図2の無音閾値決定部11の処理を説明するフローチャートである。 図2の無音閾値決定部11の動作を説明するための図である。 図2の無音閾値決定部11の動作を説明するための図である。 図2の無音閾値決定部11の動作を説明するための図である。 図3のステップS2の無音区間検出処理を説明するフローチャートである。 図3のステップS3のシーンチェンジ検出処理を説明するフローチャートである。 シーンチェンジ検出処理を説明するための図である。 CM候補区間検出部16に内蔵されるメモリに記録されている情報を説明するための図である。 CM候補区間検出部16の処理を説明するための図である。 CM候補区間検出部16に内蔵されるメモリに記録されている情報を説明するための図である。 CM候補区間検出部16の処理を説明するための図である。 CM候補区間検出部16の処理を説明するための図である。 図1のCM検出回路3の第2の構成例を示すブロック図である。 図16のCMブロック検出部21の処理を説明するための図である。 図16のCMブロック検出部21の処理を説明するための図である。 図1のCM検出回路3の第3の構成例を示すブロック図である。 図19のCM特徴量検出部31の動作を説明するフローチャートである。 図20のステップS43の音声信号の周期性検出処理を説明するフローチャートである。 音声信号の周期性検出処理を説明するための図である。 図20のステップS44の連続性検出処理を説明するフローチャートである。 図20のステップS45の再現性検出処理を説明するフローチャートである。 図20のステップS46のテロップ検出処理を説明するフローチャートである。 テロップ転出処理を説明するための図である。 図20のステップS48の無音率検出処理を説明するフローチャートである。 無音率検出処理を説明するための図である。 本発明を適用したVCRの第2の構成例を示すブロック図である。
符号の説明
2 チューナ, 3 CM検出回路, 4 遅延回路, 5 変調回路, 6 スイッチ, 7 書き込み回路, 8 磁気テープ, 9 読み取り回路, 11 無音閾値決定部, 12 A/D変換部, 13 無音区間検出部, 14 遅延部, 15 シーンチェンジ検出部, 16 CM候補区間検出部, 21 CMブロック検出部, 31 CM特徴量検出部

Claims (4)

  1. テレビジョン信号を受信する受信手段と、
    前記受信手段により受信したテレビジョン信号のシーンチェンジを検出するシーンチェンジ検出手段と、
    単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間をコマーシャル候補区間として検出するコマーシャル候補区間検出手段と、
    隣接する複数の前記コマーシャル候補区間のフレーム数の合計の、コマーシャルの標準的なフレーム数に対する誤差が所定範囲内である場合、複数の前記コマーシャル候補区間をコマーシャルブロックとして判定する判定手段と、
    前記コマーシャルブロックに挟まれた非コマーシャル区間のフレーム数が閾値以下である場合、前記非コマーシャル区間を含む前記コマーシャルブロックの区間をコマーシャル区間として検出するコマーシャル区間検出手段と
    を備える情報処理装置。
  2. 前記テレビジョン信号の無音区間を検出する無音区間検出手段をさらに備え、
    前記コマーシャル候補区間検出手段は、前記無音区間検出手段により検出された無音区間において前記シーンチェンジ検出手段により検出されたシーンチェンジ点により区切られる区間であるシーンチェンジ区間を対象とし、単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間を前記コマーシャル候補区間として検出する
    請求項1に記載の情報処理装置。
  3. 前記非コマーシャル区間は隣接する複数のシーンチェンジ区間から成る
    請求項1又は2に記載の情報処理装置。
  4. テレビジョン信号を受信する受信し、
    受信したテレビジョン信号のシーンチェンジを検出し、
    単独のシーンチェンジ区間の時間、または隣接する複数のシーンチェンジ区間の合計時間が所定時間である区間をコマーシャル候補区間として検出し、
    隣接する複数の前記コマーシャル候補区間のフレーム数の合計の、コマーシャルの標準的なフレーム数に対する誤差が所定範囲内である場合、複数の前記コマーシャル候補区間をコマーシャルブロックとして判定し、
    前記コマーシャルブロックに挟まれた非コマーシャル区間のフレーム数が閾値以下である場合、前記非コマーシャル区間を含む前記コマーシャルブロックの区間をコマーシャル区間として検出する
    ステップを含む情報処理方法
JP2008058399A 2008-03-07 2008-03-07 情報処理装置および方法 Expired - Lifetime JP4752855B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008058399A JP4752855B2 (ja) 2008-03-07 2008-03-07 情報処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008058399A JP4752855B2 (ja) 2008-03-07 2008-03-07 情報処理装置および方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP33927498A Division JP4178629B2 (ja) 1998-11-30 1998-11-30 情報処理装置および方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2008228302A JP2008228302A (ja) 2008-09-25
JP4752855B2 true JP4752855B2 (ja) 2011-08-17

Family

ID=39846297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008058399A Expired - Lifetime JP4752855B2 (ja) 2008-03-07 2008-03-07 情報処理装置および方法

Country Status (1)

Country Link
JP (1) JP4752855B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274970A (zh) * 2018-12-04 2019-01-25 深圳市梦网百科信息技术有限公司 一种快速场景切换检测方法和系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5506507B2 (ja) * 2010-03-31 2014-05-28 Necパーソナルコンピュータ株式会社 Cm検出システム、サーバ、cm検出方法、プログラム及び記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3098170B2 (ja) * 1995-05-16 2000-10-16 株式会社日立製作所 記録再生装置,記録再生方法及びコマーシャル判別装置
JP3407840B2 (ja) * 1996-02-13 2003-05-19 日本電信電話株式会社 映像要約方法
JPH10224722A (ja) * 1997-02-07 1998-08-21 Sony Corp コマーシャル検出装置及び検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274970A (zh) * 2018-12-04 2019-01-25 深圳市梦网百科信息技术有限公司 一种快速场景切换检测方法和系统
CN109274970B (zh) * 2018-12-04 2021-02-26 深圳市梦网视讯有限公司 一种快速场景切换检测方法和系统

Also Published As

Publication number Publication date
JP2008228302A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
JP4178629B2 (ja) 情報処理装置および方法、並びに記録媒体
JP4026100B2 (ja) 情報処理装置および方法、並びに記録媒体
JP2000165806A (ja) 情報処理装置および方法、並びに提供媒体
KR100519866B1 (ko) 광고방송검출장치및광고방송검출방법
KR100563746B1 (ko) Tv신호기록방법및장치,tv신호재생방법및장치,tv신호기록재생장치,및기록매체
EP1906661A2 (en) Picture recorder and commercial message detection method
JP2008277967A (ja) 情報処理装置および情報処理方法、プログラム、並びに記録媒体
KR100763685B1 (ko) 방송 신호 기록 재생 장치 및 방법과 기록 매체
JP4752855B2 (ja) 情報処理装置および方法
EP1707002B1 (en) Method and apparatus for controlling the insertion of additional fields or frames into a first format picture sequence in order to construct therefrom a second format picture sequence
US20090269029A1 (en) Recording/reproducing device
JP2000165798A (ja) 情報処理装置および方法、並びに提供媒体
JP4900246B2 (ja) タイムシフト視聴時に即時に提供すべき放送を優先する放送受信装置
US8306392B2 (en) Audio-video recording device
JPH09284706A (ja) 信号処理方法及び装置
JP4000623B2 (ja) 映像信号記録装置及び映像信号記録方法
JP2000165797A (ja) 情報処理装置および方法、並びに提供媒体
US20060187356A1 (en) Video playback apparatus and video playback method
JP4158250B2 (ja) 情報記録再生装置および方法、並びに提供媒体
JP5228623B2 (ja) 放送映像再生方法、システム及び装置
GB2424747A (en) Method of recording and reproducing video and audio stream
KR20050068688A (ko) 요약 재생을 위한 비디오 비트스트림의 기록 및 재생방법과 이를 구현하기 위한 프로그램이 기록된 기록 매체
JP2005354148A (ja) 記録装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term