JP2003032631A - 信号処理装置及び方法、記録媒体、並びにプログラム - Google Patents

信号処理装置及び方法、記録媒体、並びにプログラム

Info

Publication number
JP2003032631A
JP2003032631A JP2001217620A JP2001217620A JP2003032631A JP 2003032631 A JP2003032631 A JP 2003032631A JP 2001217620 A JP2001217620 A JP 2001217620A JP 2001217620 A JP2001217620 A JP 2001217620A JP 2003032631 A JP2003032631 A JP 2003032631A
Authority
JP
Japan
Prior art keywords
signal
character
section
candidate
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001217620A
Other languages
English (en)
Other versions
JP4512969B2 (ja
Inventor
Mototsugu Abe
素嗣 安部
Masayuki Nishiguchi
正之 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001217620A priority Critical patent/JP4512969B2/ja
Publication of JP2003032631A publication Critical patent/JP2003032631A/ja
Application granted granted Critical
Publication of JP4512969B2 publication Critical patent/JP4512969B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 例えばTV放送信号のCM部分を高精度に検
出又は検索可能とする。 【解決手段】 アンテナ6を介しチューナ1にて受信
し、さらに復調器2にて復調されたTV放送信号の音声
及び映像信号から、15,30,60秒間隔で発生する
特徴的パターンに基づいて、CMの候補区間を検出し、
そのCM候補区間内から、例えば、CMには、商品名や
企業名などを表す文字やロゴ、マーク等が画面の中央に
表示され、またその文字がCMの初めの方と、後の方に
表示されているなどの、CMらしさを表わす特徴量を抽
出し、その特徴量に基づきCM区間を検出するCM検出
部4を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、信号処理装置及び
方法、記録媒体、並びにプログラムに関し、特に、テレ
ビジョン放送に付加されるコマーシャルメッセージを適
切に自動的に検出することができる信号処理装置及び方
法、記録媒体、並びにプログラムに関するものである。
【0002】
【従来の技術】一般に、放送番組についてスポンサーが
付いているテレビジョン(以下、適宜TVと称する)放
送では、本編(番組そのもの)の合間に、その番組を提
供しているスポンサーのコマーシャルメッセージ(以
下、単にCMと称する)が挿入される。
【0003】しかしながら、視聴者の興味は、主として
本編にあるため、CMを省略して視聴したいという要望
は多い。
【0004】その一方で、関心のある製品のCMや、ス
トーリー性のあるCM、有名俳優が登場するCMなど、
CM自体を視聴対象とする場合も少なくない。
【0005】このようなことから、特に、磁気テープや
磁気ディスク等の媒体にTV放送番組等を録画する場合
において、放送番組から本編とCMとを分離/区別し
て、必要なときに必要な部分を視聴することが可能とな
れば、上述したような多様な要望に対する有効な解決手
段を与えることになると考えられる。
【0006】ところで、TV放送からCMのみを省略し
て試聴可能とする技術としては、従来より、いわゆるC
Mスキップ機能(広義のCMスキップ機能)が存在し、
例えば家庭用ビデオ録画再生装置には当該CMスキップ
機能が搭載されているものが多い。
【0007】このCMスキップ機能(広義のCMスキッ
プ機能)は、その仕組みに応じて4つに大別され、それ
ぞれ一般には、CM早送り機能、CMカット機能、放送
モードに基づくCMスキップ機能(狭義のCMスキップ
機能)、放送モードによらないCMスキップ機能(狭義
のCMスキップ機能)と呼ばれている。なお、これら4
つに大別されたCMスキップ機能のうち、上記CM早送
り機能とは、日本国内においては通例としてCMが15
秒の倍数で製作されていることを利用し、家庭用ビデオ
録画再生装置でのビデオ再生中に、例えばリモコンボタ
ン操作によって(30秒)×(ボタンを押した回数)の
時間だけ早送りを行うことにより、CM部分を飛ばす機
能である。このCM早送り機能に関する技術について
は、例えば特開平10−269651号公報などに公開
されている。また、特開平9−307841号公報に
は、上記CM早送り機能における早送り終了時刻を時間
で決定せず、映像信号のブラックフレームと音声信号の
無音部が同時に所定長さ以上にわたり生じる部分を、早
送り終了時刻とする技術が公開されている。
【0008】CMカット機能とは、日本国内においては
CMがステレオ放送されることが多く、また、TV放送
信号には音声がモノラルモード/ステレオモード/音声
多重モードの何れであるかを示すパイロット信号が多重
されていることを利用し、例えば音声がモノラルモード
又は音声多重モードとなされている本編を録画するよう
な場合に、ステレオモード区間(すなわちCM区間)の
み録画を停止することで、CM部分をカットすることを
可能にする機能である。このCMカット機能に関する技
術については、例えば特開平3−158086号、特開
平3−2622872号などの公報に公開されている。
【0009】放送モードに基づくCMスキップ機能(狭
義のCMスキップ機能)とは、CMカット機能と同様に
放送モードの違いを利用する仕組みであるが、上記CM
カット機能が録画時にCMをカットしているのに対し、
当該放送モードに基づくCMスキップ機能では、録画時
には全ての映像及び音声を記録すると同時にその放送モ
ードも記録しておき、再生時にステレオ放送区間(すな
わちCM区間)のみ自動的に早送りする機能である。こ
の放送モードに基づくCMスキップ機能に関する技術に
ついては、例えば特開平5−250762号公報などに
公開されている。
【0010】放送モードによらないCMスキップ機能
(狭義のCMスキップ機能)とは、放送信号中に含まれ
る音声信号の無音区間間隔や、映像信号の映像変換点
(映像が急激に変化する点)の出現間隔、映像信号の黒
レベル/白レベルの出現間隔などを利用して、これらが
15秒の倍数間隔に合致する部分をCMとして早送りす
る機能である。当該放送モードによらないCMスキップ
機能に関する技術については、特開平8−317342
号公報や、文献「TV放送のCM検出方式についての一
検討」(映像情報メディア学会技術報告、VIR97-22、19
/23(1997))などに公開されている。
【0011】
【発明が解決しようとする課題】しかしながら、上記C
M早送り機能自体は、家庭用ビデオ録画再生装置にて録
画したTV放送を再生して視聴する視聴者に対して、C
Mかどうかの判断を任せるものであり、TV放送から自
動的にCM部分を検出するようなCM検出機能は備えて
いない。
【0012】また、上記放送モードに基づくCMカット
機能やCMスキップ機能(狭義のCMスキップ機能)で
は、放送モードの違い、すなわち例えばステレオモード
によるCM検出を行うようになされているが、例えば本
編自体がステレオモードとなされている場合や、CMが
モノラルモードや音声多重モードとなっている場合に
は、全く効果がない(すなわちCMカットやCMスキッ
プができない)。
【0013】一方、放送モードによらないCMスキップ
機能(狭義のCMスキップ機能)では、視聴者や放送モ
ードに依存することなく、放送内容に基づいたCM検出
が可能となっている。ただし、当該機能の場合は、音声
信号の無音区間間隔や、映像信号の映像変換点(映像が
急激に変化する点)の出現間隔などが、予め想定されて
いる設定値と一致することなど、非常に狭い条件に基づ
いた決定論的な判定手続きによりCM区間を検出するよ
うになされている。これに対し、実際の放送番組では、
放送時間の調整の目的や人為的なスイッチングなどの要
因によって無音区間間隔が例えば短縮されていたりする
場合が少なからずあり、逆に、番組本編の中にも上記の
条件を満たす区間が多く存在している。このため、無音
区間間隔が予め想定されている長さより短いようなCM
の場合は全く検出ができなくなる問題が発生し、逆に、
上記設定値の条件を満たす本編の場合は当該本編をCM
区間として誤って検出してしまう等の問題点が生じてし
まう。
【0014】さらに、上記4つの機能では、例えば複数
のCMが連続されて放送されている場合には、CM全体
の区間を検出することはできても、個々のCMの検出は
できない。このため、CMを個別に抽出して視聴したい
ような場合(要望)には適さない。
【0015】以上のようなことから、TV放送信号から
CM部分を高精度に検出又は検索できることが望まれて
いる。
【0016】そこで、本発明は、以上のような状況を鑑
みてなされたものであり、例えばTV放送信号に含まれ
るコマーシャルメッセージ部分を適切に検出する、信号
処理装置及び方法を提供することを目的とする。
【0017】
【課題を解決するための手段】本発明の信号処理装置
は、少なくても第1の信号の区間とそれ以外の信号の区
間とが時分割的に存在する入力信号から、所定の時間間
隔を持つ信号の特徴的パターンに基づいて、第1の信号
の候補区間を検出する候補区間検出手段と、候補区間の
信号から、文字を表示する信号を検出する文字検出手段
と、文字検出手段による検出結果に基づいて、第1の信
号らしさを表す特徴量を算出する算出手段と、特徴量に
基づいて、第1の信号の区間を検出する区間検出手段と
を備えることを特徴とする。
【0018】算出手段は、文字検出手段により文字を表
示する信号が検出されたとき、より大きい特徴量を算出
することができる。
【0019】文字検出手段により、文字を表示する信号
が検出されたとき、文字の表示位置を検出する文字表示
位置検出手段をさらに設け、算出手段には、文字表示位
置検出手段により画面中央に文字を表示する信号が検出
されたとき、より大きい特徴量を算出させることができ
る。
【0020】文字検出手段により、文字を表示する信号
が検出されたとき、文字の出現時刻を検出する文字出現
時刻検出手段をさらに設け、算出手段には、文字出現時
刻検出手段により検出された出現時刻が候補区間の始点
または終点付近にあるとき、より大きい特徴量を算出さ
せることができる。
【0021】本発明の信号処理方法は、少なくても第1
の信号の区間とそれ以外の信号の区間とが時分割的に存
在する入力信号から、所定の時間間隔を持つ信号の特徴
的パターンに基づいて、第1の信号の候補区間を検出す
る候補区間検出ステップと、候補区間の信号から、文字
を表示する信号を検出する文字検出ステップと、文字検
出ステップでの検出結果に基づいて、第1の信号らしさ
を表す特徴量を算出する算出ステップと、特徴量に基づ
いて、第1の信号の区間を検出する区間検出ステップと
を含むことを特徴とする。
【0022】本発明の記録媒体のプログラムは、少なく
ても第1の信号の区間とそれ以外の信号の区間とが時分
割的に存在する入力信号から、所定の時間間隔を持つ信
号の特徴的パターンに基づいて、第1の信号の候補区間
を検出する候補区間検出ステップと、候補区間の信号か
ら、文字を表示する信号を検出する文字検出ステップ
と、文字検出ステップでの検出結果に基づいて、第1の
信号らしさを表す特徴量を算出する算出ステップと、特
徴量に基づいて、第1の信号の区間を検出する区間検出
ステップとを含むことを特徴とする。
【0023】本発明のプログラムは、少なくても第1の
信号の区間とそれ以外の信号の区間とが時分割的に存在
する入力信号から、所定の時間間隔を持つ信号の特徴的
パターンに基づいて、第1の信号の候補区間を検出する
候補区間検出ステップと、候補区間の信号から、文字を
表示する信号を検出する文字検出ステップと、文字検出
ステップでの検出結果に基づいて、第1の信号らしさを
表す特徴量を算出する算出ステップと、特徴量に基づい
て、第1の信号の区間を検出する区間検出ステップとを
含む処理をコンピュータに実行させることを特徴とす
る。
【0024】本発明の信号処理装置および方法、並びに
プログラムにおいては、少なくても第1の信号の区間と
それ以外の信号の区間とが時分割的に存在する入力信号
から、所定の時間間隔を持つ信号の特徴的パターンに基
づいて、第1の信号の候補区間が検出され、候補区間の
信号から、文字を表示する信号が検出され、検出結果に
基づいて、第1の信号らしさを表す特徴量が算出され、
特徴量に基づいて、第1の信号の区間が検出される。
【0025】
【発明の実施の形態】先ず、本発明実施の形態の具体的
構成について述べる前に、本発明に基づき、例えばTV
放送信号からCM部分を検出する際の原理について概説
する。
【0026】一般に、TV放送されるCMは、放送者の
指定する規格に基づいて製作されるため、その「時間長
(1つのCMの時間)はごく少数の種類に限定」され
る。例えば日本国内においては、特殊な例を除くほぼ全
てのCMが、15秒、30秒、60秒の長さで製作され
ている。
【0027】また、CMの放送時には、番組本編や他の
CMとは独立に製作されたものがTV放送ストリーム中
に挿入されるため、各CMの前後では必然的に「音声レ
ベルが下がる(すなわち小音量となる)」こと、及び、
「映像信号が切り替わる」こと、という特徴を持つ。こ
こで、「音声レベルが下がる」とは、必ずしも無音(こ
こでは極微小なノイズしかない部分という意味)と同義
ではない。すなわち、実際には、CMと本編との切り替
えのタイミングなどにより、必ずしも完全に無音とはな
らないまま切り替わることがあるからである。
【0028】上述したように、CMについての「規定時
間長(少数種類の時間長)」、「小音量」、「映像切り
替わり」という3つの特徴は、ほぼ全てのCMが示すパ
ターンである。本発明では、このようにほぼ全てのCM
が示す信号のパターンを「特徴的パターン」と称し、そ
れを検出するための条件を「必須条件」と称することに
する。
【0029】したがって、TV放送信号から当該必須条
件に対応する信号部分を検出するようにすれば、誤棄却
がほとんどなく決定論的にCMの候補(すなわちCMで
あろうと思われる信号部分)を検出することが可能とな
る。但し、番組本編内にも、偶然そのような必須条件を
満たしてしまう部分が多く存在するため、上記必須条件
を用いただけでは、番組本編の一部をCM候補として誤
検出してしまう虞が残る。
【0030】一方で、上記必須条件と比べて例外は多く
存在するものの、CMの性質上、多くのCMが満たすか
若しくは一定の傾向を示す特徴としては、以下のような
ものがある。
【0031】1)CMの前後(CMが開始される直前と
CMが終了して本編番組が開始又は再開される直前)で
は、通常の番組本編内よりも音声レベルが低くなること
が多い。
【0032】2)CMと番組本編との間、及び、あるC
Mと他のCMとの間の、ほぼ無音となる区間長は、数百
ミリ秒程度であることが多い。
【0033】3)TV放送内に含まれる有音区間は、C
Mの規定時間長(15秒、30秒、60秒等)より百ミ
リ秒程度以上短いことが多く、また1秒程度以上短いこ
とは少ない。
【0034】4)ステレオ音声信号の左チャンネル(L
チャンネル)と右チャンネル(Rチャンネル)の相関値
は、1より有意に小さいことが多い。
【0035】5)CM期間中は、番組本編より音量が大
きめである傾向がある。
【0036】6)CMの放送モードは、ステレオモード
であることが多い。
【0037】7)CM区間では、複数のCMが連続して
放送されることが多い。
【0038】8)CM期間中は、映像カットの切り替わ
り頻度が高いことが多い。
【0039】9)逆に、CM期間中であっても、カット
の切り替わり頻度が極端に低いものがある(例えば静止
画によるCMなど)。
【0040】10)番組本編とCMとの境界や、あるC
Mと他のCMの境界では、音質が大きく変化することが
多い。
【0041】11)CMは、音声と音楽を同時に含むこ
とが多い。
【0042】12)番組編成上、毎時丁度の時刻近辺で
は、CMが放送される確率が高い。
【0043】13)同様に、毎時30分付近でもCMが
放送される確率が高い。
【0044】14)番組のジャンルによってCMが放送
される確率の高い時間帯がある(例えばサッカー中継の
ハーフタイムなど)。
【0045】15)CM期間中には、商品名や企業名な
どを表す文字やロゴ、マーク等が表示される場合が多
い。
【0046】16)商品名等を表す文字は、視聴者に強
い印象を与えるため、画面の中央に表示されることが多
い。
【0047】17)企業名等を表す文字は、企業や団体
の統一感を与えるために、CMの初めの方と、後の方に
表示されることが多い。
【0048】本発明では、以下、これらの特徴に基づく
条件を「付加条件」と称することにする。すなわち、当
該付加条件は、CMが、規格に基づいて製作されるとい
う制約、短い時間で宣伝効果を上げるためのものである
という制約、及び、番組構成上の都合などによる制約の
元で製作された結果として、TV放送信号上に現れてく
ることによる条件である。したがって、この付加条件
は、決定論的な取り扱いができるほど確実な条件ではな
いものの、CMである可能性(CMらしさ)を評価する
際の有効な条件となる。本発明は、上記の15)乃至1
7)を付加条件とすることに特徴がある。
【0049】さらに、TV放送においては、同時に同じ
チャンネルで複数の映像及び音声が放送されることは物
理的にありえないという特徴がある。すなわち、TV放
送信号からCMであろうと思われる信号部分(CM候
補)を検出しようとする場合において、例えば、TV放
送信号中に、上記付加条件を満たす複数の映像及び音声
区間がオーバーラップして存在し、何らかの処理の結
果、当該オーバーラップ区間でCM候補が検出されたと
しても、そのオーバーラップしている複数の映像及び音
声内の少なくともどちらかの区間は、正しいCM区間で
はあり得ない。本発明では、TV放送におけるこのよう
な特徴に基づく条件を、「論理条件」と称することにす
る。
【0050】本発明では、以上説明した「必須条件」、
「論理条件」、「付加条件」を合理的かつ効果的に利用
することにより、TV放送信号から高精度でCM部分を
検出可能としている。
【0051】より具体的に言うと、本発明では、「必須
条件」に基づき、決定論的にTV放送信号中からCM候
補(CMであろうと思われる信号部分)を抽出し、「付
加条件」に基づくCMらしさ(CMである可能性)の統
計論的な評価によってCM候補を選択し、「論理条件」
によりCM候補のオーバーラップ関係を解消することに
より、精度の高いCM検出を実現するものである。
【0052】図1には、上述のようにTV放送信号から
CMを検出可能とした、本発明の実施の形態としての映
像音声記録装置の概略構成を示す。
【0053】図1において、アンテナ6により受信され
たTV放送信号は、チューナ1により同調され、放送信
号1aとして復調器2に入力する。
【0054】復調器2は、入力された放送信号1aに含
まれるパイロット信号の変調周波数から、その入力時点
での放送モード(モノラルモード/ステレオモード/音
声多重モード)を判別し、また、放送信号1aに含まれ
る映像及び音声の変調信号を復調する。このとき、音声
変調信号は、上記判別した放送モードに応じて復調され
る。当該復調器2により復調された映像信号2a、音声
信号2b、及び放送モード信号2cは、CM検出部4に
入力される。また、映像信号2aおよび音声信号2b
は、映像音声記録部5にも入力される。
【0055】映像音声記録部5は、磁気テープ、磁気デ
ィスク、光ディスク若しくは光磁気ディスク等を記録媒
体として用い、上記映像信号2a及び音声信号2bを記
録再生可能な装置である。なお、映像音声記録部5は、
映像信号及び音声信号に対して符号化や圧縮などを施し
て記録し、再生時にはその符号化や圧縮された映像信号
及び音声信号を復号化、伸張する装置であってもよい。
【0056】時計部3は、時刻を表す時間信号3aを発
生し、当該時間信号3aをCM検出部4に供給する。
【0057】CM検出部4は、詳細については後述する
が、上記復調器2からの映像信号2a、音声信号2b、
および放送モード信号2c、並びに時計部3からの時間
信号3aを入力とし、放送信号1aの映像及び音声信号
に含まれるCM区間を検出し、その開始時刻と長さをC
M検出出力4aとして出力する。当該CM検出部4によ
るCM検出出力4aは、映像音声記録部5に送られ、上
記映像信号2a及び音声信号2bと共に記録される。
【0058】また、このCM検出部4には、チューナ1
から、上記同調された放送チャンネルを示すチャンネル
情報1bも供給される。当該チャンネル情報1bは、C
Mが含まれない放送チャンネルが指定されたか否かを、
CM検出部4において判断する為に用いられる。すなわ
ち、CM検出部4は、上記チャンネル情報1bにより、
上記チューナ1において明らかにCMが放送されない放
送チャンネルの指定がなされていると判断した場合、上
記CM検出動作を行わないようにする。なお、ここで
は、CM検出部4自身がチャンネル情報1bに基づいて
CM検出動作を行うか否か判断することとしているが、
チューナ1がチャンネル情報1bによりCM検出部4で
のCM検出動作を制御するようにしても良い。
【0059】以上、チューナ1、復調器2、時計部3、
映像音声記録部5に示した各構成要素は、現在広く知ら
れているビデオ装置などの磁気記録再生装置のものと同
様であるため、以下では、CM検出部4に限って詳細に
説明する。
【0060】図2は、上記CM検出部4の構成例を示
す。なお、この図2中の各信号のうち、図1と共通の信
号については、図1と同じ指示符号を付している。ま
た、当該CM検出部4は、大別して、フロントエンド部
とバックエンド部とから構成されている。また、図中の
動作制御部24は、チューナ1から供給された上記チャ
ンネル情報1bに基づいて、上記チューナ1において明
らかにCMが放送されない放送チャンネルの指定がなさ
れているか否かを判断し、その判断結果に応じて、当該
図2の各部におけるCM検出動作を行わないように制御
するものである。
【0061】先ず、フロントエンド部から説明する。こ
の図2において、図1の復調器2より供給された映像信
号2aは、A/D変換器10にてディジタル化され、フ
レームメモリ11に蓄えられる。なお、フレームメモリ
11は、少なくとも2フレーム分の映像信号を蓄積可能
なメモリである。当該フレームメモリ11からフレーム
毎に読み出された映像信号は、文字検出器12およびカ
ットチェンジ検出器13に送られる。
【0062】文字検出器12は、フレームメモリ11よ
り供給されるフレーム毎の映像信号に基づいて、フレー
ム中に文字が含まれているか否かを判定するとともに、
文字が含まれている場合、それがフレームの中央に位置
しているか否かをさらに判定する。文字検出器12は、
それらの判定結果に基づいて、式(1)のような離散化
数値M[n]を決定する。
【0063】
【数1】
【0064】すなわち、第nフレーム中に文字が含まれ
ていない場合、離散化数値M[n]は0となる。一方、
第nフレーム中に文字が含まれており、かつ、それがフ
レームの中央に位置する場合、離散化数値M[n]は2
となり、中央以外に位置する場合(周辺に位置する場
合)、数値M[n]は1となる。
【0065】ここで、文字検出器12の動作を、図3の
フローチャートを参照して説明する。なお、ここでは、
文字パターンは、多くの線分により構成されていること
から、多くの線分を含む領域を文字領域とすることでフ
レーム上の文字が検出される。
【0066】ステップS1において、文字検出器12
は、フレームメモリ11に蓄えられた時間的に隣接す
る、第nフレーム、および第nフレームに対して時間的
に1フレーム前の第n−1フレームを読み出す。ステッ
プS2において、文字検出器12は、ステップS1で読
み出した隣接する2つのフレームに対して、微分法によ
るエッジ処理を施し、2つのエッジ画像を生成し、それ
らを2値化する。
【0067】次に、ステップS3において、文字検出器
12は、ステップS2で2値化されたそれぞれのエッジ
画像間でAND演算を行って、動き部分を消去し、静止
部分についてのエッジ画像を生成する。
【0068】ステップS4において、文字検出器12
は、ステップS3で生成した静止エッジ画像を、P個の
小領域に分割するとともに、各小領域に、図4に示すよ
うに番号p(p=1、2,・・・P)を割り当てる。図
4の例の場合、小領域には、反時計回転方向、かつフレ
ームの周辺から中心に向う順番で番号が割り当てられる
ので、フレームの中央に位置する小領域には大きい番号
が割り当てられる。
【0069】次に、ステップS5において、文字検出器
12は、小領域の番号を示すカウンタpの値を1に初期
化する。ステップS6において、文字検出器12は、カ
ウンタpの値の番号を有する小領域p内のエッジ線分の
密度を算出する。なお、線分密度は、2値化画像の白黒
比により求められる。
【0070】次に、ステップS7において、文字検出器
12は、ステップS6で算出した線分密度が、所定の閾
値以上であるか否かを判定し、それ以上であると判定し
た場合、ステップS8に進み、小領域pは文字領域であ
ると判定する。一方、ステップS7で、閾値より小さい
と判定された場合、ステップS9に進み、小領域pは文
字領域ではないと判定される。
【0071】ステップS8またはステップS9で、小領
域pが文字領域である、または文字領域ではないと判定
されたとき、ステップS10に進み、文字検出器12
は、カウンタpの値が、小領域の数Pより大きいか否か
を判定し、それより大きくはないと判定した場合(それ
以下である場合)、ステップS11に進み、カウンタp
の値を1だけインクリメントして、ステップS6に戻
り、次の小領域に対して、それ以降の処理を実行する。
【0072】ステップS10で、カウンタpの値が小領
域の数Pより大きいと判定された場合、すなわち、すべ
ての少領域について文字領域であるか否かが判定された
とき、ステップS12に進み、文字検出器12は、ステ
ップS8で文字領域であると判定された少領域が、所定
の数以上あるか否かを判定し、それ以上あると判定した
場合、第nフレームには文字が含まれるとし、ステップ
S13に進む。
【0073】ステップS13において、文字検出器12
は、文字領域であると判定された小領域の群(文字)
が、フレームの中央に位置するか否かを判定する。
【0074】例えば、図4の例では、小領域に割り当た
られた番号は、フレームの周辺から中央に向かって大き
くなっている。そこでこの場合、文字検出器12は、文
字領域とされた小領域の番号を検出し、その番号が所定
の番号より大きいか否かを判定することで、フレーム中
の文字が中央に位置するか否かを判定することができ
る。
【0075】ステップS13で、文字領域とされた小領
域の群(文字)は、フレームの中央に位置すると判定さ
れた場合、ステップS14に進み、文字検出器12は、
離散化数値M[n]を値2とする。一方、ステップS1
3で、文字領域とされた少領域の群が、フレームの中央
に位置しないと判定された場合、ステップS15に進
み、文字検出器12は、離散化数値M[n]を値1とす
る。
【0076】ステップS12で、ステップS8で文字領
域であると判定された小領域が、所定の数以上ないと判
定された場合、ステップS16に進み、文字検出器12
は、第nフレームには文字が含まれていないとし、離散
化数値M[n]を値0とする。
【0077】ステップS14,15,16で、離散化数
値M[n]が決定されたとき、ステップS1に戻り、次
にフレームに対して同様の処理が行われる。
【0078】なお、ここでは、線分密度を利用して文字
領域を検出したが、例えば、「画像処理アルゴリズムの
最新動向」(新技術コミュニケーションズ,1987)に紹
介されている他の方法などを利用することもできる。
【0079】文字検出器12の出力である離散化数値M
[n]は、TV送信信号の特徴量の一つとして特徴量バ
ッファ19へ送られる。
【0080】図2に戻り、カットチェンジ検出器13
は、フレームメモリ11より供給されたフレーム毎の映
像信号に基づいて、映像が急激に変化するフレーム(以
下、映像変化フレームと呼ぶ)と、輝度が一様となるフ
レーム(以下、一様輝度フレームと呼ぶ)を検出する。
【0081】すなわち、カットチェンジ検出器13は、
フレームメモリ11に蓄えられた時間的に隣接する2つ
のフレーム映像間で、各画素毎に輝度の差分の自乗和を
求め、当該自乗和が所定の閾値を越えた場合に、上記隣
接する2つのフレームのうちの時間的に後のフレーム
を、上記映像が急激に変化する映像変化フレームとして
検出する。また、カットチェンジ検出器13は、フレー
ムメモリ11に蓄えられた各フレーム映像の輝度の分散
を求め、その輝度の分散値が所定の閾値以下である場合
に、そのフレームを一様輝度フレームであるとして検出
する。なお、フレームの間隔(NTSC方式では約30
ms)が、後述する音声信号処理において説明するフレ
ーム周期と一致しない場合には、当該フレーム間隔を再
離散化することによって、フレーム周期と一致させてお
くようにする。
【0082】以下、当該カットチェンジ検出器13にお
ける映像変化フレームと一様輝度フレームの検出につい
て、より具体的に説明する。
【0083】ここで、離散化された映像信号の横サイズ
をX、縦サイズをY、縦横の画素番号をx,yとし、第
nフレームの映像をIn(x,y)、当該第nフレーム
に対して時間的に1フレーム前の第n−1フレームの映
像をIn-1(x,y)として表わすと、第nフレームと
第n−1フレームの間の各画素毎の輝度差分の自乗和D
[n]は、式(2)により得られ、また、第nフレームの
輝度分散値V[n]は、式(3)により得られる。
【0084】
【数2】
【0085】また、このときのカットチェンジ検出器1
3の検出出力C[n]は、式(4)により表わされる。
【0086】
【数3】
【0087】ただし、式中のDthsdは上記映像変化フレ
ームを検出する際の自乗和に対する所定の閾値であり、
thsdは上記一様輝度フレームを検出する際の輝度の分
散値に対する所定の閾値である。
【0088】当該カットチェンジ検出器13の検出出力
C[n]は、映像信号についての特徴量として特徴量バッ
ファ19へ送られる。
【0089】なお、上記の2つのフレーム映像間で輝度
差分を求める際には、2フレーム分の映像信号を蓄積可
能なメモリが必要となり、また、2フレーム分の映像信
号に対する演算量も必要となる。そこで、例えばフレー
ム映像全面を同時に処理する代わりに、フレーム映像を
適切な小ブロック毎に分け、その小ブロック毎に輝度差
分を求めるようにしたり、或いは、フレーム映像間の画
素毎に輝度差分を求めるのではなく、フレーム映像毎に
輝度ヒストグラムを求めて、その輝度ヒストグラムのフ
レーム間差分を求めるようにしたり、又は、フレーム映
像毎に平均輝度を求めて、その平均輝度のフレーム間差
分を求めるようにするで、メモリ容量や演算量を減らす
ことも可能である。逆に、メモリや演算量に余裕がある
場合には、例えば、カラー映像におけるR(赤),G
(緑),B(青)成分のようなカラー成分毎に、上記輝
度差分やカラーヒストグラム差分を求めることで、より
検出精度を高めることも可能である。
【0090】図2に戻り、図1の復調器2より供給され
た音声信号2bは、A/D変換器14にてディジタル化
され、音声信号バッファ15に蓄えられる。なお、音声
信号バッファ15は、少なくとも所定時間T1(例えば
30ms、以下、これを1フレーム長とする)分の左
(L)右(R)2チャンネルのステレオ音声信号を蓄積
可能なメモリである。当該音声信号バッファ15から読
み出された音声信号は、振幅検出器16、相関検出器1
7、およびスペクトル検出器18に送られる。
【0091】振幅検出器16は、音声信号バッファ15
に蓄えられた音声信号を用いて、所定の時間T2(例え
ば15ms、以下、これを1フレーム周期とする)毎の
短時間平均自乗振幅を検出する。すなわち、振幅検出器
16は、音声信号バッファ15に左右2チャンネルのス
テレオ音声信号が蓄積されている場合、当該音声信号バ
ッファ15より読み出された左右2チャンネルのステレ
オ音声信号SL[m],S R[m]から、所定の時間T2(15
ms、1フレーム周期)毎に、短時間平均自乗振幅を検
出する。なお、上記m(m=0,・・・,M−1)は、
離散化された時間を表わすバッファ内のサンプル番号で
あり、最大番号Mが1フレーム長T1に対応する。
【0092】より具体的に説明すると、振幅検出器16
は、第nフレームにおける左右2チャンネルの音声信号
の平均自乗振幅A[n]を式(5)により計算する。すな
わち、平均自乗振幅は15ms(1/2フレーム)毎に計
算され、その15ms毎の平均自乗振幅の30ms(1フレ
ーム)の期間における平均値がさらに演算され、最終的
な、1フレームの平均自乗振幅とされる。
【0093】
【数4】
【0094】当該振幅検出器16の検出出力である平均
自乗振幅A[n]は、音声信号についての特徴量の一つと
して特徴量バッファ19へ送られる。
【0095】相関検出器17は、音声信号バッファ15
に蓄えられた音声信号を用いて、1フレーム毎の音声信
号について規格化前の相関係数を検出すると共に、後段
にて行われる規格化のための短時間エネルギーも同時に
検出する。すなわち、相関検出器17は、音声信号バッ
ファ15に左右2チャンネルのステレオ音声信号が蓄積
されている場合、当該音声信号バッファ15より読み出
された左右2チャンネルのステレオ音声信号SL[m],S
R[m]から、1フレーム毎の左右2チャンネルの音声信号
について規格化前の相関係数を検出すると共に、後段に
て行われる規格化のための短時間エネルギーも同時に検
出する。
【0096】より具体的に説明すると、相関検出器17
は、第nフレームにおける左右2チャンネルの音声信号
の相関係数ALR[n]を式(6)により計算し、左チャン
ネルの音声信号エネルギーALL[n]を式(7)により計
算し、そして右チャンネルの音声信号エネルギーA
RR[n]を式(8)により計算する。
【0097】
【数5】
【0098】当該相関検出器17の検出出力である相関
係数ALR[n]と音声信号エネルギーALL[n],ARR[n]
は、それぞれが音声信号についての特徴量の一つとして
特徴量バッファ19へ送られる。
【0099】スペクトル検出器18は、音声信号バッフ
ァ15に蓄えられた音声信号を用いて、短時間スペクト
ルを計算する。すなわち、スペクトル検出器18は、音
声信号バッファ15に左右2チャンネルのステレオ音声
信号が蓄積されている場合、当該音声信号バッファ15
より読み出された左右2チャンネルのステレオ音声信号
L[m],SR[m]から、短時間スペクトルを計算する。
【0100】より具体的に説明すると、スペクトル検出
器18は、第nフレームにおける左右2チャンネルの音
声信号の離散スペクトルF[k;n]を求める。なお、k=
0,・・・,K−1を離散化された周波数を表わす番号
とすると、離散スペクトルF[k;n]は式(9)により表
わされる。
【0101】
【数6】
【0102】この式(9)の演算は、例えば、高速フー
リエ変換(FFT)又は線形予測分析(LPC)などを
用いて実現される。
【0103】当該スペクトル検出器18の計算出力であ
る短時間離散スペクトルF[k;n]は、音声信号について
の特徴量の一つとして特徴量バッファ19へ送られる。
【0104】次に、図1の復調器2より供給された放送
モード信号2cは、上述した音声信号処理のフレームに
合わせて離散化された数値となされる。
【0105】より具体的に説明すると、第nフレームに
おける放送モード信号2cは、例えば式(10)のよう
な数値B[n]となされる。
【0106】
【数7】
【0107】この放送モード信号2cを離散化した数値
B[n]は、TV放送信号の特徴量の一つとして特徴量バ
ッファ19へ送られる。
【0108】同様に、図1の時計部3より供給された時
間信号3aも、音声信号処理のフレームに合わせて離散
化された数値T[n]となされ、特徴量の一つとして特徴
量バッファ19へ送られる。
【0109】特徴量バッファ19は、上記文字検出器1
2からの離散化数値M[n]、カットチェンジ検出器1
3からの検出出力C[n]、振幅検出器16からの平均自
乗振幅A[n]、相関検出器17からの相関係数ALR[n]お
よび音声信号エネルギーALL[n],ARR[n]、スペクトル
検出器18からの短時間離散スペクトルF[k;n]、放送
モード信号2cの離散化数値B[n]、並びに時間信号3
aの離散化数値T[n]とからなる、式(10)に示され
る特徴量G[n]を、所定の時間T3に渡って蓄積する。な
お、時間T3はCM部分を最低でも1つ以上に渡って記
憶できる時間であり、例えば80秒などとする。 G[n]={M[n],C[n],A[n],ALR[n],ALL[n],ARR[n],F[k;n],B[n],T[n]} (10)
【0110】以上のA/D変換器10乃至特徴量バッフ
ァ19までが、図2に示したCM検出部4のフロントエ
ンド部の構成であり、以下、図5、図6のフローチャー
トを用いて当該フロントエンド部における処理の流れを
説明する。なお、図5のステップS30乃至S33まで
は映像信号2aについての処理の流れを表しており、図
6のステップS34乃至S41までは音声信号2b及び
放送モード信号2c、時間信号3aについての処理の流
れを表している。
【0111】先ず、映像信号2aについての処理の流れ
を表す図5において、フロントエンド部は、ステップS
30の処理として、A/D変換器10によりディジタル
化された、少なくとも1フレーム分の映像信号2aをフ
レームメモリ11に蓄える。このフレームメモリ11
は、1フレーム分の映像信号2aを1サンプルとして扱
うようになされており、1フレーム分の映像信号2aが
入力されると、当該フレームメモリ11内に既に蓄積さ
れている映像信号2aが1フレーム分シフトし、最も時
間的に過去に入力された1フレームの映像信号2aが押
し出されて出力されるようになっている。
【0112】次に、フロントエンド部は、ステップS3
1の処理として、フレームメモリ11から映像信号2a
を読み出して文字検出器12に送り、前述のようにして
離散化数値M[n]を求める。
【0113】フロントエンド部は、ステップS32の処
理として、フレームメモリ11から映像信号2aを読み
出してカットチェンジ検出器13に送り、前述のように
して検出出力C[n]を求める。
【0114】その後、フロントエンド部は、ステップS
33の処理として、離散化数値M[n]および検出出力
C[n]を特徴量バッファ19に蓄える。
【0115】一方、音声信号2bについての処理の流れ
を表す図6において、フロントエンド部は、ステップS
34及びステップS35の処理として、A/D変換器1
4によりディジタル化された、音声信号2bを音声信号
バッファ15に入力すると共に、当該音声信号バッファ
15に少なくとも1フレーム周期T2分の音声信号2b
を蓄積する。この音声信号バッファ15は、1フレーム
周期T2分の音声信号2bを1サンプルとして扱うよう
になされており、1フレーム周期T2分の音声信号2b
が入力されると、当該音声信号バッファ15内に既に蓄
積されている音声信号2bが1フレーム周期T2分だけ
シフトし、最も時間的に過去に入力された1フレーム周
期T2分の音声信号2bが押し出されて出力されるよう
になっている。
【0116】上記音声信号バッファ15に少なくとも1
フレーム周期T2分の音声信号2bが蓄積されると、フ
ロントエンド部は、ステップS36の処理として、当該
音声信号バッファ15に蓄積された音声信号2bを読み
出して振幅検出器16に送り、前述のようにして、平均
自乗振幅A[n]を求める。
【0117】同時に、フロントエンド部は、ステップS
37の処理として、音声信号バッファ15に蓄積された
音声信号2bを相関検出器17に送り、前述のようにし
て、相関係数ALR[n]と音声信号エネルギーALL[n],A
RR[n]を求める。
【0118】また同時に、フロントエンド部は、ステッ
プS38の処理として、音声信号バッファ15に蓄積さ
れた音声信号2bをスペクトル検出器18に送り、前述
のようにして、短時間離散スペクトルF[k;n]を求め
る。
【0119】さらに、フロントエンド部は、ステップS
39の処理として、図1の復調器2より供給された放送
モード信号2cから、前述のように離散化した数値B
[n]を求めると共に、ステップS40の処理として、図
1の時計部3より供給された時間信号3aから、前述の
ように離散化された数値T[n]を求める。
【0120】その後、フロントエンド部は、ステップS
41の処理として、振幅検出器16からの平均自乗振幅
A[n]、相関検出器17からの相関係数ALR[n]および音
声信号エネルギーALL[n],ARR[n]、スペクトル検出器
18からの短時間離散スペクトルF[k;n]、放送モード
信号2cの離散化数値B[n]、並びに時間信号3aの離
散化数値T[n]を、特徴量バッファ19に蓄積する。す
なわち、特徴量バッファ19には、ステップS33とス
テップS41の処理により、特徴量G[n]が蓄積され
る。
【0121】図2に戻り、バックエンド部の説明を行
う。なお、以下の説明において、番号nは、特徴量バッ
ファ19内にフレーム毎に蓄積される特徴量の、各フレ
ーム番号を表わすものとする。また、最新のフレームの
特徴量をG[0]とし、過去のフレームの特徴量となるに
したがってnの値が増加し、新たなフレームの特徴量が
入力された場合には、全てのデータが1ずつシフト(フ
レーム番号が1ずつシフト)するものとする。
【0122】図2において、特徴量バッファ19に蓄積
された特徴量は、フレーム毎にCM候補検出器20に送
られる。
【0123】当該CM候補検出器20は、ほぼ全てのC
Mが満たす、前述した「必須条件」に基づき、フレーム
毎にCM区間の候補を算出する。ここで、必須条件と
は、前述したように、CMの音声信号が「小音量」であ
ること、すなわち音声信号の音量が所定の閾値以下とな
っているフレーム(以下、音量条件と呼ぶ)であり、且
つ、CMの「映像切り替わり」があること、すなわち映
像信号が急激に変換するフレーム又は一様な輝度となる
フレーム(以下、映像条件と呼ぶ)であり、さらに、
「規定時間長(少数種類の時間長)」であること、すな
わち上記音量条件と映像条件を満たす2つのフレームの
間隔が所定のCM長と合致する区間(以下、時間条件と
呼ぶ)となるような条件であり、具体的には、前述の特
徴量を用いて、以下のような式(11)で且つ式(1
2)で且つ式(13)の条件として書き下すことができ
る。
【0124】 A[0]<Athsd (11) C[0]=1 (12) A[n1]<Athsd,C[n1]=1又はA[n2]<Athsd,C[n2]=1又は A[n3]<Athsd,C[n3]=1 (13)
【0125】ただし、Athsdは所定の自乗振幅の閾値で
あり、n1,n2,n3はそれぞれCM長として規定され
ている時間長(本実施の形態では、一例として15秒、
30秒、60秒の3種類の時間長がある場合を説明に用
いている)を、フレーム周期単位に換算した数である。
なお、CMの実際の放送時間には誤差があるため、実用
上は、n1,n2,n3にはそれぞれ多少の幅を持たせ
る。
【0126】ここで、図7を用いて、上記CM候補検出
器20の動作を説明する。
【0127】図7において、特徴量バッファ19では、
ステップS50のバッファシフト処理とステップS51
の特徴量入力処理として、図5のステップS30で説明
したフレームメモリと図6のステップS34で説明した
音声信号バッファと同様に、1フレーム単位の入力、シ
フト及び出力の動作を行うようになされている。すなわ
ち、特徴量バッファ19は、1フレーム分の特徴量を1
サンプルとして扱うようになされており、1フレーム分
の特徴量が入力されると、当該特徴量バッファ19内に
既に蓄積されている特徴量が1フレーム分だけシフト
し、最も時間的に過去に入力された1フレーム分の特徴
量が押し出されて出力されるようになっている。
【0128】上記ステップS50およびステップS51
の処理により、特徴量バッファ19から1フレーム(1
サンプル)分の特徴量が入力されると、CM候補検出器
20は、ステップS52およびステップS53の処理と
して、1フレーム(サンプル)に特徴量が上記必須条件
の音量条件、映像条件、時間条件を満たすか否かの評価
を行う。
【0129】すなわち、CM候補検出器20は、ステッ
プS52において、先ず最初のフレームの平均自乗振幅
A[0]と所定の自乗振幅の閾値Athsdを比較し、次に、
ステップS53の処理として、検出出力C[0]が1とな
るか否か調べることにより、当該フレームが上記必須条
件である音量条件、映像条件、時間条件を満たすか否か
の判定を行う。CM候補検出器20では、これらステッ
プS52,S53の判定処理の結果、上記平均自乗振幅
A[0]が所定の自乗振幅の閾値Athsdを超えず、且つ、
上記必須条件を満たしていると判定した場合、当該フレ
ームをCM候補としてステップS57以降(ステップS
54乃至S56については後述する)の処理に進み、逆
に、上記平均自乗振幅A[0]が所定の自乗振幅の閾値A
thsdを超えたか、或いは上記必須条件を満たしていない
と判定した場合、当該フレームがCM候補にはならない
としてステップS50の処理に戻る。
【0130】上記ステップS52,S53の各判定処理
の結果、上記平均自乗振幅A[0]が所定の自乗振幅の閾
値Athsdを超えず、且つ、上記必須条件を満たしている
と判定された場合、CM候補検出器20は、ステップS
57の処理としてCM開始フレームnsを検索し、次
に、ステップS58の処理としてCM終了フレームne
の検索を行い、更に、ステップS59の処理としてCM
開始時刻Tsを計算し、ステップS60としてCM長さ
Wを計算する。
【0131】CM候補検出器20は、以上のステップS
57乃至S60の検索及び計算を行った後、ステップS
61において後述するCM候補テーブルを参照し、も
し、CM開始時刻Ts及びCM長さTwが一致する候補が
すでに当該CM候補テーブル中に存在するならば、その
まま再びステップS54乃至S56の処理に戻り、逆に
存在しない場合には、ステップS62において、新たな
CM候補としてCM候補テーブルに追加した後、再びス
テップS54乃至S56の処理に戻る。
【0132】ステップS54乃至S56では、全ての時
間長に対して上述同様の処理を行った後、ステップS5
0に戻り、次の入力に対して同じ処理を繰り返すことを
表している。
【0133】なお、上記CM開始フレームnsとは、
1,n2,n3で表される各フレームのうち時間条件に
合致したフレームから、最新フレームの方向へ向かっ
て、平均自乗振幅A[n]が自乗振幅の閾値Athsdを越え
る最初のフレーム番号である。また、CM終了フレーム
eとは、0番目のフレームより過去の方向に向かっ
て、平均自乗振幅A[n]が自乗振幅の閾値Athsdを越え
ない最後のフレーム番号である。さらにCM開始時刻T
sは、CM開始フレーム番号nsを用いてTs=T[ns]と
して求められる。同様にCM長さTwは、Tw=T[ne]−
T[ns]として求められる。
【0134】ここで、図8に、上記必須条件の算出例を
示す。この図8に示すA[n]の項において、「o」は自
乗振幅の閾値Athsd未満の平均自乗振幅を持つフレーム
を示し、「x」は自乗振幅の閾値Athsd以上の平均自乗
振幅を持つフレームを示している。この例では、A
[0],C[0]及びA[n1],C[n1]が条件を満たし、n1
り左方で最初にA[n]=xとなるフレームがns、0より
右方に連続する最後のA[n]=oとなるフレームがne
なる。
【0135】以上の処理により、CM候補検出器20で
は、1フレーム(1サンプル)の特徴量が入力される毎
にCM候補の検出を行い、CM候補が検出された場合に
はCM候補テーブルにエントリーする。
【0136】図9には、CM候補テーブルの構成例を示
す。この図9において、CM候補テーブルの項目は、開
始時刻Ts、長さTw、及び後述する付加条件算出器21
で算出する特徴量Q1乃至Q14、及び後述する付加条件
判定器22で算出するスコアRとスコア判定結果Zから
なる。CM候補検出器20によるCM候補テーブル20
aの段階では、開始時刻Ts、長さTwのみが記述され
る。このように、CM候補テーブルは、CM候補検出器
20で得られるCM開始時刻Ts、長さTwと、付加条
件算出器21で算出される特徴量Q1乃至Q14と、付加
条件判定器22で算出されるスコアR及びスコア判定結
果Zとを記述し、それら特徴量を管理するための表であ
る。また、CM候補テーブルは、そのエントリーがCM
であるかないかの判定を受けるまで保持され、CMであ
ると判断された場合には、後述するルール判定器23か
らCM検出出力4aとして出力され、CMでないと判断
された場合には破棄される。
【0137】上記CM候補検出器20により開始時刻T
s、長さTwのみが記述されたCM候補テーブル20a
は、付加条件算出器21に送られる。
【0138】付加条件算出器21では、CM候補テーブ
ル20aにエントリーされた候補区間より、特徴量バッ
ファ19を参照しながら、以下に示すような特徴量Q1
乃至Q14を抽出し、それをCM候補テーブル20aに追
加記述し、CM候補テーブル21aとして付加条件判定
器22に出力する。
【0139】図10には、当該付加条件算出器21にお
ける特徴量Q1乃至Q11の算出例を示す。
【0140】この図10において、横軸はフレーム番号
(離散時間に相当)を表し、図10(A)はカットチェ
ンジ検出出力C[n]、図10(B)は放送モード信号2
cの離散化数値B[n]、図10(C)は音声信号の短時
間離散スペクトルS[k,n]、図10(D)は音声信号の
平均自乗振幅A[n]を表わし、n1の間隔(図中点線で挟
まれた区間)がCM候補である。なお、図10(A)に
おいて、図中CTで示す位置はカットチェンジ検出出力
C[n]が1となっている位置(すなわちカットチェンジ
が検出された位置)を示している。また、図10(B)
において、図中Mで示す区間はその区間が何らかの放送
モードとなっていることを示している。図10の(C)
において、図中S1,S2,S3,S4は何らかのスペ
クトル成分が存在することを示し、図10(D)におい
て、図中AMは自乗振幅の変化を表している。また、図
中Q1乃至Q11は、上記付加条件算出器21にて特徴量
1乃至Q11が計算される場所を示している。
【0141】以下、付加条件算出器21で算出される各
特徴量Q1乃至Q14について個々に説明する。
【0142】特徴量Q1は、前ブレーク長である。当該
前ブレーク長とは、CM候補区間直前の小音量区間(前
ブレーク区間と称する)、すなわち連続してA[n]が所
定の閾値Athsd以下である時間長であり、図10中の一
点鎖線で挟まれた区間長BBが前ブレーク長Q1であ
る。
【0143】特徴量Q2は、後ブレーク長である。当該
後ブレーク長とは、CM候補区間直後の小音量区間(後
ブレーク区間と称する)、すなわち連続してA[n]が所
定の閾値Athsd以下である時間長であり、図10中の一
点鎖線で挟まれた区間長ABが後ブレーク長Q2であ
る。
【0144】特徴量Q3は、前ブレーク最小振幅であ
る。当該前ブレーク最小振幅Q3は、の前ブレーク区間
におけるA[n]の最小値である。
【0145】特徴量Q4は、後ブレーク最小振幅であ
る。当該後ブレーク最小振幅Q4は、の後ブレーク区間
におけるA[n]の最小値である。
【0146】特徴量Q5は、左右相関値である。当該左
右相関値Q5は、CM候補区間の音声の左右2チャンネ
ルの音声信号SL[m],SR[m]の相関値である。これは、
式(6)乃至式(8)のALR[n],ALL[n],ARR[n]を
利用して、式(15)に従って算出することができる。
【0147】
【数8】
【0148】この式(15)の演算では、フレームのオ
ーバーラップにより原波形が部分的に複数回加算される
ことになるが、そのことはこのシステムに実質的な影響
は及ぼさない。また、原波形をそのまま保持できるだけ
のメモリ容量及び処理速度がある場合には、この演算は
原波形の相互相関と置き換えることもできる。
【0149】特徴量Q6は、平均振幅値である。当該平
均振幅値Q6は、CM候補区間の音声信号の振幅のRM
S値(平均自乗振幅)である。これは、式(16)によ
り計算することができる。
【0150】
【数9】
【0151】この式(16)の演算では、上記左右相関
演算の場合と同様に、フレームのオーバーラップ次第で
は原波形が部分的に複数回加算されることになるが、そ
のことは実質的な影響を及ぼさない。また、原波形をそ
のまま保持できるだけのメモリ容量及び処理速度がある
場合には、この演算は原波形のRMS演算と置き換える
こともできる。
【0152】特徴量Q7は、カット数である。当該カッ
ト数Q7は、CM候補区間中に存在するカットチェンジ
の回数(上記CTの数)を数える演算となる。すなわち
これは、[ns,ne]の区間でC[n]=1となる回数を数え
る演算となる。
【0153】特徴量Q8は、放送モードである。ここで
の放送モードは、CM候補区間中で最も支配的な放送モ
ードのことである。これは、[ns,ne]の区間のB[n]
値の中で、最も頻発する放送モードQ8を選ぶ演算であ
る。
【0154】特徴量Q9は、隣接候補数である。当該隣
接候補数Q9は、あるCM候補に対して、その前後にあ
る有音区間もCM候補であるかどうかを表わし、両側と
もCM候補であれば「2」、片側のみCM候補であれば
「1」、どちらもCM候補でなければ「0」の値をと
る。この演算は、CM候補テーブルを検索することで行
われ、開始時刻Tsと長さTwと後ブレーク長Q2の和
(Ts+Tw+Q2)が、他のCM候補の開始時刻
(T's)と一致するかどうかで後側候補の判定が行われ
る。同様に、開始時刻Tsと前ブレーク長Q1の差(Ts
−Q1)が、他のCM候補の開始時刻T'sと長さT'w
和(T's+T'w)と一致するかどうかで、前側候補の判
定が行われる。
【0155】特徴量Q10,Q11はスペクトル差分エネル
ギーである。当該スペクトル差分エネルギーQ10,Q11
は、CMと番組本編やCMと他のCMとの境界での音質
変化を定量化するために用いられる。これは、上記境界
の両側における平均スペクトルの差の自乗和として定義
され、式(17)乃至(22)に従って計算される。
【0156】
【数10】
【0157】但し、式中のNはスペクトルの平均をとる
フレーム数、n'eはCM候補区間の直前の有音区間の終
了フレーム番号(図10参照)、n'sはCM候補区間の
直後の有音区間の開始フレーム番号、S1[k]はCM候補
区間の直前の有音区間の終了直前の平均スペクトラム、
2[k]はCM候補区間開始直後の平均ズクトラム、S
3[k]はCM候補区間終了直前の平均スペクトラム、S
4[k]はCM候補区間の直後の有音区間の開始直後の平均
スペクトラム、Snormは適切な規格化定数である。
【0158】特徴量Q12は、式(23)に示すように、
CM候補区間中に存在するフレーム(フレームNs乃至
フレームNe)の離散化数値M[n]に基づく値であ
る。
【0159】
【数11】
【0160】従って、フレームNs乃至フレームNeの中
に、文字が中央に表示される(位置する)フレームが存
在する場合、すなわち、離散化数値M[n]が値2のフ
レームが存在する場合、特徴量Q12は、値2となる。
【0161】フレームNs乃至フレームNeの中に、文字
が中央に位置するフレームは存在しないが、文字が中央
以外の部分(周辺)に位置するフレームが存在する場
合、すなわち、離散化数値M[n]が値2のフレームは
存在しないが、離散化数値M[n]が値1のフレームが
存在する場合、特徴量Q12は、値1となる。
【0162】そしてフレームNs乃至フレームNeの中
に、文字を含むフレームが存在しない場合、すなわち、
離散化数値M[n]が値1または値2のフレームは存在
しない場合(すべてが離散化数値M[n]が値0のフレ
ームである場合)、特徴量Q12は、値0となる。
【0163】ここで、特徴量Q12を決定する場合の付加
条件算出器21の動作を、図11のフローチャートを参
照して説明する。
【0164】ステップS71において、付加条件算出器
21は、CM候補区間中のフレームNs乃至フレーム
e)の離散化数値M[n]を取得し、ステップS72
において、その中に、数値M[n]が値2のフレームが
存在するか否かを判定し、存在すると判定した場合、ス
テップS73に進み、特徴量Q12を値2とする。
【0165】ステップS72で、数値M[n]が値2の
フレームが存在しないと判定された場合、ステップS7
4に進み、付加条件算出器21は、数値M[n]が値1
のフレームが存在するか否かを判定し、存在すると判定
した場合、ステップS75に進み、特徴量Q12を値1に
する。
【0166】ステップS74で、数値M[n]が値1の
フレームが存在しないと判定された場合、すなわち、結
局、数値M[n]が値2,値1のフレームが存在しない
場合、ステップS76に進み、付加条件算出器21は、
特徴量Q12を値0にする。
【0167】ステップS73,75,76で特徴量Q12
が決定されたとき、処理は終了する。
【0168】特徴量Q13は、式(24)に示すように、
CM候補区間の最初の部分のフレーム(この例の場合、
フレームNsが入力されてから1秒間に入力された、フ
レームNsを含む30個のフレーム)の離散化数値M
[n]に基づく値である。
【0169】
【数12】
【0170】従って、この最初の部分のフレームの中
に、文字が中央に位置するフレームが存在する場合、す
なわち、離散化数値M[n]が値2のフレームが存在す
る場合、特徴量Q13は、値2となる。
【0171】最初の部分のフレームの中に、文字が中央
に位置するフレームが存在しないが、文字が周辺に位置
するフレームが存在する場合、すなわち、離散化数値M
[n]が値2のフレームは存在しないが、離散化数値M
[n]が値1のフレームが存在する場合、特徴量Q
13は、値1となる。
【0172】そして最初の部分のフレームの中に、文字
を含むフレームが存在しない場合、すなわち、離散化数
値M[n]が値1または値2のフレームが存在しない場
合(すべてが離散化数値M[n]が値0のフレームであ
る場合)、特徴量Q13は、値0となる。
【0173】特徴量Q14は、式(25)に示すように、
CM候補区間の最後の部分のフレーム(この例の場合、
フレームNeが入力される1秒前から入力された、フレ
ームNeを含む30個のフレーム)の離散化数値M
[n]に基づく値である。
【0174】
【数13】
【0175】従って、この最後の部分のフレームの中
に、文字が中央に位置するフレームが存在する場合、す
なわち、離散化数値M[n]が値2のフレームが存在す
る場合、特徴量Q14は、値2となる。
【0176】最後の部分のフレームの中に、文字が中央
に位置するフレームが存在しないが、文字が周辺に位置
するフレームが存在する場合、すなわち、離散化数値M
[n]が値2のフレームは存在しないが、離散化数値M
[n]が値1のフレームが存在する場合、特徴量Q
14は、値1となる。
【0177】そして最後の部分のフレームの中に、文字
を含むフレームが存在しない場合、すなわち、離散化数
値M[n]が値1または値2のフレームが存在しない場
合(すべてが離散化数値M[n]が値0のフレームであ
る場合)、特徴量Q14は、値0となる。
【0178】特徴量Q13,Q14を算出する場合、特徴量
12を算出する場合における図11のステップS71に
相当する処理で、最初の部分のフレームまたは最後の部
分のフレームの数値M[n]が取得された後、ステップ
S72乃至ステップS76に相当する処理が同様に行わ
れる。
【0179】上記付加条件算出器21は、以上により算
出したQ1からQ14までの特徴量を、CM候補テーブル
20aに追加記述し、CM候補テーブル21aとして出
力する。当該CM候補テーブル21aは、付加条件判定
器22に送られる。
【0180】付加条件判定器22は、CM候補テーブル
21aを入力とし、CM候補の特徴量を、閾値関数など
により非線型にパラメータ変換した後、荷重加算するこ
とでCM候補に対するスコアRを算出し、Rが所定の閾
値以上である場合には有力CM候補と判定する。付加条
件判定器22は、これらスコアRとスコア判定結果Zを
CM候補テーブル21aに追加記述し、CM候補テーブ
ル22aとして出力する。
【0181】図12には、付加条件判定器22の概略構
成を示す。
【0182】この図12において、CM候補テーブル2
1aの各特徴量Q1乃至QLは、それぞれ対応する関数演
算器501乃至50Lに送られ、それぞれ対応するパラメ
ータ変換関数H1()乃至HL()による変換演算が施された
後、さらにそれぞれ対応する重み付け器511乃至51L
により荷重W1乃至WLとの積がとられる。各重み付け器
511乃至51Lにより重み付けがなされた後の特徴量
は、総和加算器52での総和加算によりスコアRが算出
される。この総和加算器52から出力されたスコアR
は、スコア判定器53にて所定の閾値と比較され、スコ
アRが所定の閾値以上である場合には有力CM候補であ
る旨を示す判定結果が出力される。なお、スコア判定器
53によるスコア判定により所定の閾値未満であると判
定されたCM候補は、テーブルから消去される。
【0183】より具体的に説明すると、当該付加条件判
定器22におけるスコア算出演算は、式(26)に従っ
て行われる。
【0184】
【数14】
【0185】ただし、Hl()は各特徴量に対して予め定
めるパラメータ変換関数、Wlは予め決定しておく荷
重、そしてLは特徴量数(=14)である。なお、lは
1乃至14のうちの任意の数である。
【0186】ここで、各関数演算器501乃至50Lにお
けるパラメータ変換関数Hl()は、最も簡単には矩形関
数でよい。すなわち例えば、図13(B)に示すような
矩形関数Rect(x;t1,t2)を用い、予め各特徴量につい
て決定しておく標準値の下上限値をt1l,t2lとし、式
(27)により例えばQ1が標準値の範囲内ならば1、
範囲外ならば0となるようにする。
【0187】 Hl(Ql)=Rect(Ql;t1,t2) (27)
【0188】なお、境界付近で滑らかに0から1、1か
ら0へ推移させるようにする場合には、例えば式(2
8)のような、シグモイド関数Sigm(x;t1,t2)を用いる
こともできる。
【0189】
【数15】
【0190】図13(C)にシグモイド関数の概形を示
す。ただし、σ1l2lは推移の程度を表わす定数であ
り、予め特徴量の分布などに基づき決定しておく。
【0191】また、上記各重み付け器511乃至51L
よる加算荷重Wlは、予め特徴量の統計的性質に基づき
人為的に決定しておくこともできるが、既知の学習サン
プルに対して、ニューラルネットワーク(例えば中川著
「パターン情報処理」丸善(1999)などに詳説)の要領
で学習することで、自動的に荷重を決定することも可能
である。なお、lは1乃至14のうちの任意の数であ
る。
【0192】さらに、上記判定器53におけるスコア判
定は、式(29)のように、スコアRの閾値処理により
行う。
【0193】 Z=Unit(R−tr) (29)
【0194】ただし、Unit(x)は、図13(A)に
示すように、x>0で1、x<0で0となる単位ステッ
プ関数であり、trは予め定めるか或いは学習により自
動的に決まる判定閾値である。
【0195】次に、ルール判定器23は、上記付加条件
判定器22でのスコア判定により得られたCM候補テー
ブル22aを入力とし、後述するような所定のルール判
定により最終的なCM検出出力4aとしてCM開始時刻
と長さを出力する。すなわち、当該ルール判定器23で
は、同一時刻に複数のCM候補があった場合(以下、競
合関係という)に、どちらがよりCMとして確からしい
かをルール処理により判定する。
【0196】以下、ルール判定器23の動作を図14の
フローチャートを用いて説明する。
【0197】先ず、ルール判定器23は、ステップS8
0として、CM候補テーブルより、判定すべきCM候補
を選択する。この選択は、CM候補テーブル中で最古の
候補であり、予め設定された時間T4が経過したものか
ら順に行われる。T4は、数個のCMが十分含まれる程
度の時間長であり、例えば150秒間とする。
【0198】続いて、ルール判定器23は、ステップS
81として、選択したCM候補の区間中(TsからTs
+Twまでの間)に、他のCM候補が存在するかどう
か、CM候補テーブル中を検索する。このステップS8
1において、他のCM候補が存在しないと判定した場合
(No)、このCM候補はCM検出出力として出力さ
れ、CM候補テーブルより消去される。
【0199】一方、ステップS81において、他のCM
候補が存在すると判定された場合(Yes)、それらは
競合関係にあるとして、ステップS82にて先ず最小長
さ優先ルールが適用される。ここで、最小長さ優先ルー
ルは、ある時区間が、複数の長さの異なるCM候補の組
み合わせにより構成され得る場合、より短いCM候補で
構成されている方を優先するというルールである。すな
わち、例えば30秒という時区間に対して、1つの30
秒CMという可能性と、2つの15秒CMの組み合わせ
という可能性の、両方が同時に候補として存在する場合
には、15秒CMを選択し、30秒CMを棄却するとい
うルールである。
【0200】図15を用いて、この最小長さ優先ルール
の一例を説明する。
【0201】なおこの例には、図15(A)のように、
実際には4つのCM1乃至CM4が連続して放送されて
いる区間に対し、図15(B)中A乃至Hで示すような
8つの候補がCM候補テーブルに存在する場合が示され
ている。
【0202】先ず、図15(C)に示すように、AのC
M候補が判定中であるとすると、この候補Aと競合する
候補はEとHである。しかしながら、Eの区間はAとB
で記述でき、また、Hの区間はAとBとCとD等で記述
できることから、それぞれ棄却され、Aが採用される。
続いて、図15(D)に示すように、Bが判定中となっ
たときには、Fが競合相手となる(このとき、E、Hは
Aの判定により棄却済みとなっている)が、Fの区間は
BとCで記述できることから棄却され、Bが採用され
る。同様に、図15(E)に示すように、Cが判定中の
場合には、Gが競合相手となるが、Gの区間はCとDで
記述されることから棄却され、Cが採用される。最後
に、図15(F)に示すように、Dが判定されるときに
は、すでに競合相手は存在しないので、そもそもこのル
ールを適用する必要はなく、当該Dがそのまま採用され
る。
【0203】以上により、この時区間からは、CM候補
としてA,B,C,Dが選択されることとなる。このル
ールが適用できない競合関係については、そのままCM
候補テーブルに残してこの処理を終了する。
【0204】図14に戻り、ステップS82のルール判
定の後、ルール判定器23の処理は、ステップS83に
進む。ステップS83に進むと、ルール判定器23は、
最小長さ優先ルールを適用した結果、判定中のCMが棄
却されたか否か判断する。このステップS83におい
て、判定中のCMが棄却されと判断した場合(Ye
s)、ルール判定器23は、その候補をCM候補テーブ
ルから消去し、ステップS80に戻る。一方、ステップ
S83において、判定中のCMが棄却されていないと判
断した場合(No)、ルール判定器23は、ステップS
84において、再び判定中のCM候補の区間中に他のC
M候補が存在するかどうか、テーブル中を検索する。
【0205】このステップS84において他のCM候補
が存在しないと判定した場合(No)、ルール判定器2
3は、ステップS90において判定中のCM候補をCM
検出出力から出力し、CM候補テーブルから消去する。
一方、ステップS84にて他のCM候補が存在すると判
断した場合(Yes)、ルール判定器23の処理は、ス
テップS85に進む。
【0206】ステップS85に進むと、ルール判定器2
3は、隣接優先ルールを適用する。ここで、隣接優先ル
ールとは、複数のCM候補が競合関係にある場合、それ
ぞれ直前又は直後に隣接するCM候補を検索し、それが
存在する方を優先するというルールである。
【0207】図16を用いて、当該隣接優先ルールにつ
いて説明する。
【0208】なおこの例には、図16(A)のように、
実際には4つのCM11乃至CM14が連続して放送さ
れている区間に対し、図16(B)中I乃至Nで示すよ
うな6つの候補が存在する場合が示されている。また、
この例の場合、候補M及びNは、偶然CM中にカットチ
ェンジや小音量区間が存在したために候補となっている
が、このような候補は、実際には誤った区間であるとは
いえ、内容的にはCMを含んでいるため、CMらしさを
判定する付加条件のスコア判定によっても、棄却されな
い場合があるものである。
【0209】このような例において、先ず、図16
(C)に示すように、最古のIが判定される候補とな
る。当該Iと競合するものとしてMがあるが、Iには隣
接する候補Jが存在するのに対し、Mには隣接する候補
がないため、Iを採用し、Mを棄却する。次に、図16
(D)に示すように、Jが判定される候補となった場
合、Jと競合する候補としてNがあるが、Jには隣接す
る候補I、Kが存在するのに対し、Nには存在しないた
め、Jが採用されNが棄却される。次に、図16
(E),(F)に示すように、残りの候補K、Lには、
既に競合する候補がなくなるため、このルールは適用さ
れず、これらK、Lがそのまま採用される。
【0210】以上により、この図16に例示した区間か
らは、I,J,K,LがCM候補として選択されること
となる。
【0211】なお、競合関係の候補のいずれにも隣接候
補が無い場合、及び複数の候補にそれぞれ隣接候補があ
る場合には、それらはどちらも棄却されず、CM候補テ
ーブルに残される。
【0212】図14に戻り、ステップS85の処理後、
ルール判定器23の処理は、ステップS86に進む。ス
テップS86に進むと、ルール判定器23は、隣接優先
ルールを適用の結果、判定中のCMが棄却されたか否か
判断する。このステップS86において、判定中のCM
が棄却されたと判断した場合(Yes)、ルール判定器
23は、その候補をCM候補テーブルから消去し、ステ
ップS80の処理に戻る。一方、ステップS86におい
て棄却されていないと判定された場合(No)、ルール
判定器23は、次のステップS87において、再び判定
中のCM候補の区間中に、他のCM候補が存在するかど
うか、CM候補テーブル中を検索する。
【0213】このステップS87において、他のCM候
補が存在しなと判定された場合(No)、ルール判定器
23は、ステップS90において、判定中のCM候補を
CM検出出力から出力し、CM候補テーブルから消去す
る。一方、ステップS87において、他のCM候補が存
在すると判定した場合(Yes)、ルール判定器23
は、ステップS88において、スコア優先ルールを適用
する。ここで、スコア優先ルールとは、上記の各ルール
によっても競合関係が解消されない場合、付加条件判定
器22により得られた判定スコアRの高い候補を優先す
るというルールである。このスコア優先ルールは、対象
となる競合関係が解消するまで繰り返し適用する。
【0214】図17を用いて、当該スコア優先ルールに
ついて説明する。
【0215】なおこの例には、図17(A)のように、
実際には4つのCM21乃至CM24が連続して放送さ
れている区間に対し、図17(B)中P乃至Wで示すよ
うな7つの候補が存在する場合が示されている。
【0216】この例において、先ず、図17(C)に示
すように、最古のPが判定される候補となるが、この候
補PはUと競合関係がある。但し、このときの競合関係
は、最小長さ優先ルールによっても、また、隣接優先ル
ールによっても競合が解消されない。
【0217】したがって、この場合には、これら競合関
係にある候補と関連する全ての競合関係を、CM候補テ
ーブル中から検索する。すなわち、この場合は、(P−
U)、(U−Q)、(Q−V)、(V−R)、(R−W)、(W−
S)という、7候補に対する6つの競合関係が全て関連
しているので、スコア優先ルールでは、これら関連する
候補の中で最もスコアの高い候補を採用する。この例の
場合、判定スコアR(2.0)が最も高いスコアであるた
め、図17(D)に示すように、このスコアが採用さ
れ、その結果、Rと競合関係にある候補V、Wは棄却さ
れる。
【0218】しかしながら、図17(E)に示すよう
に、これによっても(P−U)の競合関係は解消されて
いない。したがって、再びこれらと関連する全ての競合
関係を、CM候補テーブル中から検索する。今回は、V
が棄却されたことにより、(P−U)、(U−Q)という、
3つの候補が関係する2つの競合関係のみとなる。
【0219】さらに、これらの候補の中で最もスコアの
高い候補Q(1.9)を採用し、図17(F)に示すよう
に、Qと競合関係にある候補Uを棄却する。
【0220】以上によって、Pに関係する競合関係はな
くなり、Pが採用される。また、U、V、Wは全て棄却
され、Q、R、Sが採用されることとなる。
【0221】なお、仮に、関連する全ての競合関係を検
索せず、対象となる競合関係(この例の場合、P,U)
のみでスコア優先ルールを適用すると、先ずUが採用さ
れ、Pは棄却される。後にUとQとの競合関係により、
一時採用されたUもまた棄却されてしまう。このよう
に、ルール判定器23では、偶然の処理順序により候補
Pが棄却されるようなことのないよう、関連競合関係の
検索を行っている。
【0222】以上のスコア優先ルールにより、選択され
た候補に関する競合関係は必ず解消されることになる。
【0223】図14に戻り、ステップS88の処理後、
ルール判定器23の処理は、ステップS89に進む。ス
テップS89に進むと、ルール判定器23は、スコア優
先ルールを適用の結果、判定中の候補が棄却されたか否
か判断する。このステップS89において、判定中の候
補が棄却されたと判断した場合(Yes)、ルール判定
器23は、その候補をCM候補テーブルより消去し、ス
テップS80に戻る。一方、ステップS89において、
棄却されなかった場合、ルール判定器23は、ステップ
S90のCM検出出力として、開始時刻とその長さを出
力し、CM候補テーブルから消去した後、ステップS8
0に戻る。
【0224】なお、本実施の形態では、例えば現行のア
ナログTV放送の映像音声記録装置を例にとったが、デ
ィジタルTV放送等に適用される場合にも同様のCM検
出部4が適用できることは明らかである。また、例えば
ラジオ放送に適用される場合には、上記CM検出部4か
ら映像信号の処理を担当する部分を省略することで同様
の機能が実現できる。
【0225】上述した一連の処理は、ハードウエアによ
り実現させることもできるが、ソフトウエアにより実現
させることもできる。一連の処理をソフトウエアにより
実現する場合には、そのソフトウエアを構成するプログ
ラムがコンピュータにインストールされ、そのプログラ
ムがコンピュータで実行されることより、上述した映像
音声記録装置が機能的に実現される。
【0226】図18は、上述のような映像音声記録装置
として機能するコンピュータ101の一実施の形態の構
成を示すブロック図である。CPU(Central Processing
Unit)111にはバス115を介して入出力インタフェ
ース116が接続されており、CPU111は、入出力イ
ンタフェース116を介して、ユーザから、キーボー
ド、マウスなどよりなる入力部118から指令が入力さ
れると、例えば、ROM(Read Only Memory)112、ハ
ードディスク114、またはドライブ120に装着され
る磁気ディスク131、光ディスク132、光磁気ディ
スク133、若しくは半導体メモリ134などの記録媒
体に格納されているプログラムを、RAM(Random Access
Memory)113にロードして実行する。これにより、
上述した各種の処理が行われる。さらに、CPU111
は、その処理結果を、例えば、入出力インタフェース1
16を介して、LCD(Liquid Crystal Display)などよ
りなる出力部117に必要に応じて出力する。なお、プ
ログラムは、ハードディスク114やROM112に予め
記憶しておき、コンピュータ101と一体的にユーザに
提供したり、磁気ディスク131、光ディスク132、
光磁気ディスク133,半導体メモリ134等のパッケ
ージメディアとして提供したり、衛星、ネットワーク等
から通信部119を介してハードディスク114に提供
することができる。
【0227】なお、本明細書において、記録媒体により
提供されるプログラムを記述するステップは、記載され
た順序に沿って時系列的に行われる処理はもちろん、必
ずしも時系列的に処理されなくとも、並列的あるいは個
別に実行される処理をも含むものである。
【0228】
【発明の効果】本発明の信号処理装置および方法、並び
にプログラムによれば、少なくても第1の信号の区間と
それ以外の信号の区間とが時分割的に存在する入力信号
から、所定の時間間隔を持つ信号の特徴的パターンに基
づいて、第1の信号の候補区間を検出し、候補区間の信
号から、文字を表示する信号を検出し、検出結果に基づ
いて、第1の信号らしさを表す特徴量を算出し、特徴量
に基づいて、第1の信号の区間を検出するようにしたの
で、第1の信号を適切に検出することができる。
【図面の簡単な説明】
【図1】本発明を適用した映像音声記録装置の構成例を
表すブロック図である。
【図2】図1のCM検出部の構成例を表すブロック図で
ある。
【図3】文字検出器12の動作を説明するフローチャー
トである。
【図4】小領域に割り当てられる番号を説明するための
図である。
【図5】CM検出部のフロントエンド部における映像信
号処理の流れを示すフローチャートである。
【図6】CM検出部のフロントエンド部における音声信
号処理の流れを示すフローチャートである。
【図7】CM検出部のCM候補検出器における動作の流
れを示すフローチャートである。
【図8】必須条件の算出例の説明に用いる図である。
【図9】CM候補テーブルを示す図である。
【図10】CM検出部の付加条件算出器における特徴量
の算出例の説明に用いる図である。
【図11】特徴量Q12を算出する場合の付加条件算出器
の動作を説明するフローチャートである。
【図12】付加条件算出器の構成例を示すブロック図で
ある。
【図13】スコア算出演算の際の単位ステップ関数、矩
形関数、シグモイド型関数の説明に用いる図である。
【図14】ルール判定器の動作の流れを示すフローチャ
ートである。
【図15】最小長さ優先ルールの説明に用いる図であ
る。
【図16】隣接優先ルールの説明に用いる図である。
【図17】スコア優先ルールの説明に用いる図である。
【図18】コンピュータ101の構成例を示すブロック
図である。
【符号の説明】
1 チューナ, 2 復調器, 3 時計部, 4 C
M検出器, 5 映像音声記録部, 10,14 A/
D変換器, 11 フレームメモリ, 12文字検出
器, 13 カットチェンジ検出器, 15 音声信号
バッファ,16振幅検出器, 17 相関検出器, 1
8 スペクトル検出器, 19 特徴量バッファ, 2
0 CM候補検出器, 21 付加条件算出器, 22
付加条件判定器, 23 ルール判定器, 24 動
作制御部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/78 H04N 5/92 Z 5/91 7/08 Z 7/08 5/91 Z 7/081 Fターム(参考) 5C025 BA25 BA30 DA08 DA10 5C052 AA01 AB02 CC06 DD04 5C053 FA14 FA21 FA23 GB06 GB11 GB12 JA01 JA16 KA03 KA05 KA25 KA26 LA06 LA07 5C063 AA01 AB01 AB05 AC01 AC05 AC10 CA20 CA23 CA36 DA01 DA05 DA07 DA11 DB10 5L096 AA06 DA02 FA00 FA44 FA69 GA08 JA11 JA28

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 少なくても第1の信号の区間とそれ以外
    の信号の区間とが時分割的に存在する入力信号から、所
    定の時間間隔を持つ信号の特徴的パターンに基づいて、
    前記第1の信号の候補区間を検出する候補区間検出手段
    と、 前記候補区間の信号から、文字を表示する信号を検出す
    る文字検出手段と、 前記文字検出手段による検出結果に基づいて、前記第1
    の信号らしさを表す特徴量を算出する算出手段と、 前記特徴量に基づいて、前記第1の信号の区間を検出す
    る区間検出手段とを備えることを特徴とする信号処理装
    置。
  2. 【請求項2】 前記算出手段は、前記文字検出手段によ
    り文字を表示する信号が検出されたとき、より大きい前
    記特徴量を算出することを特徴とする請求項1に記載の
    信号処理装置。
  3. 【請求項3】 前記文字検出手段により、文字を表示す
    る信号が検出されたとき、前記文字の表示位置を検出す
    る文字表示位置検出手段をさらに備え、 前記算出手段は、前記文字表示位置検出手段により画面
    中央に文字を表示する信号が検出されたとき、より大き
    い前記特徴量を算出することを特徴とする請求項2に記
    載の信号処理装置。
  4. 【請求項4】 前記文字検出手段により、文字を表示す
    る信号が検出されたとき、前記文字の出現時刻を検出す
    る文字出現時刻検出手段をさらに備え、 前記算出手段は、前記文字出現時刻検出手段により検出
    された出現時刻が前記候補区間の始点または終点付近に
    あるとき、より大きい前記特徴量を算出することを特徴
    とする請求項2に記載の信号処理装置。
  5. 【請求項5】 少なくても第1の信号の区間とそれ以外
    の信号の区間とが時分割的に存在する入力信号から、所
    定の時間間隔を持つ信号の特徴的パターンに基づいて、
    前記第1の信号の候補区間を検出する候補区間検出ステ
    ップと、 前記候補区間の信号から、文字を表示する信号を検出す
    る文字検出ステップと、 前記文字検出ステップでの検出結果に基づいて、前記第
    1の信号らしさを表す特徴量を算出する算出ステップ
    と、 前記特徴量に基づいて、前記第1の信号の区間を検出す
    る区間検出ステップとを含むことを特徴とする信号処理
    方法。
  6. 【請求項6】 少なくても第1の信号の区間とそれ以外
    の信号の区間とが時分割的に存在する入力信号から、所
    定の時間間隔を持つ信号の特徴的パターンに基づいて、
    前記第1の信号の候補区間を検出する候補区間検出ステ
    ップと、 前記候補区間の信号から、文字を表示する信号を検出す
    る文字検出ステップと、 前記文字検出ステップでの検出結果に基づいて、前記第
    1の信号らしさを表す特徴量を算出する算出ステップ
    と、 前記特徴量に基づいて、前記第1の信号の区間を検出す
    る区間検出ステップとを含むことを特徴とするコンピュ
    ータが読み取り可能なプログラムが記録されている記録
    媒体。
  7. 【請求項7】 少なくても第1の信号の区間とそれ以外
    の信号の区間とが時分割的に存在する入力信号から、所
    定の時間間隔を持つ信号の特徴的パターンに基づいて、
    前記第1の信号の候補区間を検出する候補区間検出ステ
    ップと、 前記候補区間の信号から、文字を表示する信号を検出す
    る文字検出ステップと、 前記文字検出ステップでの検出結果に基づいて、前記第
    1の信号らしさを表す特徴量を算出する算出ステップ
    と、 前記特徴量に基づいて、前記第1の信号の区間を検出す
    る区間検出ステップとを含む処理をコンピュータに実行
    させることを特徴とするプログラム。
JP2001217620A 2001-07-18 2001-07-18 信号処理装置及び方法、記録媒体、並びにプログラム Expired - Fee Related JP4512969B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001217620A JP4512969B2 (ja) 2001-07-18 2001-07-18 信号処理装置及び方法、記録媒体、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001217620A JP4512969B2 (ja) 2001-07-18 2001-07-18 信号処理装置及び方法、記録媒体、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2003032631A true JP2003032631A (ja) 2003-01-31
JP4512969B2 JP4512969B2 (ja) 2010-07-28

Family

ID=19051907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001217620A Expired - Fee Related JP4512969B2 (ja) 2001-07-18 2001-07-18 信号処理装置及び方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4512969B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007108960A (ja) * 2005-10-12 2007-04-26 Nippon Telegr & Teleph Corp <Ntt> ディジタルコンテンツ特徴量抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008141392A (ja) * 2006-11-30 2008-06-19 Toshiba Corp 字幕検出装置及び字幕検出方法並びにプルダウン信号検出装置
JP2009093472A (ja) * 2007-10-10 2009-04-30 Mitsubishi Electric Corp 文字表示領域検出装置及びその方法、並びに携帯端末
US8144991B2 (en) 2004-10-06 2012-03-27 Sony Corporation Apparatus, method, and computer program for processing information
JP2017505036A (ja) * 2014-09-09 2017-02-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ビデオ広告のフィルタリング方法、装置及び設備
JP2019507526A (ja) * 2016-01-05 2019-03-14 グレースノート インコーポレイテッド コンテンツ特徴に基づいたトリガ機能を有するコンピューティングシステム
JP2019212047A (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm情報生成装置、cm情報生成方法、及びプログラム
JP2019213067A (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 提供クレジット表示検出装置、提供クレジット表示検出方法、及びプログラム
WO2019235405A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm区間検出装置、cm区間検出方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02139740A (ja) * 1988-11-18 1990-05-29 Fujitsu General Ltd 記録・再生装置
JPH08339379A (ja) * 1995-06-12 1996-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像解析方法および装置
JPH1155613A (ja) * 1997-07-30 1999-02-26 Hitachi Ltd 記録および/または再生装置およびこれに用いられる記録媒体
WO2000007367A2 (en) * 1998-07-28 2000-02-10 Koninklijke Philips Electronics N.V. Apparatus and method for locating a commercial disposed within a video data stream

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02139740A (ja) * 1988-11-18 1990-05-29 Fujitsu General Ltd 記録・再生装置
JPH08339379A (ja) * 1995-06-12 1996-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像解析方法および装置
JPH1155613A (ja) * 1997-07-30 1999-02-26 Hitachi Ltd 記録および/または再生装置およびこれに用いられる記録媒体
WO2000007367A2 (en) * 1998-07-28 2000-02-10 Koninklijke Philips Electronics N.V. Apparatus and method for locating a commercial disposed within a video data stream
JP2002521977A (ja) * 1998-07-28 2002-07-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8144991B2 (en) 2004-10-06 2012-03-27 Sony Corporation Apparatus, method, and computer program for processing information
JP2007108960A (ja) * 2005-10-12 2007-04-26 Nippon Telegr & Teleph Corp <Ntt> ディジタルコンテンツ特徴量抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008141392A (ja) * 2006-11-30 2008-06-19 Toshiba Corp 字幕検出装置及び字幕検出方法並びにプルダウン信号検出装置
JP2009093472A (ja) * 2007-10-10 2009-04-30 Mitsubishi Electric Corp 文字表示領域検出装置及びその方法、並びに携帯端末
JP4613941B2 (ja) * 2007-10-10 2011-01-19 三菱電機株式会社 文字表示領域検出装置及びその方法、並びに携帯端末
JP2017505036A (ja) * 2014-09-09 2017-02-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド ビデオ広告のフィルタリング方法、装置及び設備
JP2019507526A (ja) * 2016-01-05 2019-03-14 グレースノート インコーポレイテッド コンテンツ特徴に基づいたトリガ機能を有するコンピューティングシステム
US11706500B2 (en) 2016-01-05 2023-07-18 Roku, Inc. Computing system with content-characteristic-based trigger feature
JP2019212047A (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm情報生成装置、cm情報生成方法、及びプログラム
JP2019213067A (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 提供クレジット表示検出装置、提供クレジット表示検出方法、及びプログラム
WO2019235407A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 提供クレジット表示検出装置、提供クレジット表示検出方法、及びプログラム
WO2019235406A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm情報生成装置、cm情報生成方法、及びプログラム
WO2019235405A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm区間検出装置、cm区間検出方法、及びプログラム

Also Published As

Publication number Publication date
JP4512969B2 (ja) 2010-07-28

Similar Documents

Publication Publication Date Title
US6928233B1 (en) Signal processing method and video signal processor for detecting and analyzing a pattern reflecting the semantics of the content of a signal
JP4300697B2 (ja) 信号処理装置及び方法
US7587124B2 (en) Apparatus, method, and computer product for recognizing video contents, and for video recording
JP4332988B2 (ja) 信号処理装置及び方法
US7214868B2 (en) Acoustic signal processing apparatus and method, signal recording apparatus and method and program
KR101385087B1 (ko) 정보 신호 처리 방법, 정보 신호 처리 장치 및 컴퓨터프로그램 기록 매체
US6993245B1 (en) Iterative, maximally probable, batch-mode commercial detection for audiovisual content
US6744922B1 (en) Signal processing method and video/voice processing device
US20090279840A1 (en) Image Digesting Apparatus
CN101129064A (zh) 动态生成过程建模
US8422853B2 (en) Information signal processing method and apparatus, and computer program product
JP2003032631A (ja) 信号処理装置及び方法、記録媒体、並びにプログラム
JP4253934B2 (ja) 信号処理装置及び方法
US8234278B2 (en) Information processing device, information processing method, and program therefor
JP2000285242A (ja) 信号処理方法及び映像音声処理装置
US8554057B2 (en) Information signal processing method and apparatus, and computer program product
JP4341503B2 (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体
JP2006054622A (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体
JP4507351B2 (ja) 信号処理装置及び方法
JP4470638B2 (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体
JP2006054621A (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100415

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees