JP2007049515A - 映像音声記録装置 - Google Patents

映像音声記録装置 Download PDF

Info

Publication number
JP2007049515A
JP2007049515A JP2005232948A JP2005232948A JP2007049515A JP 2007049515 A JP2007049515 A JP 2007049515A JP 2005232948 A JP2005232948 A JP 2005232948A JP 2005232948 A JP2005232948 A JP 2005232948A JP 2007049515 A JP2007049515 A JP 2007049515A
Authority
JP
Japan
Prior art keywords
transition point
video
broadcast
broadcast section
scene change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005232948A
Other languages
English (en)
Other versions
JP3894940B2 (ja
Inventor
Yoshiaki Kusunoki
恵明 楠
Isao Otsuka
功 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005232948A priority Critical patent/JP3894940B2/ja
Priority to US11/989,309 priority patent/US8886014B2/en
Priority to CN2006800291636A priority patent/CN101238727B/zh
Priority to PCT/JP2006/305337 priority patent/WO2007017970A1/ja
Priority to JP2007529457A priority patent/JP4707713B2/ja
Publication of JP2007049515A publication Critical patent/JP2007049515A/ja
Application granted granted Critical
Publication of JP3894940B2 publication Critical patent/JP3894940B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】テレビジョン放送番組の記録と並行して、CM放送区間の検出を可能とする映像音声記録装置を提供する。
【解決手段】映像音声記録装置100は、符号化ストリームを復号化し、復号化されたデータから映像のシーンチェンジを検出するシーンチェンジ検出部13と、入力された音声データから無音区間を検出する無音検出部14と、シーンチェンジと無音区間が同時に発生する変移点を検出する変移点検出部15と、検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCMフィルタ16と、符号化ストリーム及びCM放送区間の時刻情報などを記録するHDD11を備えている。
【選択図】 図1

Description

本発明は、テレビジョン放送番組の録画と並行して、録画されるテレビジョン放送番組の本編の間に挟まれているコマーシャルメッセージ(Commercial Message)放送の検出を行うことができる映像音声記録装置に関するものである。
テレビジョン放送は、その内容から「番組本編放送」と「コマーシャルメッセージ放送」に分類することができる。番組本編放送は、映画番組の場合には映画の内容自体の映像音声データに基づく放送部分である。一方、コマーシャルメッセージ放送は、広告主や広告代理店などの依頼主が放送局と契約を結んで、依頼主から提供を受けた映像音声データに基づく放送部分であり、番組本編放送の合間に放送されるものである。また、コマーシャルメッセージ放送には、放送局が自らの広告宣伝をするための放送も含まれる。本出願においては、「番組本編放送」を「番組本編」と、「コマーシャルメッセージ放送」を「CM放送」とも記す。番組本編とCM放送とは、内容の関連が希薄である場合が多く、番組本編の視聴に集中したい視聴者にとっては、テレビジョン放送を録画する際又は視聴する際に、CM放送を効率よく削除したい、又は見飛ばしたい、とする要望がある。
従来の映像音声記録装置は、テレビジョン放送の音声方式を検出し、検出された音声方式に基づいて番組本編とCM放送との識別を行っていた。番組本編の音声方式は、モノラル音声又は二ヶ国語音声(洋画における日本語と英語、など)であることが多く、また、一般に、CM放送の音声方式は、ステレオ音声であることが多い。このような違いを利用して、ステレオ音声が検出された区間をCM放送区間と判別して、録画時にはCM放送区間の録画を行わない(すなわち、削除する)、又は、視聴時にはCM放送区間を見飛ばす(すなわち、スキップする)処理を行うようにしていた。
上記従来のCM検出方式は、番組本編の音声方式がCM放送の音声方式と同じステレオ音声である場合には、機能しなくなる。この改善策として、番組本編とCM放送との境界に挿入される「ブラック・フレーム」と呼ばれる全画面黒色のフレーム映像を検出してCM放送区間を特定する提案がある(例えば、特許文献1参照。)。また、番組本編とCM放送との境界に生じる無音区間を検出し、検出された無音区間の出現間隔からCM放送区間を特定する提案もある(例えば、特許文献2参照。)。また、映像のシーンチェンジの発生頻度を利用してCM放送を抽出する提案もある(特許文献3参照)。さらに、視聴時に、ユーザーのボタン操作によって、15秒などの固定時間を見飛ばし(すなわち、スキップ)するユーザーインターフェースを提供する提案もある。
特表平8−507633号公報(第12−15頁、図1) 特開2003−47031号公報(第5−8頁、図1) 特開2000−165796号公報(第7頁、図14)
しかしながら、ブラック・フレームを検出してCM放送区間を特定する特許文献1に記載の方法では、国や地域、又は放送局によってはブラック・フレームが挿入されていないことがあるので(実際に、国内放送において、ブラック・フレームの挿入は法令で義務付けられてはいない)、CM放送区間の自動検出の確度を十分に高くできないという問題がある。
また、特許文献2又は3に記載の方法では、無音区間やシーンチェンジが番組本編の中にも多数存在するので、CM放送区間を高精度に特定することは困難であるという問題がある。
さらに、ユーザーのボタン操作によって15秒スキップさせる方法では、15秒の倍数系列にない既定外の時間長(例えば、5秒の番組スポット宣伝など)を持つCM放送には対応することができないという問題がある。
そこで、本発明は、上記従来技術の課題を解決するためになされたものであり、その目的は、テレビジョン放送番組の記録と並行して、CM放送区間の抽出を可能とする映像音声記録装置を提供することである。
本発明の映像音声記録装置は、入力された映像・音声データを符号化して符号化ストリームを出力する符号化手段と、前記符号化手段から出力された符号化ストリームを記録する記録手段と、前記符号化手段から出力された符号化ストリームを復号化し、該復号化されたデータから映像のシーンチェンジを検出する映像変化点検出手段と、入力された音声データから無音区間を検出する無音検出手段と、前記映像変化点検出手段によって検出されたシーンチェンジと前記無音検出手段によって検出された無音区間が同時に発生する変移点を検出する変移点検出手段と、前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段とを有することを特徴としている。
本発明の映像音声記録装置によれば、放送番組の記録と並行してCM放送区間検出処理を実行するのでリアルタイムにCM放送区間検出を行うことができるという効果がある。
実施の形態1.
図1は、本発明の実施の形態1の映像音声記録装置100の構成を概略的に示すブロック図である。図1に示されるように、映像音声記録装置100は、アンテナ1によって受信された放送波から録画する放送番組を選局するチューナ2と、チューナ2から出力されたアナログ映像信号をデジタル化するビデオA/D変換部3と、チューナ2から出力されたアナログ音声信号をデジタル化するオーディオA/D変換部4と、デジタル映像信号をMPEG−2(Moving Picture Experts Group−2)に圧縮符号化する符号化手段としてのビデオエンコーダ5と、デジタル音声信号を、例えば、リニアPCM(Linear pulse code modulation)又はドルビーデジタル(Dolby Digital)に符号化する符号化手段としてのオーディオエンコーダ6と、符号化された映像及び音声信号を1つの符号化ストリームに多重するマルチプレクサ(Multiplexer)(以下「Mux」とも記す。)7と、ビデオエンコーダ5、オーディオエンコーダ6及びMux7を制御する録画制御部8とを有している。
また、映像音声記録装置100は、符号化ストリームを記録する記録手段としてのハードディスクドライブ(HDD)11と、Mux7で多重された符号化ストリームをHDD11に安定して書き込むためのストリーム制御手段としてのストリーム制御部9と、符号化ストリームを一時的に記憶するストリームバッファ17と、生成された各符号化ストリームをファイルとしてHDD11に保存するためのファイルシステム部10と、生成された符号化ストリームの番組名や生成日時に加え、特殊再生を実現するためのアドレス情報や後述するCM区間情報を生成及び管理するナビゲーション部12とを有している。
さらに、映像音声記録装置100は、映像の場面転換シーンを検出する映像変化点検出手段としてのシーンチェンジ検出部13と、音声の無音区間を検出する無音検出手段としての無音検出部14と、シーンチェンジと無音区間が同時に発生する変移点を検出する変移点検出手段としての変移点検出部15と、変移点を検出するためにシーンチェンジと無音区間の情報を保持する、変移点検出部15内に備えられた一時記憶手段としての変移点マッチングバッファ19と、複数の変移点からCMに固有の周期性等からCM区間を検出するCM放送区間判定手段としてのCMフィルタ16と、CMフィルタ16で解析する変移点を記憶する変移点スタックテーブル18とを有している。
図1には、記録手段としてHDD105が示されているが、記録手段は、DVDのような光ディスクや磁気テープなどの他の情報記録媒体であってもよい。また、映像音声記録装置100は、放送番組を受信及び録画する受信機又はDVD/HDDハイブリッドレコーダであってもよい。さらに、映像音声記録装置100は、家庭用のビデオレコーダに限らず、パーソナルコンピュータ、映像サーバ、又は、監視システム用の監視レコーダなどの各種用途に適用できる。
ファイルシステム部10は、HDD11に書き込む情報をファイル化することによって書き込み情報に対するアクセスが簡単に行えるようにするためのデータ管理を行う。ファイルシステム部10によって、ストリーム制御部9及びナビゲーション部12は、ストリームや情報をHDD11に書き込み又はHDD11から読み出しを行うときに、HDD11上の直接のアドレスを気にすることなく、ファイルを指定することによって、先頭から順に、又は、指定した位置から順に読み出し及び書き込みを行うことができる。
ビデオエンコーダ5による符号化方式であるMPEG−2は、可変レートに対応しており、そのため、1秒間に発生する符号量(ビットレート)は時間によって大きく変動する。そのため、ストリーム制御部9は、HDD11へのデータ書き込み及びHDD11からのデータ読み出しによって符号化ストリームがオーバーフロー又はアンダーフローしないように、符号化ストリームをストリームバッファ17に一時的に保持させ、HDD11の状態に応じて符号化ストリームのHDD11への書き出し及びHDD11からの読み込みを行っている。ストリームバッファ17は、リングバッファで構成されており、書き込み位置ポインタと読み出し位置ポインタによって有効なデータ領域が管理されている。すなわち、データの書き込み時には、書き込み位置ポインタを先頭にデータサイズ分書き込みを行い、書き込んだデータサイズ分だけ書き込み位置ポインタを進める。一方、データの読み出し時には、読み出し位置ポインタを先頭にデータサイズ分読み出しを行い、読み出したデータサイズ分だけ読み出し位置ポインタを進める。ただし、リングバッファの終了位置に来たときは、ポインタを先頭の位置に戻す処理を行う。
次に、放送番組を記録する動作について説明する。ユーザーが手動で録画開始ボタンを押した、又は、予め録画タイマーで設定しておいた録画開始時間になると、チューナ2はアンテナ1で受信した放送波から指定チャンネルを選局する。チューナ2から出力された映像及び音声のアナログ信号は、それぞれビデオA/D変換部3及びオーディオA/D変換部4に送られ、デジタル映像信号及びデジタル音声信号に変換される。録画制御部8は録画開始時にビデオエンコーダ5及びオーディオエンコーダ6に対してエンコード開始を、Mux7に対して多重処理開始を指示する。すると、ビデオA/D変換部3又はオーディオA/D変換部4から出力されたデジタル映像信号及びデジタル音声信号が順次ビデオエンコーダ5及びオーディオエンコーダ6で圧縮符号化処理が行われ、さらに、Mux7で1つのプログラムストリームに多重化が行われ、ストリーム制御部9でストリームの制御を行いながらHDD11に記録されていく。
ビデオエンコーダ5は、エンコード単位であるGOP(Group of Pictures)の符号化が完了する毎に録画制御部8にGOP符号化完了通知を送る。ストリーム制御部9は、ビデオエンコーダ5及びオーディオエンコーダ6によって符号化されMux7で多重された符号化ストリームをストリームバッファ17の書き込み位置ポインタを先頭に順次書き込む。一方、ストリーム制御部9は、HDD11が書き込み状態になっていることを確認しながら、ストリームバッファ17の読み出し位置ポインタから符号化ストリームを読み出し、HDD11に書き込みを行う。録画が実行されている間、前記動作を繰り返し行う。録画終了時には、録画制御部8は、ビデオエンコーダ5及びオーディオエンコーダ6に対して符号化終了を指示し、符号化を停止させる。符号化停止後、ストリーム制御部9は、ストリームバッファ17に残っている符号化ストリームを全てHDD11に書き込む。
次に、シーンチェンジ検出と無音検出について説明する。録画制御部8は、GOPの符号化完了をビデオエンコーダ5から受け取る毎に、シーンチェンジ検出部13に対してシーンチェンジ検出コマンドを送る。シーンチェンジ検出部13は、エンコードが完了したGOPデータをストリーム制御部9から読み出し、映像のシーンチェンジの検出を行う。検出方法の一例としては、以下の方法がある。まず、読み出したGOP単位のデータからIピクチャの復号化を行い、ヒストグラムを作成する。そのヒストグラムと一つ前のIピクチャのヒストグラムと比較を行い、ヒストグラムの各要素値の絶対値の差の合計をシーンチェンジ差異値と定義し、そのシーンチェンジ差異値が予め設定された閾値より大きければシーンチェンジであると判定する。以下の説明においては、説明を簡単にするために、GOPを構成するピクチャ数は15枚固定であり、そのGOPの時間は0.5秒であるものとする。よって、シーンチェンジの発生した時刻は、GOPの個数で簡単に表すことが可能となる。
オーディオA/D変換部4は、アナログ音声信号をデジタル音声信号であるリニアPCM信号に変換する。無音検出部14は、入力されたリニアPCM信号の振幅が予め設定されている閾値以下の状態が予め設定された時間以上続けば無音区間であると判定する。ここでは、入力されたリニアPCM信号の振幅が予め設定されている閾値以下の状態が、300ミリ秒以上続けば、無音区間が発生したと判定する。無音区間の条件として、ある時間以上、リニアPCM信号の振幅が低い状態が続くことを必要としている理由は、瞬間的な無音を、無音区間と判定しないようにするため、及び、無音の発生毎に後述するCM放送区間検出動作の頻度が多くなると、システムの処理負荷が大きくなってCM放送区間検出以外の動作に支障を来たすおそれがあるからである。無音区間であると判定した場合、録画開始からのサンプル数の累積番号により無音開始時刻を算出する。また、無音区間が継続されている状態でリニアPCM信号の振幅が、予め設定されている閾値より大きくなった場合、無音区間が終了したと判定し、同様にサンプル数の累積番号から無音終了時刻を算出する。
図2は、図1に示される映像音声記録装置100の変移点検出部15の動作を示すフローチャートである。変移点検出部15は、シーンチェンジ検出部13から送られるシーンチェンジ情報又は無音検出部14から送られる無音情報に基づいて動作を切り替える。例えば、変移点検出部15の動作が開始されて、シーンチェンジ検出部13においてシーンチェンジの検出動作を行い(ステップS101)、シーンチェンジ情報としてシーンチェンジ検出フラグ、GOP番号、及びシーンチェンジ差異値が変移点検出部15に送られたとすると、ステップS101において検出されたシーンチェンジ情報は、変移点検出部15内の変移点マッチングバッファ19に保存される(ステップS102)。
一方、無音検出部14によって無音区間が検出されると(ステップS103)、無音区間情報として無音検出フラグ、無音発生時刻、及び無音終了時刻を変移点検出部15に送る。ステップS103において判定された無音区間に関する無音情報は、変移点検出部15内の変移点マッチングバッファ19に保存される(ステップS104)。無音区間が検出された場合は、さらに変移点マッチングバッファ19上で変移点検出、つまりシーンチェンジと無音が同時に発生した時間位置の検出を行う(ステップS105)。無音区間検出毎に変移点検出を行うのは、シーンチェンジ検出区間と無音区間の積情報を取るには、シーンチェンジ検出より発生頻度の低い無音区間検出の度に行うことが処理効率の面から適しているためである。変移点マッチングバッファ19には、最新のシーンチェンジ及び無音区間の情報が一時的に保持されており、双方が一致した場合は、一致した情報が次の処理であるステップS106に送られるとともに、そのシーンチェンジ情報及び無音区間情報と、それ以前のシーンチェンジ情報及び無音区間情報が破棄される。また、予め設定された一定時間が経過したときにも、シーンチェンジ情報及び無音区間情報が破棄される。このような制御によって、有限のバッファサイズであっても、リアルタイムにシーンチェンジと無音区間の一致を検出することができる。したがって、変移点マッチングバッファ19上で、無音区間の開始時刻から終了時刻までの間に発生したシーンチェンジを、シーンチェンジのGOP番号をもとに変移点を検出することができる。そして、シーンチェンジのGOP番号を変移点の時刻を表す値として利用する。このようにして選出された変移点及び一致したシーンチェンジの差異値及び無音の時間長を次のCMフィルタ16に送り(ステップS106)、CMフィルタ16内の変移点格納用の変移点スタックテーブル18に保存し、CMフィルタ16の動作を実行する(ステップS107)。
次に、図1に示されるCMフィルタ16によってCM放送区間を検出する方法について説明する。図1に示されるように、CMフィルタ16内には、変移点に関する情報を記憶する変移点スタックテーブル18が設けられている。図3は、変移点スタックテーブル18の一例を示す図である。変移点スタックテーブル18は、録画と並行して実行されるCM放送区間検出動作時に更新されるので、リングバッファの構成をとる。よって、リードポインタからライトポインタの手前までがCM放送区間検出のための処理範囲である。変移点スタックテーブル18内には、変移点の時間位置を示す変移点GOP番号と、後続する変移点がCMとみなされた場合の最終変移点の時間位置を示す連結終了GOP番号と、後続する変移点の個数を示す変移点カウンタと、変移点における無音時間長と、変移点におけるシーンチェンジ差異値と、この変移点の有効・無効を示す有効無効フラグとが設けられている。
変移点GOP番号は、シーンチェンジが検出されたGOP番号である。実施の形態1においては、シーンチェンジの検出精度を1GOPとしているため、録画開始からのGOPの累積番号で時間を表すことができる。
連結終了GOP番号とは、ある変移点を基点としたCM放送区間における最終変移点のGOP番号である。図3においては、変移点GOP番号‘10’の場合、GOP番号‘10’、‘40’、‘101’においてCMが継続して検出されるので、GOP番号‘101’が連結終了GOP番号になる。変移点検出部15では、変移点33gが検出されると、GOP番号‘101’にGOP番号‘130’が連結され、変移点33bから変移点33gまでがCM放送区間と判定される。また、変移点GOP番号に後続する変移点がない場合は、連結終了GOP番号は、変移点GOP番号と同じ値になる。
変移点カウンタは、CM放送区間においてCMが変移点で連結された場合における変移点の数を示す。
無音時間長は、変移点における無音区間の長さをミリ秒単位で示す。
シーンチェンジ差異値は、変移点におけるシーンチェンジの変化量を0から1までの値で示す。シーンチェンジ差異値が大きいほど、映像の変化量が大きいことを意味する。
有効無効フラグは、変移点スタックテーブル内において処理対象範囲であることを示すフラグであり、変移点が登録されたときには有効‘1’が設定され、CMフィルタ16の処理において、例えば、‘40’のように、先行する変移点に連結された変移点について無効‘0’に変更される。また、ある変移点が処理対象範囲から外れた場合、例えば、‘10’、‘40’、‘101’、‘131’をCM区間として検出した場合に、‘10’以前の‘6’や、‘10’から‘131’の間の全ての変移点‘62’、‘83’を無効‘0’にすることによって、処理の高速化及び変移点スタックテーブルに必要なメモリサイズの低減を図ることができる。
CMフィルタ16においては、変移点スタックテーブル18の要素である変移点をそれぞれ比較し、変移点の間隔が所定の基準間隔、例えば、15秒、30秒、60秒、又は90秒相当であるものを抜き出していく。そのとき、検出誤差、CMのフレームレベルでの長さのばらつき等によりCMの長さが15秒からずれる可能性があるので、そのための許容誤差を、例えば、1GOP分設ける。よって、先の変移点の間隔として有効な間隔は、GOPの個数で表現でき、30GOP±1GOP、60GOP±1GOP、120GOP±1GOP、及び180GOP±1GOPのように、±1GOPの許容誤差を設けたGOPの数で表現することができる。CMフィルタ16においては、上記変移点の間隔が上記のように予め設定しているGOPの間隔と一致する変移点の間隔をCM候補間隔とする。さらに、CM候補間隔が連続して2個以上ある場合には、その区間をCM放送区間とする。
図4(A)乃至(E)は、実施の形態1の映像音声記録装置100におけるCM放送区間検出動作を説明するための図である。図4(A)乃至(E)を用いてCM区放送間を特定する方法について説明する。無音検出部14によって無音区間31a,…,31mが検出された場合を説明する。一方、図4(B)に示されるように、シーンチェンジ32a,…,32oが存在するものとする。無音区間については、無音発生時刻と無音終了時刻が得られ、シーンチェンジについては、シーンチェンジの発生したGOP番号が得られる。実施の形態1においては、GOPのフレーム数を固定にしているので、GOP番号によって一意に時刻を表すことができる。無音とシーンチェンジの時刻を比較し、同一時刻に無音とシーンチェンジが発生した場合に、この点を変移点とする。ここでは、図4(C)に示されるように、変移点33a,…,33iが検出されている。さらに、各変移点33a,…,33iの間で、上記CM間隔に一致するものをCMと判定する。ここでは、変移点33bから変移点33cまでの間隔が30GOPであり、変移点33cから変移点33fまでの間隔が61GOPであり、変移点33fから変移点33gまでの間隔が29GOPであるので、それぞれの区間がCMとして検出され、さらに、CMが3個連続して続くので、変移点33b,…,33gがCM放送区間であると判定する。さらに、変移点33gから201GOP経過したところで変移点33iが検出されるが、変移点33gから変移点33iまでの間隔は、予め設定されたCM放送区間の最大値である180GOPを超えているので、CMが終了したと判断することができ、CM放送区間検出を完了したことを示している。
次に、図5を用いてCMフィルタ16によるCM検出処理手順について説明する。変移点検出部15においてシーンチェンジと無音区間が同時に発生する変移点が検出されると、その情報がCMフィルタ16に送られることによって、CMフィルタ16の動作が開始する(ステップS401)。検出された変移点の情報は、CMフィルタ16内の変移点スタックテーブル18の最後尾に保存される(ステップS402)。CMフィルタ16内の変移点スタックテーブル18に保存される情報は、有効無効フラグ、変移点GOP番号、連結終了GOP番号、連続するCMとして検出された変移点の個数である変移点カウンタ値、検出された変移点の無音時間長、及びシーンチェンジの変化量を示すシーンチェンジ差異値である。次に、変移点スタックテーブル18の読み出し基点を設定する(ステップS403)。図4(C)において、例えば、前回、変移点33aの処理まで完了していたとすると、今回は次の変移点33bを最初の基点とする。次に、変移点の終点側を設定する(ステップS407)。図4(C)においては、変移点33cを終点とする。もしも、変移点スタックテーブル18に終点となる変移点がなければ(ステップS408)、次の基点を取得する(ステップS404)。図4(C)においては、基点が変移点33aで終点が変移点33iの場合に、基点を変移点33bにする処理である。ここで、次の基点が見つからなければ(ステップS404)、CM検出処理を終了する(ステップS406)。基点と終点が決定した場合、基点から終点までの時間長を求める(ステップS409)。図4(C)においては、基点が変移点33b、終点が変移点33cの場合には、基点‘10’と終点‘40’との差(すなわち、変移点間隔)である30GOPが、時間長である。この時間長が、CM基準時間である30GOP±1GOP、60GOP±1GOP、120GOP±1GOP、及び180GOP±1GOPのいずれかに一致していれば(ステップS410)、基点の連結終了GOP番号を終点の連結終了GOP番号で置き換える(ステップS411)。さらに、終点の有効無効フラグを無効化し(ステップS412)、基点の変移点カウントを一つ増分する(ステップS413)。また、ステップS410においてCM基準時間長ではないと判定された場合は、次に、基点と終点間の時間長が最大CM基準時間長である180GOP±1GOPを超えているか否かを判断し(ステップS414)、超えていると判定された場合には、基点から連結終了GOP番号までをCM放送区間と判定し、CM放送区間の情報を録画制御部8に送る(ステップS415)。さらに、次回のCM放送区間検出処理の基点を今回のCM放送区間の最終変移点の次の変移点に設定すると共に、検出した最終変移点より前の変移点の有効無効フラグを無効化する(ステップS416)。
上記ステップを録画動作中継続して実行することによって、記録する放送番組のCM放送区間をリアルタイムに検出することができる。CMフィルタ16で検出したCM放送区間の時刻情報は、録画制御部8に一旦渡され、録画した番組の管理情報を扱うナビゲーション部12に伝えられ、ファイルシステム10によってファイル化され、CM放送区間情報記録手段として機能するHDD11上に記録される。
上記のように映像音声記録装置100を構成することによって、放送番組を録画しながらCM放送区間を検出することができる。
また、シーンチェンジ検出機能を有しないエンコーダを用いた場合、通常、録画実行後にあらためて録画された番組を解析する必要があるが、本発明の構成においては、録画動作と並行してCM放送区間の検出が行うことができるので、エンコーダの選択の範囲が広くなり、結果コストや調達性を重視したエンコーダの選択が可能になる。
さらに、ストリーム制御部9からシーンチェンジ検出部13及び無音検出部14にストリームを送ることによって、HDD11に録画されている番組に対して、CM放送区間検出を行うことも可能である。ただし、その場合、無音検出はシーンチェンジと同様にストリームから解析する方法を使用しなければならない。
また、シーンチェンジ検出結果と無音検出結果を一時的な記憶領域である変移点マッチングバッファ19に記録し、変移点マッチングバッファ19の記憶領域上で比較することによって、リアルタイムに変移点を検出することができ、よって、録画と並行してCM放送区間の検出が可能になる。また、同時に発生しているシーンチェンジと無音区間が、ある程度の時間差をもって変移点検出部15に通知されたとしても、変移点マッチングバッファ19で情報が保持されているので、片方の情報をとりこぼすことなくCM放送区間の検出を実行できる。
また、シーンチェンジ検出時には一時的な記憶領域である変移点マッチングバッファ19への登録のみを実行し、一方で無音が検出されたときは変移点マッチングバッファ19への登録だけでなく、変移点マッチングバッファ19上で無音と同時に発生するシーンチェンジを検出し、さらに、CM放送区間の検出処理を行う構成にすることによって、検出回数の少ない無音検出に同期して処理を行うことができるので、CPUの処理時間が少なく、かつシステム負荷の少ない状態でCM放送区間の検出を行うことができる。
また、CM放送区間検出の単位をフレーム単位でなく、例えば、GOP単位とすることによって処理頻度及び処理負荷の低減を計れるだけでなく、CM毎にCMの長さが数フレーム違う場合であっても、各CMの長さの違いに影響されずに、CM放送区間の検出を行うことができる。
また、以上の説明においては、シーンチェンジ検出単位を1GOPとしているが、シーンチェンジ検出単位を複数のGOP単位としてもよい。また、シーンチェンジ検出単位を任意の数のフレーム毎にしてもよい。
また、以上の説明においては、シーンチェンジ及び無音検出処理を行う方法としてソフトウェアによる例を示したが、ハードウェアによって実行してもよい。また、音声はオーディオA/D変換部4出力を直接解析しているが、符号化ストリームから解析して無音を検出してもよい。
実施の形態2.
実施の形態2においては、CM間の境界付近に複数の変移点が存在する場合に、CM間の境界と判定する変移点を選択する方法について説明する。通常、CMの前後部分には、宣伝を行う企業名や製品名などのテロップが一時的に表示されることが多い。このため、CM間の境界付近においては、無音及びシーンチェンジが同時に起こり、変移点が複数回連続して発生する場合が多い。一方、CM放送区間の検出においては、CMの時間長さの誤差や検出遅れ及び検出ばらつきを補うため、基準とするCM長さに対して、ある程度の幅を持たせて検出を行っている。例えば、実施の形態1においては、15秒のCMを検出するために、30±1GOPの範囲内で検出を実行している。しかしながら、±1GOPの検出幅において複数回の変移点が存在することがあり、候補となる変移点から1つの変移点を選択する指針が必要であった。そこで、実施の形態2においては、候補となる変移点から1つの変移点を選択する指針となる3つの選択基準を示す。
図6(A)乃至(C)は、候補となる変移点と選択された変移点を示している。第1の方法は、図6(A)に示すように、変移点間隔が30GOP、60GOP、及び90GOPのように、基準時間から±0GOPとなるように、次の変移点を選択していく方法である。
第2の方法は、図6(B)のGOP番号‘30’からGOP番号‘59’までに示すように、あるCM境界検出において選択された変移点の間隔が29GOP(=30GOP−1GOP)となった場合に、図6(B)のGOP番号‘60’からGOP番号‘90’までに示すように、次のCM境界検出における選択された変移点の間隔を、31GOP(=30GOP+1GOP)を中心に選択する方法である。これは、選択された変移点が一時的に基準値からずれた場合(図6(B)におけるGOP番号‘59’に相当する。)、次の変移点は、ずれを打ち消すGOPを優先して選択するものである(図6(B)におけるGOP番号‘90’に相当する)。すなわち、予め設定された基準時間(例えば、30GOP)を中心とする所定の時間範囲内(±1GOPの範囲内)に、検出されたシーンチェンジと検出された無音区間が同時に発生する変移点が複数検出された場合には、CMフィルタ16は、直前に判定されたCMの時間長と、次に前判定されるCMの時間長との合計が、前記予め設定された基準時間(例えば、30GOP)の整数倍に近づける度合いの大きい変移点をCM放送区間を規定するための変移点と判定する。
第3の方法は、累積した時間が、できるだけ±0GOPになるように選択する方法である。これは、図6(C)に示されるように、選択された変移点をGOP番号‘0’、‘29’、‘58’とした後に、GOP間隔が30±0GOPとなるGOP番号‘88’を選択せずに、GOP間隔が30+1GOPとなるGOP番号‘89’を選択し、さらに次の検出に際して、GOP間隔が30GOP−1GOPや30GOP±0GOPを選択せずに、GOP番号‘120‘を選択することによって、変移点のずれが全体として±0GOPになるようにするものである。すなわち、予め設定された基準時間(例えば、30GOP)を中心とする所定の時間範囲内(±1GOPの範囲内)に、検出されたシーンチェンジと検出された無音区間が同時に発生する変移点が複数検出された場合には、CMフィルタ16は、判定されるCM放送区間を、予め設定された基準時間(例えば、30GOP)の整数倍に近づける度合いの大きい変移点をCM放送区間と規定するための変移点と判定する。
上記第2の方法又は第3の方法を採用することによって、検出誤差等によって、一旦変移点が本来のCM間の境界位置からずれた場合であっても、補正処理が可能となり、結果としてCM放送区間検出精度を向上させることができる。
また、変移点のずれが全体として±0GOPとなる変移点を優先的に選択することによって、検出したCM放送区間が基準時間に近くなるようになり、CM放送区間の検出精度が向上する。
また、累積時間数又はGOP数の累積値の基準時間からのずれが、±0GOPになるように、検出した変移点に対して重み付けを行うことによって、1つのCMを検出するための誤差である±1GOPがCM放送区間を継続して実行するなかで、CMの数が増えるほど累積する、すなわち、本来のCM境界からずれる、さらには本来のCM境界からずれることによって検出すべきCMが検出できなくなるという問題を低減することができる。
なお、実施の形態2において、上記以外の点は、上記実施の形態1の場合と同じである。
実施の形態3.
実施の形態3においては、変移点における無音時間長を用いてCM放送区間の検出精度を向上させる方法を説明する。
一般に、テレビ放送番組においては、1つのCMの前後には約0.5秒程度の無音部分が存在し、CMとCMのつなぎ目である境界付近においては、双方のCMの無音部分の和で約1秒(≒0.5秒×2)の無音部分が存在する。一方、番組本編からCMに移行するとき、及び、CMから番組本編に移行するときは、番組本編側の無音部分が短い場合が多く、双方の無音部分の和で約0.6秒程度の無音部分が入るのみである。
図7は、実際に放送されている任意の20番組、591本のCMを含む放送区間において、あるCMとその次のCMの間の無音部分の時間長さを測定した結果を示すグラフである。図7に示されるように、CM間の無音部分のほとんどが0.8秒から1.4秒までの間に存在している。
図8は、図7の場合と同じ任意の20番組の放送区間において、CM放送区間が終了して番組本編に移行するときの無音部分の時間長さを測定した結果を示すグラフである。図8に示されるように、CM放送区間から番組本編に移行するときは、無音部分の時間長さのほとんどが、約0.4秒から約1.2秒までの間に存在していることがわかる。すなわち、実施の形態1で示した変移点における無音時間長が0.4秒から0.8秒までの間、又は、1.4秒以上であれば、ほとんどの場合においてCMが終了し番組本編に移行したと判断することができる。
図9は、CM間の無音時間長を用いてCM放送区間を検出する方法を示すフローチャートである。図9において、図5のステップと同じステップには、同じ符号を付している。実施の形態3における基本的なCM放送区間の検出方法は、実施の形態1の場合と同じであるが、実施の形態3においては、ステップS420で変移点の無音時間長について検証を行い、CMが2つ以上検出されている状態において、先述のとおり、無音時間長が0.8秒から1.4秒まで(すなわち、第1の規定範囲)に入らなければCMが終了したと判定する工程が追加されている。また、CM放送区間が検出された場合においても、CM放送区間の各変移点の無音時間長において少なくとも1つ以上、0.8秒から1.4秒までの範囲内の時間長を持つ無音部分が存在しているかを検証し(ステップS420)、0.8秒から1.4秒までの範囲内の時間長を持つ無音部分が含まれていなければ、CM放送区間として採用しない工程が追加されている。
上記のように構成することによって、CM放送区間の終了及び本編開始位置を検出することができ、CM放送区間の検出精度を向上させることができる。
とくに、CMから番組本編に移行した後に、CM間隔と同じ間隔でシーンチェンジと無音が発生した場合、番組本編の冒頭部分をCMであると誤検出する場合があるが、無音時間長によりCM終了位置を精度良く検出でき、番組本編冒頭をCMと誤検出する事態の発生頻度を低減でき、結果として、CM放送区間の検出精度を向上させることができる。
さらに、番組本編中においてシーンチェンジと無音区間が同時に複数発生し、その間隔がCM放送区間におけるシーンチェンジと無音区間の発生の間隔と同じであった場合に、番組本編をCM放送区間であると誤検出する場合があるが、無音時間長がCM間の無音時間長と一致していることを条件とするために、番組本編をCMと誤検出する事態の発生頻度を低減させることができる。
なお、実施の形態3において、上記以外の点は、上記実施の形態1及び2の場合と同じである。
実施の形態4.
実施の形態4においては、シーンチェンジの変化量を示すシーンチェンジ差異値を利用して検出精度を向上させることができるCM放送区間の検出方法について説明する。
図10は、実施の形態4の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間の検出方法を示すフローチャートである。また、図11は、実施の形態4の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出方法を説明するための図である。図11には、検出されたCM放送区間と、CM放送区間における各CMの境界に位置する変移点51a,…,51fが示されている。一般に、CMと番組本編の間、又は、CMとCMの間の映像的な因果関係は乏しく、よって、シーンチェンジの変化量は極めて大きいものとなる。実施の形態4においては、CMと番組本編の間、及び、CMとCMの間におけるシーンチェンジ差異値が、番組本編内におけるシーンチェンジ差異値よりもが大きいことを利用して、番組本編を誤ってCMとみなす誤検出を低減する方法について示す。
図10のフローチャートに示される動作は、実施の形態1における図5のフローチャートに示される動作を基本とし、さらに、シーンチェンジ差異値を利用した幾つかの判断と処理が追加されている。図10において、図5のステップと同じ又は対応するステップには、同じ符号を付している。
まず、CMフィルタ16は、基点となる変移点から終点となる変移点までの時間長がCM基準時間長(例えば、15秒、30秒、60秒、90秒など)と同じと判定された(ステップS410)後に、その基点と終点が先頭CMであり、かつ、時間長が60秒又は90秒であるかを判定する(ステップS430)。その条件に一致した場合、基点のシーンチェンジ差異値と終点のシーンチェンジ差異値を比較し(ステップS431)、基点のシーンチェンジ差異値が大きければ基点位置からCMが開始されたと判定し、ステップS411に復帰する。図11においては、変移点51aと変移点51bのシーンチェンジ差異値を比較し、シーンチェンジ差異値が大きい方を番組本編とCMの境界と判定することを示す。
一方、ステップS431において、基点のシーンチェンジ差異値より終点のシーンチェンジ差異値のほうが大きいと判断した場合は、CMフィルタ16は、終点位置からCMが開始される、すなわち、この基点と終点の間は番組本編が継続されていると判定する。
同様に、CMフィルタ16は、CM終了時にも最終CMであり、かつ、時間長が60秒又は90秒であるかを判定し(ステップS432)、条件に一致した場合、基点のシーンチェンジ差異値と終点のシーンチェンジ差異値を比較し(ステップS433)、基点のシーンチェンジ差異値より終点のシーンチェンジ差異値が大きければ終点位置から番組本編が開始されたと判定し、処理をステップS435に移す。図11においては、変移点51eのシーンチェンジ差異値と変移点51fのシーンチェンジ差異値を比較し、シーンチェンジ差異値が大きい方をCMと番組本編の境界と判定することを示す。
一方、終点のシーンチェンジ差異値より基点のシーンチェンジ差異値のほうが大きいと判断した場合は、CMフィルタ16は、基点位置から番組本編が開始された、すなわち、この基点と終点の間はすでに番組本編に入っていると判定する。このように、CM開始時又は本編開始時において60秒又は90秒などの長く、かつ、放送される頻度の少ないCMの場合、その区間の前後のどちらがより映像の変化量が大きいかによって番組本編とCMの境界を判断する。番組本編の冒頭や最後は、ひとまとまりのエピソードや1コーナーなど編集された単位になっている場合があり、その場合に、CMと誤検出する可能性があるが、実施の形態4のCM放送区間検出方法においては、より映像変化の大きいCM境界を見つけることによって、正確にCMと番組本編の境界を検出することができる。
また、ステップS435においては、全変移点のシーンチェンジ差異値をチェックし、シーンチェンジの判定に用いた閾値より大きな、第2の閾値と比較し、CM放送区間の少なくとも一つの変移点のシーンチェンジ差異値が第2の閾値を越えていれば、CM放送区間として扱うステップS415に移り、反対に、超えていなければこのCM放送区間を無効化する(ステップS436)。図3で説明すると、シーンチェンジ差異値の閾値が0.9であったとすると、変移点33b,33c,33f,33gのうち変移点33b及び33gのシーンチェンジ差異値が閾値0.9を超えているため、変移点33bから変移点33gまでの期間をCM放送区間と判定する。
上記のように番組本編とCMとの境界のCMにおいてシーンチェンジ差異値を番組本編とCMの境界選択に利用することによって、番組本編とCMとの境界を判定することができ、番組本編の冒頭又は最後をCMとして誤検出する事態の発生頻度を低減させることができる。
また、検出したCM放送区間内においてシーンチェンジ差異値の少なくとも一つが、ある閾値を超えない場合、CMでないと判定することによって、CMに比べて映像の変化量の少ない番組本編をCMであると誤検出する事態の発生頻度を低減させることができる。
なお、実施の形態4において、上記以外の点は、上記実施の形態1乃至3の場合と同じである。
実施の形態5.
実施の形態5においては、記録されたストリームの先頭に数秒のCMがあり、そのCMに続いて本編が記録されているような場合に、その数秒の断片化されたCMを検出する方法について示す。通常、映像音声記録装置100は、記録を開始すると判断してから、実際の記録が開始されるまでに一定の時間が必要とされており、そのために予め設定されていた記録開始時刻から数秒遡って記録を開始するように構成されているものが多い。また、映像音声記録装置の内部に持っている時計は、常に正確な時刻を指し示している保障はない。そのため、例えば、放送番組がPM9:00に開始予定であり、かつ、PM9:00ちょうどの本編が開始されたとしても、記録されたストリームの先頭に記録されてしまうことがあった。実施の形態5では、記録されたストリームの先頭に記録された断片化されたCMを抽出する方法を示す。
図12を用いて実施の形態5を説明する。シーンチェンジと無音が同時に発生した点である変移点が、記録されているストリームから検出されたとする。その変移点が、図12の強制CM化区間61内の最終に発生した変移点60cをCMと本編の境界と判断し、記録開始位置62から60cの間をCMとみなす。強制CM化区間は、映像音声記録装置の仕様によって決定され、例えば、記録予定時刻より5秒前から記録が開始されるのであれば、強制CM化区間は5秒とすればよい。また、映像音声記録装置の内部時計の誤差分、例えば、2秒を勘案し、7秒に設定してもよい。ここで、強制CM化区間の最終変移点60cをCMと本編の境界として採用しているのは、強制CM化区間の時間幅が実際の記録開始時刻と記録予定時刻の差にほぼ等しいように設定していることと、CM内の変移点発生頻度は本編中の変移点発生頻度に比べて、かなり高いことによる。
以上より、予め設定された記録予定時刻ちょうどから記録を開始しないために、本編前の不要なCMから記録を開始するような映像音声記録装置であっても、本編より前の不要なCMを検出することができる。
また、映像音声記録装置の内部時計が正確な時刻を刻んでいなくても、本編より前の不要なCMを検出することができる。
また、実施の形態5では、強制CM化区間における最終変移点をCMと本編の境界として採用する方法を取ったが、強制CM化区間の代わりに、強制CM化時刻として記録開始時刻から、例えば、5秒経過した時刻を用い、その強制CM化時刻に最も近い変移点をCMと本編の境界として採用するよう構成してもよい。図12では、60dとCMを本編の境界として採用する方法である。
また、実施の形態1乃至5の各構成を選択的に組み合わせて、CM放送区間の検出を行うこともできる。
本発明の実施の形態1の映像音声記録装置の構成を概略的に示すブロック図である。 実施の形態1の映像音声記録装置の変移点検出部の動作を示すフローチャートである。 実施の形態1の映像音声記録装置の変移点スタックテーブルの一例を示す図である。 (A)乃至(E)は、実施の形態1の映像音声記録装置におけるCM放送区間検出動作を説明するための図である。 実施の形態1の映像音声記録装置のCM放送区間検出動作を示すフローチャートである。 (A)乃至(C)は、本発明の実施の形態2の映像音声記録装置における変移点検出方法を示す図である。 本発明の実施の形態3の映像音声記録装置におけるCM間の無音時間長の測定結果を示すグラフである。 実施の形態3の映像音声記録装置においてCMから番組本編に移行するときの無音時間長の測定結果を示すグラフである。 実施の形態3の映像音声記録装置における、無音時間長を利用したCM放送区間検出動作を示すフローチャートである。 本発明の実施の形態4の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出動作を示すフローチャートである。 実施の形態4の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出動作を説明するための図である。 実施の形態5の映像音声記録装置における動作を説明するための図である。
符号の説明
1 アンテナ、 2 チューナ、 3 ビデオA/D変換部、 4 オーディオA/D変換部、 5 ビデオエンコーダ、 6 オーディオエンコーダ、 7 マルチプレクサ(Mux)、 8 録画制御部、 9 ストリーム制御部、 10 ファイルシステム部、 11 HDD、 12 ナビゲーション部、 13 シーンチェンジ検出部、 14 無音検出部、 15 変移点検出部、 16 CMフィルタ、 17 ストリームバッファ、 18 変移点スタックテーブル、 19 変移点マッチングバッファ、 31a,…,31m 無音区間、 32a,…,32o シーンチェンジ、 33a,…,33i 変移点、 34a,…,34c 検出されたCM、 35 検出されたCM放送区間、 51a 番組本編からCM放送区間に移行する時点における変移点、 51b,…,51e CM間の変移点、 51f CM放送区間から番組本編に移行する時点における変移点、 100 映像音声記録装置。
本発明の映像音声記録装置は、入力された映像データ及び音声データを符号化して符号化ストリームを出力する符号化手段と、前記符号化手段から出力された符号化ストリームを一時的に保持するストリーム保持手段と、前記符号化手段から出力され、前記ストリーム保持手段に一時的に記録されている符号化ストリームを記録する記録手段と、前記ストリーム保持手段から符号化ストリームを読み出し、復号化を行うとともに、映像のシーンチェンジを検出する映像変化点検出手段と、前記音声データから無音区間を検出する無音検出手段と、前記映像変化点検出手段によって検出されたシーンチェンジ情報と前記無音検出手段によって検出された無音区間情報を一時的に保持する一時記憶手段と、前記一時記憶手段上でシーンチェンジと無音区間が同時に発生する変移点を検出する変移点検出手段と、前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段とを有することを特徴としている。

Claims (12)

  1. 入力された映像データ及び音声データを符号化して符号化ストリームを出力する符号化手段と、
    前記符号化手段から出力された符号化ストリームを記録する記録手段と、
    前記符号化手段から出力された符号化ストリームを復号化し、該復号化されたデータから映像のシーンチェンジを検出する映像変化点検出手段と、
    前記音声データから無音区間を検出する無音検出手段と、
    前記映像変化点検出手段によって検出されたシーンチェンジと前記無音検出手段によって検出された無音区間が同時に発生する変移点を検出する変移点検出手段と、
    前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、
    前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段と
    を有することを特徴とする映像音声記録装置。
  2. 前記変移点検出手段が、
    前記映像変化点検出手段によって検出されたシーンチェンジ情報と前記無音検出手段によって検出された無音区間情報を一時的に保持する一時記憶手段を有し、
    前記一時記憶手段上でシーンチェンジと無音区間が同時に発生する時刻を検出する
    ことを特徴とする請求項1に記載の映像音声記録装置。
  3. 前記変移点検出手段による変移点の検出動作及び前記CM放送区間判定手段によるCM放送区間の判定動作は、前記無音検出手段によって無音区間が検出される毎に実行されることを特徴とする請求項1又は2のいずれかに記載の映像音声記録装置。
  4. 前記映像変化点検出手段によるシーンチェンジの検出動作は、複数フレームを1単位とする処理単位毎に実行され、
    前記CM放送区間判定手段による前記CM放送区間の判定動作は、前記映像変化点検出手段によるシーンチェンジの検出動作と同じ処理単位毎に実行される
    ことを特徴とする請求項1に記載の映像音声記録装置。
  5. 前記CM放送区間判定手段が用いる前記基準時間が、予め決められた数のGOPに相当する時間であり、
    前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内が、前記予め決められた数のGOPを中心にして±1GOPの範囲内である
    ことを特徴とする請求項1乃至4のいずれかに記載の映像音声記録装置。
  6. 前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合には、
    前記CM放送区間判定手段は、
    前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第1の値だけ長い場合には、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第1の値だけ短くする変移点を、CM放送区間を規定するための変移点として優先的に選択し、
    前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第2の値だけ短い場合には、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第2の値だけ長くする変移点を、CM放送区間を規定するための変移点として優先的に選択する
    ことを特徴とする請求項1乃至5のいずれかに記載の映像音声記録装置。
  7. 前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合には、
    前記CM放送区間判定手段は、前記CM放送区間判定手段によって判定されるCM放送区間を、前記基準時間の整数倍に近づける度合いの大きい変移点を、CM放送区間を規定するための変移点と判定する
    ことを特徴とする請求項1乃至5のいずれかに記載の映像音声記録装置。
  8. 前記無音検出手段は、音声データの無音部分の発生時刻と無音時間長を検出し、無音時間長が予め定められた第1の規定範囲内であれば、前記無音部分を、前記変移点を検出するために用いられる前記無音区間であると判定し、
    前記CM放送区間判定手段は、検出された第3番目以降の変移点の無音時間長が予め定められた第1の規定範囲外であればCM放送区間が終了したと判定する
    ことを特徴とする請求項1乃至7のいずれかに記載の映像音声記録装置。
  9. 前記CM放送区間判定手段によって判定されたCM放送区間の変移点の中に、無音時間長が第1の規定範囲内に有る変移点が存在しない場合、前記CM放送区間判定手段によって判定された前記CM放送区間を前記記録手段に記録しない
    ことを特徴とする請求項8記載の映像音声記録装置。
  10. 前記映像変化点検出手段から出力される情報は、シーンチェンジ発生時間と、シーンチェンジにおける映像データの変化の度合いを示すシーンチェンジ差異値とを含み、
    前記CM放送区間判定手段によって検出されたCM放送区間の変移点の中に、シーンチェンジ差異値が予め設定されたシーンチェンジ基準値よりも大きい変移点が存在しない場合、前記CM放送区間判定手段によって判定された前記CM放送区間を前記記録手段に記録しない
    ことを特徴とする請求項1乃至9のいずれかに記載の映像音声記録装置。
  11. 前記CM放送区間判定手段は、変移点間隔が60秒又は90秒であり、かつ、CMと番組本編の境界にあたる場合、基点となる変移点のシーンチェンジ差異値と終点となる変移点のシーンチェンジ差異値の比較結果に基づいて、CM放送区間と番組本編と判定することを特徴とする請求項10に記載の映像音声記録装置。
  12. 前記CM放送区間判定手段が、前記変移点検出手段によって検出された変移点のうち、ストリームが記録開始されてから規定時間内において、最後尾に発生した変移点までをCM放送区間と判定することを特徴とする請求項1に記載の映像音声記録装置。
JP2005232948A 2005-08-11 2005-08-11 映像音声記録装置 Active JP3894940B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005232948A JP3894940B2 (ja) 2005-08-11 2005-08-11 映像音声記録装置
US11/989,309 US8886014B2 (en) 2005-08-11 2006-03-17 Video recording apparatus, scene change extraction method, and video audio recording apparatus
CN2006800291636A CN101238727B (zh) 2005-08-11 2006-03-17 图像记录装置、场景转换提取方法及图像语音记录装置
PCT/JP2006/305337 WO2007017970A1 (ja) 2005-08-11 2006-03-17 映像記録装置、シーンチェンジ抽出方法、及び映像音声記録装置
JP2007529457A JP4707713B2 (ja) 2005-08-11 2006-03-17 映像記録装置及びシーンチェンジ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005232948A JP3894940B2 (ja) 2005-08-11 2005-08-11 映像音声記録装置

Publications (2)

Publication Number Publication Date
JP2007049515A true JP2007049515A (ja) 2007-02-22
JP3894940B2 JP3894940B2 (ja) 2007-03-22

Family

ID=37851972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005232948A Active JP3894940B2 (ja) 2005-08-11 2005-08-11 映像音声記録装置

Country Status (1)

Country Link
JP (1) JP3894940B2 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008245226A (ja) * 2007-03-29 2008-10-09 Kenwood Corp サーバ装置、プログラム、及びコンテンツ配信方法
JP2008271387A (ja) * 2007-04-24 2008-11-06 Nec Electronics Corp シーン変化検出装置、符号化装置及びシーン変化検出方法
JP2009038450A (ja) * 2007-07-31 2009-02-19 Toshiba Corp 放送受信装置
JP2009302767A (ja) * 2008-06-11 2009-12-24 Nec Electronics Corp シーン変化検出装置、符号化装置及びシーン変化検出方法
US8009965B2 (en) 2008-11-28 2011-08-30 Kabushiki Kaisha Toshiba Video analyzer and computer program product
WO2011107787A1 (en) * 2010-03-02 2011-09-09 Patrick Christian Video and/or audio data processing system
JP2012242502A (ja) * 2011-05-17 2012-12-10 Fujitsu Ten Ltd 音響装置
WO2013125488A1 (ja) * 2012-02-22 2013-08-29 日本電気株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US9148610B2 (en) 2013-03-26 2015-09-29 Panasonic Intellectual Property Management Co., Ltd. Video reception device and image recognition method for received video
US9762951B2 (en) 2013-07-30 2017-09-12 Panasonic Intellectual Property Management Co., Ltd. Video reception device, added-information display method, and added-information display system
US9774924B2 (en) 2014-03-26 2017-09-26 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method and additional information display system
US9900650B2 (en) 2013-09-04 2018-02-20 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and additional information display system
US9906843B2 (en) 2013-09-04 2018-02-27 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and display system for providing additional information to be superimposed on displayed image
US9955103B2 (en) 2013-07-26 2018-04-24 Panasonic Intellectual Property Management Co., Ltd. Video receiving device, appended information display method, and appended information display system
US10194216B2 (en) 2014-03-26 2019-01-29 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and additional information display system
US10200765B2 (en) 2014-08-21 2019-02-05 Panasonic Intellectual Property Management Co., Ltd. Content identification apparatus and content identification method
WO2019235405A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm区間検出装置、cm区間検出方法、及びプログラム
US10616613B2 (en) 2014-07-17 2020-04-07 Panasonic Intellectual Property Management Co., Ltd. Recognition data generation device, image recognition device, and recognition data generation method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007017970A1 (ja) 2005-08-11 2007-02-15 Mitsubishi Denki Kabushiki Kaisha 映像記録装置、シーンチェンジ抽出方法、及び映像音声記録装置
JP5036882B2 (ja) * 2011-01-14 2012-09-26 三菱電機株式会社 映像記録装置、映像記録方法、映像音声記録装置、及び映像音声記録方法
JP5425972B2 (ja) * 2012-06-08 2014-02-26 三菱電機株式会社 映像音声記録装置及び映像音声記録方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008245226A (ja) * 2007-03-29 2008-10-09 Kenwood Corp サーバ装置、プログラム、及びコンテンツ配信方法
JP2008271387A (ja) * 2007-04-24 2008-11-06 Nec Electronics Corp シーン変化検出装置、符号化装置及びシーン変化検出方法
JP2009038450A (ja) * 2007-07-31 2009-02-19 Toshiba Corp 放送受信装置
JP2009302767A (ja) * 2008-06-11 2009-12-24 Nec Electronics Corp シーン変化検出装置、符号化装置及びシーン変化検出方法
US8009965B2 (en) 2008-11-28 2011-08-30 Kabushiki Kaisha Toshiba Video analyzer and computer program product
WO2011107787A1 (en) * 2010-03-02 2011-09-09 Patrick Christian Video and/or audio data processing system
JP2012242502A (ja) * 2011-05-17 2012-12-10 Fujitsu Ten Ltd 音響装置
WO2013125488A1 (ja) * 2012-02-22 2013-08-29 日本電気株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US9148610B2 (en) 2013-03-26 2015-09-29 Panasonic Intellectual Property Management Co., Ltd. Video reception device and image recognition method for received video
US9955103B2 (en) 2013-07-26 2018-04-24 Panasonic Intellectual Property Management Co., Ltd. Video receiving device, appended information display method, and appended information display system
US9762951B2 (en) 2013-07-30 2017-09-12 Panasonic Intellectual Property Management Co., Ltd. Video reception device, added-information display method, and added-information display system
US9900650B2 (en) 2013-09-04 2018-02-20 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and additional information display system
US9906843B2 (en) 2013-09-04 2018-02-27 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and display system for providing additional information to be superimposed on displayed image
US9774924B2 (en) 2014-03-26 2017-09-26 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method and additional information display system
US9906844B2 (en) 2014-03-26 2018-02-27 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method and additional information display system
US10194216B2 (en) 2014-03-26 2019-01-29 Panasonic Intellectual Property Management Co., Ltd. Video reception device, video recognition method, and additional information display system
US10616613B2 (en) 2014-07-17 2020-04-07 Panasonic Intellectual Property Management Co., Ltd. Recognition data generation device, image recognition device, and recognition data generation method
US10200765B2 (en) 2014-08-21 2019-02-05 Panasonic Intellectual Property Management Co., Ltd. Content identification apparatus and content identification method
WO2019235405A1 (ja) * 2018-06-05 2019-12-12 日本電信電話株式会社 Cm区間検出装置、cm区間検出方法、及びプログラム

Also Published As

Publication number Publication date
JP3894940B2 (ja) 2007-03-22

Similar Documents

Publication Publication Date Title
JP3894940B2 (ja) 映像音声記録装置
JP4707713B2 (ja) 映像記録装置及びシーンチェンジ抽出方法
CN101167130B (zh) 流数据记录装置、流数据记录再现装置、流数据再现装置、流数据编辑装置、流记录方法、以及流再现方法
US20090088878A1 (en) Method and Device for Detecting Music Segment, and Method and Device for Recording Data
KR20060027826A (ko) 비디오 처리장치, 비디오 처리장치용 집적회로, 비디오처리방법, 및 비디오 처리 프로그램
US20050264703A1 (en) Moving image processing apparatus and method
US7751681B2 (en) Time-series data recording device and time-series data recording method
US6798839B2 (en) Image processing device, television receiver and image reproducing device
JP2007306327A (ja) 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP4259500B2 (ja) 映像音声記録装置
CN101238727B (zh) 图像记录装置、场景转换提取方法及图像语音记录装置
JP4432823B2 (ja) 特定条件区間検出装置および特定条件区間検出方法
JP5036882B2 (ja) 映像記録装置、映像記録方法、映像音声記録装置、及び映像音声記録方法
EP2187635B1 (en) Video voice recorder
JP5682167B2 (ja) 映像音声記録再生装置、および映像音声記録再生方法
JP5425972B2 (ja) 映像音声記録装置及び映像音声記録方法
US20090092383A1 (en) Time code processing apparatus, time code processing method, program, and video signal playback apparatus
US20060263062A1 (en) Method of and apparatus for setting video signal delimiter information using silent portions
JP2008141383A (ja) 映像編集装置、映像編集システムおよび映像編集方法
JP2007048379A (ja) プログラムの再生方法
JP4826484B2 (ja) 放送録画再生装置
JP2006303868A (ja) 信号属性判定装置、信号属性判定方法、情報信号記録装置、情報信号記録方法、情報信号再生装置、情報信号再生方法、情報信号記録再生装置および情報信号記録再生方法並びに記録媒体
JP2007234089A (ja) 記録再生装置
JP2008060654A (ja) 放送番組記録再生装置
JP2007274493A (ja) データ記録装置およびプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061212

R150 Certificate of patent or registration of utility model

Ref document number: 3894940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250