JP2010246161A - ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法 - Google Patents

ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法 Download PDF

Info

Publication number
JP2010246161A
JP2010246161A JP2010160320A JP2010160320A JP2010246161A JP 2010246161 A JP2010246161 A JP 2010246161A JP 2010160320 A JP2010160320 A JP 2010160320A JP 2010160320 A JP2010160320 A JP 2010160320A JP 2010246161 A JP2010246161 A JP 2010246161A
Authority
JP
Japan
Prior art keywords
frame
commercial
detector
cut
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010160320A
Other languages
English (en)
Inventor
Nevenka Dimitrova
ディミトローファ ネフェンカ
Thomas Mcgee
マッギー トーマス
Jan H Elenbaas
ハー エレンバース イアン
Eugene Leyvi
レイヴィ ユージーン
Carolyn Ramsey
ラムゼイ キャロライン
David Berkowitz
ベルコヴィッツ デヴィッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2010246161A publication Critical patent/JP2010246161A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7328Query by example, e.g. a complete video frame or video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/10Arrangements for replacing or switching information during the broadcast or the distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • H04H60/375Commercial
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S358/00Facsimile and static presentation processing
    • Y10S358/908Pause control, i.e. "commercial killers"

Abstract

【課題】 検出確実性の程度を向上させたコマーシャル分離装置及び方法を提供し、先行技術において示されていない進歩した技術の組み合わせを使用するコマーシャル分離装置を提供する。
【解決手段】 コマーシャル検出装置は、カット検出スレッド及びフィルタスレッドによって解析された入力データストリームからフレームを取得するフレーム取得スレッドを含む。コマーシャル検出スレッドは、平均カットフレーム間隔、カットレート、前記平均カットフレーム間隔における変化、ロゴの不在、コマーシャル署名検出、ブランド名検出、高いカットレートに先行するブラックフレームの列、解析されているフレームの前の指定された期間内に位置する同様のフレーム、及び、キャラクタ検出の各々に割り当てられた信用度に基づいて実行する。
【選択図】図2

Description

発明の背景
本発明は、ビデオ記録及び再生システムの分野に関する。特に、本発明は、ビデオデータストリーム内のコマーシャルを位置決めする方法及び装置に関する。
テレビジョン番組は、一般に、ビデオカセットレコーダ(VCR)の使用によって記録される。記録することにより、ユーザは、番組を後の時間において観るか、番組を同時に観て、後に観るためにその複製をとっておくことができる。VCRを使用して後に観るべき番組の複製を生成する場合、多くのユーザは、そのTV番組内に挿入されたコマーシャル又はプロモーションの内容には興味がなく、一般的に、このようなユーザは、これらのコマーシャルを手動でスキップする。
ブルム(Blum)に対する米国特許明細書第5151788号で開示されているような自律的にスキップするように設計された装置は、「ブラックフレーム」の発生に応じて前記VCRに合図し、記録を停止させる。ブラックフレームは、通常、コマーシャル部分の直前及び直後に見られる。このような装置は、画面に表示された画像のアクティビティにおける変化も識別する。アクティビティは、2つの異なるフレームの組間の輝度レベルにおける変化の割合である。コマーシャルは、一般的に、「アクティビティ」で満たされている。少ない量のアクティビティを検出した場合、コマーシャルが終了したと判断する。記録を再開し、続ける。
あいにく、「アクティビティ」は適切に規定されないことから、アクティビティが開始又は終了する時を正確に決定することは困難である。どのようなブラックスクリーンも、VCRの記録を停止する。それに続くアクティビティがある限り、前記装置は、コマーシャルの存在を推定する。従って、番組においてブラックスクリーンにアクションシーケンスが続くと、コマーシャルとして誤って判断され、スキップされてしまうおそれがある。代わりに、ゆっくりしたペースのコマーシャルは、番組として誤って判断され、記録されてしまうおそれがある。
ボナー(Bonner)他による米国特許明細書第4314285号に開示されているようなブラックフレームを識別する他の技術は、入力信号の電圧レベルにおけるしきい値を下回る低下を感知する。イグルデン(Iggulden)他による米国特許明細書第4314285号において開示されているような、もう1つの他の技術は、如何なるコマーシャルも含む番組全体を記録することである。ブラックフレームが放送される時を常に記録する。記録後、プロセッサは、ブラックフレーム間の期間がコマーシャルであるか番組であるかを決定する。これは、簡単な式によって成し遂げられる。前記期間が5分未満の場合、コマーシャルであると判断する。再生中、前記装置はテープを早送りし、コマーシャルであると決定された領域を通り過ぎる。前記装置は、再生を開始及び停止する時を覚えていなければならないため、特別なテープを使用しなければならないか、標準的なテープを改造しなければならず、これによってシステムコストが上昇する。さらに、互いに5分未満の2つのブラックフレームは、薄暗い又は暗いシーン中にも生じることがあり得るため、必ずしもコマーシャルの典型ではない。
レウイン(Lewine)に対する米国特許明細書第5668917号に開示されているような、さらにもう1つの他の技術において、ほとんど一致する連続フレームが、コマーシャルを表すとする。役者があまり動かないトークショー又は連続コメディー番組において代表的に見られるシーンは、この技術ではコマーシャルとして誤って判断され、スキップされる恐れがある。
全ての先行技術の装置は、信号がコマーシャルであるかどうかを識別するこれらの方法がしばしば不正確である点において不完全である。映画の中間部にブラックフレームがあると、これらの装置の大部分は、これをコマーシャルと間違える。
従って、本発明の目的は、検出確実性の程度を向上させたコマーシャル分離装置及び方法を提供することである。
本発明の他の目的は、先行技術において示されていない進歩した技術の組み合わせを使用するコマーシャル分離装置を提供することである。
本発明の他の目的は、拡張されたブラックフレーム検出技術を提供することである。
これらの目的及び利点は、添付図面と関連して読まれる以下の説明に照らして見た場合、より明らかになり、前記図面において、同様の参照符は同様の要素を示すためのものである。
本発明の目的及び要約
本発明の一態様によれば、複数のフレームに分割されたビデオデータストリーム内のコマーシャルの前又は後に生じるブラックフレームを検出する家庭情報装置は、ブラックフレーム検出器を有する。前記ブラックフレーム検出器は、前記フレームの解析されたフレームを複数の領域に分割するステップと、前記領域に関する平均最高輝度値を計算するステップと、前記領域に関する平均最低輝度値を計算するステップと、前記平均最高輝度値及び平均最低輝度値をブラックフレームしきい値と比較するステップと、ブラックフレームの発生を前記比較するステップに基づいて認知するステップとを行う。
本発明の他の態様によれば、複数のフレームに分割されたビデオデータストリーム内のコマーシャルの少なくとも一部を検出する家庭情報装置は、平均カットフレーム間隔検出器と、平均カットフレーム間隔傾向検出器と、ブランド名検出器と、カットレート及びブラックフレーム検出器と、フレーム類似検出器と、キャラクタ検出器と、静止画検出器とのうち少なくとも1つを具える。前記平均カットフレーム間隔検出器は、カットを有する第1フレーム及びカットを有する前フレーム間のフレーム数を表す分子と、前記前フレーム及び第1フレーム間のカット数を表す分母とを含む商を計算するステップと、前記商をカットフレーム間隔しきい値と比較するステップと、コマーシャルの発生を前記比較するステップに基づいて認知するステップとを行う。前記平均カットフレーム間隔傾向検出器は、複数のフレームにおけるカット数における変化を決定し、コマーシャルの一部を前記変化に基づいて検出する。前記ブランド名検出器は、前記データストリームを、オーディオプロセッサ、ビデオプロセッサ及びクローズドキャプションプロセッサのうち少なくとも1つによって処理し、テキストを生成するステップと、前記テキストを製品名及び商品名のグループと比較するステップと、コマーシャルの一部を前記比較するステップに基づいて認知するステップとを行う。前記カットレート及びブラックフレーム検出器は、コマーシャルの一部を、ブラックフレームの列が、解析されたカットの前のカット及びブラックフレーム期間内に生じたかどうかに基づいて認知する。前記解析されたカットは、カット列内において生じ、該カット列はカットレート期間内に生じる。前記フレーム類似検出器は、現在フレームが前フレームと類似しているかどうかを決定し、コマーシャルの一部を、ある期間内のフレームが現在フレームと類似している場合に検出する。前記キャラクタ検出器は,前記フレームの解析されたフレーム内の文字を見つけるステップと、前記文字の周囲のボックスを形成するステップと、前記ボックスの大きさを決定するステップと、前記解析されたフレームにおける前記ボックスの位置を決定するステップと、前記解析されたフレーム及びその後の解析されたフレームの前記大きさ及び位置を解析するステップと、コマーシャルの一部を前記解析するステップに基づいて検出するステップとを行う。前記静止画検出器は、コマーシャルの一部を、多数の静止画が、ある期間内で発生した時に検出する。
本発明のもう1つの他の態様によれば、複数のフレームに分割されたビデオデータストリーム内のコマーシャルを検出するシステムは、前記フレームを取得するフレーム取得器を具える。第1検出器は、少なくとも1つのカットにおける前記データストリーム内で、第1期間内に位置する同様のフレームと、ブロックフレームとを認知する。第2検出器は、前記データストリーム内で、第2期間内で同様の少なくとも1つのフレームと、実際的に同じ色であるフレームとを検出する。第3検出器は、前記コマーシャルを、前記第1及び第2検出器によって発生された情報を使用して認知する。
本発明のさらにもう1つの他の態様によれば、複数のフレームに分割されたビデオデータストリーム内のコマーシャルを、平均カットフレーム間隔と、カットフレーム間隔と、ブランド名と、ブラックフレームと、カットレート及びブラックフレームと、フレーム類似と、キャラクタ検出と、静止画とのうち少なくとも1つによって認知する方法を使用する。前記平均カットフレーム間隔検出は、カットを有する第1フレームとカットを有する前フレームとの間のフレーム数を表す分子と、前記前フレームと第1フレームとの間のカット数を表す分母とを含む商を計算するステップと、前記商をカットフレーム間隔しきい値と比較するステップと、コマーシャルの発生を前記比較するステップに基づいて認知するステップとを含む。前記平均カットフレーム間隔傾向検出は、複数のフレームにおけるカット数における変化の決定と、前記変化に基づくコマーシャルの一部の検出である。前記ブランド名検出は、前記データストリームを、オーディオプロセッサ、ビデオプロセッサ及びクローズドキャプションプロセッサのうち少なくとも1つによって処理し、テキストを生成するステップと、前記テキストを製品名及び商品名のグループと比較するステップと、コマーシャルの一部を前記比較するステップに基づいて認知するステップとを含む。前記ブラックフレーム検出は、前記フレームの解析されたフレームを複数の領域に分割するステップと、前記領域に関する平均最高輝度値を計算するステップと、前記領域に関する平均最低輝度値を計算するステップと、前記平均最高輝度値及び平均最低輝度値をブラックフレームしきい値と比較するステップと、コマーシャルの開始及び終了の発生を前記比較するステップに基づいて認知するステップとを含む。前記カットレート及びブラックフレーム検出は、コマーシャルの一部を、ブラックフレームの列が、解析されたカットの前のカット及びブラックフレーム期間内に生じたかどうかに基づいて認知する。前記解析されたカットは、カット列内において生じ、該カット列は、カットレート期間内に生じる。前記フレーム類似検出は、現在フレームが前フレームと類似しているかどうかの決定と、ある期間内のフレームが現在フレームと類似している場合、コマーシャルの一部とすることである。前記キャラクタ検出は,前記フレームの解析されたフレーム内の文字を見つけるステップと、前記文字の周囲のボックスを形成するステップと、前記ボックスの大きさを決定するステップと、前記解析されたフレームにおける前記ボックスの位置を決定するステップと、前記解析されたフレーム及びその後の解析されたフレームの前記大きさ及び位置を解析するステップと、コマーシャルの一部を前記解析するステップに基づいて検出するステップとを含む。前記静止画検出は、コマーシャルの一部を、多数の静止画が、ある期間内で発生した時に認知する。
図1Aは、ビデオと、本発明の第1実施形態によるコマーシャル分離器との間の入力信号分割のブロック図表現である。図1Bは、本発明の他の実施形態による、コマーシャル分離器によって受けられ、その後VCR及びメモリ間で分割される入力信号のブロック図である。 図2は、異なったスレッド及び関係するメモリを含むプロセッサのブロック図である。 図3A、3B、3C及び3Dは、入力信号のスケーリング及び変形を説明する。 図4A及び4Bは、アナログ及び圧縮信号を各々入力信号に変換することに関するブロック図である。 図5は、カット検出スレッドに関するフローチャートである。 図6Aは、フィルタスレッドに関するフローチャートである。 図6Bは、フィルタスレッドに関するフローチャートである。 図7は、署名方法のブロック図である。 図8は、代表的なキーフレームリストの表である。 図9は、代表的な一次フレームバッファの図である。 図10は、ブラックフレーム検出方法の図である。 図11は、ブランド名検出方法のブロック図である。 図12は、キーフレームリスト方法の図である。 テキスト検出方法のブロック図である。 テキスト検出方法によって解析された文字のグループを示す。 図15A、15B及び15Cは、キャラクタ分離器(テキスト検出方法)の連続的なボックスの高さと位置との関係を示す。 図16は、ロゴ検出において解析された領域の図である。 図17A、17B及び17Cは、ロゴ検出方法を示す。 図18は、平均カットフレーム間隔傾向のグラフである。 図19は、代表的なフレームリストバッファの表である。
好適実施形態の詳細な説明
一般的な概観
図1Aを参照すると、家庭情報装置50は、コマーシャル分離器56に供給される入力52を含む。メモリ78は、コマーシャル分離器56によって使用され、情報を一時的に保持し、検出されたコマーシャルの時間を最終的に格納する。コマーシャル分離器56は、入力52をVCR58に供給する。図1Bに示すような他の実施形態によれば、ホーム情報装置51は、分割器54を経てVCR58及びコマーシャル分離器56の双方に供給される入力52を含む。装置51は、カタログコマーシャルに特に好適である。
図1Aを参照すると、入力52を、アナログ(x(t))又はディジタル(x)フォーマットでフォーマットすることができる。前記コマーシャル分離技術は、離散コサイン変換(DCT)から得られた前記ビデオ信号の係数を使用する。図4Aは、入力52をアナログ信号x(t)から与えることを示す。アナログ信号x(t)をA/Dコンバータによってディジタル信号に変換し、入力52を発生するために順方向離散コサイン変換(FDCT)66に供給する。どのような商業的に利用可能なA/Dコンバータ及びFDCTも使用することができる。図4Bは、入力52を圧縮信号Xnから発生することを示す。圧縮信号Xnを、伸張回路70によって伸張し、エントロピー・デコーダ72によって復号化する。逆量子化器76は、前記復号化された信号を逆量子化し、入力52を発生する。エントロピー・デコーダ72及び伸張回路70を、当該技術分野においてよく知られているテーブル仕様74によって制御する。
入力52を、どのようなビデオ又はオーディオ/ビデオ組み合わせソースとしてもよい。例えば、テレビジョン信号又はインターネットファイル放送としてもよい。どのような媒体に格納してもよい。本例において、VCRテープを示すが、光学媒体、磁気記憶、又は、ランダムに、線形に、又は何らかの他の方法によってアクセス可能などのような他の記憶媒体にも適合させることができる。
図2を参照すると、コマーシャル分離器56は、プロセッサ57及びメモリ78を含む。プロセッサ57は、4つの別個のスレッドを制御する。これらは、フレーム取得スレッド80、カット検出器スレッド82、フィルタスレッド84及びコマーシャル検出スレッド86である。これらのスレッドの全てを、以下により詳細に説明する。以下の説明的な例において使用するプラットフォームは、パーソナルコンピュータを有する標準的なVCRである。前記VCRから前記コンピュータにデータをフィードバックするのにインタフェースを必要とする。フィードバックを利用できない場合、テープ内容確認装置を必要とする。このフィードバック能力を有する商業的に利用可能なVCRが存在する。例えば、フィリップス100BKのような特殊化された製品を使用することができる。代わりに、本発明を、パーソナルコンピュータにおいて単独型のソフトウェアを使用して実現することができる。
I.記録
各入力フレームは、3つの2次元アレイを含む。1つは輝度Yに対応し、他の2つはクロミナンス赤(Cr)及びクロミナンス青(Cb)に対応する。図3Aを参照すると、入力52は、標準的な525×480係数(すなわち画素)を有する。これを、図3Bに示すように160×120係数に縮小した。これは、輝度Yを表す。色に関して、追加の計算を行う。4つのクロミナンス値のサブブロックを平均し、図3cに示すようなCr及びCbに関する40×30係数ブロックを結果として生じる。
再び図2を参照すると、上記計算を、フレーム取得スレッド80によって行う。フレームがフレーム取得80によって取得されると、制御はカット検出器スレッド80に渡される。カット検出器スレッド82は、1)前記フレームがブラックフレームであるかどうか、2)カット(シーンにおける急激な変化)が生じたかどうか、3)前記フレームが静止フレームであるかどうかを決定する。次に制御はフィルタスレッド84に進み、このフィルタスレッド84は、類似又は単色に関するキーフレームをフィルタ処理する。最終的に、前記コマーシャル検出プロセスを、コマーシャル検出スレッド86によって行うことができる。
図5を参照すると、カット検出器スレッド82の機能を説明するブロック図が示されている。ステップS51において、カット検出器スレッド82は、前記フレームがブラックフレームであるかどうかを決定する。そうである場合、この画像をメモリ78に保存する。そうでない場合、ステップS52において、カット検出器スレッド82は、前記フレームがカットであるかどうかを決定する。そうである場合、この画像を保存する。そうでない場合、ステップS53において、カット検出器スレッド82は、前記フレームが静止フレームであるかどうかを決定する。そうである場合、前記画像を保存する。前記フレームがブラック、カット、又は静止フレームでない場合、前記フレームを破棄する。
キーフレームフィルタ処理 キーフレームを決定するどのような既知の方法も、単色であるフレーム、又は、前のフレームと類似のフレームを指摘するのに使用することができる。この情報を、以下に説明するコマーシャル検出方法において使用する。例えば、図6A及び6Bは、キーフレームフィルタ処理手順の概観である。図6Aのステップ602乃至606に示すように、ブロック署名を、フレームにおける各ブロックに関して得る。図7に示すように、ブロック署名700は、この例において、8ビットであり、これらのうち3ビットはDC署名702を表し、これらのうち5ビットはAC署名704を表す。前記DC値以外のブロックにおけるすべての他のDCT係数は、AC値である。
前記DC署名は、前記DC値を抽出し(ステップ602)、該DC値が指定された値の範囲内(この例では、−2400乃至2400の間)であるかどうかを決定する(ステップ604)ことによって得られる。この範囲は、図7に示すように、予め選択された数の間隔に分割する。本発明において、より多く又はより少ない間隔を画像のより大きい又はより小さい粒状性に関して使用できるとしても、8の間隔を使用する。
各間隔を、図7に示すように、予め決められたマップに割り当てる。各DC値を前記範囲と比較し、前記DC値が入る間隔に関するマッピングを返す。必要なビットによって表される値は、前記間隔の数に対応する。この例において、前記範囲を8間隔に分割したことから、3ビットを使用する。図7に示すように、ブロック署名700は、このように、最初の3ビットとしてDC署名702と、残りの5ビットとしてAC署名704とを含む。
図6Aのステップ604において、前記ブロックに関するAC値の良好な表現を与えるために、図7に示すように、DC値に最も近い5つのAC値(A1−A5)を抽出する。ステップ606において、5つのAC値の各々をしきい値(ACthresh)、この例において、200と比較し、前記AC値>ACthreshならば、AC署名706における対応するビットを、1のような予め決められた値に設定し、前記AC値≦ACthreshならば、対応するビットをゼロに設定する。
このようにして、ブロック署名700を得て、前記ブロック署名を使用して、単色であるフレームのような特定の画像又はフレームを除去することができる。
単色フレームを除去する迅速な方法は、DC署名のみを頼りに、ステップ602と604との間に起こる。各DC署名704を比較し、生じる各々の特定のDC署名のカウントを保つ(ステップ660)。すなわち、各DC署名は、前記DC値が入る間隔を表し、この例において、8つの異なるDC署名が存在する。例えば、前記ブロックの90%、すなわち1782ブロック(0.9×330マクロブロック×6ブロック)が同じ間隔に入る(同じDC署名を有する)場合、前記画像を単色とみなし(ステップ662)、前記フレームを破棄する、すなわち、フレームメモリから除去する(ステップ664)。その代わりに、別個のカウンタを各々の形式のブロック(Cr,Cb...)に関して保ち、各々別個のカウンタを関係するしきい値と比較する。
前記フレームにおける各々のマクロブロックの各々のブロックに関するブロック署名(Blk_sig)を得た後、領域を決定する。領域を、この例において、2以上のブロックとし、その各々のブロックは、前記領域において少なくとも1つの他のブロックと隣接し、同様のブロック署名を前記領域における他のブロックと共有する。前記フレームの各々のブロック署名を、各々他のブロック署名と比較し、計数して領域を決定できるとしても、本発明は、領域成長プロセスのような既知の方法を使用し、フレーム内の領域を決定する(ステップ608)。
前記領域成長プロセス中、領域計数を各々の領域に関して保ち、領域内のブロック数(サイズ)を計数し、16ビットによって表現する。フレーム全体を解析し、前記領域を見つけたら、この例において、x−y座標基準を基礎とする他の既知の方法を使用し、各々の領域の中心を見つけてもよい(ステップ610)。x及びy座標の双方を、各々CX及びCYとして抽出し、16ビットによって表す。次に、各々の領域に領域署名Region(Blk_sig,size,CX,CY)を割り当て、rを領域番号とする。前記領域に関するブロック署名を、前記領域成長プロセスによって決定されるような最も支配的なブロック署名に基づいて決定する。
本例においては、サイズが増大する特定の基準に基づいて、前記領域を格納し、領域フィルタ処理を行う(ステップ612)。この例において、最大の3つの領域を除くすべてを除去する。残りの3つの領域を、前記フレームを表すフレーム署名に組み入れる。前記フレーム署名を、本例において、168ビットによって表し(領域1,領域2,領域3)、あるいは、より正確には、(Blk_sig1,size1,CX1,CY1,Blk_sig2,size2,CX2,CY2,Blk_sig3,size3,CX3,CY3)の形式のものとする。
図6Bに示すように、フレーム比較手順は、現在フレーム(F2)及び前フレーム(F1)を、これらの個々のフレーム署名に基づいて比較する(ステップ616)。本例において、個々の領域1を比較し、次に個々の領域2を比較し、最後に個々の領域3を比較する。特に、個々の領域のブロック署名を、以下に従って比較する。
FDiff=ABS(size1F1-size1F2)+ABS(size2F1-size2F2)+ABS(size3F1-size3F2)
FDiff<10ならば、これらのフレームを同様とみなし、他のオブジェクト処理を行う(ステップ620)。FDiff≧10ならば、これらのフレームを異なっているとみなし、どちらのフレームもこの手順においてフィルタ処理しない。
領域は、一般的に、オブジェクト、人、物等としてもよい「オブジェクト」を表す。オブジェクト処理は、前フレームにおける領域において示されたオブジェクトが、同じ位置又はきわめて近くにあるかどうかを決定する。本例において、前記オブジェクトを、前記フレームの第1焦点、又は、より多くの焦点のうち1つとする。例えば、ビデオは、ボールで遊んでいる子供に焦点を合わせてもよく、ここで前記ボールはフレーム内を動きまわる。ユーザが、前オブジェクトが画像内にあることを心配しないですむように、ビジュアルインデックスにおけるフレーム数を制限したい場合(ステップ622)、この時点F2において、現在フレームを、フレームメモリから除去する(ステップ624)。
ユーザが、オブジェクトがフレーム内にあることを考慮し、同じ位置又は極めて近くに示されたオブジェクトを有するフレームのみを除去したい場合、いくつかの方法を使用することができる(オブジェクトフィルタ、ステップ626)。
第1の方法は、以下に示すように、中心を、これらのユークリッド的距離を決定することによって比較する。正確には、
Edist=SQRT[(CX1F1-CX1F2)2+(CY1F1-CY1F2)2]+SQRT[(CX2F1-CX2F2)2+(CY2F1-CY2F2)2]+SQRT[(CX3F1-CX3F2)2+(CY3F1-CY3F2)2]
Edist>3ならば、前記オブジェクトが動いたとし、フィルタ処理を行わない。Edist≦3ならば、前記オブジェクトがほぼ同じ位置のままであるとし、従って現在フレームを除去する。
オブジェクトフィルタ処理の第2の方法は、フレームを、マクロブロックを使用して比較する。正確には、個々のマクロブロック内の個々のブロックのブロック署名を比較する。例えば、現在フレーム(F2)のMB1,1(フレームの位置1,1におけるマクロブロック)のY1ブロックのブロック署名を、前フレーム(F1)のMB1,1のY1ブロックのブロック署名と比較する。
最初に、Y1ブロックのDC署名を比較する。これらのDC署名が一致したら、AC署名をビット毎に比較する。カウンタ(ACcount)を保ち、予め選択された数のビット、本例において、5ビットのうち4ビットが一致したら、ビットカウンタ(BlkCTR)を1増分する。DC署名が一致しなければ、又は、ACcount<4ならば、次のブロックを解析する。
前記マクロブロックの各ブロック(4:2:0を使用するこの例において6ブロック)を解析する。マクロブロックにおけるすべてのブロックを解析した場合、前記ブロックカウンタを検査する。BlkCTR≧4ならば、前記ブロックを同様とみなし、マクロブロックカウンタ(MBCTR)を1増分する。
画像におけるすべてのマクロブロックを解析したら、MBCTRを検査する。MBCTRが、この例において、フレームにおけるマクロブロックの≧75%(247すなわち0.75×330マクロブロック)であれば、前記フレームを同様とみなし、現在フレーム(F2)を前記フレームメモリから除去する。MBCTR<75%であれば、フレームをこの時点においてフィルタ処理しない。
単色フレームを除去する追加の方法は、前記領域サイズを決定するときに起こる。領域サイズが前記フレームブロックの90%、すなわち1782ブロック以上なら、前記フレームを単色とみなし、フレームメモリから除去する。このフィルタ処理は、考察した前記単色フレームフィルタ処理よりも多くの処理を必要とする。
ブラックフレーム検出 本発明は、先行技術のブラックフレーム検出技術を最適化する。図3A−3Dを参照すると、入力52がYUV信号として出発する場合、YUV入力信号52を、図3Aに示す525×480画素から図3Bに示す160×120画素に縮小する。次に、前記信号の輝度部分を、さらに、図3Dに示すような16×16のマクロブロックに分割する。図10を参照すると、次にこれらのマクロブロックの各々を、4つの8×8ブロックに分割する。この時点において、前記DCT動作を各々の8×8ブロックに行う。これは、画素がある位置と同じ位置でDCT係数を生成する。この解析において、前記DC係数のみが各々の8×8ブロックに必要である。この処理を図4Aにおいて記号化する。入力52が圧縮信号として始まる場合、それを解凍しなければならないが、前記DCT係数は図4Bに示すように保持する。明らかに、前記DCT手順を前記フレームのすべてに行うが、ちょうどブラックフレーム検出が実行されているフレームには行わない。
図10を再び参照すると、前記DCTを一度行うと、前記160×120のフレームを4つの象限に分割する。各々の象限を、DCT係数の行によって定義する。各々の行におけるDC値を平均し、平均DC値“A”を生成する。第1行を図10に示す。最大平均値“max”及び最小平均値“min”を決定する。この場合において、前記第1行のみを解析した。このmin及びmaxの平均は、必然的に平均DC値A(すなわち、前記第1行のDC係数の平均値)に等しくなる。次に、象限1における第2行を平均し、平均値Bを発生する。BをAと比較し、新たなmin及びmax値を計算する。これを、前記象限の4つの行に関して続ける。次に、全体の象限に関するmin及びmaxを互いに比較する。これらの間の差がmaxの7.5%より小さければ、前記フレームをブラックフレームとし、min及びmaxの計算された値を保持する他の象限に関する解析を続ける。そうでなければ、前記解析を中止し、前記フレームをブラックでないとみなす。
行毎の解析は、何らかのテキストが画面上に含まれている場合にそのテキストを認識することを保証する。例えば、映画の終了時に、クレジットの列は、1ライン又は2ワードを示す。フレーム全体を一度に解析すると、平均輝度はグレイフレームとほぼ等しくなり、誤ってブラックフレームとみなすかもしれ乃至かしながら、本発明の方法に関して、1ラインのテキストは、その関連する象限に関して大きいmaxを発生し、前記フレームをブラックとみなさない。
“minmax”とラベル付けされた第3パラメータを、システム動作全体に関して保持する。これは、前記象限において見つかった最低最大値である。番組全体は、その品質に応じてより明るく又は暗くなるかもしれないため、このパラメータを使用する。絶対的なしきい値を使用すると、ブラックフレームは、暗い低品質の番組において頻繁に検出され、明るい番組においては全く検出されないかもしれない。フレーム全体を解析し、前記フレームがブラックであるように見える場合(すなわち、min及びmaxが前記全ての象限に関して互いの7.5%以内)、本発明は、maxの75%を比較し、minmax未満の場合を探す。従って、ブラックフレームを検出する全体的な式を以下のように表すことができる。
max-min<(0.075)(max)AND(0.75)(max)<minmax→ブラックフレーム
各フレームを象限に分割しなくてもよく、前記解析を行によって実行しなくてもよい装置を形成するべきである。解析を、ブロック及び行のなんらかの組み合わせによって行うことができる。例えば、検出を、行又は半行、列、又はマクロブロックによって行うことができる。フレーム全体に関しても行うことができる。フレーム全体を1回で解析することは、前記フレームにおいてノイズがある場合、ブラックとみなさないため、不確実である。各ブロックをより多く分割すると、なんらかの空電ノイズが前記ブラックフレーム検出を妨害する可能性がより減る。他の解析方法は、前記フレームの上、下、左及び右10%を除外した内側の長方形のみにおいて探すことと、前記フレームを列及び行を定義する複数のブロックに分割し、解析を1ブロックおきに行うチェッカー盤構成と、上述した方法の何らかの組み合わせとを含む。前記フレームを分割するのに選択された形状を多角形にする必要もなく、任意の形状のどのような列も使用することができる。
ブラックフレーム検出のこの方法は、各々のフレームの部分を別々に分割及び解析するため、確実性が高い。これは、前記フレーム上の少ない量のテキスト又は画像でも、この方法によって、先行技術においてはそうだったようにブラックとみなされることはないことを意味する。前記平均値を全体で最低の最大輝度値と比較することは、明るい又は暗い画像による誤検出をも回避する。前記フレームを領域に分割することは、前記第1領域がブラックでない場合、前記方法は停止し、フレーム全体をブラックとみなさないため、処理時間を短縮することができる。
静止フレーム及びカット検出 当該技術分野において既知のどのような方法を使用して、静止フレーム又はカットを検出してもよい。例えば、以下の方法/式のうち1つを使用してもよい。ブラックフレーム検出と同様に、フレームのマクロブロックを使用する。
方法1:
SUM[1]=Σk,jABS(DCT1k,j[I]-DCT2k,j[I])
ここで、
kをフレームの幅におけるマクロブロックの数とし、k=1乃至フレーム幅/16、
jをフレームの高さにおけるマクロブロックの数とし、j=1乃至フレーム高/16、
Iをマクロブロックにおけるブロック数とし、I=1乃至マクロブロックにおけるブロック数、
DCT1k,j及びDCT2k,jを、図5に示すように、各々、前及び現在ビデオフレームに関する指定されたマクロブロックに関するDCT係数とし、
ABSを絶対値関数とする。
この例において、352×240画素フレームに関して、k=1乃至22、j=1乃至15及びI=1乃至6である。この方法及び以下の方法において、フレームのマクロブロック幅及びフレームのマクロブロック高を、前記フレームサイズを一様に分割できない場合、前記フレームサイズを処理中に拡大縮小して適合させるため、偶数の整数とする。
方法1は、前記マクロブロックのブロック(4つの輝度ブロック及び2つのクロミナンスブロック)の各々間を区別する。この方法において、現在ビデオフレームからの現在マクロブロックにおける輝度及びクロミナンスブロックの各々に関するDC値を、前のビデオフレームにおける対応するブロックに関する対応するDC値から各々引く。差の別々の和SUM[I}を、前記マクロブロックにおける輝度及びクロミナンスブロックの各々に関して保持する。
前記差の和を、次のマクロブロックに進め、対応する差(SUM[1],SUM[2],...SUM[6])に加える。現在ビデオフレームのマクロブロックの各々を処理した後、合計した差を、現在ビデオフレームの各輝度ブロック及び各クロミナンスブロックに関して得る。6つのSUMの各々を、SUMを合計したブロックの形式に対して特定のそれ自身の上限しきい値及び下限しきい値と比較する。この方法は、ブロックの各形式に関して異なるしきい値比較を与える。
SUM[i]が予め決められたしきい値(thresh1[i]),この例において、
thresh1[i]=0.3×ABS(Σk,jDCT2k,j[i])
より大きい場合、現在ビデオフレームを、さらに処理して視覚的インデックスにおいて使用できるようにするために、フレームメモリに保存する。前記フレームメモリを、本発明におけるようにテープ、ディスク、又は、本システムの外部又は内部のどのような他の媒体としてもよい。
SUM[i]が予め決められたしきい値(thresh2[i])より小さく、ここで、
thresh2[i]=0.02×ABS(Σk,jDCT2k,j[i])
とする場合、静止シーンカウンタ(SSctr)を1増分し、ありうる静止シーンを示す。前のビデオフレームを一時メモリに保存する。本発明において、前記一時メモリは、1フレームのみを記憶し、従って、前記前のビデオフレームは、一時メモリに現在記憶されたどのビデオフレームにも置き換わる。前記カウンタが予め決められた数(この例において30)に達した場合、前記一時メモリに保存された直前のビデオフレームを、前記視覚的インデックスにおいて使用できるようにするために、前記フレームメモリに転送する。本発明において、前記第1フレームを保存し、静止シーンを表すことができるとしても、当業者には明らかなように、この方法及び以下の方法において、ありうる静止シーンのどのフレームも保存及び使用することができる。
SUM[i]が前記2つのしきい値の間ならば、SSctrをゼロにリセットし、次の連続するフレームを比較する。
方法2
SUM=Σk,jΣI(DCT1k,j,i-DCT2k,j,i)2/ABS(DCT2k,j,i)
kをフレームの幅におけるマクロブロックの数とし、k=1乃至フレーム幅/16、
jをフレームの高さにおけるマクロブロックの数とし、j=1乃至フレーム高/16、
Iをマクロブロックにおけるブロックの数とし、I=1乃至マクロブロックにおけるブロック数、
DCT1k,j,i及びDCT2k,j,iを、各々、前及び現在ビデオフレームに関する指定されたのマクロブロックに関するDCT係数とし、
ABSを絶対値関数とする。
方法2は、方法1と対比して、ブロック形式間を区別しない。代わりに、方法2は、現在及び前のビデオフレームのマクロブロック間のDC差の連続的な合計を保持する。
ブロック間の各々の差を二乗し、次に現在ブロックのDCT値に対して正規化する。正確には、現在ビデオフレームからのブロックのDCT値を、前ビデオフレームにおける対応するブロックの対応するDCTから引く。次にこの差を二乗し、前記現在ビデオフレームの対応するDCT値で割る。現在ビデオフレームのDCT値がゼロである場合、この比較に関する和をゼロに設定する。これらのフレームのマクロブロックの各々における各ブロックのDCT値の各々に関する差を合計し、合計の和SUMを達成する。
次にSUMを予め決められたしきい値と比較する。SUMが、この場合において、予め決められたしきい値(thresh1)より大きく、ここで、
thresh1=0.3×ABS(Σk,j,iDCT2k,j,i
の場合、前記現在ビデオフレームを、さらに処理するためにフレームメモリに保存する。SUMが、この場合において、予め決められたしきい値(thresh2)より小さく、ここで、
thresh2=0.02×ABS(Σk,j,iDCT2k,j,i
の場合、静止シーンカウンタ(SSctr)を1増分し、ありうる静止シーンを示す。方法1におけるように、前のビデオフレームを、直前のフレームのみを保存する一時メモリに保存する。SSctrカウンタが予め決められた数(この例において30)に達した場合、前記一時メモリに保存された直前のビデオフレームを、前記フレームメモリに転送する。
SUMが前記2つのしきい値の間である場合、SSctrをゼロにリセットし、次の連続するフレームを比較する。
方法3
SUM[1]=Σk,j(DCT1k,j[I]-DCT2k,j[I])2/ABS(DCT2k,j)
ここで、
kをフレームの幅におけるマクロブロックの数とし、k=1乃至フレーム幅/16、
jをフレームの高さにおけるマクロブロックの数とし、j=1乃至フレーム高/16、
Iをマクロブロックにおけるブロックの数とし、I=1乃至マクロブロックにおけるブロック数、
DCT1k,j,i及びDCT2k,j,iを、各々、前及び現在ビデオフレームに関する指定されたのマクロブロックに関するDCT係数とし、
ABSを絶対値関数とする。
方法3は、方法1と同様に、マクロブロックのブロック(4つの輝度ブロック及び2つのクロミナンスブロック)の各々間を区別する。この方法において、現在ビデオフレームからの現在マクロブロックにおける各々の輝度及びクロミナンスブロックに関するDC値を、各々、前のビデオフレームにおける対応するブロックに関する対応するDC値から引く。しかしながら、方法2におけるように、ブロック間の各々の差を二乗し、次に前記現在ブロックのDCT値に対して正規化する。正確には、前記現在ビデオフレームからのブロックのDCT値を、前記前のビデオフレームにおける対応するブロックの対応するDCT値から引く。次にこの差を二乗し、前記現在ビデオフレームの対応するDCTによって割る。前記現在ビデオフレームのDCT値がゼロの場合、この比較に関する和を1に設定する。
マクロブロックの各々におけるブロックの各々の形式に関するDCT値の各々に関する差を合計し、ブロックの形式に関する合計SUM[i]を達成する。差の別々の和SUM[I]を、マクロブロックにおける輝度及びクロミナンスブロックの各々のに関して保持する。前記差の和を、次のマクロブロックに進め、対応する差(SUM[1],SUM[2],...SUM[6])に加える。現在ビデオフレームのマクロブロックの各々を処理した後、合計された差を、前記現在ビデオフレームの各々の輝度ブロック及び各々のクロミナンスブロックに関して得る。6つのSUMの各々を、SUMを合計したブロックの形式に対して特定のそれ自身の上限しきい値及び下限しきい値と比較する。この方法は、ブロックの各形式に関して異なるしきい値比較を与える。
SUM[i]が予め決められたしきい値(前に規定したようなthresh1[i])より大きい場合、前記現在ビデオフレームを、さらに処理するために前記フレームメモリに保存する。
SUM[i]が予め決められたしきい値(前に規定したようなthresh2[i])より小さい場合、静止シーンカウンタ(SSctr)を1増分し、ありうる静止シーンを示す。前記前のビデオフレームを、本発明においては直前のビデオフレームのみを保存する一時メモリに保存する。SSctrカウンタが予め決められた数30に達した場合、前記一時メモリに保存された直前のビデオフレームを、前記フレームメモリに転送する。
SUM[i]が前記2つのしきい値の間である場合、SSctrをゼロにリセットし、次の連続するフレームを比較する。
方法4
方法1乃至3は、各々、完全なビデオフレームを調査し、すべての輝度及びクロミナンスに関するDCT値に関する差又は差の二乗を合計するか、別々の成分として加算する。方法4は、マクロブロックレベルに作用し、制限された処理によって効果的な結果を与える。
SUM=Σk,jMbdiff(MB1[i]k,j-MB2[i]k,j)
ここで、
kをフレームの幅におけるマクロブロックの数とし、k=1乃至フレーム幅/16、
jをフレームの高さにおけるマクロブロックの数とし、j=1乃至フレーム高/16、
Iをマクロブロックにおけるブロックの数とし、I=1乃至マクロブロックにおけるブロック数、
MB1k,j及びMB2k,jを各々前及び現在ビデオフレームに関するマクロブロックとし、Mbdiffを、2つのマクロブロック間の互いに異なるブロックの数を決定する関数とし、この差があるしきい値より高い場合、第1値を出力し、そうでなければ第2値を出力する。
正確には、副合計(subsum[1],subsum[2],...subsum[6])を、特定のマクロブロックのブロック(Y1,Y2,Y3,Y4,Cr及びCd)の各々に関して、第1マクロブロックの個々のブロックを第2マクロブロックの対応する個々のブロックと比較し、subsum[i]を得ることによって決定し、ここで、
subsum[i]j,k=ABS(DCT1[i]j,k-DCT2[i]j,k)
とする。例えば、現在フレームの第1マクロブロックのCrのDC値を、前のフレームの第1マクロブロックのCrのDC値から引き、subsum[Cr]1,1を得る。各々のsubsum[i]を予め決められたしきい値(th1)と比較する。subsum[i]が、この例において、第1の予め決められたしきい値(th1)より大きく、この例において、
th1=0.3×subsum[i]
である場合、ブロックカウンタ(B1ctr)を1増分し、予め決められたしきい値(th2)より小さく、
th2=0.02×subsum[i]
である場合、ブロックカウンタ(B2ctr)を1増分する。各々のsubsum[i]を、固定された関数に基づく、又は、ブロックの形式に特定の関数又は定数に基づく定数としてもよいしきい値(th1及びth2)と比較する。
前記マクロブロックの6つのブロックを処理した後、前記ブロックカウンタを解析する。ブロックカウンタB1ctrが、この例において、予め決められたしきい値、この例において3よりも上の場合、前記マクロブロックを、前のビデオフレームのマクロブロックとは異なるとみなし、マクロブロックカウンタMB1ctrを1増分する。次にB1ctrをリセットし、次のマクロブロックを解析する。
ビデオフレームの全てのマクロブロックを処理した場合、MB1ctrを予め決められたフレームしきい値と比較する。MB1ctrが、この例において320×240フレーム(又は画像)を使用し、100の第1の予め決められたフレームしきい値(f1th)より上の場合、現在フレームを前記フレームメモリに保存し、MB1ctrをリセットする。
マクロブロックにおけるいくつかの数のブロックが同じであり、B2ctrが3の予め決められたしきい値(B2th)より上の場合、前記マクロブロックを同じとみなし、第2マクロブロックカウンタMB2ctrを1増分する。次に、B2ctrをリセットし、次のマクロブロックを解析する。フレームの全てのマクロブロックを解析した後、前記第2マクロブロックカウンタが250の第2の予め決められたフレームしきい値より上の場合、前記ビデオフレームを同じとみなし、フレームカウンタ(Fctr)を設定する。MB2ctrをリセットし、次のフレームを解析する。Fctrが予め決められたしきい値(SSthresh、この例において30)に達した場合、静止列が生じたと推定する。前のビデオフレームを、静止シーケンスを表すフレームメモリに保存する。この処理を、ビデオフレームが、前のビデオフレームと異なっていることが決定するか、新たなフレームがなくなるまで続ける。次に、Fctrをリセットし、次のビデオフレームを解析する。
この方法及び前の方法においてフレームメモリに保存されたこれらのフレームをキーフレームとみなす。
方法4を、前記正規化された差の二乗を使用することによって実現することもできる。正確には、ブロック間の差を使用する代わりに、前記差を二乗し、引かれたブロックにおいて見つかった値によって割る。シーンカット検出を、しきい値に対してあまり敏感ではなくすることができる。
上述したしきい値を、容易に、より少なく又はより多く検出するように変更することができる。例えば、定数を、より高い又はより低い能率を考慮するように変更することができ、例えば、SSctrを異ならせることができる。さらに、各々のしきい値を、代わりに、定数、固定された関数、又は、解析されているブロックの形式又は位置に応じて変化しうる関数としてもよい。
スレッド 前記システムは、連続するプロセスの代わりにスレッドを使用すると、より高い能率で動作する。1スレッドのみをプロセッサ78によっていつ活性化しても、すべてのスレッドは、これらの間で成分を共有する。例えば、フレーム取得スレッド80は、フレームをカット検出器スレッド82に送り、カット検出器スレッド82は、DC値及び検出されたカットをフィルタスレッド84に送る。
加えて、前記スレッドのすべては、メモリ78に記憶された情報を共有する。コマーシャル検出スレッド86は、カット検出器スレッド82及びフィルタスレッド84からメモリ78に記憶されたカット、ブラックフレーム、静止フレーム及び単色フレームに関する情報を使用する。前記スレッドは、前記スレッドに対する丸で囲まれた数字1−4において図2に示すような優先順位を有する。フレーム取得スレッド80は、他のスレッドがフレーム無しで動作できないため、最も高い優先権を有する。コマーシャル検出スレッド86は、その計算を行う前に他のスレッドからの情報を必要とするため、最低の優先権を有する。前記優先権指定は、使用頻度の表示でもある。フレーム取得スレッド80及びカット検出器スレッド82の双方は、情報をリアルタイムにおいて、1秒あたり約30フレーム処理する。フィルタスレッド84及びコマーシャル検出スレッド86は、フレーム取得スレッド80より低い頻度(例えば、13分の1程度)で使用される。
フレーム取得スレッド80は、フレームを入力52から取得し、これらをカット検出器スレッド82に送る。新たなフレームが検出された場合、プロセッサ57は、フレーム取得スレッド80に制御を移し、カット検出器スレッド82は待機する。フレーム取得スレッド80が行われた場合、カット検出器スレッド82又はフィルタスレッド84のいずれかがアクティブになる。これは、1度に1スレッドのみが「作動している」ことを意味する。前記スレッドが一つもアクティブでないことも可能である。入力52が停止すると、フレーム取得スレッド80はターンオフする。制御は、他のスレッドに関して、処理が完了するまで続く。一連のプロセスを使用し、あるステップが作動停止、又は処理を停止すると、前記システム全体が停止する。スレッドを基礎とするシステムに関して、制御は他のブランチに単に分岐する。また、他のスレッドが処理している間、あるスレッドがメモリに書きこむことができ、それによって前記システム全体の能率が向上する。
メモリ カット検出器スレッド82は、フレーム取得スレッド80によって取得されたフレームがブラックフレームか、カットか、静止フレームであるかどうかを決定する。図19を参照して、この情報をメモリ78において位置するフレームリストバッファに格納する。フレーム番号の長く狭いリストを、何らかの関連する特徴と共に発生する。このリストは、メモリ78においてそのブロックに関係する画像が格納されている場所を示すメモリポインタも含む。このリストを使用し、番組内のすべてのフレームを保持することができる。代わりに、前記フレームリストバッファに使用されている空間がもはや必要ない場合、再割り当てすることができる。これは、例えば、フレームが処理され、フレームキーリスト(後に説明する)に送られた後か、該フレームにおいて意味のあるイベントが生じない場合に起こるかもしれない。
図8を参照して、フィルタスレッド84は、前記フレームリストバッファを使用し、「キー」又は重要な特徴を有するフレームのみを載せたフレームキーリストを構成する。このリストは、平凡なフレームを含まないことを除いて、前記フレームリストバッファと同じ情報を含む。これらのキーフレームは、コマーシャル検出スレッド86によって処理される。コマーシャル検出手段86は、コマーシャルが位置する場所を決定し、コマーシャルの停止時間(又はテープ位置情報)を、メモリ78にコマーシャルリスト(図示せず)において出力する。前記フレームキーリストを、キーフレームのウィンドウとしてもよい。例えば、ユーザは、最後の1000キーフレームのみを見たい場合を示すことができる。
図9を参照して、フレーム取得スレッド80がフレームを取得した場合、その画像をメモリ78において割り当てられた一次フレームバッファに格納する。前記画像は、カット検出器スレッド82及びフィルタスレッド84によって処理されるまで待機する。前記フレームがこれらのスレッドによって処理されたら、前記フレームはもはや必要なく、新たなフレームをこの古いフレームと同じメモリ空間に上書きする。メモリの8ブロックを、最初に8フレームを保持するために割り当てる。第8フレームが取得されるときまでに、第1フレームは通常処理され、第9フレームを前記第1フレームと同じメモリ空間に格納することができる。処理がある理由のため遅くなり、前記第1フレームがまだ処理されない場合、追加のメモリを、幽霊ブロックにおいて見られるように割り当てる。1時間の長い放送において、50ブロックにおよぶメモリが要求されるかもしれない。例えば、フレーム1が処理され、メモリ空間がもはやこのフレームに関して必要なくなった場合、前記フレームリストバッファ(図19)におけるポインタを変更する。フレーム1に関するポインタを消去し、新たなフレーム9は、フレーム1が格納されていたメモリ空間を指し示すポインタを有する(図9も参照)。
これを、メモリに関する「レンタルショップ」とみなすことができる。このショップは、予め8空間のメモリを割り当てる。空間が一度必要なくなると、この空間を他のフレームに貸す。より多くのメモリ空間が要求された場合、前記レンタルショップはそれに割り当てる。メモリ空間が割り当てられると、前記割り当ては破棄され、新たな情報が前記空間におけるどの古い情報にも上書きされる。これは、割り当てられるブロックが常に同じサイズであり、異なったメモリ空間を連続して割り当てる必要がないため、有利である。他の用途において、どのくらいの費用が必要か予めわからず、従ってこのようなレンタルショップは不可能である。
本実施形態において、2つのレンタルショップを使用する。第1レンタルショップは、YUV領域におけるフレームの複製を保持する。これを、完全な画像をユーザに示すのが望ましい場合に行う。例えば、コマーシャルが見つかった場合、この画像を使用し、ユーザにコマーシャルの開始を示すことができ、彼に、彼がこのコマーシャルを観ることを望むか、又は、飛ばすことを望むかに関して暗示を与えることができる。検出されたコマーシャルの内容を含む視覚テーブルを形成することができる。第2レンタルショップは、前記DCT係数を保持する。前記YUV画像を保存し、DCT処理を行う。後に、ユーザに処理されたフレームの完全な画像を示すことが望ましい場合、呼び戻すことができる。もちろん、YUV画像の完全な組も前記記憶媒体(VCRテープ)に送る。明らかに、1つのレンタルショップを使用し、前記DCT画像及びYUV画像の双方に関する空間を割り当てることができる。前記YUV画像は前記DCT係数より多くのメモリ空間をふさぎ、異なったサイズのメモリ割り当てが必要なため、2つ使う方が簡単である。
II.コマーシャル検出
コマーシャル検出スレッドは、あるトリガイベントが生じるまでアクティブ化しない。このトリガイベントは、以下のうち1つの検出である。1)高いカットレート。後で明らかに定義するように、9より高いカットレートは、コマーシャルの兆候である。2)少なくとも10−30のブラックフレームの列。一般的に、コマーシャル検出スレッド86は、これらのトリガのうち1つが生じるまで、休止状態のままである。しかしながら、コマーシャル検出スレッド86を、その解析を周期的に(例えば、1分ごとに)行うように、又は、番組全体の終了まで行わないようにプログラムすることができる。
以下の技術のすべてを使用し、コマーシャルを検出することができる。前記システムは、前記平均カットフレーム間隔、平均カットフレーム間隔傾向、カットレート及びブラックフレーム検出解析(これらのすべてを後に詳細に説明する)から開始する。これらは、コマーシャルが位置するかもしれない多数の時間的セグメントを発生する。その後、以下の技術をこの順序で使用し、可能性のあるコマーシャルセグメントをさらに限定することができる。1)静止又は同様のフレーム、2)ロゴ検出、3)コマーシャル署名、4)テキスト、5)ブランド名。
技術の各々の組を連続すると、コマーシャルが前記期間内に配置されている可能性がより高くなる。ユーザに、どのくらい多くの段階か、又は、ユーザがコマーシャルの識別において望む信用度レベルかを暗示することができる。例えば、ユーザは、コマーシャルである可能性が最も高い期間のみを除去することを望んでもよく、又は、ユーザは、処理パワーを一定に保つことを決めることができる。信用度レベルを、コマーシャルの位置決めにおけるその全体的な有効性に対応する技術の各々に割り当てることができる。これらの信用度レベルの各々に、使用しているプラットフォームの関数として重み付けすることができる。例えば、遅いプロセッサが存在する場合、重みのいくつかに、これらが前記システムを遅くし、これらの有効性が証明されないことを示すゼロ値を割り当てることができる。各々の技術の信用度レベルにconfをラベル付けし、重みをwとし、このとき前記システムにおける完全な信用度は、
Figure 2010246161
となる。ここで、11の技術が使用されているため、n=11である。この信用度レベルはユーザによって選択される。例えば、70%の信用度レベルはユーザによって選択される。
さらに、前記重みを、テレビジョン番組のカテゴリの関数とすることができる。例えば、前記コマーシャル検出アプリケーションは、ユーザ又はEPG(電子番組ガイド)から解析されている番組の形式における入力を有する。前記検出技術のいくつかを、番組の形式に基づくよりよい選別器としてもよい。前記重みwiを、変数の組み合わせの関数とすることもできる。
i.平均カットフレーム間隔(ACD) カットが他のカットに近い場合、前記検出プロセスのこの部分は、コマーシャルが生じたことを示す。使用する式は、
Figure 2010246161
であり、ここで、nを現在フレームとし、mを振りかえったカット数とし、代表的に5とする。例えば、フレーム1700がカットを有し、その後5番目のカット(m=5)がフレーム1750である場合、10のACDを得る。ACD<150ならば、測定されたカット間の領域は、おそらくコマーシャル内である。前記式を、フレーム数と時間との固有の関係のため、時間依存であると容易に操作することができる。
ii.カットレート検出 広告者は、情報を輸送する短い時間を有する。結果として、シーンを短くし、頻繁に変化させ、消費者の注意を得る。これは、カットレート、シーンにおける変化の量が、一般的に、コマーシャルにおける方が通常の番組におけるよりも多いことを意味する。この技術は、1分間に生じるカット数の計算である。この数が9より大きく40より少なければ、解析されたフレームはおそらくコマーシャル内である。40をこえるカットレートは、おそらく、映画における高度なアクションシーンのしるしであり、コマーシャルではない。
iii.平均カットフレーム間隔傾向(ACDT) 平均カットフレーム間隔(ACD)は、名前から連想されるように、カット間の平均間隔を決定する。ACDTは、ACDにおける変化の測定である。類推として、入力を関数f(x)として考えると、カットレートは、その関数の導関数f’(x)であり、ACDTは、2次導関数f”(x)である。これが、前記関数が不連続であるため、変化の瞬時のレートではないとしても、概念は同じである。ACDTに関する式は、
Figure 2010246161
であり、mをカット間におけるフレーム数とする。上述したように、広告者は、短い時間でメッセージを伝えるために、多くの異なった画像をすばやく消費者に送る。ACDTは、カットレートそれ自身がコマーシャルにおいて一定であり、番組において一定でないというアイデアを考慮する。コマーシャルは、きわめて変動しやすく、画像がすばやく変化し、高い一定のACDTであるか、画像が少しも変化せず、低い一定のカットレートである。図18を参照すると、時間に関するカットレート振幅のプロットがある。”A”のラベルがついた点におけるカットレートは、振幅においてほぼ同じである。同様に、”B”のラベルがついた領域における点は、同じカットレート振幅を有する。これらの領域に関するACDTは、ほぼ0である。コマーシャルは、一般的に、小さな標準偏差を有する約0のACDTを有する。従って、領域”A”及び”B”に示すようにACDTがほぼ0ならば、コマーシャルの一部がこの領域において生じたとみなす。
iv.ロゴ 本発明において使用される他の技術は、ロゴの不在の検出である。上述したいくつかの先行技術の装置は、コマーシャルの証拠として広告された製品に関係するマークの存在を探した。いくつかのテレビジョン番組は、番組中にのみ存在するこれら自身のロゴを有する。例えば、CNN及び朝のニュースは、一般的に、右下隅において、時間と、ひょっとするとその日の天気予報と共に、ネットワークのしるしを示す。この情報が画像から除去された場合、この除去は、テレビ放送されているコマーシャルのしるしとなる。
このロゴは、一般的に、画面の指定された部分、通常は4隅のうちの1つにある。図16を参照すると、フレームを複数の領域に分割し、4隅のみを探索する。これらの隅において、ロゴが限定された鮮明度で表示される可能性は低いため、前記隅に最も近い領域を解析しなくてもよい。
図17A−17Cを参照すると、前記隅領域における輝度値を連続的なフレームを通じて比較した。絶対フレーム差を、図17Cに示すような連続フレームと、図17A及び17Bにおけるフレームとに関して計算した。これらの計算も、カット検出に関して行う。前記隅領域における画素のすべてが変化している場合、ロゴはない。ある領域が図17Cの絶対フレーム差において示すようにすべて”0”である場合、この領域はおそらくロゴである。この方法は、ロゴが静的であることを仮定した。動くロゴを、モーションテクスチャを使用して分離することができる。ロゴの一部が変化する(例えば、時間)場合、前記ロゴのその部分は検出されない。すべて”0”の領域を、これらによってロゴ画像を発生するために保持する。次に、前記ロゴを表す署名を形成することができる。次の章においてより完全に説明するように、既知のロゴ署名のバンクを使用することができる。ロゴが見つかった場合、このロゴが消えたとき、コマーシャルが始まったとみなす。
信号内の形状を検出する他の既知の方法が存在する。例えば、Hough変換、bスプライン解析、NURB及びウェイブレットをすべて使用し、前記署名及びロゴの形状を表すか、ロゴ自体を検出することができる。どのような他の正規直交又はマッチング遂行アルゴリズムを使用することもできる。
v.署名 この方法において、既知のコマーシャルのキーフレームの署名を抽出し、データベースに格納する。格納されるコマーシャルの数は、前記データベースのサイズに依存する。キーフレームの署名は、ブロック署名すなわち168バイトのフレーム署名を使用する場合、約1kのメモリを必要とする。各々のコマーシャルは、約10のキーフレームを有する。図12を参照すると、前記キーフレームリスト(図8においてより完全に示す)からのキーフレームを、既知のコマーシャルのキーフレームと順次に比較する。50%をこえるキーフレームが一致した場合、前記フレームを、コマーシャル内にあるとみなす。
前記データベースにおける各コマーシャルに関するコマーシャル発見カウンタを、そのコマーシャルが検出されるたびに1増分する。コマーシャルが予め決められた期間(例えば月)内に見つからなかった場合、そのコマーシャルに対応する署名を前記データベースから消去する。2つの既知のコマーシャルが、指定された期間(例えば分)内のフレームの組を挟む場合、これらの挟まれたフレームを可能性コマーシャルデータベースに置く。これらの挟まれたフレームは、1つ以上のコマーシャルを表すかもしれない。これらのフレームの部分集合が少なくとも2回既知のコマーシャルフレームと一致した場合、これらの可能性コマーシャルフレームを前記既知のコマーシャルのデータベースに追加する。このようにして、既知のコマーシャルのダイナミック・データベースを形成する。
先行技術のシステムとは異なり、このデータベースは、ユーザがコマーシャルを実際に閲覧することを可能にする。ユーザは、例えば、誰が売出し中か、又は、どのカーディーラーが所望の車両において最もよい値をつけているかを決定することができる。前記データベースを分類し、コマーシャル探索を容易にすることができる。前記データベースは、コマーシャル全体を保持することができ、又は、単に、既知の情報検索手段によって形成されたキーワードによるインデックスを保持することができる。
フレームの署名を抽出する多くの既知の方法が存在する。例えば、カラーヒストグラムを使用することができる。代わりに、濾過プロセスにおいて使用される署名方法を実施することもできる。
vi.テキスト及びブランド名 ブランド名が表示された場合、このフレームがコマーシャル内である確率はきわめて高い。図11を参照すると、入力52を、オーディオプロセッサ100、ビデオプロセッサ114及びクローズドキャプションプロセッサ116に送る。オーディオプロセッサ100は、この信号を、音声をテキスト120に変換する音声認識プロセッサ112に送る。同様にビデオプロセッサ114は、入力52を、ビデオをテキスト120に変換するセグメント化及びOCR装置118に送る。クローズドキャプションプロセッサ116もテキスト120を発生する。次にテキスト120を、ブランド及び製品名グループか124と、比較器122によって比較する。すべての登録されたブランド名を容易に決定及び格納することができる。(指定された期間内のブランド名数)/(この期間内の総ワード数)がしきい値より大きい場合、コマーシャルがこの期間中に発生している。現在使用するこの期間は2分である。
vii.ブラックフレーム検出 上述したように、コマーシャルには、通常、ブラックフレームが前後に続く。本装置は、上記に関する最適化されたブラックフレーム検出方法を使用し、ブラックフレームが発生したかどうかをより正確に決定する。ブラックフレームが生じた場合、コマーシャルがその前又は後に続く可能性は高くなる。一般的に、多くのブラックフレームがコマーシャルに先行して使用されるが、コマーシャルの考えられる開始及び終了が起こる場所を示すだけでよい。
viii.ブラックフレーム及びカット 高いカットレートが検出された場合、この技術は、前記装置に、4分間(7200フレーム)、ブラックフレームの列に関して遡る。この列を少なくとも10−30フレーム長としなければならない。一般的に、コマーシャル間の時間は4分より長い、高いカットレートが存在し、最後の4分以内にブラックフレームが存在する場合、この高いカットレート列は、おそらくコマーシャル内である。
ix.フレーム類似 上述したように、フィルタスレッド84は、あるフレームが最後の10分において受けたフレームと同様であるかどうかを決定する。映画又はテレビジョン番組において、前記列は一般的に同様である。これを行い、視聴者にシーンが変化していない知覚を与える。例えば、連続コメディ番組において、同じ一般的なレイアウトが連続して表示され、俳優はこの空間内で相互作用する。コマーシャルは、一般的に30秒より長く持続しない。結果として、コマーシャルにおいて、背景は30秒ごとに劇的に変化する。従って、あるフレームが最後の30秒以内に生じた他のフレームと同様な場合、現在及び最後のフレームを、コマーシャルの一部であると推定する。同様なフレーム間の時間が30秒をこえる場合、これらのフレームはおそらく番組内である。
x.静止画像 静止画像は同様な画像と、より長い時間が同様の画像に使用されることを除いて同様である。コマーシャルは、概念を視聴者にすばやく伝えるために、多くの動きを必要とする。従って、静止画像は、通常、番組において位置し、コマーシャルにおいて位置しない。従って、本発明は、1分における静止画像の数を考察する。一般的に、コマーシャルにおいて静止画像はない。2つ以上の静止画像が見つかった場合、解析されたフレームは、おそらくコマーシャル内ではない。
xi.キャラクタ検出 コマーシャルがテキストを表示する場合、一般的に画面の異なった場分において、異なったフォント及びサイズにおいてである。これは、例えば、少なくとも同様のパターンのフォントサイズ及び形式を有する映画クレジットと区別される。図13を参照すると、コマーシャル内であるかもしれないフレームは、2つの変形が加えられている。このフレームは、グレイスケール化され、エッジ検出が行われている。
エッジ検出後、前記システムは、どのような情報がフレーム内に残っているかを発見することを期待する.可能性のあるキャラクタの最大幅及び高さは、結果として生じた検出された領域を比較するのに使用されるしきい値を形成する。領域がその中にテキストキャラクタを有するには大き過ぎる又は小さ過ぎる場合、考慮から除外する。テキストキャラクタがあると決定したら、同様のキャラクタを同じ垂直ライン上に関して走査する。4つ以上のキャラクタが同じライン上に見つかった場合、最初のキャラクタから最後のキャラクタまでを単語とみなす。例えば、図14において、前記システムは名前”Eugene”における文字”g”を、”g”が大き過ぎるため、検出しないかもしれ乃至かしながら、他の文字は検出され、追加の文字が同じラインにおいて見つかる。これは、単語”Eu_ene”を発生する。前記システムを、追加の解析を行って”g”を探すようにプログラムすることができる。
見つかった全ての単語を、前記フレーム内のそれらのキャラクタをアウトライン化するボックスによって表す。このボックスの高さは、コマーシャル内にあるか、又は、番組内にあるかに応じて変化する。図15A−Cを参照すると、このボックスの中心(x,y)及び高さ(z)を、3次元軸においてプロットする。一連のフレーム(又は一連のキーフレーム)を時間に関して互いに重なる。テキストが、映画のクレジットのように、画面の中心を通ってスクロールする場合、前記プロットは図15Aにおけるように直線になる。テキストが画面の中心においてちょうど現れ、消える場合、プロットは、図15Bにおけるように、2つの近い点のように見える。コマーシャルにおいて、点は、図15Cにおけるようにグラフじゅうに現れる。この技術を、キーフレームにおいてのみ使用し、処理時間を節約することができ、又は、すべてのフレームを解析することができる。
III.再生
コマーシャル検出を行ったら、テープ再生は比較的簡単である。上述したように、検出されたコマーシャルの時間をメモリ78に保存する。再生中、プロセッサ57は、これらの時間を捜し、検出されたコマーシャル中テープを早送りする。ユーザに、コマーシャルの第1フレームを表示し、このコマーシャルをスキップすることを望むかどうかに関して促すことができる。代わりに、プロセッサ57を、ある形式の内容交換を行うようにプログラムすることができる。ユーザは、コマーシャルの代わりに他の刺激を与えられることを要求することができる。例えば、ユーザは、指定されたウェブサイトの内容が表示されることを要求することができる。
ユーザが記録中の番組を観ている場合、前記番組の数分間をメモリ(例えばメモリ78)に一時記憶し、解析し、ディスプレイに出力しなければならない。これは、コマーシャルが何時あり、どのくらい長いかを決定することを必要とする。このような一時記憶を、例えば、SMASH(家庭におけるマルチメディアアプリケーションシステム用記憶装置)技術によって行うことができる。一時記憶を行わない場合、コマーシャルの最初の部分が記録され、コマーシャルに続く番組の最初の部分が記録されない。これは、番組及びコマーシャル間の変化を検出するために、処理がビデオ情報を必要とすることによるものである。
ユーザが存在しない場合、内容交換を、前記コマーシャル検出処理後に行うことができる。プロセッサ57は、再び、番組の少なくとも一部を一時記憶し、プロセッサ57がコマーシャルが開始及び終了するときを決定できるようにした場合、コマーシャルに関する内容を交換することもでき、これらを完全に除去することもできる。
IV.結論
本発明の方法は、その存在が、ディジタルテレビジョンと、JPEG又はMPEG圧縮アルゴリズムを使用するなにか他の信号との到来と共に増大するDCT係数に基づいている。このような信号に解凍を行わなければならないとしても、これは、多くの既知の装置によって行うことができる。処理パワー及び時間の大部分は、DCT係数を見つけ、次に完全な画像を再生することに費やされる。従って、本発明は、ディジタルフォーマットに向かう動きを認識する。
好適実施形態を説明したことによって、種々の変更を、当業者によって、添付した請求項においてより明らかに規定した本発明の範囲及び精神から逸脱することなく、行うことができることに注意すべきである。
50…家庭内情報装置
51…ホーム情報装置
52…入力
54…分割器
56…コマーシャル分離器
57…プロセッサ
58…VCR
S51…ステップ
S52…ステップ
S53…ステップ
66…順方向離散コサイン変換(FDCT)
600…ステップ
602…ステップ
604…ステップ
606…ステップ
608…ステップ
610…ステップ
612…ステップ
614…ステップ
616…ステップ
620…ステップ
622…ステップ
624…ステップ
626…ステップ
70…伸張回路
700…ブロック署名
702…DC署名
704…AC署名
72…エントロピー・デコーダ
74…テーブル仕様
76…逆量子化器
78…メモリ
80…フレーム取得スレッド
82…カット検出器スレッド
84…フィルタスレッド
86…コマーシャル検出スレッド
100…オーディオプロセッサ
112…音声認識プロセッサ
114…ビデオプロセッサ
116…クローズドキャプションプロセッサ
118…OCR装置
120…テキスト
122…比較器
124…ブランド名及び製品名グループ

Claims (7)

  1. 平均カットフレーム間隔検出器と、平均カットフレーム間隔傾向検出器と、ブランド名検出器と、カットレート及びブラックフレーム検出器と、フレーム類似検出器と、キャラクタ検出器と、静止画像検出器とのうち少なくとも1つを具え、
    複数のフレームに分割されたビデオデータストリーム内のコマーシャルの少なくとも一部を、前記平均カットフレーム間隔検出器、前記平均カットフレーム間隔傾向検出器、前記ブランド名検出器、前記カットレート及びブラックフレーム検出器、前記フレーム類似検出器、前記キャラクタ検出器、又は前記静止画像検出器によってそれぞれ成し遂げられるコマーシャル検出技術に割り当てられた、使用しているプラットフォームの関数として重み付けられる信用度レベルに基づいて、コマーシャルを検出する家庭情報装置において、
    前記平均カットフレーム間隔検出器が、
    a.カットを有する第1フレーム及びカットを有する前フレーム間のフレーム数を表す分子と、前記前フレーム及び第1フレーム間のカット数を表す分母とを含む商を計算するステップと、
    b.前記商をカットフレーム間隔しきい値と比較するステップと、
    c.コマーシャルの発生を前記比較するステップに基づいて検出するステップとを行い、
    前記平均カットフレーム間隔傾向検出器が、複数のフレームにおけるカット数における変化を決定し、前記変化に基づいてコマーシャルの一部を検出し、
    前記ブランド名検出器が、
    a.前記データストリームを、オーディオプロセッサ、ビデオプロセッサ、及びクローズドキャプションプロセッサのうち少なくとも1つの装置又は装置の組み合わせによって処理し、テキストを発生するステップと、
    b.前記テキストを製品名及びブランド名のグループと比較するステップと、
    c.ブランド名がコマーシャルにおいて表示される確率が高いことから、コマーシャルの一部を前記比較するステップに基づいて認知するステップとを行い、
    前記カットレート及びブラックフレーム検出器が、コマーシャルの一部を、ブラックフレームの列が解析されたカットの前のカット及びブラックフレーム期間内に生じたかどうかに基づいて認知し、前記解析されたカットはカット列内において生じ、前記列はカットレート期間内に生じており、
    前記フレーム類似検出器が、現在フレームと前フレームと間の絶対フレーム差を計算し、該絶対フレーム差をしきい値に比較することによって、前記現在フレームが前記前フレームと類似しているかどうかを決定し、ある期間内のフレームが現在フレームと類似している場合、コマーシャルの一部を検出し、
    前記キャラクタ検出器が、
    a.前記フレームの解析されたフレーム内のキャラクタを、エッジ検出後しきい値と比較することによってみつけるステップと、
    b.前記キャラクタをアウトライン化することによって前記キャラクタの周囲のボックスを形成するステップと、
    c.前記ボックスの大きさを、前記キャラクタの最大幅及び高さに基づいて決定するステップと、
    d.前記解析されたフレームにおける前記ボックスの位置を決定するステップと、
    e.前記解析されたフレーム及びその後の解析されたフレームの前記大きさ及び位置を解析するステップと、
    f.コマーシャルの一部を前記解析するステップに基づいて検出するステップとを行い、
    前記キャラクタの周囲のボックスの中心及び高さを3次元軸においてプロットすることによって前記コマーシャルの一部を検出し、
    前記静止画検出器が、多数の静止画がある期間内で発生した時を区別することによって、コマーシャルの一部を検出することを特徴とする家庭情報装置。
  2. 請求項1に記載の家庭情報装置において、
    前記フレームを取得するフレーム取得器と、
    前記データストリーム内で、カット、前記コマーシャルの推定される長さに基づいて決定される第1期間内において、前記現在フレームと前記前フレームとの間の絶対フレーム差を計算し、前記しきい値に比較することによって検出される類似したフレーム、及び、ブラックフレームのうち少なくとも1つを識別する第1検出器と、
    前記データストリーム内で、前記コマーシャルの推定される長さに基づいて決定される第2期間内において、前記現在フレームと前記前フレームとの間の絶対フレーム差を計算し、前記しきい値に比較することによって検出される類似したフレーム、及び、同じカラーのフレームのうち少なくとも1つを識別する第2検出器と、
    前記第1及び第2検出器によって発生された情報を使用して前記コマーシャルを識別する第3検出器とをさらに具えることを特徴とする家庭情報装置。
  3. 請求項2に記載の家庭情報装置において、前記第2期間を前記第1期間より長くしたことを特徴とする家庭情報装置。
  4. 請求項1に記載の家庭情報装置において、前記平均カットフレーム間隔検出器における前記カット数と、前記カットレート及びブラックフレーム期間と、前記ブラックフレームの列と、前記カットの列と、前記カットレート期間と、前記フレーム類似検出器における期間と、前記静止画像検出器における期間及び静止フレームの数とのうち少なくとも1つを予め決定することを特徴とする家庭情報装置。
  5. 請求項1に記載の家庭情報装置において、前記検出器の各々が前記データストリームのDCT係数を使用することを特徴とする家庭情報装置。
  6. 請求項1に記載の家庭情報装置において、前記データストリームを格納し、検出されたコマーシャルを代わりの内容に取りかえる記憶装置をさらに具えることを特徴とする家庭情報装置。
  7. 請求項1に記載の家庭情報装置において、検出されたコマーシャルをスキップする手段をさらに具えることを特徴とする家庭情報装置。
JP2010160320A 1998-07-28 2010-07-15 ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法 Withdrawn JP2010246161A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/123,444 US6100941A (en) 1998-07-28 1998-07-28 Apparatus and method for locating a commercial disposed within a video data stream

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000563066A Division JP2002521977A (ja) 1998-07-28 1999-06-28 ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法

Publications (1)

Publication Number Publication Date
JP2010246161A true JP2010246161A (ja) 2010-10-28

Family

ID=22408727

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000563066A Pending JP2002521977A (ja) 1998-07-28 1999-06-28 ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法
JP2010160320A Withdrawn JP2010246161A (ja) 1998-07-28 2010-07-15 ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2000563066A Pending JP2002521977A (ja) 1998-07-28 1999-06-28 ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置および方法

Country Status (6)

Country Link
US (1) US6100941A (ja)
EP (1) EP1040656B1 (ja)
JP (2) JP2002521977A (ja)
AT (1) ATE395785T1 (ja)
DE (1) DE69938711D1 (ja)
WO (1) WO2000007367A2 (ja)

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL125141A0 (en) * 1998-06-29 1999-01-26 Nds Ltd Advanced television system
US7558472B2 (en) 2000-08-22 2009-07-07 Tivo Inc. Multimedia signal processing system
US6233389B1 (en) 1998-07-30 2001-05-15 Tivo, Inc. Multimedia time warping system
JP4178629B2 (ja) * 1998-11-30 2008-11-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP4026100B2 (ja) * 1998-11-30 2007-12-26 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US8290351B2 (en) 2001-04-03 2012-10-16 Prime Research Alliance E., Inc. Alternative advertising in prerecorded media
US6906743B1 (en) * 1999-01-13 2005-06-14 Tektronix, Inc. Detecting content based defects in a video stream
EP1885127A3 (en) 1999-09-20 2008-03-19 Tivo, Inc. Closed caption tagging system
US6469749B1 (en) * 1999-10-13 2002-10-22 Koninklijke Philips Electronics N.V. Automatic signature-based spotting, learning and extracting of commercials and other video content
CN1240218C (zh) * 1999-11-01 2006-02-01 皇家菲利浦电子有限公司 用于替换不希望的广告中断或其它视频序列的视频内容的方法和装置
US6993245B1 (en) 1999-11-18 2006-01-31 Vulcan Patents Llc Iterative, maximally probable, batch-mode commercial detection for audiovisual content
AU2099201A (en) * 1999-12-21 2001-07-03 Tivo, Inc. Intelligent system and methods of recommending media content items based on userpreferences
US6766098B1 (en) 1999-12-30 2004-07-20 Koninklijke Philip Electronics N.V. Method and apparatus for detecting fast motion scenes
US8910199B2 (en) 2000-02-25 2014-12-09 Interval Licensing Llc Targeted television content display
AU2001249994A1 (en) 2000-02-25 2001-09-03 Interval Research Corporation Method and system for selecting advertisements
US7661116B2 (en) 2000-02-25 2010-02-09 Vulcan Patents Llc Auction for targeted content
FR2806573B1 (fr) * 2000-03-15 2002-09-06 Thomson Multimedia Sa Procede de visualisation d'emissions diffusees et enregistrees possedant une caracteristique commune et dispositif associe
GB2360581A (en) * 2000-03-15 2001-09-26 Television Monitoring Services Quantification of brand exposure on screen
JP4300697B2 (ja) * 2000-04-24 2009-07-22 ソニー株式会社 信号処理装置及び方法
JP4332988B2 (ja) * 2000-04-27 2009-09-16 ソニー株式会社 信号処理装置及び方法
US7877766B1 (en) 2000-05-04 2011-01-25 Enreach Technology, Inc. Method and system of providing a non-skippable sub-advertisement stream
JP2003534757A (ja) * 2000-05-23 2003-11-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コマーシャル休止検出装置
US7013477B2 (en) * 2000-05-25 2006-03-14 Fujitsu Limited Broadcast receiver, broadcast control method, and computer readable recording medium
US8028314B1 (en) 2000-05-26 2011-09-27 Sharp Laboratories Of America, Inc. Audiovisual information management system
JP2002044572A (ja) 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
GB0022370D0 (en) * 2000-09-13 2000-10-25 Pace Micro Tech Plc Improvements to televisionn system
US8020183B2 (en) 2000-09-14 2011-09-13 Sharp Laboratories Of America, Inc. Audiovisual management system
US6829778B1 (en) 2000-11-09 2004-12-07 Koninklijke Philips Electronics N.V. Method and system for limiting repetitive presentations based on content filtering
US20030038796A1 (en) * 2001-02-15 2003-02-27 Van Beek Petrus J.L. Segmentation metadata for audio-visual content
US7536078B2 (en) * 2001-02-26 2009-05-19 Yesvideo, Inc. Identification of blank segments in a set of visual recording data
US8949878B2 (en) * 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US20020178447A1 (en) * 2001-04-03 2002-11-28 Plotnick Michael A. Behavioral targeted advertising
US20020184047A1 (en) * 2001-04-03 2002-12-05 Plotnick Michael A. Universal ad queue
US7904814B2 (en) 2001-04-19 2011-03-08 Sharp Laboratories Of America, Inc. System for presenting audio-video content
US7499077B2 (en) * 2001-06-04 2009-03-03 Sharp Laboratories Of America, Inc. Summarization of football video content
US7143354B2 (en) * 2001-06-04 2006-11-28 Sharp Laboratories Of America, Inc. Summarization of baseball video content
US20020188945A1 (en) * 2001-06-06 2002-12-12 Mcgee Tom Enhanced EPG to find program start and segments
AU2002254360A1 (en) * 2001-06-14 2003-01-02 Digeo, Inc. Aggregation and substitution of user-specified content
US7266832B2 (en) * 2001-06-14 2007-09-04 Digeo, Inc. Advertisement swapping using an aggregator for an interactive television system
US6870956B2 (en) * 2001-06-14 2005-03-22 Microsoft Corporation Method and apparatus for shot detection
US7203620B2 (en) 2001-07-03 2007-04-10 Sharp Laboratories Of America, Inc. Summarization of video content
JP4512969B2 (ja) * 2001-07-18 2010-07-28 ソニー株式会社 信号処理装置及び方法、記録媒体、並びにプログラム
US20030016604A1 (en) * 2001-07-20 2003-01-23 Hanes David H. System and method for detecting the border of recorded video data
US7089575B2 (en) * 2001-09-04 2006-08-08 Koninklijke Philips Electronics N.V. Method of using transcript information to identify and learn commercial portions of a program
US20030066077A1 (en) * 2001-10-03 2003-04-03 Koninklijke Philips Electronics N.V. Method and system for viewing multiple programs in the same time slot
US7474698B2 (en) 2001-10-19 2009-01-06 Sharp Laboratories Of America, Inc. Identification of replay segments
JP3823804B2 (ja) * 2001-10-22 2006-09-20 ソニー株式会社 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
US7020336B2 (en) * 2001-11-13 2006-03-28 Koninklijke Philips Electronics N.V. Identification and evaluation of audience exposure to logos in a broadcast event
US7170566B2 (en) * 2001-12-21 2007-01-30 Koninklijke Philips Electronics N.V. Family histogram based techniques for detection of commercials and other video content
US7337455B2 (en) * 2001-12-31 2008-02-26 Koninklijke Philips Electronics N.V. Method, apparatus, and program for evolving algorithms for detecting content in information streams
US7302160B1 (en) * 2002-01-22 2007-11-27 Lsi Corporation Audio/video recorder with automatic commercial advancement prevention
US7120873B2 (en) 2002-01-28 2006-10-10 Sharp Laboratories Of America, Inc. Summarization of sumo video content
US20030149975A1 (en) * 2002-02-05 2003-08-07 Charles Eldering Targeted advertising in on demand programming
US20030149621A1 (en) * 2002-02-07 2003-08-07 Koninklijke Philips Electronics N.V. Alternative advertising
US7333712B2 (en) * 2002-02-14 2008-02-19 Koninklijke Philips Electronics N.V. Visual summary for scanning forwards and backwards in video content
US20030172378A1 (en) * 2002-03-07 2003-09-11 Koninklijke Philips Electronics N.V. Method and apparatus for creating a personal commercials channel
US20030228125A1 (en) * 2002-03-07 2003-12-11 Koninklijke Philips Electronics N.V. Method and system for fee-based commercial-free television viewing
US8214741B2 (en) 2002-03-19 2012-07-03 Sharp Laboratories Of America, Inc. Synchronization of video and data
US20030184679A1 (en) * 2002-03-29 2003-10-02 Meehan Joseph Patrick Method, apparatus, and program for providing slow motion advertisements in video information
US8131133B2 (en) 2002-04-16 2012-03-06 Roth David A System and method for modifying broadcast signals in closed circuit systems
US8155498B2 (en) * 2002-04-26 2012-04-10 The Directv Group, Inc. System and method for indexing commercials in a video presentation
US7260308B2 (en) * 2002-05-09 2007-08-21 Thomson Licensing Content identification in a digital video recorder
KR100960342B1 (ko) * 2002-05-09 2010-05-28 톰슨 라이센싱 디지털 비디오 레코더에서 컨텐트 식별
US7206494B2 (en) * 2002-05-09 2007-04-17 Thomson Licensing Detection rules for a digital video recorder
US8872979B2 (en) * 2002-05-21 2014-10-28 Avaya Inc. Combined-media scene tracking for audio-video summarization
AU2003249663A1 (en) * 2002-05-28 2003-12-12 Yesvideo, Inc. Summarization of a visual recording
JP4076067B2 (ja) * 2002-07-02 2008-04-16 株式会社日立製作所 録画再生システム
GB0215624D0 (en) * 2002-07-05 2002-08-14 Colthurst James R Razor head
US20040010480A1 (en) * 2002-07-09 2004-01-15 Lalitha Agnihotri Method, apparatus, and program for evolving neural network architectures to detect content in media information
US7657836B2 (en) 2002-07-25 2010-02-02 Sharp Laboratories Of America, Inc. Summarization of soccer video content
US20040073919A1 (en) * 2002-09-26 2004-04-15 Srinivas Gutta Commercial recommender
US7657907B2 (en) 2002-09-30 2010-02-02 Sharp Laboratories Of America, Inc. Automatic user profiling
US7274741B2 (en) * 2002-11-01 2007-09-25 Microsoft Corporation Systems and methods for generating a comprehensive user attention model
US7116716B2 (en) * 2002-11-01 2006-10-03 Microsoft Corporation Systems and methods for generating a motion attention model
KR100555427B1 (ko) * 2002-12-24 2006-02-24 엘지전자 주식회사 비디오 재생 장치 및 지능형 스킵 방법
JP4528763B2 (ja) * 2003-01-06 2010-08-18 ペイス ピーエルシー インターネットからデータをストリーミングするリアルタイム記録エージェント
US7164798B2 (en) * 2003-02-18 2007-01-16 Microsoft Corporation Learning-based automatic commercial content detection
US7260261B2 (en) * 2003-02-20 2007-08-21 Microsoft Corporation Systems and methods for enhanced image adaptation
US20050177847A1 (en) * 2003-03-07 2005-08-11 Richard Konig Determining channel associated with video stream
US7738704B2 (en) * 2003-03-07 2010-06-15 Technology, Patents And Licensing, Inc. Detecting known video entities utilizing fingerprints
US7694318B2 (en) * 2003-03-07 2010-04-06 Technology, Patents & Licensing, Inc. Video detection and insertion
US7809154B2 (en) 2003-03-07 2010-10-05 Technology, Patents & Licensing, Inc. Video entity recognition in compressed digital video streams
US20040237102A1 (en) * 2003-03-07 2004-11-25 Richard Konig Advertisement substitution
US20050149968A1 (en) * 2003-03-07 2005-07-07 Richard Konig Ending advertisement insertion
WO2004086751A2 (en) 2003-03-27 2004-10-07 Sergei Startchik Method for estimating logo visibility and exposure in video
US6856758B2 (en) * 2003-04-09 2005-02-15 Televentions, Llc Method and apparatus for insuring complete recording of a television program
US6874160B1 (en) * 2003-05-01 2005-03-29 Nvidia Corporation Digital video recorder and method of operating the same
JP2004336507A (ja) * 2003-05-09 2004-11-25 Sony Corp 映像処理装置および方法、記録媒体、並びにプログラム
SG161094A1 (en) * 2003-06-25 2010-05-27 Chuan Sheng Foo Advertisement filtration method and system
US7685619B1 (en) 2003-06-27 2010-03-23 Nvidia Corporation Apparatus and method for 3D electronic program guide navigation
ES2277260T3 (es) * 2003-06-30 2007-07-01 Koninklijke Philips Electronics N.V. Sistema y metodo para generar un resumen multimedia de flujos multimedia.
US7581182B1 (en) 2003-07-18 2009-08-25 Nvidia Corporation Apparatus, method, and 3D graphical user interface for media centers
US7522816B2 (en) 2003-08-12 2009-04-21 The Directv Group, Inc. Method and apparatus for navigating content in a personal video recorder
AU2003272483A1 (en) * 2003-09-12 2005-04-27 Nielsen Media Research, Inc. Digital video signature apparatus and methods for use with video program identification systems
US7400761B2 (en) * 2003-09-30 2008-07-15 Microsoft Corporation Contrast-based image attention analysis framework
EP2144440A1 (en) * 2003-10-02 2010-01-13 Tivo, Inc. Modifying commercials for multi-speed playback
US7483484B2 (en) * 2003-10-09 2009-01-27 Samsung Electronics Co., Ltd. Apparatus and method for detecting opaque logos within digital video signals
US7356084B2 (en) * 2003-10-09 2008-04-08 Samsung Electronics Co., Ltd. Method for tracking the disappearance of detected logos within digital video signals
US7471827B2 (en) * 2003-10-16 2008-12-30 Microsoft Corporation Automatic browsing path generation to present image areas with high attention value as a function of space and time
WO2005046237A1 (en) * 2003-11-10 2005-05-19 Koninklijke Philips Electronics, N.V. Providing additional information
US7483618B1 (en) * 2003-12-04 2009-01-27 Yesvideo, Inc. Automatic editing of a visual recording to eliminate content of unacceptably low quality and/or very little or no interest
US7280737B2 (en) * 2004-02-23 2007-10-09 Warner Bros. Entertainment Inc. Method and apparatus for discouraging commercial skipping
US8356317B2 (en) 2004-03-04 2013-01-15 Sharp Laboratories Of America, Inc. Presence based technology
US8949899B2 (en) 2005-03-04 2015-02-03 Sharp Laboratories Of America, Inc. Collaborative recommendation system
US7594245B2 (en) 2004-03-04 2009-09-22 Sharp Laboratories Of America, Inc. Networked video devices
JP4682186B2 (ja) * 2004-03-12 2011-05-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチビュー表示装置
CA2563107C (en) 2004-03-29 2014-03-04 Nielsen Media Research, Inc. Methods and apparatus to detect a blank frame in a digital video broadcast signal
JP4776179B2 (ja) * 2004-05-25 2011-09-21 株式会社エヌ・ティ・ティ・ドコモ タイミング決定装置及びタイミング決定方法
US7362474B2 (en) * 2004-06-07 2008-04-22 Lite-On Technology Corp. Printing quality enhancement via graphic/text detection method in compression (JPEG) image
US9053754B2 (en) 2004-07-28 2015-06-09 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs
US7986372B2 (en) * 2004-08-02 2011-07-26 Microsoft Corporation Systems and methods for smart media content thumbnail extraction
DE102004042360B4 (de) * 2004-09-01 2006-06-08 Sonavis Gmbh Verfahren zum Erkennen von Videosequenzen in einem aufgenommenen Videofilm
US8117282B2 (en) 2004-10-20 2012-02-14 Clearplay, Inc. Media player configured to receive playback filters from alternative storage mediums
CN101077006A (zh) 2004-11-19 2007-11-21 Tivo股份有限公司 用于先前播放内容的安全传输的方法和设备
JP4932493B2 (ja) * 2004-12-27 2012-05-16 パナソニック株式会社 データ処理装置
KR20070112130A (ko) 2005-01-07 2007-11-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 그래픽 객체를 검출하기 위한 방법 및 전자 디바이스
US8068691B2 (en) * 2005-01-26 2011-11-29 Koninklijke Philips Electronics N.V. Sparkle processing
US20060195859A1 (en) * 2005-02-25 2006-08-31 Richard Konig Detecting known video entities taking into account regions of disinterest
US20060195860A1 (en) * 2005-02-25 2006-08-31 Eldering Charles A Acting on known video entities detected utilizing fingerprinting
US20060236220A1 (en) 2005-04-18 2006-10-19 Clearplay, Inc. Apparatus, System and Method for Associating One or More Filter Files with a Particular Multimedia Presentation
US20060242667A1 (en) * 2005-04-22 2006-10-26 Petersen Erin L Ad monitoring and indication
US7400364B2 (en) * 2005-04-26 2008-07-15 International Business Machines Corporation Sub-program avoidance redirection for broadcast receivers
KR100707189B1 (ko) * 2005-04-29 2007-04-13 삼성전자주식회사 동영상의 광고 검출 장치 및 방법과 그 장치를 제어하는컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 기록매체
US7690011B2 (en) * 2005-05-02 2010-03-30 Technology, Patents & Licensing, Inc. Video stream modification to defeat detection
US20060271947A1 (en) * 2005-05-23 2006-11-30 Lienhart Rainer W Creating fingerprints
US7707485B2 (en) * 2005-09-28 2010-04-27 Vixs Systems, Inc. System and method for dynamic transrating based on content
US20070112811A1 (en) * 2005-10-20 2007-05-17 Microsoft Corporation Architecture for scalable video coding applications
US8180826B2 (en) * 2005-10-31 2012-05-15 Microsoft Corporation Media sharing and authoring on the web
US7773813B2 (en) * 2005-10-31 2010-08-10 Microsoft Corporation Capture-intention detection for video content analysis
US8196032B2 (en) * 2005-11-01 2012-06-05 Microsoft Corporation Template-based multimedia authoring and sharing
US7904920B2 (en) * 2005-11-28 2011-03-08 Lg Electronics Inc. Method for skipping advertisement broadcasting
JP2007174195A (ja) * 2005-12-21 2007-07-05 Toshiba Corp 電子機器、自動シーンスキップ方法およびプログラム
US7599918B2 (en) 2005-12-29 2009-10-06 Microsoft Corporation Dynamic search with implicit user intention mining
US8689253B2 (en) 2006-03-03 2014-04-01 Sharp Laboratories Of America, Inc. Method and system for configuring media-playing sets
US20070242926A1 (en) * 2006-04-13 2007-10-18 Huang Chen-Hsiu Video Program Processing Method and System
JP2007300158A (ja) * 2006-04-27 2007-11-15 Toshiba Corp 単色フレーム検出方法
JP4187011B2 (ja) * 2006-06-01 2008-11-26 ソニー株式会社 情報処理システム、情報処理装置および方法、並びにプログラム
US7661121B2 (en) 2006-06-22 2010-02-09 Tivo, Inc. In-band data recognition and synchronization system
US7982797B2 (en) * 2006-06-30 2011-07-19 Hewlett-Packard Development Company, L.P. Detecting blocks of commercial content in video data
US8233048B2 (en) * 2006-09-19 2012-07-31 Mavs Lab. Inc. Method for indexing a sports video program carried by a video stream
US7814524B2 (en) * 2007-02-14 2010-10-12 Sony Corporation Capture of configuration and service provider data via OCR
US7991271B2 (en) 2007-02-14 2011-08-02 Sony Corporation Transfer of metadata using video frames
US8763038B2 (en) * 2009-01-26 2014-06-24 Sony Corporation Capture of stylized TV table data via OCR
US10489795B2 (en) * 2007-04-23 2019-11-26 The Nielsen Company (Us), Llc Determining relative effectiveness of media content items
WO2008135945A1 (en) * 2007-05-08 2008-11-13 Koninklijke Philips Electronics N.V. Method and apparatus for detecting a transition between video segments
KR20100017679A (ko) * 2007-05-08 2010-02-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 데이터 스트림의 삽입된 세그먼트를 검출하는 방법 및 장치
US8165451B2 (en) 2007-11-20 2012-04-24 Echostar Technologies L.L.C. Methods and apparatus for displaying information regarding interstitials of a video stream
US8165450B2 (en) 2007-11-19 2012-04-24 Echostar Technologies L.L.C. Methods and apparatus for filtering content in a video stream using text data
US8136140B2 (en) 2007-11-20 2012-03-13 Dish Network L.L.C. Methods and apparatus for generating metadata utilized to filter content from a video stream using text data
US8302120B2 (en) * 2008-02-19 2012-10-30 The Nielsen Company (Us), Llc Methods and apparatus to monitor advertisement exposure
US8606085B2 (en) 2008-03-20 2013-12-10 Dish Network L.L.C. Method and apparatus for replacement of audio data in recorded audio/video stream
US8090822B2 (en) 2008-04-11 2012-01-03 The Nielsen Company (Us), Llc Methods and apparatus for nonintrusive monitoring of web browser usage
US8763024B2 (en) 2008-04-23 2014-06-24 At&T Intellectual Property I, Lp Systems and methods for searching based on information in commercials
US8156520B2 (en) 2008-05-30 2012-04-10 EchoStar Technologies, L.L.C. Methods and apparatus for presenting substitute content in an audio/video stream using text data
US20090320063A1 (en) * 2008-06-23 2009-12-24 Microsoft Corporation Local advertisement insertion detection
US20090320060A1 (en) * 2008-06-23 2009-12-24 Microsoft Corporation Advertisement signature tracking
US8209713B1 (en) 2008-07-11 2012-06-26 The Directv Group, Inc. Television advertisement monitoring system
US8320674B2 (en) 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
US8035656B2 (en) * 2008-11-17 2011-10-11 Sony Corporation TV screen text capture
US8510771B2 (en) 2008-12-24 2013-08-13 Echostar Technologies L.L.C. Methods and apparatus for filtering content from a presentation stream using signature data
US8407735B2 (en) 2008-12-24 2013-03-26 Echostar Technologies L.L.C. Methods and apparatus for identifying segments of content in a presentation stream using signature data
US8588579B2 (en) 2008-12-24 2013-11-19 Echostar Technologies L.L.C. Methods and apparatus for filtering and inserting content into a presentation stream using signature data
US8438596B2 (en) 2009-04-08 2013-05-07 Tivo Inc. Automatic contact information transmission system
ES2395448T3 (es) 2009-06-02 2013-02-12 Fundacion Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech Procedimiento de detección y reconocimiento de logotipos en un flujo de datos de vídeo
US8437617B2 (en) 2009-06-17 2013-05-07 Echostar Technologies L.L.C. Method and apparatus for modifying the presentation of content
US8245249B2 (en) 2009-10-09 2012-08-14 The Nielson Company (Us), Llc Methods and apparatus to adjust signature matching results for audience measurement
JP2010130700A (ja) * 2009-12-08 2010-06-10 Toshiba Corp 映像解析装置およびプログラム
US8925024B2 (en) 2009-12-31 2014-12-30 The Nielsen Company (Us), Llc Methods and apparatus to detect commercial advertisements associated with media presentations
WO2011089276A1 (es) 2010-01-19 2011-07-28 Vicomtech-Visual Interaction And Communication Technologies Center Método y sistema de análisis de archivos multimedia
US8934758B2 (en) 2010-02-09 2015-01-13 Echostar Global B.V. Methods and apparatus for presenting supplemental content in association with recorded content
US8422859B2 (en) * 2010-03-23 2013-04-16 Vixs Systems Inc. Audio-based chapter detection in multimedia stream
CN101840435A (zh) 2010-05-14 2010-09-22 中兴通讯股份有限公司 一种实现视频预览和检索的方法及移动终端
US8677385B2 (en) 2010-09-21 2014-03-18 The Nielsen Company (Us), Llc Methods, apparatus, and systems to collect audience measurement data
US8364865B2 (en) 2010-09-28 2013-01-29 Microsoft Corporation Data simulation using host data storage chain
US20130067326A1 (en) * 2011-09-14 2013-03-14 Eldon Technology Limited Associating Macro User Input Events with Content
US8953891B1 (en) * 2011-09-30 2015-02-10 Tribune Broadcasting Company, Llc Systems and methods for identifying a black/non-black frame attribute
TWI520609B (zh) * 2012-10-05 2016-02-01 緯創資通股份有限公司 顯示系統以及通訊方法
US20140118622A1 (en) * 2012-10-29 2014-05-01 Tektronix, Inc. Dct based black frame detection using varying block size
KR102045245B1 (ko) 2012-12-20 2019-12-03 삼성전자주식회사 휴대단말기의 영상 재생 방법 및 장치
US9098553B2 (en) * 2013-03-15 2015-08-04 Gridglo Llc System and method for remote activity detection
US20140282790A1 (en) * 2013-03-15 2014-09-18 Echostar Technologies L.L.C. Systems and methods for avoiding missing television programming when changing between television channels
KR20150060008A (ko) * 2013-11-25 2015-06-03 (주)휴맥스 광고 제거 미디어 제작 장치 및 방법
WO2015102014A1 (en) * 2013-12-31 2015-07-09 Vats Nitin Texturing of 3d-models using photographs and/or video for use in user-controlled interactions implementation
CN104754179B (zh) * 2013-12-31 2017-11-07 澜起科技(上海)有限公司 动态图像中的静态特征信息的全自动检测方法及系统
USRE48920E1 (en) * 2014-02-21 2022-02-01 Lattice Semiconductor Corporation Adaptive processing of video streams with reduced color resolution
CN106031168B (zh) * 2014-02-21 2018-02-06 美国莱迪思半导体公司 具有减少色彩分辨率的视频流的自适应处理
US9179184B1 (en) * 2014-06-20 2015-11-03 Google Inc. Methods, systems, and media for detecting a presentation of media content on a display device
CN104581396A (zh) * 2014-12-12 2015-04-29 北京百度网讯科技有限公司 一种推广信息的处理方法及装置
US9973662B2 (en) * 2015-01-13 2018-05-15 Arris Enterprises Llc Detection of solid color frames for determining transitions in video content
US10057577B2 (en) * 2015-06-11 2018-08-21 Sony Corporation Pre-charge phase data compression
US9848222B2 (en) 2015-07-15 2017-12-19 The Nielsen Company (Us), Llc Methods and apparatus to detect spillover
CN105573747B (zh) * 2015-12-10 2018-11-06 小米科技有限责任公司 用户界面的测试方法及装置
WO2017114573A1 (en) * 2015-12-30 2017-07-06 Telecom Italia S.P.A. Control of processing of multimedia content
US11256923B2 (en) * 2016-05-12 2022-02-22 Arris Enterprises Llc Detecting sentinel frames in video delivery using a pattern analysis
US10097865B2 (en) 2016-05-12 2018-10-09 Arris Enterprises Llc Generating synthetic frame features for sentinel frame matching
US9872049B1 (en) * 2016-06-30 2018-01-16 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements
US10397620B2 (en) 2016-06-30 2019-08-27 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
US11272228B2 (en) 2016-06-30 2022-03-08 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements in live stream content
CN112070864A (zh) * 2019-06-11 2020-12-11 腾讯科技(深圳)有限公司 动画渲染方法、装置、计算机可读存储介质和计算机设备
US11172269B2 (en) 2020-03-04 2021-11-09 Dish Network L.L.C. Automated commercial content shifting in a video streaming system
US11792491B2 (en) 2020-09-30 2023-10-17 Snap Inc. Inserting ads into a video within a messaging system
US11856255B2 (en) 2020-09-30 2023-12-26 Snap Inc. Selecting ads for a video within a messaging system
US11694444B2 (en) 2020-09-30 2023-07-04 Snap Inc. Setting ad breakpoints in a video within a messaging system
US11930063B2 (en) * 2020-12-09 2024-03-12 Nagravision S.A. Content completion detection for media content
CN112672165A (zh) * 2020-12-25 2021-04-16 咪咕文化科技有限公司 图像编码、解码方法、电子设备及可读存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4390904A (en) * 1979-09-20 1983-06-28 Shelton Video Editors, Inc. Automatic circuit and method for editing commercial messages from television signals
JPH01284092A (ja) * 1988-01-26 1989-11-15 Integrated Circuit Technol Ltd ビデオ信号から特定資料を識別し排除する方法及び装置
US5245436A (en) * 1992-02-14 1993-09-14 Intel Corporation Method and apparatus for detecting fades in digital video sequences
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5696866A (en) * 1993-01-08 1997-12-09 Srt, Inc. Method and apparatus for eliminating television commercial messages
US5692093A (en) * 1993-01-08 1997-11-25 Srt, Inc. Method and apparatus for eliminating television commercial messages
US5455630A (en) * 1993-08-06 1995-10-03 Arthur D. Little Enterprises, Inc. Method and apparatus for inserting digital data in a blanking interval of an RF modulated video signal
US5999688A (en) * 1993-01-08 1999-12-07 Srt, Inc. Method and apparatus for controlling a video player to automatically locate a segment of a recorded program
US5343251A (en) * 1993-05-13 1994-08-30 Pareto Partners, Inc. Method and apparatus for classifying patterns of television programs and commercials based on discerning of broadcast audio and video signals
JP2804225B2 (ja) * 1993-12-28 1998-09-24 株式会社東芝 Cmバンクシステム
US5668917A (en) * 1994-07-05 1997-09-16 Lewine; Donald A. Apparatus and method for detection of unwanted broadcast information
EP0735754B1 (en) * 1995-03-30 2008-05-07 THOMSON Licensing Method and apparatus for the classification of television signals
JP3098170B2 (ja) * 1995-05-16 2000-10-16 株式会社日立製作所 記録再生装置,記録再生方法及びコマーシャル判別装置
JPH08339379A (ja) * 1995-06-12 1996-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像解析方法および装置
JP3407840B2 (ja) * 1996-02-13 2003-05-19 日本電信電話株式会社 映像要約方法
JP3423138B2 (ja) * 1996-02-22 2003-07-07 三洋電機株式会社 テレビジョン放送信号の記録再生装置
JP3332756B2 (ja) * 1996-03-14 2002-10-07 三洋電機株式会社 テレビジョン放送信号の記録再生装置
JPH09312827A (ja) * 1996-05-22 1997-12-02 Sony Corp 記録再生装置
JPH09322125A (ja) * 1996-05-24 1997-12-12 Sony Corp 映像信号再生装置及び方法
US5920360A (en) * 1996-06-07 1999-07-06 Electronic Data Systems Corporation Method and system for detecting fade transitions in a video signal

Also Published As

Publication number Publication date
ATE395785T1 (de) 2008-05-15
US6100941A (en) 2000-08-08
EP1040656A2 (en) 2000-10-04
JP2002521977A (ja) 2002-07-16
WO2000007367A2 (en) 2000-02-10
WO2000007367A3 (en) 2000-03-23
DE69938711D1 (de) 2008-06-26
EP1040656B1 (en) 2008-05-14

Similar Documents

Publication Publication Date Title
JP2010246161A (ja) ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法
JP5005154B2 (ja) 記憶媒体上に記憶された情報信号を再生する装置
US6137544A (en) Significant scene detection and frame filtering for a visual indexing system
US6125229A (en) Visual indexing system
US6606409B2 (en) Fade-in and fade-out temporal segments
US8442384B2 (en) Method and apparatus for video digest generation
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
US20030061612A1 (en) Key frame-based video summary system
JP2005513663A (ja) コマーシャル及び他のビデオ内容の検出用のファミリーヒストグラムに基づく技術
US20070211170A1 (en) Methods and apparatus to distinguish a signal originating from a local device from a broadcast signal
US7840081B2 (en) Methods of representing and analysing images
WO1997010564A9 (en) A method of compressing a plurality of video images
JP2003511934A (ja) コマーシャル及び他のビデオコンテンツの標識に基づく自動的突き止め、習得及び抽出
KR20010089770A (ko) 동적 임계치를 사용하는 비주얼 인덱싱 시스템에 대한중요 장면 검출 및 프레임 필터링
KR100547370B1 (ko) 객체 형상 정보를 이용한 요약영상 추출 장치 및 그방법과 그를 이용한 동영상 요약 및 색인 시스템
JP2004528790A (ja) 番組開始及び終了区切りを検出する拡張epg
US20070061727A1 (en) Adaptive key frame extraction from video data
Fernando et al. Fade-in and fade-out detection in video sequences using histograms
JP2005536937A (ja) 一連のビデオ画像中でのコンテンツ特性の検出用のユニット及び方法
JP3024574B2 (ja) 動画像検索装置
JP2000182028A (ja) 字幕領域検出方法及びその装置、並びに動画像検索方法及びその装置
Possos et al. Accuracy and stability improvement of tomography video signatures
Chen et al. Object and Color Based Video Representation for Automatic Model-Free News Summarization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100715

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20120224