JP2007049516A - 映像記録装置及びシーンチェンジ抽出方法 - Google Patents

映像記録装置及びシーンチェンジ抽出方法 Download PDF

Info

Publication number
JP2007049516A
JP2007049516A JP2005232957A JP2005232957A JP2007049516A JP 2007049516 A JP2007049516 A JP 2007049516A JP 2005232957 A JP2005232957 A JP 2005232957A JP 2005232957 A JP2005232957 A JP 2005232957A JP 2007049516 A JP2007049516 A JP 2007049516A
Authority
JP
Japan
Prior art keywords
scene change
video
unit
encoding
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005232957A
Other languages
English (en)
Other versions
JP3827705B1 (ja
Inventor
Yoshiaki Kusunoki
恵明 楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005232957A priority Critical patent/JP3827705B1/ja
Priority to JP2007529457A priority patent/JP4707713B2/ja
Priority to PCT/JP2006/305337 priority patent/WO2007017970A1/ja
Priority to CN2006800291636A priority patent/CN101238727B/zh
Priority to US11/989,309 priority patent/US8886014B2/en
Application granted granted Critical
Publication of JP3827705B1 publication Critical patent/JP3827705B1/ja
Publication of JP2007049516A publication Critical patent/JP2007049516A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像の記録と並行して映像のシーンチェンジ抽出を行うことができる映像記録装置及びシーンチェンジ抽出方法を提供する。
【解決手段】映像記録装置100は、映像データPINを符号化する符号化器101と、符号化器101から出力された符号化ストリームを記録するHDD105と、符号化器101から出力された符号化ストリームをHDD105に転送するストリーム制御部103と、符号化器101から出力された符号化ストリームを復号化し、復号化された映像データのシーンチェンジを抽出するシーンチェンジ抽出部110と、符号化器101から符号化ストリームの符号化単位毎に符号化完了通知IENを取得して、シーンチェンジ抽出部110に対するシーンチェンジ抽出指示CSCを出力する録画制御部102とを有している。
【選択図】 図1

Description

本発明は、映像の記録と並行して映像のシーンチェンジを検出することができる映像記録装置、及びこの映像記録装置によって実施されるシーンチェンジ抽出方法に関するものである。
従来、映像を符号化して記録する映像記録装置において、記録した映像から希望する映像シーンを探し出すためには、早送り又は巻戻しなどの特殊再生を利用しながら、人間の目で該当するシーンを探し出しており、非常に多くの時間と労力を費やす必要があった。
このような問題を解消するために、映像の場面転換シーン(以後「シーンチェンジ」と言う。)を見つけるための方法が提案されてきた(例えば、特許文献1及び2参照)。特許文献1には、符号化を行うエンコーダの前段のプリ映像信号処理装置において、時間的に前後する2つの映像のヒストグラムの差の絶対値を算出し、算出された絶対値が所定の閾値を超えた場合にシーンチェンジであると判定する方法が示されている。また、特許文献2には、既にHDDなどのストレージメディアに蓄積された映像データを読み出してシーンチェンジを抽出する方法が示されている。
特開2004−282318号公報(第7頁、図2) 特開2002−064823号公報(第5頁、図1)
しかしながら、特許文献1に示される方法は、エンコーダの前段に設けられたプリ映像信号処理装置によってシーンチェンジを検出する方法であるので、ビデオエンコーダからエンコーダまでの構成が一体になっているエンコーダチップセットであってシーンチェンジ抽出結果を外部に出力しないものを備えた映像記録装置には適用することができなかった。また、エンコーダチップセットがシーンチェンジ抽出結果を出力する場合においても、使用するエンコーダチップセットの種類が変わる毎にシーンチェンジ抽出結果が変わってしまうので、エンコーダチップセットの種類が変わる毎に映像記録装置における調整が必要になるという問題があった。
また、特許文献2に示される方法は、既に圧縮されHDD上に記録された映像ストリームからシーンチェンジを検出する方法であるので、記録処理が完了した後に、オフラインで多大な時間のかかる処理を行う必要があり、実用的ではなかった。
そこで、本発明は、上記従来技術の課題を解決するためになされたものであり、その目的は、映像の記録と並行して映像のシーンチェンジ抽出を行うことができる映像記録装置及びこの映像記録装置において実施されるシーンチェンジ抽出方法を提供することである。
本発明の映像記録装置は、映像データを符号化する符号化手段と、前記符号化手段から出力された符号化ストリームを記録する記録手段と、前記符号化手段から出力された符号化ストリームを前記記録手段に転送するストリーム制御手段と、前記符号化手段から出力された符号化ストリームを復号化し、該復号化された映像データのシーンチェンジを抽出する映像変化点抽出手段と、前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに前記映像変化点抽出手段に対するシーンチェンジ抽出指示を出力する録画制御手段とを有することを特徴とするものである。
また、本発明のシーンチェンジ抽出方法は、符号化手段によって映像データを符号化して符号化ストリームを出力するステップと、前記符号化ストリームをストリーム制御手段によって転送して記録手段に記録するステップと、録画制御手段によって前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに映像変化点抽出手段に対するシーンチェンジ抽出指示を出力するステップと、前記映像変化点抽出手段によって、前記符号化手段から出力された符号化ストリームを復号化し、該復号化された映像データのシーンチェンジを抽出するステップとを有することを特徴とするものである。
本発明の映像記録装置及びシーンチェンジ抽出方法によれば、映像が符号化される毎にシーンチェンジ抽出処理を行うので、リアルタイムにシーンチェンジの抽出を行うことができるという効果がある。
実施の形態1.
図1は、本発明の実施の形態1の映像記録装置100の構成を示すブロック図である。図1に示されるように、映像記録装置100は、図示しないチューナから又は外部から入力された入力映像データに対して、MPEG−2(Moving Picture Experts Group)に準拠した符号化を行う符号化手段としての符号化部101と、符号化部101によって生成された符号化ストリームが記録される記録手段としてのHDD(ハードディスクドライブ)105と、HDD105に対して符号化ストリームを安定的に書き込み及び読み出しを行うためのストリーム制御を行うストリーム制御手段としてのストリーム制御部103とを有している。また、映像記録装置100は、ストリーム制御部103が符号化ストリームを一時的に記憶しておく一時記憶手段としてのストリームバッファ104と、符号化部101に対して符号化の開始・終了などを指示する録画制御手段としての録画制御部102と、符号化部101によって生成された符号化ストリームからシーンチェンジを抽出する映像変化点抽出手段としてのシーンチェンジ抽出部110とを有している。図1には、記録手段としてHDD105が示されているが、記録手段は、DVDのような光ディスクや磁気テープなどの他の情報記録媒体であってもよい。また、映像記録装置100は、DVD/HDDハイブリッドレコーダであってもよい。さらに、映像記録装置100は、家庭用のビデオレコーダに限らず、パーソナルコンピュータ、映像サーバ、又は、監視システム用の監視レコーダなどの各種用途に適用できる。
符号化部101による符号化方式であるMPEG−2は可変レートに対応しており、そのため、1秒間に発生する符号量(ビットレート)は時間によって大きく変動する。そのため、ストリーム制御部103は、HDD105へのデータ書き込み及びHDD105からのデータ読み出しによって符号化ストリームがオーバーフロー又はアンダーフローしないように、符号化ストリームをストリームバッファ104に一時的に保持させ、HDD105の状態に応じて符号化ストリームのHDD105への書き出し及びHDD105からの読み込みを行っている。ストリームバッファ104は、リングバッファで構成されており、書き込み位置ポインタと読み出し位置ポインタによって有効なデータ領域が管理されている。すなわち、データの書き込み時には、書き込み位置ポインタを先頭にデータサイズ分書き込みを行い、書き込んだデータサイズ分だけ書き込み位置ポインタを進める。一方、データの読み出し時には、読み出し位置ポインタを先頭にデータサイズ分読み出しを行い、読み出したデータサイズ分だけ読み出し位置ポインタを進める。ただし、リングバッファの終了位置に来たときは、ポインタを先頭の位置に戻す処理を行う。
図2は、図1に示されるシーンチェンジ抽出部110の構成を示すブロック図である。図2に示されるように、シーンチェンジ抽出部110は、入力された符号化ストリームの復号化を行う復号化手段としての復号化部111と、復号化された映像データのヒストグラムを生成するヒストグラム生成手段としてのヒストグラム生成器112と、ヒストグラム生成器112によって生成されたヒストグラムを保持する第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114と、第1のヒストグラムバッファ113に保持されたヒストグラムと第2のヒストグラムバッファ114に保持されたヒストグラムの差異を求める差分抽出手段としての差分抽出器115とを有している。また、シーンチェンジ抽出部110は、差分抽出器115で求めた差異値と予め設定された閾値を比較するシーンチェンジ判定手段としてのシーンチェンジ判定器116と、録画制御部102からのシーンチェンジ開始命令などの制御信号に基づいてシーンチェンジ抽出部110を制御するシーンチェンジコマンド制御手段としてのシーンチェンジコマンド制御部120とを有している。
次に、映像記録装置100の録画動作について説明する。録画が開始されると、録画制御部102は、符号化部101に対して制御信号CENを出力して符号化開始を指示し、符号化部101は入力された映像データPINの符号化処理を開始する。符号化部101は、例えば、符号化単位であるGOP(Group of Pictures)の符号化が完了する毎に、録画制御部102にGOP符号化完了通知IENを送る。ストリーム制御部103は、符号化部101によって符号化された符号化ストリームをストリームバッファ104の書き込み位置ポインタを先頭に順次書き込んでいく。一方、ストリーム制御部103は、HDD105が書き込み状態になっているのを確認しながら、ストリームバッファ104の読み出し位置ポインタから符号化ストリームを読み出し、HDD105に書き込みを行う。録画が実行されている間、前記動作が繰り返し行われる。録画終了時には、録画制御部102は、符号化部101に対して符号化終了を指示し、符号化部101は符号化を停止する。ストリーム制御部103は、ストリームバッファ104に残っている符号化ストリームをすべてHDD105に書き込む。
次に、録画を行いながらシーンチェンジを抽出する方法について説明する。録画制御部102は、例えば、GOPの符号化完了通知IENを符号化部101から受け取る毎に、シーンチェンジ抽出部110に対してシーンチェンジ抽出コマンドCSCを送る。シーンチェンジ抽出コマンドCSCは、シーンチェンジ抽出部110内のシーンチェンジ制御部120を経由して、復号化開始コマンドCDEとして復号化部111に送られる。復号化部111は、符号化ストリームPSTをストリーム制御部103を経由してストリームバッファ104から呼び出し、復号化を開始する。復号化部111によってMPEG−2からYUVに復号化された映像データはヒストグラム生成器112に入力され、ヒストグラム生成器112によって映像データのYUVの各区画に含まれる計数に基づいてヒストグラムが作成される。ここで、ヒストグラム生成のための区画分けは、値の取り得る範囲を一定間隔に区切る方法、又は、予め複数の閾値を定めておいて、各閾値に対する大小関係に応じて区画分けをする方法などがある。また、ここでは、輝度成分Yと色差成分U、Vのすべての成分に対してヒストグラムを作成する場合を説明しているが、輝度成分Yのみについてヒストグラムを生成する方法を採用してもよい。また、輝度成分Yと色差成分U、Vのすべての成分に対してヒストグラムを作成するが、色差成分U及びVに対しては重みを加えて区画分けを荒くする方法を採用してもよい。また、ヒストグラムの区画分けの方法は、以上に説明した例に限定されず、他の区画分け方法を採用してもよい。
ヒストグラム生成器112で生成されたヒストグラムは、第1のヒストグラムバッファ113又は第2のヒストグラムバッファ114に交互に送られ保持される。差分抽出器115は、第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114に交互に記憶されたヒストグラムを用いて、現在の映像データと1つ前の映像データの映像の比較を行い(例えば、現在のフレームの映像データと、1フレーム前のフレームの映像データの比較を行い)、差異値を求める。2つのヒストグラムの差異値を求める方法としては、例えば、2つのヒストグラムの対応する成分の値の差を、すべての成分について累積する方法がある。ここで、i番目の映像のヒストグラムをH
={h(1),h(2),・・・,h(K)}
とすると、i番目の映像のヒストグラムHと、1つ前のiー1番目の映像のヒストグラムHi−1との差異値dを以下の式で求める。なお、Kは、所定の正の整数である。
Figure 2007049516
ここで、Nは1フレーム内の画素数である。これによって、差異値dは0から1までの値をとり、i番目のフレームの映像とiー1番目のフレームの映像が同じ映像であれば差異値dは0になり、i番目のフレームの映像とiー1番目のフレームの映像の違いが大きければ差異値dは1に近づくことになる。
差分抽出器115で求められた差異値dは、シーンチェンジ判定器116に送られ、予めシーンチェンジコマンド制御部120によって設定された閾値ETHと比較され、設定された閾値ETHより大きな値であればシーンチェンジと判定し、その判定結果RSCをシーンチェンジコマンド制御部120に送る。さらに、録画終了時などに判定結果RSCを録画制御部102に送る。
以上に説明したように、符号化部101によってGOPの符号化が完了する毎に(すなわち、実施の形態1においては、GOPの符号化完了に同期して)、シーンチェンジ抽出部110でシーンチェンジ判定を行う処理を、映像の録画開始から終了までの間において継続的に行うことによって、映像ストリームPSTを録画しながら、映像ストリームPSTのシーンチェンジを抽出することができる。すなわち、符号化の最小単位であるGOPの符号化完了毎にシーンチェンジ抽出処理を実行するので、符号化と並行してシーンチェンジ抽出を行うことができる。
また、リアルタイムにシーンチェンジ抽出を行うので、シーンチェンジ抽出機能を有していないエンコーダを符号化部101に用いることができる。そのため、映像記録装置に採用するエンコーダの選定に際して、シーンチェンジ抽出機能を有しないエンコーダを選ぶことが可能になり、エンコーダ選択の幅が広がり、コストや調達性を重視したエンコーダの選択が可能になる。
また、既にHDDなどに蓄積された符号化ストリームを解析してシーンチェンジを抽出する方法では、符号化ストリームを記憶装置であるHDDから読み出すための時間が、シーンチェンジの解析時間に加えて、必要とされる。しかしながら、実施の形態1の映像記録装置100においては、HDD105よりも書き込み及び読出し速度が速く、ストリームを一時的に記憶しておくストリームバッファ104(通常は、揮発性半導体メモリを用いる)から読み出すため高速に読み出すことができ、結果として処理時間が早くなる。
また、シーンチェンジ抽出部110は符号化部101(エンコーダ)の動作よって影響されないので、エンコーダの種類や仕様が変更されたとしても、シーンチェンジの抽出基準を一定範囲に維持することができる。
また、実施の形態1の映像記録装置は、録画と並行してシーンチェンジを抽出できる機能のほかに、符号化ストリームを直接解析する機能をも有する。このため、直接HDDに記録された符号化ストリームに対してもストリーム制御部103を介して符号化ストリームを読み出すことによってシーンチェンジ抽出を行うことができる。
さらに、一般的にハードウェアで構成されるエンコーダチップ内のシーンチェンジ機能を利用するわけではなく、録画再生装置のファームウェアのみで構成することも可能なので、シーンチェンジ抽出のためのアルゴリズムを比較的容易に改変したり、録画再生装置の状態等に合わせてシーンチェンジ抽出処理の状態遷移や閾値を動的に変更したりすることができる。
例えば、入力映像データがCM映像データである期間は、シーンチェンジの判定の閾値ETHを大きくして、シーンチェンジであると判定され難くして、CM映像データに対するシーンチェンジ検出を実行させないように制御する方法を採用してもよい。
また、シーンチェンジにおいて音声信号が無音になる瞬間が存在することに着目し、音声信号が無音(すなわち、所定の閾値よりも低いレベル)のときに、シーンチェンジの判定の閾値ETHを小さくすることによって、シーンチェンジを映像データだけでなく、音声データをも考慮して検出し、シーンチェンジの検出精度を向上させる制御方法を採用してもよい。
また、以上の説明においては、シーンチェンジ抽出単位を1GOPとしているが、シーンチェンジ抽出単位を複数のGOP単位としてもよい。また、シーンチェンジ抽出単位を、1又は複数のスライス単位又は1又は複数のマクロブロック単位としてもよい。
また、以上の説明においては、復号化処理を行う方法としてソフトウェアによる例を示したが、ハードウェアによって実行してもよい。
実施の形態2.
本発明の実施の形態2の映像記録装置は、図2に示されるシーンチェンジコマンド制御部120の構成及び動作のみが、実施の形態1の映像記録装置と相違する。したがって、実施の形態2の説明においては、図1及び図2をも参照する。
実施の形態2の映像記録装置は、録画と並行してシーンチェンジ抽出を行う場合に、シーンチェンジ抽出動作をGOPの符号化処理と非同期に行う。この非同期に行われる符号化処理を、単に「非同期処理」とも言う。この非同期処理は、符号化部101による符号化処理が完了したGOPに対して実行されるシーンチェンジ抽出処理の開始タイミングが、符号化処理の完了タイミングと必ずしも一致しない状態でも実行できることである。非同期処理の実際の動作としては、あるGOPについて着目すると、符号化処理が完了した後、直ぐにシーンチェンジ抽出処理が行うのではなく、しばらく時間を置いてからシーンチェンジ抽出処理を実行する方法である。
一般的に、映像を記録する装置、例えば、HDD/DVDハイブリッドレコーダなどにおいては録画動作に並行して、再生やダビング等のような装置のCPUの負荷が上昇する動作が発生し得る。また、ユーザーによって不定期に行われる行為、例えば、DVDのトレーオープン、機能設定画面の表示、及び電子番組表の閲覧などの動作は、装置の一時的なCPUの負荷上昇を招く。これらの動作によって負荷上昇が発生した場合、シーンチェンジ抽出処理のために、CPUを占有し続けることができる保障はなく、他の処理の完了を待つ間、シーンチェンジ抽出処理をしばらく遅らせることが望ましい場合があり得る。一方、シーンチェンジ抽出処理によって、装置の基本機能である映像の記録機能が妨げられることがあってはならず、よってシーンチェンジ抽出処理は記録処理よりも優先度を落とした処理にすることが望ましい。このような機能を実現するために、実施の形態2の映像記録装置においては、シーンチェンジ抽出処理を録画動作と非同期に行うころができるように構成している。
図3は、実施の形態2の映像記録装置のシーンチェンジコマンド制御部120(図2に示される)の構成を示すブロック図である。図3に示されるように、シーンチェンジコマンド制御部120は、録画制御部102からのコマンドの受け付けを行うAPI(アプリケーション プログラム インターフェース)部121と、受け付けたコマンドを複数保持するコマンドバッファ122と、シーンチェンジ抽出部の状態遷移を司り、受け付けたコマンドを処理する状態制御部124と、シーンチェンジ抽出結果やエラー状態を保持し、録画制御部102に返すためのシーンチェンジ抽出結果バッファ123とを有している。実施の形態2の映像記録装置が実施の形態1の映像記録装置と相違する点は、録画制御部102から発行されたシーンチェンジ抽出コマンドがシーンチェンジコマンド制御部120内のAPI部121に伝えられ、コマンドバッファ122に一旦保持されることである。コマンドバッファ122が保持できるコマンドの数はストリームバッファ104の容量に応じて設定すればよい。例えば、ストリームバッファ104のサイズが実施の形態1で示した20Mバイトである仮定すると、符号化ストリームの約15秒分(すなわち、1GOPあたり15ピクチャ、0.5秒の時間長とすると、30GOPのデータ)が一時的に保持できることになり、よって、30個分のシーンチェンジ抽出コマンドを保持できるように構成すればよい。コマンドバッファ122が30個のシーンチェンジ抽出コマンドを保持でき、且つ、ストリームバッファ104に30GOP分のデータが残っていれば、最新のGOPから30個前のGOPまで遡ってシーンチェンジ抽出が可能であることを意味し、30個のGOP分、すなわち、15秒遅延したシーンチェンジ抽出処理が可能であることをも意味する。シーンチェンジコマンド制御部120のシーンチェンジ抽出結果バッファ123は、シーンチェンジ抽出部110の状態制御部124が実行したシーンチェンジ抽出結果の複数回分保持することが可能で、コマンドバッファ122に保持できるコマンド数と同数分を保持できるものとすればよい。
これによって、先行するGOPのシーンチェンジ抽出処理が完了していない状態(例えば、ユーザーが既に録画されているストリームの再生要求をしたために、システムの負荷が上昇し、シーンチェンジ抽出処理が完了できなかった場合)において、次のGOPの符号化が完了し、録画制御部102からシーンチェンジ抽出コマンドが発行された場合であっても、新しいシーンチェンジ抽出コマンドはコマンドバッファ122に保持される。コマンドバッファ122に保持されているシーンチェンジ抽出コマンドによって、現在実行中のシーンチェンジ抽出処理が完了後に、先行するGOPのシーンチェンジ抽出処理を実行できるので、GOPの符号化毎にシーンチェンジ抽出処理が完了しないために次のシーンチェンジ抽出処理が実行できないという問題を防ぐことができる。
次に、図4、図5、及び図6のフローチャートを用いて録画動作と非同期で動作するシーンチェンジ抽出処理の説明を行う。まず、録画制御部102の動作について説明する。映像記録装置100に電源が投入されると、システム起動(ステップS201)され、定期的にシステム終了の確認(ステップS202)と録画開始の確認(ステップS204)が行われ、システム終了の要求があれば、システム終了(ステップS202)に遷移する。一方、録画開始の要求があれば、シーンチェンジコマンド制御部120に対して、録画開始コマンド発行(ステップS205)が行われる。録画開始コマンドの発行の後は、録画終了を確認(ステップS206)し、録画終了であれば録画終了コマンドをシーンチェンジコマンド制御部120に発行する(ステップS207)。録画状態においては、GOP単位の符号化が完了すると(ステップS208)、シーンチェンジコマンド制御部120に対してシーンチェンジ検出コマンドが発行される(ステップS209)。GOP符号化検出(ステップS208)は、録画が完了するまで続けられる。録画制御部102から発行された制御コマンドは、シーンチェンジコマンド制御部120のAPI部121内で処理される。シーンチェンジ制御コマンドCSCが発行されるとコマンドバッファ122の空きをチェックし(ステップS223)、コマンドバッファ122の空きがあれば、コマンドバッファ122にコマンドを格納する(ステップS224)。コマンドバッファ122に格納できなかった場合も含めて、次にシーンチェンジ状態制御部124からシーンチェンジ結果バッファ123に蓄えられたシーンチェンジ抽出結果の取得を行う(ステップS225)。最後に、シーンチェンジ抽出結果とコマンドが受け付けられたか否かを録画制御部102に返す(ステップS226)。
一方、シーンチェンジ状態制御部124では電源起動されると(ステップS241)、コマンド待ち状態になり(ステップS242)、受け取ったコマンドがシステム終了(ステップS243)であればシステム終了に移る(ステップS245)。また、コマンドが録画開始コマンドであれば(ステップS252)、録画開始のための例えばメモリの確保や変数の初期化などの録画開始処理(ステップS253)を実行し、録画終了コマンド(ステップS254)であれば、例えば確保したメモリの開放やシーンチェンジ抽出結果を録画制御部102に送る録画終了処理(ステップS255)を行う。一方、受け取ったコマンドがシーンチェンジ抽出コマンドであれば、シーンチェンジ抽出コマンドに付けて渡される符号化ストリームのストリームバッファ104における先頭アドレスを元に、符号化ストリームの復号化を行う(ステップS246)。復号化部111によってYUVに変換された映像データからヒストグラムを生成し(ステップS247)、そのヒストグラムを第1のヒストグラムバッファ113(又は第2のヒストグラムバッファ114)に格納する(ステップS248)。生成したヒストグラムと第2のヒストグラムバッファ114(又は第1のヒストグラムバッファ113)に格納されている1つ前の映像のヒストグラムの差異値を求め(ステップS249)、予め設定されている閾値以上であればシーンチェンジと判定する(ステップS250)。この結果を、結果バッファ123に格納する(ステップS251)。
1つのGOPに対するシーンチェンジ抽出処理が終わると、次の処理を行うためにコマンド待ち(ステップS242)に移る。ここでもし既にコマンドバッファ122にコマンドが格納されていれば、即座に、次のGOPの解析が開始されるが、次のコマンドバッファがまだ設定されていなければ、コマンド待ちを継続する(ステップS242)。
実施の形態2の映像記録装置においては、シーンチェンジ抽出を行うソフトウェアモジュールのタスク又はスレッドの優先度は録画再生を行うモジュール群より低くしている。この理由は、シーンチェンジ抽出を行うモジュールは、MPEGのソフトウェアデコード処理を伴うために、非常に処理負荷が高く、よって図示しないがソフトウェアを処理するCPUを占有する時間が他のモジュールに比べて極めて大きくなるからである。そのため、もしシーンチェンジ抽出モジュールの優先度を録画再生モジュールの優先度と同じ又はそれ以上にしていると、録画再生時にCPUの処理時間の多くを占有し、そのために映像の記録に関するモジュールの処理が遅れ、結果記録又は再生ができない問題を引き起こす可能性があるからである。さらに、ユーザー入力によって動作するモジュール、例えば、キー入力、画面表示等を司るモジュールの動作も同様にシーンチェンジ抽出モジュールによってその動作を遅延させることが想定しうる。よって、シーンチェンジ抽出モジュールの優先度は、その他のモジュールの優先度に比べて、低くすることが望ましい。一方、次々と録画によって生成されるGOPに対してシーンチェンジの解析を実行していかなければ、シーンチェンジ検出を行うことはできない。しなしながら、符号化部101による符号化処理はリアルタイムに行われていくが、生成された符号化ストリームはHDD105に書き込みを行うために一時的にストリームバッファ104に保持されている。よって、符号化ストリームがストリームバッファ104に保持されている間にシーンチェンジモジュールがストリームバッファ104上の符号化ストリームを処理すれば、すべてのGOPに対してシーンチェンジ抽出処理を行うことができることになる。
実際に、シーンチェンジ抽出動作が継続して実行されている最中において、例えば、ユーザーによる別番組の再生要求やEPG番組表の表示などシステム的に負荷の大きな処理が起動された場合を想定してみる。先行するGOPのシーンチェンジ抽出実行時に大きな負荷がかかり、その処理の進行があまり進んでいない状況で、次のGOPの符号化完了通知が符号化部101から録画制御部102に上がってくる。録画制御部102は、即座にシーンチェンジ抽出部110のシーンチェンジコマンド制御部120に対して、シーンチェンジ抽出コマンドを発行する。シーンチェンジコマンド制御部120のAPI部は、コマンドバッファの空きを見て(ステップS223)、空きがあればコマンドバッファにシーンチェンジ抽出コマンドを格納する。シーンチェンジコマンド制御部120は、シーンチェンジ抽出コマンドの格納だけを行い、即座に録画制御部102にリターンを返す。さらに、次のGOPの符号化完了までに、先行するGOPのシーンチェンジ抽出が完了していなければ、さらにその次のGOPに対するシーンチェンジ抽出コマンドもコマンドバッファに格納する。その後シーンチェンジ抽出が完了すると、シーンチェンジ状態制御部はコマンド待ち(ステップS242)に移り、コマンドバッファより最古のコマンドを受け取り、次のGOPのシーンチェンジ抽出の実行を開始する。その後システムの負荷が定常状態になると、シーンチェンジ抽出処理の処理頻度が増加し、コマンドバッファの遅延されたコマンドを順次と実行する。ただし、この遅延に許された最大数は20GOP分であり、それ以上のシーンチェンジ処理要求が生じた場合はコマンドバッファにコマンドの空きがないため、該当するGOPに対してシーンチェンジ処理が実行されないことになる。このとき録画制御部102は何らかのエラー処理を実行してもよく、また、装置の主たる目的である録画動作が正常に行われているという理由で特にエラー処理を実行せずにそのまま処理を継続してもよい。
このようにストリームバッファ104上に一時的に保持されたストリームを解析することに加え、録画制御部102から発行されるコマンドをバッファリングすることによって、必ずしも映像が符号化される毎に符号化されたストリームに対してシーンチェンジ抽出を実行する必要がなく、遅延処理が可能である。そのため、録画制御部102による符号化処理における符号化単位とシーンチェンジ抽出部120における解析単位を連続的に処理する必要がなく、よって符号化処理とシーンチェンジ抽出処理を独立した処理単位として設計できる。
また、録画制御部102とシーンチェンジ抽出部120は独立して動作することが可能であり、さらにシーンチェンジ抽出部120の処理優先度を録画に関する処理のそれより低くすることによって、処理時間が長くかかるシーンチェンジ抽出部120の動作によって、録画制御部102の処理が遅れ、結果として通常の録画処理に影響を及ぼすといった悪影響を発生させることがない。
また、シーンチェンジ抽出処理は遅延処理が可能なため、システムの一時的な負荷上昇によってシーンチェンジ抽出処理がGOPの再生時間内で完了できなかった場合や、シーンチェンジ抽出処理に処理が回ってこない場合であっても、コマンドバッファ122に格納されたシーンチェンジ抽出コマンドを使って、過去に符号化されたストリームに対して順次抽出処理を実行できるため、シーンチェンジ抽出処理が飛ばされて実行されないといった問題を回避することができる。
なお、上記シーンチェンジ抽出処理の遅延可能な時間若しくは回数は、ストリームバッファ104及びコマンドバッファの数によって決定される。
また、実施の形態2において、上記以外の点は、上記実施の形態1の場合と同じである。
実施の形態3.
本発明の実施の形態3の映像記録装置は、実施の形態1の映像記録装置の復号化部111の構成を特定した点が、実施の形態1の映像記録装置と相違する。したがって、実施の形態3の説明においては、図1及び図2をも参照する。
図7は、図1の復号化部111の構成を示すブロック図である。実施の形態3の映像記録装置は、図7に符号化ストリームからシーンチェンジの抽出処理を行う場合の復号化処理において、DCT(離散コサイン変換)係数の復号化次数を制御する方法に特徴がある。図7に示されるように、復号化部111は、入力された符号化ストリームのヘッダから画素サイズを求める画素サイズ検出部301と、画素サイズ検出部301によって検出された画素サイズからDCTブロックの使用する成分(次数)を決定する次数決定部302と、符号化ストリームに対して次数決定部302で決定した次数まで逆量子化を行いながらDCT係数を抽出するDCT係数抽出部303と、抽出されたDCT係数から逆DCTを実行するIDCT部304と、削減された次数で実行された逆DCTによって離散化してしまった画素データを詰めて縮小された画像を生成する画像整形部305とを有している。
図8(a)乃至(d)は、実施の形態3の映像記録装置のDCT係数削減処理を説明するための図である。実施の形態3においては、ユーザーの希望により符号化する映像の画素サイズを704×480画素と352×240画素から選択できる映像記録装置について説明する。よって、復号化部111に入力されるストリームは、704×480画素の符号化ストリーム又は352×240画素の符号化ストリームの2種類の画素サイズのものが存在する。復号化部111に符号化ストリームが入力されると、まず最初に画素サイズ検出部301が符号化ストリームの画素サイズの検出を行い、検出した画素サイズを次数決定部302に送る。次数決定部302では、検出した画素サイズに応じて、符号化ストリームに含まれるDCT係数のうちの処理する次数Deを決定する。例えば、704×480画素の符号化ストリームの場合はDCTブロックの内の次数2まで、一方、352×240画素の符号化ストリームの場合は次数4まで処理すると予め設定しておく。この次数に従ってDCT係数抽出部303とIDCT部304は、DCTブロックの処理対象とする次数を設定し、復号化を行う。IDCT部304から出力された復号化された映像データは、DCTブロック単位でDCT係数の間引きを行ったため復号化されたDCTブロックをつなぎ合わせて生成された復号化された映像の画素は離散的な映像になっている。この画素間が離散的な映像に対して画素の隙間をつめる処理を画素整形部305で行う。これによって、復号化された映像は、704×480画素の符号化ストリームの場合は176×120画素、352×240画素の符号化ストリームの場合は176×120画素となり、入力された符号化ストリームの画素サイズが違っていたにもかかわらず同じサイズの画像を得ることができる。このように復号化された映像を次のヒストグラム生成器112に送れば、実施の形態1と同様にシーンチェンジの検出を行うことができる。
すなわち、実施の形態3においては、復号化部111にDCT係数の制御を行う機能が付加されることによって、符号化部101によって異なる画素サイズとして符号化された符号化ストリームであってもシーンチェンジ抽出に使う映像は同じ画素サイズで行うことができることを示すと共に、シーンチェンジ抽出で解析対象とする映像の周波数帯域の上限を同じ帯域に揃えることができることを示している。また、ヒストグラム生成器112以降では常に同じ画素サイズの符号化ストリームに対してシーンチェンジ抽出を行うことができるので、次のヒストグラム生成器112以降の処理は画素サイズに依存することなく同じ処理を行うことができる。
上記のように構成することによって、符号化ストリームの画素サイズが違う場合であっても、同じ又は同程度の画素サイズに復号化された映像を得ることができる。
また、符号化ストリームの画素サイズが違う場合でも同じ画素サイズの復号化された映像に対して、シーンチェンジ抽出処理を行うことができるので、符号化ストリームの画素サイズが違っているストリームに対しても、同じシーンチェンジの評価方法と評価基準を用いることができ、結果として画素サイズを変えて同じ映像を録画した場合においても、同じ時間位置をシーンチェンジとして検出することができる。
また、画素サイズが異なる符号化ストリームに対してDCT係数を制御することによって、復号化された画像の周波数帯域を揃えることができるので、画素サイズを変えて同じ映像を録画した場合においても、同じ時間位置をシーンチェンジとして検出することができる。
また、高解像度の符号化データほど間引きを多くすることができるので、処理時間がかかる高解像度な符号化データであっても高速にシーンチェンジ抽出することができる。
また、高解像度の符号化データほど高周波の次数を間引きくことができるように構成できるので、比較的高周波ノイズの発生し易い高解像度の符号化データほどノイズ除去を効果的に行うことができる。
また、解像度によらず同一の復号化映像を生成するために、復号化映像を記憶するメモリサイズを同一にすることができる。
また、本来復号化映像を記憶するために大きなメモリサイズを必要とする高解像度映像ほど間引き処理を行うために、復号化処理のために用意しておくべきメモリ領域を小さくすることができる。
なお、実施の形態3において、上記以外の点は、上記実施の形態1乃至2の場合と同じである。
実施の形態4.
本発明の実施の形態4の映像記録装置は、実施の形態1の映像記録装置の復号化部111の構成を特定した点が、実施の形態1の映像記録装置と相違する。したがって、実施の形態4の説明においては、図1及び図2をも参照する。
図9は、本発明の実施の形態4の映像記録装置の復号化部の構成を示すブロック図である。図9を用いて符号化ストリームからシーンチェンジの抽出処理を行う場合の復号化処理において、復号化を実行するスライスを限定する処理について説明する。実施の形態4の映像記録装置の復号化部111は、入力された符号化ストリームのヘッダから画素サイズを求める画素サイズ検出部301と、画素サイズ検出部301の検出した画素サイズからシーンチェンジ抽出の処理対象とするスライスを決定する使用スライス決定部306と、符号化ストリームのヘッダを解析するヘッダ検出部307と、符号化ストリームの逆量子化を行う逆量子化部308と、周波数領域に変換された係数値を逆DCT処理するIDCT部304とを有している。
次に、スライス削減と合わせて動作するシーンチェンジ抽出処理の動作について説明する。画素サイズ検出部301が画素サイズの検出を行い、使用スライス決定部306が使用するスライスを決定する。ここでは、例えば、符号化部101で生成される符号化ストリームの解像度は720×480画素と352×240画素の2種類のみしか存在しない場合には、垂直方向の画素数が480のときには、上下5スライス、すなわち、
(16画素×5スライス)×2=80画素×2
を使用しないものとし、一方、画素数が240のときには、上下2スライス、すなわち、
(16画素×2スライス)×2=32画素×2
を使用しないものとしている。ここで解像度によって使用しない画素数が異なるが、垂直方向に対する割合は、480画素の場合、全30スライスに対して10スライスを使用しないので、1/3を使用しないことになり、一方、240画素の場合、全15スライスに対して4スライスを使用しないので、4/15を使用しないことになり、ほぼ同じ割合をシーンチェンジ抽出対象としていることが分かる。
このようにして使用スライス決定部306において使用するスライス数を求め、ヘッダ検出部307で符号化ストリームのヘッダを解析し、スライスヘッダを抽出する毎に先の使用スライス決定部306で使用しないスライスと判定したスライスであれば、次のスライスヘッダまでジャンプし、一方、使用するスライスであれば、該当するスライスを逆量子化部308に送る。逆量子化部308は、符号化ストリームの逆量子化を行い、IDCT部304は、逆DCTを実行する。上記構成によって、使用するスライスのみが復号化処理され、結果として垂直解像度が480画素であれば垂直解像度320画素の映像を、一方、垂直解像度が240画素であれば垂直172画素の復号化された映像を求めることができる。復号化部111によって上記のように垂直方向に削減され復号化された映像に対して、ヒストグラム生成器112では有効なスライス領域と同じ位置の画素を対象にヒストグラムの生成を行う。差分抽出器115で求める差異値dを導出するためにフレーム内の画素数を表すN(1フレーム内の画素数)を利用している。実施の形態4においては、垂直方向に画素を削減したので、フレーム内の画素数Nは以下のように補正される。まず、元が垂直解像度720画素の場合であれば、削減された垂直解像度が320画素で、水平解像度は720画素なので、
N=320×720=230400
となる。また、垂直解像度240画素の場合、削減された垂直解像度が172画素で、水平解像度は352画素であれば
N=172×352=60544
に補正を行う。本補正を行ったうえで求められる差異値dを用いて、シーンチェンジ判定器116は、実施の形態1と同様のシーンチェンジ判定を行うことができる。
上記説明においては、スライス単位で復号化をするか否かを設定しているが、シーンチェンジに利用する領域を画素位置又はマクロブロック単位で設定してもよい。この場合、シーンチェンジを検出する位置を特定できるので、検出精度を向上することができる。また、画素毎にシーンチェンジ抽出を行うか否かを設定する場合、すべての画素について復号化を行い、復号化した後に抽出したいエリアのヒストグラム及びヒストグラムの差異値をとることによって実現可能であるが、検出単位をマクロブロック単位で指定するようにすると、ヘッダ検出部又は復号化処理部においてマクロブロック単位で処理を実行するか否かを制御できるので、不必要な復号化を実行しないよう構成でき、処理速度を向上することができる。
以上のように構成することによって、復号化及びシーンチェンジ抽出する画素サイズがスライス単位で削減できるので、処理の高速化を実現できる。
また、スライスの削減によって復号した画像のサイズも小さくなるので使用するメモリサイズも小さくなる。
また、シーンチェンジを検出する対象が放送番組であれば、映像の上下位置のスライスを使用しないように構成することによって、番組の本編との関連性が低い、又は、余り重要ではない情報である、時刻表示、臨時ニュースの文字表示、又はテロップなどに影響されることなくシーンチェンジ抽出を行うことができる。
また、マクロブロック単位で復号化及びシーンチェンジ抽出処理の実行を指定することによって、任意の1つ若しくは複数のマクロブロックに対してのみシーンチェンジ検出が可能になり、位置を特定したシーンチェンジ抽出が可能になる。
なお、実施の形態4において、上記以外の点は、上記実施の形態1乃至3の場合と同じである。
実施の形態5.
実施の形態5の映像記録装置は、差分抽出器115の動作が実施の形態1の映像記録装置と相違する。したがって、実施の形態5の説明においては、図1及び図2をも参照する。
実施の形態5においては、シーンチェンジ抽出対象となる映像によってシーンチェンジの判定基準を切り替える方法について説明する。図10は映像の画素値のYUV分布を示している。一般的にYUVは各256値で表現され、輝度信号Yは0から255まで、色差信号U及びVは、−128から127までの値をとる。そのとき人間の目でほぼ白と感じる領域及びほぼ黒と感じる領域を、図10において、それぞれW及びBで示している。実施の形態5においては、抽出対象となる映像が、全体として白に近い色の領域が多い映像(以下「白映像」とも言う。)である場合は、領域W以外の領域で差異値を算出し、一方、全体として黒に近い色の領域が多い映像(以下「黒映像」とも言う。)である場合は、領域B以外の領域で差異値を算出する方法によって、比較する2つの映像がよく似た映像であっても的確にシーンチェンジを検出することを目的とする。
実施の形態5の差分抽出器115の動作を、図11にフローチャートで示す。まず、第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114からi番目のフレーム(以下「iフレーム」とも言う。)及びi−1番目のフレーム(以下「i−1フレーム」とも言う。)のヒストグラムを取得する(ステップS401)。次にそれぞれのフレームの白領域Wの画素数をカウントする(ステップS402)。iフレーム及びi−1フレームの白画素数CWi、CWi−1は次式で表される。
Figure 2007049516
次に、白領域Wの累積差異rを次式で求める(ステップS403)。
Figure 2007049516
一方、黒領域Bについても同様に、黒画素数CBi、CBi−1を次式で求める(ステップS404)。
Figure 2007049516
また、黒領域Bの累積差異rを次式で求める(ステップS405)。
Figure 2007049516
次に、iフレーム及びi−1フレームが共に以下の条件式を満足すれば、白に近い色の領域が多い映像(「白映像」とも言う。)であると判断する(ステップS406)。
_MAX>CWi>C_MIN 且つ
_MAX>CWi−1>C_MIN
上記は、全体として白に近い色の領域が多い映像と判定する条件として、白領域Wの画素数が下限C_MINより大きく、上限C_MAX未満であることを条件としている。このように、白画素数が下限より大きいことを満足するだけでなく、上限を設けている理由は、白画素数がある値より大きい場合は、白に近い色の領域以外の画素数が非常に少なくなり、全体の画素数に対して非常に少ない白以外の画素で画像全体のシーンチェンジを判定を行ってしまうことを避けるためである。
上記条件を満足できれば、白領域Wを除いた領域について次式で差異値を求める(ステップS407)。
Figure 2007049516
一方、白に近い色の領域が多い映像と判断されなかった場合は、以下の条件式で黒に近い色の領域が多い映像であるか否かを判定する(ステップS408)。
_MAX>CBi>C_MIN 且つ
_MAX>CBi−1>C_MIN
上記は、黒に近い色の領域が多い映像と判定する条件として、黒領域Bの画素数が下限C_MINより大きく、上限C_MAX未満であることを条件としている。上記条件を満足できれば、黒領域Bを除いた領域について次式で差異値を求める(ステップS409)。
Figure 2007049516
一方、白に近い色の領域が多い映像と判断されず、且つ、黒に近い色の領域が多い映像とも判断されなかった場合は、実施の形態1で示した差異値の導出式
Figure 2007049516
によって差異値を求める(ステップS410)。
以上によって求めた差異値dを用いて、実施の形態1で示した手法と同様に、シーンチェンジ判定器116によってシーンチェンジの判定が行われる。
上記動作により、比較する2つの映像が共に白に近い色の領域が多い映像であれば白領域Wを除いた領域で映像の変化を比較し、一方、比較する2つの映像が共に黒に近い色の領域が多い映像であれば黒領域Bを除いた領域で映像の変化を比較することができるので、特定の色領域を除いた映像のシーンチェンジを抽出することができる。
そのために、全体的に白に近い色の領域が多い映像又は黒に近い色の領域が多い映像が続いたシーンにおいてもシーンチェンジを検出することが可能である。
特に、放送番組のCM(Commercial Message)間のつなぎ目において、白い背景(又は黒い背景)に企業名や製品名が示されたシーンから同じように白い背景(又は黒い背景)に異なる企業名や製品名が示されるシーンに切り替わる場合において、白い背景や黒い背景を除いたエリアでシーンチェンジ判定を行うので、結果として企業名や製品名の領域からシーンチェンジとして検出することができ、CMの区切りを検出するのに非常に有効に動作することができる。
なお、実施の形態5において、上記以外の点は、上記実施の形態1乃至4の場合と同じである。
本発明の実施の形態1の映像記録装置の構成を示すブロック図である。 実施の形態1の映像記録装置のシーンチェンジ抽出部の構成を示すブロック図である。 本発明の実施の形態2の映像記録装置のシーンチェンジコマンド制御部の構成を示すブロック図である。 実施の形態2の映像記録装置の動作を示すフローチャートである。 実施の形態2の映像記録装置のシーンチェンジコマンド制御部のAPI部の動作を示すフローチャートである。 実施の形態2の映像記録装置のシーンチェンジコマンド制御部の状態制御部の動作を示すフローチャートである。 本発明の実施の形態3の映像記録装置の復号化部の構成を示すブロック図である。 (a)乃至(d)は、実施の形態3の映像記録装置のDCT係数削減処理を説明するための図である。 本発明の実施の形態4の映像記録装置の復号化部の構成を示すブロック図である。 本発明の実施の形態5の映像記録装置におけるYUV領域を示す図である。 実施の形態5の映像記録装置の動作を示すフローチャートである。
符号の説明
100 映像記録装置、 101 符号化部、 102 録画制御部、 103 ストリーム制御部、 104 ストリームバッファ、 105 HDD、 110 シーンチェンジ抽出部、 111 復号化部、 112 ヒストグラム生成器、 113 第1のヒストグラムバッファ、 114 第2のヒストグラムバッファ、 115 差分抽出器、 116 シーンチェンジ判定器、 120 シーンチェンジコマンド制御部、 121 API部、 122 コマンドバッファ、 123 シーンチェンジ抽出結果バッファ、 124 状態制御部、 301 画素サイズ検出部、 302 次数決定部、 303 DCT係数抽出部、 304 IDCT部、 305 画像整形部、 306 使用スライス決定部、 307 ヘッダ検出部、 308 逆量子化部。

Claims (24)

  1. 映像データを符号化して符号化ストリームを出力する符号化手段と、
    前記符号化手段から出力された符号化ストリームを記録する記録手段と、
    前記符号化手段から出力された符号化ストリームを前記記録手段に転送するストリーム制御手段と、
    前記符号化手段から出力された符号化ストリームを復号化し、該復号化された映像データのシーンチェンジを抽出する映像変化点抽出手段と、
    前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに前記映像変化点抽出手段に対するシーンチェンジ抽出指示を出力する録画制御手段と
    を有することを特徴とする映像記録装置。
  2. 前記映像変化点抽出手段は、
    前記符号化手段から出力された符号化ストリームを復号化する復号化手段と、
    前記復号化された映像データのヒストグラムを生成するヒストグラム生成手段と、
    前記生成されたヒストグラムを所定の画素数毎に交互に保持する第1のヒストグラムバッファ及び第2のヒストグラムバッファと、
    前記第1のヒストグラムバッファに保持されたヒストグラムと前記第2のヒストグラムバッファに保持されたヒストグラムの差異値を求める差分抽出手段と、
    前記差分抽出手段で求めた差異値と予め定められた閾値とを比較するシーンチェンジ判定手段と、
    前記録画制御手段からのシーンチェンジ抽出指示に基づいて前記映像変化点抽出手段を制御するシーンチェンジコマンド制御手段と
    を有することを特徴とする請求項1に記載の映像記録装置。
  3. 前記記録手段よりもデータの書込み速度及びデータの読出し速度が早く、前記ストリーム制御手段に入力された符号化ストリームを一時的に記憶する一時記憶手段をさらに有し、
    前記映像変化点抽出手段によるシーンチェンジの抽出は、前記一時記憶手段から読み出された符号化ストリームに対して実行される
    ことを特徴とする請求項1又は2のいずれかに記載の映像記録装置。
  4. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数GOP出力される毎に実行されることを特徴とする請求項1乃至3のいずれかに記載の映像記録装置。
  5. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数スライス出力される毎に実行されることを特徴とする請求項1乃至3のいずれかに記載の映像記録装置。
  6. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数マクロブロック出力される毎に実行されることを特徴とする請求項1乃至3のいずれかに記載の映像記録装置。
  7. 前記映像変化点抽出手段によるシーンチェンジ抽出動作は、前記録画制御手段からのシーンチェンジ抽出指示の受信に同期して実行されることを特徴とする請求項1乃至6のいずれかに記載の映像記録装置。
  8. 前記映像変化点抽出手段が、前記録画制御手段からのシーンチェンジ抽出指示を一時保持する制御命令保持手段を有し、
    前記映像変化点抽出手段によるシーンチェンジ抽出動作は、前記制御命令保持手段から出力されたシーンチェンジ抽出指示に基づいて、前記録画制御手段からのシーンチェンジ抽出指示の受信に非同期のタイミングで実行される
    ことを特徴とする請求項1乃至7のいずれかに記載の映像記録装置。
  9. 前記制御命令保持手段は、前記シーンチェンジ抽出指示を複数回分保持し、所定の符号化単位のシーンチェンジ抽出が完了する毎に、前記シーンチェンジ抽出指示に対応した処理をすることを特徴とする請求項8に記載の映像記録装置。
  10. 前記符号化手段が、DCTを用いて映像データを圧縮し、
    前記映像変化点抽出手段が、前記復号化に際して、符号化ストリームの画素サイズに応じて符号化ストリームのDCT係数の復号化次数を制御する
    ことを特徴とする請求項1乃至9のいずれかに記載の映像記録装置。
  11. 前記映像変化点抽出手段が、符号化ストリームの画素サイズに応じて符号化ストリームの復号化スライスを制御することを特徴とする請求項10に記載の映像記録装置。
  12. 前記ヒストグラム生成手段は、前記ヒストグラムの分布が、指定した色分布に適合するかを判定し、指定した色分布であると判定した場合、指定した色分布以外のヒストグラムを前記第1のヒストグラムバッファ及び前記第2のヒストグラムバッファに出力することを特徴とする請求項2に記載の映像記録装置。
  13. 符号化手段によって映像データを符号化して符号化ストリームを出力するステップと、
    前記符号化ストリームをストリーム制御手段によって転送して記録手段に記録するステップと、
    録画制御手段によって前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに映像変化点抽出手段に対するシーンチェンジ抽出指示を出力するステップと、
    前記映像変化点抽出手段によって、前記符号化手段から出力された符号化ストリームを復号化し、該復号化された映像データのシーンチェンジを抽出するステップと
    を有することを特徴とするシーンチェンジ抽出方法。
  14. 前記シーンチェンジを抽出するステップが、
    前記符号化手段から出力された符号化ストリームを復号化するステップと、
    前記復号化された映像データのヒストグラムを生成するステップと、
    前記生成されたヒストグラムを所定の画素数毎に交互に第1のヒストグラムバッファ及び第2のヒストグラムバッファに保持するステップと、
    前記第1のヒストグラムバッファに保持されたヒストグラムと前記第2のヒストグラムバッファに保持されたヒストグラムの差異値を求めるステップと、
    前記求められた差異値と予め定められた閾値とを比較するステップと、
    前記録画制御手段からのシーンチェンジ抽出指示に基づいて前記映像変化点抽出手段を制御するステップと
    を有することを特徴とする請求項13に記載のシーンチェンジ抽出方法。
  15. 前記記録手段よりもデータの書込み速度及びデータの読出し速度が早い一時記憶手段に、前記ストリーム制御手段に入力された符号化ストリームを一時的に記憶させるステップさらに有し、
    前記映像変化点抽出手段によるシーンチェンジの抽出は、前記一時記憶手段から読み出された符号化ストリームに対して実行される
    ことを特徴とする請求項13又は14のいずれかに記載のシーンチェンジ抽出方法。
  16. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数GOP出力される毎に実行されることを特徴とする請求項13乃至15のいずれかに記載のシーンチェンジ抽出方法。
  17. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数スライス出力される毎に実行されることを特徴とする請求項13乃至15のいずれかに記載のシーンチェンジ抽出方法。
  18. 前記符号化手段からの符号化完了通知の送信は、前記符号化手段から符号化ストリームが1又は複数マクロブロック出力される毎に実行されることを特徴とする請求項13乃至15のいずれかに記載のシーンチェンジ抽出方法。
  19. 前記映像変化点抽出手段によるシーンチェンジ抽出動作は、前記録画制御手段からのシーンチェンジ抽出指示の受信に同期して実行されることを特徴とする請求項13乃至18のいずれかに記載のシーンチェンジ抽出方法。
  20. 前記録画制御手段からのシーンチェンジ抽出指示を制御命令保持手段に一時保持させるステップをさらに有し、
    前記映像変化点抽出手段によるシーンチェンジ抽出動作は、前記制御命令保持手段から出力されたシーンチェンジ抽出指示に基づいて、前記録画制御手段からのシーンチェンジ抽出指示の受信に非同期のタイミングで実行される
    ことを特徴とする請求項13乃至18のいずれかに記載のシーンチェンジ抽出方法。
  21. 前記制御命令保持手段にシーンチェンジ抽出指示を一時保持させるステップにおいて、前記シーンチェンジ抽出指示を複数回分保持させ、所定の符号化単位のシーンチェンジ抽出が完了する毎に、前記シーンチェンジ抽出指示に対応した処理をすることを特徴とする請求項20に記載のシーンチェンジ抽出方法。
  22. 前記符号化手段が、DCTを用いて映像データを圧縮し、
    前記映像変化点抽出手段が、前記復号化に際して、符号化ストリームの画素サイズに応じて符号化ストリームのDCT係数の復号化次数を制御する
    ことを特徴とすることを特徴とする請求項13乃至21のいずれかに記載のシーンチェンジ抽出方法。
  23. 符号化ストリームの画素サイズに応じて符号化ストリームの復号化スライスを制御することを特徴とする請求項22に記載のシーンチェンジ抽出方法。
  24. 前記ヒストグラム生成手段は、前記ヒストグラムの分布が、指定した色分布に適合するかを判定し、指定した色分布であると判定した場合、指定した色分布以外のヒストグラムを前記第1のヒストグラムバッファ及び前記第2のヒストグラムバッファに出力することを特徴とする請求項14に記載のシーンチェンジ抽出方法。
JP2005232957A 2005-08-11 2005-08-11 映像記録装置及びシーンチェンジ抽出方法 Expired - Fee Related JP3827705B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005232957A JP3827705B1 (ja) 2005-08-11 2005-08-11 映像記録装置及びシーンチェンジ抽出方法
JP2007529457A JP4707713B2 (ja) 2005-08-11 2006-03-17 映像記録装置及びシーンチェンジ抽出方法
PCT/JP2006/305337 WO2007017970A1 (ja) 2005-08-11 2006-03-17 映像記録装置、シーンチェンジ抽出方法、及び映像音声記録装置
CN2006800291636A CN101238727B (zh) 2005-08-11 2006-03-17 图像记录装置、场景转换提取方法及图像语音记录装置
US11/989,309 US8886014B2 (en) 2005-08-11 2006-03-17 Video recording apparatus, scene change extraction method, and video audio recording apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005232957A JP3827705B1 (ja) 2005-08-11 2005-08-11 映像記録装置及びシーンチェンジ抽出方法

Publications (2)

Publication Number Publication Date
JP3827705B1 JP3827705B1 (ja) 2006-09-27
JP2007049516A true JP2007049516A (ja) 2007-02-22

Family

ID=37101324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005232957A Expired - Fee Related JP3827705B1 (ja) 2005-08-11 2005-08-11 映像記録装置及びシーンチェンジ抽出方法

Country Status (2)

Country Link
JP (1) JP3827705B1 (ja)
CN (1) CN101238727B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873495A (zh) * 2009-04-22 2010-10-27 三菱电机株式会社 场景转换检测装置以及影像记录装置
JP2011024077A (ja) * 2009-07-17 2011-02-03 Mitsubishi Electric Corp 映像音声記録再生装置および映像音声記録再生方法
JP2011061830A (ja) * 2010-10-27 2011-03-24 Konica Minolta Business Technologies Inc 動画再生装置、動画再生方法および動画再生プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8886014B2 (en) 2005-08-11 2014-11-11 Mitsubishi Electric Corporation Video recording apparatus, scene change extraction method, and video audio recording apparatus
JP5036882B2 (ja) * 2011-01-14 2012-09-26 三菱電機株式会社 映像記録装置、映像記録方法、映像音声記録装置、及び映像音声記録方法
CN102223535A (zh) * 2011-06-07 2011-10-19 东莞电子科技大学电子信息工程研究院 一种基于svc的自适应图像组结构选择方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10276388A (ja) * 1997-03-28 1998-10-13 Sony Corp 画像処理装置および画像処理方法、画像再生装置および画像再生方法、並びに記録媒体
JP2000286715A (ja) * 1999-03-31 2000-10-13 Toshiba Corp 情報記録再生方法および情報記録再生装置
JP2002010254A (ja) * 2000-06-20 2002-01-11 Sony Corp 特徴点検出方法および記録再生装置
JP2005175710A (ja) * 2003-12-09 2005-06-30 Sony Corp デジタル記録再生装置及びデジタル記録再生方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004500772A (ja) * 2000-03-07 2004-01-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号を符号化する方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10276388A (ja) * 1997-03-28 1998-10-13 Sony Corp 画像処理装置および画像処理方法、画像再生装置および画像再生方法、並びに記録媒体
JP2000286715A (ja) * 1999-03-31 2000-10-13 Toshiba Corp 情報記録再生方法および情報記録再生装置
JP2002010254A (ja) * 2000-06-20 2002-01-11 Sony Corp 特徴点検出方法および記録再生装置
JP2005175710A (ja) * 2003-12-09 2005-06-30 Sony Corp デジタル記録再生装置及びデジタル記録再生方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873495A (zh) * 2009-04-22 2010-10-27 三菱电机株式会社 场景转换检测装置以及影像记录装置
JP2010258576A (ja) * 2009-04-22 2010-11-11 Mitsubishi Electric Corp シーンチェンジ検出装置および映像記録装置
JP2011024077A (ja) * 2009-07-17 2011-02-03 Mitsubishi Electric Corp 映像音声記録再生装置および映像音声記録再生方法
US8639089B2 (en) 2009-07-17 2014-01-28 Mitsubishi Electric Corporation Video audio recording/playback apparatus and method
JP2011061830A (ja) * 2010-10-27 2011-03-24 Konica Minolta Business Technologies Inc 動画再生装置、動画再生方法および動画再生プログラム

Also Published As

Publication number Publication date
CN101238727A (zh) 2008-08-06
CN101238727B (zh) 2012-12-12
JP3827705B1 (ja) 2006-09-27

Similar Documents

Publication Publication Date Title
JP4707713B2 (ja) 映像記録装置及びシーンチェンジ抽出方法
EP2476256B1 (en) Video editing and reformating for digital video recorder
US7187415B2 (en) System for detecting aspect ratio and method thereof
EP1107613A2 (en) Picture recording apparatus and methods
US8036470B2 (en) Image processing apparatus, image processing method, and program
JP2005252850A (ja) 映像再生装置、映像再生方法及びその方法をコンピュータに実行させるためのプログラム
JP3827705B1 (ja) 映像記録装置及びシーンチェンジ抽出方法
US9509940B2 (en) Image output device, image output method, and recording medium
US8363726B2 (en) Electronic apparatus, motion vector detecting method, and program therefor
KR100846770B1 (ko) 동영상 부호화 방법 및 이에 적합한 장치
EP1547016B1 (en) Method and apparatus for encoding image and or audio data
US20060263067A1 (en) Information processing apparatus and method
JP5036882B2 (ja) 映像記録装置、映像記録方法、映像音声記録装置、及び映像音声記録方法
US6781637B2 (en) Image change detecting apparatus and image change detecting method, image encoding apparatus and information recording medium with image change detecting program recorded readable by computer
US6999090B2 (en) Data processing apparatus, data processing method, information storing medium, and computer program
JP5425972B2 (ja) 映像音声記録装置及び映像音声記録方法
US20090304089A1 (en) Reproduction processing apparatus, reproduction processing method, and computer program
JP5775006B2 (ja) 情報処理装置、情報処理方法及び半導体装置
WO1997004598A1 (en) Device for decoding encoded video signal and storing and decoding device using it
JPH11283333A (ja) データ記録装置及び方法
JP2007027857A (ja) マルチメディアデータ記録装置および方法
JP2007158807A (ja) 記録再生装置および記録再生方法、記録装置および記録方法、再生装置および再生方法、並びにプログラム
JP2000013741A (ja) 映像記録装置、映像再生装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060704

R150 Certificate of patent or registration of utility model

Ref document number: 3827705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110714

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110714

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130714

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees