JP3932631B2 - 圧縮動画像データカット検出装置 - Google Patents

圧縮動画像データカット検出装置 Download PDF

Info

Publication number
JP3932631B2
JP3932631B2 JP32740197A JP32740197A JP3932631B2 JP 3932631 B2 JP3932631 B2 JP 3932631B2 JP 32740197 A JP32740197 A JP 32740197A JP 32740197 A JP32740197 A JP 32740197A JP 3932631 B2 JP3932631 B2 JP 3932631B2
Authority
JP
Japan
Prior art keywords
data
cut
dvc
frame
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32740197A
Other languages
English (en)
Other versions
JPH10327387A (ja
Inventor
俊和 赤間
耕治 有村
由紀子 井上
淳 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP32740197A priority Critical patent/JP3932631B2/ja
Priority to US09/046,315 priority patent/US20010048486A1/en
Publication of JPH10327387A publication Critical patent/JPH10327387A/ja
Application granted granted Critical
Publication of JP3932631B2 publication Critical patent/JP3932631B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Description

【0001】
【発明の属する技術分野】
本発明は、圧縮動画像データから効率良くカット(シーンの変化点)を検出する技術に関する。
【0002】
【従来の技術】
近年、DVCカメラに代表されるように、映像分野において圧縮動画像データを扱う機会が増加している。これらの圧縮動画像データからカットを検出することにより、内容検索や編集作業を効率良く行うことができる。例えば圧縮動画像データをパソコン等でノンリニア編集する場合、圧縮動画像データから事前にカットを検出しておき、カットの代表画像を並べて表示することで、一連の内容を理解することができる。また、カットの位置情報とカットの代表画像をリンクさせておくことで、カットの代表画像の順番を並べ換えたりすることによって容易に内容の変更を行うことができる。
【0003】
以下、圧縮動画像データの例としてDVCデータから、カットを検出する従来の圧縮動画像データカット検出装置について説明する。なお、DVCデータには、民生用とプロ用(DVCPRO)があり、民生用についてはHDDigitalVCRConferenceのSpecificationsofConsumer−UseDigitalVCRsusing6.3mmmagnetictapeに、プロ用についてはProposedSMPTEStandard/SMPTExxxMforTelevisionDigitalRecording6.35mmTypeD−7ComponentFormatTapeCassetteV16.08−2C4thDraftSeptember10,1996やProposedSMPTEStandardforDigitalVideoRecordingwithvideocompression6.35mmTypeD−7ComponentFormat525/60and625/50(DVCPRO)V16.08−3B4thDraftDecember9,1996に示される規格に準じている。以後の説明では例として民生用のDVCデータを用いる。
【0004】
ここでまずDVCデータの圧縮方式とフォーマットについて説明する。
まず、DVCデータの圧縮方法を図19を用いて説明する。DVCデータは、フレーム内の輝度(Y)、色差(Cr、Cb)の各ブロック(水平8画素×垂直8画素)ごとに圧縮を行う。まず、ブロックをDCT(離散コサイン変換)してDC成分とAC成分を得る(図19のS1)。
【0005】
このDCTには、圧縮後の画質を良くするために、8−8DCTと呼ばれるモードと、2−4−8DCTと呼ばれる2通りのモードが準備されている。この2つのモードを、DCTモードと呼ばれるコード(1ビット)で、適応的に切り替えて使用する。ブロック内の、奇数フィールドと偶数フィールドの差分が大きい場合は、DCTモードの値を1として、2−4−8DCTを行なう。ブロック内の、奇数フィールドと偶数フィールドの差分が小さい場合は、DCTモードの値を0として、8−8DCTを行なう。
【0006】
例えば、被写体の動きが大きい場合は、ブロック内の、奇数フィールドと偶数フィールドの差分が大きくなるため、2−4−8DCTを行ない、静止画のように動きが小さい場合は、ブロック内の、奇数フィールドと偶数フィールドの差分が小さくなるため、8−8DCTを行なう。DCTを行なった後、AC成分については、4つのエリア(図19のエリア0からエリア3)に分割し、各エリアごとに量子化を行う。各エリアの量子化の際に用いる量子化ステップは、クラスナンバー(後述)と、量子化ナンバー(後述)より決定される。量子化後のAC成分はVLC(可変長符号化)により圧縮される。
【0007】
各エリアは、各AC成分の絶対値の最大値の大きさにより、クラス0からクラス3の4つのクラスに分けられる。クラスナンバーは各クラスを区別するためのものである。
【0008】
(表1)にAC成分の絶対値の最大値とクラスナンバーの関係の例を示す。また量子化ナンバーは圧縮後のデータの量を制限するための値である。
【0009】
【表1】
Figure 0003932631
【0010】
(表2)は量子化ステップの算出を行う表である。クラスナンバーと量子化ナンバーと各エリア(エリアナンバーが0から3)と量子化ステップの関係は(表2)のようになる。
【0011】
【表2】
Figure 0003932631
【0012】
次にDVCデータのフォーマットについて図20、図21、図22、図23を用いて説明する。なお、以下では例としてNTSCの場合について説明する。
【0013】
図20に示すように、輝度ブロックのデータは14バイト、色差ブロックは10バイトで構成される。DC成分は9ビット固定、クラスナンバーは2ビット固定、DCTモードは1ビット固定で、図20に示すように決められた位置に記録されている。AC成分の記録領域も、輝度ブロックの場合100ビット、色差ブロックの場合68ビットと固定であるが、圧縮されたAC成分は可変長なので、実質的なAC成分のデータが、記録領域の中でどのくらいの範囲に記録されているかは画像によって変動する。
【0014】
図21にマクロブロックの構成を示す。マクロブロックは4個の輝度(Y)ブロックと2個の色差(Cr、Cb)ブロックで構成される。AC成分の量子化の際に用いられる量子化ナンバーは4ビット固定で、マクロブロックごとに設定され図21に示すような位置に記録される。
【0015】
図22は1フレームの構成を示す。各フレームは10個のDIFsequenceで構成される。各DIFsequenceは150個(図22のNo.0からNo.149)のDIFblockで構成される。No.0からNo.5のDIFblockにはそのフレームに関連する諸情報が記録されている。その中にインデックスコード(見たいシーンの頭出しをする際の目印となる信号)や録画タイムコード(DVCカメラで撮影したときの年月日および時刻)が記録されている。インデックスコードには録画が開始されるたびに目印を記録しても良いし、また、録画開始にかかわらずユーザーが見たい映像に合わせて自由に目印を記録しても良い。
【0016】
No.6からNo.149のDIFblockには圧縮されたオーディオデータとビデオデータが記録されている。
【0017】
なお、以後の説明において、No.6からNo.149のDIFblockに記録されているデータ、及びこれらを伸長したものを画像データと呼んでNo.0からNo.5のDIFblockとは区別する。
【0018】
各DIFblockの大きさは80バイト固定であるためフレーム全体の大きさは120Kバイト固定である。
【0019】
図23に1つのDIFsequenceの構造を示す。図23においてA0からA8がオーディオデータのDIFblockであり、V0からV134がビデオデータのDIFblockである。V0からV134の各DIFblockはそれぞれ1個のマクロブロックの情報が記録されている。
【0020】
一般的に、DVCカメラで撮影したデータや、既に存在するアナログの動画像データをディジタル化し、DVCデータの形式にエンコードしたものなど大容量のものは、ハードディスクなどより安価なテープメディアに記録されていることが多い。
【0021】
これらのDVCデータをパソコン上でノンリニア編集を行う場合、DVCデータをテープメディアからパソコン上のハードディスクなどのランダムアクセスメディアに転送する必要がある。
【0022】
このような用途を鑑み、以下に述べる従来の圧縮動画像データカット検出装置は、テープメディアからパソコンにDVCデータを転送する際にカットを検出するものである。
【0023】
図24に従来の圧縮動画像データカット検出装置の構成を示す。図24において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0024】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータのうち1フレーム分のデータを一時記憶するメモリで、107はハードディスクで、118はメモリ104に記録されている1フレーム分のDVCデータの中の各フレームからインデックスコードを読み出して、インデックスコードの値よりカットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0025】
以上のうち、カット判定手段118はソフトウェアで構成される。
図25は従来の圧縮動画像データカット検出装置の処理の流れを示す。以下、従来の圧縮動画像データカット検出装置の動作について図24と図25を用いて説明する。
【0026】
DVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図25のS1)。
【0027】
このときカット判定手段118でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントする(図25のS2)。そしてメモリ104に記憶されているデータの中からインデックスコードを読み出し、インデックスコードに目印が記録されているかを見て、カットの有無を判定する(図25のS3)。
【0028】
DVCカメラの仕様によっては、録画開始(カット)ごとにインデックスコードに目印を自動的に記録するものもある。このようなDVCカメラで撮影されているDVCデータに対して正確にカットを検出することができる。カットが有ると判定したら、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図25のS4)。
【0029】
次にメモリ104内に記憶されている現在フレームのDVCデータをハードディスク107に転送して記録する(図25のS5)。
【0030】
以上の処理を最終フレームになるまで繰り返す。
以上のように従来の圧縮動画像データカット検出装置では、DVCカメラで撮影時にDVCデータに記録されるインデックスコードをたよりにカット検出を行っていた。
【0031】
【発明が解決しようとする課題】
しかしながら、上記従来の圧縮動画像データカット検出装置は、DVCカメラで撮影時にDVCデータに記録されるインデックスコードをたよりにカット検出を行っているので、録画開始(カット)と、インデックスコードの目印が対応していないDVCデータに対してはカットを検出できないという問題を有していた。
【0032】
例えば、既にたくさんのカットを持つアナログの動画像データを、DVC用VTRで録画した場合は、動画像中のカットとインデックスコードは対応しなくなる。そのため、インデックスコードを用いてカットを検出することができない。
【0033】
また、DVCデータが、どのようにして作成されたのか(どんなDVCカメラで撮影されたのか、DVC用VTRで録画されたのか)が分からない場合は、インデックスコードとカットが対応しているかどうかの確認ができず、インデックスコードを用いてのカット検出結果を信頼できないという問題を有していた。
【0036】
【課題を解決するための手段】
このような問題を解決するために、本発明の圧縮動画像データカット検出装置は、圧縮動画像データの中の、各フレームの先頭より同一位置のデータの、フレーム間の比較を行う同一位置データ比較手段を有する。
【0037】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、直交変換のDC成分のデータの比較を行う。
【0038】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、量子化ステップのデータの比較を行う。
【0039】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、DVCデータの各フレームのクラスナンバーのデータの比較を行う。
【0040】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、DVCデータの各フレームの量子化ナンバーのデータの比較を行う。
【0041】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、直交変換のDC成分のデータのフレーム間の比較および量子化ステップのデータのフレーム間の比較を行う。
【0042】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、DVCデータのDCT(離散コサイン変換)のDC成分のデータのフレーム間の比較およびクラスナンバーのデータのフレーム間の比較を行う。
【0043】
また、本発明の圧縮動画像データカット検出装置は、同一位置データ比較手段により、DVCデータのDCTのDC成分のデータのフレーム間の比較および量子化ナンバーのデータのフレーム間の比較を行う。
【0044】
また、本発明の圧縮動画像データカット検出装置は、DVCデータの、DCTモードの値をカウントするカウンタと、前記カウンタの値を用いてカットの有無を判定するカット判定手段を有する。
【0045】
【発明の実施の形態】
(実施の形態1)
図1は本発明の第1の実施形態における圧縮動画像データカット検出装置の構成図である。図1において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0046】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータのうち2フレーム分(現在入力されるフレームと、1つ前に入力されたフレーム)を一時記憶するメモリで、107はハードディスクで、105はメモリ104に記録されている2フレーム分のDVCデータの中の各フレームから録画タイムコードを読み出して比較する録画タイムコード比較手段で、106はメモリ104に一時記憶されるDVCデータのフレーム番号を管理し、録画タイムコード比較手段105の結果より、カットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0047】
本実施形態においては、例として、以上のうちの録画タイムコード比較手段105と、カット判定手段106はソフトウェアで構成されるものとする。
【0048】
図2は本発明の第1の実施形態の圧縮動画像データカット検出装置の処理の流れを示す。以下、本発明の第1の実施形態の圧縮動画像データカット検出装置の動作について図1と図2を用いて説明する。
【0049】
図1のDVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図2のS1)。
【0050】
このときカット判定手段106でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントする(図2のS2)。そしてメモリ104に現在フレームと1つ前のフレームの2フレーム分のDVCデータが記憶されたかどうかを判断し(図2のS3)、2フレーム分のDVCデータが記憶されている場合は、フレーム間の録画タイムコードの比較を行う(図2のS4)。ここでいう録画タイムコードとは、録画時の年月日や時分秒に対応するコードである。よって録画を停止して、再度録画を開始した時点で録画タイムコードが不連続になる。録画タイムコードが不連続であれば、カットが有ると判定し(図2のS5)、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図2のS6)。
【0051】
次にメモリ104内に記憶されている現在フレームの1つ前のフレームのDVCデータをハードディスク107に転送して記録する(図2のS7)。
【0052】
以上の処理を最終フレームになるまで繰り返す。
以上のように、DVCカメラで撮影時にDVCデータに記録される録画タイムコードを用いることでカットを検出することができる。このように図1に示すような構成にすることで、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。また、圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0053】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセスして再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【0054】
(実施の形態2)
次に、本発明の第2の実施形態について、図面を参照しながら説明する。
【0055】
図3は本発明の第2の実施形態における圧縮動画像データカット検出装置の構成図である。図3において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0056】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータのうち2フレーム分(現在入力されるフレームと、1つ前に入力されたフレーム)を一時記憶するメモリで、107はハードディスクで、108はメモリ104に記録されているDVCデータを伸長して画像を再構成するデコーダボードで、109は伸長された2フレーム分の画像データを記憶する画像データメモリで、110は画像データメモリ109に記憶されている各フレームの輝度信号と色差信号を比較する画像データ比較手段で、111は画像データ比較手段110の結果より、カットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0057】
本実施形態においては、例として、以上のうちの画像データ比較手段110と、カット判定手段111はソフトウェアで構成されるものとする。
【0058】
図4は本発明の第2の実施形態における圧縮動画像データカット検出装置の処理の流れを示す。以下、本発明の第2の実施形態における圧縮動画像データカット検出装置の動作について図3と図4を用いて説明する。
【0059】
DVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図4のS1)。
【0060】
このときカット判定手段111でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントする(図4のS2)。そしてメモリ104に記憶されているDVCデータをデコーダボード108で伸長して画像を再構成し、再構成された画像データを画像データメモリ109に記憶する(図4のS3)。
【0061】
画像データメモリ109に現在フレームと1つ前のフレームの2フレーム分の画像データが記憶されたかどうかを判断し(図4のS4)、2フレーム分の画像データが記憶されている場合は、フレーム間の輝度信号の比較(またはフレーム間の色差信号の比較)を行う(図4のS5)。輝度信号(または色差信号)の変化量が大きい場合は、カットが有ると判定する(図4のS6)。
【0062】
図5に輝度信号を用いた場合の変化量の算出方法例を示す。図5に示すように、画像を分割し、過去フレームと現在フレームの対応する分割領域どうしの差分の絶対値を求め、全ての分割領域の差分の絶対値の和を変化量とする。
【0063】
なお、変化量の算出方法は、これに限らず、色差信号を用いても良いし、輝度(または色)のヒストグラムを用いても良い。図6に変化量のグラフを示す。
【0064】
フレーム間にカットが無い場合は、画像が非常に似ているため、各分割領域においてフレーム間の輝度差は小さな値となり変化量は小さくなる。フレーム間にカットが有る場合は、図5に示すように各フレームの各分割領域では画像の内容が違うため、各分割領域においてフレーム間の輝度差は大きな値となり変化量は図6に示すように大きな値となる。このようにカット点の変化量は突出するため、変化量がある値(しきい値)を超えるとフレーム間にカットと有ると判定する。
【0065】
カットが有ると判定したら、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図4のS7)。
【0066】
次にメモリ104内に記憶されている現在フレームの1つ前のフレームのDVCデータをハードディスク107に転送して記録する(図4のS8)。
【0067】
以上の処理を最終フレームになるまで繰り返す。以上のように、メモリ104に記録されているDVCデータの中の画像データを伸長してカットを検出することができる。このように図3に示すような構成にすることで、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。
【0068】
またDVCデータは、DVCカメラで撮影されたものばかりではなく、例えば複数のカットが存在する1本のアナログの動画像データをディジタル化し、DVCデータの形式にエンコードされたものである場合もあり、このようなデータにはインデックスコードに限らず、例えば録画タイムコードもカットに対応した形式になっていない場合もありえる。このようなデータに対しても、図3のような構成で、DVCデータを伸長してカットを検出することができる。すなわち、エンコードの状態に依存せず、汎用的にカット検出ができる。また、転送に用いる圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0069】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセスして再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【0070】
(実施の形態3)
上記の本発明の第2の実施形態では図3のメモリ104に記憶されているDVCデータを、伸長してカット検出を行う例を示したが、以下にDVCデータを伸長せずに、同一位置データ(後述)を直接比較する同一位置データ比較手段を有する本発明の第3の実施形態について説明する。図22に示した通り、1フレームのDVCデータは固定長でかつ固定数のDIFblockで構成されている。ビデオデータのDIFblockは図21に示すようなマクロブロックのデータが記録されている。マクロブロックの構成要素であるブロックは図20に示す通りである。この中でDC成分のデータは定められた位置に記録されている。すなわち各フレームのDVCデータの中でDC成分は、定められた位置に記録されており、フレームによって(画像によって)記録位置が変動することはない。このようにフレーム(画像によって)記録位置が変動しないデータを同一位置データと呼ぶことにする。同一位置データとしてDC成分のほかに、ブロックごとに存在するクラスナンバーやDCTモード(図20参照)、マクロブロックごとに存在する量子化ナンバー(図21参照)などがある。同一位置データでないものとしてAC成分が挙げられる。AC成分はデータの記録領域は、輝度ブロックの場合100ビット、色差ブロックの場合68ビットと固定であり、図20に示すようにクラスナンバーより後の領域に記録される。しかしながら圧縮されたAC成分のデータは可変長なので、実質的なAC成分のデータが、記録領域の中でどのくらいの範囲に記録されているかはフレームによって(画像によって)変動する。すなわちAC成分のデータはフレーム内での記録位置がフレームによって(画像によって)変動する。
【0071】
図7は本発明の第3の実施形態における圧縮動画像データカット検出装置の構成図である。図7において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0072】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータのうち2フレーム分(現在入力されるフレームと、1つ前に入力されたフレーム)を一時記憶するメモリで、107はハードディスクである。112はメモリ104に記録されている各フレームの同一位置データどうしを比較する同一位置データ比較手段であるが、本実施形態では比較する同一位置データとしてDC成分を用いるので、112をDC成分比較手段と呼ぶ。
【0073】
113はDC成分比較手段112の結果より、カットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0074】
本実施形態においては、例として、以上のうちのDC成分比較手段112と、カット判定手段113はソフトウェアで構成されるものとする。
【0075】
図8は本発明の第3の実施形態における圧縮動画像データカット検出装置の処理の流れを示す。以下、本発明の第3の実施形態における圧縮動画像データカット検出装置の動作について図7と図8を用いて説明する。
【0076】
DVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図8のS1)。
【0077】
このときカット判定手段113でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントし(図8のS2)、メモリ104に現在フレームと1つ前のフレームの2フレーム分のDVCデータが記憶されたかどうかを判断(図8のS3)する。2フレーム分のDVCデータが記憶されている場合は、各フレーム内の同一位置データであるDC成分のフレーム間の比較を行う(図8のS4)。DC成分は各ブロックの輝度(または色差)の平均値に対応した値であり、第2の実施形態と同様に図5に示したように各分割領域ごとにフレーム間のDC成分の差分の絶対値を求め、それらの和を変化量とする。
【0078】
なお、変化量の算出方法は、これに限らずDC成分のヒストグラムを用いても良い。
【0079】
各ブロックのDC成分の値を得るには、ブロックの先頭アドレスにダイレクトに移動し、ブロック内の最初の9ビットを取得すれば良い(図20参照)。そしてDC成分の変化量が大きい場合は、カットが有ると判定する(図8のS5)。これも第2の実施形態と同様に図6に示すようにカット点で変化量が突出する特徴を利用してカットの有無を判定する。
【0080】
カットが有ると判定したら、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図8のS6)。
【0081】
次にメモリ104内に記憶されている現在フレームの1つ前のフレームのDVCデータをハードディスク107に転送して記録する(図8のS7)。
【0082】
以上の処理を最終フレームになるまで繰り返す。
以上のように、同一位置データであるDC成分を用いることでカットを検出することができる。このように図7に示すような構成にすることで、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。
【0083】
またDVCデータは、DVCカメラで撮影されたものばかりではなく、例えば複数のカットが存在する1本のアナログの動画像データをディジタル化し、DVCデータの形式にエンコードされたものである場合もあり、このようなデータにはインデックスコードに限らず、例えば録画タイムコードもカットに対応した形式になっていない場合もありえる。このようなデータに対しても、図7のような構成で、DC成分を用いてカットを検出することができる。すなわち、エンコードの状態に依存せず、汎用的にカット検出ができる。また、転送に用いる圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0084】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセスして再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【0085】
第2の実施形態では、DVCデータを完全に伸長してからカット検出を行っていたため、伸長のためのデコーダボードと画像データメモリが必要であった。本実施形態では記録位置が固定であるDC成分のデータの変化量を用いてカット検出を行ったため、DC成分の取得は、ブロックの先頭アドレスに移動し、最初の9ビットを取得するという簡単な処理だけで良く、容易にソフトウェアで実現できる。そのためデコーダボードや画像メモリが不要で低コスト化を図ることができる。また、AC成分の取得や逆量子化、逆DCTといった伸長のための一連の処理が不要なので高速処理が実現できる。AC成分は可変長コードであるため、AC成分の取得は、同一位置データの取得のようにブロックの先頭アドレスに移動して、所定の固定長の値を取得するのとは異なり、AC成分の可変長コードを頭から少しずつ解く処理を繰り返す必要があり、非常に負荷が大きい。また、逆量子化および逆DCTは、膨大な数の積和演算が必要である。このような膨大な処理を行うことに比べ、同一位置データであるDC成分のデータを取得しながらカット検出を行う本実施形態では、テープメディアからパソコンへのデータ転送速度が、DVCデータの通常再生速度の例えば4倍速や5倍速といった高速転送を行う際にも、その速度に追従した高速カット検出が行うことができる。
【0086】
(実施の形態4)
以上のDC成分と同様に、各ブロックごとに設定されるクラスナンバーや、各マクロブロックごとに設定される量子化ナンバーもフレーム内の固定の位置に記録されており(図20、図21参照)、これらの値のフレーム間の比較結果をもとにカットを検出しても良く、DC成分を用いた場合と同様に高速処理が可能となる。
【0087】
以下、本発明の第4の実施形態について、図面を参照しながら説明する。
図9は本発明の第4の実施形態における圧縮動画像データカット検出装置の構成図である。図9において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0088】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータのうち2フレーム分(現在入力されるフレームと、1つ前に入力されたフレーム)を一時記憶するメモリで、107はハードディスクである。114はメモリ104に記録されている各フレームの同一位置データどうしを比較する同一位置データ比較手段であるが、本実施形態では比較する同一位置データとしてクラスナンバーを用いるので、114をクラスナンバー比較手段と呼ぶ。115はクラスナンバー比較手段114の結果より、カットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0089】
本実施形態においては、例として、以上のうちのクラスナンバー比較手段114と、カット判定手段115はソフトウェアで構成されるものとする。
【0090】
図10は本発明の第4の実施形態における圧縮動画像データカット検出装置の処理の流れを示す。以下、本発明の第4の実施形態における圧縮動画像データカット検出装置の動作について図9と図10を用いて説明する。
【0091】
DVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図10のS1)。
【0092】
このときカット判定手段115でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントし(図10のS2)、メモリ104に現在フレームと1つ前のフレームの2フレーム分のDVCデータが記憶されたかどうかを判断(図10のS3)する。2フレーム分のDVCデータが記憶されている場合は、各フレーム内の同一位置データであるクラスナンバーのフレーム間の比較を行う(図10のS4)。
【0093】
(表1)に示すように、クラスナンバーは各ブロックのAC成分の絶対値の最大値より算出された値であるため、図11に示すような画像例において、人物の顔の輪郭や髪の毛などの複雑な部分ではクラスナンバーの値は大きくなる(図11の黒いブロック)。背景等の単調な部分ではクラスナンバーは小さくなる(図11の白い部分)。このようにクラスナンバーには画像の特徴が反映される。
【0094】
図12にクラスナンバーを用いた場合の変化量の算出方法例を示す。図12に示すように、画像を分割し、過去フレームと現在フレームの対応する分割領域どうしのクラスナンバーの差分の絶対値を求め、全ての分割領域の差分の絶対値の和を変化量とする。
【0095】
なお、変化量の算出方法は、これに限らずクラスナンバーのヒストグラムを用いても良い。図13に変化量のグラフを示す。
【0096】
フレーム間にカットが無い場合は、画像が非常に似ているため、各分割領域においてフレーム間のクラスナンバーの差は小さな値となり変化量は小さくなる。フレーム間にカットが有る場合は、図12に示すように各フレームの各分割領域では画像の内容が違うため、各分割領域においてフレーム間のクラスナンバーの差は大きな値となり変化量は図13に示すように大きな値となる。
【0097】
各ブロックのクラスナンバーの値を得るには、ブロックの先頭アドレスにダイレクトに移動し、図20に示すように、ブロック内の所定の2ビットの値を取得すれば良い。そしてクラスナンバーの変化量がある値(しきい値)より大きい場合は、カットが有ると判定する(図10のS5)。
【0098】
カットが有ると判定したら、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図10のS6)。
【0099】
次にメモリ104内に記憶されている現在フレームの1つ前のフレームのDVCデータをハードディスク107に転送して記録する(図10のS7)。
【0100】
以上の処理を最終フレームになるまで繰り返す。
以上のように、同一位置データであるクラスナンバーを用いることでカットを検出することができる。このように図9に示すような構成にすることで、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。
【0101】
またDVCデータは、DVCカメラで撮影されたものばかりではなく、例えば複数のカットが存在する1本のアナログの動画像データをディジタル化し、DVCデータの形式にエンコードされたものである場合もあり、このようなデータにはインデックスコードに限らず、例えば録画タイムコードもカットに対応した形式になっていない場合もありえる。このようなデータに対しても、図9のような構成で、クラスナンバーを用いてカットを検出することができる。すなわち、エンコードの状態に依存せず、汎用的にカット検出ができる。また、転送に用いる圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0102】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセス再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【0103】
第2の実施形態では、DVCデータを完全に伸長してからカット検出を行っていたため、伸長のためのデコーダボードと画像データメモリが必要であった。本実施形態では記録位置が固定であるクラスナンバーのデータの変化量を用いてカット検出を行っており、クラスナンバーの取得は、ブロックの先頭アドレスに移動し、図20に示すように所定の2ビットを取得するという簡単な処理だけで良く、容易にソフトウェアで実現できる。そのためデコーダボードや画像メモリが不要で低コスト化を図ることができる。また、AC成分の取得や逆量子化、逆DCTといった伸長のための一連の処理が不要なので高速処理が実現できる。AC成分は可変長コードであるため、AC成分の取得は、同一位置データの取得のようにブロックの先頭アドレスに移動して、所定の固定長の値を取得するのとは異なり、AC成分の可変長コードを頭から少しずつ解く処理を繰り返す必要があり、非常に負荷が大きい。また、逆量子化および逆DCTは、膨大な数の積和演算が必要である。このような膨大な処理を行うことに比べ、同一位置データであるクラスナンバーのデータを取得しながらカット検出を行う本実施形態では、テープメディアからパソコンへのデータ転送速度が、DVCデータの通常再生速度の例えば4倍速や5倍速といった高速転送を行う際にも、その速度に追従した高速カット検出を行うことができる。なお、クラスナンバーと量子化ナンバーは、量子化ステップを決定するためのパラメータであり、(表2)に示すような関係にあり、クラスナンバーと量子化ナンバーから容易に量子化ステップを導くことができ、量子化ステップの値のフレーム間の比較結果を用いてカットを検出しても良い。
【0104】
クラスナンバーの値が大きいほど複雑な画像であり、圧縮後のデータの大きさが小さくなりにくいことを意味する。DVCデータは各ブロックの記録領域の大きさは固定であるため、各ブロックのデータを最終的には定められた記録領域におさまるように圧縮する必要があり、そのために圧縮後のデータが小さくなりにくいデータに対しては量子化ステップの値として大きな値を用いて圧縮する。
【0105】
このように、量子化ステップはクラスナンバーの値と同様に画像によって変動する。すなわち量子化ステップの値も画像の特徴が反映されているため、クラスナンバーと同様にカット検出に用いることができる。
【0106】
また、量子化ナンバーも、圧縮後のデータの大きさが所定量になることを目的として変動するパラメータであるので量子化ステップ同様に画像の特徴が反映されるため、カット検出に用いることができる。
【0107】
また、クラスナンバーや量子化ステップや量子化ナンバーは、AC成分の圧縮に関係する値であるため、画像の複雑さに対応しており、具体的には図11に示すように被写体の輪郭部分に対応する。既に述べた第3の実施形態ではDC成分を用いてカット検出を行う例を示したが、DC成分を用いた場合、カットが無い一連のシーンの中で、輝度値が極端に大きく変化するような場合、カットが無いにもかかわらずカットが有ると判定してしまう。このような誤った判定によりカットを検出することを過剰検出と呼ぶことにする。例えば人がランプに火をともすようなシーンにおいて、火をともす前後のフレーム間では、ランプの部分における輝度差が極端に大きくなる。これにより過剰検出となる可能性がある。しかしながら、クラスナンバー(または量子化ステップや量子化ナンバー)を用いてカット検出をする場合は、ランプに火がともされてもランプ部分の形状は極端に変化をするわけではないため、DC成分を用いた場合に比べ輝度変化の影響による過剰検出が発生しにくいという利点がある。また、DC成分と、クラスナンバーまたは量子化ナンバーまたは量子化ステップを、併用してカット検出を行っても良い。例えば赤い服を着た人物が中央に存在するシーンから、青い服を着た人物が中央に存在するシーンに変化するような動画がある場合、被写体の存在位置に変化がないため、同じような位置に同じような輪郭が存在する。よってクラスナンバー(または量子化ステップや量子化ナンバー)ではシーンの前後のフレーム間で、大きな変化が確認できず、カットの検出漏れが生じる可能性がある。しかしながら、色差のDC成分には大きな変化が出る。よってクラスナンバー(または量子化ステップや量子化ナンバー)とDC成分を併用することにより、高精度の検出が可能となる。
【0108】
(実施の形態5)
以下、本発明の第5の実施形態について、図面を参照しながら説明する。
【0109】
図14は本発明の第5の実施形態における圧縮動画像データカット検出装置の構成図である。図14において100はDVCデータを記録しているDVC用テープメディアで、101はDVC用テープメディア100からDVCデータを読み出すDVC用VTRで、102はパソコンである。103はDVC用VTR101から、パソコン102にDVCデータを転送するIEEE1394ケーブルである。
【0110】
パソコン102の内部における104は、IEEE1394ケーブル103を介して入力されるDVCデータを一時記憶するメモリで、107はハードディスクである。116は、メモリ104に記録されている1フレーム分のデータの中から、DCTモードの値が1であるブロック数をカウントするDCTモードカウンタである。
【0111】
117は、DCTモードカウンタ116の結果より、カットの有無を判定してカットのフレーム番号をハードディスク107に出力するカット判定手段である。
【0112】
本実施形態においては、例として、以上のうちのDCTモードカウンタ116と、カット判定手段117はソフトウェアで構成されるものとする。
【0113】
図15は本発明の第5の実施形態における圧縮動画像データカット検出装置の処理の流れを示す。以下、本発明の第5の実施形態における圧縮動画像データカット検出装置の動作について図14と図15を用いて説明する。
【0114】
はじめに、DCTモードカウンタ116の値を0にする(図15のS1)。次にDVC用テープメディア100から1フレーム分のDVCデータが読み出され、IEEE1394ケーブル103を介してパソコン102内のメモリ104に記録される(図15のS2)。
【0115】
このときカット判定手段117でフレーム番号を管理する変数(フレーム番号変数と呼ぶ)をインクリメントする(図15のS3)。
【0116】
次にフレーム内の各ブロックのDCTモードの値を読み出し、DCTモードの値が1のブロックの数をカウントする(図15のS4)。
【0117】
各ブロックのDCTモードの値を得るには、ブロックの先頭アドレスにダイレクトに移動し、図20に示すように、ブロック内の所定の1ビットの値を取得すれば良い。
【0118】
次に、カット判定手段117において、ある値(しきい値)とDCTモードカウンタ116の値を比較して、カットが有るかどうか(DCTモードカウンタ116の値が、しきい値より大きいかどうか)を判定する(図15のS5)。
【0119】
カットが有ると判定したら、フレーム番号の数字をハードディスク107上のテキストファイルに出力する(図15のS6)。
【0120】
次にメモリ104内に記憶されている現在フレームのDVCデータをハードディスク107に転送して記録する(図15のS7)。
【0121】
以上の処理を最終フレームになるまで繰り返す。
以上、処理の流れを説明したが、DCTモードカウンタ116の出力(各フレームのDCTモードが1のブロック数)の値を用いてカットが検出できる理由について、DCTモードと画像の関係を示して説明する。
【0122】
まず、DCTモードと画像がどのような関係にあるかを図16、図17を用いて説明する。
【0123】
DCTには、圧縮後の画質を良くするために、8−8DCTと呼ばれるモードと、2−4−8DCTと呼ばれる2通りのモードが準備されている。この2つのモードを、DCTモード(1ビット)で、適応的に切り替えて使用する。ブロック内の、奇数フィールドと偶数フィールドの差分が大きい場合は、DCTモードの値を1として、2−4−8DCTを行なう。ブロック内の、奇数フィールドと偶数フィールドの差分が小さい場合は、DCTモードの値を0として、8−8DCTを行なう。
【0124】
よって、例えば、被写体の動きが大きい場合は、ブロック内の、奇数フィールドと偶数フィールドの差分が大きく、2−4−8DCTを行ない、静止画のように動きが小さい場合は、ブロック内の、奇数フィールドと偶数フィールドの差分が小さく、8−8DCTを行なう。
【0125】
図16に被写体が右へ動いている場合のDCTモードの様子を示す。被写体が動くことによって、奇数フィールドと偶数フィールドの差分が大きくなるブロックが出現する。このようなブロックは、DCTモードが1となる(図16の黒いブロック)。この例では、背景では大きな変化がないため、DCTモードが1となるブロックは、画像全体のほんの一部である。
【0126】
次に図17に、あるフレームの、奇数フィールドと偶数フィールドの間でシーンが変わるようなカット(以下では、フィールド混在カットと呼ぶ)の例を示す。フレーム2の奇数フィールドと偶数フィールドの間がカットとなっており、フレーム2は、フレーム1とフレーム3を混ぜたような絵になる。
【0127】
このような場合は、フレーム1とフレーム2は、似ている要素が多く含まれる(フレーム2とフレーム3も同様)ので、フレーム1とフレーム2の差分(または、フレーム2とフレーム3の差分)は、あまり大きな値にならない。そのため、フレーム1とフレーム2の差分を用いてフィールド混在カットを検出するのは困難である。
【0128】
フレーム2をまたぐ、フレーム1とフレーム3の差分は大きな値となるので、これを用いてフィールド混在カットを検出することは可能であるが、フレーム1とフレーム3の差分を得るには、フレーム1とフレーム3を保存しておくメモリが必要となり、装置の低コスト化が図れない。
【0129】
しかしながら、図17に示すように、フレーム2では画面全体のほとんどのブロックでDCTモードが1となるという特徴があり、この特徴を利用して、各フレームのDCTモードが1のブロック数をカウントし、その集計結果の値により、フィールド混在カットを検出することができる。
【0130】
図18に、各フレームのDCTモードが1のブロック数を示す。この図のように、フィールド混在カットでは、DCTモードが1のブロック数が極端に多くなる。被写体の動きが大きい領域においても、ややDCTモードが1のブロック数は多くなるが、図16に示した通り、被写体が動いたりした場合に、DCTモードが1になるブロック数は、画面全体のほんの一部に過ぎないため、フィールド混在カットのように極端に大きな値になることはない。
【0131】
このような特徴から、各フレームのDCTモードが1のブロック数をカウントして、その結果より、フィールド混在カットを検出することが可能である。
【0132】
この方法によれば、図17のフレーム1とフレーム3の差分を使う必要がないため、フレーム1とフレーム3を保存するためのメモリが不要で、装置の低コスト化を図ることができる。
【0133】
以上のように、DCTモードを用いることでフィールド混在カットを検出することができる。このように図14に示すような構成にすることで、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。
【0134】
またDVCデータは、DVCカメラで撮影されたものばかりではなく、例えば複数のカットが存在する1本のアナログの動画像データをディジタル化し、DVCデータの形式にエンコードされたものである場合もあり、このようなデータにはインデックスコードに限らず、例えば録画タイムコードもカットに対応した形式になっていない場合もありえる。このようなデータに対しても、図14のような構成で、DCTモードを用いてカットを検出することができる。すなわち、エンコードの状態に依存せず、汎用的にカット検出ができる。また、転送に用いる圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0135】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセス再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【0136】
第2の実施形態では、DVCデータを完全に伸長してからカット検出を行っていたため、伸長のためのデコーダボードと画像データメモリが必要であった。本実施形態では記録位置が固定であるDCTモードのデータの変化量を用いてカット検出を行っており、DCTモードの取得は、ブロックの先頭アドレスに移動し、図20に示すように所定の1ビットを取得するという簡単な処理だけで良く、容易にソフトウェアで実現できる。そのためデコーダボードや画像メモリが不要で低コスト化を図ることができる。また、AC成分の取得や逆量子化、逆DCTといった伸長のための一連の処理が不要なので高速処理が実現できる。AC成分は可変長コードであるため、AC成分の取得は、同一位置データの取得のようにブロックの先頭アドレスに移動して、所定の固定長の値を取得するのとは異なり、AC成分の可変長コードを頭から少しずつ解く処理を繰り返す必要があり、非常に負荷が大きい。また、逆量子化および逆DCTは、膨大な数の積和演算が必要である。このような膨大な処理を行うことに比べ、DCTモードのデータを取得しながらカット検出を行う本実施形態では、テープメディアからパソコンへのデータ転送速度が、DVCデータの通常再生速度の例えば4倍速や5倍速といった高速転送を行う際にも、その速度に追従した高速カット検出を行うことができる。
【0137】
なお、DCTモードと、DC成分またはクラスナンバーまたは量子化ナンバーまたは量子化ステップを、併用してカット検出を行っても良い。併用することにより、フィールド混在カットと、フィールド混在カット以外の通常のカットの、両方のカットが含まれるような圧縮動画像データからのカット検出が可能となる。
【0138】
【発明の効果】
本発明の圧縮動画像データカット検出装置は、インデックスコードの記録内容にかかわらず、テープメディアからパソコンへ圧縮動画像データの、データ転送およびカット検出の同時処理が可能となる。また、転送に用いる圧縮動画像データは、非圧縮動画像データに比べてデータ量が少ないため、高速に、データ転送およびカット検出の同時処理を実現できる。
【0139】
また、データ転送とカット検出の同時処理を行うことで、ユーザーはパソコンへのデータ転送が完了するとすぐに、ノンリニア編集等の作業に着手することができる。その際、すでにテキストファイルに出力しているカットのフレーム番号を参照して、任意のカットにランダムアクセスして再生したり、カットの順番の並べ換えなどを行うことができる。また、アナログデータであれば、テープメディアからパソコンへのデータ転送中に画質劣化が生じ、かつ同じデータでも転送するたびに劣化の度合いが異なり、カット検出結果が毎回違う結果になりえるが、テープメディアからパソコン内部に至るまでを一貫してディジタルのデータとすることで画質劣化が無く、データ転送中のカット検出結果に全くばらつきがなく、安定した結果を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の構成図
【図2】本発明の第1の実施形態の処理の流れ図
【図3】本発明の第2の実施形態の構成図
【図4】本発明の第2の実施形態の処理の流れ図
【図5】輝度信号を用いた場合の変化量の算出方法例を示す図
【図6】輝度信号を用いた場合の変化量を示す図
【図7】本発明の第3の実施形態の構成図
【図8】本発明の第3の実施形態の処理の流れ図
【図9】本発明の第4の実施形態の構成図
【図10】本発明の第4の実施形態の処理の流れ図
【図11】原画像とクラスナンバーの対応を示す図
【図12】クラスナンバーを用いた場合の変化量の算出方法例を示す図
【図13】クラスナンバーを用いた場合の変化量を示す図
【図14】本発明の第5の実施形態の構成図
【図15】本発明の第5の実施形態の処理の流れ図
【図16】被写体が動いた場合の原画像とDCTモードの対応を示す図
【図17】フィールド混在カットの場合の原画像とDCTモードの対応を示す図
【図18】各フレームのDCTモードが1のブロック数の図
【図19】DVCデータの各ブロックの圧縮方法の説明図
【図20】DVCデータの輝度ブロックと色差ブロックのデータの配置の説明図
【図21】DVCデータのマクロブロックのデータの配置の説明図
【図22】DVCデータの1フレームのデータの構造の説明図
【図23】DVCデータの1つのDIFsequenceのデータの構造の説明図
【図24】従来の圧縮動画像データカット検出装置の構成図
【図25】従来の圧縮動画像データカット検出装置の処理の流れ図
【符号の説明】
100 DVC用テープメディア
101 DVC用VTR
102 パソコン
103 IEEE1394ケーブル
104 メモリ
105 録画タイムコード比較手段
106 カット判定手段
107 ハードディスク
108 デコーダボード
109 画像データメモリ
110 画像データ比較手段
111 カット判定手段
112 DC成分比較手段(同一位置データ比較手段)
113 カット判定手段
114 クラスナンバー比較手段(同一位置データ比較手段)
115 カット判定手段
116 DCTモードカウンタ
117 カット判定手段
118 カット判定手段

Claims (4)

  1. 圧縮動画像データの中の、各フレームの先頭より同一位置のデータのフレーム間の比較を行う同一位置データ比較手段を有し、
    前記同一位置データ比較手段により、量子化ステップのデータを比較し、データの変化量がしきい値より大きい場合にカットが有ると判定することを特徴とする圧縮動画像データカット検出装置。
  2. 圧縮動画像データの中の、各フレームの先頭より同一位置のデータのフレーム間の比較を行う同一位置データ比較手段を有し、
    前記圧縮動画像データがDVCデータであり、
    前記同一位置データ比較手段により、クラスナンバーのデータを比較し、データの変化量がしきい値より大きい場合にカットが有ると判定することを特徴とする圧縮動画像データカット検出装置。
  3. 圧縮動画像データの中の、各フレームの先頭より同一位置のデータのフレーム間の比較を行う同一位置データ比較手段を有し、
    前記圧縮動画像データがDVCデータであり、
    前記同一位置データ比較手段により、量子化ナンバーのデータを比較し、データの変化量がしきい値より大きい場合にカットが有ると判定することを特徴とする圧縮動画像データカット検出装置。
  4. DVCデータの、1フレーム分のデータの中から、DCTモードの値が1であるブロック数をカウントするカウンタと、
    前記カウンタの値がしきい値より大きい場合にカットが有ると判定するカット判定手段を有することを特徴とする圧縮動画像データカット検出装置。
JP32740197A 1997-03-21 1997-11-28 圧縮動画像データカット検出装置 Expired - Fee Related JP3932631B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP32740197A JP3932631B2 (ja) 1997-03-21 1997-11-28 圧縮動画像データカット検出装置
US09/046,315 US20010048486A1 (en) 1997-03-21 1998-03-23 Apparatus for detection of cut in compressed motion picture data

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6766897 1997-03-21
JP9-67668 1997-03-21
JP32740197A JP3932631B2 (ja) 1997-03-21 1997-11-28 圧縮動画像データカット検出装置

Publications (2)

Publication Number Publication Date
JPH10327387A JPH10327387A (ja) 1998-12-08
JP3932631B2 true JP3932631B2 (ja) 2007-06-20

Family

ID=26408881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32740197A Expired - Fee Related JP3932631B2 (ja) 1997-03-21 1997-11-28 圧縮動画像データカット検出装置

Country Status (2)

Country Link
US (1) US20010048486A1 (ja)
JP (1) JP3932631B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000311469A (ja) 1999-02-26 2000-11-07 Matsushita Electric Ind Co Ltd ディスク制御装置及びそれを用いたディスク装置
US7031385B1 (en) 1999-10-01 2006-04-18 Matsushita Electric Industrial Co., Ltd. Method and apparatus for detecting scene change of a compressed moving-picture, and program recording medium therefor
US7085995B2 (en) * 2000-01-26 2006-08-01 Sony Corporation Information processing apparatus and processing method and program storage medium
WO2001056281A1 (fr) * 2000-01-26 2001-08-02 Sony Corporation Procede et systeme informatique et support d'enregistrement de programmes
US6882793B1 (en) 2000-06-16 2005-04-19 Yesvideo, Inc. Video processing system
JP4783985B2 (ja) * 2001-02-28 2011-09-28 日本電気株式会社 映像処理装置、映像表示装置及びそれに用いる映像処理方法並びにそのプログラム
JP4337317B2 (ja) * 2002-09-06 2009-09-30 ソニー株式会社 情報処理装置、およびプログラム
EP1597914A1 (en) * 2003-02-21 2005-11-23 Koninklijke Philips Electronics N.V. Shot-cut detection
US7733596B2 (en) * 2007-12-13 2010-06-08 Dell Products L.P. System and method for identifying the signal integrity of a signal from a tape drive
JP5071988B2 (ja) * 2009-04-24 2012-11-14 Kddi株式会社 動画像のカット点検出装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870144A (en) * 1997-03-28 1999-02-09 Adaptec, Inc. Reduced-quality resolution digital video encoder/decoder

Also Published As

Publication number Publication date
JPH10327387A (ja) 1998-12-08
US20010048486A1 (en) 2001-12-06

Similar Documents

Publication Publication Date Title
JP3315766B2 (ja) 画像データ符号化方法、その方法を用いた画像データ符号化装置、画像データ復元方法、その方法を用いた画像データ復元装置、シーン変化検出方法、その方法を用いたシーン変化検出装置、シーン変化記録装置、及び画像データのシーン変化記録・再生装置
JP3244629B2 (ja) シーン変化点検出方法
US8644629B2 (en) Compression and decoding of single sensor color image data
JP3787398B2 (ja) 画像処理装置及びその方法
US9167198B2 (en) Image processing apparatus and image processing method
GB2379117A (en) System and method for detecting the border of recorded video data
JPH09322174A (ja) 動画データの再生方法
JP3932631B2 (ja) 圧縮動画像データカット検出装置
US6078690A (en) Image data conversion device and method having function of inserting delimiter code into position in image data where a predetermined amount of data is reached
CN1132985A (zh) 活动图象信息压缩和解压缩方法及视频信号处理系统
JP4115061B2 (ja) 記録メディアとこれを用いる映像記録/再生装置
US20090153677A1 (en) Recording and reproduction apparatus and methods, and a recording medium storing a computer program for executing the methods
JP5290568B2 (ja) 動画像記録装置、動画像再生装置及びプログラム
US8428355B2 (en) Image file processing method
JP2003023600A (ja) 画像処理装置、動画記録再生装置、画像処理方法、プログラム、及びコンピュータ読み取り可能な記憶媒体
JP2000023081A (ja) 画像再生装置
TW550952B (en) Method for detecting scene change in compressed video data
JP2001160947A (ja) 画像記録装置および方法
KR100210443B1 (ko) 디지탈 스틸 카메라(dsc)의 화상 압축방법.
KR101501244B1 (ko) 썸네일 생성 방법
JPH10145812A (ja) ディジタル画像信号記録装置
KR100838816B1 (ko) 동영상 검색 방법
Singh et al. Critical Review of External Recorders in Film and Television Production
KR20030085671A (ko) 영상파일 포맷 및 영상파일 생성 및 재생 방법
JP2001358983A (ja) 画像入力装置、画像記録方法、およびその方法を実行するためのプログラムを格納したコンピュータが読取可能な記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040929

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040929

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20041014

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070312

LAPS Cancellation because of no payment of annual fees