JP3128107B2 - 映像圧縮方法および装置 - Google Patents

映像圧縮方法および装置

Info

Publication number
JP3128107B2
JP3128107B2 JP25033094A JP25033094A JP3128107B2 JP 3128107 B2 JP3128107 B2 JP 3128107B2 JP 25033094 A JP25033094 A JP 25033094A JP 25033094 A JP25033094 A JP 25033094A JP 3128107 B2 JP3128107 B2 JP 3128107B2
Authority
JP
Japan
Prior art keywords
event
image data
time
image
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25033094A
Other languages
English (en)
Other versions
JPH08116533A (ja
Inventor
行信 谷口
明人 阿久津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP25033094A priority Critical patent/JP3128107B2/ja
Publication of JPH08116533A publication Critical patent/JPH08116533A/ja
Application granted granted Critical
Publication of JP3128107B2 publication Critical patent/JP3128107B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、映像データベーシステ
ムなどにおいて、フレームを間引くことによって映像デ
ータを圧縮する方法および装置に関する。
【0002】
【従来の技術】コンピュータを使って大量の映像を蓄積
・管理し、利用する映像データベースシステムにおいて
は、必要な映像を迅速に検索できることが要求される。
一般に検索の手段としてはキーワード(タイトル、主人
公など)を使って絞り込む方法がとられるが、キーワー
ドだけでは十分な絞り込みが行えないので、最終的に
は、その映像が本当に自分の欲しいものかを確認するた
めのブラウズ機能(映像の中身を、本をぱらぱらめくる
ような感覚でさっと見る機能)が欠かせない。この場
合、レスポンスの早いブラウズを実現するためには、ハ
ードディスク等の高速アクセス可能な記憶装置に、長時
間の映像を圧縮して蓄積する必要がある。しかし、従来
の映像圧縮方法はMPEG(MPEG,CD1117
2,Coding ofMoving Pictures and Asociated Au
dio for Digital Strage Media atUp To About
1.5 Mbps,1991)やH.261(CCITT Re
c.H.261,Video Codec for Audiovisual Ser
vices at px64 kbit/s,CCITT COM.XV−
R 37−E,1990)など、ほとんどが映像の品質
劣化を最小限に抑える目的で開発されたものであったた
め、十分な圧縮率が得られなかった。また、画像の圧縮
伸長処理のために特別で高価なハードウェアが必要であ
った。
【0003】
【発明が解決しようとする課題】映像を大幅に圧縮する
ための便法として、フレームを等時間間隔に間引く方法
が考えられる。例えば、NTSC映像信号では30フレーム
/秒のフレームレートであるが、それらのうち29フレ
ームを捨てて1フレーム/秒にまで間引くことによっ
て、1/30にまでデータ量を減らすことができる。間
引き映像を再生する時には、紙芝居のように1秒に1枚
ずつ画像をディスプレイ上に表示する。したがって、動
きはぎくしゃくしたものになるが、音声は連続的に再生
されるので、映像内容の概略を理解することは可能であ
り、映像データベースシステム等におけるブラウズには
十分役立つ。
【0004】しかし、フレームを等時間間隔に間引く方
法では、音声に対して画像の表示が遅れているように感
じるという問題が生じる。これを図3を使って説明す
る。
【0005】図3において、31は入力される画像デー
タ列(フレーム列)であり、二つのコマーシャルCM
1,CM2から構成され、CM1の映像311からCM
2の映像312に、313の時点で切り替わっていると
仮定する。CM1とCM2の映像を区別するため、CM
1の画像データは網掛けで示す。31′は31の入力画
像データ列から1秒間隔で間引いて抜粋された画像デー
タ列であり、32,33がCM1から抜粋された画像デ
ータ、34,35がCK2から抜粋された画像データで
ある。再生時には、t0,t0+1,t0+2,t0+3の各時刻
に、画像データ32,33,34,35がユーザディス
プレイ上に紙芝居のように1秒間隔で表示され、同時に
音声がスピーカから出力される。この場合、音声は時刻
Tの時点でCM1からCM2のものに切り替わるのに、
画像の方は時刻t0+2までCM1の画像データ33が表
示されたままである。したがって、Tからt0+2の区間
で音声内容と画像内容が食い違ってしまい、音声に対し
て画像の表示が遅れているように感じる。
【0006】さらに、このフレームを等時間間隔に間引
く方法には、CMのように場面が頻繁に切り替わるよう
な映像の場合には、1秒以内等での短いショット(場
面)が抜け落ちてしまう可能性もある。
【0007】本発明の目的は、上記等間隔の間引きのた
めに生じる画像表示遅れの不自然さや重要場面の抜けな
どを軽減した上で映像を大幅に圧縮できる映像圧縮方法
および装置を提供することにある。
【0008】
【課題を解決するための手段】本発明は、映像データを
順次入力し、その画像データあるいは音声データあるい
は付属情報が特定の条件を満たす場合にイベントありと
判定し、一定時間経過してもイベントが検出されない
と、その時点時点で画像データを出力し、イベントが検
出されると、その時点で画像データを出力して経過時間
を初期化することを特徴とする。
【0009】
【作用】通常は入力された画像データ(フレーム)を等
時間間隔毎に間引いて出力するが、イベントが検出され
た場合は、その時点の画像データを出力する。イベント
ありは例えば場面の変わり目とする。このように、場面
の変わり目に代表される重要性の高いイベントを検出
し、そのイベントに対応する画像データをもらさず抜粋
するように制御することによって、音声内容と画像内容
のずれが感じにくくなり、画像が音声に対して遅れてい
るような感じを軽減することができるようになる。
【0010】
【実施例】以下、本発明の一実施例を図面を用いて説明
する。
【0011】図1は、本発明の一実施例の構成ブロック
図である。図において、100は映像記録装置であり、
これから読み出された画像データ、付属情報、音声デー
タがそれぞれ画像入力手段101、付属情報入力手段1
02、音声入力手段103に入力される。画像入力手段
101から画像データが画像出力手段106とイベント
検出手段104に順次送られ、同時に、音声データが音
声入力手段103から音声出力手段107とイベント検
出手段104に送られる。付属情報は付属入力手段10
2からイベント検出手段104に順次送られる。付属情
報とは、ビデオテープなどに書き込まれたタイムコード
や、その映像の撮影日時の情報などである。イベント検
出手段104は、画像データ、音声データ、付属情報が
ある特定の条件を満たす場合にイベントありと判定し、
信号線108を介して画像出力手段106にトリガ(画
像データ出力トリガ)をかける。また、イベント検出手
段104は、タイマ105が一定時間(実施例では1秒
とする)を経過した場合、イベントありと判定されなく
ても信号線108にトリガ信号を出す。画像出力手段1
06は、イベント検出手段104から信号線108を介
してトリガ信号を受けると、画像入力手段101から送
られてきている画像データを1フレーム出力する。一
方、音声出力手段107は、音声入力手段103から送
られた音声データをイベントあるなしに関わらず逐次出
力し続ける。
【0012】図2に、イベント検出手段104の処理フ
ローチャートの一例を示す。まず、タイマ105を初期
化し(ステップ201)、画像入力手段101から画像
データを読込む(ステップ202)。ここで、タイマ1
05は初期化時点を0としてそこからの経過時間を計測
し、イベント検出手段104からの問い合わせに対して
返答するものである。画像入力手段101から読み込ま
れた画像データが特定の条件を満たす場合にイベントあ
りと判定し(ステップ203)、ステップ205に進
む。イベントがない場合も、タイマ105に問い合わせ
て、初期化時点から1秒が経過していた場合(ステップ
204)、ステップ205に進む。ステップ205で
は、画像出力手段106に信号線108を介してトリガ
信号を送り、ステップ201に戻る。一方、イベントな
しで、1秒経過しない場合は、ステップ202に戻り、
引き続いて画像データの読み込みを行う。
【0013】図2の処理では、ステップ204でイベン
トが1秒以上検出されない時に画像出力を行えるように
しているが、間隔は何秒おきでも構わない。この間隔が
狭ければ狭いほど、動きが滑らかになるが、その反面、
データ量は増加するので、通信容量または記憶容量との
兼ね合いで適当に決めることができる。また、図2で
は、画像データでイベントありを判定したが、後述の付
属情報や音声データでイベントを判定する場合も、処理
フローは基本的に同じである。
【0014】次に、イベント検出の二、三の実施例につ
いて説明する。イベント検出手段104では、これらの
一つあるいは複数のものを組み合わせてイベントありを
判定すればよい。
【0015】まず、イベント検出の第1の実施例は、画
像入力手段101からの画像データを用いて、画像処理
により場面の変わり目をイベントと検出するものであ
る。これは画像の音声に対する遅れの感覚をなくすのに
好適である。即ち、先の図3の例では、CM1とCM2
の変わり目では場面の転換があるはずであり、それをイ
ベントとして検出し、その時点の画像を抜粋しておき、
再生時に音声と同期をとりながら表示を行なうことによ
って、画像が音声に対して遅れている感じがなくなる。
【0016】なお、場面の変わり目を画像処理によって
検出することは、カット検出、シーンチェンジ検出とい
った名前で呼ばれ、様々な方法がある。例えば、代表的
な方法としては、時間的に隣合う二枚の画像It,It-1
の対応する画素における輝度値の差を計算して、その絶
対値の和(フレーム間差分)をD(t)とし、D(t)が
ある与えられた閾値よりも大きい時、tをカット点とみ
なす方法がある(大辻、外村、大庭:「輝度情報を使っ
た動画像ブラウジング」、電気情報通信学会技術報告,
IE90−103,1991)。この場合、フレーム間
差分の代りに、画素変化面積、輝度ヒストグラム差分、
ブロック別色相関、x2検定量などがD(t)として使
われることもある(大辻、外村:「映像カット自動検出
方式の検討」,テレビジョン学会技術報告,Vol.1
6,No.43,pp.7−12)。また、D(t)をその
まま閾値処理するのではなく、各種時間フィルタをD
(t)に対して作用した結果を閾値処理する方法もある
(K.Otsuji and Y.Tonomura:“Projection Detec
ting Filter for Video Cut Detection”Proc.of
ACM Multimedia 93,1993,pp.251−2
57)。この方法は、映像の中に激しく動く物体やフラ
ッシュ光があっても誤検出を生じにくいという特徴を持
っている。さらに、先に本出願人は、入力画像データ列
について時間的に隣合う画像間に加えて時間的に離れた
画像間の複数組の各画像データIi,Ijの間の距離d
(i,j)を計算し、該計算された複数組の距離d
(i,j)をもとに時刻tにおけるシーン変化率C
(t)を求め、該シーン変化率C(t)をあらかじめ定
めた閾値と比較して、時刻tがカット点であるか否か判
定することで、時間的にゆっくりとしたシーン変化を検
出する方法を提案した(特願平5−317663号)。
画像処理によるイベント検出では、これらのいずれの方
法を用いてもよい。
【0017】イベント検出の第2の実施例は、場面の変
わり目を検出するのに、画像データを使わずに付属情報
入力手段102からの付属情報を使うものである。例え
ばカメラのON/OFF動作によって生じるタイムコー
ドの不連続性として、場面の変わり目を検出するのであ
る。
【0018】イベント検出の第3の実施例は、イベント
として映像のカット点ではなく、テロップ(字幕)の出
現/消滅、カメラ操作(例えば、パニング、ズーム)の
開始/終了、人がフレームイン/アウトを検出するもの
である。例えば、テロップはニュース映像などでは、内
容理解に欠かせないものであり、表示遅れがないように
する方がよい。
【0019】イベント検出の第4の実施例は、画像デー
タや付属情報から検出されるイベントに限らず、音声入
力手段103からの音声データから抽出されるイベント
を使うものである。例えば、“これ”、“あれ”といっ
た指示代名詞が発話されたことをワードスポッティング
技術を使ってイベントとして検出するものである。例え
ば、“この値段”というナレーションの入ったところで
は、価格が画像として表示されているはずであり、その
画像は内容を理解するためには欠かすことができない。
【0020】図1の構成で、画像出力手段106と音声
出力手段107の出力先はファイルであっても、通信回
線であってもよいが、非一定間隔で間引かれた画像デー
タを音声データと同期をとりながら再生するためには、
画像表示のタイミングを何らかの形で記述しておく必要
がある。図4に、記述の一例を示す。図4において、4
6は出力データであり、画像ブロックと音声ブロックか
ら構成される。各々の画像ブロックは41の“画像表示
時刻”と42の“イベントの種類”と43の“画像デー
タ”から構成され、各々の音声ブロックは44の“音声
出力時刻”と45の音声データから構成される。43の
画像データは、JPEGで圧縮したデータであってもよ
いし、縮小した画像であってもよい。41の画像表示時
刻は、43の画像データを再生開始時刻から何ミリ秒後
にユーザディスプレイ上に表示すればよいかを表す。4
2のイベントの種類は、例えば43の画像データが場面
の変わり目のイベントに対応するものなのか、等間隔に
とられたものかを記述している。このようにイベントの
種類を記述しておき、場面の変わり目に対応する画像を
並べることで図5のような場面一覧表示が可能となる。
45の音声データはどのような形で符号化されていても
よい。図4の例では、音声データは2秒を1ブロックと
して記述されている。44の音声出力時刻は、45の音
声データを出力デバイスに送り出す時刻を表す。図1で
は省略したが、出力デバイスは45の音声データが送ら
れてくると、それを一時バッファリングしながら、スピ
ーカ、ヘッドホンに音声を出力する。
【0021】
【発明の効果】以上説明したように、本発明によれば、
間引きのために生じる画像表示遅れの不自然さを軽減し
た上で映像を大幅に圧縮できる効果がある。さらに、圧
縮・伸長に特別なハードウェアを必要としないため、安
価に映像データシステムを構成できる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成ブロック図である。
【図2】本発明の一実施例のイベント検出の処理フロー
図である。
【図3】従来の等間隔間引き処理の問題点を説明するた
めの図である。
【図4】出力フォーマットの一例を説明するための図で
ある。
【図5】場面の一覧表示の一例を示す図である。
【符号の説明】
101 画像入力手段 102 付属情報入力手段 103 音声入力手段 104 イベント検出手段 105 タイマ 106 画像出力手段 107 音声出力手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 7/24 - 7/68 H04N 7/14 - 7/15

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 映像データを順次入力し、その画像デー
    タあるいは音声データあるいは付属情報が特定の条件を
    満たす場合にイベントありと判定し、一定時間経過して
    もイベントが検出されないと、該一定時間経過した時点
    時点で画像データを出力し、イベントが検出されると、
    その時点で画像データを出力して経過時間を初期化する
    ことを特徴とする映像圧縮方法。
  2. 【請求項2】 請求項1記載の映像圧縮方法において、
    場面の変わり目をイベントとして検出することを特徴と
    する映像圧縮方法。
  3. 【請求項3】 画像データ、該画像データの付属情報、
    音声データを順次入力する手段と、 前記入力された画像データあるいは付属情報あるいは音
    声データが特定条件を満たす場合にイベントありを判定
    し、一定時間経過してもイベントが検出されないと該一
    定時間経過した時点時点で画像データ出力トリガを出力
    し、イベントが検出されるとその時点で画像データ出力
    トリガを出力して経過時間を初期化する手段と、 前記トリガが出力される毎に入力画像データを出力する
    手段と、 入力音声データをイベントのありなしに関係なく連続し
    て出力する手段と、 を具備することを特徴とする映像圧縮装置。
JP25033094A 1994-10-17 1994-10-17 映像圧縮方法および装置 Expired - Fee Related JP3128107B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25033094A JP3128107B2 (ja) 1994-10-17 1994-10-17 映像圧縮方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25033094A JP3128107B2 (ja) 1994-10-17 1994-10-17 映像圧縮方法および装置

Publications (2)

Publication Number Publication Date
JPH08116533A JPH08116533A (ja) 1996-05-07
JP3128107B2 true JP3128107B2 (ja) 2001-01-29

Family

ID=17206313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25033094A Expired - Fee Related JP3128107B2 (ja) 1994-10-17 1994-10-17 映像圧縮方法および装置

Country Status (1)

Country Link
JP (1) JP3128107B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002112224A (ja) * 2000-09-29 2002-04-12 Just Syst Corp 放送番組リンク情報提供システム、装置、方法及び記録媒体

Also Published As

Publication number Publication date
JPH08116533A (ja) 1996-05-07

Similar Documents

Publication Publication Date Title
US20040027367A1 (en) Method of and apparatus for processing zoomed sequential images
US7463776B2 (en) Method and device for condensed image recording and reproduction
JPH09322174A (ja) 動画データの再生方法
JP2004194338A (ja) スライドショーの制作方法およびシステム
KR20010089770A (ko) 동적 임계치를 사용하는 비주얼 인덱싱 시스템에 대한중요 장면 검출 및 프레임 필터링
JP3340905B2 (ja) 動画像処理方法
JP2000350165A (ja) 動画像記録再生装置
US7450823B2 (en) Hard disk recorder and video record apparatus
JPH1066085A (ja) 画像処理装置および画像処理方法、並びに記録媒体
US7084908B2 (en) Image signal recording apparatus with controlled recording of main, preceding and succeeding moving image signals
JPH11215458A (ja) 画像記録装置及び方法、画像再生装置及び方法、画像記録再生装置及び方法、並びに記録媒体
JPH11265396A (ja) 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体
JP3128107B2 (ja) 映像圧縮方法および装置
JPH10276388A (ja) 画像処理装置および画像処理方法、画像再生装置および画像再生方法、並びに記録媒体
JP4321374B2 (ja) パノラマ映像記録再生装置
JP2000165803A (ja) 映像信号記録再生装置
JP6742515B2 (ja) 符号化映像再生装置および符号化映像再生方法
JPH06153146A (ja) 動画像のシーンチェンジ検出装置および編集装置
JPH10276395A (ja) 画像処理装置および画像処理方法、並びに記録媒体
JP3794146B2 (ja) 情報再生装置および方法、並びに提供媒体
WO2003065715A1 (fr) Appareil, systeme et procede d'enregistrement/lecture de donnees audio/video, support enregistre par eux, appareil de reproduction de donnees audio/video, et structure de donnees
JP2000011545A (ja) 記録装置及び方法
JP4196475B2 (ja) 再生装置及び方法並びに記録及び/又は再生装置及び方法
JP4186949B2 (ja) 情報記録再生装置
JP2000152141A (ja) 情報記憶媒体、および動画音声記録再生装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071110

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081110

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees