JPH09214879A - 動画像処理方法 - Google Patents

動画像処理方法

Info

Publication number
JPH09214879A
JPH09214879A JP8020744A JP2074496A JPH09214879A JP H09214879 A JPH09214879 A JP H09214879A JP 8020744 A JP8020744 A JP 8020744A JP 2074496 A JP2074496 A JP 2074496A JP H09214879 A JPH09214879 A JP H09214879A
Authority
JP
Japan
Prior art keywords
moving image
image data
detected
section
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8020744A
Other languages
English (en)
Other versions
JP3340905B2 (ja
Inventor
Toshimitsu Kaneko
敏充 金子
Hisashi Aoki
恒 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP02074496A priority Critical patent/JP3340905B2/ja
Publication of JPH09214879A publication Critical patent/JPH09214879A/ja
Application granted granted Critical
Publication of JP3340905B2 publication Critical patent/JP3340905B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】動画像から所望の場面を検索する際に、動画像
の不連続点(ショットの切れ目)を検出し、ショットご
との代表フレームを一覧表示して選ぶ方法では、画面に
多くの静止画が一覧表示されてしまい、かえって動画像
の内容がわかりづらくなり、利用者が困惑してしまう。
また、長時間の動画像を短縮したい場合には、人手によ
り必要な部分と不必要な部分との判定を行い、動画像の
編集により短縮する以外に方法はなく、ユーザに負担を
かけてしまう。 【解決手段】動画像の不連続点(カット点)を検出し、
さらに音声の無音部分を音声の切れ目として検出し、音
声の切れ目かつ動画像のカット点である部分を全体の切
れ目として検出し、このようにして切り分けられた部分
ごとに代表フレームを選んで一覧表示させる。また、動
画像データから動きの激しさを検出し、さらに音声から
音声のない無音部分を検出し、動きの激しさと無音部分
の情報とから音声と動画像をどのようなメディアの組み
合わせで表示させるか、または表示しないかを決定す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、動画像の検索、編
集を自動で行うための動画像処理方法に関する。
【0002】
【従来の技術】従来、動画像は連続するフレーム全体で
一つの単位をなしており、単に一つの動画像を選択して
再生するのが一般的であった。したがって、動画像中の
所望の場面を選択して再生したい場合には、まず、一本
の動画像を選択して再生し、時間的に未来方向、過去方
向に早送りしながら所望の場面まで到達していた。すな
わち、動画像のはじめから、または、たまたま選択され
た途中の場面から動画像の時間軸をたどって所望の場面
まで到達していた。
【0003】また、所望の場面が動画像のどのあたりに
あったかをあらかじめ記憶している場合には、その記憶
を頼りにして再生開始位置を指定し、到達するまでの時
間を短くするようにしていた。
【0004】以上は、以前見たことのある動画像から所
望の場面を探す場合の手続きであったが、一度も見たこ
とのない動画像から利用者が興味のありそうな場面を選
択するためには、動画像のはじめから再生するしかな
い。動画を見る時間を短縮するためには、早送り操作を
織り交ぜながら動画像を早見したり、時間的に未来方向
または過去方向に再生開始場所を適当に飛ばして再生
し、興味のありそうな場面が再生されたら通常の再生速
度で再生し、興味のなさそうな場面であれば再び再生開
始場所を飛ばして次の場面の再生へと移っていた。
【0005】もう少し効率よく所望の場面を探すための
手法として、動画像をいくつかの場面に分割しておき、
それぞれの場面を代表するフレームを一覧表示するもの
がある。利用者は表示された代表フレームの中から所望
の場面に相当する代表フレームを選択し、その場面から
動画像を再生する。
【0006】また、まだ見たことのない動画像から利用
者の興味のある場面を選択してみる場合には、代表フレ
ームの一覧を見ることにより動画像の内容をざっと見る
ことができるため、比較的容易に興味のある場面を予測
して、その場面からの再生を行うことができる。
【0007】また、長時間の動画像を見たいが、十分な
時間がない場合には、あまり必要のない部分は再生させ
ずに、重要な部分だけを再生させることにより再生時間
を短縮させる必要がある。同様に、素人が撮影したビデ
オには不必要な場面が多く含まれているため、このよう
な不必要な部分を簡単に削除したいという要求がある。
しかしながら、現在のところ、人手により必要な部分と
不必要な部分との判定を行い、動画像の編集により短縮
する以外に方法はなかった。
【0008】さらに、音声のみが必要であるにも関わら
ず、ビデオカメラによって動画像も撮影してしまった場
合や、やはり音声は重要であるが映像は動画である必要
はなく静止画でも十分である場合でも、とくに編集をす
ることはほとんどなく動画像とそれに付随する音声とし
て保管、再生されていた。
【0009】
【発明が解決しようとする課題】従来のような動画像の
時間軸をたどりながらの検索では、動画像の時間軸上の
一点しか利用者が見ることができないために所望の場面
にたどり着くまでの時間が非常に長くなり、効率的では
ない。特に、長い動画像の場合には顕著である。利用者
の記憶を頼りにして動画像の再生開始位置を指定し、所
望の場面を探す場合にも、利用者の記憶は曖昧で信頼の
置けないものであり、記憶違いの場合にはかえって検索
の効率を悪くしてしまうことさえもある。また、所有し
ている動画像全てに対してどの場面が動画像のどのあた
りに存在していたかを記憶しておくのは利用者に多大な
付加をかけることになるし、多くの動画像にたいしては
全て記憶すること事態が不可能である。
【0010】一方、動画像の中から代表フレームを選
び、これを一覧表示して所望の場面を探す手法において
は、動画像の時間軸上の複数の点の映像を同時に見るこ
とができるため、検索の効率は改善されている。しかし
ながら、代表フレームを利用者自身が選択してあらかじ
め登録しておくのは、利用者に負担を強いることにな
る。
【0011】この負担をなくすために、自動的に動画像
の不連続点(ショットの切れ目)を検出し、それぞれの
ショットの中から代表フレームを選ぶ(例えばショット
のはじめのフレームを選ぶ)手法があるが、編集された
映像ではショットは一般に5秒程度と短いため、表示さ
れる代表フレーム数が多くなってしまうという欠点があ
る。画面に多くの静止画が一覧表示されると、かえって
動画像の内容がわかりづらくなり、利用者が困惑してし
まう場合がある。
【0012】また、ときには画面上に表示しきれなくな
り、複数回に分けて表示しなければならなかったり、一
度に表示しようとするために一つの代表フレームの表示
がきわめて小さくなってしまったりする。このような場
合には、所望の場面の検索効率の改善度が低下してしま
うという問題がある。
【0013】また、長時間の動画像を短縮したい場合に
は、すでに説明したように人手により必要な部分と不必
要な部分との判定を行い、動画像の編集により短縮する
以外に方法はないのが現状である。
【0014】さらに、音声情報だけが重要で、動画像は
必要がない、もしくは静止画でも十分であると言った場
合でも、動画像は動画像として保管、再生されていたの
で、意味のない動画像に無駄な記録容量が費やされてい
た。また、ネットワークを経由してデータを受け取る場
合には、情報量が多いため、長い時間待たされてしまう
という状況であった。
【0015】
【課題を解決するための手段】本発明は、動画像データ
に対応付けられてなる音声データの無音区間を検出し、
検出した前記音声データの無音区間に対応する前記動画
像データの不連続点を検出し、検出した前記動画像デー
タの不連続点を、前記動画像データおよび前記音声デー
タと関連づけて記憶することを特徴とする。
【0016】また、動画像データに対応付けられてなる
音声データの無音区間を検出し、検出した前記音声デー
タの無音区間に対応する前記動画像データの不連続点を
検出し、検出したこの不連続点によって区切られる前記
動画像データのフレームを表示させることを特徴とす
る。
【0017】また、動画像データに対応付けられてなる
音声データの無音区間を検出し、検出した前記音声デー
タの無音区間に対応する前記動画像データの不連続点を
検出し、検出した前記動画像データの不連続点および前
記音声データの無音部分をもとに、前記動画像データお
よび音声データの再生方法を決定することを特徴とす
る。
【0018】また、動画像データに対応付けられてなる
音声データの無音区間を検出し、検出した前記音声デー
タの無音区間に対応する前記動画像データの不連続点を
検出し、検出した前記不連続点のフレームの動きの変化
があらかじめ定められた第一のしきい値よりも小さい区
間で、あらかじめ定められた第二のしきい値よりも長
く、前記区間の音声が無音であるときに、前記区間の動
画像データのうちの一つのフレームを静止画として表示
し、静止画として表示した前記区間の動画像データに対
応付けられてなる音声を再生しないことを特徴とする。
【0019】また、動画像データに対応付けられてなる
音声データの無音区間を検出し、検出した前記音声デー
タの無音区間に対応する前記動画像データの不連続点を
検出し、検出した前記不連続点のフレームの動きの変化
があらかじめ定められた第一のしきい値よりも小さい区
間で、あらかじめ定められた第二のしきい値よりも長
く、前記区間の音声が無音であるときに、前記区間の動
画像データおよび音声データを再生しないことを特徴と
する。
【0020】つまり、本発明の動画像処理方法では、動
画像の不連続点(カット点)を検出し、さらに音声の無
音部分を音声の切れ目として検出し、音声の切れ目かつ
動画像のカット点である部分を全体の切れ目として検出
し、このようにして切り分けられた部分ごとに代表フレ
ームを選んで一覧表示させる。
【0021】また、本発明の動画像処理方法では、動画
像データから動きの激しさを検出し、さらに音声から音
声のない無音部分を検出し、動きの激しさと無音部分の
情報とから音声と動画像をどのようなメディアの組み合
わせで表示させるか、または表示しないかを決定する。
また、本発明の動画像処理方法では、動画像データか
ら動きの激しさを検出し、さらに音声から音声のない無
音部分を検出し、動きの激しさと無音部分の情報によっ
て、あらかじめ決められた方法で音声と動画像を編集す
る。
【0022】以上の手段により、本発明の動画像処理方
法では、動画像を意味的なまとまりに階層化する事がで
きるため、所望の場面の検索が効率的に行えるようにな
る。また、本発明の動画像処理方法では、不要な場面を
自動的に削除もしくは飛ばして再生することができるた
め、時間がないときにも動画像を短時間で見たり、素人
の撮影した間延びした動画像を質の高い動画像に編集し
直すことができる。
【0023】さらにまた、本発明の動画像処理方法で
は、音声のみが必要で、画像は静止画でも十分である場
面を判定することができるため、ユーザの手を煩わせる
ことなく、無駄なデータを削除することができる。その
結果記録媒体の無駄をなくし、データの転送にかかる時
間も削減できる。
【0024】
【発明の実施の形態】
(第一の実施例)本発明の第一の実施例を図を用いて詳
細に説明する。図1は第一の実施例の一構成例を示すブ
ロック図である。まず、図1における各ブロックの機能
について簡単に説明する。
【0025】図1において、アナログの音声を扱う場合
にはディジタル音声データ入力端子10への入力の前段
階としてA/D変換が施される。ディジタル音声データ
入力端子10への入力となる音声データは記録部80に
記憶されている音声データであることもある。
【0026】ディジタル音声データ入力端子10に入力
される音声データは、ディジタル動画像データ入力端子
20に入力される動画像データに付随している音声デー
タである。動画像データもアナログデータを扱う場合に
はディジタル動画像データ入力端子20への入力の前段
階としてA/D変換を施しておく。また、音声データと
ともに記録部80に記録されている動画像データが20
の入力データである場合もある。
【0027】音声データおよび動画像データにはそれぞ
れタイミング情報が含まれており、音声と動画像を同期
して再生できるようになっている。無音声部検出装置3
0は、音声データから無音部分、音声レベルの低い部分
を検出する。具体的な方法としては、例えば「音声認
識」(新美康永著、共立出版)などに記されている方法
が適用される。
【0028】映像カット検出部40は、ディジタル動画
像データ入力端子20に入力された動画像の連続したフ
レームのうち、変化の大きかったフレーム間(カット)
を検出する。すなわち、時間的に連続して撮影されたフ
レームのかたまり(ショット)のつなぎ目を検出する。
例えば、フレーム間の輝度の差分量としきい値との比較
による検出方法、フレームごとの輝度ヒストグラムの差
分量としきい値との比較による検出方法などがあり、い
ずれも本実施例に適用可能である。
【0029】音声符号化部50は、音声データを圧縮す
るなど、音声の記録に適した符号化を施す。例えば、入
力された音声信号を周波数帯域に変換し、周波数をサブ
バンドに分割することによって、各サブバンド内での信
号エネルギーの偏りを減少させ、各サブバンドの信号エ
ネルギーに応じたビットを割り当てるサブバンド符号化
が用いられる。または、入力音声信号をフーリエ変換や
コサイン変換などの線形変換により信号エネルギーを集
中させ、量子化を行う適応変換符号化なども用いること
ができる。
【0030】動画像符号化部70も同様に多量の動画像
データを圧縮し、記録に適したデータに変換を行う。こ
の際にはコサイン変換などの直行変換を行った後に量子
化を行う方法や、動画像の時間方向の相関を利用した動
き補償を用いた方法、さらに両者を用いた方法などを用
いることができる。
【0031】また、記録部80は、実際には磁気ディス
ク装置や磁気テープ装置などが用いられ、音声データ、
動画像データ、及びこれらに付随した情報が記録され
る。シーン検出部60は、無音部検出部30から出力さ
れる無音部情報、及びカット検出部40から出力される
カット情報とから、動画像をシーン単位に分割し、分割
位置とタイミング情報とを関連させたシーン情報を生成
し、出力する。シーン情報は動画像データ、音声データ
に関連づけられ、記録部80に記録される。
【0032】以下、本発明の処理の流れを説明する。無
音部検出部30に入力された音声データは、先に説明し
たように、無音部分、または音声レベルの低い部分を検
出する。
【0033】上記の無音部検出部30により検出された
無音部は、無音部情報として出力される。無音部情報
は、無音部分を音声データに含まれているタイミング情
報と関連させた情報である。例えば、無音部に相当する
タイミング情報のリストとして記述しても良いし、無音
部のはじめと終わりに対応する位置のタイミング情報だ
けをリストとして記述してもよい。また、全てのタイミ
ング情報にその時刻において音声が有音か無音かを示す
情報を付与しておいてもよい。
【0034】カット検出部40においては、動画像中の
カットを見つけるため、例えば、フレームごとに求めた
輝度のヒストグラムの差分を調べる方法が使われる。こ
の方法では、まずフレームの画素の輝度のヒストグラム
を作成する。そして、直前のフレームについて同様に求
められた輝度のヒストグラムとの差分を求める。このと
き、同じ輝度値に対応する二つのヒストグラムの成分の
絶対値差分をとり、この絶対値差分を全ての輝度値につ
いて加えたものを二つのフレームの輝度ヒストグラムの
差分とする。そしてあらかじめ定められたしきい値との
比較を行い、輝度ヒストグラムの差分がしきい値よりも
大きければ、二つのフレームの間にカットがあると判定
する。以上の処理を全ての連続したフレーム間で行え
ば、動画像のどこにカットがあったかを検出することが
できる。
【0035】処理の高速化のために、フレーム内の全て
の画素についてではなく、間引かれた画素についてのみ
ヒストグラムを作成する方法も用いられる。また、輝度
ヒストグラムの差分そのものではなく、輝度ヒストグラ
ムの差分の変化量を使うことにより、検出能力を向上さ
せた方法も用いられる。その他、(「映像カット自動検
出方式の検討」、テレビジョン学会技術報告、1992
年Vol.16,No.43,pp.7−12)などに
記述されているように、様々なカット検出の方法が知ら
れている。
【0036】動画像のカットが検出されると、カットの
生じた位置に対応するタイミング情報のリストであるカ
ット情報が作られ、カット検出部40から出力される。
カット検出情報は、全てのタイミング情報にカットの有
無を表す情報を付与したものであってもよい。
【0037】無音部検出部30からの出力である無音部
情報、及びカット検出部40からの出力であるカット情
報はシーン検出部60に入力される。同時に、無音部情
報、カット情報はそのまま記録部80に記憶させてもよ
い。シーン検出部60では、二つの情報から、カットの
生じており、なおかつ音声が無音である時刻を検出す
る。
【0038】図2は音声の無音部、動画像のカット、及
びシーン検出部60で検出されるシーンの切れ目の関係
を示したものである。100は音声の波形を簡略化して
表現したもので、平らな部分が無音部に対応している。
実際には、音声には周囲の雑音など目的以外の音が含ま
れているため、このようにきれいな無音部ができるわけ
ではないが、わかりやすく表現するため、無音部検出部
30で検出された無音部は平らな部分として表現する。
110は動画像をカットとカットで区切られるショット
単位で表示したものである。120がショットの切れ目
であるカットに対応している。
【0039】130は動画像をいくつかのショットの集
まりであるシーン単位に表示したものである。シーンの
切れ目は、カットがあり、なおかつ音声が無音部である
位置が選択されている。例えば時刻t1、t2、t4で
はカットはあるが音声が無音部でないため、シーンの切
れ目ではないと判定される。一方、時刻t0、t3では
カットがあり、音声も無音であるため、シーンの切れ目
であると判定される。
【0040】ドラマや映画においては、編集によって複
数のショットにまたがって同じバックグラウンドミュー
ジックが流れていることがよくある。従って、音楽がと
ぎれ、なおかつカットのあるところだけがシーンの切れ
目として検出される本実施例の動画像処理方法では、関
連のあるショットを自動的にまとめてシーンという単位
を作ることができる。また、時間的に連続してとられた
映像であるが、途中でカメラの切り替えのある動画像も
ある。この様な動画像に対しても、本実施例の動画像処
理方法では、音声が連続して流れてさえいれば、別のカ
メラに切り替えられた場合でも同一のシーンであると判
断される。
【0041】以上のようにして検出されたシーンの切れ
目は、シーン情報としてシーン検出部60から出力され
る。シーン情報は、シーンの切れ目、もしくはシーンの
始まりに対応したタイミング情報のリストとして記述さ
れる。または、全てのタイミング情報に、その時刻がシ
ーンの切れ目か否かの情報を付与した形態でもよい。シ
ーン情報は動画像データ、音声データとともに記録部8
0に記録される。
【0042】次に、シーン情報の利用方法について説明
する。本発明によりシーン情報の付与された動画像は、
光ディスク、磁気ディスク等のディスク状の記録媒体
や、半導体メモリに記録される。これらの記録装置は、
図7に示すように、動画像の再生装置にローカルに接続
されるか、もしくはネットワーク上の動画像サーバに接
続される。そして、ユーザはこれらローカルなもしくは
ネットワーク上に接続された記録媒体上の動画像データ
を再生し、ディスプレイに表示させる。このさいに、動
画像と関連づけて記録されているシーン情報にアクセス
することにより、以下のような検索を行うことができ
る。
【0043】動画像の所望の場面を探す場合には、まず
シーン情報に記述されているシーンの切れ目により作ら
れるシーンごとに一つの代表フレームを選んでおき、代
表フレームだけを表示させる。そして、所望の場面が含
まれるシーンを見つけ、選択する。一つのシーンが指
示、選択されると、指示されたシーンに含まれるショッ
トごとの代表フレームが一覧表示される。表示された代
表フレームの中から所望の場面に相当するものを選択、
再生させることにより、所望の場面の検索が終了する。
【0044】シーンごとの代表フレームの選び方は様々
なものが考えられ、いかようなものでも本実施例に適用
可能である。例えば、シーン情報に記述されているシー
ンのはじめのフレームを代表として選ぶ。もしくは、連
続した二つのシーンの切れ目、またはシーンの始まりの
中間のフレームを代表として選んでもよい。ショット単
位の代表フレームもカット情報から同様の方法で選ぶこ
とができる。
【0045】一方、はじめてみる動画像の全体の流れを
先に見ておき、興味を感じたところだけをみたいといっ
た場合にも、同様の操作を行えばよい。すなわち、シー
ン単位で選ばれた代表フレームを一覧表示させることに
より、動画像全体がどのような流れになっているかを把
握した後、興味を感じたシーン、またはそのシーンに含
まれるショットの一覧表示を行い、ショット単位で再生
開始位置を指定する。
【0046】シーン検出部60によるシーン情報がない
場合には、はじめにショットごとに選ばれた代表フレー
ムを表示させることになる。この様な場合には、表示さ
せなければならないフレームの数が多すぎて、何回にも
分けて表示させなければならなくなり、動画像の全体を
短時間で見渡すことができない。結果、検索の効率が落
ちることになるが、本発明を実施することにより、これ
を改善することができる。
【0047】(第二の実施例)次に、第二の実施例につ
いて説明する。図3は第二の実施例の一構成例を示すブ
ロック図である。まず、各ブロックの大まかな働きを説
明する。
【0048】図3の中で、ディジタル音声データ入力端
子10、ディジタル動画像データ入力端子20、無音部
検出部30、音声符号化部50、動画像符号化部70、
記録部80は第一の実施例で図1を用いて説明したもの
と同じ機能を持つものである。
【0049】動き検出部210は、入力された動画像の
動きの激しさを測定し、動画像データに含まれているタ
イミング情報と関連させて動き情報として出力する。選
択部220は無音部検出部30の出力である無音部情報
と、動き検出部210の出力である動き情報とから、動
画像の不要部分を検出し、不要部分が取り除かれた動画
像、音声データを音声符号化部50及び動画像符号化部
70に出力する。このとき、タイミング情報も新たに付
与し直されている。
【0050】次に、処理の方法を詳細に説明する。動き
検出部210はディジタル動画像データ入力端子20か
ら入力された動画像データから、動画像の動きがどれだ
け激しいかを数値化し、動き情報とする。動きの激しさ
の尺度としては、様々なものが用いられ得る。
【0051】例えば簡単な例として、連続する二つのフ
レームの輝度、または色の変化を評価する方法がある。
この方法では、まず連続する二つのフレームの、対応す
る位置の輝度もしくは色の差分の絶対値を全ての画素に
ついて求める。そして、全ての画素について求まった輝
度もしくは色の差分の絶対値を加えあわせ、連続したフ
レーム間の動きの大きさの値とする。このようにして求
めた評価値は、画像に全く動きがない場合には0の値を
とり、小さな物体が動くとき、もしくは大きな物体が少
しだけ動くときには正の値をとり、さらに多くの小さな
物体が動くときや大きな物体が大きく動くときなどに正
の大きな値をとる。従って、動画像の動きの激しさの尺
度として用いることができる。
【0052】動画像の動きの激しさを求める別の方法と
して、オプティカルフローを利用する方法がある。オプ
ティカルフローは動画像の局所的な動き速度ベクトルの
分布であり、各種の推定方法が提案されている。例え
ば、画像の色の勾配から推定する方法("Determining O
ptical Flow", Artificial Intelligence, 1981,pp.185
-203)が知られている。オプティカルフローは画像の動
きそのものを表現しているので、そのまま動きの激しさ
の尺度の推定に利用することができる。例えば、オプテ
ィカルフローの動きベクトルの個々の長さを計算し、フ
レーム中の動きベクトル全てについての和をとり、動き
の激しさの評価値とすることができる。計算時間を減ら
すためには、求める動き速度のベクトルの個数を減らせ
ば良い。
【0053】動きの激しさが数値化されると、動画像に
含まれるタイミング情報と関連づけられ、動き情報とし
て動き検出部210から出力される。もしくは、あらか
じめ定められたしきい値よりも大きな数値を示す場合に
動きあり、しきい値よりも小さな値を示す場合に動きな
しとして、タイミング情報に動き情報を付加したのを動
き情報として用いてもよい。さらに、動きのある時刻に
対応したタイミング情報のリストとして記述したり、動
きあり/なしの変化点のタイミング情報のリストとして
動き情報を記述しても良い。
【0054】選択部20では無音部検出部30から出力
される無音部情報と、動き検出部210から出力される
動き情報とから、動画像の必要な部分、不必要な部分を
判断する。図4は、動画像の必要部分、不必要な部分の
判定方法を説明したものである。
【0055】図4の中で、310は音声波形を簡略的に
表現したもので、平らな部分が無音部情報に無音部分と
して記述されている部分、それ以外の波の部分は音声の
ある部分を示している。また、320は動き情報であり
上方にあるほど大きな動きがあることを示している。3
30はあらかじめ定められたしきい値であり、しきい値
を越えるとその時刻の映像に動きがあると判定され、し
きい値よりも低い値の時は小さな動きが無視され、動き
がなかったものと見なされる。
【0056】選択部220では、無音部分で、なおかつ
動きのない部分の動画像を不必要な部分であると判定す
る。例えば、図4の場合には、T1、T3が不必要な部
分と判定され、T0,T2,T4が必要な部分であると
判定される。
【0057】必要な部分と不必要な部分の判定がなされ
ると、必要な部分もしくは不必要な部分に対応するタイ
ミング情報のリストである選択情報が生成され、記録部
80に記録される。
【0058】選択情報の付与された動画像を再生する際
には、選択情報を読みとり、必要な部分に相当する部分
だけの再生を行う。このように処理することにより、不
要な部分と判定された部分のデータは削除されずに記録
部に残っているので、後で必要になったときや、選択部
の判定を変更したい場合に利用することができる。
【0059】一方、動画像のうち、選択部220で不必
要と判定された部分は削除してもかまわない場合には、
選択情報は記録部80に記録する必要はない。動画像、
音声の必要な部分だけを音声符号化部50、動画像符号
化部70に送ることにより、不必要な部分を削除でき
る。この場合には、必要な部分の動画像、音声が連続し
て再生されるように、あらかじめ付与されていたタイミ
ング情報を変更し、新たに付与し直す必要がある。
【0060】図7のようにネットワーク上の動画像デー
タにアクセスする場合には、上記のような不要部分の削
除により転送するデータ量が削減されるため、ネットワ
ークへの付加が軽くなる。
【0061】(第三の実施例)次に、本発明の第三の実
施例を説明する。図5は本発明の第三の実施例の一構成
例を示すブロック図である。はじめにそれぞれのブロッ
クの役割を簡単に説明する。
【0062】図5において、ディジタル音声データ入力
端子10、ディジタル動画像データ入力端子20、音声
符号化部50、動画像符号化部70および記録部80は
第一の実施例での説明に用いたものと同様のものであ
る。また、動き検出部210は第二の実施例で説明に用
いた動き検出部と同様のものである。
【0063】表示方式判定部410は、無音部検出部3
0の出力である無音部情報と、動き検出部210の出力
である動き情報とから、動画像の一部または全体を動画
像のままにしておくか、静止画として保存しておくかを
後に説明する方法で判定する。
【0064】静止画符号化部420は、静止画データを
記録しておくのに適した形に変換する。例えば、コサイ
ン変換などの直行変換により画像信号を少ない低域係数
に集中させ、空間方向の情報を削減する画像圧縮符号化
などが用いられる。
【0065】次にメディア形式判定部410での処理を
より詳しく説明する。メディア形式判定部410は、動
画像の部分部分に対して、動画像のまま保存、再生すべ
きか、それとも動画像を静止画に変換して保存、表示す
べきかを判定する。そのために、無音部情報および動き
情報を参照し、動きの激しさがあらかじめ定められたし
きい値よりも小さく、なおかつ音声のレベルがあらかじ
め定められたしきい値よりも大きな部分があらかじめ定
められた時間以上続く部分を検出する。音声が含まれて
おり、動きが少ない画像は、音声情報が特に重要である
場合が多く、動画像は静止画に変換されても差し支えな
い。そこで、動きの激しさがあらかじめ定められたしき
い値よりも小さく、なおかつ音声のレベルがあらかじめ
定められたしきい値よりも大きな部分は、その部分の動
画像が切り離されて静止画に変換され、音声付きの静止
画として記録、再生されるようにする。
【0066】動画像を静止画に変換する方法としては、
もっとも単純なものとして、動画像の中の一つのフレー
ムだけを選択する方法がある。例えば、はじめのフレー
ムや真ん中のフレームなどが選ばれる。
【0067】このとき静止画には、変換された動画像部
分に対応する音声に付与されたタイミング情報が関連づ
けられて記録部80に記録される。もしくは、音声は静
止画に変換された部分が元の音声データから切り離さ
れ、独立に音声符号化部50により符号化され、動画像
が変換された静止画と関連づけられて記録部80に記録
される。
【0068】図6は以上の処理により、動画像が音声付
きの静止画に変換される部分を図示したものである。図
6において、510は音声レベルを簡略化して表したも
ので、図2や図4の表記方法と同じである。また、52
0は動きの激しさを表す評価値で、図4における320
と同じ意味を持つ。530はあらかじめ定められたしき
い値で、このしきい値を下回る部分では動画像の動きは
非常に少ない。T7に対応する部分は、音声が含まれて
おり、なおかつ動きがしきい値よりも少ない。従って区
間T7があらかじめ定められた長さよりも長いならば、
この部分はメディア形式判定部410により音声付きの
静止画に変換される。
【0069】メディア形式判定部410はまた、無音部
情報および動き情報を参照し、動きの激しさがあらかじ
め定められたしきい値よりも小さく、なおかつ音声のレ
ベルもあらかじめ定められたしきい値よりも小さな部分
があらかじめ定められた時間以上続く部分を検出する。
このような部分は、音声は不必要であることが多く、ま
た、映像形態も動画像ではなく静止画で十分であること
が多い。従って、このような部分は音声データをなく
し、動画像を静止画に変換した形で保存、表示させるよ
うにする。図6においては、区間T5がこのような処理
の対象になる。
【0070】動画像を静止画に変換する方法はすでに説
明した方法が適用できる。音声データは、削除された部
分の音声データは音声符号化部50には送られない。ま
たは、他の削除されない部分と連続したかたちで音声符
号化部50に送られて、符号化されるが、この場合に
は、音声を再生しない部分のタイミング情報を新たに付
与しておく。
【0071】以上のような処理により、動画像から静止
画の変換が行われた場合、動画像の一覧表示をすると、
動画像のままの形態である部分のショットごと、または
シーンごとの代表フレームの一覧に混じって、動画像か
ら変換された静止画も表示される。動画像のままの形態
である部分が選択されて再生要求がなされると、選択さ
れた部分の再生が行われる。一方、静止画に変換された
部分が選択されて再生が要求されると、音声が付随して
いる場合には静止画の表示とともに音声の再生が行わ
れ、音声が付随していない場合には単に静止画の表示が
行われる。図7は、本願発明を実施する際の具体的な一
形態を示したものである。
【0072】
【発明の効果】本発明の動画像処理方法では、利用者の
手を煩わすことなく、動画像を階層構造に分割すること
ができるため、この構造を用いることにより所望の場面
の検索が効率的になる。
【0073】また、本発明の動画像処理方法では、自動
的に動画像の不要な部分が削除されるため、利用者の手
を煩わせることなく内容の濃い動画像に編集することが
可能になる。
【0074】さらにまた、本発明の動画像処理方法で
は、静止画で十分であるにも関わらず、動画像として撮
影されている部分を自動的に検出し、静止画として扱う
ため、記憶容量が節約できる、データ転送時間が節約で
きる、間延びした表示が引き締まるなどの効果がある。
【図面の簡単な説明】
【図1】第一の実施例の一構成例を示すブロック図。
【図2】第一の実施例の処理例の説明図。
【図3】第二の実施例の一構成例を示すブロック図。
【図4】第二の実施例の処理例の説明図。
【図5】第三の実施例の一構成例を示すブロック図。
【図6】第三の実施例の処理例の説明図。
【図7】本発明のシステム構成の例を示した図。
【符号の説明】
10・・・ディジタル音声データ入力端子 20・・・ディジタル動画像データ入力端子 30・・・無音部検出部 40・・・カット検出部 50・・・音声符号化部 60・・・シーン検出部 70・・・動画像符号化部 80・・・記録部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】動画像データに対応付けられてなる音声デ
    ータの無音区間を検出し、 検出した前記音声データの無音区間に対応する前記動画
    像データの不連続点を検出し、 検出したこの不連続点によって区切られる前記動画像デ
    ータのフレームを表示させることを特徴とする動画像処
    理方法。
  2. 【請求項2】動画像データに対応付けられてなる音声デ
    ータの無音区間を検出し、 検出した前記音声データの無音区間に対応する前記動画
    像データの不連続点を検出し、 検出した前記動画像データの不連続点を、前記動画像デ
    ータおよび前記音声データと関連づけて記憶することを
    特徴とする動画像処理方法。
  3. 【請求項3】動画像データに対応付けられてなる音声デ
    ータの無音区間を検出し、 検出した前記音声データの無音区間に対応する前記動画
    像データの不連続点を検出し、 検出した前記動画像データの不連続点および前記音声デ
    ータの無音部分をもとに、前記動画像データおよび音声
    データの再生方法を決定することを特徴とする動画像処
    理方法。
  4. 【請求項4】動画像データに対応付けられてなる音声デ
    ータの無音区間を検出し、 検出した前記音声データの無音区間に対応する前記動画
    像データの不連続点を検出し、 検出した前記不連続点のフレームの動きの変化があらか
    じめ定められた第一のしきい値よりも小さい区間で、あ
    らかじめ定められた第二のしきい値よりも長く、前記区
    間の音声が無音であるときに、前記区間の動画像データ
    のうちの一つのフレームを静止画として表示し、 静止画として表示した前記区間の動画像データに対応付
    けられてなる音声を再生しないことを特徴とする動画像
    処理方法。
  5. 【請求項5】動画像データに対応付けられてなる音声デ
    ータの無音区間を検出し、 検出した前記音声データの無音区間に対応する前記動画
    像データの不連続点を検出し、 検出した前記不連続点のフレームの動きの変化があらか
    じめ定められた第一のしきい値よりも小さい区間で、あ
    らかじめ定められた第二のしきい値よりも長く、前記区
    間の音声が無音であるときに、前記区間の動画像データ
    および音声データを再生しないことを特徴とする動画像
    処理方法。
JP02074496A 1996-02-07 1996-02-07 動画像処理方法 Expired - Fee Related JP3340905B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02074496A JP3340905B2 (ja) 1996-02-07 1996-02-07 動画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02074496A JP3340905B2 (ja) 1996-02-07 1996-02-07 動画像処理方法

Publications (2)

Publication Number Publication Date
JPH09214879A true JPH09214879A (ja) 1997-08-15
JP3340905B2 JP3340905B2 (ja) 2002-11-05

Family

ID=12035710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02074496A Expired - Fee Related JP3340905B2 (ja) 1996-02-07 1996-02-07 動画像処理方法

Country Status (1)

Country Link
JP (1) JP3340905B2 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09238298A (ja) * 1996-03-01 1997-09-09 Nippon Telegr & Teleph Corp <Ntt> 映像目次生成方法および装置
JP2000069420A (ja) * 1998-08-26 2000-03-03 Sharp Corp 映像処理装置
JP2000181924A (ja) * 1998-12-14 2000-06-30 Nec Corp Webページ上の動画を構成する静止画像を出力するWWWブラウザ及びそのプログラムを記録した記録媒体
JP2000187477A (ja) * 1998-12-24 2000-07-04 Casio Comput Co Ltd 画像処理装置及び画像処理方法
US6339804B1 (en) 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
JP2003087728A (ja) * 2001-06-26 2003-03-20 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
JP2006094183A (ja) * 2004-09-24 2006-04-06 Matsushita Electric Ind Co Ltd 信号処理装置、及び信号処理方法
KR100764521B1 (ko) * 1999-01-26 2007-10-09 소니 가부시끼 가이샤 영상 정보의 송신 방법 및 수신 방법, 송신 장치 및 수신 장치 및 송수신 방법 및 송수신 시스템 및 정보 기록 매체
US7286749B2 (en) 2002-04-16 2007-10-23 Canon Kabushiki Kaisha Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
JP2008263657A (ja) * 2008-07-22 2008-10-30 Casio Comput Co Ltd 画像処理装置、サムネイル動画作成方法及びサムネイル動画作成プログラム
US7450823B2 (en) 2004-04-28 2008-11-11 Funai Electric Co., Ltd. Hard disk recorder and video record apparatus
JP2010093614A (ja) * 2008-10-09 2010-04-22 Mitsubishi Electric Corp 映像信号再生装置
US7801420B2 (en) 2005-05-17 2010-09-21 Kabushiki Kaisha Toshiba Video image recording and reproducing apparatus and video image recording and reproducing method
WO2013042766A1 (ja) * 2011-09-22 2013-03-28 オリンパス株式会社 画像処理装置、画像処理システム、及び画像読出し装置
JP2013070264A (ja) * 2011-09-22 2013-04-18 Olympus Corp 画像処理装置及び画像処理システム
JP2013070265A (ja) * 2011-09-22 2013-04-18 Olympus Corp 画像読出し装置及び画像処理システム
JP2013143661A (ja) * 2012-01-10 2013-07-22 Olympus Corp 画像処理装置
CN109218685A (zh) * 2018-11-20 2019-01-15 广东电网有限责任公司 一种视频信号输出方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012142645A (ja) * 2009-04-28 2012-07-26 Mitsubishi Electric Corp 映像音声再生装置、映像音声記録再生装置、映像音声編集装置、映像音声再生方法、映像音声記録再生方法、および映像音声編集方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0380782A (ja) * 1989-08-24 1991-04-05 Nippon Telegr & Teleph Corp <Ntt> シーン抽出処理方法
JPH03184484A (ja) * 1989-12-13 1991-08-12 Toshiba Corp コマーシャル検出装置
JPH0630367A (ja) * 1992-07-08 1994-02-04 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法および装置
JPH08317342A (ja) * 1995-05-16 1996-11-29 Hitachi Ltd 映像記録再生装置
JPH08339379A (ja) * 1995-06-12 1996-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像解析方法および装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0380782A (ja) * 1989-08-24 1991-04-05 Nippon Telegr & Teleph Corp <Ntt> シーン抽出処理方法
JPH03184484A (ja) * 1989-12-13 1991-08-12 Toshiba Corp コマーシャル検出装置
JPH0630367A (ja) * 1992-07-08 1994-02-04 Nippon Telegr & Teleph Corp <Ntt> 映像検索方法および装置
JPH08317342A (ja) * 1995-05-16 1996-11-29 Hitachi Ltd 映像記録再生装置
JPH08339379A (ja) * 1995-06-12 1996-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像解析方法および装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09238298A (ja) * 1996-03-01 1997-09-09 Nippon Telegr & Teleph Corp <Ntt> 映像目次生成方法および装置
US6339804B1 (en) 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
JP2000069420A (ja) * 1998-08-26 2000-03-03 Sharp Corp 映像処理装置
JP2000181924A (ja) * 1998-12-14 2000-06-30 Nec Corp Webページ上の動画を構成する静止画像を出力するWWWブラウザ及びそのプログラムを記録した記録媒体
JP2000187477A (ja) * 1998-12-24 2000-07-04 Casio Comput Co Ltd 画像処理装置及び画像処理方法
KR100764521B1 (ko) * 1999-01-26 2007-10-09 소니 가부시끼 가이샤 영상 정보의 송신 방법 및 수신 방법, 송신 장치 및 수신 장치 및 송수신 방법 및 송수신 시스템 및 정보 기록 매체
JP2003087728A (ja) * 2001-06-26 2003-03-20 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
JP4546682B2 (ja) * 2001-06-26 2010-09-15 パイオニア株式会社 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
US7286749B2 (en) 2002-04-16 2007-10-23 Canon Kabushiki Kaisha Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US7450821B2 (en) 2002-04-16 2008-11-11 Canon Kabushiki Kaisha Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US7450823B2 (en) 2004-04-28 2008-11-11 Funai Electric Co., Ltd. Hard disk recorder and video record apparatus
JP2006094183A (ja) * 2004-09-24 2006-04-06 Matsushita Electric Ind Co Ltd 信号処理装置、及び信号処理方法
US7801420B2 (en) 2005-05-17 2010-09-21 Kabushiki Kaisha Toshiba Video image recording and reproducing apparatus and video image recording and reproducing method
JP2008263657A (ja) * 2008-07-22 2008-10-30 Casio Comput Co Ltd 画像処理装置、サムネイル動画作成方法及びサムネイル動画作成プログラム
JP2010093614A (ja) * 2008-10-09 2010-04-22 Mitsubishi Electric Corp 映像信号再生装置
WO2013042766A1 (ja) * 2011-09-22 2013-03-28 オリンパス株式会社 画像処理装置、画像処理システム、及び画像読出し装置
JP2013070264A (ja) * 2011-09-22 2013-04-18 Olympus Corp 画像処理装置及び画像処理システム
JP2013070265A (ja) * 2011-09-22 2013-04-18 Olympus Corp 画像読出し装置及び画像処理システム
US9300904B2 (en) 2011-09-22 2016-03-29 Olympus Corporation Image processing apparatus, image processing system, and image reading apparatus
JP2013143661A (ja) * 2012-01-10 2013-07-22 Olympus Corp 画像処理装置
CN109218685A (zh) * 2018-11-20 2019-01-15 广东电网有限责任公司 一种视频信号输出方法及装置
CN109218685B (zh) * 2018-11-20 2021-05-04 广东电网有限责任公司 一种视频信号输出方法及装置

Also Published As

Publication number Publication date
JP3340905B2 (ja) 2002-11-05

Similar Documents

Publication Publication Date Title
JP3340905B2 (ja) 動画像処理方法
US20030016604A1 (en) System and method for detecting the border of recorded video data
US7486832B2 (en) Method and device for condensed image recording and reproduction
EP1143714A1 (en) Method for editing video information and editing device
US20070201817A1 (en) Method and system for playing back videos at speeds adapted to content
KR100846770B1 (ko) 동영상 부호화 방법 및 이에 적합한 장치
MX2007005739A (es) Aparato y metodo para almacenar datos de video.
JP2009124298A (ja) 符号化映像再生装置及び符号化映像再生方法
JPH11289517A (ja) 再生装置及び再生方法
JP2005086734A (ja) 画像記録装置
JP2002281433A (ja) 動画像検索閲覧編集装置および記録媒体
JP4913288B2 (ja) 情報信号処理装置及び情報信号処理方法
JP3629764B2 (ja) 映像信号記録装置、記録方法、編集方法及びそのシステム
US7471871B2 (en) Index validation system and method
JP2000287165A (ja) 画像情報記述方法、映像検索方法、映像再生方法、映像検索装置、及び映像再生装置
JP3590275B2 (ja) 記録再生装置、記録再生方法、及び記録再生プログラムを記録した記録媒体
US7089496B2 (en) System and method for scene detection information storage
KR100478017B1 (ko) 다채널 영상데이타 처리장치 및 방법
JP3780910B2 (ja) 光ディスク録画装置
JPH06153146A (ja) 動画像のシーンチェンジ検出装置および編集装置
JPH1132294A (ja) 情報検索装置および方法、並びに伝送媒体
KR20010051174A (ko) 데이터 기록장치와 매체 및 정보 패키지
JP5560999B2 (ja) 映像音声記録再生装置、および映像音声記録再生方法
JP2006293513A (ja) 先行シーンの存在を利用した特定シーンの映像の抽出方法及び装置
JP2000175133A (ja) 情報記録再生装置および方法、並びに提供媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070816

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090816

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090816

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100816

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100816

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110816

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110816

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120816

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120816

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130816

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees