JP2005277733A - 動画像処理装置 - Google Patents

動画像処理装置 Download PDF

Info

Publication number
JP2005277733A
JP2005277733A JP2004087408A JP2004087408A JP2005277733A JP 2005277733 A JP2005277733 A JP 2005277733A JP 2004087408 A JP2004087408 A JP 2004087408A JP 2004087408 A JP2004087408 A JP 2004087408A JP 2005277733 A JP2005277733 A JP 2005277733A
Authority
JP
Japan
Prior art keywords
image data
moving image
frame image
frame
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004087408A
Other languages
English (en)
Inventor
Tatsuya Hosoda
達矢 細田
Junichiro Shinozaki
順一郎 篠▲崎▼
Fumiaki Mukoyama
文昭 向山
Masashi Aiiso
政司 相磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2004087408A priority Critical patent/JP2005277733A/ja
Priority to US11/081,135 priority patent/US7616868B2/en
Publication of JP2005277733A publication Critical patent/JP2005277733A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/326Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is a video-frame or a video-field (P.I.P.)

Abstract

【課題】 ユーザが簡便に要約動画像を作成することを支援する動画像処理装置を提供する。
【解決手段】 動画像処理装置は、インタフェース画面250に動画像を再生表示し、ダイジェストボタン203から、ユーザが要約動画像に使用を希望するフレーム画像データの指定を受ける。但し、動画像処理装置は、ユーザがフレーム画像データを指定する際の目安標識となる最高標識209,分割標識210をフレーム画像データの評価値に基づいて表示している。
【選択図】 図6

Description

本発明は、動画像データから、その内容を要約した要約動画像データを生成する動画像処理装置に関する。
近年、ビデオカメラの普及に伴い、ビデオカメラを用いた撮影が一般的になりつつある。それと同時に、長時間多岐にわたって撮影された動画像データの内容を、短時間で簡単に把握したいという要望も高まっている。そこで、動画像データの要約情報としての要約動画像データ、いわゆるダイジェスト画像を生成する技術が提案されている。
例えば特許文献1では、自動的に要約動画像データを生成する技術が提案されている。特許文献1では、動画像データを複数のシーンに分割し、シーン毎に所定の評価値を求め、評価値の高いほうから、所定数のシーンを用いて要約動画像データを生成している。
一方では、ユーザ自身の手で要約動画像データを作成したいという要望もある。そこで、ユーザが実際に動画像を見ながら要約動画像を生成することを支援するアプリケーションが存在する。アプリケーションには、動画像を再生する機能や早送りする機能などがついており、ユーザは動画像を再生したり早送りしたりしながら、要約動画像に使用したい箇所を指定して、要約動画像データを生成する。
特開2002−142189号公報
自動的に生成された要約動画像は必ずしもユーザの希望を反映したものとならないことから、上記したようなアプリケーションは一応有効ではある。しかし、動画像を一様に再生したり、早送りしたりしながら、要約動画像データに使用したいシーンを探すのは手間がかかるという問題があった。
本発明は、上記した問題点を解決するためになされたものであり、ユーザが簡便に要約動画像を作成することを支援する動画像処理装置を提供することを目的とする。
上記課題の少なくとも一部を解決する動画像処理装置は、時系列的に連続する複数のフレーム画像データによって構成された動画像データから、その内容を要約した要約動画像データを生成する動画像処理装置であって、
前記動画像データを取得する取得部と、
前記フレーム画像データの各々に関して、前記動画像データにおける重要度を表わす所定の評価値を算出する算出部と、
前記要約動画像データへの使用を希望する前記フレーム画像データである使用希望フレーム画像データを指定するためのインタフェース画面を提供するインタフェース提供部と、
ユーザによる前記使用希望フレーム画像データの指定を支援するために前記インタフェース画面上に提示される目安標識の表示形式を制御するための目安情報を、前記評価値に基づいて設定する目安設定部と、
前記使用希望フレーム画像データを特定する指定情報を入力する指定入力部と、
前記使用希望フレーム画像データを含んだ前記フレーム画像データの集合である指定フレームデータの少なくとも一部を用いて前記要約動画像データを生成する生成部と
を備え、
前記インタフェース画面は、
前記動画像データに基づく動画像を再生する再生表示エリアと、
前記動画像の再生箇所をグラフィック表示する再生箇所表示エリアと、
前記目安情報に基づいて前記目安標識を表示する目安表示エリアと
を備えることを特徴とする。
本発明によれば、ユーザは表示された目安標識を参考にして、簡便に使用希望フレーム画像データを選び出すことができる。目安情報は、例えば、目安標識の表示位置に関する情報、目安標識について文字、記号の種別や、表示形状、表示色に関する情報を含めることができる。指定情報は、ユーザが使用希望フレーム画像データを指定することにより入力される。
再生箇所を示すグラフィック表示は、例えばスライドバーで再生箇所を示す時間軸であっても良いし、長針や短針で再生箇所を示すアナログ時計のような表示であっても良い。このように、グラフィック表示は、動画像データの全再生時間のうち、現在再生している箇所の時間的な位置づけが視覚的に認識できる形式が好ましい。
目安表示エリアは任意の箇所に設けることができる。例えば、目安表示エリアを再生箇所表示エリアと重ね、目安標識をグラフィック表示上に、例えば、△や○などの記号や文字や所定の色で表示してもよい。こうすることで、ユーザは、目安標識と再生箇所の関係を視覚的に容易に把握することが可能となり、要約動画像に使用するフレーム画像データをより容易に選択することが可能となる。
目安標識は、例えば△や○などの記号や文字を用いて表示してもよいし、再生箇所のグラフィック表示の色を変更することで表示するようにしてもよい。目安標識は、評価値を文字で示すものであっても良い。その場合、目安情報は、表示する値及び目安標識の表示位置であるものとしても良い。
目安標識の表示位置は、評価値が動画像データ中最も高いフレーム画像データに相当する箇所など、評価値に基づいて設定してもよいし、所定のフレーム画像データ数おきというように設定してもよい。また、動画像データが複数のフレーム画像データを含むシーンに分割されている時は、シーンの切れ目に目安標識を表示するものとしても良い。
算出部は、評価値を、例えばビデオカメラのズーム操作やパン操作に基づいて算出しても良い。ズーム操作とは、ズームレンズを用いて被写体の像を拡大したり縮小したりすることである。パン操作とは、カメラの位置を固定したまま、カメラの向きを変えて広い範囲を撮影することである。
上記したインタフェース画面は、「動体の位置」「動体の大きさ」などの評価値の算出基準を、ユーザに選択させる評価基準選択エリアを備えるものとしても良い。評価値が最も高いフレーム画像データに相当する位置に目安標識を表示する場合などに有効である。この場合、ユーザは、評価値の算出基準を選択することにより、好みに応じた評価基準で目安標識を表示させることができる。
また、前記目安標識は前記評価値を視覚的に表したグラフ、記号および文字のいずれかであるものとしても良い。
評価値は、例えば、フレーム画像データ毎の評価値を示す折れ線グラフや棒グラフなどのグラフで表しても良いし、濃淡や色相の変化で表しても良い。目安標識は評価値を文字で示すものであっても良い。ユーザは、これらの表示を参照することにより、より評価値が分かりやすく、使用希望フレーム画像データを指定することがより容易になる。
上記した前記指定フレームデータは、前記使用希望フレーム画像データを含む、時系列的に連続した所定数以上の前記フレーム画像データの集合であるフレーム群で構成されるものとしても良い。
これによれば、ユーザが使用希望フレーム画像データを指定することで、要約動画像を見た者がその内容を把握できる程度の長さを確保したフレーム群を容易に指定することができる。
フレーム群の抽出は、種々の方法で行うことができる。例えば、使用希望フレーム画像データ及びその前後所定数のフレーム画像データをまとめてフレーム群としても良い。また、使用希望フレーム画像データの前後のフレーム画像データを評価値に基づいて所定数抽出しても良い。
使用希望フレーム画像データ1つに対して1つのフレーム群を抽出しても良いし、複数の使用希望フレーム画像データに対して1つのフレーム群を抽出しても良い。使用希望フレーム画像データが複数存在する場合、生成部は複数のフレーム群をつなぎあわせて要約動画像データを生成するものとしても良い。更に、生成部は、複数のフレーム群の再生順序をユーザに選択させる機能を備え、ユーザが選択した再生順序に従って要約動画像データを生成するものとしても良い。
また、前記指定情報は、前記フレーム群の最初と最後のフレーム画像データを指定するものとしても良い。
このようにすれば、フレーム群のフレーム画像データ数はユーザの意図を反映したものとすることができる。
上記した動画像処理装置の前記インタフェース提供部は、ユーザから再生開始箇所として指定されたフレーム画像データから前記動画像の再生を開始するものであっても良い。
本発明によれば、任意の箇所からの再生が容易になる。再生開始箇所を指定するためのインタフェースとしては、例えば、動画の再生箇所を示す時間軸上のスライドバーをユーザが移動させるようにとしても良い。また、ユーザが動画像の早送り量や巻き戻し量を時間やフレーム画像数などで指定するようにしても良い。
更に、前記再生開始箇所の指定は、前記目安情報と関連付けられたフレーム画像データ、および前記指定フレームデータから選択するものであっても良い。
こうすることで、上述のフレーム画像データにスキップして再生を行なうことができる。上記選択のためのインタフェースをボタンとし、押下される度に、上記フレーム画像を時系列的に順次選択するようにしても良い。
また、前記インタフェース提供部は、前記指定入力部に隣接して、前記再生開始箇所を指定するためのインタフェースを提供するものであっても良い。
ユーザは、要約動画像の作成にあたり、指定情報入力と、動画像の早送り等に相当する再生開始箇所の指定入力を連続して実行することが多い。よって、本発明によれば、要約動画像の生成時の操作性を向上させることができる。
上記した動画像処理装置の前記再生表示エリアは、前記指定情報の入力に呼応して、前記目安情報と関連付けられたフレーム画像データにスキップして前記動画像の再生を開始するものとしても良い。
これによれば、指定情報を入力すれば、自動的に目安情報と関連付けられたフレーム画像データにスキップして再生が行われるので、ユーザは、動画像を早送りしたり巻き戻ししたりする手間を省くことができる。
上記した動画像処理装置は、
前記指定情報を修正するための修正情報を入力する修正入力部と、
前記修正情報に基づき、前記指定フレームデータを修正する修正部と
を備えるものとしても良い。
これによれば、ユーザが一旦指定した使用希望フレーム画像データを変更することができる。修正情報は、任意の使用希望フレーム画像データを指定から外す、つまり任意の指定情報を削除するという情報であっても良い。その場合、修正部は、該指定情報に対応する指定フレームデータを削除するものとしても良い。
上記した動画像処理装置は、
前記再生箇所表示エリアは、前記指定フレームデータに対応する再生箇所を、他のフレーム画像データと区別可能に表示する指定箇所表示を有するものとしても良い。
このようにすれば、ユーザは、要約動画像に使用されるフレーム画像データの再生箇所を視覚的に把握することができる。
更に、前記指定箇所表示の位置の変更を入力する位置入力部と、
前記変更に基づき、前記指定フレームデータを修正する修正部と
を備えるものとしても良い。
これにより、ユーザは、視覚的に確認しながら指定フレームデータを修正することができる。
上記した動画像処理装置は、
前記要約動画像データの再生時間の希望値である希望再生時間を取得する希望再生時間取得部と、
前記希望再生時間に基づいて、前記指定フレームデータの数を調整する調整部と
を備えるものとしても良い。
本発明によれば、希望再生時間に応じた要約動画像データを生成することができる。
本発明は、動画像処理装置としての構成の他、動画像処理方法の発明として構成することもできる。また、これらを実現するコンピュータプログラム、およびそのプログラムを記録した記録媒体、そのプログラムを含み搬送波内に具現化されたデータ信号など種々の態様で実現することが可能である。なお、それぞれの態様において、先に示した種々の付加的要素を適用することが可能である。
本発明をコンピュータプログラムまたはそのプログラムを記録した記録媒体等として構成する場合には、動画像処理装置の動作を制御するプログラム全体として構成するものとしてもよいし、本発明の機能を果たす部分のみを構成するものとしてもよい。また、記録媒体としては、フレキシブルディスクやCD−ROM、DVD−ROM、光磁気ディスク、ICカード、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置などコンピュータが読み取り可能な種々の媒体を利用できる。
以下、本発明の実施の形態について、以下の項目に分けて説明する。
A.実施例:
A1.インタフェース画面の構成:
A2.動画像処理装置の構成:
A3.評価値の算出:
A4.目安標識及び各ボタンの機能:
A5.処理:
A6.効果:
B.変形例:
A.実施例:
A1.インタフェース画面の構成:
図1は、実施例としての動画像処理装置のインタフェース画面を示す説明図である。動画像処理装置は、複数のフレーム画像データで構成された動画像データから、その要約情報である要約動画像データを、ユーザの指定に基づいて生成するための装置である。図1のインタフェース画面は、ユーザの指定を入力するために動画像処理装置により映し出される画面である。
なお、本実施例においては、フレーム画像データが表わす画像をフレーム画像と呼ぶ。このフレーム画像は、ノンインターレース方式で表示可能な静止画像を意味している。また、動画像処理装置は、要約動画像の再生時間もユーザの希望にあうよう要約動画像を生成する。
インタフェース画面250aの再生ボタン201は、マウスなどで選択されると、動画像を再生してビューウィンドウ200に表示させる機能を持つボタンである。停止ボタン202は、選択されると、再生中の動画像を停止させる機能を持つボタンである。
ダイジェストボタン203は、ビューウィンドウ200に表示されているフレーム画像を、ユーザが要約動画像データに使用することを望む使用希望フレーム画像であるものと決定するボタンである。スキップボタン204は、選択された際の再生箇所から、動画像における所定の箇所までスキップして、そこから再度動画像を再生してビューウィンドウ200に表示させる機能を持つボタンである。
クリアボタン205は、選択されると、ダイジェストボタン203でなされた使用希望フレーム画像の決定を取り消す機能を持つボタンである。確定ボタン206は、使用希望フレーム画像を確定し、使用希望フレーム画像データに基づいた要約動画像データの生成処理を動画像処理装置に開始させる機能をもつボタンである。
確定ボタン206の機能は停止ボタン202に持たせ、確定ボタン206を省略しても構わない。また、ダイジェストボタン203,スキップボタン204,クリアボタン205の機能について詳しくは後述する。本実施例では、ユーザがダイジェストボタン203で使用希望フレーム画像を指定する際の目安標識を表示する。目安標識についても詳しくは後述する。
再生スライドバー208は、再生スライダ207と共に、ユーザに動画像の再生箇所を視覚的に示すためのバーであり、再生スライドバー208の全長は、動画像の再生時間に対応する。再生スライドバー208には、要約動画像の生成に用いられるフレーム画像データ(以下、指定フレームデータと呼ぶ)に対応する再生箇所(以下、指定箇所と呼ぶ)が赤色で表示される。但し、再生スライドバー208の基本色は白である。詳しくは後述する。
再生スライダ207は、動画像の再生箇所に応じて左端から右方向に再生スライドバー上を移動する。例えば、動画像が再生開始されてから、数分経過した際、ビューウィンドウ200内では、船が矢印pbの方向へ移動している。その際、再生スライダ207は、動画像の再生開始位置から矢印pa方向に、再生スライダ207aの位置まで移動する。ユーザは、再生スライダ207の位置を、マウスなどにより、移動することにより、動画像の再生開始箇所を指定することができる。
これらの他に、インタフェース画面には、ビデオデッキ等に備えられている早送りボタンや巻き戻しボタンやコマ送りボタンや一時停止ボタンに相当する機能を持つボタンを設けても良い。
A2.動画像処理装置の構成:
図2は、実施例としての動画像処理装置の概略構成を示す説明図である。左上に動画像処理装置100を、右及び左下に動画像処理装置100の機能ブロックを示した。
動画像処理装置100は、汎用のパーソナルコンピュータであり、情報を出力する装置としてのディスプレイ150を備えている。動画像処理装置100は、ディスプレイ150にインタフェース画面250を表示する。動画像処理装置100は、ユーザからの情報を入力する装置としてのキーボード120およびマウス130も備えている。動画像処理装置100は、上述した各種ボタンの選択情報などもキーボード120およびマウス130から入力する。
また、動画像処理装置100に動画像データを入力する装置としてデジタルビデオカメラ30およびCD−R/RWドライブ140を備えている。なお、動画像データを入力する装置としては、CD−R/RWドライブの他DVDドライブ等の種々の情報記憶媒体からデータを読み出すことが可能な駆動装置を備えることも可能である。
動画像処理装置100は、所定のオペレーティングシステムの下で動くアプリケーションプログラムにより、図2の機能ブロックとして図示した、要約動画像生成制御部102、データ取得部104、シーン分割部106、動き検出部107、評価値算出部108、目安設定部109、インタフェース提供部110、指定箇所設定部114、指定箇所修正部117、抽出部118、要約動画像生成部119という機能を実現する。これらの機能はハードウェア的に備えていても良い。
以下、各機能について説明する。データ取得部104は、CD−R/RWドライブ140内のCD−RWやデジタルビデオカメラ30、あるいはハードディスク(図示せず)などから動画像データを読み込み、RAM上に動画像データベース101を構築する。また、データ取得部104は、キーボード120やマウス130を用いてユーザが入力した要約動画像の希望再生時間も取得し、メモリに記憶させる。
シーン分割部106は、動画像のシーンの変わり目を検出し、動画像データをシーンに分割する。動き検出部107は、フレーム画像データ間の比較により動きベクトルを求めたり、動きベクトルに基づき動体ブロックを検出したりする。
評価値算出部108は、動きベクトルや動体ブロックなどに基づき、フレーム画像データの後述する評価値を算出する。評価値は、フレーム画像データの動画像データにおける重要度を示す値である。目安設定部109は、フレーム画像データの評価値に基づいて、インタフェース画面250に目安標識を表示させる位置としての目安標識の位置を設定する。インタフェース提供部110は、インタフェース画面250をディスプレイ150に表示すると共に、インタフェース画面250の各ボタン等における上述した各種機能を実現させる。また、目安設定部109が設定した目安標識の位置に基づいて、目安標識を表示する。
指定箇所設定部114は、先述したダイジェストボタン203の選択に基づいてインタフェース提供部110から出される指定箇所設定指示に従い、指定箇所データベース(DB)120を更新することにより指定箇所を設定する。本実施例では、1シーン内での指定箇所は1つであるものとする。指定箇所修正部117は、先述したクリアボタン205の選択などに基づいてインタフェース提供部110から出される指定箇所修正指示に従い、指定箇所DB120を修正することにより指定箇所を修正する。
抽出部118は、確定ボタン206の選択に基づいてインタフェース提供部110から出される抽出指示に従い、希望再生時間に基づいて指定箇所を修正し、修正した指定箇所に相当するフレーム画像データを抽出する。要約動画像生成部119は、抽出されたフレーム画像データをつなぎあわせて要約動画像データを生成し、CD−R/RWドライブ140内のCD−RWやデジタルビデオカメラ30、あるいはハードディスクに出力する。要約動画像生成制御部102は、以上の各部の要約動画像生成動作を全体的に制御する。
この他にも、要約動画像データにより要約動画像をディスプレイ150に表示させる表示部を備えていても良い。
A3.評価値の算出:
ここでは、フレーム画像データの評価値の算出について説明する。評価値算出部108は、ズーム,パン,静止,動体位置,動体大きさ,肌色大きさという項目について、それぞれフレーム画像データを評価し、評価値を算出する。
図3は、フレーム画像データの評価値について説明するための説明図である。図3(a)は、動画像の5枚のフレーム画像を抜き出して例示した図である。フレーム画像は、左側から時系列的に図示されている。図3(a)で示されたフレーム画像は連続しておらず、左側からn枚目(n=1〜4)のフレーム画像とn+1枚目のフレーム画像の間には、動画像において数枚のフレーム画像が存在するが、ここでは図示を省略した。図3(b)〜(g)は、各項目について、フレーム画像データの評価値の時刻変化を示すグラフである。グラフの時刻は、動画像を再生した場合の、再生開始からの経過時間に対応している。グラフは、動画像を再生した場合に、各経過時間において表示されるフレーム画像データの評価値を線で結ぶことにより示した。また、図3(a)の各フレーム画像データの評価値が、そのフレーム画像の中央の下の位置付近に表われるようグラフを示した。
図3(b)は、評価値「ズーム」のグラフである。「ズーム」はズーム操作に関する評価値である。ズーム操作とは、被写体を拡大,縮小するカメラ操作である。評価値算出部108は、ズーム操作関数,ズーム終了関数という2種類の関数を用いて、評価値「ズーム」を算出する。ズーム操作関数は、ズーム操作が開始されてからの経過時間が大きいほど大きな「ズーム」を出力する、傾きが正の一次関数である。ズーム終了関数は、ズーム操作が開始されてからの経過時間が大きいほど小さな「ズーム」を出力する、傾きが負の一次関数である。
評価値算出部108は、ズーム操作が開始された時からズーム操作が終了して30フレーム経過するまでズーム操作関数を使用し、ズーム操作が終了して30フレーム経過した時からズーム終了関数を使用する。ズーム終了関数は傾きのみが予め決められている。切片は、ズーム操作関数により求められた最後の「ズーム」に、ズーム終了関数で求められる最初の「ズーム」が一致するよう評価値算出部108が求める。評価値算出部108は、0以下の値が出力されるまでズーム終了関数を使用する。「ズーム」が0以下の値となった場合は、値0に修正する。評価値算出部108は、ズーム操作が開始されてから0以下の「ズーム」が出力されるまでの時間に当てはまらないフレーム画像データの「ズーム」は値0とする。
ズーム操作中及びその直後のフレーム画像は撮影者が特に撮影しようとしたフレーム画像であると考え、ズーム関数を以上のように設定した。ズーム操作が開始された時やズーム操作が終了した時の検出方法については後述する。
ズーム操作において、被写体の像を拡大する操作をズームインと言い、被写体の像を縮小する操作をズームアウトと言う。ズームイン,ズームアウト両方にズーム操作関数,ズーム終了関数は使用される。図3(a)のフレーム画像では、左側から一枚目のフレーム画像からズームインが開始され、左側から二枚目のフレーム画像においてズームインが終了している。したがって、図3(b)の評価値「ズーム」は、グラフで示すように変動する。
図3(c)は、評価値「パン」のグラフである。「パン」はパン操作に関する評価値である。パン操作とは、カメラの位置を固定したままカメラの向きを変えて広い範囲を撮影する操作である。評価値算出部108は、2つのパン関数という関数により評価値「パン」を算出する。2つのパン関数は、パン操作が開始,終了されたフレーム画像データを検出して使用する、先述した2つのズーム関数と同じ構造の関数である。更に、2つのパン関数を使用する時間の条件も2つのズーム関数と同じである。評価値算出部108は、パン関数を使用する時間以外の「パン」は値0と算出する。パン操作中及びその直後のフレーム画像は撮影者が特に撮影しようとしたフレーム画像であると考え、パン関数を以上のように設定した。パン操作開始やパン操作終了の検出方法については後述する。図3(a)のフレーム画像では、パン操作は行なわれていないので、図3(c)の評価値は、グラフで示すように値0のままである。
図3(d)は、評価値「静止」のグラフである。「静止」は背景の動きに関する評価値である。評価値算出部108は、静止関数という関数により評価値「静止」を算出する。静止関数は、背景の動きの大きさ(以下、動きの大きさを単に速さと呼ぶ)が入力されると「静止」を出力する関数である。静止関数は、速さが0に近いほど大きな値を出力する。また、速さが所定値以上になると値0を出力する。背景が静止している場面のフレーム画像は撮影者が特に撮影しようとしたフレーム画像であると考え、静止関数を以上のように設定した。背景の速さの算出方法については、後述する。図3(a)のフレーム画像は、左側から二枚目のフレーム画像に至るまでに背景の動きが次第に小さくなり、二枚目のフレーム画像から背景が静止している。したがって、図3(d)の評価値は、グラフで示すように変動する。
図3(e)は、評価値「動体位置」のグラフである。「動体位置」は動体(被写体)の位置に関する評価値である。なお、以下でいう動体は、フレーム画像内で最も大きい動体のことをさしているものとする。評価値算出部108は、動体位置関数という関数により評価値「動体位置」を算出する。動体位置関数は、動体のフレーム画像内における位置が入力されると評価値「動体位置」を出力する関数である。動体位置関数は、動体の位置として、フレーム画像の中央に近い値が入力されるほど、大きな値を出力する。また、動体の位置として、フレーム画像の中央を含む所定範囲外の値を入力された場合は、値0を出力する。動体が中央にある場面のフレーム画像は撮影者が特に撮影しようとしたフレーム画像であると考え、動体位置関数を以上のように設定した。動体の位置の算出方法については、後述する。図3(a)のフレーム画像では、左側から三枚目のフレーム画像から、次第に動体(人物)がフレーム画像の中央に移動し、四枚目のフレーム画像では動体(人物)はフレーム画像のほぼ中央に位置している。そして、四枚目のフレーム画像から、次第に動体(人物)が中央から左方向に移動している。したがって、図3(e)の評価値は、グラフで示すように変動する。
図3(f)は、評価値「動体大きさ」のグラフである。「動体大きさ」はフレーム画像内の動体の大きさに関する評価値である。評価値算出部108は、動体大きさ関数という関数により評価値「動体大きさ」を算出する。動体大きさ関数は、フレーム画像内の動体の大きさが入力されると評価値「動体大きさ」を出力する関数である。動体大きさ関数は、大きい値が入力されるほど大きな値を出力する。また、所定値以下の値が入力された場合は、値0を出力する。動体が大きく撮影されたフレーム画像は、撮影者が特に撮影しようとしたフレーム画像であると考え、動体大きさ関数を以上のように設定した。動体の大きさの算出方法については、後述する。図3(a)のフレーム画像では、左側から一枚目のフレーム画像から、次第に動体が大きくなり、二枚目のフレーム画像から動体は一定の大きさを保っているので、図3(f)の評価値は、グラフで示すように変動する。
図3(g)は、評価値「肌色大きさ」のグラフである。「肌色大きさ」はフレーム画像内の肌色の大きさに関する評価値である。評価値算出部108は、肌色大きさ関数という関数により評価値「肌色大きさ」を算出する。肌色大きさ関数は、フレーム画像内の肌色の大きさが入力されると評価値「肌色大きさ」を出力する関数である。肌色大きさ関数は、大きい値が入力されるほど大きな値を出力する。また、所定値以下の値が入力された場合は値0を出力する。肌色が大きく撮影されたフレーム画像は人物がアップで撮影されたフレーム画像であり、撮影者が特に撮影しようとしたフレーム画像であると考え、そのように設定した。肌色の大きさの算出方法については、後述する。図3(a)のフレーム画像では、左側から一枚目のフレーム画像から、次第に肌色が大きくなり、二枚目のフレーム画像から肌色は一定の大きさを保っているので、図3(g)の評価値は、グラフで示すように変動する。
以上の、評価値を算出するために用いている関数は、様々に設定可能である。例えば、評価値「静止」を算出するための静止関数は、背景の速さが0になってから何番目のフレーム画像データであるかにより、異なる値を出力するものであっても良い。動体位置に関しても、動体の位置が中央になってから何番目のフレーム画像データであるかにより、異なる値を出力するものであっても良い。また、以上の評価値以外に、評価値算出部108は並進及び動体の動きの速度に関する評価値を算出しても良い。並進とは、マラソン中継のように、動体はフレーム画像の中央に存在し、背景が動いていることである。動体の動きの速度とは、動体の背景に対する相対速度である。動体の動きの速度が所定値以上となった場合は、動体の動きの速度に関する評価値を値0にする。更に、評価値算出部108は、フレーム画像データの色や輝度のヒストグラム、音声データなどに基づいて評価値を算出しても良い。
次に、ズーム操作の開始や終了,パン操作の開始や終了の検出方法について説明する。ズーム操作の開始や終了,パン操作の開始や終了は、動きベクトルに基づいて検出する。動きベクトルとは、フレーム画像を複数に分割してできる各ブロックの絵柄が、1のフレーム画像から他のフレーム画像までの間でどれだけどのように移動しているかを示すベクトルである。ブロックの絵柄が大きく移動しているほど、つまりそのブロックの動きベクトルが大きいほど、そのブロックの絵柄が表わす動体は、速く移動していることになる。動きベクトルの算出方法については、後述し、以下では、動きベクトルが動き検出部107により既に算出されているものとして説明する。
図4は、ズーム操作開始・終了時のフレーム画像データ,パン操作開始・終了時のフレーム画像データの検出方法を示すための説明図である。動画像データにおいて、各ブロックの動きベクトルmが、図4(a)のように、フレーム画像の外側から中央に向かい始めた場合、評価値算出部108は、そこでズームインを開始したものと判断し、そのフレーム画像データをズーム操作が開始されたフレーム画像データであると検出する。ズーム操作が開始されてから、各ブロックの動きベクトルmが、図4(a)のように、フレーム画像の外側から中央に向かわなくなった時点で、そのフレーム画像データをズーム操作が終了したフレーム画像データであると検出する。
各ブロックの動きベクトルmが、図4(b)のように、フレーム画像の中央から外側に向かい始めた場合、評価値算出部108は、そこでズームアウトを開始したものと判断し、そのフレーム画像データをズーム操作が開始されたフレーム画像データであると検出する。ズーム操作が開始されてから、各ブロックの動きベクトルmが、図4(b)のように、フレーム画像の中央から外側に向かわなくなった時点で、そのフレーム画像データをズーム操作が終了したフレーム画像データであると検出する。
なお、動画像データの中に、メタデータとして、ビデオカメラのズームボタンが押されているか否かを示すズームボタン操作情報が付いている場合がある。ズーム操作が開始されたフレーム画像データやズーム操作が終了したフレーム画像データは、そのようなズームボタン操作情報に基づいて検出しても良い。
一方、パン操作が開始されたフレーム画像やパン操作を終了したフレーム画像は、フレーム画像全体のズレSに基づいて検出する。ズレSとは、1のフレーム画像から他のフレーム画像までの間でフレーム画像全体がどれだけどの方向に移動しているかを示すベクトルである。ビデオカメラの向きを変える速度が大きいほど、ズレSの大きさは大きくなる。図4(c)のように、時系列的に連続する所定数以上のフレーム画像において、ズレSの方向が同じ向きになった場合、パン操作が開始されているものと判断する。そして、ズレSが同じ向きのフレーム画像データのうち、最初のフレーム画像データを、パン操作が開始されたフレーム画像データであると検出する。そして、ズレSが同じ向きのフレーム画像データのうち、最後のフレーム画像データを、パン操作が終了したフレーム画像であると検出する。
次に、各フレーム画像の背景の速さや動体の位置,動体の大きさの算出方法について説明する。これらの値は、動きベクトルの大きさが所定値を超えているブロックの集合である動体ブロックに基づいて算出する。動体ブロックが表わす絵柄は、動体であると推定できる。フレーム画像内に複数の動体が存在する場合は、動きベクトルの大きさが所定値を超えているブロックをクラスタリングして複数の動体ブロックを求める。図5は、動体mvを示す説明図である。
評価値算出部108は、動体ブロック以外のブロック(以下、背景ブロックとよぶ)の動きベクトルの大きさにより、背景の速さを算出する。各背景ブロックの動きベクトルの大きさの合計値を背景の速さとしても良いし、各背景ブロックの動きベクトルの大きさの平均値を背景の速さとしても良い。ここでは、平均値を背景の速さとしている。
評価値算出部108は、動体位置として動体ブロックの重心を算出する。また、評価値算出部108は、動体ブロックの大きさを動体大きさとして算出する。なお、動体大きさは、動体ブロックが複数の場合には、全動体ブロックの大きさであるものとしても良い。
次に、肌色大きさの検出方法について説明する。肌色の領域は、以下の式で、0.1<H<0.9かつG>Bを満たすRGB値を有する画素の集合として求めることができる。
H(色相)=1.732(G−B)/(2R−G−B) ・・・(1)
S(彩度)={(B−R)+(R−G)+(G−B)}/3 ・・・(2)
V(明度)=R+G+B ・・・(3)
評価値算出部108は、フレーム画像における肌色の画素の数を肌色大きさとして算出する。なお、肌色大きさは、動体ブロックにおける肌色の画素の数としても良い。
評価値算出部108は、以上のように求めた各項目の評価値を、フレーム画像データごとに足し合わせる。以下、評価値とは、この合計の評価値を意味するものとする。
A4.目安標識及び各ボタンの機能:
図6は、目安標識の位置の設定及び指定箇所の設定を示す説明図である。図6の上側には目安標識が表示されたインタフェース画面250が、下側には説明の便宜上、評価値を示すグラフが示されている。グラフの時刻軸は、動画像の再生箇所に対応する。このグラフは、インタフェース画面250に併せて表示するものとしても良い。
動画像データはシーン分割部106によりシーンに分割される。図の例では、動画像データはシーンS1,シーンS2,シーンS3の3つのシーンに分割されている。
本実施例では、2種類の目安標識を用いる。1つは、シーン内で最高の評価値をもつフレーム画像データの再生箇所を示す最高標識209a,209b,209cである。シーンS1では時刻H1、シーンS2では時刻H2、シーンS3では時刻H3に相当するフレーム画像データがシーン内で最高の評価値をもつフレーム画像データである。もう1つはシーンの切れ目を示す分割標識210a,210b,210cである。本実施例では、動画像の再生終了位置にも分割標識210cを示した。なお、目安標識の種類は2種類に限られず、様々な目安標識を設定可能である。これらの目安標識は再生スライドバー208の下に表示される。
目安設定部109は、フレーム画像データの評価値に基づいて、最高標識と分割標識の目安標識を表示すべきフレーム画像を特定する。インタフェース提供部110は、目安標識の種類及び目安標識の位置に基づいて、最高標識209a,209b,209cや分割標識210a,210b,210cを表示する。
ユーザが、ダイジェストボタン203を押下すると、インタフェース提供部110は、その時点でビューウィンドウ200に再生表示されているフレーム画像を使用希望フレーム画像データと判断し、指定箇所設定部114に指定箇所設定指示を出す。
指定箇所設定部114は、指定された使用希望フレーム画像データに基づき、指定箇所を設定する。本実施例では、2つの使用希望フレーム画像データの間の時系列的に連続したフレーム画像データの集合を指定箇所として設定するものとし、指定箇所設定部114は、指定箇所の最初および最後に相当する2つの使用希望フレーム画像データを特定する情報を指定箇所DB120に管理する。本実施例では、指定箇所は1シーン中1つとするが、複数の指定を許容してもよい。指定が完了すると、指定箇所設定部114は、次のシーンから動画像の再生を開始させる。
例えば、動画像の再生中、再生スライダが位置207b、207cにある時にダイジェストボタン203が押下された場合は、これらの位置に挟まれた部分、即ちシーンS1内の斜線で示された部分211aを、指定箇所として設定し、赤色で表示する。以下、再生スライドバーにおいて指定箇所に相当する部分を指定部分と呼ぶ。その後、再生スライダを位置207nに移動させ、シーンS2から再生を開始させる。
なお、使用希望フレーム画像データを中心に所定数分のフレーム画像データを指定箇所に設定しても良い。具体的には、再生スライダが位置207dにある時にダイジェストボタン203が押下された場合、このフレーム画像を挟む前後所定数のフレーム画像に相当する箇所、即ちシーンS2内の斜線で示された部分211bを、指定箇所として設定しても良い。この所定数は、ユーザから指定されるものとしても良いし、評価値に基づいて決定しても良い。
図7は、スキップボタン204の機能を示す説明図である。動画像の再生中、スキップボタン204が押下された場合、インタフェース提供部110は、動画像の再生箇所を移動させる。具体的には、再生スライドバー208において、最高標識から長さdだけ左の位置、または分割標識の位置、または指定部分の左端の位置のいずれかのうち、現在の再生箇所に最も近い位置から動画像を再生する。
例えば、再生スライダが位置207eにある際に、スキップボタン204が押下された場合は、インタフェース提供部110は、再生スライダを最高標識209aの左側dの位置207fまで移動させ、ここから動画像を再生させる。最高標識のフレーム画像から再生を行ってもユーザはそのフレーム画像の内容を把握することは困難であるため、本実施例では、最高標識の左側dの位置から再生を行うものとした。dの値は、再生開始から最高標識のフレーム画像に至るまでの事前表示として過不足ない範囲で任意に設定可能である。
また、再生スライダが位置207gにある際に、スキップボタン204が押下された場合は、インタフェース提供部110は、分割標識に相当する位置207hから動画像を再生させる。
また、ユーザが指定箇所を設定した後、要約動画像生成前に、再度動画像を再生して指定箇所などを確認する場合もある。そのように、既に指定部分211dが設定されている場合、インタフェース提供部110は、再生スライダが位置207hにある際に、スキップボタン204が押下された場合は、指定部分211dの開始フレームに相当する位置207iから動画像を再生させる。
更に、スキップボタン204にはもう1つの機能がある。ダイジェストボタン203が押下されることで指定部分の開始位置に相当する使用希望フレーム画像データが指定された後、スキップボタン204が押下された場合は、スキップ後の再生箇所が指定部分の終了位置に設定される。
例えば、再生スライダが位置207gにある際に、ダイジェストボタン203が押下された後、スキップボタン204が押下された場合は、位置207gからスキップ後の位置207hまでを指定部分211cとし、これに相当する部分を指定箇所として設定し、この部分を赤で表示する。
図8は、クリアボタン205の機能を示す説明図である。クリアボタン205は、使用希望フレーム画像の決定を取り消す機能を持つ。具体的には、1つ目の使用希望フレーム画像データが指定されてから、2つ目の使用希望フレーム画像データが指定されるまでの間に、クリアボタン205が押下された場合は、1つ目の使用希望フレーム画像データの指定がクリアされる。インタフェース提供部110は、クリアに応じて再生箇所を1つ目の使用希望フレーム画像データまで戻す。
例えば、位置207kで1つ目の使用希望フレーム画像データが指定されてから、再生スライダが位置207jに来たときにクリアボタン205が押下された場合は、指定箇所修正部117は、1つ目の使用希望フレーム画像データに関する情報を指定箇所DB120から削除する。指定部分211eも元の白色にする。そして、インタフェース提供部110は、再生箇所を再生スライダ207kの位置に相当する箇所まで移動する。
また、動画像の再生終了後、再生スライダが再生スライダ207mの位置に来てから、インタフェース画面250を介して、指定箇所の調節が可能であるものとしても良い。例えば、調節部212により、指定部分211fの端を再生スライドバー208内で移動させることにより、指定部分211fに相当する指定箇所を調節可能であるものとしても良い。
A5.処理:
次に、動画像処理装置100における処理について説明する。図9は、要約動画像データ生成処理の一部であるインタフェース提供処理を示す説明図である。まず、動画像処理装置100は、ユーザの入力により、動画像データや、要約動画像の希望再生時間を取得する(ステップS100)。そして、取得した動画像データをシーン分割する(ステップS200)。シーン分割は、色や輝度のヒストグラム、音声データなどの動画像データの特徴量を用いて、各フレーム画像データを比較するという既知の技術により行なう。
次に、各フレーム画像の動きを検出する(ステップS300)。図10は、各フレーム画像の動き検出処理を示すフローチャートである。本処理において、まず、動画像処理装置100は、動画像における複数のフレーム画像の中から、動きを検出する対象としての基準フレーム画像nを1つ選択し、基準フレーム画像nとその直前のフレーム画像(n−1)とのフレーム画像全体のズレSを検出する(ステップS301)。ズレSは、例えば、勾配法やパターンマッチング法などの既知の技術を用いることで検出することができる。ここで検出するズレSが、先述した、パンを検出するためのズレSに相当する。
図中には、背景として山が、動体としてボールがフレーム画像(n−1)と基準フレーム画像nに撮像されている例を示している。フレーム画像(n−1)と基準フレーム画像nとを比較すると、山はフレーム画像の右下に移動しており、ボールはフレーム画像の右方向に移動している。また、ボールの移動量は山の移動量よりも相対的に大きく、フレーム画像内に占める山の面積はボールの面積よりも大きい。ということがわかる。このようなフレーム画像に対して上述した勾配法やパターンマッチング法を適用すると、フレーム画像全体に占める面積の小さいボールのズレよりも、フレーム画像全体に占める面積の割合の大きい山のズレが優先して検出されることとなる。つまり、フレーム画像全体のズレは、山のズレとほぼ一致することとなる。
なお、2つのフレーム間には、上下左右方向の並進ズレと回転方向の回転ズレとが生じうるが、ここでは説明の簡単のため、回転ズレは生じないものとして説明する。
フレーム画像全体のズレSを検出した後、動画像処理装置100は、基準フレーム画像nとその直前のフレーム画像(n−1)をそれぞれ複数のブロックに分割する(ステップS302)。図には、それぞれのフレーム画像を横方向に4分割、縦方向に3分割する例を示している。
フレーム画像の分割後、動画像処理装置100は、基準フレーム画像nの各ブロックに対応するフレーム画像(n−1)の各ブロックのズレSbを検出し(ステップS303)、各ブロックのズレSbと全体のズレSとの差分をとることで、各ブロックの動きベクトルmを算出する(ステップS304)。ここで算出する動きベクトルmが、先述した、ズームインやズームアウトを検出するための動きベクトルmに相当する。図示した例では、ボールが撮像された右上のブロック以外のブロックのズレSbは、ステップS301で検出したフレーム画像全体のズレSとほぼ等しいためキャンセルされて動きベクトルmはゼロとなり、右上のブロックの動きベクトルmのみが検出される。
次に動画像処理装置100は、動きベクトルmが所定の閾値を超えるか否かを判断し、所定の閾値を超える動きベクトルmとなったブロックを動体として検出する(ステップS305)。ここで検出する動体のブロックが、先述した、静止や動体位置や動体大きさを検出するための動体ブロックに相当する。閾値を設けるものとしたのはブロック間の軽微なズレ(例えば、微小な回転ズレ)を排除するためである。閾値としては、例えば、30ピクセルなどとすることができる。図示した例では、基準フレーム画像n内の右上のブロックが動体ブロックであるものとして特定される。
以上のステップS301〜ステップS305の処理を、動画像データにおける最初のフレーム画像データ以外のすべてのフレーム画像データについて行なう。
再度、図9に戻り説明する。動画像処理装置100は、次に、ステップS300で検出したズレSや動きベクトルmや動体ブロックに基づいて、各フレーム画像データの評価値を算出する(ステップS400)。算出方法は先の項目A3で述べた通りであり、評価値算出部108は、ズーム,パン,静止,動体位置,動体大きさ,肌色大きさという項目について、それぞれ評価値を算出する。そして、それらを足し合わせ、評価値を求める。そして、求めた評価値をもとに、目安標識の位置を設定する(ステップS500)。更に、目安標識の位置に基づいて目安標識を表示した、上述した各機能を実現するインタフェース画面250を提供する(ステップS600)。
図11は、指定箇所設定処理を示すフローチャートである。指定箇所設定処理は、インタフェース提供部110からの指定箇所設定指示に基づいて、指定箇所設定部114が実行する。インタフェース提供部110は、ダイジェストボタン203やスキップボタン204が押下されると、押下された際の動画像の再生箇所などである使用希望フレーム画像データに関する情報と共に、指定箇所設定部114に、指定箇所設定指示を出す。
指定箇所設定部114は、指定箇所設定指示を受けると、使用希望フレーム画像データに関する情報に基づいて、指定箇所DB120を更新する(ステップS700)。使用希望フレーム画像データに関する情報とは、使用希望フレーム画像データの再生時刻である。指定箇所設定部114は、指定箇所DB120にその再生時刻を保存する。その際、先述した1つ目の使用希望フレーム画像データの再生時刻を「開始位置」として、2つ目の使用希望フレーム画像データの再生時刻を「終了位置」として保存する。
指定箇所DB120に保存される情報は、ここでは「時:分:秒」であるが、「時:分:秒:ミリ秒」を保存しても良いし、使用希望フレーム画像データが動画像データの先頭から何番目であるかを保存しても良い。
指定箇所設定部114は、開始位置を更新した場合は(ステップS702:NO)、要約動画像の選択中であることをユーザに示す表示をする(ステップS703)。具体的には、指定部分を表示するために、再生スライダの移動に伴い、1つ目の使用希望フレーム画像データに相当する位置から、再生スライドバー208を赤色に表示していく。インタフェース画面250中に、コメントとして、要約動画像選択中である旨を表示するものとしても良い。再生スライドバー208にマークを表示するものとしても良い。
指定箇所設定部114は、終了位置を更新した場合は(ステップS702:YES)、指定箇所を設定したものとして、要約動画像選択中の表示を終了する(ステップS704)。そして、再生スライダを次のシーンの開始位置に相当する位置に移動させ、次のシーンから再生を開始させる(ステップS706)。
図12は、指定箇所修正処理を示すフローチャートである。指定箇所修正処理は、インタフェース提供部110からの指定箇所終了指示に基づいて、指定箇所修正部117が実行する。インタフェース提供部110は、クリアボタン205が押下されたり、再生スライドバー208において指定部分211の幅が調節されたりすると、「クリアボタン押下」、「指定部分の調節」という操作内容と、使用希望フレーム画像データに関する情報と共に、指定箇所修正部117に、指定箇所修正指示を出す。
指定箇所修正部117は、指定箇所修正指示を受けると、操作内容と、使用希望フレーム画像データに関する情報に基づいて、指定箇所DB120を修正する(ステップS800)。ここでも、使用希望フレーム画像データに関する情報は、使用希望フレーム画像データの再生時刻である。具体的には、指定箇所修正部117は、操作内容が「指定部分の調節」である場合は、変更前の使用希望フレーム画像データに関する情報(図12では「0:00:30」)を、変更後の使用希望フレーム画像データに関する情報(図12では「0:00:45」)に置き換える。操作内容が「クリアボタンの押下」である場合は、使用希望フレーム画像データに関する情報(図12では「0:2:12」)を削除する。
また、操作内容が「クリアボタンの押下」である場合は(ステップS802:YES)、削除した使用希望フレーム画像データに相当する指定部分211を白色にする(ステップS804)。
図13は、要約動画像データ生成処理を示すフローチャートである。要約動画像データ生成処理は、確定ボタン206の選択に基づいてインタフェース提供部110から出される抽出指示に従い、抽出部118や要約動画像生成部119により実行される処理である。抽出部118は、抽出指示を受けると、指定箇所DB120から、指定箇所の合計の再生時間である合計再生時間を計算する(ステップS900)。
そして、希望再生時間に基づいて指定箇所を修正し、合計再生時間を調節する(ステップS902)。指定箇所の修正は、例えば、希望再生時間と合計再生時間の差を各指定箇所で均等に割り振り、「開始位置」と「終了位置」を、各々割り振られた値の半分だけ移動させることにより行なう。これにより、希望再生時間と合計再生時間を一致させる。その際、指定箇所DB120も修正後の値に変更する。
なお、指定箇所の修正は、「開始位置」あるいは「終了位置」のみ、割り振られた値だけ移動させるものとしても良い。希望再生時間と合計再生時間の差を各指定箇所で均等に割り振るのではなく、各指定箇所のフレーム画像データの評価値に基づいて、差を割り振るものとしても良い。希望再生時間と合計再生時間の差が所定の閾値以上である場合は、ユーザに注意を促し、要約動画像生成処理を終了するものとしても良い。
指定箇所DB120の修正後は、修正した指定箇所に相当するフレーム画像データを抽出する(ステップS904)。フレーム画像データを抽出したら、次に要約動画像データを生成する(ステップS906)。要約動画像データは、抽出した各指定箇所に相当するフレーム画像データをつなぎあわせることにより生成する。
生成した要約動画像データは、デジタルビデオカメラ30やCD−R/RWドライブ140に出力しても良い。ユーザは、出力された要約動画像データをデジタルビデオカメラ30などで再生することで、要約動画像を見ることができる。また、ビューウィンドウ200に再生表示するものとしても良い。
また、指定箇所DB120の修正後は、インタフェース提供部110に、指定箇所DB120に基づいて各指定部分の色の表示を行わせるものとしても良い。
A6.効果:
以上の実施例の動画像処理装置100によれば、ユーザは最高標識209や分割標識210を参考にして、簡便に使用希望フレーム画像データを指定し、要約動画像データを生成することができる。スキップボタン204を備えているので、目安標識の位置に相当する再生箇所などへ動画像を簡単に早送りすることができ、使用希望フレーム画像データの指定を手早く行なうことができる。1シーン中の指定箇所の指定後は自動的に次のシーンから再生するので、操作が楽になる。
更に、クリアボタン205を備えているので、指定箇所の変更を簡単に行なうことができる。また、本実施例ではダイジェストボタン203の1つの操作で開始位置・終了位置を指定することにより指定箇所全体を指定できるので、操作が簡単である。
B.変形例:
以上、本発明の実施例について説明したが、本発明はこれらに限定されず、その趣旨を逸脱しない範囲で種々の構成を採ることができることはいうまでもない。指定箇所が1シーン内で1つであるとは限らない。2つ以上であっても良いし、0であっても良い。本実施例のスキップボタン204は動画像の早送りに相当するスキップボタンであるが、動画像の巻き戻しに相当するスキップボタンを備えても良い。更に、スキップ後の再生箇所は、例えばスキップする時間などを指定することにより、ユーザが選択可能であるものとしても良い。
図14は、実施例の変形例を示す説明図である。インタフェース画面250は、各シーンの代表画像を表示する代表画像ウィンドウ224を備えるものとしても良い。代表画像は、シーン中で評価値が最高のフレーム画像であることが望ましいが、それ以外であっても構わない。また、希望再生時間を表示する希望再生時間表示エリア222を備えていても良い。更に、「希望再生時間―指定箇所の再生時間の合計」を表示する残り時間表示エリア223を備えていても良い。それらの表示を参考にすれば、ユーザは使用希望フレーム画像データを選択することが容易になる。
また、フレーム画像データの評価値を算出する際の評価基準を選択することが可能な評価基準選択エリア220を備えていても良い。評価基準選択エリア220を備えれば、ユーザに選択された評価基準で算出した評価値に従った最高標識を表示することができ、ユーザは希望に即した最高標識を参考にして使用希望フレーム画像データを選択することができる。
更に、指定箇所の要約動画像における再生順序を指定可能な再生順序指定エリア221を備えていても良い。この場合、要約動画像生成部119は、指定に従って各指定箇所のフレーム画像データをつなぎあわせる。
ダイジェストボタンは1つでなくても良い。例えば、指定箇所の開始位置を指定するボタンと終了位置を指定するボタンを別個に設けても良い。更に、各シーンの開始位置を自動的に指定箇所の開始位置と定めるものとしても良い。
実施例としての動画像処理装置のインタフェース画面を示す説明図。 実施例としての動画像処理装置の概略構成を示す説明図。 フレーム画像データの評価値について説明するための説明図。 ズーム操作開始・終了時のフレーム画像データ,パン操作開始・終了時のフレーム画像データの検出方法を示すための説明図。 動体mvを示す説明図。 目安標識の設定及び指定箇所の設定を示す説明図。 スキップボタン204の機能を示す説明図。 クリアボタン205の機能を示す説明図。 要約動画像データ生成処理の一部であるインタフェース提供処理を示す説明図。 各フレーム画像の動き検出処理を示すフローチャート。 指定箇所設定処理を示すフローチャート。 指定箇所修正処理を示すフローチャート。 要約動画像データ生成処理を示すフローチャート。 実施例の変形例を示す説明図。
符号の説明
30...デジタルビデオカメラ
100...動画像処理装置
101...動画像データベース
102...要約動画像生成制御部
104...データ取得部
106...シーン分割部
107...動き検出部
108...評価値算出部
109...目安設定部
110...インタフェース提供部
114...指定箇所設定部
117...指定箇所修正部
118...抽出部
119...要約動画像生成部
120...キーボード
130...マウス
150...ディスプレイ
200...ビューウィンドウ
201...再生ボタン
202...停止ボタン
203...ダイジェストボタン
204...スキップボタン
205...クリアボタン
206...確定ボタン
207,207a...再生スライダ
207b〜207n...位置
208...再生スライドバー
209,209a,209b,209c...最高標識
210,210a,210b,210c...分割標識
211,211c〜211f...指定部分
211a,211b...部分
212...調節部
220...評価基準選択エリア
221...再生順序指定エリア
222...希望再生時間表示エリア
223...残り時間表示エリア
224...代表画像ウィンドウ
250,250a...インタフェース画面

Claims (14)

  1. 時系列的に連続する複数のフレーム画像データによって構成された動画像データから、その内容を要約した要約動画像データを生成する動画像処理装置であって、
    前記動画像データを取得する取得部と、
    前記フレーム画像データの各々に関して、前記動画像データにおける重要度を表わす所定の評価値を算出する算出部と、
    前記要約動画像データへの使用を希望する前記フレーム画像データである使用希望フレーム画像データを指定するためのインタフェース画面を提供するインタフェース提供部と、
    ユーザによる前記使用希望フレーム画像データの指定を支援するために前記インタフェース画面上に提示される目安標識の表示形式を制御するための目安情報を、前記評価値に基づいて設定する目安設定部と、
    前記使用希望フレーム画像データを特定する指定情報を入力する指定入力部と、
    前記使用希望フレーム画像データを含んだ前記フレーム画像データの集合である指定フレームデータの少なくとも一部を用いて前記要約動画像データを生成する生成部と
    を備え、
    前記インタフェース画面は、
    前記動画像データに基づく動画像を再生する再生表示エリアと、
    前記動画像の再生箇所をグラフィック表示する再生箇所表示エリアと、
    前記目安情報に基づいて前記目安標識を表示する目安表示エリアと
    を備えた動画像処理装置。
  2. 請求項1記載の動画像処理装置であって、
    前記目安標識は前記評価値を視覚的に表したグラフ、記号および文字のいずれかである動画像処理装置。
  3. 請求項1記載の動画像処理装置であって、
    前記指定フレームデータは、前記使用希望フレーム画像データを含む、時系列的に連続した所定数以上の前記フレーム画像データの集合であるフレーム群で構成される動画像処理装置。
  4. 請求項3記載の動画像処理装置であって、
    前記指定情報は、前記フレーム群の最初と最後のフレーム画像データを指定する動画像処理装置。
  5. 請求項1記載の動画像処理装置であって、
    前記インタフェース提供部は、ユーザから再生開始箇所として指定されたフレーム画像データから前記動画像の再生を開始する
    動画像処理装置。
  6. 請求項5記載の動画像処理装置であって、
    前記再生開始箇所の指定は、前記目安情報と関連付けられたフレーム画像データ、および前記指定フレームデータから選択することで行われる動画像処理装置。
  7. 請求項5記載の動画像処理装置であって、
    前記インタフェース提供部は、前記指定入力部に隣接して、前記再生開始箇所を指定するためのインタフェースを提供する動画像処理装置。
  8. 請求項1記載の動画像処理装置であって、
    前記再生表示エリアは、前記指定情報の入力に呼応して、前記目安情報と関連付けられたフレーム画像データにスキップして前記動画像の再生を開始する動画像処理装置。
  9. 請求項1記載の動画像処理装置であって、
    前記指定情報を修正するための修正情報を入力する修正入力部と、
    前記修正情報に基づき、前記指定フレームデータを修正する修正部と
    を備えた動画像処理装置。
  10. 請求項1記載の動画像処理装置であって、
    前記再生箇所表示エリアは、前記指定フレームデータに対応する再生箇所を、他のフレーム画像データと区別可能に表示する指定箇所表示を有する動画像処理装置。
  11. 請求項10記載の動画像処理装置であって、
    前記指定箇所表示の位置の変更を入力する位置入力部と、
    前記変更に基づき、前記指定フレームデータを修正する修正部と
    を備えた動画像処理装置。
  12. 請求項1記載の動画像処理装置であって、
    前記要約動画像データの再生時間の希望値である希望再生時間を取得する希望再生時間取得部と、
    前記希望再生時間に基づいて、前記指定フレームデータの数を調整する調整部と
    を備えた動画像処理装置。
  13. 時系列的に連続する複数のフレーム画像データによって構成された動画像データから、その内容を要約した要約動画像データを生成する動画像処理方法であって、
    コンピュータが実行する工程として、
    前記動画像データを取得する取得工程と、
    前記フレーム画像データの各々に関して、前記動画像データにおける重要度を表わす所定の評価値を算出する算出工程と、
    前記要約動画像データへの使用を希望する前記フレーム画像データである使用希望フレーム画像データを指定するためのインタフェース画面を提供するインタフェース提供工程と、
    ユーザによる前記使用希望フレーム画像データの指定を支援するために前記インタフェース画面上に提示される目安標識の表示形式を制御するための目安情報を、前記評価値に基づいて設定する目安設定工程と、
    前記使用希望フレーム画像データを特定する指定情報を入力する指定入力工程と、
    前記使用希望フレーム画像データを含んだ前記フレーム画像データの集合である指定フレームデータの少なくとも一部を用いて前記要約動画像データを生成する生成工程と
    を備え、
    前記インタフェース画面は、
    前記動画像データに基づく動画像を再生する再生表示エリアと、
    前記動画像の再生箇所をグラフィック表示する再生箇所表示エリアと、
    前記目安情報に基づいて前記目安標識を表示する目安表示エリアと
    を備えた動画像処理方法。
  14. 時系列的に連続する複数のフレーム画像データによって構成された動画像データから、その内容を要約した要約動画像データを生成するためのコンピュータプログラムであって、
    前記動画像データを取得する取得機能と、
    前記フレーム画像データの各々に関して、前記動画像データにおける重要度を表わす所定の評価値を算出する算出機能と、
    前記要約動画像データへの使用を希望する前記フレーム画像データである使用希望フレーム画像データを指定するためのインタフェース画面を提供するインタフェース提供機能と、
    ユーザによる前記使用希望フレーム画像データの指定を支援するために前記インタフェース画面上に提示される目安標識の表示形式を制御するための目安情報を、前記評価値に基づいて設定する目安設定機能と、
    前記使用希望フレーム画像データを特定する指定情報を入力する指定入力機能と、
    前記使用希望フレーム画像データを含んだ前記フレーム画像データの集合である指定フレームデータの少なくとも一部を用いて前記要約動画像データを生成する生成機能と
    をコンピュータに実現させ、
    前記インタフェース画面は、
    前記動画像データに基づく動画像を再生する再生表示エリアと、
    前記動画像の再生箇所をグラフィック表示する再生箇所表示エリアと、
    前記目安情報に基づいて前記目安標識を表示する目安表示エリアと
    を備えたコンピュータプログラム。
JP2004087408A 2004-03-24 2004-03-24 動画像処理装置 Pending JP2005277733A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004087408A JP2005277733A (ja) 2004-03-24 2004-03-24 動画像処理装置
US11/081,135 US7616868B2 (en) 2004-03-24 2005-03-15 Video processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004087408A JP2005277733A (ja) 2004-03-24 2004-03-24 動画像処理装置

Publications (1)

Publication Number Publication Date
JP2005277733A true JP2005277733A (ja) 2005-10-06

Family

ID=35096376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004087408A Pending JP2005277733A (ja) 2004-03-24 2004-03-24 動画像処理装置

Country Status (2)

Country Link
US (1) US7616868B2 (ja)
JP (1) JP2005277733A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008136759A (ja) * 2006-12-05 2008-06-19 Pentax Corp 動画記録再生装置
JP2009077046A (ja) * 2007-09-19 2009-04-09 Onkyo Corp コンテンツ再生システム、中継サーバ、クライアント、中継プログラム及び再生プログラム
JP2009518908A (ja) * 2005-12-08 2009-05-07 トムソン ライセンシング ディスプレイ、キー画像の抽出及び関連するレセプタを用いて、記録されたドキュメントを識別する方法
JP2009272873A (ja) * 2008-05-07 2009-11-19 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP2012020115A (ja) * 2010-06-16 2012-02-02 Toshiba Corp 医用画像表示装置及びx線コンピュータ断層撮影装置
WO2012070371A1 (ja) * 2010-11-22 2012-05-31 株式会社Jvcケンウッド 映像処理装置、映像処理方法及び映像処理プログラム
US8411735B2 (en) 2006-02-17 2013-04-02 Sony Corporation Data processing apparatus, data processing method, and program
US8934550B2 (en) 2006-02-17 2015-01-13 Sony Corporation Data processing apparatus, data processing method, and program for processing image data of a moving image
JP6218296B1 (ja) * 2016-12-26 2017-10-25 株式会社ユニコーン 動画再生装置、動画再生方法、そのプログラム及び記録媒体
JP2018206142A (ja) * 2017-06-06 2018-12-27 日本放送協会 カメラワーク判定装置及びプログラム

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007081594A (ja) * 2005-09-13 2007-03-29 Sony Corp 撮像装置、記録方法
US7765491B1 (en) * 2005-11-16 2010-07-27 Apple Inc. User interface widget for selecting a point or range
JP4939890B2 (ja) * 2006-10-02 2012-05-30 株式会社東芝 映像符号化装置、映像復号化装置及び映像復号化方法
JP2008236644A (ja) * 2007-03-23 2008-10-02 Fujifilm Corp 撮影装置および画像再生装置
JP2008252160A (ja) * 2007-03-29 2008-10-16 Casio Hitachi Mobile Communications Co Ltd 放送受信装置及びプログラム
JP5060224B2 (ja) * 2007-09-12 2012-10-31 株式会社東芝 信号処理装置及びその方法
JP4444323B2 (ja) * 2007-09-14 2010-03-31 株式会社東芝 デジタル放送受信機
US8543921B2 (en) * 2009-04-30 2013-09-24 Apple Inc. Editing key-indexed geometries in media editing applications
US20110292038A1 (en) * 2010-05-27 2011-12-01 Sony Computer Entertainment America, LLC 3d video conversion
US8670070B2 (en) * 2010-07-15 2014-03-11 Broadcom Corporation Method and system for achieving better picture quality in various zoom modes
US20150221337A1 (en) * 2014-02-03 2015-08-06 Jong Wan Kim Secondary Video Generation Method
US9934222B2 (en) 2014-04-22 2018-04-03 Google Llc Providing a thumbnail image that follows a main image
USD781318S1 (en) 2014-04-22 2017-03-14 Google Inc. Display screen with graphical user interface or portion thereof
USD780777S1 (en) 2014-04-22 2017-03-07 Google Inc. Display screen with graphical user interface or portion thereof
USD781317S1 (en) 2014-04-22 2017-03-14 Google Inc. Display screen with graphical user interface or portion thereof
US9972121B2 (en) * 2014-04-22 2018-05-15 Google Llc Selecting time-distributed panoramic images for display
JP2018533295A (ja) 2015-09-25 2018-11-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ処理のためのシステムおよび方法
CN108028908A (zh) * 2015-09-25 2018-05-11 高通股份有限公司 用于视频处理的系统和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4227241B2 (ja) * 1999-04-13 2009-02-18 キヤノン株式会社 画像処理装置及び方法
JP2002142189A (ja) 2000-11-06 2002-05-17 Canon Inc 画像処理装置、画像処理方法及び記憶媒体
JP2004056397A (ja) * 2002-07-18 2004-02-19 Canon Inc 画像処理装置および方法
US20040088723A1 (en) * 2002-11-01 2004-05-06 Yu-Fei Ma Systems and methods for generating a video summary

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518908A (ja) * 2005-12-08 2009-05-07 トムソン ライセンシング ディスプレイ、キー画像の抽出及び関連するレセプタを用いて、記録されたドキュメントを識別する方法
US8411735B2 (en) 2006-02-17 2013-04-02 Sony Corporation Data processing apparatus, data processing method, and program
US8934550B2 (en) 2006-02-17 2015-01-13 Sony Corporation Data processing apparatus, data processing method, and program for processing image data of a moving image
JP2008136759A (ja) * 2006-12-05 2008-06-19 Pentax Corp 動画記録再生装置
JP2009077046A (ja) * 2007-09-19 2009-04-09 Onkyo Corp コンテンツ再生システム、中継サーバ、クライアント、中継プログラム及び再生プログラム
JP4737228B2 (ja) * 2008-05-07 2011-07-27 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US8886012B2 (en) 2008-05-07 2014-11-11 Sony Corporation Information processing apparatus, information processing method, and program
JP2009272873A (ja) * 2008-05-07 2009-11-19 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP2012020115A (ja) * 2010-06-16 2012-02-02 Toshiba Corp 医用画像表示装置及びx線コンピュータ断層撮影装置
US9814434B2 (en) 2010-06-16 2017-11-14 Toshiba Medical Systems Corporation Medical image display apparatus and X-ray computed tomography apparatus
WO2012070371A1 (ja) * 2010-11-22 2012-05-31 株式会社Jvcケンウッド 映像処理装置、映像処理方法及び映像処理プログラム
JP2012114559A (ja) * 2010-11-22 2012-06-14 Jvc Kenwood Corp 映像処理装置、映像処理方法及び映像処理プログラム
JP6218296B1 (ja) * 2016-12-26 2017-10-25 株式会社ユニコーン 動画再生装置、動画再生方法、そのプログラム及び記録媒体
JP2018107596A (ja) * 2016-12-26 2018-07-05 株式会社ユニコーン 動画再生装置、動画再生方法、そのプログラム及び記録媒体
JP2018206142A (ja) * 2017-06-06 2018-12-27 日本放送協会 カメラワーク判定装置及びプログラム
JP6990998B2 (ja) 2017-06-06 2022-02-03 日本放送協会 カメラワーク判定装置及びプログラム

Also Published As

Publication number Publication date
US7616868B2 (en) 2009-11-10
US20050232606A1 (en) 2005-10-20

Similar Documents

Publication Publication Date Title
JP2005277733A (ja) 動画像処理装置
US7606462B2 (en) Video processing device and method for producing digest video data
US7317485B1 (en) Digital still camera with composition advising function, and method of controlling operation of same
JPWO2005086478A1 (ja) 動画像データ処理
EP1646235B1 (en) Moving picture recording and reproducing apparatus and method
US8421871B2 (en) Method and apparatus for image pickup and image processing
JP3230858B2 (ja) 動画像の優先度自動選択方法および動画像ダイジェスト自動表示装置
JP4479829B2 (ja) 撮像装置及び撮像方法
JP2003256836A (ja) 知的特徴選択およびパンズーム制御
JP2007151080A (ja) 画像処理装置及び画像処理方法
JP4929631B2 (ja) 画像生成装置、及び画像生成方法
JP2007027971A (ja) 撮影装置及びその制御方法及びプログラム及び記録媒体
JP2010258768A (ja) 画像表示装置及びその制御方法、並びにプログラム及び記憶媒体
JP5126392B2 (ja) 再生制御装置及び再生制御方法並びにプログラム
JP2010177731A (ja) 画像再生装置及び撮像装置
JP2003304492A (ja) 画像処理装置
US7268808B2 (en) Digital camera for recording object scene image with image quality adjusting value
US6735250B2 (en) Image processing apparatus and method utilizing motion vectors
JP4612803B2 (ja) 画像動き検知装置、画像動き検知方法、プログラム及び記録媒体
JP7353821B2 (ja) 画像処理装置、その制御方法、プログラム
JP2006229467A (ja) フォトムービー作成装置及びフォトムービー作成プログラム、並びに被写体認識方法
JP4568797B2 (ja) ビデオカメラの撮影支援プログラム及び編集支援プログラム
JP4769693B2 (ja) 撮像装置、方法、およびプログラム
JP2001094919A (ja) 画像記録装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP2005267455A (ja) 画像処理システム、表示装置、及び画像処理方法