JP4765732B2 - 動画編集装置 - Google Patents

動画編集装置 Download PDF

Info

Publication number
JP4765732B2
JP4765732B2 JP2006105072A JP2006105072A JP4765732B2 JP 4765732 B2 JP4765732 B2 JP 4765732B2 JP 2006105072 A JP2006105072 A JP 2006105072A JP 2006105072 A JP2006105072 A JP 2006105072A JP 4765732 B2 JP4765732 B2 JP 4765732B2
Authority
JP
Japan
Prior art keywords
person
scene
moving image
face
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006105072A
Other languages
English (en)
Other versions
JP2007281858A (ja
Inventor
淳 入江
えりな 瀧川
善久 湊
直輝 前田
楡子 松原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2006105072A priority Critical patent/JP4765732B2/ja
Priority to CN2007100958415A priority patent/CN101051389B/zh
Priority to US11/783,223 priority patent/US8204312B2/en
Publication of JP2007281858A publication Critical patent/JP2007281858A/ja
Application granted granted Critical
Publication of JP4765732B2 publication Critical patent/JP4765732B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/167Detection; Localisation; Normalisation using comparisons between temporally consecutive images
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、動画から所望のシーンを抽出するための技術に関する。
HDDやDVDなどの大容量記録媒体の登場により、色々な場面の動画データを手軽に撮り(録り)ためておくことが可能になった。しかし、多数の若しくは長時間の動画データの中から所望のシーンを探し出したり、動画データを編集・整理したりするのは容易ではない。例えば、特定の人物が写っているシーンを抽出(カット編集)する場合、一般的な動画編集装置では、ユーザがスライダー等を操作しながら特定の人物が写るシーンを探し出し、切り出す最初のフレームと最後のフレームとを指定しなければならない。このような作業は素人には難しく、また非常に手間がかかる。そこで従来より、動画の検索や編集を容易化する技術が望まれていた。
なお、この種の技術としては、所定フレーム間隔おきに顔検出を実行し、新たな顔が検出されると、その顔について時間軸を遡る方向と時間軸に沿う方向の両方向に顔追跡を実行する方法が提案されている(特許文献1参照)。また、シーンの区間、キーフレーム、重要度、キーフレームの画像特徴量などを含むシーン特徴情報を動画データに関連付けておくことで、動画のダイジェスト再生や検索に役立てる方法も提案されている(特許文献2参照)。
特開2005−99953号公報 特開2000−299829号公報
本発明は上記実情に鑑みてなされたものであって、その目的とするところは、簡単な操作で望みの人物が写っているシーンを動画の中から抽出することのできる技術を提供することにある。
上記目的を達成するために本発明は、以下の構成を採用する。
本発明の動画編集装置は、動画を表示可能な表示手段と、ユーザの指示に基づいて抽出対象とする人物を決定する抽出対象決定手段と、前記抽出対象とする人物の顔を追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定するシーン特定手段と、前記シーン特定手段により特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する部分動画抽出手段と、を備える。
この構成によれば、ユーザの指示を契機として、抽出対象とする人物の決定、その人物が写っているシーンの特定、及び、そのシーンを含む部分動画の抽出が自動で行われる。
ユーザに対して要求する指示の種類、及び、実際に入力されたユーザの指示から抽出対象とする人物を決定する方法は、種々考えられる。
例えば、前記抽出対象決定手段は、前記表示手段に表示された画像上の任意の位置をユーザに指定させ、その指定位置に基づき前記画像から抽出対象とする人物を選ぶとよい。もし前記指定位置に人物が存在していたら、前記抽出対象決定手段は、前記指定位置に存在する人物を前記抽出対象とする人物として選べばよい。前記指定位置に人物が存在して
いなかったら、前記抽出対象決定手段は、前記指定位置に近い順に所定数の人物を前記抽出対象とする人物として選べばよい。所定数はユーザにより変更可能であってもよい。
この構成によれば、表示画像に写る所望の人物の辺りを指し示すという極めて簡単かつ直感的な操作だけで、自動的にその人物が抽出対象として選ばれる。
また、前記抽出対象決定手段は、前記表示手段に表示された動画の任意のフレームをユーザに指定させ、その指定されたフレームの画像から抽出対象とする人物を選ぶようにしてもよい。もし前記指定されたフレームの画像に複数の人物が含まれている場合には、それらの人物の中から所定の特徴量に基づいて抽出対象とする人物を選べばよい。
この構成によれば、動画を閲覧中に所望の人物が写っているフレームを指し示すという極めて簡単かつ直感的な操作だけで、自動的に抽出対象とすべき人物が設定される。
また、複数の人物が予め関連付けられており、前記抽出対象決定手段は、前記画像から選ばれた人物に加え、その人物に関連付けられている人物をも、抽出対象とする人物として決定するようにしてもよい。人物同士の関連付けは、ユーザにより設定可能であるとよい。
この構成によれば、関連付けされた複数の人物の中の一人を表示画面上で指定するだけで、自動的に複数の人物全員が抽出対象として決定される。よって、家族で一緒に写っている動画を抽出するとか、友人グループや同僚グループの動画を抽出するといった編集を非常に簡単に実現できる。
前記抽出対象決定手段は、複数の顔をリスト表示し、それら複数の顔の中から抽出対象とする人物をユーザに指定させることも好ましい。ここで、動画の再生中にその動画に含まれている顔を自動的に検出することによって、リスト表示すべき複数の顔を取得してもよいし、前記表示手段に表示された画像内の顔をユーザに指定させることによって、リスト表示すべき複数の顔を取得してもよい。
この構成によれば、現在表示されている画像には写っていない人物(例えば、前のシーンに登場していた人物とか、別の動画に写っていた人物など)をも抽出対象として指定できるようになる。
前記抽出元の動画は、前記表示手段に表示中の動画であってもよいし、記憶手段に格納されている1又は複数の動画であってもよい。
前記部分動画抽出手段は、前記シーン特定手段によって特定された2つのシーンの間の時間間隔がしきい値より短い場合に、それら2つのシーンを1つの部分動画に含めることが好ましい。また、前記部分動画抽出手段は、前記シーン特定手段によって特定された2つのシーンの画像に相関がある場合に、それら2つのシーンを1つの部分動画に含めるようにしてもよい。
この構成によれば、抽出対象が短時間だけフレームアウトした場合や、抽出対象が写るシーンの途中に他のシーン(CM含む)が挿入されていた場合や、顔の追跡において一時的に顔を見失った場合などに、部分動画が細切れに分断されてしまうことを防ぐことができ、利便性が向上する。
本発明は、上記手段の少なくとも一部を有する動画編集装置として捉えてもよいし、また、本発明は、上記処理の少なくとも一部を含む動画編集方法、または、かかる方法を実
現するためのプログラムやそのプログラムを記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
例えば、本発明に係る動画編集方法は、動画を表示可能な表示手段を備えた動画編集装置が、ユーザの指示に基づいて抽出対象とする人物を決定し、前記抽出対象とする人物の顔を追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定し、前記特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する動画編集方法である。
また、本発明に係るプログラムは、動画を表示可能な表示手段を備えた動画編集装置に、ユーザの指示に基づいて抽出対象とする人物を決定処理と、前記抽出対象とする人物の顔を追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定する処理と、前記特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する処理と、を実行させるプログラムである。
本発明によれば、簡単な操作で望みの人物が写っているシーンを動画の中から抽出することができる。
以下に図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。
<装置構成>
図1は、本発明の実施形態に係る動画編集装置の機能構成を示すブロック図である。
動画編集装置は、図1に示すように、表示部10、入力部11、抽出対象決定部12、シーン特定部13、動画編集部14、抽出元動画記憶部15、設定記憶部16、部分動画記憶部17を備えている。この動画編集装置は典型的には演算処理装置(CPU)、主記憶装置(メモリ)、補助記憶装置(ハードディスクなど)、ディスプレイ、入力装置(マウスなど)を備えた汎用のコンピュータと、このコンピュータで動作するソフトウエア(プログラム)から構成可能である。図1に示す機能要素は、演算処理装置がソフトウエア(プログラム)を実行し、必要に応じて主記憶装置、補助記憶装置、ディスプレイ、入力装置などのハードウエア資源を制御することで実現される。ただし、これらの機能要素を専用のチップで構成しても構わない。
この動画編集装置は、動画のカット編集を行うための装置である。編集対象となる動画(抽出元の動画)は、複製可能なデータであれば、ビデオカメラ等で撮影したものでも、放送番組等を録画したものであってもよい。
抽出元の動画は抽出元動画記憶部15に格納されている。そして、この動画から抽出された部分動画は部分動画記憶部17に格納される。抽出元動画記憶部15と部分動画記憶部17はそれぞれ不揮発性の記憶装置であればよく、例えば、ハードディスク(HDD)やDVDなどを利用可能である。なお、設定記憶部16は動画編集処理で利用される各種設定データを記憶する部分であり、これも不揮発性の記憶装置で構成可能である。各記憶部15、16、17は単一のハードウエアで構成してもよいし、別体のハードウエアで構成してもよい。
表示部10は、記憶部からの動画の読み込み、動画の再生、ユーザインターフェイスの生成、ディスプレイへの表示出力などを担う機能である。また、入力部11は、ユーザが
動画編集装置に指示を入力するための機能であり、例えば、キーボードとポインティングデバイス(マウス、タッチパッド、タッチパネル、視線入力装置など)から構成される。
抽出対象決定部12、シーン特定部13、動画編集部14のそれぞれの機能及び処理については、以下の動作例に沿って説明する。
<第1動作例>
ユーザが入力部11を用いて抽出元とする動画を指定すると、表示部10が、その動画を抽出元動画記憶部15から順次読み込み、デコード処理などの動画再生に必要な処理を施して、ディスプレイに表示する(図2(a)参照)。そして、動画の再生開始に伴い、抽出対象決定部12がユーザからの入力の監視を開始する。
ここで、図2(b)に示すように、ユーザが入力部11を用いて表示画像上の一点(若しくは領域)を指定すると、以下に述べる自動抽出処理が開始される。なお、自動抽出処理開始後は、動画の再生を停止しても構わない。
まず、抽出対象決定部12が、ユーザによって指定された点若しくは領域(以下、「指定位置」という。)に基づいて、抽出対象とする人物を決定する。ここでは顔検出処理を利用して抽出対象の決定を行う。具体的には、指定位置を中心とする所定の顔検出範囲の中で顔検出を実行し、指定位置で顔が検出された場合はその人物を抽出対象として選び、指定位置に顔が存在しない場合は指定位置の最も近くで検出された顔の持ち主を抽出対象として選ぶ(図2(c)参照)。顔検出範囲内で顔が検出されなかった場合には、エラーを返すか、範囲を広げて再度顔検出を実行すればよい。なお、顔検出範囲は画像全体でも構わない。
顔検出処理は、既存のどのような技術が適用されてもよい。一例を挙げると、(1)顔全体の輪郭に対応した基準テンプレートを用いたテンプレートマッチングによって顔を検出する手法、(2)顔の器官(目、鼻、耳など)に基づくテンプレートマッチングによって顔を検出する手法、(3)クロマキー処理によって頭部などの頂点を検出し、この頂点に基づいて顔を検出する手法、(4)肌の色に近い領域を検出し、その領域を顔として検出する手法、(5)ニューラルネットワークを使って教師信号による学習を行い、顔らしい領域を顔として検出する手法、などがある。
抽出対象が決定したら、シーン特定部13が、その人物の顔を追跡する(顔トラッキング処理)。ここでは、顔検出に用いられた画像を開始フレームとして、時間軸の順方向と逆方向のそれぞれに顔トラッキング処理が実行される。
顔トラッキング処理における同一顔の推定には、既存のどのような技術が適用されてもよい。例えば、(1)フレーム間の相関を利用し、前フレームにおける顔の位置を基準として現フレームにおける同一顔を推定する手法、(2)複数のフレームの処理結果から顔の動きベクトルを求め、その動きベクトルから現フレームにおける同一顔を推定する手法、(3)顔認識技術を利用して、顔画像から抽出される特徴量の類似度に基づき同一顔を推定する手法、などがある。もちろんこれらを組み合わせることも好ましい。組み合わせに関しては、複数の手法から総合的に一つの解を導いてもよいし(並列的な組み合わせ)、手法を切り替えるようにしてもよい(直列的な組み合わせ)。並列的な組み合わせとしては、例えば、複数の手法それぞれの解(推定結果)の中から最も信頼性の高い解を選択するやり方がある。直列的な組み合わせとしては、例えば、ある一つの手法で顔の追跡に失敗した場合に他の手法で再試行するやり方とか、高精度だが処理負荷の大きい手法と高精度ではないが処理負荷の小さい手法とを切り替えるやり方などがある。なお、全てのフレームについて顔トラッキング処理を実行する必要はなく、抽出対象の位置変動が小さい
ときなどは数フレームおきに顔トラッキング処理を実行しても構わない。
シーン特定部13は、時間軸の逆方向の顔トラッキング処理において抽出対象を見失った時点、及び、時間軸の順方向の顔トラッキング処理において抽出対象を見失った時点を、それぞれ「シーン開始点」「シーン終了点」に設定する(図2(d)参照)。これにより、抽出対象とする人物が写っているシーンが特定される。
動画編集部14は、シーン特定部13により特定されたシーン(つまり、シーン開始点とシーン終了点の間のシーン)を抽出元の動画から抽出する。この抽出された部分動画は、部分動画記憶部17に格納される。なお、部分動画を作成する際に、シーン開始点の前及びシーン終了点の後にそれぞれ所定フレーム数のマージンを付加してもよい。
以上述べた処理によれば、画面上の一点(若しくは一領域)を指定するというユーザの指示を契機(トリガ)として、抽出対象とする人物の決定、その人物が写っているシーンの開始点及び終了点の決定(シーン検索)、並びに、そのシーンを含む部分動画の抽出(カット編集)が自動で行われる。よって、極めて簡単かつ直感的な操作で望みの人物が写っているシーンを抽出することが可能となる。
また、抽出対象の決定にあたり、その探索範囲をユーザによる指定位置及びその近傍に限定したことから、処理の簡単化及び高速化を図ることができる。これは、画像中に多数の人物が写っている場合などに特に有利である。
なお、シーン特定部13が、顔トラッキング処理において抽出対象を見失った後も、動画の最初のフレーム若しくは最後のフレームに至るまで処理を続行し、抽出対象が登場する全てのシーンを動画全体の中から特定するようにしてもよい。複数のシーンが特定されたら、動画編集部14が、シーンごとに部分動画を作成してもよいし、複数のシーンをまとめて1つの部分動画としてもよい(この処理については第5動作例で詳しく述べる。)。
<第2動作例>
第1動作例では、ユーザの指定位置に基づき抽出対象を決定したのに対し、第2動作例では、ユーザの指定したフレームから抽出対象を自動的に選択する構成を採用する。その他の点は第1動作例と同様である。
動画の再生中、ユーザは入力部11を用いてフレームを指定することができる。フレームの指定は、例えば、表示画像若しくはユーザインターフェイス上の所定のボタンの押下、マウスボタンやキーの押下などにより行わせればよい。
抽出対象決定部12は、ユーザによって指定されたフレームの画像から顔を検出する。もし一つの顔しか検出されなかったら、その顔の人物を抽出対象に決定する。複数の顔が検出された場合には、所定の特徴量に基づいて抽出対象を絞り込む。
抽出対象の絞り込みに用いられる特徴量としては、例えば、顔の位置、顔の大きさ、顔の向き、顔部分の画像のボケ量、目の開き度合、視線の方向などがある。これらは、「写りの良さ」を反映する特徴量である。つまり、顔が画像の中心にあるほど、顔が所定の大きさに近いほど、顔が正面を向いているほど、ボケ量が小さいほど、目が開いているほど、視線が正面を向いているほど、それぞれ写りが良好であるといえる。ユーザが指定したフレームではユーザが抽出を望む人物ほど写りが良い慨然性が高い。よって、「写りの良さ」を反映する特徴量に基づき抽出対象を決定することで、ユーザの意図した人物を正確に絞り込むことができる。いずれか1つの特徴量から写りの良さを評価してもよいし、複
数の特徴量の組み合わせから写りの良さを総合評価してもよい。複数の特徴量を組み合わせると、絞り込みの精度を向上することができる。
以上述べた処理によっても第1動作例と同様の作用効果を得ることができる。
<第3動作例>
第3動作例では、設定記憶部16に設定されている関連付け情報に基づいて、抽出対象決定部12が関連付けされた複数の人物を抽出対象として選び出す。その他の点は第1動作例若しくは第2動作例と同様である。
関連付け情報は、2以上の人物を関連付けるための情報であって、少なくとも各人物の顔を定義する顔定義情報を含んでいる。顔定義情報は、顔照合(顔認識)に利用される情報であり、具体的には顔画像から抽出された特徴量から構成される。関連付け情報は、例えば、関連付ける人物それぞれの顔画像をユーザに選択させ、選択された各人の顔画像から顔定義情報を作成し、それらを組にして設定記憶部16に格納することで設定可能である。関連付け情報の設定は以下に述べる自動抽出処理の前に予め行われているものとする。
図3は第3動作例を示している。動画の再生中、ユーザが入力部11を用いて指示を入力すると(図3(a)参照)、その指示に基づいて表示中の画像から抽出対象が選ばれる(図3(b)参照)。この処理は第1動作例若しくは第2動作例のものと同様である。図3(b)の例では、Xが抽出対象として選ばれている。
続いて、抽出対象決定部12は、画像から選ばれた抽出対象Xの顔画像から特徴量を抽出し、設定記憶部16に設定されている個々の関連付け情報の顔定義情報と比較することによって、同一の顔を含む関連付け情報がないか照合する(図3(c)参照)。同一の顔を含む関連付け情報が発見されたら、抽出対象決定部12は、その関連付け情報にて関連付けされている他の人物を抽出対象に加える。図3(d)の例では、Xに関連付けられているYが抽出対象に追加されている。
シーン特定部13は第1動作例と同様に顔トラッキング処理を行って、動画の中からX、Yが登場するシーンを特定する。このとき、XとYの両方が登場するシーンのみを選ぶか、XとYの少なくとも一方が登場するシーンを選ぶかは、ユーザにより設定可能であるとよい。以降の処理は第1動作例と同様である。
この構成によれば、関連付けされた複数の人物の中の一人を表示画面上で指定するだけで、自動的に複数の人物全員が抽出対象として決定される。よって、家族で一緒に写っている動画を抽出するとか、友人グループや同僚グループの動画を抽出するといった編集を非常に簡単に実現できる。
<第4動作例>
第1、第2動作例では表示画像中から抽出対象を指定する方法を説明した。しかしこの方法では、再生中のフレームに含まれていない人物は指定できないので、例えば「少し前のシーンに写っていた人物を抽出したい」というようなニーズに対応できない。そこで、第4動作例では表示画像からでなく、顔画像リストからユーザに抽出対象を指定させる方法を採用する。
顔画像リストは、設定記憶部16に格納されている。顔画像リストへの顔画像の登録は、装置が自動で行ってもよいし、ユーザが手動で行ってもよい。装置による自動登録の一例を挙げると、動画の再生と並行して、所定数のフレームごとに顔検出を実行し、新しい
顔を検出したらその顔を顔画像リストに登録する方法がある。動画の再生が進むに従い、登場人物がリストアップされていくので、前のシーンに登場した人物を後から指定することが可能になる。ユーザによる手動登録の場合は、表示画像の中からユーザに顔を指定させ、その顔を登録すればよい。例えば、動画を閲覧しながら、気になる人物が登場するたびにその顔を登録していく、という使い方が可能である。
図4は顔画像リストの表示例を示している。抽出対象決定部12は、動画再生中に顔画像リストの中から人物が指定されると、その人物を抽出対象に決定する。このとき第3動作例のように、顔画像リストで指定された人物に関連付けされている人物を追加の抽出対象として選んでもよい。以降の処理は上記動作例と同様である。なお、再生中のフレームに抽出対象の顔が含まれていないときは、時間軸の逆方向や順方向に顔探索を実行し、抽出対象が現れるフレームを発見し、そのフレームから顔トラッキング処理を開始すればよい。
<第5動作例>
第5動作例は、シーン特定部13によって抽出対象の登場シーンが2つ以上特定された場合に実行される処理である。
シーンが頻繁に切り替わったり、CMをまたぐ場合などは、短時間のうちに抽出対象がフレームイン/アウトを繰り返すことがある。また、撮影時の手ブレや被写体の激しい動きなどによっても、同様のことが起こりうる。また、実際には抽出対象がフレームアウトしていない場合でも、顔トラッキング処理のミスによって一時的に顔を見失い、一続きであるべきシーンを2つのシーンと誤解してしまうこともある。このような場合に、シーン特定部13によって特定されたシーンごとに別個の部分動画を作成すると、細切れの部分動画が多数作成される結果となり、好ましくない。
そこで、第5動作例では、動画編集部14が2以上のシーンをまとめて部分動画を作成する。具体的には、図5に示すように、時間的に隣り合う2つのシーンA,Bの間の時間間隔Tab(前のシーンの終了点と後のシーンの開始点の間の時間若しくはフレーム数)が、しきい値Tthよりも短い場合に、それら2つのシーンA,Bを同じ部分動画に含める。しきい値Tthは設定記憶部16に予め設定されているものとする。
このとき、動画編集部14は、2つのシーンA,Bの間の部分(つまり、抽出対象が登場していない部分)を、部分動画に含めてもよいし、含めなくてもよい。これも設定で変えられるようにするとよい。また、時間間隔Tabの長さに応じて、2つのシーンA,Bの間の部分を部分動画に含めるか否かを切り換えられるようにすることも好ましい。例えば、Tabが極めて短い場合(数フレーム程度)には手ブレや顔トラッキング処理のミスである可能性が高いので、2つのシーンA,Bの間の部分も残したほうがよいだろうし、逆にTabが長い場合には別のシーンやCMが挿入されている可能性が高いので、2つのシーンA,Bの間の部分は不要であることが多いと考えられる。
この構成によれば、抽出対象が短時間だけフレームアウトした場合や、抽出対象が写るシーンの途中に他のシーン(CM含む)が挿入されていた場合や、顔の追跡において一時的に顔を見失った場合などでも、部分動画が細切れに分断されてしまうことを防ぐことができ、利便性が向上する。また、いわゆるCM抜き編集にも応用可能である。
<変形例>
上述した実施形態の構成及び動作例は本発明の一具体例を例示するものにすぎない。本発明の範囲はこれらに限られることなく、その技術的思想の範囲内で種々の変形が可能である。以下、好ましい変形例を例示する。なお、上記動作例及び下記変形例は可能な限り
適宜組み合わせることが可能である。
・抽出対象決定部12が、抽出対象として複数の人物を選ぶようにしてもよい。抽出対象の人数は、ユーザが都度指定してもよいし、設定記憶部16に予め設定しておいてもよい。例えば第1動作例や第2動作例において複数の抽出対象を選ぶ場合は、ユーザの指定位置から近い順に複数の人物を選択したり、写りの良い順に複数の人物を選択したりすればよい。抽出対象が複数の場合、抽出対象ごとにシーンの特定や部分動画の作成を実行してもよいし、複数の抽出対象全員が含まれること、若しくは、複数の抽出対象のいずれかが含まれることを条件として、シーンの特定や部分動画の作成を実行してもよい。
・予め設定された属性条件(性別、年齢(年齢層)、人種など)を参照して、抽出対象の絞り込みを行ってもよい。例えば、ユーザの指定位置の近傍に複数の抽出対象候補が検出された場合に、それら候補の顔画像から属性推定を行い、上記属性条件に合致するものを優先的に抽出対象として選択する。これにより、より正確にユーザの意図を反映することができる。なお属性推定は公知の技術を利用可能である。
・上記動作例では、再生中の動画から部分動画の抽出を行っているが、抽出元の動画は再生中の動画に限らない。例えば、抽出元動画記憶部15に格納されている1又は複数の動画を抽出元の動画とし、それらの動画から一括してシーンの特定及び部分動画の抽出を行ってもよい。これは、多数の動画をバッチ処理するのに適している。
・第5動作例に関して、2つのシーンA,Bをまとめるべきか否かの判定条件として、シーンAの画像とシーンBの画像との相関(連続性)の有無を採用してもよい。例えば、シーンAの最後の1又は数フレームの画像と、シーンBの最初の1又は数フレームの画像との間で、抽出対象の位置、大きさ、動きベクトルなどを比較する。それらの値が一致若しくは類似していたら、2つのシーンA,Bの画像に相関があるとみなし、シーンAとBを1つの部分動画とすればよい。また、2つのシーンA,Bの間の時間間隔がしきい値より短く、かつ、両シーンA,Bの画像に相関がある場合にのみ、2つのシーンA,Bをまとめるようにしても構わない。
図1は、本発明の実施形態に係る動画編集装置の機能構成を示すブロック図である。 図2は、第1動作例を示す図である。 図3は、第3動作例を示す図である。 図4は、顔画像リストの表示例を示す図である。 図5は、第5動作例を示す図である。
符号の説明
10 表示部
11 入力部
12 抽出対象決定部
13 シーン特定部
14 動画編集部
15 抽出元動画記憶部
16 設定記憶部
17 部分動画記憶部

Claims (3)

  1. 動画を表示可能な表示手段と、
    前記表示手段に表示された画像上の任意の位置をユーザに指定させ、その指定位置を中心とする所定の顔検出範囲の中で顔検出を実行することにより、その指定位置に存在する人物を抽出対象とする人物として決定する抽出対象決定手段と、
    前記抽出対象とする人物の顔を、顔検出に用いられた画像を開始フレームとして、時間軸の順方向と逆方向のそれぞれに追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定するシーン特定手段と、
    前記シーン特定手段により特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する部分動画抽出手段と、
    を備える動画編集装置。
  2. 動画を表示可能な表示手段を備えた動画編集装置が、
    前記表示手段に表示された画像上の任意の位置をユーザに指定させ、その指定位置を中心とする所定の顔検出範囲の中で顔検出を実行することにより、その指定位置に存在する人物を抽出対象とする人物として決定し、
    前記抽出対象とする人物の顔を、顔検出に用いられた画像を開始フレームとして、時間軸の順方向と逆方向のそれぞれに追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定し、
    前記特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する動画編集方法。
  3. 動画を表示可能な表示手段を備えた動画編集装置に、
    前記表示手段に表示された画像上の任意の位置をユーザに指定させ、その指定位置を中心とする所定の顔検出範囲の中で顔検出を実行することにより、その指定位置に存在する人物を抽出対象とする人物として決定する処理と、
    前記抽出対象とする人物の顔を、顔検出に用いられた画像を開始フレームとして、時間軸の順方向と逆方向のそれぞれに追跡することによって、抽出元の動画の中で前記人物が写っているシーンを特定する処理と、
    前記特定されたシーンを含む部分動画を、前記抽出元の動画から抽出する処理と、
    を実行させるプログラム。
JP2006105072A 2006-04-06 2006-04-06 動画編集装置 Expired - Fee Related JP4765732B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006105072A JP4765732B2 (ja) 2006-04-06 2006-04-06 動画編集装置
CN2007100958415A CN101051389B (zh) 2006-04-06 2007-04-05 动画编辑装置
US11/783,223 US8204312B2 (en) 2006-04-06 2007-04-06 Moving image editing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006105072A JP4765732B2 (ja) 2006-04-06 2006-04-06 動画編集装置

Publications (2)

Publication Number Publication Date
JP2007281858A JP2007281858A (ja) 2007-10-25
JP4765732B2 true JP4765732B2 (ja) 2011-09-07

Family

ID=38575302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006105072A Expired - Fee Related JP4765732B2 (ja) 2006-04-06 2006-04-06 動画編集装置

Country Status (3)

Country Link
US (1) US8204312B2 (ja)
JP (1) JP4765732B2 (ja)
CN (1) CN101051389B (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101363017B1 (ko) * 2007-08-23 2014-02-12 삼성전자주식회사 얼굴영상 촬영 및 분류 시스템과 방법
KR100904846B1 (ko) * 2007-08-27 2009-06-25 아주대학교산학협력단 움직임을 추적하여 영상획득기기들의 네트워크 구성을추론하는 장치 및 방법
JP4424396B2 (ja) 2007-09-03 2010-03-03 ソニー株式会社 データ処理装置および方法、並びにデータ処理プログラムおよびデータ処理プログラムが記録された記録媒体
KR100840023B1 (ko) * 2007-11-13 2008-06-20 (주)올라웍스 셀프 촬영 시 얼굴의 구도를 잡도록 도와주는 방법 및시스템
US20090153654A1 (en) * 2007-12-18 2009-06-18 Enge Amy D Video customized to include person-of-interest
JP4322945B2 (ja) * 2007-12-27 2009-09-02 株式会社東芝 電子機器、及び画像表示制御方法
JP5207489B2 (ja) * 2008-01-25 2013-06-12 株式会社金猪電脳研究所 動画表示装置、コンピュータネットワークシステム、放送ネットワークシステム、携帯ネットワークシステム
CN103475837B (zh) * 2008-05-19 2017-06-23 日立麦克赛尔株式会社 记录再现装置及方法
JP5087477B2 (ja) * 2008-06-12 2012-12-05 株式会社日立製作所 情報記録再生装置および情報記録方法
JP2010016621A (ja) * 2008-07-03 2010-01-21 Sony Corp 画像データ処理装置と画像データ処理方法およびプログラムと記録媒体
JP2010039795A (ja) * 2008-08-06 2010-02-18 Casio Comput Co Ltd 認識用データ生成装置及び電子カメラ、認識用データ生成プログラム、並びに認識用データ生成方法
CN101646018A (zh) * 2008-08-08 2010-02-10 佛山普立华科技有限公司 摄影装置及其自拍方法
JP2010154484A (ja) * 2008-11-18 2010-07-08 Nippon Telegr & Teleph Corp <Ntt> 映像変換装置、映像変換方法および映像変換プログラム
JP5263966B2 (ja) * 2009-05-18 2013-08-14 Necカシオモバイルコミュニケーションズ株式会社 端末装置およびプログラム
JP5214533B2 (ja) * 2009-05-21 2013-06-19 富士フイルム株式会社 人物追跡方法、人物追跡装置および人物追跡プログラム
JP2010287985A (ja) * 2009-06-10 2010-12-24 Sanyo Electric Co Ltd 画像処理装置
JP5322799B2 (ja) * 2009-06-18 2013-10-23 オリンパスイメージング株式会社 撮像装置及び撮像方法
JP5552769B2 (ja) * 2009-07-29 2014-07-16 ソニー株式会社 画像編集装置、画像編集方法及びプログラム
CN102074033B (zh) * 2009-11-24 2015-07-29 新奥特(北京)视频技术有限公司 一种动画制作方法和装置
CN102075689A (zh) * 2009-11-24 2011-05-25 新奥特(北京)视频技术有限公司 一种快速制作动画的字幕机
CN102074032A (zh) * 2009-11-24 2011-05-25 新奥特(北京)视频技术有限公司 一种基于图片序列的动画生成方法和装置
JP5427622B2 (ja) * 2010-01-22 2014-02-26 Necパーソナルコンピュータ株式会社 音声変更装置、音声変更方法、プログラム及び記録媒体
JP5471749B2 (ja) * 2010-04-09 2014-04-16 ソニー株式会社 コンテンツ検索装置および方法、並びにプログラム
JP5634111B2 (ja) * 2010-04-28 2014-12-03 キヤノン株式会社 映像編集装置、映像編集方法及びプログラム
KR20120045667A (ko) * 2010-10-29 2012-05-09 삼성전자주식회사 움직임 인식을 이용한 사용자 인터페이스 장치 및 방법
US8643746B2 (en) * 2011-05-18 2014-02-04 Intellectual Ventures Fund 83 Llc Video summary including a particular person
US8984622B1 (en) * 2012-01-17 2015-03-17 Amazon Technologies, Inc. User authentication through video analysis
JP6344592B2 (ja) * 2012-03-09 2018-06-20 パナソニックIpマネジメント株式会社 画像処理装置
JP5895624B2 (ja) * 2012-03-14 2016-03-30 オムロン株式会社 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
JP5352697B2 (ja) * 2012-03-21 2013-11-27 日立コンシューマエレクトロニクス株式会社 記録再生装置及び方法
WO2013150789A1 (ja) * 2012-04-05 2013-10-10 パナソニック株式会社 動画解析装置、動画解析方法、プログラム、及び集積回路
US9317751B2 (en) * 2012-04-18 2016-04-19 Vixs Systems, Inc. Video processing system with video to text description generation, search system and methods for use therewith
US9805267B2 (en) * 2012-04-18 2017-10-31 Vixs Systems, Inc. Video processing system with photo generation and methods for use therewith
US9230158B1 (en) 2012-12-18 2016-01-05 Amazon Technologies, Inc. Fraud detection for facial recognition systems
JP2014134898A (ja) * 2013-01-08 2014-07-24 Canon Inc 画像検索装置
JP6303297B2 (ja) * 2013-06-14 2018-04-04 富士通株式会社 端末装置、視線検出プログラムおよび視線検出方法
JP5346140B1 (ja) * 2013-07-01 2013-11-20 日立コンシューマエレクトロニクス株式会社 記録再生装置及び方法
WO2015045713A1 (ja) * 2013-09-24 2015-04-02 シャープ株式会社 画像処理装置及び画像表示装置
KR102184987B1 (ko) * 2013-11-15 2020-12-01 엘지전자 주식회사 영상 표시 장치 및 그 동작 방법
EP3038108A1 (en) * 2014-12-22 2016-06-29 Thomson Licensing Method and system for generating a video album
KR102306538B1 (ko) 2015-01-20 2021-09-29 삼성전자주식회사 콘텐트 편집 장치 및 방법
JP2017045374A (ja) * 2015-08-28 2017-03-02 富士ゼロックス株式会社 情報処理装置及びプログラム
CN105469361B (zh) 2015-12-24 2018-12-04 努比亚技术有限公司 一种局部图像处理方法和装置
JP6150919B2 (ja) * 2016-03-07 2017-06-21 日立マクセル株式会社 記録再生装置および記録再生方法
JP6866210B2 (ja) * 2017-03-31 2021-04-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN107784281B (zh) * 2017-10-23 2019-10-11 北京旷视科技有限公司 人脸检测方法、装置、设备及计算机可读介质
JP2019110421A (ja) * 2017-12-18 2019-07-04 トヨタ自動車株式会社 動画配信システム
CN111010590B (zh) * 2018-10-08 2022-05-17 阿里巴巴(中国)有限公司 一种视频裁剪方法及装置
CN109542322B (zh) * 2018-11-21 2021-03-23 网易(杭州)网络有限公司 信息的处理方法、装置、存储介质和电子装置
WO2021162019A1 (ja) * 2020-02-14 2021-08-19 ソニーグループ株式会社 コンテンツ処理装置、コンテンツ処理方法およびコンテンツ処理プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263113B1 (en) * 1998-12-11 2001-07-17 Philips Electronics North America Corp. Method for detecting a face in a digital image
WO2001028238A2 (en) * 1999-10-08 2001-04-19 Sarnoff Corporation Method and apparatus for enhancing and indexing video and audio signals
US7020351B1 (en) * 1999-10-08 2006-03-28 Sarnoff Corporation Method and apparatus for enhancing and indexing video and audio signals
US7272295B1 (en) * 1999-11-10 2007-09-18 Thomson Licensing Commercial skip and chapter delineation feature on recordable media
JP2001285787A (ja) * 2000-03-31 2001-10-12 Nec Corp 映像録画方法およびそのシステムとその記録媒体
JP3784289B2 (ja) 2000-09-12 2006-06-07 松下電器産業株式会社 メディア編集方法及びその装置
EP1217574A3 (en) * 2000-12-19 2004-05-19 Matsushita Electric Industrial Co., Ltd. A method for lighting- and view-angle-invariant face description with first- and second-order eigenfeatures
KR100438269B1 (ko) * 2001-03-23 2004-07-02 엘지전자 주식회사 뉴스 비디오 브라우징 시스템에서 앵커 샷 자동 검출 방법
JP2002344925A (ja) * 2001-05-15 2002-11-29 Sony Corp 動画像配信装置、動画像配信方法、動画像配信プログラム、動画像配信プログラム格納媒体、画像指定装置、画像指定方法、画像指定プログラム及び画像指定プログラム格納媒体及び動画像提供システム
KR100411437B1 (ko) * 2001-12-28 2003-12-18 엘지전자 주식회사 지능형 뉴스 비디오 브라우징 시스템
AUPS170902A0 (en) * 2002-04-12 2002-05-16 Canon Kabushiki Kaisha Face detection and tracking in a video sequence
US8238718B2 (en) * 2002-06-19 2012-08-07 Microsoft Corporaton System and method for automatically generating video cliplets from digital video
GB2395778A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Face detection
US20050033758A1 (en) * 2003-08-08 2005-02-10 Baxter Brent A. Media indexer
US20060251382A1 (en) * 2005-05-09 2006-11-09 Microsoft Corporation System and method for automatic video editing using object recognition

Also Published As

Publication number Publication date
US20070237360A1 (en) 2007-10-11
JP2007281858A (ja) 2007-10-25
CN101051389B (zh) 2011-06-15
CN101051389A (zh) 2007-10-10
US8204312B2 (en) 2012-06-19

Similar Documents

Publication Publication Date Title
JP4765732B2 (ja) 動画編集装置
KR100827846B1 (ko) 동영상에 포함된 특정 인물을 검색하여 원하는 시점부터재생하기 위한 방법 및 시스템
JP4797761B2 (ja) 動画表示装置
US9881215B2 (en) Apparatus and method for identifying a still image contained in moving image contents
JP5247356B2 (ja) 情報処理装置およびその制御方法
US8692940B2 (en) Method for producing a blended video sequence
US9014537B2 (en) Information processing apparatus and method, and program
JP5106271B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
US20130236162A1 (en) Video editing apparatus and method for guiding video feature information
JP4909840B2 (ja) 映像処理装置、プログラムおよび方法
JP5483863B2 (ja) 情報処理装置およびその制御方法
JP2010518673A (ja) ビデオの索引付けとビデオシノプシスのための、方法およびシステム
JP4536940B2 (ja) 画像処理装置、画像処理方法、記憶媒体、及びコンピュータプログラム
KR101440168B1 (ko) 개요 및 리포트를 이미 포함하는 시청각 도큐먼트의 새로운 개요를 생성하기 위한 방법 및 상기 방법을 구현할 수 있는 수신기
CN110502117B (zh) 电子终端中的截图方法以及电子终端
US10146870B2 (en) Video playback method and surveillance system using the same
JP2018081630A (ja) 検索装置、検索方法およびプログラム
WO2014065033A1 (ja) 類似画像検索装置
JP6214762B2 (ja) 画像検索システム、検索画面表示方法
JP6373446B2 (ja) ビデオフレームを選択するプログラム、システム、装置、及び方法
JP5850188B2 (ja) 画像表示システム
JP4835545B2 (ja) 画像再生装置、撮像装置、および画像再生方法、並びにコンピュータ・プログラム
JP2008020944A (ja) 画像処理方法、プログラムおよび装置
JP2001022780A (ja) 動画像へのキーワード付与方法、装置、およびキーワード付与プログラムを記録した記録媒体
JP2015082691A (ja) 映像編集装置、映像編集方法、および、映像編集プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

R150 Certificate of patent or registration of utility model

Ref document number: 4765732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees