JP2012222651A - 映像再生装置、映像再生方法、および映像再生プログラム - Google Patents

映像再生装置、映像再生方法、および映像再生プログラム Download PDF

Info

Publication number
JP2012222651A
JP2012222651A JP2011087363A JP2011087363A JP2012222651A JP 2012222651 A JP2012222651 A JP 2012222651A JP 2011087363 A JP2011087363 A JP 2011087363A JP 2011087363 A JP2011087363 A JP 2011087363A JP 2012222651 A JP2012222651 A JP 2012222651A
Authority
JP
Japan
Prior art keywords
coordinates
frame image
search
video
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011087363A
Other languages
English (en)
Inventor
Takashi Sato
隆 佐藤
Mitsuhiro Goto
充裕 後藤
Takeshi Irie
豪 入江
Akira Kojima
明 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011087363A priority Critical patent/JP2012222651A/ja
Publication of JP2012222651A publication Critical patent/JP2012222651A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。
【解決手段】複数のフレーム画像からなる映像データを記憶する映像記憶手段16と、ユーザが入力した初期座標と、ユーザが初期座標を移動させた移動座標とを受け付ける入力手段12と、所定の時点のフレーム画像上で入力された初期座標の周辺の画像データを探索パターンとし、所定の時点の前後の各フレーム画像において、移動座標の周辺の探索領域の中から、探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段14と、探索した各フレーム画像の類似データ領域の座標の中で、移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段13と、選択したフレーム画像を表示する表示手段11とを備える。
【選択図】図1

Description

本発明は、映像を再生する映像再生装置、映像再生方法、および映像再生プログラムに関する。
コンピュータを用いてデジタル映像を再生する上で、単に映像を先頭から再生して流し見するだけでなく、好きな部分をインタラクティブに巻き戻し・早送り・コマ送りして再生する方法がある。
従来の映像再生方法としては、スライダーのGUI(Graphical User Interface)を用いて、再生する映像のフレームを選ぶものがある。例えば、図7に示すように、マウスやタッチパネル等のポインティングデバイスを用いて、スライダー上のツマミを左右に動かすことによって、フレームを前後にコマ送りし、所望のフレーム画像を表示する。
また、特許文献1には、あらかじめ被写体の動きに合った折れ線型のスライダーを定義し、映像の中に配置しておくことによって、あたかも被写体を動かしているかのように、映像をコマ送り再生する方法が記載されている。
また、非特許文献1には、Particle Video(非特許文献2参照)等の動き検出技術を用いて、画面上の多数の点(パーティクル)の動きをあらかじめ追跡しておき、ポインティングデバイスからの入力座標の動きに一番近い動きに相当するフレームを選択することで、映像再生を実現する方法が記載されている。
また、非特許文献3では、あらかじめSIFT特徴点の追跡により被写体の動きを検出し、検出した被写体の動きを用いて映像再生を実現する方法が記載されている。
特許第3325859号公報
Goldman, D.B., Curless, B., Salesin D., Seitz, S.M., "Interactive Video Object Annotation", Tech Report UW-CSE-2007-04-01, 2007. Sand, P., and Teller, S., "Particle video: LOng-range motion estimation using point trajectories", CVPR'06 2006. Dragicevic, P., Ramos, G., Bibliowitcz, J. Nowrouzezahrai, D., Balakrishnan, R., and Singh, K, "Video Browsing by Direct Manipulation", CHI'08, 2008
以上の従来技術では、あらかじめ被写体の動きに対応した折れ線型のスライダーを設定し、もしくは、被写体の動きを検出しておく必要がある。このため、折れ線型のスライダーを編集する作業負荷が発生し、もしくは、被写体の動きを計算するための計算コストがかかるという問題がある。
本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする映像再生装置、映像再生方法、および映像再生プログラムを提供することにある。
上記目的を達成するため、本発明は、映像再生装置であって、複数のフレーム画像からなる映像データを記憶する映像記憶手段と、ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力手段と、所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段と、前記パターン探索手段が探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段と、前記フレーム画像選択手段が選択したフレーム画像を表示する表示手段と、を備える。
また、本発明は、映像再生装置が行う映像再生方法であって、前記映像再生装置は、複数のフレーム画像からなる映像データを記憶する映像記憶部と、ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力ステップと、所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索ステップと、前記パターン探索ステップで探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択ステップと、前記フレーム画像選択ステップで選択されたフレーム画像を表示する表示ステップと、を行う。
また、本発明は、前記映像再生装置としてコンピュータを機能させるための映像再生プログラムである。
本発明によれば、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする映像再生装置、映像再生方法、および映像再生プログラムを提供することができる。
本発明の実施形態に係る映像再生装置の構成図である。 表示部に表示されたゴルフプレーヤのフレーム画像の一例を示す図である。 本実施形態の動作を示すフローチャートである。 探索パターンと探索ウィンドウを説明する説明図である。 ブロックマッチング法を説明する説明図である。 初期状態のフレーム画像と、移動後のフレーム画像の一例を示す図である。 従来のスライダーを説明するための説明図である。
以下、本発明の実施の形態について、図面を参照して説明する。
図1は、本発明の実施形態に係る映像再生装置の構成を示す構成図である。本実施形態の映像再生装置は、映像データを表示する表示部11と、例えばマウスやタッチパネルなどのユーザの指示を受け付ける入力部12と、フレーム画像選択部13と、パターン探索部14と、フレーム画像復号部15と、デジタル化された映像データを記憶する映像記憶部16と、記憶部17とを備える。
映像記憶部16に記憶される映像データは、複数のフレーム画像から構成される動画データである。なお、本実施形態の映像データは、例えばMPEGなどの所定の圧縮方式を用いて圧縮し、映像記憶部16に記憶されているものとする。
フレーム画像復号部15は、映像記憶部16に圧縮して記憶された映像データのフレーム画像を復号する。
入力部12は、ユーザが入力した初期座標と、ユーザが初期座標を移動させた移動座標とを受け付ける。
パターン探索部14は、所定の時点のフレーム画像上で入力された初期座標の周辺の画像データを探索パターンとし、所定の時点の前後の各フレーム画像において、移動座標の周辺の探索領域の中から、探索パターンに最も類似する類似データ領域の座標を探索する。なお、本実施形態では、探索方法として、ブロックマッチング法を用いるものとする。
フレーム画像選択部13は、パターン探索部14が探索した各フレーム画像の類似データ領域の座標の中で、移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択する。表示部11は、フレーム画像選択部13が選択したフレーム画像を表示する。
以上説明した映像再生装置は、例えば、CPUと、メモリと、HDD等の外部記憶装置と、入力装置と、出力装置とを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた映像再生装置用のプログラムを実行することにより、映像再生装置の各機能が実現される。また、映像再生装置のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。また、映像再生装置は、専用ハードウェア上で動作することとしてもよい。
次に、本実施形態の動作について説明する。
本実施形態では、映像再生操作をするユーザの知識や経験、期待、操作履歴などを活用し、計算コストを削減しながら、直感的な映像再生を可能にする。ユーザは映像を見ると、被写体がどのように動くのかを期待する。たとえば、ゴルフプレーヤの映像の場合、ゴルフクラブを振り回すであろうと期待する。実際にユーザの行動を観察すると、期待する動きをなぞるように操作することが多い。そこで、本実施形態では、ユーザの操作を手がかりとして、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。
ここでは、映像記憶部16には、ゴルフプレーヤのスイング映像が記憶されおり、表示部11には、当該スイング映像の中の図2に示す所定のフレーム画像が表示されている場合を例に、本実施形態の動作を説明する。
図示するフレーム画像上で、ユーザは、入力部12を用いて、ゴルフプレーヤの手の部分の座標I1を初期座標として入力するものとする。図示する例では、矢印で表示したカーソルを操作することで、初期座標I1(矢印の先端座標)を入力する。そして、ユーザが、入力部12を用いて、初期座標I1を右上の移動座標I2方向に移動(ドラッグ)した場合の動作を説明する。
図3は、本実施形態の映像再生装置の動作を示すフローチャートである。
ここでは、表示部11に図2に示すフレーム画像(静止画)が表示されており、この状態でユーザは、初期座標I1を入力する。これにより、映像再生装置のフレーム画像選択部13は、初期化処理として、現時点で表示されているフレーム画像のフレーム番号nと、ユーザが入力した初期座標In(I1)と、現時点で表示されているフレーム画像上の探索パターンRnとを、記憶部17に記憶する(S11)。
探索パターンRnは、図4に示すように、初期座標In(I1)の周辺領域の画像データである。図4に示す探索パターンRnは、初期座標In(I1)を中心とした、所定のサイズの矩形領域の画像データである。
そして、ユーザは、入力部12を用いて初期座標In(I1)に設定されたカーソルを所望の位置に移動する。このカーソルの移動操作(ドラッグ)により、カーソルが順次移動した位置(移動座標)に応じて、S13からS17の処理が繰り返し行われ(S12)、対応するフレーム画像がコマ送りで再生される。
すなわち、フレーム画像選択部13は、カーソルの移動操作により、移動されたことを検知すると、現時点でのカーソルの位置を示す移動座標Ic(I)を、記憶部17に記憶する(S13)。
そして、フレーム画像選択部13は、S11で記憶部17に記憶したフレーム番号nの前後のフレーム番号(d=n±1、n±2、・・・、n±D)の各フレーム画像(探索フレーム画像)について、S15およびS16の処理を、フレーム画像復号部15およびパターン探索部14を用いて、繰り返し行う(S14)。
まず、フレーム画像復号部15は、フレーム画像選択部13が指示したフレーム番号dのフレーム画像Fdを、映像記憶部16から読み出し、復号する(S15)。
そして、パターン探索部14は、フレーム画像復号部15が復号したフレーム画像Fdから、S11で記憶部17に記憶した探索パターンRnの画像データに最も類似する画像データの領域の位置を探索する(S16)。探索方法としては、本実施形態ではブロックマッチング法を用いることとする。
ブロックマッチング法は、図5に示すように、所定のサイズの探索ウィンドウを設定し、当該探索ウィンドウの中で探索ブロックを1ピクセルずつずらしながら走査して、探索対象の画像データ(探索パターンRn)と最も類似する画像データの探索ブロックの位置を調べる方法である。
図2に示すフレーム画像の場合、図4に示すように移動された移動座標Ic(I)の周辺を探索ウィンドウとして設定する。図4に示す探索ウィンドウは、移動座標Ic(I)を中心とした、所定のサイズの矩形領域の画像データである。なお、探索ウィンドウのサイズは、探索パターンRnのサイズより大きい。
そして、図5で説明したように、探索パターンRnと同じサイズの探索ブロックを、探索ウィンドウの左上から1ピクセルずつずらしながら走査していき、探索パターンRnの画像データと最も類似する画像データ(類似データ)の探索ブロックの位置(中心座標)Odを取得する。
なお、パターン探索部14は、探索パターンRnとの類似度を判定するために、比較する2つの画像データ(探索パターンRnの画像データと、探索ブロックの画像データ)の間の距離として、輝度の差の絶対値の和や、差の二乗和を用いることが考えられる。すなわち、以下の式により、輝度の差の絶対値の和、差の二乗和を算出する。
輝度の差の絶対値の和=Σ|P−P
輝度の差の二乗和=Σ(P−P
ここで、PとPは、比較する2つの画像データの特定の画素の輝度値を表す。このほか、RGB成分の差の絶対値の和や2乗和や、輝度色ヒストグラムの差の絶対値の和または2乗和等を、画像データ間の距離として用いてもよい。いずれの距離を用いるにせよ、ブロックマッチング法では、探索ウィンドウの中で、最も距離の小さくなる探索ブロックの位置(中心座標)Odを検出する。
このように、フレーム番号nの前後のフレーム番号の各フレーム画像毎にS15およびS16を繰り返し行うことで、フレーム画像選択部13は、探索パターンRnと最も類似する探索ブロックの位置(中心座標)Odを、各フレーム画像毎に取得する。
そして、フレーム画像選択部13は、各フレーム毎の最も類似する探索ブロックの位置(中心座標)Odと、S13で記憶部17に記憶した移動座標Ic(I)との距離をそれぞれ算出し、移動座標Ic(I)に最も近い位置(中心座標)Odの探索ブロックのフレーム画像を選択し、選択したフレーム画像を表示部11に出力する(S17)。
これにより、図6に示すように、S11で表示部11に表示されたフレーム番号nのフレーム画像(図6(a))において、ユーザが初期座標I1を入力し、当該フレーム画像(図6(a))上でカーソルを右上の移動座標Iに移動させることで、初期座標I1が示す箇所の画像(ゴルフプレーヤの手)が、移動座標Iに移動したフレーム画像(図6(b))を自動的に検索し、表示する。これにより、ユーザは、あたかもゴルフプレーヤの手を直接つかんで動かしているかのように直感的に映像データを再生することができる。
なお、ユーザのカーソルの移動操作(ドラッグ)により、カーソルの各位置(移動座標)に応じてS13からS17のループ処理が行われるため、例えば図6に示すフレーム画像において、ユーザが、初期位置I1から右上の方向にカーソルを移動させていくと、連続的なフレーム画像が、ユーザの操作速度と同じ速度で表示部11に順次再生される。
以上説明した本実施形態では、ユーザの操作開始時点の初期座標の周辺の画像データを探索パターンとし、前後の各フレーム画像において、移動座標の周辺の探索ウィンドウの中から、探索パターンに最も類似する探索ブロックの座標を探索し、探索した各フレーム画像の最も類似する探索ブロックの座標の中で、移動座標と最も近い距離の探索ブロックを有するフレーム画像を、次に表示すべきフレーム画像として選択する。
これにより、本実施形態では、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。すなわち、被写体の動きに基づくインタラクティブな映像再生を実現する上で、あらかじめ映像中の被写体の動きを検出しなくても、ユーザの期待に基づく操作を活用して、ユーザの操作する近傍の画像データのみを探索すれば済むため、計算コストを削減することができる。
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。例えば、上記実施形態の本映像装置を、PCなどのコンピュータだけでなく、デジタルカメラ、カメラ付き携帯電話、スマートフォンなどで動作させてもよい。
また、上記実施形態では、映像再生装置が単体で、映像生成を行うこととしたが、サーバー・クライアント構成を適用し、サーバ側に計算コストが比較的高いパターン探索部やフレーム画像選択部を備え、クライアント側では、サーバ側から送信される処理結果の画像フレームを表示することとしてもよい。
また、上記実施形態では、映像データは圧縮して映像記憶部16に記憶されることとしたが、圧縮しない状態で映像記憶部16に記憶されることとしてもよい。この場合、映像再生装置は、フレーム画像復号部15を備えなくてもよい。
11:表示部
12:入力部
13:フレーム画像選択部
14:パターン探索部
15:フレーム画像復号部
16:映像記憶部
17:記憶部

Claims (7)

  1. 映像再生装置であって、
    複数のフレーム画像からなる映像データを記憶する映像記憶手段と、
    ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力手段と、
    所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段と、
    前記パターン探索手段が探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段と、
    前記フレーム画像選択手段が選択したフレーム画像を表示する表示手段と、を備えること
    を特徴とする映像再生装置。
  2. 請求項1記載の映像再生装置であって、
    前記パターン探索手段は、ブロックマッチング法を用いて、前記探索パターンに最も類似する類似データ領域の座標を探索すること
    を特徴とする映像再生装置。
  3. 請求項1記載の映像再生装置であって、
    前記映像記憶手段に記憶された映像データのフレーム画像を復号するフレーム画像復号手段をさらに備えること
    を特徴とする映像再生装置。
  4. 映像再生装置が行う映像再生方法であって、
    前記映像再生装置は、
    複数のフレーム画像からなる映像データを記憶する映像記憶部を備え、
    ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力ステップと、
    所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索ステップと、
    前記パターン探索ステップで探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択ステップと、
    前記フレーム画像選択ステップで選択されたフレーム画像を表示する表示ステップと、を行うこと
    を特徴とする映像再生方法。
  5. 請求項4記載の映像再生方法であって、
    前記パターン探索ステップは、ブロックマッチング法を用いて、前記探索パターンに最も類似した類似データ領域の座標を探索すること
    を特徴とする映像再生方法。
  6. 請求項4記載の映像再生方法であって、
    前記映像記憶部に記憶された映像データのフレーム画像を復号するフレーム画像復号ステップをさらに行うこと
    を特徴とする映像再生方法。
  7. 請求項1から請求項3のいずれか一項に記載の映像再生装置としてコンピュータを機能させるための映像再生プログラム。
JP2011087363A 2011-04-11 2011-04-11 映像再生装置、映像再生方法、および映像再生プログラム Withdrawn JP2012222651A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011087363A JP2012222651A (ja) 2011-04-11 2011-04-11 映像再生装置、映像再生方法、および映像再生プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011087363A JP2012222651A (ja) 2011-04-11 2011-04-11 映像再生装置、映像再生方法、および映像再生プログラム

Publications (1)

Publication Number Publication Date
JP2012222651A true JP2012222651A (ja) 2012-11-12

Family

ID=47273685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011087363A Withdrawn JP2012222651A (ja) 2011-04-11 2011-04-11 映像再生装置、映像再生方法、および映像再生プログラム

Country Status (1)

Country Link
JP (1) JP2012222651A (ja)

Similar Documents

Publication Publication Date Title
US9690388B2 (en) Identification of a gesture
US8379098B2 (en) Real time video process control using gestures
US9313444B2 (en) Relational display of images
US9270928B2 (en) Video-previewing methods and systems for providing preview of a video and machine-readable storage mediums thereof
US9275275B2 (en) Object tracking in a video stream
US20170068850A1 (en) Image processing apparatus and program
US9240066B2 (en) Methods and apparatuses for facilitating skeletal animation
US20130300750A1 (en) Method, apparatus and computer program product for generating animated images
JP2007072564A (ja) マルチメディア再生装置、メニュー操作受付方法およびコンピュータプログラム
JP6949612B2 (ja) 動画再生装置およびその制御方法、並びにプログラム
JP2021013095A (ja) 画像処理装置、表示方法、及び、プログラム
JP2011250095A (ja) 電子機器、映像編集方法及びプログラム
JP2012222653A (ja) 映像再生装置、映像再生方法、および映像再生プログラム
US9502076B2 (en) Cue point control apparatus and recording medium that facilitate search of cue point during playback
JP2012222651A (ja) 映像再生装置、映像再生方法、および映像再生プログラム
JP2016039496A (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
JP2014164652A (ja) 画像編集装置、画像編集方法、および画像編集プログラム
KR101610952B1 (ko) 사용자 제스처 기반의 영상 재생 장치 및 그 동작 방법
JP5844697B2 (ja) 映像再生装置、映像再生方法、および映像再生用プログラム
CN113132778A (zh) 播放视频的方法、装置、电子设备和可读存储介质
US10347297B2 (en) Moving picture playback method, moving picture playback program, and moving picture playback apparatus
JP6842194B2 (ja) 表示制御装置、表示制御方法及び表示制御プログラム
JP3941808B2 (ja) 動画像の変化点検出方法及び装置
JP2011085899A (ja) 画像表示装置及び画像表示方法
JP6214365B2 (ja) 画像再生装置、その制御方法、および制御プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140701