JPWO2013146508A1 - 画像処理装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JPWO2013146508A1
JPWO2013146508A1 JP2014507772A JP2014507772A JPWO2013146508A1 JP WO2013146508 A1 JPWO2013146508 A1 JP WO2013146508A1 JP 2014507772 A JP2014507772 A JP 2014507772A JP 2014507772 A JP2014507772 A JP 2014507772A JP WO2013146508 A1 JPWO2013146508 A1 JP WO2013146508A1
Authority
JP
Japan
Prior art keywords
frame
moving image
image
transition
frame sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014507772A
Other languages
English (en)
Other versions
JP5999454B2 (ja
Inventor
英史 山田
英史 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2013146508A1 publication Critical patent/JPWO2013146508A1/ja
Application granted granted Critical
Publication of JP5999454B2 publication Critical patent/JP5999454B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2625Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of images from a temporal image sequence, e.g. for a stroboscopic effect
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • G06T3/18
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4007Interpolation-based scaling, e.g. bilinear interpolation

Abstract

本技術は、より高品質なループ動画像を得ることができるようにする画像処理装置および方法、並びにプログラムに関する。フレーム列決定部は、入力された素材動画像から遷移元フレーム列と遷移先フレーム列を抽出し、部分フレーム列決定部は、遷移先フレーム列から、長さが異なるいくつかの部分フレーム列を抽出する。マッチング処理部は、遷移元フレーム列と部分フレーム列とのDPマッチングを行なって、互いに対応するフレームのペアを定め、ブレンド処理部は、各フレームペアの画像をブレンドすることで、遷移元フレーム列の画像から、遷移先フレーム列の画像へと遷移していく遷移期間のフレーム列を生成する。ループ動画像生成部は、素材動画像と遷移期間のフレーム列とに基づいて、ループ動画像を生成する。本技術は、画像処理装置に適用することができる。

Description

本技術は画像処理装置および方法、並びにプログラムに関し、特に、より高品質なループ動画像を得ることができるようにした画像処理装置および方法、並びにプログラムに関する。
例えば、ビデオ映像素材からループ動画像を生成して提示するビデオテクスチャ技法が知られている。ビデオテクスチャ技法とは、数秒間のビデオ素材を繰り返し再生した場合に、繰り返しの映像のつなぎ目が目立たないように画像処理してループ動画像を生成する方法である。
このようなループ動画像は、1回分の繰り返しを記録したビデオ映像で、再生時にループ動画像の終わりのフレームと始まりのフレームを途切れなく再生することで、あたかも無限長のビデオ映像のように提示することができる。また、ループ動画像は、1回分の繰り返しのビデオ映像データだけを保存しておけばよいので、記憶容量や転送時間を節約することができる。
例えば、滝の流れる風景や風にたなびく旗など、周期のあるような映像であれば、ループ動画像として映像を繰り返し再生しても視聴者が違和感なく鑑賞することができる。そのため、ループ動画像は、デジタルフォトフレーム上での鑑賞やウェブサイトの広告動画像、パーソナルコンピュータ画面の背景動画像などの用途に適している。
このループ動画像を自動で生成する方法として、例えば非特許文献1に記載されたビデオテクスチャ技法が知られている。ビデオテクスチャ技法では、ループ動画像の繰り返しの再生区間、および遷移フレーム画像が自動で計算される。
具体的には、ビデオ映像に含まれる各フレーム画像について、任意の2つのフレーム画像の類似度が計算される。そして、計算された類似度の最も高いフレーム画像のペアが繰り返し再生のイン点とアウト点とされて、それらの両点の間が繰り返し再生されるようにループ動画像が生成される。このとき、イン点とアウト点の前後の遷移期間において、イン点とアウト点のつなぎ目が目立たないように、ビデオ映像のクロスフェード処理が行なわれる。
Video Textures, Arno Schodl, Richard Szeliski, David H. Salesin, Irfan Essa, Proceedings of SIGGRAPH 2000, pages 489-498, July 2000
しかしながら、上述した技術では、充分に高品質なループ動画像を得ることができない場合があった。
例えば、上述したビデオテクスチャ技法では、周期性のない動きが含まれるビデオ映像がループ動画像の素材とされた場合、類似度の高いイン点とアウト点がみつからないために、繰り返し再生時のつなぎ目が明らかになってしまうことがあり、好ましくない。そのため、より多様なビデオ映像素材に対応できるようなループ動画像の生成手法が望まれている。
本技術は、このような状況に鑑みてなされたものであり、より高品質なループ動画像を得ることができるようにするものである。
本技術の一側面の画像処理装置は、第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理装置であって、前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索するマッチング処理部と、時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置する再配置処理部と、再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成するブレンド処理部とを備える。
時系列に並ぶ複数の前記フレームペアの前記第1の動画像のフレームと前記第2の動画像のフレームは、それぞれ時系列の昇順または降順に並ぶようにすることができる。
前記再配置処理部には、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差と前記第2の動画像のフレームの時間差とを重み付き加算して得られる時間差で、互いに隣接する前記フレームペアが配置されるように、前記再配置を行なわせることができる。
前記重み付き加算に用いられる前記第1の動画像のフレームの時間差の重みを、互いに隣接する前記フレームペアの各前記第1の動画像のフレームの重みの平均値とし、前記第1の動画像の各フレームの重みを、前記第1の動画像の先頭側にあるフレームほど大きくなるように定められるようにすることができる。
前記マッチング処理部には、所定の前記フレームペアを起点として、前記第1の動画像に対する前記第2の動画像の再生速度を変化させたときに、同時に提示されるべき前記第1の動画像と前記第2の動画像のフレームのペアの前記類似の度合いに基づいて、いくつかの前記再生速度のフレームのペアのうちの何れかを前記所定の前記フレームペアに隣接する前記フレームペアとさせることができる。
前記マッチング処理部には、互いに長さの異なる複数の前記第1の動画像について、時系列に並ぶ複数の前記フレームペアを求めさせ、前記ブレンド処理部には、前記第1の動画像ごとに求めた複数の前記フレームペアのうち、各フレームについての前記類似の度合いに基づく評価が最も高いものを用いて前記遷移動画像を生成させることができる。
画像処理装置には、前記遷移動画像に基づいてループ動画像を生成するループ動画像生成部をさらに設けることができる。
本技術の一側面の画像処理方法またはプログラムは、第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理方法またはプログラムであって、前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索し、時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置し、再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成するステップを含む。
本技術の一側面においては、第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理において、前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアが探索され、時系列に並ぶ複数の前記フレームペアが、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置され、再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像が生成される。
本技術の一側面によれば、より高品質なループ動画像を得ることができる。
ビデオテクスチャ技法によるループ動画像の生成について説明する図である。 二次元差分値行列について説明する図である。 二次元差分値行列と遷移コストについて説明する図である。 DPマッチングによる最小コスト経路の探索について説明する図である。 DPマッチングによる最小コスト経路の探索について説明する図である。 DP平面におけるエッジの傾斜制限について説明する図である。 エッジ長を考慮したコストの算出について説明する図である。 ブレンド処理について説明する図である。 逆転再生を含むループ動画像の生成について説明する図である。 画像処理装置の構成例を示す図である。 ループ動画像生成処理について説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
[ループ動画像の生成について]
まず、ビデオテクスチャ技法によるループ動画像の生成について説明する。
なお、ここではループ動画像の素材となる動画像(ビデオ映像)は1つであり、1つの動画像内から繰り返し再生される区間を決定してループ動画像を生成するものとする。
例えば、図1に示すように、動画像MT11が素材として与えられ、この動画像MT11が用いられてループ動画像LP11が生成されるとする。
なお、図1において、動画像MT11やループ動画像LP11を表す長方形内の複数の長方形のそれぞれは、1つのフレームの画像を表している。また、図1では、図中、左端にあるフレームが、フレーム番号が最も小さいフレームとなっており、通常の再生時には、左端のフレームから右端のフレームまで順番に再生されていく。例えば、動画像MT11の図中、左端のフレームが1番目のフレームであり、そのフレームの右側に隣接するフレームが2番目のフレームである。
ビデオテクスチャ技法では、2つのステップの処理によりループ動画像が生成される。
まず、第1のステップでは、動画像MT11のなかから、遷移元のフレーム列と、遷移先のフレーム列の2つのフレーム列が決定される。つまり、遷移元と遷移先の各フレーム列(区間)のイン点とアウト点の対応が決定される。
図1の例では、動画像MT11における5つのフレームからなる区間が遷移元のフレーム列TS11とされ、動画像MT11におけるフレーム列TS11より前にある5つのフレームからなる区間が遷移先のフレーム列TD11とされている。
ここで、フレーム列TS11とフレーム列TD11において、それらのフレーム列の先頭のフレームおよび最後のフレームが、それぞれイン点およびアウト点である。
すなわち、フレーム列TS11では、先頭のフレームFSinがイン点であり、最後のフレームFSoutがアウト点である。また、フレーム列TD11では、先頭のフレームFDinがイン点であり、最後のフレームFDoutがアウト点である。
フレーム列TS11とフレーム列TD11は、それらのフレーム列の同じ位置にあるフレームの画像が互いに類似した画像となるように定められる。通常、遷移元のフレーム列TS11は、素材となる動画像MT11の終端付近から選択され、遷移先のフレーム列TD11は、動画像MT11の開始端付近から選択される。
また、第2のステップでは、動画像MT11のフレームFDinからフレームFSoutまでの区間の画像データに基づいて、ループ動画像LP11が生成される。
具体的には、遷移元のフレーム列TS11と遷移先のフレーム列TD11とがブレンド処理されて、ループ動画像LP11の後半の区間、すなわち遷移期間Trの各フレームの画像が生成される。ブレンド処理では、フレーム列TS11とフレーム列TD11の同じ位置にあるフレームの画像が重み付き加算されて、ループ動画像LP11の遷移期間Trの各フレームの画像とされる。
したがって、例えば遷移期間Trの先頭のフレームFBinの画像は、遷移元のフレーム列TS11における先頭のフレームFSinの画像と、遷移先のフレーム列TD11における先頭のフレームFDinの画像とをブレンドして得られた画像である。
また、ループ動画像LP11の遷移期間Trの最後のフレームFBoutの画像は、遷移元のフレーム列TS11における最後のフレームFSoutの画像と、遷移先のフレーム列TD11における最後のフレームFDoutの画像とをブレンドして得られた画像である。
このようなブレンド処理により得られる遷移期間Trは、各フレームの画像が、遷移元のフレーム列TS11の画像から、遷移先のフレーム列TD11の画像へと徐々に変化(遷移)していく画像となる。
さらに、動画像MT11におけるフレームFDoutとフレームFSinの間にある区間NT11が、そのままループ動画像LP11の前半の区間Tnとされ、区間Tnと遷移期間Trとからなるループ動画像LP11が得られる。
ループ動画像LP11の再生時には、区間Tnの先頭のフレームから遷移期間Trの最後のフレームまで順番に再生された後、再び区間Tnの先頭のフレームに戻り、ループ動画像LP11を構成する各フレームが繰り返し再生される。
なお、ループ動画像LP11の生成時には、遷移に要するフレーム数、すなわち遷移期間Trのフレーム数は予めパラメータとして与えられている。また、ループ動画像LP11の最小の長さである最小ループ動画像長Tr_min、すなわちフレームFDinからフレームFSinまでの区間の最小距離制約も、予めパラメータとして与えられている。
次に、遷移元のフレーム列TS11と遷移先のフレーム列TD11のイン点およびアウト点を決定する方法について説明する。
まず、入力された素材となる動画像を構成する任意のi番目のフレームiの画像Fiと、j番目のフレームjの画像Fjについて、それらの画像の差分値D(i,j)が計算される。すなわち、次式(1)の計算が行なわれる。
Figure 2013146508
なお、式(1)において、F(x,y)は、画像Fiの位置(x,y)にある画素の画素値を示しており、F(x,y)は、画像Fjの位置(x,y)にある画素の画素値を示している。したがって、式(1)では、画像Fiと画像Fjの全ての画素について、画像Fiと画像Fjの同じ位置にある画素の画素値の差分の二乗値が求められ、それらの二乗値の総和(積算値)がフレームiとフレームjの差分値D(i,j)とされる。
この差分値D(i,j)は、フレームiの画像Fiと、とフレームjの画像Fjとの類似の度合いを示しており、それらの画像が類似しているほど差分値D(i,j)の値は小さくなる。
ループ動画像の生成時には、素材となる動画像を構成する全ての(i,j)の組み合わせについて差分値D(i,j)が求められ、それらの差分値D(i,j)が二次元差分値行列MDとして保存される。
ここで、二次元差分値行列MDは、例えば図2に示すように、図中、縦方向をi軸とし、横方向をj軸として、位置(i,j)の要素の値が差分値D(i,j)となる行列である。なお、図2において、各正方形は、二次元差分値行列MDの各要素を表しており、要素を表す正方形の濃度が濃いほど、その要素の値、つまり差分値D(i,j)の値は小さくなっている。
例えば、二次元差分値行列MDの図中、右下方向の対角線上にある各要素では、フレームiとフレームjは同じフレームとなるので、それらの要素の値(差分値D(i,j))は0となっている。また、フレームiとフレームjは、同じ動画像を構成するフレームであるので、二次元差分値行列MDは、直線i=jに関して対称となっている。
このようにして二次元差分値行列MDが得られると、次に二次元差分値行列MD上で連続して並ぶ要素列について、次式(2)の計算が行なわれ、遷移コストC(i,j)が算出される。
Figure 2013146508
なお、式(2)において、Trは、図1を参照して説明した遷移期間Trのフレーム数から1を減じた数を示している。したがって、式(2)では、位置(i,j)から位置(i+Tr,j+Tr)までの差分値D(i,j)の総和が遷移コストC(i,j)として求められる。
例えば、Tr=4である場合、図2の位置(i,j)=(i1,j1)に注目すると、領域RC11内に含まれる5つの各要素の値である差分値D(i,j)の和が、位置(i1,j1)についての遷移コストC(i1,j1)となる。
ここで、領域RC11内に含まれる要素列は、位置(i1,j1)の要素を先頭として図中、右斜め下方向に隣接して並ぶ5つの要素の列である。
例えば、フレームiが図1のフレームFSinであるとすると、フレームi乃至フレーム(i+Tr)は、それぞれフレーム列TS11を構成するフレームFSin乃至フレームFSoutとなる。また、フレームjが図1のフレームFDinであるとすると、フレームj乃至フレーム(j+Tr)は、それぞれフレーム列TD11を構成するフレームFDin乃至フレームFDoutとなる。
この場合、位置(i,j)についての遷移コストC(i,j)は、フレーム列TS11とフレーム列TD11の同じ位置にあるフレームの差分値D(i,j)の総和となる。
したがって、遷移コストC(i,j)は、フレーム列TS11とフレーム列TD11との類似の度合いを示しているということができる。そのため、遷移コストC(i,j)が最小となる位置(i,j)を求めて、そのフレーム位置を先頭とする区間を遷移元および遷移先のフレーム列とすれば、つなぎ目の目立ちにくいループ動画像を得ることができる。
そこで、ループ動画像の生成時には、各位置(i,j)のうち、遷移コストC(i,j)が最小となる位置(i,j)が求められ、得られた位置(i,j)により示されるフレームi,jが、それぞれイン点であるフレームFSin,FDinとされる。
なお、より詳細には、二次元差分値行列MD上の各位置(i,j)のうち、最小ループ動画像長Tr_minにより定まる領域、具体的にはi=jである要素近傍の領域は、遷移コストC(i,j)が最小となる位置(i,j)の検出の対象外とされる。
また、ビデオテクスチャ技法では、遷移コストC(i,j)の算出時に、単純に各位置の差分値D(i,j)を積算するのではなく、イン点とアウト点の中間位置を最大値として両端点へ徐々に減衰する重みを付加した差分値D(i,j)の重み付き積算値を遷移コストC(i,j)とする方法も提案されている。
さて、以上において説明したビデオテクスチャ技法においては、素材として入力された動画像から、類似したフレーム列を探し出して繰り返し遷移点、つまりイン点とアウト点としたが、実際の映像で2つのフレーム列の画像が一致することは稀である。
例えば、素材となる動画像内の2つの区間で、被写体の動きが似たような動きであっても動きの速度が異なったり、そもそも周期的な動きが素材となる動画像に含まれていなかったりすることもある。そのような場合、素材となる動画像からループ動画像を生成したとしても、ループ動画像の繰り返し再生時に、先頭フレームと終了フレームとのつなぎ目がはっきりと認識できてしまうようになる。
そのため、より高品質なループ動画像を得るためには、素材となる動画像の類似する2つの区間で、被写体の動きの速度が異なるのであれば、速度まで考慮に入れて遷移点を決定し、各フレームの画像に対するブレンド処理を行なうことが望ましい。また、被写体の動きが周期的でない動きであっても、動画像を逆転再生する場合も遷移元または遷移先のフレーム列の候補に含めれば、より適切な遷移点が見つかる可能性がある。
ここで、考慮する再生速度をN倍速とすると、前者は再生速度を速くしたり遅くしたりする場合、つまりNが0以上の速度を考えることに相当し、後者の逆転再生はNが負となる場合であると考えることができる。
例えば、図3に示すように、二次元差分値行列MDでの表現では、1倍再生でないフレーム列の遷移コストC(i,j)は、図中、右下がりの45度でない方向に並ぶ要素の差分値D(i,j)の積算に相当する。また、逆転再生のフレーム列の遷移コストC(i,j)は、図中、左下がりの方向に並ぶ要素の差分値D(i,j)の積算に相当する。
なお、図3において、縦方向および横方向は、それぞれi軸方向およびj軸方向を示しており、図3では、図2に示した二次元差分値行列MDと同じ二次元差分値行列MDが示されている。
例えば、図3の例では、領域RC21内に含まれる8つの各要素の値である差分値D(i,j)の和が、1倍でない再生速度で一方のフレーム列を再生させる場合における、位置(i,j)についての遷移コストC(i,j)となる。この例では、j軸方向のフレーム列の1フレーム分の画像が再生されている期間に、i軸方向のフレーム列の2フレーム分の画像が再生されることになる。この場合、2つのフレーム列の長さは異なるが、それらのフレーム列の再生速度が異なるために、各フレーム列の再生時間が同じ長さとなる。
また、領域RC22内に含まれる6つの各要素の値である差分値D(i,j)の和が、一方のフレーム列に対して、他方のフレーム列が逆転再生される場合における、位置(i,j)についての遷移コストC(i,j)となる。この例では、i軸方向のフレーム列がフレーム番号の小さいものから順番に再生される場合には、j軸方向のフレーム列は、フレーム番号の大きいものから順番に再生されることになる。
なお、再生速度も考慮して遷移元と遷移先のフレーム列を決定する場合、例えば領域RC21と領域RC22とでは遷移期間の長さが異なるので、遷移コストC(i,j)を正規化して比較する必要がある。
以上のように、再生速度や再生方向を考慮すれば、遷移元と遷移先のフレーム列として、より適切な区間を得ることができるので、より高品質なループ動画像を生成することができる。そこで、従来では、順方向の1倍再生のみを考慮していたところを、本技術ではN倍再生についても考慮することで、より高品質なループ動画像を得ることができるようにする。
なお、一方のフレーム列に対して他方のフレーム列を逆転再生とするのに適した動画像は、方向性を持たない動きが含まれる映像であり、例えば人物が表情を変えるような映像や、動物が体の向きを変えるような映像、旗が風ではためいているような映像などである。
これに対して、方向性のある動きが含まれる映像とは、人が左から右へ歩いて通り過ぎるような映像などである。そのような映像を素材として、映像の一部の区間を逆転再生したものを遷移元または遷移先のフレーム列とすると、得られたループ動画像は不自然なものとなってしまう。
[再生速度を考慮したループ動画像の生成について]
それでは、以下において、本技術によるループ動画像の生成について説明していく。
本技術では、ループ動画像を生成する際に、速度Nを調整しながら最適な遷移フレーム画像が生成される。
まず、ループ動画像の素材となる動画像(以下、素材動画像とも称する)について、遷移元となるフレーム列と、遷移先となるフレーム列とが決定される。以下では、遷移元となるフレーム列を遷移元フレーム列FSと称し、遷移先となるフレーム列を遷移先フレーム列FDと称することとする。
例えば、典型的には、遷移元フレーム列FSは素材動画像の終端付近から選択され、遷移先フレーム列FDは素材動画像の開始端付近から選択される。また、遷移元フレーム列FSおよび遷移先フレーム列FDの各フレーム列を構成するフレーム数NFは、入力パラメータとして予め与えられているものとする。
これから生成しようとするループ動画像では、遷移元フレーム列FSと遷移先フレーム列FDの一部の区間同士を用いて映像を遷移させるとする。そして、遷移に要する最小のフレーム数NF_min、つまりループ動画像に含まれる遷移期間の最小のフレーム数は、入力パラメータとして予め与えられているものとする。
例えば、再生速度N=1も含めた速度Nでの最適な遷移期間を求めるということは、遷移元フレーム列FSと遷移先フレーム列FDの各フレーム列のなかから抽出した部分的なフレーム列同士の対応付けを、そのコストが最小になるように求めることと同義である。なお、ここでいうコストとは、例えば式(2)の計算で得られる遷移コストC(i,j)である。
このとき、遷移元フレーム列FSと遷移先フレーム列FDから抽出するフレーム列の長さが異なれば、それは、すなわち再生速度が異なる遷移となることを意味する。
例えば、遷移元の15個のフレームに対して、遷移先の30個のフレームが対応付けられたとすると、遷移先のフレーム列をN=2として再生しながら映像を遷移していくことになる。
このような対応付け問題をより一般的な問題として考えると、信号Xと信号Yの2つの信号について、弾性マッチングを行うことに相当する。
すなわち、信号Xと信号Yから一部系列がそれぞれ取り出され、取り出した各系列を伸び縮みさせながら2つの系列間の距離が求められ、その距離が最小となる系列の組み合わせが探索される。
このように長さの異なる数列の最適な対応を計算する方法の1つに、DP(Dynamic Programming)マッチング(動的計画法)があり、DPマッチングは、音声やジェスチャなどの時系列パターン認識や、画像パターン認識などの様々な分野で用いられている。
1次元の信号Xと信号YのDPマッチングを行なうには、信号間のマッチングの制約を決める必要がある。
一般的には、信号Xの長さをJとし、信号Yの長さをIとすると、例えば、図4に示すように(I×J)個の格子点を持つDP平面を定義して、その格子点間のつながり(エッジ)が与えられ、各格子点間のつながりには傾斜制限と呼ばれる制限が加えられる。
なお、図4において、横方向および縦方向は、それぞれ信号Xおよび信号Yの時間方向を示しており、各円は、DP平面上の1つの格子点を表している。
ここで、図中、横方向をj軸方向とし、縦方向をi軸方向とすると、DP平面上の各格子点の位置を、ij座標系の位置(i,j)(但し、1≦i≦I,1≦j≦J)で表現することができる。
図4のDP平面では、位置(i,j)=(1,1)を始点SP11とし、位置(i,j)=(I,J)を終点DP11として、始点SP11から終点DP11までの経路を考えるときに、各格子点から他の格子点への経路として、矢印Q11に示す3通りの経路が与えられている。すなわち、矢印Q11に示すように傾斜制限が与えられる。
具体的には、位置(i,j)にある格子点PO11からは、位置(i,j+1)にある格子点PO12、位置(i+1,j+1)にある格子点PO13、または位置(i+2,j+1)にある格子点PO14の何れかに遷移することができる。換言すれば、格子点PO11は、格子点PO12乃至格子点PO14の何れかへの経路に接続されている。
さらに、DP平面では、各格子点、格子点間のエッジ、または各格子点と格子点間のエッジの両方に対してコストが定義される。
そして、DP平面の始点SP11から終点DP11までの経路中のコストが積算されて、コストが最小となる経路がDPマッチングによって計算され、その結果得られた経路を通る各格子点群が、最適な信号の組み合わせ方となる。
このようなDPマッチングを、上述した遷移元フレーム列FSと遷移先フレーム列FDの対応付けに適用することを考える。
この場合、遷移元フレーム列FSと遷移先フレーム列FDの間の距離が最小となる組み合わせは、以下のようにして得られる。すなわち、遷移元フレーム列FSと遷移先フレーム列FDから取り出されるフレーム列長を変えながら、取り出された2つのフレーム列の組み合わせを作り、フレーム列の各組について弾性マッチングを行なっていき、各組から距離が最小となる組を選択すればよい。
しかしながら、そのような処理を行なうと、遷移元フレーム列FSと遷移先フレーム列FDから取り出した2つのフレーム列の組み合わせの数が膨大な数となってしまう。そこで、DPマッチングの次のような拡張機能を利用することで、フレーム列の組み合わせの数を減らすことができる。
すなわち、拡張機能を利用したDPマッチングとは、始点終点自由化によるDPマッチングであり、図4の例では始点SP11と終点DP11が固定されていたのに対して、これらの始点と終点の候補を複数与えるものである。
具体的には、例えば図5に示すように、DP平面が拡大される。なお、図5では、縦方向および横方向は、それぞれi軸方向およびj軸方向を示しており、各円は、DP平面上の1つの格子点を表している。
図5では、図4に示したDP平面に対して、さらに1つの仮の始点TSP11と、1つの仮の終点TDP11とが与えられている。
そして、DP平面では仮の始点TSP11に対して、5つの格子点PO21乃至格子点PO25が真の始点の候補とされて、仮の始点TSP11から格子点PO21乃至格子点PO25のそれぞれへのエッジが定義され、それらのエッジのコストが0とされる。
また、仮の終点TDP11に対して、6つの格子点PO31乃至格子点PO36が真の終点の候補とされて、仮の終点TDP11から格子点PO31乃至格子点PO36のそれぞれへのエッジが定義され、それらのエッジのコストが0とされる。
これにより、DP平面にDPマッチングを適用するだけで、自動的に真の始点から終点までの経路が、コストの合計が最小となる経路として決定される。
このような始点終点自由化によるDPマッチングによって、信号Xについては、信号X中の部分信号のうち、コストが最小になる部分信号が選択されることになる。
すなわち、可変長の信号Xと可変長の信号Yの弾性マッチングのうち、信号Xについては入力を固定することができるので、試行する組み合わせ数を大幅に削減することができる。また、信号Yについては、部分信号長および部分信号開始位置を変えながら、全ての部分信号パターンを抽出して信号Xとの弾性マッチングを行うこととする。
つまり、図5に示したDP平面では、仮の始点と終点が定められるので、固定された信号Xを入力すれば、DPマッチングにより信号Xから抽出された各部分信号についてのマッチングが行なわれることになる。したがって、信号Yから抽出した部分信号の信号長等を変化させながら、その部分信号と信号Xとを入力としてDPマッチングを行なえば、可変長の信号Xと可変長の信号Yの弾性マッチングの処理結果が得られることになる。
続いて、上述のDPマッチングを用いて、ループ動画像を生成する具体的な方法について説明する。なお、ループ動画像を生成する場合に、遷移元フレーム列FSと遷移先フレーム列FDの両方を可変長としてもよいが、ここでは、遷移元フレーム列FSを固定長とし、遷移先フレーム列FDのみを可変長とする例について説明する。このような場合、両方のフレーム列を可変長とする場合と比べて、計算量を削減することができる。
例えば、フレーム数がNFである遷移元フレーム列FSと遷移先フレーム列FDが与えられており、これらのフレーム列に含まれる部分フレーム列の最適なマッチングを計算するとする。
この場合に、遷移元フレーム列FSに関しては固定長にしておいて、始点終点自由化によって部分フレーム列が選択されるようにする。
また、遷移先フレーム列FDに関しては、部分フレーム列の開始位置を遷移先フレーム列FDの1フレーム目乃至(NF−NF_min)フレーム目の間で変化させ、かつ部分フレーム列の長さもNF_min乃至NFの間で変化させて、部分フレーム列が決定される。なお、以下、遷移先フレーム列FDから抽出された、DPマッチングに用いられるフレーム列を部分フレーム列FD’とも称することとする。
本技術では、遷移元フレーム列FSと遷移先フレーム列FDとから、例えば図5と同様にしてDP平面が生成される。このとき、遷移先フレーム列FDの真の始点から終点までの部分が部分フレーム列FD’となる。
ここで、DP平面では、遷移元フレーム列FSの方向がi軸方向とされ、部分フレーム列FD’(遷移先フレーム列FD)の方向がj軸方向とされる。そして、ij座標系において、遷移元フレーム列FSのK番目のフレームの位置のi座標はi=Kとされ、部分フレーム列FD’のフレームとされる遷移先フレーム列FDのL番目のフレームの位置のj座標はj=Lとされる。
また、DP平面上の各位置(i,j)に格子点が配置されるとともに、DP平面には仮の始点と仮の終点が与えられる。そして、位置(i,j)=(1,1)乃至(1,NF−NF_min)にある各格子点が仮の始点と接続され、i座標が最大となり、かつj座標がNF_minから最大値までの間となる各格子点には、仮の終点が接続される。
さらに、格子点間のつながり(エッジ)が与えられ、各格子点間のつながりには、例えば図6に示す傾斜制限が与えられる。
なお、図6において、縦方向および横方向は、それぞれi軸方向(遷移元フレーム列FS方向)、およびj軸方向(部分フレーム列FD’方向)を示しており、各円は、1つの格子点を表している。
図6の例では、格子点PO41からは、格子点PO51乃至格子点PO55の何れかへの経路をとることができる。
例えば、格子点PO41が位置(i,j)にあるとすると、格子点PO51の位置は位置(i+1,j+3)となる。つまり、格子点PO41から格子点PO51への経路は、遷移元フレーム列FS方向に1進むのに対して、部分フレーム列FD’方向へは3進む対応となっている。
これは、遷移元フレーム列FSの再生速度を1倍速とすると、部分フレーム列FD’の再生速度が3倍速となっていることに相当する。つまり、遷移元フレーム列FSに対する部分フレーム列FD’の相対的な再生速度が3倍となっていることに相当する。
したがって、経路が格子点PO41から格子点PO51へと進む場合、格子点PO41の位置(i,j)と、格子点PO51の位置(i+1,j+3)とは、次のような関係を有しているといえる。
すなわち、フレームiとフレームjを起点(再生開始位置)とし、遷移元フレーム列FSに対する部分フレーム列FD’の再生速度を3倍速として、それらの遷移元フレーム列FSと部分フレーム列FD’を仮想的に再生させるとする。このとき、フレームiともフレームjとも異なる遷移元フレーム列FSと部分フレーム列FD’のフレームのペアのうち、再生開始位置であるフレームiとフレームjよりも後に、最初に同時に提示させるべきフレームのペアがフレームi+1とフレームj+3となる。
格子点PO41の位置(i,j)に対して、格子点PO52の位置は位置(i+1,j+2)となり、このときの遷移元フレーム列FSに対する部分フレーム列FD’の相対的な再生速度は2倍速となる。
また、格子点PO41の位置(i,j)に対して、格子点PO53の位置は位置(i+1,j+1)となり、このときの遷移元フレーム列FSに対する部分フレーム列FD’の相対的な再生速度は1倍速となる。
格子点PO41の位置(i,j)に対して、格子点PO54の位置は位置(i+2,j+1)となり、このときの遷移元フレーム列FSに対する部分フレーム列FD’の相対的な再生速度は1/2倍速となる。
さらに、格子点PO41の位置(i,j)に対して、格子点PO55の位置は位置(i+3,j+1)となり、このときの遷移元フレーム列FSに対する部分フレーム列FD’の相対的な再生速度は1/3倍速となる。
なお、ここで説明した再生速度は、2つの格子点の位置関係を説明するためのものであり、遷移元フレーム列FSと部分フレーム列FD’の全体の長さの違いにより定まる再生速度とは異なる。フレーム列の全体の長さの違いにより定まる再生速度とは、遷移元から遷移先に遷移させようとするときに、再生時間を揃えるために必要となる遷移元フレーム列FSと部分フレーム列FD’の相対的な再生速度である。
また、DP平面では、各格子点間のエッジにコストが定義される。
例えば、DP平面の各格子点に図6に示した傾斜制限が与えられた場合、DP平面上の仮の始点から所定の格子点までの各経路のコストに対して正規化が必要となる。これは、同じ格子点に到達する経路であっても、経路が異なるとコストの加算回数が異なるためである。
例えば、ここでは、仮に位置(i,j)にある格子点におけるコストを、上述した式(1)により求まる差分値D(i,j)の値としておき、実際にエッジに付加されるコストとして、その格子点に達するエッジごとに異なるコストが割り当てられるようにする。すなわち、エッジに付加されるコストは、例えばそのエッジの長さ、つまりエッジ長に応じてスケールされる。なお、格子点におけるコストは、エッジにコストを与えるために一時的に与えられたものであり、最終的なDP平面では、格子点にはコストは与えられない。
より具体的には、位置(i,j)にある格子点におけるコストが差分値D(i,j)の値とされており、この格子点につながるエッジkのエッジ長がlength(k)であるとする。この場合、次式(3)に示すように、差分値D(i,j)をlength(k)倍して得られる値がエッジkに付加されるコストE(i,j,k)とされる。
Figure 2013146508
例えば、図7に示すように、DP平面上において、格子点OP61から格子点PO62へのエッジk11の長さがlength(k)であるとする。また、格子点OP62の位置が位置(i,j)であるとする。
この場合、エッジk11に付加されるコストE(i,j,k)は、位置(i,j)について求められた差分値D(i,j)と、エッジk11の長さlength(k)との積「D(i,j)×length(k)」となる。
ここで、差分値D(i,j)は、上述した式(1)を計算することで求まる差分値である。すなわち、差分値D(i,j)は、遷移元フレーム列FSの先頭からi番目のフレームの画像の各画素の画素値と、部分フレーム列FD’のフレームとされる遷移先フレーム列FDの先頭からj番目のフレームの画像の各画素の画素値との差分二乗値の総和である。
差分値D(i,j)は、遷移元フレーム列FSの画像と、部分フレーム列FD’の画像との類似の度合いを示しているが、コストE(i,j,k)を求める場合に、差分値D(i,j)に代えてオプティカルフローなどが用いられてもよい。
このようにして、DP平面上の各格子点間のエッジにコストE(i,j,k)が付加される。このとき、DP平面の始点から終点までの経路の合計コストは、その経路上のエッジに付加されたコストの合計値であるから、長いエッジが多く選択された経路ほど、経路の合計コストの算出時におけるコストの加算回数が少なくなる。
そこで、差分値にエッジの長さを乗算してエッジのコストとすることで、加算回数が少なくなる分だけ、エッジのコストを大きくすることができ、合計コストが最小となる経路が正しく求められるようになる。
なお、以下、遷移元フレーム列FSと部分フレーム列FD’とのDPマッチングにより得られた、DP平面の始点から終点までの合計コストが最小となる経路を最小コスト経路とも称し、最小コスト経路の合計コストを最小合計コストとも称することとする。
仮の始点と終点を定めて遷移元フレーム列FSと遷移先フレーム列FDのDPマッチングを行なうと、遷移元フレーム列FSと各部分フレーム列FD’とのDPマッチングが行なわれたことになる。
遷移元フレーム列FSと部分フレーム列FD’とのDPマッチングを行なうと、遷移先フレーム列FDの部分フレーム列FD’ごとに最小合計コストが求まるので、各部分フレーム列FD’のうち、最小合計コストが最小となるものを選択すればよい。
しかし、各部分フレーム列FD’は、信号長、つまりフレーム数が異なり、各部分フレーム列FD’についての最小合計コストの算出時におけるコストの加算回数は異なるため、そのままでは各最小合計コストを公平に比較することができない。
そこで、部分フレーム列FD’について求めた最小合計コストを、部分フレーム列FD’の信号長、つまりフレーム数で除算して、最小合計コストを正規化してから、正規化された最小合計コストが最小となる部分フレーム列FD’を選択すればよい。
したがって、部分フレーム列FD’の信号長がmであり、DP平面上の部分フレーム列FD’の始点位置が位置(i,j)である場合、部分フレーム列FD’の最小コスト経路の合計コストC(i,j,m)は、次式(4)を計算することで求められる。
Figure 2013146508
なお、式(4)においてE(x,y,k)は、式(3)により求まるエッジのコストを示している。したがって、合計コストC(i,j,m)は、最小コスト経路上にある各エッジのコストE(x,y,k)の総和を、部分フレーム列FD’の信号長mで除算することにより得られる。
各部分フレーム列FD’のうち、式(4)により求められる合計コストC(i,j,m)が最小となるものが、最終的な遷移先フレーム列FDとされる。
以上のように、DPマッチングを行なうと、最終的な遷移元となる遷移元フレーム列FSと、最終的な遷移先となる遷移先フレーム列FD、つまり選択された部分フレーム列FD’が得られる。
次に、DPマッチングにより得られた遷移元フレーム列FSと遷移先フレーム列FDをどのようにブレンドして再生するかについて説明する。
例えば、遷移元フレーム列FSと遷移先フレーム列FDの対応付けによって、遷移元の再生速度を1に固定した場合、遷移先の再生速度は様々な速度となる。
そのため、遷移先フレーム列FDを、遷移元フレーム列FSの再生速度とし、それらのフレーム列の各フレームの画像をブレンドして得られた映像を再生すると、完全に遷移先に遷移したときの映像のつながりが悪くなってしまう。これは、遷移先の再生速度がN倍から1倍に急に変化する箇所が生じるからである。
そこで、本技術では、遷移開始時点、つまり遷移期間の先頭のフレームでは、遷移元が1倍の再生速度,遷移先がN倍の再生速度とされ、遷移終了時点、つまり遷移期間の最後のフレームでは、遷移元が1/N倍の再生速度,遷移先が1倍の再生速度となるように徐々に再生速度を変化させて遷移期間の各フレームが生成される。
本技術では、このような再生速度を割り当てる処理が行なわれる。
すなわち、DPマッチングにより得られた遷移先フレーム列FDと遷移元フレーム列FSとの互いに対応するフレーム、つまり類似するフレーム(以下、マッチングフレームとも称する)の列が、DPマッチング時の最小コスト経路から得られる。
このマッチングフレーム列は、最小コスト経路上の格子点位置のフレームだけでなく、遷移先フレーム列FDと遷移元フレーム列FSの各フレームのうち、マッチングフレームとされていないフレームについても、他方のフレーム列の対応するフレームを定めることで得られるものである。
具体的には、例えば図8の矢印Q31に示すDPマッチング結果が得られたとする。この例では、図中、横軸は遷移元フレーム列FSのフレーム番号i(但し、1≦i≦6)を示しており、縦軸は遷移先フレーム列FDのフレーム番号j(但し、1≦j≦7)を示している。また、各円は遷移元フレーム列FSと遷移先フレーム列FDのマッチングフレーム列を示している。
例えば、位置(i,j)=(1,1),(2,3),(3,4),(5,5),(6,7)の各位置におけるマッチングフレームが、DPマッチングにより得られた最小コスト経路上の格子点により示される遷移元フレーム列FSと遷移先フレーム列FDのフレームの組であるとする。例えば、位置(i,j)=(1,1)は、遷移元フレーム列FSの1フレーム目と、遷移先フレーム列FDの1フレーム目とが互いに対応しているマッチングフレームであることを示している。
しかし、このままでは、遷移元フレーム列FSの4フレーム目に対応する遷移先フレーム列FDのフレームと、遷移先フレーム列FDの2フレーム目および6フレーム目に対応する遷移元フレーム列FSのフレームとが定まっていない。
そこで、例えば最小コスト経路上の格子点に対応する各位置(i,j)に基づいて、遷移元フレーム列FSの4フレーム目と、遷移先フレーム列FDの2フレーム目および6フレーム目とに対応するマッチングフレームが決定される。
その結果、例えば位置(i,j)=(1,2),(4,4),(5,6)の各位置により示されるフレームペアがマッチングフレームとされる。
すなわち、遷移先フレーム列FDの2フレーム目に対応するフレームが、遷移元フレーム列FSの1フレーム目とされ、遷移元フレーム列FSの4フレーム目に対応するフレームが、遷移先フレーム列FDの4フレーム目とされる。また、遷移先フレーム列FDの6フレーム目に対応するフレームが、遷移元フレーム列FSの5フレーム目とされる。
このようにして遷移元フレーム列FSと遷移先フレーム列FDのマッチングフレーム列が定まると、次に、図8の右側の矢印Q32に示すように、初期状態において、マッチングフレームが、そのまま1倍速で再生されるように割り当てられる。
なお、図8中、右側において右方向は時間方向を示しており、各四角形は1つのフレームの画像を表している。
特に、四角形内にFSi(但し、1≦i≦6)が記されたフレームは、遷移元フレーム列FSの先頭からi番目のフレームを表しており、四角形内にFDj(但し、1≦j≦7)が記されたフレームは、遷移先フレーム列FDの先頭からj番目のフレームを表している。また、四角形内にFBh(但し、1≦h≦7)が記されたフレームは、遷移元フレーム列FSと遷移先フレーム列FDとをブレンド処理して得られた、遷移期間の先頭からh番目のフレームを表している。
なお、以下では、遷移元フレーム列FSのi番目のフレームをフレームFSiとも称し、遷移先フレーム列FDのj番目のフレームをフレームFDjとも称することとする。また、以下、遷移期間のh番目のフレームをフレームFBhとも称することとする。
図8では、矢印Q32により示される部分では、各マッチングフレームが等間隔に並べられている。
すなわち、フレームFS1とフレームFD1のペア、フレームFS1とフレームFD2のペア、フレームFS2とフレームFD3のペア、およびフレームFS3とフレームFD4のペアが右方向に順番に並べられている。
そして、さらにその右側に、フレームFS4とフレームFD4のペア、フレームFS5とフレームFD5のペア、フレームFS5とフレームFD6のペア、およびフレームFS6とフレームFD7のペアが右方向に順番に並べられている。
これらの時系列に並べられた遷移元フレーム列FSのフレームFSiと遷移先フレーム列FDのフレームFDjとのペアを構成する各フレームFSiは、フレーム番号が大きい順または小さい順、つまり昇順または降順に並べられることになる。同様に、フレームFSiとフレームFDjとのペアを構成する各フレームFDjも昇順または降順に並べられることになる。
また、矢印Q32に示される部分では、右方向に並ぶ各フレームFSi間には、それらのフレーム間の時間差を示す数値が示されている。なお、時間差の単位はフレーム数である。
例えば、同じフレームFS1が並んでいる間には、それらのフレームFS1間の時間差「0」が記されており、フレームFS1とフレームFS2が並んでいる間には、それらのフレーム間の時間差「1」が記されている。
同様に、右方向に並ぶ各フレームFDj間には、それらのフレーム間の時間差を示す数値が示されている。例えば、同じフレームFD4が並んでいる間には、それらのフレームFD4間の時間差「0」が記されており、フレームFD1とフレームFD2が並んでいる間には、それらのフレーム間の時間差「1」が記されている。
このように各マッチングフレームが等間隔に並べられると、この状態(初期状態)から、マッチングフレーム再配置処理が行なわれ、各フレームFSiとフレームFDjのペアが再配置される。
マッチングフレーム再配置処理では、遷移期間の始端から終端、つまり時系列に並べられたフレームFSiとフレームFDjのペアの先頭から最後尾に向かって、徐々に遷移元から遷移先のフレーム間の時間差(間隔)が1になるように、その位置がずらされていく。
すなわち、図8中、左側にある遷移期間の開始位置近傍では、遷移元フレーム列FSの各フレームFSiの間隔が1となり、図8中、右側にある遷移期間の終了位置近傍では、遷移先フレーム列FDの各フレームFDjの間隔が1となるように、各フレームペアの配置位置が調整される。
各フレームFSiとフレームFDjのペアを時間方向に配置した場合、図中、右方向に同じフレームが連続して並ぶ区間は、本来であれば、時間差0で再生されるべき箇所である。
しかし、矢印Q32に示す状態では、横方向に並ぶフレームFSi間では時間差が0となっている場合でも、同じ位置にあるフレームFDj間では時間差が0となっていない箇所がある。例えば、フレームFS1およびフレームFD1のペアと、フレームFS1およびフレームFD2のペアとが並んでいる部分では、フレームFS1の時間差は0であるが、フレームFD1とフレームFD2の時間差は1となっている。
そこで、マッチングフレーム再配置処理では、遷移先と遷移元で時間差が異なる場所について、重みを付けて各フレームペアの配置位置の間隔(時間差)が調整される。これにより、遷移始端においては遷移元フレーム列FSが1倍の再生速度に近い間隔で配置され、終端部においては遷移先フレーム列FDが1倍の再生速度に近い間隔で配置されるようになる。
例えばマッチングフレーム再配置処理では、各フレームペアについて、遷移先と遷移元の互いに隣接して配置されているフレームのフレーム間隔、つまり矢印Q32に示す時間差に対して重みが付けられる。そして、重み付けされたフレーム間隔(時間差)をブレンドすることで、更新後のフレーム間隔が算出される。そして、各フレームペアが、そのフレームペアの時間方向の直前にあるフレームペアに対して、得られたフレーム間隔(時間差)で並ぶように、フレームペアが配置し直される。
より具体的には、遷移元フレーム列FSに対して重みWSが与えられ、遷移先フレーム列FDに対して重みWDが与えられているとする。
なお、より詳細には、重みWSは、遷移元フレーム列FSの各フレームFSiに対して与えられた重みWS(但し、1≦i≦6)からなり、重みWDは、遷移先フレーム列FDの各フレームFDjに対して与えられた重みWD(但し、1≦j≦7)からなる。
ここで、重みWSは、遷移元フレーム列FSの先頭の位置から最後の位置へ向かって減衰していくように定められる。つまり、例えば重みWS=1.0とされ、重みWS=0.0とされて、それらの間にあるWSは、重みWSと重みWSを用いた線形補間により求められる値とされる。
一方、重みWDは、遷移先フレーム列FDの先頭の位置から最後の位置へ向かって増加していくように定められる。つまり、例えば重みWD=0.0とされ、重みWD=1.0とされて、それらの間にあるWDは、重みWDと重みWDを用いた線形補間により求められる値とされる。
このような重みWSが用いられて、遷移元フレーム列FSのフレーム間の重みが求められる。フレーム間の重みは、例えば互いに隣接するフレームの重みの平均値とされる。したがって、例えばフレームFS1とフレームFS2の間の重みは、(WS+WS)/2とされる。遷移元フレーム列FSのフレーム間の重みと同様に、遷移先フレーム列FDのフレーム間の重みも重みWDが用いられて求められる。
そして、用いられた重みが用いられて、注目するフレームペアについて、遷移元フレーム列FSのフレーム間隔(時間差)と、遷移先フレーム列FDのフレーム間隔(時間差)とがブレンド処理され、更新後のフレーム間隔(時間差)が算出される。
例えば、フレームFS1とフレームFD2のペアに注目すると、このフレームペアの直前にあるフレームペアは、フレームFS1とフレームFD1のペアである。
したがって、これらのペアの遷移元フレーム列FSについては、同じフレームFS1が並んでおり、遷移先フレーム列FDについては、フレームFD1とフレームFD2が並んでいる。
そこで、フレーム間隔のブレンド処理に用いられる重みとして、フレームFD1の重みWDと、フレームFD2の重みWDとの平均値が、それらのフレーム間の重み(WD1,2とする)として算出される。なお、遷移元フレーム列FSについては、同じフレームFS1が並んでいるので、重みWSがそのまま用いられる。これは、2つの重みWSの平均値は重みWSとなるからである。
そして、注目しているフレームFS1とフレームFD2のペアについて、そのペアの直前のフレームペアとのフレーム間隔のブレンドが行なわれる。
この場合、遷移元フレーム列FSについては、同じフレームFS1が並んでいるので、そのフレーム間隔(時間差)は「0」である。また、遷移先フレーム列FDについては、フレームFD1とフレームFD2が並んでいるので、そのフレーム間隔(時間差)は「1」である。
したがって、これらのフレーム間隔を、求めた重みを付けてブレンド(重み付き加算)すれば、最終的に得ようとするフレーム間隔が得られる。すなわち、(WS×0)+(WD1,2×1)が計算され、得られた値が最終的なフレーム間隔である。
最終的なフレーム間隔(時間差)が得られると、注目しているフレームFS1とフレームFD2のペアと、その直前にあるフレームFS1とフレームFD1のペアとのフレーム間隔、つまり図中、横方向に並ぶ間隔が、求めたフレーム間隔となるように、フレームFS1とフレームFD2のペアが配置し直される。
このように、マッチングフレーム再配置処理を行なって、矢印Q32に示した各フレームペアを再配置すると、矢印Q33に示すようになる。この例では、フレームFS1とフレームFD2のペアは、その直前にあるフレームFS1とフレームFD1のペアにほぼ重なる位置に配置されている。
マッチングフレーム再配置処理が行なわれて、各フレームペアが再配置されると、実際に再生される遷移期間の各時刻のマッチングフレームが選択される。
矢印Q33に示す各フレームペアは、時系列に並べられたそれらのフレームペアの先頭のフレームペアの位置が、遷移期間の先頭のフレームの時刻の位置となるように配置されている。
ここでは、例えば矢印Q34に示すように、各フレームペアのうち、点線で示される遷移期間の各フレームの提示時刻ごとに、その時刻に最も近い位置に配置されているフレームペアが選択される。この場合、選択されずに破棄されるフレームペアが存在することもある。
矢印Q34に示す例では、遷移期間の各時刻のマッチングフレームのペアとして、フレームFS1とフレームFD1のペア、フレームFS2とフレームFD3のペア、およびフレームFS3とフレームFD4のペア、フレームFS4とフレームFD4のペア、フレームFS5とフレームFD5のペア、フレームFS5とフレームFD6のペア、およびフレームFS6とフレームFD7のペアが選択されている。
最後に、遷移期間の時刻ごとに選択されたフレームペアの各フレームの画像が、ブレンド率αによりブレンドされ、遷移期間のフレームの画像とされる。なお、図8では、遷移期間の各時刻を表す点線の位置に、それらの時刻におけるブレンド率αが示されている。
この例では、ブレンド率αは、遷移先フレーム列FDの各フレームFDjに乗算される重みを示しており、ブレンド率αは、α=0.0からα=1.0まで、遷移期間のフレーム番号が大きくなるにしたがって線形的に大きくなっている。
また、フレームペアのブレンド時には、遷移元フレーム列FSの各フレームFSiには、(1−α)が重みとして乗算される。
したがって、例えば遷移期間の1つ目のフレームFB1に注目し、遷移元フレーム列FSのフレームFS1の画像をFS1とし、遷移先フレーム列FDのフレームFD1の画像をFD1とすると、フレームFB1の画像は、α×FD1+(1−α)×FS1により求められる。
このような遷移元フレーム列FSと遷移先フレーム列FDの各フレームのブレンドにより、遷移期間の各フレームの画像が生成される。図8では、遷移期間の画像(フレーム列)は、遷移元フレーム列FSの画像から、遷移先フレーム列FDの画像へと徐々に遷移していく画像となる。
遷移期間のフレーム列が得られると、素材動画像における遷移先フレーム列FDの最後のフレーム(アウト点)と、遷移元フレーム列FSの最初のフレーム(イン点)との間の区間のフレーム列と、そのフレーム列に続く遷移期間のフレーム列とからなるループ動画像が得られる。
なお、逆転再生も含めたループ動画像も、以上において説明した方法と同様の計算により生成することができる。
そのような場合、上述したDPマッチングにおいて、遷移元フレーム列FSと、遷移先フレーム列FDから抽出される部分フレーム列FD’の組み合わせとして、逆転再生も考慮した組み合わせも加えればよい。
例えば、ループ動画像に含まれる遷移期間の最小のフレーム数がNF_minであるとし、遷移元フレーム列FSおよび遷移先フレーム列FDの各フレーム列を構成するフレーム数がNFであるとする。
この場合、遷移先フレーム列FDから抽出される部分フレーム列FD’の先頭のフレーム(開始位置)を、遷移先フレーム列FDの先頭からNF乃至(NF−NF_min)フレーム目の間で変化させ、かつ部分フレーム列FD’の信号長をNF_min乃至NFフレームの間で変化させて、部分フレーム列FD’が抽出される。このとき、遷移先フレーム列FDから抽出されたフレーム列の表示順(フレームの順番)を逆向きに並べて得られるフレーム列、つまりフレーム番号が新しいものから古いものへと順番に各フレームを並べて得られるフレーム列が、部分フレーム列FD’とされる。
そして、遷移元フレーム列FSと、得られた部分フレーム列FD’との各組み合わせについてDPマッチングが行なわれ、逆転再生についての最終的な遷移先フレーム列FDが得られる。したがって、これらの逆転再生についての遷移元フレーム列FSと遷移先フレーム列FDとから、逆転再生につての遷移期間のフレーム列が得られる。
但し、逆転再生を用いたループ動画像を最終的に出力する場合には、2つの遷移期間が必要となるので、素材動画像から、それぞれ独立に順再生の遷移期間と、逆転再生の遷移期間とを生成する必要がある。
例えば、図9に示すように、1つの素材動画像MT31から、逆転再生の区間を含むループ動画像LP31を生成するものとする。
この場合、素材動画像MT31の終了端近傍の区間FV11から、DPマッチングにより順再生の遷移期間TR11、つまり順方向への再生により画像遷移が行われる遷移期間TR11を得るための遷移元フレーム列FS1と遷移先フレーム列FD1が定められる。
そして、遷移元フレーム列FS1と遷移先フレーム列FD1の各フレームの画像がブレンドされ、遷移期間TR11が生成される。
また、素材動画像MT31の開始端近傍の区間FV12から、DPマッチングにより逆転再生の遷移期間TR12、つまり逆転再生を用いた画像遷移が行われる遷移期間TR12を得るための遷移元フレーム列FS2と遷移先フレーム列FD2が定められる。そして、遷移元フレーム列FS2と遷移先フレーム列FD2の各フレームの画像がブレンドされ、遷移期間TR12が生成される。
さらに、素材動画像MT31における遷移先フレーム列FD2の直後のフレームから、遷移元フレーム列FS1の直前のフレームまでの区間がそのまま切り出され、ループ動画像LP31における順再生期間TU11とされる。
また、素材動画像MT31における遷移元フレーム列FS2の直前のフレームから、遷移先フレーム列FD1の直前のフレームまでの区間が切り出され、切り出された区間のフレームがフレーム番号の新しい方から古い方へと順番に並べられる。そして、その結果得られたフレーム列からなる区間が、ループ動画像LP31における逆転再生期間TU12とされる。この逆転再生期間TU12は、素材動画像MT31の一部の区間が逆方向に再生される区間である。
そして、順再生期間TU11、遷移期間TR11、逆転再生期間TU12、および遷移期間TR12を順番につなげて得られる動画像が、ループ動画像LP31とされる。
なお、以下では、説明を簡単にするため、逆転再生を含まないループ動画像の生成について説明することとする。
[画像処理装置の構成例]
次に、本技術を適用した具体的な実施の形態について説明する。
図10は、本技術を適用した画像処理装置の一実施の形態の構成例を示す図である。
図10の画像処理装置11は、取得部21、フレーム列決定部22、部分フレーム列決定部23、マッチング処理部24、再配置処理部25、ブレンド処理部26、およびループ動画像生成部27から構成される。
取得部21は、これから生成しようとするループ動画像の素材となる素材動画像を取得して、フレーム列決定部22およびループ動画像生成部27に供給する。
フレーム列決定部22は、取得部21から供給された素材動画像から、遷移元フレーム列FSと遷移先フレーム列FDを抽出し、部分フレーム列決定部23、マッチング処理部24、およびブレンド処理部26に供給する。
部分フレーム列決定部23は、フレーム列決定部22から供給された遷移先フレーム列FDから部分フレーム列FD’を抽出し、マッチング処理部24に供給する。
マッチング処理部24は、フレーム列決定部22からの遷移元フレーム列FSと遷移先フレーム列FD、および部分フレーム列決定部23からの部分フレーム列FD’に基づいて弾性マッチングを行い、そのマッチング結果を再配置処理部25に供給する。
再配置処理部25は、マッチング処理部24から供給されたマッチング結果に基づいて、マッチングフレーム再配置処理を行い、その処理結果をブレンド処理部26に供給する。
ブレンド処理部26は、再配置処理部25からの処理結果、およびフレーム列決定部22からの遷移元フレーム列FSと遷移先フレーム列FDに基づいてブレンド処理を行い、ループ動画像を構成する遷移期間の各フレームを生成し、ループ動画像生成部27に供給する。
ループ動画像生成部27は、ブレンド処理部26からの遷移期間の各フレームと、取得部21からの素材動画像とに基づいてループ動画像を生成し、出力する。
[ループ動画像生成処理の説明]
ところで、画像処理装置11に素材動画像が供給され、ループ動画像の生成が指示されると、画像処理装置11によりループ動画像生成処理が行なわれ、ループ動画像が生成される。以下、図11のフローチャートを参照して、画像処理装置11によるループ動画像生成処理について説明する。
ステップS11において、取得部21は、供給された素材動画像を取得して、フレーム列決定部22およびループ動画像生成部27に供給する。
ステップS12において、フレーム列決定部22は、取得部21から供給された素材動画像における、遷移元フレーム列FSと遷移先フレーム列FDの区間を決定し、部分フレーム列決定部23、マッチング処理部24、およびブレンド処理部26に供給する。
例えば、遷移元フレーム列FSと遷移先フレーム列FDの各フレーム列を構成するフレーム数NFが予め定められているとする。この場合、フレーム列決定部22は、素材動画像の先頭のフレームからNF番目のフレームまでの区間を遷移先フレーム列FDとし、素材動画像の最後のNFフレームからなる区間を遷移元フレーム列FSとする。
なお、遷移元フレーム列FSと遷移先フレーム列FDは、それぞれ異なる素材動画像から抽出されるようにしてもよい。
ステップS13において、部分フレーム列決定部23は、フレーム列決定部22から供給された遷移先フレーム列FDから部分フレーム列FD’を抽出し、マッチング処理部24に供給する。
例えば、遷移元フレーム列FSおよび遷移先フレーム列FDのフレーム数NFと、ループ動画像に含まれる遷移期間の最小のフレーム数NF_minとが予め定められているとする。
この場合、部分フレーム列決定部23は、部分フレーム列FD’の開始位置を、遷移先フレーム列FDの1乃至(NF−NF_min)フレーム目の間で変化させ、かつ部分フレーム列FD’の長さもNF_min乃至NFフレームの間で変化させて、部分フレーム列FD’を決定する。したがって、複数のフレーム列が部分フレーム列FD’となり得るので、ステップS13では、それらのフレーム列のうち、まだ処理対象とされていないものが部分フレーム列FD’とされる。
ステップS14において、マッチング処理部24は、フレーム列決定部22からの遷移元フレーム列FSと遷移先フレーム列FD、および部分フレーム列決定部23からの部分フレーム列FD’に基づいて弾性マッチングを行なう。
例えば、弾性マッチングとして、DPマッチングが行なわれる。そのような場合、マッチング処理部24は、遷移元フレーム列FSと遷移先フレーム列FDに基づいてDP平面を生成し、DP平面上の各エッジに式(3)に示したコストE(i,j,k)を与える。このとき、DP平面には、必要に応じて仮の始点と仮の終点が与えられる。
そして、マッチング処理部24は、DP平面上における始点から終点までの最小コスト経路を探索して、その最小コスト経路の合計コストC(i,j,m)を、式(4)を計算することにより求める。式(4)により求まる合計コストは、各マッチングフレームの画像の類似の度合いに基づく最小コスト経路の評価値ということができる。
なお、DP平面の始点は、遷移元フレーム列FSの先頭のフレームと、部分フレーム列FD’の先頭のフレームとにより定まる格子点の位置とされる。同様に、DP平面の終点は、遷移元フレーム列FSの最後のフレームと、部分フレーム列FD’の最後のフレームとにより定まる格子点の位置とされる。
ステップS15において、マッチング処理部24は、直前のステップS14の処理で得られた最小コスト経路の合計コストC(i,j,m)が最小であるか否かを判定する。すなわち、直前のステップS14の処理で得られた最小コスト経路の合計コストC(i,j,m)が、これまで処理対象とした部分フレーム列FD’について求めた最小コスト経路の合計コストC(i,j,m)よりも小さいか否かが判定される。
例えば、マッチング処理部24は、これまで処理対象とした部分フレーム列FD’について求めた最小コスト経路の合計コストC(i,j,m)のうち、最小となる合計コストC(i,j,m)と、そのときのマッチングフレームとを保持している。そして、マッチング処理部24は、保持している合計コストよりも、直前のステップS14の処理で新たに求められた合計コストが小さい場合、合計コストが最小であると判定する。
ステップS15において、合計コストが最小であると判定された場合、ステップS16において、マッチング処理部24は、保持している合計コストC(i,j,m)とマッチングフレームを更新する。
すなわち、マッチング処理部24は、これまで保持していた合計コストとマッチングフレームを破棄し、新たに求められた最小コスト経路の合計コストと、その最小コスト経路により示されるマッチングフレームとを保持する。
このように最小コスト経路の合計コストとマッチングフレームの更新を行なっていくことで、合計コストに基づく評価が最も高いマッチングフレームが得られることになる。合計コストとマッチングフレームの更新が行なわれると、その後、処理はステップS17へと進む。
また、ステップS15において、合計コストが最小でないと判定された場合、合計コストとマッチングフレームの更新は行なわれず、処理はステップS17に進む。
ステップS15において合計コストが最小でないと判定されたか、またはステップS16において合計コストとマッチングフレームの更新が行なわれると、ステップS17において、マッチング処理部24は、全ての部分フレーム列FD’について処理を行なったか否かを判定する。
ステップS17において、まだ全ての部分フレーム列FD’について処理を行なっていないと判定された場合、処理はステップS13に戻り、上述した処理が繰り返される。
これに対して、ステップS17において、全ての部分フレーム列FD’について処理を行なったと判定された場合、マッチング処理部24は、保持しているマッチングフレームを再配置処理部25に供給し、処理はステップS18に進む。
ステップS18において、再配置処理部25は、マッチング処理部24から供給されたマッチングフレームに基づいて、マッチングフレーム再配置処理を行い、その処理結果をブレンド処理部26に供給する。
例えば、再配置処理部25は、図8を参照して説明したように、適宜、マッチングフレームを補間により求めて、マッチングフレームとされた遷移元フレーム列FSと遷移先フレーム列FDのフレームのペアを時系列に並べる。
例えば、図8の矢印Q31に示したように、補間によってフレームFS1とフレームFD2のペア、フレームFS4とフレームFD4のペア、およびフレームFS5とフレームFD6のペアが求められ、矢印Q32に示すように、各フレームペアが並べられる。
そして、再配置処理部25は、各フレームペアについて、フレーム間の時間差(フレーム間隔)と、フレーム間の重みとに基づいて、矢印Q33に示したように、各フレームペアを配置し直す。
ステップS19において、ブレンド処理部26は、再配置処理部25からの処理結果に基づいて、各フレームペアの再割り当て処理を行なう。
例えば、ブレンド処理部26は、図8を参照して説明したように、遷移期間の各時刻に対して、1つのフレームペアを割り当てる。これにより、図8の矢印Q34に示すように、遷移期間の各時刻に対して、その時刻のブレンド処理に用いるフレームペアが定められる。
ステップS20において、ブレンド処理部26は、遷移期間の各時刻へのフレームペアの割り当て結果、およびフレーム列決定部22からの遷移元フレーム列FSと遷移先フレーム列FDに基づいてブレンド処理を行って、遷移期間の各フレームの画像を生成する。
例えばブレンド処理部26は、図8を参照して説明したように、遷移期間の時刻ごとに、その時刻に割り当てられたフレームペア、つまり遷移元フレーム列FSのフレームの画像と、部分フレーム列FD’(遷移先フレーム列FD)のフレームの画像とをブレンドし、遷移期間のフレームの画像とする。これにより、図8の矢印Q35に示した遷移期間のフレーム列が得られる。ブレンド処理部26は、得られた遷移期間のフレーム列を、ループ動画像生成部27に供給する。
ステップS21において、ループ動画像生成部27は、ブレンド処理部26からの遷移期間のフレーム列と、取得部21からの素材動画像とに基づいてループ動画像を生成する。
例えば、ループ動画像生成部27は、素材動画像における遷移先フレーム列FDの最後のフレームと、遷移元フレーム列FSの最初のフレームとの間の区間のフレーム列の後に、遷移期間のフレーム列を接続することでループ動画像を生成する。
ループ動画像が生成されると、ループ動画像生成部27は、生成したループ動画像を出力し、ループ動画像生成処理は終了する。画像処理装置11から出力されたループ動画像は再生されたり、記録媒体に記録されたりする。
以上のようにして画像処理装置11は、最終的な遷移先フレーム列FDの候補となる部分フレーム列FD’の長さや先頭フレームの位置を変えながら、各部分フレーム列FD’と遷移元フレーム列FSとのマッチングを行い、最適なマッチングフレームを求める。
そして、画像処理装置11は、得られたマッチングフレームのペアの時間方向の提示位置を調整して、ブレンド処理により遷移期間のフレーム列を生成するとともに、この遷移期間のフレーム列を用いてループ動画像を生成する。
このように、部分フレーム列FD’の長さや先頭フレームの位置を変えながらマッチングを行なうことで、遷移元フレーム列FSと遷移先フレーム列FDのフレームのペアとして、より適切なペアを得ることができる。これにより、より高精度に類似フレームの遷移を行なうことができ、その結果、より高品質なループ動画像を得ることができる。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図12は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インターフェース205が接続されている。入出力インターフェース205には、入力部206、出力部207、記録部208、通信部209、及びドライブ210が接続されている。
入力部206は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部207は、ディスプレイ、スピーカなどよりなる。記録部208は、ハードディスクや不揮発性のメモリなどよりなる。通信部209は、ネットワークインターフェースなどよりなる。ドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア211を駆動する。
以上のように構成されるコンピュータでは、CPU201が、例えば、記録部208に記録されているプログラムを、入出力インターフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア211に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インターフェース205を介して、記録部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記録部208にインストールすることができる。その他、プログラムは、ROM202や記録部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、本技術は、以下の構成とすることも可能である。
[1]
第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理装置であって、
前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索するマッチング処理部と、
時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置する再配置処理部と、
再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成するブレンド処理部と
を備える画像処理装置。
[2]
時系列に並ぶ複数の前記フレームペアの前記第1の動画像のフレームと前記第2の動画像のフレームは、それぞれ時系列の昇順または降順に並んでいる
[1]に記載の画像処理装置。
[3]
前記再配置処理部は、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差と前記第2の動画像のフレームの時間差とを重み付き加算して得られる時間差で、互いに隣接する前記フレームペアが配置されるように、前記再配置を行なう
[2]に記載の画像処理装置。
[4]
前記重み付き加算に用いられる前記第1の動画像のフレームの時間差の重みは、互いに隣接する前記フレームペアの各前記第1の動画像のフレームの重みの平均値とされ、
前記第1の動画像の各フレームの重みは、前記第1の動画像の先頭側にあるフレームほど大きくなるように定められる
[3]に記載の画像処理装置。
[5]
前記マッチング処理部は、所定の前記フレームペアを起点として、前記第1の動画像に対する前記第2の動画像の再生速度を変化させたときに、同時に提示されるべき前記第1の動画像と前記第2の動画像のフレームのペアの前記類似の度合いに基づいて、いくつかの前記再生速度のフレームのペアのうちの何れかを前記所定の前記フレームペアに隣接する前記フレームペアとする
[1]乃至[4]の何れかに記載の画像処理装置。
[6]
前記マッチング処理部は、互いに長さの異なる複数の前記第1の動画像について、時系列に並ぶ複数の前記フレームペアを求め、
前記ブレンド処理部は、前記第1の動画像ごとに求めた複数の前記フレームペアのうち、各フレームについての前記類似の度合いに基づく評価が最も高いものを用いて前記遷移動画像を生成する
[1]乃至[5]の何れかに記載の画像処理装置。
[7]
前記遷移動画像に基づいてループ動画像を生成するループ動画像生成部をさらに備える
[1]乃至[6]の何れかに記載の画像処理装置。
11 画像処理装置, 22 フレーム列決定部, 23 部分フレーム列決定部, 24 マッチング処理部, 25 再配置処理部, 26 ブレンド処理部, 27 ループ動画像生成部

Claims (9)

  1. 第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理装置であって、
    前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索するマッチング処理部と、
    時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置する再配置処理部と、
    再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成するブレンド処理部と
    を備える画像処理装置。
  2. 時系列に並ぶ複数の前記フレームペアの前記第1の動画像のフレームと前記第2の動画像のフレームは、それぞれ時系列の昇順または降順に並んでいる
    請求項1に記載の画像処理装置。
  3. 前記再配置処理部は、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差と前記第2の動画像のフレームの時間差とを重み付き加算して得られる時間差で、互いに隣接する前記フレームペアが配置されるように、前記再配置を行なう
    請求項2に記載の画像処理装置。
  4. 前記重み付き加算に用いられる前記第1の動画像のフレームの時間差の重みは、互いに隣接する前記フレームペアの各前記第1の動画像のフレームの重みの平均値とされ、
    前記第1の動画像の各フレームの重みは、前記第1の動画像の先頭側にあるフレームほど大きくなるように定められる
    請求項3に記載の画像処理装置。
  5. 前記マッチング処理部は、所定の前記フレームペアを起点として、前記第1の動画像に対する前記第2の動画像の再生速度を変化させたときに、同時に提示されるべき前記第1の動画像と前記第2の動画像のフレームのペアの前記類似の度合いに基づいて、いくつかの前記再生速度のフレームのペアのうちの何れかを前記所定の前記フレームペアに隣接する前記フレームペアとする
    請求項2に記載の画像処理装置。
  6. 前記マッチング処理部は、互いに長さの異なる複数の前記第1の動画像について、時系列に並ぶ複数の前記フレームペアを求め、
    前記ブレンド処理部は、前記第1の動画像ごとに求めた複数の前記フレームペアのうち、各フレームについての前記類似の度合いに基づく評価が最も高いものを用いて前記遷移動画像を生成する
    請求項2に記載の画像処理装置。
  7. 前記遷移動画像に基づいてループ動画像を生成するループ動画像生成部をさらに備える
    請求項2に記載の画像処理装置。
  8. 第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理方法であって、
    前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索し、
    時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置し、
    再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成する
    ステップを含む画像処理方法。
  9. 第1の動画像と第2の動画像のうちの一方から他方へと画像が遷移する遷移動画像を生成する画像処理用のプログラムであって、
    前記第1の動画像を構成するフレームの画像と、前記第2の動画像を構成するフレームの画像との類似の度合いに基づいて、画像が類似する前記第1の動画像と前記第2の動画像のフレームペアを探索し、
    時系列に並ぶ複数の前記フレームペアを、互いに隣接する前記フレームペアの前記第1の動画像のフレームの時間差および前記第2の動画像のフレームの時間差に基づいて、時間方向に再配置し、
    再配置された前記フレームペアを構成する各フレームの画像をブレンドして前記遷移動画像のフレームの画像とすることで、前記遷移動画像を生成する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2014507772A 2012-03-30 2013-03-21 画像処理装置および方法、並びにプログラム Expired - Fee Related JP5999454B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012080973 2012-03-30
JP2012080973 2012-03-30
PCT/JP2013/057994 WO2013146508A1 (ja) 2012-03-30 2013-03-21 画像処理装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JPWO2013146508A1 true JPWO2013146508A1 (ja) 2015-12-14
JP5999454B2 JP5999454B2 (ja) 2016-09-28

Family

ID=49259765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014507772A Expired - Fee Related JP5999454B2 (ja) 2012-03-30 2013-03-21 画像処理装置および方法、並びにプログラム

Country Status (4)

Country Link
US (1) US9344643B2 (ja)
JP (1) JP5999454B2 (ja)
CN (1) CN104205807B (ja)
WO (1) WO2013146508A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112014007242T5 (de) * 2014-12-12 2017-09-28 Mitsubishi Electric Corporation Informationsverarbeitungsvorrichtung; wiedergabeverfahren für bewegte bilder und wiedergabeprogramm für bewegte bilder
WO2017094527A1 (ja) * 2015-12-04 2017-06-08 日本電産株式会社 動画生成システムおよび動画表示システム
JP6411991B2 (ja) * 2015-12-16 2018-10-24 日本電信電話株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP7246236B2 (ja) * 2019-04-12 2023-03-27 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置および画像表示方法
CN111783567B (zh) * 2020-06-16 2023-07-25 西安外事学院 一种基于极值标识的时间序列分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216975A (ja) * 2002-01-17 2003-07-31 Sony Corp 動作情報処理装置及び動作情報処理方法、記憶媒体、並びにコンピュータ・プログラム
WO2007129367A1 (ja) * 2006-04-25 2007-11-15 Mitsubishi Denki Kabushiki Kaisha 画像合成装置および画像合成方法
JP2012199613A (ja) * 2011-03-18 2012-10-18 Sony Corp 画像処理装置および方法、並びにプログラム
JP2013247468A (ja) * 2012-05-24 2013-12-09 Casio Comput Co Ltd 動画生成装置、動画生成方法、及び、プログラム
JP2013251803A (ja) * 2012-06-01 2013-12-12 Casio Comput Co Ltd 動画生成装置、動画生成方法、及び、プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100593188C (zh) * 2004-05-19 2010-03-03 索尼计算机娱乐公司 图像帧处理方法及向各种显示器显示活动图像的设备
JP5123643B2 (ja) * 2007-11-12 2013-01-23 ルネサスエレクトロニクス株式会社 映像処理装置
JP5111088B2 (ja) * 2007-12-14 2012-12-26 三洋電機株式会社 撮像装置及び画像再生装置
JP5553152B2 (ja) * 2010-04-09 2014-07-16 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5510012B2 (ja) * 2010-04-09 2014-06-04 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP2012044407A (ja) * 2010-08-18 2012-03-01 Sony Corp 画像処理装置および方法、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216975A (ja) * 2002-01-17 2003-07-31 Sony Corp 動作情報処理装置及び動作情報処理方法、記憶媒体、並びにコンピュータ・プログラム
WO2007129367A1 (ja) * 2006-04-25 2007-11-15 Mitsubishi Denki Kabushiki Kaisha 画像合成装置および画像合成方法
JP2012199613A (ja) * 2011-03-18 2012-10-18 Sony Corp 画像処理装置および方法、並びにプログラム
JP2013247468A (ja) * 2012-05-24 2013-12-09 Casio Comput Co Ltd 動画生成装置、動画生成方法、及び、プログラム
JP2013251803A (ja) * 2012-06-01 2013-12-12 Casio Comput Co Ltd 動画生成装置、動画生成方法、及び、プログラム

Also Published As

Publication number Publication date
CN104205807B (zh) 2017-06-06
CN104205807A (zh) 2014-12-10
US20150304573A1 (en) 2015-10-22
WO2013146508A1 (ja) 2013-10-03
US9344643B2 (en) 2016-05-17
JP5999454B2 (ja) 2016-09-28

Similar Documents

Publication Publication Date Title
JP5999454B2 (ja) 画像処理装置および方法、並びにプログラム
US11587319B2 (en) Gating model for video analysis
WO2020233378A1 (zh) 版面分析方法、阅读辅助设备、电路和介质
US11379519B2 (en) Query response device and method
US8717504B2 (en) Picture processing apparatus, processing method for use therewith, and program
US11184558B1 (en) System for automatic video reframing
JP2013531290A (ja) モーフィングアニメーションを生成するための方法および装置
JP2008257460A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2014010621A (ja) 最適画像サイズによる画像領域分割装置、方法、およびプログラム
US8873886B2 (en) Apparatus and method for displaying a region of an image in an enlarged manner, and program therefor
US10425658B2 (en) Image block-based matching method and system, and video processing device
Zhang et al. Boosting-based multimodal speaker detection for distributed meeting videos
CN114449313A (zh) 视频的音画面播放速率调整方法及装置
CN110910479A (zh) 视频处理方法、装置、电子设备及可读存储介质
CN114119373A (zh) 图像裁剪方法、装置及电子设备
JP4432274B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP6917788B2 (ja) 要約映像生成装置及びプログラム
JPWO2018211602A1 (ja) 学習装置、推定装置、学習方法及びプログラム
KR101969230B1 (ko) 학습을 이용한 모션 인식 장치 및 방법과 이에 대한 기록 매체
JP2005175839A (ja) 画像表示装置、画像表示方法、プログラムおよび記憶媒体
JP2000214992A (ja) 方向指示装置および方向推定方法、並びにその方法にかかるプログラムを記録したコンピュ―タ読み取り可能な記録媒体
CN117478964A (zh) 视频倍速播放的方法和装置
CN116112762A (zh) 一种基于元学习的补充数据下的说话视频生成方法
JP2023003442A (ja) 手話教材用画像生成装置及びそのプログラム
CN114491142A (zh) 一种音频波形图绘制方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160817

R151 Written notification of patent or utility model registration

Ref document number: 5999454

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees