JP7052737B2 - 映像編集装置、その方法、およびプログラム - Google Patents
映像編集装置、その方法、およびプログラム Download PDFInfo
- Publication number
- JP7052737B2 JP7052737B2 JP2019001915A JP2019001915A JP7052737B2 JP 7052737 B2 JP7052737 B2 JP 7052737B2 JP 2019001915 A JP2019001915 A JP 2019001915A JP 2019001915 A JP2019001915 A JP 2019001915A JP 7052737 B2 JP7052737 B2 JP 7052737B2
- Authority
- JP
- Japan
- Prior art keywords
- size
- subject
- image
- video editing
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000005520 cutting process Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 20
- 238000003860 storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 210000001015 abdomen Anatomy 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000001360 synchronised effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 210000003423 ankle Anatomy 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/282—Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2628—Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/272—Means for inserting a foreground image in a background image, i.e. inlay, outlay
Description
本発明は、複数の撮影装置によって撮影した映像の編集を行う映像編集装置、その方法、およびプログラムに関する。
従来から、被写体を取り囲むように多視点カメラを配置し、撮影した映像をカメラの並びに沿って切り替えることで、動きのある被写体をあたかもカメラが回り込んだような映像(以下、回り込み映像という)を得る映像編集方法が知られている(例えば、非特許文献1参照)。
図1は、多視点カメラの配置例を示す図である。この例では、被写体201を取り囲むように、時刻を同期したN台のカメラ20-nを配置している。なお、nは撮影装置(この例ではカメラ)を示すインデックスであり、n=1,2,…,Nである。なお、N台のカメラ20-nで撮影した映像は時刻同期できるものとする。
図2は多視点カメラ入力であり、図1の多視点カメラで撮影した映像の、同期した時刻cにおける画像I(n,c)を映した画面を示している。
図3は、各カメラの画像に対するラベルを説明するための図である。Camnはn番目のカメラを示すラベルであり、Numcは時刻cの画像を意味し、カメラnの時刻cの画像をI(n,c)とし、そのラベルをCamn Numcとする。
図4は、ラベルを付与した画像における被写体の骨格を推定し、推定結果を重畳した画像の例を示す。例えば、画像から人物の骨格を推定する技術として非特許文献2が知られている。この例では、被写体に対して、回り込み映像の回り込む候補であることを示す人物番号(この例では1)と候補を囲む枠502が表示されている。ここで、骨格情報として、顔503、首下504、中腹部505、右足首506、左足首507を示す●が示されていて、各部位の位置情報を得ることができる。
また、類似する画像領域の分析に関する研究も行われており(例えば、非特許文献3参照)、類似する画像領域に基づき、あるカメラ20-nで撮影した被写体が他のカメラ20-n’(n'=1,2,…,N、ただし、n'≠n)で撮影した画像のどの画像領域に対応するかを判定することができる。つまり、N個の画像に存在する被写体を同定することができる。
従来技術では被写体を取り囲むよう配置されたN個のカメラによって撮影された映像のある時刻の画像をカメラの並びに沿って切り替えることで、ある時刻における回り込み映像を得る。
池谷健佑他、「多視点ロボットカメラシステムを用いた映像表現手法」、NHK、2012年映像情報メディア学会年次大会講演予稿集、Vol.2012, Page.21-1
Zhe Cao and Tomas Simon and Shih-En Wei and Yaser Sheikh, "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields", CVPR, 2017.
多田昌裕他、「類似する画像領域の特徴解析と視覚感性のモデル化」、電子情報通信学会論文誌、D-II、情報・システム、II-パターン処理、D-II 87(10)、1983-1995, 2004-10-01
しかしながら、複数のカメラを設置し、非特許文献2により人物の骨格を推定して人物認識を行ったり、非特許文献3を利用して被写体を同定しても、様々な条件により被写体に関する完全な位置情報を得られる訳ではなく、誤認識や情報欠損が生じる。誤認識や欠損し情報に基づき、回転した映像を合成した場合、被写体の位置が上下左右に変動するため連続性が感じられなくなり、見づらくなってしまうことがある。以下、図5を参照してより詳しく説明する。図5は、カメラ20-nで撮影された映像の時刻cにおける、被写体の候補の周りに枠と候補を示す番号を重畳した画像の例を示す。二人の被写体の候補の人物1、2が映されていることが分かる。画像I(2,c)において、人物が入替わり認識されていて、人物の骨格認識の誤認識例が示されている。画像I(4,c)において、人物が認識されておらず、不認識例が示されている。このように、人物の骨格認識では、誤認識や情報欠損が起こる場合がある。
また、複数のカメラを設置し、被写体の正しい位置情報を得られても、複数のカメラで撮影した映像の、ある時刻における画像の被写体の大きさが均一でなく、被写体の大きさが変動するため連続性が感じられなくなり、回転した合成映像が見づらくなってしまうことがある。
本発明は、多視点カメラで撮影した複数の映像を用いて生成した回り込み映像を視聴者が見やすいように編集することができる映像編集装置、その方法、およびプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、映像編集装置は、Nを3以上の整数の何れかとし、被写体を取り囲むよう配置されたN個の撮影装置によって撮影された映像を撮影装置の並びに沿って切り替えることで、あたかも撮影装置が被写体を回り込んだときに得られる映像である回り込み映像を得る。映像編集装置は、N個の撮影装置から得られる画像に対して、撮影装置を示すラベルと、時刻を示すラベルとを付与するラベル付与部と、ラベルを付与した画像に存在する被写体の位置と大きさに関する情報との組合せを抽出する位置大きさ抽出部と、N個の被写体の位置と大きさに関する情報に基づき、被写体の位置に関する多項式と被写体の大きさに関する多項式とを生成し、被写体の位置に関する多項式を用いて多項式近似曲線によるN個の被写体の位置の補正または補間を行い、被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の大きさの補正または補間を行い、拡縮パラメータpによりN個の被写体の大きさを拡大または縮小させる位置大きさ決定部と、ラベルを付与したN個の画像から補正または補間および拡大または縮小されたN個の被写体の位置と大きさとに基づく切り取り範囲を切り取る画像切り取り部と、切り取ったN個の画像のサイズを同じサイズに変換する画像サイズ整合部と、回り込み映像の長さを示すパラメータをTpとし、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成し、回り込み映像を生成する映像編集部とを含む。
本発明によれば、多視点カメラで撮影した複数の映像を用いて生成した回り込み映像を視聴者が見やすいように編集することができるという効果を奏する。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
以下、各実施形態のポイントを説明する。
<第一実施形態のポイント>
第一実施形態では、誤認識や情報欠損に対応するために、被写体の位置および大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の位置および大きさの補正または補間を行う(第二実施形態のポイント1で具体例を示す)。
第一実施形態では、誤認識や情報欠損に対応するために、被写体の位置および大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の位置および大きさの補正または補間を行う(第二実施形態のポイント1で具体例を示す)。
拡縮パラメータpによりN個の補正または補間された被写体の大きさを拡大または縮小させる(第二実施形態のポイント2で具体例を示す)。
また、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成し、長さTpの回り込み映像を生成する(第三実施形態のポイントで具体例を示す)。
<第二実施形態のポイント1>
図6は、多項式近似曲線による情報の補正と補間を説明するための図である。なお、第二実施形態では、多項式近似曲線による情報の補正と補間を行うため、Nは3以上の整数の何れかである。
図6は、多項式近似曲線による情報の補正と補間を説明するための図である。なお、第二実施形態では、多項式近似曲線による情報の補正と補間を行うため、Nは3以上の整数の何れかである。
図6A、図6Bは、それぞれ候補の人物1、2についての、Cam番号(横軸)とX値(縦軸)の関係の例を示している。なお、Cam番号は、カメラの並びに対応するものとする。そのため、Camnに対応するカメラ20-nとCamn+1に対応するカメラ20-n+1とは隣接する。
まず、人物1の位置に関するN個の情報に基づき、人物1の位置(X値)に関する多項式(近似式)を生成する。なお、情報が欠損している場合には、欠損していない残りの情報のみを用いて多項式を生成してもよいし、欠損している情報の代わりに、(1)欠損していない残りの情報の平均、(2)欠損していない情報のうち、欠損している情報に対応するカメラと物理的に最も近い位置に配置されたカメラに対応する情報(複数存在する場合には、その平均、例えば、隣接するカメラに対応する情報が何れも欠損していない場合には、それらの平均)等を用いて、多項式を生成してもよい。
図中、●は誤差(観測値と真値との差分)が極めて小さいデータを表し、○は誤差が大きいデータを表し、破線の○は補正または補間されたデータを表す。観測値として人物の骨格認識の結果得られる値を利用し、真値として多項式(近似式)上の値を用いる。例えば、誤差率(誤差/真値)が所定の閾値より小さい場合(または閾値以下の場合)に誤差が極めて小さいデータとし、誤差率が所定の閾値以上の場合(または閾値より大きい場合)に誤差が大きいデータと判断する。
第二実施形態では、誤差が大きいデータと判断した場合、誤差が大きいデータを多項式近似曲線によって補正し、誤認識例の大きな誤差を緩和する。例えば、誤差が大きいデータを近似式上の値に置換することで補正する。これにより、誤認識例の大きな誤差を緩和できることを示している。
また、第二実施形態では、情報が欠損している場合、欠損している情報を近似式上の値に置換することで補間する。図6Bは、不認識例のデータを補間できることを示している。
図6は、縦軸がX値の例であるが、Y値、大きさについても同様の方法により補正または補間することができる。
<第二実施形態のポイント2>
図4の骨格推定結果を用いて人物の大きさを調整する処理を行い、大きすぎず小さすぎない大きさにすることで、回転した合成映像が見づらくなってしまうという課題を解決する。
図4の骨格推定結果を用いて人物の大きさを調整する処理を行い、大きすぎず小さすぎない大きさにすることで、回転した合成映像が見づらくなってしまうという課題を解決する。
図7は、画像の切り取りサイズを指定するための、倍率のパラメータpnの1例である。ここで、
G=(1+n)/2
G2=N-G
pn=p-(p-1)×{(n-G)/G2 2}
である。pは拡縮パラメータであり、所定の値である。例えば、利用者によって指定される値であってもよいし、何らかの初期値であってもよい。
G=(1+n)/2
G2=N-G
pn=p-(p-1)×{(n-G)/G2 2}
である。pは拡縮パラメータであり、所定の値である。例えば、利用者によって指定される値であってもよいし、何らかの初期値であってもよい。
倍率のパラメータpnは、拡大縮小の倍率パラメータである。第二実施形態では、上述のパラメータp,G,G2により図7のように倍率パラメータpnを2次曲線で作成することにより、拡縮を制御する。式から分かるように、pnは最大値、または、最小値においてpになるように2次曲線で作成する。
図7A、図7Bは、それぞれN=5、N=10の例を示す。各図において、横軸はカメラ番号を、縦軸pn値を示している。p=1.15、p=1.1のpn値を示す。
図8は、画像切り取り処理の内容を説明するための図である。
ラベルCamn Numc(n=1,2,…,N)が付与されたN個の画像I(n,c)から、被写体を切り取り範囲で切り取り、NumcにおけるN個の切り取り画像Icut(n,c)を取得する。
画像I(n,c)において、被写体の中心として、補正または補間された中心X座標値Xs(n)と補正または補間された中心Y座標値Ys(n)とを用いる。
切り取り画像Icut(n,c)は、補正または補間された中心X座標値Xs(n)と補正または補間された中心Y座標値Ys(n)を中心とし、右上値(XsR(n),YsU(n))、左上値(XsL(n),YsU(n))、右下値(XsR(n),YsD(n))、左下値(XsL(n),YsD(n))により定まる。なお、補正または補間された大きさをLs(n)とすると、{(XsR(n),YsU(n)),(XsL(n),YsU(n)),(XsR(n),YsD(n)),(XsL(n),YsD)(n)}={(Xs(n)-a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)-a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn)}である。ここで、a,bはアスペクト比を特定するパラメータであり、例えばそれぞれ2, 1.5とすることでアスペクト比4:3の画像を得ることができる。
図9は、後述する画像サイズ整合部の出力の画像であり、N個の切り取り画像の大きさを正規化して並べたものである。正規化することで、目的の被写体のサイズが調度良い大きさになり、回転時のガタガタが抑えられ、連続性を感じられ、見やすいものとなる。
図9Aは図5の候補の人物1の切り取り画像であり、図9Bは図5の候補の人物2の切り取り画像である。
図9Aと図9Bの切り取り画像Icut(2,c)では、誤認識での大きな誤差を補正している。
図9Bの切り取り画像Icut(4,c)では、不認識でのデータを補間している。
具体的には、
(1)各画像から骨格推定結果を求め、骨格推定結果から縦サイズを得る。
(2)多項式近似により各画像の被写体の縦サイズの補正または補間する。
(3)補正または補間した縦サイズに対して拡縮効果を入れる。
(4)拡縮効果を入れた画像の大きさを正規化する。
(1)各画像から骨格推定結果を求め、骨格推定結果から縦サイズを得る。
(2)多項式近似により各画像の被写体の縦サイズの補正または補間する。
(3)補正または補間した縦サイズに対して拡縮効果を入れる。
(4)拡縮効果を入れた画像の大きさを正規化する。
なお、(3)の拡縮効果を入れることで以下の効果を得ることができる。
前述のとおり、被写体の大きさを調度良い同じ大きさや滑らかにする処理を入れ、極力に振動を抑え込む。しかし一方で、被写体を同じ大きさに表示させる処理を行うがために、被写体を回転映像にしてみると、被写体の大きさの振動(以下、大きさのガタガタ振動)をかえって目で知覚させやすくなってしまう(見づらくなる)場合がある。そのような場合もあるため、拡縮効果を入れ、被写体の大きさを変えていくことで、被写体を回転映像にした時、ガタガタ振動を目で知覚しにくくする(見づらくならないようにする)。
このように、骨格推定結果の誤差や情報欠損について、近似式をあてはめることにより、誤認識を小さくする処理(補正する処理)と欠損した情報の補間する処理と人物の大きさ調整と拡縮処理を行い、切り取り画像の拡縮率を変え、回転した合成映像を見やすく編集する。
<第三実施形態のポイント>
あるカメラから得られる切り取り画像と、そのカメラに隣接するカメラから得られる切り取り画像とから中間画像を生成し、中間画像から映像を生成することで、視聴者の違和感をより低減する。
あるカメラから得られる切り取り画像と、そのカメラに隣接するカメラから得られる切り取り画像とから中間画像を生成し、中間画像から映像を生成することで、視聴者の違和感をより低減する。
Tpを回り込み映像の長さ(時間的な長さ)を示すパラメータとする。回り込み映像の時刻tにおけるn+1番目の画像I(n+1,c')とn番目の画像I(n,c')との間の中間画像I(t)は、次式により求める。
Tc=Tp/(N-1)
t=Tc×(n-1)+1,…,Tc×nのとき、
B(n+1,t)=1/[1+Exp[Ng×{Tc×(n-0.5)-t}/Tc]]
B(n,t)=1-B(n+1,t)
I(t)=I(n+1,c')×B(n+1,t)+I(n,c')×B(n,t)
である。ただし、n=1,2,…,N-1である。一例として、Ng=9である。
Tc=Tp/(N-1)
t=Tc×(n-1)+1,…,Tc×nのとき、
B(n+1,t)=1/[1+Exp[Ng×{Tc×(n-0.5)-t}/Tc]]
B(n,t)=1-B(n+1,t)
I(t)=I(n+1,c')×B(n+1,t)+I(n,c')×B(n,t)
である。ただし、n=1,2,…,N-1である。一例として、Ng=9である。
なお、画像I(n+1,c')、画像I(n,c')は、補正または補間および拡大または縮小された被写体の位置と大きさとに基づく切り取り範囲で切り取ったものを、規格化(同じサイズに変換)したものである。時刻を表すインデックスc'は多視点カメラで撮影した映像の、同期した時刻の何れかを表し、c'=1,2,…,Zの何れかである。第三実施形態では、N個の映像のある時刻c'のN個の画像I(n,c')から、Tp時間の回り込み映像を生成する。tは、回り込み映像における時刻を表すインデックスである。
図10は画像I(n+1,c')、画像I(n,c')の例を示し、図11はブレンド割合B(n+1,t)、B(n,t)とtとの関係を示す。横軸の右端において時刻t=Tc×(n-1)、左端において時刻t=Tc×n(つまり、t=Tc×(n-1),…,Tc×n)、中間において時刻t=Tc×(n-0.5)である。この例では、Ng=9、nの最大値がN-1であるとき(つまり、n=1,2,…,N-1のとき)の画像I(n+1,c')、画像I(n,c')とのブレンド割合B(n+1,t)(破線)、B(n,t)(実線)の曲線が示されている。
このように、可変可能な時間パラメータTpに基づき、カメラ間の中間画像を合成することで、カメラ間の視点移動画像を合成することができる。
<第一実施形態>
図12は第一実施形態に係る映像編集装置の機能ブロック図を、図13はその処理フローを示す。
図12は第一実施形態に係る映像編集装置の機能ブロック図を、図13はその処理フローを示す。
映像編集装置は、IF部101、ラベル付与部102、位置大きさ抽出部103、IF部104、位置大きさ決定部105、画像切り取り部106、画像サイズ整合部107、IF部108、映像編集部109、IF部110を含む。
映像編集装置は、N個の映像(多視点映像)を入力とし、回り込み映像の回り込む候補を囲む枠(図4参照)を重畳したN個の映像を出力する。枠を重畳したN個の映像を視た利用者が何れかの候補を指定し、回り込み映像の元となるN個の画像の時刻と、さらに、拡縮パラメータpおよび回り込み映像の長さを示すパラメータTpとを指定し、映像編集装置に入力する。例えば、ディスプレイやタッチパネル等の出力装置に、枠を重畳したN個の映像を表示し、N個の映像のうちの何れかに表示された候補を利用者がマウスやタッチパネル、キーボード等の入力装置を用いて指定する。指定したタイミングを回り込み映像の元となるN個の画像の時刻とする。また、利用者が、まず入力装置を用いて時刻(回り込み映像の元となるN個の画像の時刻)を指定し、時刻に対応する枠を重畳したN個の画像を出力装置に表示し、表示された候補を利用者が入力装置を用いて指定してもよい。要は、利用者が、回り込み映像の元となるN個の画像の時刻と、候補と、拡縮パラメータpおよび回り込み映像の長さを示すパラメータTpとを指定することができるように、何らかの映像や画像を表示し、指定された情報を取得できればよい。
映像編集装置は、指定された候補と、時刻と、拡縮パラメータpと、パラメータTpとを入力とし、指定された候補、時刻の、拡縮パラメータpに対応した、長さTpの回り込み映像を生成し、出力する。
なお、N個の映像(多視点映像)はカメラなどの撮影装置から直接入力されるものに限らず、記憶媒体に記憶されたものを用いてもよいし、映像編集装置内の記憶部に記憶されたものを用いてもよい。
映像編集装置は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。映像編集装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。映像編集装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。映像編集装置の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。映像編集装置が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。ただし、各記憶部は、必ずしも映像編集装置がその内部に備える必要はなく、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置により構成し、映像編集装置の外部に備える構成としてもよい。
以下、各部について説明する。
<IF部101>
IF部101は、N個の映像(多視点映像)を入力とし、同期したN個の映像を出力する。
IF部101は、N個の映像(多視点映像)を入力とし、同期したN個の映像を出力する。
<ラベル付与部102>
ラベル付与部102は、同期したN個の映像を入力とし、同期したN個の映像を構成する画像に対して、撮影装置を示すラベルと、時刻を示すラベルとを付与し(S102、図3参照)、ラベルを付与した画像I(n,c)を出力する。各映像がZ個の画像からなる場合には、撮影装置を示すラベルと、時刻を示すラベルとを付与してN×Z個の画像I(n,c)を出力する。なお、N個の映像を撮影した撮影装置は、被写体を取り囲むよう配置されているものとし、撮影装置の並びは予め分かっているものとする。
ラベル付与部102は、同期したN個の映像を入力とし、同期したN個の映像を構成する画像に対して、撮影装置を示すラベルと、時刻を示すラベルとを付与し(S102、図3参照)、ラベルを付与した画像I(n,c)を出力する。各映像がZ個の画像からなる場合には、撮影装置を示すラベルと、時刻を示すラベルとを付与してN×Z個の画像I(n,c)を出力する。なお、N個の映像を撮影した撮影装置は、被写体を取り囲むよう配置されているものとし、撮影装置の並びは予め分かっているものとする。
<位置大きさ抽出部103>
位置大きさ抽出部103は、ラベルを付与した画像I(n,c)を入力とし、ラベルを付与した画像に存在する被写体の候補を示すインデックスmとその被写体の候補の位置と大きさに関する情報info(m)との組合せ(I(n,c),m,info(m))を抽出し(S103)、ラベルを付与した画像に被写体の候補を囲む枠を重畳した画像I'(n,c)をIF部104に出力し、被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せ(n,c,m,info(m))を位置大きさ決定部105に出力する。N×Z個の画像に、それぞれM体の被写体の候補が存在する場合には、N×Z×M個の被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せ(n,c,m,info(m))を抽出する。なお、被写体が一時的に画像から存在しなくなる場合には、存在していないことを示す情報を位置と大きさに関する情報として利用すればよい。
位置大きさ抽出部103は、ラベルを付与した画像I(n,c)を入力とし、ラベルを付与した画像に存在する被写体の候補を示すインデックスmとその被写体の候補の位置と大きさに関する情報info(m)との組合せ(I(n,c),m,info(m))を抽出し(S103)、ラベルを付与した画像に被写体の候補を囲む枠を重畳した画像I'(n,c)をIF部104に出力し、被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せ(n,c,m,info(m))を位置大きさ決定部105に出力する。N×Z個の画像に、それぞれM体の被写体の候補が存在する場合には、N×Z×M個の被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せ(n,c,m,info(m))を抽出する。なお、被写体が一時的に画像から存在しなくなる場合には、存在していないことを示す情報を位置と大きさに関する情報として利用すればよい。
なお、画像から所定の対象(例えば人間)を検出し、検出した対象に枠を重畳技術としては、どのような画像認識(人物認識)技術を用いてもよい。枠が表示されると被写体の候補が認識できていることを示唆し、枠が表示されないと被写体の候補が認識できていないことを示唆している。
被写体の候補の位置と大きさに関する情報を取得する方法としては、どのような取得方法を用いてもよい。例えば、非特許文献2の方法で画像に存在する被写体の候補の骨格を推定し、推定結果(骨格推定結果)を候補の位置と大きさに関する情報として利用してもよい。
N個の画像に存在する1つ以上の被写体の候補をそれぞれ同定し、被写体の候補を示すインデックスを付与する際には、どのような同定方法を用いてもよい。例えば、非特許文献3を利用して、N個の画像に存在する被写体を同定してもよい。
<IF部104>
IF部104は、ラベルを付与した画像に被写体の候補を囲む枠を重畳した画像I'(n,c)(図4参照)を入力とし、外部の出力装置に出力する。
IF部104は、ラベルを付与した画像に被写体の候補を囲む枠を重畳した画像I'(n,c)(図4参照)を入力とし、外部の出力装置に出力する。
前述の通り、利用者が、回り込み映像の元となるN個の画像の時刻と、候補と、拡縮パラメータpおよび回り込み映像の長さを示すパラメータTpとを指定することができるように、何らかの映像や画像を出力装置を介して利用者に表示する。
<IF部108>
IF部108は、利用者に指定された候補と、時刻と、拡縮パラメータpと、パラメータTpとを入力とし、指定された候補と、時刻と、拡縮パラメータpとを位置大きさ決定部105に出力する。また、IF部108は、指定された時刻を画像切り取り部106に出力し、パラメータTpを映像編集部109に出力する。なお、候補の指定、拡縮パラメータpと、パラメータTpの入力がない場合には、指定された候補と、拡縮パラメータp、パラメータTpとして、前回使用した値や初期値等を使用してもよい。
IF部108は、利用者に指定された候補と、時刻と、拡縮パラメータpと、パラメータTpとを入力とし、指定された候補と、時刻と、拡縮パラメータpとを位置大きさ決定部105に出力する。また、IF部108は、指定された時刻を画像切り取り部106に出力し、パラメータTpを映像編集部109に出力する。なお、候補の指定、拡縮パラメータpと、パラメータTpの入力がない場合には、指定された候補と、拡縮パラメータp、パラメータTpとして、前回使用した値や初期値等を使用してもよい。
<位置大きさ決定部105>
位置大きさ決定部105は、被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せと、指定された候補と、時刻と、拡縮パラメータpとを入力とする。
位置大きさ決定部105は、被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せと、指定された候補と、時刻と、拡縮パラメータpとを入力とする。
まず、位置大きさ決定部105は、被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せ(n,c,m,info(m))の中から指定された候補と時刻とに対応する組合せ(n,c',m',info(m'))を抽出する。c'は指定された時刻のインデックスを示し、m'は指定された候補のインデックスを示す。例えば、N×Z×M個の被写体の候補を示すインデックスとその被写体の候補の位置と大きさに関する情報との組合せを入力とする場合には、N×Z×M個の組合せ(n,c,m,info(m))の中から、指定された被写体の候補(以降、指定された被写体の候補を単に被写体とも呼ぶ)と、時刻とで指定されるN個の被写体の位置と大きさに関する情報(n,c',m',info(m'))を抽出する。
位置大きさ決定部105は、N個の被写体の位置と大きさに関する情報(n,c',m',info(m'))から補正または補間および拡大または縮小されたN個の被写体の位置と大きさ{Xs(n),Ys(n),size(n)}を求め(S105)、補正または補間および拡大または縮小されたN個の被写体の位置と大きさとに基づく切り取り範囲{(XsR(n),YsU(n)),(XsL(n),YsU(n)),(XsR(n),YsD(n)),(XsL(n),YsD(n))}を出力する。具体的には、以下のように求める。
位置大きさ決定部105は、N個の被写体の位置と大きさに関する情報に基づき、被写体の位置に関する多項式と被写体の大きさに関する多項式とを生成する。
さらに、位置大きさ決定部105は、被写体の位置に関する多項式を用いて多項式近似曲線によるN個の被写体の位置の補正または補間を行う。
位置大きさ決定部105は、被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の大きさの補正または補間を行い、拡縮パラメータpによりN個の被写体の大きさを拡大または縮小させる。
<画像切り取り部106>
画像切り取り部106は、指定された時刻c'と、ラベルを付与したN×Z個の画像I(n,c)とN個の切り取り範囲{(XsR(n),YsU(n)),(XsL(n),YsU(n)),(XsR(n),YsD(n)),(XsL(n),YsD(n))}とを入力とする。
画像切り取り部106は、指定された時刻c'と、ラベルを付与したN×Z個の画像I(n,c)とN個の切り取り範囲{(XsR(n),YsU(n)),(XsL(n),YsU(n)),(XsR(n),YsD(n)),(XsL(n),YsD(n))}とを入力とする。
まず、ラベルを付与した画像I(n,c)の中から指定された時刻c'に対応するN個の画像I(n,c')を抽出する。N個の画像I(n,c')からそれぞれN個の切り取り範囲{(XsR(n),YsU(n)),(XsL(n),YsU(n)),(XsR(n),YsD(n)),(XsL(n),YsD(n))}を切り取り(S106)、切り取ったN個の画像Icut(n,c')出力する。
<画像サイズ整合部107>
画像サイズ整合部107は、切り取ったN個の画像Icut(n,c')を入力とし、N個の画像Icut(n,c')のサイズを同じサイズに変換し(S107)、同じサイズに変換したN個の切り取った画像Ist(n,c')を出力する。
画像サイズ整合部107は、切り取ったN個の画像Icut(n,c')を入力とし、N個の画像Icut(n,c')のサイズを同じサイズに変換し(S107)、同じサイズに変換したN個の切り取った画像Ist(n,c')を出力する。
<映像編集部109>
映像編集部109は、パラメータTpと同じサイズに変換したN個の切り取った画像Ist(n,c')とを入力とし、隣接する撮影装置に対応する2つの同じサイズの画像Ist(n+1,c'),Ist(n,c')から中間画像I(t)を生成し、中間画像(t)に基づき、長さTpの回り込み映像を生成し(S109)、出力する。ただし、Tc=Tp/(N-1)とする。
映像編集部109は、パラメータTpと同じサイズに変換したN個の切り取った画像Ist(n,c')とを入力とし、隣接する撮影装置に対応する2つの同じサイズの画像Ist(n+1,c'),Ist(n,c')から中間画像I(t)を生成し、中間画像(t)に基づき、長さTpの回り込み映像を生成し(S109)、出力する。ただし、Tc=Tp/(N-1)とする。
<IF部110>
IF部110は、回り込み映像を入力とし、回り込み映像を外部の出力装置に出力する。
IF部110は、回り込み映像を入力とし、回り込み映像を外部の出力装置に出力する。
<効果>
以上の構成により、多視点カメラで撮影した複数の映像を用いて生成した回り込み映像を視聴者が見やすいように編集することができる。
以上の構成により、多視点カメラで撮影した複数の映像を用いて生成した回り込み映像を視聴者が見やすいように編集することができる。
より詳しく説明すると、被写体の位置に関する多項式を用いて多項式近似曲線によるN個の被写体の位置の補正または補間を行うことで、被写体の位置が上下左右に変動し、連続性が感じられなくなり、見づらくなってしまうという課題を解決している。
さらに、被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の大きさの補正または補間を行い、拡縮パラメータpによりN個の被写体の大きさを拡大または縮小させることで、被写体の大きさが変動するため連続性が感じられなくなり、回転した合成映像が見づらくなってしまうという課題を解決している。
また、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成し、長さTpの回り込み映像を生成することで、隣接する撮影装置に対応する2つの同じサイズの画像を滑らかに繋げることができる。撮影手段の個数Nの値大きく、撮影手段が密に配置されることが望ましいが、本実施形態では、中間画像を生成することで、比較的Nの値が小さい場合(例えばN=5)であっても画像を滑らかに繋げることができる。
<変形例>
本実施形態では、N個の映像の中に1体以上の被写体の候補が存在し、その中から1つの被写体を指定する構成としたが、N個の映像の中に1体の被写体の候補しか存在しない場合にはその被写体の候補を被写体とし、被写体を指定する処理、構成を省略してもよい。
本実施形態では、N個の映像の中に1体以上の被写体の候補が存在し、その中から1つの被写体を指定する構成としたが、N個の映像の中に1体の被写体の候補しか存在しない場合にはその被写体の候補を被写体とし、被写体を指定する処理、構成を省略してもよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態と異なる部分を中心に説明する。
本実施形態では、図14を参照して位置大きさ決定部105の具体的な処理の一例を説明する。
本実施形態では、骨格推定結果を被写体の位置と大きさに関する情報とする。
位置大きさ決定部105が、被写体の候補を示すインデックスとその被写体の位置と大きさに関する情報との組合せの中から指定された候補と時刻とに対応する組合せを抽出するまでの処理は第一実施形態と同じである。その後、第二実施形態では、位置大きさ決定部105は、被写体の位置と大きさに関する情報である図4の被写体の骨格推定情報から顔503、中腹部505、右足首506、左足首507の座標値(Xface(n),Yface(n)),(Xbelly(n),Ybelly(n)),(XRankle(n),YRankle(n)),(XLankle(n),YLankle(n))を得る。なお、情報が欠損している場合にはNULLを取得してもよい。
位置大きさ決定部105は、次式により、N個の骨格推定結果からそれぞれN個の被写体の縦サイズYsize(n)を得る。
Y1(n)=Yface(n)-YRankle(n)
Y2(n)=Yface(n)-YLankle(n)
Ysize(n)=(Y1(n)+Y2(n))/2
なお、情報が欠損している場合にはNULLを取得してもよい。
Y1(n)=Yface(n)-YRankle(n)
Y2(n)=Yface(n)-YLankle(n)
Ysize(n)=(Y1(n)+Y2(n))/2
なお、情報が欠損している場合にはNULLを取得してもよい。
中腹部505の座標値(Xbelly(n),Ybelly(n))を被写体の位置とし、縦サイズYsize(n)を得、これを被写体の大きさとして取得する(S901)。
N個の被写体の位置と大きさに関する情報から、情報の欠損が多くて、3つ以上の被写体の大きさと被写体の位置を得られない場合には(S902のNOの場合)、多項式近似曲線による補正または補間ができないものと判断し、回り込み映像の編集を行わず処理を終了する(S904)。
3つ以上の被写体の大きさと被写体の位置を得られる場合(S902のYESの場合)、<第二実施形態のポイント1>で説明した処理を行う。
位置大きさ決定部105は、3つ以上の被写体の位置を用いて、被写体の位置に関する多項式を生成する。さらに被写体の位置に関する多項式を用いて多項式近似曲線によるN個の被写体の位置の補正または補間を行う(S905)。
例えば、被写体の位置に関する多項式に当てはめたときに、閾値よりも大きな外れ値を有する場合に、外れ値となった位置を多項式で求めた値に置換することで補正する(図6参照)。また、n番目の被写体の位置が欠損してる場合に、欠損している位置を多項式で求めた値に置換することで補間する(図6B参照)。
位置大きさ決定部105は、3つ以上の被写体の大きさを用いて、被写体の大きさに関する多項式を生成する。さらに被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の被写体の大きさの補正または補間を行う(S906)。
例えば、被写体の大きさに関する多項式に当てはめたときに、閾値よりも大きな外れ値を有する場合に、外れ値となった大きさを多項式で求めた値に置換することで補正する。また、n番目の被写体の大きさが欠損してる場合に、欠損している大きさを多項式で求めた値に置換することで補間する。
以上の処理により、補正または補間された被写体の位置と大きさを取得する。なお、上述の閾値判定や欠損判定の後に、外れ値や欠損がなく実際に補正または補間しない場合もあるが、それらも合わせて、補正または補間された被写体の位置と大きさと呼ぶ。
次に、位置大きさ決定部105は、拡縮パラメータpの指定がある場合(S1002のYesの場合)、以下のS1004(<第二実施形態のポイント2>で説明した処理)を実行し、拡縮パラメータpの指定がない場合(S1002のNoの場合)、以下のS1005を実行する。
(S1005(拡縮パラメータpの指定がない場合))
補正または補間された被写体の位置を(Xs(n),Ys(n))とし、補正または補間された被写体の大きさをLs(n)とすると、切り取り範囲を、Xs(n)に対してX軸方向に±a×Ls(n)、Ys(n)に対してY軸方向に±b×Ls(n)とする。つまり、切り取り範囲を{(Xs(n)-a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)-a×Ls(n),Ys(n)+b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)+b×Ls(n))}として求める。
補正または補間された被写体の位置を(Xs(n),Ys(n))とし、補正または補間された被写体の大きさをLs(n)とすると、切り取り範囲を、Xs(n)に対してX軸方向に±a×Ls(n)、Ys(n)に対してY軸方向に±b×Ls(n)とする。つまり、切り取り範囲を{(Xs(n)-a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)-a×Ls(n),Ys(n)+b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)+b×Ls(n))}として求める。
(S1004(拡縮パラメータpの指定がある場合))
拡縮パラメータpにより補正または補間されたN個の被写体の大きさを拡大または縮小させる。例えば、第二実施形態のポイント2で説明した処理を行い、拡縮パラメータpを用いて、N個の被写体の倍率パラメータpnを2次曲線で作成し、N個の被写体の大きさを拡大または縮小させる。より詳しくは以下の処理を行う。まず、
G=(1+n)/2
G2=N-G
pn=p-(p-1)×{(n-G)/G2 2}
を求める。切り取り範囲をパラメータpnに基づきXs(n)に対してX軸方向に±a×Ls(n)×pn、Ys(n)に対してY軸方向に±b×Ls(n)×pnとする。つまり、切り取り範囲を{(Xs(n)-a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)-a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn)}として求める。なお、視聴者には、pnが大きいほど切り取り範囲が大きくなり切り取り画像における被写体の割合は小さくなり縮小しているように見え、pnが小さいほど切り取り範囲が小さくなり切り取り画像における被写体の割合は大きくなり拡大しているように見える。
拡縮パラメータpにより補正または補間されたN個の被写体の大きさを拡大または縮小させる。例えば、第二実施形態のポイント2で説明した処理を行い、拡縮パラメータpを用いて、N個の被写体の倍率パラメータpnを2次曲線で作成し、N個の被写体の大きさを拡大または縮小させる。より詳しくは以下の処理を行う。まず、
G=(1+n)/2
G2=N-G
pn=p-(p-1)×{(n-G)/G2 2}
を求める。切り取り範囲をパラメータpnに基づきXs(n)に対してX軸方向に±a×Ls(n)×pn、Ys(n)に対してY軸方向に±b×Ls(n)×pnとする。つまり、切り取り範囲を{(Xs(n)-a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)-a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn)}として求める。なお、視聴者には、pnが大きいほど切り取り範囲が大きくなり切り取り画像における被写体の割合は小さくなり縮小しているように見え、pnが小さいほど切り取り範囲が小さくなり切り取り画像における被写体の割合は大きくなり拡大しているように見える。
<変形例>
本実施形態では、S1005(拡縮パラメータpの指定がない場合)に、切り取り範囲を{(Xs(n)-a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)-a×Ls(n),Ys(n)+b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)+b×Ls(n))}として求める例を示したが、第一実施形態で説明したように、拡縮パラメータpとして、前回使用した値や初期値等を使用してもよい。
本実施形態では、S1005(拡縮パラメータpの指定がない場合)に、切り取り範囲を{(Xs(n)-a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)-b×Ls(n)),(Xs(n)-a×Ls(n),Ys(n)+b×Ls(n)),(Xs(n)+a×Ls(n),Ys(n)+b×Ls(n))}として求める例を示したが、第一実施形態で説明したように、拡縮パラメータpとして、前回使用した値や初期値等を使用してもよい。
本実施形態では、中腹部の座標値を被写体の位置とし、縦サイズを被写体の大きさとして利用しているが、他の値を被写体の位置、大きさとして利用してもよい。例えば、複数の座標値の重心や中心等を被写体の位置としてもよいし、横サイズや面積等を被写体の大きさとしてもよい。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態と異なる部分を中心に説明する。
本実施形態では、映像編集部109の具体的な処理の一例を説明する。
映像編集部109は、パラメータTpと同じサイズに変換したN個の切り取った画像とを入力とし、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成する。例えば、n+1番目の画像I(n+1,c')とn番目の画像I(n,c')(図10参照)とから、n+1番目の画像I(n+1,c')とn番目の画像I(n,c')との間の中間画像I(t)を次式により生成する。
B(n+1,t)=1/[1+Exp[Ng×{Tc×(n-0.5)-t}/Tc]]
B(n,t)=1-B(n+1,t)
I(t)=I(n+1,c')×B(n+1,t)+I(n,c')×B(n,t)
なお、ブレンド割合B(n+1,t)、B(n,t)は図11で示すようにtに応じて変化する。Tc=Tp/(N-1)
t=Tc×(n-1)+1,…,Tc×n
である。
B(n+1,t)=1/[1+Exp[Ng×{Tc×(n-0.5)-t}/Tc]]
B(n,t)=1-B(n+1,t)
I(t)=I(n+1,c')×B(n+1,t)+I(n,c')×B(n,t)
なお、ブレンド割合B(n+1,t)、B(n,t)は図11で示すようにtに応じて変化する。Tc=Tp/(N-1)
t=Tc×(n-1)+1,…,Tc×n
である。
一例として、Ng=9である。n=1,2,…N-1とすることで、中間画像I(t)を生成する。中間画像I(t)を順番に並べることで長さTpの回り込み映像を生成する。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (6)
- Nを3以上の整数の何れかとし、被写体を取り囲むよう配置されたN個の撮影装置によって撮影された映像を前記撮影装置の並びに沿って切り替えることで、あたかも前記撮影装置が前記被写体を回り込んだときに得られる映像である回り込み映像を得る映像編集装置であって、
N個の撮影装置から得られる画像に対して、撮影装置を示すラベルと、時刻を示すラベルとを付与するラベル付与部と、
ラベルを付与した画像に存在する被写体の位置と大きさに関する情報との組合せを抽出する位置大きさ抽出部と、
N個の前記被写体の位置と大きさに関する情報に基づき、前記被写体の位置に関する多項式と前記被写体の大きさに関する多項式とを生成し、前記被写体の位置に関する多項式を用いて多項式近似曲線によるN個の前記被写体の位置の補正または補間を行い、前記被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の前記被写体の大きさの補正または補間を行い、拡縮パラメータpによりN個の前記被写体の大きさを拡大または縮小させる位置大きさ決定部と、
前記ラベルを付与したN個の画像から補正または補間および拡大または縮小されたN個の前記被写体の位置と大きさとに基づく切り取り範囲を切り取る画像切り取り部と、
切り取ったN個の画像のサイズを同じサイズに変換する画像サイズ整合部と、
回り込み映像の長さを示すパラメータをTpとし、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成し、回り込み映像を生成する映像編集部とを含む、
映像編集装置。 - 請求項1の映像編集装置であって、
n=1,2,…Nとし、前記被写体は人間であり、前記被写体の大きさに関する情報は画像から人間の骨格を推定して得られる骨格推定結果であり、
前記位置大きさ決定部は、N個の骨格推定結果からN個の被写体の縦サイズを被写体の大きさとして得、前記被写体の大きさに関する多項式に当てはめたときに、閾値よりも大きな外れ値を有する場合に、外れ値となった縦サイズを多項式で求めた値に置換することで補正し、n番目の前記被写体の縦サイズが欠損している場合に、欠損している縦サイズを多項式で求めた値に置換することで補間し、
前記拡縮パラメータpを用いて、前記N個の被写体の倍率パラメータを2次曲線で作成し、N個の前記被写体の大きさを拡大または縮小させることで、前記被写体の拡縮を制御する、
映像編集装置。 - 請求項1または請求項2の映像編集装置であって、
前記位置大きさ決定部は、
n=1,2,…Nとし、
G=(1+n)/2
G2=N-G
pn=p-(p-1)×{(n-G)/G2 2}
とし、a,bを所定のパラメータとし、n番目の撮影装置から得られる画像の、補正または補間された前記被写体の位置を(Xs(n),Ys(n))とし、補正または補間された前記被写体の大きさをLs(n)とし、補正または補間および拡大または縮小されたN個の前記被写体の位置と大きさとに基づく切り取り範囲{(Xs(n)-a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)-b×Ls(n)×pn),(Xs(n)-a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn),(Xs(n)+a×Ls(n)×pn,Ys(n)+b×Ls(n)×pn)}を求める、
映像編集装置。 - 請求項1から請求項3の何れかの映像編集装置であって、
回り込み映像の時刻tにおける、n+1番目の画像I(n+1,c')とn番目の画像I(n,c')との間の中間画像I(t)は、
Tc=Tp/(N-1)、n=1,2,…N-1、t=Tc×(n-1)+1,…,Tc×nのとき、
B(n+1,t)=1/[1+Exp[Ng×{Tc×(n-0.5)-t}/Tc]]
B(n,t)=1-B(n+1,t)
I(t)=I(n+1,c')×B(n+1,t)+I(n,c')×B(n,t)
である、
映像編集装置。 - Nを3以上の整数の何れかとし、映像編集装置を用いて、被写体を取り囲むよう配置されたN個の撮影装置によって撮影された映像を前記撮影装置の並びに沿って切り替えることで、あたかも前記撮影装置が前記被写体を回り込んだときに得られる映像である回り込み映像を得る映像編集方法であって、
前記映像編集装置が、N個の撮影装置から得られる画像に対して、撮影装置を示すラベルと、時刻を示すラベルとを付与するラベル付与ステップと、
前記映像編集装置が、ラベルを付与した画像に存在する被写体の位置と大きさに関する情報との組合せを抽出する位置大きさ抽出ステップと、
前記映像編集装置が、N個の前記被写体の位置と大きさに関する情報に基づき、前記被写体の位置に関する多項式と前記被写体の大きさに関する多項式とを生成し、前記被写体の位置に関する多項式を用いて多項式近似曲線によるN個の前記被写体の位置の補正または補間を行い、前記被写体の大きさに関する多項式を用いて多項式近似曲線によるN個の前記被写体の大きさの補正または補間を行い、拡縮パラメータpによりN個の前記被写体の大きさを拡大または縮小させる位置大きさ決定ステップと、
前記映像編集装置が、前記ラベルを付与したN個の画像から補正または補間および拡大または縮小されたN個の前記被写体の位置と大きさとに基づく切り取り範囲を切り取る画像切り取りステップと、
前記映像編集装置が、切り取ったN個の画像のサイズを同じサイズに変換する画像サイズ整合ステップと、
前記映像編集装置が、回り込み映像の長さを示すパラメータをTpとし、隣接する撮影装置に対応する2つの同じサイズの画像から中間画像を生成し、回り込み映像を生成する映像編集ステップとを含む、
映像編集方法。 - 請求項1から請求項4の何れかの映像編集装置としてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019001915A JP7052737B2 (ja) | 2019-01-09 | 2019-01-09 | 映像編集装置、その方法、およびプログラム |
PCT/JP2019/050734 WO2020145138A1 (ja) | 2019-01-09 | 2019-12-25 | 映像編集装置、その方法、およびプログラム |
US17/421,364 US11508412B2 (en) | 2019-01-09 | 2019-12-25 | Video editing apparatus, method and program for the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019001915A JP7052737B2 (ja) | 2019-01-09 | 2019-01-09 | 映像編集装置、その方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020113842A JP2020113842A (ja) | 2020-07-27 |
JP7052737B2 true JP7052737B2 (ja) | 2022-04-12 |
Family
ID=71520700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019001915A Active JP7052737B2 (ja) | 2019-01-09 | 2019-01-09 | 映像編集装置、その方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11508412B2 (ja) |
JP (1) | JP7052737B2 (ja) |
WO (1) | WO2020145138A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115442539B (zh) * | 2021-06-04 | 2023-11-07 | 北京字跳网络技术有限公司 | 一种视频编辑方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048305A (ja) | 2007-08-15 | 2009-03-05 | Nara Institute Of Science & Technology | 形状解析プログラム及び形状解析装置 |
JP2017103613A (ja) | 2015-12-01 | 2017-06-08 | 日本電信電話株式会社 | 情報取得装置、情報取得方法及び情報取得プログラム |
WO2017119034A1 (ja) | 2016-01-06 | 2017-07-13 | ソニー株式会社 | 撮影システム、撮影方法およびプログラム |
JP2018046448A (ja) | 2016-09-15 | 2018-03-22 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6539253B2 (ja) * | 2016-12-06 | 2019-07-03 | キヤノン株式会社 | 情報処理装置、その制御方法、およびプログラム |
WO2020004162A1 (ja) * | 2018-06-27 | 2020-01-02 | キヤノン株式会社 | 撮像システム、配置決定装置、配置決定方法およびプログラム |
-
2019
- 2019-01-09 JP JP2019001915A patent/JP7052737B2/ja active Active
- 2019-12-25 US US17/421,364 patent/US11508412B2/en active Active
- 2019-12-25 WO PCT/JP2019/050734 patent/WO2020145138A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048305A (ja) | 2007-08-15 | 2009-03-05 | Nara Institute Of Science & Technology | 形状解析プログラム及び形状解析装置 |
JP2017103613A (ja) | 2015-12-01 | 2017-06-08 | 日本電信電話株式会社 | 情報取得装置、情報取得方法及び情報取得プログラム |
WO2017119034A1 (ja) | 2016-01-06 | 2017-07-13 | ソニー株式会社 | 撮影システム、撮影方法およびプログラム |
JP2018046448A (ja) | 2016-09-15 | 2018-03-22 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2020113842A (ja) | 2020-07-27 |
WO2020145138A1 (ja) | 2020-07-16 |
US20220093131A1 (en) | 2022-03-24 |
US11508412B2 (en) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10284789B2 (en) | Dynamic generation of image of a scene based on removal of undesired object present in the scene | |
KR102013978B1 (ko) | 이미지들의 융합을 위한 방법 및 장치 | |
US10205889B2 (en) | Method of replacing objects in a video stream and computer program | |
US7424218B2 (en) | Real-time preview for panoramic images | |
JP4658223B2 (ja) | 画像生成方法、装置、およびそのプログラム並びにプログラムを記録した記録媒体 | |
KR20130107840A (ko) | 실감 파노라마 영상 생성을 위한 3d 데이터 포맷 생성/소비 장치 및 방법 | |
WO2004053591A1 (en) | Image capture and and display and method for generating a synthesized image | |
CN109525786B (zh) | 视频处理方法、装置、终端设备及存储介质 | |
CN102792700A (zh) | 将三维文本与三维内容组合的系统和方法 | |
CN112712487A (zh) | 一种场景视频融合方法、系统、电子设备及存储介质 | |
Zhang et al. | Multi-view video synopsis via simultaneous object-shifting and view-switching optimization | |
JP2004246667A (ja) | 自由視点動画像データ生成方法およびその処理をコンピュータに実行させるためのプログラム | |
JP7052737B2 (ja) | 映像編集装置、その方法、およびプログラム | |
JPH10126665A (ja) | 画像合成装置 | |
JP7459927B2 (ja) | 画像処理方法 | |
JPH0981746A (ja) | 二次元表示画像生成方法 | |
JP2002032743A (ja) | 3次元画像生成システムおよび3次元画像生成方法、並びにプログラム提供媒体 | |
JPH10108003A (ja) | 画像合成装置および画像合成方法 | |
US20040054721A1 (en) | Visual media viewing system and method | |
JP2000358194A (ja) | 画像合成装置、方法及びプログラムを記憶した記憶媒体 | |
JP6454238B2 (ja) | 映像編集装置、映像編集方法及び映像編集プログラム | |
JPH1083442A (ja) | 画像合成方法 | |
Bastos et al. | Automatic camera pose initialization, using scale, rotation and luminance invariant natural feature tracking | |
JP5192940B2 (ja) | 画像変換装置、画像変換プログラムおよび画像変換方法 | |
Chen et al. | SpriteCam: virtual camera control using sprite |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7052737 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |