JP6534964B2 - Video editing method, video editing apparatus and video editing program - Google Patents

Video editing method, video editing apparatus and video editing program Download PDF

Info

Publication number
JP6534964B2
JP6534964B2 JP2016103361A JP2016103361A JP6534964B2 JP 6534964 B2 JP6534964 B2 JP 6534964B2 JP 2016103361 A JP2016103361 A JP 2016103361A JP 2016103361 A JP2016103361 A JP 2016103361A JP 6534964 B2 JP6534964 B2 JP 6534964B2
Authority
JP
Japan
Prior art keywords
video
viewpoint
image size
estimated
fluctuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016103361A
Other languages
Japanese (ja)
Other versions
JP2017212536A (en
Inventor
利明 武田
利明 武田
弾 三上
弾 三上
明 小島
明 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016103361A priority Critical patent/JP6534964B2/en
Publication of JP2017212536A publication Critical patent/JP2017212536A/en
Application granted granted Critical
Publication of JP6534964B2 publication Critical patent/JP6534964B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像編集方法、映像編集装置及び映像編集プログラムに関する。   The present invention relates to a video editing method, a video editing apparatus, and a video editing program.

複数のカメラの各フレームにおいてオブジェクト(被写体)を追跡推定し、良好な自由視点映像生成できることが知られている(例えば、非特許文献1参照)。また、複数のカメラの各フレームにおいてオクルージョン発生時、時間空間の補間で位置を予測して、良好な自由視点映像生成できることが知られている。(例えば、非特許文献2参照)。また、映像中の一部を拡縮して、視聴者が見たい部分を選べるようにしたシステムが知られている(例えば、非特許文献3参照)。   It is known that an object (subject) can be tracked and estimated in each frame of a plurality of cameras to generate a good free viewpoint video (see, for example, Non-Patent Document 1). In addition, it is known that, when occlusion occurs in each frame of a plurality of cameras, the position can be predicted by interpolation in time space to generate a good free viewpoint video. (For example, refer to nonpatent literature 2). There is also known a system in which a part of the video is scaled up and down so that the viewer can select a part to be viewed (see, for example, Non-Patent Document 3).

ところで、通常の映像は、時間変化した画像を連続させて再生したものである。これに対して、各フレーム間で視点変化させた画像を連続させて再生した映像を生成することが行われている。このような映像を回り込み映像という。回り込み映像では、複数の視点から撮影されたカメラの画像を使用して、1台のカメラがあたかもオブジェクトの回りを回り込んだような映像を生成することができる。   By the way, a normal video is one in which time-varying images are continuously reproduced. On the other hand, it is performed to generate a reproduced video by continuously making images of which the viewpoint is changed between frames. Such an image is called a wraparound image. In the wraparound video, images of cameras taken from multiple viewpoints can be used to generate a video that looks as if one camera wraps around an object.

「選手領域の抽出と追跡によるサッカーの自由視点映像生成」三功浩嗣他,映像情報メディア学会誌Vol.68,No.3,p125-134,2014"Free-viewpoint video generation of football by extraction and tracking of player area", Hiroki Sango et al, Journal of the Institute of Image Information and Television Engineers Vol. 68, No. 3, p 125-134, 2014 「オブジェクトの分離とカメラ間/フレーム間の予測に基づく自由視点映像生成」 山田健太郎他,電子情報通信学会論文誌D,Vol.J97-D,No.2,pp.303-315,2014.02.01"Free-viewpoint image generation based on object separation and inter-camera / inter-frame prediction" Kentaro Yamada et al., Transactions of the Institute of Electronics, Information and Communication Engineers D, Vol. J 97-D, No. 2, pp. 303-315, 2014.02.01 「見たいところが自由に選べるインタラクティブ・パノラマ映像配信技術」、ビジネスコミュニケーション,Vol.48 No.4 Page.41-43 (2011.04.01)“Interactive and panoramic video distribution technology that allows you to freely choose what you want to see,” Business Communication, Vol. 48 No. 4 Page. 41-43 (2011.04.01)

しかしながら、非特許文献1及び非特許文献2における、一般的なオブジェクト位置推定では、過去のシーン/パターンと類似していないと、学習がうまく機能しなくなり、位置推定確度が低くなる。このため、位置誤差に伴う揺らぎが大きく生じてしまう。特に想定条件外のシーン/パターンである激しい動きやオクルージョンや体のポーズでは、学習がうまく機能しなくなり位置推定確度が低くなり、揺らぎが大きく生じてしまう。揺らぎが生じると、回り込み映像の連続性が失われて見づらい映像となってしまう。ここで、回り込み映像の連続性とは、視点を変化させた回り込み映像の切り替えが滑らかに行われることである。   However, in general object position estimation in Non-Patent Document 1 and Non-Patent Document 2, if the scene / pattern is not similar to the past, learning will not work well and position estimation accuracy will be low. As a result, fluctuations due to the position error occur largely. In particular, in the case of a violent motion or occlusion or body pose which is a scene / pattern outside the assumed condition, the learning does not work well and the position estimation accuracy becomes low, resulting in a large fluctuation. When the fluctuation occurs, the continuity of the wraparound image is lost and the image becomes difficult to view. Here, the continuity of the wraparound video means that switching of the wraparound video with the viewpoint changed is performed smoothly.

上述の課題を解決するために、本発明は、位置推定値に揺らぎが生じている状況でも、良好に、回り込み映像の連続性をもった映像を生成することができる映像編集方法、映像編集装置及び映像編集プログラムを提供することを目的とする。   In order to solve the above-mentioned problems, the present invention provides a video editing method and a video editing apparatus capable of generating a video having continuity of a wraparound video favorably even in a situation where fluctuation occurs in a position estimation value. And providing a video editing program.

本発明の一態様は、複数の入力画像のそれぞれから画面位置及び画サイズをオブジェクト追跡により推定する推定ステップと、前記画面位置の推定値及び前記画サイズの推定値の揺らぎを統計的手法により算出する揺らぎ算出ステップと、前記推定値の揺らぎに基づいて、画面位置及び画サイズを決定する決定ステップと、視点変更開始時点の初視点映像と、視点変更終了時点の終視点映像と、前記初視点映像と前記終視点映像の間の視点変更映像と、決定した前記画面位置及び画サイズとに基づき、回り込み映像を生成する映像生成ステップとを含む映像編集方法である。   One aspect of the present invention is an estimation step of estimating a screen position and an image size by object tracking from each of a plurality of input images, and calculating a fluctuation of the estimated value of the screen position and the estimated value of the image size by a statistical method Performing a fluctuation calculation step, determining a screen position and an image size based on the fluctuation of the estimated value, a first viewpoint video at a viewpoint change start time, a close viewpoint video at a viewpoint change end time, and the first viewpoint According to another aspect of the present invention, there is provided a video editing method including a video generation step of generating a wraparound video based on a viewpoint change video between the video and the final viewpoint video, and the determined screen position and image size.

本発明の一態様は、前記映像編集方法であって、前記揺らぎ算出ステップでは、前記推定値に対してフィルタ演算を行い、前記推定値と前記フィルタ演算した推定値との差分を基に統計的手法により推定値の揺らぎを算出する。   One aspect of the present invention is the video editing method, wherein in the fluctuation calculation step, a filter operation is performed on the estimated value, and a statistical operation is performed based on a difference between the estimated value and the estimated value subjected to the filter operation. The fluctuation of the estimated value is calculated by the method.

本発明の一態様は、前記映像編集方法であって、前記決定ステップでは、前記推定値の揺らぎが小さい場合には、オブジェクト追跡により推定された推定位置を前記画面位置として決定し、予め定められた標準サイズを前記画サイズとして決定する。   One aspect of the present invention is the video editing method, wherein in the determination step, when the fluctuation of the estimated value is small, an estimated position estimated by object tracking is determined as the screen position, and is determined in advance. The standard size is determined as the image size.

本発明の一態様は、前記映像編集方法であって、前記決定ステップでは、前記推定値の揺らぎが大きい場合には、フィルタ演算した前記推定位置を前記画面位置として決定し、画面揺らぎを緩和する画サイズに基づいて前記画サイズを決定する。   One embodiment of the present invention is the video editing method, wherein, in the determination step, when the fluctuation of the estimated value is large, the estimated position subjected to the filter operation is determined as the screen position to alleviate the screen fluctuation. The image size is determined based on the image size.

本発明の一態様は、複数の入力画像のそれぞれから画面位置及び画サイズをオブジェクト追跡により推定する推定部と、前記画面位置の推定値及び前記画サイズの推定値の揺らぎを統計的手法により算出する揺らぎ算出部と、前記推定値の揺らぎに基づいて、画面位置及び画サイズを決定する決定部と、視点変更開始時点の初視点映像と、視点変更終了時点の終視点映像と、前記初視点映像と前記終視点映像の間の視点変更映像と、決定した前記画面位置及び画サイズとに基づき、回り込み映像を生成する映像生成部とを備える映像編集装置である。   According to one aspect of the present invention, there is provided an estimation unit for estimating a screen position and an image size by object tracking from each of a plurality of input images, and calculating a fluctuation of the estimated value of the screen position and the estimated value of the image size by a statistical method. A fluctuation calculation unit, a determination unit that determines a screen position and an image size based on the fluctuation of the estimated value, a first viewpoint video at a viewpoint change start time, a close viewpoint video at a viewpoint change end time, and the first viewpoint The video editing apparatus includes a video generation unit that generates a wraparound video based on a viewpoint change video between the video and the final viewpoint video, and the determined screen position and image size.

本発明の一態様は、コンピュータに、前記映像編集方法を実行させるための映像編集プログラムである。   One aspect of the present invention is a video editing program for causing a computer to execute the video editing method.

本発明によれば、オブジェクト位置の推定値の揺らぎが生じている状況でも、回り込み映像の連続性をもった映像を生成することができるため、見易い画面を生成することができる。   According to the present invention, it is possible to generate an image having continuity of a wraparound image even in a situation in which fluctuation of an estimated value of an object position occurs, so that an easily viewable screen can be generated.

本発明の第1の実施形態に係る映像編集装置の概要を示す説明図である。BRIEF DESCRIPTION OF THE DRAWINGS It is explanatory drawing which shows the outline | summary of the video editing apparatus based on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る映像編集装置の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a video editing apparatus according to a first embodiment of the present invention. 本発明の第1の実施形態に係る映像編集装置におけるオブジェクト追跡部の処理の説明図である。It is explanatory drawing of a process of the object tracking part in the video editing apparatus concerning the 1st Embodiment of this invention. 水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値の変化を示すグラフである。It is a graph which shows the change of the estimated value of the estimated position of the horizontal direction, the estimated position of the orthogonal | vertical direction, and an image size. 本発明の第1の実施形態に係る映像編集装置における追跡統計部の処理を説明するためのフローチャートである。It is a flowchart for demonstrating the process of the tracking statistics part in the video editing apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施形態に係る映像編集装置において追跡統計部から編集処理判断部に送られる情報の説明図である。It is explanatory drawing of the information sent to a edit process judgment part from a tracking statistics part in the video editing apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施形態に係る映像編集装置における各視点の画サイズの説明図である。It is explanatory drawing of the drawing size of each viewpoint in the video editing apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施形態に係る映像編集装置における編集処理判断部の処理を説明するためのフローチャートである。It is a flowchart for demonstrating the process of the edit process judgment part in the video editing apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施形態に係る映像編集装置において編集処理判断部から映像生成部に送られる情報の説明図である。FIG. 7 is an explanatory diagram of information sent from the editing process determination unit to the video generation unit in the video editing device according to the first embodiment of the present invention. 本発明の第1の実施形態に係る映像編集装置における映像生成部の処理を説明するためのフローチャートである。It is a flowchart for demonstrating the process of the imaging | video production | generation part in the video editing apparatus which concerns on the 1st Embodiment of this invention.

以下、本発明の実施の形態について図面を参照しながら説明する。まず、本発明の実施形態による映像編集装置1の概要について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, an outline of a video editing apparatus 1 according to an embodiment of the present invention will be described.

図1は、本発明の実施形態による映像編集装置1の概要を示す説明図である。図1(A)に示すように、映像編集装置1には、N台(Nは自然数)のカメラから各視点の映像が入力される。映像編集装置1に入力される入力画像1〜Nは、それぞれ異なる視点のカメラ「1」〜「N」で撮影された画像である。図1(B)に示すように、入力画像1〜Nは広角撮影されている。映像編集装置1は、オブジェクト(被写体)追跡により、入力画像1〜Nの水平方向の位置及び垂直方向の位置、並びに画サイズ(画面の対角線の長さ)を推定する。そして、映像編集装置1は、入力画像1〜Nの水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値をフィルタ演算し、統計的手法により、入力画像1〜Nの水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値と、揺らぎと、編集判断のための係数を求める。なお、編集判断のための係数は、推定値の揺らぎに基づいて設定される。そして、映像編集装置1は、編集判断のための係数に基づいて編集判断を行い、水平方向の位置及び垂直方向の位置、並びに画サイズの値を決定する。そして、映像編集装置1は、初視点映像(視点変更開始時点の映像)、終視点映像(視点変更終了時点の映像)、及び初視点映像と終視点映像の間の視点変更映像で構成する入力画像1〜Nと、水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定値とに基づいて、回り込み映像を生成する。映像編集装置1は、図1(C)に示すような初視点の追跡映像と、追跡回り込み映像と、終視点の追跡映像を生成する。そして、映像編集装置1は、これらを合成して、表示装置2に、注目オブジェクトの回り込み映像を表示する。   FIG. 1 is an explanatory view showing an outline of a video editing apparatus 1 according to an embodiment of the present invention. As shown in FIG. 1A, an image of each viewpoint is input to the image editing apparatus 1 from N (N is a natural number) cameras. The input images 1 to N input to the video editing apparatus 1 are images captured by cameras “1” to “N” of different viewpoints. As shown in FIG. 1B, the input images 1 to N are shot at wide angles. The image editing apparatus 1 estimates the horizontal position and the vertical position of the input images 1 to N and the image size (the length of the diagonal of the screen) by object (subject) tracking. Then, the video editing apparatus 1 performs a filter operation on the estimated position in the horizontal direction and the estimated position in the vertical direction of the input images 1 to N and the estimated value of the image size, and the horizontal direction of the input images 1 to N The estimated position and the estimated position in the vertical direction, and the estimated value of the image size, the fluctuation, and the coefficient for the editing determination are obtained. Note that the coefficient for editing determination is set based on the fluctuation of the estimated value. Then, the video editing apparatus 1 performs editing determination based on the coefficient for editing determination, and determines the horizontal position, the vertical position, and the value of the image size. Then, the video editing apparatus 1 has an input composed of a first viewpoint video (video at the start of viewpoint change), a last viewpoint video (video at the end of viewpoint change), and a viewpoint change video between the first viewpoint video and the last viewpoint video. A wraparound image is generated based on the images 1 to N, the determined position in the horizontal direction and the determined position in the vertical direction, and the determined values of the image size. The video editing apparatus 1 generates a tracking video of the first viewpoint, a tracking wraparound video, and a tracking video of the last viewpoint as shown in FIG. 1 (C). Then, the video editing device 1 combines these and displays the wraparound video of the object of interest on the display device 2.

次に、図1に示す映像編集装置1について詳細に説明する。図2は、図1に示す映像編集装置1の構成を示すブロック図である。図2に示すように、図1に示す映像編集装置1は、IF(Interface)部101と、映像蓄積部102と、オブジェクト追跡部103と、追跡統計部104と、編集処理判断部105と、映像生成部106と、IF部107とを備える。   Next, the video editing apparatus 1 shown in FIG. 1 will be described in detail. FIG. 2 is a block diagram showing the configuration of the video editing apparatus 1 shown in FIG. As shown in FIG. 2, the video editing apparatus 1 shown in FIG. 1 includes an IF (Interface) unit 101, a video storage unit 102, an object tracking unit 103, a tracking statistics unit 104, and an editing processing determination unit 105. The image generation unit 106 and the IF unit 107 are provided.

IF部101は、複数のカメラ「N」(Nは自然数)の入力画像1〜Nを時刻同期して入力し、この入力画像1〜Nを映像蓄積部102に送る。なお、入力映像としては、カメラ入力の映像の他に、N視点のファイル入力の映像であってもよい。   The IF unit 101 inputs the input images 1 to N of a plurality of cameras “N” (N is a natural number) in time synchronization, and sends the input images 1 to N to the video storage unit 102. In addition to the camera input video, the input video may be an N viewpoint file input video.

映像蓄積部102は、IF部101から入力された入力画像1〜Nを一旦蓄積した後、入力画像1〜Nをオブジェクト追跡部103に送る。また、映像蓄積部102は、初視点映像と終視点映像と初視点映像と終視点映像の間の視点変更映像の入力画像1〜Nを映像生成部106に送る。   After temporarily storing the input images 1 to N input from the IF unit 101, the video storage unit 102 sends the input images 1 to N to the object tracking unit 103. Also, the video storage unit 102 sends, to the video generation unit 106, the input images 1 to N of the viewpoint-changed video between the first viewpoint video, the last viewpoint video, the first viewpoint video, and the last viewpoint video.

オブジェクト追跡部103は、オブジェクト追跡を行って、入力画像1〜Nの水平方向の位置及び垂直方向の位置、並びに画サイズを推定する。図3は、オブジェクト追跡部103で行われるオブジェクト追跡の説明図である。図3に示すように、各視点の映像は広角撮影されており、A1で示す領域が広角撮影領域である。標準サイズ(デフォルト値)は、領域A2で示した領域である。A3で示す領域が追跡画面領域である。図3に示すように、オブジェクト追跡部103は、画面の縦横比を一定に保ちながら、画面の中央にオブジェクトB1が位置するように、水平方向及び垂直方向に画面位置を動かす。そして、オブジェクト追跡部103は、水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値を追跡統計部104に送る。なお、ここで、表示画面を広角化する際に、画面の縦横比は変化していない。   The object tracking unit 103 performs object tracking to estimate the horizontal position and the vertical position of the input images 1 to N and the image size. FIG. 3 is an explanatory diagram of object tracking performed by the object tracking unit 103. As shown in FIG. 3, the image of each viewpoint is shot at a wide angle, and the area indicated by A1 is a wide angle shooting area. The standard size (default value) is the area indicated by the area A2. An area indicated by A3 is a tracking screen area. As shown in FIG. 3, the object tracking unit 103 moves the screen position in the horizontal and vertical directions so that the object B1 is positioned at the center of the screen while keeping the aspect ratio of the screen constant. Then, the object tracking unit 103 sends the estimated values of the estimated position in the horizontal direction and the estimated position in the vertical direction and the image size to the tracking statistics unit 104. Here, when making the display screen wide-angle, the aspect ratio of the screen does not change.

図2において、追跡統計部104は、オブジェクト追跡部103で推定された水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値から、統計的手法により、推定値の揺らぎに基づく値を算出する。追跡統計部104は、まず、オブジェクト追跡部103で推定された水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値に対して、フィルタ演算を行う。そして、追跡統計部104は、オブジェクト追跡部103で推定された水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値と、フィルタ演算した水平方向の推定位置及びフィルタ演算した垂直方向の推定位置、並びにフィルタ演算した画サイズの推定値から、推定値の揺らぎを算出する。そして、追跡統計部104は、視点変更時刻での瞬間カメラ間距離を算出する。続いて、追跡統計部104は、推定値の揺らぎと、視点変更時刻での瞬間カメラ間距離と、視点変更時刻での画サイズとから、編集判断のための係数を算出する。そして、追跡統計部104は、水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値と、フィルタ演算した水平方向の推定位置及びフィルタ演算した垂直方向の推定位置、並びにフィルタ演算した画サイズの推定値と、揺らぎと、編集判断のための係数とを、編集処理判断部105に送る。   In FIG. 2, the tracking statistics unit 104 is a value based on the fluctuation of the estimated value by the statistical method from the estimated position in the horizontal direction and the estimated position in the vertical direction estimated by the object tracking unit 103 and the estimated value of the image size. Calculate The tracking statistics unit 104 first performs a filter operation on the estimated position in the horizontal direction and the estimated position in the vertical direction estimated by the object tracking unit 103 and the estimated value of the image size. Then, the tracking statistics unit 104 calculates the estimated position in the horizontal direction and the estimated position in the vertical direction estimated by the object tracking unit 103, the estimated value of the image size, the estimated position in the horizontal direction subjected to the filter operation, and the vertical direction obtained by the filter operation. The fluctuation of the estimated value is calculated from the estimated position of the image and the estimated value of the filtered image size. Then, the tracking statistics unit 104 calculates the instantaneous inter-camera distance at the viewpoint change time. Subsequently, the tracking statistics unit 104 calculates a coefficient for editing determination from the fluctuation of the estimated value, the instantaneous inter-camera distance at the viewpoint change time, and the image size at the viewpoint change time. Then, the tracking statistics unit 104 calculates the estimated position in the horizontal direction and the estimated position in the vertical direction, the estimated value of the image size, the estimated position in the horizontal direction subjected to the filter operation, the estimated position in the vertical direction subjected to the filter operation, and the filter operation. The estimated value of the image size, the fluctuation, and the coefficient for the editing determination are sent to the editing processing determination unit 105.

編集処理判断部105は、追跡統計部104で求められた編集判断のための係数に基づいて、水平方向の位置及び垂直方向の位置、並びに画サイズの値を決定する。編集判断のための係数が閾値より小さい場合に、編集処理判断部105は、オブジェクト追跡部103で推定された水平方向の推定値及び垂直方向の推定位置を、水平方向の位置及び垂直方向の位置として決定する。また、この場合、編集処理判断部105は、画サイズを標準サイズ(デフォルト値)として決定する。一方、編集判断のための係数が閾値より大きい場合、編集処理判断部105は、画面揺らぎを緩和する画サイズを求める。そして、編集処理判断部105は、フィルタ演算した水平方向の推定位置及びフィルタ演算した垂直方向の推定位置を、水平方向の位置及び垂直方向の位置として決定する。また、画サイズを画面揺らぎを緩和する画サイズを用いて決定する。そして、編集処理判断部105は、水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定値を映像生成部106に送る。   The editing process determination unit 105 determines the horizontal position and the vertical position, and the value of the image size, based on the coefficient for the editing determination obtained by the tracking statistics unit 104. When the coefficient for editing determination is smaller than the threshold value, the editing process determining unit 105 determines the estimated value in the horizontal direction and the estimated position in the vertical direction estimated by the object tracking unit 103 as the position in the horizontal direction and the position in the vertical direction. Decide as. Further, in this case, the editing process determination unit 105 determines the image size as the standard size (default value). On the other hand, when the coefficient for editing determination is larger than the threshold value, the editing processing determination unit 105 obtains an image size that reduces the screen fluctuation. Then, the editing process determination unit 105 determines the estimated position in the horizontal direction subjected to the filter operation and the estimated position obtained in the vertical direction subjected to the filter operation as the position in the horizontal direction and the position in the vertical direction. Also, the image size is determined using the image size that reduces the screen fluctuation. Then, the editing process determination unit 105 sends the determined position in the horizontal direction, the determined position in the vertical direction, and the determined value of the image size to the image generation unit 106.

映像生成部106は、映像蓄積部102から入力された初視点映像、終視点映像、及び視点変更時刻の映像(初視点映像と終視点映像の間の視点変更映像)の入力画像1〜Nと、編集処理判断部105から入力された水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定値とに基づいて、初視点の追跡映像と、追跡回り込み映像と、終視点の追跡映像を生成する。そして、生成した映像を結合して、1つの映像として、IF部107に送る。   The video generation unit 106 receives input images 1 to N of a first viewpoint video, a last viewpoint video, and a video of viewpoint change time (a viewpoint changed video between the first viewpoint video and the last viewpoint video) input from the video storage unit 102 Based on the determined position in the horizontal direction and the determined position in the vertical direction input from the editing process determination unit 105 and the determined value of the image size, the tracking video of the first viewpoint, the tracking wraparound video, and the tracking video of the last viewpoint Generate Then, the generated video is combined and sent to the IF unit 107 as one video.

IF部107は、回り込み映像の入力に対し映像やファイルを出力する。これにより、追跡回り込み映像が生成される。   The IF unit 107 outputs a video and a file in response to the input of the wraparound video. This generates a tracking wraparound video.

次に、図2に示す映像編集装置1における追跡統計部104での処理について詳述する。追跡統計部104は、オブジェクト追跡部103から、水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値を入力する。これら水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値には、時間に対して変動するような揺らぎが含まれている。   Next, processing in the tracking statistics unit 104 in the video editing device 1 shown in FIG. 2 will be described in detail. The tracking statistics unit 104 receives, from the object tracking unit 103, an estimated position in the horizontal direction and an estimated position in the vertical direction, and an estimated value of the image size. The estimated position in the horizontal direction, the estimated position in the vertical direction, and the estimated value of the image size include fluctuations that fluctuate with respect to time.

図4は、水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値の変化を示すものである。図4(A)〜図4(C)において、横軸は時間を示し、縦軸は画素単位での推定値を示す。図4(A)は、時間tに対する水平方向の推定位置x(t)の変動を示している。図4(B)は、時間tに対する垂直方向の推定位置y(t)の変動を示している。図4(C)は、時間tに対する画サイズの推定値S(t)の変動を示している。図4(A)〜図4(C)に示すグラフから、水平方向の推定位置x(t)、垂直方向の推定位置y(t)、画サイズの推定値S(t)の値には、時間に対して変動するような揺らぎが含まれていることが分かる。   FIG. 4 shows changes in the estimated position in the horizontal direction, the estimated position in the vertical direction, and the estimated value of the image size. 4A to 4C, the horizontal axis indicates time, and the vertical axis indicates an estimated value in pixel units. FIG. 4A shows the fluctuation of the estimated position x (t) in the horizontal direction with respect to time t. FIG. 4B shows the fluctuation of the estimated position y (t) in the vertical direction with respect to time t. FIG. 4C shows the variation of the estimated value S (t) of the image size with respect to time t. From the graphs shown in FIGS. 4A to 4C, the values of the estimated position x (t) in the horizontal direction, the estimated position y (t) in the vertical direction, and the estimated value S (t) of the image size It can be seen that fluctuations that fluctuate with time are included.

追跡統計部104は、水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値S(t)に対して、(1)から(3)式に示すようなフィルタ演算を行う。fx(t)は、フィルタ演算後の水平方向の推定位置、fy(t)はフィルタ演算後の垂直方向の推定位置、fS(t)はフィルタ演算後の画サイズの推定位置である。なお、tは時間値、hはフィルタ変数、kはフレーム番号である。各視点において、fx(t)、fy(t)、fS(t)を計算する。   The tracking statistics unit 104 shows equations (1) to (3) for the estimated position x (t) in the horizontal direction and the estimated position y (t) in the vertical direction, and the estimated value S (t) of the image size. Perform a filter operation like this: fx (t) is the estimated position in the horizontal direction after the filter operation, fy (t) is the estimated position in the vertical direction after the filter operation, and fS (t) is the estimated position of the image size after the filter operation. Here, t is a time value, h is a filter variable, and k is a frame number. At each viewpoint, fx (t), fy (t) and fS (t) are calculated.

Figure 0006534964
Figure 0006534964

水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値S(t)に対して、(1)から(3)式に示すようなフィルタ演算を行う。図4(A)〜図4(C)に示すように、そのフィルタ演算した値fx(t)、fy(t)、fS(t)では、推定値が平滑化され、揺らぎ成分が除去される。   A filter operation as shown in equations (1) to (3) is performed on the estimated position x (t) in the horizontal direction, the estimated position y (t) in the vertical direction, and the estimated value S (t) of the image size. . As shown in FIG. 4A to FIG. 4C, the estimated values are smoothed and the fluctuation component is removed at the filtered values fx (t), fy (t) and fS (t). .

次に、追跡統計部104は、水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値s(t)と、フィルタ演算した水平方向の推定位置fx(t)及びフィルタ演算した垂直方向の推定位置y(t)、並びにフィルタ演算した画サイズの推定値fS(t)から、推定値の揺らぎを算出する。水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値の揺らぎは、(4)から(6)式に示すように算出できる。各視点において、σX、σY、σSを計算する。 Next, the tracking statistics unit 104 estimates the estimated position x (t) in the horizontal direction and the estimated position y (t) in the vertical direction, and the estimated value s (t) of the image size and the estimated position fx in the horizontal direction that has been filtered. The fluctuation of the estimated value is calculated from (t) and the estimated position y (t) in the vertical direction subjected to the filter operation and the estimated value fS (t) of the image size subjected to the filter operation. The estimated position in the horizontal direction, the estimated position in the vertical direction, and the fluctuation of the estimated value of the image size can be calculated as shown in equations (4) to (6). In each viewpoint, σ 2 X, σ 2 Y, and σ 2 S are calculated.

Figure 0006534964
Figure 0006534964

推定値の揺らぎの分散σは、これらの総平均から(7)式に示すようにして求められる。各視点のσX、σY、σSから計算する。 The variance σ 2 of the fluctuation of the estimated value is obtained from these total averages as shown in equation (7). Calculated from σ 2 X, σ 2 Y, σ 2 S of each viewpoint.

Figure 0006534964
Figure 0006534964

次に、追跡統計部104は、視点変更時刻での瞬間カメラ間距離を算出する。ここで、カメラnの水平方向の推定位置の値をn_x(t)及び垂直方向の推定位置の値をn_y(t)とし、カメラnの画サイズの推定値をn_S(t)とする。また、カメラnのフィルタ演算した水平方向の推定位置の値をn_fx(t)及びフィルタ演算した垂直方向の推定位置の値をn_fy(t)とし、カメラnのフィルタ演算した画サイズの推定値をn_fS(t)とする。   Next, the tracking statistics unit 104 calculates the instantaneous inter-camera distance at the viewpoint change time. Here, the value of the estimated position in the horizontal direction of the camera n is n_x (t), the value of the estimated position in the vertical direction is n_y (t), and the estimated value of the image size of the camera n is n_S (t). Also, let the value of the estimated position in the horizontal direction filtered by camera n be n_fx (t) and the value of the estimated position in the vertical direction filtered be n_fy (t), and the estimated value of the image size calculated by the filter of camera n It is assumed that n_fS (t).

カメラnでの視点変更時刻t1での水平方向の瞬間カメラ間距離は、以下のようにして求められる。   The instantaneous inter-camera distance in the horizontal direction at the viewpoint change time t1 at the camera n can be obtained as follows.

Figure 0006534964
Figure 0006534964

同様に、視点変更時刻t1での垂直方向の瞬間カメラ間距離は、以下のようにして求められる。   Similarly, the vertical instantaneous inter-camera distance at the viewpoint change time t1 can be obtained as follows.

Figure 0006534964
Figure 0006534964

同様に、視点変更時刻t1での画サイズの瞬間カメラ間距離は、以下のようにして求められる。   Similarly, the instantaneous inter-camera distance of the image size at the viewpoint change time t1 can be obtained as follows.

Figure 0006534964
Figure 0006534964

よって、カメラnでの視点変更時刻の瞬間カメラ間距離は、(8)式に示すようにして求めることができる。   Therefore, the instantaneous inter-camera distance at the viewpoint change time of the camera n can be obtained as shown in equation (8).

Figure 0006534964
Figure 0006534964

追跡統計部104は、カメラ(n=1)から、カメラ(n=N−1)の中で最大値を瞬間カメラ間距離dcとして求める。   The tracking statistics unit 104 obtains the maximum value among the cameras (n = N-1) from the camera (n = 1) as the instantaneous inter-camera distance dc.

Figure 0006534964
Figure 0006534964

次に、追跡統計部104は、(7)式で求められた推定値の揺らぎσと、(9)式で求められた視点変更時刻での瞬間カメラ間距離dcと、視点変更時刻でのフィルタ演算した画サイズの推定値fS(t1)とから、以下のように、編集判断のための係数を算出する。なお、αは係数である。   Next, the tracking statistics unit 104 calculates the fluctuation .sigma. Of the estimated value obtained by the equation (7), the instantaneous inter-camera distance dc at the viewpoint change time determined by the equation (9), and the filter at the viewpoint change time From the calculated estimated value fS (t1) of the image size, a coefficient for editing determination is calculated as follows. Here, α is a coefficient.

Figure 0006534964
Figure 0006534964

次に、図2に示す映像編集装置1における追跡統計部104の動作をフローチャートを参照して説明する。図5は、追跡統計部104の動作を示すフローチャートである。   Next, the operation of the tracking statistics unit 104 in the video editing apparatus 1 shown in FIG. 2 will be described with reference to a flowchart. FIG. 5 is a flowchart showing the operation of the tracking statistics unit 104.

追跡統計部104は、オブジェクト追跡部103から、各視点の水平方向の推定位置、垂直方向の推定位置、推定画サイズを入力する(ステップS101)。   The tracking statistics unit 104 inputs the estimated position in the horizontal direction, the estimated position in the vertical direction, and the estimated image size of each viewpoint from the object tracking unit 103 (step S101).

追跡統計部104は、各視点の水平方向の推定位置、垂直方向の推定位置、推定画サイズの推定値に対して、(1)式から(3)式に示すフィルタ演算を行う(ステップS102)。   The tracking statistics unit 104 performs the filter operation shown in the equations (1) to (3) on the estimated position in the horizontal direction, the estimated position in the vertical direction, and the estimated value of the estimated image size for each viewpoint (step S102) .

追跡統計部104は、(4)式から(7)式に示す演算により、統計的手法により、推定値の揺らぎを算出する(ステップS103)。   The tracking statistics unit 104 calculates the fluctuation of the estimated value by the statistical method by the calculation shown in the equations (4) to (7) (step S103).

追跡統計部104は、(8)式から(9)式に示す演算により、視点変更時刻での瞬間カメラ間距離を算出する(ステップS104)。   The tracking statistics unit 104 calculates the instantaneous inter-camera distance at the viewpoint change time by the calculation shown in the equations (8) to (9) (step S104).

追跡統計部104は、(10)式に示す演算により、編集判断のための係数を算出する(ステップS105)。   The tracking statistics unit 104 calculates a coefficient for editing determination by the calculation shown in equation (10) (step S105).

追跡統計部104は、水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値と、フィルタ演算した水平方向の推定位置及びフィルタ演算した垂直方向の推定位置、並びにフィルタ演算した画サイズの推定値と、揺らぎと、編集判断のための係数とを編集処理判断部105に送る(ステップS106)。   The tracking statistics unit 104 estimates the estimated position in the horizontal direction and the estimated position in the vertical direction, the estimated value of the image size, the estimated position in the horizontal direction filtered and the estimated position in the vertical direction filtered, and the image size filtered The estimated value of R, the fluctuation, and the coefficient for editing determination are sent to the editing processing determination unit 105 (step S106).

図6は、追跡統計部104から編集処理判断部105に送られる情報を示す図である。図6(A)に示すように、追跡統計部104から編集処理判断部105には、水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値S(t)が送られる。水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値S(t)は、オブジェクト追跡部103で推定される。また、図6(B)に示すように、追跡統計部104から編集処理判断部105には、フィルタ演算した水平方向の推定位置fx(t)及びフィルタ演算した垂直方向の推定位置fy(t)、並びにフィルタ演算した画サイズの推定値fS(t)が送られる。フィルタ演算した水平方向の推定位置fx(t)及びフィルタ演算した垂直方向の推定位置fy(t)、並びにフィルタ演算した画サイズの推定値fS(t)は、(1)から(3)式に示すようにして算出される。また、図6(C)に示すように、追跡統計部104から編集処理判断部105には、揺らぎσと、編集判断のための係数bnが送られる。揺らぎσは、(4)から(7)式に示すようにして算出される。編集判断のための係数bnは、(10)式に示すように、算出される。   FIG. 6 is a diagram showing information sent from the tracking statistics unit 104 to the editing process determination unit 105. As shown in FIG. 6A, from the tracking statistics unit 104 to the editing process determination unit 105, the estimated position x (t) in the horizontal direction, the estimated position y (t) in the vertical direction, and the estimated value S of the image size (T) will be sent. The estimated position x (t) in the horizontal direction, the estimated position y (t) in the vertical direction, and the estimated value S (t) of the image size are estimated by the object tracking unit 103. Further, as shown in FIG. 6B, from the tracking statistics unit 104 to the editing process judging unit 105, the estimated position fx (t) in the horizontal direction subjected to the filter operation and the estimated position fy (t) in the vertical direction subjected to the filter operation. , And a filtered image size estimate fS (t). The estimated position fx (t) in the horizontal direction subjected to the filter operation, the estimated position fy (t) in the vertical direction subjected to the filter operation, and the estimated value fS (t) of the image size subjected to the filter operation can be expressed by equations (1) to (3) Calculated as shown. Further, as shown in FIG. 6C, the tracking statistic unit 104 sends the fluctuation σ and the coefficient bn for the editing judgment to the editing process judging unit 105. The fluctuation σ is calculated as shown in equations (4) to (7). The coefficient bn for editing determination is calculated as shown in equation (10).

次に、図2に示す映像編集装置1における編集処理判断部105での処理について詳述する。編集処理判断部105には、図6(A)から図6(C)に示したような情報が入力される。そして、編集処理判断部105は、編集判断のための係数bnにより大きいか否かを判定する。編集判断のための係数bnが閾値より小さい場合、編集処理判断部105は、水平方向及び垂直方向の推定位置x(t)及びy(t)の値を、水平方向の決定位置及び垂直方向の決定位置とする。また、編集処理判断部105は、標準サイズ(図3に示す領域A2を参照)を決定画サイズとする。   Next, the process in the editing process determination unit 105 in the video editing apparatus 1 shown in FIG. 2 will be described in detail. Information as shown in FIGS. 6A to 6C is input to the editing process determination unit 105. Then, the editing process determination unit 105 determines whether the coefficient bn for editing determination is larger than the coefficient bn. When the coefficient bn for editing determination is smaller than the threshold value, the editing processing determination unit 105 determines the values of the estimated positions x (t) and y (t) in the horizontal and vertical directions to the determined position in the horizontal direction and the vertical direction. Let it be the decision position. Further, the editing process determination unit 105 sets the standard size (see the area A2 shown in FIG. 3) as the determined image size.

一方、編集判断のための係数bnが閾値より大きい場合、編集処理判断部105は、画面揺らぎを緩和する画サイズを求める。画面揺らぎを緩和する画サイズは、以下を満たす最小限サイズSnewを算出することで求められる。   On the other hand, when the coefficient bn for editing determination is larger than the threshold value, the editing processing determination unit 105 obtains an image size that reduces screen fluctuation. The image size for reducing the screen fluctuation can be obtained by calculating the minimum size Snew which satisfies the following condition.

Figure 0006534964
Figure 0006534964

そして、編集処理判断部105は、フィルタ演算した水平方向の推定位置fx(t)及びフィルタ演算した垂直方向の推定位置fy(t)を、水平方向の決定位置及び垂直方向の決定位置とする。また、nの視点変更時の各視点の画サイズSを以下のようにして決定する。   Then, the editing process determination unit 105 sets the estimated position fx (t) in the horizontal direction subjected to the filter operation and the estimated position fy (t) in the vertical direction subjected to the filter operation as the determined position in the horizontal direction and the determined position in the vertical direction. Further, the image size S of each viewpoint at the time of changing the viewpoint of n is determined as follows.

Figure 0006534964
Figure 0006534964

図7は、各視点の画サイズの説明図である。図7において、横軸はカメラ番号であり、縦軸は画サイズである。図7に示すグラフから、カメラ番号「1」から「N」の視点に対して、縮小されている率が変化していることが示される。   FIG. 7 is an explanatory diagram of the image size of each viewpoint. In FIG. 7, the horizontal axis is the camera number, and the vertical axis is the image size. From the graph shown in FIG. 7, it is shown that the reduction ratio changes for the viewpoints of camera numbers “1” to “N”.

次に、図2に示す映像編集装置1における編集処理判断部105の動作をフローチャートを参照して説明する。図8は、編集処理判断部105の動作を示すフローチャートである。   Next, the operation of the editing process determination unit 105 in the video editing apparatus 1 shown in FIG. 2 will be described with reference to a flowchart. FIG. 8 is a flowchart showing the operation of the editing process determination unit 105.

編集処理判断部105は、追跡統計部104から、水平方向の推定位置x(t)及び垂直方向の推定位置y(t)、並びに画サイズの推定値S(t)と、フィルタ演算した水平方向の推定位置fx(t)及びフィルタ演算した垂直方向の推定位置y(t)、並びにフィルタ演算した画サイズの推定値fS(t)と、揺らぎσと、編集判断のための係数bnとを入力する(ステップS201)。   The editing processing determination unit 105 performs, from the tracking statistics unit 104, the estimated horizontal position x (t) and the estimated vertical position y (t), and the estimated value S (t) of the image size in the filtered horizontal direction. The estimated position fx (t) of the image, the estimated position y (t) in the vertical direction subjected to the filter operation, and the estimated value fS (t) for the filtered image size, the fluctuation .sigma., And the coefficient bn for editing judgment (Step S201).

編集処理判断部105は、編集判断のための係数bnが閾値以下(bn<閾値)か否かを判定する(ステップS202)。   The editing process determination unit 105 determines whether the coefficient bn for editing determination is equal to or less than the threshold (bn <threshold) (step S202).

編集処理判断部105は、編集判断のための係数が閾値以下の場合(ステップS202:Yes)、処理をステップS203に進め、編集判断のための係数が閾値以下でない場合(ステップS202:No)、処理をステップS204に進める。   When the coefficient for editing determination is equal to or less than the threshold (step S202: Yes), the editing process determining unit 105 advances the process to step S203, and when the coefficient for editing determination is not less than the threshold (No at step S202) The process then proceeds to step S204.

編集処理判断部105は、揺らぎについて良好な状態であるとして、水平方向及び垂直方向の位置と画サイズの決定を行い、処理をステップS206に進める(ステップS203)。この場合、編集処理判断部105は、水平方向の推定位置及び垂直方向の推定位置(図6(A))を、各視点での水平方向及び垂直方向の位置として決定する。各視点の画像サイズは、標準サイズ(図3の領域A2を参照)として決定する。   The editing process determination unit 105 determines the horizontal and vertical positions and the image size on the assumption that the fluctuation is good, and advances the process to step S206 (step S203). In this case, the editing process determination unit 105 determines the estimated position in the horizontal direction and the estimated position in the vertical direction (FIG. 6A) as the positions in the horizontal direction and the vertical direction at each viewpoint. The image size of each viewpoint is determined as a standard size (see area A2 in FIG. 3).

編集処理判断部105は、(11)式を満足するように、画面揺らぎを緩和する画サイズSnewを求め、処理をステップS205に進める(ステップS204)。   The editing process determination unit 105 obtains the image size Snew for reducing the screen fluctuation so as to satisfy the equation (11), and advances the process to step S205 (step S204).

編集処理判断部105は、揺らぎについて悪い状態であるとして、画サイズと位置の決定を行い、処理をステップS206に進める(ステップS205)。この場合、各視点での水平方向及び垂直方向の位置は、フィルタ演算した水平方向の推定位置及びフィルタ演算した垂直方向の推定位置(図6(B))とする。各視点の画サイズは、(12)式及び(13)式に示す演算により算出される。   The editing process determination unit 105 determines the image size and the position, assuming that the fluctuation is not good, and advances the process to step S206 (step S205). In this case, the positions in the horizontal and vertical directions at each viewpoint are the estimated position in the horizontal direction subjected to the filter operation and the estimated position in the vertical direction subjected to the filter operation (FIG. 6B). The image size of each viewpoint is calculated by the calculations shown in equations (12) and (13).

編集処理判断部105は、ステップS203又はステップS205で決定された水平方向の決定位置及び垂直方向の決定位置と、画サイズの決定値を映像生成部106に送る(ステップS206)。   The editing process determination unit 105 sends the determined position in the horizontal direction and the determined position in the vertical direction determined in step S203 or step S205 and the determined value of the image size to the image generation unit 106 (step S206).

図9は、編集処理判断部105から映像生成部106に送られる情報を示す図である。図9(A)に示すように、編集処理判断部105から映像生成部106には、初視点の情報として、開始時間、及び視点変更時間での水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定位置が送られる。また、図9(B)に示すように、編集処理判断部105から映像生成部106には、終視点の情報として、視点変更時間及び終了時間での水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定位置が送られる。また、図9(C)に示すように、編集処理判断部105から映像生成部106には、視点変更時刻の情報として、初視点及び終視点での水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定位置が送られる。   FIG. 9 is a diagram showing information sent from the editing process determination unit 105 to the video generation unit 106. As shown in FIG. 9A, the editing processing determination unit 105 to the video generation unit 106 use the start time and the determination position in the horizontal direction and the determination position in the vertical direction as the viewpoint change time as the information of the first viewpoint, And the determined position of the picture size is sent. Further, as shown in FIG. 9B, the editing processing determination unit 105 to the video generation unit 106 determine the determination position in the horizontal direction and the determination position in the vertical direction at the viewpoint change time and the end time as the information on the closing viewpoint. And the determined position of the picture size is sent. Further, as shown in FIG. 9C, the editing processing determination unit 105 to the video generation unit 106 determine the determination position in the horizontal direction and the determination position in the vertical direction at the first viewpoint and the last viewpoint as the information of the viewpoint change time. And the determined position of the picture size is sent.

次に、図2に示す映像編集装置1における映像生成部106の動作について詳述する。映像生成部106には、映像蓄積部102から、初視点映像と終視点映像と視点変更時刻の入力画像1〜Nが入力される。また、映像生成部106には、編集処理判断部105から、各時刻での水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定値が入力される。映像生成部106は、初視点映像と終視点映像と視点変更時刻の映像(初視点映像と終視点映像の間の視点変更映像)である入力画像1〜Nと、水平方向の決定位置及び垂直方向の決定位置、並びに画サイズの決定値とに基づいて、初視点の追跡映像と、追跡回り込み映像と、終視点の追跡映像を生成し、これらを結合して、1つの映像として、IF部107に送る。   Next, the operation of the video generation unit 106 in the video editing apparatus 1 shown in FIG. 2 will be described in detail. The video generation unit 106 receives, from the video storage unit 102, input images 1 to N of the first viewpoint video, the last viewpoint video, and the viewpoint change time. The image generation unit 106 also receives, from the editing process determination unit 105, the determined position in the horizontal direction and the determined position in the vertical direction at each time, and the determined value of the image size. The video generation unit 106 receives input images 1 to N, which are a first viewpoint video, a last viewpoint video, and a video of viewpoint change time (viewpoint modified video between the first viewpoint video and the last viewpoint video), and the determination position and vertical direction in the horizontal direction. Based on the determined position of the direction and the determined value of the image size, the tracking video of the first viewpoint, the tracking wraparound video, and the tracking video of the last viewpoint are generated and combined to form an IF part as one video. Send to 107.

なお、視点変更時刻の各視点追跡画像の生成成、視点変更の時刻までの初視点追跡映像生成、視点変更の時刻からの終視点追跡映像生成については、非特許文献3に記載されている方法を用いることができる。   Note that the method described in Non-Patent Document 3 describes generation of each viewpoint tracking image at viewpoint change time, generation of initial viewpoint tracking video up to the time of viewpoint change, and final viewpoint tracking video generation from the time of viewpoint change. Can be used.

図10は、図2に示す映像編集装置1における映像生成部106の動作を示すフローチャートである。   FIG. 10 is a flowchart showing the operation of the video generation unit 106 in the video editing device 1 shown in FIG.

映像生成部106は、映像蓄積部102から、初視点映像を入力し、ステップS302に処理を進める(ステップS301)。   The video generation unit 106 receives the initial viewpoint video from the video storage unit 102, and advances the process to step S302 (step S301).

映像生成部106は、編集処理判断部105から、初視点映像の情報として、開始時刻での水平方向の決定位置、垂直方向の決定位置、決定画サイズと、視点変更時刻での水平方向の決定位置、垂直方向の決定位置、画サイズの決定値を入力し、処理をステップS303に進める(ステップS302)。   The image generation unit 106 determines the determination position in the horizontal direction at the start time, the determination position in the vertical direction, the determined image size, and the determination in the horizontal direction at the viewpoint change time The position, the determined position in the vertical direction, and the determined value of the image size are input, and the process proceeds to step S303 (step S302).

映像生成部106は、視点変更の時刻までの初視点追跡映像を生成し、処理をステップS310に進める(ステップS303)。   The image generation unit 106 generates a first viewpoint tracking image up to the time of viewpoint change, and advances the process to step S310 (step S303).

映像生成部106は、映像蓄積部102から、視点変更時刻の入力画像1〜Nを入力し、ステップS305に処理を進める(ステップS304)。   The video generation unit 106 receives the input images 1 to N of the viewpoint change time from the video storage unit 102, and advances the process to step S305 (step S304).

映像生成部106は、編集処理判断部105から、視点変更時刻の情報として、初視点での水平方向の決定位置、垂直方向の決定位置、画サイズの決定置と、終視点での水平方向の決定位置、垂直方向の決定位置、画サイズの決定値を入力し、処理をステップS306に進める(ステップS305)。   The image generation unit 106 receives, from the editing process determination unit 105, the determination position in the horizontal direction at the first viewpoint, the determination position in the vertical direction, the determination position of the image size, and the determination of the image size as information of the viewpoint change time. The determination position, the determination position in the vertical direction, and the determination value of the image size are input, and the process proceeds to step S306 (step S305).

映像生成部106は、各視点追跡画像から合成して映像生成し、これにより追跡対象を回り込む表現映像を生成して、処理をステップS310に進める(ステップS306)。   The image generation unit 106 combines the viewpoint tracking images to generate an image, generates an expression image that wraps around the tracking target, and advances the process to step S310 (step S306).

映像生成部106は、映像蓄積部102から、終視点映像を入力し、ステップS308に処理を進める(ステップS307)。   The video generation unit 106 receives the end-view video from the video storage unit 102, and advances the process to step S308 (step S307).

映像生成部106は、編集処理判断部105から、終視点映像の情報として、視点変更時刻での水平方向の決定位置、垂直方向の決定位置、決定画サイズと、終了時刻での水平方向の決定位置、垂直方向の決定位置、決定画サイズを入力し、処理をステップS309に進める(ステップS308)。   The image generation unit 106 determines the determination position in the horizontal direction at the viewpoint change time, the determination position in the vertical direction, the determined image size, and the determination in the horizontal direction at the end time The position, the determined position in the vertical direction, and the determined image size are input, and the process proceeds to step S309 (step S308).

映像生成部106は、視点変更の時刻からの終視点追跡映像生成し、処理をステップS310に進める(ステップS309)。   The image generation unit 106 generates an end-view tracking image from the viewpoint change time, and advances the process to step S310 (step S309).

映像生成部106は、ステップS303で生成された視点変更の時刻までの初視点追跡映像と、ステップS306で生成された視点変更の時刻の回り込み映像と、ステップS309で生成された視点変更の時刻からの終視点追跡映像を結合し、1つの映像として、処理をステップS311に進める(ステップS310)。   The video generation unit 106 uses the first viewpoint tracking video up to the viewpoint change time generated in step S303, the wraparound video of the viewpoint change time generated in step S306, and the viewpoint change time generated in step S309. The end point tracking images of the above are combined, and the process proceeds to step S311 as one image (step S310).

映像生成部106は、生成された映像をIF107に送り、処理を終了する(ステップS311)。なお、IF107から映像は、表示装置に表示してもよいし、ファイル出力としてもよい。   The video generation unit 106 sends the generated video to the IF 107, and ends the processing (step S311). The video from the IF 107 may be displayed on the display device or may be output as a file.

以上説明したように、本発明の実施形態による映像編集装置1では、入力画像1〜Nの水平方向の推定位置及び垂直方向の推定位置、並びに画サイズの推定値の揺らぎが大きい場合には、フィルタ演算した推定位置と、画面揺らぎを緩和する追跡サイズにより視点変更映像を生成している。これにより、推定値の揺らぎが大きく生じている状況で回り込み連続性をもった映像生成しても、見易い画面が生成できる。   As described above, in the video editing apparatus 1 according to the embodiment of the present invention, when the estimated position in the horizontal direction and the estimated position in the vertical direction of the input images 1 to N have large fluctuations in estimated values of the image size, The viewpoint change image is generated based on the estimated position subjected to the filter operation and the tracking size for reducing the screen fluctuation. As a result, it is possible to generate an easy-to-see screen even when generating an image with wraparound continuity in a situation where fluctuations in estimated values occur largely.

なお、本例について、参考文献にあるように一般的な映像によるオブジェクト追跡推定アルゴリズムの誤差や振動について記載している。より位置推定の確度の高い赤外線付デプスカメラや、レーザによる位置推定を併用するカメラ等についても、閾値と編集判断のための係数bnを調整することで、同様の方法とプログラムとなる。   In this example, as described in the reference document, errors and vibrations of an object tracking estimation algorithm using a general image are described. The same method and program can be obtained by adjusting the threshold value and the coefficient bn for editing determination also for an infrared depth camera with higher accuracy of position estimation, a camera using position estimation with a laser in combination, and the like.

なお、映像編集装置1の全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Note that a program for realizing all or a part of functions of the video editing apparatus 1 is recorded in a computer readable recording medium, and the program recorded in the recording medium is read into a computer system and executed. The processing of each part may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices.
The "computer system" also includes a homepage providing environment (or display environment) if the WWW system is used.
The term "computer-readable recording medium" refers to a storage medium such as a flexible disk, a magneto-optical disk, a ROM, a portable medium such as a ROM or a CD-ROM, or a hard disk built in a computer system. Furthermore, “computer-readable recording medium” dynamically holds a program for a short time, like a communication line in the case of transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, the volatile memory in the computer system which is the server or the client in that case, and the one that holds the program for a certain period of time is also included. The program may be for realizing a part of the functions described above, or may be realized in combination with the program already recorded in the computer system.

以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。   Although the embodiments of the present invention have been described in detail with reference to the drawings, the specific configuration is not limited to this embodiment, and design changes and the like within the scope of the present invention are also included.

1:映像編集装置,101:IF部,102:映像蓄積部,103:オブジェクト追跡部,104:追跡統計部,105:編集処理判断部,106:映像生成部,107:IF部 1: Video editing apparatus, 101: IF unit, 102: Video storage unit, 103: Object tracking unit, 104: Tracking statistics unit, 105: Editing processing determination unit, 106: Video generation unit, 107: IF unit

Claims (6)

複数の入力画像のそれぞれから画面位置及び画サイズをオブジェクト追跡により推定する推定ステップと、
前記画面位置の推定値及び前記画サイズの推定値の揺らぎを統計的手法により算出する揺らぎ算出ステップと、
前記推定値の揺らぎに基づいて、画面位置及び画サイズを決定する決定ステップと、
視点変更開始時点の初視点映像と、視点変更終了時点の終視点映像と、前記初視点映像と前記終視点映像の間の視点変更映像と、決定した前記画面位置及び画サイズとに基づき、回り込み映像を生成する映像生成ステップと
を含む映像編集方法。
Estimating the screen position and the image size from the plurality of input images by object tracking;
A fluctuation calculation step of calculating fluctuation of the estimated value of the screen position and the estimated value of the image size by a statistical method;
A determining step of determining a screen position and an image size based on the fluctuation of the estimated value;
A wraparound based on the first viewpoint video at the start of viewpoint change, the last viewpoint video at the time of viewpoint change end, the viewpoint change video between the first viewpoint video and the last viewpoint video, and the determined screen position and image size And a video generating step of generating a video.
前記揺らぎ算出ステップでは、
前記推定値に対してフィルタ演算を行い、
前記推定値と前記フィルタ演算した推定値との差分を基に統計的手法により推定値の揺らぎを算出する請求項1に記載の映像編集方法。
In the fluctuation calculation step,
Perform a filter operation on the estimated value,
The video editing method according to claim 1, wherein the fluctuation of the estimated value is calculated by a statistical method based on the difference between the estimated value and the estimated value subjected to the filter operation.
前記決定ステップでは、
前記推定値の揺らぎが小さい場合には、オブジェクト追跡により推定された推定位置を前記画面位置として決定し、予め定められた標準サイズを前記画サイズとして決定する請求項1または2に記載の映像編集方法。
In the determination step,
The video editing according to claim 1 or 2, wherein when the fluctuation of the estimated value is small, the estimated position estimated by object tracking is determined as the screen position, and a predetermined standard size is determined as the image size. Method.
前記決定ステップでは、
前記推定値の揺らぎが大きい場合には、フィルタ演算した前記推定位置を前記画面位置として決定し、画面揺らぎを緩和する画サイズに基づいて前記画サイズを決定する請求項3に記載の映像編集方法。
In the determination step,
4. The video editing method according to claim 3, wherein when the fluctuation of the estimated value is large, the filtered estimated position is determined as the screen position, and the image size is determined based on the image size for reducing the screen fluctuation. .
複数の入力画像のそれぞれから画面位置及び画サイズをオブジェクト追跡により推定する推定部と、
前記画面位置の推定値及び前記画サイズの推定値の揺らぎを統計的手法により算出する揺らぎ算出部と、
前記推定値の揺らぎに基づいて、画面位置及び画サイズを決定する決定部と、
視点変更開始時点の初視点映像と、視点変更終了時点の終視点映像と、前記初視点映像と前記終視点映像の間の視点変更映像と、決定した前記画面位置及び画サイズとに基づき、回り込み映像を生成する映像生成部と
を備える映像編集装置。
An estimation unit that estimates the screen position and the image size from the plurality of input images by object tracking;
A fluctuation calculation unit that calculates fluctuation of the estimated value of the screen position and the estimated value of the image size by a statistical method;
A determination unit that determines a screen position and an image size based on the fluctuation of the estimated value;
A wraparound based on the first viewpoint video at the start of viewpoint change, the last viewpoint video at the time of viewpoint change end, the viewpoint change video between the first viewpoint video and the last viewpoint video, and the determined screen position and image size And a video generation unit that generates a video.
コンピュータに、請求項1から4のいずれか一項に記載の映像編集方法を実行させるための映像編集プログラム。   A video editing program for causing a computer to execute the video editing method according to any one of claims 1 to 4.
JP2016103361A 2016-05-24 2016-05-24 Video editing method, video editing apparatus and video editing program Active JP6534964B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016103361A JP6534964B2 (en) 2016-05-24 2016-05-24 Video editing method, video editing apparatus and video editing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016103361A JP6534964B2 (en) 2016-05-24 2016-05-24 Video editing method, video editing apparatus and video editing program

Publications (2)

Publication Number Publication Date
JP2017212536A JP2017212536A (en) 2017-11-30
JP6534964B2 true JP6534964B2 (en) 2019-06-26

Family

ID=60476808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016103361A Active JP6534964B2 (en) 2016-05-24 2016-05-24 Video editing method, video editing apparatus and video editing program

Country Status (1)

Country Link
JP (1) JP6534964B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5495855B2 (en) * 2010-03-01 2014-05-21 キヤノン株式会社 Video processing apparatus and video processing method
JP2014199560A (en) * 2013-03-29 2014-10-23 Kddi株式会社 Free viewpoint video generation device
JP6336856B2 (en) * 2014-08-26 2018-06-06 日本放送協会 Multi-view video expression device and program thereof

Also Published As

Publication number Publication date
JP2017212536A (en) 2017-11-30

Similar Documents

Publication Publication Date Title
CN107801045B (en) Method, device and system for automatically zooming when playing augmented reality scene
JP4958610B2 (en) Image stabilization apparatus, imaging apparatus, and image stabilization method
JP6948171B2 (en) Image processing equipment and image processing methods, programs
KR101502362B1 (en) Apparatus and Method for Image Processing
JP5645450B2 (en) Image processing apparatus and method
JP2017220715A (en) Image processing apparatus, image processing method, and program
JP2019083402A (en) Image processing apparatus, image processing system, image processing method, and program
JPWO2009051062A1 (en) Image generating method, apparatus, program thereof, and recording medium recording program
JP2019128641A (en) Image processing device, image processing method and program
JP2009081574A (en) Image processor, processing method and program
JP2016015037A (en) Information processing apparatus and control method, and video camera
JP2019135617A (en) Information processing device, method for controlling the same, and image processing system
JP2018136793A (en) Image processing device, image processing method and program
US20190306417A1 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
JP6534964B2 (en) Video editing method, video editing apparatus and video editing program
JP5927051B2 (en) Image processing apparatus, image processing method, and program
JP5639033B2 (en) Image processing method, image processing apparatus, and image processing program
JP4482933B2 (en) Motion vector detection device, image display device, image imaging device, motion vector detection method, program, and recording medium
JP2017021430A (en) Panoramic video data processing device, processing method, and program
US11893704B2 (en) Image processing method and device therefor
JP2006285655A (en) Image processor, image processing method and image processing program
Lee Novel video stabilization for real-time optical character recognition applications
JP2023011262A (en) Virtual reality simulator and virtual reality simulation program
JP2023011263A (en) Virtual reality simulator and virtual reality simulation program
US20220092796A1 (en) Image Processing Method and Device Thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190530

R150 Certificate of patent or registration of utility model

Ref document number: 6534964

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150