JP6949612B2 - 動画再生装置およびその制御方法、並びにプログラム - Google Patents

動画再生装置およびその制御方法、並びにプログラム Download PDF

Info

Publication number
JP6949612B2
JP6949612B2 JP2017154388A JP2017154388A JP6949612B2 JP 6949612 B2 JP6949612 B2 JP 6949612B2 JP 2017154388 A JP2017154388 A JP 2017154388A JP 2017154388 A JP2017154388 A JP 2017154388A JP 6949612 B2 JP6949612 B2 JP 6949612B2
Authority
JP
Japan
Prior art keywords
subjects
moving image
group
subject
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017154388A
Other languages
English (en)
Other versions
JP2019033430A5 (ja
JP2019033430A (ja
Inventor
悠基 和田
悠基 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017154388A priority Critical patent/JP6949612B2/ja
Priority to US16/045,023 priority patent/US10560632B2/en
Publication of JP2019033430A publication Critical patent/JP2019033430A/ja
Publication of JP2019033430A5 publication Critical patent/JP2019033430A5/ja
Application granted granted Critical
Publication of JP6949612B2 publication Critical patent/JP6949612B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4314Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for fitting data in a restricted space on the screen, e.g. EPG data in a rectangular grid
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6812Motion detection based on additional sensors, e.g. acceleration sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/268Signal distribution or switching

Description

本発明は、動画を再生する動画再生装置およびその制御方法、並びにプログラムに関する。
近年、4Kの解像度で動画を撮影できるカメラが急速に増加している。また、近い将来8Kの動画も一般的に撮影できるようになると予想される。このように、4Kや8Kなどの高解像度動画を撮影できるようになると、その一部分を拡大しても、閲覧に十分な解像度が得られる。そのため、再生する際に動画を拡大して再生する機能へのユーザーニーズが今後より高まることが想定される。
また、動画に複数の被写体が写っている場合に、各被写体に対して切り出し操作を実行して複数の分割画面の合成映像をモニタ表示し、必要に応じてその複数の分割画面の1つで表示中の被写体を拡大再生する技術が存在する(例えば、特許文献1参照)。
特開平11−331827号公報
しかし、特許文献1のように、被写体毎に分割された状態で拡大再生してしまうと、被写体それぞれの表情はわかるものの、被写体同士の関係性がわかりにくくなってしまう。例えば、子供2人が遊んでいる様子が映っている動画の場合にそれぞれの子供が分割されて再生されたり、結婚式の動画の場合に新郎新婦2人が分割されて再生されると、2人の関係性や動画のストーリーがわかりにくくなってしまう。
このような課題を鑑みて本発明は、動画中の被写体同士の関係性を維持しながら、それぞれの被写体を拡大して再生することができる動画再生装置およびその制御方法、並びにプログラムを提供することを目的とする。
本発明の請求項1に係る動画再生装置は、動画再生装置において、動画に含まれる複数の被写体を検出して追尾する追尾手段と、前記追尾手段により検出された前記複数の被写体の位置情報を取得する取得手段と、前記位置情報に基づき、前記複数の被写体のそれぞれの間の距離を算出する算出手段と、前記動画における、前記算出された距離が閾値より小さい期間に基づき、前記複数の被写体のそれぞれが所属するグループを決定する決定手段と、前記動画の拡大率を変更する変更手段と、前記変更手段により前記拡大率が変更された際、前記決定されたグループの数に応じた複数の分割画面に、前記動画の対象フレームのうち前記グループごとに所属する被写体が含まれる範囲それぞれをレイアウトして前記動画を再生する再生手段とを備えることを特徴とする。
本発明によれば、動画中の被写体同士の関係性を維持しながら、それぞれの被写体を拡大して再生することができる。
実施例1に係る動画再生装置のハードウェア構成を示すブロック図である。 図1の動画再生装置上で実行される動画再生アプリケーションの構成を示すユーザーインターフェースを説明するための図である。 実施例1に係る動画の追尾、動画のレイアウト、再生に至るまでの動画再生時における全体の処理の手順を示すフローチャートである。 実施例1に係る、等倍で複数の被写体が含まれる動画を再生中のユーザーインターフェースを示す図である。 図4のユーザーインターフェースで再生中の動画の対象フレームに対する追尾情報のデータ構造を示す図である。 実施例1に係る図3のステップS304の分割情報決定処理の手順を示すフローチャートである。 実施例1に係るグループ情報のデータ構造を示す図である。 図3のステップS305のレイアウト決定処理の手順を示すフローチャートである。 図8のステップS801で決定される分割数に応じたレイアウト構造を示す図である。 図4の再生中の動画に対してユーザーによる拡大指示があった時のユーザーインターフェースを示す図である。 図10の各分割画面に各グループの被写体をレイアウトするときの、各領域の拡大領域幅を決定する方法を説明する図である。 実施例2に係る図3のステップS304の分割情報決定処理の手順を示すフローチャートである。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、以下の各実施例で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
(実施例1)
図1は、本実施例に係る動画再生装置のハードウェア構成を示すブロック図である。ここで、動画再生装置とは、以下説明するハードウェア構成を有し、後述する図2のユーザーインターフェースにおいて動画再生できる装置であればよく、PCやモバイルデバイス等が例示される。
動画再生装置1000は、CPU1001と、一次記憶装置1002と、二次記憶装置1003と、表示部1004と、操作部1005と、ネットワーク装置1006と、音声出力部1007から構成されている。
CPU1001は、入力された信号や後述の動画再生アプリケーションを含むプログラム(以下、単にプログラムという)に従って、各種の演算や、動画再生装置1000を構成する各部分の制御を行う。一次記憶装置1002は、一時的なデータを記憶し、CPU1001の作業用に使われる。二次記憶装置1003は、動画再生装置1000を制御するためのプログラムや各種の設定情報などを記憶する。
表示部1004は、画像の表示、対話的な操作のための文字表示などを行う。なお、表示部1004にはLCDなどのディスプレイ装置が用いられる。また表示部1004は動画再生装置1000が備える必要はなく、動画再生装置1000は表示部1004の表示を制御する表示制御機能を有していればよい。
操作部1005は、ユーザーの操作を受け付けるためのものである。操作部1005としては、キーボードやマウスやタッチパネルなどを用いることが可能である。
ネットワーク装置1006は、外部装置と接続し制御コマンドやデータの送受信を行う。接続を確立し、データ通信するためのプロトコルとしては、例えば、PTP(Picture Transfer Protocol)やMTP(Media Transfer Protocol)が用いられる。なお、ネットワーク装置1006は、例えばUSB(Universal Serial Bus)ケーブルなどの有線接続により通信を行ってもよい。また、無線LANなどの無線接続により通信を行ってもよい。また、外部装置と直接接続してもよいし、サーバを経由したり、インターネットなどのネットワークを介して外部装置と接続してもよい。
音声出力部1007は、音声の出力を行い、スピーカー等が用いられる。
図2は、図1の動画再生装置1000上で実行される動画再生アプリケーションのユーザーインターフェースを説明するための図である。
図2(a)は、動画を等倍で表示するユーザーインターフェース2001を示し、図2(b)は、動画を拡大表示するユーザーインターフェース2101を示す。
図2(a)において、2002は動画が再生される領域(ビュー:所定領域)である。2003は動画の再生ボタンで、再生ボタン2003を押下すると動画の再生が始まる。この押下時に再生ボタン2003は、図2(b)に示す2103の一時停止ボタンへ変化する。2004は動画の拡大率を変更するスライダーバーである。2005は現在の拡大率の値「1.0」を示す倍率表示部であり、この倍率表示部2005により動画が拡大されることなく、等倍の1.0倍で表示されていることがわかる。
図2(b)において、2102は動画が再生される領域(ビュー)で、動画が拡大されて再生される。一時停止ボタン2103は、押下されたときに再生中の動画を一時停止させるためのボタンであり、この押下時に一時停止ボタン2103は再生ボタン2003へと変化する。2104は動画の拡大率を変更するスライダーバーである。2105は現在の拡大率の値「1.5」を示す倍率表示部であり、この倍率表示部2105により、動画が1.5倍に拡大されて表示されていることがわかる。
図3は、本実施例に係る動画の追尾、動画のレイアウト、再生に至るまでの動画再生時における全体の処理の手順を示すフローチャートである。本処理は、CPU1001が、二次記憶装置1003に記憶される動画再生アプリケーションに従って実行される。
本実施例では、動画の全フレームに対して、この処理を行うものとするが、例えば追尾処理等を1フレーム間引いて処理して、途中フレームは前後フレームの追尾情報から補間してもよい。
まず、ステップS301では動画の現在再生中のフレームの1つを対象フレームとして選択し、この対象フレーム中の被写体の追尾処理を行い、その追尾結果を示す追尾情報を記録する。また、被写体が複数いる場合は、それぞれの被写体に対して追尾処理を行う。ここでは、追尾処理自体は一般的な方法とし、顔であれば顔検出処理を行い、顔以外であればテンプレートマッチング処理により追尾を行うものとする。対象フレームより時間的に未来のフレームに関する追尾情報も利用するので、追尾処理は非同期処理として、未来のフレーム中の被写体に対しても追尾処理を実施し、未来のフレームに関する追尾情報も記録しておく。
この追尾情報について、図4、図5を用いて説明する。
図4は、本実施例に係る、等倍で複数の被写体が含まれる動画を再生中のユーザーインターフェース4001を示す図である。
図4において、4002は動画が再生されるビュー領域であり、対象フレームには6人の被写体A〜Fがビュー領域4002に含まれる。
図5は、図4のユーザーインターフェース4001で再生中の動画の対象フレームに対する追尾情報のデータ構造を示す図である。
5001の追尾情報は、対象フレームに含まれる各被写体A〜Fについて、その被写体IDの値を示す列5002、その中心座標の値(位置情報)を示す列5003、その被写体距離の値を示す列5004から構成される。
列5002に示す被写体IDの値として、ステップS301の追尾処理で検出された各被写体A〜Fに対して夫々異なる値が振られる。異なるフレーム間で同じ被写体IDの値が振られている場合は、その被写体を同一被写体と判断する。同一被写体であるかどうか判断はステップS301の追尾処理において行われ、顔の類似度情報やテンプレートマッチングにおける類似度情報を利用する。
列5003に示す中心座標の値は、各被写体A〜Fの対象フレーム中の位置を示す座標値である。具体的には、顔検出枠やテンプレート枠の中心となる座標が中心座標として算出される。
列5004に示す被写体距離の値は、動画の撮影を行ったカメラ(不図示)から各被写体A〜Fまでの距離を表す。すなわち、この被写体距離の値が小さいほどカメラから近いことを意味する。この被写体距離は、動画の撮像を行ったカメラが多眼カメラなどであれば取得可能である。
動画中の被写体の数は時間と共に増減するため、本実施例では動画の全フレームに対して以下のように追尾情報を取得する。具体的には、新たに被写体がフレームインした場合、被写体の数が増えたと検知し、列5002における被写体IDを新規作成する。一方、フレームアウトしたり、追尾処理に失敗した被写体がある場合は、被写体の数が減少したと検知し、図5の追尾情報5001において、その被写体の中心座標や被写体距離の値を列5003,5004において空欄とする。
次にステップS302でユーザーが拡大率を変更したか否かを判別する。ユーザーは図2のスライダーバー2004等で拡大率を変更できる。ステップS302で拡大率を変更していなければ、ステップS303に進み、後述する図10のようにグループ毎にフレームの領域を分割することなく動画を再生する。一方、ステップS302で拡大率が変更されていれば、ステップS304において図6で後述する分割情報決定処理を実行する。
ステップS305では、ステップS304で決定された分割情報に基づいて図8で後述するレイアウト決定処理を実行する。
ステップS306では、ステップS305で決定されたレイアウトに、対象フレームのレイアウトを変更した後、ステップS303で再生する。その後、ステップS307で対象フレームが最後のフレームか否かを判定し、最後のフレームであればそのまま本処理を終了し、最後のフレームなければステップS308に進み、次のフレームを対象フレームとして、ステップS301に戻る。
図6は、本実施例に係る図3のステップS304の分割情報決定処理の手順を示すフローチャートである。
まず、ステップS601では追尾情報5001から対象フレームに含まれる各被写体の位置座標を取得する。また、対象フレームに含まれる被写体の1つを対象被写体として選択する。
次に、ステップS602では、対象被写体とその他全ての被写体との間の距離を算出する。例えば図5において対象被写体が被写体ID1であれば、被写体ID1,2、被写体ID1,3、被写体ID1,4、被写体ID1,5、被写体ID1,6というように算出する。ここで、距離は2次元上での距離を扱うものとし、列5003に示す各中心座標の値に基づき算出される距離とするが、これに限定されない。例えば、列5004に示す各被写体距離の値も含めた3次元上での距離としてもよいし、列5004に示す被写体距離の値にのみに基づき算出される距離としてもよい。
ステップS603ではステップS602で算出した被写体同士の距離が閾値より小さいか確認し、閾値より小さければステップS604へ進む。以下、算出された距離が小さいことが確認された複数の被写体を対象被写体群という。
ステップS604で、対象被写体群が前のフレームにおいて属すると判定されたグループと同じグループに所属するか否かを判定する。この判定の結果、同じグループに所属する場合は(ステップS604でYES)、ステップS606に進み、対象被写体群を同じグループに設定する。例えば、現フレームであるNフレーム目で、対象被写体群に対しそれぞれ被写体ID1,2が振られていた場合に、N−1フレームで被写体ID1,2が振られた被写体群が同グループに属すると判定されていたら、対象被写体群を同じグループに設定する。尚、ステップS603で対象被写体群として3つ以上の被写体が確認された場合も、同様にステップS604の判定が行われる。例えば、Nフレーム目で、対象被写体群に対しそれぞれ被写体ID1,2,3が振られていた場合に、N−1フレームで被写体ID1,2,3が同グループに所属すると判定されていたら、対象被写体群を同じグループに設定する。
一方、ステップS604において、同じグループに所属しない場合は(ステップS604でNO)、ステップS605に進む。ステップS605では、時間的に未来の数フレームの追尾情報から対象被写体とその他の対象被写体群との間の距離を算出し、算出された被写体同士の距離が閾値より小さい期間が所定時間以上であるか否かを判定する。この判定の結果、被写体同士の距離が閾値より小さい期間が所定時間以上である場合は(ステップS605でYES)、ステップS606に進む。ステップS606では、対象被写体及び対象被写体との距離が閾値より小さい被写体に対し、新しくグループを生成して、その生成された同じグループに設定する。例えば、2秒間を上記所定時間に設定した場合、動画における2秒間分の追尾情報、例えば、60fpsの動画であればN+1からN+120のフレームまでの追尾情報を確認し、これら全てのフレームで被写体同士の距離が閾値より小さいか確認する。これは被写体同士が近づいたり、離れたり繰り返すシーンで、フレームが分割された後にすぐに分割が解除されてしまったときに、動画として見にくくなってしまうのを避けるためである。一方、被写体同士の距離が閾値より小さい期間が所定時間以上とならなかった場合は(ステップS605でNO)、ステップS607に進む。
ステップS607では、被写体全てが対象被写体となって他の被写体と比較されたか否かを判定する。この判定の結果、被写体全てが対象被写体となって比較されている場合は(ステップS607でYES)、本処理をそのまま終了し、そうでなければ(ステップS607でNO)、ステップS608に進む。ステップS608では、次の被写体IDが振られた被写体を対象被写体とし、ステップS602に戻る。具体的には、まず初めに、被写体ID1が振られた被写体を対象被写体として、ステップS602で被写体ID2〜6が振られた被写体との間の距離を算出し、ステップS603〜S607の処理を行なう。次に、ステップS608で被写体ID2が振られた被写体を対象被写体とし、ステップS602で被写体ID3〜6が振られた被写体との間の距離を算出し、ステップS603〜S607の処理を行なう。
図7は、本実施例に係るグループ情報のデータ構造を示す図である。
グループ情報7001は、ステップS606で生成されるグループのそれぞれについて、グループIDの値を示す列7002と、グループの中心座標(拡大中心位置)を表す列7003と、グループに所属する被写体のIDを示す列7004から構成される。
列7002には、グループの数だけグループIDを保持する。また、列7003では、例えばグループID1001の中心座標として算出された、被写体ID1,2,3の中心座標の平均値が保持される。
図8は、図3のステップS305のレイアウト決定処理の手順を示すフローチャートである。
ステップS801でグループの数から分割数を決定する。本実施例では、図9に示すように、分割数に応じた複数の分割画面(レイアウト枠)からなるレイアウト構造が予めテンプレートとして保持されている。例えば、グループ数が2であればテンプレート9001に示すように2つの分割画面を有するレイアウト構造がステップS801において選択される。同様にグループ数が3〜4であればテンプレート9002、グループ数5〜6であればテンプレート9003、グループ数7〜9であればテンプレート9004のように分割画面を有するレイアウト構造がステップS801において選択される。本実施例では、予め保持されたテンプレートを利用したが、被写体の大きさに応じて、分割された領域のサイズに重みを持たせてもよい。
次に、ステップS802では、グループ情報7001に情報が記載されるグループの1つを対象グループに選択し、その対象グループの中心座標をグループ情報7001から取得する。本実施例では、グループIDの値が最も小さいグループID1001のグループを対象グループとする。
ステップS803では、対象グループのレイアウトを決定する。決定されたレイアウトの位置ができるだけ被写体の元の位置に近くなるように、列7003に示される対象グループの中心座標に基づき、図9の9005〜9008に示す順番で配置する。グループ情報7001の場合だと、グループ数が3つなので、テンプレート9002のレイアウト構造がステップS801において選択される。また、グループ情報7001において中心座標が最も左上にあるグループは、グループID1001のグループなので、テンプレート9002における配置位置が左上のレイアウト枠にこのグループの被写体を配置する。次にグループ情報7001において中心座標が最も右上にあるグループは、グループID1002のグループなので、テンプレート9002における配置位置が右上のレイアウト枠にこのグループの被写体を配置する。同様にして、グループID1003のグループの被写体をテンプレート9002における配置位置が左下のレイアウト枠に配置する。この時、グループ数が3に対して、レイアウト枠の数が4であるので、空いている右下のレイアウト枠にレイアウトを変更する前の対象フレームを縮小して配置してもよい。そうすることにより、動画の全体像も把握することができる。
図10は、図4の再生中の動画に対してユーザーによる拡大指示があった時のユーザーインターフェース10001を示す図である。
ユーザーインターフェース10001において、図7のグループID1001〜1003の被写体はそれぞれ、10002〜10004の分割画面にレイアウトされ、対象フレームを再生している。
図11は、図10の各分割画面10002〜10004に各グループの被写体をレイアウトするときの、各領域の拡大領域幅を決定する方法を説明する図である。
11004は元の動画のフレーム、すなわち、ユーザーより拡大指示をうけた対象フレームを表しており、11005は元動画幅、11006は元動画高さを示す。11007は、図7のグループID1001のグループに含まれる被写体がレイアウトされる分割画面の大きさを示す矩形領域を示しており、11008は拡大時領域幅、11009は拡大時領域高さを表している。拡大時領域幅、拡大時領域高さはステップS801で選択されたテンプレートに応じて決定される。例えば、図10の場合、元動画幅11005の値をxとすると、拡大時領域幅はx/2と算出され、元動画高さ11006の値をyとすると、拡大時領域高さはy/2と算出される。これによって、中心座標と拡大領域幅、拡大領域高さから、図7のグループID1001のグループに含まれる被写体がレイアウトされる矩形領域の座標情報{left1,right1,bottom1,top1}を算出することが可能となる。各グループはその中心座標を中心にユーザー指示のあった倍率に対象フレームを拡大し、その中心が各矩形領域の中心に位置するように配置されるが、その際、拡大された対象フレームのうち各矩形領域からはみ出した領域はトリミング(切り出し)される。
尚、列7003に示される中心座標は動画が再生されるビュー領域4002の端の方に位置し、{left1,right1,bottom1,top1}の値が、元動画幅もしくは元動画高さより大きな値になったり、0より小さい場合がある。このような場合は、その範囲を超えない最大、最少の値に置き換える。例えばleft1が負になった場合は0とし、right1は拡大領域幅の値とする。
11001は、図7の各グループに含まれる被写体がレイアウトされる領域の座標情報であり、各グループのグループIDを示す列11002、各グループに含まれる被写体がレイアウトされる矩形領域の座標情報を示す列11003により構成される。
図8に戻り、ステップS804において、全てのグループが対象グループとなってレイアウトが決定された否かを判別する。この判定の結果、全てのグループが対象グループとなってレイアウトの決定済みである場合は(ステップS804でYES)、ステップS806に進み、そうでなければ(ステップS804でNO)、ステップS805に進む。ステップS805では、次のグループIDが振られたグループを対象グループとし、ステップS803に戻る。
ステップS80では、決定されたすべてのグループのレイアウトに関するレイアウト情報を生成し、本処理を終了する。
(実施例2)
実施例1では、図3のステップS302において拡大率が変更されると、図6に示す処理により対象フレームに含まれる複数の被写体を、複数のグループに分割する。これに対して、本実施例では、以下で説明するように、ユーザが拡大率を変更した場合、その拡大率にまで対象フレームを中心位置を基点に拡大していく。この際、ユーザーインターフェースの動画が再生されるビュー領域4002から対象フレームに存在する被写体の少なくとも一つが外れてしまった場合に、対象フレームに含まれる複数の被写体を複数のグループに分割する。
図12は、本実施例に係る図3のステップS304の分割情報決定処理の手順を示すフローチャートである。
まず、ステップS1201で、追尾情報5001から被写体の位置座標を取得する。
次に、ステップS1202で対象フレームを中心位置を基点として、ステップS302で取得した拡大率で拡大し、ユーザーインターフェースの動画が再生されるビュー領域4002から切れてしまう被写体があるか否かを判別する。この判別の結果、切れてしまう被写体がある場合はステップS1203に進み、全グループ数を、外れた被写体の数+1とし、図3のステップS305に進む。一方、切れてしまう被写体がない場合は図3のステップS302に戻る。
ここで本実施例では、被写体がビュー領域4002から切れてしまう否かの判定は、図5の列5003に示す各被写体の中心座標がビュー領域4002の外側に出てしまうか否かで決定する。但し。かかる方法に限定されるわけなく、例えば、被写体に対する顔検出枠やテンプレートマッチングの枠がビュー領域4002の外側に出てしまうか否かで判定してもよい。
尚、ステップS1203におけるグループ数の決定方法は、拡大したときにビュー領域4002に存在する被写体が所属するグループを含む複数のグループを決定する方法であれば、かかる実施例に限定されるわけでない。例えば、外れた被写体のうち位置が互いに近い被写体がある場合、すなわち、外れた被写体のうち被写体同士の距離が閾値以下である被写体がある場合は、それらの被写体を同じグループに設定するようにしてもよい。また、この場合、その後のフレームにおいて、被写体同士の距離が閾値より大きくなった場合、上記決定されたグループを分割し、それぞれ別のグループに所属するようにしてもよい。
(その他の実施形態)
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザーに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザーに配布する。そして、所定の条件をクリアしたユーザーに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
1000 動画再生装置
1001 CPU
1002 一次記憶装置
1003 二次記憶装置
1004 表示部
1005 操作部
2001,2101,4001,10001 ユーザーインターフェース
2004,2104 スライダーバー
10002〜10004 分割画面

Claims (7)

  1. 動画再生装置において、
    動画に含まれる複数の被写体を検出して追尾する追尾手段と、
    前記追尾手段により検出された前記複数の被写体の位置情報を取得する取得手段と、
    前記位置情報に基づき、前記複数の被写体のそれぞれの間の距離を算出する算出手段と、
    前記動画における、前記算出された距離が閾値より小さい期間に基づき、前記複数の被写体のそれぞれが所属するグループを決定する決定手段と、
    前記動画の拡大率を変更する変更手段と、
    前記変更手段により前記拡大率が変更された際、前記決定されたグループの数に応じた複数の分割画面に、前記動画の対象フレームのうち前記グループごとに所属する被写体が含まれる範囲それぞれをレイアウトして前記動画を再生する再生手段とを備えることを特徴とする動画再生装置。
  2. 前記対象フレームにおける、前記グループの範囲それぞれの中心位置及び前記複数の分割画面の配置位置に応じて、前記複数の分割画面に前記グループの範囲がレイアウトされることを特徴とする請求項1記載の動画再生装置。
  3. 前記対象フレームのうち前記グループの範囲それぞれを、前記中心位置を中心に前記変更された拡大率に拡大し、前記中心位置が前複数の分割画面の夫々の中心に位置するように配置することを特徴とする請求項2記載の動画再生装置。
  4. 前記追尾手段は、顔の類似度情報基づき前記動画の異なるフレーム間で同一被写体か否かを判断する判断手段を更に備え、
    記取得手段は、前記複数の被写体の位置情報として、前記複数の被写体に対する顔検出枠の中心となる座標を取得することを特徴とする請求項1乃至のいずれか1項に記載の動画再生装置。
  5. 前記追尾手段は、テンプレートマッチングにおける類似度情報基づき前記動画の異なるフレーム間で同一被写体か否かを判断する判断手段を更に備え、
    前記取得手段は、前記複数の被写体の位置情報として、前記複数の被写体に対するテンプレート枠の中心となる座標を取得することを特徴とする請求項1乃至のいずれか1項に記載の動画再生装置。
  6. 動画再生装置の制御方法において、
    動画に含まれる複数の被写体を検出して追尾する追尾ステップと、
    記検出された前記複数の被写体の位置情報を取得する取得ステップと、
    前記位置情報に基づき、前記複数の被写体のそれぞれの間の距離を算出する算出ステップと、
    前記動画における、前記算出された距離が閾値より小さい期間に基づき、前記複数の被写体のそれぞれが所属するグループを決定する決定ステップと、
    前記動画の拡大率を変更する変更ステップと、
    前記拡大率が変更された際、前記決定されたグループの数に応じた複数の分割画面に、前記動画の対象フレームのうち前記グループごとに所属する被写体が含まれる範囲それぞれをレイアウトして再生する再生ステップとを有することを特徴とする制御方法。
  7. コンピュータを請求項1乃至5のいずれか一項に記載の動画再生装置の各手段として機能させるプログラム。
JP2017154388A 2017-08-09 2017-08-09 動画再生装置およびその制御方法、並びにプログラム Active JP6949612B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017154388A JP6949612B2 (ja) 2017-08-09 2017-08-09 動画再生装置およびその制御方法、並びにプログラム
US16/045,023 US10560632B2 (en) 2017-08-09 2018-07-25 Moving image reproducing apparatus, control method therefor, and storage medium storing control program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017154388A JP6949612B2 (ja) 2017-08-09 2017-08-09 動画再生装置およびその制御方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2019033430A JP2019033430A (ja) 2019-02-28
JP2019033430A5 JP2019033430A5 (ja) 2020-09-10
JP6949612B2 true JP6949612B2 (ja) 2021-10-13

Family

ID=65275662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017154388A Active JP6949612B2 (ja) 2017-08-09 2017-08-09 動画再生装置およびその制御方法、並びにプログラム

Country Status (2)

Country Link
US (1) US10560632B2 (ja)
JP (1) JP6949612B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6894707B2 (ja) * 2017-01-06 2021-06-30 キヤノン株式会社 情報処理装置およびその制御方法、プログラム
US10957068B2 (en) * 2017-01-06 2021-03-23 Canon Kabushiki Kaisha Information processing apparatus and method of controlling the same
US20230290115A1 (en) * 2020-07-17 2023-09-14 Nec Corporation Method, apparatus and non-transitory computer readable medium
CN112243110B (zh) * 2020-10-15 2023-03-24 成都易瞳科技有限公司 全景目标轨迹记录方法
JP7129463B2 (ja) * 2020-12-21 2022-09-01 グリー株式会社 コンピュータプログラム、方法、及び、サーバ装置
KR102642139B1 (ko) * 2022-04-29 2024-02-29 사회적협동조합 어우리 Cctv 영상의 이벤트 분할 감지 시스템
KR102649342B1 (ko) * 2022-04-29 2024-03-19 사회적협동조합 어우리 Cctv 분할 영상의 이벤트 정밀 감지 시스템

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331827A (ja) 1998-05-12 1999-11-30 Fujitsu Ltd テレビカメラ装置
GB0116877D0 (en) * 2001-07-10 2001-09-05 Hewlett Packard Co Intelligent feature selection and pan zoom control
JP5247569B2 (ja) * 2009-04-09 2013-07-24 富士フイルム株式会社 人物追跡装置、人物追跡方法及びプログラム
JP2013134574A (ja) * 2011-12-26 2013-07-08 Canon Inc 画像データ生成装置、画像データ表示システムおよび画像データ生成方法
WO2013136792A1 (ja) * 2012-03-15 2013-09-19 パナソニック株式会社 コンテンツ処理装置、コンテンツ処理方法およびプログラム
JP6281245B2 (ja) * 2013-10-31 2018-02-21 日本電気株式会社 情報処理装置及び表示拡大方法、並びにコンピュータ・プログラム
JP2016143335A (ja) * 2015-02-04 2016-08-08 富士通株式会社 グループ対応付け装置、グループ対応付け方法及びグループ対応付け用コンピュータプログラム

Also Published As

Publication number Publication date
US10560632B2 (en) 2020-02-11
US20190052806A1 (en) 2019-02-14
JP2019033430A (ja) 2019-02-28

Similar Documents

Publication Publication Date Title
JP6949612B2 (ja) 動画再生装置およびその制御方法、並びにプログラム
KR102225802B1 (ko) 반응형 영상 생성방법 및 생성프로그램
CN101989173A (zh) 图像编辑装置、图像编辑方法和程序
EP2182522B1 (en) Information processing
EP3070681A1 (en) Display control device, display control method and program
US11355158B2 (en) Asynchronous video collaboration
JP6760718B2 (ja) 動画再生プログラム、装置、及び方法
TWI625964B (zh) 視訊回放裝置及方法(二)
JP2007323698A (ja) マルチメディアコンテンツ表示装置、方法及びプログラム
CN103838809A (zh) 信息处理设备、信息处理方法以及程序
JP6686578B2 (ja) 情報処理装置及び情報処理プログラム
TWI628952B (zh) 視訊回放裝置及方法(三)
TWI514319B (zh) 藉由虛擬物件編輯資料之方法及系統,及相關電腦程式產品
JP2000209541A (ja) 動画像再生装置、及び動画像再生プログラムが記憶された記憶媒体
JP2013146511A (ja) 人体の動作の変移を記録、解析し、表示する電子機器
JP6314465B2 (ja) 情報処理装置、画像処理システム、情報処理装置におけるデータ表示方法及びプログラム
JP2021129317A (ja) 多次元反応型映像提供方法及びコンピュータ装置。
KR102066857B1 (ko) 객체 영상 트랙킹 스트리밍 시스템 및 이를 이용한 스트리밍 방법
JP2005167822A (ja) 情報再生装置及び情報再生方法
KR102372181B1 (ko) 전자 장치 및 그의 제어 방법
JP2005117182A (ja) 画像表示装置、画像表示方法、プログラム及び記録媒体
JP2008112425A (ja) データ処理装置、データ処理方法、データ処理プログラムおよびデータ処理プログラムを記録した記録媒体
JP6354624B2 (ja) 動画撮像システム、情報処理端末、動画確認方法及びプログラム
JP2012222653A (ja) 映像再生装置、映像再生方法、および映像再生プログラム
JP2016019138A (ja) 画像処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210922

R151 Written notification of patent or utility model registration

Ref document number: 6949612

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151