JP2023058322A - 映像処理装置及びその制御方法及びプログラム - Google Patents
映像処理装置及びその制御方法及びプログラム Download PDFInfo
- Publication number
- JP2023058322A JP2023058322A JP2021168273A JP2021168273A JP2023058322A JP 2023058322 A JP2023058322 A JP 2023058322A JP 2021168273 A JP2021168273 A JP 2021168273A JP 2021168273 A JP2021168273 A JP 2021168273A JP 2023058322 A JP2023058322 A JP 2023058322A
- Authority
- JP
- Japan
- Prior art keywords
- image
- subject
- video
- main
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 10
- 239000002131 composite material Substances 0.000 claims abstract description 12
- 238000004891 communication Methods 0.000 claims description 18
- 238000003384 imaging method Methods 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 4
- 238000004091 panning Methods 0.000 claims description 4
- 238000001454 recorded image Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/69—Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
- H04N23/661—Transmitting camera control signals through networks, e.g. control via the Internet
- H04N23/662—Transmitting camera control signals through networks, e.g. control via the Internet by using master/slave camera arrangements for affecting the control of camera image capture, e.g. placing the camera in a desirable condition to capture a desired image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/90—Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2628—Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
- Studio Circuits (AREA)
Abstract
【課題】 2つの映像それぞれの被写体の位置関係が自然で、違和感が少ない合成映像を生成する。【解決手段】 映像処理装置は、第1の映像及び第2の映像に基づいて、第1の映像における第1の被写体の向き及び第2の映像における第2の被写体の向きを特定するための情報を取得する取得部と、第1の被写体を含む第1の映像の少なくとも一部を、第2の映像において取得部により取得される情報に基づいて決定される位置に重畳することで、合成映像を生成する生成部とを有する。【選択図】 図6
Description
本発明は、2つの映像の重畳合成技術に関するものである。
メインカメラで撮影した映像に、サブカメラで撮影した映像をワイプ映像として重畳表示するPicture In Picture技術がある。特許文献1には、好ましい構図でワイプ映像が合成されるよう、ワイプ映像の位置およびサイズに応じてメインカメラの撮影方向を決定する技術が開示されている。
しかしながら、特許文献1は、被写体に応じて最終的な出力映像を判断しない。そのため、特許文献1の技術では、各被写体とワイプの位置関係が不自然なものとなることがある。また、特許文献1の技術では、ワイプ映像をただ重畳するだけでは被写体サイズが小さく視認性が低いといった、品位の低い映像を生成する可能性がある。
この課題を解決するため、例えば本発明の映像処理装置は以下の構成を備える。すなわち、
第1の映像及び第2の映像に基づいて、第1の映像における第1の被写体の向き及び前記第2の映像における第2の被写体の向きを特定するための情報を取得する取得手段と、
前記第1の被写体を含む前記第1の映像の少なくとも一部を、前記第2の映像において前記取得手段により取得される情報に基づいて決定される位置に重畳することで、合成映像を生成する生成手段とを有する。
第1の映像及び第2の映像に基づいて、第1の映像における第1の被写体の向き及び前記第2の映像における第2の被写体の向きを特定するための情報を取得する取得手段と、
前記第1の被写体を含む前記第1の映像の少なくとも一部を、前記第2の映像において前記取得手段により取得される情報に基づいて決定される位置に重畳することで、合成映像を生成する生成手段とを有する。
本発明によれば、2つの映像それぞれの被写体の位置関係が自然で、違和感が少ない合成映像を生成することができる。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[第1の実施形態]
実施形態における映像システムの構成を図1(a)に、出力映像の一例を図1(b)に示す。映像システムにおける制御装置100は、メインカメラ101およびサブカメラ102に各種撮影に係る制御コマンドを送信すると共に、それらカメラが撮影した映像データを受信する。メインカメラ101はメイン被写体103を撮影し、撮影して得た映像をメイン映像として制御装置100に送信する。サブカメラ102はサブ被写体104を撮影し、撮影して得た映像をサブ映像として制御装置100へ送信する。制御装置100は、リアルタイムでメイン映像に、サブ映像内の一部分をワイプ画面として重畳する映像処理を行って出力画像(図1(b)に示すような合成映像)を生成する。
実施形態における映像システムの構成を図1(a)に、出力映像の一例を図1(b)に示す。映像システムにおける制御装置100は、メインカメラ101およびサブカメラ102に各種撮影に係る制御コマンドを送信すると共に、それらカメラが撮影した映像データを受信する。メインカメラ101はメイン被写体103を撮影し、撮影して得た映像をメイン映像として制御装置100に送信する。サブカメラ102はサブ被写体104を撮影し、撮影して得た映像をサブ映像として制御装置100へ送信する。制御装置100は、リアルタイムでメイン映像に、サブ映像内の一部分をワイプ画面として重畳する映像処理を行って出力画像(図1(b)に示すような合成映像)を生成する。
実施形態におけるメインカメラ101とサブカメラ102は、本映像システムにおける役割で区別表記しているに過ぎず、カメラとしてのハードウェア上の違いはない。以下、簡単のため、メインカメラ101ついてのみ説明するが、サブカメラ102についても同様であるものと理解されたい。
図7に、実施形態におけるメインカメラ101のハードウェア構成図を示す。メインカメラ101は、制御装置100によるリモート制御可能となっている。このため、メインカメラ101は、CPU701,ROM702,RAM703,通信I/F704,撮像部705,撮像制御部706、雲台707,雲台制御部708を有する。
CPU701は、RAM703をワークエリアとして使用し、ROM702に格納されたプログラムに従って装置全体の制御を司る。通信I/F704は、CPU601の制御下において制御装置100と通信を行う。撮像部705は、光学レンズ(フォーカスレンズ、ズームレンズを含む)、絞り、撮像素子を有する。撮像制御部706は、CPU701の制御下にて、フォーカスレンズ、ズームレンズ、絞りを制御する。雲台制御部708は、CPU701の制御下にて、雲台707のパン用モータ、或いは/及び、チルト用モータを駆動する。
かかる構成において、CPU701は、撮像部705を制御し、所定のフレームレート(例えば30フレーム/秒)で撮像を行い、得た映像データを通信I/F704を介して制御装置100に送信する。また、CPU701は、制御装置100から制御コマンド(後述する制御情報)を通信I/F704を介して受信した場合、その制御コマンドがズーム制御に係るコマンドである場合には、撮像制御部706を制御して、ズームレンズをコマンドに応じた位置(焦点距離)に移動させる。また、制御コマンドがパン、或いはチルト制御に係るコマンドである場合には、雲台制御部708内の不図示のモータを制御し、目標とするパン位置、もしくはチルト位置に雲台の回動させる制御を行う。いずれの場合であっても、コマンドに応じた駆動が完了した場合、CPU701は、駆動完了を示すレスポンスを、通信I/F704を介して、制御装置100に通知する。以上が、メインカメラ101の構成と動作である。先に説明したように、サブカメラ102の構成と動作は、メインカメラ101と同じである。
図2は、主として制御装置100のハードウェア構成図である。制御装置100は、CPU200、ROM201、RAM202、HDD203、解析モジュール204、通信モジュール205を備える。
CPU200は、ROM201に格納されたプログラム、もしくはHDD203からRAM202にロードしたプログラムを実行し、制御装置100の各構成要素を制御する。
解析モジュール204は、CPU200の制御下にて、メイン映像およびサブ映像における被写体情報を解析する。この解析処理は、GPU(不図示)や、ASICもしくはFPGAなどによる映像解析処理専用回路(不図示)で解析を行ってもよい。なお、2つのカメラのいずれがメインで、いずれがサブとするかは、管理者が予め設定されているものとする。
通信モジュール205は、CPU200の制御下にて、装置外部のネットワーク206、メインカメラ101、及び、サブカメラ102との間での通信を行う。具体的には、通信モジュール205は、メインカメラ101およびサブカメラ102への各種制御コマンドの送信、並びに、メインカメラ101およびサブカメラ102からの映像データの受信を行う。また。通信モジュール205は、制御装置100にて生成した出力画像を、ネットワーク206上の装置(例えば映像配信サーバ、或いは映像を閲覧するクライアント端末)に送信する。なお、通信モジュール205による通信路は、有線/無線を問わない。
HDD203は、CPU200が実行するプログラムだけでなく、後述する被写体(人物等)を同定するためのデータベース(被写体IDとその人物に固有の特徴情報で構成される)が格納されている。
図3は、制御装置100の機能構成図を示している。制御装置100が有する解析部300、判断部301、及び、重畳部302は、CPU200が、対応するプログラムを実行することで機能するものとするが、CPU200とは独立した回路等で実現させても構わない。
解析部300は、通信モジュール205を介して、メインカメラ101およびサブカメラ102から入力映像303を取得する。解析部300は、HDD203に予め格納されたDB等を参照して、解析モジュール204を用いて入力映像303を解析し、その解析結果304を判断部301へ供給する。解析結果304を構成する具体的なパラメータは後述する。解析部300は、ワイプ表示のちらつきを防止するため、被写体をロストしても、しばらくはロスト前と同じ解析結果304を判断部301へ供給する。
判断部301は、解析結果304をもとに、ワイプ映像およびメイン映像の被写体に応じてワイプを含む最終的な出力映像を判断する。判断部301は、メインカメラ101およびサブカメラ102の構図を変更するための制御情報305を生成し、通信モジュール205を用いてメインカメラ101およびサブカメラ102へ、その制御情報305を供給する。制御情報305は撮影に係るパラメータであって、パン、チルト、ズームに対する制御量を含む制御コマンド形式の情報である。判断部301は、メイン映像にサブ映像を重畳するための重畳情報306を生成し、重畳部302へ供給する。重畳情報306の具体的なパラメータは後述する。
重畳部302は、入力映像303と重畳情報306をもとに、出力映像307を生成する。出力映像307は、通信モジュールによりネットワーク206へ出力する。出力映像307は、HDD203へ出力してもよい。
図4(a)に入力映像の一例と、図4(b)に解析部300による解析結果の一例を示す。図4(a)の映像は、被写体の位置とサイズ400と、注目領域の位置とサイズ401を含む。
図4(b)の被写体IDは、検出した被写体を識別するIDである。被写体の種別は、「人物」「動物」「乗り物」「モノ」「事前登録済みの人物」「板書内容」などの検出した被写体の種別である。被写体の状態は、被写体の種別が「人物」であれば、「起立」「発話」「着席」「沈黙」などの状態である。位置とサイズは、入力映像の左上隅を原点とし、画素を単位で表現する。具体的には、被写体の位置とサイズは、被写体全体(外接矩形)を示す領域の左上座標とサイズであり、被写体1が被写体の位置とサイズ400と一致する。注目領域の位置とサイズは、被写体の顔などの一般的に注目する領域の外接矩形の左上座標とサイズであり、被写体1が注目領域の位置とサイズ401と一致する。被写体全体に注目する場合、注目領域の位置とサイズは被写体の位置とサイズと同一でよい。被写体の向きは、被写体の正面向きを基準とし、その基準の向きに対する角度である。被写体の目の位置は、被写体の目と目の中央の座標である。
図5(a)に重畳情報306の一例を、図5(b)に重畳前と後の映像の一例を示す。
図5(a)のリストの「クロップする位置とサイズ」は、メイン映像の場合は、その左上隅の座標とサイズである。また、サブ映像における「クロップする位置とサイズ」は、ワイプ用に切り抜く領域の左上隅の座標とサイズである。なお、座標及びサイズは、画素を単位としている。「重畳する位置とサイズ」は、メイン映像における位置とサイズを表す。「重畳する形状」は、サブ映像を矩形、円、台形、菱形などのクロップ領域によりさらに切り抜く形状を示す。「左右反転フラグ」は、サブ映像を鏡映反転させて重畳するかどうかを示すフラグである。
図5(a)の例の場合、サブ映像における座標(630,160)を左上隅とし、水平方向400画素,垂直方向400画素のサイズの矩形領域がワイプ映像としてクロップされること、並びに、メイン映像における座標(20,20)に、クロップしたワイプ映像の左上隅を位置させることを示している。図5(b)は、図5(a)に示す重畳情報306による、メイン映像、サブ映像から合成映像を生成する様を示している。
図6のフローチャートは、判断部301が実行する一連の処理を表している。判断部301は、解析部300による解析が完了したタイミングもしくは定期的なタイミングで、図6のフローチャートの処理を実施する。
ステップS600において、判断部301は、解析結果304をもとに、メイン映像およびサブ映像それぞれにて、追尾すべき主被写体を決定する。判断部301は、被写体IDをもとに、直前の処理結果で主被写体として選択した被写体を、引き続き主被写体として選択する。さらに、判断部301は、予め優先する被写体の種別と状態を登録しておき、被写体の種別が「人物」「事前登録済みの人物」「板書内容」や、被写体の状態が「起立」「発話」と一致する場合は、優先的に主被写体として選択する。判断部301は、解析結果304に被写体が含まれないと判断した場合、もしくは予め追尾がオフに登録されている場合、主被写体を選択しない。
ステップS601において、判断部301は、メイン映像およびサブ映像いずれかの主被写体の被写体IDもしくは主被写体の選択有無が変化したかを判断する。判断部301は、変化したと判断した場合にはステップS602へ、変化無しと判断した場合はステップS607へ処理を遷移する。
ステップS602において、判断部301は、メイン映像およびサブ映像それぞれの主被写体が最終的な映像としてなるべく向かい合うよう、ワイプ映像の重畳位置を設定する。例えば、メイン映像の主被写体が映像内で左を向いている場合は、判断部301は、そのメイン映像内の予め設定された左寄りの位置を、ワイプ映像の重畳位置に設定する。また、メイン映像の主被写体が映像内で右を向いている場合は、判断部301は、そのメイン映像の予め設定された右寄りの位置を、ワイプ映像の重畳位置に設定する。
また、メイン映像の主被写体の向きが左又は右のいずれでもなく(ほぼ正面を向いている場合等がこれに相当)、かつ、サブ映像の主被写体が映像内にて左を向いている場合、判断部301は、メイン映像内の予め設定された右寄り位置を、ワイプ映像の重畳位置に設定する。
また、メイン映像の主被写体の向きが左又は右のいずれと判断できず(ほぼ正面を向いている場合等)、かつ、サブ映像の主被写体が映像内にて右を向いている場合、判断部301は、メイン映像内の予め設定された左寄り位置を、ワイプ映像の重畳位置に設定する。
また、メイン映像およびサブ映像それぞれの主被写体の向きが左又は右のいずれでもない場合、判断部301は、ワイプ映像の重畳位置を予めデフォルトとして登録した位置に設定する。また、ワイプ映像の重畳位置を、以前の位置のまま維持するようにしてもよい。
更に、メイン映像内で主被写体が選択されていない場合、サブ映像の主被写体の向きに応じてワイプ映像の重畳位置を設定する。またサブ映像で主被写体が選択されていない場合、メイン映像の主被写体の向きに応じてサブ映像の重畳位置を設定する。
また更に、メイン映像およびサブ映像それぞれの主被写体のいずれもが、同じ向きの場合(共に左向き、又は、共に右向きの場合)、ワイプ映像の重畳位置を設定するだけでは最終的な映像としてなるべく向かい合うようにならない。そのため、判断部301は、サブ映像の左右反転フラグをONに設定する。この結果、メイン映像とサブ映像内の主被写体は互いに向かい合う関係にできるようになる。
ワイプ映像を重畳する垂直方向の位置は、シチュエーションに応じて予め登録した位置とする。もしくは、メイン映像およびサブ映像の主被写体の目の高さが一致するよう、ワイプ映像の重畳位置の高さを設定してもよい。
ワイプ映像を重畳する座標は、ステップS602で判断する上下左右の位置に基づき、画面端から例えば20画素を離れた位置とする。
ステップS603にて、判断部301は、サブ映像内の主被写体に関する解析結果304が示す情報に応じて、サブカメラ102のパン、チルト、ズームの各値を設定する。判断部301は、パン、チルトの可動範囲内で、主被写体もしくは注目領域が映像の中心位置となるために必要となるパン、チルトの値を計算して、そのためのコマンドを生成する。主被写体と注目領域のどちらを画面中心にするかは、シチュエーションに応じて予め登録された設定情報に従うものする。ズームの値としては、ワイプ映像の解像度が低下せず、かつ、なるべく広い範囲が撮影可能な値を設定する。広い範囲を撮影することで、新たな主被写体を検出しやすくなり、主被写体の注目領域が多少移動してもクロップ位置をずらすことでパン、チルトすることなく追従できるようになる。判断部301は、主被写体の種別に応じたクロップ後のサイズおよび主被写体の注目領域の周囲の余分領域の割合を予め決めておく。例えば顔であれば、クロップ後のサイズは400×400画素、余分領域の割合は例えば20%として予め登録しておき、判断部301は、顔の検出サイズが320×320画素になるようズームの値を決定する。もしくは、クロップ時に映像を拡大縮小しても解像度がなるべく落ちないよう、さらに例えば150%を乗じた480×480画素になるようズームの値を決定してもよい。
判断部301は、メイン映像の主被写体とサブ映像の主被写体が、重畳後は同じサイズになるよう、予め登録したメインカメラのズーム後の主被写体サイズと、余分領域の割合から、クロップ後のサイズを自動で計算してもよい。例えば、メインカメラのズーム後の主被写体サイズが350×350画素、余分領域の割合は20%であれば、クロップ後のサイズは420×420画素とする。また、判断部301は、サブ映像に被写体がいなければ、被写体が見つけられるよう、予め登録した広角となるズームの値を設定する。
ステップS604において、判断部301は、ワイプ映像を重畳して表示するサイズを設定する。基本となる重畳サイズは、主被写体の種別に応じたクロップ後のサイズであり、例えば400×400画素である。しかし、最大限ズームをしてもサブ映像の主被写体サイズが小さく、無理に拡大表示して解像度が落ちるのであれば、ワイプ映像の重畳サイズを小さくする。判断部301は、構図変更後のサブ映像の主被写体サイズを計算し、基本となる重畳サイズと計算した主被写体サイズの小さい方を、ワイプ映像の重畳サイズとして設定する。例えば、クロップ後のサイズが150×150画素にしかならなければ、ワイプ映像の重畳サイズも150×150画素とする。もしくは、例えば2倍までの引き伸ばしを許容し、ワイプ映像の重畳サイズを300×300画素としてもよい。なお、許容するサイズは、ユーザが、設定できるようにしてもよい。
ステップS605において、判断部301は、メイン映像の主被写体とワイプ映像の重畳位置とサイズに応じ、メインカメラ101のパン、チルト、ズームの各値を設定する。具体的には、判断部301は、パン、チルトの可動範囲内で、主被写体もしくは注目領域が画面中心になるように、パン、チルトの値を計算して設定する。
主被写体と注目領域のどちらを画面中心にするかは、シチュエーションに応じて予め登録しておいて、撮影する際に、ユーザがその1つを選択することで決定するものとする。判断部301は、新たにメイン映像で主被写体が見つかった場合、ズーム後の主被写体サイズが予め登録したサイズになるよう、ズームの値を計算する。さらに、判断部301は、サブ映像で主被写体が選択されている場合、ズームの値は、顔とワイプ映像が被りにくくなるようズームアウトした値とする。例えば、判断部301は、ズームアウト前の画角から、ワイプ映像の重畳サイズの1/2のサイズを足した領域がズームアウト後の画角になるよう、ズームの値を計算する。
判断部301は、予め登録した条件に当てはまる場合、チルトの値をずらしてもよい。例えば、主被写体が人物であり起立し、ワイプ映像の重畳位置が画面上部であれば、判断部301は、顔とワイプ映像がより被りにくくなるよう、見下ろす方向にチルトするよう値を設定する。
判断部301は、ズーム後のメイン映像の主被写体と、ズーム後のサブ映像の主被写体のサイズが同じになるよう、余分領域の割合を変更しても良い。
判断部301は、メイン映像に被写体がいなければ、被写体が見つけられるよう、予め登録した広角となるズームの値を設定する。
メインカメラ101およびサブカメラ102は、判断部301に設定された制御情報(パン、チルト、ズームを指定するコマンド)に基づき、パン、チルト、ズームに係る駆動部の駆動を開始する。
ステップS606にて、判断部301は、メインカメラ101およびサブカメラ102によるパン、チルト、ズームの駆動完了を待つ。
ステップS607にて、判断部301は、サブ映像のクロップする位置とサイズを設定する。サブ映像をクロップする位置は、主被写体の注目領域の位置に設定する。サブ映像をクロップするサイズは、主被写体のサイズに余分領域の割合を乗じて加えた値を設定する。
判断部301は、サブ映像に主被写体が選択されていなければ、サブ映像のクロップする位置とサイズを設定しないことで、ワイプ映像を重畳させない。
判断部301は、メイン映像のクロップする位置とサイズを設定してもよい。クロップする位置は、主被写体の位置に設定する。クロップするサイズは、被写体サイズがステップS605で計算したズーム後の被写体サイズと一致するよう、ズームの値を計算して設定する。
ステップS608にて、判断部301は、主被写体が画面中心から一定以上移動している場合、主被写体を追尾するようメインカメラ101とサブカメラ102の制御情報を設定する。例えば、主被写体の中心位置が映像の左25%もしくは右25%、上25%、下25%のいずれかの領域に位置する場合は、ステップS603もしくはステップS605同様にパン、チルトの値を計算する。さらに例えば、主被写体のサイズが、ステップS603もしくはステップS605、ステップS608で設定した顔の検出サイズの150%を超えるもしくは75%未満の場合は、ステップS603もしくはステップS605同様にズームの値を計算する。
図6のフローでは、サブ映像の処理を先に行っているが、サブ映像の処理をメイン映像の処理の後に行ってもよい。
上記第1の実施形態によれば、各被写体とワイプの位置関係が自然で、違和感が発生しにくい映像を生成できる。また、被写体サイズが適切で視認性が高い、品位の高い映像を生成することもできる。
[第2の実施形態]
メイン映像もしくはサブ映像のいずれか、もしくは両方が、カメラにより撮影したライブ映像ではなく、予め撮影し記録された映像やプレゼンテーション画面、ゲーム画面、静止画、文章などの、追尾不要な情報でもよい。
メイン映像もしくはサブ映像のいずれか、もしくは両方が、カメラにより撮影したライブ映像ではなく、予め撮影し記録された映像やプレゼンテーション画面、ゲーム画面、静止画、文章などの、追尾不要な情報でもよい。
追尾不要な情報は、解析部300で解析を行わず、カラの解析結果を判断部301へ通知する。サブ映像が追尾不要な情報であれば、判断部301は、ステップS603において、サブカメラの制御情報を設定しない。さらに、ステップS604において、ワイプ映像の重畳サイズを予めデフォルトとして登録したサイズもしくはサブ映像のサイズを設定する。さらに、ステップS607において、サブ映像のクロップする位置とサイズをワイプ映像全体として設定する。
メイン映像が追尾不要な情報であれば、判断部301は、ステップS605において、メインカメラの制御情報を設定しない。さらに、ステップS607において、メイン映像のクロップする位置とサイズを出力映像全体として設定する。
このように、第2の実施形態では、メイン映像もしくはサブ映像のいずれかを追尾不要な情報に置き換えて制御することができる。
上記の第1および第2の実施形態では、制御装置100が解析および判断、重畳を行ったが、メインカメラ101もしくはサブカメラ102が行ってもよい。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100…制御装置、101…メインカメラ、102…サブカメラ、300…解析部、301…判断部、302…重畳部
Claims (12)
- 第1の映像及び第2の映像に基づいて、第1の映像における第1の被写体の向き及び前記第2の映像における第2の被写体の向きを特定するための情報を取得する取得手段と、
前記第1の被写体を含む前記第1の映像の少なくとも一部を、前記第2の映像において前記取得手段により取得される情報に基づいて決定される位置に重畳することで、合成映像を生成する生成手段とを有する
ことを特徴とする映像処理装置。 - 前記取得手段は、
前記第1の映像及び前記第2の映像を解析し、第1の映像における第1の被写体及び前記第2の映像における第2の被写体の向きを含む情報を取得する解析手段を含み、
前記生成手段は、
前記第2の被写体の向きを表す情報に基づき、前記第2の映像における、前記第1の被写体の一部の重畳する位置を決定し、前記合成映像を生成する
ことを特徴とする請求項1に記載の映像処理装置。 - リモート制御可能な外部の撮像装置と通信する通信手段を有し、
前記第1、第2の映像の一方は、前記通信手段を介して前記撮像装置から受信した映像であり、他方が既に記録された映像である
ことを特徴とする請求項1又は2に記載の映像処理装置。 - 前記第1、第2の映像を撮像するリモート制御可能な2つの撮像装置と通信する通信手段を更に有する
ことを特徴とする請求項1又は2に記載の映像処理装置。 - 前記取得手段により取得された情報に基づき、前記通信手段を介して、前記撮像装置への画角に係る制御情報を生成し、生成した制御情報を送信するリモート制御手段を更に有することを特徴とする請求項3又は4に記載の映像処理装置。
- 前記リモート制御手段は、被写体の動きに追従するため、或いは、予め設定された構図となるようにするため、パン、チルト、ズームにかかる制御情報を生成する
ことを特徴とする請求項5に記載の映像処理装置。 - 前記生成手段は、第1、第2の被写体の向きが異なる場合、前記第2の映像内の、前記第2の被写体が向いている側の予め設定された位置に、前記第1の被写体を含む前記第1の映像の少なくとも一部を重畳して合成映像を生成する
ことを特徴とする請求項1乃至6のいずれか1項に記載の映像処理装置。 - 前記生成手段は、第1の被写体と第2の被写体の向きが同じである場合、前記第1の被写体を含む前記第1の映像の少なくとも一部の左右を反転して得た像を、前記第2の映像内の前記第2の被写体が向いている側の予め設定された位置に、重畳して合成映像を生成する
ことを特徴とする請求項1乃至6のいずれか1項に記載の映像処理装置。 - 前記第1、第2の被写体は人物であって、
前記生成手段は、前記第2の被写体の目の垂直方向の位置を、前記第1の被写体の目と同じ位置となるように合成映像を生成する
ことを特徴とする請求項1乃至8のいずれか1項に記載の映像処理装置。 - 前記生成手段で生成した合成映像を、ネットワークに送信する手段を更に有することを特徴とする請求項1乃至9のいずれか1項に記載の映像処理装置。
- 第1の映像及び第2の映像に基づいて、第1の映像における第1の被写体の向き及び前記第2の映像における第2の被写体の向きを特定するための情報を取得する取得工程と、
前記第1の被写体を含む前記第1の映像の少なくとも一部を、前記第2の映像において前記取得工程により取得される情報に基づいて決定される位置に重畳することで、合成映像を生成する生成工程と
を有することを特徴とする映像処理装置の制御方法。 - コンピュータが読み込み実行することで、前記コンピュータに、請求項11に記載の方法の各工程を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021168273A JP2023058322A (ja) | 2021-10-13 | 2021-10-13 | 映像処理装置及びその制御方法及びプログラム |
US17/943,286 US12069398B2 (en) | 2021-10-13 | 2022-09-13 | Image processing apparatus, method, and non-transitory computer-readable storage medium for superimposing images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021168273A JP2023058322A (ja) | 2021-10-13 | 2021-10-13 | 映像処理装置及びその制御方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023058322A true JP2023058322A (ja) | 2023-04-25 |
Family
ID=85798392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021168273A Pending JP2023058322A (ja) | 2021-10-13 | 2021-10-13 | 映像処理装置及びその制御方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US12069398B2 (ja) |
JP (1) | JP2023058322A (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8744420B2 (en) * | 2010-04-07 | 2014-06-03 | Apple Inc. | Establishing a video conference during a phone call |
KR102018887B1 (ko) * | 2013-02-21 | 2019-09-05 | 삼성전자주식회사 | 신체 부위 검출을 이용한 이미지 프리뷰 |
WO2014132816A1 (ja) * | 2013-02-27 | 2014-09-04 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
US9538160B1 (en) * | 2013-04-11 | 2017-01-03 | Nextvr Inc. | Immersive stereoscopic video acquisition, encoding and virtual reality playback methods and apparatus |
JP2019057885A (ja) | 2017-09-22 | 2019-04-11 | 株式会社Jvcケンウッド | 画像配置位置決定装置、画像処理装置、および画像処理方法 |
EP3506629A1 (en) * | 2017-12-27 | 2019-07-03 | Nokia Technologies Oy | Multi-camera display |
JP2021010053A (ja) | 2019-06-28 | 2021-01-28 | 株式会社Jvcケンウッド | 撮影方向決定装置、撮影装置、および撮影方向決定方法 |
-
2021
- 2021-10-13 JP JP2021168273A patent/JP2023058322A/ja active Pending
-
2022
- 2022-09-13 US US17/943,286 patent/US12069398B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20230116612A1 (en) | 2023-04-13 |
US12069398B2 (en) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4699040B2 (ja) | 自動追尾制御装置及び自動追尾制御方法、並びにプログラム、自動追尾システム | |
US8780200B2 (en) | Imaging apparatus and image capturing method which combine a first image with a second image having a wider view | |
JP5963422B2 (ja) | 撮像装置、表示装置、コンピュータプログラムおよび立体像表示システム | |
JP4912117B2 (ja) | 追跡機能付き撮像装置 | |
KR20130112574A (ko) | 확대된 영상의 화질을 개선하기 위한 장치 및 방법 | |
JP5200821B2 (ja) | 撮像装置及びそのプログラム | |
JP2016127571A (ja) | カメラシステム、表示制御装置、表示制御方法、及びプログラム | |
JP2021124669A (ja) | 電子機器 | |
JP6700935B2 (ja) | 撮像装置、その制御方法、および制御プログラム | |
JP2003179798A (ja) | デジタルカメラ | |
JP2007124399A (ja) | 画像処理装置、電子カメラおよび画像処理プログラム | |
WO2018196854A1 (zh) | 一种拍照方法、拍照装置及移动终端 | |
JP2017143354A (ja) | 画像処理装置及び画像処理方法 | |
JP2018207415A (ja) | 視線検出機能を備える撮像装置 | |
JP6831473B2 (ja) | 撮影装置とその制御方法および制御プログラム | |
JP6004978B2 (ja) | 被写体画像抽出装置および被写体画像抽出・合成装置 | |
JP2023058322A (ja) | 映像処理装置及びその制御方法及びプログラム | |
KR100579135B1 (ko) | 수렴형 3차원 다시점 영상 획득 방법 | |
CN112019735B (zh) | 一种拍摄方法及装置、存储介质、电子装置 | |
JP2015118274A (ja) | 撮像装置、その制御方法及びプログラム | |
US9602701B2 (en) | Image-pickup apparatus for forming a plurality of optical images of an object, control method thereof, and non-transitory computer-readable medium therefor | |
JP6137009B2 (ja) | 画像処理装置、画像処理方法、プログラム及びカメラ | |
JP6828069B2 (ja) | 撮像装置、撮像方法およびプログラム | |
JP5338248B2 (ja) | 画像処理装置、電子カメラおよび画像処理プログラム | |
JP2008244586A (ja) | 映像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240927 |