WO2022244314A1

WO2022244314A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2022244314A1
Application number: PCT/JP2022/003240
Authority: WO
Inventors: 秀敏永野; 和博嶋内
Original assignee: ソニーグループ株式会社
Priority date: 2021-05-21
Filing date: 2022-01-28
Publication date: 2022-11-24
Also published as: US20240223883A1; JPWO2022244314A1

Abstract

情報処理装置（１０）は、目標構図算出部（１６）と構図遷移決定部（１７）とを有する。目標構図算出部（１６）は、被写体の状態に基づいて目標構図を算出する。構図遷移決定部（１７）は、被写体の状態の変化の状況に基づいて、目標構図への遷移モードをスムーズ構図遷移モードと瞬時構図遷移モードとの間で切り替える。スムーズ構図遷移モードは、目標構図に向けて徐々に構図が遷移する遷移モードである。瞬時構図遷移モードは、目標構図に向けて瞬時に構図が遷移する遷移モードである。

Description

情報処理装置、情報処理方法およびプログラム

　本発明は、情報処理装置、情報処理方法およびプログラムに関する。

　レクチャーキャプチャなどの分野において、被写体（例えば講師）を自動撮影する技術が提案されている。自動撮影では、被写体が追尾され、被写体の位置に合わせてフレーミングが行われる。フレーミングを行う際には、構図の決定と、構図を適切に遷移させることが重要である。例えば、被写体が右を向いている場合や、右側に移動している場合には、被写体の右側にスペースを取った構図が望ましい。

　しかしながら、移動方向や向きなどの状態は常に同じではない。例えば、被写体は常に右側を向いているわけではなく、向きを変える。また、向きを変えるタイミングもその時々で変化し、講義内容や聴講者とのやりとりによっては頻繁に向きが変わる場合もある。

特開２０１９－１９１７３６号公報特開２０１０－０８１２４６号公報特開２０１６－１５８２４１号公報特開２０１７－０６３３４０号公報

　自動撮影結果は動画であるため、それまで望ましい構図であったとしても、被写体の状態（例えば、被写体の移動方向や向きなど）が変わった瞬間に望ましい構図ではなくなってしまう。このため、被写体の状態が変わった後の望ましい構図を目標の構図として現在の構図から構図調整を行う必要があるが、不自然な構図調整となる場合があった。

　被写体の向きを判定する技術には、例えば、特許文献１がある。しかし、特許文献１では、フレーミングを目的としていないことから、ここで得られた被写体の向きをそのまま適用しても、上記のような適切なフレーミングとはならない。例えば、特許文献１では、手の向きを用いて被写体の向きを判定しているが、手を伸ばしている向きが必ずしも被写体が向いている方向と一致しているとは限らない。また、時間方向の被写体の向きの連続性や変化を適切に捉えるような考慮がなされていない。

　フレーミングに関する技術には、例えば、特許文献２、特許文献３および特許文献４がある。いずれも視線の向きなどを判定し、その方向にスペースを取る構図に関して工夫がなされている。しかし、視線の向きの変化などをどう時間方向に捉え、フレーミングに適用するかについては考慮されていない。

　そこで、本開示では、被写体の状態の変化に応じた適切な構図を設定することが可能な情報処理装置、情報処理方法およびプログラムを提案する。

　本開示によれば、被写体の状態に基づいて目標構図を算出する目標構図算出部と、前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える構図遷移決定部と、を有する情報処理装置が提供される。また、本開示によれば、前記情報処理装置の情報処理がコンピュータにより実行される情報処理方法、ならびに、前記情報処理装置の情報処理をコンピュータに実現させるプログラムが提供される。

第１実施形態の撮影システムを示す図である。映像処理装置の機能構成を示すブロック図である。全体の映像処理の流れを示したフローチャートである。姿勢取得部で取得される姿勢情報の一例を示す図である。被写体の向きの判定方法を説明する図である。被写体の向きの判定方法を説明する図である。向き判定フローの一例を示す図である。被写体領域による向き判定の代わりに、手首と体軸との距離による向き判定を行った例を示す図である。被写体の大きさの判定方法を説明する図である。大きさ判定フローの一例を示す図である。動き判定フローの一例を示す図である。目標構図の算出方法を説明する図である。目標構図の算出フローの一例を示す図である。目標構図の算出フローの一例を示す図である。静止状態から歩き出した場合のスムーズな構図の遷移を示す図である。聴講者の質問のやり取りや呼びかけなどで頻繁に被写体が向きを変える例を示す図である。瞬時構図遷移モードで構図を遷移させる例を示す図である。最初に瞬時遷移を行い、その後スムーズな遷移を行う例を示す図である。遷移モードの決定フローの一例を示す図である。第２実施形態の撮影システムを示す図である。第３実施形態の撮影システムを示す図である。映像スイッチャの機能構成の一例を示す図である。撮影映像の選択フローの一例を示す図である。第４実施形態のフレーミングの概要を説明する図である。第４実施形態のフレーミングの概要を説明する図である。映像処理装置の機能構成の一例を示す図である。第５実施形態のフレーミングの概要を説明する図である。映像処理装置の機能構成の一例を示す図である。ＰＴＺカメラの制御フローの一例を示す図である。撮影システムのハードウェア構成例を示す図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　なお、説明は以下の順序で行われる。
［１．第１実施形態］
　［１－１．撮影システムの構成］
　［１－２．映像処理方法］
　　［１－２－１．姿勢取得部］
　　［１－２－２．被写体追尾部］
　　［１－２－３．向き判定部］
　　［１－２－４．大きさ判定部］
　　［１－２－５．動き判定部］
　　［１－２－６．目標構図算出部］
　　［１－２－７．構図遷移決定部］
　　［１－２－８．映像切り出し部］
　［１－３．効果］
［２．第２実施形態］
［３．第３実施形態］
　［３－１．撮影システムの構成］
　［３－２．映像スイッチャの構成］
　［３－３．映像処理方法］
　［３－４．効果］
［４．第４実施形態］
［５．第５実施形態］
　［５－１．映像処理装置の機能構成］
　［５－２．映像処理方法］
　［５－３．効果］
［６．変形例１］
［７．変形例２］
［８．変形例３］
［９．撮影システムのハードウェア構成例］

［１．第１実施形態］
［１－１．撮影システムの構成］
　以下、図面を参照しながら、撮影システムＣＳの構成の一例を説明する。図１は、第１実施形態の撮影システムＣＳ１を示す図である。

　撮影システムＣＳ１は、レクチャーキャプチャ（講義収録）を行うシステムである。撮影システムＣＳ１は、被写体ＳＵである講師を自動追尾し、講義内容を自動収録する。例えば、撮影システムＣＳ１は、映像処理装置１０、カメラ２０、表示装置３０および記録装置４０を有する。

　カメラ２０は、被写体ＳＵが動き回る範囲を撮影可能である。映像処理装置１０は、カメラ２０が撮影した撮影映像ＣＶに対してフレーミングを実施する。フレーミングとは、撮影映像ＣＶから、構図に応じた映像領域を切り出す処理をいう。この処理は、画角を調整する作業と類似するため、以下の説明では、切り出しの対象となる映像領域を画角ＡＶ（図９参照）と記載する。

　構図とは、映像に写る被写体ＳＵの位置および大きさに関する構成を意味する。例えば３分割法では、画面を縦横それぞれ三分割にし、分割ラインＤＬ（図１５参照）どうしが交わる点に被写体ＳＵが配置される。被写体ＳＵが右を向いているときは、左側の分割ラインＤＬ上に被写体ＳＵが配置される（被写体ＳＵの右側にリードルームが設けられる）構図が採用される。被写体ＳＵが左を向いているときは、右側の分割ラインＤＬ上に被写体ＳＵが配置される（被写体ＳＵの左側にリードルームが設けられる）構図が採用される。被写体ＳＵの大きさについては、撮影対象となる被写体ＳＵの範囲に応じて、ロングショット、フルフィギュア、ニーショット、ウエストショット、バストショットおよびクローズアップなどの構図が知られている。

　映像処理装置１０は、被写体ＳＵの状態に基づいて目標となる構図（目標構図）を決定する。例えば、映像処理装置１０は、標準的な構図として、被写体ＳＵの位置または大きさの異なる複数のタイプの構図を記憶している。映像処理装置１０は、被写体ＳＵの状態に応じた特定のタイプの構図を目標構図として選択する。

　例えば、被写体ＳＵが右側を向いて講義をしているときには、映像処理装置１０は、画面の左側の分割ラインＤＬに被写体ＳＵを配置し、被写体ＳＵをバストショットでフレーミングする構図を目標構図として決定する。被写体ＳＵが左側に移動しているときには、映像処理装置１０は、画面の右側の分割ラインＤＬに被写体ＳＵを配置し、被写体ＳＵをフルフィギュアでフレーミングする構図を目標構図として決定する。被写体ＳＵの状態は、例えば、被写体ＳＵの撮影映像ＣＶを画像解析することにより取得される。

　映像処理装置１０は、現在の構図と目標構図ＴＣＰとに基づいて、次の構図を決定する。映像処理装置１０は、決定された構図に基づいて画角ＡＶ（切り出しの対象となる映像領域）の位置および大きさを示す画角情報を生成する。映像処理装置１０は、画角情報に基づいて映像領域の切り出しを行う。映像処理装置１０は、撮影映像ＣＶから切り出した映像領域をフレーミング映像ＯＶとして出力する。

　表示装置３０は、映像処理装置１０が出力するフレーミング映像ＯＶを表示する。記録装置４０は、フレーミング映像ＯＶを記録する。撮影システムＣＳ１に含まれる各機器は、ＨＤＭＩ（登録商標））（Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）やＳＤＩ（Ｓｅｒｉａｌ　Ｄｉｇｉｔａｌ　Ｉｎｔｅｒｆａｃｅ）などを介して直接接続されていても良いし、有線および無線のネットワークを介して接続されていても良い。

［１－２．映像処理方法］
　図２は、映像処理装置１０の機能構成を示すブロック図である。

　映像処理装置１０は、各種情報を処理する情報処理装置である。映像処理装置１０は、姿勢取得部１１、被写体追尾部１２、向き判定部１３、大きさ判定部１４、動き判定部１５、目標構図算出部１６、構図遷移決定部１７および映像切り出し部１８を有する。

　図３は全体の映像処理の流れを示したフローチャートである。

　映像処理装置１０は、処理に必要なカウンタなどの状態の初期設定を行った後（ステップＳＡ１）、姿勢取得部１１にて被写体ＳＵの姿勢や頭部領域ＨＥＡ（図１４参照）の取得を行う（ステップＳＡ２）。次に、映像処理装置１０は、被写体ＳＵの動きを前フレームとのマッチング等により被写体追尾部１２にて取得する（ステップＳＡ３）。こうして取得した情報をもとに、映像処理装置１０は、被写体ＳＵの向き、被写体ＳＵの大きさ、被写体ＳＵの動きを向き判定部１３、大きさ判定部１４および動き判定部１５にて判定する（ステップＳＡ４、ＳＡ５、ＳＡ６）。

　映像処理装置１０は、これらの判定結果をもとに、目標構図算出部１６で入力フレームに適した目標構図ＴＣＰ（図１５参照）を算出する（ステップＳＡ７）。続いて、映像処理装置１０は、構図遷移決定部１７にて現在の構図ＣＰ（図１５参照）から目標構図ＴＣＰへの遷移を決定し、入力フレームに対する構図ＣＰを決定する（ステップＳＡ８）。映像切り出し部１８では、決定された構図ＣＰに基づいてフレーミング映像ＯＶを切り出して出力する（ステップＳＡ９）。

　映像処理装置１０は、全てのフレームに対してフレーミングが行われたか否かを判定する（ステップＳＡ１０）。次のフレームがある場合には（ステップＳＡ１０：ｎｏ）、ステップＳＡ２に戻り、全てのフレームに対してフレーミングが行われるまで上述の処理が繰り返される。次のフレームがない場合には（ステップＳＡ１０：ｙｅｓ）、映像処理装置１０は、処理を終了する。

［１－２－１．姿勢取得部］
　図４は、姿勢取得部１１で取得される姿勢情報の一例を示す図である。

　姿勢取得部１１は、撮影映像ＣＶから、向き判定部１３および大きさ判定部１４で使用する身体部位ＢＰを画像解析処理により取得する。姿勢取得部１１は、身体部位ＢＰの画像を解析することにより、被写体ＳＵの姿勢情報を抽出する。

　例えば、ディープラーニング技術を用いることで、撮影映像ＣＶから図４の左側に示すような骨格データＳＫを抽出したり、顔のパーツや首、肩、肘、手首、腰、膝、足首などの関節ＪＴの位置を取得したりすることができる。関節ＪＴの位置は、姿勢情報の一部として用いることができる。また、ディープラーニング技術を用いて、図４の右側に示すような頭部領域ＨＥＡを推定する画像処理方法も存在する。頭部領域ＨＥＡも姿勢情報の一部として用いることができる。関節ＪＴの位置および頭部領域ＨＥＡは別々の推定処理で求められてもよいし、一つの推定処理で求められてもよい。

［１－２－２．被写体追尾部］
　被写体追尾部１２は、被写体ＳＵのフレーム間での移動を検出する。これには、ピクセル毎のマッチングを行うオプティカルフロー処理のような画像を直接入力とする移動量算出処理や、姿勢取得部１１で得た身体部位ＢＰのフレーム間でのマッチング処理といった一度画像を処理して得られたデータによる移動量算出処理を用いることができる。ロバスト性を上げるために画像と身体部位ＢＰのマッチングを両方用いて移動量算出を行うこともできる。

［１－２－３．向き判定部］
　図５および図６は、被写体ＳＵの向きの判定方法を説明する図である。

　向き判定部１３は、姿勢取得部１１で得た姿勢情報を用いて被写体ＳＵの向きを判定する。向きの判定は、例えば、被写体ＳＵの体軸ＡＸに対する身体部位ＢＰのズレに基づいて行われる。例えば、図５の例では、体軸ＡＸに対する鼻ＮＳの位置のズレ（左方向を正として算出された体軸ＡＸから鼻ＮＳまでの距離ｄ）が閾値を越えた場合に左方向を向いていると判定される。この判定には目ＥＹなどの他の顔パーツの体軸ＡＸに対するズレを使用することも可能である。判定をより安定に求めるために、同時に複数の顔パーツの体軸ＡＸに対する相対位置を用いることもできる。身体全体が横方向を向く場合には画像内の肩幅ＳＷが狭まることから、肩幅ＳＷが閾値以下になるかどうかといった指標により向きの判定のロバスト性を高めることもできる。

　上記の判定と並行して、向き判定部１３は、被写体ＳＵのポーズに基づいて、被写体ＳＵの向きを判定する。例えば、被写体ＳＵが正面を向いていても、被写体ＳＵのポーズによっては、被写体ＳＵを画面の中央からずらした方がバランスのよい映像が得られる場合がある。図６は被写体ＳＵが右手を広げて説明を行う例であるが、この例では、被写体ＳＵは画面の右側にずらした方が望ましい。向き判定部１３は、被写体ＳＵのポーズに基づいて姿勢の偏りを検出し、この姿勢の偏りを被写体ＳＵの向きとして判定する。

　ポーズに基づく判定では、例えば、被写体ＳＵの右手首（図４の左側の４番目の関節）と体軸ＡＸとの距離Ｄ１が閾値を越えたかどうかや（図６の左側）、被写体領域ＳＵＡの中央と体軸ＡＸとの距離Ｄ２が閾値を越えたかどうか（図６の右側）などの情報を用いることができる。被写体領域ＳＵＡは、撮影対象となる被写体ＳＵの主要部位を包含する被写体ＳＵの領域を意味する。例えば、バストショットでは、被写体ＳＵの上半身の関節を含む矩形領域が被写体領域ＳＵＡとなる。向き判定部１３は、体軸ＡＸと顔パーツ、体軸ＡＸとポーズといった複数の算出手段を用いて向きを判定する。

　図７は、向き判定フローの一例を示す図である。

　図７では、鼻ＮＳと体軸ＡＸ、肩幅ＳＷ、および、被写体領域ＳＵＡと体軸ＡＸとの関係から被写体ＳＵの向きが判定される。向き判定部１３は、最初に首の付け根から身体に沿った体軸ＡＸを算出する（ステップＳＢ１）。レクチャーキャプチャで想定される被写体ＳＵの姿勢は立ち姿勢であるため、通常は、体軸ＡＸは首の付け根から鉛直に伸ばした線となる。図７では３種類の向き判定処理が行われており、図の左から、顔による向き判定（ステップＳＢ２～ＳＢ７）、肩幅ＳＷによる向き判定（ステップＳＢ８～ＳＢ１１）、被写体領域ＳＵＡを用いた向き判定（ステップＳＢ１２～ＳＢ１７）となっている。

　顔による向き判定では（ステップＳＢ２～ＳＢ７）、体軸ＡＸに対して鼻ＮＳが画面の左側にあるのか右側にあるのかが算出される。画面の横をｘ軸、縦をｙ軸とすると、体軸はｘ＝ａ＊ｙ＋ｂのような直線の式で表される。この直線に対して鼻ＮＳの座標が（ｘ０，ｙ０）である場合、向き判定部１３は、符号付きの距離ｄ＝（ｘ０－ａ＊ｙ０－ｂ）／√（１＋ａ＊ａ）を算出する（ステップＳＢ２）。距離ｄが正の値である場合には、鼻ＮＳは画面上で体軸ＡＸの右側にあると判定される。距離ｄが負の値である場合には、鼻ＮＳは体軸ＡＸの左側にあると判定される。

　体軸ＡＸを鉛直に引いた場合には、ａ＝０でｘ＝ｂとなり、ｂは首のｘ座標となる。このとき、ｄ＝ｘ０－ｂとなる。鼻ＮＳが体軸ＡＸの右側（ｘ０＞ｂ）にあれば、ｄ＞０となる。鼻ＮＳが体軸ＡＸの左側（ｘ０＜ｂ）にあれば、ｄ＜０となる。向き判定部１３は、距離ｄの絶対値が閾値よりも大きいか否かを判定する（ステップＳＢ３）。向き判定部１３は、距離ｄの絶対値が閾値以下である場合には（ステップＳＢ３：ｎｏ）、被写体ＳＵの向きは正面であると判定する（ステップＳＢ７）。向き判定部１３は、距離ｄの絶対値が閾値よりも大きい場合には（ステップＳＢ３：ｙｅｓ）、距離ｄの符号に基づいて右向きか左向きかを判定する（ステップＳＢ４～ＳＢ６）。

　肩幅ＳＷによる向き判定では（ステップＳＢ８～ＳＢ１１）、向き判定部１３は、両肩の間の距離を肩幅ＳＷとして算出する（ステップＳＢ８）。向き判定部１３は、肩幅ＳＷの絶対値が閾値よりも大きいか否かを判定する（ステップＳＢ９）。向き判定部１３は、肩幅ＳＷの絶対値が閾値よりも大きい場合には（ステップＳＢ９：ｙｅｓ）、被写体ＳＵの向きは正面であると判定する（ステップＳＢ１０）。向き判定部１３は、肩幅ＳＷの絶対値が閾値以下であれば（ステップＳＢ９：ｎｏ）、被写体ＳＵの向きは正面ではないと判定する（ステップＳＢ１１）。

　被写体領域ＳＵＡを用いた向き判定では（ステップＳＢ１２～ＳＢ１７）、例えば、向き判定部１３は、姿勢取得部１１で得た上半身パーツを含む領域を被写体領域ＳＵＡとして算出する。向き判定部１３は、被写体領域ＳＵＡの中央と体軸ＡＸとの距離Ｄ１を距離ｄの算出方法と同様の方法で算出する（ステップＳＢ１２）。向き判定部１３は、距離Ｄ１の絶対値が閾値よりも大きいか否かを判定する（ステップＳＢ１３）。向き判定部１３は、距離Ｄ１の絶対値が閾値以下である場合には（ステップＳＢ１３：ｎｏ）、被写体ＳＵの向きが正面であると判定する（ステップＳＢ１７）。向き判定部１３は、距離Ｄ１の絶対値が閾値よりも大きい場合には（ステップＳＢ１３：ｙｅｓ）、距離Ｄ１の符号に基づいて右向きか左向きかを判定する（ステップＳＢ１４～ＳＢ１６）。

　このようにして、向き判定部１３は、複数（３種）の向き判定結果が揃ったところで総合的に左／右／正面の判定を行う（ステップＳＢ１８）。向き判定部１３は、首の位置が取得できないケースなどを考え、３種のうち２種の向き判定結果が同方向を示す場合にその向きを採用するなどして、向きのロバスト性を高める。なお、ステップＳＢ１１において被写体ＳＵの向きが正面ではないと判定された場合には、被写体ＳＵの向きは右でも左でもよいものとして扱われる。

　図８は、被写体領域ＳＵＡによる向き判定の代わりに、手首と体軸ＡＸとの距離Ｄ２による向き判定を行った例を示す図である。顔による向き判定（ステップＳＣ２～ＳＣ７）および肩幅ＳＷによる向き判定（ステップＳＣ８～ＳＣ１１）は、図７と同様である。

　向き判定部１３は、右手首と体軸ＡＸとの距離Ｄ２を距離ｄの算出方法と同様の方法で算出する（ステップＳＣ１２）。向き判定部１３は、距離Ｄ２の絶対値が閾値よりも大きいか否かを判定する（ステップＳＣ１３）。向き判定部１３は、距離Ｄ２の絶対値が閾値以下である場合には（ステップＳＣ１３：ｎｏ）、被写体ＳＵの向きが正面であると判定する（ステップＳＣ１７）。向き判定部１３は、距離Ｄ２の絶対値が閾値よりも大きい場合には（ステップＳＣ１３：ｙｅｓ）、距離Ｄ２の符号に基づいて右向きか左向きかを判定する（ステップＳＣ１４～ＳＣ１６）。

　向き判定部１３は、左手首についても右手首と同様の向き判定フローを実施する。すなわち、向き判定部１３は、左手首と体軸ＡＸとの距離Ｄ２を距離ｄの算出方法と同様の方法で算出する（スップＳＣ１８）。向き判定部１３は、距離Ｄ２の絶対値が閾値よりも大きいか否かを判定する（ステップＳＣ１９）。向き判定部１３は、距離Ｄ２の絶対値が閾値以下である場合には（ステップＳＣ１９：ｎｏ）、被写体ＳＵの向きが正面であると判定する（ステップＳＣ２３）。向き判定部１３は、距離Ｄ２の絶対値が閾値よりも大きい場合には（ステップＳＣ１９：ｙｅｓ）、距離Ｄ２の符号に基づいて右向きか左向きかを判定する（ステップＳＣ２０～ＳＣ２２）。

　図８の例では、向き判定部１３は、４種の向き判定結果を用いて総合的な向きを判定する（ステップＳＣ２４）。この際、右手首と左手首を用いた判定結果を先に統合し、統合された判定結果を、他の２種の判定結果とさらに統合することが望ましい。向き判定部１３は、統合された１種の判定結果と、残りの２種の判定結果（顔による向き判定結果、肩幅ＳＷによる向き判定結果）と、を合わせた３種の向き判定結果に基づいて、被写体ＳＵの向きを判定する。

　例えば、両手を開いた場合には右手首と左手首で判定結果が左向きと右向きに分かれて判定されるが、身体としては正面を向いていると考えられる。そのため、向き判定部１３は、統合された判定結果として、被写体ＳＵの向きが正面であるとの判定結果をだし、他の２種の判定結果と合わせて、左／右／正面の判定を行う。向き判定部１３は、３種のうち２種の向き判定結果が同方向を示す場合にその向きを採用する。これにより、向きのロバスト性が高まる。

　なお、図７および図８のフローで用いられる閾値に関しては、計測の対象となる身体の部位に応じて適切な値が設定される。閾値は、被写体ＳＵの特定部位のサイズを基準とした比率によって表されることが好ましい。例えば、閾値を頭部領域ＨＥＡの高さの０．２倍などに設定すると、ズーム変化による人の大きさの変化にも対応できる。

［１－２－４．大きさ判定部］
　図９は、被写体ＳＵの大きさの判定方法を説明する図である。

　大きさ判定部１４は、被写体ＳＵのポーズが大きいか小さいかを判定する。図９の左側には、両手ＨＡを広げて喜びを表現する被写体ＳＵが示されている。図９の右側には、小さくガッツポーズをした被写体ＳＵが示されている。大きさ判定部１４は、これらの被写体ＳＵに対して、例えば、被写体ＳＵの上半身もしくは全身を囲む領域を被写体領域ＳＵＡとして抽出し、被写体領域ＳＵＡの大きさを被写体ＳＵの大きさとして判定する。大きさの判定結果は構図ＣＰに反映される。

　図１０は、大きさ判定フローの一例を示す図である。

　被写体ＳＵの大きさについては、ユーザからあらかじめおおよその大きさを指定される場合も多い。ここでは、ユーザからバストショットの切り出しを指定されていることを想定して説明を行う。

　例えば、大きさ判定部１４は、姿勢取得部１１で得た身体部位ＢＰの位置や頭部領域ＨＥＡを用いて、被写体ＳＵの上半身を囲む矩形の領域を被写体領域ＳＵＡとして算出する（ステップＳＤ１）。大きさ判定部１４は、被写体領域ＳＵＡが前フレームからどのくらい大きくなったかを、前フレームからの差分として算出する（ステップＳＤ２）。差分としては、被写体ＳＵの縦方向と横方向の差分が得られるが、大きさ判定部１４は、例えば絶対値が大きい方の差分を選択する。

　大きさ判定部１４は、算出された差分の絶対値が閾値よりも大きいか否かを判定する（ステップＳＤ３）。差分の絶対値が閾値以下の場合には（ステップＳＤ３：ｎｏ）、大きさ判定部１４は、大きさの変化はないと判定する（ステップＳＤ７）。差分の絶対値が閾値よりも大きい場合には（ステップＳＤ３：ｙｅｓ）、大きさ判定部１４は、差分の符号に基づいて、大きさが縮小したか拡大したかを判定する（ステップＳＤ４～ＳＤ６）。

　大きさが変化する場合、大きさ判定部１４は、基本的には被写体領域ＳＵＡを含むように画角ＡＶ（切り出しの対象となる撮影映像ＣＶ中の映像領域）の縮小率および拡大率を決めるが、あらかじめ縮小率および拡大率を決めておくこともできる。ユーザの要望次第なところもあるが、あらかじめ拡大率および縮小率を決めておくと、画角ＡＶの大きさの切り替わりがはっきりし、見やすい映像となる。

［１－２－５．動き判定部］
　動き判定部１５は、被写体追尾部１２で得た被写体追尾結果から前フレームに対して現フレームで被写体ＳＵが移動した向きと移動量を算出する。動き判定部１５は、移動方およびと移動量の算出結果に基づいて、被写体ＳＵが動いたかどうかを判定する。

　図１１は、動き判定フローの一例を示す図である。

　動き判定部１５は、追尾結果に基づいて、現フレームの被写体位置と前フレームの被写体位置とを取得する。被写体位置は、例えば、カメラ座標系における被写体ＳＵの座標として取得される。動き判定部１５は、現フレームの被写体位置から前フレームの被写体位置を減じることにより、被写体ＳＵの移動量を算出する（ステップＳＥ１）。例えば、移動量は、右方向を正とした符号付きの移動量として算出される。画面右側に移動している場合には正の移動量、左側に移動している場合には負の移動量となる。

　動き判定部１５は、移動量の絶対値が閾値よりも大きいか否かを判定する（ステップＳＥ２）。動き判定部１５は、移動量の絶対値が閾値以下である場合には（ステップＳＥ２：ｎｏ）、被写体ＳＵは動いていないと判定する（ステップＳＥ６）。動き判定部１５は、移動量の絶対値が閾値よりも大きい場合には（ステップＳＥ２：ｙｅｓ）、移動量の符号に基づいて、移動方向が右方向か左方向かを判定する（ステップＳＥ３～ＳＥ５）。

［１－２－６．目標構図算出部］
　図１２は、目標構図の算出方法を説明する図である。

　向き判定部１３、大きさ判定部１４および動き判定部１５の判定結果により、被写体ＳＵの状態が特定される。被写体ＳＵの状態は、例えば、被写体ＳＵの移動方向、被写体ＳＵの向き、および、被写体ＳＵの大きさ、のうちの少なくとも１つに関する状態を含む。例えば、図１２の左側の例では、被写体ＳＵが左を向いて左方向に移動している状態が検出される。

　目標構図算出部１６は、被写体ＳＵの状態に基づいて、目標となるフレーミング映像ＯＶの構図（目標構図ＴＣＰ）を算出する。例えば、目標構図算出部１６は、大きさの判定結果に基づいて目標構図ＴＣＰの大きさ（画角ＡＶの大きさ）を決める。目標構図算出部１６は、向きおよび動きの判定結果に基づいて、被写体ＳＵの左右の空間的な余裕を決める。これにより、左右の余裕を含めた目標構図ＴＣＰが決定される。

　図１２の右側の例のように、被写体ＳＵが振り返りつつ歩くような場合には、移動方向の判定結果と被写体ＳＵの向きの判定結果とは異なる場合があるが、その場合には移動方向の判定結果が優先される。多くの場合は、前フレームの構図ＣＰが継続される。

　図１３および図１４は、目標構図の算出フローの一例を示す図である。

　図１３のフローチャートでは、図３の初期設定（ステップＳＡ１）においてクリアされた向き判定用カウンタ、動き判定用カウンタおよび大きさ判定用カウンタを用いて、時間方向の安定性が図られる。

　目標構図算出部１６は、向き判定部１３で左向きと判定された場合には、カウンタをあらかじめ設定された設定数だけ減少し、右向きと判定された場合には同じ設定数だけカウンタを増加させる。向き判定部１３で正面と判定された場合には、目標構図算出部１６は、カウンタを変更しない。このカウンタの絶対値が閾値を越えた場合には、目標構図算出部１６は、カウンタの符号に基づいて、左向きまたは右向きと判定する。

　目標構図算出部１６は、動き判定部１５で左方向・右方向・動きなしの判定が得られた場合に、それぞれ動きカウンタに対して減少・増加・不変の処理を行う。カウンタの絶対値が閾値を越えた場合には、目標構図算出部１６は、動きがあったと判定し、カウンタの符号に基づいて、左方向または右方向と判定する。

　向き判定および動き判定の判定結果は、被写体ＳＵを画面中央からずらして判定結果の方向に余裕を作るための指標として用いられる。目標構図算出部１６は、動き判定で左方向もしくは右方向と判定された場合には、この移動方向を優先して被写体ＳＵのずらし量を決める。動き判定で動きなしと判定された場合には、目標構図算出部１６は、向き判定の判定結果を優先する。向き判定において正面と判定された場合には、目標構図算出部１６は、被写体ＳＵを画面の中央に配置し、向き判定において左向きまたは右向きと判定された場合には、目標構図算出部１６は、被写体ＳＵのずらし量をその方向に余裕があるように決定する。

　目標構図算出部１６は、大きさ判定部１４で被写体領域ＳＵＡが拡大されたと判定された場合には、大きさカウンタを増加させる。目標構図算出部１６は、大きさ判定部１４で被写体領域ＳＵＡが縮小されたと判定された場合には、大きさカウンタを減少させる。大きさカウンタについても、目標構図算出部１６は、絶対値が閾値以下の場合には画角ＡＶのサイズの変更を行わず、絶対値を越える場合には、大きさカウンタの符号に基づいて、画角ＡＶの拡大および縮小を決定する。

　目標構図算出部１６の出力は、例えば、画角ＡＶのサイズと画角ＡＶ内での被写体ＳＵの頭頂を始点とする体軸ＡＶの相対位置である。例えば、始点は図１４の頭部領域ＨＥＡの上辺と体軸ＡＸの交点として求められる。

［１－２－７．構図遷移決定部］
　図１５ないし図１８は、構図ＣＰの遷移方法を説明する図である。現在の構図ＣＣＰ、目標構図ＴＣＰおよび次の構図ＮＣＰは、切り出しの対象となる映像領域（画角ＡＶ）として示されている。現在の構図ＣＣＰは、現フレームのフレーミング映像ＯＶとして切り出されている映像領域の構図ＣＰを意味する。次の構図ＮＣＰは、次フレームのフレーミング映像ＯＶとして切り出されるべき映像領域の構図ＣＰを意味する。

　構図遷移決定部１７は、現在の構図ＣＰから目標構図ＴＣＰへの遷移モードを決定する。構図遷移決定部１７は、決定された遷移モードに基づいて次の構図ＮＣＰを決定する。

　遷移モードには、スムーズ構図遷移モードと瞬時構図遷移モードとがある。スムーズ構図遷移モードは、現在の構図ＣＣＰから目標構図ＴＣＰに向けて徐々に構図ＣＰが遷移する遷移モードである。瞬時構図遷移モードは、現在の構図ＣＣＰから目標構図ＴＣＰに向けて瞬時に構図ＣＰが遷移する遷移モードである。瞬時構図遷移モードでは、スムーズ構図遷移モードよりも短い期間で素早く構図ＣＰが遷移する。瞬時とは、例えば、予め設定された数フレーム以内の期間を意味する。この遷移の期間は、例えば５フレーム以下であり、好ましくは１フレームである。

　構図遷移決定部１７は、被写体ＳＵの状態の変化の状況に基づいて、目標構図ＴＣＰへの遷移モードをスムーズ構図遷移モードと瞬時構図遷移モードとの間で切り替える。被写体ＳＵの状態の変化の状況は、例えば、被写体ＳＵの移動方向が切り替わる速さ、被写体ＳＵの向きが切り替わる速さ、および、被写体ＳＵの大きさの変化、のうちの少なくとも１つに関する状況を含む。

　遷移モードをスムーズ構図遷移モードから瞬時構図遷移モードへ切り替えるべき状況とは、例えば、目標構図ＴＣＰに向けてスムーズに構図を遷移させている最中に目標構図ＴＣＰのタイプが変化するような状況を意味する。

　例えば、目標構図ＴＣＰへの遷移が完了する前に、被写体ＳＵの向きが左から右、または、右から左へと変化した場合には、リードルームを設けるべき位置が左から右、または、右から左へと変化する。そのため、リードルームの設置方向が異なる、別のタイプの目標構図ＴＣＰが決定される。被写体ＳＵのポーズが変化することにより、バストショットからフルショットで撮影することが適切となった場合なども、目標構図ＴＣＰのタイプが変化する。このような場合には、遷移モードがスムーズ構図遷移モードから瞬時構図遷移モードへ切り替えられる。

　遷移モードをスムーズ構図遷移モードから瞬時構図遷移モードへ切り替えるべき状況が生じたとは、上述のような構図のタイプの変化が発生するような所定の基準時間以内の被写体ＳＵの向きもしくは移動方向の変化があった場合、または、所定の基準倍率以上の被写体ＳＵの大きさの変化があった場合を意味する。なお、基準時間および基準倍率は、ユーザに応じて適宜設定可能である。

　図１５は、静止状態から歩き出した場合のスムーズな構図ＣＰの遷移を示す図である。図１５の例では、３分割法に基づいて目標構図ＴＣＰが決定される。図１５の一点鎖線は、画面を３分割する分割ラインＤＬの位置を示す。

　当初の静止状態では画角ＡＶの中央に被写体ＳＵが配置される。動き判定部１５によって被写体ＳＵが動いたと判定されると、目標構図算出部１６は、進行方向に余白ができるように目標構図ＴＣＰの画角ＡＶ（目標画角）の位置および大きさを算出する。構図遷移決定部１７は、スムーズに画角ＡＶを遷移させるために、現在の構図ＣＣＰの画角ＡＶと目標画角との間で補間を行った結果を次の構図ＮＣＰの画角ＡＶとして算出する。

　構図遷移決定部１７は、次の構図ＮＣＰの画角ＡＶの位置および大きさに関する情報を画角情報として生成し、映像切り出し部１８に供給する。構図遷移決定部１７は、次の構図ＮＣＰの画角ＡＶを補間処理によって求めることで、画角ＡＶの位置および大きさを徐々に目標画角に近づける。スムーズな画角ＡＶの遷移は自然であり、移動方向や被写体ＳＵの向きが頻繁に変化しない場合には有効な遷移方法である。

　図１６は、聴講者の質問のやり取りや呼びかけなどで頻繁に被写体ＳＵが向きを変える例を示す図である。

　図１６の例では、目標画角に向けて徐々に画角ＡＶを遷移させようとしても、遷移が完了する前に被写体ＳＵの向きが変化する。そのため、目標画角に近づかない。この状況が連続すると、視聴者はふらふらした画角ＡＶの変化を見ることになり、望ましくない。そのため、構図遷移決定部１７は、目標構図ＴＣＰに向けて瞬時に構図ＣＰを遷移させる。

　図１７は、瞬時構図遷移モードで構図ＣＰを遷移させる例を示す図である。

　構図遷移決定部１７は、スムーズ構図遷移モードで構図ＣＰが遷移している最中に、目標画角の位置および大きさの異なる新たな目標構図ＴＣＰが決定された場合には、遷移モードを瞬時構図遷移モードに切り替える。例えば、スムーズ構図遷移モードで遷移が開始してすぐに、もしくは、目標構図ＴＣＰから離れた状況で、被写体ＳＵの向きなどが変化し、目標画角の位置および大きさが変更された場合には、構図遷移決定部１７は、次の構図ＮＣＰの画角ＡＶの位置および大きさを目標画角の位置および大きさに向けて瞬時に遷移させる。

　構図遷移決定部１７は、遷移モードをスムーズ構図遷移モードから瞬時構図遷移モードに切り替えた直後の画角ＡＶの大きさの変化率（拡大率または縮小率）を、遷移モードを切り替える直前の画角ＡＶの大きさの変化率と異ならせる。これは、画角ＡＶの位置とともに画角ＡＶの大きさも調整することで、瞬時の構図ＣＰの変化が映像の乱れとして認識されにくくなるためである。例えば、画角ＡＶの変化率を変えずに画角ＡＶの位置のみを変化させると、カメラ２０が何かにぶつかって映像が乱れたかのような印象を与える場合がある。画角ＡＶの大きさを変化させると、そのような違和感が生じにくい。

　したがって、構図遷移決定部１７は、目標画角の大きさから算出される瞬時遷移時の画角ＡＶの大きさの変化率が瞬時遷移の直前の画角ＡＶの大きさの変化率と異なる場合には、目標画角の大きさをそのまま次の構図ＮＣＰの画角ＡＶの大きさとして設定する。構図遷移決定部１７は、目標画角から算出される瞬時遷移時の画角ＡＶの大きさの変化率が瞬時遷移の直前の画角ＡＶの大きさの変化率と同じである場合には、目標画角よりも大きい画角を次の構図ＮＣＰの画角ＡＶの大きさとして設定する。

　瞬時遷移とは異なるが、複数のカメラを切り替えながら映像を配信する場合、カメラの切り替え時間は早くても５秒から７秒程度であることが知られている。早過ぎるカメラの切り替えは、視聴者に違和感を与えてしまい、望ましい映像とはならないためである。瞬時の構図ＣＰの遷移はカメラの切り替えとは異なるが、切り替えの時間間隔が短すぎるとカメラの切り替えと同様に望ましい映像とはならない。したがって、構図遷移決定部１７は、瞬時構図遷移モードが選択されてから所定の期間は瞬時構図遷移モードの選択を禁止する。構図遷移決定部１７は、前回の瞬時遷移から一定時間が経過しない場合には、瞬時遷移とせずにスムーズな遷移を選択する。

　図１８は、最初に瞬時遷移を行い、その後スムーズな遷移を行う例を示す図である。図１９は、遷移モードの決定フローの一例を示す図である。

　図１９のフローチャートでは、図３の初期設定（ステップＳＡ１）においてクリアされた瞬時カウンタおよびスムーズカウンタを用いて構図ＣＰの遷移を行う。瞬時カウンタは、瞬時構図遷移モードによる遷移が行われてからのフレーム数を示す。スムーズカウンタは、スムーズ構図遷移モードによる遷移が行われてからのフレーム数を示す。

　構図遷移決定部１７は、瞬時カウンタおよびスムーズカウンタをそれぞれ１フレームごとに１ずつ加算する（ステップＳＧ１～ＳＧ２）。瞬時構図遷移モードでは、構図遷移決定部１７は、瞬時カウンタのみクリアする（ステップＳＧ８）。スムーズ構図遷移モードでは、構図遷移決定部１７は、スムーズカウンタのみクリアする（ステップＳＧ１０）。

　目標構図算出部１６で算出された構図ＣＰが前フレームの構図ＣＰに対して変化しない場合、もしくは、変化した場合でも被写体ＳＵの向きの変更によらない変化の場合には、構図遷移決定部１７は、スムーズ構図遷移モードを選択する（ステップＳＧ９）。被写体ＳＵの向きの変更によって構図ＣＰの変化が起きた場合でも、スムーズカウンタが閾値以上もしくは瞬時カウンタが閾値以下の場合には、構図遷移決定部１７は、瞬時構図遷移モードではなく、スムーズ構図遷移モードを選択する（ステップＳＧ９）。

　被写体ＳＵの向きの変更による構図ＣＰの変化であって、スムーズカウンタが閾値未満、かつ、瞬時カウンタが閾値を越える場合には、構図遷移決定部１７は、瞬時構図遷移モードを選択する（ステップＳＧ７）。構図遷移決定部１７は、目標画角から算出される次フレームの画角ＡＶの変化率（瞬時遷移時の画角ＡＶの変化率）が現フレームの画角ＡＶの変化率（瞬時遷移直前の画角ＡＶの変化率）と同じである場合には、画角ＡＶの拡大率を高めて瞬時の構図ＣＰの遷移を行う。

［１－２－８．映像切り出し部］
　映像切り出し部１８は、構図遷移決定部１７から取得した画角情報に基づいて、撮影映像ＣＶから次の構図ＮＣＰの画角ＡＶに対応した映像領域を切り出す。映像切り出し部１８は、切り出された映像領域の映像をフレーミング映像ＯＶとして出力する。

［１－３．効果］
　映像処理装置１０は、目標構図算出部１６と構図遷移決定部１７とを有する。目標構図算出部１６は、被写体ＳＵの状態に基づいて目標構図ＴＣＰを算出する。構図遷移決定部１７は、被写体ＳＵの状態の変化の状況に基づいて、目標構図ＴＣＰへの遷移モードをスムーズ構図遷移モードと瞬時構図遷移モードとの間で切り替える。スムーズ構図遷移モードは、目標構図ＴＣＰに向けて徐々に構図ＣＰが遷移する遷移モードである。瞬時構図遷移モードは、目標構図ＴＣＰに向けて瞬時に構図ＣＰが遷移する遷移モードである。本実施形態の情報処理方法は、映像処理装置１０の処理がコンピュータにより実行される。本実施形態のプログラムは、映像処理装置１０の処理をコンピュータに実現させる。

　この構成によれば、被写体ＳＵの状態の変化に応じた適切な構図ＣＰが得られる。

　被写体ＳＵの状態は、被写体ＳＵの移動方向、被写体ＳＵの向き、および、被写体ＳＵの大きさ、のうちの少なくとも１つに関する状態を含む。被写体ＳＵの状態の変化の状況は、移動方向が切り替わる速さ、被写体ＳＵの向きが切り替わる速さ、および、被写体ＳＵの大きさの変化、のうちの少なくとも１つに関する状況を含む。

　この構成によれば、被写体ＳＵの移動方向、向きおよび大きさの変化の状況に応じた適切な構図ＣＰが得られる。

　構図遷移決定部１７は、遷移モードをスムーズ構図遷移モードから瞬時構図遷移モードに切り替えた直後の画角ＡＶの大きさの変化率を、遷移モードを切り替える直前の画角ＡＶの大きさの変化率と異ならせる。

　この構成によれば、瞬時の構図ＣＰの変化が映像の乱れとして認識されにくくなる。

　構図遷移決定部１７は、スムーズ構図遷移モードで構図ＣＰが遷移している最中に新たな目標構図ＴＣＰが決定された場合には遷移モードを瞬時構図遷移モードに切り替える。

　この構成によれば、構図ＣＰが頻繁に変更されることによる映像のふらつきが低減される。

　構図遷移決定部１７は、瞬時構図遷移モードが選択されてから所定の期間は瞬時構図遷移モードの選択を禁止する。

　この構成によれば、瞬時の構図ＣＰの遷移が頻繁に生じることによる違和感が低減される。

　被写体ＳＵの状態は被写体ＳＵの撮影映像ＣＶを画像解析することにより取得される。

　この構成によれば、カメラ以外のセンサを用いることなく、簡便に被写体ＳＵの状態が取得される。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

［２．第２実施形態］
　図２０は、第２実施形態の撮影システムＣＳ２を示す図である。

　本実施形態において第１実施形態と異なる点は、被写体ＳＵの状態が、被写体ＳＵに取り付けられた位置センサＳＥのセンサ位置情報ＰＯＩに基づいて取得される点である。以下、第１実施形態との相違点を中心に説明を行う。

　センサ位置情報ＰＯＩは、位置センサＳＥが取り付けられた被写体ＳＵの身体部位ＢＰの位置の情報を含む。映像処理装置５０は、センサ信号受信機ＲＣを介してセンサ位置情報ＰＯＩを取得する。映像処理装置５０は、カメラ２０とのキャリブレーションを行って、身体部位ＢＰの位置をカメラ座標系における位置に変換する。

　本実施形態では、センサ位置情報ＰＯＩを用いた演算処理によって、姿勢取得部１１もしくは被写体追尾部１２（あるいはその両方）の処理が代替される。そのため、複雑な画像解析を行わなくても精度よく被写体ＳＵの状態が検出される。

［３．第３実施形態］
［３－１．撮影システムの構成］
　図２１は、第３実施形態の撮影システムＣＳ３を示す図である。

　本実施形態において第１実施形態と異なる点は、複数のカメラ２０を用いて講義内容が収録される点である。以下、第１実施形態との相違点を中心に説明を行う。

　撮影現場には、複数のカメラ２０が設置されている。複数のカメラ２０は、被写体ＳＵを異なる視点から撮影する。映像処理装置６０は、カメラ２０ごとに設置される。映像処理装置６０の構成は、第１実施形態の映像処理装置１０と同様である。図２１では、個々のカメラ２０が、符号の後に付された番号によって区別されている。各カメラ２０に対応する機器および情報には、符号の後にカメラ２０と同じ番号が付される。この番号は、例えば、各撮影映像ＣＶに付与される映像番号と一致する。

　映像処理装置６０は、撮影映像ＣＶを画像解析して画角情報ＣＰＩおよび被写体情報ＳＵＩを生成する。画角情報ＣＰＩは、次フレームの構図ＮＣＰに対応した画角ＡＶ（撮影映像ＣＶから切り出される映像領域）の位置および大きさを示す。被写体情報ＳＵＩは、被写体ＳＵの状態（被写体ＳＵの移動方向、被写体ＳＵの向き、被写体ＳＵの大きさ）を示す。被写体情報ＳＵＩは、向き判定部１３、大きさ判定部１４および動き判定部１５の判定結果に基づいて目標構図算出部１６により生成される。

　撮影システムＣＳ３は、映像スイッチャ７０を有する。映像処理装置６０は、画角情報ＣＰＩおよび被写体情報ＳＵＩを映像スイッチャ７０に出力する。映像スイッチャ７０は、各映像処理装置６０から取得した被写体情報ＳＵＩに基づいて、フレーミングの対象となる撮影映像ＣＶを切り替える。映像スイッチャ７０は、選択された撮影映像ＣＶから切り出されたフレーミング映像ＯＶを出力する。

　フレーミング映像ＯＶは、画角情報ＣＰＩに基づいて撮影映像ＣＶから切り出される。フレーミング映像ＯＶの切り出しは、映像処理装置６０によって行われてもよいし、映像スイッチャ７０によって行われてもよい。映像スイッチャ７０がフレーミング映像ＯＶの切り出しを行う場合には、映像処理装置６０の映像切り出し部１８は使用されない。

［３－２．映像スイッチャの構成］
　図２２は、映像スイッチャ７０の機能構成の一例を示す図である。

　映像スイッチャ７０は、選択映像判定部７１および映像切り替え部７２を有する。選択映像判定部７１は、各映像処理装置６０から被写体情報ＳＵＩおよび画角情報ＣＰＩを取得する。選択映像判定部７１は、取得した複数の被写体情報ＳＵＩに基づいて、複数の被写体ＳＵの撮影映像ＣＶから被写体ＳＵの状態に応じた１つの撮影映像ＣＶを選択する。

　映像切り替え部７２は、選択映像判定部７１から、選択された撮影映像ＣＶに対応する画角情報ＣＰＩを取得する。映像切り替え部７２は、選択された撮影映像ＣＶから、画角情報ＣＰＩに応じた映像領域を切り出す。映像切り替え部７２は、選択された撮影映像ＣＶから切り出された映像領域をフレーミング映像ＯＶとして出力する。

　選択映像判定部７１では、例えば、被写体情報ＳＵＩから得られる被写体ＳＵの向きを利用して、より正面（あるいは予め設定された方向）に近い撮影映像ＣＶが選択される。あるいは、被写体情報ＳＵＩから得られる被写体ＳＵの移動方向を利用して、被写体ＳＵが近づいてくる方向に近いカメラ２０の撮影映像ＣＶが選択される。

［３－３．映像処理方法］
　図２３は、撮影映像ＣＶの選択フローの一例を示す図である。

　ユーザは、被写体ＳＵの好適な向きを設定する（ステップＳＨ１）。デフォルトでは、例えば、正面が好適な向きとして設定されている。選択映像判定部７１は、複数の映像処理装置６０から、撮影映像ＣＶに同期した被写体情報ＳＵＩおよび画角情報ＣＰＩを取得する。選択映像判定部７１は、撮影映像ＣＶごとに、被写体情報ＳＵＩから被写体ＳＵの向きを検出する。選択映像判定部７１は、撮影映像ＣＶごとに、被写体ＳＵの向きと好適な向きとの類似度を求める（ステップＳＨ２～ＳＨ３）。

　向きの類似度は、例えば、鼻ＮＳと体軸ＡＸとの距離ｄなどを用いて算出することができる。顔が真横を向く場合と斜め方向を向く場合などで距離ｄが異なるため、左向き・右向き・正面よりも細かく向きを設定することができる。

　選択映像判定部７１は、最も類似度の高い被写体ＳＵの向きを示す撮影映像ＣＶを検出する。選択映像判定部７１は、検出された撮影映像ＣＶの映像番号と、この撮影映像ＣＶに対応する画角情報ＣＰＩと、を映像切り替え部７２に出力する（ステップＳＨ４）。映像切り替え部７２は、取得した映像番号が示す撮影映像ＣＶを画角情報ＣＰＩに基づいて適切な画角ＡＶで切り出す。映像切り替え部７２は、切り出された映像領域をフレーミング映像ＯＶとして出力する。

　撮影映像ＣＶ（カメラ２０）の切り替えは瞬時に行われる。第１実施形態では、瞬時構図遷移モードが選択されてから所定の期間は瞬時構図遷移モードの選択が禁止された。これは、瞬時の構図ＣＰの遷移が頻繁に生じることによる違和感を低減するためである。これと同様の理由により、選択映像判定部７１は、１つの撮影映像ＣＶが選択されてから所定の期間は他の撮影映像ＣＶの選択を禁止することが望ましい。例えば、選択映像判定部７１は、前回の切り替えから数秒をおいてから次の切り替えを行う。図２３のフローに切り替え間隔を測るためのカウンタを設けることで、こうした制御が可能になる。

　この際、瞬時構図遷移で行われたように、撮影映像ＣＶの切り替え時に画角ＡＶの大きさも変更するように制御することも可能である。例えば、選択映像判定部７１は、他の撮影映像ＣＶが選択された直後の画角ＡＶの大きさの変化率を、他の撮影映像ＣＶが選択される直前の画角ＡＶの大きさの変化率と異ならせる。これにより、瞬時の構図ＣＰの変化が映像の乱れとして認識されにくくなる。

［３－４．効果］
　本実施形態では、選択映像判定部７１は、異なる視点から撮影された複数の被写体ＳＵの撮影映像ＣＶから、被写体ＳＵの状態に応じた１つの撮影映像ＣＶを選択する。映像切り替え部７２は、選択された撮影映像ＣＶから切り出された映像領域をフレーミング映像ＯＶとして出力する。

　この構成によれば、被写体ＳＵの状態に基づいて視点（カメラ２０）が選択される。選択された視点の撮影映像ＣＶからフレーミング映像ＯＶが切り出されることで、より適切な構図ＣＰの映像が得られる。

［４．第４実施形態］
　図２４および図２５は、第４実施形態のフレーミングの概要を説明する図である。図２６は、映像処理装置８０の機能構成の一例を示す図である。

　本実施形態において第１実施形態と異なる点は、特定の物体ＯＢが被写体ＳＵとともに構図ＣＰの対象となる点である。以下、第１実施形態との相違点を中心に説明を行う。

　目標構図ＴＣＰを算出する際に、被写体ＳＵだけでなく、特定の物体ＯＢも同時に考慮したい場合がある。例えば、図２４のような新製品の宣伝を行うシーンでは、話者（被写体ＳＵ）だけでなく製品（物体ＯＢ）を含めた構図ＣＰを決定することが望ましい。

　図２４の左側の例では、話者のみが構図ＣＰＡの算出の基礎となっている。話者のみを包含する領域が被写体領域として抽出される。被写体領域の中心線は体軸ＡＸと一致し、体軸ＡＸが画面の中央に配置されている。しかし、視聴者は話者だけでなく製品にも注目する。そのため、全体として左に偏った映像として認識される可能性がある。

　図２４の右側の例では、話者および製品が構図ＣＰＢの算出の基礎となっている。話者および製品を包含する領域が被写体領域として抽出され、被写体領域の中心線が画面の中央に配置されている。この構図ＣＰＢでは、視聴者が注目する領域が画面の中央に配置されるため、バランスの良い映像が得られる。

　図２５のようなテレビ会議を取り入れた番組の映像についても同様である。この種の映像では、メインの話者（被写体ＳＵ）だけでなく、テレビ会議参加者を写すモニタ（物体ＯＢ）を含めた構図ＣＰを決定することが望ましい。

　図２５の左側の例では、メインの話者のみが構図ＣＰＡの算出の基礎となっており、左側にあるモニタは構図ＣＰの対象となっていない。そのため、全体として左側に偏った映像として認識される可能性がある。図２５の右側の例では、メインの話者だけでなくモニタも構図ＣＰＢの算出の基礎となっているため、バランスの良い映像が得られる。

　こうした状況を反映するためには、図２の映像処理装置１０に物体認識部８１を追加した図２６のような映像処理装置８０を用いることが好ましい。物体認識部８１は、被写体ＳＵの撮影映像ＣＶから、被写体ＳＵとともに目標構図ＴＣＰの算出の基礎となる物体ＯＢを検出する。この構成によれば、物体認識結果も踏まえて目標構図ＴＣＰが算出される。そのため、ターゲットとなる物体ＯＢを含めた適切な構図ＣＰの映像が得られる。

［５．第５実施形態］
［５－１．映像処理装置の機能構成］
　図２７は、第５実施形態のフレーミングの概要を説明する図である。図２８は、映像処理装置９０の機能構成の一例を示す図である。

　本実施形態において第１実施形態と異なる点は、カメラ２０としてＰＴＺカメラ２２が用いられている点である。以下、第１実施形態との相違点を中心に説明を行う。

　第１実施形態では、カメラ２０として、被写体ＳＵの動き回る範囲全体を画角に収める、視野が固定された固定カメラ（俯瞰カメラ）が用いられた。しかし、カメラ２０は固定カメラに限定されない。例えば、ＰＴＺカメラ２２を使用しても同様の処理は可能である。ＰＴＺカメラ２２では、レンズの向き（パン、チルト）やズームを制御できることから、固定カメラよりも高品質な映像が得られる。

　図２７の左側には、被写体ＳＵを写す際の固定カメラ２１とＰＴＺカメラ２２の視野の違いが示されている。固定カメラ２１を使用する場合には、被写体ＳＵ（講師）の動く範囲を想定し、それを全て包含するような範囲を視野ＦＶ１に収めないと講義中の被写体ＳＵの映像が出力できない。その点、ＰＴＺカメラ２２は、レンズを旋回させることができるので、絞った視野ＦＶ２で解像度を活かした被写体ＳＵの撮影が可能である。

　図２７の右側の映像Ａは、固定カメラ２１で撮影された映像を示している。広範囲な映像のうち、被写体ＳＵ付近の映像領域（画角ＡＶ）が切り出されており、撮影解像度の多くが出力に使用されない。

　映像Ｂは、瞬時遷移を考慮したＰＴＺカメラ２２の撮影映像である。ＰＴＺカメラ２２は、メカニカル制御によりレンズの旋回を行うため、瞬時の構図ＣＰの遷移はできない。このため、瞬時遷移後にフレーミングの対象となる映像範囲を考慮して、目標構図ＴＣＰよりも余裕を持たせた視野ＦＶ２の撮影が行われる。映像Ｃのように映像Ｂとは逆向きの被写体ＳＵであっても目標構図ＴＣＰ（瞬時遷移時の画角ＡＶの拡大を含む）を内包できるように視野ＦＶ２を設定すれば、瞬時の構図ＣＰの遷移が可能になる。

　映像Ａと映像Ｂ，Ｃとの比較で明らかなように、本実施形態では、ＰＴＺカメラ２２の撮影解像度を活かして固定カメラ２１より高品質なフレーミングが行われる。

　図２８には、ＰＴＺカメラ２２を制御するためのカメラ制御部９１を追加した映像処理装置９０が示されている。カメラ制御部９１は、被写体ＳＵを撮影するＰＴＺカメラ２２の視野（パン、チルト、ズーム）を被写体ＳＵの状態（被写体ＳＵの移動方向、被写体ＳＵの向き、被写体ＳＵの大きさ）に基づいて制御する。

　例えば、被写体ＳＵが右側を向いている場合には、カメラ制御部９１は、被写体ＳＵの右側に空間的な余裕が生じるようにＰＴＺカメラ２２の視野を設定する。しかし、被写体ＳＵが左側に向きを変えたときには、被写体ＳＵの左側に空間的な余裕がないと、左向き用の適切な構図ＣＰを有する映像領域が切り出せない。そのため、カメラ制御部９１は、瞬時に左向き用の構図ＣＰに遷移できるように、被写体ＳＵの左側にも同様の空間的な余裕が生じるようにＰＴＺカメラ２２の視野を設定する。これにより、フレーミング映像ＯＶの解像度を高めつつ、瞬時の構図ＣＰの遷移にも対応可能となる。

［５－２．映像処理方法］
　図２９は、ＰＴＺカメラ２２の制御フローの一例を示す図である。

　カメラ制御部９１は、被写体ＳＵの体軸ＡＸの位置と、想定される最大視野をもとにしてＰＴＺカメラ２２の制御信号を出力する。例えば、カメラ制御部９１は、体軸ＡＸが画面の左１／３に配置された場合の視野を算出し（ステップＳＪ１）、体軸ＡＸが画面の右１／３に配置された場合の視野を算出する（ステップＳＪ２）。カメラ制御部９１は、ＰＴＺカメラ２２の旋回動作での遅れ分を加味した余白を算出する（ステップＳＪ３）。

　カメラ制御部９１は、ステップＳＪ１およびステップＳＪ２で算出された２つの視野を包含する視野を算出し、これにステップＳＪ３で算出された余白を加えて、ＰＴＺカメラ２２で撮影する視野の範囲を算出する（ステップＳＪ４）。カメラ制御部９１は、算出された視野が得られるように、ＰＴＺカメラのパン、チルトおよびズームを制御する（ステップＳＪ５）。

　例えば、カメラ制御部９１は、頭頂を始点とする体軸ＡＸが画面の中央に配置されるようにパンとチルトを設定し、求めた視野のサイズが得られるようにズームを設定する。これにより、図２７の映像Ｂに相当する映像が取得される。

［５－３．効果］
　本実施形態では、カメラ制御部９１により、ＰＴＺカメラ２２の視野が適切に制御される。そのため、適切な構図を有する解像度の高い映像が得られる。

［６．変形例１］
　第１実施形態では、スムーズ構図遷移モードで構図ＣＰが遷移している最中に新たな目標構図ＴＣＰが決定された場合に遷移モードが瞬時構図遷移モードに切り替えられた。しかし、遷移モードを瞬時構図遷移モードに切り替えるタイミングはこれに限定されない。例えば、構図遷移決定部１７は、スムーズ構図遷移モードで構図ＣＰが遷移している最中に被写体ＳＵの状態が許容基準を超えて大きく変化した場合には、遷移モードを瞬時構図遷移モードに切り替えることができる。

　許容基準とは、目標構図ＴＣＰの変更が必要となる状態の変化量に関する基準を意味する。被写体ＳＵの状態が許容基準を超えて大きく変化した場合には、目標構図ＴＣＰを維持できないと判定される。

　例えば、被写体ＳＵが、静止した状態から、両手を大きく広げたり、身振り手振りを交えて話をし始めたりした場合には、被写体ＳＵの大きさが大きく変化する。静止状態ではバストショットが適切であったとしても、被写体ＳＵの大きさが大きく変化した場合には、ウエストショット、ニーショット、フルフィギュアまたはロングショットなどが適切となる場合がある。目標構図ＴＣＰの変更が必要となるほど被写体ＳＵの状態が大きく変化した場合には、構図遷移決定部１７は瞬時構図遷移モードで構図ＣＰを切り替える。

　この構成によれば、被写体ＳＵの状態と構図ＣＰとの間の乖離によって生じる違和感が低減される。被写体ＳＵの状態が大きく変化すると、スムーズな構図ＣＰの遷移では、被写体ＳＵの状態に構図ＣＰの変化が追いつくまでに時間がかかる。被写体ＳＵの状態と構図ＣＰとの間に乖離が生じている時間が長くなると、視聴者に違和感を与える。被写体ＳＵの状態が大きく変化した場合に、瞬時に目標構図ＴＣＰに構図ＣＰを遷移させれば、このような違和感は生じにくい。

［７．変形例２］
　第５実施形態のフレーミングの手法は、手持ちカメラで撮影を行う場合にも適用できる。手持ちカメラは、レンズの向きによって視野が調整できる点でＰＴＺカメラ２２と共通する。そのため、カメラ制御部９１は、ＰＴＺカメラ２２と同様に、被写体ＳＵを撮影するカメラ２０の視野を被写体ＳＵの状態に基づいて制御することができる。例えば、カメラ制御部９１は、向き反転や構図の拡縮に対応可能な視野で撮影できるように、手持ちカメラのズームの自動制御を行う。

　カメラ制御部９１は、現フレームの視野と目標となる視野との差異に基づいて、被写体を撮影するユーザにレコメンド情報を通知することもできる。例えば、カメラ制御部９１は、現在の手持ちカメラの視野を目標となる視野に近づけるために、ファインダ内でパン方向やズーム率などの変更に関するレコメンド情報を提示する。これにより、視野の変更をユーザに促すことができる。

［８．変形例３］
　第３実施形態のフレーミングの手法に、第５実施形態で説明したＰＴＺカメラ２２の制御手法を組み合わせることができる。この際、現在出力しているフレーミング映像ＯＶの画角ＡＶをもとに次の画角ＡＶを想定し、選択されていないＰＴＺカメラ２２の視野を、次の画角ＡＶに対応した視野に合わせこんでおく。例えば、カメラ制御部９１は、選択されていない撮影映像ＣＶを撮影したＰＴＺカメラ２２の視野を、選択されている撮影映像ＣＶから切り出された映像領域の画角ＡＶに基づいて算出する。これにより、被写体の向きや移動方向が変化したときにスムーズに対応することができる。

［９．撮影システムのハードウェア構成例］
　図３０は、撮影システムＣＳのハードウェア構成例を示す図である。

　撮影システムＣＳは、例えば、図３０に示すような構成のコンピュータ１０００によって実現される。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１３００、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Ｂａｓｉｃ　Ｉｎｐｕｔ　Ｏｕｔｐｕｔ　Ｓｙｓｔｅｍ）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）等の光学記録媒体、ＭＯ（Ｍａｇｎｅｔｏ－Ｏｐｔｉｃａｌ　ｄｉｓｋ）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が映像処理装置として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、映像処理装置の各部の機能を実現する。また、ＨＤＤ１４００には、本開示に係るプログラムや、映像処理装置および記録装置４０内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

［付記］
　なお、本技術は以下のような構成も取ることができる。
（１）
　被写体の状態に基づいて目標構図を算出する目標構図算出部と、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える構図遷移決定部と、
　を有する情報処理装置。
（２）
　前記被写体の状態は、前記被写体の移動方向、前記被写体の向き、および、前記被写体の大きさ、のうちの少なくとも１つに関する状態を含み、
　前記状態の変化の状況は、前記移動方向が切り替わる速さ、前記向きが切り替わる速さ、および、前記被写体の大きさの変化、のうちの少なくとも１つに関する状況を含む、
　上記（１）に記載の情報処理装置。
（３）
　前記構図遷移決定部は、前記遷移モードを前記スムーズ構図遷移モードから前記瞬時構図遷移モードに切り替えた直後の画角の大きさの変化率を、前記遷移モードを切り替える直前の画角の大きさの変化率と異ならせる、
　上記（１）または（２）に記載の情報処理装置。
（４）
　前記構図遷移決定部は、前記スムーズ構図遷移モードで前記構図が遷移している最中に新たな前記目標構図が決定された場合には、前記遷移モードを前記瞬時構図遷移モードに切り替える、
　上記（１）ないし（３）のいずれか１つに記載の情報処理装置。
（５）
　前記構図遷移決定部は、前記スムーズ構図遷移モードで前記構図が遷移している最中に前記状態が許容基準を超えて大きく変化した場合には、前記遷移モードを前記瞬時構図遷移モードに切り替える、
　上記（１）ないし（３）のいずれか１つに記載の情報処理装置。
（６）
　前記構図遷移決定部は、前記瞬時構図遷移モードが選択されてから所定の期間は前記瞬時構図遷移モードの選択を禁止する、
　上記（１）ないし（５）のいずれか１つに記載の情報処理装置。
（７）
　前記被写体の状態は、前記被写体の撮影映像を画像解析することにより取得される、
　上記（１）ないし（６）のいずれか１つに記載の情報処理装置。
（８）
　前記被写体の状態は、前記被写体に取り付けられた位置センサのセンサ位置情報に基づいて取得される、
　上記（１）ないし（６）のいずれか１つに記載の情報処理装置。
（９）
　異なる視点から撮影された複数の前記被写体の撮影映像から、前記被写体の状態に応じた１つの撮影映像を選択する選択映像判定部と、
　選択された前記撮影映像から切り出された映像領域をフレーミング映像として出力する映像切り替え部と、
　を有する上記（１）ないし（８）のいずれか１つに記載の情報処理装置。
（１０）
　前記選択映像判定部は、１つの前記撮影映像が選択されてから所定の期間は他の前記撮影映像の選択を禁止する、
　上記（９）に記載の情報処理装置。
（１１）
　前記選択映像判定部は、他の前記撮影映像が選択された直後の画角の大きさの変化率を、他の前記撮影映像が選択される直前の画角の大きさの変化率と異ならせる、
　上記（１０）に記載の情報処理装置。
（１２）
　前記被写体の撮影映像から、前記被写体とともに前記目標構図の算出の基礎となる物体を検出する物体認識部を有する、
　上記（１）ないし（１１）のいずれか１つに記載の情報処理装置。
（１３）
　前記被写体を撮影するカメラの視野を前記被写体の状態に基づいて制御するカメラ制御部を有する、
　上記（１）ないし（１２）のいずれか１つに記載の情報処理装置。
（１４）
　前記カメラ制御部は、現フレームの視野と目標となる視野との差異に基づいて、前記被写体を撮影するユーザにレコメンド情報を提示する、
　上記（１３）に記載の情報処理装置。
（１５）
　選択されていない前記撮影映像を撮影したカメラの視野を、選択されている前記撮影映像から切り出された前記映像領域の画角に基づいて算出するカメラ制御部を有する、
　上記（９）ないし（１１）のいずれか１つに記載の情報処理装置。
（１６）
　被写体の状態に基づいて目標構図を算出し、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える、
　ことを有する、コンピュータにより実行される情報処理方法。
（１７）
　被写体の状態に基づいて目標構図を算出し、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える、
　ことをコンピュータに実現させるプログラム。

１０，５０，６０，８０，９０　映像処理装置（情報処理装置）
２０　カメラ
１６　目標構図算出部
１７　構図遷移決定部
７１　選択映像判定部
７２　映像切り替え部
８１　物体認識部
９１　カメラ制御部
１０００　コンピュータ
１４５０　プログラムデータ（プログラム）
ＡＶ　画角
ＣＰ　構図
ＣＶ　撮影映像
ＯＢ　物体
ＯＶ　フレーミング映像
ＰＯＩ　センサ位置情報
ＳＥ　位置センサ
ＳＵ　被写体
ＴＣＰ　目標構図

Claims

　被写体の状態に基づいて目標構図を算出する目標構図算出部と、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える構図遷移決定部と、
　を有する情報処理装置。
　前記被写体の状態は、前記被写体の移動方向、前記被写体の向き、および、前記被写体の大きさ、のうちの少なくとも１つに関する状態を含み、
　前記状態の変化の状況は、前記移動方向が切り替わる速さ、前記向きが切り替わる速さ、および、前記被写体の大きさの変化、のうちの少なくとも１つに関する状況を含む、
　請求項１に記載の情報処理装置。
　前記構図遷移決定部は、前記遷移モードを前記スムーズ構図遷移モードから前記瞬時構図遷移モードに切り替えた直後の画角の大きさの変化率を、前記遷移モードを切り替える直前の画角の大きさの変化率と異ならせる、
　請求項１に記載の情報処理装置。
　前記構図遷移決定部は、前記スムーズ構図遷移モードで前記構図が遷移している最中に新たな前記目標構図が決定された場合には、前記遷移モードを前記瞬時構図遷移モードに切り替える、
　請求項１に記載の情報処理装置。
　前記構図遷移決定部は、前記スムーズ構図遷移モードで前記構図が遷移している最中に前記状態が許容基準を超えて大きく変化した場合には、前記遷移モードを前記瞬時構図遷移モードに切り替える、
　請求項１に記載の情報処理装置。
　前記構図遷移決定部は、前記瞬時構図遷移モードが選択されてから所定の期間は前記瞬時構図遷移モードの選択を禁止する、
　請求項１に記載の情報処理装置。
　前記被写体の状態は、前記被写体の撮影映像を画像解析することにより取得される、
　請求項１に記載の情報処理装置。
　前記被写体の状態は、前記被写体に取り付けられた位置センサのセンサ位置情報に基づいて取得される、
　請求項１に記載の情報処理装置。
　異なる視点から撮影された複数の前記被写体の撮影映像から、前記被写体の状態に応じた１つの撮影映像を選択する選択映像判定部と、
　選択された前記撮影映像から切り出された映像領域をフレーミング映像として出力する映像切り替え部と、
　を有する請求項１に記載の情報処理装置。
　前記選択映像判定部は、１つの前記撮影映像が選択されてから所定の期間は他の前記撮影映像の選択を禁止する、
　請求項９に記載の情報処理装置。
　前記選択映像判定部は、他の前記撮影映像が選択された直後の画角の大きさの変化率を、他の前記撮影映像が選択される直前の画角の大きさの変化率と異ならせる、
　請求項１０に記載の情報処理装置。
　前記被写体の撮影映像から、前記被写体とともに前記目標構図の算出の基礎となる物体を検出する物体認識部を有する、
　請求項１に記載の情報処理装置。
　前記被写体を撮影するカメラの視野を前記被写体の状態に基づいて制御するカメラ制御部を有する、
　請求項１に記載の情報処理装置。
　前記カメラ制御部は、現フレームの視野と目標となる視野との差異に基づいて、前記被写体を撮影するユーザにレコメンド情報を提示する、
　請求項１３に記載の情報処理装置。
　選択されていない前記撮影映像を撮影したカメラの視野を、選択されている前記撮影映像から切り出された前記映像領域の画角に基づいて算出するカメラ制御部を有する、
　請求項９に記載の情報処理装置。
　被写体の状態に基づいて目標構図を算出し、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える、
　ことを有する、コンピュータにより実行される情報処理方法。
　被写体の状態に基づいて目標構図を算出し、
　前記状態の変化の状況に基づいて、前記目標構図への遷移モードを、前記目標構図に向けて徐々に構図が遷移するスムーズ構図遷移モードと、前記目標構図に向けて瞬時に前記構図が遷移する瞬時構図遷移モードと、の間で切り替える、
　ことをコンピュータに実現させるプログラム。