以下、図示の実施の形態によって本発明を説明する。以下の説明に用いる各図面は模式的に示すものであり、各構成要素を図面上で認識できる程度の大きさで示すために、各部材の寸法関係や縮尺等を構成要素毎に異ならせて示している場合がある。したがって、本発明は、各図面に記載された各構成要素の数量や各構成要素の形状や各構成要素の大きさの比率や各構成要素の相対的な位置関係等に関して、図示の形態のみに限定されるものではない。
本発明の一実施形態は、例えば光学レンズにより形成される光学像を固体撮像素子を用いて光電変換し、これによって得られる画像信号を静止画像や動画像を表わすデジタルデータとして記憶媒体に記録し、また記憶媒体に記録されたデジタル画像データに基いて静止画像や動画像を表示装置に再生表示し得るように構成されるいわゆるデジタルカメラ等の撮像装置を一例として挙げるものである。
[一実施形態]
図1は、本発明の一実施形態の記録装置における撮像機能を概念的に示す概念図である。本実施形態の記録装置である撮像装置100は、撮像部11と、連続撮影部110とを有して構成されている。
撮像部11は、撮影対象物(いわゆる被写体)を含む所定の領域を撮像して被写体像を含む所定の領域の画像データを取得する構成部である。撮像部11は、撮像素子を含む複数の電子部品等と、これら撮像素子等の電子部品等を実装した撮像基板などによって構成されている。この撮像基板には、例えば当該撮像素子を駆動するための駆動回路や、同撮像素子によって連続的に取得されて出力される各画像信号を受けて適宜必要な所定の信号処理を順次施す撮像回路等の電子回路やプログラムソフトウエア等を含んで構成されている。
連続撮影部110は、動体領域判別部112と、フレームレート変更部113と、撮像結果関連付け記録部114と、画像データ記録部115と、時計部116とを有する。
動体領域判別部112は、撮像部11によって取得された第1の画像データ(全領域データ;詳細後述)に基づいて当該第1画像データによって表される一画面内に含まれる動体を検出し、検出された動体が当該画面内のどの分割領域にあるかを判別する構成部である。この動体領域判別部112は、例えば電子回路若しくはプログラムソフトウエア等を有して構成されている。
換言すると、動体領域判別部112は、第1の画像データ(全領域データ;詳細後述)に基づいて当該第1画像データによって表される一画面内に含まれる動体を含む一部画像領域の第2の画像データ(部分領域データ;詳細後述)を判別する時に、各領域毎の特徴として検出された動体の位置に応じて部分領域としての候補を出力する領域候補判別部として機能する構成ユニットである。
フレームレート変更部113は、撮像部11に含まれる撮像素子の各分割領域(詳細後述)のフレームレートを、撮像部11の撮像素子によって取得される画像データの状況に応じて、適宜変更するための構成部である。具体的には、例えば動体領域判別部112によって動体が検出された場合に、当該撮影対象動体のある分割領域を、通常よりも高いフレームレートで駆動するようにフレームレートの設定変更処理をしたり、当該動体が画面内で移動することによって対応する分割領域から対象としている動体が外れた場合には、高フレームレート設定から通常のフレームレートとなるようにフレームレートの設定変更処理を行なう等を行なう。このフレームレート変更部113は、例えば電子回路若しくはプログラムソフトウエア等を有して構成されている。
撮像結果関連付け記録部114は、撮像部11によって取得され、画像データ記録部115に記録された複数の画像データ(第1の画像データや第2の画像データ等;詳細後述)について、所定の条件に基づいて関連付けを行って記録するための構成部である。この撮像結果関連付け記録部114は、例えば電子回路若しくはプログラムソフトウエア等を有して構成されている。
画像データ記録部115は、撮像部11から出力され所定の信号処理が施された後に生成される所定の形態の画像データ(静止画像データ、動画像データ等)を記憶するための構成部である。この画像データ記録部115には、記録媒体を含む複数の電子部品等と、これら複数の電子部品等を実装した電気基板などによって構成されている。この電気基板には、例えば当該記録媒体を駆動するための駆動回路や、入力された画像データを記録媒体の所定の記憶領域に記録するための記録回路等の電子回路やプログラムソフトウエア等を有して構成されている。
時計部116は、いわゆるリアルタイムクロック(Real-Time Clock;RTC)などと呼ばれる内部時計回路である。この時計部116は、例えば生成された画像データファイル等に対して日時情報や時刻情報等を付与したり、各種の制御処理の実行中において、所定の指示タイミング間の計時を行ったり時間的制御等の際に利用される回路部である。この時計部116は、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
なお、撮像結果関連付け記録部114若しくは画像データ記録部115には、記録対象とする画像データについて、例えばJPEG形式(静止画像データ),MPEG形式(動画像データ)等、各種所定の規格に基づく圧縮処理等を行なう圧縮処理回路部などを有して構成するようにしてもよい。
次に、本発明の一実施形態の撮像装置の具体的な構成例を、図2のブロック構成図によって、以下に説明する。
図2に示すように、本実施形態の記録装置である撮像装置100は、制御部10と、撮像部11と、操作部12と、表示部13と、通信部14と、記録部15と、推論エンジン(inference engine)16と、時計部116等を有して構成されている。
制御部10は、本実施形態の記録装置である撮像装置100の各構成ユニットを統括的に制御する構成ユニットである。制御部10は、上記連続撮影部110に対応する機能を有しており、本実施形態の撮像装置100による撮像動作及び再生動作等を制御する構成ユニットである。制御部10は、例えば中央処理装置(Central Processing Unit;CPU)等のいわゆるプロセッサ等が適用される。
具体的には、制御部10は、例えば記録制御部10aと、操作判別部10bと、通信制御部10cと、画像処理部10dと、パラメータ制御部10eと、画像内動体領域判別部10f等を有して構成される。
記録制御部10aは、本実施形態の撮像装置100によって取得される複数の画像データ(第1の画像データや第2の画像データ等;詳細後述)や、当該画像データに関連する各種の情報群の記録処理や所定の関連付け処理等を制御する構成部である。つまり、記録制御部10aは、上述の撮像結果関連付け記録部114に対応する機能を有する。記録制御部10aは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
ここで、第1の画像データは、撮像部11に含まれる撮像素子11bによって取得される画像データのうち、当該撮像素子11bの有効撮像領域の全域を用いて取得される画像データをいうものとする。この第1の画像データは、当該撮像装置100において、所定のフレームレート(例えば通常のフレームレートである24,30,60fps等のフレームレート)で連続的に取得される全領域の画像データ(全領域データ)が相当する。
また、第2の画像データは、所定の(通常の)フレームレートで連続的に取得された第1の画像データの全領域のうちの所定の領域毎の特徴(例えば動体が位置すること)に応じて当該第1の画像データの部分的な一部の画像領域を第1の画像データよりも高いフレームレート(例えば120fps又はそれ以上のフレームレート)で取得した所定の部分領域の画像データ(部分領域画像データ)が相当する。
操作判別部10bは、撮像装置100を所望の動作を行わしめるために、使用者によって操作される各種の操作部材(操作部12に含まれる部材)に応じて出力される所定の指示信号を受けて、当該操作指示信号を判別する構成ユニットである。ここで、各種の操作部材による所定の指示信号としては、例えば、撮影動作時における撮像準備信号(AF開始信号,AE開始信号)や撮像開始信号(レリーズ信号)や、動作モードの変更指示信号、撮像動作時若しくは再生動作時などにおける表示部13への表示形態の切り換え指示信号等、当該撮像装置100を使用する際に発生する各種の指示信号であって、一般的な撮像装置において用いられる各種の指示信号である。がある。この操作判別部10bは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
通信制御部10cは、通信部14を制御して当該撮像装置100と外部機器200との間で、各種の情報通信を制御する構成ユニットである。この通信制御部10cは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
画像処理部10dは、撮像部11によって取得され、連続的に出力される複数の画像信号を受けて、適宜所定の画像信号処理を施す構成ユニットである。ここで行われる画像信号処理は、例えば、撮像素子11bから出力されるアナログ信号をデジタル信号に変換するAD変換処理や、各種のデジタル信号処理、データ圧縮処理等の一般的な撮像装置によって行われる通常の各種信号処理である。この画像処理部10dは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
パラメータ制御部10eは、本撮像装置100によって撮像動作を実行する際の各種のパラメータについての所定の制御(測定,設定等)を行なう構成ユニットである。ここで、各種のパラメータとしては、例えばシャッター速度値,絞り値,ISO感度値,ホワイトバランス値,焦点距離値等の撮影パラメータや、取得された画像データに対して画像処理を施す際の設定値等の画像処理パラメータのほか、取得画像に対して所望のフィルター効果を追加するめのフィルター効果設定値等がある。このパラメータ制御部10eが対象とするパラメータは、一般的な撮像装置における制御部によって扱われる各種のパラメータである。また、パラメータ制御部10eは、上記フレームレート変更部113に対応する機能を有しており、適宜、撮影パラメータの一つとしてのフレームレートの設定を変更する構成ユニットでもある。当該パラメータ制御部10eは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。
画像内動体領域判別部10fは、上記動体領域判別部112(領域候補判別部)と対応する機能を有する構成ユニットである。画像内動体領域判別部10fは、上述したように、撮像部11によって取得された第1の画像データ(全領域データ)に基づいて当該第1画像データによって表される一画面内に含まれる動体を検出する動体検出機能と、これにより検出された動体が当該画面内のどの分割領域にあるかを判別する構成ユニットである。この画像内動体領域判別部10fは、例えば電子回路若しくはプログラムソフトウエア等によって構成されている。なお、図2に示す実施形態は、動体領域判別部112(領域候補判別部)は、推論モデル(後述)を利用して動体の位置する部分領域の判別を行なう例を示している。
撮像部11は、上述したように、被写体を含む所定の領域を撮像して被写体像を含む所定の領域の画像データを取得する構成部である。そのために、撮像部11は、レンズ11aと、撮像素子11b等を含んで構成されている。
レンズ11aは、被写体によって反射した反射光を受けて光学像を結像する複数の光学レンズと、これら複数の光学レンズのうちの一部を適宜光軸に沿う方向に駆動させる駆動ユニット(不図示)のほか、レンズを透過する光束の光量を調整する絞り機構等(不図示)等を有して構成される構成ユニットである。
撮像素子11bは、レンズ11aによって結像された光学像を受けて、被写体像を含む光学像を電気信号(アナログ信号)に変換する光電変換素子である。この撮像素子11bは、上述したように、撮像基板(不図示)に実装されている。この撮像基板上には、撮像素子11bを駆動するための駆動回路や、撮像素子11bによって取得された画像信号についての各種の信号処理を行なう撮像回路等が実装されている。
また、本実施形態の撮像装置100において適用される撮像素子11bは、多数の画素が縦横に配列されて構成される受光面を有している。ここで、本実施形態の撮像装置100においては、当該撮像素子11bの受光面は、その有効撮像領域(一つの画像データを取得するためのセンサ領域)が、複数の領域に分割されて構成されている。そして、本撮像素子11bは、例えば各領域毎にそれぞれ異なるフレームレートで駆動することができるように制御され、各領域毎の管理がなされている。
操作部12は、当該撮像装置100の動作指示を入力するための各種形態(レバー式,ダイヤル式,スライド式,プッシュボタン式など)の操作部材のほか、表示部13の表示画面上に配置されるタッチパネル等を含む操作部材群と、各操作部材群等の各操作に応じて作動する電気部品(スイッチ類等)を含んで構成される構成部材群である。さらに、操作部12には、例えば、各種のセンサ類(アイセンサ,姿勢センサ,方位センサ,GPSなど)も含まれるものとする。
表示部13は、撮像部11を用いて取得され所定の画像処理を経て出力される画像データや記録済みの画像データに基づく画像を表示し、当該画像データに関連する各種の情報を表示し、また各種の設定情報等を表示する表示用ユニットである。表示部13は、具体的には、例えば撮像装置100の背面に設置される背面表示パネルのほか、接眼式表示パネル(いわゆる電子ビューファインダ(EVF))等である。また、表示部13の他の形態としては、例えば当該撮像装置100との間で無線若しくは有線接続される携帯型デバイスの表示装置を用いる形態としてもよい。表示部13は、例えば液晶ディスプレイ(liquid crystal display;LCD)や有機エレクトロルミネッセンス(有機EL;organic electro-luminescence:OEL)ディスプレイ等が適用される。
通信部14は、当該撮像装置100と、他の外部機器200や上記携帯型デバイス等との間でデータ通信を行なうのに用いられる電子回路若しくはプログラムソフトウエア等によって構成される構成ユニットである。通信部14の形態としては、例えば無線形式又は有線形式のいずれの形態のものでもよい。通信部14は、一般的な撮像装置において適用されるものと同様のものが適用される。
記録部15は、記録部15は、上記画像データ記録部115に対応する機能を有する。即ち、記録部15は、上述したように、撮像部11を用いて取得され所定の画像処理を経て出力される画像データや、当該画像データに関連する各種の情報等を記録する記録媒体(不図示)と、当該記録媒体を駆動制御する各種の電子回路等若しくはプログラムソフトウエア等によって構成される構成ユニットである。
記録部15に記録される画像データには、上述したように、例えば第1の画像データである全領域データ15aと、第2の画像データである部分領域データ15bと、これら全領域データ15a(第1の画像データ)や部分領域データ15b(第2の画像データ)に関連する各種の関連情報15c等が含まれる(図2参照)。
ここで、上記関連情報には、例えばシャッター速度値,絞り値,ISO感度値,ホワイトバランス値,焦点距離値,フレームレート等の撮影パラメータなどのほか、所定の領域情報等が含まれる。
なお、上記領域情報とは、
(1)全領域データ15a(第1の画像データ)と部分領域データ15b(第2の画像データ)との相対的な関連情報、即ち、特定の部分領域データ15bが複数記録されている全領域データ15aのうちのどの全領域データ15aに対応するかの情報、
(2)特定の部分領域データ15bが対応する全領域データ15aのどの領域に対応するかの情報、
等を示す固有情報である。
推論エンジン16は、例えば、撮像部11を用いて取得され所定の画像処理を経て出力される画像データにより表示される画像の中に含まれる被写体のうち所望の動体に関して、外部機器200によって予め生成された推論モデルに基づいて所定の推論を行う電子回路若しくはプログラムソフトウエアによって構成される構成ユニットである。
推論エンジン16は、外部機器200によって予め生成された所定の推論モデルが記憶される記憶部16aを有して構成されている。ここで、推論モデルは、撮像装置100によって取得される画像データの中から特徴的な部分としての所望の被写体(本実施形態においては動体を対象としている)を抽出し判別するための推論を行う際に利用されるいわゆる「ひな形(テンプレート)」である。この推論モデルは、例えば、外部機器200の学習機能を用いて生成される。
時計部116は、上述したように、いわゆるリアルタイムクロック(Real-Time Clock;RTC)などと呼ばれる内部時計回路である。
このように構成される本実施形態の撮像装置100は、外部機器200との間で通信して、所望の被写体に応じた推論エンジンを取り寄せることができる。
外部機器200は、学習部201と、データベース202とを有して構成される。ここで、学習部201は、データベース202の大量の画像データ30bに基づいて所望の推論モデルを生成する処理を行なう構成ユニットである。学習部201は、電子回路若しくはプログラムソフトウエア等によって構成される。
学習部201は、通信部20aと、母集合作成部20bと、出力設定部20cと、入出力モデル化部20dとを有して構成される。
通信部20aは、撮像装置100との間、若しくはデータベース202との間で、データ通信を行うのに用いられる電子回路若しくはプログラムソフトウエア等によって構成される構成ユニットである。
母集合作成部20bは、データベース202に予め記憶されている大量の画像データ30b(静止画及び動画と、これらに関連付けられた関連情報等)の中から、学習処理を行なうための複数の画像データ(教師データ;今回生成しようとする推論モデルに対応する所望の被写体に類似の(所定の条件を満たす)大量の画像データ)の母集合を作成する電子回路若しくはプログラムソフトウエア等によって構成される構成ユニットである。
本実施形態においては、所望の被写体としての教師データは、例えば画面内で動く被写体(動体)を対象とする例を示している。したがって、教師データの候補となる画像データとしては、主に動画像データが対象となる。
ここで動体とは、具体的には例えば、鳥類の飛翔シーン,昆虫類の飛翔シーン,動物の疾走シーン,各種スポーツにおける選手の動き,各種球技におけるボールの軌跡,移動する自動車やオートバイや飛行機等のほか、演劇等の舞台上の演者等が考えられる。
なお、演劇等の舞台撮影においては、通常の場合、演者等はスポットライトによって照らされることが多くある。したがって、このことを考慮すれば、舞台上を移動するスポットライトを動体としての対象物として考えることもできる。この場合、スポットライト内には演者がほぼ常に存在しているものと見なすことができるからである。舞台上の演者等が画面内に占める領域は、画面全体に対して小さいものであるが、スポットライト内には演者等が含まれる可能性が高いことから、スポットライトを動体として追尾すれば、結果的に所望の主要被写体としての演者等を動体として取り扱うことが出来ることになる。
即ち、このように、本実施形態の撮像装置100においては、画面内において各フレーム毎に位置を移動する物体(像)を動体として扱うことにしている。
出力設定部20cは、推論モデルを生成するための条件設定を行なう電子回路若しくはプログラムソフトウエア等によって構成される構成ユニットである。
本実施形態においては、母集合データとして選択された動画像データ(動体を含む動画像データ)の各フレームにおいて、画面内で動体が位置する領域情報(例えば鳥が飛翔中の画面内位置情報)や、撮影対象動体が動きを開始する直前の状態にあるとき(例えば鳥が飛翔する直前に枝等の固定物に止まっているとき等)の領域情報等を出力条件としている。
入出力モデル化部20dは、母集合作成部20bに集められた教師データを読み出して、所定の学習を行って、対応する推論モデルを生成する電子回路若しくはプログラムソフトウエア等によって構成される構成ユニットである。ここで行われる学習は、例えば画面内で対象とする動体が、静止状態にある位置から移動を開始し、その移動中の様子の一連の動作態様についての学習である。
データベース202は、大量の画像データ30b(静止画及び動画と、これらに関連付けられた関連情報等)等が集積され記憶されているストレージユニット(補助記憶装置)である。データベース202は、学習部201との間でデータ通信を行うのに用いられる電子回路若しくはプログラムソフトウエア等によって構成される通信部30aを有する。
このように構成される本実施形態の撮像装置100における作用の具体例を、以下に簡単に説明する。
図3〜図5は、本実施形態の撮像装置の作用の概略を説明する説明図である。このうち、図3は、本実施形態の撮像装置100を用いて、動体としての鳥の飛翔シーンを動画像として撮像する際の様子を示す概念図である。図4は、図3の状態で当該撮像装置によって取得され表示部に表示されるライブビュー画像(動画像)の概念を示す図である。なお、図4においては、動画像であることを示すために、各フレーム毎の画像を重ねて示している。したがって、図4では、撮影対象動体としての鳥が画面内を所定時間毎に移動する様子を示す5つのフレームを図示している。図5は、本撮像装置を用いて鳥の飛翔シーンを撮影した場合に記録される複数の画像データの構成を示す概念図である。
図3に示すように、例えば、遠景に固定物としての建物601があり、この建物601から飛び立って飛翔する鳥類600の飛翔シーンを、撮影者500が手501で持つ撮像装置100を用いて、動画像を撮像する場合の状況を想定する。
図3においては、撮影者500が撮像装置100を手501に持って、当該撮像装置100を撮影対象動体としての鳥600に向けて構えている様子を示している。このとき、撮像装置100の表示部13である背面パネルには、その様子がライブビュー表示として表示されている様子が図示されている。
このような状況下において、特定の動く被写体(動体;本例では鳥600)の動きを、撮像装置100を用いて記録すると共に、動きを再現することができるようにするためには、動画像撮影が行われる。さらに、動体の動きの詳細をより精密に再現したいといった場合には、動画撮影においてスローモーション撮影を行なうといった要望がある。
このような撮影を行う場合においては、撮影者にとって興味の対象となる部分は、撮影対象の動く被写体(動体;本例では鳥600)である。したがって、動画像撮影時に取得される1フレームの画面内においては、撮影対象動体の占める領域と、その他の領域(背景)とに区別することができる。
このとき、その他の領域(背景)は、動画像撮影時に取得される複数の各フレーム中において、ほとんど変化のない画像になることが考えられる。したがって、動画撮影時に被写体以外の領域をも、撮影対象物(被写体)と同時に常に記録することは、撮影動作の無駄な負荷が増加することになると共に、記録容量を無駄に消費してしまうという問題点が指摘される。
そこで、不要な背景(撮影者の興味の対象外の被写体)を省略し、撮影者の興味の対象となる被写体(本例では鳥600)を撮影画面一杯に捉えようとする場合には、焦点距離の長いレンズ(いわゆる望遠レンズ)が一般に利用される。この場合、焦点距離が長くなるほど、被写体の拡大率を大きくすることができることから、焦点距離が長いレンズほど、所望の被写体を画面内で大きく撮影することができるという利点がある。
しかしながら、撮像装置100によって撮影動作を行う際に、所望の被写体を撮影画面内に捕らえ続けるためには、レンズ11aの光軸を、常に被写体に向け続けている必要がある。そして、焦点距離が長くなるほど、撮影画面の画角が狭くなってしまう傾向がある。
したがって、画角の狭い望遠レンズを用いて、所望の被写体を常に画面内に捕らえ続けることは困難であり、熟練を要する作業になる。特に、高速で移動することが予想される動体でかつ対象物が小さい場合(例えば鳥類等)では、被写体を撮影画面内に常に捕らえ続けることは、より困難な作業であるといえる。
つまり、鳥類等の動きの速い被写体を対象として撮影するのに、望遠レンズを用いる場合、所望の被写体が撮影画面から外れてしまうことが多くなり、また、見失ってしまった被写体を再度、撮影画面内に捕らえ直すことは、より困難が伴う作業になってしまうといえる。特に、動体の連続的な動きを撮影したいような場合、具体的には、動体の動画像撮影を行うような場合には、この種の問題が大きな障害となる。
そこで、広角寄りのレンズ(広い画角のレンズ;いわゆる広角レンズ)を用いれば、撮影対象とする所望の被写体(動体)を常に撮影画面内に捕らえ続けることは、望遠レンズに比べて比較的容易になる。また、広角レンズで広い画角による撮影を行う場合、動きが早く小さな動体(例えば鳥600)であっても、撮像装置100のレンズ光軸の向きを、あまり動かさなくとも、当該所望の被写体を撮影画面内に捕らえ続けることが容易になる。したがって、撮影技術の未熟な初心者であっても、画角の広い広角レンズを用いることで、動体の連続的な動きを捕らえることができる可能性が高くなる。しかし、広角レンズを用いると、撮影画面内において、所望の被写体以外が写り込む領域が多くなってしまう可能性が高くなる。
そこで、本発明の実施形態の撮像装置においては、所望の動く被写体を含む一部の領域のみを通常のフレームレートよりも高いフレームレートでの読み出しを行って動体の動きを鮮明に撮像する(第2の画像データ)と共に、所望の被写体以外の動きの無い領域は、通常のフレームレートで撮像して(第1の画像データ)、両データを関連付けて記録するようにしている。
このようなことを考慮して、以下に示す例示では、撮像装置100には、広角寄りで広い画角のレンズ11aが取り付けられているものとし、これにより、比較的広い範囲を撮像し得る状況を想定している。
このような状況において、撮像装置100の表示部13(背面パネル)には、図4に示すように、動画像としてのライブビュー画像が表示される。この場合において、表示部13の表示パネルの全領域に示される全体画像を示す画像データが全領域データ(第1の画像データ)である。また、符号A1,A2,A3,A4,A5で示し、点線で示す各矩形領域の画像を示す画像データが部分領域データ(第2の画像データ)である。また、図3の符号A0で示す矩形領域は、飛び立つ直前の鳥600を含む領域を示している。
なお、図3において示される矩形領域A0〜A5は、参照のために図示するものであって、実際の表示部13の表示としては現れない。しかしながら、例えば、後述する部分領域判別処理の結果として、上記矩形領域A0〜A5を表す矩形線図等をライブビュー画像に重畳させて表示するようにしてもよい。
本実施形態の撮像装置100において取得される画像データの概念について、以下に、図5を用いて簡単に説明する。
本実施形態の撮像装置100が撮像モードにて動作し、動画像撮影が行われる際には、まず、通常のフレームレート(ここでは例えば24,30,60fps等のフレームレート)によって撮像素子11bが駆動される。
このときの状況が図3,図4に示すような状況、即ち撮影者500が撮像装置100を用いて鳥600の飛翔シーンを取ろうとしている状況である場合、撮像部11にて連続的に取得される動画像画像データの各フレームの様子は、図5(a)のようになる。
即ち、動画像画像データの各フレームは全領域データとして連続的に取得される。このときに取得される画像データ(全領域データ)に基づく画像は表示部13において順次表示される(ライブビュー表示)。図5(a)において示す符号T1,T2,T3,T4,T5は、順次取得される全領域データのそれぞれに附されるフレーム番号を意味する経時情報である。この経時情報は、画像データを関連付ける関連情報として、最終的に記録される画像データファイルのメタデータとして記録される。なお、図5には示されていないが、図4で示す矩形領域A0を含む全領域データ、即ち鳥600が飛び立つ直前の全領域データに対応する経時情報を符号T0で表すものとする(不図示)。
このようなライブビュー表示が行われているときの撮像装置100は、連続的に取得される1フレーム毎の画像データについて、画面内の動体を検出する動体検出処理を行っている。そして、所定の1フレームの画像データにおける画面内に動体が検出された場合には、当該フレームの画像データについて画面内のどの領域に動体が位置しているかの判別を行なう。ここで、撮像素子11bは、上述したように、受光面の有効撮像領域(センサ領域)が、複数の領域に分割されて構成されている。したがって、ここで行われる判別は、どの分割領域に動体が位置しているかの判別である。ここでの判別結果は、部分領域データ(第2の画像データ)が全領域データ(第1の画像データ)のどの領域に対応するかを表す情報としての領域情報である。
このようにして、各フレーム毎に動体が検出されて、各画面内における動体が位置している分割領域が判別されると、当該判別された分割領域について、通常フレームレート(例えば24,30,60fps等のフレームレート)よりも高いフレームレート(例えば120fps又はそれ以上のフレームレート)での駆動が開始される。なお、その他のr分割領域は、通常フレームレートでの駆動が継続される。これと同時に、判別された分割領域を含む所定の範囲の部分領域が、例えば図5(a)の符号A1,A2,A3,A4,A5に示すように設定される。そして、この部分領域の画像データが部分領域データ(第2の画像データ)として連続的に取得される。このときの各部分領域データにより表される画像の様子は、図5(b2)のようになる。
このようにして、所定の分割領域(動体が位置する分割領域)での高フレームレートの駆動が開始されると、各フレーム毎に部分領域データが取得される。これと同時に、通常フレームレートで連続的に取得されていた全領域データは、所定のフレームおきの全領域データのみを残して、残されるフレーム間の全領域データは捨てられる(図5(b1)参照)。
この場合において、各フレーム毎の部分領域データ(図5(b2))と、残された全領域データ(図5(b1))との間を関連付ける情報も生成される。この関連付け情報には、通常の撮影情報等に加え、上記領域情報等も含まれる。そして、当該関連付け情報は、各部分領域データのメタデータや、残される全領域データのメタデータとして、対応するデータファイルに付与される。
なお、ここで、関連付け情報は、上述したように画像データのメタデータとして一体に付与する形態のみに限られない。例えば、関連付け情報は、画像データとは別体の個別ファイルとして生成するようにしてもよい。その場合には、当該関連付け情報の個別ファイルは、対応する画像データとの関連が明示されるような所定の形態で紐付けられるように記録されていればよい。
そして、再生動作時には、撮像処理時に捨てられたフレームに対応する部分領域データと、その前後の全領域データとに基づいて、捨てられたフレームの代替フレーム(全領域データ)が生成される。こうして生成された代替フレーム(全領域データ)と、残された全領域データとを連続的に再生することによって、通常フレームレートよりも高いフレームレートの動画像を再生できる。この場合において、動体の部分は、高いフレームレートで取得した画像データを用いているので、高画質な動画像として再生できる。また、画面内において動体以外の部分(静止部分)は、通常フレームレートで取得される全領域データの一部のみを記録するようにしているので、動画像データの全体的なデータ量の削減に寄与することができるという効果を得ることができる。
このようにして、本実施形態の撮像装置100において、ライブビュー画像が表示されているときに、例えば、動画像の撮像動作を開始するレリーズ信号が生じると、通常フレームレートで取得される複数の全領域データのうちの一部の全領域データ(図5(b1))と、各フレーム毎の全ての部分領域データ(図5(b2))とが、関連付けられた状態で、関連付け情報と共に記録される(図5(b))。
なお、この記録動作時においては、例えば上述した作用とは別に、若しくは上述の作用に加えて、図5(a)で画像データ(全領域データ)は、動画像の撮像動作を開始するレリーズ信号が生じた時点以降は、全てのフレームの全領域データを、通常フレームレートによる動画像データとして記録しておくような構成であってもよい。
このようにして記録される画像データファイルは、例えば、図6に示すような形態となる。図6は、本実施形態の撮像装置によって記録される画像データファイルの一形態を概念的に示す図である。
図6に示すように、画像データファイルは、複数の画像データと、領域情報を含む関連付け情報とを含んで構成されている。ここで、複数の画像データは、複数の全領域データ(第1の画像データ)と、複数の部分領域データ(第2の画像データ)とがある。
図示の例では、複数の全領域データ(第1の画像データ)は、経時情報T0,T1,T3,T5に対応する画像データとしている。これらの全領域データの領域情報は「全領域」である。そして、これらの全領域データのフレームレート情報は「30fps」であることが示されている。また、複数の部分領域データ(第2の画像データ)は、経時情報T1,T2,T3,T4,T5に対応する画像データとしている。これらの部分領域データの領域情報は「A1,A2,A3,A4,A5」である。そして、これらの部分領域データのフレームレート情報は「120fps」であることが示されている。
なお、図6の画像データファイルにおいて、画像データ中に付与されている符号(T0,T1,T3,T5,A1,A2,A3,A4,A5)は、メタデータと関連付けされている旨を示す情報として便宜的に付与している符号である。したがって、実際の画像データによって表示される画像中に、これらの符号が表示されることを意味しているわけではない。
図7は、本実施形態の撮像装置によって記録される画像データファイルの別の一形態を概念的に示す図である。
図7に示す画像データファイルの例は、基本的には図6の形態と略同様である。即ち、画像データファイルは、複数の画像データと、領域情報を含む関連付け情報とを含んで構成されている点において、図6の例示と同様である。この図7に示す例では、全領域データ(第1の画像データ)関連の画像データファイルと、部分領域データ(第2の画像データ)関連の画像データファイルとをグループ分けして構成した点が異なる。
図7に示すように、全領域データ(第1の画像データ)関連の画像データファイルは、複数の全領域データ(第1の画像データ)として、経時情報T0,T1,T3,T5に対応する画像データと、これらの全領域データに対応する関連情報であって、対応する部分領域データの有無情報やフレームレート情報、ファイル名情報等が含まれる。また、部分領域データ(第2の画像データ)関連の画像データファイルは、複数の部分領域データ(第2の画像データ)として、経時情報T1,T2,T3,T4,T5に対応する部分領域の画像データと、これらの部分領域データに対応する領域情報(A1,A2,A3,A4,A5)と、フレームレート情報、ファイル名情報等が含まれる。
なお、図6,図7に示す例では、記録される複数の全領域データのうち符号T1,T3,T5に対応する画像データと、これらに対応する複数の部分領域データ(領域情報A1,A3,A5の画像データ)とを共に記録するようにしているが、この形態例に限られることはない。
即ち、全領域データT1,T3,T5には、部分領域データ(領域情報A1,A3,A5の画像データ)が含まれている。したがって、全領域データT1,T3,T5に対応する部分領域データ(A1,A3,A5)については、別データとして記録しなくてもよい。つまり、全領域データが記録されている場合には、記録されている全領域データに対応する部分領域データは記録しない形態としてもよい。
なお、これとは別の記録形態として、部分領域データ(A1,A3,A5)についても別データとして記録しておくようにすれば、部分領域データのみを用いての拡大再生表示(例えば拡大された撮像対象物(ここでは鳥類)のスローモーション動画再生等)を行なうことも可能となる。さらに、部分領域データの1フレーム分を取り出せば、鮮明な静止画像データとして取り扱うこともできる。
このように構成された本実施形態の撮像装置100の作用の概略を、以下に説明する。図8,図9は、本実施形態の撮像装置100(図1参照)の作用の流れを示すフローチャートである。このうち、図8は当該フローチャートの前半部を示し、図9は当該フローチャートの後半部を示している。なお、図8,図9で示されるフローチャートは、図1の構成に基づいて説明する。
本実施形態の撮像装置100が電源オンの起動状態にあるものとする。この場合において、まず、図8のステップS101において、撮像装置100の制御部(図1の連続撮影部110に含まれる制御回路;以下同様)は、現在設定されている動作モードが撮像モードであるか否かの確認を行なう。ここで、撮像モードであることが確認された場合には、次のステップS102の処理に進む。また、撮像モード以外が確認された場合には、ステップS120の処理に進む。
ステップS120において、制御部は、通常の再生モード処理を実行する。その後、ステップS101の処理に戻る。
なお、図8に示す作用の例示では、撮像モード以外の動作モードとして、ステップS120の処理にて再生モードを例示している。そして、この再生モード自体については、従来の撮像装置における再生モード処理と同様の処理がなされるものとして、その詳細な説明は省略している。また、本実施形態の撮像装置100においては、撮像モードと再生モード以外にも、他の動作モード、例えば通信モード,設定モードなどが存在するが、これらの動作モードは、本発明に直接関連しない部分であるので、その詳細は、従来の撮像装置に適用されているものと同様であるとして、それらの説明も省略する。
ステップS101にて撮像モードが設定されていることが確認されて、ステップS101の処理に進むと、このステップS102において、制御部は、撮像部11を制御して撮像動作を実行する。つまり、撮像部11は、画像データを取得し、取得された画像データを表示部に表示する通常のライブビュー表示処理を実行する。これと同時に、制御部は、撮像部11により取得された画像データに基づいて、フレーム内の被写体(動体)を判別する処理を開始する。その後、次のステップS103の処理に進む。このとき、撮像部11は、通常のフレームレートにより撮像動作を行なう制御がなされる。
ステップS103において、制御部は、不図示の手振れ補正機構による手振れ検出結果を考慮しながら、取得された画像データのフレーム内の背景領域(静止領域)を判別する処理を行なう。
続いて、ステップS104において、制御部の動体領域判別部112は、上述の被写体判別処理の結果、判別された動体(背景に対して動きがある被写体)が存在する分割領域(動体領域)を判別する。その後、次のステップS105の処理に進む。なお、動体領域判別部112により行われる動体領域判別処理は、例えばロジックによる処理であってもよいし、推論モデルを利用した処理であってもよい。
ステップS105において、制御部は、静止画像の撮影動作を開始する指示信号が検出されたか否かの確認を行なう。ここで、静止画撮像開始信号が確認された場合には、ステップS113の処理に進む。また、静止画撮像開始信号が確認されない場合(他の指示信号が確認された場合)には、ステップS106の処理に進む。
ステップS106において、制御部は、動画像の撮影動作を開始する指示信号が検出されたか否かの確認を行なう。ここで、動画撮像開始信号が確認された場合には、ステップS107の処理に進む。また、動画撮像開始信号が確認されない場合には、ステップS101の処理に戻る。
ステップS107において、制御部は、動画像の撮像動作を実行する。これと同時に、制御部は、時計部116を参照して計時処理を開始する。この計時処理は、動画撮影動作の開始時点の情報や、撮影継続時間等を取得して、取得された画像データの関連付け情報としての計時情報として記録するための処理である。なお、動画像の撮像動作自体については、従来の撮像装置において行われる動画撮像動作の処理と同様の処理であるものとして、その詳細説明は省略する。その後、図9のステップS108の処理に進む(図8,図9の丸符号9参照)。
ステップS108において、制御部は、高速撮像動作が必要であるか否かの確認を行なう。ここで、高速撮像動作が必要である場合とは、1フレームの画面内に動体が検出されている場合を想定している。即ち、動体が検出されて高速撮像動作を行うべきと判断された場合には、次のステップS109の処理に進む。また、動体が検出されておらず高速撮像動作が不要であると判断された場合には、ステップS114の処理に進む。
ステップS109において、制御部は、動体の存在する領域について対応する分割領域の限定が可能であるか否かの確認を行なう。ここで、分割領域の限定が可能であると判断された場合には、ステップS110の処理に進む。また、分割領域の限定が不可能であると判断された場合には、ステップS114の処理に進む。
なお、分割領域の限定が可能であるか否かの判断とは、例えば次のような状況を想定している。即ち、上述のステップS104の処理による判別結果、即ち動体(上述のステップS102の処理で検出されている)が存在する分割領域が、対応する1フレームの全領域に対して所定以上の広さ(面積)を占めている場合には、当該判別された分割領域での高フレームレートによる撮像動作が困難な場合があり得る。そのような場合には、分割領域の限定が不可能であるものと判断することにする。ここで、全領域に対する所定以上の広さ(面積)とは、例えば、全領域面積に対して判別された分割領域面積が30%程度以上の面積を占めている場合等である。分割領域面積は、小さい程、より高フレームレートでの駆動が容易となる。
ステップS110において、制御部は、分割領域を限定して読み出し処理を行なう。即ち、制御部(のフレームレート変更部113)は、撮像素子の受光面の全領域のうちから動体を含む分割領域について、通常のフレームレートよりも高いフレームレートとする設定変更処理を行なう。そして、制御部は、撮像部11を制御して、当該分割領域について、設定された高フレームレートによる読み出し処理(撮像動作処理)を実行する。
なお、当該ステップS110の処理(分割領域限定読出処理)にて行われる詳細な処理シーケンスについては、図10〜図16によって後述する。
次いで、ステップS111において、制御部は、動画像の撮像動作を終了する指示信号が発生したか否かの確認を行なう。ここで、動画撮像動作終了指示信号の発生が確認されなければ、上述のステップS108の処理に戻る。また、動画撮像動作終了指示信号の発生が確認されると、次のステップS112の処理に進む。つまり、ステップS111の処理においては、制御部は、動画撮像動作終了指示信号の発生が確認されるまで同様の処理を繰り返す。
動画撮像動作終了指示信号が確認されて、ステップS112の処理に進むと、このステップS112において、制御部(の画像データ記録部115)は、取得された領域情報(分割領域に関する情報),計時情報,画像データ(部分領域データ;第2の画像データ)等の記録処理を行なう。なお、ここでは、同時に、制御部(の撮像結果関連付け記録部114)によって、得られた各種情報と対応する画像データとの関連付け処理も行なう。その後、図8のステップS101の処理に戻る(図9,図8の丸符号8参照)。
一方、上述したように、上述のステップS108の処理にて高速撮像動作が不要であると判断された場合と、上述のステップS109の処理にて分割領域の限定が不可能であると判断された場合には、ステップS114に進む。
このステップS114において、制御部は、通常のフレームレートによる撮像処理の実行を継続して行なう。
次いで、ステップS115において、制御部は、動画像の撮像動作を終了する指示信号が発生したか否かの確認を行なう。この確認処理は、上述のステップS111の処理と同様である。即ち、動画撮像動作終了指示信号の発生が確認されなければ、上述のステップS108の処理に戻る。また、動画撮像動作終了指示信号の発生が確認されると、次のステップS116の処理に進む。
ステップS116において、制御部(の画像データ記録部115)は、取得された領域情報(全領域である旨の情報),計時情報,画像データ(部分領域データ;第2の画像データ)等の記録処理を行なうと同時に、制御部(の撮像結果関連付け記録部114)による関連付け処理も行なう。この記録処理は、上述のステップS112の処理と同様である。その後、図8のステップS101の処理に戻る(図9,図8の丸符号8参照)。
一方、上述のステップS105の処理にて、静止画撮像開始信号が検出されて、ステップS113の処理に進むと、このステップS113にて、制御部は、静止画像の撮像動作を実行する。その後、ステップS101の処理に戻る。なお、静止画像の撮像動作については、従来の撮像装置において行われる静止画撮像動作の処理と同様の処理が行われるものとして、詳細説明は省略する。
なお、上述の図8,図9で示す作用例では、動画撮像時に得られる動画像データに基づいて動体検出を行う処理としているが、この例に限られることはない。例えば、静止画撮像モードにおいて、静止画像の連続撮影動作を行った結果で取得される複数の静止画像データに基づいて同様の処理(動体を判別し、通常フレームレートで取得する全領域データ(第1の画像データ)と高フレームレートで取得する(第2の画像データ)とを取得する処理等)を行うようにしてもよい。
また、上述した作用例では、図9のステップS108以降の処理は、動画撮像動作信号の発生後、即ち記録を伴う動画像撮像動作中の処理としているが、この例に限られることはない。例えば、ステップS108以上の処理を、ライブビュー表示処理時に実行するようにしてもよい。
ここで、上述のステップS110(図9参照)の処理にて行われる詳細を、図10〜図16を用いて以下に説明する。図10〜図16は、本実施形態の撮像装置100の作用の概略を説明する説明図である。
このうち、図10は、本実施形態の撮像装置100を用いて、球技シーン(例示はサッカー)におけるボールの動きを動画像として撮像する際の様子を示す概念図である。
図10において、太線で示す矩形枠(符号13A)は、撮像装置100の撮像素子11bによって取得し得る画像データの1フレーム分の全領域を示している。つまり、矩形枠を示す符号13Aは、撮像素子11bの受光面の有効撮像領域(センサ領域)に対応する。したがって、以下の説明において矩形枠で示す符号13Aを、全領域画像13Aと呼称することにする。
ここで、当該全領域画像13Aは、上述したように、複数の領域に分割した形態で構成されている。そして、全領域画像13Aの各領域を分割領域というものとする。これらの分割領域のそれぞれは、各領域毎に異なるフレームレートで駆動制御することができるように制御され管理されている。この場合において、各分割領域に設定できるフレームレートは、例えば任意の数値に、若しくは予め決められた数値(例えば120fps,240fps等)毎に複数段階で設定できるようになっているものとする。
図10に示す例では、全領域画像13Aに対し、長辺(横)方向に8つ、短辺(縦)方向に5つの分割領域が並べて配置されているものとしている。そして、全領域画像13Aは、合計40個の分割領域によって構成されている形態としている。換言すると、撮像素子11bの受光面は、横8x縦5=40個の分割領域で構成されているものとしている。
なお、これら複数の分割領域を明示するために、図10において、全領域画像13Aの長辺方向においては右から順に数字の1〜8を割り当てると共に、同短辺方向においては上から順にローマ字アルファベットのA〜Eを割り当てることにする。そして、これらの数字及び英アルファベットの組み合わせによって、全領域画像13Aの画面枠内における複数の分割領域の位置を特定することにする。具体的には、例えば図10において、全領域画像13Aの右上隅の分割領域は、位置A1として特定することができる。同様に、全領域画像13Aの右下隅の分割領域は、位置E1として特定される。
図10に示す例示は、球技(サッカー)にて競技者503がシュートを行なうシーンを想定している。ここで、ボールを動体とし、画面外にいる競技者503が蹴ったボールがゴール内に飛び込むまでの間のボールの動きを動画像として記録する状況を概念的に示している。
なお、図10においては、動画像であることを示すために、各フレーム毎の画像を重ねた形態で概念的に示している。したがって、同図10においては、撮影対象動体としてのボールが画面内を所定時間毎に移動する際の6つのフレームを重ねた形態で図示されている。
また、図10においては、説明の便宜上から、撮像素子11bの全領域画像13Aから外れた領域の状況、即ち画面外にいる競技者503及び当該競技者503が蹴った直後であって画面外にあるボールをも合わせて図示している。
ここで、符号T1〜T7は、通常フレームレートで連続的に取得された各フレームに対応する画像を示すものである。このうち、符号T1は画面外のフレームに対応する画像に付されているものとする。また、符号T2〜T7は、符号T1の後に順次取得されるフレーム毎の画像にそれぞれ対応させて付されているものとする。
図11〜図15は、図10に示す全領域画像13Aのうちの一部の領域を拡大して示す要部拡大概念図である。なお、図11〜図14においては、具体的には、符号T2,T3の2フレーム分に対応する画像((ボール(動体))を示している。なお、図14,図15においては、さらに、符号T4,T5の2フレーム分に対応する画像((ボール(動体))をも同時に示している。
このような(図10に示す)状況下において、競技者503がボールを蹴り飛ばしたときに、当該ボールが画面内で移動する際の部分領域を推定し、推定された部分領域に対応する分割領域のフレームレートのみを高速に設定する処理(分割領域限定読出処理)の具体的な作用の流れを、簡単に説明する。
まず、当該処理(分割領域限定読出処理)は、簡略に言うと、通常フレームレートで連続的に取得される全領域データ毎に対象とする動体を検出し、検出した動体のベクトル(以下、動体ベクトルという)を判別して、当該動体ベクトルから動体の次の移動先の領域を予測し、動体が予測領域に入る以前に当該予測領域のフレームレート設定を変更する処理である。ここで、動体ベクトルは画面内における像の動きを表すことになるので、例えばスポットライト等のように、実体の無いものを対象物としても、動きとして処理することができる。
このような処理により、1フレームの画面内において動体ベクトルが所定値より低いである(動きがない)対象物が含まれる分割領域は通常のフレームレートで駆動し、動体ベクトルが所定値以上の対象物が含まれる分割領域のみを高いフレームレートで駆動することができる。ここで設定される高いフレームレートとは、予めメニュー設定等によって使用者(ユーザ)が設定するフレームレート値である。
そして、高フレームレートで取得した分割領域の部分領域データと、全領域データとを用いて、対応する全領域データを作成する。これにより、動画像データの情報量(データ容量)を削減することができる。
なお、動体ベクトルの対応領域が所定以上に広い場合には、通常の場合に設定される高フレームレートよりも低いフレームレートであって、通常フレームレートよりも高いフレームレートとなるような設定もできる。即ち、動体ベクトルを含む場合に高フレームレートに設定するとき、動体ベクトルの領域の広狭によってフレームレートの設定を段階的に設定できる。
以上の分割領域限定読出処理について、さらに詳しい説明を以下に示す。
まず、図10に示すような状況において、撮影者(不図示)が保持する撮像装置100の表示部13の背面パネルには、撮像素子11bによって順次取得された画像データに基づいて生成された全領域画像13Aが連続的に表示されるライブビュー表示が行われている。このとき、上述したように、撮像装置100はライブビュー画像の各フレームに対応する各画像データ基づいて動体検出処理を同時に実行している。ここで、動体検出処理は、予め登録されたデータベースを参照し、所定の時点で取得された1フレーム分の画像データに基づく画像の画面内に動体としてのボールを検出する処理である。
ここで、画面外の競技者503がボールを蹴ったときには、ボールは、符号T1から符号T2,T3,……,T7へと移動するものとする。この場合において、ボールが符号T2に示す位置に到達したとき(つまりボールが全領域画像13Aで示される画面枠内に入ったとき)、実行中の動体検出処理によって当該ボールが動体として検出される。
こうして、図10,図11の符号T2の位置にてボールが動体として検出されると、当該ボールの位置に対応する分割領域D1,E1が判別される。
こうして、対象動体であるボールに対応する分割領域D1,E1が判別された時点で、当該分割領域について、通常フレームレートよりも高いフレームレートでの駆動を開始させる。この場合に設定される高フレームレート値は、予めメニュー設定等によって使用者(ユーザ)が設定しておいたフレームレート値である。
次に、動体として検出された(符号T2の位置する)ボールの像に対し、図11に示すように、外接矩形領域S2を設定する。
次に、符号T2に位置するボールが、当該画面内において、その後、どのように移動するのかを予測する処理を行なう。そのためには、まず、符号T2の次の1フレーム分の画像データについて、ボールの位置を検出する。ここでは、図10〜図12に示すように、ボールは、符号T2の位置から符号T3の位置に移動するものとしている。こうして、符号T3に位置するボールが検出されたら、当該符号T3のボールの像に対しても、図12に示すように、外接矩形領域S3を同様に設定する。
なお、符号T3のボール位置が検出されたら、対応する分割領域C1,C2,D1,D2の4つの分割領域について、高フレームレートによる駆動を開始させる。同時に、この時点までに高フレームレートで駆動していた分割領域(符号T2のボール位置に対応する分割領域D1,E1)のうち分割領域E1については、通常フレームレートでの駆動に戻す。なお、ここで、分割領域D1については、上述したように、符号T3のボール位置に対応する分割領域となっているので継続して高フレームレートでの駆動が行われる。
このようにして、符号T2と符号T3のそれぞれのボールの位置が検出されることにより、当該ボールの飛翔方向が判別できる。即ち、図12に示すように、符号T2の位置のボールに対応する外接矩形領域S2の四隅のうちの一点U2と、符号T3の位置のボールに対応する外接矩形領域S3の四隅のうち上記一点U2に対応する同位置の一点U3とを直線で結ぶ。こうすることにより、ボールの飛翔方向と速度を示す動体ベクトルV1を示すことができる。このようにしてボールの飛翔方向の動体ベクトルV1が求められると、この動体ベクトルV1に基づいて、符号T3の位置以後にボールが飛翔していく予想範囲を推定することができる。
そのために、例えば、図13に示すように、符号U2を始点とする動体ベクトルV1を基準として、所定の角度R1(具体的には例えば±25度程度)の範囲で、かつ動体ベクトルV1に沿う所定の長さの範囲を設定すると、略扇形状のボール飛翔予想範囲E1が設定できる(図14の一点鎖線参照)。この場合において、当該扇形状の予想範囲E1を設定するための角度や長さ等のパラメータは、例えば動体としてのボールの飛翔速度値等を考慮して自動的に設定されるものとする。したがって、そのための各種のデータも、上記データベースに含まれているものとする。
同様に、図14に示すように、外接矩形領域S2の符号U2以外の2つの点U2a,U2bのそれぞれと、予想範囲E1とによって、図14に示すように、外接矩形領域S2の移動予想範囲E2(図14の二点鎖線参照)を設定できる。
こうして、ボールの飛翔する予想範囲(外接矩形領域S2の移動予想範囲E2)が設定されると、当該予想範囲E2が含まれる分割領域(符号B1,B2,B3,C1,C2,C3,D1,D2,D3)について高フレームレートで駆動すればよいことが判別できる。
なお、このうち分割領域C1,C2,D1,D2については、上述したように、符号T3を検出した際に高フレームレートによる駆動が開始されている。
このような一連の処理を、ボールが飛翔している間に、ボールを追尾しながら、各フレーム毎に繰り返し行えば、高フレームレートで駆動すべき分割領域を、動体としてのボールが到達する前に予測し実行することができる。
したがって、ボールの画面内の移動に伴って、対応する分割領域のフレームレートを切り換えることによって、画面内を動体が動く際に、動体が位置する狭い領域のみを高フレームレートで駆動させるように制御することができる。
なお、上述の例示では、ボールの飛翔予測をするための画像データとして、符号T2に対応する1フレームの次の1フレームを符号T3としている。上述したように、符号T2,T3…で示す各フレームは、通常フレームレートで連続的に取得した複数の画像データである。
しかし、上述したように、例えば所定の時点(符号T2にボールが位置するとき)に動体としてのボールを検出するように構成している。このように、当該符号T2にボールが位置することが検出されると、画面内の所定の分割領域D1,E1については、高フレームレートで駆動する処理が開始されている。
したがって、通常フレームレートでの所定の時点で示す位置(例えば符号T3)にボールが到達する前の所定の時点、ボールが含まれる特定の狭領域の画像データ(ここではセンサ分割領域D1,E1)が取得されている。
具体的に示すと、例えば、図15に示す符号T2と符号T3との間の符号T2.1や符号T2.2は、符号T2で示す所定の時点の後に高フレームレートで取得された分割領域D1の画像データの2フレーム分の画像データに含まれるボールの各位置を示している。
したがって、上述のボール飛翔予測範囲の設定処理を、所定の時点(符号T2)と、その次の時点(符号T2.1)とに対応する各画像データに基づいて行うようにしてもよい。そのようにすれば、より正確な飛翔予測が可能となる。
なお、ボール以外の他の動体、例えば図10に示す例では、競技者や審判等の他の動体が画面内(全領域画像13A内)に入ってくる状況が考えられる。このような場合には、高いフレームレートに設定して駆動しなければならない分割領域が増加してしまう。
したがって、このような状況になった場合には、制御部10の情報処理能力を超えてしまうので、設定された高フレームレートを、処理能力に見合ったフレームレートに下げる処理を行なうような制御を行うようにしてもよい。
このような制御処理を加えれば、動体撮像時において、可能な限り高精細な撮影を行うことができる。
また、動体領域を含む分割領域に対する高フレームレートへの切り換えを行う際には、通常のフレームレートと、それより高いフレームレートの二種類の設定であってもよいし、これに限らず、例えば状況に応じて、高フレームレートを二段階設定とするような設定でもよい。さらに、フレームレートの設定は、検出された動体の種類や速度,移動距離等の各種パラメータに応じて適宜自動的に設定するようにしてもよい。
このように、動体に着目して、より高いフレームレートでの駆動を行うような動画撮影では、例えば、スポーツ競技における審判の判定補助等(具体的には例えばボールのラインイン,ラインアウトのビデオ判定等)として活用することができる。
以上のような分割領域限定読出処理の流れを、図16のフローチャートによって簡単に説明する。図16は、図9のステップS110の処理、即ち分割領域限定読出処理の詳細を示すフローチャートである。
まず、図16のステップS201において、制御部は、ライブビュー画像の各フレームに対応する各画像データ基づいて動体検出処理を実行する。
ステップS202において、制御部は、検出された動体が位置する領域(動体領域という)が所定の範囲以内であれば、その動体領域を含む分割領域を高いフレームレートに設定する処理(フレームレートアップ処理)を実行する。
ステップS203において、制御部は、動体ベクトル(方向,速度)を設定すると共に、分割領域判別処理及びフレームレート設定処理を実行する。ここで、フレームレート設定処理は、予めメニュー設定等によって使用者(ユーザ)が設定しておいたフレームレート値である。また、フレームレート設定処理の他の形態としては、例えば、推論モデルを利用して任意に設定するようにしてもよい。
ステップS204において、制御部は、判別された分割領域の範囲が所定の範囲よりも大きいか否かの確認を行なう。ここで、判別された分割領域の範囲が、所定の範囲よりも大きい場合には、ステップS205の処理に進む。また、判別された分割領域の範囲が、所定の範囲以内であれば、ステップS207の処理に進む。
続いて、ステップS205において、制御部は、当該判別された分割領域のフレームレートを通常のフレームレートに設定する。その後、図8の元の処理に戻る(リターン)。ここで、通常のフレームレートに戻す処理を行なうのは、設定された高フレームレートでの駆動では、データ容量が大きく負荷が大きくなってしまうことにより、処理しきれない等の可能性が考えられるためである。
ステップS207において、制御部は、動体方向に対応する分割領域を高いフレームレートで駆動する設定を行なう(フレームレートアップ処理)。その後、図8の元の処理に戻る(リターン)。
次に、本実施形態の撮像装置100の別の形態の作用について、以下に説明する。図17〜図19は、本実施形態の撮像装置100の作用の変形例を示すフローチャートである。このうち、図17は本実施形態の撮像装置における撮像モード時の動作シーケンスの変形例を示すフローチャートである。図18は当該撮像装置における再生モード時及び推論モデル生成モード時の動作シーケンスを示すフローチャートである。図19は当該撮像装置と連携する外部機器側の処理シーケンスを示すフローチャートである。これら図17〜図19で示されるフローチャートは、図2に示す構成に基づいて説明する。
撮像装置100は、電源オンの起動状態にあるものとする。この場合において、まず、図17のステップS301において、制御部10は、現在設定されている動作モードが撮像モードであるか否かの確認を行なう。ここで、撮像モードであることが確認された場合には、次のステップS302の処理に進む。また、撮像モード以外が確認された場合には、図18のステップS321の処理に進む。
ステップS302において、制御部10は、撮像部11を制御して撮像動作を実行する。つまり、撮像部11は、画像データを取得し、取得された画像データを表示部に表示する通常のライブビュー表示処理を実行する。これと同時に、制御部10は、時計部116を参照して計時処理を開始する。さらに、制御部は、図示していないが、撮像部11により取得された画像データに基づいて、フレーム内の被写体(動体)を判別する処理を開始する。その後、次のステップS303の処理に進む。なお、上述のライブビュー表示処理の際には、制御部10は、通常のフレームレートによる撮像動作を行なうように、撮像部11を制御する。
ステップS303において、制御部10は、推論エンジン16を用いた動体検出処理を行なう。
続いて、ステップS304において、制御部10は、上述のステップS303の検出結果の信頼性が高いか否かの確認を行なう。ここで、信頼性が高いと判断された場合には、ステップS305の処理に進む。また、信頼性が高いと判断されなかった場合には、ステップS307の処理に進む。
ステップS305において、制御部10は、動体が含まれる分割領域の選択処理を実行する。
続いて、ステップS306において、制御部10は、選択された分割領域の仮記録処理を実行する。
次に、ステップS307において、制御部10は、動画撮像動作の開始指示信号の確認を行なう。ここで、動画撮像動作開始指示信号が確認されると、ステップS308の処理に進む。また、動画撮像動作開始指示信号が確認されなかった場合には、ステップS301の処理に戻る。
ステップS308において、制御部10は、推論エンジン16を用いた動体検出処理を行なう(ステップS303と同様の処理)。
ステップS309において、制御部10は、上述のステップS308の検出結果の信頼性が高いか否かの確認を行なう。ここで、信頼性が高いと判断された場合には、ステップS310の処理に進む。また、信頼性が高いと判断されなかった場合には、ステップS313の処理に進む(ステップS304と同様の処理)。
ステップS310において、制御部10は、動体が含まれる分割領域の選択処理を実行する(ステップS305と同様の処理)。
続いて、ステップS311において、制御部10は、選択された分割領域のフレームレートの変更処理及び記録処理を実行する。加えて、計時結果や領域位置情報の記録も行なう。これら各種の情報は、対応する動画像データに関連付けられて記録される。
次に、ステップS312において、制御部10は、動画撮像動作の終了指示信号の確認を行なう。ここで、動画撮像動作終了指示信号が確認されると、ステップS314の処理に進む。また、動画撮像動作終了指示信号が確認されなかった場合には、ステップS301の処理に戻る。
ステップS314において、制御部10は、動画像データの記録処理を実行する。その後、ステップS301の処理に戻る。
一方、上述のステップS309の処理にて、動体検出結果の信頼性が高いと判断されなかった場合にステップS313の処理に進むと、このステップS313において、制御部10は、全領域データの記録処理を実行する。加えて、計時結果も記録する。その後、ステップS312の処理に進む。
他方、上述のステップS301の処理にて、現在設定されている動作モードが撮像モード以外であることが確認されて、図18のステップS321の処理に進むと、このステップS321にて、制御部10は、現在設定されている動作モードが再生モードであるか否かの確認を行なう。ここで、再生モードであることが確認された場合には、次のステップS322の処理に進む。また、再生モード以外が確認された場合には、ステップS331の処理に進む。
ステップS322以降において、制御部10は、通常の再生モード処理を実行する。即ち、ステップS322において、制御部10は、一覧表示処理を実行する。この一覧表示処理は、記録媒体に記録済みの画像データを一覧形式で表示する一般的な処理である。
続いて、ステップS323において、制御部10は、選択再生処理を実行する。この選択再生処理は、使用者(ユーザ)の選択操作指示を受けて、対応する画像データを記録媒体から読み出して、当該読み出された画像データの基づく画像(静止画像若しくは動画像)を再生表示する処理である。
この場合における再生表示処理については、本実施形態の撮像装置では、上述のようにして取得された動画像データに基づく再生処理に若干特徴がある。
即ち、まず、ステップS324において、制御部10は、選択された画像データが、撮像動作時にフレームレート変更を伴って記録された動画像データか否かの確認を行なう。ここで、該当する動画像データである場合には、ステップS325の処理に進む。また、非該当の場合には、通常の再生動作を実行した後、ステップS326の処理にすすむ。
ステップS325において、制御部10は、各種形態による動画像表示処理を実行する。ここで行われる動画像表示処理としては、例えば、通常フレームレートで取得された全領域データ(第1の画像データ)と、当該全領域データの動体領域以外の部分と部分領域データ(第2の画像データ)及び動体位置情報を用いて(合成処理若しくは重畳表示処理等によって)作成された全領域データとによって生成した動画像表示や、このようにして作成した動画像データに基づくスローモーション表示、または部分領域データのみを用いた部分拡大スローモーション表示等、各種の形態の再生表示動作を行うことができる。このような再生表示処理が終了すると、再度、一覧表示及び選択指示の待機状態になる。
次に、ステップS326において、制御部10は、再生動作終了指示信号の有無を確認する。ここで、再生動作終了指示信号が確認されると、当該再生モード処理を抜けて、図17のステップS301の処理に戻る。また、再生動作終了指示信号が確認されない場合には、上述のステップS324の処理に戻り、以降の処理ステップを繰り返す。
一方、上述のステップS321の処理にて、再生モード以外が確認されて、ステップS331の処理に進むと、このステップS331において、制御部10は、推論モデルの作成依頼指示信号の有無を確認する。ここで、推論モデルの作成依頼指示信号が確認されると、次のステップS332の処理に進む。また、推論モデルの作成依頼指示信号が確認されない場合は、ステップS334の処理に進む。
続いて、ステップS332において、制御部10は、対象物設定処理を実行する。この対象物設定処理は、所望の被写体(動体)についての情報を入力し設定する処理等である。
次に、ステップS333において、制御部10は、学習依頼処理を実行する。この学習依頼処理は、例えば、当該撮像装置100と外部機器200とをデータ通信によって連携させ、外部機器200に対して、入力設定した所望の被写体(動体)に関する推論モデルを作成するための学習を依頼(リクエスト)するといった処理等である。その後、図17のステップS301の処理に戻る。
他方、上述のステップS331の処理にて、推論モデルの作成依頼指示信号が確認されずにステップS334の処理に進むと、このステップS334において、制御部10は、推論モデルの取得指示信号の確認を行なう。ここで、推論モデル取得指示信号が確認された場合には、ステップS335の処理に進む。また、推論モデル取得指示信号が確認されない場合は、図17のステップS301の処理に戻る。
ステップS335において、制御部10は、外部機器200との通信による、所望する推論モデルのダウンロード(取得)処理及び記録処理を実行する。その後、図17のステップS301の処理に戻る。
なお、図17,図18に示す作用の例示では、撮像モード以外の動作モードとして、ステップS321以降の処理にて再生モードを例示し、ステップS331以降の処理にて推論モデルの作成処理を示し、さらにステップS334以降の処理にて推論モデルのダウンロード(取得)処理等を例示している。
これらの各処理については、本発明に直接関連しない部分であるので簡単な説明に留めている。また、本実施形態の撮像装置100においては、これらの動作モード以外にも、他の動作モード、例えば通信モード,設定モードなどが存在するが、これらの動作モードについても、本発明に直接関連しない部分であるので、その詳細は、従来の撮像装置に適用されているものと同様であるとして、それらの説明を省略している。
次に、本実施形態の撮像装置100と連携して動作する外部機器200の作用を、図19のフローチャートを用いて以下に説明する。
まず、図19のステップS401において、外部機器200の制御部(不図示;制御回路;プロセッサ)は、撮像装置100等の依頼元からの学習依頼指示の有無を確認する。ここで、学習依頼指示が確認された場合には、ステップS402の処理に進む。また、学習依頼指示が確認されない場合には、ステップS421の処理に進む。
ステップS402において、制御部は、タイトルや代表画像に基づいて所望の対象物に類似する類似対象物の連続画像データ群(動画データを含む)を学習参考用画像データ群として取得する処理を行なう。
続いて、ステップS403において、制御部は、取得した類似対象物の連続画像データ群のうちから動体を含む領域が判定できる画像データ群を選択する処理を行なう。連続画像データ群の各フレームの画像データのそれぞれにおいて、背景が静止しており、動体が動いているといった状況の画像データの場合、動体を含む一部の領域を検出することは簡単に検出することができるようになっている。また、このような場合において、背景領域が手振れなどで揺れており、完全に静止した状態になくても、そのような背景の中で動いている部分を検出することは、動きベクトルの検出や解析処理などによって検出することができるようになっている。ここで、図5(b2)に示すような切り出し処理を行うには、いくつかの考え方がある。例えば、まず第1に、動いている動体(鳥)の輪郭の全てが含まれるように切り出し処理を行なう場合が考えられる(単純切出処理というものとする)。第2に、同じ画面内で動いている部分が特定の場所に留まるように精密な切り出し処理を行なう場合が考えられる(精密切出処理というものとする)。このことは、再生する時に、図4のように、背景に対して切り出した部分を重ねた形態で再生表示する場合と、動体(鳥)の羽ばたきを目視で解析できるようにするために、動体(鳥)の部分だけを再生する場合とで、切出処理を異ならせて行なうようにする。前者(単純切出処理)の場合は、切り出した画像が背景を含む全体の中でどの部分に相当するかを座標などで管理できるようにすればよい。この場合、切り出し処理の対象範囲などが変化しても再生時に不自然さを感じるという問題は生じない。後者(精密切出処理)の場合は、例えば動体(鳥)が動かしていないところは止まって見えるようにし、動いているところだけを動かすように表示するために、切り出し処理の範囲や切り出した画像内における対象物の位置などの管理が重要となる。使用者(ユーザ)が、どちらのタイプの再生を行おうとするかによって、学習に使う画像は変えた方が望ましい。しかしながら、厳密でなくても良い場合には、同じ学習データを用いて切出処理を行うようにすればよい。
ステップS404において、制御部は、選択画像データのうちから、動体が動く前から画面内に存在する動体を選択する処理を先に示したように実行する。これは、撮影時に推論モデルの出力に相当する画像部分の設定と言える。この選択された部分領域は、教師データを作るときのアノテーション(メタデータ;関連情報)に相当するので、一フレームずつ動く対象物がはみ出さないように対象物の輪郭や濃淡などを各フレームごとに判定して切り出す。また、これとは別に、前後のフレームを比較して動いていない背景部分を除去する切り出し処理の方法もある。なお、このような切出処理を手動によって行ってもよい。簡単な方法としては、対象物を含む矩形状の範囲を余白を大きめにして選択して切り出し処理を行なう。このようにして得られた画像の前後のフレームを比較して、対象物の動いていない画像部分を揃えて同じ大きさ(範囲)となるようにした上で、矩形状の範囲がフレーム毎に一致するように、余白部を削って切り出すという方法がある。このような複雑な切り出し処理を、瞬時に実行可能とするために、教師データが作られる。なお、この工程のいくつかは省略したり変更したりすることが可能である。
続いて、ステップS405において、制御部は、1フレームの全領域データと、その中で動体を含む部分領域データ、或いはこれから動き出そうとする動体を含む部分領域データを教師データ化する処理を行なう。上述のようにして、全領域データと選択された部分領域データの関係を入出力とする推論モデルを学習する時の教師データが生成される。
つまり、教師データは、あらかじめ得られていた連続した画像の各フレームから対象となる動体の部分を判定し、この動体部分の輪郭が収まるような余白を含む範囲の切り出し処理を行っている。このとき、切り出し時の余白が大きいと画像データが増えてしまうので、当該余白部分は少ない方が望ましい。また、余白を仮決めして画像の切り出しを行ったあとに、各フレームの切り出した部分を重ねて、動いていない部分を揃える切り出し処理をさらに行うようにしてもよい。単純に表現すると、あらかじめ得られた連続したフレームからなる画像群の各フレームの動体部分を含む矩形画像部分(座標情報なども含む)をアノテーション情報とした動画フレームを教師データというものとする。撮像素子によっては、矩形状でなくとも切り出しやすいタイプがあるが、矩形状の切り出し処理とするのが単純で扱いやすいと考えられる。これによって、図2の推論エンジンに適応される推論モデルは、簡単に動体部分を含む適切な範囲を各フレームから切り出し可能となる。そして、得られたライブビュー画像から順次切り出し範囲を、座標情報も含め判定できる。
次に、 ステップS406において、制御部は、全領域データを入力画像データとし、そのうちの選択された部分領域を出力画像データとして設定する。
ステップS407において、制御部は、所定の推論モデル化処理を実行する。
続いて、ステップS408において、制御部は、推論の信頼性が所定値以上であるか否かの確認を行なう。ここで、推論の信頼性が所定値以上であることが確認された場合には、ステップS409の処理に進む。また、推論の信頼性が所定値未満であることが確認されると、ステップS410の処理に進む。
ステップS409において、制御部は、作成された推論モデルの記録処理を実行する。
一方、 ステップS410において、制御部は、教師データの再設定処理等を実行する。
続いて、ステップS411において、制御部は、所定回数以上の繰り返し処理を行ったか否かの確認を行なう。ここで、所定回数以上であることが確認された場合には、ステップS412の処理に進む。また、所定回数未満であることが確認されると、ステップS407の処理に戻り、以降の処理を繰り返す。
ステップS412において、制御部は、所望の画像が苦手画像情報である旨を送信する処理を行なう。ここで、苦手画像情報送信処理は、例えば推論モデルを作成するのに際して設定した教師データを用いて所定の学習を行った場合に、高い信頼性を得ることが必ずしも期待できない旨の情報を、学習部201へと送信する。その後、ステップS409の処理に進む。
一方、上述のステップS401において、撮像装置100等の依頼元から学習依頼が確認されずにステップS421の処理に進むと、このステップS421において、制御部は、学習結果の送信依頼が撮像装置100から出されているか否かの確認を行なう。ここで、撮像装置100からの学習結果送信依頼が確認された場合には、次のステップS422の処理に進む。また、撮像装置100からの学習結果送信依頼が確認されない場合には、ステップS401の処理に戻る。
ステップS422において、制御部は、作成済みの推論モデルを撮像装置100等の依頼元へと送信する処理を実行する。その後、ステップS401の処理に戻る。
なお、図19に示す例では、当該外部機器200は、撮像装置100等の依頼元からの送信依頼指示を待って、作成した推論モデル等の情報を送信するようにしているが、この形態に限られることはない。例えば、推論モデルの作成が完了したら、送信依頼を待たずに作成完了後に、自発的に依頼元へと送信するようにしてもよい。
以上説明したように上記第1の実施形態によれば、記録装置である撮像装置100は、通常のフレームレートで連続的に取得された第1の画像データ(全領域データ)の領域毎の特徴に応じて上記第1の画像データ(全領域データ)の一部画像領域(部分領域)を上記第1の画像データ(全領域データ)より高いフレームレートで取得した第2の画像データ(部分領域データ)と、上記第2の画像データ(部分領域データ)が上記第1の画像データ(全領域データ)のどの領域に対応するかを表す領域情報とを関連付けて記録する連続撮影部110(制御部10)を具備し、上記一部画像領域(部分領域;動体を含む領域)を判別する時に上記領域毎の特徴として検出された動体の位置に応じて領域候補(撮像素子の分割領域の画像データ)を出力する領域候補判別部(動体領域判別部112)を具備している。
この構成により、本実施形態の撮像装置100は、撮像モードにおいてライブビュー画像表示動作中であっても、撮像部11によって連続的に取得される複数の画像データ(全領域データ;第1の画像データ)に基づいて各フレームに含まれる動体を検出し、当該動体を含む部分領域のみを高いフレームレートで駆動することにより、通常のフレームレートで全領域データ(第1の画像データ)を取得しながら、同時に複数の部分領域データ(第2の画像データ)を取得することができる。これにより、連続的に取得される画像データの全体的なデータ容量を抑制することができる。
また、こうして取得された通常フレームレートで取得された複数の全領域データ(第1の画像データ)と、高いフレームレートで取得された複数の部分領域データ(第2の画像データ)とに基づいて、複数の部分領域データ(第2の画像データ)のそれぞれに対応する全領域データ(第1の画像データ)を生成することができる。これにより、高いフレームレートで全領域データ常に取得せずとも、高いフレームレートでの再生を行なうことができる。
したがって、例えば撮像対象とする動体の動きをより鮮明に再生することができるようになる。また、例えば当該動体のスローモーション再生を行なうことができる。さらに、複数の部分領域データのみを用いて再生動作を行うことにより、撮像対象とした動体の動きを拡大した鮮明な画像で表示したり、拡大スローモーション表示を行うこともできる。このように、再生動作時における多彩な表示形態を容易に実現することができる。
そして、領域候補判別部(動体領域判別部112)は、第1の画像データ(全領域データ)のうちの一部画像領域(部分領域;動体を含む領域)を判別する時に上記領域毎の特徴としての動体を検出する際に推論モデルを利用している。
このような構成により、本実施形態の撮像装置100は、1フレームの画面内での動体の移動先の位置を予測することができるので、常に確実かつ正確に、しかも迅速に動体の位置を判別することができる。
上述した実施形態においては、通常形態の撮像装置100を用いて、一般的な対象物(例えば鳥の飛翔シーンやサッカー等の球技におけるボールの軌跡(シュートシーン)等)を撮像対象とする状況を例示したが、動体を撮像対象とする状況は、他にも考えられる。例えば、光学顕微鏡等を用いて細胞等の微小な動体を拡大して撮像するといった状況等において、光学顕微鏡観察下での細胞分裂の様子や微生物の成長過程等を動体の具体例として考慮することができる。さらに、このほか、内視鏡観察下の動画撮影において、例えば生体内部、例えば臓器内部の動体観察等であっても、本発明は全く同様に適用することができる。
図20,図21は、光学顕微鏡観察下において微小動体を撮像対象物とした場合の状況を概念的に示す図である。このうち図20は、本発明の記録装置である撮像装置の一形態としての光学顕微鏡の概略的な外観を示す図である。図21は、図20の光学顕微鏡を用いて微小動体としての細胞の細胞分裂を撮像対象とした場合に取得される画像データに基づいて表示される画像を概念的に示す図である。
図20に示すように、光学顕微鏡100Aは、接眼レンズ11aa及び対物レンズ11abを有し、ステージ101上に載置された撮像対象物を光学的に拡大観察するための装置である。さらに、当該光学顕微鏡100Aは、撮像部11と、撮像部11等を制御する制御回路を備えたプロセッサ等からなる制御部(不図示)等を有して構成されている。これにより、当該光学顕微鏡100Aは、光学像を電子的な画像データとして取得し、記録することのできる記録装置であり撮像装置として機能するように構成されている。なお、当該光学顕微鏡100Aにおける構成において、その他の基本的な構成部分については、上述の一実施形態の記録装置である撮像装置100と略同様であるものとする(図2参照)。
このような形態の光学顕微鏡100Aを用いて取得される画像データは、図21に示すような形態である。図21において、太線で示す矩形枠(符号13A)は、光学顕微鏡100Aの撮像部11Aに含まれる撮像素子(不図示)によって取得し得る画像データの1フレーム分の全領域画像を示している。
当該全領域画像13Aは、複数の領域に分割した形態で構成されている点において、上述の撮像装置100と同様である。即ち、全領域画像13Aの各領域(分割領域)のそれぞれは、各領域毎に異なるフレームレートで駆動制御することができるように制御され管理されている。
図21に示す例では、全領域画像13Aに対し、長辺(横)方向に5つ、短辺(縦)方向に5つの分割領域が並べて配置されている例を示している。これにより、全領域画像13Aは、合計25個の分割領域によって構成されている形態としている。
なお、これら複数の分割領域のそれぞれを特定するための手段は、上述の一実施形態で説明したものと同様である。即ち、図21においては、全領域画像13Aの長辺方向においては右から順に数字の1〜5を割り当て、短辺方向においては上から順にローマ字アルファベットのA〜Eを割り当てている。これにより、例えば図21において、全領域画像13Aの右上隅の分割領域は、位置A1として特定できる。
図21に示す例示は、顕微鏡観察下において、細胞が分裂するシーンを想定して図示している。ここで、細胞611aを動体として概念的に示している。
このような状況下においても、細胞611aが細胞分裂をする際の動きを、撮像対象とする動体として見ることで、上述の一実施形態と全く同様の作用により、同様の効果を得ることができる。
例えば、観察画面内のどの細胞が分裂しそうかどうかを予測して(動体予測)、その予測した対象動体領域を含む分割領域のみを高いフレームレートで駆動することで、例えば拡大動画やスローモーション表示等を行なうことができるようになる。
なお、上述した実施形態においては、主に動画像撮影時の状況を例に挙げて説明しているが、この例に限られることはない。本発明は、例えば静止画像を連続的に高速で撮影する場合(いわゆる連続撮影動作の場合)であっても、略同様に適用することができる。
なお、プログラムで構成した部分を適宜、回路に置き換えることも可能である。上述の実施形態の説明中において、「部」(セクションやユニット)として記載した部分は、専用の回路や、複数の汎用の回路を組み合わせて構成してもよく、必要に応じて、予めプログラムされたソフトウェアに従って動作を行うマイコン、CPUなどのプロセッサ、あるいはFPGAなどシーケンサを組み合わせて構成されてもよい。また、その制御の一部または全部を外部の装置が引き受けるような設計も可能で、この場合、有線や無線の通信回路が介在する。通信は、ブルートゥース(登録商標)やWiFi(登録商標)、電話回線などで行えばよく、USBなどで行っても良い。専用の回路、汎用の回路や制御部を一体としてASICとして構成してもよい。機械的に位置制御される部位(例えば移動部など)は、様々なアクチュエータと、必要に応じて移動用の連結メカニズムによって構成されており、ドライバ回路によってアクチュエータが作動する。このドライブ回路もまた、特定のプログラムに従ってマイコンやASICなどが制御する。こうした制御は各種センサやその周辺回路が出力する情報によって、詳細な補正、調整などが行われても良い。
また、上述の実施形態で説明した各処理シーケンスは、その性質に反しない限り、手順の変更を許容し得る。したがって、上述の処理シーケンスに対して、例えば各処理ステップの実行順序を変更したり、複数の処理ステップを同時に実行させたり、一連の処理シーケンスを実行する毎に、各処理ステップの順序が異なるようにしてもよい。即ち、特許請求の範囲,明細書及び図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。また、これらの動作フローを構成する各ステップにおいては、発明の本質に影響しない部分について適宜省略することもできることは言うまでもない。
ここで説明した技術のうち、主にフローチャートで説明した制御や機能は、多くがソフトウエアプログラムにより設定できることが多くあり、そのソフトウエアプログラムをコンピュータが読み取り実行することで上述した制御や機能を実現することができる。そのソフトウエアプログラムは、コンピュータプログラム製品として、予め製品製造過程において上記記憶媒体や記憶部等、具体的には例えばフレキシブルディスク CD−ROM等 不揮発性メモリ等の可搬媒体やハードディスク 揮発性メモリ等の記憶媒体に、その全体あるいは一部を記憶又は記録されている電子データである。また、これとは別に、製品出荷時又は可搬媒体或いは通信回線を介して流通又は提供ができるものである。利用者は、製品出荷後であっても、自ら通信ネットワークやインターネット等を介して、それらのソフトウエアプログラムをダウンロードしてコンピュータにインストールしたり、あるいは記憶媒体からコンピュータにインストールすることで、動作させるようにすることができ、これによって容易に上述の実施形態の記録装置である撮像装置を実現することができる。
また、「深層学習(ディープ・ラーニング)」は、ニューラル・ネットワークを用いた「機械学習」の過程を多層構造化したものである。情報を前から後ろに送って判定を行う「順伝搬型ニューラル・ネットワーク」が代表的なものである。これは、最も単純なものでは、N1個のニューロンで構成される入力層、パラメータで与えられるN2個のニューロンで構成される中間層、判別するクラスの数に対応するN3個のニューロンで構成される出力層の3層があればよい。そして、入力層と中間層、中間層と出力層の各ニューロンはそれぞれが結合加重で結ばれ、中間層と出力層はバイアス値が加えられることで、論理ゲートの形成が容易である。簡単な判別なら3層でもよいが、中間層を多数にすれば、機械学習の過程において複数の特徴量の組み合わせ方を学習することも可能となる。近年では、9層〜152層のものが、学習にかかる時間や判定精度、消費エネルギーの関係から実用的になっている。また、画像の特徴量を圧縮する、「畳み込み」と呼ばれる処理を伴い、最小限処理で動き、パターン認識に強い「畳み込み型ニューラル・ネットワーク」や、より複雑な情報を扱え、順番や順序によって意味合いが変わる情報分析に対応して、情報を双方向に流れる「再帰型ニューラル・ネットワーク」(全結合リカレントニューラルネット)を利用してもよい。
これらの技術の実現のためには、CPUやFPGA(Field Programmable Gate Array)といったこれまでの汎用的な演算処理回路などを使ってもよいが、ニューラル・ネットワークの処理の多くが行列の掛け算であることから、行列計算に特化したGPU(Graphic Processing Unit)やTensor Processing Unit(TPU)と呼ばれるものが利用される場合もある。近年ではこうした人工知能(AI)専用ハードの「ニューラル・ネットワーク・プロセッシング・ユニット(NPU)」がCPUなどその他の回路とともに集積して組み込み可能に設計され、処理回路の一部になっている場合もある。
その他の機械学習の方法としては、例えば、サポートベクトルマシン、サポートベクトル回帰という手法もある。ここでの学習は、識別器の重み、フィルター係数、オフセットを算出するもので、他には、ロジスティック回帰処理を利用する手法もある。機械に何かを判定させる場合、人間が機械に判定の仕方を教える必要があり、ここでは画像の判定を、機械学習により導出する手法を採用したが、そのほか、人間が経験則・ヒューリスティクスによって獲得したルールを適応するルールベースの手法を用いてもよい。
本発明は上述した実施形態に限定されるものではなく、発明の主旨を逸脱しない範囲内において種々の変形や応用を実施することができることは勿論である。さらに、上述の実施形態には、種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせによって、種々の発明が抽出され得る。例えば、上記実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題が解決でき、発明の効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。この発明は、添付のクレームによって限定される以外にはそれの特定の実施態様によって制約されない。