JP2022011712A - シーン認識装置、撮像装置、シーン認識方法、及びプログラム - Google Patents

シーン認識装置、撮像装置、シーン認識方法、及びプログラム Download PDF

Info

Publication number
JP2022011712A
JP2022011712A JP2020113027A JP2020113027A JP2022011712A JP 2022011712 A JP2022011712 A JP 2022011712A JP 2020113027 A JP2020113027 A JP 2020113027A JP 2020113027 A JP2020113027 A JP 2020113027A JP 2022011712 A JP2022011712 A JP 2022011712A
Authority
JP
Japan
Prior art keywords
image
scene recognition
scene
image pickup
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020113027A
Other languages
English (en)
Other versions
JP7043707B2 (ja
Inventor
長波 周
chang-bo Zhou
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SZ DJI Technology Co Ltd
Original Assignee
SZ DJI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SZ DJI Technology Co Ltd filed Critical SZ DJI Technology Co Ltd
Priority to JP2020113027A priority Critical patent/JP7043707B2/ja
Publication of JP2022011712A publication Critical patent/JP2022011712A/ja
Application granted granted Critical
Publication of JP7043707B2 publication Critical patent/JP7043707B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】画像のシーン認識の精度が低下することを抑制できる、シーン認識装置、撮像装置、シーン認識方法及びプログラムを提供する。【解決手段】シーン認識装置は、測距センサを備える撮像装置により撮像される画像及び測距センサの測距結果に基づく画像の深度マップを取得する回路を備える。回路は、深度マップに基づいて、画像から、被写体までの距離に応じた複数の部分画像をクロップし、複数の部分画像ごとにそれぞれのアルゴリズムに従ってシーン認識を実行し、複数の部分画像のそれぞれのシーン認識の結果に基づいて、画像のシーンを決定する。【選択図】図2

Description

本発明は、シーン認識装置、撮像装置、シーン認識方法、及びプログラムに関する。
特許文献1には、「物体50の位置を確定する前に、計測データから背景と物体50との分離を行い、ノイズ処理を行う」と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開平11-63989号公報
画像の内容によっては、画像のシーン認識の精度が低下することがある。
本発明の一態様に係るシーン認識装置は、測距センサを備える撮像装置により撮像される画像、及び測距センサの測距結果に基づく画像の深度マップを取得するように構成される回路を備える。回路は、深度マップに基づいて、画像から、被写体までの距離に応じた複数の部分画像をクロップするように構成されてよい。回路は、複数の部分画像ごとにそれぞれのアルゴリズムに従ってシーン認識を実行するように構成されてよい。回路は、複数の部分画像のそれぞれのシーン認識の結果に基づいて、画像のシーンを決定するように構成されてよい。
回路は、深度マップに基づいて、画像から、撮像装置からの距離が予め定められた距離以下である被写体を含む第1部分画像と、撮像装置からの距離が予め定められた距離より遠い被写体を含む第2部分画像とをクロップするように構成される。回路は、第1アルゴリズムに従って第1部分画像に対する第1シーン認識を実行するように構成される。回路は、第2アルゴリズムに従って第2部分画像に対する第2シーン認識を実行するように構成される。回路は、第1シーン認識の結果及び第2シーン認識の結果に基づいて、画像のシーンを決定するように構成される。
それぞれのアルゴリズムは、異なるアルゴリズムでよい。
回路は、複数の部分画像が画像に占めるそれぞれの割合にさらに基づいて、画像のシーンを決定するように構成されてよい。
測距センサは、TOFセンサでよい。
本発明の一態様に係る撮像装置は、上記シーン認識装置と、測距センサと、イメージセンサとを備えてよい。回路は、決定された画像のシーンに基づいて、撮像条件及び画像処理条件の少なくとも一方を決定するように構成されてよい。
本発明の一態様に係るシーン認識方法は、測距センサを備える撮像装置により撮像される画像、及び測距センサの測距結果に基づく画像の深度マップを取得する段階を備える。シーン認識方法は、深度マップに基づいて、画像から、被写体までの距離に応じた複数の部分画像をクロップする段階を備えてよい。シーン認識方法は、複数の部分画像ごとにそれぞれのアルゴリズムに従ってシーン認識を実行する段階を備えてよい。シーン認識方法は、複数の部分画像のそれぞれのシーン認識の結果に基づいて、画像のシーンを決定する段階を備えてよい。
本発明の一態様に係るプログラムは、上記シーン認識装置としてコンピュータを機能させるためのプログラムでよい。
本発明の一態様によれば、画像の内容によって、画像のシーン認識の精度が低下することを抑制できる。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
撮像装置の機能ブロックを示す図である。 画像のクロップ及びシーン認識について説明するための図である。 シーン認識の手順の一例を示すフローチャートである。 無人航空機及び遠隔操作装置の外観の一例を示す図である。 ハードウェア構成の一例を示す図である。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施の形態は特許請求の範囲に係る発明を限定するものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。以下の実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、図面、及び要約書には、著作権による保護の対象となる事項が含まれる。著作権者は、これらの書類の何人による複製に対しても、特許庁のファイルまたはレコードに表示される通りであれば異議を唱えない。ただし、それ以外の場合、一切の著作権を留保する。
本発明の様々な実施形態は、フローチャート及びブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、プログラマブル回路、及び/またはプロセッサによって実装されてよい。専用回路は、デジタル及び/またはアナログハードウェア回路を含んでよい。集積回路(IC)及び/またはディスクリート回路を含んでよい。プログラマブル回路は、再構成可能なハードウェア回路を含んでよい。再構成可能なハードウェア回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、及び他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等の様なメモリ要素等を含んでよい。
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよい。その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM(登録商標))、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
コンピュータ可読命令は、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードの何れかを含んでよい。ソースコードまたはオブジェクトコードは、従来の手続型プログラミング言語を含む。従来の手続型プログラミング言語は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語または同様のプログラミング言語でよい。コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供されてよい。プロセッサまたはプログラマブル回路は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
図1は、本実施形態に係る撮像装置100の機能ブロックの一例を示す。撮像装置100は、撮像部102、TOFセンサ160、及びレンズ部200を備える。撮像部102は、イメージセンサ120、撮像制御部110、メモリ170、表示部180、及び操作部182を有する。
イメージセンサ120は、CCDまたはCMOSにより構成されてよい。イメージセンサ120は、複数のレンズ154を介して結像された光学像の画像データを撮像制御部110に出力する。撮像制御部110は、CPUまたはMPU等のマイクロプロセッサ、MCU等のマイクロコントローラ等により構成されてよい。
撮像制御部110は、操作部182からの撮像装置100の動作命令に応じて、撮像制御部110は、イメージセンサ120から出力された画像信号にデモザイク処理を施すことで画像データを生成する。撮像制御部110は、画像データをメモリ170に格納する。撮像制御部110は、TOFセンサ160を制御する。撮像制御部110は、回路の一例である。TOFセンサ160は、対象物までの距離を測距する飛行時間型センサである。撮像装置100は、TOFセンサ160により測距された距離に基づいて、フォーカスレンズの位置を調整することで、合焦制御を実行する。
メモリ170は、コンピュータ可読可能な記録媒体でよく、SRAM、DRAM、EPROM、EEPROM、及びUSBメモリ等のフラッシュメモリの少なくとも1つを含んでよい。メモリ170は、撮像制御部110がイメージセンサ120等を制御するのに必要なプログラム等を格納する。メモリ170は、撮像装置100の筐体の内部に設けられてよい。
複数のレンズ154は、ズームレンズ、バリフォーカルレンズ、及びフォーカスレンズとして機能してよい。複数のレンズ154の少なくとも一部または全部は、光軸に沿って移動可能に配置される。レンズ制御部150は、撮像制御部110からのレンズ制御命令に従って、レンズ駆動部152を駆動して、1または複数のレンズ154を光軸方向に沿って移動させる。レンズ制御命令は、例えば、ズーム制御命令、及びフォーカス制御命令である。レンズ駆動部152は、複数のレンズ154の少なくとも一部または全部を光軸方向に移動させるボイスコイルモータ(VCM)を含んでよい。レンズ駆動部152は、DCモータ、コアレスモータ、または超音波モータ等の電動機を含んでよい。レンズ駆動部152は、電動機からの動力をカム環、ガイド軸等の機構部材を介して複数のレンズ154の少なくとも一部または全部に伝達して、複数のレンズ154の少なくとも一部または全部を光軸に沿って移動させてよい。本実施形態では、複数のレンズ154は、撮像装置100と一体型の例について説明する。しかし、複数のレンズ154は、交換レンズでよく、撮像装置100とは別体で構成されてもよい。
表示部180は、イメージセンサ120から出力された画像を表示してよい。表示部180は、撮像装置100の各種の設定情報を表示してよい。表示部180は、液晶ディスプレイ、タッチパネルディスプレイなどでよい。表示部180は、複数の液晶ディスプレイ、またはタッチパネルディスプレイを含んでよい。
TOFセンサ160は、発光部162、受光部164、発光制御部166、受光制御部167、及びメモリ168を備える。TOFセンサ160は、測距センサの一例である。撮像装置100は、TOFセンサ160の代わりに、視差に基づいて測距するステレオカメラなどの他の測距センサを備えてもよい。発光部162は、少なくとも1つの発光素子163を含む。発光素子163は、LEDまたはレーザ等の高速変調されたパルス光を繰り返し出射するデバイスである。発光素子163は、赤外光であるパルス光を出射してよい。発光制御部166は、発光素子163の発光を制御する。発光制御部166は、発光素子163から出射されるパルス光のパルス幅を制御してよい。
受光部164は、複数の測距領域のそれぞれに関連する被写体までの距離を測距する複数の受光素子165を含む。複数の受光素子165は、複数の測距領域のそれぞれに対応する。受光素子165は、対象物からのパルス光の反射光を繰り返し受光する。受光制御部167は、受光素子165の受光を制御する。受光制御部167は、予め定められた受光期間に受光素子165が繰り返し受光する反射光の量に基づいて、複数の測距領域のそれぞれに関連する被写体までの距離を測距する。受光制御部167は、予め定められた受光期間に受光素子165が繰り返し受光する反射光の量に基づいて、パルス光と反射光との間の位相差を特定することで、被写体までの距離を測距してよい。受光部164は、反射波の周波数変化を読み取ることで、被写体までの距離を測距してよい。これはFMCW(Frequency Modulated Continuous Wave)方式と呼ばれる。
メモリ168は、コンピュータ可読可能な記録媒体でよく、SRAM、DRAM、EPROM、及びEEPROMの少なくとも1つを含んでよい。メモリ168は、発光制御部166が発光部162を制御するために必要なプログラム、及び受光制御部167が受光部164を制御するのに必要なプログラム等を格納する。
TOFセンサ160は、受光部164の画素数に対応する複数の測距領域のそれぞれに関連する被写体までの距離を測距できる。
このように構成された撮像装置100は、撮像装置100により撮像される画像のシーン認識を実行する。撮像装置100は、画像のシーン認識の結果に基づいて、撮像条件及び画像処理条件の少なくとも一方を決定する。撮像条件は、シャッター速度、絞り(F値)、及びISO感度を含む露出条件を含む。画像処理条件は、ホワイトバランス調整、階調(トーンカーブ)制御、色調整等のデジタル信号処理の条件を含む。
撮像装置100は、画像の輝度情報、画像の色情報、及び画像を構成する画素値のヒストグラムの少なくとも1つと、シーンの種類ごとに予め定められた基準の輝度情報、色情報、及び画素値のヒストグラムの少なくとも1つとの類似度に基づいて、画像のシーン認識を実行してよい。撮像装置100は、画像の輝度情報、画像の色情報、及び画素値のヒストグラムの少なくとも1つに基づいて、画像のシーンとして、風景、人物、植物、料理、夜景、花火などを判別してよい。撮像装置100は、シーンの種類ごとの教師データと判別対象の画像との類似度に基づいて、画像のシーン認識を実行してよい。
ここで、画像は二次元の情報であり、奥行き情報を有さないので、撮像装置100は、画像の内容によっては、シーン認識を適切に行えない場合がある。撮像装置100は、例えば、風景画の画像と、実際の風景の画像とを区別してシーン認識できない場合がある。
そこで、本実施形態に係る撮像装置100は、画像から取得できる二次元の情報に加えて、TOFセンサ160からの測距結果に基づく深度マップを利用して、シーン認識を実行する。
撮像制御部110は、撮像部102により撮像される画像を取得する。撮像制御部110は、TOFセンサ160の測距結果に基づく画像の深度マップを取得する。深度マップは、被写体までの距離の分布を示す情報でよい。
撮像制御部110は、深度マップに基づいて、画像から、撮像部102からの距離が予め定められた距離以下である被写体を含む近景部分画像と、撮像部102からの距離が予め定められた距離より遠い被写体を含む遠景部分画像とをクロップする。撮像制御部110は、画像の各画素と深度マップの各画素との予め定められた対応関係に基づいて、画像内の被写体までの距離を特定してよい。撮像制御部110は、画像を、予め定められた距離以下の被写体を含む領域と、予め定められた距離より遠い被写体を含む領域とに分割することで、近景部分画像と遠景部分画像とを生成する。
撮像制御部110は、予め定められた近景用アルゴリズムに従って近景部分画像に対する近景用シーン認識を実行する。近景用アルゴリズムは、近景のシーンの認識に特化したアルゴリズムでよい。近景用アルゴリズムは、認識結果として、近景のシーンのみを出力し、遠景のシーンを出力しないアルゴリズムでよい。
撮像制御部110は、予め定められた遠景用アルゴリズムに従って遠景部分画像に対する遠景用シーン認識を実行する。遠景用アルゴリズムは、遠景のシーンの認識に特化したアルゴリズムでよい。遠景用アルゴリズムは、認識結果として、遠景のシーンのみを出力し、近景のシーンを出力しないアルゴリズムでよい。遠景のシーンは、予め定められた距離より遠い距離にある被写体を含むシーンであり、山、空、夜景、花火などのシーンである。近景のシーンは、予め定められた距離以下の距離にある被写体を含むシーンであり、人物、料理、花などのシーンである。
近景用アルゴリズムと遠景用アルゴリズムとは異なるアルゴリズムでよい。しかし、撮像制御部110は、同じアルゴリズムに従って、近景部分画像及び遠景部分画像のそれぞれに対するシーン認識を実行してもよい。
撮像制御部110は、近景部分画像のシーンの認識結果と、遠景部分画像のシーンの認識結果とに基づいて、画像のシーンを決定する。撮像制御部110は、近景部分画像のシーンの認識結果と、遠景部分画像のシーンの認識結果とを合わせた結果を、画像のシーンとして決定してよい。例えば、近景部分画像のシーンの認識結果が「山」で、遠景部分画像のシーンの認識結果が「人物」であれば、撮像制御部110は、画像のシーンを「山」+「人物」と決定してよい。
撮像制御部110は、近景部分画像及び遠景部分画像が、画像に占めるそれぞれの割合にさらに基づいて、画像のシーンを決定してよい。撮像制御部110は、例えば、画像に占める割合が多い近景部分画像及び遠景部分画像のいずれか一方のシーンの認識結果を、画像のシーンとして決定してよい。撮像制御部110は、近景部分画像及び遠景部分画像のそれぞれのシーンの認識結果と、画像に占める近景部分画像及び遠景部分画像のそれぞれの割合とを、画像のシーンとして決定してよい。例えば、撮像制御部110は、「山」が70%を占め、「人物」が30%を占めるシーンとして、画像のシーンを決定してよい。
撮像制御部110は、図2に示すように、撮像部102により撮像された画像300と、TOFセンサ160による測距結果に基づく深度マップ310とを比較することで、予め定められた距離より遠い被写体を含む遠景部分画像320と、予め定められた距離以下の被写体を含む近景部分画像322とを画像300からクロップする。
撮像制御部110は、遠景部分画像320及び近景部分画像322の境界部分がオーバーラップするように、画像300をクロップしてよい。撮像制御部110は、画像300と深度マップ310とを画像マッチングすることで、画像300の各画素と、深度マップ310の各画素との対応関係を特定してよい。予め定められた距離は、TOFセンサ160の測距範囲に基づいて定められてよい。予め定められた距離は、TOFセンサ160が予め定められた精度以上で測距可能な測距範囲で最も遠い距離でよい。
撮像制御部110は、遠景用アルゴリズムに従って、遠景部分画像320のシーン認識を実行し、遠景部分画像320のシーンを「風景」と決定する。また、撮像制御部110は、近景用アルゴリズムに従って、近景部分画像322のシーン認識を実行し、近景部分画像322のシーンを「人物」と決定する。次いで、撮像制御部110は、遠景部分画像320のシーン認識の結果と、近景部分画像322のシーン認識の結果とに基づいて、画像300のシーンを、「風景」+「人物」と決定する。
図3は、シーン認識の手順の一例を示すフローチャートである。
撮像制御部110は、撮像部102により撮像される画像と、TOFセンサ160により測距された測距結果に基づく、画像に対応する深度マップとを取得する(S100)。撮像制御部110は、画像と深度マップとの位置関係を対応付ける(S102)。撮像制御部110は、画像と深度マップとを画像マッチングすることで、位置関係を対応付けてよい。
撮像制御部110は、深度マップを参照することで、画像から、被写体までの距離が予め定められた距離以下の領域である近景部分画像と、被写体までの距離が予め定められた距離より遠い領域である遠景部分画像とをクロップする(S104)。撮像制御部110は、近景用アルゴリズムに従って近景部分画像のシーン認識を実行し、遠景用アルゴリズムに従って遠景部分画像のシーン認識を実行する(S106)。
撮像制御部110は、近景部分画像のシーン認識の結果と、遠景部分画像のシーン認識の結果とに基づいて、画像のシーン認識を実行して、画像のシーンを決定する(S108)。
本実施形態によれば、撮像制御部110は、画像から取得できる情報に加えて、TOFセンサ160からの測距結果に基づく深度マップを利用して、シーン認識を実行する。撮像制御部110は、画像を被写体までの距離に応じた部分画像に分割して、それぞれの分割画像ごとに、シーン認識を実行する。これにより、より精度よく画像のシーン認識を実行できる。例えば、風景画の画像と、実際の風景の画像とを区別して、シーン認識を実行できる。
なお、本実施形態では、撮像制御部110は、画像を、近景部分画像及び遠景部分画像の2つに分割する例について説明した。しかしながら、撮像制御部110は、画像に含まれる被写体までの距離に応じて、3つ以上の部分画像に分割して、それぞれの部分画像のアルゴリズムに従って、それぞれの部分画像のシーン認識を実行してもよい。
撮像制御部110は、画像から、第1距離範囲の被写体を含む第1部分画像、第1距離範囲より遠い第2距離範囲の被写体を含む第2部分画像、及び第2距離範囲より遠い第3距離範囲の被写体を含む第3部分画像をクロップしてよい。撮像制御部110は、第1距離範囲のアルゴリズム、第2距離範囲のアルゴリズム、及び第3距離範囲のアルゴリズムのそれぞれに従って、第1部分画像、第2部分画像、及び第3部分画像のそれぞれのシーン認識を実行し、第1部分画像、第2部分画像、及び第3部分画像のそれぞれのシーン認識の結果に基づいて、画像のシーンを決定してよい。
上記のような撮像装置100は、移動体に搭載されてもよい。撮像装置100は、図4に示すような、無人航空機(UAV)に搭載されてもよい。UAV1000は、UAV本体20、ジンバル50、複数の撮像装置60、及び撮像装置100を備えてよい。ジンバル50、及び撮像装置100は、撮像システムの一例である。UAV1000は、推進部により推進される移動体の一例である。移動体とは、UAVの他、空中を移動する他の航空機などの飛行体、地上を移動する車両、水上を移動する船舶等を含む概念である。
UAV本体20は、複数の回転翼を備える。複数の回転翼は、推進部の一例である。UAV本体20は、複数の回転翼の回転を制御することでUAV1000を飛行させる。UAV本体20は、例えば、4つの回転翼を用いてUAV1000を飛行させる。回転翼の数は、4つには限定されない。また、UAV1000は、回転翼を有さない固定翼機でもよい。
撮像装置100は、所望の撮像範囲に含まれる被写体を撮像する撮像用のカメラである。ジンバル50は、撮像装置100を回転可能に支持する。ジンバル50は、支持機構の一例である。例えば、ジンバル50は、撮像装置100を、アクチュエータを用いてピッチ軸で回転可能に支持する。ジンバル50は、撮像装置100を、アクチュエータを用いて更にロール軸及びヨー軸のそれぞれを中心に回転可能に支持する。ジンバル50は、ヨー軸、ピッチ軸、及びロール軸の少なくとも1つを中心に撮像装置100を回転させることで、撮像装置100の姿勢を変更してよい。
複数の撮像装置60は、UAV1000の飛行を制御するためにUAV1000の周囲を撮像するセンシング用のカメラである。2つの撮像装置60が、UAV1000の機首である正面に設けられてよい。更に他の2つの撮像装置60が、UAV1000の底面に設けられてよい。正面側の2つの撮像装置60はペアとなり、いわゆるステレオカメラとして機能してよい。底面側の2つの撮像装置60もペアとなり、ステレオカメラとして機能してよい。複数の撮像装置60により撮像された画像に基づいて、UAV1000の周囲の3次元空間データが生成されてよい。UAV1000が備える撮像装置60の数は4つには限定されない。UAV1000は、少なくとも1つの撮像装置60を備えていればよい。UAV1000は、UAV1000の機首、機尾、側面、底面、及び天井面のそれぞれに少なくとも1つの撮像装置60を備えてもよい。撮像装置60で設定できる画角は、撮像装置100で設定できる画角より広くてよい。撮像装置60は、単焦点レンズまたは魚眼レンズを有してもよい。
遠隔操作装置600は、UAV1000と通信して、UAV1000を遠隔操作する。遠隔操作装置600は、UAV1000と無線で通信してよい。遠隔操作装置600は、UAV1000に上昇、下降、加速、減速、前進、後進、回転等のUAV1000の移動に関する各種命令を示す指示情報を送信する。指示情報は、例えば、UAV1000の高度を上昇させる指示情報を含む。指示情報は、UAV1000が位置すべき高度を示してよい。UAV1000は、遠隔操作装置600から受信した指示情報により示される高度に位置するように移動する。指示情報は、UAV1000を上昇させる上昇命令を含んでよい。UAV1000は、上昇命令を受け付けている間、上昇する。UAV1000は、上昇命令を受け付けても、UAV1000の高度が上限高度に達している場合には、上昇を制限してよい。
図5は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ1200の一例を示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200に、本発明の実施形態に係る装置に関連付けられるオペレーションまたは当該装置の1または複数の「部」として機能させることができる。または、当該プログラムは、コンピュータ1200に当該オペレーションまたは当該1または複数の「部」を実行させることができる。当該プログラムは、コンピュータ1200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
本実施形態によるコンピュータ1200は、CPU1212、及びRAM1214を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、入力/出力ユニットを含み、それらは入力/出力コントローラ1220を介してホストコントローラ1210に接続されている。コンピュータ1200はまた、ROM1230を含む。CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブが、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納してよい。ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/またはコンピュータ1200のハードウェアに依存するプログラムを格納する。プログラムが、CR-ROM、USBメモリまたはICカードのようなコンピュータ可読記録媒体またはネットワークを介して提供される。プログラムは、コンピュータ可読記録媒体の例でもあるRAM1214、またはROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ1200の使用に従い情報のオペレーションまたは処理を実現することによって構成されてよい。
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、またはUSBメモリのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
また、CPU1212は、USBメモリ等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ1200上またはコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
100 撮像装置
102 撮像部
110 撮像制御部
120 イメージセンサ
150 レンズ制御部
152 レンズ駆動部
154 レンズ
160 TOFセンサ
162 発光部
163 発光素子
164 受光部
165 受光素子
166 発光制御部
167 受光制御部
168 メモリ
170 メモリ
180 表示部
182 操作部
200 レンズ部
1000 UAV
20 UAV本体
50 ジンバル
60 撮像装置
600 遠隔操作装置
1200 コンピュータ
1210 ホストコントローラ
1212 CPU
1214 RAM
1220 入力/出力コントローラ
1222 通信インタフェース
1230 ROM

Claims (8)

  1. 測距センサを備える撮像装置により撮像される画像、及び前記測距センサの測距結果に基づく前記画像の深度マップを取得し、
    前記深度マップに基づいて、前記画像から、被写体までの距離に応じた複数の部分画像をクロップし、
    前記複数の部分画像ごとにそれぞれのアルゴリズムに従ってシーン認識を実行し、
    前記複数の部分画像のそれぞれのシーン認識の結果に基づいて、前記画像のシーンを決定するように構成される回路を備えるシーン認識装置。
  2. 前記回路は、
    前記深度マップに基づいて、前記画像から、前記撮像装置からの距離が予め定められた距離以下である被写体を含む第1部分画像と、前記撮像装置からの距離が前記予め定められた距離より遠い被写体を含む第2部分画像とをクロップし、
    第1アルゴリズムに従って前記第1部分画像に対する第1シーン認識を実行し、
    第2アルゴリズムに従って前記第2部分画像に対する第2シーン認識を実行し、
    前記第1シーン認識の結果及び前記第2シーン認識の結果に基づいて、前記画像のシーンを決定するように構成される、請求項1に記載のシーン認識装置。
  3. それぞれの前記アルゴリズムは、異なるアルゴリズムである、請求項1に記載のシーン認識装置。
  4. 前記回路は、前記複数の部分画像が前記画像に占めるそれぞれの割合にさらに基づいて、前記画像のシーンを決定するように構成される、請求項1に記載のシーン認識装置。
  5. 前記測距センサは、TOFセンサである、請求項1に記載のシーン認識装置。
  6. 請求項1から5の何れか1つに記載のシーン認識装置と、
    前記測距センサと、
    イメージセンサと
    を備え、
    前記回路は、決定された前記画像のシーンに基づいて、撮像条件及び画像処理条件の少なくとも一方を決定するように構成される、撮像装置。
  7. 測距センサを備える撮像装置により撮像される画像、及び前記測距センサの測距結果に基づく前記画像の深度マップを取得する段階と、
    前記深度マップに基づいて、前記画像から、被写体までの距離に応じた複数の部分画像をクロップする段階と、
    前記複数の部分画像ごとにそれぞれのアルゴリズムに従ってシーン認識を実行する段階と、
    前記複数の部分画像のそれぞれのシーン認識の結果に基づいて、前記画像のシーンを決定する段階とを備えるシーン認識方法。
  8. 請求項1から5の何れか1つに記載のシーン認識装置としてコンピュータを機能させるためのプログラム。
JP2020113027A 2020-06-30 2020-06-30 シーン認識装置、撮像装置、シーン認識方法、及びプログラム Active JP7043707B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020113027A JP7043707B2 (ja) 2020-06-30 2020-06-30 シーン認識装置、撮像装置、シーン認識方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020113027A JP7043707B2 (ja) 2020-06-30 2020-06-30 シーン認識装置、撮像装置、シーン認識方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2022011712A true JP2022011712A (ja) 2022-01-17
JP7043707B2 JP7043707B2 (ja) 2022-03-30

Family

ID=80148372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020113027A Active JP7043707B2 (ja) 2020-06-30 2020-06-30 シーン認識装置、撮像装置、シーン認識方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7043707B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211233A (ja) * 2014-04-23 2015-11-24 キヤノン株式会社 画像処理装置および画像処理装置の制御方法
JP2017229033A (ja) * 2016-06-24 2017-12-28 キヤノン株式会社 撮像装置およびその制御方法ならびにプログラム
CN108989783A (zh) * 2018-08-22 2018-12-11 Oppo广东移动通信有限公司 电子装置和电子装置的控制方法
WO2019239715A1 (ja) * 2018-06-11 2019-12-19 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211233A (ja) * 2014-04-23 2015-11-24 キヤノン株式会社 画像処理装置および画像処理装置の制御方法
JP2017229033A (ja) * 2016-06-24 2017-12-28 キヤノン株式会社 撮像装置およびその制御方法ならびにプログラム
WO2019239715A1 (ja) * 2018-06-11 2019-12-19 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
CN108989783A (zh) * 2018-08-22 2018-12-11 Oppo广东移动通信有限公司 电子装置和电子装置的控制方法

Also Published As

Publication number Publication date
JP7043707B2 (ja) 2022-03-30

Similar Documents

Publication Publication Date Title
JP2019216343A (ja) 決定装置、移動体、決定方法、及びプログラム
JP2020012878A (ja) 制御装置、移動体、制御方法、及びプログラム
JP6630939B2 (ja) 制御装置、撮像装置、移動体、制御方法、及びプログラム
JP2021085893A (ja) 制御装置、撮像装置、制御方法、及びプログラム
JP6972456B1 (ja) 測距センサ、撮像装置、制御方法、及びプログラム
JP6790318B2 (ja) 無人航空機、制御方法、及びプログラム
JP7043707B2 (ja) シーン認識装置、撮像装置、シーン認識方法、及びプログラム
JP6768997B1 (ja) 制御装置、撮像装置、移動体、制御方法、及びプログラム
CN110337609A (zh) 控制装置、镜头装置、摄像装置、飞行体以及控制方法
WO2018185940A1 (ja) 撮像制御装置、撮像装置、撮像システム、移動体、撮像制御方法、及びプログラム
WO2021031833A1 (zh) 控制装置、摄像系统、控制方法以及程序
JP6801161B1 (ja) 画像処理装置、撮像装置、移動体、画像処理方法、及びプログラム
JP2019066556A (ja) 制御装置、撮像装置、飛行体、制御方法、プログラム
JP6961889B1 (ja) 制御装置、撮像装置、制御方法、及びプログラム
US11125970B2 (en) Method for lens autofocusing and imaging device thereof
JP6547984B2 (ja) 制御装置、撮像装置、撮像システム、移動体、制御方法、及びプログラム
JP6818987B1 (ja) 画像処理装置、撮像装置、移動体、画像処理方法、及びプログラム
JP7173657B2 (ja) 制御装置、撮像装置、制御方法、及びプログラム
JP6805448B2 (ja) 制御装置、撮像システム、移動体、制御方法、及びプログラム
JP2019205047A (ja) 制御装置、撮像装置、移動体、制御方法、及びプログラム
JP7043706B2 (ja) 制御装置、撮像システム、制御方法、及びプログラム
JP2020016703A (ja) 制御装置、移動体、制御方法、及びプログラム
JP6690106B1 (ja) 決定装置、撮像システム、及び移動体
WO2021031840A1 (zh) 装置、摄像装置、移动体、方法以及程序
JP6569157B1 (ja) 制御装置、撮像装置、移動体、制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220218

R150 Certificate of patent or registration of utility model

Ref document number: 7043707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150