JP2024012828A - 撮像装置およびその制御方法 - Google Patents
撮像装置およびその制御方法 Download PDFInfo
- Publication number
- JP2024012828A JP2024012828A JP2022114572A JP2022114572A JP2024012828A JP 2024012828 A JP2024012828 A JP 2024012828A JP 2022114572 A JP2022114572 A JP 2022114572A JP 2022114572 A JP2022114572 A JP 2022114572A JP 2024012828 A JP2024012828 A JP 2024012828A
- Authority
- JP
- Japan
- Prior art keywords
- image recognition
- imaging
- image
- exposure
- imaging device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003384 imaging method Methods 0.000 title claims abstract description 192
- 238000000034 method Methods 0.000 title claims description 51
- 230000007704 transition Effects 0.000 claims abstract description 113
- 238000012545 processing Methods 0.000 claims abstract description 96
- 238000001514 detection method Methods 0.000 claims description 60
- 230000002123 temporal effect Effects 0.000 claims description 33
- 230000003287 optical effect Effects 0.000 claims description 30
- 230000010365 information processing Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 37
- 230000006870 function Effects 0.000 description 21
- 238000003860 storage Methods 0.000 description 18
- 238000011156 evaluation Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000003321 amplification Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- PICXIOQBANWBIZ-UHFFFAOYSA-N zinc;1-oxidopyridine-2-thione Chemical class [Zn+2].[O-]N1C=CC=CC1=S.[O-]N1C=CC=CC1=S PICXIOQBANWBIZ-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/71—Circuitry for evaluating the brightness variation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/72—Combination of two or more compensation controls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/73—Circuitry for compensating brightness variation in the scene by influencing the exposure time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/50—Control of the SSIS exposure
- H04N25/51—Control of the gain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/50—Control of the SSIS exposure
- H04N25/53—Control of the integration time
- H04N25/533—Control of the integration time by using differing integration times for different sensor regions
- H04N25/535—Control of the integration time by using differing integration times for different sensor regions by dynamic region selection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Studio Devices (AREA)
- Exposure Control For Cameras (AREA)
Abstract
【課題】適切な画像認識を行うことができる撮像装置を提供すること。【解決手段】撮像装置は、単一あるいは複数の画素ごとに露光条件を設定可能な露光領域を有する撮像手段と、画像処理による画像認識を行う画像認識領域を取得する取得手段と、前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定手段と、前記決定手段により決定した前記露光条件の遷移設定を用いて、前記撮像手段による撮像を行う撮像制御手段と、を備える。【選択図】図3
Description
本発明は、撮像装置およびその制御方法に関する。
従来、監視用途のカメラではユーザにとって視認性が高い監視向けのAE(Auto Exposure:自動露出)の遷移設定が求められている。監視向けのAEの遷移設定とは、被写体の動きブレが目立たない露光時間と、ノイズが少なくないアナログゲインのバランスを取り明るさが適切な露出となるように遷移する設定である。これに対して、カメラにとって画像認識が処理し易い露出となるよう遷移する設定があり、このような設定がされたカメラを機械認識用途のカメラと呼ぶ。機械認識用途のカメラでは、機械認識(画像認識)の精度を向上するために、露光時間とアナログゲインのバランスを極端に片方に寄せたAEの遷移設定にすることがある。例えば、画像からエッジ検出を行う場合、動きブレを極力排除するために、露光時間を短く設定し、露光量を補うためにアナログゲインは高ゲインに設定する。また、背景差分などを用いた画像間比較を行う場合には、ノイズ量を抑えるためにアナログゲインは低ゲインに設定し、露光量を補うために露光時間を長く設定する。このように、監視向けのAEの遷移設定と機械認識向けのAEの遷移設定は異なる。
また、機械認識は撮像される画像の全面ではなく一部で実施することがある。特許文献1には、機械認識における被写体の検出結果に基づき、露出を決定する技術が開示されている。
しかしながら特許文献1では、画像全体の明るさを一律に変更するため、機械認識を行う領域に対しては適切な明るさになるが、それ以外の領域(例えば、ユーザが視認したい領域)に対しては適切な明るさになるとは限らない。また、特許文献1では、画像一律(画像全体の)で明るさを変更するため、領域ごとのAEの遷移設定については言及されていない。
本発明は、上記した課題に鑑み、適切な画像認識を行うことができる撮像装置を提供することである。
本発明は、上記した課題に鑑み、適切な画像認識を行うことができる撮像装置を提供することである。
上記課題を解決するために、本発明の一つの態様にかかる撮像装置は、単一あるいは複数の画素ごとに露光条件を設定可能な露光領域を有する撮像手段と、画像処理による画像認識を行う画像認識領域を取得する取得手段と、前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定手段と、前記決定手段により決定した前記露光条件の遷移設定を用いて、前記撮像手段による撮像を行う撮像制御手段と、を備える。
本発明によれば、適切な画像認識を行うことができる。
以下、添付図面を参照して、本発明を実施するための形態について詳細に説明する。以下に説明する実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、後述する各実施形態の一部を適宜組み合わせて構成してもよい。
<第1の実施形態>
図1Aは本発明の第1の実施形態に係る撮像装置100の機能構成を例示したブロック図である。
撮像装置100は、撮像光学系101、撮像部102、システム制御部103、機械認識領域取得部104、優先度決定部105、AE制御部106、エンコーダ部107、ネットワークI/F108およびメモリ109を有する。AEはAuto Exposureの略である。撮像部102は、撮像素子102a、増幅部102bおよび画像処理部102cを有する。メモリ109は、SRAMやDRAMといった揮発性メモリと、フラッシュメモリといった不揮発性メモリとを含む。SRAMはStatic Random Access Memoryの略である。DRAMはDynamic Random Access Memoryの略である。撮像装置100は、例えば、監視カメラである。
図1Aは本発明の第1の実施形態に係る撮像装置100の機能構成を例示したブロック図である。
撮像装置100は、撮像光学系101、撮像部102、システム制御部103、機械認識領域取得部104、優先度決定部105、AE制御部106、エンコーダ部107、ネットワークI/F108およびメモリ109を有する。AEはAuto Exposureの略である。撮像部102は、撮像素子102a、増幅部102bおよび画像処理部102cを有する。メモリ109は、SRAMやDRAMといった揮発性メモリと、フラッシュメモリといった不揮発性メモリとを含む。SRAMはStatic Random Access Memoryの略である。DRAMはDynamic Random Access Memoryの略である。撮像装置100は、例えば、監視カメラである。
撮像光学系101は、被写体からの光を撮像素子102aの受光面に集光する。撮像光学系101は、単数或いは複数のレンズを備える。例えば、撮像光学系101は、ズームレンズ、フォーカスレンズおよびぶれ補正レンズ等を備える。
撮像部102は被写体の像を撮像して画像を生成する。
撮像素子102aは、撮像光学系101によって撮像面(受光面)に集光された被写体からの光を画素ごとに電気信号に変換して出力する。撮像素子102aは、撮像面の画素又は画素ブロック毎に露光時間およびアナログゲインを独立して設定(変更)可能な露光領域を有する。ここでいう画素ブロックは1以上の画素から構成される画素の集合であり、各画素ブロックでそれぞれ露光時間又はアナログゲインを異ならせて設定できる。画素ブロックは、単一の画素で構成される場合もあるし、複数の画素で構成される場合もある。画素ブロックの形状は矩形である必要はなく、どのような形状をしていてもよい。本実施形態では画素ブロックの形状が矩形(ブロック形状)であるとして説明する。撮像素子102aは、光電変換素子からなる画素がマトリクス状に配列されたICチップである。例えば、撮像素子102aは、CCD(Charge Coupled Device)センサ又はCMOS(Complementary Metal Oxide Semiconductor)センサである。撮像素子102aは、主に可視光に高い感度を有しており、画素毎に赤(R)、緑(G)、青(B)のいずれかに高い感度を有するが、赤外光にもある程度の感度を有している。そのため、太陽光に照らされている被写体、および赤外光照明によって照らされている場所等にある被写体を鮮明に撮像することができる。
撮像素子102aは、撮像光学系101によって撮像面(受光面)に集光された被写体からの光を画素ごとに電気信号に変換して出力する。撮像素子102aは、撮像面の画素又は画素ブロック毎に露光時間およびアナログゲインを独立して設定(変更)可能な露光領域を有する。ここでいう画素ブロックは1以上の画素から構成される画素の集合であり、各画素ブロックでそれぞれ露光時間又はアナログゲインを異ならせて設定できる。画素ブロックは、単一の画素で構成される場合もあるし、複数の画素で構成される場合もある。画素ブロックの形状は矩形である必要はなく、どのような形状をしていてもよい。本実施形態では画素ブロックの形状が矩形(ブロック形状)であるとして説明する。撮像素子102aは、光電変換素子からなる画素がマトリクス状に配列されたICチップである。例えば、撮像素子102aは、CCD(Charge Coupled Device)センサ又はCMOS(Complementary Metal Oxide Semiconductor)センサである。撮像素子102aは、主に可視光に高い感度を有しており、画素毎に赤(R)、緑(G)、青(B)のいずれかに高い感度を有するが、赤外光にもある程度の感度を有している。そのため、太陽光に照らされている被写体、および赤外光照明によって照らされている場所等にある被写体を鮮明に撮像することができる。
増幅部102bは、撮像素子102aから出力された電気信号を増幅して出力する。増幅部102bの信号増幅率(アナログゲイン)は撮像素子102aの画素又は画素ブロック毎に設定・変更できる。
画像処理部102cは、増幅部102bから出力されたアナログ信号である電気信号をデジタル信号へA/D変換する。A/DはAnalog/Digitalの略である。画像処理部102cは、A/D変換により得られたデジタル信号に対してさらにデモザイキング処理、ホワイトバランス処理、ガンマ処理等を含む信号処理を行ってデジタル画像を生成する。また、画像処理部102cは、画素又は画素ブロック毎のアナログゲインに基づいて、画素又は画素ブロック毎に対応する画像信号のデジタル値を増幅・減退させることによって明るさ補正を行う。生成されたデジタル画像はメモリ109に一時的に保存される。この際、画像処理部102cは、例えばJPEGやH.264、H.265等の所定のフォーマットの画像ファイル、または動画ファイルをメモリ109へ出力する。なお、メモリ109には、機械認識処理で使用する教師データも格納されている。
また、画像処理部102cは画像の機械認識処理(カメラによる画像認識処理)を行う。画像の機械認識処理は大別して2種類ある。1つは時間的な輝度の変化に基づいて画像の機械認識を行う処理(「時間的な認識処理」と称する)である。もう1つは空間的な輝度の変化に基づいて画像の機械認識を行う処理(「空間的な認識処理」と称する)である。この2種類の機械認識処理の詳細は後述する。
また、画像処理部102cは画像の機械認識処理(カメラによる画像認識処理)を行う。画像の機械認識処理は大別して2種類ある。1つは時間的な輝度の変化に基づいて画像の機械認識を行う処理(「時間的な認識処理」と称する)である。もう1つは空間的な輝度の変化に基づいて画像の機械認識を行う処理(「空間的な認識処理」と称する)である。この2種類の機械認識処理の詳細は後述する。
なお、図1Aでは、増幅部102bおよび画像処理部102cが撮像素子102aと別体として示されているが、撮像素子102aが増幅部102bおよび画像処理部102cの一部またはすべてを含む構成としてもよい。
また、図1Aでは、撮像装置100が撮像光学系101を有しているが、交換式レンズのように撮像光学系101が撮像装置100に着脱可能に設けられていてもよい。つまり、撮像装置100は、自身の構成要素として撮像光学系101を常に有する必要はない。
また、図1Aでは、撮像装置100が撮像光学系101を有しているが、交換式レンズのように撮像光学系101が撮像装置100に着脱可能に設けられていてもよい。つまり、撮像装置100は、自身の構成要素として撮像光学系101を常に有する必要はない。
システム制御部103はCPU(図1B参照)を含み、撮像装置100の各構成要素を統括的に制御し、各種パラメータの設定を行う。システム制御部103は撮像装置100を構成する各部が協調して動作するように統括的に制御する。例えば、システム制御部103は撮像光学系101を制御する。より具体的には、システム制御部103は、光学ズーム倍率、F値、焦点距離などの光学制御を行う。システム制御部103は、撮像素子102aによる撮像を行うので、撮像制御部と称してもよい。
機械認識領域取得部104は、機械認識を行う画素又は画素ブロックを判別して、機械認識領域(画像認識領域)として出力する。機械認識領域は、ネットワークI/F108を介してユーザがマニュアル操作で指定することが可能である。また、機械認識の結果に基づいて機械認識領域を撮像装置100が自動で指定(自動設定)してもよい。例えば、撮像装置100の機械認識領域取得部104は、画像全体あるいは画像の一部の領域で動体検出を行い、動体が検出された領域を機械認識領域に自動設定する。さらに、機械認識領域取得部104は、機械認識領域に対して動体が人体であるかを識別する人体識別を実施する。
優先度決定部105は、撮像部102の露光時間とアナログゲインの優先度を決定する。露光時間を増やすほど露光量は増えるが、被写体または撮像装置100の動きブレが増加する。アナログゲインを増やすほど露光量は増えるが、ノイズが増加する。優先度決定部105では非機械認識領域(人間が認識する領域)と機械認識領域で、露光時間とアナログゲインの優先度が異なる。
次に、優先度について説明する。
非機械認識領域では機械的な認識処理を行わないためユーザが人の眼で見て違和感が小さくなるように露光時間とアナログゲインのそれぞれを段階的にAE(自動露出)遷移させる。つまり、非機械認識領域では、人間の視認性を重視したAE遷移の設定を行う。そのため露光時間とアナログゲインは同一あるいは近い優先度に設定する。本実施形態においてAEは露光時間およびアナログゲインによって決定される露光量である。
機械認識領域では、機械認識の種類(内容)に応じて、露光時間とアナログゲインに優先度をつけて露光量が適切となるようにAEを遷移させる。
時間的な認識処理においては、アナログゲインを優先してAEを遷移させる。すなわち時間的な認識処理では、アナログゲインを決定して固定した後に、露光時間によってAEの遷移(露光量の調整)を行う。
空間的な認識処理においては、露光時間を優先してAEを遷移させる。すなわち、空間的な認識処理では、露光時間を決定して固定した後に、アナログゲインによってAEの遷移(露光量の調整)を行う。
非機械認識領域では機械的な認識処理を行わないためユーザが人の眼で見て違和感が小さくなるように露光時間とアナログゲインのそれぞれを段階的にAE(自動露出)遷移させる。つまり、非機械認識領域では、人間の視認性を重視したAE遷移の設定を行う。そのため露光時間とアナログゲインは同一あるいは近い優先度に設定する。本実施形態においてAEは露光時間およびアナログゲインによって決定される露光量である。
機械認識領域では、機械認識の種類(内容)に応じて、露光時間とアナログゲインに優先度をつけて露光量が適切となるようにAEを遷移させる。
時間的な認識処理においては、アナログゲインを優先してAEを遷移させる。すなわち時間的な認識処理では、アナログゲインを決定して固定した後に、露光時間によってAEの遷移(露光量の調整)を行う。
空間的な認識処理においては、露光時間を優先してAEを遷移させる。すなわち、空間的な認識処理では、露光時間を決定して固定した後に、アナログゲインによってAEの遷移(露光量の調整)を行う。
AE制御部106は、画素毎の輝度又は画素ブロック毎の輝度および優先度決定部105の優先度に基づいて露光条件を決定・制御する。例えば、画素毎の輝度又は画素ブロック毎の輝度の平均値が出力可能なデータ諧調の中央値となるように露光量(露光時間+アナログゲイン)を決定する。さらに優先度決定部105の優先度に基づいて露光時間とアナログゲインのうち一方を決定した後に、もう一方によって決定された露光量に調整する。決定された露光時間およびアナログゲインによって撮像素子102aの露出を制御する。つまり、撮像素子102aは、決定された露光条件の遷移設定を用いて、撮像を行う。
エンコーダ部107は、画像処理部102cにて処理された画像データをMоtiоn JpegやH264、H265等の所定のファイルフォーマットに符号化する(符号化処理を行う)。
ネットワークI/F108は、ネットワーク110を介して外部の情報処理装置(例えば、図2のクライアント装置210)や記憶装置(例えば、図2のサーバ220)との通信に利用されるインターフェースである。エンコーダ部107で符号化処理された画像データを、ネットワークI/F108を利用して情報処理装置(クライアント装置210)や記憶装置(サーバ220)に送信することができる。ネットワークI/F108は、情報処理装置(クライアント装置210)から、機械認識を行う領域の指定や、機械認識の種類の指定を受信する。また、ネットワークI/F108は、撮像装置100のパンニング・チルト・ズームの制御命令等を情報処理装置(クライアント装置210)から受信する。
ネットワークI/F108は、ネットワーク110を介して外部の情報処理装置(例えば、図2のクライアント装置210)や記憶装置(例えば、図2のサーバ220)との通信に利用されるインターフェースである。エンコーダ部107で符号化処理された画像データを、ネットワークI/F108を利用して情報処理装置(クライアント装置210)や記憶装置(サーバ220)に送信することができる。ネットワークI/F108は、情報処理装置(クライアント装置210)から、機械認識を行う領域の指定や、機械認識の種類の指定を受信する。また、ネットワークI/F108は、撮像装置100のパンニング・チルト・ズームの制御命令等を情報処理装置(クライアント装置210)から受信する。
ネットワーク110は、例えば、ローカルエリアネットワーク(LAN:Local Area Network)であり、Ethernet(登録商標)等の通信規格に準拠したルータ等から構成される。撮像装置100、情報処理装置(クライアント装置210)および記憶装置(サーバ220)はLANケーブル等によって接続される。なお、ネットワーク110はインターネット等の無線ネットワークを含んでもよい。この場合、撮像装置110、情報処理装置(クライアント装置210)および記憶装置(サーバ220)は無線ネットワークにより接続されてよい。
次に、2種類の機械認識処理と、AEの遷移設定について説明する。
1つ目の機械認識処理は時間的な輝度の変化を演算するものである。同一画角で連続した複数の画像を撮像し、画像あるいは画像内の領域ごとに輝度の変化量を算出する。時間的な輝度の変化量が所定値を超えた場合(つまり、当該領域に明るさの変化が所定量を超えた場合)、動体がいると推測できる。そのため、ノイズによる変動を抑えることで精度が向上する。撮像装置(カメラ)100の具体的な機能としては、画像内に動体がいるかを判定する動体検出機能、特定の領域に対して物体が持ち込まれることを検出する検知機能、物体が持ち去られることを検出する検知機能などが、1つ目の機械認識処理に含まれる。
1つ目の機械認識処理は時間的な輝度の変化を演算するものである。同一画角で連続した複数の画像を撮像し、画像あるいは画像内の領域ごとに輝度の変化量を算出する。時間的な輝度の変化量が所定値を超えた場合(つまり、当該領域に明るさの変化が所定量を超えた場合)、動体がいると推測できる。そのため、ノイズによる変動を抑えることで精度が向上する。撮像装置(カメラ)100の具体的な機能としては、画像内に動体がいるかを判定する動体検出機能、特定の領域に対して物体が持ち込まれることを検出する検知機能、物体が持ち去られることを検出する検知機能などが、1つ目の機械認識処理に含まれる。
2つ目の機械認識処理は空間的な輝度の変化を演算するものである。撮像した一枚の画像に対して水平方向または垂直方向の空間的な輝度の変化量を算出する。空間的な輝度の変化量が所定値を超えた場合には、その境界を不連続点であるエッジ(輪郭)として検出することができる。このエッジの形状に基づいて特徴点を算出することが可能となる。そのため被写体の動きによる変動を抑制することで精度が向上する。撮像装置(カメラ)100の具体的な機能としては、人の肩や頭の形状から人体であるかを識別する人体識別や、顔の目、鼻、口といった部位の位置関係または形状を教師データと比較して一致度を評価する顔認証などがが、2つ目の機械認識処理に含まれる。教師データとは予め保存された特徴点のデータである。機械学習によって教師データ(サンプル数)を増やすことで精度を向上させることが可能である。
1つ目の機械認識処理(時間的な認識処理)と2つ目の機械認識処理(空間的な認識処理)では、優先される撮像条件が異なる。具体的には、時間的な認識処理では、露光時間よりアナログゲインを優先し、空間的な認識処理ではアナログゲインより露光時間を優先する。
時間的な認識処理においては、低いアナログゲイン(低ノイズ)で撮像して画像間の意図しない輝度変化(ノイズ)を抑制することで精度を向上する。アナログゲインを低く設定するためには露光時間を長く設定する必要があるが、時間的な認識処理においては空間的な輝度変化、すなわち動きブレは精度に大きく影響しないためアナログゲインを優先して設定することが可能である。
空間的な認識処理においては、短い露光時間(動きブレ小)で撮像して空間内の意図しない輝度変化(動きブレ)を抑制することで精度を向上する。これは、動きブレはデジタル処理では抑制することが困難なためである。露光時間を短く設定するためにはアナログゲインを高く設定する必要があるが、微分フィルタなどのデジタル処理を用いることでアナログゲインによるノイズの影響を抑制することが可能である。
図1Aに示す各機能ブロック(符号102b、102c、103~108)は、ソフトウェアにより実現される。より詳しくは、図1Aの各機能ブロックの機能提供するためのプログラムが図1Bに示すROM(Read Only Memory)124等のメモリに記憶される。そして、そのプログラムを図1Bに示すRAM(Random Access Memory)125に読み出してCPU(Central Processing Unit)123が実行することにより実現される。なお、機能ブロックの一部または全部は、ハードウェアにより実現されてもよい。この場合、例えば、所定のコンパイラを用いることで、各機能ブロックの機能を実現するためのプログラムからFPGA上に自動的に専用回路を生成すればよい。FPGAは、Field Programmable Gate Arrayの略である。また、FPGAと同様にしてゲートアレイ回路を形成し、ハードウェアとして実現するようにしてもよい。また、ASIC(Application Specific Integrated Circuit)により実現するようにしてもよい。
なお、図1Aに示した機能ブロックの構成は一例であり、複数の機能ブロックが1つの機能ブロックを構成するようにしてもよいし、いずれかの機能ブロックが複数の機能を行うブロックに分かれてもよい。
なお、図1Aに示した機能ブロックの構成は一例であり、複数の機能ブロックが1つの機能ブロックを構成するようにしてもよいし、いずれかの機能ブロックが複数の機能を行うブロックに分かれてもよい。
図1Bは、撮像装置100のハードウェア構成の一例を示している。
撮像装置100は、撮像光学系121、撮像素子122、CPU123、ROM124、RAM125、撮像系制御部126、通信制御部127、A/D変換部128、画像処理部129、エンコーダ部130およびネットワークI/F131を有する。撮像装置100の各部(123~131)は、システムバス132により相互接続されている。ROM124はフラッシュメモリを含む。RAM125はSRAMやDRAMを含む。ROM124とRAM125は図1Aのメモリ109に対応している。
撮像装置100は、撮像光学系121、撮像素子122、CPU123、ROM124、RAM125、撮像系制御部126、通信制御部127、A/D変換部128、画像処理部129、エンコーダ部130およびネットワークI/F131を有する。撮像装置100の各部(123~131)は、システムバス132により相互接続されている。ROM124はフラッシュメモリを含む。RAM125はSRAMやDRAMを含む。ROM124とRAM125は図1Aのメモリ109に対応している。
撮像光学系121はズームレンズ、フォーカスレンズ、ブレ補正レンズ、絞り、シャッターなどから構成され、被写体の光情報を集光する光学部材群である。撮像光学系121は撮像素子122に接続されている。撮像光学系121は図1Aの撮像光学系101に対応している。
撮像素子122は、撮像光学系121で集光される光束を電流値(信号値)へと変換するCMOSやCCDなどの電荷蓄積型の固体撮像素子である。撮像素子122は図1Aの撮像素子102aに対応している。撮像素子122はA/D変換部128に接続されている。
撮像素子122は、撮像光学系121で集光される光束を電流値(信号値)へと変換するCMOSやCCDなどの電荷蓄積型の固体撮像素子である。撮像素子122は図1Aの撮像素子102aに対応している。撮像素子122はA/D変換部128に接続されている。
CPU123は、撮像装置100の動作を統括的に制御する制御部である。CPU123は、ROM124やRAM125に格納された命令を読み込み、その結果に従って処理を実行する。CPU123は図1Aのシステム制御部103に対応している。
撮像系制御部126は、CPU123からの指示に基づいて、撮像装置100の各部の制御を行う。例えば、撮像系制御部126は、撮像光学系121に対して、フォーカス制御、シャッター制御、絞り調整などの制御を行う。撮像系制御部126は図1Aのシステム制御部103に対応している。
通信制御部127は、クライアント装置210との通信によって、クライアント装置210から撮像装置100の各部への制御命令(制御信号)をCPU123に伝達するための制御を行う。通信制御部127は図1Aのシステム制御部103に対応している。
撮像系制御部126は、CPU123からの指示に基づいて、撮像装置100の各部の制御を行う。例えば、撮像系制御部126は、撮像光学系121に対して、フォーカス制御、シャッター制御、絞り調整などの制御を行う。撮像系制御部126は図1Aのシステム制御部103に対応している。
通信制御部127は、クライアント装置210との通信によって、クライアント装置210から撮像装置100の各部への制御命令(制御信号)をCPU123に伝達するための制御を行う。通信制御部127は図1Aのシステム制御部103に対応している。
A/D変換部128は、撮像素子122から受信した電流値をデジタル信号(画像データ)に変換する。A/D変換部128は、当該デジタル信号を画像処理部129に送信する。A/D変換部128は図1Aの画像処理部102cに対応している。
画像処理部129は、A/D変換部128から受信したデジタル信号の画像データに対して、画像処理を行う。画像処理部129はエンコーダ部130に接続されている。画像処理部129は図1Aの画像処理部102cに対応している。
エンコーダ部130は、画像処理部129で処理された画像データをMotion Jpeg、H264、H265などのファイルフォーマットに変換する処理を行う。エンコーダ部130はネットワークI/F131に接続されている。エンコーダ部130は図1Aのエンコーダ部107に対応している。
ネットワークI/F131は、クライアント装置210等の外部の装置とのネットワーク110を介した通信に利用されるインターフェースであって、通信制御部127により制御される。ネットワークI/F131は図1AのネットワークI/F108に対応している。
画像処理部129は、A/D変換部128から受信したデジタル信号の画像データに対して、画像処理を行う。画像処理部129はエンコーダ部130に接続されている。画像処理部129は図1Aの画像処理部102cに対応している。
エンコーダ部130は、画像処理部129で処理された画像データをMotion Jpeg、H264、H265などのファイルフォーマットに変換する処理を行う。エンコーダ部130はネットワークI/F131に接続されている。エンコーダ部130は図1Aのエンコーダ部107に対応している。
ネットワークI/F131は、クライアント装置210等の外部の装置とのネットワーク110を介した通信に利用されるインターフェースであって、通信制御部127により制御される。ネットワークI/F131は図1AのネットワークI/F108に対応している。
図2を参照して、撮像装置100を含む撮像システム200の構成を説明する。図2は撮像システム200の構成の一例を示している。撮像システム200において、撮像装置100は、ネットワーク110を介してクライアント装置210とサーバ220に接続されている。クライアント装置210はパーソナルコンピュータなどの情報処理装置である。
クライアント装置210は表示装置201と入力装置202に、有線または無線で接続される。表示装置201はディスプレイを有し、画像およびユーザの操作画面(GUI)を表示する機器である。ディスプレイは例えば、液晶ディスプレイである。GUIはGraphic User Interfaceの略である。入力装置202とはマウスやキーボードを含み、ユーザは表示装置201の画面を見ながら入力装置202を操作することができる。GUIは入力装置202の一部であると考えてもよい。
なお、図2ではクライアント装置210の外部に表示装置201と入力装置202が設けられているが、クライアント装置210は表示装置201と入力装置202の少なくとも一方を内蔵してもよい。
クライアント装置210は表示装置201と入力装置202に、有線または無線で接続される。表示装置201はディスプレイを有し、画像およびユーザの操作画面(GUI)を表示する機器である。ディスプレイは例えば、液晶ディスプレイである。GUIはGraphic User Interfaceの略である。入力装置202とはマウスやキーボードを含み、ユーザは表示装置201の画面を見ながら入力装置202を操作することができる。GUIは入力装置202の一部であると考えてもよい。
なお、図2ではクライアント装置210の外部に表示装置201と入力装置202が設けられているが、クライアント装置210は表示装置201と入力装置202の少なくとも一方を内蔵してもよい。
図3を参照して、撮像装置100で実行される処理について説明する。図3は撮像装置100の動作の一例である。図3では、ユーザが機械認識領域を指定する場合を説明する。
S300において、ユーザによる機械認識領域の設定(指定)が行われる。例えば、人体検出をする場合、ユーザは機械認識領域として、人物が通ると予想される通路を指定する。ユーザはクライアント装置210からネットワーク110を介して撮像装置100に機械認識領域を指示する(領域指定情報を送信する)。クライアント装置210は表示装置201に接続され、表示装置201に画像を表示することが可能である。表示装置201(図4のディスプレイ400)にはユーザが操作を行うユーザインターフェースの機能があり、ユーザは、撮像装置100によって撮像される画像や重畳表示されているボタンやスライドをタッチやドラッグによって操作することができる。ユーザは表示されている画像に対して、機械認識領域の設定を行う。機械認識領域の設定に関するユーザインターフェースについては図4を参照して後述する。
S300において、ユーザによる機械認識領域の設定(指定)が行われる。例えば、人体検出をする場合、ユーザは機械認識領域として、人物が通ると予想される通路を指定する。ユーザはクライアント装置210からネットワーク110を介して撮像装置100に機械認識領域を指示する(領域指定情報を送信する)。クライアント装置210は表示装置201に接続され、表示装置201に画像を表示することが可能である。表示装置201(図4のディスプレイ400)にはユーザが操作を行うユーザインターフェースの機能があり、ユーザは、撮像装置100によって撮像される画像や重畳表示されているボタンやスライドをタッチやドラッグによって操作することができる。ユーザは表示されている画像に対して、機械認識領域の設定を行う。機械認識領域の設定に関するユーザインターフェースについては図4を参照して後述する。
S301において、撮像装置100は機械認識領域(画像認識領域)の取得を行う。撮像装置100はネットワーク110を介して得られた機械認識領域の指示に基づいて、当該機械認識領域の取得を機械認識領域取得部104で行う。
S302において、撮像装置100は露光条件(アナログゲインおよび露光時間)の制御・決定を行う。本実施形態では、撮像装置100のCPU123が、機械認識の内容に基づいて、機械認識領域に適用する露光条件の遷移設定を決定する。
本実施形態では、特に断りがない限り、露光条件とはアナログゲインおよび露光時間を指す。露光条件を決定するために領域毎の輝度の平均値を算出する。この輝度の平均値と目標輝度の差分をとって、差分がある場合に露光時間またはアナログゲインを遷移させる。本実施形態では、非機械認識領域と機械認識領域で、遷移させる露光時間およびアナログゲインの優先度が異なる。露光条件は画素ブロック(単一または複数の画素)ごとに独立して決定(設定)される。また、非機械認識領域と機械認識領域では、同じ輝度であっても、アナログゲインと露光時間の割合が異なる露光条件となる。AEの遷移設定の詳細については図5、図6および図7に示した露光条件遷移図を参照して説明する。
S302において、撮像装置100は露光条件(アナログゲインおよび露光時間)の制御・決定を行う。本実施形態では、撮像装置100のCPU123が、機械認識の内容に基づいて、機械認識領域に適用する露光条件の遷移設定を決定する。
本実施形態では、特に断りがない限り、露光条件とはアナログゲインおよび露光時間を指す。露光条件を決定するために領域毎の輝度の平均値を算出する。この輝度の平均値と目標輝度の差分をとって、差分がある場合に露光時間またはアナログゲインを遷移させる。本実施形態では、非機械認識領域と機械認識領域で、遷移させる露光時間およびアナログゲインの優先度が異なる。露光条件は画素ブロック(単一または複数の画素)ごとに独立して決定(設定)される。また、非機械認識領域と機械認識領域では、同じ輝度であっても、アナログゲインと露光時間の割合が異なる露光条件となる。AEの遷移設定の詳細については図5、図6および図7に示した露光条件遷移図を参照して説明する。
S303において、決定された露光条件で撮像を行う。より詳しくは、撮像装置100のシステム制御部103は、撮像素子102aによる撮像を行う。
S304において、撮像により得られた映像信号(映像データ)に対して画像処理を行い、輝度情報を取得する。輝度情報とは、画素毎又は画素ブロック毎の輝度値、時間的な輝度変化の量、および、空間的な輝度変化の量である。時間的な輝度変化の量を算出する場合には、1フレーム以上前に撮像した映像信号の輝度をメモリに保存しておき、現在のフレームの輝度と比較する。
S304において、撮像により得られた映像信号(映像データ)に対して画像処理を行い、輝度情報を取得する。輝度情報とは、画素毎又は画素ブロック毎の輝度値、時間的な輝度変化の量、および、空間的な輝度変化の量である。時間的な輝度変化の量を算出する場合には、1フレーム以上前に撮像した映像信号の輝度をメモリに保存しておき、現在のフレームの輝度と比較する。
S305において、S304で得られた輝度情報に基づいて画像処理部102cで機械認識処理を行う。
S306において、画像処理部102cにて現像処理を行う。これにより映像データはJPEGなどの画像に圧縮処理される。
S307において、ネットワークI/F108によって、圧縮処理された画像をクライアント装置210に配信(送信)する。
クライアント装置210は圧縮された画像を受信する。クライアント装置210は受信した画像を表示装置201に表示する。
S306において、画像処理部102cにて現像処理を行う。これにより映像データはJPEGなどの画像に圧縮処理される。
S307において、ネットワークI/F108によって、圧縮処理された画像をクライアント装置210に配信(送信)する。
クライアント装置210は圧縮された画像を受信する。クライアント装置210は受信した画像を表示装置201に表示する。
図4を参照して、ユーザによる機械認識領域の設定方法について説明する。図4はユーザの操作画面の一例である。操作画面となるディスプレイ400において、配信画像401と機能選択部404の一例が示されている。配信画像401内に示す格子は撮像素子102aの露光ブロックの境界である。配信画像401の左上にある露光ブロック402は斜線部で示されている。またユーザは機械認識を行う領域を選択することが可能である。ユーザが指定した機械認識領域はユーザ指定領域403であり、図4ではドット部で示されている。ユーザ指定領域403はマウス操作によって画像の領域をドラッグやクリックにすることによって指定することができる。
機能選択部404は機械認識の機能を選択するユーザインターフェースである。一例として、図4には、持ち去り検知405、置き去り検知406、動体検出407、人体検出408、顔認識409のボタンが示されている。機能選択部404を使用して、機械認識(画像認識)の内容を決定することができる。
持ち去り検知とは指定された領域内の静止物が移動したかを判定する機能で、輝度またはエッジの時間的な変化に基づいて検知を行う。置き去り検知とは指定された領域内の静止物が移動しないかを判定する機能で、輝度またはエッジの時間的な変化に基づいて検知を行う。持ち去り検知および置き去り検知は静止物に対してのエッジまたは輝度情報に基づいて判定するため、動きブレは検出精度に影響しない。そのため、露光時間は長秒に設定することが可能であり、その分アナログゲインを低く設定することで低ノイズの画像を取得できる。これによって検出精度が向上する。また、動体検出の一例として輝度の時間的な変化から算出する(動体を検出する)方法がある。この場合、輝度に時間的な変化(動き)があるかどうかが判断基準となるため、動きブレは検出精度に影響しない。そのため、露光時間は長秒に設定することが可能であり、その分アナログゲインを低く設定することで低ノイズの画像を取得できる。これによって検出精度が向上する。
人体検出は、一枚の画像から人体の特徴となるエッジ(例えば頭や肩)を検出して、教師データと比較して類似しているかを評価値として算出する。類似している場合には評価値が高くなる。類似していない場合には評価値が低くなる。一枚の画のエッジを検出するため、動きブレがないことが重要となる。そのため露光時間を短秒にすることでエッジの検出精度が向上する。
顔認識は、人体検出と同様に一枚の画像から人体の特徴となるエッジ(例えば目や鼻)を検出して、教師データと比較して類似しているかを評価値として算出する。類似している場合には評価値が高くなる。類似していない場合には評価値が低くなる。一枚の画のエッジを検出するため、動きブレがないことが重要となる。そのため露光時間を短秒にすることでエッジの検出精度が向上する。
図5、図6および図7を参照して機械認識領域の設定に応じたAEの遷移設定について説明する。本実施形態では非機械認識領域に適用する遷移図をバランス型AE遷移図(図5)、時間的な機械認識領域に適用する遷移図をアナログゲイン優先AE遷移図(図6)、空間的な機械認識領域に適用する遷移図を露光時間優先AE遷移図(図7)と称する。図5~図7において、横軸はアナログゲインを示し、縦軸は露光時間を示している。また、横軸および縦軸に記載している数字は段数を示していて、数字が一つ大きくなると露光する量が倍になる。アナログゲインの段数と露光時間の段数の和を露出=EV(Exposure Value)の段数として表現する。露出(EV)とアナログゲインおよび露光時間の関係を式(1)に示す。また、アナログゲインおよび露光時間によって決定される値を露光量Xとして式(2)に示す。EVの基準となるEV=0とは、ISO感度(アナログゲイン)を100かつ、露光時間を1秒かつ、絞りをF1の条件で撮像した被写体が適正な露出になる明るさである。本実施形態ではEVおよびXに関して、絞りについては省略し、アナログゲインまたは露光時間が変化したときの露出の変化を示す相対値として取り扱う。
露出EV(段数)=-(アナログゲイン(段数)+露光時間(段数))・・・式(1)
露光量X(段数)=-EV(段数)= アナログゲイン(段数)+露光時間(段数)
・・・式(2)
露出EV(段数)=-(アナログゲイン(段数)+露光時間(段数))・・・式(1)
露光量X(段数)=-EV(段数)= アナログゲイン(段数)+露光時間(段数)
・・・式(2)
すなわち、遷移図の左下(縦軸と横軸の交点)の露光条件ではアナログゲイン1段と露光時間1段の和なので、X=2となる。遷移図の右上端の露光条件では、例えば、アナログゲイン9段と露光時間9段の和になり、X=18となる。Xの値が同じであれば、露光条件とアナログゲインの差に依らず、露光量は同一となる。図中の矢印は露光条件の遷移方向を示している。Xを変化させるためには、矢印の方向にアナログゲインまたは露光時間を遷移する。本実施形態では説明を簡単にするために1段ずつ遷移させるが、一度に遷移できる値は1段に限定されない。
図5のバランス型AE遷移図では、ユーザの視認性が高い画像となるように露光時間とアナログゲインのバランスをとって遷移する。例えば、X=2からX=6に遷移するためには、アナログゲインと露光時間を交互に1段ずつ遷移させて、合計4段(アナログゲイン2段、露光時間2段)の遷移を行う。これにより、ノイズ感と動きブレのバランスをとった画像を取得することができる。
図5のバランス型AE遷移図に対して、時間的な機械認識領域に適用するアナログゲイン優先AE遷移図(図6)および空間的な機械認識領域に適用する露光時間優先AE遷移図(図7)では、アナログゲインと露光時間の優先度が異なる。アナログゲイン優先AE遷移図および露光時間優先AE遷移図のそれぞれについて説明する。
図6に示した時間的な機械認識領域に適用するアナログゲイン優先AE遷移図では、Xが低い(図ではX=10段以下)ときはアナログゲインを優先して低ゲイン(図では最小の1段)に固定して、露光時間によって露出の調整を行う。これによりノイズ感の少ない画像を取得することができる。従って、時間的な輝度の変化量がノイズに埋もれずに、検出精度が向上する。ただし、Xが大きい領域(図ではX=11以上)では、露光時間だけでXの値をこれ以上増大することができないので、アナログゲインによって露出を調整する。
なお、図6では、露光時間が最大になってからアナログゲインを変更するとしたが、露光時間が最大値になる前にアナログゲインを変更してもよい。例えば、X=6まではアナログゲインを1で固定し、X=8まではアナログゲインを2で固定するというような、段階的な制御(変更)をしてもよい。ただし、図5のバランス型AE遷移図に対して、アナログゲインの優先度を高く設定する。
図7に示した空間的な機械認識領域に適用するアナログゲイン優先AE遷移図(露光時間優先AE遷移図)では、Xが低い(図ではX=10段以下)ときは露光時間を優先して短秒(図では最小の1段)に固定して、アナログゲインによって露出の調整を行う。これにより動きブレの少ない画像を取得することができる。その結果、空間的な輝度の変化量が動きブレに埋もれずに、検出精度が向上する。ただし、Xが大きい領域(図ではX=11以上)では、アナログゲインだけでXの値を増大することができないので、露光時間によって露出を調整する。
なお、図7では、アナログゲインが最大になってから露光時間を変更するとしたが、アナログゲインが最大値になる前に露光時間を変更してもよい。例えば、X=6までは露光時間を1で固定し、X=8までは露光時間を2で固定するというような、段階的な制御をしてもよい。ただし、非機械認識領域に適用するバランス型AE遷移図(図5)に対して、露光時間の優先度を高く設定する。
本実施形態では、機械認識の種類(内容)に基づいて、機械認識領域に適用する露光条件の遷移設定を図6の遷移設定にするか図7の遷移設定にするかを決定する。非機械認識領域(画像認識領域以外の領域)に適用する遷移設定は、図5の遷移設定であるのでユーザ(人間)にとって視認性の高い露光条件になっている。
このように本実施形態において、機械認識領域に設定されている領域に対して優先度の異なるAEの遷移設定(図6の遷移設定または図7の遷移設定)に設定することで、非機械認識領域における視認性が高い画像出力しつつも、機械認識の検出精度を向上させることができる。さらに、機械認識の認識処理方法(機械認識の内容)によって、アナログゲインと露光時間のどちらを優先するか選択・決定することで、機械認識の種類に適した設定となり、検出精度を向上させることができる。
このように本実施形態において、機械認識領域に設定されている領域に対して優先度の異なるAEの遷移設定(図6の遷移設定または図7の遷移設定)に設定することで、非機械認識領域における視認性が高い画像出力しつつも、機械認識の検出精度を向上させることができる。さらに、機械認識の認識処理方法(機械認識の内容)によって、アナログゲインと露光時間のどちらを優先するか選択・決定することで、機械認識の種類に適した設定となり、検出精度を向上させることができる。
図6および図7で、機械認識領域に対するAEの遷移設定について説明したが、機械認識に必要な精度(要求される精度)によって遷移設定を変形(変更、調節)することで、機械認識に必要な精度を確保したまま、視認性を向上することができる。例えば、顔認証(空間的な認識処理)を用いて、「1.人の顔であるか判定する場合」と、「2.人の顔の年齢を判定する場合」、では必要となる精度が異なる。この場合、「2.人の顔の年齢を判定する場合」のほうが詳細なデータが必要となるため、高い検出精度が要求される。そのため「2.人の顔の年齢を判定する場合」には図7で示したように、X=2~10は露光時間の設定を1で固定して撮像を行って、被写体の動きブレを抑制する。これに対して、「1.人の顔であるか判定する場合」には、「2.人の顔の年齢を判定する場合」よりも高い精度(ほどの高い精度)は要求されない。そこで、検出精度が十分である明るさでは視認性を重視したAEの遷移を行い、検出精度が十分ではない明るさでは機械認識を重視したAEの遷移を行う。このような場合について、X=1から6までを検出精度が十分である明るさとして具体的に説明する。
検出精度が十分である明るさX=1から6までは図5のバランス型AE遷移と同様に遷移させて視認性を向上させる。検出精度が十分ではない明るさであるX=6から12では露光時間を3で固定して検出精度を向上させる。露光時間を固定する段数は図7と異なるが、図7と同様に露光時間を優先(固定)させる。X=12以上では、図7と同様にこれ以上アナログゲインによる調整ができないため、露光時間で露出の調整を行う。このように、必要な精度によって、優先度を変更することで、必要な検出精度を維持しつつも視認性を向上することができる。また、機械認識に必要な精度に依らず、機械認識の種類によっても、同様にAEの遷移設定を変形(変更、調節)することが可能である。
非機械認識領域に対して、新たに機械認識領域を設定する場合もある。例えば、非機械認識領域で動体が検出(認識)された場合、新たに機械認識領域を設定する。この場合、Xの値に依らず、切り替え後(機械認識領域)のAE遷移図におけるAEの設定となるように、露光時間およびアナログゲインを遷移させることが望ましい。この場合、1フレームで一度に遷移させてもよいし、数段ずつ徐々に(段階的に)遷移させてもよい。一度に遷移させる場合にはAE遷移図の目標とするXのAE設定を参照して、変更を行う。数段ずつ徐々に遷移させる場合には、アナログゲインまたは露光時間のうち、優先する項目を先に遷移させることが望ましい。これによって短時間で検出精度を向上することが可能となる。このように、領域の種類(非機械認識領域、時間的な機械認識領域、空間的な機械認識領域)が変更される場合には、切り替え後のAE遷移図を参照して、露光時間およびアナログゲインを遷移させる。
本実施形態では露光量X(=-EV)の値を露光時間またはアナログゲインの和として示した。しかし、撮像光学系101でしぼりやND(Neutral Density)フィルタによって撮像素子102へ入射する光量が変化する場合も有り得る。そのため、輝度情報および撮像光学系101の光学情報に基づいて、X(=-EV)の値を補正して、露光時間またはアナログゲインを遷移させることが望ましい。
上記した実施形態では、AEの遷移図においてアナログゲインおよび露光時間が1段ごとに変化(遷移)する例を示したが、1段ごとである必要はない。例えば1/3段ごとに遷移してもよいし、2段ごとに遷移してもよい。
AEの遷移設定を変更するための機械認識領域の設定の有無は機械認識の種類や領域の位置、撮像状況などによって設計者もしくはユーザが変更可能である。例えば複数の機械認識の種類・内容(例えば、図4の機能選択部404に示された5つの画像認識405~409)の中でも顔認証の精度のみを上げたい場合には、顔認証を実施する領域のみ機械認識領域のAEの遷移設定を変更してもよい。また、AEの遷移設定を変更は、機械認識を行うすべての領域に適用する必要はない。例えば、動体検出と人体識別の両方を同時に異なる領域で実施する場合でも、片方のみ、AEの遷移設定を変更してもよい。このとき設計者もしくはユーザが機械認識の種類(内容)に応じて機械認識領域を設定するか選択(決定)することが望ましい。これにより設計者もしくはユーザが重要視する機械認識に対して精度を向上することができる。
また動体検出後に人物識別(人体検出)を行うなど、同一の領域に対して異なる機械認識を行う場合には、それぞれの機械認識を行うタイミング毎に、AEの遷移設定を変更してもよい。動体検出後に人体検出(人物検出)を行う場合、どのようにAEの遷移設定を変更するかについて、以下に具体的に説明する。
動体検出(時間的な認識処理)では、誤検出を防ぐためにノイズを抑制することが望ましい(図6)。これに対し、動体検出の後に行う人体検出(空間的な認識処理)では、人体検出や顔検出といった特徴点を正確に算出するために露光時間を短くすることが望ましい(図7)。そのため、動体検出期間中は図6のアナログゲイン優先のAE遷移図を適用し、人物識別期間中は図7の露光時間優先のAE遷移図を適用する。これにより、異なるタイミングに限定されるが同一領域に複数のAEの遷移設定を反映することができる。すなわち、同一領域で異なる種類の領域設定を行う場合でも、機械認識の精度を向上することができる。
<第2の実施形態>
第1の実施形態では、ユーザが機械認識領域を指定する場合(図3のS300)を説明した。第2の実施形態では、撮像装置100が自動で機械認識領域を指定(設定)する場合を説明する。第2の実施形態では、顔認証を具体例に挙げて説明する。顔認証を行うために、まず動体検出を行う。動体が検出された場合、当該動体(領域)に対して機械認識領域を設定して顔認証を実施する。なお、以下の記載において、第1の実施形態と同じ構成および処理については、同じ参照符号を付けて、詳細な説明は省略する。
第1の実施形態では、ユーザが機械認識領域を指定する場合(図3のS300)を説明した。第2の実施形態では、撮像装置100が自動で機械認識領域を指定(設定)する場合を説明する。第2の実施形態では、顔認証を具体例に挙げて説明する。顔認証を行うために、まず動体検出を行う。動体が検出された場合、当該動体(領域)に対して機械認識領域を設定して顔認証を実施する。なお、以下の記載において、第1の実施形態と同じ構成および処理については、同じ参照符号を付けて、詳細な説明は省略する。
本発明の第2の実施形態を、図8を用いて説明する。図8は本実施形態の処理を実施するための手順を示したフローチャートである。
S800において、撮像装置100は予備撮像を行う。予備撮像により、撮像装置100の撮像輝度を取得する。
その後、S801において、予備撮像時の輝度から、時間的な輝度変化が所定量以上あるか否かを判定する。より詳しくは、時間的な輝度変化に基づいて、動体(機械認識対象)が検出されたか判定する。動体を検出するためにS801では時間的な認識処理を用いて、時間的な輝度変化が所定量以上あった場合には、動体がいる領域と判定する。このとき、動体の検出は画像全面で実施する。そのため、予備撮像期間中のAEの遷移設定は、時間的な認識処理向けのAE遷移図(図6)に設定しておくことが望ましい。ただし、ユーザが画像を視認する場合には、バランス型AE遷移図(図5)に設定してもよい。
S800において、撮像装置100は予備撮像を行う。予備撮像により、撮像装置100の撮像輝度を取得する。
その後、S801において、予備撮像時の輝度から、時間的な輝度変化が所定量以上あるか否かを判定する。より詳しくは、時間的な輝度変化に基づいて、動体(機械認識対象)が検出されたか判定する。動体を検出するためにS801では時間的な認識処理を用いて、時間的な輝度変化が所定量以上あった場合には、動体がいる領域と判定する。このとき、動体の検出は画像全面で実施する。そのため、予備撮像期間中のAEの遷移設定は、時間的な認識処理向けのAE遷移図(図6)に設定しておくことが望ましい。ただし、ユーザが画像を視認する場合には、バランス型AE遷移図(図5)に設定してもよい。
S801において、動体が検出されない場合には、予備撮像(S800)を繰り返す。動体が検出された場合にはS802に移行する。
S802において、動体が検出された領域を、顔認証(空間的な認識処理)を行うための機械認識領域に設定する。このとき、検出誤差や動体の動きを考慮した設定を行う。具体的には、実際に検出された領域の周辺も含めた大きい領域を空間的な認識処理を行う機械認識領域に設定することが望ましい。S802の後、S302に移行する。
S302からS307は図3と同様のため、説明は省略する。S307の後、S803に移行する。
S802において、動体が検出された領域を、顔認証(空間的な認識処理)を行うための機械認識領域に設定する。このとき、検出誤差や動体の動きを考慮した設定を行う。具体的には、実際に検出された領域の周辺も含めた大きい領域を空間的な認識処理を行う機械認識領域に設定することが望ましい。S802の後、S302に移行する。
S302からS307は図3と同様のため、説明は省略する。S307の後、S803に移行する。
S803において、顔認証(機械認識)が完了したか判定を行う。例えば、顔認証の評価値が所定値以上であれば(評価値が80/100点以上であれば)、顔認証が完了したと判定する。顔認証が完了したならば、S804に移行して機械認識領域の設定を解除し、図8の処理を終了する。S803において、評価値が80/100点未満であればS805に移行する。
S805において、顔認証のエラー判定(エラーか否かの判定)を実施する。例えば、評価値が80/100点未満となった画像の枚数をカウントしていき、当該カウントが所定数(例えば、10)になったか否かを判定する。評価値が80/100点未満となった画像の枚数が10枚になるまでは、S805の判定結果はNoであり、S302に移行してS302~S803の処理を繰り返す。評価値が80/100点未満となった画像の枚数が10枚になっても評価値が80/100点以上とならない場合にはエラーと判定する(S805:Yes)。エラーと判定された後、S804に移行して機械認識領域の設定を解除し、画像の枚数のカウントをリセットし、図8の処理を終了する。
なお、図示していないが、S804の後、予備撮像時のAEの遷移設定に戻す。
以上、本実施形態における機械認識領域を自動で設定する場合におけるAEの遷移設定の方法について示した。このように本実施形態においても、機械認識領域に設定されている領域に対して優先度の異なるAEの遷移設定に設定することで、非機械認識領域における視認性が高い画像出力しつつも、機械認識の検出精度を向上させることができる。さらに、機械認識の認識処理方法によって、アナログゲインと露光時間のどちらを優先するか決定することで、機械認識の種類に適した設定となり、検出精度を向上させることができる。
なお、機械認識領域の設定は、機械認識による認識(検出)結果に基づいて、変更してもよい。
以上、本実施形態における機械認識領域を自動で設定する場合におけるAEの遷移設定の方法について示した。このように本実施形態においても、機械認識領域に設定されている領域に対して優先度の異なるAEの遷移設定に設定することで、非機械認識領域における視認性が高い画像出力しつつも、機械認識の検出精度を向上させることができる。さらに、機械認識の認識処理方法によって、アナログゲインと露光時間のどちらを優先するか決定することで、機械認識の種類に適した設定となり、検出精度を向上させることができる。
なお、機械認識領域の設定は、機械認識による認識(検出)結果に基づいて、変更してもよい。
<第3の実施形態>
第1の実施形態および第2の実施形態では、撮像装置100で機械認識を実施する場合について示した。第3の実施形態ではクライアント装置210で機械認識を実施する場合を説明する。顔認証などを行う場合、複数の特徴点を算出して、当該複数の特徴点を膨大な教師データと比較するので、高い演算能力が必要となる。クライアント装置210のほうが撮像装置100に比べて演算能力が高い場合には、機械認識をクライアント装置210で実施することが望ましいことも有り得る。なお、以下の記載において、第1の実施形態および第2の実施形態と同じ構成および処理については、同じ参照符号を付けて、詳細な説明は省略する。
第1の実施形態および第2の実施形態では、撮像装置100で機械認識を実施する場合について示した。第3の実施形態ではクライアント装置210で機械認識を実施する場合を説明する。顔認証などを行う場合、複数の特徴点を算出して、当該複数の特徴点を膨大な教師データと比較するので、高い演算能力が必要となる。クライアント装置210のほうが撮像装置100に比べて演算能力が高い場合には、機械認識をクライアント装置210で実施することが望ましいことも有り得る。なお、以下の記載において、第1の実施形態および第2の実施形態と同じ構成および処理については、同じ参照符号を付けて、詳細な説明は省略する。
本発明の第3の実施形態を、図9A~図11を用いて説明する。図9Aはクライアント装置210の機能構成を示している。クライアント装置210は、ネットワークI/F901と、システム制御部902と、出力I/F903と、入力I/F904と、画像処理部905と、メモリ906と、を備えている。
ネットワークI/F901は、ネットワーク110とクライアント装置210を接続するインターフェースであり、データの入出力を行う。システム制御部902は、各モジュールを制御する。出力I/F903は表示装置201とのインターフェースである。入力I/F904は入力装置202とのインターフェースである。メモリ906は、撮像装置100から受信した画像や輝度情報を格納する。また、メモリ906は、顔認証で使用する教師データと、システム制御部902が使用するプログラムなどを記憶している。
ネットワークI/F901は、ネットワーク110とクライアント装置210を接続するインターフェースであり、データの入出力を行う。システム制御部902は、各モジュールを制御する。出力I/F903は表示装置201とのインターフェースである。入力I/F904は入力装置202とのインターフェースである。メモリ906は、撮像装置100から受信した画像や輝度情報を格納する。また、メモリ906は、顔認証で使用する教師データと、システム制御部902が使用するプログラムなどを記憶している。
画像処理部905は撮像装置100から出力される画像もしくは輝度情報に基づいて機械認識を行う。圧縮前の輝度情報に基づいて機械認識を行う場合は、撮像装置100で機械認識を実施する場合と同等の精度が得られる。これに対して、圧縮後の画像に基づいて機械認識を行う場合はデータが圧縮されて分解能が落ちるため、撮像装置100で機械認識を実施する場合と比べて検出精度(認識精度)が低下する。さらに、圧縮処理のパラメータはフレーム毎に変化する場合があるため、被写体に変化がなくても、圧縮画像に時間的な変化が生まれることがある。そのため、時間的な認識処理を行う場合には、圧縮による変化も加味したうえで、画像の明るさの変化に対する機械認識処理のパラメータを設定することが望ましい。例えば、動体検出において、時間的な画像の明るさの変化をみて判断する場合に、基準となる所定値よりも大きいか否かで判断するが、圧縮率が変化する場合や圧縮率が高い場合には、誤検出を防ぐために所定値を緩和することが望ましい。
図9Bは、クライアント装置210のハードウェア構成の例を示すブロック図である。
クライアント装置210は、クライアントCPU911、主記憶装置912、補助記憶装置913、入力I/F914、出力I/F915およびネットワークI/F916を有する。クライアント装置210の各要素は、システムバス917を介して、相互に通信可能に接続されている。
クライアント装置210は、クライアントCPU911、主記憶装置912、補助記憶装置913、入力I/F914、出力I/F915およびネットワークI/F916を有する。クライアント装置210の各要素は、システムバス917を介して、相互に通信可能に接続されている。
クライアントCPU911は、クライアント装置210の動作を統括的に制御する中央演算装置である。なお、クライアントCPU911によって、ネットワーク110を介して撮像装置100の統括的な制御を実行してもよい。クライアントCPU911は、図9Aのシステム制御部902および画像処理部905に対応する。
主記憶装置912は、クライアントCPU911のデータの一時的な記憶場所として機能するRAM等の記憶装置である。例えば、主記憶装置912は、クライアント装置210が顔検出や人体検出を行う際に使用するパターンマッチング用のパターン(顔の特徴部分や人体の特徴部分に対応するパターン)を予め格納している。主記憶装置912は、図9Aのメモリ906に対応する。
補助記憶装置913は、各種プログラム、各種設定データ等を記憶するHDD、ROM、SSD等の記憶装置である。また、補助記憶装置913には、あらかじめ登録された顔画像と人物情報とを関連付けたデータベース(顔認証データベース)が保存されていてもよい。HDDはHard Disk Driveの略である。SSDはSolid State Driveの略である。補助記憶装置913も、図9Aのメモリ906に対応する。
主記憶装置912は、クライアントCPU911のデータの一時的な記憶場所として機能するRAM等の記憶装置である。例えば、主記憶装置912は、クライアント装置210が顔検出や人体検出を行う際に使用するパターンマッチング用のパターン(顔の特徴部分や人体の特徴部分に対応するパターン)を予め格納している。主記憶装置912は、図9Aのメモリ906に対応する。
補助記憶装置913は、各種プログラム、各種設定データ等を記憶するHDD、ROM、SSD等の記憶装置である。また、補助記憶装置913には、あらかじめ登録された顔画像と人物情報とを関連付けたデータベース(顔認証データベース)が保存されていてもよい。HDDはHard Disk Driveの略である。SSDはSolid State Driveの略である。補助記憶装置913も、図9Aのメモリ906に対応する。
入力I/F914は、クライアント装置210が入力装置202等からの入力(信号)を受け取る際に利用されるインターフェースである。入力I/F914は、図9Aの入力I/F904に対応する。
出力I/F915は、クライアント装置210から表示装置201等への情報(信号)を出力する際に利用されるインターフェースである。出力I/F915は、図9Aの出力I/F903に対応する。
ネットワークI/F916は、撮像装置100等の外部の装置とのネットワーク110を介した通信に利用されるインターフェースである。ネットワークI/F916は図9AのネットワークI/F901に対応する。
クライアントCPU911が、補助記憶装置913に記憶されたプログラムに基づき処理を実行することによって、クライアント装置210の処理(図10のS1000や図11のS1100)が実現される。
出力I/F915は、クライアント装置210から表示装置201等への情報(信号)を出力する際に利用されるインターフェースである。出力I/F915は、図9Aの出力I/F903に対応する。
ネットワークI/F916は、撮像装置100等の外部の装置とのネットワーク110を介した通信に利用されるインターフェースである。ネットワークI/F916は図9AのネットワークI/F901に対応する。
クライアントCPU911が、補助記憶装置913に記憶されたプログラムに基づき処理を実行することによって、クライアント装置210の処理(図10のS1000や図11のS1100)が実現される。
次に、図10および図11を参照してクライアント装置210が実行する処理について説明する。図10は、第1の実施形態のようにユーザが機械認識領域を指定する(図3)が、機械認識処理をクライアント装置210が実施する場合の動作手順の一例を示している。図11は、第2の実施形態のように自動で機械認識領域を指定する(図8)が、機械認識処理をクライアント装置210が実施する動作手順の一例である。
まず、図10について説明する。図10におけるS300からS304は図3と同じである。図10にS305はない。図10におけるS306およびS307も図3と同じである。S307で、撮像装置100が画像をクライアント装置210に配信する。当該画像は、クライアント装置210のネットワークI/F901を介して画像処理部905に配信(送信)される。図10ではS307の後にS1000を実施する。
S1000において、クライアント装置210の画像処理部905は、配信(送信)されてきた画像に基づいて機械認識を行う。このとき、空間的な認識処理を行う場合には、配信された画像に対して、機械認識のための演算・処理を行う。時間的な認識処理を行う場合には、フレーム毎に画像をメモリ906に保存しておき、機械認識のための演算・処理を行う。例えば、顔認証を実施する場合には、配信された画像とメモリ906に格納している教師データを比較して、評価値を算出する。このように図3のS305における機械認識処理(撮像装置)を、S1000で示したようにクライアント装置で実施することができる。
S1000において、クライアント装置210の画像処理部905は、配信(送信)されてきた画像に基づいて機械認識を行う。このとき、空間的な認識処理を行う場合には、配信された画像に対して、機械認識のための演算・処理を行う。時間的な認識処理を行う場合には、フレーム毎に画像をメモリ906に保存しておき、機械認識のための演算・処理を行う。例えば、顔認証を実施する場合には、配信された画像とメモリ906に格納している教師データを比較して、評価値を算出する。このように図3のS305における機械認識処理(撮像装置)を、S1000で示したようにクライアント装置で実施することができる。
次に、図11について説明する。図11におけるS800~S802、S302~S304、S306、S307およびS803~S805は図8と同じである。図11にもS305はない。S307で、撮像装置100が画像をクライアント装置210に配信する。当該画像は、クライアント装置210のネットワークI/F901を介して画像処理部905に配信(送信)される。図11では、S307とS803の間にS1100の処理を行う。
S1100において、クライアント装置210の画像処理部905は、配信(送信)されてきた画像に基づいて機械認識を行う。この機械認識の処理はS1000(図10)と同様のため、説明を省略する。このように図8のS305における機械認識処理(撮像装置)を、S1100で示したようにクライアント装置210で実施することができる。
S1100において、クライアント装置210の画像処理部905は、配信(送信)されてきた画像に基づいて機械認識を行う。この機械認識の処理はS1000(図10)と同様のため、説明を省略する。このように図8のS305における機械認識処理(撮像装置)を、S1100で示したようにクライアント装置210で実施することができる。
本実施形態では、機械認識処理をクライアント装置210で行う場合におけるAEの遷移設定の方法について説明した。本実施形態においても、機械認識領域に設定されている領域に対して優先度の異なるAEの遷移設定に設定することで、非機械認識領域における視認性が高い画像出力しつつも、機械認識の検出精度を向上させることができる。さらに、機械認識の認識処理方法によって、アナログゲインと露光時間のどちらを優先するか決定することで、機械認識の種類に適した設定となり、検出精度を向上させることができる。
上記した機械認識の種類は、時間的な機械認識(処理)と空間的な機械認識(処理)を含む。また、機械認識処理を行うのは、撮像装置100またはクライアント装置210のどちらか片方だけでもよく、両方でもよい。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行することによっても実現できる。 従って、本発明の機能処理をコンピュータで実現するために、当該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明には、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。OSはOperating Systemの略である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行することによっても実現できる。 従って、本発明の機能処理をコンピュータで実現するために、当該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明には、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。OSはOperating Systemの略である。
本実施形態の開示は、以下の構成、システム、方法およびプログラムを含む。
構成1
単一あるいは複数の画素ごとに露光条件を設定可能な露光領域を有する撮像手段と、
画像処理による画像認識を行う画像認識領域を取得する取得手段と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定手段と、
前記決定手段により決定した前記露光条件の遷移設定を用いて、前記撮像手段による撮像を行う撮像制御手段と、
を備えることを特徴とする撮像装置。
構成2
前記露光条件はアナログゲインと露光時間を含み、
前記決定手段は、前記画像認識の内容に応じて、前記遷移設定における前記アナログゲインと前記露光時間の優先度を決定することを特徴とする構成1に記載の撮像装置。
構成3
前記画像認識領域に適用する前記露光条件の遷移設定は、前記画像認識領域以外の領域に適用する露光条件の遷移設定とは異なることを特徴とする構成2に記載の撮像装置。
構成4
時間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記露光時間より前記アナログゲインを優先した遷移設定とすることを特徴とする構成3に記載の撮像装置。
構成5
空間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記アナログゲインより前記露光時間を優先した遷移設定とすることを特徴とする構成3に記載の撮像装置。
構成6
前記決定手段は、前記画像認識の種類または前記画像認識に要求される精度によって、前記露光条件の遷移設定を決定することを特徴とする構成1から構成5のいずれかに記載の撮像装置。
構成7
前記取得手段は、外部からの領域指定情報に基づいて、前記画像認識領域を取得することを特徴とする構成1から構成6のいずれかに記載の撮像装置。
構成8
前記画像認識の結果に基づいて前記画像認識領域を指定する指定手段をさらに備え、
前記取得手段は、前記指定手段による指定に基づいて、前記画像認識領域を取得することを特徴とする構成1から構成6のいずれかに記載の撮像装置。
構成9
前記画像認識による検出結果に基づいて前記画像認識領域の設定を変更する変更手段をさらに備えることを特徴とする構成1から構成8のいずれかに記載の撮像装置。
構成10
前記撮像装置は撮像光学系をさらに備え、
前記決定手段は、前記画像認識の内容に加えて、前記画素の輝度および前記撮像光学系の光学情報も用いて、前記画像認識領域に適用する前記露光条件の遷移設定を決定することを特徴とする構成1から構成9のいずれかに記載の撮像装置。
構成11
前記画像認識の内容は、少なくとも、前記画像認識の種類と、画像認識される物体と、前記物体の部位と、のいずれかを含むことを特徴とする構成1から構成10のいずれかに記載の撮像装置。
構成12
前記画像認識のための画像処理を行う処理手段をさらに備えることを特徴とする構成1から構成11のいずれかに記載の撮像装置。
構成13
前記撮像装置は、前記撮像手段により撮像した画像を外部の情報処理装置に送信し、当該情報処理装置が前記画像認識を行うことを特徴とする構成1から構成11のいずれかに記載の撮像装置。
システム1
構成13に記載の撮像装置と、
前記撮像装置から送信されてきた画像に対して、前記画像認識のための画像処理を行う情報処理装置と、
を有することを特徴とするシステム。
方法1
単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置の制御方法であって、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を有することを特徴とする制御方法。
プログラム1
単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置のコンピュータに、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を実行させるためのプログラム。
構成1
単一あるいは複数の画素ごとに露光条件を設定可能な露光領域を有する撮像手段と、
画像処理による画像認識を行う画像認識領域を取得する取得手段と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定手段と、
前記決定手段により決定した前記露光条件の遷移設定を用いて、前記撮像手段による撮像を行う撮像制御手段と、
を備えることを特徴とする撮像装置。
構成2
前記露光条件はアナログゲインと露光時間を含み、
前記決定手段は、前記画像認識の内容に応じて、前記遷移設定における前記アナログゲインと前記露光時間の優先度を決定することを特徴とする構成1に記載の撮像装置。
構成3
前記画像認識領域に適用する前記露光条件の遷移設定は、前記画像認識領域以外の領域に適用する露光条件の遷移設定とは異なることを特徴とする構成2に記載の撮像装置。
構成4
時間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記露光時間より前記アナログゲインを優先した遷移設定とすることを特徴とする構成3に記載の撮像装置。
構成5
空間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記アナログゲインより前記露光時間を優先した遷移設定とすることを特徴とする構成3に記載の撮像装置。
構成6
前記決定手段は、前記画像認識の種類または前記画像認識に要求される精度によって、前記露光条件の遷移設定を決定することを特徴とする構成1から構成5のいずれかに記載の撮像装置。
構成7
前記取得手段は、外部からの領域指定情報に基づいて、前記画像認識領域を取得することを特徴とする構成1から構成6のいずれかに記載の撮像装置。
構成8
前記画像認識の結果に基づいて前記画像認識領域を指定する指定手段をさらに備え、
前記取得手段は、前記指定手段による指定に基づいて、前記画像認識領域を取得することを特徴とする構成1から構成6のいずれかに記載の撮像装置。
構成9
前記画像認識による検出結果に基づいて前記画像認識領域の設定を変更する変更手段をさらに備えることを特徴とする構成1から構成8のいずれかに記載の撮像装置。
構成10
前記撮像装置は撮像光学系をさらに備え、
前記決定手段は、前記画像認識の内容に加えて、前記画素の輝度および前記撮像光学系の光学情報も用いて、前記画像認識領域に適用する前記露光条件の遷移設定を決定することを特徴とする構成1から構成9のいずれかに記載の撮像装置。
構成11
前記画像認識の内容は、少なくとも、前記画像認識の種類と、画像認識される物体と、前記物体の部位と、のいずれかを含むことを特徴とする構成1から構成10のいずれかに記載の撮像装置。
構成12
前記画像認識のための画像処理を行う処理手段をさらに備えることを特徴とする構成1から構成11のいずれかに記載の撮像装置。
構成13
前記撮像装置は、前記撮像手段により撮像した画像を外部の情報処理装置に送信し、当該情報処理装置が前記画像認識を行うことを特徴とする構成1から構成11のいずれかに記載の撮像装置。
システム1
構成13に記載の撮像装置と、
前記撮像装置から送信されてきた画像に対して、前記画像認識のための画像処理を行う情報処理装置と、
を有することを特徴とするシステム。
方法1
単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置の制御方法であって、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を有することを特徴とする制御方法。
プログラム1
単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置のコンピュータに、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を実行させるためのプログラム。
100 撮像装置、101 撮像光学系、102 撮像部、103 システム制御部、104 機械認識領域取得部、105 優先度決定部、106 AE制御部、123 CPU、126 撮像制御部、129 画像処理部、210 クライアント装置
Claims (16)
- 単一あるいは複数の画素ごとに露光条件を設定可能な露光領域を有する撮像手段と、
画像処理による画像認識を行う画像認識領域を取得する取得手段と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定手段と、
前記決定手段により決定した前記露光条件の遷移設定を用いて、前記撮像手段による撮像を行う撮像制御手段と、
を備えることを特徴とする撮像装置。 - 前記露光条件はアナログゲインと露光時間を含み、
前記決定手段は、前記画像認識の内容に応じて、前記遷移設定における前記アナログゲインと前記露光時間の優先度を決定することを特徴とする請求項1に記載の撮像装置。 - 前記画像認識領域に適用する前記露光条件の遷移設定は、前記画像認識領域以外の領域に適用する露光条件の遷移設定とは異なることを特徴とする請求項2に記載の撮像装置。
- 時間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記露光時間より前記アナログゲインを優先した遷移設定とすることを特徴とする請求項3に記載の撮像装置。
- 空間的な輝度の変化に基づいて前記画像認識を行う場合、前記決定手段は、前記アナログゲインより前記露光時間を優先した遷移設定とすることを特徴とする請求項3に記載の撮像装置。
- 前記決定手段は、前記画像認識の種類または前記画像認識に要求される精度によって、前記露光条件の遷移設定を決定することを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。
- 前記取得手段は、外部からの領域指定情報に基づいて、前記画像認識領域を取得することを特徴とする請求項6に記載の撮像装置。
- 前記画像認識の結果に基づいて前記画像認識領域を指定する指定手段をさらに備え、
前記取得手段は、前記指定手段による指定に基づいて、前記画像認識領域を取得することを特徴とする請求項6に記載の撮像装置。 - 前記画像認識による検出結果に基づいて前記画像認識領域の設定を変更する変更手段をさらに備えることを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。
- 前記撮像装置は撮像光学系をさらに備え、
前記決定手段は、前記画像認識の内容に加えて、前記画素の輝度および前記撮像光学系の光学情報も用いて、前記画像認識領域に適用する前記露光条件の遷移設定を決定することを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。 - 前記画像認識の内容は、少なくとも、前記画像認識の種類と、画像認識される物体と、前記物体の部位と、のいずれかを含むことを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。
- 前記画像認識のための画像処理を行う処理手段をさらに備えることを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。
- 前記撮像装置は、前記撮像手段により撮像した画像を外部の情報処理装置に送信し、当該情報処理装置が前記画像認識を行うことを特徴とする請求項1から請求項5のいずれかに記載の撮像装置。
- 請求項13に記載の撮像装置と、
前記撮像装置から送信されてきた画像に対して、前記画像認識のための画像処理を行う情報処理装置と、
を有することを特徴とするシステム。 - 単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置の制御方法であって、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を有することを特徴とする制御方法。 - 単一あるいは複数の画素ごとに、露光条件を設定可能な露光領域を有する撮像素子を備える撮像装置のコンピュータに、
画像処理による画像認識を行う画像認識領域を取得する取得工程と、
前記画像認識の内容に基づいて、前記画像認識領域に適用する前記露光条件の遷移設定を決定する決定工程と、
前記決定工程により決定した前記露光条件の遷移設定を用いて、前記撮像素子による撮像を行う撮像工程と、
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022114572A JP2024012828A (ja) | 2022-07-19 | 2022-07-19 | 撮像装置およびその制御方法 |
US18/353,710 US20240031683A1 (en) | 2022-07-19 | 2023-07-17 | Image capturing apparatus, control method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022114572A JP2024012828A (ja) | 2022-07-19 | 2022-07-19 | 撮像装置およびその制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024012828A true JP2024012828A (ja) | 2024-01-31 |
Family
ID=89576254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022114572A Pending JP2024012828A (ja) | 2022-07-19 | 2022-07-19 | 撮像装置およびその制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240031683A1 (ja) |
JP (1) | JP2024012828A (ja) |
-
2022
- 2022-07-19 JP JP2022114572A patent/JP2024012828A/ja active Pending
-
2023
- 2023-07-17 US US18/353,710 patent/US20240031683A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240031683A1 (en) | 2024-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8629915B2 (en) | Digital photographing apparatus, method of controlling the same, and computer readable storage medium | |
EP3320676B1 (en) | Image capturing apparatus and method of operating the same | |
CN111107276B (zh) | 信息处理设备及其控制方法、存储介质以及摄像系统 | |
JP6863284B2 (ja) | 検出装置、検出方法、検出プログラムおよび撮像装置 | |
US20180241949A1 (en) | Image pickup apparatus, control method for image pickup apparatus | |
JP2009177472A (ja) | 画像処理方法、画像処理装置及び撮像装置 | |
JP2012118817A (ja) | 画像処理装置及び画像処理方法、プログラム、並びに記憶媒体 | |
JP6752681B2 (ja) | 表示制御装置、表示制御装置の制御方法及びプログラム並びに記憶媒体 | |
US10237488B2 (en) | Image capturing apparatus and image capturing method | |
JP7516471B2 (ja) | 制御装置、撮像装置、制御方法およびプログラム | |
JP2019129446A (ja) | 画像処理装置、および画像処理方法、並びにプログラム | |
US20200099841A1 (en) | Image capturing apparatus, control method for image capturing apparatus, and control program for image capturing apparatus | |
US11575841B2 (en) | Information processing apparatus, imaging apparatus, method, and storage medium | |
US20110115938A1 (en) | Apparatus and method for removing lens distortion and chromatic aberration | |
US11202044B2 (en) | Image processing apparatus and method | |
KR20130005883A (ko) | 디지털 촬영 장치, 그 제어방법, 및 컴퓨터 판독가능 저장매체 | |
EP4199528A1 (en) | Image processing apparatus, image capture apparatus, and image processing method | |
US20190199952A1 (en) | Imaging apparatus and imaging method | |
EP3474532A1 (en) | Image processing apparatus, image processing method, and program | |
JP2024012828A (ja) | 撮像装置およびその制御方法 | |
US20160269628A1 (en) | Image processing apparatus, image processing method, and recording medium | |
US20190052803A1 (en) | Image processing system, imaging apparatus, image processing apparatus, control method, and storage medium | |
WO2017208991A1 (ja) | 撮像処理装置、電子機器、撮像処理方法、撮像処理装置制御プログラム | |
US11843848B2 (en) | Control apparatus for controlling exposure and method for controlling the same | |
EP4243402A1 (en) | Information processing device, image capturing device, program, storage medium, and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20240614 |