(実施の形態1)
以下、図面を参照しながら、本発明の実施の形態について説明する。
図1は、本発明の実施の形態1に係る撮像システムの構成例を示す。撮像システムは、大きく、1台以上の撮像装置100((a)〜(n))と1台以上のコントローラ装置200で構成される。撮像装置100とコントローラ装置200は、ネットワーク303を介して接続される。ネットワーク303は、本実施の形態では有線LAN(Local Area Network)を前提に説明するが、無線LAN(WiFi)、USB(Universal Serial Bus)、IEEE1394などの汎用ネットワークでも良い。
ネットワーク303においては、ネットワークプロトコルとして標準のIP(Internet Protocol)を使用し、上位のトランスポートプロトコルとしてはTCP(Transmission Control Protocol)、UDP(User Datagram Protocol)を用いる。撮像装置100が撮影した画像の転送には、さらに上位のアプリケーションプロトコル、例えばRTP(Real−time Transport Protocol)/RTCP(RTP Control Protocol)やHTTP(Hyper Text Transfer Protocol)等を使用し、転送制御にはRTSP(Real−Time Streaming Protocol)等を用いる。なお、IPはIPv4、IPv6のどちらを使用しても良い。また、上述したHTTPやRTPなどの技術を用いたWebサービスを用いて、より上位アプリケーション間での通信も可能とする。また、図示していないが、ハブやルータを介してインターネット接続も可能である。
コントローラ装置200は、複数の撮像装置100を制御することが可能であり、他のコントローラ装置200との間で情報をやり取りすることも可能である。
本実施の形態の撮像システムは、監視用途や入退室管理などのアプリケーションやサービスで利用することができる。
本実施の形態の特徴である撮像装置100は、レンズ11、撮像センサ部12、信号処理部13、信号出力制御部14、通信制御部15、IF部16、異常検出部17、照度監視部18、GPS19、時計20、メモリ21、保守IF部22、制御部23、赤外LED24から構成される。
レンズ11は、被写体からの可視光301、赤外光(非可視光)302を撮像センサ部12上の所定の焦点距離に結像させる撮影用の光学レンズであり、複数のレンズを含んで構成される。
撮像センサ部12は、レンズ11によって結像された可視光と赤外光を各種フィルタにより分光して光電変換することで所定の波長成分に対応した複数の画素信号を出力する部分である。
信号処理部13は、前記撮像センサ部12から出力される出力信号を処理して、内装処理や、カラー撮影時の第2の波長帯域を通過した赤外光の影響を除去する画像処理や、ガンマ補正や、ホワイトバランスや、RGBマトリックス補正等の画像処理を画像信号に施し、可視画像の出力信号と赤外画像の出力信号を出力する部分である。
信号出力制御部14、前記信号処理部13から出力された「同じタイミングで対象物を撮影した」可視画像信号と赤外画像信号を、通信制御部15あるいは制御部23の指示にしたがって、IF部16を介して、ネットワーク接続された所定のコントローラ装置200へ送信する。
通信制御部15は、前記信号出力制御部14からIF部16経由で出力する画像信号の制御と、IF部経由で前記コントローラ装置200との間で制御信号を送受信する部分である。前記したネットワークプロトコルやアプリケーションプロトコル、Webサービスなどを実行する部分でもある。
IF部16は、撮像装置100とネットワーク303とを接続する通信IF部分である。
異常検出部17は、撮像装置100のハードウェア、ソフトウェアに異常が発生していないかを常時あるいは定期的に監視し、異常を検出する部分である。例えば、撮像装置100が所定の設置場所から取り外された場合や画像撮影できなくなった場合、ネットワーク通信できなくなった場合など、不正アクセスがあった場合などである。
照度監視部18は、照度センサなどを利用して撮像装置100の撮影範囲の明るさを常時あるいは定期的に監視する部分である。照度が不足していることを検知した場合、制御部23にその旨を通知し、赤外LED24を照射する。
GPS19は、衛星から受信した位置情報から撮像装置100自身の現在位置を取得する部分である。取得した位置情報は、IF部16を介してコントローラ装置200へ通知することも可能である。
時計20は、現在の時間情報の管理、タイマー設定/解除を実行する部分である。時間情報は、NTP(Network Time Protocol)や標準電波など汎用的な技術を用いて自動調整する。
メモリ21は、プログラムや各種設定情報、プロパティ情報を記憶する記憶装置(ROM(Read−Only Memory)エリア、FROM(Flash ROM)エリア)、これらのプログラムやデータをロードして一時的に保管したり、ワークデータを記憶する記憶装置(RAM(Random Access Memory)エリア)である。ここで、記録装置は、内蔵メモリの他に、外付けメモリ(USBメモリやNAS(Network−Attached Storage))や可搬型媒体(マイクロフラッシュ、SDカード、磁気テープ等)を併用しても良い。
保守IF部22は、撮像装置100の保守員がプログラムの更新処理や故障発生時に診断するために通信するIF部分である。また、前記異常検出部17で異常を検知した場合に、遠隔にある保守サイトへ異常検知した内容を自動的に通知することも可能である。
制御部23は、上記した各構成要素の動作を統括的に制御する部分である。
一方コントローラ装置200は、ユーザIF部201、表示部202、時計203、メモリ204、記録再生部205、通信制御部206、IF部207、カメラ管理部208、動体領域抽出部209、顔領域検出部210、顔特徴点検出部211、顔照合部212、顔DB213、制御部214から構成される。
ユーザIF部201は、リモコンやタッチパネル、キーボード、マウス、ボタンなどを用いてユーザがコントローラ装置200を操作する部分である。
表示部202は、外付けあるいは内蔵のモニタに、コントローラ装置200の操作画面や、ネットワーク303経由で受信した可視画像や赤外画像、顔認証した結果、警告画面等を表示する部分である。
時計203は、現在の時間情報の管理、タイマー設定/解除を実行する部分である。時間情報は、NTPや標準電波など汎用的な技術を用いて自動調整する。
メモリ204は、プログラムや各種設定情報、プロパティ情報を記憶する記憶装置(ROMエリア、FROMエリア)、これらのプログラムやデータをロードして一時的に保管したり、ワークデータを記憶する記憶装置(RAMエリア)である。ここで、記録装置は、内蔵メモリの他に、外付けメモリ(USBメモリやNAS)や可搬型媒体(マイクロフラッシュ、SDカード、DVD、Blu−ray(登録商標) Disc、磁気テープ等)を併用しても良い。
記録再生部205は、ネットワーク303とIF部207経由で受信した可視画像や赤外画像、これらの画像に付随したメタデータなどを前記メモリ204に記録、再生する部分である。必要に応じてこれら記録対象データの暗号・復号化、圧縮・伸長を行う。
通信制御部206は、ネットワーク303とIF部207経由で前記撮像装置100との間で制御信号を送受信する部分である。前記したネットワークプロトコルやアプリケーションプロトコル、Webサービスなどを実行する部分でもある。
IF部207は、コントローラ装置200とネットワーク303とを接続する通信IF部分である。
カメラ管理部208は、ネットワーク303経由で当該コントロール装置200が管理する1台以上の撮像装置100を管理する部分である。管理対象の前記撮像装置100に関する情報(例えば、IPアドレス、設置場所、メーカー名、型名、導入時期/稼動時間、機能スペック、保守連絡先など)を作成、保持、更新、削除する部分である。
動体領域抽出部209は、IF部207経由で受信あるいは記録再生部205で記録した可視画像や赤外画像内に存在する人や動物、物体などの動体を抽出し、その位置情報を取得する部分である。画像内の動体を抽出する方法としては、連続する複数枚の画像(例えば、3枚)から差分画像(例えば、1枚目と2枚目の差分画像、2枚目と3枚目の差分画像)を作成し、それを比較することで動体を抽出したり、撮像画像より背景画像を生成しながら背景差分法を用いることで動体を抽出する方法などがある。
顔領域検出部210は、IF部207経由で受信あるいは記録再生部205で記録した可視画像や赤外画像内から直接、あるいは前記動体領域抽出部209で抽出した動体領域の中から人の顔が存在する領域を検出する。検出する方法は、Viola&Johnsの積分画像とカスケード型識別器を用いた高速顔検出アルゴリズムの技術などがある。
顔特徴点検出部211は、前記顔領域検出部210で検出した顔領域内の目や鼻、口端などの特徴点を検出する部分である。これにより、正確に顔の特徴を取り出せるように画像位置補正が可能となる。
顔照合部212は、前記顔特徴点検出部211で検出した特徴点の中から、個人を識別するために最適な特徴を選択し、顔DB213を用いてマッチングを行う部分である。ここで、顔を見分けるための特徴としては、顔領域内の濃淡情報全体を用いる方法(例えば、主成分分析を応用した固有法)や、顔領域内の局所的な濃淡変化の間隔と方向成分を特徴量とする方法(例えば、Elastic Bunch Graph Matching)、これら両方の方法を融合した方法などが利用できる。また、マッチングする方法として、最近傍法、線形判別分析などが適用できる。
顔DB213は、前記顔照合部212でマッチングするために予め顔画像を登録したデータを内蔵あるいは外付けの記憶媒体に格納する部分である。これらの登録した画像から照明変化や顔向き変化などを人工的に生成した画像を登録することもできる。例えば、入退室管理システムでは特定のエリアに入ることが許可されたユーザや従業員であるユーザの顔画像を登録する。また、特定の場所で顔認証した結果、本人であると確認できた画像を追加で登録しておくことも可能である。ここで、この顔DB213はコントローラ装置200ではなく、ネットワーク303経由でアクセス可能な外部のDBでも良い。例えば、空港などの監視カメラシステムでは、警察や法的機関から提供された容疑者やテロリストなどの顔DBを利用する。また、複数のコントローラ装置間でDBを共有するようにしても良い。
制御部214は、上記した各構成要素の動作を統括的に制御する部分である。また、前記顔照合部212でマッチングした結果、予め登録されたユーザでない(不審者など)場合や容疑者と一致した場合には、所定のフォーマットに基づくレポートを自動再生し、管理者や警察の連絡先に通知すると共に該レポートを送付することが可能となる。
図2は、カメラ部100の撮像センサ部12の構成例を示す。
撮像センサ部12は、センサ本体2、カラーフィルタ3、カバーガラス4、DBPF5から構成される。
センサ本体2は、CCD(Charge Coupled Device)イメージセンサであり、各画素に受光素子としてフォトダイオードが配置されている部分である。CCDイメージセンサの代わりにCMOS(Complementary Metal・Oxide Semiconductor)イメージセンサでも良い。
カラーフィルタ3は、上記センサ本体2に設けられており、センサ本体2の各画素に対して赤(R)、緑(G)、青(B)、赤外(IR)の各領域を所定の配列で配置した部分である。図4に本実施の形態で使用するカラーフィルタのバリエーションを示す。
カバーガラス4は、前記センサ本体2およびカラーフィルタ3上を覆って保護するものである。
DBPF5は、前記カバーガラス4に成膜された光学フィルタである。DBPF5は、可視光帯域に透過特性を有し、可視光帯域の長波長側に隣接する第1の波長帯域に遮断特性を有し、前記第1の波長帯域内の一部分である第2の波長帯域に透過特性を有する光学フィルタである。なお、DBPF5の配置位置は限定されるものではなく、例えばレンズ11に設けても良い。
図3は、前記カラーフィルタ3のR,G,B,IRの各フィルタの透過率スペクトルを示し、縦軸が透過率、横軸が波長となっている。グラフにおける波長の範囲は、可視光帯域と近赤外帯域の一部を含むもので、例えば300nm〜1100nmの波長範囲を示す。
Rのフィルタ部は、グラフのR(二重線)に示すように、波長600nmで略最大の透過率となり、その長波長側は、1000nmを超えても透過率が略最大の状態が維持された状態となる。
Gのフィルタ部は、グラフのG(間隔の広い破線)に示すように、波長が540nm程度の部分に透過率極大となるピークを有し、その長波長側の620nm程度の部分に、透過率極小となる部分がある。また、Gのフィルタ部は、透過率極小となる部分より長波長側が上昇傾向となり、850nm程度で透過率が最大となる。それより長波長側では、1000nmを超えても透過率が最大となった状態となっている。
Bのフィルタ部は、グラフのB(間隔の狭い破線)に示すように、波長が460nm程度の部分に透過率が極大となるピークを有し、その長波長側の630nm程度の部分に、透過率が極小となる部分がある。また、それより長波長側が上昇傾向となり、860nm程度で透過率が最大となり、それより長波長側では、1000nmを超えても透過率が最大となった状態となっている。
IRのフィルタ部は、780nm程度から短波長側の光を遮断し、1020nm程度から長波長側の光を遮断し、820nm〜920nm程度の部分が透過率最大となっている。
R,G,B,IRの各フィルタ部の透過率スペクトルは、図3等に示すものに限られるものではないが、現在、一般的に使用されているカラーフィルタ3では、これに近い透過率スペクトルを示すと思われる。なお、透過率を示す横軸の1は、光を100%透過することを意味するものではなく、カラーフィルタ3において、例えば、最大の透過率を示す。
ここで、本実施の形態で使用するDBPF5は、グラフでDBPF(実線)に示すように、DBPF(VR)で示す可視光帯域と、可視光帯域に対して長波長側の少し離れた位置のDBPF(IR)で示す赤外帯域(第2の波長帯域)の2つの帯域の透過率が高くなっている。また、可視光帯域の透過率の高い帯域としてのDBPF(VR)は、例えば、370nm〜700nm程度の波長帯域となっている。また、赤外側で透過率が高い第2の波長帯域としてのDBPF(IR)は、例えば、830nm〜970nm程度の帯域となっている。
本実施の形態では、上述のカラーフィルタ3の各フィルタ部の透過率スペクトルと、DBPF5の透過率スペクトルの関係が以下のように規定されている。すなわち、DBPF5の透過率スペクトルの赤外光を透過する第2の波長帯域となるDBPF(IR)は、Rのフィルタ部、Gのフィルタ部、Bのフィルタ部の全てがほぼ最大の透過率となって各フィルタ部で透過率が略同じとなる図2に示す波長帯域A内に含まれ、かつ、IRのフィルタ部の最大の透過率で光を透過する波長帯域B内に含まれるようになっている。
ここで、R,G,Bの各フィルタ部の透過率が同じになる波長帯域Aとは、各フィルタ部の透過率の差が透過率で10%以下である部分とする。なお、この波長帯域Aより短波長側では、透過率が略最大のRのフィルタ部に対して、G、Bのフィルタ部の透過率が低くなる。DBPF5では、このR,G,Bの各フィルタ部の透過率に差がある部分が、可視光帯域の透過率が高い部分であるDBPF(VR)と、赤外光帯域の第2の波長帯域の透過率の高い部分であるDBPF(IR)との間のDBPF5の光を略遮断する透過率が極小となる部分に対応する。すなわち、赤外側では、R,G,Bの各フィルタ部の透過率の差が大きくなる部分の光の透過がカットされ、それより長波長側で各フィルタ部の透過率が最大となって透過率が同じになる波長帯域Aで光を透過するようになっている。
以上のことから、本実施の形態において、赤外光カットフィルタに代えて用いられるDBPF5では、可視光帯域だけではなく、赤外光側の第2の波長帯域にも光を透過する領域があるため、可視光によるカラー撮影に際して、第2の波長帯域を通過した光の影響を受けることになる。しかし、上述のように第2の波長帯域がR,G,Bの各フィルタ部で透過率が異なる部分の光を透過せず、各フィルタ部の透過率が最大となって同じ透過率となる波長帯域の光だけを透過するようになっている。
また、DBPF5の第2の波長帯域においては、IRのフィルタ部で透過率が最大となる部分の光を透過するようになっている。したがって、同じ光が照射される極めて近接した4つの画素にR,G,B,IRのフィルタ部がそれぞれ設けられていると仮定した場合に、第2の波長帯域においては、Rのフィルタ部、Gのフィルタ部、Bのフィルタ部、IRのフィルタ部で同様に光が通過することになり、赤外側の光としては、IRを含む各フィルタ部で同じ光量の光が撮像センサ本体のフォトダイオードに至ることになる。すなわち、R,G,Bの各フィルタを透過する光のうちの赤外側の第2の波長帯域を通過する光の光量は、IRのフィルタ部を通過する光の光量と同様となる。上述のように仮定した場合に、基本的にR,G,Bの各フィルタを透過した光を受光したセンサ本体2からの上述のように仮定された画素の出力信号とIRのフィルタを通過した光を受光したセンサ本体2からの上述のように仮定された画素の出力信号との差分が、各R,G,Bのフィルタ部で通過した赤外側の光をカットしたR,G,Bそれぞれの可視光部分の出力信号となる。
実際には、カラーフィルタ3では、センサ本体2の各画素にR,G,B,IRのいずれか1つのフィルタ部が配置されることになり、各画素に照射される各色の光のそれぞれの光量が異なるものとなる可能性が高い。そのため、例えば、各画素において、周知の内挿法(補間法)を用いて、各画素の各色の輝度を求め、この補間された各画素のR,G,Bの輝度と、同じく補間されたIRの輝度との差分をそれぞれR,G,Bの輝度とすることが可能である。なお、R,G,Bの各色の輝度から赤外光成分を除く画像処理方法は、これに限られるものではなく、最終的にR,G,Bの各輝度から第2の波長帯域を通過した光の影響をカットできる方法であれば、いずれの方法を用いても良い。いずれの方法においても、DBPF5が、赤外側でR,G,Bのフィルタ部の透過率が10%より異なる部分、すなわち、透過率が所定割合より異なる部分をカットしているので、各画素において、赤外光の影響を除く処理が容易となる。
以上、上記撮像センサ部12を用いることで、カラー撮影と、赤外光撮影との両方が可能な撮像装置100を実現できる。一般的には、通常の撮影をカラー撮影で行い、夜間に可視光の照明を用いることなく、人間には認識困難な赤外光の照明を用いて赤外撮影することが考えられる。例えば、各種監視カメラ等において、夜間照明を必要としないか、夜間照明されないことが好ましい場所での夜間撮影に際し、赤外光照明を用いた赤外光による夜間撮影を行うことが考えられる。また、野生動物の観察のための昼間の撮影と夜間の撮影などの用途にも用いることができる。
赤外光撮影を夜間撮影として用いる場合には、赤外光であっても可視光と同様に、夜間は光量が不足するので、赤外光照明が必要となる。
図21に示すDBPF5の透過率スペクトル(A)と(B)は、R,G,B,IRの各フィルタ部の透過率スペクトルと、赤外光照明用の光、例えば、照明用赤外光LEDの発光スペクトルを考慮して決定されたものである。
図21では、図2と同様の各色のフィルタ部の透過率スペクトルR,G,B,IRと、DBPF5の透過率スペクトルDBPFに加えて、LED照明の発光スペクトルIR−lightが図示されている。
図21(A)に示すDBPFの赤外光を透過する部分であるDBPF(IR)で示す第2の波長帯域は、図2に示すDBPFと同様に、Rのフィルタ部、Gのフィルタ部、Bのフィルタ部の全てが略最大の透過率となって各フィルタ部で透過率が略同じとなる図2に示す波長帯域A内に含まれ、かつ、IRのフィルタ部の最大の透過率で光を透過する波長帯域B内に含まれるようになっている。
それに加えて、上述の波長帯域Aと波長帯域Bとの両方に含まれる赤外光照明の発光スペクトルのピークとなる波長帯域の略全体がDBPF(IR)の波長帯域に含まれるようになっている。なお、赤外光撮影を夜間の自然光ではなく、赤外光照明下で行う場合にDBPF(IR)で示す第2の波長帯域が赤外光照明の光学スペクトルのピーク幅より広い必要はなく、赤外光照明のスペクトルが上述の波長帯域Aおよび波長帯域Bの両方に含まれる場合に、赤外光照明の発光スペクトルの例えば860程度を頂点とするピークのピーク幅と略同様のピーク幅で第2の波長帯域としてDBPF(IR)で示されるDBPF5の透過率のピーク部分を設けても良い。
すなわち、図21(A)においては、IR−lightで示す赤外光照明の発光スペクトルにおけるピークが上述の波長帯域Aおよび波長帯域Bの短波長側にあり、DBPF(IR)で示すDBPFの第2の波長帯域が波長帯域Aおよび波長帯域Bの短波長側部分のIR−lightにおける発光スペクトルのピークと重なるようになっている。
また、図21(B)に示すグラフも、(A)と同様に、図2に示すグラフに赤外光照明の発光スペクトルを加えるとともに、DBPF5の透過率スペクトルの赤外側の透過率が高い部分であるDBPF(IR)で示す第2の波長帯域を上述の赤外光照明のIR−lightで示す発光スペクトルのピークに合わせたものである。
図21(B)においては、赤外光照明として、(A)よりも発光スペクトルのピークの波長が長いものを用いており、このピークは、上述の波長帯域Aおよび波長帯域Bに含まれるとともに、波長帯域Aおよび波長帯域Bの長波長側に存在する。それに対応してDBPF5のDBPF(IR)で示す第2の波長帯域が上述の波長帯域Aおよび波長帯域B内で赤外照明のIR−lightで示されるピークと重なるように設けられている。
DBPF5の第2の波長帯域は、図2、図21のいずれに示すものであっても良く、第2の波長帯域が上述の波長帯域Aと波長帯域Bとの両方に含まれていれば良い。また、夜間の赤外光撮影で用いられる赤外光照明の発光スペクトルのピークとなる波長帯域が決まっている場合に、その波長帯域を上述の波長帯域Aと波長帯域Bの両方に含まれるようにすると共に、赤外光照明の発光スペクトルのピークにDBPF5の第2の波長帯域を合わせることが好ましい。
このような撮像センサでは、DBPF5の赤外側で光を透過する第2の波長帯域が、R,G,B,IRの各フィルタ部の赤外側で、各フィルタ部の透過率が最大となって、各フィルタ部の透過率が同じと波長帯域Aに含まれるとともに、IRのフィルタ部の透過率が最大となる波長帯域Bに含まれる。言い換えれば、可視光帯域より長波長側で、R,G,Bの各フィルタの透過率がRのフィルタ部だけ最大となって、G、Bのフィルタ部は透過率が最大となっていないことにより、R,G,Bの各フィルタ部の透過率が同じとならずに異なる部分の光は、DBPF5によりカットされる。
すなわち、R,G,B,IRの各フィルタ部では、赤外側で第2の波長帯域の光が透過するようになっていることから、各フィルタ部における赤外側の透過率が全て同じになる。第2の波長帯域となる光が同じ光量で照射されれば、R,G,B,IRの各フィルタ部における透過光量が同じになる。これにより、上述のようにR,G,Bの各フィルタ部に対応する画素からの出力信号に基づく色を補正し、カラー撮影時の色の第2の波長帯域を通過する赤外光による影響を抑制した画像を容易に得ることができる。
また、第2の波長帯域を上述の波長帯域Aと波長帯域Bに含まれる赤外光照明の発光スペクトルのピークに対応させることにより、赤外光照明の光を効率的に用いられると共に、第2の波長帯域の幅を狭めて、カラー撮影時に、第2の波長帯域を通過する赤外光の影響を小さくすることができる。
図5は、上記信号処理部12における信号処理をブロック図で示したものである。
図4に記載したカラーフィルタを搭載した前記撮像センサ部12からの出力信号に対する処理概要について説明する。
R,G,B,IRの各画素の出力信号は、各内装処理ブロック21r、21g、21b、21irに送られる。各内装処理ブロック21r、21g、21b、21irでは、周知の方法を用いた内挿処理(補間処理)を用いて、上述のカラーフィルタ3の各フレームの画像データにおいて、それぞれ、全ての画素が赤Rで表された画像データ20r、全ての画素が緑Gで表された画像データ20gと、全ての画素が青Bで表された画像データ20bと、全ての画素が赤外IRで表された画像データ20irとするようにR,G,B,IRの信号を変換する。
次に、赤外光除去信号作成ブロック22r、22g、22b、22irにおいて、上述の第2の波長帯域から受光される赤外光の影響を除去するために、R,G,Bの各色の信号から減算する信号をIRの信号から生成する。この赤外光除去信号作成ブロック22r、22g、22bでR,G,B毎に作成された信号を、R,G,Bの各色の信号から減算する。この場合に、上述のように同じ画素では、基本的にR,G,Bの各信号からIRの信号を除去すればいいので、処理が容易になる。実際には、各画素のフィルタ部の特性等により各色の画素毎に感度が異なるので、R,G,Bの画像毎にR,G,Bの各信号から減算する信号をIRの信号から作成する。
次に、R,G,Bの各信号は、画像処理ブロック23において、行列式を用いてR,G,Bの各信号を変換して色を補正する周知のRGBマトリックス処理と、画像で白となる部分でR,G,Bの各信号の出力値が同じとなるようにする周知のホワイトバランス処理、ディスプレイ等への画像出力のための補正である周知のガンマ補正を行う。次いで、輝度マトリックスブロック24において、R,G,Bの各色の信号に係数を乗算して輝度Yの信号を生成する。また、青Bの信号と、赤Rの信号から輝度Yの信号を除算することにより、R−YとB−Yの色差信号を算出し、Y、R−Y、B−Yの信号を出力する。
また、IRの信号は、基本的に白黒のグラディエーションの画像として出力される。
図6は、図1で示した撮像装置100とコントローラ装置200の間で可視画像や赤外画像、制御コマンドをやり取りするための通信フローを示す。ここで、通信フローは独自通信プロトコルでも良いが、例えば監視カメラの標準通信としてONVIF(Open Network Video Interface Forum)が策定したプロトコルなどを使用しても良い。
最初に、撮像装置100を所定の場所に設置し、ネットワーク303に接続した後、電源を投入すると、該撮像装置100が起動し、撮像装置100の制御部23は初期設定処理を実行する。例えば、メモリ21に格納したプログラムのロードやGPS19の現在場所取得など、主にハードウェアの起動やソフトウェアの初期パラメータ設定処理などである。なお、PoE(Power Over Ethernet)を利用し、PoE対応ハブを利用してネットワーク303に接続したタイミングで起動するようにしても良い(ステップ601)。
必要な初期設定処理が終了すると、撮像装置100の制御部23は、通信制御部15やIF部16で使用するIPアドレスを設定する。IPアドレスは保守IF部22でPCやパッド端末などを直接接続し、Static IPアドレスを設定する方法や、DHCP(Dynamic Host Configuration Protocol )を使用して自動的にIPアドレスを設定する方法など、汎用のネットワークプロトコルを使用して設定する(ステップ602)。
IPアドレスの設定が終了すると、撮像装置100の制御部23は通信制御部15に指示して、自身の存在をコントローラ装置200に通知する。ネットワーク上に存在する装置を自動発見する方法としてはUPnP(Universal Plug and Play)やWS−Discovery(Web Services Dynamic Discovery)などのプロトコルを利用しても良い。また、通知する際に、自身のメーカー名や型名、設置場所、日時などを含めても良い(ステップ603)。この際、設置場所は、予め初期設定された情報やGPS19から取得した情報でも良い。また、GPS19や照度監視部18を用いて屋外か屋内かを判定した情報を含んでも良い。
前記通知を受信したコントローラ装置200の制御部214は、撮像装置100のIPアドレスを取得することで、撮像装置100の存在を認識することができる。制御部214は、表示部202を介して新しい撮像装置100が接続された旨を管理者に通知し、自分がその撮像装置100を管理するか否かの管理者からの指示を待つ。ユーザIF部201経由で管理者からの指示があった場合、あるいは、当該コントローラ装置200が現在管理している撮像装置100の数を確認し、最大数に達していない場合には、自動的に通信制御部206に指示して、前記撮像装置100に対して搭載機能情報の取得要求を送信する(ステップ605)。
前記機能情報取得要求を受信した撮像装置100の制御部23は、メモリ21に格納した機能情報を取得し、通信制御部15に指示して該機能情報をコントローラ装置200に送信する。機能情報は、例えば、装置管理情報(ネットワークやシステム、セキュリティに関するサポート有無やパラメータ値)や撮像装置性能情報(逆光補正や明るさ、コントラスト、ホワイトバランス、フォーカス調整、ワイドダイナミックレンジなどの画質に関するパラメータ値や、解像度、フレームレート、コーデック種別などのメディアのプロファイルに関するパラメータ値)、PTZ(パン・チルト・ズーム)機能情報(座標系の定義、可動パラメータ、プリセットポジションなど)、解析機能情報(サポートする解析機能や認証の種類、解析結果のフォーマットなど)がある(ステップ606)。
ここで、図7に、本実施の形態の撮像装置100に関する情報の一構成を示す。本実施の形態の撮像装置100は、出力画像の種別701として「可視画像」と「赤外画像」があり、コントローラ装置200に送信する出力モード702として「可視画像のみ出力」、「赤外画像のみ出力」、「両画像を照度や時間によりどちらか一方に自動的に切り替えて出力」、「可視画像と赤外画像の両方を同時出力」の4種類を持つ。また、可視画像のアクセス先情報703として、コントローラ装置200が撮像装置100から可視画像に関する情報や実際の可視画像を取得するためにアクセスするURI/URL情報、同様に赤外画像のアクセス先情報704としてコントローラ装置200が撮像装置100から赤外画像に関する情報や実際の赤外画像を取得するためにアクセスするURI/URL情報を持つ。また、可視画像の情報705として出力可能な可視画像のコーデックや転送レート、解像度など、同様に赤外画像の情報706して出力可能な赤外画像のコーデックや転送レート、解像度などを含む。本構成は一例であり、その他情報を含んでも良い。
前記撮像装置100の機能情報を受信したコントローラ装置200の制御部214は、機能情報の内容を表示部202を介して管理者に通知あるいは自動的に確認し、該コントローラ装置200で管理すると決定した場合にはカメラ管理部208に管理対象として追加する。カメラ管理部208はメモリ204に機能情報の全部あるいは一部を格納して管理する。また、制御部214は、コントローラ装置200自身がサポートする解析機能や認証機能を確認し、前記撮像装置100の画像を利用するか否かを判断する。あるいは/さらに、撮像装置100がサポートする解析機能情報を確認し、該撮像装置100を利用する際に実行する認証の方法や解析方法を決定するようにしても良い(ステップ607)。
コントローラ装置200の制御部214が前記撮像装置100を利用すると決定した場合、制御部214は、ステップ606で取得した機能情報に含まれるパラメータで変更や設定が必要なものを設定するために、通信制御部206に指示して、撮像装置100に対して機器設定要求を送信する。例えば、本実施の形態では、前記出力モード702として「可視画像と赤外画像の両方を同時出力」を設定する(ステップ608)。ここで、例えば前記撮像装置100の設置場所に基づき、前記出力モード702を決定するようにしても良い。
前記機器設定要求を受信した撮像装置100の制御部23は、受信した設定が実行可能であるか否かを確認し、実行した結果をコントローラ装置200に返信する(ステップ609)。
次に、コントローラ装置200の制御部214は、通信制御部206に指示して、実際に可視画像や赤外画像の取得に必要なプロトコルやパラメータを取得するためのアクセス先情報取得要求を送信する(ステップ610)。
前記アクセス先情報取得要求を受信した撮像装置100の制御部23は、前記可視画像のアクセス先情報703や赤外画像のアクセス先情報704を含むメディアへのアクセス先情報(例えば、メディアタイプやポート番号、転送プロトコル、ペイロード番号など)を、通信制御部15に指示して返信する(ステップ611)。
前記アクセス先情報を受信したコントローラ装置200の制御部214は、引き続き、画像の受信に必要なセッション情報(DESCRIBE)の取得要求を撮像装置100に対して送信する(ステップ612)。
前記セッション情報取得要求を受信した撮像装置100の制御部23は、通信制御部15に指示して、SDP(Session Description Protocol)を用いて記述したセッション情報を生成し、コントローラ装置200へ送信する(ステップ613)。
前記セッション情報を受信したコントローラ装置200の制御部214は、通信制御部206に指示して、撮像装置100との間でRTSPセッションを確立する。ここで、RTSPセッションは、通常、可視画像の転送用と赤外画像の転送用とで別々に確立する(ステップ614)。
前記RTSPセッションを確立した後、コントローラ装置200はこれらの画像の受信準備や顔認証の準備を行い(ステップ615)、撮像装置100は可視画像や赤外画像の送信準備を行い(ステップ616)、結果を送信する(ステップ617)。
コントローラ装置200の制御部214は、全ての準備が完了したことを確認すると、通信制御部206に指示して、ストリーミング開始要求(PLAY)を撮像装置100に送信する(ステップ618)。
前記ストリーミング開始要求を受信した撮像装置100の制御部23は、ステップ608でコントローラ装置200が要求した通りの画像を出力するように信号出力制御部14に指示し、信号出力制御部14が出力する画像を前記ステップ612/613で確立したセッション上でRTPを用いて撮像装置100へ送信するように通信制御部15に指示する(ステップ620)。
また、コントローラ装置200の制御部214は、画像の受信を開始する(ステップ621)。
その後、撮像装置100が撮影した可視画像と赤外画像のRTP転送を実行する(ステップ621,622)。ここで、撮像装置100の通信制御部15は、コントローラ装置側の処理負担を軽減するために、RTPヘッダのマーカビットを利用し、フレームの切れ目が分かるようにしても良い。
また、撮像装置100の通信制御部15は、所定のフレーム数を転送する毎に、RTCPの送信レポートをコントローラ装置200に送信する。可視画像と赤外画像が同時に撮像されたことを示すために、前記レポートの中に同じタイムスタンプやフレーム番号、パケットカウントなどを格納する(ステップ623)。
撮像装置100から可視画像および赤外画像を受信するコントローラ装置200の制御部214は、記録再生部205を介してこれらの画像をメモリ204に格納しながら、動体領域抽出部209や顔領域検出部210、顔特徴点検出部211、顔照合部212を用いて顔認証を実行する。そして、必要に応じてストリームングの中断や停止を制御する(ステップ624)。
以上が、コントローラ装置200と撮像装置100間の基本的な通信フローである。
ここで、上記の通信フローではRTP通信を用いているが、HTTP通信や他の独自通信方法でも良い。また、可視画像と赤外画像を個別のストリームで転送するのではなく、同じストリームに重畳して転送するようにしても良い(例えば、共通ヘッダ(タイムスタンプやシーケンス番号を含む)+1枚目の可視画像+1枚目の赤外画像+・・・等)。また、同時に両画像を転送すると通信帯域の使用率が高くなるため、赤外画像は1フレーム毎、可視画像は30フレーム毎といった転送でも良い。この場合も、同タイミングで撮影したフレームについては、赤外画像と可視画像で同じタイムスタンプとフレーム番号を使用するようにする。
ここで、ステップ623では、撮像装置100がコントローラ装置200に対して送信レポートを送付しているが、同様にコントローラ装置200が撮像装置100に対してパケット欠落や転送遅延に関する情報を含んだ受信レポートを送付しても良い。
また、ステップ623で可視画像と赤外画像が同時に撮像されたことを示すために、同じタイムスタンプやフレーム番号を設定した送信レポートを送信すると記載したが、例えば、送信するRTPヘッダのタイムスタンプやシーケンス番号を同じ値に設定する方法や、RTPヘッダの拡張ヘッダに同じタイムスタンプとフレーム番号を設定する方法もある。
コントローラ装置200の制御部214は、記録再生部205に指示して、受信した可視画像や赤外画像をメモリ204に格納し、動体領域抽出部209、顔領域検出部210、顔特徴点検出部211、顔照合部212を用いて、画像内に含まれた人物を検出し、不審者か否かなどの顔認証を実行する。この際、同タイミングで同対象物を撮影した可視画像と赤外画像を取得でき、さらに同じタイムスタンプやシーケンス番号が付加されることにより両画像の同期が容易であるメリットを生かし、両方の画像で顔認証して認証精度を向上させる方法や、通常はどちらか一方の画像だけで顔認証を行い(例えば、赤外画像のみ)、両画像を比較して確認したい場合(背景や色などの付加情報を把握したい、他方の画像で顔認証したい部分がある等)に同じシーケンス番号の他方の画像を利用する方法がある。
また、本実施の形態では、ステップ608で前記出力モード702として「可視画像と赤外画像の両方を同時出力」を設定したが、日中は「視画像と赤外画像の両方を同時出力」を設定し、夜間は「赤外画像のみ」を設定など、時間や周囲の環境によって変更するようにしても良い。あるいは、どちらか一方の画像を受信しながら同時に顔認証を実行する場合に、顔照合部212でマッチングした結果、不審者と思しき人物のさらなる情報を取得したい場合に、途中で両方画像を受信するように自動的に切り替えるようにしても良い。
コントローラ装置200の制御部214は、顔照合部212で照合した結果、画像内に不審者がいると判断あるいは不審者の候補がいると判断した場合、表示部202経由で管理者に通知、あるいはIF部207経由で他のコントローラ装置200に通知や情報共有し、複数の撮像装置100の間で当該不審者を追跡することも可能となる。
(実施の形態2)
次に、本発明の実施の形態2に係る撮像システムの構成を説明する。
図8は、本発明の実施の形態2に係る撮像システムの構成例を示す。なお、前記実施の形態1の撮像装置100と、本実施の形態の撮像装置800、810は、同じ撮像システム上に混在して複数設置することができ、コントローラ装置200はこれらの撮像装置を管理することが可能である。
本実施の形態の撮像装置800は、前記実施の形態1の撮像装置100に、コントローラ装置200の動体領域抽出部209と同様の機能を備えた動体領域抽出部801を搭載した構成である。それ以外の構成部分は、撮像装置100と同様の構成である。
撮像装置800の制御部23は、信号処理部13が出力する可視画像と赤外画像の内、赤外画像のみを動体領域抽出部801へ入力する。赤外画像のみを用いる理由としては、可視画像で検出できない物体を検出できること、可視画像より人間と背景とのコントラストが大きく人検出に有効であること、などが挙げられる。
前記動体領域抽出部801は、入力された赤外画像を用いて画像内の動体領域を抽出し、その数と位置情報を出力する。これらの結果は、制御部25あるいは信号出力制御部14に出力する。メモリ22に格納しても良い。
以上により、前記撮像装置800は、同タイミングで撮影した可視画像と赤外画像の内、赤外画像を用いて常に画像内の動体領域を監視し、高精度に抽出した動体領域に関する情報を可視画像あるいは赤外画像と一緒にコントローラ装置200に提供できる。コントローラ装置200は、画像と共に動体領域に関する情報を取得できるため、画像処理負担を軽減できる。
ここで、撮像装置800の制御部23は、ネットワーク上の通信帯域の使用量を減らすために、動体領域抽出部801で動体領域を抽出した場合のみ信号出力制御部14からIF部16を介して画像を出力し、動体領域が抽出できない場合は信号出力制御部14から画像を出力しない、あるいは信号出力制御部14から出力する画像のフレームレートを落とすようにしても良い。
また、撮像装置800の制御部23は、動体領域抽出部801で抽出した動体領域と信号処理部13で出力する可視画像および/または赤外画像を組み合わせ、画像上に動体領域が矩形で囲まれた画像を生成/加工するように信号出力制御部14に指示するようにしても良い。
同様に、本実施の形態の撮像装置810は、前記撮像装置800に、コントローラ装置200の顔領域検出部210と同様の機能を備えた顔領域検出部802を搭載した構成である。それ以外の構成部分は、撮像装置100と同様の構成である。
撮像装置810の制御部23は、信号処理部13が出力する可視画像と赤外画像の内、赤外画像のみを動体領域抽出部801へ入力する。前記動体領域抽出部801は、入力された赤外画像を用いて画像内の動体領域を抽出し、その数と位置情報を制御部23あるいは信号出力制御部14に出力すると同時に、顔領域検出部802に入力する。前記顔領域検出部802は、入力された動体領域の中から人の顔が存在する領域を検出し、制御部23あるいは信号出力制御部14に出力する。
以上により、前記撮像装置810は、同タイミングで撮影した可視画像と赤外画像の内、赤外画像を用いて常に画像内の動体領域を監視し、高精度に動体領域を抽出でき、さらにその動体領域から人の顔が存在する領域を検出し、可視画像あるいは赤外画像と一緒に動体領域の情報と顔領域の情報をコントローラ装置200に提供できる。コントローラ装置200は、画像と共にこれらの情報を取得できるため、画像処理負担を軽減できる。
ここで、撮像装置810の制御部23は、ネットワーク上の通信帯域の使用量を減らすために、顔領域検出部802で人の顔領域を検知した場合のみ信号出力制御部14からIF部16を介して画像を出力し、動体領域を抽出しても人の顔領域が検出できない場合は信号出力制御部14から画像を出力しない、あるいは信号出力制御部14から出力する画像のフレームレートを落とすようにしても良い。同様に、物体のみを検知するために、人の顔領域が検出できなかった動体領域を検知した場合のみ、信号出力制御部14からIF部16を介して画像を出力するようにしても良い。
また、撮像装置810の制御部23は、顔領域検出部802で抽出した顔領域(および動体領域抽出部801で抽出した動体領域)と信号処理部13で出力する可視画像および/または赤外画像を組み合わせ、画像上に顔領域が矩形で囲まれた画像を生成/加工するように信号出力制御部14に指示するようにしても良い。
撮像装置800、810とコントローラ装置200間の通信フローは、実施の形態1の図6に記載した内容とほぼ同じであるが、異なる点のみ以下に記載する。
まず、図6のステップ606において、撮像装置800、810がコントローラ装置200へ提供する機能情報は、例として図7に示した情報に加え、図9に示すような情報を前記した解析機能情報として提供する。すなわち、機能情報の中に、撮像装置800は自身が「動体領域抽出機能」を搭載することを示す内容を、撮像装置801は「動体領域抽出機能」と「顔領域検出機能」を搭載することを示す内容を含める。
本実施の形態では、これらの情報を解析メタデータとし、機能情報(解析機能情報)として図9に示すような解析メタデータの種別901.解析メタデータの出力モード902、動体領域メタデータのアクセス先情報903、顔領域メタデータのアクセス先情報904、動体領域/顔領域メタデータのアクセス先情報905、動体領域メタデータの情報906、顔領域メタデータの情報907を含む。
前記機能情報を受信したコントローラ装置200の制御部214は、ステップ607において、コントローラ装置200自身がサポートする解析機能や認証機能を確認し、前記撮像装置800が出力する解析メタデータを利用するか否かを判断する。例えば、撮像装置800、810の両方に対して解析メタデータ「動体領域の位置情報」のみを利用する、あるいは撮像装置800の解析メタデータは利用せず、撮像装置810の解析メタデータの「顔領域の位置情報」のみを利用する、といった選択が可能となる。
図10は、撮像装置800、810とコントローラ装置200との間で可視画像や赤外画像、解析メタデータを送信するための通信フローを示す。この説明では、撮像装置800は「動体領域の位置情報」、撮像装置810は「動体領域の位置情報」「顔領域の位置情報」の両方の解析メタデータを送信するものとする。また、撮像装置800、810は、図6のステップ614において、可視画像と赤外画像に加え、解析メタデータ転送用のセッションも確立するものとする。
撮像装置800、810は、可視画像と赤外画像のフレーム転送を開始し(ステップ1001、1002)、所定のフレーム数を転送する毎に(ステップ1003、1004)、動体領域抽出部801や顔領域検出部802で抽出した解析メタデータを送信する(ステップ1005)。ここで、解析メタデータの送付は、動体領域や顔領域を検出したタイミングで送付するようにしても良い。
前記解析メタデータ1200を受信したコントローラ装置200の制御部214は、前記解析メタデータ1200に動体領域の情報か顔領域の情報が含まれているか否かを確認する(ステップ1006)。そして、動体領域の情報が含まれていない場合は自身が持つ動体領域抽出部209を用いて動体領域の抽出処理を実行する(ステップ1007)。
一方、動体領域の情報か顔領域の情報が含まれている場合は、顔領域の情報が含まれているか否かを確認する(ステップ1008)。そして、顔領域の情報が含まれていない(すなわち、動体領域の情報のみ含まれる)場合は受信した動体領域の情報と、自身が持つ顔領域検出部210を用いて顔領域の検出処理を実行する(ステップ1008)。
一方、顔領域の情報が含まれている場合は、受信した顔領域の情報と、自身が持つ顔特徴点検出部211を用いて顔の特徴点を抽出し(ステップ1010)、顔照合部212を用いてマッチングを実行する(ステップ10100)。
図11に、撮像装置800、810で扱う画像イメージを示す。画像1100は、撮像装置800、810が撮影した可視画像の例である。画像1100から背景を除去し、動体領域のみを抽出したものが画像1101である。この画像例では、(A)(B)(C)の3つの領域(点線の四角で囲っている部分)が抽出できている。画像1101からさらに顔領域を抽出したものが画像1102である。この画像例では、(a)(b)の2つの領域(実線の四角で囲っている部分)が抽出できている。
図12に、ステップ1005で撮像装置800、810が送付する解析メタデータ1200の構成例を示す。
解析メタデータ1200は、大きく通信ヘッダ1201とペイロード1210で構成される。通信ヘッダ1201は例えば、RTPヘッダやHTTPヘッダなどと同様である。
ペイロード1210には、解析メタデータを格納する。例えば、動体領域あるいは顔領域の抽出に使用した赤外画像のフレーム番号1211、可視画像のフレーム番号1212、撮像装置800、810が抽出できる動体領域の最大数1213、実際に動体領域抽出部801で抽出できた動体領域抽出数1214(ここではn個)、抽出した動体領域の座標情報1〜n(1215〜1216)、撮像装置810が抽出できる顔領域の最大数1217、実際に顔領域検出部802で抽出できた顔領域抽出数1218(ここではm個≦n個)、抽出した動体領域の座標情報1〜m(1219〜1220)から構成される。
以上により、本実施の形態の前記撮像装置800、810は、可視画像、赤外画像に加え、赤外画像を用いて精度良く抽出した動体領域に関する情報や人領域に関する情報を、必要な画像出力と同時にコントローラ装置200へ提供することができる。
一方、コントローラ装置200は、受信した動体領域の情報や人領域の情報を即座に利用することで従来の手順を省くことができるため、従来よりも顔認証の実行時間を短縮することができる。これは、1台のコントローラ装置200で多くの撮像装置を管理する場合に、コントローラ装置200の処理負荷を軽減する点で有効である。
ここで、本実施の形態では、撮像装置800、810がコントローラ装置200に対して、少なくとも可視画像、赤外画像のいずれか1つの画像と解析パラメータを送信する例について記載したが、ネットワーク上のデータ量を削減するために、解析パラメータと、解析パラメータが示す部分(動体領域、顔領域)のみの画像を送付するようにしても良い。
また、撮像装置800、810の制御部23は、動体領域抽出部801で画像内の動体領域を最初に検知すると該当する画像のフレーム番号を保持し、その画像に連続して撮像された画像からその動体領域の対象が存在しなくなるまで追跡し、図12に示す解析メタデータ1200内の座標情報の付属情報として前記フレーム番号を追加するようにしても良い。これにより、コントローラ装置200は、解析メタデータ1200を参照することで、動体領域が含まれるフレーム番号を容易に把握し、時間を算出することができる。
(実施の形態3)
次に、本発明の実施の形態3に係る撮像システムの構成を説明する。
前述の実施の形態1、実施の形態2の撮像装置は、1組のレンズ11、撮像センサ部12、信号処理部13を用いて可視画像と赤外画像を撮影していた。本実施の形態の撮像装置は、2組のレンズ11、撮像センサ部12、信号処理部13を左右に配置した構成とし、可視光と赤外光とでそれぞれ左右2つの画像からなるステレオ画像(距離画像)を撮影可能とする。
図13は、本実施の形態の撮像システムの構成例を示す。本撮像システムは、1台以上の撮像装置1300とコントローラ装置1310から構成する。
撮像装置1300は、前述した通り、2組のレンズ11、撮像センサ部12、信号処理部13を備え、新たに補正パラメータ算出部1301、距離算出部1302を備える。2つのレンズ11(a)(b)は、それぞれの光軸が互いに平行になるように左右に配置する。それ以外の構成部分は、基本的に実施の形態1、実施の形態2の撮像装置100、800、810と同様の構成である。
補正パラメータ算出部1301は、2つの信号処理部13(a)(b)から出力されるそれぞれの可視画像の信号強度(信号レベル)を近似させるようにクリップレベルや信号レベルの補正値(例えば、可視画像信号や赤外画像信号、赤外信号や各色信号等の信号に加算や減算や乗算や除算される補正値)等のパラメータを設定して、2つの可視画像信号(2つの赤外画像信号)の信号レベルが近似するようにする。画像信号補正処理部203における補正量については、2つの信号処理部13(a)(b)からの出力を見て、それぞれに設定することで画像信号のレベル合わせ込む。左右の画像信号のレベルを合わせ込む処理は、赤外画像信号と可視画像信号の両方で行うことが可能である。
すなわち、補正パラメータ算出部1301が2つの信号処理部13(a)(b)から出力される画像信号の信号レベルに基づいて補正量を決定して、2つの信号処理部13(a)(b)から出力される画像信号の信号レベルが近似するようにする。これにより、2つの画像データで例えば輝度レベルが異なることにより、被写体の異なる部分を同じ部分(対応点)と認知して、測定する距離に誤差が生じたり、エラー発生したりするのを抑制することができる。
距離算出部1302は、2つの信号処理部13(a)(b)からそれぞれ入力される2つの可視画像信号あるいは赤外画像信号を用いて、対象物までの距離を算出する。この際、2つの画像から同一の被写体(対応点)を決定し、これら同一の被写体の画像上の位置の違いとしての視差を検出することで、従来と同様に距離を求める。すなわち、差の測定用の対応点は、画像認識により決定し、対応点の画像中の位置の違いである視差に基づいて距離を算出する。そして、各画素に対応した距離情報を元にステレオ画像(距離画像)を生成し、信号出力制御部14に出力する。
信号出力制御部14は、左右で撮像した2つの可視画像、赤外画像に加え、前記距離算出部1302が生成したステレオ画像(距離画像)をコントローラ装置1310に提供することが可能となる。
以上から、本撮像装置1300では、被写体の可視光画像、赤外画像を同時に取得することができ、両方の画像から距離を算出することができる。この際、可視画像と赤外画像の位置があっているので、両画像間で計測される距離が変化してしまうことを防止できる。
ここで、上記距離算出部1302は、2枚の可視画像、2枚の赤外画像を用いて、それぞれの距離を算出した後、2枚のステレオ画像(距離画像)を生成してそのまま出力しても良い。あるいは、生成した2枚のステレオ画像を比較し、それら距離情報の差異が所定の閾値範囲内であればどちらか一方の距離画像を出力し、閾値を超える場合は両方の距離画像を出力する、あるいは予め出力設定していた距離画像(例えば、赤外画像で計算した距離画像を優先、距離が近い値を示している距離画像など)を出力する、あるいは超えている領域部分を解析メタデータとして個別に出力するようにしても良い。図22に、距離算出部1302の処理概要の一例を示す。
また、本撮像装置1300の制御部23は、コントローラ装置200の指示に従い、信号出力制御部14を用いて、2つの信号処理部13(a)(b)から出力された可視画像、赤外画像と、距離算出部1302から出力されたステレオ画像(距離画像)のうち、IF部16経由で出力するデータを制御する。例えば、本撮像装置1300がプライベート保護の必要な場所(例えば、トイレや更衣室)に設置されている場合にはステレオ画像のみを出力し、高いセキュリティが要求される場所に設置されている場合は全ての画像を出力する、といった利用が可能となる。
一方、コントローラ装置1310は、実施の形態1、実施の形態2のコントローラ装置200の動体領域抽出部209、顔領域検出部210、顔特徴点検出部211、顔照合部212、顔DB213の代わりに、可視画像と赤外画像に加えてステレオ画像(距離画像)を使用あるいはステレオ画像のみを使用して解析処理や認証処理を行うために、異なる動体領域抽出部1311、顔領域検出部1312、顔特徴点検出部1313、顔照合部1314、3D顔DB1315を搭載する。これにより、例えば、顔認識において、顔の凸凹に関する3次元データを取得し、それを利用することで、精度良くかつ容易に顔領域の検出や、顔特徴点の検出を実行することができる。
また、コントローラ装置1310は、撮像装置1300からステレオ画像(距離画像)を取得することで、動体領域抽出部209で抽出した動体領域の距離を参照し、所定の距離以内であれば顔認証を実行し、それ以外は実行しない等を判断することができる。
図23に、コントローラ装置1310が別々の場所に設置された撮像装置1300(a)(b)(c)の様子を表示した例を示す。オフィスやビル等のエントランスに設置された撮像装置1300(a)から受信した可視画像あるいは赤外画像と距離画像を用いて、コントローラ装置1310は3Dベースの顔認証を行い、実行結果を表示する。これにより、来場者や不審者の確認が容易となり、受付時の混雑解消に役立つ。また、公共施設や商業施設等の店舗に設置された撮像装置1300(b)から受信した距離画像を用いて、コントローラ装置1310は商品棚を眺める人の数や、人物が特定できない範囲の情報(例えば、性別や身長、顔の向き、身体の向き、姿勢など)を表示する。これにより、買い物客の購買層や視線や姿勢による関心度などを判断し、商品や陳列に関するマーケティング/販売力強化に役立つ。遊園地や公園等の屋外に設置された撮像装置1300(c)から受信した可視画像、赤外画像、距離画像を用いて、コントローラ装置1310は、画像の中から人物を抽出し、3Dベースの顔認証を行い、予め登録した人物であると確認できた場合はその部分を距離画像で表示し、確認できなかった人物のみを可視画像あるいは赤外画像で表示する。あるいは、人物が特定できない範囲の情報(例えば、性別や身長、顔の向き、子供連れ、姿勢など)を表示する。これにより、来園客の安全確保と不審者の早期発見に役立つ。
次に、図14に、本実施の形態の撮像システムの別構成例を示す。本撮像システムは、1台以上の撮像装置1400とコントローラ装置1410から構成する。また、図示していないが、ネットワーク303上に、実施の形態1の撮像装置100、実施の形態2の撮像装置800、810、そして上記撮像装置1300が混在しても良い。コントローラ装置1410は、いずれの撮像装置も管理可能とする。
撮像装置1400は、前記撮像装置1300に、2つの動体領域抽出部1401(a)(b)を搭載する。この動体領域抽出部1401は、前記コントローラ装置1310の動体領域抽出部1311と同様でも良い。それ以外の構成部分は、撮像装置1300と同様の構成である。
動体領域抽出部1401(a)(b)は、2つの信号処理部13(a)(b)から出力される赤外画像を用いて、それぞれの画像から動体領域を抽出する部分である。これらの抽出した動体領域の情報は、前記実施の形態2と同様に、信号出力制御部14あるいは制御部23に出力し、コントローラ装置1410に提供することが可能である。また、動体領域抽出部1401(a)(b)は、前記距離算出部1302から出力されるステレオ画像(距離画像)を用いて動体領域を抽出し、前述の方法と結果を比較することでより精度良く動体領域を抽出できる。あるいは、最初にステレオ画像(距離画像)を用いて動体領域を抽出し、次に赤外画像を用いて前記抽出した動体領域の部分のみをさらに詳細に確認するようにしても良い。
ここで、制御部23は、前記動体領域抽出部1401(a)(b)から出力された2つの動体領域の情報を参照し、抽出した数や位置を比較し、その比較結果を解析メタデータとして送信することもできる。コントローラ装置1410は、前記解析メタデータを利用し、左右どちらの可視画像あるいは赤外画像を用いて顔認証するかを選択することができる。例えば、動体領域抽出部1401(a)(b)で動体領域を抽出した結果、動体領域抽出部1401(a)(あるいは動体領域抽出部1401(b))で抽出した結果の方が動体領域の数が多い場合に、撮像装置1400の制御部23は動体領域抽出部1401(a)(あるいは動体領域抽出部1401(b))で抽出した動体領域の情報と信号処理部13(a)(あるいは信号処理部13(b))から出力される可視画像あるいは赤外画像を送付する。
一方、コントローラ装置1410は、前記コントローラ装置1310に、実施の形態1に記載したコントローラ装置200の顔領域検出部210、顔特徴点211、顔照合部212、顔DB213と、総合判定部1411を搭載する。
これにより、撮像装置1400は、実施の形態1に記載した顔領域検出部210、顔特徴点211、顔照合部212、顔DB213を用いた顔認証処理(可視画像、赤外画像を使用)と、前述した顔領域検出部1312、顔特徴点検出部1313、顔照合部1314、3D顔DB1315を用いた顔認証処理(可視画像、赤外画像、ステレオ画像を使用)とを併用して実行することができる。総合判定部1411は、両方の顔認証処理を実行した結果に基づき、人認証結果の最終判定を行う部分である。これにより2種類の異なる顔認証方法を実行することで、より精度の高い顔認証を実行できる。
同様に、図15に、本実施の形態の撮像システムの別構成例を示す。本撮像システムは、1台以上の撮像装置1500とコントローラ装置1510から構成する。また、図示していないが、ネットワーク303上に、実施の形態1の撮像装置100、実施の形態2の撮像装置800、810、そして上記撮像装置1300、1400が混在しても良い。コントローラ装置1510は、いずれの撮像装置も管理可能とする。
撮像装置1500は、前記撮像装置1400に、2つの顔領域検出部1502(a)(b)を搭載する。この顔領域検出部1502は、前記コントローラ装置1310の顔領域検出部1312と同様でも良い。それ以外の構成部分は、撮像装置1400と同様の構成である。
顔領域検出部1501(a)(b)は、2つの動体領域抽出部1401(a)(b)から出力される動体領域の情報を用いて、人の顔領域を抽出する部分である。これらの抽出した顔領域の情報は、前記実施の形態2と同様に、信号出力制御部14あるいは制御部23に出力し、コントローラ装置1510に提供することが可能である。
ここで、制御部23は、前記顔領域検出部1501(a)(b)から出力された2つの顔領域の情報を参照し、抽出した数や位置、そして顔の向きを比較し、その比較結果を解析メタデータとして送信することができる。コントローラ装置1510は、前記解析メタデータを利用し、より顔認証に適した画像を選択することで、より精度の高い顔認証を実行できる。
一方、コントローラ装置1510は、前記コントローラ装置200あるいはコントローラ装置1410に、新たに認証方式選択部1511、虹彩検出部1512、虹彩照合部1513、虹彩DB1514を搭載する。
認証方式選択部1511は、撮像装置1500から受信した可視画像、赤外画像、ステレオ画像(距離画像)、解析パラメータ情報などを用いて、顔認証と虹彩認証のどちらを実行するかを選択する部分である。例えば、対象物が所定の距離範囲に入った場合は虹彩認証を実行し、それ以外は顔認証を実行する。あるいは、通常は顔認証を実行し、虹彩認証が可能な条件を満たしている場合には虹彩認証も実行する、
虹彩検出部1512は、撮像装置1500から受信した赤外画像と、その画像から抽出した顔領域を含む解析パラメータを用いて、人の目の虹彩位置を検出し、さらに虹彩と白目の境の検出および虹彩と同行の境を検出し、虹彩エリアの特定を行い、瞳孔コードを生成する。なお、これらの方法は、周知のいずれの手法を適用しても良い。
虹彩照合部1513は、前記虹彩検出部1512で検出した情報を元に、顔認証と同様に、虹彩DB1514を用いてマッチングを行う。
これによりコントローラ装置1510は、撮像装置1500から受信した可視画像、赤外画像、ステレオ画像(距離画像)、解析パラメータ情報などを用いて、最適な生体認証を選択することができ、より精度の高い本人認証を実行することが可能となる。
図24に、空港やビルエントランスなどに設置された撮像装置1500の撮像映像を、コントローラ装置1410、コントローラ装置1510が処理する例を示す。本例では、コントローラ装置1410は、撮像装置1500から可視画像と解析パラメータとして顔領域と距離情報を取得することで、距離が遠い顔領域に対しては比較的画像処理負担が軽い2D顔認証を実施し、距離が近い顔領域については画像処理負担の大きい3D顔認証する。また、コントローラ装置1510は、撮像装置1500から可視画像、赤外画像、解析パラメータとして顔領域と距離情報を取得することで、距離が遠い顔領域に対しては可視画像を用いて顔認証し、距離が近い顔領域に対しては赤外画像を用いて虹彩認証を行う。また、順番待ちなどによる混雑を解消するために、撮像画像内で所定の位置から近い距離に居る人を判断し、その順番に顔認証を実行することもできる、
図16は、本実施の形態の撮像システムの別構成例を示す。本撮像システムは、例えばスマートフォンやタブレットのような携帯端末に搭載した例を示す。
図17、図18は、本実施の形態の形態で使用する撮像装置1400、1500に関する機能情報や解析パラメータの構成例を示す。
前記撮像装置が生成するステレオ画像(距離画像)は、図17に示すように、可視画像や赤外画像と同様の転送方法で、コントローラ装置へ提供することが可能である。
あるいは、図18に示すように、動体領域の位置情報や顔領域の位置情報に付加した方法で提供することも可能である。その場合は、動体領域や顔領域に該当する座標領域に関する距離情報のみを切り出して付加する。
図20に、解析パラメータの一部として距離情報を送付する構成例を示す。ペイロード1210内に距離情報を格納し、例えば抽出した動体領域(個数n)に関する距離情報は動体領域の座標情報の直後に格納(2001、2002)し、顔領域(個数m)に関する距離情報は顔領域の座標情報直後に格納(2003、2004)する。この構成の他、座標情報と距離情報を交互に格納した構成でも良い。
図19は、本実施の形態の撮像システムの別構成例を示す。本撮像システムの撮像装置1900は、1つの動体領域抽出部1901を備え、左右の信号処理部13(a)(b)のどちらか一方の赤外画像を用いて動体領域を抽出する構成である。あるいはどちらか一方の赤外画像と、距離算出部1302から出力されたステレオ画像とを用いて動体領域を抽出する構成である。