JP2017126910A - 撮影装置 - Google Patents
撮影装置 Download PDFInfo
- Publication number
- JP2017126910A JP2017126910A JP2016005651A JP2016005651A JP2017126910A JP 2017126910 A JP2017126910 A JP 2017126910A JP 2016005651 A JP2016005651 A JP 2016005651A JP 2016005651 A JP2016005651 A JP 2016005651A JP 2017126910 A JP2017126910 A JP 2017126910A
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- pixels
- mode
- face recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】リアルタイムに撮影した人物の顔認識を行うには、撮影装置などの端末で顔を含む画像を撮影し、複雑な処理が必要な顔認識処理は、クラウドの外部の装置にておこなうという分担が適切である。このとき通信量を抑えるには、顔認識に必要情報量の画像を撮影する必要があり、そのための適切な撮影方法が要望されている。【解決手段】撮影装置にて、間引き読みにて撮影した画像により顔検出を行い、検出した顔画像が顔認識に必要な画素数に足りない場合は、全画素読みにて撮影し、顔画像を切り出して、顔認識が可能な装置へ送信を行う。【選択図】図3
Description
本発明は、人物の顔を検出する撮影装置に関する。
近年、デジタルカメラなどの撮影装置にて撮影した画像から、人物の顔の特徴を解析して人物を特定する、いわゆる顔認識を行う技術が考案されている。顔認識を使ったシステムの例として、国際空港に設置し、犯罪者の入国防止に使われている事例が広く知られている。
一方、警官の行動と市民の行動を監視する目的で、警官の身体への装着式カメラ(Body Worn Camera:BWC)の導入が、米国を発端に始まっている。このBWCを使って、撮影時にリアルタイムに犯罪者を照合することができれば、犯人逮捕に役立てることができると考えられている。
撮影時にカメラ単体で顔認識を行うためには、顔認識のためのデータベースをカメラ毎に持つ必要がある。特に、犯罪者などの大量のデータベースと照合するには、大きなメモリと高い処理能力が必要となるため、実現するためには高価で大型化してしまう恐れがある。また、犯罪者のデータベースは日々更新されているため、それぞれのカメラのデータベースを更新するのにも莫大なコストがかかる。
そのため、BWCで撮影した画像を顔認識サーバへ送信し、犯罪者データベースと照合することで、カメラ側は軽量で安価に作成することができ、システムもフレキシブル性を得ることができる。
しかし、撮影した画像全てを顔認識サーバへ送信すると、大量の通信トラフィックが発生し、通信コストがかさんでしまうという問題が発生する。
そこで、通信トラフィックを圧縮できるカメラとして、検出した顔画像を一定の画素数で切り出して送信する撮像画像転送装置に関する発明が、特許文献1にて開示されている。
しかしながら、顔認識を行うためには、顔の目や鼻、口などの器官を検出して、それぞれの相対位置情報を数値化する必要があるため、顔検出に必要な画像サイズよりも大きな画像サイズが必要である。そのため、顔検出できた画像が顔認識に使えない場合が発生し、無駄な通信トラフィックと、顔認識サーバで無駄な処理プロセスが発生してしまう。
本発明の目的は、顔認識サーバに送信する画像データを適切に撮影するための撮影装置を提供することにある。
上記の目的を達成するために、本発明に係る撮影装置は、
撮像素子と、外部と無線通信を行うための無線通信手段を有する撮影装置であって、
前記撮像素子からの画像の読み出し方法である、第一の撮影モードと、
前記第一の撮影モードよりも読み出し画素数が多い第二の撮影モードがあり、
前記第一の撮影モードで顔検出を行い、
前記第一の撮影モードで検出した顔の画像をトリミングする第一のトリミング手段と、
前記第一のトリミング手段でトリミングした画像の画素数が所定以下であるかどうかを判断する顔認識判断手段と、
前記顔認識判断手段が、所定以下であと判断した時は、前記第二の撮影モードに切り替えて撮影を行い、対応する顔の画像をトリミングする第二のトリミング手段を有し、
前記第一のトリミング手段、または、前記第二のトリミング手段でトリミングした少なくとも一方の画像を外部装置へ前記無線通信手段にて送信することを特徴とする。
撮像素子と、外部と無線通信を行うための無線通信手段を有する撮影装置であって、
前記撮像素子からの画像の読み出し方法である、第一の撮影モードと、
前記第一の撮影モードよりも読み出し画素数が多い第二の撮影モードがあり、
前記第一の撮影モードで顔検出を行い、
前記第一の撮影モードで検出した顔の画像をトリミングする第一のトリミング手段と、
前記第一のトリミング手段でトリミングした画像の画素数が所定以下であるかどうかを判断する顔認識判断手段と、
前記顔認識判断手段が、所定以下であと判断した時は、前記第二の撮影モードに切り替えて撮影を行い、対応する顔の画像をトリミングする第二のトリミング手段を有し、
前記第一のトリミング手段、または、前記第二のトリミング手段でトリミングした少なくとも一方の画像を外部装置へ前記無線通信手段にて送信することを特徴とする。
本発明に係る撮影装置によれば、顔認識サーバに送信する画像データを適切に撮影することができる。
以下、本発明の実施の形態を図面に基づいて説明する。
[第1の実施の形態]
図4は本実施形態である撮影装置を含む、顔認識システムの全体構成図である。
図4は本実施形態である撮影装置を含む、顔認識システムの全体構成図である。
撮影装置100で顔を検出し、画像から検出した顔情報のみを切り出して、ネットワーク経由で顔認識が実行できるクラウド等のサーバ200へ送信する。サーバ200で顔認識した情報が、特定のデータベースと一致した場合、その旨を撮影装置100へ送信し、撮影装置の使用者へ通知するものとする。
図1は本実施形態による撮影装置の構成を示すブロック図である。
撮影レンズ103はシャッター101を通して撮像素子22へ結像するための調整がされている。シャッター101は、絞り機能を備えている。
撮像素子22は、光学像を電気信号に変換するCCDやCMOS素子等によって構成されている。撮像素子22の受光面には、図2に示すような複数の画素がマトリクス状に配されている。各画素には、赤、青、緑のカラーフィルターが装着されており、カラーフィルターは各色に応じた周波数帯を通過させるバンドフィルターとなっている。画素の読み出し方式は、撮影モード毎に切り替えることが可能であり、たとえば、全ての画素を読み出す全画素読みや、高速省電力のため、水平方向の特定のラインを間引き読み等の読み出し方式が選択可能である。A/D変換器23は、撮像素子22から出力されるアナログ信号をデジタル信号に変換する。
画像処理部24は、A/D変換器23からのデータ、又は、メモリ制御部15からのデータに対し、所定の画素補間、縮小といったリサイズ処理や、色変換処理、また、撮影した画像を解析して人物の顔の検出や、画像の必要か所を抜き出すトリミング処理等を行う。また、画像処理部24は、撮像した画像データを用いて所定の演算処理を行い、演算処理によって得られた演算結果をシステム制御部50に送信する。
システム制御部50は、画像処理部24によって得られた演算結果に基づいて、露光制御等を行う。これにより、TTL(スルー・ザ・レンズ)方式のAE(自動露出)処理等が行われる。画像処理部24は、撮像した画像データを用いて所定の演算処理を行い、演算処理によって得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行う。
A/D変換器23から出力されるデジタルデータは、画像処理部24及びメモリ制御部15を介して、或いは、メモリ制御部15を介して、メモリ32に書き込まれる。
メモリ32は、撮像素子22によって得られ、A/D変換器23によってデジタルデータに変換された画像データを格納する。メモリ32は、所定枚数の静止画像や所定時間の動画像及び音声を格納するのに十分な記憶容量を備えている。
不揮発性メモリ56は、電気的に情報の消去や記録が可能なメモリであり、例えばEEPROM等が用いられている。不揮発性メモリ56には、システム制御部50の動作用の定数、プログラム等が記憶されている。かかるプログラムは、本実施形態による撮影装置を制御するためのプログラムであり、例えば、図3に示すような動作が当該プログラムによって実行される。
システム制御部50は、本実施形態による撮影装置(以下、「デジタルカメラ」ともいう)100の全体の制御を司る。不揮発性メモリ56に記録されたプログラムを実行することによって、後述する各処理を実行する。
システムメモリ52としては、例えばRAMが用いられている。システムメモリ52には、システム制御部50の動作用の定数、変数、不揮発性メモリ56から読み出したプログラム等が展開される。
システムタイマー53は、各種制御に用いる時間や、内蔵された時計の時間を計測する。
電源制御部80は、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成され、電池の装着の有無、電池の種類、電池残量の検出を行う。また、電源制御部80は、これらの検出結果やシステム制御部50からの指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、各部へ供給する。
電源部30は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等から成る。
電源スイッチ72は、デジタルカメラ100の電源のオン/オフの切り替えのためのものである。
記録媒体150は、メモリカード、半導体メモリ、磁気ディスク等によって構成される。記録媒体150への画像データの書き込みや記録媒体150からの画像データの読み出し等は、メディアインターフェース18を介して行われる。
外部装置と接続する場合は、通信インタフェース41を介して行われる。通信インタフェースとしては、無線LAN,Bluetooth(登録商標)、LET(Long Term Evolution)等の無線技術によって構成される。外部装置と通信することにより、本撮影装置の操作や設定の変更が可能となる。さらに、本撮影装置のライブ画像を送信することも可能である。
アラーム54は、デジタルカメラ100で発生したイベントや、通信インタフェース41を介して外部機器などから受信した情報をもとに、ユーザへ音で通知するためのスピーカ等で構成されている。
図2を用いて間引き読みを説明する。
図2において、H0行V0列の画素はR(赤色:Red)、H1行V0列の画素および、H0行V1列の画素はG(緑色:Green)、H1行V1列の画素はB(青色:Blue)を示している。全画素に対して、RGBが繰り返しパターンとなっている。RGBの各画素の出力の比が彩度を表現し、出力の絶対値が輝度を表す。多くの画素で撮影するためには、全ての画素を読み出す全画素読みモードで撮影する。
しかしながら、全画素読みを使用すると、画素からの読み出しに時間がかかり、電力消費が大きくなる。そのため、必要な解像度と消費電力のトレードオフにより、画素を垂直方向に間引いて読み出す間引き読みという動作モードを設ける。
例として図2を用いて垂直1/3間引き読みを説明すると、H0行をはじめとする3の倍数の行の画素は全画素読み出すが、H1、H2等のその他の行は読み出さない。垂直1/3間引き読みは全画素読みに対して垂直方向の解像度が1/3になるが、全画素読みで読み出した画素配列と同じRGB構造をとることになる。垂直方向および、水平方向の間引き読みは、R画素およびG画素を含む行とまたは列と、G画素およびB画素を含む行または列を交互に読み出す必要がある。
図3は本発明である撮影装置100のシステム制御部50での処理フローを示した図である。
S301は、撮影を終了するかどうかを判定するステップである。判定条件としては、電源スイッチ72が押されたかどうかで検出する方法や、通信インタフェース41を介して、外部の装置から指示をもとに判定してもよい。撮影を終了する場合は、S302に進み、撮影を継続する場合はS303へ進む。
S303は、間引き撮影を行い、撮影した画像を画像処理部24で解析を行うステップである。間引き読み出しを行った場合に得られる画素数が、全画素読み出しを行った場合に得られる画素数に対する割合を間引き率としたとき、顔検出時に使用する間引き率は下記の式で表すことができる。
(間引き率)≦(顔検出に必要な最低画素数)/(顔認識に必要な最低画素数)
例えば、顔検出を行うのに必要な最低画素数が垂直方向に20ピクセル、顔認識を行うのに必要な最低画素数が垂直方向に60ピクセルである場合、垂直1/3間引き以下で顔検出を行えばよい。
(間引き率)≦(顔検出に必要な最低画素数)/(顔認識に必要な最低画素数)
例えば、顔検出を行うのに必要な最低画素数が垂直方向に20ピクセル、顔認識を行うのに必要な最低画素数が垂直方向に60ピクセルである場合、垂直1/3間引き以下で顔検出を行えばよい。
次にS304は、画像処理部24での解析をもとに、撮影画像に顔が含まれているかどうかで検出判定を行うステップである。顔が検出されない場合は、S301へ戻り、検出された場合は、S305へ進む。
S305は、S303にて撮影した画像に含まれる顔画像が個体を識別するのに必要な画素数を含んでいるかどうか、つまり、顔認識できるかどうかの判定を行うステップである。顔認識に必要な画素数は、事前に顔認識を行うシステムと通信を行い、取得した情報をメモリ32などへ保存しておくと良い。先ほどの例では、顔認識を行うのに必要な最低画素数が60ピクセルであるため、顔検出された画素が60ピクセル未満であるかどうかで判定を行う。画素が不足している場合はS306へ進み、不足していないときは、S307へ進む。
S306は、顔が検出された領域に対して、間引き読みから全画素読みに撮影モードを切り替えて撮影を行うステップである。このとき、S304の判定で、顔検出ができたために、垂直1/3間引き読みで20ピクセル以上の画像であるため、全画素読みを行うことで60ピクセル以上が得ることができる。
S307は、顔に関わる画像領域をトリミングするステップである。画像処理部24を使用して、顔を検出した領域から余分な領域を切り出し、画像を圧縮し、S308へ進む。
S308は、顔画像を送信するステップである。顔画像の送信が終わるとS301へ戻る。
以上示したように、本実施の形態によれば、顔認識を行うサーバ200において、画素不足のため、顔認識ができないという問題を回避することができるため、再送のための無駄な通信トラフィックの発生を抑制することができた。
[第2の実施の形態]
第1の実施の形態では、顔検出を行ったときに、図3のフローチャートのように、顔認識するために必要な画素が不足しているかどうかの判定S305を行った後、不足していたらS306へ進んでいた。ところが、間引き読みから全画素読みへ切り替えるには、撮像素子22の消費電力が増大するという問題と、撮像素子22の読み出しモードを変更する必要があるため、システム制御部50での処理オーバヘッドが増大するという問題が発生する。
第1の実施の形態では、顔検出を行ったときに、図3のフローチャートのように、顔認識するために必要な画素が不足しているかどうかの判定S305を行った後、不足していたらS306へ進んでいた。ところが、間引き読みから全画素読みへ切り替えるには、撮像素子22の消費電力が増大するという問題と、撮像素子22の読み出しモードを変更する必要があるため、システム制御部50での処理オーバヘッドが増大するという問題が発生する。
本実施例では、極力、読み出しモードを変更せず、顔認識に必要な画素数の画像を得るための実施の形態を説明する。
例えばBWCを使用して、路上などですれ違う人を撮影する場合を考える。このとき、対面方向に歩いてくる人の顔を撮影することはできるが、同一方向へ歩いている歩行者の顔は、振り返る等の動作が無い限り顔を撮影することは困難である。
そこで、対面方向に歩いてくる人の顔の出現パターンに着目し、図5を用いて説明する。
図5において、遠方にいる人504は、顔検出するにも顔が小さくて検出することができない。しかし、近くに近寄ってくると、顔検出する程度の大きさになり(501)、さらに、十分接近してくると、顔検出でき、さらに顔認識するために必要な画素数を得ることができるようになる(502)。しかし、顔認識するたに必要な画素数を得る前に、十分接近することなく画面から逸れていくと顔認識に必要な画素数を得ることができない。画面から逸れていく場合は、画面中央付近から突如、消失するのではなく、画面の周辺から逸れて行くのである(503)。
そこで、画面内の中央付近の領域に、保留領域510を設け、保留領域に入っている場合、顔認識に必要な画素になるまでは顔画像の送信を保留し、保留領域から逸れた場合のみ、顔認識に必要な画素数を得るために、読み出し方法を変更するというものである。
このときのシステム制御部50での処理フローを図6へ示す。図3との違いは、S609のステップを追加したところである。
以上示したように、本実施の形態によれば、実施の形態1と比較して、撮像素子22での消費電力の低減と、システム制御部50における処理オーバヘッドの低減を行うことができた。
本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。
また、上述の実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いてプログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのプログラムを実行する場合も本発明に含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、ハードディスク、磁気テープ等の磁気記録媒体、光/光磁気記憶媒体、不揮発性の半導体メモリでもよい。
また、プログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムを記憶し、接続のあったクライアントコンピュータはがコンピュータプログラムをダウンロードしてプログラムするような方法も考えられる。
22 撮像素子、24 画像処理部、41 通信インタフェース、
50 システム制御部、54 アラーム、100 撮影装置、101 シャッター、
103 撮影レンズ、150 記録媒体
50 システム制御部、54 アラーム、100 撮影装置、101 シャッター、
103 撮影レンズ、150 記録媒体
Claims (6)
- 撮像素子と、外部と無線通信を行うための無線通信手段を有する撮影装置であって、
前記撮像素子からの画像の読み出し方法である、第一の撮影モードと、
前記第一の撮影モードよりも読み出し画素数が多い第二の撮影モードがあり、
前記第一の撮影モードで顔検出を行い、
前記第一の撮影モードで検出した顔の画像をトリミングする第一のトリミング手段と、
前記第一のトリミング手段でトリミングした画像の画素数が所定以下であるかどうかを判断する顔認識判断手段と、
前記顔認識判断手段が、所定以下であと判断した時は、前記第二の撮影モードに切り替えて撮影を行い、対応する顔の画像をトリミングする第二のトリミング手段を有し、
前記第一のトリミング手段、または、前記第二のトリミング手段でトリミングした少なくとも一方の画像を外部装置へ前記無線通信手段にて送信する撮影装置。 - 前記第一の撮影モードにて検出した顔画像が、前記撮像素子の特定の領域にあり、なおかつ、前記顔認識判断手段が、所定の画素数以下であると判断したときは、顔が検出される領域が前記特定の領域以外から検出されるまで、外部装置への画像送信を保留することを特徴とする請求項1に記載の撮影装置。
- 前記顔認識判断手段は、前記通信手段により、外部装置から取得した情報に応じて判断を行うことを特徴とする請求項1又は請求項2に記載の撮影装置。
- 前記第二の撮影モードは、顔画像を含む領域を全画素読みするモードであることを特徴とする請求項1又は請求項2に記載の撮影装置。
- 前記第一の撮影モードは、特定の行または列を読み出さずスキップする、または、加算することにより画素数を減らす間引き読みを行っていることを特徴とする請求項1又は請求項2に記載の撮影装置。
- 前記顔検出を行うために必要な画素数に対する、前記顔認識判断手段で判断基準となる画素数の比が、前記第一の撮影モードで得られる顔画像の画素数に対する、前記第二の撮影モードで得られる顔画像の画素数の比よりも大きくなるように前記第一の撮影モードと前記第二の撮影モードを決定することを特徴とする請求項1又は請求項2に記載の撮影装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016005651A JP2017126910A (ja) | 2016-01-15 | 2016-01-15 | 撮影装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016005651A JP2017126910A (ja) | 2016-01-15 | 2016-01-15 | 撮影装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017126910A true JP2017126910A (ja) | 2017-07-20 |
Family
ID=59365383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016005651A Pending JP2017126910A (ja) | 2016-01-15 | 2016-01-15 | 撮影装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017126910A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019064755A1 (ja) * | 2017-09-29 | 2019-04-04 | 富士通株式会社 | 処理プログラム、処理方法、及び処理装置 |
JP2019180017A (ja) * | 2018-03-30 | 2019-10-17 | キヤノン株式会社 | 画像処理装置、撮影装置、画像処理方法、およびプログラム |
-
2016
- 2016-01-15 JP JP2016005651A patent/JP2017126910A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019064755A1 (ja) * | 2017-09-29 | 2019-04-04 | 富士通株式会社 | 処理プログラム、処理方法、及び処理装置 |
JP2019068234A (ja) * | 2017-09-29 | 2019-04-25 | 富士通株式会社 | 処理プログラム、処理方法、及び処理装置 |
JP2019180017A (ja) * | 2018-03-30 | 2019-10-17 | キヤノン株式会社 | 画像処理装置、撮影装置、画像処理方法、およびプログラム |
JP7182893B2 (ja) | 2018-03-30 | 2022-12-05 | キヤノン株式会社 | 画像処理装置、撮影装置、画像処理方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5089405B2 (ja) | 画像処理装置及び画像処理方法並びに撮像装置 | |
JP5046788B2 (ja) | 撮像装置及びその制御方法 | |
JP4914045B2 (ja) | 撮像装置及び撮像装置の制御方法 | |
US9258481B2 (en) | Object area tracking apparatus, control method, and program of the same | |
CN104702826A (zh) | 摄像设备及其控制方法 | |
CN104717423A (zh) | 摄像装置、通信装置及其控制方法 | |
US9560265B2 (en) | Image processing apparatus, image processing method, image processing program, and imaging apparatus | |
US20120162495A1 (en) | Image-capturing apparatus and control method therefor | |
JP2018207497A (ja) | 画像処理装置及び画像処理方法、撮像装置、プログラム、並びに記憶媒体 | |
JP2005197914A (ja) | 顔画像認識装置及びそれを備えたデジタルカメラ | |
JP2014103643A (ja) | 撮像装置及び被写体認識方法 | |
JP5423186B2 (ja) | 撮像装置、領域検知方法、及びプログラム | |
JP2017126910A (ja) | 撮影装置 | |
JP6450107B2 (ja) | 画像処理装置及び画像処理方法、プログラム、記憶媒体 | |
JP4647518B2 (ja) | 撮影装置 | |
JP4891163B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
JP5968386B2 (ja) | 撮像装置及びその制御方法 | |
JP5111023B2 (ja) | 撮像装置及びその制御方法 | |
US20230196508A1 (en) | Image processing apparatus, image capturing apparatus, image processing method, and storage medium | |
JP2012199986A (ja) | 撮像装置及びその制御方法 | |
JP4773924B2 (ja) | 撮像装置及びその制御方法及びプログラム及び記憶媒体 | |
US20230196708A1 (en) | Image processing apparatus and method for controlling the same, and non-transitory computer-readable storage medium | |
JP6526270B2 (ja) | 撮像装置及びその制御方法 | |
JP2010021956A (ja) | 撮像装置 | |
JP2016167088A (ja) | 撮像装置及びその制御方法 |