WO2023105635A1

WO2023105635A1 - 判定装置、判定方法、および判定プログラム

Info

Publication number: WO2023105635A1
Application number: PCT/JP2021/044955
Authority: WO
Inventors: ▲浜▼壮一
Original assignee: 富士通株式会社
Priority date: 2021-12-07
Filing date: 2021-12-07
Publication date: 2023-06-15

Abstract

判定装置は、カメラにより異なる時刻に撮影された、人物の画像領域を含む複数の撮影画像を取得する取得部と、前記複数の撮影画像から、光の反射量が閾値以上となる反射領域を特定する特定部と、前記複数の撮影画像間における、前記反射領域に含まれる画素の変化と、前記反射領域以外である非反射領域の画素の変化との差に応じて、前記複数の撮影画像が前記人物の表示物を撮影したものかを判定する判定部と、を備えることを特徴とする。　

Description

判定装置、判定方法、および判定プログラム

　本件は、判定装置、判定方法、および判定プログラムに関する。

　本人確認するための顔認証に係る技術が開発されている。顔認証では、高い認証精度を実現できる反面、なりすまし等の不正行為が行われることがある。そこで、不正行為を防止する技術が開示されている（例えば、特許文献１参照）。

特開２０１０－２２５１１８号公報

　しかしながら、人物の表示物を用いた不正行為を判定することは困難である。

　１つの側面では、本発明は、人物の表示物を用いた不正行為を判定することができる判定装置、判定方法、および判定プログラムを提供することを目的とする。

　１つの態様では、判定装置は、カメラにより異なる時刻に撮影された、人物の画像領域を含む複数の撮影画像を取得する取得部と、前記複数の撮影画像から、光の反射量が閾値以上となる反射領域を特定する特定部と、前記複数の撮影画像間における、前記反射領域に含まれる画素の変化と、前記反射領域以外である非反射領域の画素の変化との差に応じて、前記複数の撮影画像が前記人物の表示物を撮影したものかを判定する判定部と、を備える。

　人物の表示物を用いた不正行為を判定することができる。

（ａ）は表示物ではない本物の顔を撮影することで得られた顔画像を例示する図であり、（ｂ）は表示物をカメラに対して提示することで得られた顔画像を例示する図である。（ａ）は表示物ではない本物の顔を撮影することで得られた顔画像を例示する図であり、（ｂ）は表示物をカメラに対して提示することで得られた顔画像を例示する図である。反射の動きを説明するための図である。（ａ）は判定装置の全体構成を例示するブロック図であり、（ｂ）は判定装置のハードウェア構成を例示するブロック図である。判定装置の動作の一例を表すフローチャートである。（ａ）および（ｂ）は反射が映り込んだ画像である。実施例に係る判定装置の全体構成を例示するブロック図である。実施例４に係る判定装置の動作の一例を表すフローチャートである。実施例５に係る判定装置の全体構成を例示するブロック図である。反射領域を例示する図である。実施例５に係る判定装置の動作の一例を表すフローチャートである。反射領域を例示する図である。実施例６に係る判定装置の動作の一例を表すフローチャートである。

　生体認証は、指紋、顔、静脈などの生体特徴を用いて本人確認をおこなう技術である。生体認証では、確認が必要な場面においてセンサによって取得した照合用生体データと、予め登録しておいた登録生体データとを比較（照合）し、類似度が本人判定閾値以上になるか否かを判定することで、本人確認を行なっている。

　中でも、顔認証技術は、非接触で本人確認できる手段として注目されている。顔認証技術は、パーソナルコンピューターやスマートフォンなどの個人利用端末のアクセス管理だけでなく入退室や空港での搭乗ゲートでの本人確認など様々な用途で利用されている。

　顔認証技術は、非接触で高い認証精度を実現できる反面、なりすまし等の不正行為が行われるおそれがある。例えば、なりすまし対象の人物の顔の表示物を入手することは、比較的容易である。例えば、顔画像は、ＳＮＳ（Social Networking Service）などでインターネット上に公開されている場合もある。したがって、インターネット上で公開されている顔画像を写真印刷すれば、なりすまし対象の人物の表示物を入手することができる。または、インターネット上で公開されている顔画像（静止画および動画のいずれでもよい）をスマーフォンなどの画面に表示することで、なりすまし対象の人物の表示物として用いることができる。指紋認証や手のひら静脈認証などの他の生体情報と比較すると、顔認証で利用する顔画像は特殊なセンサを用いずに撮影可能であるため、撮影の段階で被写体が表示物であるのか、表示物でない本物なのか、判定することは困難である。以上のことから、顔認証技術では、人物の表示物をカメラに対して提示することで本人になりすます不正行為に対する懸念がある。

　例えば、図１（ａ）は、表示物ではない本物の顔を撮影することで得られた顔画像を例示する図である。これに対して、図１（ｂ）は、インターネットなどで入手した当該人物の顔画像をスマーフォンやタブレット端末などの端末の画面に表示した表示物をカメラに対して提示することで得られた顔画像を例示する図である。このように、カメラで撮影することで得られた顔画像が、人物の表示物であるのか、表示物ではない本物であるのかを判定することは困難である。

　そこで、以下の実施例では、人物の表示物を用いた不正行為を判定することができる判定装置、判定方法、および判定プログラムについて説明する。

　まずは、人物の表示物を用いた不正行為を判定する原理について説明する。

　認証装置のカメラで、表示物ではない本物の顔を撮影すると、図２（ａ）で例示するように、顔を含む人物とともに、背景も撮影される。図２（ａ）の例では、背景として窓が撮影されている。顔および背景の両方とも、それぞれ動きを伴って撮影されるが、顔の動きと背景の動きとの間には大きな差異は見られない傾向にある。

　一方、タブレット端末やスマートフォン等の端末の画面は、外部からの光を反射する。したがって、当該端末の画面に人物の表示物（顔の静止画や動画）を表示してカメラに対して提示すると、図２（ｂ）で例示するように、カメラが撮影することで得られた撮影画像には、当該表示物に加えて、反射（映り込み）が含まれる。図２（ｂ）の例では、端末の画面が天井灯の光、認証装置の表示装置の光などを反射しているため、天井灯の反射２０１と、認証装置の表示装置の反射２０２とが映り込んでいる。

　なお、反射の映り込みが確認されるのは、端末の画面、光沢紙などであって、表面反射率の高いものである。例えば、拡散反射率の高いものであれば反射が拡散して結像しないが、表面反射率の高いものであれば反射が結像して形状を確認できるようになる。図２（ｂ）の例では、天井灯の形状を確認でき、表示装置の形状も確認できている。

　カメラ２０４に対して表示物を提示する際には、端末を手で持った状態で提示することが多いため、手ブレ（手で持つことによって生じるブレ）によって端末に微小な動きが加わることがある。しかしながら、表示物の動きも微小となる。したがって、図３の右図で例示する回転方向に端末２０３の画面が動いても、表示物の動きも微小となる。このように、表示物自体には、角度の揺れなどの影響は大きくは現れない。

　しかしながら、端末２０３の画面に映り込む反射は、光源からの光が端末２０３の平面状の画面で反射することによって映り込むものである。したがって、図３の左図で例示するように、映り込んだ反射像は、角度の揺れ（回転方向の動き）によって一定方向に大きく動く。例えば、図３の右図で例示する回転方向に端末の画面が動いたとすると、図３の左図のように、天井灯の反射２０１および認証装置の表示装置の反射２０２が矢印の方向に大きく動く。

　なお、動画を表示物として画面に表示する場合に、人物や背景などが様々な動きを示すことがある。例えば、動画において、人物が不規則に揺れるような動きを示し、背後の窓の外に樹木があると風で揺れたり、あるいは別の人物が背後を横切ったりする場合もある。このように、表示物が大きく動く場合もある。しかしながら、表示物の動きは、映り込んだ反射とは相関しない動きとなる。

　このように、表示物をカメラに対して提示した場合には、表示物とは相関の低い動きをする反射像が観測される。この反射像の動きは、本物と表示物とを見分ける手掛かりとなる。本実施例においては、撮影画像から反射である可能性が高い領域を特定し、特定された反射領域、およびそれ以外の非反射領域の各領域の動きを検出して比較し、動きの差によって本物か表示物であるか否かを判定する。

　図４（ａ）は、判定装置１００の全体構成を例示するブロック図である。図４（ａ）で例示するように、判定装置１００は、取得部１０、画像格納部２０、特定部３０、動き検出部４０、判定部５０、照合部６０、登録データ格納部７０などとして機能する。

　図４（ｂ）は、判定装置１００のハードウェア構成を例示するブロック図である。図４（ｂ）で例示するように、判定装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、記憶装置１０３、インタフェース１０４、表示装置１０５、入力装置１０６、カメラ１０７、照明１０８等を備える。

　ＣＰＵ（Central Processing Unit）１０１は、中央演算処理装置である。ＣＰＵ１０１は、１以上のコアを含む。ＲＡＭ（Random Access Memory）１０２は、ＣＰＵ１０１が実行するプログラム、ＣＰＵ１０１が処理するデータなどを一時的に記憶する揮発性メモリである。記憶装置１０３は、不揮発性記憶装置である。記憶装置１０３として、例えば、ＲＯＭ（Read Only Memory）、フラッシュメモリなどのソリッド・ステート・ドライブ（ＳＳＤ：Solid State Drive）、ハードディスクドライブに駆動されるハードディスクなどを用いることができる。記憶装置１０３は、判定プログラムを記憶している。インタフェース１０４は、外部機器とのインタフェース装置である。例えば、インタフェース１０４は、ＬＡＮ（Local Area Network）とのインタフェース装置である。

　表示装置１０５は、ＬＣＤ（Liquid Crystal Device）などのディスプレイ装置などである。入力装置１０６は、キーボード、マウスなどの入力装置である。カメラ１０７は、ＭＯＳ（Metal Oxide Semiconductor）センサ、ＣＣＤ（Charged Coupled Device）センサなどである。照明１０８は、被写体に光を出射する光源である。

　ＣＰＵ１０１が判定プログラムを実行することで、取得部１０、画像格納部２０、特定部３０、動き検出部４０、判定部５０、照合部６０、登録データ格納部７０が実現される。なお、取得部１０、画像格納部２０、特定部３０、動き検出部４０、判定部５０、照合部６０、登録データ格納部７０として、専用の回路などのハードウェアを用いてもよい。

　図５は、判定装置１００の動作の一例を表すフローチャートである。以下、図５のフローチャートを参照しつつ、判定装置１００の動作の一例について説明する。

　図５で例示するように、取得部１０は、カメラ１０７によって撮影された、人物の画像領域を含む複数の撮影画像を取得する（ステップＳ１）。画像格納部２０は、取得部１０が取得した撮影画像を格納する。この場合において、画像格納部２０は、各画像に時刻を付すなどして、各画像の撮影順序を特定できるようにしておく。当該複数枚の撮影画像は、異なる時刻に撮影されたものであり、例えば、時間的に等間隔で撮影されたものであるものとする。

　次に、特定部３０は、画像格納部２０に格納されている各撮影画像について、光の反射量（映り込みの度合い）を取得する（ステップＳ２）。反射の映り込みの検出には、いくつかの技術が提案されている。例えば、映り込んだ物体が撮影対象とは異なる距離に存在するため、反射像は認証対象の人物と比較してボケて観測される傾向にある。そこで、特定部３０は、例えば、フォーカスの差（ボケ具合の差）を利用して反射像を検出することができる。フォーカスの差を利用して反射像を検出する技術として、“Yang et al., “Fast Single Image Reflection Suppression via Convex Optimization”, CVPR 2019”などを用いることができる。なお、光の反射量（映り込みの度合い）は、反射光強度のことである。

　次に、特定部３０は、ステップＳ２で取得した反射量が閾値以上となる領域を反射領域Ｒとして特定し、当該反射領域Ｒ以外を非反射領域Ｔとして特定し、各領域を分離する（ステップＳ３）。

　次に、動き検出部４０は、反射領域Ｒおよび非反射領域Ｔのそれぞれについて、動きを検出する（ステップＳ４）。時系列で格納してある複数枚の撮影画像を用いることで、動きを求めることができる。具体的には、複数の撮影画像間における、反射領域Ｒに含まれる画素の変化を反射領域Ｒの動きとして検出することができる。非反射領域Ｔの画素の変化を非反射領域Ｔの動きとして検出することができる。

　例えば、動き検出部４０は、複数の撮影画像間における各画素の動きベクトルを求め、反射領域Ｒおよび非反射領域Ｔのそれぞれについて、動きベクトルを集計して平均ベクトルを求める。動きベクトルを求める技術として、例えば、“Farneback, G. “Two-Frame Motion Estimation Based on Polynomial Expansion.” In Proceedings of the 13th Scandinavian Conference on Image Analysis, 363 - 370. Halmstad, Sweden: SCIA, 2003.”などを用いることができる。この技術では、画像の各画素（ｉ，ｊ）における動きベクトル（ｖｘ，ｖｙ）を求めることができる。まず、反射領域Ｒ内の各画素（ｉ，ｊ）における動きベクトル（ｖｘ，ｖｙ）を合計し、領域画素数ｎｒで割り、反射領域Ｒの平均ベクトルｖｒを求めることができる。平均ベクトルｖｒは、ｘ方向の動きｖｒｘと、ｙ方向の動きｖｒｙとからなる２次元の量である。

　動き検出部４０は、非反射領域Ｔについても、平均ベクトルｖｔ＝（ｖｔｘ，ｖｔｙ）を算出する。

　なお、平均ベクトルを算出する際に、動きが検出されない画素が含まれる場合もある。例えば、非反射領域Ｔには、ほとんど動きの無い背景が含まれる場合がある。動いていない画素を含めると正しい平均ベクトルが得られないため、所定値以下の大きさの動きベクトルについては、ノイズとして除外してもよい。

　次に、動き検出部４０は、ステップＳ４で算出した反射領域Ｒの動きと、非反射領域Ｔの動きとの差を算出する（ステップＳ５）。動きの差は、例えば、ステップＳ４で求めた動きベクトルの差分ベクトルの大きさ（距離）から求めることができる。反射領域Ｒと非反射領域Ｔとの差分ベクトルｖｄｉｆｆは、下記式のように表すことができる。

　次に、判定部５０は、ステップＳ５で算出した動きの差が閾値以上であるか否かを判定する（ステップＳ６）。例えば、撮影画像が人物の表示物を撮影したものであれば、反射領域Ｒの動きと、非反射領域Ｔの動きとの差が大きくなる。したがって、動きの差が閾値以上となれば、ステップＳ１で格納された撮影画像については、人物の表示物を撮影したものであると判定することができる。一方、動きの差が閾値未満となれば、ステップＳ１で格納された撮影画像については、本物を撮影したものであると判定することができる。

　ステップＳ６で「Ｙｅｓ」と判定された場合、判定部５０は、撮影画像が人物の表示物を撮影したものであると判定する（ステップＳ７）。判定部５０は、この判定結果を出力する。例えば、この判定結果は、表示装置１０５などに表示される。その後、フローチャートの実行が終了する。そのため、本人確認のための認証処理は行われない。

　ステップＳ６で「Ｎｏ」と判定された場合、判定部５０は、撮影画像が本物を撮影したものであると判定する（ステップＳ８）。

　次に、照合部６０は、認証処理を実行する（ステップＳ９）。具体的には、ステップＳ１で格納した撮影画像から抽出した顔特徴データと、登録データ格納部７０が格納している登録データとを比較（照合）し、類似度が本人判定閾値以上になるか否かを判定する。その後、フローチャートの実行が終了する。

　このように、本実施例によれば、複数の撮影画像間における、反射領域Ｒに含まれる画素の変化と、非反射領域Ｔの画素の変化との差に応じて、複数の撮影画像が人物の表示物を撮影したものかを精度よく判定することができる。したがって、人物の表示物を用いた不正行為を判定することができる。

　なお、本実施例においては、反射領域Ｒの動き、および非反射領域Ｔの動きの両方を用いて表示物の判定を行なっているが、反射領域Ｒの動きだけを用いて表示物の判定を行なうことも考えられる。しかしながら、反射領域Ｒの動きだけで表示物の判定を行なおうとすると、難易度が高くなり、誤検出が生じるおそれがある。例えば、背景の窓のように散乱光のような明るい領域がある場合に、当該明るい領域がある程度の反射量であると推定されることがある。逆に、映り込みである認証装置の表示装置の一部の反射量が小さく検出されてしまう場合がある。

　図６（ａ）は、カメラが撮影することで得られた画像であって、天井灯の反射２０１と、認証装置の表示装置の反射２０２とが映り込んだ画像である。例えば、図６（ｂ）で例示するように、窓のような明るい領域が反射２０５として特定されるおそれがある。また、認証装置の表示装置の一部が反射として特定されないおそれもある。以上のことから、反射領域の動きだけを用いて表示物を判定することは困難である。これに対して、本実施例においては、反射領域Ｒおよび非反射領域Ｔの両方の動きを検出するため、表示物の判定精度が向上する。

　その他、動きを検出することで、反射領域Ｒを分離する手法も考えられる。動きを検出することで反射領域Ｒを分離する手法として、例えば、“Xue et al., “A Computational Approach for Obstruction-Free Photography”, ACM SIGGRAPH 2015”が挙げられる。しかしながら、この技術では、透過によって観測される物体と、反射物体との距離差を、視差を利用して分離しているため、画面反射を微小な手ブレなどから分離することは困難である。これに対して、本実施例においては、反射領域Ｒおよび非反射領域Ｔの両方の動きを別々に検出し、両方の検出結果から表示物の判定を行なっているため、表示物の判定精度が向上する。

　実施例１では、取得部１０が取得した画像を、反射領域Ｒと非反射領域Ｔとの２つの領域に分離していたが、それに限られない。例えば、図２で例示したように、画像内に複数の反射領域が検出される場合がある。そこで、複数の反射領域Ｒ１，Ｒ２のそれぞれの動きと、非反射領域Ｔの動きと比較してもよい。例えば、各反射領域Ｒ１，Ｒ２の動きが類似しており、かつ各反射領域Ｒ１，Ｒ２の動きと非反射領域Ｔの動きとの差が大きい場合に、当該撮影画像を表示物と判定することができる。具体的には、判定部５０は、図５のステップＳ６で、平均ベクトルｖｒ１と、平均ベクトルｖｒ２との差の大きさが閾値以上であるか否かを判定基準に追加してもよい。例えば、平均ベクトルｖｒ１と平均ベクトルｖｒ２との差の大きさが閾値未満であり、かつ平均ベクトルｖｔと平均ベクトルｖｒ１との差、および平均ベクトルｖｔと平均ベクトルｖｒ２との差の両方の大きさが閾値以上である場合に「Ｙｅｓ」と判定してもよい。また、平均ベクトルｖｒ１と平均ベクトルｖｒ２との差の大きさが閾値未満であり、かつ平均ベクトルｖｔと平均ベクトルｖｒ１との差、および平均ベクトルｖｔと平均ベクトルｖｒ２との差の両方の大きさが閾値未満である場合「Ｎｏ」と判定してもよい。また、平均ベクトルｖｒ１と平均ベクトルｖｒ２との差の大きさが閾値以上である場合「Ｎｏ」と判定してもよい。ただし、反射領域Ｒ１の平均ベクトルをｖｒ１、反射領域Ｒ２の平均ベクトルをｖｒ２、非反射領域Ｔの平均ベクトルをｖｔとする。

　図７は、実施例３に係る判定装置１００ａの全体構成を例示するブロック図である。図７で例示するように、判定装置１００ａが判定装置１００と異なる点は、品質判定部８０をさらに備える点である。ＣＰＵ１０１が判定プログラムを実行することで、品質判定部８０も実現されてもよい。また、品質判定部８０として、専用の回路などのハードウェアを用いてもよい。

　フォーカスの差（ボケ具合の差）を利用して反射像を検出する際に、画像全体の品質が低い（ボケが大きい）場合には、反射像を検出する際の反射量の閾値を変更してもよい。例えば、品質判定部８０は、画像格納部２０が格納している複数の撮影画像の各品質を判定する。例えば、品質判定部８０は、ボケの少ない高品質の画像に対しては高い品質値を算出し、ボケの多い低品質の画像に対しては低い品質値を算出する。

　特定部３０は、複数の撮影画像の品質に応じて、反射領域を特定するための閾値を変更する。例えば、品質判定部８０が判定した画像全体の品質が低い場合には、特定部３０は、反射領域を特定するための反射量の閾値を大きくし、必要以上に反射領域が検出されないようにする。ここでの品質は、例えば、ボケ具合によって判定してもよい。具体的には、画像全体の空間周波数の分布を調べ、高周波成分が少なくなっていればボケ具合が大きく、品質が低いと判定することができる。

　ところで、撮影画像が高品質であれば、検出される反射量の信頼度が向上する。そこで、高品質画像において反射量が極端に多い場合には、反射量だけで表示物の判定を行なってもよい。例えば、撮影画像が高品質である場合において、反射量が所定値以上となる領域が含まれる場合には、撮影画像が人物の表示物を撮影したものであると判定することができる。この場合の所定値は、図５のステップＳ３で反射量を判定するための閾値よりも大きい値とする。撮影画像が高品質である場合において、反射量が上記所定値未満であれば、実施例１と同様に、反射領域Ｒおよび非反射領域Ｔの両方の動きの差を用いて表示物の判定を行なってもよい。このように、検出される反射量に応じて、処理を切り替えてもよい。

　図８は、実施例４に係る判定装置の動作の一例を表すフローチャートである。図８のフローチャートは、図５のステップＳ２の実行後に実行される。実施例４に係る判定装置の構成は、例えば、実施例３に係る判定装置１００ａと同様である。

　まず、品質判定部８０は、画像格納部２０が格納している複数の撮影画像の品質を判定する（ステップＳ１１）。次に、特定部３０は、ステップＳ１１で判定された品質（品質値）の少なくともいずれかが閾値以上であるか否かを判定する（ステップＳ１２）。ステップＳ１２で「Ｎｏ」と判定された場合には、図５のステップＳ３が実行される。ステップＳ１２「Ｙｅｓ」と判定された場合には、特定部３０は、複数の撮影画像のうち品質値が閾値以上となる撮影画像において、光の反射量が、上記所定値以上となる領域が含まれるか否かを判定する（ステップＳ１３）。ステップＳ１３で「Ｎｏ」と判定された場合には、図５のステップＳ３が実行される。ステップＳ１３で「Ｙｅｓ」と判定された場合には、判定部５０は、複数の撮影画像が人物の表示物を撮影したものであると判定する（ステップＳ１４）。

　図９は、実施例５に係る判定装置１００ｂの全体構成を例示するブロック図である。図９で例示するように、判定装置１００ｂが実施例１の判定装置１００と異なる点は、検出部９０をさらに備える点である。ＣＰＵ１０１が判定プログラムを実行することで、検出部９０も実現されてもよい。また、検出部９０として、専用の回路などのハードウェアを用いてもよい。

　撮影画像のうち、人物の領域（例えば、顔領域）を抽出してもよい。例えば、顔が表示物ではなく本物であれば、検出される反射領域は限られる。例えば、反射領域は、眼鏡部分、頬や額の一部などのテカリである。したがって、図１０で例示するように顔領域Ｆ内で一定以上の面積の反射領域Ｒが検出されることは不自然である。そこで、顔領域Ｆにおいて、反射領域Ｒの面積の割合が閾値以上であれば、撮影画像を表示物の画像であると判定することができる。

　図１１は、判定装置１００ｂの動作の一例を表すフローチャートである。図１１のフローチャートは、図５のステップＳ２の実行後に実行される。

　まず、検出部９０は、画像格納部２０が格納している複数の撮影画像から顔領域Ｆを検出する（ステップＳ２１）。次に、判定部５０は、複数の撮影画像の少なくともいずれかにおける顔領域Ｆにおいて反射領域Ｒの面積が閾値以上となるか否かを判定する（ステップＳ２２）。ステップＳ２２で「Ｎｏ」と判定された場合には、図５のステップＳ３が実行される。ステップＳ２２「Ｙｅｓ」と判定された場合には、判定部５０は、複数の撮影画像が人物の表示物を撮影したものであると判定する（ステップＳ２３）。

　なお、撮影画像から人物領域を検出する技術としては、セマンテックセグメンテーションを用いた検出手法を用いることができる。または、ＭＴＣＮＮ（Multi-task Cascaded Convolutional Neural Networks、マルチタスクカスケード畳み込みネットワーク）を用いた顔領域検出手法を用いることができる。

　または、撮影画像から人物を検出し、人物領域と背景領域とに分離する技術として、“Zhao et al., "Pyramid Scene Parsing Network", CVPR2017”、“Zhang et al., "Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks", IEEE Signal Processing Letters (Volume: 23 , Issue: 10 , Oct. 2016)”などを用いることができる。

　または、顔領域および背景領域と、反射領域との関係を用いて、表示物の判定を行なってもよい。具体的には、本物であれば、検出される反射領域は、顔領域からはみ出すことはない。また、検出される反射領域は、背景からはみ出すこともない。映り込みは、顔領域または背景から、境界を交差して検出されることが多い。したがって、図１２で例示するように顔領域から外部にかけて反射領域が連続して検出された場合に、撮影画像が表示物の画像であると判定してもよい。

　図１３は、実施例６に係る判定装置の動作の一例を表すフローチャートである。図１４のフローチャートは、図５のステップＳ２の実行後に実行される。実施例６に係る判定装置の構成は、例えば、実施例５に係る判定装置１００ｂと同様である。

　まず、検出部９０は、画像格納部２０が格納している複数の撮影画像から顔領域Ｆを検出する（ステップＳ３１）。次に、判定部５０は、複数の撮影画像の少なくともいずれかにおいて、顔領域Ｆから外部にかけて反射領域Ｒが連続して検出されてはみ出ているか否かを判定する（ステップＳ３２）。ステップＳ３２で「Ｎｏ」と判定された場合には、図５のステップＳ３が実行される。ステップＳ３２「Ｙｅｓ」と判定された場合には、判定部５０は、複数の撮影画像が人物の表示物を撮影したものであると判定する（ステップＳ３３）。

　上記各例において、通常の撮影カメラへの適用を想定しているが、反射量の推定はグレースケール画像からも計算可能なため、赤外線カメラや深度カメラの出力するグレースケール画像に対して適用してもよい。

　以上、本発明の実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

　１０　取得部
　２０　画像格納部
　３０　特定部
　４０　動き検出部
　５０　判定部
　６０　照合部
　７０　登録データ格納部
　１００　判定装置
　１０５　表示装置
　１０７　カメラ

Claims

　カメラにより異なる時刻に撮影された、人物の画像領域を含む複数の撮影画像を取得する取得部と、
　前記複数の撮影画像から、光の反射量が閾値以上となる反射領域を特定する特定部と、
　前記複数の撮影画像間における、前記反射領域に含まれる画素の変化と、前記反射領域以外である非反射領域の画素の変化との差に応じて、前記複数の撮影画像が前記人物の表示物を撮影したものかを判定する判定部と、を備えることを特徴とする判定装置。
　前記判定部は、前記差が閾値以上であれば前記複数の撮影画像が前記人物の表示物を撮影したものであると判定し、前記差が前記閾値未満であれば前記複数の撮影画像が前記人物の表示物を撮影したものではないと判定することを特徴とする請求項１に記載の判定装置。
　前記特定部が前記複数の撮影画像のそれぞれについて複数の反射領域を特定した場合に、前記判定部は、前記複数の撮影画像間における、前記複数の反射領域の画素の変化の差が閾値以下で、前記複数の反射領域の画素の変化と前記非反射領域の画素の変化との差が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１または請求項２に記載の判定装置。
　前記特定部は、前記複数の撮影画像の品質に応じて、前記反射領域を特定するために用いる前記閾値を変更することを特徴とする請求項１から請求項３のいずれか一項に記載の判定装置。
　前記判定部は、前記複数の撮影画像のうち品質が閾値以上となる撮影画像において、光の反射量が、前記反射領域を特定するために用いる前記閾値よりも大きい閾値以上となる領域が含まれる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１から請求項４のいずれか一項に記載の判定装置。
　前記品質は、撮影画像のボケ具合に応じて定まることを特徴とする請求項４または請求項５に記載の判定装置。
　前記複数の撮影画像から前記人物の顔領域を検出する検出部を備え、
　前記判定部は、前記複数の撮影画像の少なくともいずれかにおける前記顔領域において前記反射領域の面積が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１から請求項６のいずれか一項に記載の判定装置。
　前記複数の撮影画像から前記人物の顔領域を検出する検出部を備え、
　前記判定部は、前記複数の撮影画像の少なくともいずれかにおいて、前記顔領域から外部にかけて前記反射領域が連続して検出された場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１から請求項６のいずれか一項に記載の判定装置。
　前記判定部が、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定しなかった場合に、前記複数の撮影画像の少なくとも一部と、予め登録されている登録データとを照合する照合部をさらに備えることを特徴とする請求項１から請求項８のいずれか一項に記載の判定装置。
　カメラにより異なる時刻に撮影された、人物の画像領域を含む複数の撮影画像を取得し、
　前記複数の撮影画像から、光の反射量が閾値以上となる反射領域を特定し、
　前記複数の撮影画像間における、前記反射領域に含まれる画素の変化と、前記反射領域以外である非反射領域の画素の変化との差に応じて、前記複数の撮影画像が前記人物の表示物を撮影したものかを判定する、処理をコンピュータが実行することを特徴とする判定方法。
　前記差が閾値以上であれば前記複数の撮影画像が前記人物の表示物を撮影したものであると判定し、前記差が前記閾値未満であれば前記複数の撮影画像が前記人物の表示物を撮影したものではないと判定することを特徴とする請求項１０に記載の判定装置。
　前記複数の撮影画像のそれぞれについて複数の反射領域が特定された場合に、前記複数の撮影画像間における、前記複数の反射領域の画素の変化の差が閾値以下で、前記複数の反射領域の画素の変化と前記非反射領域の画素の変化との差が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１０または請求項１１に記載の判定方法。
　前記複数の撮影画像の品質に応じて、前記反射領域を特定するために用いる前記閾値を変更することを特徴とする請求項１０から請求項１２のいずれか一項に記載の判定方法。
　前記複数の撮影画像のうち品質が閾値以上となる撮影画像において、光の反射量が、前記反射領域を特定するために用いる前記閾値よりも大きい閾値以上となる領域が含まれる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１０から請求項１３のいずれか一項に記載の判定方法。
　前記品質を、撮影画像のボケ具合に応じて定めることを特徴とする請求項１３または請求項１４に記載の判定方法。
　前記複数の撮影画像から前記人物の顔領域を検出する処理を前記コンピュータが実行し、
　前記複数の撮影画像の少なくともいずれかにおける前記顔領域において前記反射領域の面積が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１０から請求項１５のいずれか一項に記載の判定方法。
　前記複数の撮影画像から前記人物の顔領域を検出する処理を前記コンピュータが実行し、
　前記複数の撮影画像の少なくともいずれかにおいて、前記顔領域から外部にかけて前記反射領域が連続して検出された場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１０から請求項１５のいずれか一項に記載の判定方法。
　前記複数の撮影画像が前記人物の表示物を撮影したものであると判定しなかった場合に、前記複数の撮影画像の少なくとも一部と、予め登録されている登録データとを照合する処理を前記コンピュータが実行することを特徴とする請求項１０から請求項１７のいずれか一項に記載の判定方法。
　コンピュータに、
　カメラにより異なる時刻に撮影された、人物の画像領域を含む複数の撮影画像を取得する処理と、
　前記複数の撮影画像から、光の反射量が閾値以上となる反射領域を特定する処理と、
　前記複数の撮影画像間における、前記反射領域に含まれる画素の変化と、前記反射領域以外である非反射領域の画素の変化との差に応じて、前記複数の撮影画像が前記人物の表示物を撮影したものかを判定する処理と、実行させることを特徴とする判定プログラム。
　前記差が閾値以上であれば前記複数の撮影画像が前記人物の表示物を撮影したものであると判定し、前記差が前記閾値未満であれば前記複数の撮影画像が前記人物の表示物を撮影したものではないと判定することを特徴とする請求項１９に記載の判定プログラム。
　前記複数の撮影画像のそれぞれについて複数の反射領域が特定された場合に、前記複数の撮影画像間における、前記複数の反射領域の画素の変化の差が閾値以下で、前記複数の反射領域の画素の変化と前記非反射領域の画素の変化との差が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１９または請求項２０に記載の判定プログラム。
　前記複数の撮影画像の品質に応じて、前記反射領域を特定するために用いる前記閾値を変更することを特徴とする請求項１９から請求項２１のいずれか一項に記載の判定プログラム。
　前記複数の撮影画像のうち品質が閾値以上となる撮影画像において、光の反射量が、前記反射領域を特定するために用いる前記閾値よりも大きい閾値以上となる領域が含まれる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１９から請求項２２のいずれか一項に記載の判定プログラム。
　前記品質を、撮影画像のボケ具合に応じて定めることを特徴とする請求項２２または請求項２３に記載の判定プログラム。
　前記コンピュータに、
　前記複数の撮影画像から前記人物の顔領域を検出する処理を実行させ、
　前記複数の撮影画像の少なくともいずれかにおける前記顔領域において前記反射領域の面積が閾値以上となる場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１９から請求項２４のいずれか一項に記載の判定プログラム。
　前記コンピュータに、
　前記複数の撮影画像から前記人物の顔領域を検出する処理を実行させ、
　前記複数の撮影画像の少なくともいずれかにおいて、前記顔領域から外部にかけて前記反射領域が連続して検出された場合に、前記複数の撮影画像が前記人物の表示物を撮影したものであると判定することを特徴とする請求項１９から請求項２４のいずれか一項に記載の判定プログラム。
　前記コンピュータに、
　前記複数の撮影画像が前記人物の表示物を撮影したものであると判定しなかった場合に、前記複数の撮影画像の少なくとも一部と、予め登録されている登録データとを照合する処理を実行させることを特徴とする請求項１９から請求項２６のいずれか一項に記載の判定プログラム。