JP2017044778A - 認証装置 - Google Patents
認証装置 Download PDFInfo
- Publication number
- JP2017044778A JP2017044778A JP2015165610A JP2015165610A JP2017044778A JP 2017044778 A JP2017044778 A JP 2017044778A JP 2015165610 A JP2015165610 A JP 2015165610A JP 2015165610 A JP2015165610 A JP 2015165610A JP 2017044778 A JP2017044778 A JP 2017044778A
- Authority
- JP
- Japan
- Prior art keywords
- authentication
- authenticated
- lip
- person
- opening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
Abstract
【課題】カメラとマイクを用いた簡便な構成で、セキュリティレベルの向上した堅牢な認証システムを実現する装置を提供する。【解決手段】声紋認証により個人を特定する認証装置1は、被認証者がキーワードを発声した際の声紋情報を取得する声紋情報取得部11と、被認証者がキーワードを発声することで生じる口唇の開度の時間変化を算出する口開度算出部12と、被認証者を認証する被認証者認証部13を備えてなる。被認証者認証部13は、声紋情報が被認証者の登録された声紋と一致し、且つ、口開度算出部12より算出された口唇の実際の開度の時間変化が声紋情報から想定される口唇の開度の時間変化と一致すると判定した場合に、被認証者を認証する。【選択図】図1
Description
本発明は、セキュリティ等の目的で個人を特定、認証する認証装置に関する。
セキュリティ技術において、セキュリティレベルを向上させるための方法として、複数の認証方式を組み合わせることが試みられている。
特に、顔認証や声紋認証など、複数の個人情報(生体情報)を組み合わせて認証に用いるものとして、下記の例が挙げられる。
特許文献1に記載の個人認証装置は、複数の生体認証部による認証結果が食い違う場合に、照合スコアベクトル空間における矛盾照合スコアを検出することで、矛盾照合スコアに基づいて「正当」か「不当」かを判断するもので、単に論理和を用いることに起因して本人排除率が上昇することなく、認証精度の向上を図るものである。
特許文献2に記載の個人認証装置は、音声と口唇の動きを比較し、双方の母音データを比較することで一次認証を行い、その後顔認証による二次認証を行うものである。
特許文献3に記載の個人情報認証システムは、顔検出を行い、ランダムに指定されるキーワードの発語をユーザに促し、キーワード発語時の顔の動画像に基づいてユーザを特定し、認証するものである。
顔認証システムは、単独では写真・動画などに表示された顔による誤認証の問題があり、セキュリティの担保が困難という課題がある。
また、顔認証に限らず、近年の認証システム全般にいえることであるが、単一の要素による認証は容易に看破されることが危惧されているため、少なくとも2要素以上を認証キーとする多要素認証が求められている。
その追加要素として声紋認証技術を導入することも考えられるが、顔認証と声紋認証が夫々独立した2段階認証システムでは、顔写真と録音音声により容易になりすましされ、看破される危惧がある。
つまり、多要素認証システムにおいて要素の追加は必ずしもセキュリティレベルの向上に寄与するとは限らず、夫々の要素のシナジーを利かせつつ、セキュリティレベルの向上を担保する必要がある。
そこで、本発明は、上記の状況を鑑み、カメラ撮影とマイク録音を用いて、セキュリティレベルが向上した認証装置を提供することをその目的とする。
上記目的を達成するための本発明に係る認証装置は、
声紋認証により個人を特定する認証装置であって、
キーワード、前記キーワードに対応する被認証者の声紋、及び、前記キーワードの発声の際に想定される口唇の開度の時間変化が登録されている記憶部と、
前記被認証者が前記キーワードを発声した際の声紋情報を取得する声紋情報取得部と、
前記被認証者が前記キーワードを発声することで生じる口唇の開度の時間変化を算出する口開度算出部と、
前記声紋情報が前記被認証者の登録された声紋と一致し、且つ、前記口開度算出部より算出された口唇の実際の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定した場合に、前記被認証者を認証する被認証者認証部と、を備えたことを第1の特徴とする。
声紋認証により個人を特定する認証装置であって、
キーワード、前記キーワードに対応する被認証者の声紋、及び、前記キーワードの発声の際に想定される口唇の開度の時間変化が登録されている記憶部と、
前記被認証者が前記キーワードを発声した際の声紋情報を取得する声紋情報取得部と、
前記被認証者が前記キーワードを発声することで生じる口唇の開度の時間変化を算出する口開度算出部と、
前記声紋情報が前記被認証者の登録された声紋と一致し、且つ、前記口開度算出部より算出された口唇の実際の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定した場合に、前記被認証者を認証する被認証者認証部と、を備えたことを第1の特徴とする。
上記第1の特徴の本発明に係る認証装置に依れば、被認証者にキーワードの発声を促し、声紋認証により個人を特定する構成であり、発声時の口唇の動きを実際の発声と照合することで、キーワードを発声したときに、発声と同じタイミング、キーワードの音節に対応する口唇の開度の時間変化パターンで、現実に口を動かしているかを判断する。これにより、セキュリティレベルの向上を実現できる。即ち、録音した音声により声紋認証を看破したとしても、録音と口唇の動きが一致していないと本人であると認証しないため、セキュリティ向上を望める。
なお、ここで、口唇の開度の時間変化が「一致」するとは、数学的な意味で、厳密に等しいことを意味するものではなく、認証精度或いは被認証者の体調等を考慮して、多少の相違は許容されてよい。被認証者認証部は、口唇の開度の時間変化が完全に一致しないものであっても、その違いが所定の範囲内に収まる場合、一致すると判定してよい。好適には、後述の通り、2つの口唇の開度の時間変化の間の一致度を算出し、一致度が閾値を超える場合に一致すると判定することができる。
上記第1の特徴の本発明に係る認証装置は、好ましくは、更に、
前記被認証者認証部は、
前記声紋情報を分析し、前記被認証者が前記キーワードの各音節を発声した発声期間の始期及び終期を、音節ごとに算出し、
前記発声期間ごとに、当該発声期間における口唇の実際の開度の時間変化と、当該発声期間で発声した音節により想定される口唇の開度の時間変化とを比較し、
全ての前記発声期間において、両者の時間変化が一致すると判定した場合に、前記被認証者を認証することを第2の特徴とする。
前記被認証者認証部は、
前記声紋情報を分析し、前記被認証者が前記キーワードの各音節を発声した発声期間の始期及び終期を、音節ごとに算出し、
前記発声期間ごとに、当該発声期間における口唇の実際の開度の時間変化と、当該発声期間で発声した音節により想定される口唇の開度の時間変化とを比較し、
全ての前記発声期間において、両者の時間変化が一致すると判定した場合に、前記被認証者を認証することを第2の特徴とする。
上記第2の特徴の本発明に係る認証装置に依れば、声紋情報に基づいて被認証者がキーワードの各音節を発声した発声期間を求め、当該各発声期間において、実際の口唇の開度の時間変化が対応する音節を発声したときに生じる時間変化と一致しているかを判定する。少なくとも1つの発声期間で時間変化が一致しない場合、被認証者を認証しない。
各発声期間において、口唇は、その始期では子音を発声するための動きをし、その後、母音を発声するために略一定の開度になり、その終期では、次の発声期間での子音の発声に備えた動きとなるはずである。例えば、録音された音声を利用したこと等により、音節の発声と、口唇の動きが同期していない場合には、少なくとも何れかの発声期間において、発声期間の始期(終期)において子音の発声のための口唇の動きをしていないことになるため、不正行為であることを容易に看破できる。また、複数の母音を発声時の口唇の開度の強弱パターンを比較することで、不正行為を容易に看破できる。
上記第2の特徴の本発明に係る認証装置は、好ましくは、更に、
前記記憶部は、前記被認証者が前記キーワードの各音節を発声する際に想定される口唇の開度の時間変化を、前記被認証者毎に記憶しており、
前記被認証者認証部は、
前記声紋情報が前記被認証者の登録された声紋と一致した場合、
前記発声期間ごとに、前記声紋情報により特定された前記被認証者が当該発声期間の対応する音節を発声する際に想定される口唇の開度の時間変化を、前記記憶部を参照して取得し、
前記取得された時間変化を、当該発声期間における口唇の実際の開度の時間変化と比較し、全ての前記発声期間において両者の時間変化が一致すると判定した場合、前記被認証者を認証することを第3の特徴とする。
前記記憶部は、前記被認証者が前記キーワードの各音節を発声する際に想定される口唇の開度の時間変化を、前記被認証者毎に記憶しており、
前記被認証者認証部は、
前記声紋情報が前記被認証者の登録された声紋と一致した場合、
前記発声期間ごとに、前記声紋情報により特定された前記被認証者が当該発声期間の対応する音節を発声する際に想定される口唇の開度の時間変化を、前記記憶部を参照して取得し、
前記取得された時間変化を、当該発声期間における口唇の実際の開度の時間変化と比較し、全ての前記発声期間において両者の時間変化が一致すると判定した場合、前記被認証者を認証することを第3の特徴とする。
上述の通り、口唇の開度の時間変化は、発声する音節(母音、又は母音と子音の組み合わせ)に応じたパターンとなるが、母音と子音の発声については被認証者毎ごとに個人差(癖、方言)が存在し、口唇の開度の時間変化パターンについても同様に個人差が生じる。上記第3の特徴の本発明に係る認証装置では、被認証者ごとに口唇の開度の時間変化を予め保持しておき、実際の口唇の開度の時間変化を声紋認証により特定された被認証者の口唇の開度の時間変化パターンと比較することで、認証精度の向上を望める。
上記第1乃至第3の何れかの特徴の本発明に係る認証装置は、好ましくは、更に、
被認証者の顔部の画像から口唇部位を検出し、特定する口唇部位特定部を備え、
前記口開度算出部は、前記口唇部位特定部が検出した口唇部位の開度の時間変化を算出することを第4の特徴とする。
被認証者の顔部の画像から口唇部位を検出し、特定する口唇部位特定部を備え、
前記口開度算出部は、前記口唇部位特定部が検出した口唇部位の開度の時間変化を算出することを第4の特徴とする。
上記第4の特徴の本発明に係る認証装置に依れば、口唇部位特定部が口唇部位を検出し、特定することにより、口開度算出部が口唇の開度の時間変化を算出するにあたっては当該口唇部位が含まれる範囲の画像を解析し、時間変化を追いかければよく、顔全体の画像の時間変化を取得する必要はないので、認証の処理速度を高めることができる。
上記第4の特徴の本発明に係る認証装置は、好ましくは、更に、
顔認証による被認証者特定を行う顔認証部を備え、前記口唇部位特定部は、前記認証された顔から口唇部位を特定する構成とすることができる。
顔認証による被認証者特定を行う顔認証部を備え、前記口唇部位特定部は、前記認証された顔から口唇部位を特定する構成とすることができる。
上記第4の特徴の本発明に係る認証装置は、好ましくは、更に、
前記口唇部位特定部は、前記被認証者の顔部が撮像され、撮像位置から顔の各部までの距離の分布を示すものとして顔の凹凸形状が反映された2次元データを取得し、
前記2次元データから、口唇部分を特定する構成とすることができる。
前記口唇部位特定部は、前記被認証者の顔部が撮像され、撮像位置から顔の各部までの距離の分布を示すものとして顔の凹凸形状が反映された2次元データを取得し、
前記2次元データから、口唇部分を特定する構成とすることができる。
上記第1乃至第4の何れかの特徴の本発明に係る認証装置は、好ましくは、更に、
前記被認証者認証部は、
前記口開度算出部より算出された口唇の開度の時間変化と、前記声紋情報から想定される口唇の開度の時間変化との間の一致度を算出し、前記一致度が設定された閾値を超える場合に、前記口開度算出部より算出された口唇の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定する構成とすることができる。
前記被認証者認証部は、
前記口開度算出部より算出された口唇の開度の時間変化と、前記声紋情報から想定される口唇の開度の時間変化との間の一致度を算出し、前記一致度が設定された閾値を超える場合に、前記口開度算出部より算出された口唇の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定する構成とすることができる。
上記第1乃至第4の何れかの特徴の本発明に係る認証装置は、好ましくは、更に、前記キーワードが、母音「あ」を含む音節と、「あ」と異なる母音を含む音節を含んでなることを第5の特徴とする。
上記第5の特徴の本発明に係る認証装置に依れば、キーワード中の個々の母音の発声時の口唇の開度パターンを声紋情報から想定されるパターンと比較することで、精度よく認証が可能となる。
母音「あ」は、口を最も大きく開けて発声する音である。したがって、「あ」と、「あ」以外の母音を含むキーワードを発声させ、口唇の開度の母音による変化(強弱)がキーワード発声時のパターンと一致しているか検出することで、口開度算出部より算出された口唇の実際の開度の時間変化と声紋情報から想定される時間変化との照合が容易となる。
上記第1乃至第5の何れかの特徴の本発明に係る認証装置は、好ましくは、更に、前記キーワードが、少なくとも1つの両唇音を音節として有することを第6の特徴とする。
両唇音とは、日本語では「ま」行音[m]、「わ」行音[w]、「ふ」音[hu]、「ば」行音[b]、又は「ぱ」行音[p]等が相当し、発声に際して口を一度閉じるか、少なくとも口を小さくすぼめて発声する必要のある音である。即ち、このような両唇音の発声時には、口唇の開度はその発声前後と比較して急激に小さく(好ましくは、ゼロに)なる。
したがって、キーワード中に含まれる両唇音の発声時の口唇の開度変化を検出することで、被認証者の認証が容易になる。
上記第6の特徴の本発明に係る認証装置は、好ましくは、更に、
前記被認証者認証部は、
前記声紋情報から、前記被認証者が前記キーワード中の前記両唇音を発声した発声期間の始期を算出し、
前記両唇音の前記発声期間の始期において、前記口開度算出部より算出された口唇の実際の開度が極小値をとっていない場合、前記被認証者を認証しないことを第7の特徴とする。
前記被認証者認証部は、
前記声紋情報から、前記被認証者が前記キーワード中の前記両唇音を発声した発声期間の始期を算出し、
前記両唇音の前記発声期間の始期において、前記口開度算出部より算出された口唇の実際の開度が極小値をとっていない場合、前記被認証者を認証しないことを第7の特徴とする。
上記第7の特徴の本発明に係る認証装置では、より具体的に、被認証者が両唇音を発声した発声期間の始期を導出し、当該始期において、口唇の開度が極小に至っていないかを検出する。開度が極小値をとっていなければ、口唇の動きと発声が一致しないため、不正な認証行為であることを容易に看破できる。
以上の通り、上記本発明に係る認証装置は、カメラとマイクを用意するだけで容易に認証が可能となり、認証システムを構築可能となる。認証システムに導入する機器数が少なく、更に、不正な方法で取得された被認証者の顔写真や録音音声による成りすましを防ぐことができ、堅牢な認証システムを構築できる。
〈第1実施形態〉
以下に、本発明の一実施形態に係る認証装置1につき、図面を参照して説明する。図1は、認証装置1の構成の一例を示すブロック図である。図1に示すように、認証装置1は、記憶部10(データベース)、声紋情報取得部11、口開度算出部12、被認証者認証部13、及び、口唇部位特定部14と、を備える。認証装置1に、被認証者の顔画像を撮像するカメラ15、及び音声を取得するマイク16を備え、認証システムが構築されている。ここで、声紋情報取得部11、口開度算出部12、被認証者認証部13、及び、口唇部位特定部14の各処理は、コンピュータのハードウェア資源(CPUや各種記憶装置等)及びソフトウェア資源(OS、各種ドライバ等)を使用して演算処理が行われ、かかる演算処理が、CPUによりその実行が制御されるプログラムを実行することによりソフトウェア的に実現される。記憶部10は、当該コンピュータ内に設けられた、或いはネットワークを介してアクセスが可能な所定の記憶装置の所定の記憶領域に構築されている。
以下に、本発明の一実施形態に係る認証装置1につき、図面を参照して説明する。図1は、認証装置1の構成の一例を示すブロック図である。図1に示すように、認証装置1は、記憶部10(データベース)、声紋情報取得部11、口開度算出部12、被認証者認証部13、及び、口唇部位特定部14と、を備える。認証装置1に、被認証者の顔画像を撮像するカメラ15、及び音声を取得するマイク16を備え、認証システムが構築されている。ここで、声紋情報取得部11、口開度算出部12、被認証者認証部13、及び、口唇部位特定部14の各処理は、コンピュータのハードウェア資源(CPUや各種記憶装置等)及びソフトウェア資源(OS、各種ドライバ等)を使用して演算処理が行われ、かかる演算処理が、CPUによりその実行が制御されるプログラムを実行することによりソフトウェア的に実現される。記憶部10は、当該コンピュータ内に設けられた、或いはネットワークを介してアクセスが可能な所定の記憶装置の所定の記憶領域に構築されている。
認証装置1は、声紋認証により個人を特定する構成であり、マイク16を介して被認証者の音声を取得する。被認証者がキーワードを発声すると、発声時の音声をマイク16が集音し、認証装置1に送信される。また、認証装置1は、カメラ15を介して被認証者の顔画像を取得する。認証装置1は、マイク16から取得した音声について声紋分析を行い、声紋情報取得部11が、被認証者がキーワードを発声した際の声紋情報を取得する。なお、具体的な声紋認証の方法については、公知の構成を利用可能であり、詳細な説明は割愛する。
記憶部10は、キーワード、及びキーワードに対応する被認証者の声紋が登録されている。キーワードは、被認証者毎に登録されているのが好ましい。好ましくは、キーワードは、一般のセキュリティシステムにおけるパスワードに相当するものであり、被認証者が各自、適切なものを設定できる。認証精度の向上の点からは、後述するように、キーワードは特定の音節を含んだものとすることが好ましい。
記憶部10にはまた、被認証者がキーワードの各音節を発声する際に想定される標準的な口唇の開度の時間変化パターンが、音節ごとに登録されているとする。
口開度算出部12は、カメラ15を介して取得した顔画像を元に、被認証者がキーワードを発声することで生じる口唇の開度の時間変化を算出する。図2に、顔画像の例を模式的に示す。ここで、口唇の開度とは、口をどの程度開いて発声したかを示すものであるが、開度の算出方法としては、口を開いた部分の面積Sを算出する方法のほか、開いた口の横方向(水平方向)の幅L1、上下方向の幅L2、或いはL2に対するL1の比L1/L2を求める方法など、様々な算出基準が考えられる。
口唇部位特定部14が、被認証者の顔画像から口唇部位を検出し特定すると、口開度算出部12は、一定間隔ごとに、当該特定された口唇部位の開度を、画像解析により算出し、口唇の開度の時間変化を求める。
被認証者認証部13は、声紋情報が被認証者の登録された声紋と一致し、且つ、口開度算出部12より算出された口唇の実際の開度の時間変化が声紋情報から想定される口唇の開度の時間変化と一致すると判定した場合に、被認証者を認証する。
図3(a)〜(d)に、記憶部10に登録されている、口唇の開度(口開度:面積S)の時間変化パターンS(t)の例を、特定の音節を発声する場合に示す。図3から分かるように、口唇の開度は、発声する音節に応じて、先ず(子音を含む場合)発声の開始期T0において子音の発声のための開度S0となり、その後、所定期間Tc(=T1−T0)経過後は母音の発声に応じた一定の開度S1を維持する。特に、図3(d)に示すように、「ま」を発声する場合、両唇を閉じて発声するため、子音[m]発声時の開度S0は一旦ゼロにまで急激に減少することが想定される。
例えば、図3(a)〜(d)を順に連接させると、「ただいま」と発声するときの口唇の開度の時間変化パターンが得られる。この場合、母音の変化だけを取り出すと、「ああいあ」となるが、「あ」は一般に口を大きく開けて発生するので、口唇の開度(面積S)は大きい。一方、「い」は、「あ」に比べれば口唇の開度(面積S)は小さい。さらに、母音「い」は、口を横に広げて発声するため、横(水平)方向の口唇の開度L1が、縦(上下)方向の口唇の開度L2より大きいことが想定される。
つまり、「ただいま」と発声する場合、母音発声時の口唇の開度変化に着目すると、大きな開度Sが2度続いた後、口開面積としての開度は小さいが横方向に広がった(L1/L2の大きな)開度となり、その後、大きな開度Sがもう一度繰り返される。被認証者認証部13は、声紋認証を行うとともに、このような口唇の開度変化パターンを、口開度算出部12より算出された口唇の開度が示すかどうかを検証し、実際の口唇の動きがキーワードの発声に対応した動きになっているかを判定する。対応した動きになっている場合に限り、被認証者を認証することで、不正な成りすましを防ぐことができる。
具体的に、被認証者認証部13は、声紋情報を分析し、被認証者がキーワードの各音節を発声した発声期間の始期及び終期を、音節ごとに算出する。そして、
(1)実際の口唇の開度の変化タイミングが、各音節の変化タイミング(子音の発声タイミング)と一致しているか、
(2)実際の口唇の開度の変化が、キーワードから推定される隣接する音節間の母音発声時の口唇の開度の強弱と一致しているか、を判定することができる。
(1)実際の口唇の開度の変化タイミングが、各音節の変化タイミング(子音の発声タイミング)と一致しているか、
(2)実際の口唇の開度の変化が、キーワードから推定される隣接する音節間の母音発声時の口唇の開度の強弱と一致しているか、を判定することができる。
被認証者認証部13は、図3の音節ごとの口唇の時間変化パターンS(t)を組み合わせ、キーワードを発声した場合に想定される口唇の開度の時間変化F(t)を求める。ただし、このとき、(例えば、母音発声による口唇の開度が一定の期間を調整することにより)各パターンS(t)の期間を対応する発声期間の長さと同じに設定し、F(t)内の各パターンS(t)の始期及び終期が対応する発声期間の始期及び終期と一致するようにする。さらに、母音の発声後、異なる母音又は子音の発声のために口唇が変化するまでに一定の期間を要するとし、例えば図4(a)に示すF(t)を生成する。
その後、被認証者認証部13は、F(t)と、口開度算出部12により算出された実際の口唇の開度変化G(t)との一致度合いを求める。本実施形態では、例えば、F(t)とG(t)を関数ベクトルとし、ベクトルのなす角を求めることにより、数1に示す一致度Cを導出することができる。なお、一致度Cは、口唇の開口面積S、横方向の幅L1、及び、縦方向の幅L2を開度とする場合のように、開度に相当するものを複数考慮する場合、夫々の開度について算出されることができる。
[数1]
C=cosθ= ∫F(t)G(t)dt/|F(t)||G(t)|
|F(t)|=(∫F(t)F(t)dt)1/2
|G(t)|=(∫G(t)G(t)dt)1/2
C=cosθ= ∫F(t)G(t)dt/|F(t)||G(t)|
|F(t)|=(∫F(t)F(t)dt)1/2
|G(t)|=(∫G(t)G(t)dt)1/2
図4に、キーワードの発声から予測される口唇の開度の時間変化F(t)と口開度算出部12より算出される実際の口唇の開度の時間変化G(t)の関係を示す。図4(b)は正常な認証の場合であり、図4(c)、(d)の場合は認証されない。正常な認証では、図4(b)に示すように、G(t)はF(t)と略比例関係にあるので、一致度Cは1に近い値となる。しかしながら、図4(c)に示すように、一部の発声期間(ここでは、音節「だ」に対応する期間)で母音の発声が異なる場合や、図4(d)に示すように、何れかの発声期間(ここでは、音節「た」に対応する期間)において口唇の開度の変化タイミングがずれている場合には、一致度Cは1から大きく外れた値となるので、不正な認証であることを推測できる。
したがって、夫々の発声期間において、口唇の実際の開度の時間変化が記憶部10に保持されたパターンS(t)と一致する(略比例関係にある)場合に限り、上記の一致度Cは1に近い値となる。被認証者認証部13は、一致度Cが設定された閾値を超える場合に、F(t)とG(t)が一致すると判定し、認証を許可する構成とすることができる。
なお、一致度Cは、前述の通り、口唇の開口面積S、横方向の幅L1、縦方向の幅L2を開度とする場合のように、複数の開度を考慮する場合には、夫々について一致度を算出し、全ての一致度が設定された閾値を超える場合に限り、認証を許可してもよい。
F(t)とG(t)の一致判定を精度良く行うためには、声紋認証のキーワードとして、異なる複数の母音が含まれていることが好ましい。発生時において口唇の開度が異なる複数の母音が含まれていることで、母音間で開度の強弱が発生するため、一致判定を精度良く行うことができる。特に、口を大きく開けて発音することから、口唇の開度も大きくなる母音「あ」と、「あ」と異なる母音が含まれていることが好適である。
また、キーワードには、両唇音が含まれていることが好ましい。両唇音とは、発声に際して口を一端閉じるか、少なくとも口を小さくすぼめて発生する音であり、日本語では「ま」行音[m]、「わ」行音[w]、「ふ」音[hu]、「ば」行音[b]、又は「ぱ」行音[p]等が相当する。このなかでも、「ま」行音[m]、「ば」行音[b]、又は「ぱ」行音[p]が好ましい。これらの両唇音がキーワードに含まれている場合、両唇音の発声時において、口唇の開度は急激に減少し、ゼロに近づく。したがって、両唇音発声時の口唇の開度変化により、一致判定を精度よく行うことができる。上記の条件を満たすキーワードとして、上述の「ただいま」がある。
また、被認証者が両唇音を発声した始期において、口唇の開度は急激に減少し、極小値(好ましくは、ゼロ)をとることから、被認証者認証部13は、声紋情報から両唇音を発声した発声期間の始期を算出し、当該始期において口唇の開度が極小に至っていないかを判定することができる。開度が極小値をとっていなければ、口唇の動きと発声が一致しないことは明らかである。両唇音の発声期間の始期と口唇の開度が極小となる時期が一致していない場合には、上述の一致度に基づく判定を行うことなく(或いは、一致度を算出することなく)、不正な認証行為として認証を拒否してよい。
以上、本発明に係る認証装置1では、カメラとマイクを用意するだけで容易に多要素認証システムを構築できる。この認証システムは、不正な方法で取得された被認証者の顔写真や録音音声による成りすましを防ぐことができ、堅牢な認証システムとなる。
もっとも、被認証者本人がキーワードを発声する際の口唇の動きを音声とともに録音録画した動画像を使用されると、不正な認証を防ぐことはできないが、そのような動画像を、第三者が、本人の許可なく撮影、取得することは困難であろう。
したがって、本発明に係る認証装置1を用いることにより、簡便な構成で堅牢な認証システムを実現できる。
〈第2実施形態〉
以下に、本発明の一実施形態に係る認証装置2につき、図面を参照して説明する。図5は、認証装置2の構成の一例を示すブロック図である。図5に示すように、認証装置2は、認証装置1の構成に加えて、顔認証による被認証者特定を行う顔認証部17を備えてなる。認証装置2に、カメラ15及びマイク16を備え、認証システムが構築されている。
以下に、本発明の一実施形態に係る認証装置2につき、図面を参照して説明する。図5は、認証装置2の構成の一例を示すブロック図である。図5に示すように、認証装置2は、認証装置1の構成に加えて、顔認証による被認証者特定を行う顔認証部17を備えてなる。認証装置2に、カメラ15及びマイク16を備え、認証システムが構築されている。
記憶部10、声紋情報取得部11、口開度算出部12、被認証者認証部13については、認証装置1と同様の構成であり、説明を割愛する。また、顔認証部17による顔認証の方法としては、公知の構成を利用することができる。
顔認証部17が、カメラ15により撮像された画像を解析し、顔認証に成功すると、口唇部位特定部14は、顔認証部17により認証された顔の画像を利用し、顔画像から口唇の位置を特定する。その後、口開度算出部12は、一定間隔ごとに、当該特定された口唇部位を画像解析し、口唇の開度の時間変化を求める。
この場合、顔認証部17は、顔の各部位の位置関係を把握するために広範な領域(図2の領域A1)を画像解析する必要があるが、認証成功後、口開度算出部12が口唇の開度を求めるにあたっては、認証された顔の口唇部分に係る領域(図2の領域A2)の画像を解析するだけで良いので、処理速度を大幅に低減できる。
認証装置2は、上述した認証装置1の効果を奏するほか、声紋認証に加えて顔認証を行うためセキュリティが強化される。更に、キーワード発生中に複数回顔認証を行うように構成することで、声紋認証中の顔の各部位の位置が変化していないこと(不自然な位置変化がないこと)を確認できる。これにより、実際に本人が口唇を動かして発声していることを保証でき、より堅牢な認証システムを実現できる。
〈第3実施形態〉
以下に、本発明の一実施形態に係る認証装置3につき、図面を参照して説明する。図6は、認証装置3の構成の一例を示すブロック図である。認証装置3は、口唇部位特定部14による口唇部位の特定方法として認証装置2と異なる方法を用いる。認証装置3に、所定の間隔を空けて配置された2台のカメラ15a、15b、及びマイク16を備え、認証システムが構築されている。
以下に、本発明の一実施形態に係る認証装置3につき、図面を参照して説明する。図6は、認証装置3の構成の一例を示すブロック図である。認証装置3は、口唇部位特定部14による口唇部位の特定方法として認証装置2と異なる方法を用いる。認証装置3に、所定の間隔を空けて配置された2台のカメラ15a、15b、及びマイク16を備え、認証システムが構築されている。
記憶部10、声紋情報取得部11、口開度算出部12、被認証者認証部13については、認証装置1と同様の構成であり、説明を割愛する。
本実施形態では、2台のカメラ15a、15bによって、2つの異なる位置から見た被認証者の顔部画像が撮像される。これら2台のカメラで得られた画像間の差分を評価することにより、認証装置3は、顔部の立体形状(凹凸形状)を反映するものとして、撮像位置から顔の各部までの距離の分布を示す2次元データ(画像)を得る。
口唇部位特定部14は、当該2次元データを取得すると、当該2次元データから、口元の独特な凹凸形状(上唇と下唇の2山構造)を検知し、口唇部位を特定する。その後、口開度算出部12は、一定間隔ごとに、当該特定された口唇部位を画像解析し、口唇の開度の時間変化を求める。
これにより、認証装置3は、上述した認証装置1の効果を奏するほか、実際に本人が口唇を動かして発声していることを保証でき、より堅牢な認証システムを実現できる。また、認証装置2と同様、口開度算出部12が口唇の開度を求めるにあたっては、顔全体の立体形状を解析する必要はなく、口唇部位特定部14によって特定された口唇部位の立体形状の画像を解析するだけで良いので、処理速度を大幅に低減できる。
以上、認証装置1〜3を用いることで、カメラとマイクを用意するだけで容易に認証システムを構築可能でありながら、不正な方法で取得された被認証者の顔写真や録音音声による成りすましを防ぐことができ、堅牢な認証システムを実現できる。
図7に、認証装置1〜3(ここでは、認証装置1)を備えた認証システムの認証時の動作の一例を示すフローチャートを示す。
先ず、声紋認証が行われる(ステップS31)。認証装置1は、マイク16を介して被認証者の音声を取得し、声紋分析を行い、キーワードを発声した被認証者を特定する。声紋認証に失敗した場合(ステップS32でNO分枝)、認証は拒否される。
声紋認証に成功すると(ステップS32でYES分枝)、声紋情報取得部11が、被認証者がキーワードを発声した際の声紋情報を取得する(ステップS33)。
続いて、口唇部位特定部14は、カメラ15を介して取得した被認証者の顔画像から口唇部位を検出し特定する(ステップS34)。口開度算出部12は、一定間隔ごとに、当該特定された口唇部位の開度を画像解析により算出し、口唇の開度の時間変化G(t)を求める(ステップS35)。なお、ステップS34及びS35は、ステップS33と並列に処理されることができる。
被認証者認証部13は、口開度算出部12より算出された口唇の実際の開度の時間変化G(t)と、キーワードの発声から想定される口唇の開度の時間変化F(t)との間の一致度を算出する(ステップS36)。想定される口唇の開度変化F(t)を求める方法、及び一致度の算出方法については、前述のとおりである。
被認証者認証部13は、上記一致度が設定された閾値と同じか、少なくとも閾値を超える場合(ステップS37でYES分岐)に、被認証者を認証する。一致度が閾値未満の場合、被認証者を認証しない(ステップS37でNO分岐)。
なお、ステップS34における唇部位特定部14による顔画像内の口唇部位を検出、特定方法については、認証装置2のように顔認証の結果を利用する方法や、認証装置3のように顔部の3次元立体形状を解析することにより口唇部位を特定する方法が挙げられる。
〈別実施形態〉
以下に、別実施形態について説明する。
以下に、別実施形態について説明する。
〈1〉上記第1実施形態において、音節ごとの口唇の開度の時間変化パターンS(t)は模式的に示したものであり、図3及び図4で示したモデルに限られるものではない。口唇の時間変化パターンS(t)を組み合わせて想定される口開度変化F(t)を導出するにあたっては、様々な方法が考えられる。
〈2〉上記第1〜第3実施形態では、音節ごとの口唇の開度の時間変化パターンS(t)について、被認証者に依らず共通の時間変化のパターンを用いるとしている。しかしながら、口唇の開度の時間変化パターンS(t)を被認証者別に用意することも可能である。特に、認証装置1〜3は声紋認証を行うことから、声紋認証により被認証者を特定できるので、当該特定された被認証者の口唇の開度の時間変化パターンを用いて被認証者認証部13による認証処理を行うことができる。
口唇の開度の時間変化は、発声に応じたパターンとなるが、母音と子音の発声については被認証者ごとに個人差(癖、方言)が存在し、口唇の開度の時間変化パターンについても同様に(例えば、母音間の口唇の開度の違いや、子音発声時の開度において)個人差が生じ得る。声紋認証により特定された被認証者に応じて最適な口唇の開度の時間変化F(t)を算出し、実際の口唇の開度の時間変化G(t)と比較することで、認証精度の向上を望める。
この場合、認証装置1〜3は、最初に被認証者にキーワードを発声させ、声紋を登録するに際して、カメラ15及び口開度算出部を介してキーワードの各音節を発声時の口唇の開度の時間変化を取得し、記憶部10に保持しておけばよい。認証時には、被認証者認証部は、声紋認証が成功した場合に、声紋情報より特定された被認証者がキーワードの各音節を発声する際に想定される口唇の開度の時間変化F(t)を記憶部10を参照して取得し、実際の口唇の開度の時間変化G(t)と比較することができる。
〈3〉上記第3実施形態において、口唇部位特定部14が顔部の凹凸形状を取得する方法としては、上記のような2台のカメラを用いた偏差撮影の方法に限られるものではない。例えば、対象に向け赤外線を照射し、反射赤外光の到達時間差から対象までの距離情報分布を得るもの、所謂TOF(Time-of-Flight)方式の距離画像センサを利用してもよい。
〈4〉上記第1〜第3実施形態において、声紋認証を行う前に、例えば会員証、社員証等の磁気カードのような記憶媒体に記憶された個人情報を読み出すように構成してもよい。この場合、認証装置1〜3は、声紋認証を行う前から被認証者は特定されており、当該特定された被認証者が発声するはずのキーワードも声紋認証前から知ることができる。したがって、認証装置1〜3は、声紋認証にあたって、声紋情報が記憶媒体の所有者のものと一致するかを判定すればよく、認証処理速度の高速化を望める。本発明では、被認証者がキーワードに対応する口唇の動きをしているかが重要であり、被認証者が発声した個々の音節を特定し、キーワードと一字一句完全に一致する文言を発声しているかまで判定する必要はない。
本発明は、セキュリティ目的で個人を特定、認証する認証システムとしての利用が可能である。
1〜3: 本発明の一実施形態に係る認証装置
10: 記憶部(データベース)
11: 声紋情報取得部
12: 口開度算出部
13: 被認証者認証部
14: 口唇部位特定部
15、15a、15b: カメラ
16: マイク
17: 顔認証部
10: 記憶部(データベース)
11: 声紋情報取得部
12: 口開度算出部
13: 被認証者認証部
14: 口唇部位特定部
15、15a、15b: カメラ
16: マイク
17: 顔認証部
Claims (10)
- 声紋認証により個人を特定する認証装置であって、
キーワード、前記キーワードに対応する被認証者の声紋、及び、前記キーワードの発声の際に想定される口唇の開度の時間変化が登録されている記憶部と、
前記被認証者が前記キーワードを発声した際の声紋情報を取得する声紋情報取得部と、
前記被認証者が前記キーワードを発声することで生じる口唇の開度の時間変化を算出する口開度算出部と、
前記声紋情報が前記被認証者の登録された声紋と一致し、且つ、前記口開度算出部より算出された口唇の実際の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定した場合に、前記被認証者を認証する被認証者認証部と、を備えたことを特徴とする認証装置。 - 前記被認証者認証部は、
前記声紋情報を分析し、前記被認証者が前記キーワードの各音節を発声した発声期間の始期及び終期を、音節ごとに算出し、
前記発声期間ごとに、当該発声期間における口唇の実際の開度の時間変化と、当該発声期間で発声した音節により想定される口唇の開度の時間変化とを比較し、
全ての前記発声期間において、両者の時間変化が一致すると判定した場合に、前記被認証者を認証することを特徴とする請求項1に記載の認証装置。 - 前記記憶部は、前記被認証者が前記キーワードの各音節を発声する際に想定される口唇の開度の時間変化を、前記被認証者毎に記憶しており、
前記被認証者認証部は、
前記声紋情報が前記被認証者の登録された声紋と一致した場合、
前記発声期間ごとに、前記声紋情報により特定された前記被認証者が当該発声期間の対応する音節を発声する際に想定される口唇の開度の時間変化を、前記記憶部を参照して取得し、
前記取得された時間変化を、当該発声期間における口唇の実際の開度の時間変化と比較し、全ての前記発声期間において両者の時間変化が一致すると判定した場合、前記被認証者を認証することを特徴とする請求項2に記載の認証装置。 - 被認証者の顔部の画像から口唇部位を検出し、特定する口唇部位特定部を備え、
前記口開度算出部は、前記口唇部位特定部が検出した口唇部位の開度の時間変化を算出することを特徴とする請求項1〜3の何れか1項に記載の認証装置。 - 顔認証による被認証者特定を行う顔認証部を備え、
前記口唇部位特定部は、前記認証された顔から口唇部位を特定することを特徴とする請求項4に記載の認証装置。 - 前記口唇部位特定部は、
前記被認証者の顔部が撮像され、撮像位置から顔の各部までの距離の分布を示すものとして顔の凹凸形状が反映された2次元データを取得し、
前記2次元データから、口唇部分を特定することを特徴とする請求項4に記載の認証装置。 - 前記被認証者認証部は、
前記口開度算出部より算出された口唇の開度の時間変化と、前記声紋情報から想定される口唇の開度の時間変化との間の一致度を算出し、前記一致度が設定された閾値を超える場合に、前記口開度算出部より算出された口唇の開度の時間変化が前記声紋情報から想定される口唇の開度の時間変化と一致すると判定することを特徴とする請求項1〜6の何れか1項に記載の認証装置。 - 前記キーワードが、母音「あ」を含む音節と、「あ」と異なる母音を含む音節を含んでなることを特徴とする請求項1〜7の何れか1項に記載の認証装置。
- 前記キーワードが、少なくとも1つの両唇音を音節として有することを特徴とする請求項1〜8の何れか1項に記載の認証装置。
- 前記被認証者認証部は、
前記声紋情報から、前記被認証者が前記キーワード中の前記両唇音を発声した発声期間の始期を算出し、
前記両唇音の前記発声期間の始期において、前記口開度算出部より算出された口唇の実際の開度が極小値をとっていない場合、前記被認証者を認証しないことを特徴とする請求項9に記載の認証装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015165610A JP2017044778A (ja) | 2015-08-25 | 2015-08-25 | 認証装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015165610A JP2017044778A (ja) | 2015-08-25 | 2015-08-25 | 認証装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017044778A true JP2017044778A (ja) | 2017-03-02 |
Family
ID=58209912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015165610A Pending JP2017044778A (ja) | 2015-08-25 | 2015-08-25 | 認証装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017044778A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271915A (zh) * | 2018-09-07 | 2019-01-25 | 北京市商汤科技开发有限公司 | 防伪检测方法和装置、电子设备、存储介质 |
EP3460698A1 (en) | 2017-09-25 | 2019-03-27 | Canon Kabushiki Kaisha | Information processing terminal, method, and system including information processing terminal |
WO2020213384A1 (ja) * | 2019-04-19 | 2020-10-22 | パナソニックIpマネジメント株式会社 | 宅配業者認証方法、宅配業者認証システム、サーバ装置および制御装置 |
JP2020535538A (ja) * | 2018-09-07 | 2020-12-03 | 北京市商▲湯▼科技▲開▼▲発▼有限公司Beijing Sensetime Technology Development Co., Ltd. | 偽装防止の検出方法および装置、電子機器、記憶媒体 |
JP2021117049A (ja) * | 2020-01-23 | 2021-08-10 | 国立大学法人電気通信大学 | 口腔認識装置 |
-
2015
- 2015-08-25 JP JP2015165610A patent/JP2017044778A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3460698A1 (en) | 2017-09-25 | 2019-03-27 | Canon Kabushiki Kaisha | Information processing terminal, method, and system including information processing terminal |
US11265315B2 (en) | 2017-09-25 | 2022-03-01 | Canon Kabushiki Kaisha | Information processing terminal, method, and system including information processing terminal |
CN109271915A (zh) * | 2018-09-07 | 2019-01-25 | 北京市商汤科技开发有限公司 | 防伪检测方法和装置、电子设备、存储介质 |
JP2020535538A (ja) * | 2018-09-07 | 2020-12-03 | 北京市商▲湯▼科技▲開▼▲発▼有限公司Beijing Sensetime Technology Development Co., Ltd. | 偽装防止の検出方法および装置、電子機器、記憶媒体 |
CN109271915B (zh) * | 2018-09-07 | 2021-10-08 | 北京市商汤科技开发有限公司 | 防伪检测方法和装置、电子设备、存储介质 |
WO2020213384A1 (ja) * | 2019-04-19 | 2020-10-22 | パナソニックIpマネジメント株式会社 | 宅配業者認証方法、宅配業者認証システム、サーバ装置および制御装置 |
JP2020177545A (ja) * | 2019-04-19 | 2020-10-29 | パナソニックIpマネジメント株式会社 | 宅配業者認証方法、宅配業者認証システム、サーバ装置および制御装置 |
JP7378042B2 (ja) | 2019-04-19 | 2023-11-13 | パナソニックIpマネジメント株式会社 | 宅配業者認証方法、宅配業者認証システム、およびサーバ装置 |
JP2021117049A (ja) * | 2020-01-23 | 2021-08-10 | 国立大学法人電気通信大学 | 口腔認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7109634B2 (ja) | アイデンティティ認証方法及び装置 | |
EP3540621B1 (en) | Identity authentication method and apparatus, terminal and server | |
ES2883326T3 (es) | Reconocimiento de hablante de extremo a extremo mediante el uso de una red neuronal profunda | |
KR102455633B1 (ko) | 라이브니스 검사 방법 및 장치 | |
JP6151582B2 (ja) | 顔認証システム | |
CN103475490B (zh) | 一种身份验证方法及装置 | |
US11756338B2 (en) | Authentication device, authentication method, and recording medium | |
JP2017044778A (ja) | 認証装置 | |
US11682236B2 (en) | Iris authentication device, iris authentication method and recording medium | |
JP2007156974A (ja) | 個人認証・識別システム | |
JP7428242B2 (ja) | 認証装置、認証システム、認証方法および認証プログラム | |
JP2012164093A (ja) | 顔画像認証装置 | |
JP2003233816A (ja) | アクセスコントロールシステム | |
JP2015169977A (ja) | 本人認証装置、本人認証方法、本人認証プログラム、および自動取引システム | |
JP2019159372A (ja) | 認証装置、認証システム、認証方法、コンピュータプログラム、及び記憶媒体 | |
WO2023238953A1 (ja) | 認証装置および認証方法 | |
JP2022040244A (ja) | 情報処理装置、方法およびプログラム | |
JP2009026230A (ja) | パターン認識システム及び認識方法 |