WO2023037429A1

WO2023037429A1 - 認証装置、認証方法、及び、記録媒体

Info

Publication number: WO2023037429A1
Application number: PCT/JP2021/032947
Authority: WO
Inventors: レイカク; 仁山本
Original assignee: 日本電気株式会社
Priority date: 2021-09-08
Filing date: 2021-09-08
Publication date: 2023-03-16
Also published as: JPWO2023037429A1

Abstract

認証装置１０００は、対象者の音声の空気伝導音を示す空気伝導音声信号と、対象者の音声の骨伝導音を示す骨伝導音声信号とから、空気伝導音声信号の特徴量である空気伝導特徴量と、骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、空気伝導特徴量及び骨伝導特徴量を結合することで、対象者の特徴量である対象特徴量を算出する算出手段１００１と、対象特徴量に基づいて対象者を認証する認証手段１００２とを備える。

Description

認証装置、認証方法、及び、記録媒体

　この開示は、例えば、対象者の音声を用いて対象者を認証可能な認証装置、認証方法及び記録媒体の技術分野に関する。

　対象者の音声を用いて対象者を認証可能な認証装置の一例が、特許文献１に記載されている。

　その他、この開示に関連する先行技術文献として、特許文献２から特許文献４があげられる。

特開２００６－０１１５９１号公報国際公開第２０１８／０３４１７８号パンフレット特開２００７－０１７８４０号公報特開２００６－０１０８０９号公報

　この開示は、先行技術文献に記載された技術の改良を目的とする認証装置、認証方法、及び、記録媒体を提供することを課題とする。

　認証装置の第１の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出する算出手段と、前記対象特徴量に基づいて前記対象者を認証する認証手段とを備える。

　認証装置の第２の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出する算出手段と、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証手段とを備える。

　認証方法の第１の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、前記対象特徴量に基づいて前記対象者を認証する。

　認証方法の第２の態様は、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する。

　記録媒体の第１の態様は、コンピュータに、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、前記対象特徴量に基づいて前記対象者を認証する認証方法を実行させるコンピュータプログラムが記録された記録媒体である。

　記録媒体の第２の態様は、コンピュータに、対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証方法を実行させるコンピュータプログラムが記録された記録媒体である。

図１は、第１実施形態における認証装置の構成を示すブロック図である。図２は、第２実施形態における認証システムの構成を示すブロック図である。図３は、第２実施形態における認証装置の構成を示すブロック図である。図４は、第２実施形態における認証装置が行う第１認証動作の流れを示すフローチャートである。図５は、第１認証動作を行う算出部の構成を示すブロック図である。図６は、第２実施形態における認証装置が行う第２認証動作の流れを示すフローチャートである。図７は、第２認証動作を行う算出部及び認証部の構成を示すブロック図である。図８は、第３実施形態における認証システムの構成を示すブロック図である。図９は、骨伝導マイクの位置の違いを考慮して対象者を認証する認証動作の流れを示すフローチャートである。

　以下、図面を参照しながら、認証装置、認証方法、及び、記録媒体の実施形態について説明する。

　（１）第１実施形態
　はじめに、認証装置、認証方法、及び、記録媒体の第１実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第１実施形態が適用された認証装置１０００を用いて、認証装置、認証方法、及び、記録媒体の第１実施形態について説明する。

　図１は、第１実施形態における認証装置１０００の構成を示すブロック図である。図１に示すように、認証装置１０００は、算出部１００１と、認証部１００２とを備えている。

　第１の例では、算出部１００１は、対象者の音声（つまり、対象者が発話した音声、以下同じ）の空気伝導音を示す空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する。更に、算出部１００１は、対象者の音声の骨伝導音を示す骨伝導音声信号から、骨伝導音声信号の特徴量である骨伝導特徴量を算出する。更に、算出部１００１は、空気伝導音声信号及び骨伝導特徴量を結合することで、対象者の特徴量である対象特徴量を算出する。認証部１００２は、算出部１００１が算出した対象特徴量に基づいて、対象者を認証する。

　このように、第１の例では、認証装置１０００は、対象者の音声そのものの特徴を示す空気伝導特徴量のみならず、対象者の骨格の影響が重畳された対象者の音声の特徴を示す骨伝導特徴量（つまり、対象者の骨格の特徴をも示す骨伝導特徴量）にも基づいて、対象者を認証する。このため、空気伝導特徴量及び骨伝導特徴量のいずれか一方に基づいて対象者を認証する認証装置と比較して、認証装置１０００は、対象者の音声を用いて、対象者をより精度よく認証することができる。特に、認証装置１０００は、空気伝導特徴量に基づいて対象者を認証する処理と、空気伝導特徴量とは異なる骨伝導特徴量に基づいて対象者を認証する処理とを別々に行わなくてもよくなる。つまり、認証装置１０００は、結合された空気伝導特徴量及び骨伝導特徴量から算出される対象特徴量に基づいて対象者を認証する処理を行えばよい。このため、認証装置１０００は、対象者を認証するための処理負荷を低減可能となる。

　一方で、第２の例では、算出部１００１は、対象者の音声の空気伝導音を示す空気伝導音声信号と、対象者の音声の骨伝導音を示す骨伝導音声信号とから、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出する。更に、算出部１００１は、空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する。認証部１００２は、空気伝導特徴量及び差分特徴量に基づいて、対象者を認証する。

　ここで、空気伝導特徴量が対象者の音声そのものの特徴を示すことは、上述したとおりである。更に、差分特徴量は、対象者の骨格の影響が重畳した対象者の音声の特徴から、対象者の音声そのものの特徴が実質的に排除された特徴量に相当する。つまり、差分特徴量は、対象者の個人性を示す対象者の骨格（つまり、対象者に固有の骨格）そのものの特徴を示す特徴量に相当する。このため、認証装置１０００は、対象者の音声そのものの特徴を示す空気伝導特徴量及び対象者の骨格そのものの特徴を示す差分特徴量に基づいて、対象者を認証する。その結果、空気伝導特徴量及び差分特徴量のいずれか一方に基づいて対象者を認証する認証装置と比較して、認証装置１０００は、対象者の音声を用いて、対象者をより精度よく認証することができる。

　（２）第２実施形態
　続いて、認証装置、認証方法、及び、記録媒体の第２実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第２実施形態が適用された認証システムＳＹＳを用いて、認証装置、認証方法、及び、記録媒体の第２実施形態について説明する。

　（２－１）認証システムＳＹＳの構成
　はじめに、図２を参照しながら、第２実施形態における認証システムＳＹＳの構成について説明する。図２は、第２実施形態における認証システムＳＹＳの構成を示すブロック図である。

　図２に示すように、認証システムＳＹＳは、空気伝導マイク１と、骨伝導マイク２と、認証装置３とを備えている。

　空気伝導マイク１は、対象者の音声の空気伝導音を検出可能な音声検出装置である。具体的には、対象者の音声に伴って発生する空気の振動を検出することで、対象者の音声の空気伝導音を検出する。空気伝導マイク１は、空気伝導音を検出することで、空気伝導音を示す音声信号を生成する。尚、以下の説明では、空気伝導音を示す音声信号を、“空気伝導音声信号”と称する。空気伝導マイク１は、生成した空気伝導音声信号を、認証装置３に出力する。

　骨伝導マイク２は、対象者の音声の骨伝導音を検出可能な音声検出装置である。具体的には、対象者の音声に伴って発生する対象者の骨（骨格）の振動を検出することで、対象者の音声の骨伝導音を検出する。骨伝導マイク２は、骨伝導音を検出することで、骨伝導音を示す音声信号を生成する。尚、以下の説明では、骨伝導音を示す音声信号を、“骨伝導音声信号”と称する。骨伝導マイク２は、生成した骨伝導音声信号を、認証装置３に出力する。

　認証装置３は、対象者の音声を用いて対象者を認証する認証動作を行う。つまり、認証装置３は、声認証を行う。認証動作を行うために、認証装置３は、空気伝導マイク１から空気伝導音声信号を取得する。更に、認証装置３は、骨伝導マイク２から骨伝導音声信号を取得する。その後、認証装置３は、空気伝導音声信号と骨伝導音声信号とを用いて、対象者を認証する。

　空気伝導マイク１と骨伝導マイク２と認証装置３とを備える装置が、認証システムＳＹＳとして用いられてもよい。例えば、空気伝導マイク１と骨伝導マイク２とを備え且つ認証装置３として機能可能な携帯端末（例えば、スマートフォン）が、認証システムＳＹＳとして用いられてもよい。例えば、空気伝導マイク１と骨伝導マイク２と認証装置３とを備えるウェアラブルデバイスが、認証システムＳＹＳとして用いられてもよい。

　声認証を行う認証システムＳＹＳが適用される場面の一例として、顔認証及び虹彩認証を精度よく行うことが容易ではない場面があげられる。顔認証及び虹彩認証を精度よく行うことが容易ではない場面の一例として、マスクを装着した対象者を認証する場面があげられる。例えば、建設現場及び工場の少なくとも一方においてマスクを装着した作業員の入場を管理するために、認証システムＳＹＳが用いられてもよい。例えば、医療施設においてマスクを装着した医療従事者の入退室を管理するために、認証システムＳＹＳが用いられてもよい。声認証を行う認証システムＳＹＳが適用される場面の他の一例として、指紋認証を精度よく行うことが容易ではない場面があげられる。指紋認証を精度よく行うことが容易ではない場面の一例として、手袋を装着した対象者を認証する場面があげられる。例えば、医療施設において手袋を装着した医療従事者の入退室を管理するために、認証システムＳＹＳが用いられてもよい。声認証を行う認証システムＳＹＳが適用される場面の他の一例として、電話サービスを介して対象者を認証する場面があげられる。但し、認証システムＳＹＳが適用される場面が、ここで説明した場面に限定されることはない。

　（２－２）認証装置３の構成
　続いて、図３を参照しながら、第２実施形態における認証装置３の構成について説明する。図３は、第２実施形態における認証装置３の構成を示すブロック図である。

　図３に示すように、認証装置３は、演算装置３１と、記憶装置３２とを備えている。更に、認証装置３は、通信装置３３と、入力装置３４と、出力装置３５とを備えていてもよい。但し、認証装置３は、通信装置３３、入力装置３４及び出力装置３５のうちの少なくとも一つを備えていなくてもよい。演算装置３１と、記憶装置３２と、通信装置３３と、入力装置３４と、出力装置３５とは、データバス３６を介して接続されていてもよい。

　演算装置３１は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｅｃｓｓｉｎｇ　Ｕｎｉｔ）及びＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）のうちの少なくとも一つを含む。演算装置３１は、コンピュータプログラムを読み込む。例えば、演算装置３１は、記憶装置３２が記憶しているコンピュータプログラムを読み込んでもよい。例えば、演算装置３１は、コンピュータで読み取り可能であって且つ一時的でない記録媒体が記憶しているコンピュータプログラムを、認証装置３が備える図示しない記録媒体読み取り装置（例えば、後述する入力装置３４）を用いて読み込んでもよい。演算装置３１は、通信装置３３（或いは、その他の通信装置）を介して、認証装置３の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい（つまり、ダウンロードしてもよい又は読み込んでもよい）。演算装置３１は、読み込んだコンピュータプログラムを実行する。その結果、演算装置３１内には、認証装置３が行うべき動作（例えば、上述した認証動作）を実行するための論理的な機能ブロックが実現される。つまり、演算装置３１は、認証装置３が行うべき動作（言い換えれば、処理）を実行するための論理的な機能ブロックを実現するためのコントローラとして機能可能である。

　図３には、認証動作を実行するために演算装置３１内に実現される論理的な機能ブロックの一例が示されている。図３に示すように、演算装置３１内には、「算出手段」の一具体例である算出部３１１と、「認証手段」の一具体例である認証部３１２とが実現される。

　算出部３１１は、空気伝導音声信号及び骨伝導音声信号から、認証動作に用いられる対象者の特徴量である対象特徴量を算出する。尚、算出部３１１が算出する対象特徴量については、後に詳述する。

　認証部３１２は、算出部３１１が算出した対象特徴量に基づいて、対象者を認証する。つまり、認証部３１２は、算出部３１１が算出した対象特徴量に基づいて、対象者が登録人物と一致するか否かを判定する。具体的には、登録人物の音声に関する特徴量である登録特徴量は、記憶装置３２が記憶している照合ＤＢ（ＤａｔａＢａｓｅ）３２１に予め登録されている。照合ＤＢ３２１には、このような登録特徴量が、登録人物の数だけ登録されている。認証部３１２は、算出部３１１が算出した対象特徴量と、照合ＤＢ３２１に登録された登録特徴量とを比較することで、対象者が登録人物に一致するか否かを判定する。

　記憶装置３２は、所望のデータを記憶可能である。例えば、記憶装置３２は、演算装置３１が実行するコンピュータプログラムを一時的に記憶していてもよい。記憶装置３２は、演算装置３１がコンピュータプログラムを実行している場合に演算装置３１が一時的に使用するデータを一時的に記憶してもよい。記憶装置３２は、認証装置３が長期的に保存するデータを記憶してもよい。尚、記憶装置３２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ハードディスク装置、光磁気ディスク装置、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。つまり、記憶装置３２は、一時的でない記録媒体を含んでいてもよい。

　通信装置３３は、不図示の通信ネットワークを介して、認証装置３の外部の装置と通信可能である。例えば、通信装置３３は、空気伝導マイク１及び骨伝導マイク２の少なくとも一方と通信可能であってもよい。この場合、通信装置３３は、不図示の通信ネットワークを介して、空気伝導マイク１から空気伝導音声信号を受信（つまり、取得）してもよい。通信装置３３は、不図示の通信ネットワークを介して、骨伝導マイク２から骨伝導音声信号を受信（つまり、取得）してもよい。

　入力装置３４は、認証装置３の外部からの認証装置３に対する情報の入力を受け付ける装置である。例えば、入力装置３４は、認証装置３のオペレータが操作可能な操作装置（例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つ）を含んでいてもよい。例えば、入力装置３４は、認証装置３に対して外付け可能な記録媒体にデータとして記録されている情報を読み取り可能な読取装置を含んでいてもよい。例えば、入力装置３４は、空気伝導マイク１から出力される空気伝導音声信号及び骨伝導マイク２から出力される骨伝導音声信号の少なくとも一方が入力される入力インタフェースを含んでいてもよい。

　出力装置３５は、認証装置３の外部に対して情報を出力する装置である。例えば、出力装置３５は、情報を画像として出力してもよい。つまり、出力装置３５は、出力したい情報を示す画像を表示可能な表示装置（いわゆる、ディスプレイ）を含んでいてもよい。例えば、出力装置３５は、情報を音声として出力してもよい。つまり、出力装置３５は、音声を出力可能な音声装置（いわゆる、スピーカ）を含んでいてもよい。例えば、出力装置３５は、紙面に情報を出力してもよい。つまり、出力装置３５は、紙面に所望の情報を印刷可能な印刷装置（いわゆる、プリンタ）を含んでいてもよい。

　（２－３）認証装置３の動作（認証動作）
　続いて、第２実施形態における認証装置３が行う認証動作の流れについて説明する。第２実施形態では、認証装置３は、第１認証動作と第２認証動作との少なくとも一方を行う。このため、以下では、第１認証動作及び第２認証動作について順に説明する。

　（２－３－１）第１認証動作
　初めに、図４を参照しながら、第２実施形態における認証装置３が行う第１認証動作の流れについて説明する。図４は、第２実施形態における認証装置３が行う第１認証動作の流れを示すフローチャートである。

　図４に示すように、算出部３１１は、空気伝導マイク１から、対象者の音声の空気伝導音を示す空気伝導音声信号を取得する（ステップＳ１１）。更に、算出部３１１は、骨伝導マイク２から、対象者の音声の骨伝導音を示す骨伝導音声信号を取得する（ステップＳ１２）。

　その後、算出部３１１は、ステップＳ１１において取得された空気伝導音声信号から、空気伝導音声信号の特徴量である空気伝導特徴量を算出する（ステップＳ１３）。更に、算出部３１１は、ステップＳ１２において取得された骨伝導音声信号から、骨伝導音声信号の特徴量である骨伝導特徴量を算出する（ステップＳ１３）。

　算出部３１１は、空気伝導音声信号の特徴を定性的に及び／又は定量的に示す任意のパラメータを、空気伝導特徴量として算出してもよい。例えば、算出部３１１は、空気伝導音声信号に対して所望の音声分析処理を施すことで、空気伝導音声信号の特徴を示す任意のパラメータを、空気伝導特徴量として算出してもよい。所望の音声分析処理の一例として、周波数分析処理、ケプストラム分析処理及びピッチ抽出処理のうちの少なくとも一つがあげられる。空気伝導音声信号の特徴を示す任意のパラメータの一例として、空気伝導音声信号に対して行われる周波数分析処理の結果から算出可能なメル周波数ケプストラム係数（ＭＦＣＣ：Ｍｅｌ　Ｆｒｅｑｕｅｎｃｙ　Ｃｅｐｓｔｒｕｍ　Ｃｏｅｆｆｉｃｉｅｎｔｓ）があげられる。

　空気伝導特徴量は、Ｎ次元のベクトル（つまり、Ｎ個のベクトル要素から構成されるベクトル）である。尚、「Ｎ」は、１以上の整数を示す定数である。この場合、ベクトルの次元の数は、認証動作を適切に行うことが可能な適切な数に設定されることが好ましい。一例として、メル周波数ケプストラム係数が空気伝導特徴量として用いられる場合には、空気伝導特徴量は、１２次元以上のベクトルであってもよい。

　同様に、算出部３１１は、骨伝導音声信号の特徴を定性的に及び／又は定量的に示す任意のパラメータを、骨伝導特徴量として算出してもよい。例えば、算出部３１１は、骨伝導音声信号に対して所望の音声分析処理を施すことで、骨伝導音声信号の特徴を示す任意のパラメータを、骨伝導特徴量として算出してもよい。骨伝導音声信号の特徴を示す任意のパラメータの一例として、骨伝導音声信号に対して行われる周波数分析処理の結果から算出可能なメル周波数ケプストラム係数があげられる。

　骨伝導特徴量は、Ｍ次元のベクトル（つまり、Ｍ個のベクトル要素から構成されるベクトル）である。尚、「Ｍ」は、１以上の整数を示す定数である。この場合、ベクトルの次元の数は、認証動作を適切に行うことが可能な適切な数に設定されることが好ましい。一例として、メル周波数ケプストラム係数が空気伝導特徴量として用いられる場合には、骨伝導特徴量は、１２次元以上のベクトルであってもよい。

　その後、算出部３１１は、ステップＳ１３において算出された空気伝導特徴量と、ステップＳ１３において算出された骨伝導特徴量とを結合（言い換えれば、連結又は合成）する（ステップＳ１４）。その結果、算出部３１１は、結合された空気伝導特徴量及び骨伝導特徴量から構成される特徴量である結合特徴量を算出する（ステップＳ１４）。

　上述したように、空気伝導特徴量がＮ次元のベクトルであり且つ骨伝導特徴量がＭ次元のベクトルであるため、結合特徴量は、典型的には、Ｎ＋Ｍ次元のベクトルとなる。つまり、結合特徴量の次元の数は、Ｎ＋Ｍとなる。逆に言えば、算出部３１１は、結合特徴量が、空気伝導特徴量に含まれるＮ個のベクトル要素と、骨伝導特徴量に含まれるＭ個のベクトル要素とを含むように、結合特徴量を算出してもよい。

　但し、結合特徴量は、Ｎ＋Ｍ次元未満のベクトルであってもよい。つまり、結合特徴量の次元の数は、Ｎ＋Ｍ未満であってもよい。但し、結合特徴量の次元の数は、Ｎよりも大きく且つＭよりも大きい。つまり、結合特徴量は、Ｎ＋Ｍ次元未満であって、Ｎ次元より大きく且つＭ次元よりも大きいベクトルであってもよい。一例として、算出部３１１は、結合特徴量が、空気伝導特徴量に含まれるＮ個のベクトル要素のうちのＮ’個のベクトル要素（但し、Ｎ’は、１以上且つＮ未満の整数を示す定数）の少なくとも一つと、骨伝導特徴量に含まれるＭ個のベクトル要素のうちのＭ’個のベクトル要素（但し、Ｍ’は、１以上且つＭ未満の整数を示す定数）少なくとも一つとを含むように、結合特徴量を算出してもよい。つまり、第２実施形態における「空気伝導特徴量と骨伝導特徴量とを結合することで結合特徴量を算出する」動作は、「結合特徴量が、空気伝導特徴量に含まれるＮ個のベクトル要素のうちの少なくとも一つと、骨伝導特徴量に含まれるＭ個のベクトル要素のうちの少なくとも一つとを含むように、結合特徴量を算出する」動作を意味していてもよい。

　その後、算出部３１１は、ステップＳ１４において算出された結合特徴量から、認証動作を行うために認証部３１２が用いる対象特徴量を算出する（ステップＳ１５）。例えば、算出部３１１は、ステップＳ１４において算出された結合特徴量から、対象者の特徴を示す特徴量を抽出することで、抽出した特徴量に相当する対象特徴量を算出してもよい。

　算出部３１１は、結合特徴量が入力された場合に対象特徴量を出力可能であって且つ機械学習によって構築可能なニューラルネットワークを用いて、結合特徴量から対象特徴量を算出してもよい。ニューラルネットワークは、サンプル人物の空気伝導音声信号及びサンプル人物の骨伝導音声信号とサンプル人物の認証結果の正解ラベルとを含む教師データを用いた機械学習によって、予め構築されていてもよい。

　その後、認証部３１２は、ステップＳ１５において算出された対象特徴量に基づいて、対象者を認証する（ステップＳ１６）。具体的には、認証部３１２は、ステップＳ１５において算出された対象特徴量と、照合ＤＢ３２１に登録された登録人物に対応する登録特徴量との類似度を算出する。認証部３１２は、算出した類似度が所定の認証閾値を上回る（つまり、対象特徴量が登録特徴量に似ている）場合には、対象者が登録人物と一致すると判定してもよい。一方で、認証部３１２は、算出した類似度が所定の認証閾値を下回る（つまり、対象特徴量が登録特徴量に似ていない）場合には、対象者が登録人物と一致しないと判定してもよい。

　認証部３１２は、二つの特徴量の類似度を算出するための任意の方法を用いて、類似度を算出してもよい。二つの特徴量の類似度を算出するための任意の方法として、確率的線形判別分析（ＰＬＤＡ：Ｐｒｏｂａｂｌｉｓｔｉｃ　Ｌｉｎｅｒａ　Ｄｉｓｃｒｉｍｉｎａｎｔ　Ａｎａｌｙｓｉｓ）モデルを用いた方法があげられる。

　認証部３１２は、ニューラルネットワークを用いて、対象者を認証してもよい。例えば、認証部３１２は、確率的線形判別分析モデルが適用されたニューラルネットワークを用いて、対象者を認証してもよい。ニューラルネットワークは、サンプル人物の空気伝導音声信号及びサンプル人物の骨伝導音声信号とサンプル人物の認証結果の正解ラベルとを含む教師データを用いた機械学習によって、予め構築されていてもよい。

　上述したように算出部３１１がニューラルネットワークを用いる場合には、算出部３１１が用いるニューラルネットワークと認証部３１２が用いるニューラルネットワークとが統合されていてもよい。つまり、算出部３１１は、ニューラルネットワークの第１ネットワーク部分を用いて対象特徴量を算出し、認証部３１２は、第１ネットワーク部分の出力が入力されるニューラルネットワークの第２ネットワーク部分を用いて対象者を認証してもよい。この場合、算出部３１１及び認証部３１２が用いるニューラルネットワークは、いわゆるｘ－ｖｅｃｔｏｒと称される方式（言い換えれば、深層話者埋込（Ｄｅｅｐ　Ｓｐｅａｋｅｒ　Ｅｍｂｅｄｄｉｎｇ））に準拠したニューラルネットワークであってもよい。

　照合ＤＢ３２１には、複数の登録人物に夫々対応する複数の登録特徴量が登録されていてもよい。この場合、認証部３１２は、照合ＤＢ３２１から、一の登録人物に対応する一の登録特徴量と対象特徴量との類似度を算出することで対象者が一の登録人物と一致するか否かを判定する動作を、複数の登録特徴量を用いて繰り返してもよい。

　第１認証動作が行われる場合には、照合ＤＢ３２１に登録されている登録特徴量は、第１認証動作で用いられる対象特徴量と同様の流れで生成されていてもよい。具体的には、登録特徴量を照合ＤＢ３２１に登録するために、まずは、登録人物の音声の空気伝導音を示す空気伝導音声信号及び登録人物の音声の骨伝導音を示す骨伝導音声信号が取得されてもよい。その後、空気伝導音声信号から空気伝導特徴量が算出され、且つ、骨伝導音声信号から骨伝導特徴量が算出されてもよい。その後、空気伝導特徴量と骨伝導特徴量とを結合することで結合特徴量が算出されてもよい。その後、結合特徴量から登録特徴量が算出されてもよい。

　このような図４に示す流れで第１認証動作が行われる場合には、算出部３１１は、図５に示す機能ブロックを備えていてもよい。具体的には、図５に示すように、算出部３１１は、算出部３１１１と、算出部３１１２と、算出部３１１３と、算出部３１１４とを備えていてもよい。算出部３１１１は、空気伝導音声信号から、空気伝導特徴量を算出してもよい。算出部３１１２は、骨伝導音声信号から、骨伝導特徴量を算出してもよい。算出部３１１２は、算出部３１１１が算出した空気伝導特徴量と算出部３１１２が算出した骨伝導特徴量とを結合することで、結合特徴量を算出してもよい。算出部３１１４は、算出部３１１３が算出した結合特徴量から、対象特徴量を算出してもよい。

　以上説明した第１認証動作によれば、認証装置３は、対象者の音声そのものの特徴を示す空気伝導特徴量のみならず、対象者の骨格の影響が重畳された対象者の音声の特徴を示す骨伝導特徴量（つまり、対象者の骨格の特徴をも示す骨伝導特徴量）にも基づいて、対象者を認証する。つまり、認証装置３は、空気伝導音声信号と骨伝導音声信号との双方を用いて、対象者を認証する。その結果、空気伝導特徴量及び骨伝導特徴量のいずれか一方に基づいて対象者を認証する（つまり、空気伝導音声信号と骨伝導音声信号のいずれか一方に基づいて対象者を認証する）第１比較例の認証装置と比較して、認証装置３は、対象者の音声を用いて、対象者をより精度よく認証することができる。というのも、第１比較例の認証装置が空気伝導特徴量に基づいて対象者を認証する（つまり、対象者を認証するために骨伝導特徴量を用いない）場合には、空気伝導音声信号の取得環境が適切でない場合において、認証精度が悪化する可能性があるという技術的問題が生ずる可能性がある。例えば、空気伝導音声信号の取得環境が、ノイズの多い環境又は対象者が音声を適切に発していない環境である場合において、認証精度が悪化する可能性がある。一方で、第１比較例の認証装置が骨伝導特徴量に基づいて対象者を認証する（つまり、対象者を認証するために空気伝導特徴量を用いない）場合には、骨伝導音声信号の精度がそもそも空気伝導音声信号の精度よりも低いがゆえに、認証精度が悪化する可能性があるという技術的問題が生ずる可能性がある。しかるに、第１認証動作では、認証装置３は、空気伝導特徴量及び骨伝導特徴量の双方に基づいて対象者を認証する。このため、認証装置３は、第１比較例の認証装置において発生する可能性がある技術的問題を適切に解決可能である。

　更に、第１認証動作によれば、認証装置３は、空気伝導特徴量に基づいて対象者を認証する処理と、空気伝導特徴量とは異なる骨伝導特徴量に基づいて対象者を認証する処理とを別々に行わなくてもよくなる。つまり、認証装置３は、２種類の異なる特徴量に基づいて対象者を夫々認証する２種類の処理を別々に行わなくてもよくなる。言い換えれば、認証装置３は、対象特徴量という１種類の特徴量に基づいて対象者を認証する処理を行えばよい。このため、空気伝導特徴量に基づいて対象者を認証する処理と骨伝導特徴量に基づいて対象者を認証する処理とを別々に行う必要がある第２比較例の認証装置と比較して、認証装置３は、特徴量に基づいて対象者を認証する処理を行う回数（例えば、上述した類似度を算出する回数）を減らすことができる。一例として、認証装置３は、認証装置３が特徴量に基づいて対象者を認証する処理を行う回数を、第２比較例の認証装置が特徴量に基づいて対象者を認証する処理を行う回数の半分程度にまで減らすことができる。その結果、認証装置３は、対象者を認証するための処理負荷を低減することができる。

　また、認証装置３は、ニューラルネットワークを用いて、結合特徴量から対象特徴量を算出可能である。このため、空気伝導特徴量及び骨伝導特徴量の夫々と比較して要素数が多い結合特徴量が用いられる場合であっても、認証装置３は、対象特徴量を比較的容易に算出することができる。

　（２－３－２）第２認証動作
　続いて、図６を参照しながら、第２実施形態における認証装置３が行う第２認証動作の流れについて説明する。図６は、第２実施形態における認証装置３が行う第２認証動作の流れを示すフローチャートである。

　図６に示すように、第２認証動作においても、第１認証動作と同様に、算出部３１１は、空気伝導マイク１から、空気伝導音声信号を取得する（ステップＳ１１）。更に、算出部３１１は、骨伝導マイク２から、骨伝導音声信号を取得する（ステップＳ１２）。

　その後、第２認証動作においても、第１認証動作と同様に、算出部３１１は、ステップＳ１１において取得された空気伝導音声信号から、空気伝導特徴量を算出する（ステップＳ２３）。

　一方で、第２認証動作においては、算出部３１１は、ステップＳ１２において取得された骨伝導音声信号から、骨伝導特徴量を算出しなくてもよい。第２認証動作では、算出部３１１は、骨伝導特徴量に代えて、差分特徴量を算出する（ステップＳ２４）。差分特徴量は、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分を示す特徴量（つまり、差分の特徴を示す特徴量）である。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分そのものが、差分特徴量として用いられてもよい。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分から算出されるパラメータが、差分特徴量として用いられてもよい。例えば、空気伝導音声信号の周波数スペクトルと骨伝導音声信号の周波数スペクトルとの差分を定量的に又は定性的に示すパラメータが、差分特徴量として用いられてもよい。

　その後、認証部３１２は、ステップＳ２３において算出された空気伝導特徴量に基づいて、対象者を認証する（ステップＳ２５）。更に、認証部３１２は、ステップＳ２４において算出された差分特徴量に基づいて、対象者を認証する（ステップＳ２６）。このため、第２実施形態では、空気伝導特徴量及び差分特徴量の夫々が、対象者を認証するために実際に用いられる対象特徴量として用いられる。

　第２認証動作においても、第１認証動作と同様に、認証部３１２は、対象特徴量と照合ＤＢ３２１に登録された登録特徴量との類似度を算出することで、対象者を認証する。ここで、上述したように、第２実施形態では、空気伝導特徴量及び差分特徴量の夫々が、対象特徴量として用いられる。このため、第２認証動作では、照合ＤＢ３２１には、登録特徴量として、空気伝導特徴量に対応する第１登録特徴量と、差分特徴量に対応する第２登録特徴量とが登録されている。第１登録特徴量は、登録人物の音声の空気伝導音を示す空気伝導音声信号の特徴量である。第２登録特徴量は、登録人物の音声の空気伝導音を示す空気伝導音声信号の周波数スペクトルと、登録人物の音声の骨伝導音を示す骨伝導音声信号の周波数スペクトルとの差分を示す特徴量である。この場合、認証部３１２は、ステップＳ２５において、ステップＳ２３において差分特徴量として算出された空気伝導特徴量と照合ＤＢ３２１に登録された第１登録特徴量との類似度を算出することで、対象者を認証する。更に、認証部３１２は、ステップＳ２６において、ステップＳ２４において差分特徴量として算出された差分特徴量と照合ＤＢ３２１に登録された第２登録特徴量との類似度を算出することで、対象者を認証する。

　その後、認証部３１２は、ステップＳ２５における対象者の認証結果と、ステップＳ２６における対象者の認証結果とに基づいて、対象者を認証する（ステップＳ２７）。つまり、第２認証動作では、認証部３１２は、ステップＳ２５及びＳ２６の夫々において、対象者を暫定的に認証し、ステップＳ２７において、対象者の暫定的な認証結果に基づいて、対象者を確定的に（言い換えれば、最終的に）認証する。一例として、認証部３１２は、ステップＳ２５において対象者が一の登録人物に一致し且つステップＳ２６において対象者が同じ一の登録人物に一致すると判定された場合に、対象者が一の登録人物に一致すると判定してもよい。他方で、認証部３１２は、ステップＳ２５及びＳ２６の少なくとも一方において対象者が一の登録人物に一致していないと判定された場合に、対象者が一の登録人物に一致していないと判定してもよい。

　このような図６に示す流れで第２認証動作が行われる場合には、算出部３１１及び認証部３１２は、図７に示す機能ブロックを備えていてもよい。具体的には、図７に示すように、算出部３１１は、図５に示す算出部３１１１と、算出部３１１５とを備えていてもよい。認証部３１２は、認証部３１２１と、認証部３１２２と、認証部３１２３とを備えていてもよい。算出部３１１１は、上述したように、空気伝導音声信号から、空気伝導特徴量を算出してもよい。算出部３１１５は、空気伝導音声信号と骨伝導音声信号から、差分特徴量を算出してもよい。認証部３１２１は、算出部３１１１が算出した空気伝導特徴量に基づいて、対象者を暫定的に認証してもよい。認証部３１２２は、算出部３１１５が算出した差分特徴量に基づいて、対象者を暫定的に認証してもよい。認証部３１２３は、認証部３１２１による認証結果と、認証部３１２２による認証結果とに基づいて、対象者を確定的に認証してもよい。

　以上説明した第２認証動作によれば、第１認証動作と同様に、認証装置３は、空気伝導音声信号と骨伝導音声信号との双方を用いて、対象者を認証する。その結果、空気伝導音声信号と骨伝導音声信号のいずれか一方に基づいて対象者を認証する第１比較例の認証装置と比較して、認証装置３は、対象者の音声を用いて、対象者をより精度よく認証することができる。

　更に、第２認証動作によれば、認証装置３は、骨伝導特徴量に代えて差分特徴量に基づいて対象者を認証する。ここで、差分特徴量は、対象者の骨格の影響が重畳した対象者の音声の特徴から、対象者の音声そのものの特徴が実質的に排除された特徴量に相当する。つまり、差分特徴量は、対象者の個人性を示す対象者の骨格（つまり、対象者に固有の骨格）そのものの特徴を示す特徴量に相当する。このため、認証装置３は、対象者の音声そのものの特徴を示す空気伝導特徴量及び対象者の骨格そのものの特徴を示す差分特徴量に基づいて、対象者を認証する。その結果、空気伝導特徴量及び差分特徴量のいずれか一方に基づいて対象者を認証する第３比較例の認証装置と比較して、認証装置３は、対象者の音声を用いて、対象者をより精度よく認証することができる。

　更に、認証装置３は、空気伝導特徴量及び差分特徴量の夫々に基づく対象者の暫定的な認証結果に基づいて、対象者を確定的に認証する。このため、空気伝導特徴量の基づく対象者の認証結果が対象者の確定的な認証結果としてそのまま用いられる又は差分特徴量の基づく対象者の認証結果が対象者の確定的な認証結果としてそのまま用いられる場合と比較して、認証装置３は、対象者の音声を用いて、対象者をより精度よく認証することができる。

　（３）第３実施形態
　続いて、認証装置、認証方法、及び、記録媒体の第３実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第３実施形態が適用された認証システムＳＹＳを用いて、認証装置、認証方法、及び、記録媒体の第３実施形態について説明する。尚、以下の説明では、第３実施形態における認証システムＳＹＳを、認証システムＳＹＳａと称することで、第２実施形態における認証システムＳＹＳと区別する。

　以下、図８を参照しながら、第３実施形態における認証システムＳＹＳａについて説明する。図８は、第３実施形態における認証システムＳＹＳａの構成を示すブロック図である。

　図８に示すように、認証システムＳＹＳａは、認証システムＳＹＳと比較して、複数の骨伝導マイク２を備えているという点で異なる。以下の説明では、図８に示すように、認証システムＳＹＳａが二つの骨伝導マイク２（具体的には、骨伝導マイク２＃１及び２＃２）を備える例について説明する。認証システムＳＹＳａのその他の特徴は、認証システムＳＹＳのその他の特徴と同一であってもよい。

　複数の骨伝導マイク２は、対象者に対して異なる複数の位置にそれぞれ配置される。例えば、骨伝導マイク２は、対象者の異なる複数の部位にそれぞれ接触するように配置されてもよい。一例として、骨伝導マイク２＃１は、対象者の頭に接触するように配置され、骨伝導マイク２＃２は、対象者の耳又はその近傍の部位に接触するように配置されてもよい。対象者の頭に接触する骨伝導マイク２＃１の一例として、眼鏡型のウェアラブルデバイス（例えば、眼鏡のつるの部分）に組み込まれた骨伝導マイクがあげられる。対象者の耳又はその近傍の部位に接触する骨伝導マイク２＃２の一例として、対象者の耳に装着可能なヘッドセット型のウェアラブルデバイスに組み込まれた骨伝導マイクがあげられる。

　複数の骨伝導マイク２のうちの一の骨伝導マイク２の用途と、複数の骨伝導マイク２のうちの一の骨伝導マイク２とは異なる他の骨伝導マイク２の用途とが異なっていてもよい。つまり、骨伝導マイク２＃１の用途と、骨伝導マイク２＃２の用途とが異なっていてもよい。一例として、骨伝導マイク２＃１及び２＃２ｐのいずれか一方は、照合ＤＢ３２１に登録されている登録特徴量を算出するために用いられてもよい。この場合、登録特徴量は、骨伝導マイク２＃１及び２＃２ｐのいずれか一方が検出した骨伝導音から算出されてもよい。一方で、骨伝導マイク２＃１及び２＃２ｐのいずれか他方は、対象者を認証するための対象特徴量を算出するために用いられてもよい。この場合、上述した認証装置３が備える算出部３１１は、骨伝導マイク２＃１及び２＃２ｐのいずれか他方が検出した骨伝導音から、対象特徴量を算出してもよい。

　ここで、骨伝導マイク２が検出する骨伝導音は、骨伝導音の検出位置によって変わる可能性がある。例えば、一の位置に配置されている骨伝導マイク２が検出した一の対象者の骨伝導音（特に、その特徴量）は、一の位置とは異なる他の位置に配置されている骨伝導マイク２が検出した同じ一の対象者の骨伝導音（特に、その特徴量）と異なる可能性がある。この場合、登録特徴量を算出するための骨伝導マイク２と対象特徴量を算出するための骨伝導マイク２とが異なることに起因して、認証装置３の認証精度が悪化してしまう可能性がある。そこで、上述した認証装置３が備える認証部３１２は、骨伝導マイク２の位置の違いを考慮して、対象者を認証してもよい。以下、骨伝導マイク２の位置の違いを考慮して対象者を認証する認証動作について、図９を参照しながら説明する。図９は、骨伝導マイク２の位置の違いを考慮して対象者を認証する認証動作の流れを示すフローチャートである。

　図９に示すように、第３実施形態においても、算出部３１１が空気伝導音声信号を取得し（ステップＳ１１）、算出部３１１が骨伝導音声信号を取得し（ステップＳ１２）、算出部３１１が空気伝導特徴量及び骨伝導特徴量を算出する（ステップＳ１３）。

　その後、認証部３１２は、登録特徴量が算出された場合と比較して、対象者に対する骨伝導マイク２の位置が変わっているか否かを判定する（ステップＳ３１ａ）。つまり、認証部３１２は、登録特徴量を算出するために用いられた骨伝導マイク２の位置と、対象特徴量を算出するために用いられた骨伝導マイク２の位置（つまり、図９に示す動作が行われている場合の骨伝導マイク２の位置であり、対象者が現在装着している骨伝導マイク２の位置）とが異なるか否かを判定する。この判定を行うために、照合ＤＢ３１２内において、登録特徴量は、登録特徴量を算出するために用いられた骨伝導マイク２の位置に関するマイク位置情報と関連付けられていてもよい。その結果、認証部３１２は、照合ＤＢ３１２を参照することで、登録特徴量を算出するために用いられた骨伝導マイク２の位置を特定することができる。更に、対象特徴量を算出するために用いられた骨伝導マイク２の位置に関する情報は、例えば、対象者によって認証部３１２に入力されてもよい。或いは、認証部３１２は、対象者が現在装着している骨伝導マイク２の機器番号等から、対象者が現在装着している骨伝導マイク２の位置（つまり、対象特徴量を算出するために用いられた骨伝導マイク２の位置）を推定してもよい。

　ステップＳ３１ａにおける判定の結果、骨伝導マイク２の位置が変わった（つまり、登録特徴量を算出するために用いられた骨伝導マイク２の位置と、対象特徴量を算出するために用いられた骨伝導マイク２の位置とが異なる）と判定された場合には（ステップＳ３１ａ：Ｙｅｓ）、認証部３１２は、ステップＳ１３で算出した骨伝導特徴量を補正する（ステップＳ３２ａ）。具体的には、認証部３１２は、登録特徴量を算出するために用いられた骨伝導マイク２の位置と対象者が現在装着している骨伝導マイク２の位置との違いに起因した骨伝導特徴量の変化が相殺されるように、骨伝導特徴量を補正する。つまり、認証部３１２は、対象者が現在装着している骨伝導マイク２の位置が、登録特徴量を算出するために用いられた骨伝導マイク２の位置と同じ位置であると仮定した場合に算出される骨伝導特徴量に、補正後の骨伝導特徴量が近づく（好ましくは一致する）ように、骨伝導特徴量を補正する。

　骨伝導特徴量を補正するために、一の位置に配置されている骨伝導マイク２が実際に検出した骨伝導音の特徴量と一の位置とは異なる他の位置に配置されている骨伝導マイク２が実際に検出した骨伝導音の特徴量との差分から、骨伝導特徴量を補正するための補正パラメータが予め生成されていてもよい。例えば、骨伝導マイク２＃１が実際に検出した骨伝導音の特徴量と骨伝導マイク２＃２が実際に検出した骨伝導音の特徴量との差分から、骨伝導マイク２＃１が検出した骨伝導音の特徴量を骨伝導マイク２＃２が検出した骨伝導音の特徴量に補正するための補正パラメータ、及び、骨伝導マイク２＃２が検出した骨伝導音の特徴量を骨伝導マイク２＃１が検出した骨伝導音の特徴量に補正するための補正パラメータのうちの少なくとも一方が予め生成されていてもよい。この場合、認証部３１２は、補正パラメータを用いて、骨伝導特徴量を補正してもよい。

　他方で、ステップＳ３１ａにおける判定の結果、骨伝導マイク２の位置が変わっていない（つまり、登録特徴量を算出するために用いられた骨伝導マイク２の位置と、対象特徴量を算出するために用いられた骨伝導マイク２の位置とが同じである）と判定された場合には（ステップＳ３１ａ：Ｎｏ）、認証部３１２は、ステップＳ１３で算出した骨伝導特徴量を補正しなくてもよい。

　その後は、第３実施形態においても、算出部３１１は、ステップＳ１３において算出された空気伝導特徴量と、ステップＳ１３において算出された又はステップＳ３２ａにおいて補正された骨伝導特徴量とを結合し（ステップＳ１４）、算出部３１１は、結合特徴量から、対象特徴量を算出し（ステップＳ１５）、認証部３１２は、対象特徴量に基づいて、対象者を認証する（ステップＳ１６）。

　このような第３実施形態によれば、認証装置３は、登録特徴量を算出するために用いられた骨伝導マイク２の位置と、対象特徴量を算出するために用いられた骨伝導マイク２の位置とが異なる場合であっても、対象者を適切に認証することができる。

　尚、図９は、図４を用いて説明した第１認証動作において骨伝導マイク２の位置の違いを考慮した認証動作を示している。しかしながら、認証装置３は、図６を用いて説明した第２認証動作を行う場合においても、骨伝導マイク２の位置の違いを考慮してもよい。つまり、認証装置３は、図６を用いて説明した第２認証動作を行う場合においても、骨伝導マイク２の位置の違いを考慮して骨伝導特徴量を補正してもよい。

　（４）第４実施形態
　続いて、認証装置、認証方法、及び、記録媒体の第４実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第４実施形態が適用された認証システムＳＹＳを用いて、認証装置、認証方法、及び、記録媒体の第４実施形態について説明する。尚、以下の説明では、第３実施形態における認証システムＳＹＳを、認証システムＳＹＳｂと称することで、第２実施形態における認証システムＳＹＳと区別する。

　認証システムＳＹＳｂは、認証システムＳＹＳと比較して、第２認証動作の一部が異なるという点で異なる。認証システムＳＹＳｂのその他の特徴は、認証システムＳＹＳのその他の特徴と同一であってもよい。

　具体的には、認証装置３は、第２認証動作を行う場合に、空気伝導特徴量に基づいて、対象者を認証し（図６のステップＳ２５）、且つ、差分特徴量に基づいて、対象者を認証する（図６のステップＳ２６）。第４実施形態では、認証装置３は、空気伝導特徴量と第１登録特徴量との類似度が認証閾値を上回る（つまり、対象者が登録人物と一致すると判定された）一方で、差分特徴量と第２登録特徴量との類似度が認証閾値を下回る（つまり、対象者が登録人物と一致しないと判定された）場合に、骨伝導特徴量に何らかの影響が生じたと推定する。この場合、認証装置３は、差分特徴量を補正してもよい。例えば、骨密度に応じて骨伝導特徴量が変動する可能性がある。一例として、正常な骨密度の人物の骨伝導特徴量と骨粗しょう症をわずらっている人物の骨伝導特徴量とは異なる可能性がある。この場合、認証装置３は、対象者が骨粗しょう症であると判定された場合に、正常な骨密度の人物の骨伝導特徴量と骨粗しょう症をわずらっている人物の骨伝導特徴量との差分に関する情報に基づいて、差分特徴量を補正してもよい。その結果、骨伝導特徴量に何らかの影響が生じた場合であっても、認証装置３は、対象者を適切に認証することができる。

　（５）第５実施形態
　続いて、認証装置、認証方法、及び、記録媒体の第５実施形態について説明する。以下では、認証装置、認証方法、及び、記録媒体の第５実施形態が適用された認証システムＳＹＳを用いて、認証装置、認証方法、及び、記録媒体の第５実施形態について説明する。尚、以下の説明では、第５実施形態における認証システムＳＹＳを、認証システムＳＹＳｃと称することで、第２実施形態における認証システムＳＹＳと区別する。

　認証システムＳＹＳｃは、認証システムＳＹＳと比較して、骨伝導特徴量の重みづけ処理を行ってよいという点で異なる。認証システムＳＹＳｃのその他の特徴は、認証システムＳＹＳのその他の特徴と同一であってもよい。

　具体的には、空気伝導特徴量は、骨伝導特徴量と比較して、対象者の周囲の環境音の影響を受けやすい。そこで、対象者の周囲の環境音が相対的に大きい（例えば、環境音の大きさが閾値よりも大きい）場合には、そうでない場合と比較して、骨伝導特徴量の重みを大きくしてもよい。具体的には、第１認証動作において、認証装置３は、対象特徴量を算出する場合の骨伝導特徴量の重みを大きくしてもよい。第２認証動作において、認証装置３は、差分特徴量を算出する場合の骨伝導特徴量の重み（この場合、実際には、骨伝導音声信号の重み）を大きくしてもよい。その結果、対象者の周囲の環境音が相対的に大きい場合であっても、認証装置３は、対象者を適切に認証することができる。

　（６）付記
　以上説明した実施形態に関して、更に以下の付記を開示する。
［付記１］
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出する算出手段と、
　前記対象特徴量に基づいて前記対象者を認証する認証手段と
　を備える認証装置。
［付記２］
　前記算出手段は、前記結合された空気伝導特徴量及び骨伝導特徴量が入力された場合に、前記対象特徴量を出力するニューラルネットワークを用いて、前記対象特徴量を算出する
　付記１に記載の認証装置。
［付記３］
　前記算出手段は、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出し、
　前記認証手段は、前記空気伝導特徴量及び前記差分特徴量に基づいて前記対象者を認証する
　付記１又は２に記載の認証装置。
［付記４］
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出する算出手段と、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証手段と
　を備える認証装置。
［付記５］
　前記認証手段は、前記空気伝導特徴量に基づいて前記対象者を暫定的に認証する第１処理と、前記差分特徴量に基づいて前記対象者を暫定的に認証する第２処理とを行い、前記第１処理の結果と前記第２処理との結果に基づいて前記対象者を確定的に認証する
　付記４に記載の認証装置。
［付記６］
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
　前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
　前記対象特徴量に基づいて前記対象者を認証する
　認証方法。
［付記７］
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
　認証方法。
［付記８］
　コンピュータに、
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
　前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
　前記対象特徴量に基づいて前記対象者を認証する
　認証方法を実行させるコンピュータプログラムが記録された記録媒体。
［付記９］
　コンピュータに、
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
　認証方法を実行させるコンピュータプログラムが記録された記録媒体。

　上述の各実施形態の構成要件の少なくとも一部は、上述の各実施形態の構成要件の少なくとも他の一部と適宜組み合わせることができる。上述の各実施形態の構成要件のうちの一部が用いられなくてもよい。また、法令で許容される限りにおいて、上述のこの開示で引用した全ての文献（例えば、公開公報）の開示を援用してこの開示の記載の一部とする。

　この開示は、請求の範囲及び明細書全体から読み取るこのできる技術的思想に反しない範囲で適宜変更可能である。そのような変更を伴う認証装置、認証方法、及び、記録媒体もまた、この開示の技術的思想に含まれる。

　ＳＹＳ　認証システム
　１　空気伝導マイク
　２　骨伝導マイク
　３、１０００　認証装置
　３１　演算装置
　３１１、１００１　算出部
　３１２、１００２　認証部
　３２　記憶装置
　３２１　照合ＤＢ

Claims

　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出する算出手段と、
　前記対象特徴量に基づいて前記対象者を認証する認証手段と
　を備える認証装置。
　前記算出手段は、前記結合された空気伝導特徴量及び骨伝導特徴量が入力された場合に、前記対象特徴量を出力するニューラルネットワークを用いて、前記対象特徴量を算出する
　請求項１に記載の認証装置。
　前記算出手段は、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量を算出し、
　前記認証手段は、前記空気伝導特徴量及び前記差分特徴量に基づいて前記対象者を認証する
　請求項１又は２に記載の認証装置。
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出する算出手段と、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する認証手段と
　を備える認証装置。
　前記認証手段は、前記空気伝導特徴量に基づいて前記対象者を暫定的に認証する第１処理と、前記差分特徴量に基づいて前記対象者を暫定的に認証する第２処理とを行い、前記第１処理の結果と前記第２処理との結果に基づいて前記対象者を確定的に認証する
　請求項４に記載の認証装置。
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
　前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
　前記対象特徴量に基づいて前記対象者を認証する
　認証方法。
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
　認証方法。
　コンピュータに、
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記骨伝導音声信号の特徴量である骨伝導特徴量とを算出し、
　前記空気伝導特徴量及び前記骨伝導特徴量を結合することで、前記対象者の音声の特徴量である対象特徴量を算出し、
　前記対象特徴量に基づいて前記対象者を認証する
　認証方法を実行させるコンピュータプログラムが記録された記録媒体。
　コンピュータに、
　対象者の音声の空気伝導音を示す空気伝導音声信号と、前記対象者の音声の骨伝導音を示す骨伝導音声信号とから、前記空気伝導音声信号の特徴量である空気伝導特徴量と、前記空気伝導音声信号の周波数スペクトルと前記骨伝導音声信号の周波数スペクトルとの差分の特徴量である差分特徴量とを算出し、
　前記空気伝導特徴量及び前記差分特徴量に基づいて、前記対象者を認証する
　認証方法を実行させるコンピュータプログラムが記録された記録媒体。