JP2002244697A

JP2002244697A - 音声認証装置、音声認証方法、及びプログラム

Info

Publication number: JP2002244697A
Application number: JP2001040456A
Authority: JP
Inventors: Hiroyasu Ide; 博康井手
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2001-02-16
Filing date: 2001-02-16
Publication date: 2002-08-30
Anticipated expiration: 2021-02-16
Also published as: JP4244524B2

Abstract

(57)【要約】【課題】本発明の課題は、認証に有用な音声部分を的
確に抽出して認証率を向上することが可能な音声認証装
置、音声認証方法、及びプログラムを提供することであ
る。【解決手段】特徴抽出処理部１１ｂは入力音声の音声
区間について細かい精度でケプストラムを算出し、その
高ケフレンシー部に現れるピーク値に基づいて音声部分
（有声音）を抽出し、抽出された音声部分についてやや
粗いメルケプストラムを算出し、その低ケフレンシー部
を特徴データとして抽出し、登録データバッファ１１ｃ
に記憶する。新たに音声が入力された場合は、特徴抽出
処理部１１ｂにて入力音声の音声部分についての新規特
徴データを抽出し、特徴照合部１１ｄによりこの新規特
徴データと前記登録特徴データとをＤＰマッチングによ
り照合し、照合結果に基づいて新規音声が登録音声と同
一であるか認証する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認証装置、音
声認証方法、及びプログラムに係り、詳細には、発話者
により発話される音声によって個人を認証する音声認証
装置、音声認証方法、及びプログラムに関する。

【０００２】

【従来の技術】従来より、コンピュータシステムやネッ
トワークシステムを使用する際に本人であることを確認
するため、認証処理が行われている。このような認証の
手法の一つとして、音声による個人認証がある。また、
音声認証処理をコンピュータ等により行わせるための音
声認証装置が開発されている。

【０００３】この種の音声認証装置では、入力されたア
ナログ音声信号をデジタル音声信号に変換し、このデジ
タル音声信号から音声区間を切り出し、切り出された音
声区間について夫々特徴データを抽出し、予め登録され
ている音声についての特徴データと照合することによ
り、入力された音声が、同一人物による音声であるかを
認証する。

【０００４】このような音声認証装置において、入力さ
れた音声信号から音声区間を切り出す際は、一般に音声
信号のエネルギー値がある程度大きい区間を音声区間と
して切り出している。そのため、例えば、発話されるま
での非音声区間や、音と音の間の非音声区間については
エネルギー値が低いため照合の対象から外すことができ
る。

【０００５】

【発明が解決しようとする課題】しかしながら、上述の
ような方法で音声区間を切り出す場合には、エネルギー
値に基づいて音声区間であるか非音声区間であるかを判
別するため、例えば、マイクに息がかかる等、エネルギ
ー値が大きいにも関わらず音声でない部分については照
合の対象から外すことはできなかった。そのため、認証
に有用でない音声部分についても認証の対象としてしま
い、認証率を損なわせていた。

【０００６】本発明の課題は、認証に有用な音声部分を
的確に抽出して認証率を向上することが可能な音声認証
装置、音声認証方法、及びプログラムを提供することで
ある。

【０００７】

【課題を解決するための手段】このような課題を解決す
るため、請求項１記載の発明は、入力された音声信号に
ついて、所定の精度でケプストラムを算出し、その高ケ
フレンシー部に表れるピーク値に基づいて音声部分を抽
出する音声部分抽出手段（例えば、図２に示す特徴抽出
処理部１１ｂ、図４の１１１ｂ〜１１３ｂ、１１８ｂ、
図７のＳ２１〜Ｓ２５）と、この音声部分抽出手段によ
り抽出された音声部分における音声信号について、前記
精度より粗い精度でメルケプストラムを算出し、その低
ケフレンシー部を音声の特徴データとして抽出する特徴
抽出手段（例えば、図２に示す特徴抽出処理部１１ｂ、
図４の１１４ｂ〜１１７ｂ，図７のＳ２６〜Ｓ３１）
と、この特徴抽出手段により抽出された特徴データを登
録する登録手段（例えば、図２に示す登録データバッフ
ァ１１ｃ、図５のＳ６）と、新規入力された音声信号に
ついて前記音声部分抽出手段及び前記特徴抽出手段によ
って特徴データを抽出し、この新規入力音声信号の特徴
データと前記登録手段により予め登録されている特徴デ
ータとをＤＰマッチングにより照合し、その照合結果に
基づいて新規入力された音声信号を認証する認証手段
（例えば、図２に示す特徴照合部１１ｄ、図５のＳ７、
図９のＳ６１〜Ｓ６７）と、を備えることを特徴として
いる。

【０００８】ここで、所定の精度とは、ケプストラムの
高ケフレンシー部のピークにおよそ８０Hz以上の音声、
即ち低い声のデータが表れる程度の精度をいう。例え
ば、１１kHzで音声信号をサンプリングした場合は、ケ
プストラムを算出する際にフーリエ変換（ＦＦＴ）を５
１２点とればよい。また、粗い精度とは、メルケプスト
ラムの低ケフレンシー部に個人差が表れる程度とするこ
とが望ましい。具体的には、例えば１１kHzで音声信号
をサンプリングした場合は、メルケプストラムを算出す
る際にフーリエ変換を１２８点とればよい。

【０００９】請求項１記載の発明によれば、音声部分抽
出手段と、特徴抽出手段と、登録手段と、によって、入
力された音声信号から所定の精度でケプストラムを算出
し、その高ケフレンシー部に表れるピーク値に基づいて
音声部分を抽出し、抽出された音声部分における音声信
号について前記精度より粗い精度でメルケプストラムを
算出し、その低ケフレンシー部を音声の特徴データとし
て抽出し、この特徴データを登録特徴データとして登録
する。また、認証手段によって、新規入力された音声信
号について前記音声部分抽出手段及び前記特徴抽出手段
によって音声部分の特徴データを抽出し、この新規入力
音声信号の特徴データと前記登録特徴データとをＤＰマ
ッチングにより照合し、その照合結果に基づいて新規入
力された音声を認証する。

【００１０】従って、ケプストラムの高ケフレンシー部
に表れる音声の基本周波数を表すピーク値に基づいて音
声部分を抽出するため、認証に有用な音声部分を的確に
抽出できる。また、その抽出した音声部分について、あ
る程度粗い精度で特徴データを抽出するため音声の個人
差をよく表せる。そのため、個人の認証に有用な音声部
分を用いて特徴データを照合することが可能になり、認
証率を向上できる。

【００１１】

【発明の実施の形態】以下、図を参照して本発明に係る
音声認証装置の実施の形態を詳細に説明する。

【００１２】まず構成を説明する。図１は、本願発明の
音声認証装置の回路構成図である。本実施の形態におい
て音声認証装置１は、ＣＰＵ（Central Processing Uni
t）１０、入力部１２、表示部１３、通信制御部１４、
音声入力部１５、ＲＡＭ（Random Access Memory）１
６、ＲＯＭ（Read Only Memory）１７、外部記憶装置１
８、及び記録媒体１９によって構成されており、記録媒
体１９を除く各部はバス２０によって接続されている。

【００１３】ＣＰＵ１０は、ＲＯＭ１７または外部記憶
装置１８に記憶されている当該音声認証装置１に対応す
る各種アプリケーションプログラムの中から指定された
アプリケーションプログラム、入力部１２または音声入
力部１５から入力される各種指示をＲＡＭ１６内のワー
クメモリに格納し、この入力指示及び入力データに応じ
てＲＡＭ１６内に格納したアプリケーションプログラム
に従って各種処理を実行し、その処理結果をＲＡＭ１６
内のワークメモリに格納するとともに、表示部１３に表
示する。そして、ワークメモリに格納した処理結果を入
力部１２から指示される外部記憶装置１８内の保存先に
保存する。

【００１４】また、ＣＰＵ１０は、音声入力部１５から
入力された音声について認証処理を実行する音声認証処
理部１１を備える。図２は、音声認証処理部１１の構成
を示す機能ブロック図である。図２に示すように、音声
認証処理部１１は、音声区間切り出し処理部１１ａ、特
徴抽出処理部１１ｂ、登録データバッファ１１ｃ、及び
特徴照合部１１ｄにより構成される。

【００１５】音声認証処理部１１には、デジタル化され
た音声信号が入力音声として入力される。入力音声は、
まず音声区間切り出し処理部１１ａによってエネルギー
値に基づいて音声区間が切り出され、その後、特徴抽出
処理部１１ｂによって、その音声区間の特徴データが抽
出される。抽出された特徴データは、登録モードであれ
ば登録データバッファ１１ｃに送出され保存される。ま
た、認証モードであれば特徴照合部１１ｄに送出され、
登録データバッファ１１ｃに予め保存されている特徴デ
ータと照合されて、その照合結果が出力される。

【００１６】照合の結果、入力された音声と登録されて
いる音声の各特徴データが同一と照合された場合は、同
一人物による音声であると認証するとともに、新たに入
力された音声の特徴データを登録データバッファ１１ｃ
に送り、登録されている特徴データに代えて更新登録す
る。

【００１７】図３は音声区間切り出し処理部１１ａの具
体的な構成例、及びエネルギーのスレッシュ値の一例を
説明する図である。

【００１８】図３（ａ）に示すように、音声区間切り出
し処理部１１ａは、ハイパスフィルタ１１１ａ、エネル
ギー算出処理部１１２ａ、及び音声区間切り出し部１１
３ａによって構成される。入力音声は、まずハイパスフ
ィルタ１１１ａによってその直流成分が除去される。こ
のとき１００Hz程度のハイパスフィルタをかけることで
定常ノイズを除去する。ハイパスフィルタ１１１ａは、
例えば次式（１）で表されるものを用いればよい。

【００１９】 H(z)=(0.46-0.93z^-1+0.46z^-2)/(1-1.91z^-1+0.91z^-2) ・・・・（１）

【００２０】ハイパスフィルタ１１１ａにより定常ノイ
ズが除去された入力音声は、次に、エネルギー算出処理
部１１２ａにより、一定サンプル毎、即ち各信号区間毎
にエネルギー値の対数が計算される。以下の説明におい
て一定サンプルの各信号区間をフレームという。各フレ
ームのエネルギー値Ｅの算出式を次式（２）に示す。

【００２１】

【数１】

【００２２】ここで、Ｓiはサンプル値、ｎは各フレー
ムのサンプル数を示し、例えば、ｎ＝１００等とすれば
よい。エネルギー値Ｅを算出する際に対数をとること
で、音声区間を精度よく切り出すことができる。

【００２３】エネルギー算出処理部１１２ａは、上式
（２）を入力音声の全信号（全フレーム）にわたって計
算する。発話者がマイク（音声入力部１５）に十分接近
して発声している場合には、音声区間は非音声区間に比
べて十分にエネルギーが高い。そこで、エネルギー算出
処理部１１２ａは、各フレームのエネルギーＥのレンジ
を計算し、算出したエネルギー値Ｅからスレッシュ値Ｅ
ｔを算出する。

【００２４】図３（ｂ）にエネルギーのスレッシュ値Ｅ
tの一例を示す。図３（ｂ）に示すように、例えば、全
フレームのエネルギー値Ｅのレンジ（Ｅmin≦Ｅ≦Ｅma
x）の１／２以上のエネルギーを持つフレームを音声区
間とみなす場合には、スレッシュ値Ｅtは以下の式
（３）で表される。

【００２５】Ｅt＝（Ｅmax-Ｅmin）/２＋Ｅmin ・・・・・・（３）ここで、Ｅmaxはエネルギーの最大値であり、Ｅminはエ
ネルギーの最小値である。なお、この例ではエネルギー
のスレッシュ値Ｅtを全フレームにおけるエネルギーの
レンジの１／２としているが、これに限定されるもので
はない。

【００２６】次に音声区間切出し部１１３ａはエネルギ
ー算出処理部１１２ａにより算出された各フレームのエ
ネルギー値Ｅをスレッシュ値Ｅtと比較し、エネルギー
Ｅがスレッシュ値Ｅtより大きいフレームを音声区間と
みなし、またスレッシュ値Ｅt以下となるフレームを非
音声区間とみなす。そして、音声区間とみなされたフレ
ームを切出し、特徴抽出処理部１１ｂへ出力する。

【００２７】特徴抽出処理部１１ｂは、音声の特徴デー
タとしてケプストラムＣ（τ）及びメルケプストラムを
算出する。ケプストラムとは、波形の短時間スペクトル
の対数の逆フーリエ変換として定義され、次式（４）で
表される。ケプストラムの横軸はケフレンシーと呼ばれ
る。また、メルケプストラムとはメル軸に変換されたケ
プストラムをいい、聴力特性に近似した特徴を表すこと
が知られている。

【００２８】Ｃ（τ）＝IFFT（LOG|FFT(ｘ(t))|）・・・・・（４）ここで、FFT()はフーリエ変換、IFFT()は逆フーリエ変
換、ｘ(t)は入力信号である。

【００２９】図４は、特徴抽出処理部１１ｂによる特徴
抽出の手順を示す図である。まず、入力音声ｘ(ｔ)をフ
ーリエ変換（ＦＦＴ；Fast Fourier Transform）する
（１１１ｂ）。ここでは、ケプストラムの高ケフレンシ
ー部に表れるピークに、８０Hz程度の低い音声まで表現
可能とするため、ある程度細かい精度でフーリエ変換す
る。具体的には、例えば１１kHzでサンプリングした音
声信号であれば５１２点のフーリエ変換を行えばよい。

【００３０】次に、フーリエ変換されたスペクトルの絶
対値|Ｘ(ｔ)|の対数を取り、逆フーリエ変換して、ケプ
ストラムＣ(τ)を算出する（１１２ｂ）。ケプストラム
の高ケフレンシー部には入力信号の基本周波数がピーク
として表れる。そこで、特徴抽出処理部１１ｂはケプス
トラムの高ケフレンシー部を抽出し（１１３ｂ）、その
高ケフレンシー部に表れるピーク値が所定のスレッシュ
値よりも小さければ基本周波数が存在しない、即ち音声
でない（有声音でない）と判定する。ピーク値が所定の
スレッシュ値以上であれば音声部分（有声音）と判定す
る。

【００３１】具体的には、例えばケプストラムの３０次
以降を高ケフレンシー部とし、ピーク値のスレッシュ値
は０．１とすればよい。音声部分と判定された音声信号
はその後、特徴データの抽出対象となる（１１８ｂ）。

【００３２】一方、ケプストラムＣ(τ)の低ケフレンシ
ー部にはスペクトラム包絡の情報が含まれ、やや粗くケ
プストラムを算出する方が個人差を表現しやすい。

【００３３】そこで、特徴抽出処理部１１ｂは、高ケフ
レンシー部に現れるピーク値に基づき音声部分として抽
出された音声信号について、やや粗いケプストラムを算
出し（１１４ｂ、１１５ｂ）、そのケプストラムを聴力
特性と近似するためにメル軸に変換し（１１６ｂ）、変
換されたメル軸のケプストラム（以下、メルケプストラ
ムという）の低ケフレンシー部を抽出し（１１７ｂ）、
特徴データとして音声認証に利用する。

【００３４】粗いケプストラムを算出するため、具体的
には、例えば図４に示すように、細かいケプストラムを
算出した際に既に算出されているフーリエ変換の結果を
ダウンサンプリングし（１１１ｂ→１１４ｂ）、その値
を利用してケプストラムを算出する。

【００３５】メルケプストラム係数は、ケプストラム係
数Ｃnにより次の再帰式を用いて近似的に算出される。
メルケプストラムの算出式を次式（５）に示す。

【００３６】

【数２】

【００３７】ここで、Ｃnはケプストラム係数、Ｎはケ
プストラムの次元数、ｉ，ｊは夫々｛i｜0,1,…,N｝、
｛j｜0,1,…,N｝である。また、αはサンプリング周波
数に依存した値であり、サンプリング周波数が８kHzの
ときはα＝0.31、10kHzのときはα＝0.35に設定する。
この再帰式を計算すると、MC^k ₀にメルケプストラムが代
入される。ここではメルケプストラムの例えば３０次ま
でを低ケフレンシー部とする。

【００３８】特徴抽出処理部１１ｂは、抽出された音声
部分のやや粗く算出されたメルケプストラムの低ケフレ
ンシー部を音声の特徴データとし、登録モードであれば
登録データバッファ１１ｃに送出し、認証モードであれ
ば特徴照合部１１ｄに送出する。

【００３９】登録データバッファ１１ｃには、やや粗く
算出されたメルケプストラムの低ケフレンシー部が登録
特徴データとして記憶される。

【００４０】特徴照合部１１ｄは、特徴抽出処理部１１
ｂから供給される新たに入力された音声についての特徴
データ（やや粗く算出されたメルケプストラムの低ケフ
レンシー部）を、登録データバッファ１１ｃに登録され
ている登録特徴データと照合する。

【００４１】ここで、特徴照合処理について説明する。
特徴照合にはＤＰマッチングを利用する。ＤＰマッチン
グとは、時間長の変動を動的計画法（ＤＰ：Dynamic Pr
ogramming）を用いて時間正規化する手法である。以
下、ＤＰマッチングについて簡単に説明する。

【００４２】対応すべき２つのベクトルの系列を次のよ
うに表す。Ａ＝ａ1，ａ2，…，ａI Ｂ＝ｂ1，ｂ2，…，ｂJ

【００４３】Ａ，Ｂ両パターンの時間軸の対応付けは、
ベクトルＡ、Ｂからなる平面の格子点の系列で表され
る。即ち、マッチングでは、（ａ1，ｂ1）から始まり、
（ａI，ｂJ）まで到達する交点の系列を算出する。交点
の系列Ｆは次のように表される。Ｆ＝ｃ1，ｃ2，…，ｃk，…，ｃK ｃk＝（ｉk，ｊk）

【００４４】また、Ａ，Ｂ間の各ベクトルの組（ａi，
ｂj）間の距離をｄ（ｉ，ｊ）で表すと、交点の系列Ｆ
に沿ったＡ，Ｂの距離の総和Ｄ（Ｆ）は次の式（６）で
表される。

【００４５】

【数３】

【００４６】ここで、ｗkは重み付け関数である。この
Ｄ（Ｆ）の値が小さいほど、ＡとＢの対応付けがよいこ
ととなる。

【００４７】単調連続性条件として、０≦ｉ_k−ｉ_k-1≦１０≦ｊ_k−ｊ_k-1≦１境界条件として、ｉ₁＝ｊ₁＝１ｉ_K＝Ｉ，ｊ_K＝Ｊを導入し、これらの条件を満たす範囲で、上式（６）に
示すＤ（Ｆ）が最小となる交点系列Ｆを算出すればよ
い。

【００４８】ＤＰマッチング時の重みとして、市街化距
離を採用すると、ｗk＝（ｉ_k−ｉ_k-1）＋（ｊ_k−ｊ_k-1），（ｉ₀＝ｊ₀＝
０）となる。このとき、Ｄ（Ｆ）は次の式（７）に簡略化さ
れる。

【００４９】

【数４】

【００５０】ＤＰマッチングにより最小のＤ（Ｆ）を算
出し、この算出した結果値が所定のスレッシュ値未満と
なる場合は、新規入力された音声が登録されている音声
に一致すると判定する。例えば、１０kHz程度でサンプ
リングした音声についてユークリッド距離を採用し、そ
の重み付けとして市街化距離を採用したＤＰマッチング
を行う場合は、スレッシュ値を０．７程度とすればよ
い。

【００５１】以上の説明がＤＰマッチングの簡単な説明
である。本実施の形態では、照合すべきデータは予め登
録された登録特徴データ（ベクトル列）と新規入力音声
の特徴データ（ベクトル列）である。まず、特徴照合部
１１ｄは各特徴データの各点（ベクトル）間の距離ｄ
（ｉ，ｊ）を算出する。ベクトル間距離は、例えばユー
クリッド距離を用いる。各ベクトルの要素をａ＝｛ｘ1，…，ｘN｝ｂ＝｛ｙ1，…，ｙN｝とすると、ユークリッド距離ｄは、以下の式（８）で表
される。

【００５２】

【数５】

【００５３】上述のＤＰマッチングの説明では(ａ1，ｂ
1)から（ａI，ｂJ）までのＤ（F）を算出することとし
ているが、これはベクトル列ＡとＢの長さだけが異な
り、始点と終点が一致している場合に適用するものであ
る。

【００５４】ところが、音声では「サ行」や「シャ行」
のように徐々にフェードインし、音声区間の切り出し方
によって、照合すべき２つの音声の始点が必ずしも一致
しない場合がある。そのため、本実施の形態では、特徴
照合部１１ｄはＤＰマッチングの始点付近の複数の点群
（以下、初期点群という）から最適な始点を選択する。

【００５５】即ち、（ａ1，ｂ1）だけでなく、（ａ1，
ｂ2），…，（ａ1，ｂs）や、（ａ2，ｂ１），…，（ａ
s，ｂ1）等の所定範囲内に含まれる複数の点を初期点群
とし、この初期点群に含まれる各点については、ベクト
ル間距離を算出する際に各点に適した重み付けを行う。
例えば点（ａp，ｂq）でのベクトル間距離ｄ（ａp，ｂ
q）に対して、（ｐ＋ｑ）の重みを掛ける。即ち、点
（ａp，ｂq）でのスコアは、（ｐ＋ｑ）×ｄ（ａp，ｂ
q）として算出される。そして、上記初期点群の各点に
ついてスコアを計算し、最小の値を最適な初期値とし、
その点を始点として選択する。

【００５６】また、延音で終わる単語は照合すべき２つ
の音声の終点が必ずしも一致しない場合がある。そのた
め、特徴照合部１１ｄはＤＰマッチングの終点付近の複
数の点群（以下、終点群という）から終点として最適な
点を選択し、その点におけるＤＰマッチングの値をその
点に適した重み付けで正規化し、ＤＰマッチングの結果
とする。

【００５７】即ち、（ａI，ｂJ）だけでなく、（ａI，
ｂJ-1），…，（ａI，ｂJ-s）や、（ａI-1，ｂJ），
…，（ａI-s，ｂJ）等の所定範囲内に含まれる複数の点
を終点群とし、終点群に含まれる各点までのＤＰマッチ
ングの結果（スコア）を算出し、それらスコアを比較し
て最小となる点を終点として選択する。また、選択され
た終点に適した重み付けでその点におけるＤＰマッチン
グの結果値を正規化する。例えば、点（ａp，ｂq）を終
点とした場合には、その点のスコアＳを（ｐ＋ｑ）で割
る、即ちＳ／（ｐ＋ｑ）を計算することにより正規化
し、ＤＰマッチングの結果とする。

【００５８】また、上記初期点群、終点群の範囲、即ち
上記のｓの値はＦＦＴ窓のシフト量に依存するが、例え
ば、1/100sec程度の点を取ることにすればよい。

【００５９】特徴照合部１１ｄは、登録特徴データと、
新規入力された音声の特徴データと、について上述のよ
うなＤＰマッチングによる照合処理を行い、その照合結
果をＣＰＵ１０に出力する。ＣＰＵ１０は照合結果に応
じた処理を実行する。

【００６０】照合結果により両特徴データが同一である
と認証された場合は、新規入力された音声の特徴データ
を、予め登録されている登録特徴データに代えて登録デ
ータバッファ１１ｃに更新登録させる。また、照合結果
により両特徴データが同一でないと認証された場合は、
例えばこの音声認証装置１に接続されたコンピュータシ
ステムの利用を禁止させる処理等を実行する。

【００６１】入力部１２は、カーソルキー、数字入力キ
ー及び各種機能キー等を備えたキーボード、及びマウス
を含み、キーボードで押下された押下信号やマウスの位
置信号をＣＰＵ１０に出力する。

【００６２】表示部１３は、ＣＲＴ（Cathode Ray Tub
e）、またはＬＣＤ（Liquid CrystalDisplay）等により
構成され、ＣＰＵ１０から入力される表示指示に従って
各種表示データの画面表示を行う。

【００６３】通信制御部１４は、モデム（ＭＯＤＥＭ：
MOdulator/DEModulator ）またはターミナルアダプタ
（ＴＡ：Terminal Adapter）等によって構成され、通信
回線を介して外部機器との通信を行うための制御を行
う。

【００６４】音声入力部１５は、マイク、及びＡ／Ｄ変
換器により構成され、発話者によりマイクに対して入力
された音声のアナログ信号をデジタル音声信号に変換
し、音声認証処理部１１へ出力する。

【００６５】ＲＡＭ１６は、指定されたアプリケーショ
ンプログラム、入力指示、入力データ及び処理結果等を
格納するメモリ領域を有する。

【００６６】ＲＯＭ１７は、音声認証装置１に対応する
基本プログラムを格納している。すなわち、音声認証装
置１の電源がＯＮ状態にされた際に実行する初期プログ
ラム、各種演算プログラム、各処理モードにおいて実行
される処理プログラム等の書き換え不要な基本プログラ
ムを格納している。

【００６７】外部記憶装置１８は、プログラム、データ
等が予め記憶されており、この外部記憶装置１８は磁気
的、光学的記録媒体、若しくは半導体メモリ等ＣＰＵで
読取り可能な記録媒体１９を含んだ構成である。この記
録媒体１９はＣＤ−ＲＯＭ、メモリカード等の可搬型の
媒体やハードディスク等の固定的な媒体を含む。また、
この記録媒体１９に格納するプログラム、データ等は、
その一部若しくは全部をサーバやクライアントからＷＡ
Ｎ、ＬＡＮなどのネットワークを介して通信制御部１４
から受信する構成にしてもよく、更に、前記記録媒体１
９はネットワーク上に構築されたサーバやクライアント
の記録媒体であってもよい。

【００６８】次に動作を説明する。後述する各フローチ
ャートは本願発明の音声認証装置を構成するコンピュー
タに各機能を実現させるためのプログラムを説明するた
めのものである。このプログラムはＣＰＵ１０が読取り
可能なプログラムコードの形態で前記記録媒体１９に格
納されている例で説明するが、全ての機能を前記記録媒
体１９に格納する必要はなく、必要に応じて、その一部
若しくは全部をネットワークを介して通信制御部１４か
ら受信して実現するようにしてもよい。

【００６９】図５は音声認証装置１における音声認証処
理の全体的な流れを説明するフローチャートである。

【００７０】まず、ユーザは音声入力部１５に対して所
定の音声を発話する（ステップＳ１）。音声入力部１５
は入力された音声のアナログ信号を所定のサンプリング
周波数で標本化し、量子化し、符号化することにより、
デジタル音声信号に変換し、変換されたデジタル音声信
号を入力音声として音声認証処理部１１へ送出する（ス
テップＳ２）。

【００７１】音声認証処理部１１では、まず音声区間切
り出し処理部１１ａにより入力音声からエネルギー値に
基づいて音声区間を切り出す処理を行う（ステップＳ
３）。ここで、音声区間切り出し処理について図６を参
照して説明する。図６は音声区間切り出し処理を説明す
るフローチャートである。図６に示すように、音声区間
切り出し処理では、まず、ハイパスフィルタ１１１ａに
より入力音声から直流成分、及び定常ノイズを除去する
（ステップＳ１１）。次に、エネルギー算出部１１２ａ
によって入力音声の一定サンプル毎の各区間（フレー
ム）のエネルギー値を算出し（ステップＳ１２）、対数
処理を行う（ステップＳ１３）。例えば、１００サンプ
ル毎の区間（フレーム）に区切り、エネルギー値を算出
する（上式（２）参照）。

【００７２】入力音声の信号全域に渡って、各フレーム
のエネルギー値を算出すると（ステップＳ１４；Ｙｅ
ｓ）、次に音声区間切り出し処理部１１ａは、算出した
各フレームのエネルギー値から、音声区間か或いは非音
声区間かのスレッシュ値Ｅtを算出する（ステップＳ１
５）。スレッシュ値Ｅtは、エネルギー値のレンジ（Ｅm
in≦Ｅ≦Ｅmax）の例えば１／２とすればよい（上式
（３）参照）。

【００７３】そして、音声区間切り出し部１１３ａは各
フレームのエネルギー値Ｅがスレッシュ値Ｅtより大き
いか否かを判別し（ステップＳ１６）、スレッシュ値Ｅ
tより大きければ（ステップＳ１６；Ｙｅｓ）、そのフ
レームを音声区間として切り出す（ステップＳ１７）。
また、エネルギー値Ｅがスレッシュ値Ｅt以下であれ
ば、そのフレームは非音声区間であるとみなし、以降の
ケプストラム計算の対象としない。

【００７４】全区間（フレーム）についてエネルギー値
に基づく音声区間の切り出しが終了すると（ステップＳ
１８；Ｙｅｓ）、一連の音声区間切り出し処理を終了
し、図５のステップＳ４へ移行する。

【００７５】音声区間として切り出された音声信号は次
に特徴抽出処理部１１ｂによって特徴データが抽出され
る（ステップＳ４）。ここで、特徴抽出処理について図
７を参照して説明する。図７は特徴抽出処理を説明する
フローチャートである。まず、切り出された音声信号に
ついてケプストラムを算出するため、フーリエ変換（Ｆ
ＦＴ処理）を行う（ステップＳ２１）。ここで、低い声
（８０Hz程度）でも高ケフレンシー部にピークが表れる
ようにするため、ある程度細かくフーリエ変換をとる。
例えばサンプリング周波数が１１kHzの音声信号であれ
ば５１２点のフーリエ変換を行えばよい。ここで算出さ
れたフーリエ変換の結果はＲＡＭ１６に保存される（ス
テップＳ２２）

【００７６】次に、フーリエ変換された値の絶対値の対
数をとり、逆フーリエ変換を計算することによりケプス
トラムを算出する（ステップＳ２３）。特徴抽出処理部
１１ｂでは、算出したケプストラムの例えば３０次以降
を高ケフレンシー部として抽出する（ステップＳ２
４）。そして高ケフレンシー部に現れるピーク値が所定
のスレッシュ値（例えば、０．１）より大きいか判定す
ることによりその音声信号が有声音（音声部分）である
か判別する（ステップＳ２５）。マイクに息がかかる
等、有声音でない場合は高ケフレンシー部のピーク値が
所定のスレッシュ値（例えば、０．１）以下になるため
音声部分でないと判別される。以降の処理（ステップＳ
２７〜Ｓ３１）では音声部分と判別された音声信号のみ
特徴抽出（メルケプストラム計算）の対象とし（ステッ
プＳ２６；Ｙｅｓ）、音声部分でない音声信号は特徴抽
出の対象としない（ステップＳ２６；Ｎｏ）。

【００７７】ステップＳ２５において音声部分と判別さ
れた音声信号について、特徴抽出処理部１１ｂはステッ
プＳ２３において算出したケプストラムよりも粗くケプ
ストラムを算出する。ここでは、ＲＡＭ１６に保存した
ＦＦＴ処理結果を読み出し（ステップＳ２７）、ダウン
サンプリングする（ステップＳ２８）。ダウンダンプリ
ングは例えば１２８点とすればよい。次に、ダウンサン
プリングしたＦＦＴの結果の対数を計算し、逆フーリエ
変換することによりやや粗いケプストラムを算出する
（ステップＳ２９）。

【００７８】次に、算出したやや粗いケプストラムをメ
ル軸に変換することにより、メルケプストラムを算出す
る（ステップＳ３０）。メルケプストラム算出処理につ
いて図８を参照して説明する。図８はメルケプストラム
算出処理を説明するフローチャートである。このフロー
チャートにおいて、Ｎはケプストラムの次元数、C[0,
…,N]は求められているケプストラムの値、MC[0,…,N]
[0,…,N+1]は計算に用いるバッファであり、αはサンプ
リング周波数に依存した定数である。

【００７９】まず、バッファMC[0][N+1]，MC[1][N+1]，
…，MC[N][N+1]に「０」を代入し初期化する（ステップ
Ｓ４１）。また、カウンタｎにＮを代入し初期化する
（ステップＳ４２）。次に、C[n]+α×MC[0][n+1]を計
算し、バッファMC[0][n]に代入する（ステップＳ４
３）。この計算をカウンタｎが０になるまで、即ちＮ＋
１回繰り返す（ステップＳ４４；Ｎｏ→ステップＳ４５
→ステップＳ４３）。カウンタｎが０になった場合は
（ステップＳ４４；Ｙｅｓ）、再度カウンタｎにＮを代
入して初期化し（ステップＳ４６）、次に、式(1-α^2)
×MC[0][n+1]+α×MC[1][n+1]を計算し、バッファMC[1]
[n]に代入する（ステップＳ４７）。この計算をカウン
タｎが０になるまで、即ちＮ＋１回繰り返す（ステップ
Ｓ４８；Ｎｏ→ステップＳ４９→ステップＳ４７）。

【００８０】次に、カウンタｋに２を代入し（ステップ
Ｓ５０）、カウンタｎにＮを代入して（ステップＳ５
１）、初期化する。次に、MC[k-1][n+1]+α×(MC[k][n+
1]-MC[k-1][n])を計算し、バッファMC[k][n]に代入する
（ステップＳ５２）。この計算をカウンタｎが０になる
まで、即ちＮ＋１回繰り返す（ステップＳ５３；Ｎｏ→
ステップＳ５４→ステップＳ５２）。また、ステップＳ
５１〜Ｓ５３の計算をカウンタｋがＮになるまで（即
ち、Ｎ−１回）繰り返す（ステップＳ５５；Ｎｏ→ステ
ップＳ５６→ステップＳ５１〜Ｓ５３）。以上の計算が
終了すると（ステップＳ５５；Ｙｅｓ）、MC[0][0],MC
[1][0],…,MC[N][0]に、メルケプストラムの値が夫々代
入されている。

【００８１】メルケプストラムが算出されると、図７の
ステップＳ３１に戻り、算出されたメルケプストラムの
うち、低ケフレンシー部を抽出する。ここでは、例えば
３０次までのメルケプストラムを低ケフレンシー部とす
る（ステップＳ３１）。全音声区間について特徴抽出処
理が終了すると（ステップＳ３２；Ｙｅｓ）図５のステ
ップＳ５に移行する。ＣＰＵ１０は登録モードであるか
認証モードであるか判別する。

【００８２】登録モードであれば（ステップＳ５；登
録）、特徴抽出処理部１１ｂにより抽出されたメルケプ
ストラムの低ケフレンシー部を登録特徴データとして、
登録データバッファ１１ｃに記憶させる（ステップＳ
６）。認証モードであれば（ステップＳ５；認証）、特
徴抽出処理部１１ｂにより抽出されたメルケプストラム
の低ケフレンシー部を新規特徴データとして、特徴照合
部１１ｄに出力し、特徴照合処理を行わせる（ステップ
Ｓ７）。

【００８３】ここで、特徴照合処理について図９を参照
して説明する。図９は特徴照合処理を説明するフローチ
ャートである。図９に示すように、特徴照合部１１ｄ
は、登録データバッファ１１ｃに登録されている登録特
徴データを読出し、この登録特徴データと特徴抽出処理
部１１ｂから供給される新規特徴データとをＤＰマッチ
ングにより照合する。

【００８４】ＤＰマッチングではまず、登録特徴データ
（例えば３０次のベクトル列で表される）の各点（各要
素）と新規特徴データ（例えば３０次のベクトル列で表
される）の各点（各要素）とのベクトル間距離を算出す
る（上式（８）参照）（ステップＳ６１）。次に、所定
の初期点群については、ベクトル間距離に各点に適切な
重み付けを行ってスコアを求める（ステップＳ６２）。
そして、ＤＰマッチングを実行する（ステップＳ６
３）。

【００８５】また、所定の終点群について、その点に適
した重み付けで正規化した、各点におけるＤＰマッチン
グの結果（スコア）を求め、それらの結果の中から最適
なものを選択する（ステップＳ６４）。その値を所定の
スレッシュ値と比較し（ステップＳ６５）、スレッシュ
値以上であれば（ステップＳ６５；Ｎｏ）、他人による
音声と判定して（ステップＳ６６）、その照合結果をＣ
ＰＵ１０に出力する。また、ＤＰマッチングの結果がス
レッシュ値未満であれば（ステップＳ６５；Ｙｅｓ）、
同一人物による音声と判定して（ステップＳ６７）、そ
の照合結果をＣＰＵ１０に出力する。

【００８６】同一人物による音声であると認証された場
合は、ＣＰＵ１０は登録データバッファ１１ｃに登録さ
れている特徴データに代えて、新規特徴データを登録特
徴データとして更新登録し（ステップＳ６８）、一連の
音声認証処理を終了する。

【００８７】以上説明したように、本実施の形態の音声
認証装置１は、音声認証処理部１１として、音声区間切
り出し処理部１１ａ、特徴抽出処理部１１ｂ、登録デー
タバッファ１１ｃ、及び特徴照合部１１ｄを備え、音声
区間切り出し処理部１１ａによって入力音声からエネル
ギー値に基づいて音声区間を切り出し、その音声区間に
ついての特徴データ（メルケプストラム）を特徴抽出処
理部１１ｂによって算出する。特徴データを算出する際
は、まず、８０Hz程度の低い音声まで基本周波数が検出
できるように細かくフーリエ変換し、ケプストラムを算
出し、その高ケフレンシー部に現れるピーク値が所定の
スレッシュ値より大きい場合はその区間を音声部分（有
声音）と判断して抽出する。次に、その抽出された音声
部分について、個人の特徴がよく現れるようにやや粗く
フーリエ変換し、ケプストラムを算出し、更にメル軸に
変換してメルケプストラムを算出し、その低ケフレンシ
ー部を特徴データとして抽出する。そして、抽出した特
徴データを登録データバッファ１１ｃに記憶しておく。

【００８８】また、新たに音声が入力された場合は、音
声区間切り出し処理部１１ａ、及び特徴抽出処理部１１
ｂにて同様の処理を行って、入力音声の音声部分につい
てのメルケプストラムの低ケフレンシー部を新規特徴デ
ータとして抽出する。そして、特徴照合部１１ｄによ
り、その新規特徴データと登録データバッファ１１ｃに
予め登録されている登録特徴データとをＤＰマッチング
により照合し、照合結果に基づいて新規音声が登録音声
と同一であるか認証する。

【００８９】従って、音声から特徴データを抽出する際
に、まずケプストラムを細かく算出して高ケフレンシー
部に現れるピーク値に基づいて音声部分であるか否かを
判別するため音声部分を的確に抽出できる。つまり、マ
イクに息がかかったときのようにエネルギー値が大きい
が音声でない部分を認証の対象から削除できる。その
後、粗いメルケプストラムを算出するため個人差をよく
表すことができる。そのため、音声認証に有用な音声部
分について個人の特徴をよく表した特徴データで各音声
を照合できるため、高性能な音声認証を行うことができ
る。

【００９０】また、特徴抽出処理部１１ｂでは、粗いメ
ルケプストラムを算出する際に、ケプストラムの高ケフ
レンシー部抽出の際に細かく計算したフーリエ変換の値
をダウンサンプリングして用いるので、フーリエ変換の
演算量を削減して高速な処理を行える。

【００９１】また、音声区間切り出し処理部１１ａによ
り、音声のエネルギー値に基づいて予め音声認証の処理
対象とする音声区間を切り出し、非音声区間についての
ケプストラム計算等の処理を省略できるため、一般に演
算に時間のかかるケプストラムの計算量を削減でき、よ
り高速な処理を行える。

【００９２】また、特徴照合部１１ｄでは、特徴データ
をＤＰマッチングにより照合する際に、所定の初期点群
については各点に適当な重み付けを行ってスコアを算出
し、その中で最適な始点を決定する。つまり音声の始点
に幅を持たせたＤＰマッチングを行えるため、「サ行」
や「シャ行」のように、フェードインする音声の照合率
を向上できる。

【００９３】更に、音声の終点についても、所定の終点
群については各点においてその点に適した重み付けで正
規化したＤＰマッチングの結果を比較して最適なものを
選択する。つまり、終点に幅を持たせたＤＰマッチング
を行えるため、延音で終わる音声の照合率を向上でき
る。

【００９４】また、認証の結果、新たに入力された音声
と登録された音声とが同一人物による音声であることが
認証された場合は、その新たに入力された音声の特徴デ
ータを予め登録されている登録特徴データに代えて更新
登録するため、音声の経年変化に追従した認証を行うこ
とが可能となり、認証率を向上できる。

【００９５】なお、上述の実施の形態では、粗い精度で
メルケプストラムを算出する際に予め細かく算出されて
いるフーリエ変換の値をダウンサンプリングして用いる
こととしたが、これに限定されるものではなく、入力音
声から粗い精度でフーリエ変換を計算し直すようにして
もよい。

【００９６】また、特徴照合部１１ｄでは、ＤＰマッチ
ングに用いるベクトル間距離としてユークリッド距離を
用いる例を示したが、これに限定されるものではなく、
例えばハミング距離ｄ＝(1/N)Σ｜(ｘn−ｙn)｜や、チェビシェフ距離ｄ＝max｜(ｘn−ｙn)｜を用いることとしてもよい。

【００９７】その他、上述の実施の形態に示した各種ス
レッシュ値（エネルギーのスレッシュ値、ケプストラム
の高ケフレンシー部のピーク値のスレッシュ値、ＤＰマ
ッチングの結果のスレッシュ値等）の具体的な数値は夫
々一例を示したものであり、本発明の趣旨を逸脱しない
範囲で適宜変更可能である。

【００９８】

【発明の効果】請求項１、７、及び８記載の発明によれ
ば、ケプストラムの高ケフレンシー部に表れる音声の基
本周波数を表すピーク値に基づいて音声部分を抽出する
ため、認証に有用な音声部分を的確に抽出できる。ま
た、その抽出した音声部分について、ある程度粗い精度
で特徴データを抽出するため音声の個人差をよく表せ
る。そのため、個人の認証に有用な音声部分を用いて特
徴データを照合することが可能になり、認証率を向上で
きる。

【００９９】請求項２記載の発明によれば、ケプストラ
ムを算出する際に予め計算されているフーリエ変換の値
をダウンサンプリングして、粗い精度のメルケプストラ
ムの計算を行うので、演算量を削減でき、高速に認証処
理を行うことができる。

【０１００】請求項３記載の発明によれば、予めエネル
ギー値に基づいて音声区間を切出し、切出された音声区
間について音声部分を抽出するので、一般に演算に時間
のかかるケプストラムの計算量を削減でき、高速に認証
処理を行うことができる。

【０１０１】請求項４記載の発明によれば、ＤＰマッチ
ングの終点付近の所定範囲内にある複数の点について、
各点までのＤＰマッチングの計算値をその点に適した重
み付けで正規化し、正規化された各ＤＰマッチングの計
算値のうち最適なものを選択してＤＰマッチングの結果
とするので、ＤＰマッチングの終点に幅を持たせた照合
が可能となり、延音で終わる音声の照合率を向上でき
る。

【０１０２】請求項５記載の発明によれば、ＤＰマッチ
ングの始点付近の所定範囲内にある複数の点における各
特徴データの距離をその点に適した値で重み付けし、そ
の重み付けされた距離のうち最適なものを選択してＤＰ
マッチングの始点値とするので、ＤＰマッチングの始点
に幅を持たせた照合が可能となり、例えばサ行やシャ行
等のフェードインする音声の照合率を向上できる。

【０１０３】請求項６記載の発明によれば、認証の結
果、新規入力された音声信号の特徴データが前記登録特
徴データと同一であると認証された場合は、その新規入
力された音声信号の特徴データを登録特徴データとして
更新登録するので、日々変化する音声に追従した音声認
証を可能とし、音声認証装置の性能を向上できる。

【図面の簡単な説明】

【図１】本願発明の音声認証装置の回路構成図である。

【図２】音声認証処理部１１の構成を示す機能ブロック
図である。

【図３】（ａ）は音声区間切り出し処理部１１ａの構成
例、（ｂ）はエネルギーのスレッシュ値Ｅｔの一例を説
明する図である。

【図４】特徴抽出処理部１１ｂによる特徴抽出の手順を
示す図である。

【図５】音声認証処理の全体的な流れを説明するフロー
チャートである。

【図６】音声区間切り出し処理を説明するフローチャー
トである。

【図７】特徴抽出処理を説明するフローチャートであ
る。

【図８】メルケプストラム算出処理を説明するフローチ
ャートである。

【図９】特徴照合処理を説明するフローチャートであ
る。

【符号の説明】

１音声認証装置１０ＣＰＵ１１音声認証処理部１１ａ音声区間切り出し処理部１１１ａハイパスフィルタ１１２ａエネルギー算出処理部１１３ａ音声区間切り出し部１１ｂ特徴抽出処理部１１ｃ登録データバッファ１１ｄ特徴照合部１２入力部１３表示部１４通信制御部１５音声入力部１６ＲＡＭ１７ＲＯＭ１８外部記憶装置１９記録媒体２０バス

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/20 Ｇ１０Ｌ 3/00 ５２１Ｐ 21/02 ５２１Ｈ 15/02 ５３３Ｃ // Ｇ１０Ｌ 101:04 3/02 ３０１Ｄ 101:16 9/16 ３０１Ａ

Claims

【特許請求の範囲】

【請求項１】入力された音声信号について、所定の精度
でケプストラムを算出し、その高ケフレンシー部に表れ
るピーク値に基づいて音声部分を抽出する音声部分抽出
手段と、この音声部分抽出手段により抽出された音声部分におけ
る音声信号について、前記精度より粗い精度でメルケプ
ストラムを算出し、その低ケフレンシー部を音声の特徴
データとして抽出する特徴抽出手段と、この特徴抽出手段により抽出された特徴データを登録す
る登録手段と、新規入力された音声信号について前記音声部分抽出手段
及び前記特徴抽出手段によって特徴データを抽出し、こ
の新規入力音声信号の特徴データと前記登録手段により
予め登録されている特徴データとをＤＰマッチングによ
り照合し、その照合結果に基づいて新規入力された音声
信号を認証する認証手段と、を備えることを特徴とする音声認証装置。
【請求項２】前記特徴抽出手段は、前記音声部分抽出手段によるケプストラム算出の際に計
算されるフーリエ変換の結果をダウンサンプリングし、
このダウンサンプリングした値からメルケプストラムを
算出することを特徴とする請求項１記載の音声認証装
置。
【請求項３】入力された音声信号から定常ノイズを除去
するフィルタと、フィルタにより定常ノイズが除去された音声信号につい
て所定の信号区間毎にエネルギー値を算出するエネルギ
ー算出手段と、エネルギー算出手段により算出されたエネルギー値に基
づいてケプストラム算出の対象とする信号区間を切り出
す対象区間切出手段と、を更に備え、前記音声部分抽出手段は、前記対象区間切出手段により
切出された信号区間について、前記ケプストラムを算出
することを特徴とする請求項１記載の音声認証装置。
【請求項４】前記認証手段は、前記各特徴データを照合
する際、ＤＰマッチングの終点付近の所定範囲内にある
複数の点について、各点までのＤＰマッチングの計算値
をその点に適した重み付けで正規化し、正規化された各
ＤＰマッチングの計算値のうち最適なものを選択してＤ
Ｐマッチングの結果とすることを特徴とする請求項１記
載の音声認証装置。
【請求項５】前記認証手段は、前記各特徴データを照合
する際、ＤＰマッチングの始点付近の所定範囲内にある
複数の点における各特徴データの距離をその点に適した
値で重み付けし、その重み付けされた距離のうち最適な
ものを選択してＤＰマッチングの始点値とすることを特
徴とする請求項１記載の音声認証装置。
【請求項６】前記認証手段による認証の結果、新規入力
された音声信号の特徴データが前記登録特徴データと同
一であると認証された場合は、その新規入力された音声
信号の特徴データを登録特徴データとして、予め登録さ
れている登録特徴データに代えて更新登録する更新登録
手段を更に備えることを特徴とする請求項１から５の何
れかに記載の音声認証装置。
【請求項７】入力された音声信号について、所定の精度
でケプストラムを算出し、その高ケフレンシー部に表れ
るピーク値に基づいて音声部分を抽出する音声部分抽出
工程と、この音声部分抽出工程により抽出された音声部分におけ
る音声信号について、前記精度より粗い精度でメルケプ
ストラムを算出し、その低ケフレンシー部を音声の特徴
データとして抽出する特徴抽出工程と、この特徴抽出工程により抽出された特徴データを登録す
る登録工程と、新規入力された音声信号について前記音声部分抽出工程
及び前記特徴抽出工程によって特徴データを抽出し、こ
の新規入力音声信号の特徴データと前記登録工程により
予め登録されている特徴データとをＤＰマッチングによ
り照合し、その照合結果に基づいて新規入力された音声
信号を認証する認証工程と、を含むことを特徴とする音声認証方法。
【請求項８】コンピュータに、入力された音声信号について、所定の精度でケプストラ
ムを算出し、その高ケフレンシー部に表れるピーク値に
基づいて音声部分を抽出する音声部分抽出機能と、この音声部分抽出機能により抽出された音声部分におけ
る音声信号について、前記精度より粗い精度でメルケプ
ストラムを算出し、その低ケフレンシー部を音声の特徴
データとして抽出する特徴抽出機能と、この特徴抽出機能により抽出された特徴データを登録す
る登録機能と、新規入力された音声信号について前記音声部分抽出機能
及び前記特徴抽出機能によって特徴データを抽出し、こ
の新規入力音声信号の特徴データと前記登録機能により
予め登録されている特徴データとをＤＰマッチングによ
り照合し、その照合結果に基づいて新規入力された音声
信号を認証する認証機能と、を実現させるためのプログラム。