JP2003044084A - 音声認証装置及び音声認証プログラム - Google Patents

音声認証装置及び音声認証プログラム

Info

Publication number
JP2003044084A
JP2003044084A JP2001231775A JP2001231775A JP2003044084A JP 2003044084 A JP2003044084 A JP 2003044084A JP 2001231775 A JP2001231775 A JP 2001231775A JP 2001231775 A JP2001231775 A JP 2001231775A JP 2003044084 A JP2003044084 A JP 2003044084A
Authority
JP
Japan
Prior art keywords
block
similarity
blocks
calculating
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001231775A
Other languages
English (en)
Inventor
Hiroyasu Ide
博康 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2001231775A priority Critical patent/JP2003044084A/ja
Publication of JP2003044084A publication Critical patent/JP2003044084A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 簡易的に抽出した母音部分のデータを利用す
ることにより、高速、かつ精度の高い音声認証を実現す
ることが可能な音声認証装置及び音声認証プログラムを
提供することを提供すること。 【解決手段】 入力された音声信号の線形予測残差信号
を算出する線形予測残差信号算出手段と、線形予測残差
信号算出手段によって算出された線形予測残差信号を周
波数変換する周波数変換手投と、周波数変換手投によっ
て変換された周波数データを複数のブロックに分割する
ブロック分割手段と、ブロック分割手段によって分割さ
れたブロック同士の類似度を算出する類似度算出手段
と、類似度算出手段によって算出された類似度があらか
じめ定められた類似度以上であるブロックのみを抜き出
すブロック抜出手段と、ブロック抜出手段によって抜き
出されたブロックに基づいて、音声信号の認証を行う認
証手段とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、記憶された音声サ
ンプルを用いて、話者の同一性を確認するための音声認
証装置及び音声認証プログラムに関し、特に、簡易的に
抽出した母音部分のデータを利用して、話者の同一性を
確認する音声認証装置及び音声認証プログラムに関する
ものである。
【0002】
【従来の技術】一般に、音声認証装置は、未知話者の音
声と利用者登録された音声の特徴から何らかのスコアを
計算し、予め設定された閾値と比較することによって、
本人かどうかの認証を行っている。
【0003】まず、利用者毎に予め決められた発声内容
の音声が登録される。これを登録音声又は照合用音声と
呼ぶ。実際には、利用者により音声が入力されると、そ
の音声信号から例えばスペクトル包絡情報が抽出され、
それが照合時のリファレンス用データとして保存され
る。
【0004】入力音声の照合時には、利用者により入力
された音声信号から、登録時と同様の分析によりスペク
トル包絡情報が抽出され、記憶してあるリファレンス用
データとのマッチング処理が行われる。そのマッチング
処理の結果、リファレンス用データとの違いが一定の閾
値以上であれば当該入力音声を他人のものであるとして
棄却し、その違いが一定の閾値以内であれば登録話者の
音声と同一の音声であると判断する。
【0005】より具体的には、2つの音声が同一人物の
ものであるかを照合する場合に、音声の特徴量を高速フ
ーリエ変換(FFT:Fast Fourie Tra
nsform)や線スペクトル対(LSP:Line
(ar) SpectrumPair)、ケプストラル
(cepstral)解析などの手段によって抽出し、
それらを比較する。比較の手段として、図5に示すよう
に、特徴ベクトル同士のユークリッド距離を比較する方
法や、図6に示すように、一方の音声の特徴ベクトルで
ベクトル量子化(VQ:Vector Quantiz
ation)テーブルを作成し、もう一方の音声の特徴
ベクトルをそのテーブルで量子化、その量子化歪みを調
べる方法などがある。
【0006】このようにすることにより、例えば、扉に
設けた電気錠を解錠したりするような処理の実行に移る
ことができる。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
音声認証装置は、以下のような問題点があった。すなわ
ち、音声の個人特徴は母音に集中すると考えられるが、
音声から母音だけを抽出する方法は難しく、多くの計算
量がかかってしまう。
【0008】また子音も混ぜた全体の平均を取った特徴
量を利用しているため、認証精度が低くなってしまう。
本発明は、上記のような課題を解決するためになされた
ものであって、簡易的に抽出した母音部分のデータを利
用することにより、高速、かつ精度の高い音声認証を実
現することが可能な音声認証装置及び音声認証プログラ
ムを提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は、上記課題を解
決するため、下記のような構成を採用した。すなわち、
本発明の一態様によれば、本発明の音声認証装置は、周
波数変換された線形予測残差信号の相関値の高い区間同
士が母音同士の比較であるとして、その区間のみで判別
を行う音声認証装置であって、入力された音声信号の線
形予測残差信号を算出する線形予測残差信号算出手段
と、上記線形予測残差信号算出手段によって算出された
線形予測残差信号を周波数変換する周波数変換手投と、
上記周波数変換手投によって変換された周波数データを
複数のブロックに分割するブロック分割手段と、上記ブ
ロック分割手段によって分割されたブロック同士の類似
度を算出する類似度算出手段と、上記類似度算出手段に
よって算出された類似度があらかじめ定められた類似度
以上であるブロックのみを抜き出すブロック抜出手段
と、上記ブロック抜出手段によって抜き出されたブロッ
クに基づいて、上記音声信号の認証を行う認証手段とを
備えたことを特徴とする。
【0010】また、好適には、本発明の音声認証装置
は、上記類似度算出手段が、上記ブロック分割手段によ
って分割された第1の音声信号に係るブロックと上記ブ
ロック分割手段によって分割された第2の音声信号に係
るブロックとの類似度を算出することが望ましい。
【0011】また、好適には、本発明の音声認証装置
は、相関値の算出時に、元の音声フレームと時間的に近
辺のみを対象とする事で、計算量を削減する音声認識装
置であって、上記周波数変換手投によって周波数変換さ
れた線形予測残差信号のある第1の音声信号に係るブロ
ックが、第2の音声信号に係る周波数変換された線形予
測残差信号に時間的に対応する位置を算出する対応位置
算出手段を備え、上記類似度算出手段が、上記対応位置
算出手段によって算出された対応位置からあらかじめ定
められた範囲内のブロックを算出対象の範囲とすること
が望ましい。
【0012】また、本発明の一態様によれば、本発明の
音声認証装置は、あらかじめ2回音声を取りこみ、母音
の場所・数を調べ、その区間を判別対象とする音声認証
装置であって、入力された音声信号の線形予測残差信号
を算出する線形予測残差信号算出手段と、上記線形予測
残差信号算出手段によって算出された線形予測残差信号
を周波数変換する周波数変換手投と、上記周波数変換手
投によって変換された周波数データを複数のブロックに
分割するブロック分割手段と、上記ブロック分割手段に
よって分割されたブロック同士の類似度を算出する類似
度算出手段と、上記類似度算出手段によって算出された
類似度があらかじめ定められた類似度以上であるブロッ
クのみを抜き出すブロック抜出手段と、上記ブロック抜
出手段によって抜き出されたブロックの位置情報を保持
するブロック位置情報保持手段と、上記音声信号の認証
を行う認証手段とを備え、登録時に、上記ブロック抜出
手段が、上記類似度算出手段によって算出された類似度
があらかじめ定められた類似度以上であるブロックのみ
を抜き出し、上記ブロック位置情報保持手段が、上記ブ
ロック抜出手段によって抜き出されたブロックの位置情
報を保持し、認証時に、上記認証手段が、上記ブロック
位置情報保持手段によって保持されたブロックに基づい
て上記音声信号の認証を行うことを特徴とする。
【0013】また、本発明の一態様によれば、本発明の
音声認証プログラムは、コンピュータに、入力された音
声信号の線形予測残差信号を算出する機能と、上記算出
された線形予測残差信号を周波数変換する機能と、上記
変換された周波数データを複数のブロックに分割する機
能と、上記分割されたブロック同士の類似度を算出する
機能と、上記算出された類似度があらかじめ定められた
類似度以上であるブロックのみを抜き出す機能と、上記
抜き出されたブロックに基づいて、上記音声信号の認証
を行う機能とを実現させるためのプログラムである。
【0014】また、本発明の一態様によれば、本発明の
音声認証プログラムは、コンピュータに、入力された音
声信号の線形予測残差信号を算出する機能と、上記算出
された線形予測残差信号を周波数変換する機能と、上記
変換された周波数データを複数のブロックに分割する機
能と、上記分割されたブロック同士の類似度を算出する
機能と、上記算出された類似度があらかじめ定められた
類似度以上であるブロックのみを抜き出す機能と、上記
抜き出されたブロックの位置情報を保持する機能と、上
記音声信号の認証を行う機能とを実現させるためのプロ
グラムであって、登録時に、上記ブロックを抜き出す機
能が、上記算出された類似度があらかじめ定められた類
似度以上であるブロックのみを抜き出し、上記ブロック
の位置情報を保持する機能が、上記抜き出されたブロッ
クの位置情報を保持し、認証時に、上記認証する機能
が、上記保持されたブロックに基づいて上記音声信号の
認証を行うことを実現させるためのプログラムである。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照しながら詳細に説明する。図1は、本発明が適
用される音声認証装置の回路構成図である。図1におい
て、音声認証装置1は、バス19に接続されたCPU1
1、入力部12、表示部13、通信制御部14、RAM
15、ROM16、外部記憶装置17で構成される。
【0016】外部記憶装置17には、プログラム、デー
タ等が予め記憶されており、この外部記憶装置17は、
磁気的記録媒体、光学的記録媒体、若しくは半導体メモ
リなどCPU11で読み取り可能な記録媒体18を含ん
だ構成である。この記録媒体18は、CD−ROM等の
可搬型の媒体やハードディスク等の固定的な媒体を含
む。また、この記録媒体18に格納するプログラム、デ
ータ等は、その一部若しくは全部をサーバやクライアン
トから通信回線などの伝送媒体を介して受信する構成に
してもよく、更に、上記記録媒体18は、ネットワーク
上に構成されたサーバの記録媒体であってもよい。更
に、上記プログラムを通信回線などの伝送媒体を介して
サーバやクライアントへ伝送して、これらの機器にイン
ストールするように構成してもよい。
【0017】すなわち、後述する実施の形態のシステム
を実現するフローチャートで示すソフトウェアは、プロ
グラムコードの形態で記録したRAM15やROM16
等のメモリ、記録媒体18を、音声認証装置1に供給
し、その音声認証装置1のコンピュータにプログラムコ
ードにより実現された機能を読み出して実現させること
によっても達成される。
【0018】この場合、記録媒体18から読み出された
プログラムコードにより実現された機能をコンピュータ
に実行させること自体が本発明の新規な機能を実現する
ことになり、そのプログラムコードを記録した記録媒体
等は本発明を構成することになる。
【0019】プログラムコードを供給するための可搬記
録媒体としては、上記CD−ROMやハードディスクの
他、例えば、フレキシブルディスク、光ディスク、光磁
気ディスク、CD−R、DVD−ROM、DVD−RA
M、磁気テープ、不揮発性のメモリーカード、ROMカ
ード、電子メールやパソコン通信等のネットワーク接続
装置(言い換えれば、通信回線)を介して記録した種々
の記録媒体などを用いることができる。
【0020】また、コンピュータがメモリ上に読み出し
たプログラムコードを実行することによって、後述する
実施の形態の機能が実現される他、そのプログラムコー
ドの指示に基づいて、コンピュータ上で稼動しているO
Sなどが実際の処理の一部または全部を行ない、その処
理によっても後述する実施の形態の機能が実現される。
【0021】さらに、記録媒体18から読み出されたプ
ログラムコードが、コンピュータに挿入された機能拡張
ボードやコンピュータに接続された機能拡張ユニットに
備わるメモリに書き込まれた後、そのプログラムコード
の指示に基づいて、その機能拡張ボードや機能拡張ユニ
ットに備わるCPUなどが実際の処理の一部または全部
を行ない、その処理によっても後述する実施の形態の機
能が実現され得る。
【0022】次に、本発明の第1の実施の形態について
説明する。線形予測による音声解析では、予測係数に音
声のホルマント成分が取り出され、残差信号に駆動信号
(基本周期)が残りやすいとされている。母音はある程
度しっかりした基本周期を持つが、子音にはあまり基本
周期が含まれない。つまり線形予測の残差信号を比較し
てやることで、母音かどうかを判断しやすくなる。
【0023】図2は、本発明が適用される第1の実施の
形態における音声認証処理の流れを示すフローチャート
であるまず、ステップS1において、入力音声の線形予
測分析を行い、残差信号を算出する。例えば、i番目の
音声のサンプルをxiで表すとした時、時刻tのサンプ
ルxtは、P個の過去xt-1、xt-pから予測できると仮
定し、その予測値をx’tとすると、
【0024】
【数1】
【0025】
【数2】
【0026】となる。この時のαiを線形予測係数、εt
を残差信号という。N個の音声サンプルを{xt}=
{x0,x1,・・・,xN-1}とした時、自己相関rτを
【0027】
【数3】
【0028】として、連立方程式
【0029】
【数4】
【0030】を解くことで線形予測係数が得られる。こ
の解は、「Durbinの再帰的解法」により効率的に
求められることが知られている。得られた線形予測係数
から残差信号を算出できる。次に、ステップS2におい
て、残差信号に含まれる基本周波数をよりわかりやすく
表すために、フーリエ変換を行う。
【0031】そして、ステップS3において、ステップ
S2でフーリエ変換した残差信号を一定長毎のブロック
(例えば0.35ms程度)に分割する。ステップS4
において、ステップS3で分割したブロックを、照合し
たい音声の残差信号のブロックと比較し、最も似ている
ブロック(相関係数の最も高いブロック)を探し出す。
図3は、ステップS4のブロック同士の比較のイメージ
を示す図であり、(a)の各ブロック毎に(b)の全ブ
ロックと比較する。
【0032】そして、ステップS5において、高い相関
を持つブロックが検出されたブロック同士が、母音を比
較していると考えられるので、この区間の音声データの
みを使って、認証を行う。似ているかどうかの指標に
は、例えば相関係数などを利用することができる。相関
係数は、以下の様に計算できる。
【0033】比較したい二つのベクトルX、Yを X={x1,x2,・・・,xn} Y={y1,y2,・・・,yn} とすると、平均値x〜,y〜は
【0034】
【数5】
【0035】
【数6】
【0036】標準偏差Sx、Sy
【0037】
【数7】
【0038】
【数8】
【0039】となり、相関係数rは
【0040】
【数9】
【0041】となる。相関係数は−1≦r≦1の値を取
り、似ているほど1に近くなる。母音部分を取り出すに
は、例えば相関係数が0.3以上で最も相関の高いブロ
ック同士を取り出すなどすればよい。認証処理は、最も
単純な方法は認証の対象となる相関の高いブロック同士
の相関係数の平均を取る事である。例えば、平均が0.
6以上のときに、同一人物の発声した音声と判断するこ
とが出来る。
【0042】すなわち、ステップS6において、相関係
数の平均が0.6以上であるか否かを判断し、0.6以
上であれば(ステップS6:Yes)、ステップS7に
おいて、同一人物であると認定し、0.6未満であれば
(ステップS6:No)、ステップS8において、他人
であると判定する。
【0043】なお、上記例ではFFTによって周波数変
換を行ったが、もちろん離散コサイン変換(DCT:D
iscrete Cosine Transform)
やウェーブレット(Wavelet)などの変換を利用
してもよい。相関の計算に相関係数を利用したが、誤差
エネルギーや差分の絶対値の合計などを利用してもよ
い。
【0044】また、認証時に同じ単語を発声していると
すれば、照合したい音声の残差信号のブロックと比較
し、最も似ているブロックを探し出す場合に、元のブロ
ック位置と対応する位置付近のみを検索村象とする事で
演算量を削減し、また精度を向上させることが出来る。
例えば、ブロック数をそれぞれxl、ylとした時、i
番日のブロックxiと似ているブロックをy側から検索
する場合の対応する位置ykとすると k=yl・i/xl なる。さらに、この近傍mを探すとすると、検索の村象
は y(yli/xl-m)〜y(yli/xl-m) となる。mは例えば、30などとする。
【0045】次に、本発明の第2の実施の形態について
説明する。上述の第1の実施の形態では、母音の判断に
あたって、2つの入力音声の母音が似ていると仮定した
が、より正確な判断のためには同一人物で行うべきであ
る。そこで、同一人物が2回同じ言菓を発声した音声を
入力として第1の実施の形態と同様に母音部分の抽出を
行う。認証時には、あらかじめ抽出された母音部分のみ
によって認証を行うことで、より精度を向上させること
が期待できる。
【0046】図4は、本発明が適用される第2の実施の
形態における音声認証処理の流れを示すフローチャート
である。まず、ステップS11において、登録処理であ
るか否かを判断することにより、登録処理と認証処理と
で処理を分ける。
【0047】登録の場合(ステップS11:Yes)
は、ステップS12において、同一人物が2回同じ言葉
を発声した音声から周波数変換された線形予測残差信号
を算出する。そして、ステップS13において、ステッ
プS12で算出した線形予測残差信号を一定長のブロッ
クに分割する。
【0048】ステップS14において、二つの音声の各
ブロックを比較して相関係数の最も高いブロックを探
す。ステップS15において、相関係数が0.3以上の
ブロックを母音として登録する。
【0049】一方、認証処理の場合(ステップS11:
Yes)は、ステップS16において、入力音声を周波
数変換して線形予測残差信号を算出する。その後、ステ
ップS17において、ステップS16で算出した線形予
測残差信号を一定長のブロックに分割する。
【0050】さらに、ステップS18において、登録さ
れた母音のブロックと入力音声の各ブロックを比較し、
相関係数の最も高いブロックを探す。そして、ステップ
S19において、それら相関係数の平均が0.6以上で
あるか否かを判断する。
【0051】ステップS19で0.6以上であると判断
された場合(ステップS19:Yes)は、ステップS
20において、同一人物の発声した音声と判断する。ま
た、ステップS19で0.6未満であると判断された場
合(ステップS19:No)は、ステップS21におい
て、他人であると判定する。
【0052】なお、ステップS12における登録時の位
置検出の入力は、もちろん2回と言わず、複数回行って
もよい。以上、図2および図4のフローチャートを用い
て、本発明が適用される音声認証処理の流れを説明して
きたが、これらのフローチャートは、上記CPU11が
読み取り可能なプログラムコードの形態で上記記録媒体
18に格納されていたり、また、全ての機能を上記記録
媒体18に格納したりする必要は無く、必要に応じて、
その一部若しくは全部をWANやLANなどのネットワ
ーク或いは上記インターネットを介して上記通信制御部
14から受信して実現するようにしても良い。
【0053】上述のように、本発明の実施の形態を、図
面を参照しながら説明してきたが、本発明は、以上に述
べた実施の形態に限定されるものではなく、本発明の要
旨を逸脱しない範囲内で種々の構成または形状を取るこ
とが出来る。
【0054】
【発明の効果】以上説明してきたように、本発明によれ
ば、残差信号の類似度を基準にする事で簡易的に母音の
位置を決定し、それを認証に利用することで認証精度の
向上を行うことが出来る。
【0055】また、本発明によれば、登録時に同一人物
が2回同じ言葉を発声した音声から母音部分の抽出を行
う事で、より高精度に母音を抽出し、認証精度の向上を
図ることができる。
【図面の簡単な説明】
【図1】本発明が適用される音声認証装置の回路構成図
である。
【図2】本発明が適用される第1の実施の形態における
音声認証処理の流れを示すフローチャートである
【図3】ブロック同士の比較のイメージを示す図であ
る。
【図4】本発明が適用される第2の実施の形態における
音声認証処理の流れを示すフローチャートである
【図5】特徴ベクトル同士のユークリッド距離を比較す
る方法(従来の第1の音声認証方法)を説明するための
図である。
【図6】一方の音声の特徴ベクトルでベクトル量子化テ
ーブルを作成し、もう一方の音声の特徴ベクトルをその
テーブルで量子化、その量子化歪みを調べる方法(従来
の第1の音声認証方法)を説明するための図である。
【符号の説明】
1 音声認証装置 11 CPU 12 入力部 13 表示部 14 通信制御部 15 RAM 16 ROM 17 外部記憶装置 18 記録媒体 19 バス

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号の線形予測残差信号
    を算出する線形予測残差信号算出手段と、 前記線形予測残差信号算出手段によって算出された線形
    予測残差信号を周波数変換する周波数変換手投と、 前記周波数変換手投によって変換された周波数データを
    複数のブロックに分割するブロック分割手段と、 前記ブロック分割手段によって分割されたブロック同士
    の類似度を算出する類似度算出手段と、 前記類似度算出手段によって算出された類似度があらか
    じめ定められた類似度以上であるブロックのみを抜き出
    すブロック抜出手段と、 前記ブロック抜出手段によって抜き出されたブロックに
    基づいて、前記音声信号の認証を行う認証手段とを備え
    たことを特徴とする音声認証装置。
  2. 【請求項2】 前記類似度算出手段は、前記ブロック分
    割手段によって分割された第1の音声信号に係るブロッ
    クと前記ブロック分割手段によって分割された第2の音
    声信号に係るブロックとの類似度を算出することを特徴
    とする請求項1に記載の音声認証装置。
  3. 【請求項3】 前記周波数変換手投によって周波数変換
    された線形予測残差信号のある第1の音声信号に係るブ
    ロックが、第2の音声信号に係る周波数変換された線形
    予測残差信号に時間的に対応する位置を算出する対応位
    置算出手段を備え、 前記類似度算出手段は、前記対応位置算出手段によって
    算出された対応位置からあらかじめ定められた範囲内の
    ブロックを算出対象の範囲とすることを特徴とする請求
    項1に記載の音声認証装置。
  4. 【請求項4】 入力された音声信号の線形予測残差信号
    を算出する線形予測残差信号算出手段と、 前記線形予測残差信号算出手段によって算出された線形
    予測残差信号を周波数変換する周波数変換手投と、 前記周波数変換手投によって変換された周波数データを
    複数のブロックに分割するブロック分割手段と、 前記ブロック分割手段によって分割されたブロック同士
    の類似度を算出する類似度算出手段と、 前記類似度算出手段によって算出された類似度があらか
    じめ定められた類似度以上であるブロックのみを抜き出
    すブロック抜出手段と、 前記ブロック抜出手段によって抜き出されたブロックの
    位置情報を保持するブロック位置情報保持手段と、 前記音声信号の認証を行う認証手段とを備え、 登録時に、前記ブロック抜出手段が、前記類似度算出手
    段によって算出された類似度があらかじめ定められた類
    似度以上であるブロックのみを抜き出し、前記ブロック
    位置情報保持手段が、前記ブロック抜出手段によって抜
    き出されたブロックの位置情報を保持し、 認証時に、前記認証手段が、前記ブロック位置情報保持
    手段によって保持されたブロックに基づいて前記音声信
    号の認証を行うことを特徴とする音声認証装置。
  5. 【請求項5】 コンピュータに、 入力された音声信号の線形予測残差信号を算出する機能
    と、 前記算出された線形予測残差信号を周波数変換する機能
    と、 前記変換された周波数データを複数のブロックに分割す
    る機能と、 前記分割されたブロック同士の類似度を算出する機能
    と、 前記算出された類似度があらかじめ定められた類似度以
    上であるブロックのみを抜き出す機能と、 前記抜き出されたブロックに基づいて、前記音声信号の
    認証を行う機能と、 を実現させるための音声認証プログラム。
  6. 【請求項6】 コンピュータに、 入力された音声信号の線形予測残差信号を算出する機能
    と、 前記算出された線形予測残差信号を周波数変換する機能
    と、 前記変換された周波数データを複数のブロックに分割す
    る機能と、 前記分割されたブロック同士の類似度を算出する機能
    と、 前記算出された類似度があらかじめ定められた類似度以
    上であるブロックのみを抜き出す機能と、 前記抜き出されたブロックの位置情報を保持する機能
    と、 前記音声信号の認証を行う機能とを実現させるためのプ
    ログラムであって、 登録時に、前記ブロックを抜き出す機能が、前記算出さ
    れた類似度があらかじめ定められた類似度以上であるブ
    ロックのみを抜き出し、前記ブロックの位置情報を保持
    する機能が、前記抜き出されたブロックの位置情報を保
    持し、 認証時に、前記認証する機能が、前記保持されたブロッ
    クに基づいて前記音声信号の認証を行うことを実現させ
    るための音声認証プログラム。
JP2001231775A 2001-07-31 2001-07-31 音声認証装置及び音声認証プログラム Pending JP2003044084A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001231775A JP2003044084A (ja) 2001-07-31 2001-07-31 音声認証装置及び音声認証プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001231775A JP2003044084A (ja) 2001-07-31 2001-07-31 音声認証装置及び音声認証プログラム

Publications (1)

Publication Number Publication Date
JP2003044084A true JP2003044084A (ja) 2003-02-14

Family

ID=19063787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001231775A Pending JP2003044084A (ja) 2001-07-31 2001-07-31 音声認証装置及び音声認証プログラム

Country Status (1)

Country Link
JP (1) JP2003044084A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881291A (zh) * 2012-10-24 2013-01-16 兰州理工大学 语音感知哈希认证的感知哈希值提取方法及认证方法
CN102915740A (zh) * 2012-10-24 2013-02-06 兰州理工大学 可实现篡改定位的语音感知哈希内容认证方法
CN104835499A (zh) * 2015-05-13 2015-08-12 西南交通大学 基于时-频域趋势变化的密文语音感知哈希及检索方案

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102881291A (zh) * 2012-10-24 2013-01-16 兰州理工大学 语音感知哈希认证的感知哈希值提取方法及认证方法
CN102915740A (zh) * 2012-10-24 2013-02-06 兰州理工大学 可实现篡改定位的语音感知哈希内容认证方法
CN102915740B (zh) * 2012-10-24 2014-07-09 兰州理工大学 可实现篡改定位的语音感知哈希内容认证方法
CN104835499A (zh) * 2015-05-13 2015-08-12 西南交通大学 基于时-频域趋势变化的密文语音感知哈希及检索方案

Similar Documents

Publication Publication Date Title
US10699699B2 (en) Constructing speech decoding network for numeric speech recognition
US9218809B2 (en) Fast, language-independent method for user authentication by voice
US7657432B2 (en) Speaker recognition method based on structured speaker modeling and a scoring technique
US20090171660A1 (en) Method and apparatus for verification of speaker authentification and system for speaker authentication
US8447614B2 (en) Method and system to authenticate a user and/or generate cryptographic data
US7962336B2 (en) Method and apparatus for enrollment and evaluation of speaker authentification
US20070124145A1 (en) Method and apparatus for estimating discriminating ability of a speech, method and apparatus for enrollment and evaluation of speaker authentication
JP4515054B2 (ja) 音声認識の方法および音声信号を復号化する方法
US7315819B2 (en) Apparatus for performing speaker identification and speaker searching in speech or sound image data, and method thereof
US7050973B2 (en) Speaker recognition using dynamic time warp template spotting
JP2005078077A (ja) 非線形予測子およびターゲットによって案内される時間的制約を使用して声道共鳴を追跡する方法および装置
Rabiner et al. Some performance benchmarks for isolated work speech recognition systems
Aronowitz et al. Efficient speaker recognition using approximated cross entropy (ACE)
US20070129944A1 (en) Method and apparatus for compressing a speaker template, method and apparatus for merging a plurality of speaker templates, and speaker authentication
JP2003044084A (ja) 音声認証装置及び音声認証プログラム
JP2002169592A (ja) 情報分類・区分化装置、情報分類・区分化方法、情報検索・抽出装置、情報検索・抽出方法、記録媒体および情報検索システム
WO2002029785A1 (en) Method, apparatus, and system for speaker verification based on orthogonal gaussian mixture model (gmm)
JP2009116278A (ja) 話者認証の登録及び評価のための方法及び装置
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
CN108630207B (zh) 说话人确认方法和说话人确认设备
JP2710045B2 (ja) 音声認識方法
JP5136621B2 (ja) 情報検索装置及び方法
Meghanani et al. Pitch-synchronous DCT features: A pilot study on speaker identification
Zhou et al. Novel discriminative vector quantization approach for speaker identification
JP4734771B2 (ja) 情報抽出装置及び方法