JPH01302297A - 話者認識装置 - Google Patents

話者認識装置

Info

Publication number
JPH01302297A
JPH01302297A JP63132049A JP13204988A JPH01302297A JP H01302297 A JPH01302297 A JP H01302297A JP 63132049 A JP63132049 A JP 63132049A JP 13204988 A JP13204988 A JP 13204988A JP H01302297 A JPH01302297 A JP H01302297A
Authority
JP
Japan
Prior art keywords
word
speaker
voice
random number
speaker recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63132049A
Other languages
English (en)
Inventor
Yukio Tabei
田部井 幸雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63132049A priority Critical patent/JPH01302297A/ja
Publication of JPH01302297A publication Critical patent/JPH01302297A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、単語辞書に格納されでいる単語名を読出し
て話者が入力すべき複数の単語の発声を入力指示部から
指示し、この指示に従って発声された音声を分析して得
た特徴パラメータと、標準パターンメモリに予め格納さ
れていて読出された単語名に対応して出力された標準パ
ターンとを比較することによって個人情報の差により話
者を照合する話者認識装置に関する。
(従来の技術) 話者認識の一方式として話者照合方式がある。
この話者照合方式には、認識のために発声させる単語或
いは言葉を予め決めておくすなわち発話内容を固定して
おく方式と、話者が発声する単語や言葉を任意に決定出
来るすなわち発話内容に依存しない方式とがある。
前者の発話内容固定方式では、1〜数単語の音声入力を
基にして、話者認識を求めた主が本人が否かを判定する
一方、後者の発声内容に依存しない方式では、話者本人
の音声であれば何を話しても良いが、音声の中から音韻
゛1に独立な個人性を抽出するのは難しく、認識1能を
高めることが困難である。
先ず、この発明の説明に先立ち、従来の話者認識装置の
典型的な構成例につき簡単に説明する。第2図は固定単
語で固定発声順序で話者認識を行うための話者認識装置
を示すブロック図である。l。
は話者認識装置で、話者認識部12とその制御部14と
を以って構成してある。話者認識部12にはキーボード
又はコード読取手段等から成る話者コード送出部16が
あり、この話者コード送出部16によって制御部14へ
認識を要求する本人が自分の話者コードを知らせる。入
力された話者コードが制御部14内のメモリに登録済み
の話者コードと一敗した場合に、制御部14から制御信
号を単語辞書18に送り、この単語群′:s+8から一
定の順序で複数の単語名を読出しこれを読出し順に従っ
て、入力指示部20へ送り、この入力指示部20で発声
メニューとして出力する。この出力は聴覚表示でも視覚
表示でも、或いはその他の表示方法であっても良い。
一方、この単語群、1F18から出力された単語名は標
準パターンメモリ22にも送られ、対応する標準パター
ンか出力される。
認識を要求する話者はマイクロフォン或いは電話等とい
った音声入力部24に向ってこの発声メニューに従って
発声し、電気信号の音声信号に変換された猾、認識処理
部26に送られる。この従来例では、音声信号に対し認
識処理部26の前処理部2日で適切な利得調整と雑音成
分の除去等を行った後、特徴抽出部30及び音声区間検
出部32に送られる。特徴抽出部30では入力されを音
声信号を分析し、個人の識別に有効な特徴パラメータの
時系列を比較部34に出力する。この特徴抽出は音声区
間検出部32で検出された入力音声の始端と終端で定ま
る音声区間毎に行われる。比較部34ては、標準パター
ンメモリ22から読出された、入力音声に対応した標準
パターンの時系列とこの特徴パラメータの時系列とを比
較して距離計算を行う、一般に音声は同一単語を同一人
物が発声しても、その時間構造は非線形に伸縮している
ので、比較部34においでは、入力音声の始端、材端情
報を基(こして、通常は、非線形なマツチングを行う。
距離計算の結果は照合部36に送られ、そこで、話者コ
ード毎に定められた閾値と距離との判定を所定回数だけ
行い、距離の方が閾値よつも小さいときは、話者が本人
であるとみなして結果出力端子38に合格信号を出力す
る。また、距離の方が大きいときは、話者が本人でない
と判断し、不合格信号を出力をする。尚、制m部14は
、話者認識部12の各構成成分の動作のタイミングを取
ったり、その他の所要の制御を行うように、これら各構
成成分と信号のやりとりが出来るように構成してある。
一方、発声内容に依存しない方式の従来の話者認識装置
では、前述した認識処理部26の構成が異なるが、入力
音声の特y!lを抽出しこれを標準パターンと比較後、
判定を行ってその結果を出力する構成となっている。
(発明が解決しようとする課題) しかしながら、従来の発声内容固定方式及び発声内容に
依存しない方式のいずれの方式に基づく話者認識装置に
おいても、他人が別の求人の音声を録音しておいて、こ
の他人が録音音声の再生音を話者認識装置の音声入力部
に本人であると偽って入力させた場合にはこの他人を本
人であると認識してしまうという問題点があった。すな
わち、本人であると偽る者への対策は全く考慮されでい
なかった。
このように、従来の話者認識装置ては、他人を本人であ
ると誤る第2種の誤り(詐称者受理)の測定では、録音
音声を認識対象としていない。
このような悪質な犯罪者への対応は、実用環境での運営
上は、気密保持の観点から重要であるが、従来の話者認
識装置では無防備であった。
この発明の目的は、上述した従来の問題点に鑑み、本人
以外の者が本人の録音音声を用いて話者認識を行った際
には話者認識を末めを者が本人ではないと認識出来るよ
うに構成した、認識性の優れた話者認識装置を提供する
ことにある。
(課題を解決するための手段) この目的の達成を図るため、この発明の話者認識装置に
よれば、単語辞書から単語名を読出すために当該単語辞
書に対しアドレス信号として乱数を供給する乱数発生部
を設けたことを特徴する。
(作用) ■述した構成によれば、単語辞書の読出しのアドレス信
号として乱数発生装置から出力される乱数を用いている
ので、単語辞書からはこれら出力された乱数に対応した
単語名が読出されるので、単語名の読出し順序はランダ
ムとなってあり、話者に槽数の単語をランダムな順序で
発声させるための指示を入力指示部に与えることが出来
ると共に、該指示の順序に従って標準パターンを出力さ
せるための指令を標準パターンメモリに与えることが出
来る。
これがため、この乱数の発生する順序が話者認識毎に異
なるため、決った単語の系列を発声する指示を与えるこ
とが無く、よって入力音声のカテゴリーが毎回異なる。
従って、詐称者が本人の声を録音しておき、不正に使用
しようとしても、録音音声は常に一定配列の単語から成
っているので、これを用いでも本人であると誤って話者
認識されることがない。
(実施例) 以下、図面を参照して、この発明の話者認識装置の実施
例につき説明する。
第1図は、この発明の話者認識装置の一実施例を示すブ
ロック図である。同図においで、第2図に示した従来装
置の構成要件と同一の構成要件については同一の符号を
付して示し、その詳細な説明を省略する。
この発明では、単語辞書18から単語名を読出すために
当該単語辞書18に対しアドレス信号として乱数を供給
する乱数発生部40を設ける。この乱数発声部40は制
御部14によってタイミング、その他の所要の制御が行
われるように構成されている。
この乱数発生部40から、−回の話者認識の要求時1こ
任意に定めた所定個数のそれぞれ異る乱数を順次に発生
する。単語群!+8には予めいくつかの単語名を格納し
ておき、乱数発生部40がら発生させることが出来る乱
数をそれぞれアドレス信号として対応する単語名をそれ
ぞれ読出すことが出来るように構成する。
次に、この発明の話者認識装置の動作例につき説明する
先ず、話者認識を求める者(以下、単に依頼者と称する
場合もある。)が発声の前に話者コード選出部16によ
って自己の話者コードを制御部14に知らせ、登録済み
のコードであると確認されると、制御部14からの指令
によって話者認識部12の他の構成要件が始動を開始す
る。従って、乱数発声部40からは、任意の個数及び順
序で乱数が出力されて単語群M18に送られる。
この単語群118はそれぞれの乱数をアドレス信号とし
てそれぞれのアドレスに予め格納されている単語名をj
@次に出力し入力指示部20及び標準パターンメモリ2
2へ入力させる。入力指示部20は順次に入力される単
語名に応答して単語名の受偲と同時に又は受信復−括し
て発声メニューを依頼者に表示する。この発声メニュー
の表示は所要に応じて一回又は二回以上繰り返し行うよ
うに行使することが出来る。なあ、ここでは、入力指示
部20は表示による入力指示を行なうものを示したが、
これに代えて音声合成器を用いた音声による入力指示を
行なうものを用いることもできる。
依頼者は音声入力部24に向ってこの発声メニューに従
って所要回数発声を行う。この音声入力部24からの入
力音声は従来と同様に認識処理部26に送られ、前処理
部28を経て特徴抽出部3oで特徴パラメータの時系列
の出力を得、この出力を比較部34に入力する。
一方、この比較部34には、前述した乱数に対応して単
語辞書18から順次に出力された単語名に応答して、標
準パターンメモリ22がら標準パターンの時系列が入力
される。この場合、当然のことながら、両時系列信号の
タイミングが取られている。
比較部34において、これら特徴パラメータの時系列の
内容と、標準パクーンの時系列の内容とが音声区間毎に
比較されて、それぞれの距離出力が照合部36に送られ
る。
照合部36において、予め定めた闇値と比較して合格又
は不合格信号を結果出力端子38に出力し、その結果を
外部の任意好適な処理装置又は表示装置に送り、−回の
話者認識処理を終了する。
このように、この発明では、乱数発声部40ヲ設けて、
話者認識要求毎に、これより発声する乱数に対応した単
語名を出力させて発声メニューを与えるので、その都度
ランダムな音声入力を得で話者の照合を行うことが出来
る。従って、二回又はそれ以上の話者認識が要求される
と、話者コードの確認を含め或いは含めずに、同様な処
理を繰り返すが、その場合には、それより前の回の場合
とは発声する乱数及び又はその発声順序が異なるので、
各認識要求毎に発声メニューが異なり、異なった音声入
力に対し話者照合が行われる。
これかため、この発明の装置では発声の一定順序による
癖かつきにくい。しかも、決った単語の系列の発声を繰
り返し発声することがないので、他人の録音音声を使用
した詐称者の不正な使用を、この話者認識装置によって
防ぐことが出来、信頼′注に優れている。
この発明は上述した実施例にのみ限定されるものではな
く多くの変形及び変更を行うことが出来る。例えば、上
述した乱数発声部40からの乱数の発生法として、M系
列信号を用いる方法や、その他の任意好適な方法が使用
することが出来る。
また、認識処理部の構成も上述した従来及び実施例で説
明した構成以外の任意好適な構成であっても良い。
(発明の効果) 上述した説明からも明らかなように、この発明の話者認
識装置によれば、乱数を発生させてそれに対応した単語
名に基づき発声メニューを指示させる構成となっている
ので、話者照合を行う為の入力音声のカテゴリーを毎回
異なった順で変化させることができ、従って、発声の一
定順序による癖がつきにくく、さらには、決った単語の
系列を発声することがないので詐称者が本人の録音音声
で不正に使用しようとしても、その使用を無効と出来る
。よって、この発明の話者認識装置は、従来よりも信W
I性の優れた装置である。
【図面の簡単な説明】
第1図はこの発明の話者認識装置の一実施例を示すブロ
ック図、 第2図は従来の話者認識装置の構成例を示すブロック図
である。 10・・・話者認識部!、  12・・・話者認識部1
4・・・制御部、     16・・・話者コード送出
部18・・・単語辞書、    20・・・入力指示部
22・・・標準パターンメモリ 24・・・音声入力部、   26−・・認識処理部2
8・・・前処理部、    30・・・特徴抽出部32
・・・音声区間検出部、 34・・・比較部36・・・
照合部、     38・・・結果出力端子40・・・
乱数発生部。

Claims (1)

    【特許請求の範囲】
  1. (1)単語辞書に格納されている単語名を読出して話者
    が入力すべき複数の単語の発声を入力指示部から指示し
    、該指示に従って発声された音声を分析して得た特徴パ
    ラメータと、標準パターンメモリに予め格納され読出さ
    れた前記単語名に対応した標準パターンとを比較するこ
    とによって個人情報の差により話者を照合する話者認識
    装置において、 単語辞書から単語名を読出すために当該単語辞書に対し
    アドレス信号として乱数を供給する乱数発生部 を具えることを特徴とする話者認識装置。
JP63132049A 1988-05-30 1988-05-30 話者認識装置 Pending JPH01302297A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63132049A JPH01302297A (ja) 1988-05-30 1988-05-30 話者認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63132049A JPH01302297A (ja) 1988-05-30 1988-05-30 話者認識装置

Publications (1)

Publication Number Publication Date
JPH01302297A true JPH01302297A (ja) 1989-12-06

Family

ID=15072330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63132049A Pending JPH01302297A (ja) 1988-05-30 1988-05-30 話者認識装置

Country Status (1)

Country Link
JP (1) JPH01302297A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893057A (en) * 1995-10-24 1999-04-06 Ricoh Company Ltd. Voice-based verification and identification methods and systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893057A (en) * 1995-10-24 1999-04-06 Ricoh Company Ltd. Voice-based verification and identification methods and systems

Similar Documents

Publication Publication Date Title
US7447632B2 (en) Voice authentication system
JP4672003B2 (ja) 音声認証システム
US10476872B2 (en) Joint speaker authentication and key phrase identification
US6411933B1 (en) Methods and apparatus for correlating biometric attributes and biometric attribute production features
US20030074201A1 (en) Continuous authentication of the identity of a speaker
US4694493A (en) Speaker verification system
KR100297833B1 (ko) 비고정 연속 숫자음을 이용한 화자 검증 시스템 및 그 방법
JP2002514318A (ja) 録音された音声を検出するシステムおよび方法
WO2020045204A1 (ja) 生体認証装置、生体認証方法および記録媒体
US10957318B2 (en) Dynamic voice authentication
KR20140076056A (ko) 음성 기반 캡차 방법 및 장치
JPS62502571A (ja) 音声分析による個人の識別
KR20110079161A (ko) 이동 단말기에서 화자 인증 방법 및 장치
JPH01302297A (ja) 話者認識装置
JP4440414B2 (ja) 話者照合装置及び方法
Gupta et al. Text dependent voice based biometric authentication system using spectrum analysis and image acquisition
WO2000058947A1 (en) User authentication for consumer electronics
JP2001350494A (ja) 照合装置及び照合方法
WO2006027844A1 (ja) 話者照合装置
Marinov Text dependent and text independent speaker verification system: Technology and application
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
KR101838947B1 (ko) 불완전한 발음에 적용 가능한 화자인증방법 및 장치
JP2864511B2 (ja) 話者識別方式と装置
KR19990009682A (ko) 화자인식 원격 클라이언트 계정 검증 시스템 및 화자검증방법
Hemavathi et al. Spectro-temporal features for audio replay attack detection