JPS5876893A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5876893A
JPS5876893A JP56174109A JP17410981A JPS5876893A JP S5876893 A JPS5876893 A JP S5876893A JP 56174109 A JP56174109 A JP 56174109A JP 17410981 A JP17410981 A JP 17410981A JP S5876893 A JPS5876893 A JP S5876893A
Authority
JP
Japan
Prior art keywords
pattern
standard pattern
standard
confirmation
suppression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56174109A
Other languages
English (en)
Inventor
迫江 博昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56174109A priority Critical patent/JPS5876893A/ja
Priority to US06/436,978 priority patent/US4581755A/en
Publication of JPS5876893A publication Critical patent/JPS5876893A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Collating Specific Patterns (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声認識装置に関し、特に話者確認機能t 4
h*た音声認識装置に関する。
人間の発声による音声を分析検定して、登録されている
本人か否かを判定する話者確認システムは銀行における
本人証明手段や、入出門管理システムへの応用が考えら
れ、実用化が待九れている。
話者確認は時として話者認識あるいは話者照合とも呼ば
れ、長期間研究されている。従来試みられて来た話者確
認手法は、新美康永著、共立出版株式会社、昭和54年
10月発行の「音声認識」の第213ページに記されて
いる如く、パターンマ、チック法に基づいて動作してい
る。
すなわち、登録されている話者の合い言葉の音声パター
ンを標準パターンAとしてあらかじめ記憶しておき、実
動時においては話者が発声入力する合い言葉音声パター
ンXをこの標準パターンと比較して相違FEB(X、A
)f算出する。この相違度が所定の閾値θよシ小さい場
合は入力され九し、この話者は登録されている本人であ
ると判定する。逆に相違度が閾値θよシ大きな場合には
不一致とみなし、この岐者は詐称者“であると判定する
以上、述べたような従来の話者確認機能をもった音声認
識装置の信頼性は、閾値0の設定の大きさによって大色
く左右される。話者確認機能の哄動作としては、登録話
者本人を詐称者として判定するという誤りジエクト、他
人を登録話者と認めてしまうという誤受容の2種が生じ
うる。閾値θを低く設定すると誤受容は少なくなるがl
la 17ジエクトが増加する。逆に閾値Oを高く設定
すると誤りジエクトは減少するが誤受容が増加する。
銀行の本人確認や入出門管理などへの応用では誤受容が
引き起す結果の重大性を考慮して閾値θを低めに設定す
べきであると考えられている。その結果、必然的に発生
する誤りジエクトに対しては1本人の合い言葉音声が正
しく受容されるまで、何回か繰ヤ返して発声するという
方法が取られている。しかし、このような方法は銀行の
本人確認の場合にはサービスの低下を生起し、入出門管
理においては緊急に必要な入出rが阻止されるという不
便を生じる。
本発明は在来技術の有する上記欠点を改良し、誤りジエ
クトおよび誤受容の双方を低減し、高信頼性の認識結果
が得られる話者確認機能を有する音声認識装置を実現し
提供することを目的としている。
本発明による音声認識装置は、あらかじめ定められ九言
葉の音声パターンを確認標準パターンとして記憶し、か
つ前記言葉と類似関係にあるが暴なる言語の音声パター
ンを抑制標準パターンとして記憶してなる標準バタ、−
ン記憶部と、入力される音声パターンと上記確認標準パ
ターン及び抑制標準パターンとの間の相違度をそれぞれ
算出するパターン比較部と、上記確認標準パターンに関
する相違度が所定の閾値より小でかつ抑制標準パターン
に関する相違度よりも小であるときに限って一致確認信
号を出力し、それ以外の場合には認識結果を却下する(
出力をしない)判定出力部とを含み構成される。
以下に1図面を参照して本発明の詳細な説明する。第1
図は本発明の一実施例を示すプロ、り図である。受信部
(例えばマイクロホン)10よ少入力された音声信号は
分析部20によりて周波数分析される。この分析部20
としては例えばバンドパスフィルタによる分析機能を有
し、10m5の分析フレーム周期で時間標本化が行なわ
れ、かつディジタル信号に符号化する4のでよい、又、
このようにして得られる音声パターンはベクトルの時系
列として表現される。
本装置の動作は登録と確認の2種のモードに分けられる
。登録モードではスイッチ30は端子31側に接続され
る。発声入力される音声パターンは標準パターンとして
標準パターン記憶部40に記憶される。標準パターンは
確認標準パターンと抑制標準パターンとよ秒成りている
。ここでは例として合い言葉/fojiaan/を用い
るとする。
登録される人はこの合い言葉を発声して確認標準パター
ンとして入力する他、抑制用標準パターンとして、/ 
fuj 1san / 、 / fu jesan /
 。
/fujison/の3種を発声入力しておく。かくし
て得られる標準パターンを確認標準パターンA。
抑制標準パターンX、、X、、λ易と示す。これらはそ
れぞれ確認標準パターン°領域41と抑制標準パターン
領域42とに記憶される。
確認モードではスイッチ30は端子32側に接続される
。登録話者本人であると主張する人が合い言葉となる音
声を発声すると1分析部20の出力は入カバターンバッ
ファ50に入力される。パターン比較部60ではこの入
カバターンXと前記の標準パターンA、λ1.X2.λ
3 のそれぞれとの比較が行なわれ、相違[D(X、A
)、D(X、λ1)−D(X−λ、L n(x、λ、)
が算出されて判定部70に送られる。
第1図に破線プロ、りで示す判定部70は最小値選択検
定部71、閾値回路72、およびANDゲート73よシ
成りている。最小値選択検定部71では上記の相違度が
比較され、その最小値が信号りとして出力される。また
、この最小値に対応する標準パターンが、確認標準パタ
ーンAであった場合には第1確認信号h=1が出力され
るが、抑制標準パターンλ□、r、、λ3 のいずれか
であった場合には11=Qとされる。閾値回路72では
前記最小値信号りが閾値θと比較されD〈θの時は第2
確認信号g=1が出力されるが、D≧θの時はg=Qと
される。ANDゲート73では第1確認信号りと第2確
認信号gとの論理積が計算され、その結果が確認信号p
として出力される。
これまでの説明から分るように、この確認信号pは入カ
バターンXと確認パターンAとの相違度が最小になシ、
かつ最小値が閾値0よ抄も小になった場合に限って1と
なる。
かくの如く抑制標準パターンを用いると、登録話者以外
の人が合い言葉/fojisan/と発生しても登録さ
れた人との音質の相違によって抑制標準パターンに近く
なる場合が少なからず発生する。
このような場合には詐称者は正確に却下されることにな
る。このように却下能力が°強くなるので、閾値0を高
めに設定しても鴎受容はあまり増加しない。その結果閾
値θを高めに設定することができ誤りジエクトを低減す
ることができる。なお。
登録話者が合い言葉を正確に発声している限り、抑制標
準パターンとの相違度が確認標準パターンとの相違度よ
りも近くなることは極めて希れでおるので誤りジエクト
が増加する要因は小さい。従って、本発明によりて話者
確認の誤動作を大幅に低減できるという効果が得られる
以上、本発明の原理と構成を実施例にもとづいて説明し
たがこれらの記載は本発明の範囲を限定するものではな
い。実用のシステムでは、多人数の合い言葉を記憶して
おき、最初に登録コードを入力して標準パターンを選択
してそれと入カバターンとの比較を行なうという構成も
考えられるが、登録話者ごとに確認標準パターンと抑制
標準パターンとを用意することにすれば本発明の原理を
その′tま適用可能である。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図) −ある
。 10・・・・・・マイクロホン、20・・・・・・分析
部、30・・・・・・スイッチ、31.32・・・・・
・端子、40・・・・・・標準パターン記憶部、41・
・・・・・確uta準ハターンエリア、42・・・・・
・抑制標準パターンエリア、50・・・・・・入カバタ
ーンバッフ7.60・・・・・・パターン比較部、70
・・・・・・利足部、71・・・・・・最小値選択検定
部、72・・・・・・閾値回路、73・・・・・・AN
Dゲート。

Claims (1)

  1. 【特許請求の範囲】 あらかじめ定められた言葉をディジタル符号化した音声
    パターンを確認標準パターンとして有し。 かつ前記言葉と類似関係にあるが異なる言葉をディジタ
    ル符号化した音声パターン會抑制標準パターンとして夫
    々有する標準パターン記憶部と、音声入力部と、入力さ
    れた音声パターンと前記確認標準パターン及び抑制標準
    パターンとの間の相違度をそれぞれ算出するパターン比
    較部と、確認標準パターンに関する相違度が所定の閾値
    より小でかつ抑制標準パターンに関する相違度よシも小
    さいときに@うて一致信号を発生し、l!繊結果を出力
    する判定出力部とを有することt−特徴どする音声認識
    装置。
JP56174109A 1981-10-30 1981-10-30 音声認識装置 Pending JPS5876893A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56174109A JPS5876893A (ja) 1981-10-30 1981-10-30 音声認識装置
US06/436,978 US4581755A (en) 1981-10-30 1982-10-27 Voice recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56174109A JPS5876893A (ja) 1981-10-30 1981-10-30 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5876893A true JPS5876893A (ja) 1983-05-10

Family

ID=15972799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56174109A Pending JPS5876893A (ja) 1981-10-30 1981-10-30 音声認識装置

Country Status (2)

Country Link
US (1) US4581755A (ja)
JP (1) JPS5876893A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
WO1987000332A1 (en) * 1985-07-01 1987-01-15 Ecco Industries, Inc. Speaker verification system
JPS62187897A (ja) * 1986-02-14 1987-08-17 日本電気株式会社 連続音声認識装置
US4910782A (en) * 1986-05-23 1990-03-20 Nec Corporation Speaker verification system
US5023901A (en) * 1988-08-22 1991-06-11 Vorec Corporation Surveillance system having a voice verification unit
JPH02232696A (ja) * 1989-03-06 1990-09-14 Toshiba Corp 音声認識装置
JP2504171B2 (ja) * 1989-03-16 1996-06-05 日本電気株式会社 声門波形に基づく話者識別装置
CA2105034C (en) * 1992-10-09 1997-12-30 Biing-Hwang Juang Speaker verification with cohort normalized scoring
US5430827A (en) * 1993-04-23 1995-07-04 At&T Corp. Password verification system
DE19630109A1 (de) * 1996-07-25 1998-01-29 Siemens Ag Verfahren zur Sprecherverifikation anhand mindestens eines von einem Sprecher eingesprochenen Sprachsignals, durch einen Rechner
JP3611223B2 (ja) * 1996-08-20 2005-01-19 株式会社リコー 音声認識装置及び方法
GB2316790B (en) * 1996-08-30 2000-07-19 Fujitsu Ltd Principal identifying system, electronic settlement system, and recording medium to be used therefor
JP2991148B2 (ja) * 1997-02-07 1999-12-20 日本電気株式会社 話者認識における抑制標準パターンすなわちコホートの作成方法及びシステムと該システムを含む話者照合装置
US20020133336A1 (en) * 2001-01-24 2002-09-19 Mikael Berner System, method and computer program product for supporting the delivery of localized content
US6789065B2 (en) 2001-01-24 2004-09-07 Bevocal, Inc System, method and computer program product for point-to-point voice-enabled driving directions
US7383187B2 (en) * 2001-01-24 2008-06-03 Bevocal, Inc. System, method and computer program product for a distributed speech recognition tuning platform
US7444284B1 (en) 2001-01-24 2008-10-28 Bevocal, Inc. System, method and computer program product for large-scale street name speech recognition
US20020143553A1 (en) * 2001-01-24 2002-10-03 Michael Migdol System, method and computer program product for a voice-enabled universal flight information finder
US7069513B2 (en) 2001-01-24 2006-06-27 Bevocal, Inc. System, method and computer program product for a transcription graphical user interface
US9697824B1 (en) * 2015-12-30 2017-07-04 Thunder Power New Energy Vehicle Development Company Limited Voice control system with dialect recognition
US9852287B1 (en) 2016-10-04 2017-12-26 International Business Machines Corporation Cognitive password pattern checker to enforce stronger, unrepeatable passwords

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823097A (ja) * 1981-08-03 1983-02-10 日本電信電話株式会社 音声認識装置
JPS5848099A (ja) * 1981-09-16 1983-03-19 日本電気株式会社 音声パタン一致検定方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US3969698A (en) * 1974-10-08 1976-07-13 International Business Machines Corporation Cluster storage apparatus for post processing error correction of a character recognition machine
JPS5272504A (en) * 1975-12-15 1977-06-17 Fuji Xerox Co Ltd Device for recognizing word audio
US4053710A (en) * 1976-03-01 1977-10-11 Ncr Corporation Automatic speaker verification systems employing moment invariants

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823097A (ja) * 1981-08-03 1983-02-10 日本電信電話株式会社 音声認識装置
JPS5848099A (ja) * 1981-09-16 1983-03-19 日本電気株式会社 音声パタン一致検定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
JPH11506845A (ja) * 1995-09-11 1999-06-15 ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置

Also Published As

Publication number Publication date
US4581755A (en) 1986-04-08

Similar Documents

Publication Publication Date Title
JPS5876893A (ja) 音声認識装置
US6480825B1 (en) System and method for detecting a recorded voice
US7319956B2 (en) Method and apparatus to perform speech reference enrollment based on input speech characteristics
CA1207907A (en) Speaker verification system
JP3080388B2 (ja) 不明人物の同一性検証方法
EP1159737B1 (en) Speaker recognition
JPS6217240B2 (ja)
US8433569B2 (en) Method of accessing a dial-up service
CA2133787C (en) Method of accomodating for carbon/electret telephone set variability in automatic speaker verification
JP4440414B2 (ja) 話者照合装置及び方法
JP2001350494A (ja) 照合装置及び照合方法
JPH0119597B2 (ja)
JPS63106798A (ja) 個人認証装置
JPH0331275B2 (ja)
US9978373B2 (en) Method of accessing a dial-up service
JPS58125099A (ja) 音声認識装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPH09244684A (ja) 本人認証装置
JPS6219760B2 (ja)
Hunt New commercial applications of telephone-network-based speech recognition and speaker verification
JPS6142280B2 (ja)
JPH01302297A (ja) 話者認識装置
KR19980045013A (ko) 암호 입력을 통한 화자 인식기의 성능 개선 방법
TUTORIAL et al. Dialogue Systems Research Department Bell Laboratories, Lucent Technologies
JPH03155599A (ja) 音声認識装置