JPS5934597A - 音声認識処理装置 - Google Patents

音声認識処理装置

Info

Publication number
JPS5934597A
JPS5934597A JP57144112A JP14411282A JPS5934597A JP S5934597 A JPS5934597 A JP S5934597A JP 57144112 A JP57144112 A JP 57144112A JP 14411282 A JP14411282 A JP 14411282A JP S5934597 A JPS5934597 A JP S5934597A
Authority
JP
Japan
Prior art keywords
information
rejection
speech
word
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57144112A
Other languages
English (en)
Inventor
竹内 亜紀彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57144112A priority Critical patent/JPS5934597A/ja
Publication of JPS5934597A publication Critical patent/JPS5934597A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)発明の技術分野 本発明は、不特定話者を対象とする音声認識処理装置(
こ関する。
(ロ)従来技術と問題点 第1図は、一般的な音声認識処理装置のブロック図であ
り、図中、1は特徴抽出部、2はマツチング部、3は辞
書部、4はリジェクト判定部である。
特徴抽出部1は入力音声から各種のパラメータ情報を抽
出するものであり、この特徴抽出部11こおいて抽出さ
れたパラメータ情報がマツチング部2へ送出される。マ
ツチング部2は、抽出されたパラメータ情報と辞書部3
#こ格納されている単語のパラメータ情報と全比較し、
最も類似度の高い単語全抽出する。さらに、マツチング
部21こ訃いて抽出された単語とそのパラメータ情報お
よび入力音声のパラメータ情報等がリジェクト判定部4
へ送られ、リジェクト判定m4が最終的リジェクト処理
を行々い、抽出された単語の正否を判定する。このリジ
ェクト機能は、認識の対象としてぃる単語以外の単語が
入力されたとき、これが誤って解繊されてしまうことを
防ぐための機能である。
こnは、一般船こ認識時に求められた相違度をある定め
られた値(リジェクトのための閾値)と比較して、相違
度の方が太きいときtこリジェクトするという方法が行
なわれている。従来、このリジェクトのための閾値は装
置毎に一定に定められていた。
しかし 不特定話者を対象とする音声認識処理装置ζこ
おいては、この相違度(J入Iこよって大きく異なるこ
とがある。このため、従来からの閾値を一定に定めてお
く方法では、低めに設定しておくと相違度の大きい、あ
る人の正しい単語がリジェクトされてしまい、逆lこ高
めに設定しておくと認識対象単語以外のものをリジェク
トできなく力ってしまうという不都合があった。
(/→ 発明の目的 本発明は、話者毎lこ最適な閾値を決定することlこよ
り上記の点を解決し、認識能力を高めることを目的とし
ている。
に)発明の構成 上記目的全達成するためtこ本発明は入力された音声情
報と標準パターン辞書に格納さ扛ている単語の音声情報
とr比較し、該比較結果lこもとづいて入力された音声
の単語kW&別するよう構成さnた不特定話者を対象と
1′る音声認識処理装置lこおいて、入力さ扛た音声(
こもとづいて認識した単語の音声情報と標準パターン辞
書内の対応する単語の音声情報との相違度情報を複数単
語分蓄積するバッファ全そなえるとともに、該バッファ
内の複数の相違度情報lこもとづいてリジェクトのため
の閾値を決定するリジェクト閾値決定手段をそなえ、話
者毎にその先頭部分の入力音声情報にもとづいて異なる
リジェクト閾値を設定し、以後当該設定されたりジェク
ト閾値にしたがってリジェクト判定処理を実行すること
を特徴とする。
(ホ)発明の実施例 第2図は、本発明による実施例の音声認識処理装置のブ
ロック図であり、図中、第1図と同一番号のものは同一
名称のものを示し、5はバッファ、3− 6は平均計算部、7はリジェクト閾値計算部、8は閾値
メモリ、9は定数メモリである。バッファ5は、人力さ
れた音声にもとづいて認識した単語の音声情報(パラメ
ータ情報)と標準パターン全格納する辞書部3内の対応
する単語の音声情報(パラメータ情報)との相違層情報
全最初入力されたn単語分蓄積するバッファである。閾
値メモリ8は、ある定めら扛た閾値1’l保持しておく
メモリであり、定数メモリ9は後述するりジェクト閾値
計算m7の計枦において使用される定数(a+bi保持
しておくメモリである。
実施例の動作は、以下の通りである。
まず、入力音声についての特徴抽出処理、マツチング処
理は第1図図示の例と同一である。実施例;こおいては
、ある不特定話者から最初lこ入力さ扛たn単飴分(こ
ついて、その認識した単語のパラメータ情報と辞書部3
内の対応する単語のパラメータ情報との相違度情報を求
め、轟該相違度情報會バッファ51こ格納する。そして
次に、バッファ5内のn単語分の相違度情報の平均値D
n′に平均= 4− 計算部6で求め、その平均値D n k ’Jジェクト
閾値計算部7へ送出する。
リジェクト閾値計算部7は最初のn単語分のデータに関
しては閾値メモリ8内に保持さ扛ているM(i’flそ
の[L リジェクト判定部4へ送出し当該閾値R1こよ
ってリジェクト処理全実行させる。
次lこ、最初のnj4i語分のデータが入力さnた時点
で、リジェクト閾値計算11f7は、新しい閾値R′を
例えば次の式によって足める。
R’=R+(al)n+b)   (Dn、II>R)
R’=R十(aDn−b )   (Dn=R)上記し
たようtこ、Rは閾値メモリ8Iこ保持さ扛ている値で
あり、Dnは平均計算部61ごて計算された値、a、b
は定数メモリ91こ保持されている値である。
このようにして計算されたR′がリジェクト判定部4へ
送出され、(n+1)個目の入力単語データからは、当
該R/ −e用いて判定処理が行なわれる。
例えば、R=500、a = 0.1、b−50と設定
さ扛ている場合、 R5’=500+(0,IDn+50)  (Dn)5
00)R’=500+(0,IDn−50)  1n4
soo)となり、平均値Dn=500のときは R’=500+(0,lX500−50)=500 でR′は変化しない。
一方、平均値Dn=600(相違慶大)のときは R’=500+(0,lX600+5’0 )=61O となり、新しい閾値R′はより大きい餉(許容変人)と
なる。
また、平均値Dn=400(相違夏季)のときは、R’
=500+(0,1X400−50)=490 となり、新しい閾値R′はより小さい値(許容反小、l
〃正確度変人となる。
(へ)発明の詳細 な説明したようlこ本発明によれば、話者毎にリジェク
トの閾値?可変に設定することができるので、認識率全
向上させることが可能となる。
【図面の簡単な説明】
第1図は一般的な音声認識処理装置のブロック図、第2
図は本発明lこよる実施例の音声認識処理装置のブロッ
ク図である。 図中、1は特徴抽出部、2はマツチング部、3は辞曹部
、4はリジェクト判定部、5はバッファ、6は平均計算
部、7はリジェクト閾値計算部、8は閾値メモリ、9は
定数メモリである。

Claims (1)

    【特許請求の範囲】
  1. 入力された音声情報と標準パターン辞書9こ格納されて
    いる単語の音声情報とを比較し、該比較結果にもとづい
    て入力された音声の単語を識別するよう構成された不特
    定話者を対象とする音声認識処理装置ζこおいて、入力
    された音声にもとづいて認識した単語の音声情報と標準
    パターン辞書内の対応する単語の音声情報との相違度情
    報t−複数単語分蓄積するバッファをそなえるとともに
    、該バッファ内の複数の相違度情報lこもとづいてリジ
    ェクトのための闇値を決定するりジェクト閾値決定手段
    をそなえ、話者毎にその先頭部分の入力音声情報にもと
    づいて異なるリジェクト闇値を設定し以後轟該設定され
    たりジェクト閾値にしたがってリジェクト判定処理を実
    行することを特徴とする音声認識処理装置。
JP57144112A 1982-08-20 1982-08-20 音声認識処理装置 Pending JPS5934597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57144112A JPS5934597A (ja) 1982-08-20 1982-08-20 音声認識処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57144112A JPS5934597A (ja) 1982-08-20 1982-08-20 音声認識処理装置

Publications (1)

Publication Number Publication Date
JPS5934597A true JPS5934597A (ja) 1984-02-24

Family

ID=15354459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57144112A Pending JPS5934597A (ja) 1982-08-20 1982-08-20 音声認識処理装置

Country Status (1)

Country Link
JP (1) JPS5934597A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161497A (ja) * 1986-12-24 1988-07-05 松下電器産業株式会社 音声認識装置
JP2008052178A (ja) * 2006-08-28 2008-03-06 Toyota Motor Corp 音声認識装置と音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161497A (ja) * 1986-12-24 1988-07-05 松下電器産業株式会社 音声認識装置
JP2008052178A (ja) * 2006-08-28 2008-03-06 Toyota Motor Corp 音声認識装置と音声認識方法

Similar Documents

Publication Publication Date Title
US6298323B1 (en) Computer voice recognition method verifying speaker identity using speaker and non-speaker data
US4403114A (en) Speaker recognizer in which a significant part of a preselected one of input and reference patterns is pattern matched to a time normalized part of the other
US5018201A (en) Speech recognition dividing words into two portions for preliminary selection
WO2017162053A1 (zh) 一种身份认证的方法和装置
EP0501631A2 (en) Temporal decorrelation method for robust speaker verification
US20040111261A1 (en) Computationally efficient method and apparatus for speaker recognition
US6499012B1 (en) Method and apparatus for hierarchical training of speech models for use in speaker verification
JPS5934597A (ja) 音声認識処理装置
US4790017A (en) Speech processing feature generation arrangement
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JP4440414B2 (ja) 話者照合装置及び方法
JP3098157B2 (ja) 話者照合方法及び装置
JPS6331793B2 (ja)
JPH0119597B2 (ja)
JPS6346496A (ja) 音声認識装置
JPS5977500A (ja) 単語音声認識方式
JPS58159599A (ja) 単音節音声認識方式
JPS58159598A (ja) 単音節音声認識方式
JPS58159591A (ja) 単音節音声認識方式
JPH06318097A (ja) 音声認識装置
JPS59124389A (ja) 単語音声認識方式
JPS5936299A (ja) 音声認識装置
JPS59124388A (ja) 単語音声認識処理方式
JPS59124393A (ja) 単音節音声認識処理方式
JPS59124390A (ja) 候補削減音声認識方式