JPS60168197A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60168197A
JPS60168197A JP59024123A JP2412384A JPS60168197A JP S60168197 A JPS60168197 A JP S60168197A JP 59024123 A JP59024123 A JP 59024123A JP 2412384 A JP2412384 A JP 2412384A JP S60168197 A JPS60168197 A JP S60168197A
Authority
JP
Japan
Prior art keywords
candidate
distance
pattern
matching
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59024123A
Other languages
English (en)
Other versions
JPH0344316B2 (ja
Inventor
桜庭 孝宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59024123A priority Critical patent/JPS60168197A/ja
Publication of JPS60168197A publication Critical patent/JPS60168197A/ja
Publication of JPH0344316B2 publication Critical patent/JPH0344316B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声認識判定方式に係り、特に複数の候?il
iを認識する音声認識装置においてその認識を更らに正
確に行うようにしたものに関する。
〔従来技術と問題点〕
音声認識装置では一般に入力音声パターンと辞書部に格
納された複数の標準音声パターンを比較照合し、照合結
果から最も似ている(距離が小さい)と判定したものを
認識結果としている。
しかし、このような方法のみでは、例えば単語の認識の
場合におけるように、標準音声パターンに登録されてい
るものに対する入力音声が入力された場合や、発声不良
により暖味な入力音声になったものに対しても、何らか
の認識結果を出力しなければならないので、このような
とき最も似ているという認識結果を出力してもこれは間
違った結果を出力することになる。
そのため、従来の音声認識装置では、照合結果の値であ
る照合距離にある判定距離を設定し、この設定された判
定距離よりも認識結果の照合距離が大きいものは、辞書
部に格納されている標準パターンとは異なった入力音声
か入ったものとして認識結果は正しくないと判定し、リ
ジエク1−を行っている。また曖昧な発声により複数の
標準パターンと似てしまい、正しく識別できないような
入力に対しては、最も照合距離の小さい第1候補と、次
に照合距離の小さい第2候補の照合距離の差にある判定
距離を設け、第2候補より第1候補の距離差が判定距離
よりも人きくなiJれば、入力は曖昧な発声であったと
してリシエクI・させる方法がある。
しかしこの候補の距離差を比較する場合には、判定要素
は距離差のみであって距離そのものか含まれていないた
め、どの程度標準パターンと異っているかということに
は無関係であり、また類似語(例えば[カナガヮ−1と
「カナサヮ」)か存在する場合にばこの機能ば使用てき
ない等の欠点があった。
〔発明の目的〕
本発明の目的は、前記の如き欠点を改善するため、複数
の候補が選択されたとき、第1候補と第2候補の距離の
比をチェックして距離そのもののファクターを加えると
ともに、その結果B昧だど思われる場合はこれらの候補
が類似語か否かをチェックし、類似語でなげれば認識結
果は曖昧゛ζあるとしてリジェクトさ−d、%p似語で
あれば第1(1芙補を認識結果とする(出力が1つの場
合)よ・)にした音声認識判定方式を提供することであ
る。
〔発明の構成〕
前記の如き目的を達成するために、本発明の?I声認識
判定方式では、辞書部に格納された標?1へ音声パター
ンと入力音声パターンを比較照合して照合距離の最も小
さいものを第1候補とし次に小さいものを第2候補とし
て認識する音声認識方式において、前記第1候補と第2
候補の各標準パターンの照合距離をめる標準パターン照
合手段と、第1候補と第2候?iの照合距離の比をめこ
の比と曖昧判定用の基準値を比較する曖昧1′す定手段
を設け、前記第1候補と第2候補の各標準パターンの照
合距離が類似語判定用の基準値より大きければこれらの
第1候補と第2候補の照合距離の比を曖昧判定用の基準
値と比較して小さければ曖昧な入力音声だと判定してリ
ジェクトするようにしたことを特徴とする。
〔発明の実施例〕
本発明を一実施例にもとづき詳述するに先立ち、第1図
および第2図により本発明の概略と、従来の認識方式に
おりる欠点を説明する。
第1図(イ)においてP】、Plば標準パターンであり
、このPl、、Plの標準パターン間の照合距離をap
とする。またi a −i cは入力パターンであり、
第1図(イ)で示す各人カバターンと各標準パターン間
の距離ば同(ロ)の通りである。
ここで1aはPI、Plの直線に存在し、da+=1 a2−2 の関係である。
このi a @ P +であるとキリ定できるとした場
合、その判定条件を距離の差で表すと da2−daI≧1 また距離の比で表わすと d a 2 / d a I≧2 となる。
すなわち、本発明では第1候ネ■と第2候?iliの標
準パターンの照合距離が1より人であり、また第1候補
と第2候補との照合距離の比が2より大きいときに判定
可能であるとする。そし−ζ第1奴補と第2候補の標準
パターンの照合距離が1未満であってもこれらが類似語
の場合には第1候補を判定結果として出力する。
もし、従来のように、第1候補と第2候補との距離の差
だけで判定した場合には、it)やicの場合にもPl
が判定されることになるが、Plはibやicと距離が
相当離れておりPlと判定することばエラーとなる。ま
た距離の比だけで判定した場合には、idやieに示ず
如く、PIとPlからの距離に応じて、よりPlから離
れた位置でないとP lであると判定できないことが明
らかである。(第1図においてid、ie#+P+と判
定されるもの)これらの例から明らかなように、照合距
離の差のみで判定した場合にば、P+とPP 2からの
距離に関係なく判定基準が一定であり、エラーか生ずる
欠点があるが、距離の比を判定する場合にはこのような
ことはなくなり、(勿論d、d+、de+がある範囲内
の距離にある場合である。)ibやicは曖昧だとして
リジェクトずろことかできる。
また、第1図のようにPlとPlか曖昧判定できる程離
れていれば問題はないが、類似語の場合には、第2図に
示す如く、標準パターンP3とY)4か接近し2てそれ
らの距離apがdp<lの場合かある。この場合には、
距離の差を1以上にとれるような入力は不可能であり、
また距離の比を2以」二にとるのも非常に狭い範囲に限
られるため、リジェクトか多くて使いにくいものとなる
。いま第2図において+1p=Q、5、df+−=0.
5、dfz=−0,75とすると、距離の差も、距離の
比もijj記条件にあてばまらないため、工「がP3に
非常に近い場合であってもリジェクトされることになる
。それ故、このような場合に対処するため、あらかじめ
P3 (第1候補)と1)4(第2候補)の間の距離を
調べ、曖昧判定が可能かと・うかチェックし、もし類似
語であって判定不可能と八つだ場合にはりジエクトー仕
ずに第1(佼+diを有すJとすることにより、類似語
であって曖昧判定しにくいものに対してはそのまま第1
候補を認識結果として出力し、類似語でない場合たり曖
昧判定を行うことになる。
本発明の一実施例を第3図にもとづき説明する。
第3図において、1はマイクロフォン、2 LJイニ)
声特徴抽出部であって入力した音声信号よりその特徴パ
ラメータを抽出するもの、3は入力音声パターン・バッ
ファであって入力音声の特徴パラメータを入力音声パタ
ーンとして一時保持するもの、4は標準音声パターン辞
書部であって例えばあらかじめ単語の標準音声パターン
が格納されているもの、5は第1パターン照合813で
あって前記入力音声パターン・バッファ3に保持された
入力音声の特徴バラメークを前記標準音声パターン辞書
部4に格納された各標準音声特徴パラメータと照合して
それらの照合距呂11を算出するもの、6は照合結果制
御<41(であって前記第1パターン照合部5において
入力音声と標準音声パターンとを順次照合した結果照合
距離の小さいものから複数個認識候補として選出するも
の、7は曖昧判定部であってnII記照合結果制御部6
から伝達された第1候輔と第2(吠補情報を第2パター
ン照合部8に送出したり、第2パターン照合部8から伝
達された第1候fdiと第2候補の標準パターンの照合
距離か類似語判定距離かどうかをコtす定して第1 (
1又?111と第2候補が類似語であると認識したとき
認識候補か有効であるとし7てこれらを認識結果として
出力し、また類似語でないと認識したとき、第1候補と
第2候補の照合距離(入力音声に対するもの)の比を計
算し曖昧判定距離と比較して曖昧でないと判定したとき
認識候補を有すノとして認識結果を出力し、曖昧である
と4′11定した場合には認識候補を無効としてリジェ
クトさ−Uるもの、8ば第2パターン照であって前記第
1候補と第2(19,補との各標準パターンの照合距離
を算出するものである。
本発明の動作について説明する。
(1)マイクロフォン1より入力された使用者の音声(
例えば単語)は、音声特徴抽出部2により’14徴パラ
メータが抽出されて照合用の入力名声パターンに変換さ
れ、入力音声パターン・バッファ3に格納される。
(2)この入力音声パターンは、標準音声パターン辞書
部4に格納されている複数の標準音声パターンと順番に
第1パターン照合部5と照合され、照合距離が算出され
る。
(3)この第1パターン照合部5からi(すられた照合
距離は順次照合結果制御部6に送出される。そして照合
結果制御部6ではこの照合距離の小さいものから順に認
識候補として選び出し、これを認へ候補情報として曖昧
判定部7に送出する。
(4)曖昧判定部7ではこの認識候補情報により得られ
た第1候補情報と第2候補情報を第2パターン照合部8
に送出する。第2パターン照合部8ではごれらにより標
準音声パターン辞書部4から第1候補と第2候補の各標
準パターンを取出してこれらの標準パターン間の照合距
離をめ、候補間照合距離として暖味判定部7に送出され
る。
(5)これにもとづき曖昧判定部7では候補間照合距離
を、別途定められている類似語であるかどうかを判定す
る類似語判定距離と比較する。もし類似語判定距離より
小さく類似語であると判定したとき、認識候補が有効で
あるとして、これら(場合によっては第1候補)を認識
結果として出力する。逆に類似語でないと判定したとき
、第1候補と第2候補との比を計算し、これまた別途定
められている曖昧判定距離比と比較して、比が大きく1
暖昧でないと判定できれば、認識候補を有効として認識
結果を送出する。しかしこの比が小さくて曖昧であると
判定した場合にはこの認識候補は無効としてリジェクト
させることになる。
なお前記数値はあくまでも1例にすぎず距離の差や比等
もふくめ、本発明がこれらに限定されるものではない。
〔発明の効果〕
本発明により、従来における第1候補と第2候補の距離
差で曖昧判定を行うものに比較して、第1候補および第
2候補の両者から太きく311れた場合に曖昧と判定す
ることができ、標準音声パターンに類似語が含まれてい
る場合でも認識することが可能となる。そのため従来の
ように標準音声パターンに類似語が含まれるとき曖昧判
定の機能を使用できない場合があった欠点が、本発明で
は類似語判定を行って曖昧判定を制御できるので認識効
果を向上することができる。
【図面の簡単な説明】
第1図は従来の問題点および本発明の概略説明図、第2
図は類似語における問題点説明図、第3 。 図は本発明の一実施例構成図である。 図中、1はマイクロフォン、2は音声特徴抽出部、3は
入力音声パターン・バッファ、4は標準音声パターン辞
書部、5は第1パターン照合部、6は照合結果制御部、
7は曖昧判定部、8は第2パターン照合部を示す。 才1図 (イ)

Claims (1)

    【特許請求の範囲】
  1. 辞書部に格納された標準音声パターンと入力音声パター
    ンを比較照合して照合距離の最も小さいものを第1候補
    とし次に小さいものを第2候′4fliとして認識する
    音声認識方式において、前記第1候補と第2候補の各標
    準パターンの照合距離をめる標準パターン照合手段と、
    第1候補と第2候補の照合距離の比をめこの比と曖昧判
    定用の基準値を比較する曖昧判定手段を設け、前記第1
    候補と第2候補の各標準パターンの照合距離が類似語判
    定用の基準値より大きければこれらの第1候補と第2候
    補の照合距離の比を曖昧判定用の基準値と比較して小さ
    ければ暖味な入力音声だと判定してリジェクトするよう
    にしたことを特徴とする音声認識判定方式。
JP59024123A 1984-02-10 1984-02-10 音声認識装置 Granted JPS60168197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59024123A JPS60168197A (ja) 1984-02-10 1984-02-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59024123A JPS60168197A (ja) 1984-02-10 1984-02-10 音声認識装置

Publications (2)

Publication Number Publication Date
JPS60168197A true JPS60168197A (ja) 1985-08-31
JPH0344316B2 JPH0344316B2 (ja) 1991-07-05

Family

ID=12129528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59024123A Granted JPS60168197A (ja) 1984-02-10 1984-02-10 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60168197A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63254498A (ja) * 1987-04-13 1988-10-21 日本電気株式会社 音声認識応答装置
JP2003029783A (ja) * 2001-07-17 2003-01-31 Oki Electric Ind Co Ltd 音声認識制御方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59212900A (ja) * 1983-05-19 1984-12-01 株式会社日立製作所 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59212900A (ja) * 1983-05-19 1984-12-01 株式会社日立製作所 音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63254498A (ja) * 1987-04-13 1988-10-21 日本電気株式会社 音声認識応答装置
JP2003029783A (ja) * 2001-07-17 2003-01-31 Oki Electric Ind Co Ltd 音声認識制御方式

Also Published As

Publication number Publication date
JPH0344316B2 (ja) 1991-07-05

Similar Documents

Publication Publication Date Title
KR102339594B1 (ko) 객체 인식 방법, 컴퓨터 디바이스 및 컴퓨터 판독 가능 저장 매체
CN108447471B (zh) 语音识别方法及语音识别装置
WO2014117645A1 (zh) 信息的识别方法和装置
WO2017162053A1 (zh) 一种身份认证的方法和装置
JPH03501657A (ja) パターン認識エラー低減装置
KR20060070603A (ko) 음성인식 시스템에서의 2단계 발화 검증 방법 및 장치
KR102655791B1 (ko) 화자 인증 방법, 화자 인증을 위한 학습 방법 및 그 장치들
EP3501024B1 (en) Systems, apparatuses, and methods for speaker verification using artificial neural networks
CN114999463B (zh) 语音识别方法、装置、设备及介质
CN109739968A (zh) 一种数据处理方法及装置
US7181396B2 (en) System and method for speech recognition utilizing a merged dictionary
KR20100068965A (ko) 자동 통역 장치 및 그 방법
CN111599339A (zh) 具有高自然度的语音拼接合成方法、系统、设备及介质
CN108806691B (zh) 语音识别方法及系统
JPS60168197A (ja) 音声認識装置
KR101229108B1 (ko) 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법
JP2004133477A (ja) 音声認識方法、音声認識方法のためのコンピュータプログラム、及びそのコンピュータプログラムが記録された記憶媒体
JP2000099090A (ja) 記号列を用いた話者認識方法
KR20020045960A (ko) 음성인식에서 핵심어 검출 성능 개선 방법
Kadhim et al. Enhancement and modification of automatic speaker verification by utilizing hidden Markov model
JPH11249688A (ja) 音声認識装置およびその方法
JPS6325366B2 (ja)
KR100677224B1 (ko) 안티워드 모델을 이용한 음성인식 방법
JPS58159598A (ja) 単音節音声認識方式
JP3100208B2 (ja) 音声認識装置