JP2748383B2 - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JP2748383B2
JP2748383B2 JP63024382A JP2438288A JP2748383B2 JP 2748383 B2 JP2748383 B2 JP 2748383B2 JP 63024382 A JP63024382 A JP 63024382A JP 2438288 A JP2438288 A JP 2438288A JP 2748383 B2 JP2748383 B2 JP 2748383B2
Authority
JP
Japan
Prior art keywords
pattern
evaluation distance
recognition result
input
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63024382A
Other languages
English (en)
Other versions
JPH01200293A (ja
Inventor
勇一郎 藤橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63024382A priority Critical patent/JP2748383B2/ja
Publication of JPH01200293A publication Critical patent/JPH01200293A/ja
Application granted granted Critical
Publication of JP2748383B2 publication Critical patent/JP2748383B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は音声認識方式に関し、特に各時間毎に入力パ
ターンの終端点を時間方向にシフトしながらパターンマ
ッチングを行い、標準パターンとの距離を算出し、各時
間毎の距離を評価して認識結果を判定する音声認識方式
に関する。
従来技術 従来、この種の音声認識方式においては、認識判定部
で用いる評価距離閾値は固定値となっている。上述した
従来の音声認識方式における認識結果判定部では評価距
離閾値が固定値であるために、話者に適した閾値を設定
することができないことから、誤認識となることがあ
り、正しい認識結果を得られないという欠点がある。
発明の目的 本発明は話者に適した閾値を設定するようにして、正
しい認識結果が得られるようにした音声認識方式を提供
することを目的としている。
発明の構成 本発明は、時系列データである評価距離に対して評価
距離閾値と継続時間閾値を設け、音声認識結果を判定す
る方法において、入力開始から定められたフレーム目の
評価距離の値から定められた係数値を減じた値を評価距
離閾値として適応的に算出することにより話者に適した
評価距離閾値を設定することができ、よって正確な認識
結果を得ることができるものである。
実施例 次に、図面を参照して本発明の実施例について説明す
る。
第1図は本発明の一実施例のブロック図である。音声
分析部1、標準パターン部2、パターンマッチング部
3、認識結果判定部4より構成さている。
入力音声10は、音声分析部1に入力されて特徴パター
ンに分析され、入力パターン11としてパターンマッチン
グ部3に入力される。パターンマッチング部3は標準パ
ターン部2から標準パターン12を読出し、入力パターン
11とパターンマッチングを毎フレーム行いパターン間距
離を算出し、評価距離13として認識結果判定部4に出力
する。尚、パターンマッチングはフレーム毎に、入力パ
ターンの終端点を前フレームの時の終端点よりも1フレ
ーム後ろにシフトしてから行う。
パターンマッチングの方法は始端フリーDPマッチング
法として以下に説明するが、これに限定されない。第2
図は始端フリーDPマッチングを用いた時のパターンマッ
チングのDPパス許容領域を示す図であり、第3図に示す
DPパスを用いている。第2図、第3図とも横軸が入力パ
ターンのフレーム、縦軸が標準パターンのフレームであ
り、iは入力パターンのフレーム、jは標準パターンの
フレームを示す。
始端フリーDPマッチング法とは終端点に至るDPマッチ
ング経路のうち最小のパターン間距離を与えるものを始
端点を限定しないで求める方法であり、第2図に示した
例は、入力パターンのフレームIを終端点とした時、IS
1からIS2のいづれかのフレームが始端点となることを示
している。又、フレーム毎に入力パターンの終端点をシ
フトとしてパターンマッチングを行うことは、第2図で
示したDPパスの許容領域が横軸iの方向のスライドした
ことを意味する。
次に、第4図を参照して認識結果判定部4について説
明する。評価距離13は入力フレーム毎に算出されるた
め、第4図に示す様な入力フレームに対する時系列デー
タとなる。第4図の横軸は入力フレーム、縦軸は評価距
離である。第4図(a),(b),(c),(d)はそ
れぞれ話者A,B,C,Dの評価距離のグラフである。
認識結果判定部4では、第4図に示す様な評価距離閾
値算出フレーム20と評価距離閾値算出用係数21とを定
め、次の式で適応評価距離閾値を算出する。本実施例で
は、評価距離閾値算出フレームを25、評価距離閾値算出
用係数を100としている。
適応評価距離閾値 =評価距離閾値算出フレームの評価距離−評価距離閾値
算出用係数 このようにして適応評価距離閾値は算出され、第4
(a)、(b),(c),(d)の22,23,24,25に示す
ように話者に応じて最適な値となる。継続性に対する閾
値として継続性閾値を設け、評価距離13が適応評価距離
閾値22,23,24,25を継続して下回っている区間の時間が
継続時間閾値以上であるかを判定し、継続時間閾値以上
である区間を谷区間とする。本実施例では、谷に区間の
最下点の評価距離を判定スコアーとして用いる。但し、
判定スコアーとして何を用いるかは特に限定されていな
い。
このようにして、全ての標準パターンとの判定スコア
ーを求め、判定スコアーが最も小さい標準パターンを認
識結果14として選択して出力する。
第4図(a),(b),(c),(d)に示した例か
ら明らかなように、話者によって評価距離の動き方が異
なり、評価距離閾値を固定値とした場合、全話者に適し
た値を求めることは難しくなってしまう。例えば、話者
Aと話者Dを比較した場合、話者Dに適した評価距離閾
値は約650であるが、話者Aには大きすぎた値となり、
誤認識を招いてしまう。
一方、上述の本実施例で示した適応評価距離閾値22,2
3,24,25を用いることにより、第4図(a),(b),
(c),(d)から明らかなように各話者に適した評価
距離閾値が設定され、従来方式で発生した誤認識を除去
し、正しい誤認識を得ることができる。
発明の効果 本発明によれば、固定評価距離閾値を評価距離の判定
に用いるのではなく、入力音声に適した適応評価の判定
に用いるのではなく、入力音声に適した適応評価距離閾
値を用いるようにしているので、正確な認識結果を得る
ことができ、よって誤認識を少なくできるという効果が
ある。
【図面の簡単な説明】
第1図は本発明の実施例のブロック図、第2図は始端フ
リーDPマッチングにおけるDPパスの許容領域を示す図、
第3図は始端フリーDPマッチングにおけるDPパスを示す
図、第4図(a)〜(d)は話者A〜Dの各評価距離の
グラフである。 主要部分の符号の説明 1……音声分析部 2……標準パターン部 3……パターンマッチング部 4……認識結果判定部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象の単語又は音韻の特徴パターンを
    標準パターンとして記憶しておく標準パターン部と、入
    力音声の分析を定められたフレーム周期毎に行い、入力
    音声の特徴パターンである入力パターンを出力する音声
    分析部と、標準パターンと入力パターンとのマッチング
    を行い、評価距離を算出するパターンマッチング部と、
    評価距離に基づいて認識結果を判定する認識結果判定部
    とを具備し、前記パターンマッチング部において入力パ
    ターンのフレーム毎に入力パターンの終端点を1フレー
    ムづつ後にシフトしてパターンマッチングを行い、評価
    距離としてパターン間距離を毎フレーム算出し、時系列
    データとして評価距離を前記認識結果判定部へ出力し、
    この認識結果判定部において時系列データである評価距
    離に対して評価距離閾値と継続時間閾値を設け、認識結
    果を判定する音声認識方式であって、入力開始から定め
    られたフレーム目の評価距離の値から定められた係数値
    を減じた値を該評価距離閾値として適応的に算出するこ
    とを特徴とする音声認識方式。
JP63024382A 1988-02-04 1988-02-04 音声認識方式 Expired - Lifetime JP2748383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63024382A JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63024382A JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Publications (2)

Publication Number Publication Date
JPH01200293A JPH01200293A (ja) 1989-08-11
JP2748383B2 true JP2748383B2 (ja) 1998-05-06

Family

ID=12136632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63024382A Expired - Lifetime JP2748383B2 (ja) 1988-02-04 1988-02-04 音声認識方式

Country Status (1)

Country Link
JP (1) JP2748383B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告[音声]SP87−26,P.33〜40(昭和62年6月)

Also Published As

Publication number Publication date
JPH01200293A (ja) 1989-08-11

Similar Documents

Publication Publication Date Title
US4829578A (en) Speech detection and recognition apparatus for use with background noise of varying levels
JP3130524B2 (ja) 音声信号認識方法およびその方法を実施する装置
JP2748383B2 (ja) 音声認識方式
JP3091537B2 (ja) 音声パターン作成方法
JPS60114900A (ja) 有音・無音判定法
CN113611330A (zh) 一种音频检测方法、装置、电子设备及存储介质
JPH06105399B2 (ja) 音声認識方式
JPH1195785A (ja) 音声区間検出方式
EP1079370A2 (en) Method for training a speech recognition system with detection of confusable words
JP3011421B2 (ja) 音声認識装置
JPS60129796A (ja) 音声入力装置
JP3100180B2 (ja) 音声認識方法
JPS59124397A (ja) 無音区間検出回路
JP3031081B2 (ja) 音声認識装置
JPS62141595A (ja) 音声検出方式
JPH06105400B2 (ja) 音声認識方式
JPH01116597A (ja) 音声認識方式
KR930007790B1 (ko) 음성 인식방법
JP3100208B2 (ja) 音声認識装置
JP2557497B2 (ja) 男女声の識別方法
JPH0546196A (ja) 音声認識装置
JPS59149400A (ja) 音声入力装置
JPH01116599A (ja) 音声認識方式
JPS63155196A (ja) 無声音検出方法
JPH0651793A (ja) 音声認識装置