JPS5825699A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5825699A
JPS5825699A JP56124908A JP12490881A JPS5825699A JP S5825699 A JPS5825699 A JP S5825699A JP 56124908 A JP56124908 A JP 56124908A JP 12490881 A JP12490881 A JP 12490881A JP S5825699 A JPS5825699 A JP S5825699A
Authority
JP
Japan
Prior art keywords
pattern
distance
voice
input
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56124908A
Other languages
English (en)
Other versions
JPS6332396B2 (ja
Inventor
正彦 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP56124908A priority Critical patent/JPS5825699A/ja
Publication of JPS5825699A publication Critical patent/JPS5825699A/ja
Publication of JPS6332396B2 publication Critical patent/JPS6332396B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音声パターンの非線形時間軸伸縮に対処し、
効果的なマツチング操作を実現する音声認識装置に関す
るものである。
第1図は音声認識装置の一般的な構成例を示すものであ
る。マイクロホン(1)で拾われた音声波形(2)は音
声パターン圧縮部(3)に導ひかれる。この音声パター
ン圧縮部(3)では入力音声の特徴量が抽出され、振幅
軸及び時間軸の正規化操作が行なわれる。即ち発声レベ
ルの大小が補正され、又発声時間の長短にかかわらず、
一定長の圧縮パターン(4)が出力される。切替えスイ
ッチ(5)は学習/認識モードを切替えるもので、学習
(登録)動作時には実線側、認識(入力)動作時には破
線側に倒される。
従って学習時には、圧縮パターン(4)がスイッチ(5
)の実線側を通り、登録パターンメモリ(7)に順次書
き込まれる。例えば第1図に示すように、数字音声/イ
チ/、/ニー/、/サン/、/ヨン/。
/ゴー/の如くにである。−通りの使用音声登録が終了
すると、切替えスイッチ(5)は点線側に倒され、認識
モードに入る。
認識時には圧縮パターン(4)はスイッチ(5)の点線
側を通り、入カバターンメモリ(6)に一時計えられる
。このメモリ(6)は発声の都度更新され、書き替えら
れる。ところで入カバターン(8)及び登録パターン(
9)は認識処理部00に導ひかれており、ここで両パタ
ーン間の照合比較動作が実行される。そして入カバター
ン(8)と最も距離の近い、もしくは尤度の大きい登録
パターン(9)の1つが選択され、当該入力音声と判別
されてM FJ結果01)が出力される。
第2図は従来及び本発明装置の音声パターン圧縮・比較
動作を対比して示す説明図であるが、同図(a)〜(e
)は従来方式に関する部存で、図中第1の入力(12a
)は/イチ/と普通に、第2の入力(13a)は/イー
チ/と長めに発声した時の音声パターン特微量の時間変
化例を示すものである。これらのパターンは始端と終端
間を均等分割(本例では8等分)する形で、線形圧縮さ
れる。そこで入カバターン(12a)は圧縮パターン(
12b)の如く、同様に入カバターン(13a)は圧縮
パターンα3b)の如く変換され、一定長パターンに凝
縮される。
ここで圧縮パターン(12b)を登録(基準)パターン
、圧縮パターン(13b)を入力(試験)パターンと仮
定する。従来の音声認識装置におけるパターン第2図(
e)に示す様な部分距離パターン(14a)が求められ
る。両パターン間の距離は各部分距離の総和(本例では
9サンプル分)で与えられる。
従来の音声認識装置は以上のように構成されているので
、音声パターンの発生毎の非線形時間軸伸縮は避けられ
ず、本例に示す如く、/イチ/。
/イーチ/間ではかなり距離が開く。これは棄却(リジ
ェクト)ないしは誤認識を誘発する原因となり、システ
ムのg識性能を著しく損なう結果となっていた。
本発明は上記のような従来のもののもつ本質的守亦塙4
−ときは、各サンプルの対応付けを変化させて最小距離
を探索し、該最小距離による認識結果を出力することに
より、従来頻発していた入力音声のりジエクトや誤認識
を大幅に救済することのできる音声認識装置を提供する
ことを目的としている。
以下本発明の一実施例を図について説明する。
本発明の音声認識装置におけるパターン照合方式は、従
来方式の延長線上で極めて容易に実施する事ができる。
第2図に示した部分距離パターン(14a)に先ず着目
する。始端及び終端(サンプル番号0及び8)ではその
距離は零に近い。但し途中のサンプル点では不規則な増
減変化が見られる。
このパターンは通常新たな発声毎に変動するものである
そこで部分距離パターン(14a)のうち、最大値点A
及び次点Bを探索する。次に2つの圧縮パターン、即ち
基準パターン(12b)と入カバターン(13b)との
対応付けを部分的に前後にシフトして実施する。
本例では入カバターン(13b)の5サンプル目を基準
パターン(12b)の4及び6サンプル目と比較照合し
、距離の最小となる4サンプル目との対応付けを行なう
。同様に次点Bについても3サンプル目を2及び4サン
プル目と比較照合し、最小距離をとる2サンプル目と対
応付ける。この様にして第3図(a)に示す修正された
部分距離パターン(14b)を得る事ができる。このパ
ターン04b)は従来方式によるパターン(14a”)
に比べて大幅な距離減小効果が見られる。この時点でも
し部分距離の総和が所定の闇値以下となれば、距離計算
(パターン照合操作)を打ち切ればよい。
本例では更に、部分距離パターン(14b)中の0点及
びD点に着目し前記と同様の部分シフトマツチング操作
を実行する。そして7サンプル目を6サンプル目に、2
サンプル目を1サンプル目に対応付け、更に修正された
第3図(b)の部分距離パターンα4c)を得る。パタ
ーンα4a)と(14C)とを比較すれば、その改善効
果は一目瞭然であろう。
このような本発明によるパターン照合操作により、従来
多発していたりジエクト及び誤認識を大幅に救済し、認
識率を例えばある装置では従来の86%から92%に向
上することができた。
なお上記実施例では前後に1サンプル分シフトして対応
付けを行なう例を示したが、2サンプル以上シフトする
事もできる。ただしその場合は時間軸上のサンプル配列
の逆転を避けるため、隣接サンプルも適当にシフトさせ
る必要がある。又部分距離パターンが数サンプルにわた
り集中して増大する様な場合には、数サンプル分一括し
て前後シフトし対応付けを行なう事も可能である。また
本発明は音声以外の他の音響信号や画像信号等のパター
ン認識方式あるいは装置にも容易に拡張し適用すること
ができる。
以上説明した如く、本発明による音声認識装置は登録パ
ターンと入カバターンの距離が所定の闇値を越える場合
上記サンプルの対応付けを変化させて最小距離を探索し
認識処理を行なうようにしたものであるので、従来装置
とほとんど同様の構成で極めて容易に実現できる利点が
ある。又従来頻発していた入力音声のりジエクトや誤認
識を大幅に救済することが可能で、シス戸ムの認轍性能
を著しく高める事ができる。
また従来、ダイナミックプログラミング手法により2つ
の不等長パターン間の非線形時間軸整合をとる方式が考
えられているが、この方式は多大のメモリ、処理時間、
高価で消費電力を喰う専用プロセッサを要し、認識シス
テムの経済性を著しく損なっていたのに対し、本発明に
おけるパターン照合方式は簡単なハードウェアないしは
近年とみに安価となった汎用マイクロプロセッサで充分
処理可能であり、システムのコスト/パフォーマンスを
大幅に向上させることが可能である。
【図面の簡単な説明】
第1図は音声認識装置の一般的な構成図、第2図は従来
及び本発明による音声パターン圧縮・比較動作を対比し
て示す説明図である。 (3)・・・音声パターン圧縮部、(6)・・・入カバ
ターンメモリ、(7)・・・登録パターンメモリ、(8
)・・・入カバターン、(9)・・・登録パターン、0
0・・・認識処理部、α→・・・部分距離パターン。 なお図中、同一符号は同−又は相当部分を示す。

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声の特徴量を抽出し音声パターンを圧縮す
    る音声パターン圧縮部と、学習動作時に該音声パターン
    圧縮部からの音声パターンを記憶する登録パターンメモ
    リと、認識動作時に上記音声パターン圧縮部からの音声
    パターンを一時記憶する入カバターンメモリと、上記登
    録パターンと上記入カバターンの各サンプル値の比較に
    よる部分距離パターンを求め該部分距離の総和である距
    離が所定の閾値を越える場合上記サンプルの対応付けを
    変化させて最小距離を探索し該最小距離による認識結果
    を出力する認識処理部とを備えたことを特徴とする音声
    認識装置。
JP56124908A 1981-08-07 1981-08-07 音声認識装置 Granted JPS5825699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56124908A JPS5825699A (ja) 1981-08-07 1981-08-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56124908A JPS5825699A (ja) 1981-08-07 1981-08-07 音声認識装置

Publications (2)

Publication Number Publication Date
JPS5825699A true JPS5825699A (ja) 1983-02-15
JPS6332396B2 JPS6332396B2 (ja) 1988-06-29

Family

ID=14897082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56124908A Granted JPS5825699A (ja) 1981-08-07 1981-08-07 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5825699A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0743782U (ja) * 1993-04-14 1995-09-12 中部精機株式会社 加速度検出器
US8447605B2 (en) 2004-06-03 2013-05-21 Nintendo Co., Ltd. Input voice command recognition processing apparatus

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5374807A (en) * 1976-12-15 1978-07-03 Fujitsu Ltd Voice recognition matching control system
JPS5536825A (en) * 1978-09-08 1980-03-14 Tokyo Shibaura Electric Co Voice discriminating device
JPS5665198A (en) * 1979-10-31 1981-06-02 Tokyo Shibaura Electric Co Singallsyllable identifier

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5374807A (en) * 1976-12-15 1978-07-03 Fujitsu Ltd Voice recognition matching control system
JPS5536825A (en) * 1978-09-08 1980-03-14 Tokyo Shibaura Electric Co Voice discriminating device
JPS5665198A (en) * 1979-10-31 1981-06-02 Tokyo Shibaura Electric Co Singallsyllable identifier

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0743782U (ja) * 1993-04-14 1995-09-12 中部精機株式会社 加速度検出器
US8447605B2 (en) 2004-06-03 2013-05-21 Nintendo Co., Ltd. Input voice command recognition processing apparatus

Also Published As

Publication number Publication date
JPS6332396B2 (ja) 1988-06-29

Similar Documents

Publication Publication Date Title
US4513436A (en) Speech recognition system
US5845092A (en) Endpoint detection in a stand-alone real-time voice recognition system
JPS60158498A (ja) パターン照合装置
JPS5825699A (ja) 音声認識装置
JPH04318900A (ja) 多方向同時収音式音声認識方法
JP2992324B2 (ja) 音声区間検出方法
JPH02210500A (ja) 標準パターン登録方式
JPS5876892A (ja) 音声認識装置
JPS62211699A (ja) 音声区間検出回路
JPS5999497A (ja) 音声認識装置
JPH10124084A (ja) 音声処理装置
JPH0262879B2 (ja)
JPH0419700A (ja) 音声パターンマッチング方法
JP3011984B2 (ja) パターン照合方法
JPS60115996A (ja) 音声認識装置
JPS6078489A (ja) 辞書更新方式
JPS5953899A (ja) 音声認識装置
JPH04212199A (ja) 標準パターン登録方法
JPS6078491A (ja) 辞書更新方式
JPS6070496A (ja) 音声認識処理方式
JPS6370298A (ja) 促音認識装置
JPS60111300A (ja) 連続単語音声認識方法
JPS5886598A (ja) 音声認識装置
JPS62289897A (ja) 音声認識方式
JPS6026399A (ja) 単語認識装置