JPH01138596A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01138596A
JPH01138596A JP62298594A JP29859487A JPH01138596A JP H01138596 A JPH01138596 A JP H01138596A JP 62298594 A JP62298594 A JP 62298594A JP 29859487 A JP29859487 A JP 29859487A JP H01138596 A JPH01138596 A JP H01138596A
Authority
JP
Japan
Prior art keywords
word
recognition
time
recognition result
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62298594A
Other languages
English (en)
Other versions
JPH0577080B2 (ja
Inventor
Hiromi Fujii
藤井 浩美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62298594A priority Critical patent/JPH01138596A/ja
Publication of JPH01138596A publication Critical patent/JPH01138596A/ja
Publication of JPH0577080B2 publication Critical patent/JPH0577080B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、発声された音声を高速で認識する音声認識装
置の改良に関する。
(従来の技術) 音声認識は、優れたマンマシンインターフェースを実現
する技術として重要であり、すでにさまざまな分野で音
声認識装置が使われている。現在の装置のほとんどは、
パターンマツチング法による認識方式を採用している。
この方式は、発声された認識対象単語nの特徴ベクトル
の時系列r=bfi+・・・bai・・・b″、をあら
かじめ標準パターンとして保持しておき、入力された発
声のパターンA=a。
・・・ai・・・ai(以下、入カバターンとする)と
保持された標準パターンとの比較を行い、最も類似した
標準パターンの単語名を認識結果とするものである。こ
の時、標準パターンと基カバターンの時間軸i、jをそ
れぞれ対応つけてパターン間距離を求める方法としては
、動的計画法により非線形な対応付けを行うDPマツチ
ング法が使月されている。DPマツチングは、例えば(
1)式のような漸化式計算を用いてaiとす、のベクト
ル間距離”(s + j)の総和を最小にする最適化問
題を解くものである。
ここで、g”(i、j)は(1,1)から(1+j)ま
でのd”(i、j)の累積値である。DPマツチングに
ついての詳細は、′連続発声した単語音声を効率的に認
識する2段DPマツチング11日経エレクトロニクス、
 1983年11月7日号の171頁より208頁(以
下、文献1とする)に記述されている。
このDPマツチングを原理とする認識アルゴリズムは、
現在最も一般的に用いられているが、計算量の多きが問
題であった。計算量の低減法としては、特開昭58−9
8796号明細書に記載されているクロックワイズDP
法がある。この方法は、(1)式のような漸化式計算を
基カバターンの時間軸iに同期して処理することにより
実時間性を高めるものである0時間軸に同期した処理は
、基カバターンの時刻iにおいて、全ての単語nとその
時刻jに対して累積距離g”(iv j)を求めること
によって実現される。また、さらに高速化を狙ったもの
として、このクロックワイズDP法に枝刈の考えを導入
することで処理を高速化したものが特願昭62−617
32号に述べられている。以下、この方法についてm単
に説明する。
この方法は、漸化式計算を進める際に、ある条件を満足
する(n、j)に対しては漸化式計算を行い、満足しな
い(n、j)に対しては漸化式計算を省略するという枝
刈処理を取り入れることにより、漸化式計算回数を削減
するものである。
枝刈の条件としては、例えば、時刻iにおけるg″(i
 、 j)の最小値gminに余裕分α(ビーム幅ファ
クタ)を加えたものをiにおけるしきい値θ(i)とし
て用いる方法がある。この場合、θ(i)>ga(t、
j)となる(n、j)のみを漸化式計算の対象として残
し、それ以外の(n。
j)は漸化式計算の対象から外す。
基カバターンaiが入力されると、枝刈を行いながらク
ロックワイズ法によって漸化式計算を行う。第2図はそ
のアルごリズムを示している。第2図では、求められた
g”(i、j)としきい値θ(i)を比較し、g“(i
、j)>θ(i)であればj−=j+xとして漸化式計
算を省略する。以上のようにして、処理は基カバターン
の入力と同期してf=1からI−1まで処理される。基
カバターンの最後の特徴ベクトルaiが入力されると、
i−1において、マツチング部では、(2)式の処理が
行われ、各単語nごとに基カバターンとの距1iD(A
、B”)を得る。
D(A、Bつテg”(I、J) =g”(J)+d”C
1,J)次に、求められたD(A、B’)を順次比較し
、最ノJ−値を求め、これに対応するnを認識結果とし
て出力する。
(発明が解決しようとする問題点) 従来方式における枝刈を伴う認識処理では、語中のある
時刻iにおける枝刈で残きれた(n。
j)のnが1種類になることもありうる。この場合、i
+1以降の漸化式計算を行ってもn以外の単語が認識結
果となることはない、しかしながら、従来方式による音
声認識装置では、認識結果を得るために基カバターンの
開始から終了時刻までのパターンに対して標準パターン
とのパターン間距離D(A、B”)を求める必要があっ
た。しかし、上記のように、枝刈によってnが1種類に
なったその時点で認識結果が1意に定まってしまう。そ
のため、認識結果を得るという意味では、i+1以降I
まで計算は余分な処理であり、認識速度を低下きせる原
因となっていた。
本発明の目的は、上記に述べた計算の無駄を省き、より
速く認識結果を得ることのできる音声認識装置を提供す
ることにある。
(問題点を解決するための手段) 本発明による音声認識装置は次の各部を必要とする。す
なわち各単語nの音声の特徴ベクトル時系列B” = 
b” 、・−b“1・・・b”、を標準パターンとして
保持する標準パターン格納部と、枝刈のしきい値を格納
するしきい値格納部と、時刻iの入力音声の特徴ベクト
ルaiを逐次読み込み、各時刻iにおいて入力音声の特
徴aiと前記標準パターン格納部の標準パターンとの距
離d”(i、Dの累積距離g’(i、Dを前記しきい値
格納部のしきい値によって定められる条件を満足する(
n、j)の値に対して求め、またそのとき条件を満足す
る(n、j)のnの値が1種類である場合には単語nを
認識結果として出力するマツチング部と、このマツチン
グ部にて求められた累積距離を格納する累積距離格納部
と、前記マツチング部にて時刻工に求められた累積距離
g”(I、J)の最小値を与える単語nを認識結果とし
て出力する判定部の各部である。
(作用) 本発明による音声認識装置は、漸化式計算を進める際、
枝刈されない(n、j)のnが、1種類しか存在しない
場合には、入カバターンの入力終了を持たずに単語nを
認識結果として出力する点を特徴とする。枝刈されない
(n、j)のnが1種類になったということは、これ以
上漸化式計算を行ってもn以外の単語が認識結果になる
ことはないことを意味する。従って、nが1種類になっ
た時点で、nを認識結果として出力することによりそれ
以降の漸化式計算を省略することができ、認識処理を高
速化することができる。
以上の機能を持つ音声認識装置は、枝刈されない(n、
j)のnが1種類かどうかの判定機能を持ち、そのよう
なnが1種類であればその時点でnを結果として出力し
、2種類以上ある場合にはi+1における漸化式処理を
続ける処理により実現できる。
(実施例) 以下に、本発明の実施例について図面を参照しながら詳
細に説明する。第1図は、本発明の一実施例を示すブロ
ック図である。
第1図における標準パターン格納部1には、あらかじめ
発声された認識対象単語n(1≦n≦N)の各時系列デ
ータが標準パターンB、= b” 、・・・bai・・
・b“、として格納されており、しきい値格納部2には
、時刻iにおける枝刈のしきい値θ(i)があらかじめ
格納きれているとする。発声された入カバターンAは実
時間で分析され、特徴ベクトル帽の時系列のデータとし
て逐次マツチング部3に入力きれる。
マツチング部3では、入力されたaiごとに、n。
jに対して枝刈を伴う漸化式計算を行いga (1゜j
)を求める。この処理には従来方式におけるクロックワ
イズDP法に枝刈の考えを導入した方式(前記文献、特
願昭62−61732号)を用いる。マツチング部3で
は、しきい値格納部2のしきい値θ(i)を読み込み、
g”(i、j)<θ(i)を−満足する(n、j)に対
して漸化式計算を行う。
マツチング部3における枝刈を伴う漸化式計算の処理と
しては、第2図に示した従来方式における処理を用いる
ことができる。マツチング部3における処理において、
時刻iで求められた累積距離g・(i 、 j)は、累
積距離格納部4に保持される。それらの累積距離は、i
+1の漸化式計算時にマツチング部3より読み出され使
用される。ここで、マツチング部3では、上記の処理の
他に(n、j)のnが1種類かどうか判定を行い、1種
類であればnを認識結果として出力する。この処理を含
めたマツチング部3のアルゴリズムを第3図に示す。2
重枠内がnが1種類かどうかの判定処理である。n′は
!語nに対して、枝仮されないjがあるかどうかのフラ
グであり、そのようなjがあればn′は単語番号nの値
となる。また、nnはiにおいて技刈諮れない(n、j
)のnの個数である。iの処理が終了した後、n、 n
 < 2なる判定処理を満足した場合にn′を認識結果
として出力する。
このアルゴリズムにより枝刈されない(n。
j)のnが常に2種類以上ある場合は、従来方式と同様
に時刻I−1までの漸化式計算とIにおける(2)式の
処理を行い、入カバターンAと全ての標準パターンBn
とのパターン間距離を求める0判定部5では、マツチン
グ部4にて得られた入カバターンAと全ての標準パター
ンBn、n=1・・・Nとのパターン間距離のうち最小
距離を与えた標準パターンを結果として出力する。
(発明の効果) 以上に述べたように、本発明によれば、枝刈されない(
n、j)のnが1種類である場合、直ちにnを結果とし
て出力することにより、計算量を低減し、認識処理速度
を高めた音声認識装置の実現が可能になる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
従来方式のマツチング部における処理のアルゴリズムを
示す流れ図、第3図は第1図のマツチング部における処
理のアルゴリズムを示す流れ図である。 1・・・標準パターン格納部、2・・・しきい値格納部
、3・・・マツチング部、4・・・累積距離格納部、5
・・・判定部。

Claims (1)

    【特許請求の範囲】
  1. 各単語nの音声の特徴ベクトル時系列B^■=b^■_
    i…b^■_i…b^■_jを標準パターンとして保持
    する標準パターン格納部と、枝刈のしきい値を格納する
    しきい値格納部と、時刻iの入力音声の特徴ベクトルa
    _iを逐次読み込み、各時刻iにおいて入力音声の特徴
    a_iと前記標準パターン格納部の標準パターンとの距
    離d^■(i、j)の累積距離g^■(i、j)を前記
    しきい値格納部のしきい値によって定められる条件を満
    足する(n、j)の値に対して求め、またそのとき条件
    を満足する(n、j)のnの値が1種類である場合には
    単語nを認識結果として出力するマッチング部と、この
    マッチング部にて求められた累積距離を格納する累積距
    離格納部と、前記マッチング部にて時刻Iに求められた
    累積距離g^■(I、J)の最小値を与える単語nを認
    識結果として出力する判定部とを有することを特徴とす
    る音声認識装置。
JP62298594A 1987-11-25 1987-11-25 音声認識装置 Granted JPH01138596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62298594A JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62298594A JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Publications (2)

Publication Number Publication Date
JPH01138596A true JPH01138596A (ja) 1989-05-31
JPH0577080B2 JPH0577080B2 (ja) 1993-10-25

Family

ID=17861755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62298594A Granted JPH01138596A (ja) 1987-11-25 1987-11-25 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01138596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096271A1 (ja) * 2004-03-30 2005-10-13 Pioneer Corporation 音声認識装置及び音声認識方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518141B2 (ja) * 2007-12-17 2010-08-04 日本電気株式会社 画像照合方法及び画像照合装置並びに画像照合プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096271A1 (ja) * 2004-03-30 2005-10-13 Pioneer Corporation 音声認識装置及び音声認識方法

Also Published As

Publication number Publication date
JPH0577080B2 (ja) 1993-10-25

Similar Documents

Publication Publication Date Title
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JPS60211498A (ja) 連続音声認識装置
JPH02186398A (ja) 連続音声認識装置
JPH07219579A (ja) 音声認識装置
JPH0296800A (ja) 連続音声認識装置
JPH01138596A (ja) 音声認識装置
JP2003271185A (ja) 音声認識用情報作成装置及びその方法と、音声認識装置及びその方法と、音声認識用情報作成プログラム及びそのプログラムを記録した記録媒体と、音声認識プログラム及びそのプログラムを記録した記録媒体
JPS6147999A (ja) 音声認識装置
JP3316352B2 (ja) 音声認識方法
JPS63236094A (ja) 音声認識方法
JPH01302300A (ja) 自己回帰モデル自動次数決定方法
Yfantis et al. Vector interpolation for time alignment in speech recognition
JPH0554678B2 (ja)
JP2000267691A (ja) 音声認識システムにおける認識辞書選択方法
JPH05303391A (ja) 音声認識装置
JPS62161200A (ja) 連続音声認識装置
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
CN114822535A (zh) 语音关键词识别方法、装置、介质及设备
JPS63148299A (ja) 単語音声認識方法および装置
JPH03278097A (ja) 音声認識装置
JPH08110797A (ja) パターンマッチング装置
JPS6157996A (ja) 音声認識方式
JPS59173884A (ja) パタ−ン比較装置
JPH0336439B2 (ja)
JPH08248983A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees