JPH0651793A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0651793A
JPH0651793A JP20783792A JP20783792A JPH0651793A JP H0651793 A JPH0651793 A JP H0651793A JP 20783792 A JP20783792 A JP 20783792A JP 20783792 A JP20783792 A JP 20783792A JP H0651793 A JPH0651793 A JP H0651793A
Authority
JP
Japan
Prior art keywords
distance
memory
storing
cumulative
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20783792A
Other languages
English (en)
Inventor
Toshio Akaha
俊夫 赤羽
Satoru Nakamura
哲 中村
Seiji Hamaguchi
清治 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP20783792A priority Critical patent/JPH0651793A/ja
Publication of JPH0651793A publication Critical patent/JPH0651793A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声パターンのマッチング処理と同時にパタ
ーン間距離も計算出来る音声認識装置を提供する。 【構成】 ダイナミックプログラミングを用いた音声認
識装置において、2つの音声パターンのフレームを対応
付ける格子上の点に対応させて最適化原理に従って計算
される累積距離を格納するメモリーと、重み付き累積ス
コアを格納するメモリーと、累積重みを格納するメモリ
ーとを有し、ダイナミックプログラミングによる最適マ
ッチング計算と、任意の重み付けを施したパターン間距
離の計算を同時に行うことを特徴とするよう構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に関する
ものである。
【0002】
【従来の技術】2つの時系列パターンTとRのパターン
間距離を求める時、従来からダイナミックプログラミン
グによるマッチング、即ちDPマッチングの手法が用い
られている。DPマッチングは、2つのパターン間距離
が最も近くなるように2つの時系列間でフレームの対応
付けを行い、対応づけられた点列(マッチングパス)の
上でパターン間距離を累積し、パターン間の距離とす
る。
【0003】まず従来のDPマッチングの一般的な計算
方法を述べる。入力パターン、参照パターン共に数ms
ecないし数十msecの音声区間毎に音響分析を行っ
てスペクトルなどの情報を抽出して次のような時系列と
する。
【0004】
【数1】
【0005】
【数2】
【0006】ダイナミックプログラミング(以下「D
P」と称す。)はこれらの時系列a(i)とb(j)の
フレーム間の対応を最適にとる事を目的とするが、この
対応をマッチングパスと呼び。c(k)で表すことにす
る。またそのパス上の点での距離をフレーム間距離と呼
び、d(c(k))で表す。
【0007】
【数3】
【0008】
【数4】
【0009】フレーム間距離としては、ユークリッド距
離や市街地距離がよく用いられる。時系列TとRのパタ
ーン間距離はフレーム間距離の重み付き累積が最小にな
るようにマッチングパスを選んだ時の累積距離で、次の
(5)式で表すことができる。
【0010】
【数5】
【0011】DPでは、累積距離g(c(k))を定義
し漸化的に求める事により、このパターン間距離を全て
のマッチングパスFについて計算する事なく最適のFに
対するパターン間距離を求める事が出来る。
【0012】
【数6】
【0013】
【数7】
【0014】(6)式のc(k−1)はc(k)より前
の隣接するいくつかの格子点に制限される。ここで、
(5)式の分母がFには依存しない場合のみ、最適化原
理が適用され、各c(k)でg(c(k))を{Σw
(k)}で正規化しないでも最適性が保たれ、(7)式
が成り立つ。この様なパス制限c(k−1)及び重みw
(k)として次のようなものがある。
【0015】
【表1】
【0016】
【表2】
【0017】
【表3】
【0018】上記例1〜例3のいずれの例においても、
(a)の重み付けの場合(5)式または(7)式の分母
はJとなり、(b)の重み付けの場合はJ+Iとなる。
【0019】図3は例3の(a)を図示したものであ
る。図の横方向がTのフレームiを表し、縦方向がRの
フレームjを表す。図中の符号10、20、30は以下
の条件を示している。
【0020】
【表4】
【0021】
【発明が解決しようとする課題】従来のDPでは、重み
w(k)は入力音声や参照パターンのどのフレームでも
一定である。しかし、例えば促音「っ」を含む単語は、
単語内に無音区間を含むが、(5)式の中では単語内の
無音区間もパターン間距離の計算に含まれてしまうの
で、環境雑音の違いにより、正確な音声のパターン間距
離が乱されてしまう。
【0022】この対策としてw(k)を無音区間で小さ
くするような操作を行うことが考えられるが、(5)式
の分母がFに依存してしまい、DPの最適化原理が成り
立たず、各フレームでの累積距離の正規化が必要にな
る。この正規化は計算量の大幅な増加をもたらす。
【0023】この正規化を省略するには、一旦定義どう
りのDPを行ったのちマッチングパスFの上でフレーム
ごとに重み付けをしながらパターン間距離を求める方法
が考えられるが、マッチングの後での処理時間が必要に
なる。
【0024】本発明はこのような問題点に鑑み、マッチ
ングと同時にパターン間距離も計算出来る音声認識装置
を提供するものである。
【0025】
【課題を解決するための手段】前記の問題点を解決する
ため、本発明の音声認識装置においては、ダイナミック
プログラミングを用いた音声認識装置において、2つの
音声パターンのフレームを対応付ける格子上の点に対応
させて最適化原理に従って計算される累積距離を格納す
るメモリーと、重み付き累積スコアを格納するメモリー
と、累積重みを格納するメモリーとを有し、ダイナミッ
クプログラミングによる最適マッチング計算と、任意の
重み付けを施したパターン間距離の計算を同時に行うこ
とを特徴とするよう構成している。即ち、最適化原理の
適用出来る重みをw(k)、出来ない重みをv(k)と
し、w(k)で重み付けされたマッチングのための累積
距離をg(c(k))、v(k)で重み付けされたパタ
ーン間距離のための累積スコアをs(c(k))とし、
各格子点c(k)において累積距離g(c(k))を格
納するメモリーと、重み付き累積スコアs(c(k))
を格納するメモリーと、累積重みu(c(k))を格納
するメモリーを設けている。
【0026】
【作用】各格子点c(k)、(ただしk=1,2,・・
・,K)に対して、次の(8)〜(11)式を計算し、
s(c(k)),u(c(k))を求めて記憶する。
【0027】
【数8】
【0028】
【数9】
【0029】
【数10】
【0030】
【数11】
【0031】
【数12】
【0032】マッチングの後、(12)式に従って重み
付きパターン間距離を計算する。
【0033】
【実施例】図1は本発明の実施例を説明するブロック図
である。1はプログラムに従い音声認識に必要な処理を
実行するCPU、2はCPU1に制御され、音声信号を
デジタル化するA/D変換器、3は入力された音声とそ
のパラメータを格納するメモリー、4は参照パターンの
パラメータを格納するメモリー、5は認識処理に必要な
前記プログラムを格納するメモリー、6は累積距離g
(c(k))を格納するメモリー、7は重み付き累積ス
コアs(c(k))を格納するメモリー、8は累積重み
u(c(k))を格納するメモリーである。
【0034】入力音声を予め切り出さないで認識する連
続DPの例を考える。マッチング用の重みw(k)は図
3に示すものに対して少し修正を加える。ここでは図2
のc2(k−1)以外のパスに対する重みを(1+α)
倍する事で入力と参照パターンの時間構造がずれる事に
対して(1+α)倍のペナルティをかける事にする。
【0035】
【表5】
【0036】スコア重みv(k)には、入力と参照パタ
ーンの音声パワーPa(i(k)),Pb(j(k))
を用いる。
【0037】
【数13】
【0038】とすると、(10)式(11)式は次のよ
うになる。
【0039】
【数14】
【0040】
【数15】
【0041】これにより入力音声と参照音声の音声パワ
ーの小さな部分は累積スコアに対する影響が軽減され、
しかもマッチング中に同時にスコアを正規化処理無しに
求める事が可能になる。
【0042】このアルゴリズムを図2に示す。この図で
は参照パターンは既に音響分析されてメモリーに格納さ
れているものとする。音響分析は特に定めないが音声の
スペクトル情報、パワー情報を持ったパラメータとす
る。
【0043】(201)で入力され、(202)で分析
された1フレームの音声パラメータに対して、参照パタ
ーンの各フレームとの距離を格子点毎に(204)で求
め、格子点毎に(205)で(8)式、(9)式、(1
4)式、(15)式の計算を行う。マッチング用にはg
(c(k))の重みを、スコア用にはv(c(k))の
重みをそれぞれ別にかけて累積する。
【0044】(206)では入力の各フレームiでそこ
までの入力T={a(1),a(2),・・・・,a
(i)}と参照パターンRとのパターン間距離を計算
し、それがある閾値より小さければ単語が検出されたと
する。参照パターンが複数ある場合はそのどれかがある
閾値より小さければ検出されたとする。
【0045】
【発明の効果】本発明により、パターン間距離の計算用
の重み付けに最適化原理の適用できない式を用い、DP
パターンマッチング用の重み付けと、パターン間距離の
計算用の重み付けを事なる式で与えた場合でも、最適化
原理に従って、格子点毎に累積距離や累積スコアの正規
化をすることなしに効率よくDPマッチングによる認識
をする事が可能になる。
【図面の簡単な説明】
【図1】本発明の実施例のブロック図である。
【図2】本発明の実施例のアルゴリズムを表す図であ
る。
【図3】DPにおいて使用されるパス制限とその重みの
例を表す図である。
【符号の説明】
1 CPU(DSP) 2 A/D変換器 3 入力音声とそのパラメータを格納するメモリー 4 参照パターンのパラメータを格納するメモリー 5 プログラムを格納するメモリー 6 累積距離g(c(k))を格納するメモリー 7 重み付きスコアs(c(k))を格納するメモリー 8 累積重みu(c(k))を格納するメモリー

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 ダイナミックプログラミングを用いた音
    声認識装置において、 2つの音声パターンのフレームを対応付ける格子上の点
    に対応させて最適化原理に従って計算される累積距離を
    格納するメモリーと、 重み付き累積スコアを格納するメモリーと、 累積重みを格納するメモリーとを有し、 ダイナミックプログラミングによる最適マッチング計算
    と、任意の重み付けを施したパターン間距離の計算を同
    時に行うことを特徴とする音声認識装置。
JP20783792A 1992-08-04 1992-08-04 音声認識装置 Pending JPH0651793A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20783792A JPH0651793A (ja) 1992-08-04 1992-08-04 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20783792A JPH0651793A (ja) 1992-08-04 1992-08-04 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0651793A true JPH0651793A (ja) 1994-02-25

Family

ID=16546348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20783792A Pending JPH0651793A (ja) 1992-08-04 1992-08-04 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0651793A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005078006A1 (ja) 2004-02-12 2005-08-25 Kureha Corporation ポリアリーレンスルフィド及びその製造方法
US7754848B2 (en) 2003-12-26 2010-07-13 Kureha Corporation Poly (arylene sulfide) and production process thereof

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7754848B2 (en) 2003-12-26 2010-07-13 Kureha Corporation Poly (arylene sulfide) and production process thereof
US8183336B2 (en) 2003-12-26 2012-05-22 Kureha Corporation Poly (arylene sulfide)
WO2005078006A1 (ja) 2004-02-12 2005-08-25 Kureha Corporation ポリアリーレンスルフィド及びその製造方法
US7655748B2 (en) 2004-02-12 2010-02-02 Kureha Corporation Poly(arylene sulfide) and production process thereof
US8076447B2 (en) 2004-02-12 2011-12-13 Kureha Corporation Poly (arylene sulfide) and production process thereof

Similar Documents

Publication Publication Date Title
US7133826B2 (en) Method and apparatus using spectral addition for speaker recognition
JP3584458B2 (ja) パターン認識装置およびパターン認識方法
US5228087A (en) Speech recognition apparatus and methods
JP3789246B2 (ja) 音声区間検出装置、音声区間検出方法、音声認識装置、音声認識方法および記録媒体
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
US4882755A (en) Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature
US20030220792A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
US7216075B2 (en) Speech recognition method and apparatus with noise adaptive standard pattern
US6996527B2 (en) Linear discriminant based sound class similarities with unit value normalization
JPH07219579A (ja) 音声認識装置
JPH0651793A (ja) 音声認識装置
JPS60114900A (ja) 有音・無音判定法
JP2003044078A (ja) 発声速度正規化分析を用いた音声認識装置
JPH04296799A (ja) 音声認識装置
JP3107905B2 (ja) 音声認識装置
JPH04264596A (ja) 雑音下音声認識方法
JP2514983B2 (ja) 音声認識方式
JP2710045B2 (ja) 音声認識方法
JPH0484197A (ja) 連続音声認識装置
JPS6147999A (ja) 音声認識装置
JP2514984B2 (ja) 音声認識方式
JP2844592B2 (ja) 離散単語音声認識装置
JP3254933B2 (ja) 音声認識方法
JPH05197397A (ja) 音声認識方法及びその装置
JP2024015817A (ja) 閾値生成方法、閾値生成装置およびプログラム