JPH0683383A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0683383A
JPH0683383A JP25406292A JP25406292A JPH0683383A JP H0683383 A JPH0683383 A JP H0683383A JP 25406292 A JP25406292 A JP 25406292A JP 25406292 A JP25406292 A JP 25406292A JP H0683383 A JPH0683383 A JP H0683383A
Authority
JP
Japan
Prior art keywords
pattern
input pattern
standard
input
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP25406292A
Other languages
English (en)
Inventor
Tetsuo Kobayashi
哲夫 小林
Makoto Akaha
誠 赤羽
Masahito Mori
正仁 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25406292A priority Critical patent/JPH0683383A/ja
Publication of JPH0683383A publication Critical patent/JPH0683383A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声の認識率を向上させる。 【構成】 例えば図7(a)に示すようなDPパスP1
乃至P9の始点と終点が存在する場合、所定の値C(図
7においては、C=5となっている)だけ連続して始点
が同一となっているDPパスP1乃至P5(図7(b))
の区間に、認識候補が絞り込まれる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声に含まれる特定の
単語を抽出する(ワードスポッティングする)場合に用
いて好適な音声認識装置に関する。
【0002】
【従来の技術】従来の、音声に含まれる特定の単語を抽
出する(ワードスポッティングする)音声認識装置にお
いては、例えば音声が音響分析されて入力パターンとし
ての特徴パラメータが求められ、この入力パターンと標
準パターンとの距離が算出される。この場合、入力パタ
ーンの長さ、即ち音声区間(音声が発声されている区
間)は、標準パターンの長さと対応しているものではな
いので、このような音声認識装置では、入力パターンの
時間軸および標準パターンの時間軸の正規化を行うとと
もに、標準パターンを対応させる(照合する)入力パタ
ーンの区間を、その始点から終点まで変化させて、入力
パターンと標準パターンとの距離を算出するようになっ
ている。
【0003】そして、入力パターンとの距離が所定の距
離以下になる標準パターンと、この標準パターンを入力
パターンに対応させた時系列上の位置が、音声の認識結
果として出力される。
【0004】
【発明が解決しようとする課題】ところで、入力パター
ンとの距離が所定の距離以下になる標準パターンが、時
系列上ほぼ同じ位置に複数存在する場合があり、正しい
音声認識結果としての標準パターンを選択することが困
難になる課題があった。
【0005】また、入力パターン中に存在する標準パタ
ーンの位置を認識する場合、時系列上において、標準パ
ターンと入力パターンとの距離が極小になる位置を検出
する方法があるが、標準パターンと入力パターンとの距
離の時間変化(時系列上の変化)には、いわゆるばたつ
きが多く、誤った極小点が検出されるときがあり、認識
率が劣化する課題があった。
【0006】本発明は、このような状況に鑑みてなされ
たものであり、音声の認識率を向上させるものである。
【0007】
【課題を解決するための手段】請求項1に記載の音声認
識装置は、音声から入力パターンを作成する入力パター
ン作成手段としての音響分析部2およびNAT(Normal
ization Along Trajectory)処理部3と、所定の単語の
標準パターンをあらかじめ記憶している標準パターン記
憶手段としての標準パターンメモリ6と、音響分析部2
およびNAT処理部3により作成された入力パターン
と、標準パターンメモリ6に記憶されている標準パター
ンとを対応させてDPマッチングするDPマッチング手
段としてのDPマッチング部5と、DPマッチング部5
により入力パターンと標準パターンとを対応させたDP
パスの始点に注目して、入力パターン中における標準パ
ターンを絞り込む絞り込み手段としてのワードスポッテ
ィング判定部7とを備えることを特徴とする。
【0008】請求項2に記載の音声認識装置は、ワード
スポッティング判定部7に、同一の始点を有するDPパ
ス数に対応して、入力パターン中における標準パターン
を絞り込ませることを特徴とする。
【0009】請求項3に記載の音声認識装置は、音声を
フレーム分けして、フレーム内の音声から、入力パター
ンとなるシンボルを順次作成する入力パターン作成手段
としての音響分析部2およびNAT(Normalization Al
ong Trajectory)処理部3と、所定の単語の標準パター
ンをあらかじめ記憶している標準パターン記憶手段とし
ての標準パターンメモリ6と、音響分析部2およびNA
T処理部3よりシンボルが出力されるごとに、入力パタ
ーンと標準パターンとを対応させてDPマッチングする
DPマッチング手段としてのプログラムの処理ステップ
S2と、プログラムの処理ステップS2のマッチング結
果が出力されたときのDPパスの始点と同一の始点を有
するDPパスを検出し、同一始点パス数をカウントする
検出カウント手段としてのプログラムの処理ステップS
3およびS4と、プログラムの処理ステップS3および
S4によりカウントされた同一始点パス数に対応して、
入力パターン中における標準パターンを絞り込む絞り込
み手段とプログラムの処理ステップS6およびS7とを
備えることを特徴とする。
【0010】請求項4に記載の音声認識装置は、NAT
処理部3に、入力パターンとなるシンボル系列の軌跡を
サンプリングさせ、新たなシンボル系列からなる入力パ
ターンを作成させることを特徴とする。
【0011】
【作用】請求項1に記載の音声認識装置においては、音
声から入力パターンを作成し、この入力パターンと、標
準パターンメモリ6に記憶されている標準パターンとを
対応させてDPマッチングする。そして、入力パターン
と標準パターンとを対応させたDPパスの始点に注目し
て、入力パターン中における標準パターンを絞り込む。
従って、例えば入力パターンと標準パターンとの距離に
注目して標準パターンを絞り込む場合に比べ、音声認識
結果としての標準パターンが時系列上で重複する位置に
存在することがなくなり、音声の認識率を向上させるこ
とができる。
【0012】請求項2に記載の音声認識装置において
は、ワードスポッティング判定部7に、同一の始点を有
するDPパス数に対応して、入力パターン中における標
準パターンを絞り込ませる。従って、音声の認識率を向
上させることができる。
【0013】請求項3に記載の音声認識装置において
は、音声をフレーム分けして、フレーム内の音声から、
入力パターンとなるシンボルを順次作成し、このシンボ
ルが出力されるごとに、入力パターンと標準パターンと
を対応させてDPマッチングする。そして、マッチング
結果が出力されたときのDPパスの始点と同一の始点を
有するDPパスを検出し、同一始点パス数をカウントし
て、その同一始点パス数に対応して、入力パターン中に
おける標準パターンを絞り込む。従って、例えば入力パ
ターンと標準パターンとの距離に注目して標準パターン
を絞り込む場合に比べ、音声認識結果としての標準パタ
ーンが時系列上で重複する位置に存在することがなくな
り、音声の認識率を向上させることができる。
【0014】請求項4に記載の音声認識装置において
は、NAT処理部3に、入力パターンとなるシンボル系
列の軌跡をサンプリングさせ、新たなシンボル系列から
なる入力パターンを作成させる。従って、入力パターン
の時間軸補正があらかじめ行われるので、音声の認識率
をさらに向上させることができる。
【0015】
【実施例】図1は、本発明の音声認識装置の一実施例の
構成を示すブロック図である。マイク1は入力された音
声を電気信号である音声信号に変換する。音響分析部2
は、例えばI個のチャンネルを有するフィルタバンクで
構成されている。フィルタバンクの各チャンネルは、そ
の通過域を通過する音声信号成分を全波整流して平滑化
し、音声の特徴パラメータとしての、例えばパワーPi
(n)を検出する。なお、i=1,2,・・・,Iで、
iはチャンネル数を表す。また、n=1,2,・・・,
Nで、nはフレーム数(時間)を表す。よって、Nは音
声区間(音声が発声されている区間)を表す。
【0016】NAT(Normalization Along Trajector
y)処理部3は、音声分析部2により検出された音声の
特徴パラメータとしてのパワーPi(n)に対して、N
AT処理を施す。
【0017】なお、NAT処理に関しては、例えば特開
昭60−249198、特開昭60−249199、ま
たは特開昭60−252396などに、その詳細が開示
されているので、ここでは簡単に説明する。
【0018】即ち、NAT処理部3は、例えば図2に示
すように、補間間隔設定器3aおよび補間点抽出器3b
より構成される。例えば2つの(2次元の)特徴パラメ
ータP1(n)およびP2(n)のみを考えた場合、補間
間隔設定器3aは、この2つのパラメータ(図3または
図4において、・印で示す)が、図3または図4に示す
ような2次元のパラメータ空間内に描く軌跡をサンプリ
ングするための、あらかじめ設定された間隔(サンプリ
ング間隔)Tを補間点抽出器3bに供給する。
【0019】以下、特徴パラメータPi(n)の周波数
方向に対応するサフィックスiを省略する。
【0020】補間点抽出器3bは、装置のモードが登録
モードである場合、音響分析部2より供給された特徴パ
ラメータP(n)がパラメータ空間内に描く軌跡を直線
近似した軌跡に沿って、図4に○印で示すように、補間
間隔設定器3aに設定されているサンプリング間隔T
で、特徴パラメータP(n)の軌跡をサンプリングし、
標準パターンとしての新たな特徴パラメータ系列R
(k)(k=1,2,・・・,K)を標準パターンメモ
リ6(図1)に供給する。
【0021】なお、図4に示す特徴パラメータP(n)
の軌跡長をLRとすると、 K=LR/T である。
【0022】また、補間点抽出器3bは、装置のモード
が認識モードである場合、音響分析部2より供給された
特徴パラメータP(n)がパラメータ空間内に描く軌跡
を直線近似した軌跡に沿って、図3に○印で示すよう
に、補間間隔設定器3aに設定されているサンプリング
間隔Tで、特徴パラメータP(n)の軌跡をサンプリン
グし、入力パターンとしての新たな特徴パラメータ系列
X(j)(j=1,2,・・・,J)を入力パターンメ
モリ4(図1)に供給する。
【0023】なお、図3に示す特徴パラメータP(n)
の軌跡長をLXとすると、 K=LX/T である。
【0024】入力パターンメモリ4は、装置の動作モー
ドが認識モードの場合に、NAT処理部3より供給され
る、入力パターンとしての新たな特徴パラメータ系列X
(j)を一時記憶する。標準パターンメモリ6は、装置
の動作モードが登録モードの場合に、NAT処理部3よ
り供給される、標準パターンとしての新たな特徴パラメ
ータ系列R(k)を記憶する。
【0025】DPマッチング部5は、始点フリーのDP
マッチングを行う。即ち、DPマッチング部5は、標準
パターンR(k)の時間軸k、または入力パターンX
(j)の時間軸jのうちの一方の、例えば標準パターン
R(k)の時間軸kを、他方のパターンである入力パタ
ーンX(j)に最も類似するように(標準パターンR
(k)と入力パターンX(j)との距離を最小にするよ
うに)歪ませる歪関数F、即ちDPパスを、次のように
して求める。
【0026】図5に示す縦軸kに標準パターンR(1)
乃至R(K)を並べ、横軸jに入力パターンX(1)乃
至X(J)を並べた平面図において、この平面上の格子
点(j,k)(図中、・印で示す)における入力パター
ンX(j)と標準パターンR(k)との、例えばユーク
リッド距離をd(j,k)(=|X(j)−R(k)|
2)とし、格子点(j,k)を含む任意のDPパスに沿
って求めた、この格子点(j,k)までのユークリッド
距離の総和(累積距離)をg(j,k)とする。そし
て、この場合、DPマッチング部5は、例えば以下の漸
化式(制限)にしたがって、DPパスを求めるとともに
標準パターンの終点(k=K)までの累積距離g
(jx,K)(jxは、1乃至Jの範囲の値)を求める。
k=1のとき、 g(j,1)=d(j,1) (1) 但し、1≦j≦J k=2のとき、 g(j,2)=g(j−1,1)+2d(j,2) (2) 但し、2≦j≦J k=2jのとき、 g(j,k)=g(j−1,k−2)+2d(j,k−1) +d(j,k) (3) 但し、2≦j≦J,3≦k≦K k=2j−2、またはk=2j−1のとき、
【数1】 k≦2j−3のとき、
【数2】 なお、min[]は、[]の中の最小値をとる。
【0027】式(漸化式)(5)は、DPパスを図6に
示すように制限する。なお、図6において、DPパス上
に付してある数字1または2は重み係数である。また、
DPパスの始点が、j=1またはj=2から始まる場合
に、式(1)乃至(5)により与えられるDPパスの初
期状態、およびその上限を図5に示す。
【0028】格子点(j,k)までのDPパスの長さ
(パス長)C(j,k)は、上述した重み係数の累積和
と定義され、始点(j(jx),1)(j(jx)は、1
乃至Jの範囲の値)、終点(jx,K)のDPパスPx
したがって計算された累積距離g(jx,K)を、DP
パスPxのパス長C(j(jx),jx)で正規化した正
規化距離G(jx)(=g(jx,K)/C(j
(jx),jx))が、そのDPパスPxにしたがった入
力パターン(X(1),X(2),・・・,X(J))
と標準パターン(R(1),R(2),・・・,R
(K))との距離(スコア)とされる。
【0029】DPマッチング部5は、この正規化距離G
(jx)、それが得られたDPパスPxの始点(j
(jx),1)、および終点(jx,K)をワードスポッ
ティング判定部7に供給する。
【0030】なお、DPパスPxの始点(j(jx),
1)は、式(漸化式)(1)乃至(5)にしたがって、
入力パターンと標準パターンとの距離計算を行うとき
に、始点側、即ち式(1)乃至(5)の右辺を保持する
ことにより与えられる。従って、DPパスPxの始点
(j(jx),1)は、その終点(jx,K)が決まれ
ば、一義的に決まるので、始点(j(jx),1)を終
点(jx,K)の関数として記述してある。
【0031】また、DPマッチング部5は、式(漸化
式)(1)乃至(5)で制限される(与えられる)すべ
てのDPパスに対する入力パターンと標準パターンとの
距離を計算し、さらに標準パターンメモリ6に記憶され
ている、例えばW個のすべての標準パターンR1(k)
乃至RW(k)に対して以上の処理を行う。
【0032】ワードスポッティング判定部7は、まず、
DPマッチング部5より供給される各DPパスの始点、
および終点から、終点が異なっていても、始点が同一で
あるDPパスを検出する。即ち、DPマッチング部5よ
り、例えば図7(a)に示すようなDPパスP1乃至P9
の始点と終点が供給された場合、ワードスポッティング
判定部7は、所定の値C(図7においては、C=5とな
っている)だけ連続して始点が同一となっているDPパ
スP1乃至P5(図7(b))を検出する。
【0033】なお、所定の値Cは、例えば標準パターン
メモリ6に記憶されている標準パターンの長さに対応し
て、あらかじめ設定される値である。
【0034】そして、ワードスポッティング判定部7
は、検出した同一始点を有するDPパスにしたがって計
算された距離のうち、最小のものを入力パターンと標準
パターンとのパターン間距離(スコア)として、内蔵す
るメモリ(図示せず)に記憶するとともに、そのパター
ン間距離となるDPパスの始点と終点の間を、入力パタ
ーン中における、標準パターンの範囲(入力パターン中
における、標準パターンが発声された区間)の候補とし
て、内蔵するメモリに記憶する。
【0035】ワードスポッティング判定部7は、以上の
ようにしてDPマッチング部5より供給される、標準パ
ターンメモリ6に記憶されているすべての標準パターン
に対するパターン間距離(スコア)およびそのパターン
間距離となるDPパスの始点と終点の間を、内蔵するメ
モリに記憶した後、そのメモリにあらかじめ登録されて
いる辞書を参照して、音声認識結果としての標準パター
ン(単語)と、それが発声された位置(範囲)を出力す
る。
【0036】次に、その動作について説明する。まず、
装置の動作モードが登録モードである場合、マイク1に
入力された音声が、音響分析部2のフィルタバンクにお
いて全波整流されて平滑化され、音声の特徴パラメータ
としてのパワーP(n)(パワーPi(n)の周波数方
向に対応するサフィックスiを省略してある)が検出さ
れる。
【0037】NAT処理部3の補間間隔設定器3a(図
2)において、音響分析部2により検出された特徴パラ
メータP(n)(図3または図4で、・印で示す)が、
図3または図4に示すような2次元のパラメータ空間内
に描く軌跡をサンプリングするための、あらかじめ設定
された間隔(サンプリング間隔)Tが補間点抽出器3b
に供給される。
【0038】補間点抽出器3bにおいて、音響分析部2
より供給された特徴パラメータP(n)がパラメータ空
間内に描く軌跡を直線近似した軌跡に沿って、図4に○
印で示すように、補間間隔設定器3aに設定されている
サンプリング間隔Tで、特徴パラメータP(n)の軌跡
がサンプリングされ、標準パターンとしての新たな特徴
パラメータ系列R(k)が標準パターンメモリ6(図
1)に供給され、記憶される。
【0039】次に、装置の動作モードが認識モードであ
る場合、それが登録モードである場合と同様にして、音
響分析部2で検出された特徴パラメータが、NAT処理
部3の補間点抽出器3b(図2)に供給され、そこで特
徴パラメータP(n)がパラメータ空間内に描く軌跡を
直線近似した軌跡に沿って、図3に○印で示すように、
補間間隔設定器3aに設定されているサンプリング間隔
Tで、特徴パラメータP(n)の軌跡がサンプリングさ
れ、入力パターンとしての新たな特徴パラメータ系列X
(j)が入力パターンメモリ4(図1)に供給され、一
時記憶される。
【0040】そして、入力パターンメモリ4から、入力
パターンが読み出されるとともに、標準パターンメモリ
6から、そこに記憶されているすべての標準パターンが
順次読み出され、DPマッチング部5において、始点フ
リーのDPマッチングが行われる。
【0041】即ち、DPマッチング部5において、前述
した漸化式(1)乃至(5)にしたがって、入力パター
ンメモリ4から読み出された入力パターンと、標準パタ
ーンメモリ6から読み出された標準パターンとの間距離
が算出されるとともに、それが得られたDPパスの始
点、および終点が算出され、ワードスポッティング判定
部7に供給される。
【0042】ワードスポッティング判定部7において、
まず、DPマッチング部5より供給された各DPパスの
始点、および終点から、終点が異なっていても、始点
が、所定の値Cだけ連続して同一となるDPパスが検出
される。そして、同一始点を有するDPパスにしたがっ
て計算された距離のうち、最小のものが入力パターンと
標準パターンとのパターン間距離(スコア)として、内
蔵するメモリに記憶されるとともに、そのパターン間距
離となるDPパスの始点と終点の間が、入力パターン中
における、標準パターンの範囲(入力パターン中におけ
る、標準パターンが発声された区間)の候補として、内
蔵するメモリに記憶される。
【0043】さらに、ワードスポッティング判定部7に
おいて、標準パターンメモリ6に記憶されているすべて
の標準パターンに対するパターン間距離(スコア)およ
びそのパターン間距離となるDPパスの始点と終点の間
が、内蔵するメモリに記憶された後、そのメモリにあら
かじめ登録されている辞書が参照され、音声認識結果と
しての標準パターン(単語)と、それが発声された位置
(範囲)が出力される。
【0044】次に、図8のフローチャートを参照して、
装置の動作モードが認識モードである場合の動作につい
て、さらに説明する。まず最初に、ステップS1におい
て、始点が連続して同一となるDPパスをカウントする
変数COUNTが0にリセットされる。そして、マイク
1に音声が入力されると、その音声に対して、音響分析
部2およびNAT処理部3において、上述した音声処理
が1フレームごとに行われ、フレームごとの入力パター
ン、即ちマイク1に入力された音声に対応する入力パタ
ーンを構成するシンボル(NAT処理部3より出力され
る、各フレームごとの新たな特徴パラメータ)が入力パ
ターンメモリ4に供給される。
【0045】入力パターンメモリ4に入力パターンを構
成するフレームごとのシンボルが供給されると、ステッ
プS2に進み、そのフレームまでのシンボル(入力パタ
ーン)と、標準パターンメモリ6に記憶されている標準
パターンとの距離が、漸化式(1)乃至(5)にしたが
って計算され、ステップS3において、その結果、終点
に達したDPパスがあるか否かが判定される。ステップ
S3において、終点に達したDPパスがないと判定され
た場合、音響分析部2およびNAT処理部3から、次フ
レームのシンボル(入力パターン)が出力されるのを待
って、ステップS2に戻る。
【0046】ステップS3において、終点に達したDP
パスがあると判定された場合、ステップS4に進み、そ
のDPパスの始点が、以前に終点に達したDPパスと同
じ始点であるか否かが判定される。ステップS4におい
て、ステップS3で終点に達したと判定されたDPパス
の始点が、以前に終点に達したDPパスと同じ始点であ
ると判定された場合、ステップS5に進み、始点が連続
して同一となるDPパスをカウントする変数COUNT
が1だけインクリメントされるとともに、ステップS3
で終点に達したと判定されたDPパス、または以前に終
点に達したDPパスにしたがって計算された入力パター
ンと標準パターンとの距離のうち、最小の距離SCMIN
が入力パターンと標準パターンとのパターン間距離とし
て、変数SCにセットされ、ステップS2に戻る。
【0047】一方、ステップS4において、ステップS
3で終点に達したと判定されたDPパスの始点が、以前
に終点に達したDPパスと同じ始点でないと判定された
場合、ステップS6に進み、変数COUNTが所定の値
C以上であるか否かが判定される。ステップS6におい
て、変数COUNTが所定の値C以上でないと判定され
た場合、即ち現時点で、始点が、所定の値Cだけ連続し
て同一となるDPパスがない場合、ステップS7をスキ
ップしてステップS1に戻る。
【0048】ステップS6において、変数COUNTが
所定の値C以上であると判定された場合、即ち現時点
で、始点が、所定の値Cだけ連続して同一となるDPパ
スがある場合、ステップS7に進み、変数SCに記憶さ
れている距離と、その距離となるDPパスの始点と終点
とが、ワードスポッティング判定部7の内蔵するメモリ
に、認識候補として記憶され、ステップS1に戻る。
【0049】即ち、ステップS7において、同一始点を
有するDPパスにしたがって計算された距離のうち、最
小のものが入力パターンと標準パターンとのパターン間
距離(スコア)として、ワードスポッティング判定部7
の内蔵するメモリに記憶されるとともに、そのパターン
間距離となるDPパスの始点と終点の間が、入力パター
ン中における、標準パターンの範囲(入力パターン中に
おける、標準パターンが発声された区間)の候補とし
て、ワードスポッティング判定部7内蔵するメモリに記
憶される。
【0050】以上の処理が、標準パターンメモリ6に記
憶されているすべての標準パターンに対して施された
後、ワードスポッティング判定部7のメモリにあらかじ
め登録されている辞書が参照され、音声認識結果として
の標準パターン(単語)と、それが発声された位置(範
囲)(DPパスの始点と終点)が出力される。
【0051】なお、DPマッチング部5における、DP
パスを算出するときの漸化式、即ち入力パターンと標準
パターンとの距離を算出するときの漸化式は、本実施例
で言及した式(1)乃至(5)に限定されるものではな
い。
【0052】
【発明の効果】請求項1に記載の音声認識装置によれ
ば、音声から入力パターンを作成し、この入力パターン
と、標準パターン記憶手段に記憶されている標準パター
ンとを対応させてDPマッチングする。そして、入力パ
ターンと標準パターンとを対応させたDPパスの始点に
注目して、入力パターン中における標準パターンを絞り
込む。従って、例えば入力パターンと標準パターンとの
距離に注目して標準パターンを絞り込む場合に比べ、音
声認識結果としての標準パターンが時系列上で重複する
位置に存在することがなくなり、音声の認識率を向上さ
せることができる。
【0053】請求項2に記載の音声認識装置によれば、
絞り込み手段に、同一の始点を有するDPパス数に対応
して、入力パターン中における標準パターンを絞り込ま
せる。従って、音声の認識率を向上させることができ
る。
【0054】請求項3に記載の音声認識装置によれば、
音声をフレーム分けして、フレーム内の音声から、入力
パターンとなるシンボルを順次作成し、このシンボルが
出力されるごとに、入力パターンと標準パターンとを対
応させてDPマッチングする。そして、マッチング結果
が出力されたときのDPパスの始点と同一の始点を有す
るDPパスを検出し、同一始点パス数をカウントして、
その同一始点パス数に対応して、入力パターン中におけ
る標準パターンを絞り込む。従って、例えば入力パター
ンと標準パターンとの距離に注目して標準パターンを絞
り込む場合に比べ、音声認識結果としての標準パターン
が時系列上で重複する位置に存在することがなくなり、
音声の認識率を向上させることができる。
【0055】請求項4に記載の音声認識装置によれば、
入力パターン作成手段に、入力パターンとなるシンボル
系列の軌跡をサンプリングさせ、新たなシンボル系列か
らなる入力パターンを作成させる。従って、入力パター
ンの時間軸補正があらかじめ行われるので、音声の認識
率をさらに向上させることができる。
【図面の簡単な説明】
【図1】本発明の音声認識装置の一実施例の構成を示す
ブロック図である。
【図2】図1の実施例のNAT処理部3のより詳細なブ
ロック図である。
【図3】入力パターンとしての音声の特徴パラメータの
軌跡を示す平面図である。
【図4】標準パターンとしての音声の特徴パラメータの
軌跡を示す平面図である。
【図5】DPマッチングを説明するための図である。
【図6】DPマッチングのDPパスの制限(傾斜制限)
を示す図である。
【図7】図1の実施例のワードスポッティング判定部7
で、同一始点のDPパスが検出される様子を示す図であ
る。
【図8】図1の実施例の動作を説明するためのフローチ
ャートである。
【符号の説明】
1 マイク 2 音響分析部 3 NAT処理部 4 入力パターンメモリ 5 DPマッチング部 6 標準パターンメモリ 7 ワードスポッティング判定部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声から入力パターンを作成する入力パ
    ターン作成手段と、 所定の単語の標準パターンをあらかじめ記憶している標
    準パターン記憶手段と、 前記入力パターン作成手段により作成された入力パター
    ンと、前記標準パターン記憶手段に記憶されている標準
    パターンとを対応させてDPマッチングするDPマッチ
    ング手段と、 前記DPマッチング手段により前記入力パターンと前記
    標準パターンとを対応させたDPパスの始点に注目し
    て、前記入力パターン中における前記標準パターンを絞
    り込む絞り込み手段とを備えることを特徴とする音声認
    識装置。
  2. 【請求項2】 前記絞り込み手段は、同一の始点を有す
    る前記DPパス数に対応して、前記入力パターン中にお
    ける前記標準パターンを絞り込むことを特徴とする請求
    項1に記載の音声認識装置。
  3. 【請求項3】 音声をフレーム分けして、前記フレーム
    内の音声から、入力パターンとなるシンボルを順次作成
    する入力パターン作成手段と、 所定の単語の標準パターンをあらかじめ記憶している標
    準パターン記憶手段と、 前記入力パターン作成手段より前記シンボルが出力され
    るごとに、前記入力パターンと前記標準パターンとを対
    応させてDPマッチングするDPマッチング手段と、 前記DPマッチング手段のマッチング結果が出力された
    ときのDPパスの始点と同一の始点を有するDPパスを
    検出し、同一始点パス数をカウントする検出カウント手
    段と、 前記検出カウント手段によりカウントされた前記同一始
    点パス数に対応して、前記入力パターン中における前記
    標準パターンを絞り込む絞り込み手段とを備えることを
    特徴とする音声認識装置。
  4. 【請求項4】 前記入力パターン作成手段は、入力パタ
    ーンとなるシンボル系列の軌跡をサンプリングし、新た
    なシンボル系列からなる入力パターンを作成することを
    特徴とする請求項1乃至3のいずれかに記載の音声認識
    装置。
JP25406292A 1992-08-28 1992-08-28 音声認識装置 Withdrawn JPH0683383A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25406292A JPH0683383A (ja) 1992-08-28 1992-08-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25406292A JPH0683383A (ja) 1992-08-28 1992-08-28 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0683383A true JPH0683383A (ja) 1994-03-25

Family

ID=17259698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25406292A Withdrawn JPH0683383A (ja) 1992-08-28 1992-08-28 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0683383A (ja)

Similar Documents

Publication Publication Date Title
JPH05249990A (ja) パターンマッチング方法およびパターン認識装置
JP2870224B2 (ja) 音声認識方法
JPH0683383A (ja) 音声認識装置
JP2502880B2 (ja) 音声認識方法
JPH06301395A (ja) 音声認識装置
JP2543584B2 (ja) 音声標準パタン登録方式
JPH05224693A (ja) 音声認識装置
JPH05216498A (ja) 音声認識装置
JPH0619491A (ja) 音声認識装置
JPH05313688A (ja) 音声認識装置
JPH0451037B2 (ja)
JPH06102896A (ja) 音声認識装置
JPH05165489A (ja) 音声認識方法
JPH05232988A (ja) 音声認識装置
JP2882088B2 (ja) 音声認識方法
JPH05313695A (ja) 音声分析装置
JPH0228160B2 (ja)
JPS60166993A (ja) 単語音声認識装置
JPH05150796A (ja) 音声認識装置
JPH0651793A (ja) 音声認識装置
JPH1091186A (ja) 音声認識方法
JPH0449719B2 (ja)
JPH01262597A (ja) 音声認識装置
JPS5977500A (ja) 単語音声認識方式
JPH0756593A (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991102