JPH0336436B2 - - Google Patents

Info

Publication number
JPH0336436B2
JPH0336436B2 JP60283044A JP28304485A JPH0336436B2 JP H0336436 B2 JPH0336436 B2 JP H0336436B2 JP 60283044 A JP60283044 A JP 60283044A JP 28304485 A JP28304485 A JP 28304485A JP H0336436 B2 JPH0336436 B2 JP H0336436B2
Authority
JP
Japan
Prior art keywords
matching
continuous
word
pattern
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP60283044A
Other languages
English (en)
Other versions
JPS62144200A (ja
Inventor
Takahiro Sakuraba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60283044A priority Critical patent/JPS62144200A/ja
Publication of JPS62144200A publication Critical patent/JPS62144200A/ja
Publication of JPH0336436B2 publication Critical patent/JPH0336436B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 連続音声認識装置において、複数個の標準パタ
ーンを前半と後半の半単語標準パターンに分け、
音声の入力パターンを前半単語標準パターンにつ
いて連続DP照合を行い、後半単語標準パターン
について逆時間連続DP照合を行い、その結果か
ら入力パターンの各フレーム毎にそのフレームを
前記各半単語標準パターンの境界とする標準パタ
ーンを選択し、それによつて与えられた中心候補
を、その候補が位置するフレームから始端方向に
逆時間DP照合を行い、終端方向にDP照合を行
い、与えられた各候補毎の部分区間照合距離から
その合計が最小となる様にDP処理を行つて認識
結果を求める。
〔産業上の利用分野〕
本発明は、複数の単語を連続的に発声した音声
を認識する連続音声認識装置、特に動的計画法
(Dynamic programming、以下DPという)によ
り行う連続音声の認識を、効率良く且つ高い認識
率をもつて行う様に改良した連続音声認識装置に
関する。
〔従来の技術〕
複数の単語を連続的に発声仕手形成される連続
音声を認識する方式として各種の方式が提案され
ているが、代表的なものとして次の方式がある。
第1の方式は、連続音声を形成する連続単語
を、各単語のの境界での音声パワーの落ち込みな
どの特徴を利用して個々の単語に区分し(この操
作はセグメンテーシヨンと呼ばれる)、その区分
された単語毎に標準パターンと照合して認識する
方式である。
第2の方式は、連続単語の全ての区間の組を取
り出して標準パターンと照合し、その照合結果か
ら最適である区間の組合せを求めて認識する方式
である。
〔発明が解決しようとする問題点〕
連続音声を認識する方式のうち、前述の第1の
方式は、連続単語のセグメンテーシヨンを行うこ
とが非常に難しく、且つ高い認識率が確保しにく
いという問題があつた。
一方、第2の方式は、高い認識率が得られる
が、演算量が第1の方式に比べて格段に大きく、
早いレスポンスタイムをもつた連続音声認識が出
来ないという問題があつた。
又、連続音声中の各単語の結合部分は前後の単
語の影響を受けて変形しやすいので、その位置を
正確に特定することは困難である。この為、DP
照合により求められた音声の入力パターンの各フ
レーム毎の終端候補又は始端候補に誤りが生じ、
認識率を低下させるという問題があつた。
本発明は、連続音声認識処理時の演算量を低下
させて処理効率を大幅に向上させると共に、音声
入力パターンの各フレーム毎の候補を正しく求め
ることにより高認識率を確保出来る様にした連続
音声認識装置を提供することを目的とする。
〔問題点を解決するための手段〕
従来の連続音声認識装置における前述の各問題
点を解決する為に本発明が講じた手段を、第1図
を参照して説明する。
第1図は、本発明の構成のブロツク説明図であ
る。
第1図において、110は標準パターン辞書部
で、複数の音声単語の標準パターンが格納されい
る。読み出すときは、各標準パターンは前半の半
単語に対する前半単語標準パターンと後半の半単
語に対する後半単語標準パターンに区分されて読
み出される。
120は半単語連続DP照合部で、入力パター
ン複数個の標準パターン中の各前半単語標準パタ
ーンについて連続的計画法による照合(連続DP
照合)を行うと共に、入力パターンを複数個の標
準パターン中の各後半単語標準パターンについて
逆時間連続動的計画法による照合(逆時間連続
DP照合)を行う。
130は中心候補選択部で、半単語連続DP照
合部120の結果から入力パターンの各フレーム
毎にそのフレームを前半単語及び後半単語の各標
準パターンの境界とする標準パターンを求め、そ
の標準パターンより中心候補を選択する。
140は単語始終端レベルDP処理部で、前記
中心候補が位置するフレームから始端方向に逆時
間動的計画法による照合(逆時間DP照合)を行
うと共に、終端方向に動的計画法による照合
(DP照合)を行つて部分区間照合距離を求める。
150は文レベルDP処理部で、単語始終端レ
ベルDP照合部140より入力された部分区間照
合距離に基づいて入力パターンの各桁毎に部分区
間照合距離の合計が最小となる組合せを求め、そ
の結果から入力パターンが何桁入力であるかを判
定して認識結果を求める。
なお、“桁”は各単語の位置関係を表現するも
ので、連続単語の各単語を先頭から1桁目、2桁
目……x桁目で表現する。
〔作 用〕 第1図の作用を、第2図及び第3図を参照して
説明する。
第2図は入力パターンと前後各半単語標準パタ
ーンの連続DP照合及び逆時間連続DP照合及びそ
れらの照合ルート例の説明図、第3図は単語中心
候補の終端及び始端方向のDP照合及び逆時間DP
照合の説明図である。
連続単語音声の場合には、前述の様に各単語の
結合部分がそれに隣接する前後の単語の影響を受
けて変形しやすいので、その位置を正確に特定す
ることは困難であり、その為DP照合により求め
られた入力パターンの各フレーム毎の終端又は始
端候補に誤りが生じ、認識率を低下させていた。
そこで、本発明は、連続単語音声の場合は、各
単語の始終端部はそれに隣接する前後の単語の影
響を受けて変形しやすいが、その中央部分は隣接
する前後の影響を受けることが少く安定している
ことに着目し、連続音声の各単語の標準パターン
の候補をその単語の安定部分において抽出する様
にしたものである。
標準パターン辞書部110には複数の標準パタ
ーンが格納されているが、読み出されるときは、
各標準パターンを前半と後半の半単語に2分し、
前半の半単語に対する前半単語標準パターンと後
半の半単語に対する後半単語標準パターンに区分
されて読み出される。
各標準パターンと前半と後半の半単語に分ける
方法は、一般に中心部分が安定しているので中心
部分で2分されるが、中心部分以外の安定してい
る部分において2分することも出来る。
半単語連続DP照合部120は、第2図に示す
様に、入力パターンを複数個の標準パターンの各
前半単語標準パターンについて連続DP照合を行
うと共に、各後半単語標準パターンについて逆時
間連続DP照合を行う。そして、各照合結果であ
る連続DP照合距離と逆時間連続DP照合距離を出
力する。
中心候補選択部130は、半単語連続DP照合
部120より入力された連続DP照合距離及び逆
時間連続DP照合距離に基づいて、入力パターン
の各フレーム毎にそのフレームを前半及び後半の
半単語標準パターンの境界とする標準パターンを
求め、その標準パターンより中心候補を選択す
る。
単語始終端レベルDP処理部140は、中心候
補選択部130で選択された各中心候補につき、
第3図に示す様に、その中心候補が位置するフレ
ーム(kで図示されている)から始端方向に逆時
間DP照合を行うと共に、終端方向にDP照合を行
つて、それぞれ始端中心照合距離及び中心終端照
合距離を求める。次いでこの両照合距離に基づい
て部分区間照合距離を求める。
文レベルDP照合部150は、単語始終端レベ
ルDP照合部140より入力された部分区間照合
距離に基づいて入力パターンの各桁毎に部分区間
照合距離の合計が最小となる組合せを求め、その
結果から入力パターンが何桁入力であるかを判定
して認識結課を求める。
以上の様に、連続DP照合により中心候補を求
めて部分区間候補を選択する様にしたので、入力
パターンから全ての部分区間の組合せを取り出し
て複数の標準パターンと照合することにより部分
区間候補を求める従来方式(前述の第2の方式)
に比べて大幅に演算量を低減させることが出来
る。又、連続音声の各単語の標準パターンの候補
をその単語の安定部分において抽出する様にした
ので、候補が正しく求められて高認識率を確保す
ることが出来る。
〔実施例〕
本発明の一実施例を、第2図〜第9図を参図し
て説明する。
第4図は本発明の一実施例の構成の説明図、第
5図は始終端固定のDP照合の説明図、第6図は
連続DP照合の説明図、第7図は逆時間連続DP照
合の説明図、第8図は連続DPの演算手法の説明
図、第9図は中心候補選択動作の説明図である。
第2図及び第3図については、既に説明した通り
である。
(A) 実施例の構成 第4図において、標準パターン辞書部11
0、半単語連続DP照合部120、中心候補選
択部130、単語始終端レベルDP処理部14
0及び文レベルDP処理部150については、
第1図で説明した通りである。
半単語連続DP照合部120において、12
1は連続DP照合部で、入力パターンを複数個
の標準パターンの各前半単語標準パターンにつ
いて連続DP照合を行つて、連続DP照合距離
(Gf(k,n))を求める。122は逆時間連続
DP照合部で、入力パターンを複数個の標準パ
ターンの各後半単語標準パターンについて逆時
間連続DP照合を行つて、逆時間連続DP照合距
離(Gb(k,n))を求める。
単語始終端レベルDP処理部140において、
141は逆時間DP照合部で、中心候補選択部
130より入力された各中心候補につき、その
中心候補が位置するフレームから始端方向に逆
時間DP照合を行つて始端中心照合距離(Gs
(k,l))を求める。142はDP照合部で、
前記各中心候補につき、その中心候補が位置す
るフレームから終端方向にDP照合を行つて中
心終端照合距離(Ge(k,m))を求める。1
43は部分区間候補選択部で、前記始終端中心
照合距離Gs(k,l)及び中心終端照合距離Ge
(k,m)に基づいて部分区間照合距離(D
(l,m)と対応する標準パターン(Ns(l,
m))を求める。
文レベルDP処理部150において、151
は文レベルDP照合部で、単語終端レベルDP処
理部140より入力された部分区間照合距離D
(l,m)と対応する標準パターンNs(l,m)
を用いて、最適な単語の結合をDP照合により
求める。152は認識結果処理部で、文レベル
DP照合部151の結果に基づいて入力パター
ンが何桁入力であるかを判定して認識結果を求
める。
160はマイクロホン、170は入力された
連続音声の特徴を抽出して照合用の入力パター
ンに変換する音声特徴抽出部、180はこの入
力パターンが格納される入力パターンバツフア
である。
(B) 実施例の動作 マイクロホン160は、使用者の発声した連
続単語からなる連続音声を音声特徴抽出部17
0に入力する。音声特徴抽出部170は、入力
された連続音声の特徴を抽出して照合用の入力
パターンに変換し、入力パターンバツフア18
0に格納する。
このときの音声の入力パターンAを次の様に
表わす。
A=a(1),a(2),a(3)……a(m)……a
() ここで、a(m)はフレームmにおけるパラ
メータで、例えば周波数方向を16チヤネルに区
分した場合、各区分におけるパワースペクトル
値で表わされるベクトル量である。最後のは
入力パターンAの終端フレームで、且つ入力パ
ターンAの語長を意味する。なお、フレームは
音声区間(正しくは窓関数によつて切り出した
音声区間)である。
同様に、標準パターン辞書部110の標準パ
ターンは、単語nの標準パターンをB(n)と
して、次の様に表わす。
B(n)=b(1,n),b(2,n)…b(j,
n)…b(J(n),n) ここで、b(j,n)は、単語nのフレーム
jにおけるパラメータで、入力パターンAと同
様に、例えば16チヤネルのパワースペクトル値
などで表わされるベクトル量である。J(n)
は単語nの終端フレームで、且つ標準パターン
B(n)の語長を表わす。
本発明では、入力パターンを標準パターンの
前半単語標準パターンと後半単語標準パターン
について、連続DP照合と逆時間連続DP照合に
より半単語の照合を行う。この処理は、単語中
心レベルDPと呼ばれる。
(B‐1) 連続DP照合部121の動作 通常のDP照合は入力パターンの始終端を
固定したもので、第5図に示す様に、始端と
終端を通る一本の最適な照合経路が与えら
れ、その経路の照合距離が求められる。
これに対し、連続DP照合は、第6図に示
す様に、入力パターンの任意のフレームを終
端とする始端フリーなDP照合をいう。これ
により入力パターンAの中に存在する最適な
対応区間が自動的に抽出されて連続DP照合
距離が求まる。この結果に基づいて、入力パ
ターンA中に標準パターンB(n)が存在し
そうか、又、存在しそうな場合に、入力パタ
ーンAのどのフレームを終端とするかが容易
に求められる。
(B‐2) 逆時間連続DP照合部122の動作 逆時間連続DP照合部122の行う逆時間
連続DP照合は、第7図に示す様に、入力パ
ターンAを逆時間方向に連続DP照合を行う
ものである。これにより、入力パターンA中
に標準パターンB(n)が存在しそうか、又、
存在しそうな場合に、入力パターンAのどの
フレームを始端とするかが容易に求められ
る。
前述の連続DP照合及び逆時間連続DP照合
において行われる連続DPの演算手法はマツ
チングパスの取り方等によつて種々の方法が
有るが、ここでは第8図に示す様な対称型を
用いるものとする。
第8図において、格子点(i,j)上の標
準パターンBと入力パターンAのベクトル間
距離をd(i,j)とすると、次の漸化式に
よつて照合距離gf(i,j)が求められる。
j=1のとき、 gf(i,j)=gf(i,1)=d(i・1) i=1,j>1のとき、 gf(1,j)=d(1,j)+gf(1,j−
1) j>1のとき、 gf(i,j) =mind(i,j)+gf(i−1,j) 2d(i,j)+gf(i−1,j−1) d(i,j)+gf(i,j−1) このgf(i,j)は、(1,1)点から
(i,j)点に至るまでの距離和を最小とし
たものである。
逆時間連続DP照合は入力パターンを反転
させて逆時間方向に連続DP照合を行うもの
で、その演算手法は前述の連続DP照合時の
演算手法と同様であるので、説明は省略す
る。
この連続DP照合及び逆時間連続DP照合に
より、標準パターンBの前半区間と後半区間
とを、第2図に示す様にそれぞれ照合する。
入力パターンのkフレーム上の連続DP照
合距離をGf(k)とし、逆時間連続DP照合距離
をGb(k)とする。更に、このGf(k)及びGb(k)
は、N個の標準パターンに対してはGf(k,
n)及びGb(k,n)の形で表現されて、連
続DP照合部121及び逆時間連続DP照合部
122よりそれぞれ出力される。
(B‐3) 中心候補選択部130の動作 中心候補選択部130における中心候補選
択処理は、次の様にして行われる。
半単語連続DP照合部140より入力され
たGf(k,n)及びGb(k,n)は、中心候
補選択部130において次式で示す様に累積
されて、累積半単語連続DP照合距離DC(k,
n)を生成する。
DC(k,n)=Gf(k,n)+Gb(k,n) DC(k,n)は、このままでは標準パター
ンB(n)の個々の語長J(n)によつて、短
いもの程値が小さくなる傾向が出る為、入力
パターンA及び標準パターンB(n)の各パ
ターン長の和でDC(k,n)の値を割算して
時間正規化を行う。この時間正規化された
DC(k,n)をDR(k,n)で表現すると、
DR(k,n)は下式で表わされる。
DR(k,n)=DC(k,n)/2J(n) ここで2J(n)を用いる理由は、入力パタ
ーンAが標準パターンB(n)と正しくマツ
チングした場合には、対応する入力パターン
長はJ(n)に近い値をとるものと考えられ
るからである。もし、何らかの手法でDC
(k,n)のl,mに対する始端L(k,n)
及び終端M(k,n)が判明している場合に
は、DR(k,n)は次式で求められる。
DR(k,n)=DC(k,n) /{J(n)+M(k,n)−L(k,n)+
1} このDR(k,n)は、第9図に示す様に、
n毎に異つた距離パターンを示す。
このN個の距離パターンをk毎に値の最小
のものを選択して、第9図の下段に示す様に
そのnをkフレームを中心とする候補(中心
候補)としてNC(k)に設定する。即ち、 NC(k)= argmin i {DR(k,n)} 例えば、第9図において、kiフレームで
は、n=2のDR(k,2)が最小となるの
で、n=2の標準パターンをkiフレームを中
心とする候補(中心候補)としてNC(2)に設
定する。
以上の処理によつて、入力パターンAの各
kフレームが中心になるB(n)が一個に限
定される。DR値の最小のものが最も候補に
適すると考えられるので、各kフレーム毎の
中心候補をNC(k)の1個に限定することによ
り、各kフレーム毎の中心候補を正しく選択
することが出来ると共に、演算量を更に減少
させることが出来る。
(B‐4) DP照合部142及び逆時間DP照合部1
41の動作(単語始終端レベルDP) NC(k)で示される中心候補を、DP照合部1
42によるDP照合及び逆時間DP照合部14
1による逆時間DP照合により、始終端のDP
照合距離を求める。
ここで用いるDPの演算手法もマツチング
パスの取り方等によつて種々の方法がある
が、ここでは、前述の連続DPと同様に対称
型を用いるものとする。即ち、 i=1,j=1のとき: ge(1,1)=d(1,1) i=1,h>1のとき: ge(1,j)d(1,j)+ge(1,j−
1) i>1,j=1のとき: g(i,1)=d(i,1)+ge(i−1,1) i>1,j>1のとき: ge(i,j) =mind(i,j)+ge(i−1,j) 2d(i,j)+ge(i−1,j−1) d(i,j)+ge(i,j−1) このge(i,j)は、格子点(1,1)か
ら(i,j)点に至るまでの距離和を最小と
したものである。
前記の各式によつてDP照合距離ge(i,
j)が求まるが、標準パターン終端のものを
Ge(i)とする。
又、逆時間DP照合距離gs(i,j)は、単
にパターンを反転して照合するものであり、
その演算手法はDP照合距離ge(i,j)と同
様であるので、その説明は省略する。標情パ
ターン始端のものをGs(i)とする。
これらDP照合及び逆時間DP照合により、
単語中心候補NC(k)の終端及び始端方向の照
合距離を求める。
第3図は、中心候補が位置するフレーム
(kで示されている)から始端方向に逆時間
DP照合を行い、終端方向にDP照合を行つ
て、そのフレームに対する始端フレームl及
び終飾端フレームを求める例を示たものであ
る。なお、H(NC(k)は、中心候補の標準パ
ターンの語長である。
DP照合部142がDP照合により求めた中
心終端照合距離を、Ge(k,m)とし、又、
逆時間DP照合部141が逆時間DP照合によ
り求めた始端中心照合距離を、Gs(k,l)
とする。
(B‐5) 部分区間候補選択部143の動作 部分区間候補選択部143は、入力された
Ge(k,m)及びGs(k,l)を累積したも
のを、部分パターン長(m−l+1)と標準
パターン長J(NC(k)の和で割算して時間正
規化する。この時間正規化された部分区間の
DP照合距離をDI(k,l,m)とすると、
次式で求められる。即ち、 DI(k,l,m)=Ge(k,m)+Gs(k,l)/J
(NC(K)+m−l+1) 次に部分区間候補選択部143は、この
DI(k,l,m)をkについて最小のものを
選択してD(l,m)とし、対応する標準パ
ターンをNS(l,m)に設定する。
D(l,m)= min k {DI(k,l,m)} NS(l,m)=NC〔 argmin k {DI(k,l,m)} ここで、“ argmin k ”は、〔 〕内の最小化 条件を満足するkを選定する機能をもつたオ
ペレータである。
もし、終端候補が無いmの場合は、NS
(l,m)に“0”を設定し、D(l,m)に
最大値を設定しておく。
このD(l,m)及びNS(l,m)によつ
て、入力パターンの部分パターン(l−m)
の最適な照合距離(D(l,m)及び照合相
手(NS(l,m)が決定されて、部分区間候
補選択部143より出力される。
(B‐6) 文レベルDP照合部151の動作 文レベルDP照合部151は、単語始終端
レベルDP処理部140より入力されたD
(l,m)及びNS(l,m)を用いて、最適
な単語の結合をDP照合により求める。
ここで、連続単語中の各単語を先頭から1
桁目、2桁目……x桁目という表現で位置関
係を表現することにすする。
(イ) 1桁目の設定 1桁目は、入力パターンの始端フレーム
からmフレームの部分区間の距離をT(m,
1)に設定する。即ち、 T(m,l)=D(l,m) 又、その標準語の始端がどこにあるか
を、LT(m,l)に設定する。即ち、 LT(m,l)=1 ここで、部分区間候補が存在しないD
(l,m)については処理は行わず、NT(m,l)
に“0”を、T(m,l)に最大値を設定して
おく。
(ロ) x桁目の設定 x桁目では、lの位置が未定の為、次の
DP漸化式で決定する。即ち、 T(m,x) l<m= min l 〔D(l,m)+T(l,x-1)〕 NT(m,x) l<m=NS〔 arsmin l {D(l,m) +T(l,x-1)},m〕 LT(m,x) l<m= argmin l 〔D(l,m) +T(l,x-1)〕 この場合もD(l,m)とmについて部分
区間候補が存在しない場合は処理しないで、
NT(m,x)に“0”を、T(m,x)に最
大値を、またLT(m,x)には(不定値で良
いが)“1”を設定しておく。
(B‐7) 認識結果処理部152の動作 認識結果処理部152は、文レベルDP照
合部151により送られたT(m,x)、NT
(m,x)及びLT(m,x)中のT(m,x)
から、先ず入力単語の桁数Xを、次式から求
める。
X= argmin x 〔T(I,x)/x〕 ここで、Iは入力パターンの終端フレーム
である。
次に、認識結果処理部152は、X桁の認
識結果をLT(m,x)とNT(m,x)から
次の(イ)及び(ロ)によつて求める。ここで、x桁
の認識結果をNR(x)とし、又NR(x)の
始端フレームをL(x)とする。
(イ) X桁目の認識結果 NR(x)=NT(I,X) L(x)=LT(I,X) (ロ) X−y桁目の認識結果 NR(X−y)=NT〔L(X−y+1),X−
y〕 L(X−1)=LT〔L(X−y+1),X−y〕 以上の様にして、認識結果NR(x)が、従来
よりも太幅に少い演算量で、且つ高い認識率をも
つて求められる。
例えば演算量の場合、従来の方式では入力パタ
ーンから全ての部分区間の組合せを取り出して複
数の標準パターンと照合して部分区間候補を求め
ていたが、その部分区間候補を求めるまでの演算
量は、次の様になる。いま、入力パターン長を
200フレーム、標準パターン長を50フレーム、部
分区間のDP照合の窓幅を20フレーム、標準パタ
ーン数を100個とすると、DP漸化式の演算回数
は、 200×100×50×20=200000000回 である。
これに対して、本発明による中心候補選択を行
う方法では、同じ条件で 200×50×100+200×50×20 となる。従つて、約1/17の演算量で済むことにな
り、大幅な演算量の減少が実現できる。
〔発明の効果〕
以上説明した様に、本発明によれば次の諸効果
が得られる。
(イ) 連続DP照合により中心候補を求めて部分区
間候補を選択する様にしたので、従来法式より
も大幅に演算量を低減させることが出来る。
(ロ) 各単語の安定部分においてその単語の標準パ
ターンの候補を抽出する様にしたので、候補が
正しく求められ高認識率を確保することが出来
る。
【図面の簡単な説明】
第1図…本発明の構成の説明図、第2図…前半
単語標準パターンの連続DP照合及び後半単語の
逆時間連続DP照合並びにそれらの照合ルート例
の説明図、第3図…単語中心候補の終端及び始端
方向のDP照合及び逆時間照合の説明図、第4図
…本発明の一実施例の構成の説明図、第5図…始
終端固定のDP照合の説明図、第6図…連続DP照
合の説明図、第7図…逆時間連続DP照合の説明
図、第8図…連続DPの演算手法の説明図、第9
図…中心候補選択動作の説明図。 第1図及び第4図において、110…標準パタ
ーン辞書部、120…半単語連続DP照合部、1
30…中心候補選択部、140…単語始終端レベ
ルDP処理部、150…文レベルDP処理部。

Claims (1)

  1. 【特許請求の範囲】 1 複数の単語が連続的に発声された音声を音声
    特徴抽出部において入力パターンに変換し、該入
    力パターンを複数の標準パターンと照合して区間
    別候補を選択し、各区間の照合距離が最小となる
    ものを求めて認識を得る連続音声認識装置におい
    て、 (a) 入力パターンを複数個の標準パターン中の各
    前半単語標準パターンについて連続動的計画法
    による照合を行うと共に、入力パターンを複数
    個の標準パターン中の各後半単語標準パターン
    について逆時間連続動的計画法による照合を行
    う半単語連続DP照合部120と、 (b) 半単語連続DP照合部120の結果から入力
    パターンの各フレーム毎にそのフレームを前半
    単語及び後半単語の各標準パターンの境界とす
    る標準パターンを求め、その標準パターンより
    中心候補を選択する中心候補選択部130と、 (c) 前記中心候補が位置するフレームから始端方
    向に逆時間動的計画法による照合を行うと共
    に、終端方向に動的計画法による照合を行つて
    部分区間照合距離を求める単語始終端レベル
    DP処理部140と (d) 前記部分区間照合距離に基づいて入力パター
    ンの各桁毎に部分区間照合距離の合計が最小と
    なる組合せを求め、その結果から入力パターン
    が何桁入力であるかを判定して認識結果を求め
    る文レベルDP処理部150、 を備えたことを特徴とする連続音声認識装置。
JP60283044A 1985-12-18 1985-12-18 連続音声認識装置 Granted JPS62144200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60283044A JPS62144200A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60283044A JPS62144200A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS62144200A JPS62144200A (ja) 1987-06-27
JPH0336436B2 true JPH0336436B2 (ja) 1991-05-31

Family

ID=17660484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60283044A Granted JPS62144200A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Country Status (1)

Country Link
JP (1) JPS62144200A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02239291A (ja) * 1989-03-13 1990-09-21 Nippon Telegr & Teleph Corp <Ntt> 文節音声認識装置
JP4855023B2 (ja) * 2005-09-08 2012-01-18 株式会社日立プラントテクノロジー ジェットノズル
CN111986698B (zh) * 2019-05-24 2023-06-30 腾讯科技(深圳)有限公司 音频片段的匹配方法、装置、计算机可读介质及电子设备

Also Published As

Publication number Publication date
JPS62144200A (ja) 1987-06-27

Similar Documents

Publication Publication Date Title
JPS61219099A (ja) 音声認識装置
JPH0336436B2 (ja)
JPH0336439B2 (ja)
JPH0336438B2 (ja)
JPH0336437B2 (ja)
JPH0469959B2 (ja)
JPH0343639B2 (ja)
JPH01185599A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPH0464077B2 (ja)
JPS61105600A (ja) 連続音声認識装置
JPS58159598A (ja) 単音節音声認識方式
JPS5977500A (ja) 単語音声認識方式
JPH0449719B2 (ja)
JPS59173884A (ja) パタ−ン比較装置
JPS62144199A (ja) 連続音声認識装置
JPS62111295A (ja) 音声認識装置
JPS61275799A (ja) 音声認識装置
JPS60182494A (ja) 音声認識装置
JPS61200596A (ja) 連続音声認識装置
JPH0449954B2 (ja)
JPS63236095A (ja) 音声認識方法
JPS61105598A (ja) 連続音声認識装置
JPS62278597A (ja) 音素標準パタ−ンの切り出し方法
JPS62249198A (ja) 単語音声認識装置