JPS6344240B2

JPS6344240B2 -

Info

Publication number: JPS6344240B2
Application number: JP56023975A
Authority: JP
Inventors: Hiroaki Sekoe
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1981-02-20
Filing date: 1981-02-20
Publication date: 1988-09-02
Also published as: JPS57138698A

Description

【発明の詳細な説明】本発明は連続音声認識装置に関し、特に文法に
従がつて入力される入力される文や句を矛循なく
効率良く認識する装置の改良に関する。

連続的に発声入力される文章や句（以下連続音
声と総称する。）を認識する連続音声認識装置は
計算機に対する演算命令や、ロボツトに対する行
動指令に有用であると考えられる。一般に、この
ような演算命令や行動指令は人工的な文法に基づ
いて発せられる。新美康永著、昭和54年10月共立
出版社発行の「音声認識」（以下文献(1)と称す
る。）の第164ページに記載される如く、多くの人
工的文法は正規文法で記述することができる。こ
こに正規文法とは、有限状態オートマトンの制御
によつて生成あるいは受理されるような言語の規
則である。したがつて、正規文法に基づく連続音
声を矛循なく認識できる音声認識装置は、極めて
実用性が高いと考えられる。

特願昭54−104669号明細書（以下文献(2)と称す
る。）には、正に、正規文法に基づく連続音声を
矛循なく認識処理する連続音声認識装置が記述さ
れている。その記載の要旨を本明細書の第１図に
基づいて説明する。第１図ａは算盤読み式（例え
ば3095円をサンゼンキユウジユウエンと読む。）
の数字音声の発生規則を正規文法に対応するオー
トマトンで示したものである。状態０〜５の間の
遷移図であつて遷移線に付した文字は、次のよう
な意味を持つ。

“４”＝｛1000、2000、……9000｝ “３”＝｛100、200、……900｝ “２”＝｛10、20、……90｝ “１”＝｛１、２……９｝ “５”＝｛円｝ (1) すなわち、例えば２の所には10、20、…、90な
る単語群が対応する。第１図ａのオートマトンに
数字“2053円”が入力された場合には状態を０→
３→４→５の如く遷移して受理される。

音声パタンは特徴ペクトル〓_iの時系列としてＡ＝〓₁〓₂…〓_i…a_l (2) なる如く表現される。また、認識対象となる単語
をｎ＝１、２…Ｎなる番号で示す時、単語ｎの標
準パタンは、 Bⁿ＝〓ⁿ ₁〓ⁿ ₂…〓ⁿ _j…ⁿ _Jｎ (3) なる如く示される。第２図に示すように、入力パ
タンＡの部分パタンが、Ａ（ｌ、ｍ）＝〓_l+1〓_l+2…〓_n (4) と定義される。標準パタンＢと入力パタンＡ（ｌ、
ｍ）との間の個別距離がＤ（ｌ、ｍ、ｎ）と定義
される。

単語ｎの機能を示すコードをFⁿで示す。

いま、前に述べた算盤読み数字の場合を例にと
ると、このFⁿは第３図に示すようなテーブルと
して表現される。また、第１図のオートマトンは
第４図に示すような状態遷移テーブルとして表現
される。この状態遷移テーブルは、機能コード
Fⁿを持つ単語ｎが入力された時に、状態ｐから
状態ｑへの遷移が許される事を意味する。例え
ば、Fⁿ＝２によつて０→３、１→３、２−３な
る状態遷移が生起し得る。

前記文献(2)によると、第１図ｂに示すように状
態ｐ（あるいはｑ）と時刻ｍとによつて番地指定
されるメモリーを用意する。そして、このメモリ
ー上で次のような動的計画法の漸化式が計算され
る。

Tq（ｍ）＝min〔Tp（ｌ）＋Ｄ（ｌ、ｍ、ｎ）〕 (6) ここにＤ（ｌ、ｍ、ｎ）は、前に述べたように
部分パタンＡ（ｌ、ｍ）と標準パタンBⁿとの個別
距離である。また、minで示される最小値検出は
状態ｐ、時刻ｌ、単語ｎに関して｛｝内の値を
最小化することを意味する。特にｑ、ｐ、ｎの間
には、機能コードFⁿによつて状態ｐから状態ｑ
への遷移が状態遷移テーブルに存在するという関
係が要請される。

(6)式の計算は第１図ｂに示した漸化式値テーブ
ルのｐ（＝１、２、…５）、ｍ（１、２、…Ｉ）の
組み合せを総べて埋めるように計算される。

なお、初期条件として To（ｏ）＝０ To（ｍ）＝∞ ｍ＞０ Tp（ｏ）＝∞ ｐ≠０ (7) が与えられる。これらは第１図ａに示すオートマ
トンの状態遷移が、必らず初期状態０より発する
ことを保証するためである。

上記文献(2)に記載された方法によつて前記の漸
化式(6)を計算するためには、各時刻ｍにおいて個
別距離Ｄ（ｌ、ｍ、ｎ）のすべて（すなわち、ｎ
＝１、２、…、Ｎ）を計算する必要があつた。こ
れは各時刻ｍにおけるオートマトンの状態遷移に
総ての可能性を許していたためである。その結果
として常にＮ個の単語の総てが入力される可能性
があるものと見なして、Ｎ個の標準パタンとの間
で個別距離を計算する必要があつた。一般に時刻
ｉ（すなわち、ｌ、ｍも同じ）の標本化周期は
10ms前後に選定されるのが普通である。また、
音声パタンの間の距離の計算には特開昭52−
55413号公報に記述されるが如き、動的計画法に
基づく手法が多用されているが、現在の回路技術
では一回の個別距離の計算に400μs程度を必要と
する。このため第３図に示すようにＮ＝37個の標
準パタンが有る時には、37×400μs＞10ｍｓとな
つてしまい、前記文献(2)の方法を実時間で実行す
るのは不可能になる。すなわち、従来技術によつ
て多数語彙の連続音声を実時間認識する事は困難
であり、しいて実時間処理を行なうためには並列
処理方式等を採用する必要があり、高価かつ大型
の装置構成が必要とされた。

上記特願昭54−104669号明細書記載の装置の有
する欠点を改良した装置構成が特願昭55−83199
号（以下文献(3)と呼ぶ）明細書に記載されてい
る。この文献(3)記載の連続音声認識装置は、単語
ｎ＝１、２、…Ｎのそれぞれに対して標準パタン
Bⁿ＝〓ⁿ ₁〓ⁿ ₂、…〓ⁿ _Jｎを記憶するための標準パタ
ン記憶部と、単語ｎに付随する機能コードFⁿと
状態ｐ及びｑの組を配列して構成される状態遷移
テーブルを記憶してなるオートマトン制御部と、
入力パタンＡ＝〓₁〓₂…〓_i…〓_lの各時刻ｌを始
端とし、時刻ｉ＝ｍを始端とする部分パタンＡ
（lm）＝〓_l+1〓_l+2…〓_nと前記標準パタンBⁿとの間
の個別距離Ｄ（ｌ、ｍ、ｎ）を算出するための手
段である第１マツチング部と時刻ｌ（あるいはｍ）
と、状態ｐ（あるいはｑ）とに対応して番地指定
される漸化式値テーブルT_p（ｌ）、ＬテーブルL_p
（ｌ）、ＰテーブルP_p（ｌ）およびＮテーブルN_p
（ｌ）と、順次進行される各時刻ｌにおいて漸化
式値テーブルに記憶される値T_p（ｌ）の小となる
ｐの部分組を決定する手段である状態選択部と、
これにより選択される状態ｐの各々に対して、そ
の状態で受理し得る単語の組の和集合として時刻
ｌにおいて受理し得る単語組を決定してこの単語
組みに含まれるすべての単語ｎに対して個別距離
Ｄ（ｌ、ｍ、ｎ）を計算すべく前記第１マツチン
グ部に指令する手段たる単語指定部と、該単語ｎ
に対して状態遷移が前記オートマトン制御部に定
義される状態対（ｐ、ｑ）のすべてに対してｌ＜
ｍなる時刻ｍの漸化式値T_q（ｍ）と、現時刻ｌに
おける漸化式値T_p（ｌ）と前記個別距離Ｄ（ｌ、
ｍ、ｎ）との和を比較して後者が小なる時にかぎ
り、この後者の値をT_q（ｍ）として記憶し状態ｐ
をＰテーブルPq（ｍ）に、現時刻ｌをＬテーブル
L_q（ｍ）に単語名ｎをＮテーブルN_q（ｍ）にそれ
ぞれ記入するという漸化式計算を所要の時刻ｍに
対して実行する手段である第２マツチング部と、
上記のＰテーブル、Ｌテーブル、およびＮテーブ
ルを最終状態ｐ＝ｆ、最終時刻ｌ＝Ｉよりさかの
ぼつて参照し、認識結果を定める判定部とから構
成される。

文献(2)の方法に比較して、各時刻においてオー
トマトンが受理し得る単語群を予測する機能が付
加されている。これによつて個別距離の計算は予
測された単語群の標準パタンに対してだけ行なえ
ば良いので、所要計算量が大幅に低減できるとさ
れている。

すなわち、結果として低価格な連続音声認識装
置が実現できるという効果が得られたとされてい
る。

この文献(3)の原理による単語予測を第５図を用
いて説明する。3095円という入力音声に対する処
理の例であつて、時刻ｌにおいて漸化式値テーブ
ルの値T_p（ｌ）が、それぞれT₁（ｌ）＝6030、T₂
（ｌ）＝5020、T₃（ｌ）＝2821、T₄（ｌ）＝3529、T₅
（ｌ）＝4592であつたとする。(6)式の意味する所に
より、これらの値は、この時刻ｌまでの個別距離
の積分値となつている。したがつて、この値が小
さい状態ｐはオートマトンの現在状態としての可
能性が強く、逆にこの値が大きい状態ｐは、この
時刻ｌでの現在状態である可能性は低い。故に、
漸化式値の小さい数個の状態、例えば第５図の例
ではｐ＝３とｐ＝４を選択して残し、他は無視し
ても良い。

第４図の状態遷移テーブルによるとｐ＝３の続
きには一の位の数１〜９（Fⁿ＝２）および“円”
（Fⁿ＝５）が許され、ｐ＝４の続きには、“円”
（Fⁿ＝５）だけが許される。結局第５図の時刻ｌ
の続きとしてこれらの和集合である。一の位の数
字及び“円”の合計10語だけが許容されるとして
個別距離の計算を行なえば良い事になる。

上記のような単語予測を行なわない文献(2)の従
来技術では、どの時刻ｌにおいても常に総ての標
準パタン、すなわち37語の標準パタンに対して個
別距離を計算する必要があつた。したがつて、こ
の時刻ｌにおいては、上記の単語予測によつて
10／37の計算量圧縮が実現された事になる。

この単語予測を効率良く実行するため、文献(3)
においては(6)式の漸化式を次のように分解して前
向きに実行する。

Tq（ｍ）＝minTq（ｍ） Tp（ｌ）＋Ｄ（ｌ、ｍ、ｎ） (8) ただし、初期条件 Tq（ｍ）＝∞ (9) (8)式と前記(6)式との関係は第６図によつて説明
される。図には簡単のため状態ｐからｑへの状態
遷移だけが存在する場合を示している。図中ａに
示す文献(2)の場合には参照数字１で示す過去の時
刻帯におけるTp（ｌ）が、すでに算出されてお
り、これを基にして(6)式の漸化式を計算し、現在
の時刻ｍ（参照数字２）におけるTq（ｍ）を算出
する。

これに対して文献(3)においてはｂの如く、現在
の時刻ｌにおいて確定している漸化式値Tp（ｌ）
をもとにして(8)式を計算し、未来の時刻ｍ（参照
数字４）における漸化式値テーブルに記入する。
したがつて、時刻ｌにおいて(8)式を計算しただけ
では(6)式を計算した事にはならないが、時刻ｌが
進行し参照数字３で示す部分を通過した時点では
(6)式を計算したのと等価になる事は、明らかであ
る。

このように文献(3)において(8)式を採用したの
は、次の理由による。図中ａの従来技術では、過
去の時刻帯１で選択されたすべての状態群に続き
得る単語の総べてに対して個別距離Ｄ（ｌ、ｍ、
ｎ）を算出しなければならないので、単語予測の
効率が悪い。これに対して図中ｂに示す(8)式によ
る方法では、現在時刻ｌにおいて選択された状態
に続き得る単語のみを選んで個別距離の計算を行
なえば良いので予測効果が高い。

(8)式の計算と並行して(8)式の｛｝の中の下式
が上式より小であつた時には、次の処理が実行さ
れる。

Ｌテーブル Lq（ｍ）＝ｌＰテーブル Pq（ｍ）＝ｐ (10) Ｎテーブル Nq（ｍ）＝ｎこれらは文献(2)において、本明細書(6)式の最適
パラメータｌ、ｐ、ｎをテーブルに記憶していた
事に対応する。

時刻ｌが進行して(8)式の計算が、すべて終了し
た時点で次の様な判定処理がなされるのは、文献
(2)の場合と同様である。

いま、最終状態が、一般的にｐ＝ｆであるとす
る（第１図の例ではｐ＝５）。

(1) 初期条件ｐ＝ｆ、ｍ＝Ｉ。

(2) Np（ｍ）を認識結果n^として出力する。

(3) ｐ＝Pp（ｍ）、ｍ＝Lp（ｍ）とする。

(4) ｍ＝０ならば終了する。ｍ≠０ならば(2)以下
を繰り返す。

この手続きによつて認識結果は、最後尾単語か
ら逆順に求まる。

以上要約した文献(3)の方法によると計算量は大
幅に減小されるが、オートマトンの状態数が多い
場合に、演算用のメモリーは、文献(2)の場合と同
じく膨大なものとなる。特に、漸化式値T_q（ｍ）
を記憶するための漸化式値テーブルと、(10)式のＬ
テーブル、Ｐテーブル、Ｎテーブルのために多大
な記憶量が必要とされる。標本化周期10msとし
て５秒の連続音声を認識するためには時刻方向に
500番地割り当てる事になる。またオートマトン
が30状態より成るとすると状態ｑの方向に30番地
必要である。したがつて、１個のテーブルに
15000語のメモリーが必要とされる。よつて上記
４種のテーブルを合計すると60000語のメモリー
が必要になる。このため、上記文献(3)の原理によ
る連続音声認識装置は大型でかつ高価なものとな
る。

本発明は上記従来装置の多量のメモリーを必要
とすると言う欠点を改良して小型かつ安価な連続
音声認識装置を実現し提供する事を目的としたも
のである。

本発明による連続音声認識装置は、Ｐテーブ
ル、Ｌテーブル、Ｎテーブルに記憶される内容の
うち状態選択部によつて選択された状態に対応す
る記憶内容を保持するテーブルを別途備えてこれ
を判定部より参照可能とし、漸化式テーブル、Ｐ
テーブル、Ｌテーブル、及びＮテーブルは、時刻
ｌとｍに関してリング状に番地指定される様に構
成される。

次に図面を参照して本発明の原理構成を詳細に
説明する。

第７図は本発明の一実施例を示すブロツク図で
あり、第８図はその動作を説明するためのタイム
チヤートである。第７図においてオートマトン制
御部１３０には、第３図の機能コードFⁿをｎに
対応づけて記憶する機能コードテーブルと第４図
に示した状態遷移テーブルとが内蔵されている。
単語指定部１００には、単語選択部１２０が付属
している。この単語選択部１２０には第９図に示
すごとく各状態ｐに対して、これに続けて入力さ
れ得る単語ｎに対しては１、入力が許されない単
語ｎに対しては０なるフラグが記入された予測テ
ーブルが内蔵されている。状態ｐ＝０の次には
“円”以外のすべての単語が入力されるので、ｎ
＝37と０となつている以外は、すべて１なるフラ
グが記入されている。また、状態ｐ＝３の次に
は、一の位の数字と“円”が入力されるので、ｎ
＝１〜９およびｎ＝37で１、他はすべて０となつ
ている。

最終状態ｐ＝５の次には如何なる入力も許容さ
れないので、すべて０となつている。

LPNテーブル７０は第１０図に示すように状
態ｑ（あるいはｐ）と時刻ｍ（あるいはｌ）によつ
て番地指定され、(10)式のLq（ｍ）、Pq（ｍ）および
Nq（ｍ）が記憶される。すなわちＬテーブル、Ｐ
テーブル，Ｎテーブルを含んで構成される。時刻
ｌ、ｍに関しては第１０図に示すように一周64点
のリング状メモリーとして構成されている。すな
わちｍとｍ＋64は同一位置を指定する。この様な
構成は時刻信号ｍの下位７ビツトを番地指定信号
として用いる事によつて容易に実現される。

漸化式値テーブル８０は上記LPNテーブル７
０と同様な番地形式であつて第１１図のように構
成されており、漸化式値T_q（ｍ）を保持するため
に使用される。

次に実際の動作を説明する。分析部２０は「特
開昭52−144205号公報」の第３図に示された如く
構成され、入力音声波形ｐを分析して時間標本化
を行ない、(2)式に示されるような入力パタンＡに
変換して入力パタンバツフア４０に記憶せしめ
る。他方、制御部１０からは認識に先だつてクリ
アー信号Clが発生され、これによつて第１１図に
示される如く構成される漸化式値テーブル８０に
は(7)式と(9)式に対応してｑ＝０、ｍ＝０なる番地
には０が他の番地には十分大な数値が初期条件と
して記入される。

以後、時刻信号l₁が１から順次増加され、これ
に同期して(8)式と(10)式の計算が実行される。

一般に時刻信号がl₁＝ｌであるサイクルにおい
て第８図に示すごとく、予測処理に続けて圧縮処
理、マツチング処理、リセツト処理の各処理が実
行される。これらの中で、予測処理とマツチング
処理とは文献(3)のそれぞれと同一である。

予測処理は状態選択部９０と単語選択部１２０
とによつてなされる。すなわち、時刻信号l₁番地
指定によつて漸化式値T_p（ｌ）、（ｐ＝０、１、…
５）が前記漸化式値テーブル８０から出力され状
態選択部９０に入力される。ここでは漸化式値
T_p（ｌ）が、あらかじめ定められる閾値×ｌと
比較され、T_p（ｌ）×となるｐを選択し、信号p^
として出力される。

閾値をｌに比例させているのは、漸化式値Tp
（ｌ）は(6)式から明らかなように個別距離Ｄ（ｌ、
ｍ、ｎ）の積分値となつているので、ｌに比例し
て大きくなる傾向があるのに対応するためであ
る。

かくの如き選択によつてp^＝２だけが選択され
たとする。

単語選択部は、この信号p^を受けると、第９図
予測テーブルのp^行の内容を単語ｎごとにフラグ
の論理和を計算する。今の場合p^は１個だけしか
与えられないので、第９図予測テーブルのｐ＝２
の行が、そのまま予測信号として単語指定部１
００に送られる。これによつて予測処理が終了す
る。

圧縮処理では、状態選択部９０によつて選択さ
れた状態p^＝２に対応するLPNテーブル７０の内
容がLPNQテーブル７５に保存される。この
LPNQテーブル７５は時刻信号ｌ（あるいはｍ）
と、制御部から信号線k₁によつて与えられるカウ
ンタ信号ｋとによつて番地指定される２次元構成
となつている。前記のLPNテーブル７０と異な
つて時刻信号ｌ、ｍに関してはリング状の構成と
はなつていない。上記の如くp^＝２の場合、LPN
テーブル７０に記憶されるL₂（ｌ）、P₂（ｌ）、N₂
（ｌ）がLPNQテーブル７５のｌ及びｋ＝０によ
つて指定される場地にＬ（０、ｌ）、Ｐ（０、ｌ）、
Ｎ（０、ｌ）なるデーターとして記入される。ま
た上記状態p^＝２自身もＱ（０、ｌ）なるデータ
として保存される。２個以上の状態が選択されて
いる場合には、カウンタ信号を１だけ増加して同
様な事が繰り返される。すなわち一例としてp^＝
２の他にp^＝４が選択された場合には L₄（ｌ）→Ｌ（１、ｌ） P₄（ｌ）→Ｐ（１、ｌ） N₄（ｌ）→Ｎ（１、ｌ）４→Ｑ（１、ｌ）なるデータ転送がLPNQテーブル７５に対して実
行される。

圧縮処理に後続してマツチング処理が行なわれ
る。単語指定部１００からは予測信号を参照し
フラグが１となつている単語の番号を、単語指定
信号n₁として出力する。今の例では第９図予測テ
ーブルのｐ＝２の行から明らかなようにｎ＝１、
２、…、18及び37が単語指定信号n₁として出力さ
れる。

この単語指定信号n₁の各サイクルで実行される
処理をn₁＝17の場合を例にとつて示す。

n₁＝17のサイクルの最初に第１マツチング部５
０が動作し、個別距離Ｄ（ｌ、ｍ、17）が計算さ
れる。この計算は、「特願昭50−29891号明細書」
（以下文献(4)と称す）の第６図に示される如き回
路によつて実行される。この時、入力パタンＡは
前記入力パタンバツフア４０より、標準パタン
B¹⁷は標準パタン記憶部３０より前記の単語指定
信号n₁＝17の指定によつて、それぞれ供給され
る。

上記文献(4)の第３図によると、一般にn₁＝ｎの
とき、ｌ＋Jⁿ−ｒ≦ｍ≦ｌ＋Jⁿ＋ｒ (12) なる範囲の個別距離Ｄ（ｌ、ｍ、ｎ）が、一度に
算出される。ここにｒは正整数であつて整合窓幅
と呼ばれている。よつて、n₁＝17の場合には、ｌ＋J¹⁷−ｒ≦ｍ≦ｌ＋J¹⁷＋ｒ（13）の範囲のｍに対して個別距離Ｄ（ｌ、ｍ、17）が
算出される。

第１マツチング処理に続いて第２マツチング処
理が実行される。

オートマトン制御部１３０に内蔵される機能コ
ードテーブルからは、単語指定信号n₁＝ｎの指定
によつて機能コードFⁿが出力される。n₁＝17に対
応してはF¹⁷＝２が出力される。これによつて、
同じくオートマン制御部１３０に内蔵される第４
図の状態遷移テーブルが参照され、F¹⁷＝２に対
応して（pq）＝（０、３）、（１、３）、（２、３）
なる状態対が読み出される。他方、前記の状態選
択部９０からは信号p^としてｐ＝２だけが現在状
態として指定されている。それ故、上記３個の状
態対（ｐ、ｑ）のうち（２、３）だけが有効であ
ると判定され、信号p₁、q₁として出力される。

第２マツチング部６０に、この信号対（２、
３）が与えられると、漸化式値テーブル８０、と
LPNテーブル７０に内蔵されるＬテーブル、Ｐ
テーブルＮテーブルと共同して(8)式と(10)式の計算
が実行される。このための時刻信号ｌは、信号線
l₁よりアドレス信号ｍは、信号線m₁より与えられ
る。アドレス信号ｍは（13）式（一般には(12)式の
範囲で変化され、この間各ｍの値ごとに前記第１
マツチング部５０から個別距離Ｄ（ｌ、ｍ、ｎ）
が入力され(8)式と(10)式が計算される。前記オート
マトン制御部１３０から状態対（ｐ、ｑ）が一個
以上与えられる場合には、それぞれに関してアド
レス信号m₁が（13）式の範囲で変化され、(8)式
と(10)式の計算が繰り返される。

かくして、第１マツチングと第２マツチングが
終了するごとに単語指定信号n₁が変化される。

単語指定信号n₁が37まで変化され終ると、この
時刻l₁＝ｌにおけるマツチング処理が終了する。

次にはリセツト処理が実行される。この時刻ｍ
における漸化式値Tp（ｌ）（ｐ＝０、１、…５）
は直前のマツチング処理で使用されもはや不要で
ある。それでこの時刻の漸化式値T_p（ｌ）は十分
大な数値でリセツトされる。これによつてこれら
の記憶番地は再利用可能となる。

かくして時刻ｍにおける処理がすべて終了す
る。次には時刻信号が１だけ増加され、上記と同
様な処理が繰り返される。

前に述べた様に、LPNテーブル７０と漸化式
値テーブル８０とはリング状バツフアとして構成
されている。LPNテーブル７０内の所要なデー
ターは圧縮処理時にLPNQテーブル７５に保存さ
れ、関係する記憶番地は再利用可能となる。ま
た、漸化式値テーブル８０もリセツト処理され
る。このためこれら２個のテーブルは有限長であ
るにもかかわらず、有効時には無限長のテーブル
として機能する。

時刻信号l₁＝Ｉにおける処理が終了すると判定
部１１０が動作し、(11)式に示した(1)から(4)までの
手続きが実行され、判定結果が信号n^として出力
される。ただし、LPNテーブル７０の内容は２
重書き込みによつて破壊されているのでLPNQテ
ーブル７５を参照しながら判定処理が実行され
る。このため(11)の手続きにかえて次の手続きが実
行される。

(1) 初期条件ｐ＝ｆ、ｍ＝Ｉとする。

(2) Ｑ（ｋ、ｍ）＝ｐとなるｋ＝k^を定める。

(3) Ｎ（k^m）を認識結果n^として出力する。

(4) ｐ＝Ｐ（ｋ、ｍ）、ｍ＝Ｌ（ｋ、ｍ）とする。

(5) ｍ＝０ならば終了する。ｍ≠０ならば(2)以下
を繰り返す。

以上の動作を実行するための判定部１１０は、
周知のマイクロプロセツサによつて構成できる。

以上述べた本発明の構成によると、特にオート
マトンの状態数が多い場合に、所要演算メモリー
の大幅低減が可能である。前述の数値例では従来
技術による場合60000語のメモリーが必要とされ
た。電子通信学会技術研究報告PRL80−19に
「単語を単位とした連続音声認識の一手法」と題
して発行された論文の第８図には各時刻ｍにおい
て選択される状態の個数（beam size）が４程度
で十分である事が示されている。よつてLPNQテ
ーブル７５の大きさはｋに関しては４番地まであ
ればよい事になる。したがつてLPNQテーブルの
容量は500×４×４＝8000語で十分な事になる。
また漸右式値テーブルは30×64＝1920語、LPN
テーブルは30×64×４＝7680語の容量でよい。よ
つて本発明の装置では総計17600語の演算算メモ
リーで十分な事になり、従来例に比して約1/3の
メモリーで構成できる事になつた。

以上、本発明の原理を実施例にもとづいて説明
したが、これらの記載は、本発明の範囲を限定す
るものではない。特に状態選定の方法として以上
の例では値との比較によつて行なつたが、漸化式
値T_p（ｌ）の小な一定個数のｐを選択するという
方法も考えられる。また、文献(2)と同様に本明細
書で距離をパタン間の比較尺度としたのとは逆に
類以度を用いる場合も本発明の範囲に含まれるも
のである。この場合には、本明細中の大小比較は
総て逆に行なわれる。

【図面の簡単な説明】

第１図、第２図、第３図、第４図、第５図及び
第６図は本発明の原理を説明するための図、第７
図は本発明の一実施例を示すブロツク図、第８図
はタイムチヤート、第９図は単語選択部１２０内
蔵の予測テーブルの一構成例を示す図、第１０図
はLPNテーブル７０の一構成例を示す図、第１
１図は漸化式値テーブル８０の一構成例を示す図
である。図において、１０……制御部、２０……分析
部、３０……標準パタン記憶部、４０……入力パ
タンバツフア、５０……第１マツチング部、６０
……第２マツチング部、７０……LPNテーブル、
７５……LPNQテーブル、８０……漸化式値テー
ブル、９０……状態選定部１００単語指定部、１
１０……判定部、１２０……予測テーブル、１３
０……オートマン制御部をそれぞれ示す。

Claims

【特許請求の範囲】

１単語ｎ＝１、２、…Ｎのそれぞれに対して標
準パタンＢ＝〓ⁿ ₁〓ⁿ ₂…〓ⁿ _j…〓ⁿ _Jｎを記憶してなる
標準パタン記憶部と、単語ｎに付随する機能コー
ドFⁿと状態ｐ及びｑの組を配列して構成される
状態遷移テーブルを記憶してなるオートマトン制
御部と、入力パタンＡ＝〓₁〓₂…〓_i…〓ｌの時刻
ｌを始端とし、時刻ｉ＝ｍを終端とする部分パタ
ンＡ（ｌ、ｍ）＝〓_l+1〓_l+2…〓_nと前記標準パタン
Bⁿとの間の個別距離Ｄ（ｌ、ｍ、ｎ）を算出する
ための手段である第１マツチング部と、時刻ｌと
状態ｐとに対応して番地指定される漸化式値テー
ブルTp（ｌ）と、それと同様に構成されるＬテー
ブルLp（ｌ）、ＰテーブルPp（ｌ）およびＮテーブ
ルNp（ｌ）と、順次進行される各時刻において漸
化式値テーブルに記憶される値Tp（ｌ）の小なる
状態ｐの部分組を決定する手段である状態選択部
と、これにより選択される状態ｐの各々に対し
て、その状態で受理し得る単語組の和集合を決定
し、この和集合に含まれるすべての単語組ｎに対
して個別距離Ｄ（ｌ、ｍ、ｎ）を計算すべく前記
第１マツチング部に指令する単語指定部と、該単
語ｎに対して状態遷移が、前記オートマトン制御
部中の状態遷移テーブルに定義される状態対
（ｐ、ｑ）のすべてに対してｌ＜ｍなる時刻ｍの
漸化式値Tq（ｍ）と、現時刻ｌにおける漸化式値
Tp（ｌ）と前記個別距離Ｄ（ｌ、ｍ、ｎ）との和
すなわちTp（ｌ）＋Ｄ（ｌ、ｍ、ｎ）とを比較して
後者が小なる時にかぎり、この後者の値をTq
（ｍ）として漸化式値テーブルに記入し、同時に
状態ｐをＰテーブルにPq（ｍ）として、時刻ｌを
ＬテーブルにLq（ｍ）として単語名ｎをＮテーブ
ルにNq（ｍ）としてそれぞれ記入するという漸化
式を計算する手段である第２マツチング部と、上
記のＰテーブル、Ｌテーブル及びＮテーブルを最
終状態ｐ＝ｆ、最終時刻ｌ＝１よりさかのぼつて
参照し、認識結果を定め出力する判定部とより成
る連続音声認識装置において、Ｐテーブル、Ｌテ
ーブル、Ｎテーブルに記憶される内容のうち、上
記状態選択部によつて選択された状態に対応する
記憶内容を保持するテーブルを別途備え、判定部
より参照されるように構成され、前記漸化式値テ
ーブル、Ｐテーブル、Ｌテーブル及びＮテーブル
は時刻ｌとｍに関してリング状に番地指定される
ように構成されることを特徴とする連続音声認識
装置。