JPS6344240B2 - - Google Patents

Info

Publication number
JPS6344240B2
JPS6344240B2 JP56023975A JP2397581A JPS6344240B2 JP S6344240 B2 JPS6344240 B2 JP S6344240B2 JP 56023975 A JP56023975 A JP 56023975A JP 2397581 A JP2397581 A JP 2397581A JP S6344240 B2 JPS6344240 B2 JP S6344240B2
Authority
JP
Japan
Prior art keywords
state
time
recurrence formula
word
formula value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56023975A
Other languages
English (en)
Other versions
JPS57138698A (en
Inventor
Hiroaki Sekoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56023975A priority Critical patent/JPS57138698A/ja
Publication of JPS57138698A publication Critical patent/JPS57138698A/ja
Publication of JPS6344240B2 publication Critical patent/JPS6344240B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は連続音声認識装置に関し、特に文法に
従がつて入力される入力される文や句を矛循なく
効率良く認識する装置の改良に関する。
連続的に発声入力される文章や句(以下連続音
声と総称する。)を認識する連続音声認識装置は
計算機に対する演算命令や、ロボツトに対する行
動指令に有用であると考えられる。一般に、この
ような演算命令や行動指令は人工的な文法に基づ
いて発せられる。新美康永著、昭和54年10月共立
出版社発行の「音声認識」(以下文献(1)と称す
る。)の第164ページに記載される如く、多くの人
工的文法は正規文法で記述することができる。こ
こに正規文法とは、有限状態オートマトンの制御
によつて生成あるいは受理されるような言語の規
則である。したがつて、正規文法に基づく連続音
声を矛循なく認識できる音声認識装置は、極めて
実用性が高いと考えられる。
特願昭54−104669号明細書(以下文献(2)と称す
る。)には、正に、正規文法に基づく連続音声を
矛循なく認識処理する連続音声認識装置が記述さ
れている。その記載の要旨を本明細書の第1図に
基づいて説明する。第1図aは算盤読み式(例え
ば3095円をサンゼン キユウジユウエンと読む。)
の数字音声の発生規則を正規文法に対応するオー
トマトンで示したものである。状態0〜5の間の
遷移図であつて遷移線に付した文字は、次のよう
な意味を持つ。
“4”={1000、2000、……9000} “3”={100、200、……900} “2”={10、20、……90} “1”={1、2……9} “5”={円} (1) すなわち、例えば2の所には10、20、…、90な
る単語群が対応する。第1図aのオートマトンに
数字“2053円”が入力された場合には状態を0→
3→4→5の如く遷移して受理される。
音声パタンは特徴ペクトル〓iの時系列として A=〓12…〓i…al (2) なる如く表現される。また、認識対象となる単語
をn=1、2…Nなる番号で示す時、単語nの標
準パタンは、 Bn=〓n 1n 2…〓n jn Jn (3) なる如く示される。第2図に示すように、入力パ
タンAの部分パタンが、 A(l、m)=〓l+1l+2…〓n (4) と定義される。標準パタンBと入力パタンA(l、
m)との間の個別距離がD(l、m、n)と定義
される。
単語nの機能を示すコードをFnで示す。
いま、前に述べた算盤読み数字の場合を例にと
ると、このFnは第3図に示すようなテーブルと
して表現される。また、第1図のオートマトンは
第4図に示すような状態遷移テーブルとして表現
される。この状態遷移テーブルは、機能コード
Fnを持つ単語nが入力された時に、状態pから
状態qへの遷移が許される事を意味する。例え
ば、Fn=2によつて0→3、1→3、2−3な
る状態遷移が生起し得る。
前記文献(2)によると、第1図bに示すように状
態p(あるいはq)と時刻mとによつて番地指定
されるメモリーを用意する。そして、このメモリ
ー上で次のような動的計画法の漸化式が計算され
る。
Tq(m)=min〔Tp(l)+D(l、m、n)〕 (6) ここにD(l、m、n)は、前に述べたように
部分パタンA(l、m)と標準パタンBnとの個別
距離である。また、minで示される最小値検出は
状態p、時刻l、単語nに関して{ }内の値を
最小化することを意味する。特にq、p、nの間
には、機能コードFnによつて状態pから状態q
への遷移が状態遷移テーブルに存在するという関
係が要請される。
(6)式の計算は第1図bに示した漸化式値テーブ
ルのp(=1、2、…5)、m(1、2、…I)の
組み合せを総べて埋めるように計算される。
なお、初期条件として To(o)=0 To(m)=∞ m>0 Tp(o)=∞ p≠0 (7) が与えられる。これらは第1図aに示すオートマ
トンの状態遷移が、必らず初期状態0より発する
ことを保証するためである。
上記文献(2)に記載された方法によつて前記の漸
化式(6)を計算するためには、各時刻mにおいて個
別距離D(l、m、n)のすべて(すなわち、n
=1、2、…、N)を計算する必要があつた。こ
れは各時刻mにおけるオートマトンの状態遷移に
総ての可能性を許していたためである。その結果
として常にN個の単語の総てが入力される可能性
があるものと見なして、N個の標準パタンとの間
で個別距離を計算する必要があつた。一般に時刻
i(すなわち、l、mも同じ)の標本化周期は
10ms前後に選定されるのが普通である。また、
音声パタンの間の距離の計算には特開昭52−
55413号公報に記述されるが如き、動的計画法に
基づく手法が多用されているが、現在の回路技術
では一回の個別距離の計算に400μs程度を必要と
する。このため第3図に示すようにN=37個の標
準パタンが有る時には、37×400μs>10msとな
つてしまい、前記文献(2)の方法を実時間で実行す
るのは不可能になる。すなわち、従来技術によつ
て多数語彙の連続音声を実時間認識する事は困難
であり、しいて実時間処理を行なうためには並列
処理方式等を採用する必要があり、高価かつ大型
の装置構成が必要とされた。
上記特願昭54−104669号明細書記載の装置の有
する欠点を改良した装置構成が特願昭55−83199
号(以下文献(3)と呼ぶ)明細書に記載されてい
る。この文献(3)記載の連続音声認識装置は、単語
n=1、2、…Nのそれぞれに対して標準パタン
Bn=〓n 1n 2、…〓n Jnを記憶するための標準パタ
ン記憶部と、単語nに付随する機能コードFn
状態p及びqの組を配列して構成される状態遷移
テーブルを記憶してなるオートマトン制御部と、
入力パタンA=〓12…〓i…〓lの各時刻lを始
端とし、時刻i=mを始端とする部分パタンA
(lm)=〓l+1l+2…〓nと前記標準パタンBnとの間
の個別距離D(l、m、n)を算出するための手
段である第1マツチング部と時刻l(あるいはm)
と、状態p(あるいはq)とに対応して番地指定
される漸化式値テーブルTp(l)、LテーブルLp
(l)、PテーブルPp(l)およびNテーブルNp
(l)と、順次進行される各時刻lにおいて漸化
式値テーブルに記憶される値Tp(l)の小となる
pの部分組を決定する手段である状態選択部と、
これにより選択される状態pの各々に対して、そ
の状態で受理し得る単語の組の和集合として時刻
lにおいて受理し得る単語組を決定してこの単語
組みに含まれるすべての単語nに対して個別距離
D(l、m、n)を計算すべく前記第1マツチン
グ部に指令する手段たる単語指定部と、該単語n
に対して状態遷移が前記オートマトン制御部に定
義される状態対(p、q)のすべてに対してl<
mなる時刻mの漸化式値Tq(m)と、現時刻lに
おける漸化式値Tp(l)と前記個別距離D(l、
m、n)との和を比較して後者が小なる時にかぎ
り、この後者の値をTq(m)として記憶し状態p
をPテーブルPq(m)に、現時刻lをLテーブル
Lq(m)に単語名nをNテーブルNq(m)にそれ
ぞれ記入するという漸化式計算を所要の時刻mに
対して実行する手段である第2マツチング部と、
上記のPテーブル、Lテーブル、およびNテーブ
ルを最終状態p=f、最終時刻l=Iよりさかの
ぼつて参照し、認識結果を定める判定部とから構
成される。
文献(2)の方法に比較して、各時刻においてオー
トマトンが受理し得る単語群を予測する機能が付
加されている。これによつて個別距離の計算は予
測された単語群の標準パタンに対してだけ行なえ
ば良いので、所要計算量が大幅に低減できるとさ
れている。
すなわち、結果として低価格な連続音声認識装
置が実現できるという効果が得られたとされてい
る。
この文献(3)の原理による単語予測を第5図を用
いて説明する。3095円という入力音声に対する処
理の例であつて、時刻lにおいて漸化式値テーブ
ルの値Tp(l)が、それぞれT1(l)=6030、T2
(l)=5020、T3(l)=2821、T4(l)=3529、T5
(l)=4592であつたとする。(6)式の意味する所に
より、これらの値は、この時刻lまでの個別距離
の積分値となつている。したがつて、この値が小
さい状態pはオートマトンの現在状態としての可
能性が強く、逆にこの値が大きい状態pは、この
時刻lでの現在状態である可能性は低い。故に、
漸化式値の小さい数個の状態、例えば第5図の例
ではp=3とp=4を選択して残し、他は無視し
ても良い。
第4図の状態遷移テーブルによるとp=3の続
きには一の位の数1〜9(Fn=2)および“円”
(Fn=5)が許され、p=4の続きには、“円”
(Fn=5)だけが許される。結局第5図の時刻l
の続きとしてこれらの和集合である。一の位の数
字及び“円”の合計10語だけが許容されるとして
個別距離の計算を行なえば良い事になる。
上記のような単語予測を行なわない文献(2)の従
来技術では、どの時刻lにおいても常に総ての標
準パタン、すなわち37語の標準パタンに対して個
別距離を計算する必要があつた。したがつて、こ
の時刻lにおいては、上記の単語予測によつて
10/37の計算量圧縮が実現された事になる。
この単語予測を効率良く実行するため、文献(3)
においては(6)式の漸化式を次のように分解して前
向きに実行する。
Tq(m)=minTq(m) Tp(l)+D(l、m、n) (8) ただし、初期条件 Tq(m)=∞ (9) (8)式と前記(6)式との関係は第6図によつて説明
される。図には簡単のため状態pからqへの状態
遷移だけが存在する場合を示している。図中aに
示す文献(2)の場合には参照数字1で示す過去の時
刻帯におけるTp(l)が、すでに算出されてお
り、これを基にして(6)式の漸化式を計算し、現在
の時刻m(参照数字2)におけるTq(m)を算出
する。
これに対して文献(3)においてはbの如く、現在
の時刻lにおいて確定している漸化式値Tp(l)
をもとにして(8)式を計算し、未来の時刻m(参照
数字4)における漸化式値テーブルに記入する。
したがつて、時刻lにおいて(8)式を計算しただけ
では(6)式を計算した事にはならないが、時刻lが
進行し参照数字3で示す部分を通過した時点では
(6)式を計算したのと等価になる事は、明らかであ
る。
このように文献(3)において(8)式を採用したの
は、次の理由による。図中aの従来技術では、過
去の時刻帯1で選択されたすべての状態群に続き
得る単語の総べてに対して個別距離D(l、m、
n)を算出しなければならないので、単語予測の
効率が悪い。これに対して図中bに示す(8)式によ
る方法では、現在時刻lにおいて選択された状態
に続き得る単語のみを選んで個別距離の計算を行
なえば良いので予測効果が高い。
(8)式の計算と並行して(8)式の{ }の中の下式
が上式より小であつた時には、次の処理が実行さ
れる。
Lテーブル Lq(m)=l Pテーブル Pq(m)=p (10) Nテーブル Nq(m)=n これらは文献(2)において、本明細書(6)式の最適
パラメータl、p、nをテーブルに記憶していた
事に対応する。
時刻lが進行して(8)式の計算が、すべて終了し
た時点で次の様な判定処理がなされるのは、文献
(2)の場合と同様である。
いま、最終状態が、一般的にp=fであるとす
る(第1図の例ではp=5)。
(1) 初期条件 p=f、m=I。
(2) Np(m)を認識結果n^として出力する。
(3) p=Pp(m)、m=Lp(m)とする。
(4) m=0ならば終了する。m≠0ならば(2)以下
を繰り返す。
この手続きによつて認識結果は、最後尾単語か
ら逆順に求まる。
以上要約した文献(3)の方法によると計算量は大
幅に減小されるが、オートマトンの状態数が多い
場合に、演算用のメモリーは、文献(2)の場合と同
じく膨大なものとなる。特に、漸化式値Tq(m)
を記憶するための漸化式値テーブルと、(10)式のL
テーブル、Pテーブル、Nテーブルのために多大
な記憶量が必要とされる。標本化周期10msとし
て5秒の連続音声を認識するためには時刻方向に
500番地割り当てる事になる。またオートマトン
が30状態より成るとすると状態qの方向に30番地
必要である。したがつて、1個のテーブルに
15000語のメモリーが必要とされる。よつて上記
4種のテーブルを合計すると60000語のメモリー
が必要になる。このため、上記文献(3)の原理によ
る連続音声認識装置は大型でかつ高価なものとな
る。
本発明は上記従来装置の多量のメモリーを必要
とすると言う欠点を改良して小型かつ安価な連続
音声認識装置を実現し提供する事を目的としたも
のである。
本発明による連続音声認識装置は、Pテーブ
ル、Lテーブル、Nテーブルに記憶される内容の
うち状態選択部によつて選択された状態に対応す
る記憶内容を保持するテーブルを別途備えてこれ
を判定部より参照可能とし、漸化式テーブル、P
テーブル、Lテーブル、及びNテーブルは、時刻
lとmに関してリング状に番地指定される様に構
成される。
次に図面を参照して本発明の原理構成を詳細に
説明する。
第7図は本発明の一実施例を示すブロツク図で
あり、第8図はその動作を説明するためのタイム
チヤートである。第7図においてオートマトン制
御部130には、第3図の機能コードFnをnに
対応づけて記憶する機能コードテーブルと第4図
に示した状態遷移テーブルとが内蔵されている。
単語指定部100には、単語選択部120が付属
している。この単語選択部120には第9図に示
すごとく各状態pに対して、これに続けて入力さ
れ得る単語nに対しては1、入力が許されない単
語nに対しては0なるフラグが記入された予測テ
ーブルが内蔵されている。状態p=0の次には
“円”以外のすべての単語が入力されるので、n
=37と0となつている以外は、すべて1なるフラ
グが記入されている。また、状態p=3の次に
は、一の位の数字と“円”が入力されるので、n
=1〜9およびn=37で1、他はすべて0となつ
ている。
最終状態p=5の次には如何なる入力も許容さ
れないので、すべて0となつている。
LPNテーブル70は第10図に示すように状
態q(あるいはp)と時刻m(あるいはl)によつ
て番地指定され、(10)式のLq(m)、Pq(m)および
Nq(m)が記憶される。すなわちLテーブル、P
テーブル,Nテーブルを含んで構成される。時刻
l、mに関しては第10図に示すように一周64点
のリング状メモリーとして構成されている。すな
わちmとm+64は同一位置を指定する。この様な
構成は時刻信号mの下位7ビツトを番地指定信号
として用いる事によつて容易に実現される。
漸化式値テーブル80は上記LPNテーブル7
0と同様な番地形式であつて第11図のように構
成されており、漸化式値Tq(m)を保持するため
に使用される。
次に実際の動作を説明する。分析部20は「特
開昭52−144205号公報」の第3図に示された如く
構成され、入力音声波形pを分析して時間標本化
を行ない、(2)式に示されるような入力パタンAに
変換して入力パタンバツフア40に記憶せしめ
る。他方、制御部10からは認識に先だつてクリ
アー信号Clが発生され、これによつて第11図に
示される如く構成される漸化式値テーブル80に
は(7)式と(9)式に対応してq=0、m=0なる番地
には0が他の番地には十分大な数値が初期条件と
して記入される。
以後、時刻信号l1が1から順次増加され、これ
に同期して(8)式と(10)式の計算が実行される。
一般に時刻信号がl1=lであるサイクルにおい
て第8図に示すごとく、予測処理に続けて圧縮処
理、マツチング処理、リセツト処理の各処理が実
行される。これらの中で、予測処理とマツチング
処理とは文献(3)のそれぞれと同一である。
予測処理は状態選択部90と単語選択部120
とによつてなされる。すなわち、時刻信号l1番地
指定によつて漸化式値Tp(l)、(p=0、1、…
5)が前記漸化式値テーブル80から出力され状
態選択部90に入力される。ここでは漸化式値
Tp(l)が、あらかじめ定められる閾値×lと
比較され、Tp(l)×となるpを選択し、信号p^
として出力される。
閾値をlに比例させているのは、漸化式値Tp
(l)は(6)式から明らかなように個別距離D(l、
m、n)の積分値となつているので、lに比例し
て大きくなる傾向があるのに対応するためであ
る。
かくの如き選択によつてp^=2だけが選択され
たとする。
単語選択部は、この信号p^を受けると、第9図
予測テーブルのp^行の内容を単語nごとにフラグ
の論理和を計算する。今の場合p^は1個だけしか
与えられないので、第9図予測テーブルのp=2
の行が、そのまま予測信号として単語指定部1
00に送られる。これによつて予測処理が終了す
る。
圧縮処理では、状態選択部90によつて選択さ
れた状態p^=2に対応するLPNテーブル70の内
容がLPNQテーブル75に保存される。この
LPNQテーブル75は時刻信号l(あるいはm)
と、制御部から信号線k1によつて与えられるカウ
ンタ信号kとによつて番地指定される2次元構成
となつている。前記のLPNテーブル70と異な
つて時刻信号l、mに関してはリング状の構成と
はなつていない。上記の如くp^=2の場合、LPN
テーブル70に記憶されるL2(l)、P2(l)、N2
(l)がLPNQテーブル75のl及びk=0によ
つて指定される場地にL(0、l)、P(0、l)、
N(0、l)なるデーターとして記入される。ま
た上記状態p^=2自身もQ(0、l)なるデータ
として保存される。2個以上の状態が選択されて
いる場合には、カウンタ信号を1だけ増加して同
様な事が繰り返される。すなわち一例としてp^=
2の他にp^=4が選択された場合には L4(l)→L(1、l) P4(l)→P(1、l) N4(l)→N(1、l) 4→Q(1、l) なるデータ転送がLPNQテーブル75に対して実
行される。
圧縮処理に後続してマツチング処理が行なわれ
る。単語指定部100からは予測信号を参照し
フラグが1となつている単語の番号を、単語指定
信号n1として出力する。今の例では第9図予測テ
ーブルのp=2の行から明らかなようにn=1、
2、…、18及び37が単語指定信号n1として出力さ
れる。
この単語指定信号n1の各サイクルで実行される
処理をn1=17の場合を例にとつて示す。
n1=17のサイクルの最初に第1マツチング部5
0が動作し、個別距離D(l、m、17)が計算さ
れる。この計算は、「特願昭50−29891号明細書」
(以下文献(4)と称す)の第6図に示される如き回
路によつて実行される。この時、入力パタンAは
前記入力パタンバツフア40より、標準パタン
B17は標準パタン記憶部30より前記の単語指定
信号n1=17の指定によつて、それぞれ供給され
る。
上記文献(4)の第3図によると、一般にn1=nの
とき、 l+Jn−r≦m≦l+Jn+r (12) なる範囲の個別距離D(l、m、n)が、一度に
算出される。ここにrは正整数であつて整合窓幅
と呼ばれている。よつて、n1=17の場合には、 l+J17−r≦m≦l+J17+r (13) の範囲のmに対して個別距離D(l、m、17)が
算出される。
第1マツチング処理に続いて第2マツチング処
理が実行される。
オートマトン制御部130に内蔵される機能コ
ードテーブルからは、単語指定信号n1=nの指定
によつて機能コードFnが出力される。n1=17に対
応してはF17=2が出力される。これによつて、
同じくオートマン制御部130に内蔵される第4
図の状態遷移テーブルが参照され、F17=2に対
応して(pq)=(0、3)、(1、3)、(2、3)
なる状態対が読み出される。他方、前記の状態選
択部90からは信号p^としてp=2だけが現在状
態として指定されている。それ故、上記3個の状
態対(p、q)のうち(2、3)だけが有効であ
ると判定され、信号p1、q1として出力される。
第2マツチング部60に、この信号対(2、
3)が与えられると、漸化式値テーブル80、と
LPNテーブル70に内蔵されるLテーブル、P
テーブルNテーブルと共同して(8)式と(10)式の計算
が実行される。このための時刻信号lは、信号線
l1よりアドレス信号mは、信号線m1より与えられ
る。アドレス信号mは(13)式(一般には(12)式の
範囲で変化され、この間各mの値ごとに前記第1
マツチング部50から個別距離D(l、m、n)
が入力され(8)式と(10)式が計算される。前記オート
マトン制御部130から状態対(p、q)が一個
以上与えられる場合には、それぞれに関してアド
レス信号m1が(13)式の範囲で変化され、(8)式
と(10)式の計算が繰り返される。
かくして、第1マツチングと第2マツチングが
終了するごとに単語指定信号n1が変化される。
単語指定信号n1が37まで変化され終ると、この
時刻l1=lにおけるマツチング処理が終了する。
次にはリセツト処理が実行される。この時刻m
における漸化式値Tp(l)(p=0、1、…5)
は直前のマツチング処理で使用されもはや不要で
ある。それでこの時刻の漸化式値Tp(l)は十分
大な数値でリセツトされる。これによつてこれら
の記憶番地は再利用可能となる。
かくして時刻mにおける処理がすべて終了す
る。次には時刻信号が1だけ増加され、上記と同
様な処理が繰り返される。
前に述べた様に、LPNテーブル70と漸化式
値テーブル80とはリング状バツフアとして構成
されている。LPNテーブル70内の所要なデー
ターは圧縮処理時にLPNQテーブル75に保存さ
れ、関係する記憶番地は再利用可能となる。ま
た、漸化式値テーブル80もリセツト処理され
る。このためこれら2個のテーブルは有限長であ
るにもかかわらず、有効時には無限長のテーブル
として機能する。
時刻信号l1=Iにおける処理が終了すると判定
部110が動作し、(11)式に示した(1)から(4)までの
手続きが実行され、判定結果が信号n^として出力
される。ただし、LPNテーブル70の内容は2
重書き込みによつて破壊されているのでLPNQテ
ーブル75を参照しながら判定処理が実行され
る。このため(11)の手続きにかえて次の手続きが実
行される。
(1) 初期条件p=f、m=Iとする。
(2) Q(k、m)=pとなる k=k^を定める。
(3) N(k^m)を認識結果n^として出力する。
(4) p=P(k、m)、m=L(k、m)とする。
(5) m=0ならば終了する。m≠0ならば(2)以下
を繰り返す。
以上の動作を実行するための判定部110は、
周知のマイクロプロセツサによつて構成できる。
以上述べた本発明の構成によると、特にオート
マトンの状態数が多い場合に、所要演算メモリー
の大幅低減が可能である。前述の数値例では従来
技術による場合60000語のメモリーが必要とされ
た。電子通信学会技術研究報告PRL80−19に
「単語を単位とした連続音声認識の一手法」と題
して発行された論文の第8図には各時刻mにおい
て選択される状態の個数(beam size)が4程度
で十分である事が示されている。よつてLPNQテ
ーブル75の大きさはkに関しては4番地まであ
ればよい事になる。したがつてLPNQテーブルの
容量は500×4×4=8000語で十分な事になる。
また漸右式値テーブルは30×64=1920語、LPN
テーブルは30×64×4=7680語の容量でよい。よ
つて本発明の装置では総計17600語の演算算メモ
リーで十分な事になり、従来例に比して約1/3の
メモリーで構成できる事になつた。
以上、本発明の原理を実施例にもとづいて説明
したが、これらの記載は、本発明の範囲を限定す
るものではない。特に状態選定の方法として以上
の例では値との比較によつて行なつたが、漸化式
値Tp(l)の小な一定個数のpを選択するという
方法も考えられる。また、文献(2)と同様に本明細
書で距離をパタン間の比較尺度としたのとは逆に
類以度を用いる場合も本発明の範囲に含まれるも
のである。この場合には、本明細中の大小比較は
総て逆に行なわれる。
【図面の簡単な説明】
第1図、第2図、第3図、第4図、第5図及び
第6図は本発明の原理を説明するための図、第7
図は本発明の一実施例を示すブロツク図、第8図
はタイムチヤート、第9図は単語選択部120内
蔵の予測テーブルの一構成例を示す図、第10図
はLPNテーブル70の一構成例を示す図、第1
1図は漸化式値テーブル80の一構成例を示す図
である。 図において、10……制御部、20……分析
部、30……標準パタン記憶部、40……入力パ
タンバツフア、50……第1マツチング部、60
……第2マツチング部、70……LPNテーブル、
75……LPNQテーブル、80……漸化式値テー
ブル、90……状態選定部100単語指定部、1
10……判定部、120……予測テーブル、13
0……オートマン制御部をそれぞれ示す。

Claims (1)

    【特許請求の範囲】
  1. 1 単語n=1、2、…Nのそれぞれに対して標
    準パタンB=〓n 1n 2…〓n j…〓n Jnを記憶してなる
    標準パタン記憶部と、単語nに付随する機能コー
    ドFnと状態p及びqの組を配列して構成される
    状態遷移テーブルを記憶してなるオートマトン制
    御部と、入力パタンA=〓12…〓i…〓lの時刻
    lを始端とし、時刻i=mを終端とする部分パタ
    ンA(l、m)=〓l+1l+2…〓nと前記標準パタン
    Bnとの間の個別距離D(l、m、n)を算出する
    ための手段である第1マツチング部と、時刻lと
    状態pとに対応して番地指定される漸化式値テー
    ブルTp(l)と、それと同様に構成されるLテー
    ブルLp(l)、PテーブルPp(l)およびNテーブ
    ルNp(l)と、順次進行される各時刻において漸
    化式値テーブルに記憶される値Tp(l)の小なる
    状態pの部分組を決定する手段である状態選択部
    と、これにより選択される状態pの各々に対し
    て、その状態で受理し得る単語組の和集合を決定
    し、この和集合に含まれるすべての単語組nに対
    して個別距離D(l、m、n)を計算すべく前記
    第1マツチング部に指令する単語指定部と、該単
    語nに対して状態遷移が、前記オートマトン制御
    部中の状態遷移テーブルに定義される状態対
    (p、q)のすべてに対してl<mなる時刻mの
    漸化式値Tq(m)と、現時刻lにおける漸化式値
    Tp(l)と前記個別距離D(l、m、n)との和
    すなわちTp(l)+D(l、m、n)とを比較して
    後者が小なる時にかぎり、この後者の値をTq
    (m)として漸化式値テーブルに記入し、同時に
    状態pをPテーブルにPq(m)として、時刻lを
    LテーブルにLq(m)として単語名nをNテーブ
    ルにNq(m)としてそれぞれ記入するという漸化
    式を計算する手段である第2マツチング部と、上
    記のPテーブル、Lテーブル及びNテーブルを最
    終状態p=f、最終時刻l=1よりさかのぼつて
    参照し、認識結果を定め出力する判定部とより成
    る連続音声認識装置において、Pテーブル、Lテ
    ーブル、Nテーブルに記憶される内容のうち、上
    記状態選択部によつて選択された状態に対応する
    記憶内容を保持するテーブルを別途備え、判定部
    より参照されるように構成され、前記漸化式値テ
    ーブル、Pテーブル、Lテーブル及びNテーブル
    は時刻lとmに関してリング状に番地指定される
    ように構成されることを特徴とする連続音声認識
    装置。
JP56023975A 1981-02-20 1981-02-20 Continuous voice recognizer Granted JPS57138698A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56023975A JPS57138698A (en) 1981-02-20 1981-02-20 Continuous voice recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56023975A JPS57138698A (en) 1981-02-20 1981-02-20 Continuous voice recognizer

Publications (2)

Publication Number Publication Date
JPS57138698A JPS57138698A (en) 1982-08-27
JPS6344240B2 true JPS6344240B2 (ja) 1988-09-02

Family

ID=12125547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56023975A Granted JPS57138698A (en) 1981-02-20 1981-02-20 Continuous voice recognizer

Country Status (1)

Country Link
JP (1) JPS57138698A (ja)

Also Published As

Publication number Publication date
JPS57138698A (en) 1982-08-27

Similar Documents

Publication Publication Date Title
CN110364171B (zh) 一种语音识别方法、语音识别系统及存储介质
US4723290A (en) Speech recognition apparatus
JP3168779B2 (ja) 音声認識装置及び方法
JPS5991500A (ja) 音声分析器
US6662159B2 (en) Recognizing speech data using a state transition model
JPH0159600B2 (ja)
JPS6131477B2 (ja)
JPS6326400B2 (ja)
JP3124277B2 (ja) 音声認識システム
CA1226945A (en) Pattern matching method and apparatus therefor
JPS6360919B2 (ja)
JPH0673080B2 (ja) 連続音声認識方式
CA1167165A (en) Phoneme information extracting apparatus
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JPS6344240B2 (ja)
JP2964881B2 (ja) 音声認識装置
JPH0363080B2 (ja)
EP0138166B1 (en) Pattern matching apparatus
JPS60173595A (ja) 会話応答装置
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JP3818154B2 (ja) 音声認識方法
JPH08221090A (ja) 音声認識方法
RU2101782C1 (ru) Способ распознавания слов в слитной речи и система для его реализации
JPH10143190A (ja) 音声認識装置
JPH04151700A (ja) パターンマッチング制御回路