JPH041918B2 - - Google Patents

Info

Publication number
JPH041918B2
JPH041918B2 JP58022535A JP2253583A JPH041918B2 JP H041918 B2 JPH041918 B2 JP H041918B2 JP 58022535 A JP58022535 A JP 58022535A JP 2253583 A JP2253583 A JP 2253583A JP H041918 B2 JPH041918 B2 JP H041918B2
Authority
JP
Japan
Prior art keywords
recognition
reference pattern
processor
memory
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58022535A
Other languages
English (en)
Other versions
JPS59148098A (ja
Inventor
Masayuki Iida
Kyoshi Tajima
Hiroki Oonishi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP58022535A priority Critical patent/JPS59148098A/ja
Priority to US06/490,302 priority patent/US4720864A/en
Publication of JPS59148098A publication Critical patent/JPS59148098A/ja
Publication of JPH041918B2 publication Critical patent/JPH041918B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (イ) 産業上の利用分野 本発明は音声を認識する音声認識装置に関す
る。
(ロ) 従来技術 音声を認識して何等かの機器を制御せんとした
場合、その殆どが認識動作に該当する応答時間が
常に問題になつて来る。応答時間を早めるには高
速動作の可能なCPUやメモリ或いはその周辺回
路を用いるのが一般に考えられる事であるが、シ
ステム全体が高価になる上に、それ程の高速化が
果されない。
ここで現存する音声認識動作を第1図に示す。
認識すべき音声が入力される音声入力期間T1
の入力音声の終了を意味する無音期間N1、入力
音声の認識を行う認識期間R1を一つのサイクル
とし、この認識サイクルI1,N1,R1に連続して
次の音声認識サイクルI2,N2,R2が始まる。従
つて音声入力期間I、無音期間N、認識期間Rを
直列的に持つ限り、上述した如く認識動作の高速
化には限度がある。
このような点に鑑みて、本発明者等は疑似連続
認識システムと呼ぶ高速化を図つた認識装置を提
案した(特願昭57−74932号)。これは第2図に示
す如く、音声の入力I1,I2,I3……とその入力音
声の認識R1,R2,R3……とを別個のプロセツサ
を用いて並列的に行わしめんとするものである。
ところがこの第2図からも明らかな如く、一般
に音声の入力I1,I2,I3……動作時間と認識R1
R2,R3……動作時間とを比較した場合、認識R1
R2,R3……動作時間の方が長く、結果的に入力
動作を担当するプロセツサ側に待ち時間Tが生じ
てしまいこれが時間的な無駄となる。この現象は
線形マツチングに依る認識の場合は認識時間が短
かかつたのでそれ程問題とならなかつたが、認識
率の向上の為に開発されたDPマツチング法等を
用いて認識する場合、相当な時間が掛り、この待
ち時間Tの無駄が大きくなる。
(ハ) 発明の目的 本発明はこのような新たな問題点に着目して為
されたものであり、認識処理の為の無駄な待ち時
間をなくして認識率の向上を図つた音声認識装置
を提供するものである。
(ニ) 発明の構成 本発明の音声認識装置は、入力動作の為の第1
のプロセツサ部と認識動作の為の第2のプロセツ
サ部とから成り、第1のプロセツサ部にも認識動
作の一部を担当せしめて、双方のプロセツサ部の
動作時間を略等しく設定したものである。
(ホ) 実施例 第3図に本発明装置の具体的な構成を示す。同
図に於いて、Mは予じめ複数の音声の特徴パター
ンを夫々番地付けして格納してある参照パターン
メモリであり、例えば音声帯域を8分割した各周
波数に於ける周波数スペクトル値x1t,x2t,…
…,x8tを成分とするベクトルパラメータxtの時
系列を音声の時間領域に対して16サンプルに正規
化した時系列xr1,xr2,……xr16からなる特徴パ
ターンXrが各音声毎に多数格納されている。1
は音声を電気的な音声信号に変換するマイクロフ
オン、2はこのマイクロフオン1からの音声信号
の特徴を抽出する特徴抽出回路であり、上記参照
パターンメモリMに格納されている多数の特徴パ
ターンXr……と同形式のベクトルパラメータか
らなる特徴パターン、X=(x1,x2,……,x16
が得られる。3はこの特徴抽出回路2で抽出した
入力音声の特徴パターンXを記憶する第1のバツ
フアメモリ、4は第1の認識回路であり、上記第
1のバツフアメモリ3の入力音声の特徴パターン
Xを上記参照パターンメモリMの多数の参照パタ
ーンXr……に基づいて予備的な認識動作を行な
い、多数の参照パターンXr……のうちから入力
音声の特徴パターンXに最も類似した特定のパタ
ーンを選び出すのではなく、比較的類似している
複数個のパターンXr……を遷び出すもので、比
較的その認識時間が短い線形マツチング法等が採
用される。即ち、この線形マツチング法に依れば
入力音声の特徴パターンXの各ベクトルパラメー
タx1,x2,……,x16と参照パターンXrの各ベク
トルパラメータxr1,xr2,……,xr16とを第5図
に示す如く線形に対応せしめ、両パターン間の誤
差として、 D=16n=1 |xr(n)−x(n)| を算出し、この誤差が比較的小さいと判定できる
適数の参照パターンを選出する事になる。5は上
記第1の認識回路4での認識の結果、選び出され
た入力音声の特徴パターンに比較的類似している
参照パターンXr……の参照パターンメモリMに
於ける番地を記憶する第1の番地メモリ、6は上
記音声抽出回路2での特徴抽出動作や抽出した特
徴パターンXのバツフアメモリ3への取り込み、
入力音声の無音の状態から音声の終端を検出する
検出動作、或いは第1の認識回路4での予備認識
動作とかを司どる第1のCPUで、これ等のマイ
クロフオン1〜第1のCPU6で第1のプロセツ
サP1が構成されている。
また10は上記第1のプロセツサP1のバツフ
アメモリ3に貯えられた入力音声の特徴パターン
Xが転送記憶される第2のバツフアメモリ、11
は上記参照パターンメモリM内の参照パターン
Xr……のうち第1のプロセツサP1に於ける予備
比較認識の結果予備的に選択された第1の番地メ
モリ5にある複数の参照パターンXr……の番地
が転送記憶される第2の番地メモリ、12はこの
第2の番地メモリ11で指定された参照パターン
メモリMの参照パターンXr……と第2のバツフ
アメモリ10に貯えられた入力音声の特徴パター
ンXとの本格的な比較認識動作をする第2の認識
回路で、多少その認識動作に時間が掛るが、厳密
な認識動作が行われるDP法(ダイナミツクプロ
グラミング法)を用いて認識動作を行なう。即
ち、このDP法に依れば、入力音声の特徴パター
ンXの各ベクトルパラメータx1,x2,……,x16
と選択された参照パターンXrの各ベクトルパラ
メータXr1,Xr2,……,Xr16とが、第6図に示
す如く、始点Oから終点Eに至る経路Fに従つて
パターンマツチングされる事となる。具体的には
対応する両パラメータxr(i),x(j)との誤差 d(i、j)=|xr(i)−x(j)| ただし、i=1、2、……、16、:j=1、2、
……、16 を順次積算する漸化式 D(i、j)=d(i、j)+minD(i、
j−1) D(i−j、j) D(i−1、j−1) を用いて、j−5<i<j+5で示される非線形
許容範囲で始点Oから終点Eまでの演算処理を実
行し、この終点Eでの値D(16,16)が両パター
ンXr,X間の誤差として算出され、この誤差D
(16,16)が最少となる時の参照パターンXrの音
声が入力音声であると認識される。13はこの第
2の認識回路12での認識動作の結果、特定され
た音声を外部回路に出力する出力ポート、14は
これ等の第2の認識回路12での認識動作や出力
ポート13での出力動作を司どる第2のCPUで、
これ等の第2のバツフアメモリ10〜第2の
CPU14で第2のプロセツサP2が構成されてい
る。
次にこの第3図で示した本発明装置に於ける動
作について第4図を参照しつつ説明する。
先ず、第1のプロセツサP1に於て、マイクロ
フオン1から入力された音声は特徴抽出回路2に
順次取り込まれて行くが、その入力音声I1が途切
れてから一定期間の無音期間N1が続くと第1の
CPU6は入力音声I1の終端を検出してそれまでに
特徴抽出回路2に取り込まれた入力音声の特徴パ
ターンXを該特徴抽出回路2で抽出し、第1のバ
ツフアメモリ3に貯える。一方、第1の認識回路
4は参照パターンメモリMに貯えられている参照
パターンXr……と第1のバツフアメモリ3に貯
えられた特徴パターンXとの予備比較認識SR1
行い、特徴パターンXと比較的類似している参照
パターンXr……のいくつかを選択し、その選択
した参照パターンのパターンメモリMに於ける番
地を第1の番地メモリ5に記憶せしめる。この第
1の記憶回路4に依る予備比較認識SR1動作は先
にも述べた如く、必ずしも厳密な認識動作は必要
としないので、その認識動作が比較的短時間に遂
行される線形マツチング法が採用されている。
尚、この第1のプロセツサP1に於ける全ての動
作の制御は第1のCPU6に依つて司どられる。
この予備認識SR1動作が完了すると、第2のプ
ロセツサP2に於いては、第1の番地メモリ5に
導入された予備認識SR1結果である番地情報が第
2のプロセツサP2の第2の番地メモリ11に転
送され、その番地情報に基づいて、参照パターン
メモリMのうち予備認識SR1で選択した参照パタ
ーンXr……のみを第2の認識回路12に読み出
し、該認識回路12で予め第1のバツフアメモリ
3から第2のバツフアメモリ10に転送されてい
る入力音声の特徴パターンとの本格的な比較認識
MR1が行われる。ここで行なわれる比較認識
MR1動作は、参照パターンXr……と特徴パター
ンXとの厳密な比較認識が遂行され、その為に
DP法が採用されている。先にも述べた如く、こ
の本格的比較試験MR1動作は本来であれば第1
のプロセツサP1に於ける予備認識SR1に比して時
間が掛るのであるが、この認識回路12で特徴パ
ターンXと比較される参照パターンXr……は第
1のプロセツサP1に於て予め選択されてその数
が少なくなつているので、参照パターンメモリM
に貯えられている全ての参照パターンとの比較を
する場合に比してその認識に要する時間は短く、
結果的に第4図に示すように第1のプロセツサ
P1に於ける入力音声取り込み期間Iと予備認識
期間SR並びに無音期間Nの合計期間と略等しく
なる。
一方、これと平行して第1のプロセツサP1
於ては、予備認識SR1が終了すると、次の入力音
声の取り込みI2が開始される。上述したようにこ
の取り込みI2動作とその後の無音期間N2及び予
備認識SR2と先行する入力音声の第2のプロセツ
サP2に於ける本格認識MR1期間と略等しい。従
つて第1のプロセツサP1に於ける2番目の入力
音声の取り込みI2及び予備認識SR2が完了した時
点で第2のプロセツサP2も1番目の入力音声に
対する本格認識動作MR1を完了しており、両プ
ロセツサP1,P2は全くの待ち時間なしに夫々次
の音声に対する所定の動作、即ち第1のプロセツ
サP1は3番目の入力音声の取り込み動作I3を、ま
た第2のプロセツサP2は2番目の入力音声の本
格認識動作MR2に移行する。
(ヘ) 発明の効果 本発明は以上の説明から明らかな如く、入力音
声に対する認識動作を予備認識と本格認識とに2
分すると共に夫々独立して動作する2個のプロセ
ツサを用意し、入力音声の取り込み動作と予備認
識動作とを一方のプロセツサで実行し、本格認識
動作を他方のプロセツサで実行せしめているの
で、両プロセツサでの各々実行時間が略等しくな
り、各プロセツサに於ける待時間を皆無とする事
が出来、結果的に音声認識動作の高速化を果し得
ると共に認識率の向上が図れる。しかも、本発明
装置は上記両プロセツサが単一の参照パターンメ
モリを共用できるので、メモリ構成の簡素化が図
れる。
【図面の簡単な説明】
第1図、第2図は夫々現存する音声認識動作を
示す模式図、第3図は本発明装置の構成を示すブ
ロツク図、第4図は本発明に依る音声認識動作を
示す模式図、第5図及び第6図は本発明の音声認
識動作の具体例を示すパターン対応図であつて、
P1,P2はプロセツサ、Mは参照パターンメモリ、
3,10はバツフアメモリ、4,12は認識回
路、5,11は番地メモリ、6,14はCPU、
を夫々示している。

Claims (1)

  1. 【特許請求の範囲】 1 予じめ音声の特徴パターンを貯えた単一の参
    照パターンメモリを備え、 音声を電気的な音声信号に変換するマイクロフ
    オンと、該音声信号を取り込んでその特徴を抽出
    する特徴抽出回路と、この特徴抽出回路で抽出さ
    れた特徴パターンと上記参照パターンメモリの参
    照パターンとの予備的な比較認識を行なう第1の
    認識回路と、これ等特徴抽出動作並びに予備比較
    認識動作を司どる第1のCPUと、から成る第1
    のプロセツサ部、 及び上記参照パターンメモリのうち上記第1の
    プロセツサ部で予備的に認識された参照パターン
    と特徴パターンとの本格的な比較認識を行なう第
    2の認識回路と、この認識回路での認識結果を外
    部回路に出力するI/Oポートと、この本格比較
    認識動作並びにI/Oポート動作を司どる第2の
    CPUと、から成る第2のプロセツサ部と、 に依つて構成され、上記第1のプロセツサ部での
    音声信号取り込み動作及び予備比較認識動作に要
    する時間と、上記第2のプロセツサ部での本格比
    較認識動作に要する時間とを略等しく設定した事
    を特徴とする音声認識装置。
JP58022535A 1982-05-04 1983-02-14 音声認識装置 Granted JPS59148098A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP58022535A JPS59148098A (ja) 1983-02-14 1983-02-14 音声認識装置
US06/490,302 US4720864A (en) 1982-05-04 1983-05-02 Speech recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58022535A JPS59148098A (ja) 1983-02-14 1983-02-14 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59148098A JPS59148098A (ja) 1984-08-24
JPH041918B2 true JPH041918B2 (ja) 1992-01-14

Family

ID=12085492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58022535A Granted JPS59148098A (ja) 1982-05-04 1983-02-14 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59148098A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0262879A (ja) * 1988-08-26 1990-03-02 Agency Of Ind Science & Technol フォトクロミック化合物及びその製造方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0262879A (ja) * 1988-08-26 1990-03-02 Agency Of Ind Science & Technol フォトクロミック化合物及びその製造方法

Also Published As

Publication number Publication date
JPS59148098A (ja) 1984-08-24

Similar Documents

Publication Publication Date Title
JPH0159600B2 (ja)
JPH041918B2 (ja)
JPS6123560B2 (ja)
JPH0262879B2 (ja)
JPS63179398A (ja) 音声認識方法
JPS6135494A (ja) 音声認識処理装置
JPS6022283A (ja) パタ−ンマツチング装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS6126080B2 (ja)
JP2001318688A (ja) 音声認識装置
JPS61137197A (ja) 連続単語音声認識装置
JPS603031A (ja) 情報処理装置
KR100287891B1 (ko) 테스트 서브루틴 처리장치 및 처리방법
JPH0634234B2 (ja) パターン認識装置
JPH0619705A (ja) パイプライン制御方式
SU1415230A2 (ru) Устройство дл обнаружени границ слов
JPH0323597A (ja) Romランダム書き込み装置
JPH0223400A (ja) Dp演算回路
JPH0535469A (ja) プログラマブル・コントローラ
JPS62217390A (ja) 順変換テ−ブルを用いたパタ−ン整合方式
JPS5998366A (ja) アドレス指定回路
JPH03223924A (ja) 大小比較回路及び最大値・最小値検出回路
JPS60168196A (ja) 音声パタ−ン照合回路
JPH0422277B2 (ja)
JPH0354359B2 (ja)