JPH0421879B2 - - Google Patents

Info

Publication number
JPH0421879B2
JPH0421879B2 JP57063292A JP6329282A JPH0421879B2 JP H0421879 B2 JPH0421879 B2 JP H0421879B2 JP 57063292 A JP57063292 A JP 57063292A JP 6329282 A JP6329282 A JP 6329282A JP H0421879 B2 JPH0421879 B2 JP H0421879B2
Authority
JP
Japan
Prior art keywords
pattern
standard
standard pattern
matching
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57063292A
Other languages
English (en)
Other versions
JPS58179899A (ja
Inventor
Eiji Oohira
Yoshiaki Kitatsume
Yasuo Kurosu
Hitoshi Furuki
Yoshihiro Fukao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Original Assignee
Hitachi Microcomputer System Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Microcomputer System Ltd, Hitachi Ltd filed Critical Hitachi Microcomputer System Ltd
Priority to JP57063292A priority Critical patent/JPS58179899A/ja
Publication of JPS58179899A publication Critical patent/JPS58179899A/ja
Publication of JPH0421879B2 publication Critical patent/JPH0421879B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Memory System (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 発明の対象 本発明は、パターン・マツチング装置に関し、
特に音声認識等における小型化が可能なパター
ン・マツチング装置に関するものである。
従来技術 パターン・マツチングを用いた音声認識装置で
は、第1図に示すように、先ずあらかじめ認識し
たい音声群(例えば、単語群)を発声して標準パ
ターン・メモリ4に登録する。認識装置は、未知
の音声が入力されると(以下、入力パターンと記
す)、あらかじめメモリ4に登録された複数個の
音声(以下、標準パターンと記す)との類似度を
特徴抽出部1と距離計算部2と照合部3で求め、
最も似ている標準パターンの音声を解として出力
する。
入力パターン(音声)の単語の長さは、500m
Sから1Sec程度であり、座席予約の場合、例え
ば駅名の「津」「小野」等の1〜2文字の単語で
500mS、「横浜」「東京」等の4〜5文字の単語
で1Secの長さである。通常、入力パターンは10K
Hz程度すなわち10μSecの間隔でサンプリングし
て取り込まれるが、音声の特徴は10mS程度では
殆んど変らないため、10mSを1フレームとして
この単位ごとに音声の特徴を抽出している。例え
ば、「東京」の入力パターンは、第2図に示すよ
うな音声パワーの起伏を有し、子音は低振幅、母
音は高振幅を示す。この入力パターンを10mS間
隔(a)のフレームで区切り、それらの特徴を特徴抽
出部1から距離計算部2に送出する。また、音声
認識装置には、1単語ずつ区切つて発声した音声
を認識する離散発声認識型のものと、連続的にな
めらかに発声した音声を認識する連続発声認識型
のものとがある。これらのうち連続発声認識型で
は、例えば、「0」、「1」、「2」等の数字の標準
パターンを個別に登録した後、第3図に示すよう
に、連続的に発声された「0」「1」「2」の入力
パターンの特徴を抽出して、類似度を求める必要
がある。連続発声認識装置においては、入力パタ
ーンに対して認識すべき標準パターン群を連続的
にパターン・マツチングさせ、標準パターンのう
ちどのパターンが入力パターンのどの範囲に最も
よく照合するかを決定しなければならない。この
ような連続マツチングでは、標準パターン・メモ
リ4内に格納された各標準パターンを連続的に読
出し、パターン・マツチング部内の距離計算部
2、照合部3により途切れなく処理を行う(特願
昭55−158296号明細書参照)。このために、標準
パターン・メモリ4内には、該当する各標準パタ
ーン群を、切れ目なく連続的に格納する。したが
つて、連続マツチングでは、処理の都合上、各標
準パターンの切れ目を知り、該当する標準パター
ンの始点、終点により制御を分岐する必要があ
る。
従来の標準パターンの切れ目検出方法は、第1
図の点線1b2で示すように、照合部3に入力さ
れるフレーム数をカウンタ5でカウントして、メ
モリ7からの標準パターンの切れ目と一致した時
点で切れ目を検出している。すなわち、特徴抽出
部1では、入力パターンのフレームごとに例え
ば、中心周波数が異なるバンドパス・フイルタを
通して各周波数におけるレベルを求め、1フレー
ム当り16ワードのデータとして距離計算部2に送
出する。その場合、1点の各周波数における大き
さを16ビツトで表すので、1フレーム当り(16ビ
ツト)×(16チヤンネル)の情報で表される。
第1図に示した装置では、まず、メモリ7に、
標準パターン・メモリ4に格納されているすべて
の標準パターン1dのフレーム長を、標準パター
ンが格納されている順序で書き込む。距離計算部
2は、特徴抽出部1からの入力パターン1aの特
徴パラメータの時系列と上記標準パターン1dの
特徴パラメータの時系列とのパターン・マツチン
グをとるため、特徴パラメータ間の類似度を距離
で演算する。すなわち、距離計算部2は、入力パ
ターン1aのデータをX、標準パターン1dのデ
ータをYとして、それぞれ、X、Yの差|X−Y
|を求め、これを前述の16個分加えたものを距離
1b1として照合部3に送る。
一方、距離計算部2から上述の距離1b1が照
合部3に入力される毎に、これと同期して距離ス
トローブ1b2が、カウンタ5に入力されたカウ
ンタ5を+1ずつカウントアツプしていく。この
カウンタ値は比較器6において、前述のメモリ7
中に格納されている、該当する標準パターン1d
のフレーム長1cと比較され、これらが等しくな
つたときに、比較器6から照合部3に対して、標
準パターンの切れ目であることを示す信号が送ら
れる。なお、上述の信号1b1は距離値であり、
1b2は距離用ストローブである。
このように、第1図の音声認識装置では、カウ
ンタ5、比較器6およびメモリ7が必要となる。
単語音声の場合、各標準パターンの長さが100フ
レーム程度で構成されるため、7ビツト/単語の
メモリ7が必要であり、例えば100単語を格納す
る場合には700ビツトのメモリが必要となる。こ
れらのハードウエアの増加は、照合部3を小型化
する際、特にLSI化する場合に望ましくなく、特
に内部に搭載するメモリ7は大きな障害になる。
また、認識装置の初期設定においても、標準パ
ターン・メモリ4への標準パターンと登録と、メ
モリ7への標準パターン・フレーム長の設定とい
う2回の動作が必要となり、システム的にもきわ
めて繁雑となる。
発明の目的 本発明の目的は、これらの欠点を除去するた
め、照合部内にメモリを付加することなく、標準
パターンの切れ目を検出して、マツチング部の小
型化を可能とし、かつ照合部への初期設定を簡単
化できるパターン・マツチング装置を提供するこ
とにある。
発明の総括的説明 上記目的を達成するため、本発明のパターンマ
ツチング装置は、(イ)標準パターンを格納する標準
パターン・メモリと標準パターンと入力パターン
とのパターン・マツチングを行うパターン・マツ
チング部を有するパターン認識装置において、標
準パターン・メモリに、単位標準パターンの単語
の終端フラグを有する制御情報を格納するととも
に、標準パターンの最後にその標準パターン長を
付加し、パターン・マツチング部に制御情報を取
り込むための入力制御情報取込みレジスタを設
け、終端フラグおよび標準パターン等に基づい
て、標準パターンの切り目検出処理、および標準
パターンの始点情報の計算処理を行う如く構成し
たことに特徴がある。また、(ロ)標準パターン・メ
モリに、単位標準パターン毎の終端フラグに加え
て、特定単位標準パターンをマスクするためのマ
スクフラグを格納することにより、パターン・マ
ツチング部は、マスクフラグに基づいて、特定単
位標準パターンを除去した標準パターンを用いて
パターン・マツチングを行う如く構成したことに
も特徴がある。
発明の実施例 以下、本発明の実施例を、図面により説明す
る。
第4図は、本発明の一実施例を示す音声認識装
置のブロツク図であり、第5図は、後述する入力
制御情報の格納位置を示す説明図である。
第4図において、記号1〜4は第1図に示した
と同じ構成要素を示しており、8はマルチプレク
サ、9はレジスタを示している。
以下に説明する実施例においては、標準パター
ンの単語に、以下に詳述する制御情報をフレーム
単位に付加して(第5図参照)、前述の標準パタ
ーン・メモリ4に格納し、標準パターンの読み出
し時に上述の制御情報を同時に読み出して、これ
に基づいて標準パターンの切れ目検出、標準パタ
ーンの部分マスクによう特徴部分のみのマツチン
グ等の処理を行うようにしたものである。
まず、第1の実施例を説明する。
本実施例においては、標準パターンを標準パタ
ーン・メモリ4に登録する際、標準パターンの1
フレーム毎に標準パターンの切れ目を示す情報を
追加する。すなわち、第5図に示す如く、1フレ
ーム(FRM)16ワード(WD)に1ワード
(WD)の情報を付加し、標準パターンの切れ目
や後述するマスク等の情報をここに格納せる。こ
の意味でこの1ワード(WD)の情報を、入力制
御情報と呼ぶことにする。この入力制御情報のう
ちの任意の1ビツト、例えば、最後の1ビツトを
標準パターンの終端フラグとし、このフラグを、
当該フレームが終端フレームのときには“1”、
その他のときには“0”とする。なお、当該フレ
ームが終端フレームのときには、上述の入力制御
情報の最終ビツトを“1”にするとともに、他の
数ビツトを使つて当該標準パターンのフレーム数
を格納する。
特徴抽出部1により求められた1フレームの特
徴ベクトル1a(16WD)が距離計算部2に送ら
れると、距離計算部2は、標準パターン・メモリ
4から1フレーム分の標準パターン1d1を読み
込み、それらの間の距離1b1を計算する。この
とき、距離計算部2は、標準パターン・メモリ4
から上述の標準パターン1d1に付加されている
前記入力制御情報1d2も同時に読み込み、これ
をマルチプレクサ(MXR)8に転送する。すな
わち、17WDの標準パターンの前16WDは距離計
算部2に、最後の1WDはマルチプレクサ8に送
られる。
距離計算部2は、上述の標準パターンの前
16WDが読み込まれると、これと特徴抽出部1か
ら送られる入力パターン(16WD)から、これら
の間の距離1b1を計算し、照合部3に出力す
る。また、距離計算部2は、上述の標準パターン
の前16WDが読み込まれると、距離用ストローブ
信号1b2を照合部3に出力し、照合部3は、こ
れに基づいて、マルチプレクサ8の切替信号1e
を出力する。マルチプレクサ8は、通常は、距離
1b1を照合部3に出力しているが、切替信号1
eにより出力を他方に切り替えて、前記入力制御
情報1d2を出力する。
すなわち、照合部3は、距離計算部2から出力
される距離データ1b1と前記入力制御情報1d
2を、いずれもマルチプレクサ8を通して取り込
むことができ、このうち、入力制御情報1d2に
関しては、これを入力制御情報取り込みレジスタ
9に格納する。照合部3は、入力制御情報取り込
みレジスタ9に格納された入力制御情報の前記終
端フラグを参照することにより、入力された距離
データ1b1が終端フレームのものか否か、すな
わち、標準パターンの切れ目か否かを知ることが
できる。
第4図においては、第1図に示す従来の認識装
置と比較すれば明らかなように、標準パターンの
フレーム長を記憶するメモリ7、距離用ストロー
ブをカウントするカウタ5、カウント値とメモリ
7から読出されたフレーム長を比較する比較器6
がいずれも不要となり、入力制御情報を一時記憶
するレジスタ9と信号を切替えるためのマルチプ
レクサ8を設けるのみでよいため、ハードウエア
量が少なくてすみ、LSI化に有利である。
また、照合部3の入出力端子数も、切替信号1
eを1本だけ追加するのみでよい。なお、マルチ
プレクサ8は、入出力端子数を少なくするために
設けられたもので、マルチプレクサ8を取外して
距離データ1b1と入力制御情報1d2を両方と
も照合部3に入力してもよく、この場合には勿論
入出力端子数がさらに1つ増加することになる。
距離計算部2は、マルチプレクサ8に入力制御
情報1d2を送り出す必要があるが、これは単
に、標準パターン・メモリ4の出力1dの一部を
マルチプレクサ8に接続するのみでよいため、回
路の増加はない。
このように、第4図においては、距離計算部2
および照合部3のハードウエアを殆んど増加する
ことなく、逐次処理が可能な距離計算部2と、標
準パターンの終単検出が可能な照合部3を実現す
ることができる。さらに、標準パターンに関する
初期設定も、標準パターン・メモリ4に対しての
み行えばよいので、認識装置全体として制御を簡
単化できる。
次に、入力制御情報に、マスク・ビツトを付加
することにより、ハードウエア量や入出力端子を
増加することなく、照合部3にマスク処理機能を
付加する場合について説明する。
例えば、「タイプ」という単語を入力したとき、
標準パターンの「タイプ」と「パイプ」ではマツ
チング結果が殆んど違わない場合があり、どちら
の単語であるか判別できないことがある。このと
き、入力音声の語頭が「タ」であるか、「パ」で
あるかを知るために、両標準パターンの「イプ」
の部分をマスクして、この部分がマツチングに影
響しないように「タ」と「パ」を区別するための
処理を行う。
本発明では、この場合にも、入力制御情報にマ
スク・フラグを設け、両標準パターンの「イプ」
の部分にマスク・フラグを立てることによつて、
照合部3はこのマスク・フラグが立つていれば、
入力される距離データを“0”にし、この部分の
距離の影響を除いたマスク処理を行うことができ
る。なお、このマスクフラグは、前述のフレーム
の長さを格納する場合と同様に、入力制御情報の
最終ビツトを除いた他のビツトを使つてセツトす
ることができる。
さらに、入力制御情報として、フレーム長を同
時に含ませることにより、フレームの始点情報の
計算に役立たせることができる。
すなわち、連続マツチングにおける始点情報を
計算で求める方法(先に出願した実願昭55−
66296号明細書参照)では、単語パターンの切れ
目を求めるため、入力パターンの大きさを1フレ
ームずつずらしながら加算し、丁度連続の切れ目
から切れ目まで加算したとき、始めてその値が小
さくなることにより求められるが、前述の如く本
発明では、入力制御情報に標準フレームの長さを
含ませることによつて、そのフレーム長を照合部
3で求めたものに加算すれば次の始点が求められ
る。
なお、本発明は、パターン・マツチング装置に
関するものであれば、音声認識に限らず、数字、
漢字等の文字認識やその他の認識にも適用するこ
とができる。また、照合部3は、連続マツチング
の場合に限定されず、それ以外のマツチング方式
の場合にも適用できる。
発明の効果 以上説明したように、本発明によれば、パター
ン・マツチング部にメモリ等のハードウエアを付
加することなく、切れ目検出処理等の各種の処理
を行うことができ、パターン・マツチング部の照
合部の小型化が可能となるので、LSI化の際にき
わめて有利である。また、標準パターンに関する
初期設定操作に簡易にできるので、パターン認識
システムの制御の繁雑さを減少することができ
る。
【図面の簡単な説明】
第1図は従来のパターン・マツチングを用いた
音声認識装置のブロツク図、第2図は入力音声パ
ターンの音声パワー特性図、第3図は連続発声認
識型の標準パターンの特性図、第4図は本発明の
実施例を示す音声認識装置のブロツク図、第5図
は第4図の入力制御情報の格納位置の説明図であ
る。 1:特徴抽出部、2:距離計算部、3:照合
部、4:標準パターン・メモリ、8:マルチプレ
クサ、9:入力制御情報取込レジスタ。

Claims (1)

  1. 【特許請求の範囲】 1 標準パターンを格納する標準パターン・メモ
    リと前記標準パターンと入力パターンとのパター
    ン・マツチングを行うパターン・マツチング部を
    有するパターン認識装置において、前記標準パタ
    ーン・メモリに、単位標準パターンの単語の終端
    フラグを有する制御情報を格納するとともに、該
    標準パターンの最後にその標準パターン長を付加
    し、前記パターン・マツチング部に前記制御情報
    を取り込むための入力制御情報取込みレジスタを
    設け、前記終端フラグおよび標準パターン長に基
    づいて、前記標準パターンの切り目検出処理、お
    よび該標準パターンの始点情報の計算処理を行う
    如く構成したことを特徴とするパターン・マツチ
    ング装置。 2 前記標準パターン・メモリに、単位標準パタ
    ーン毎の終端フラグに加えて、特定単位標準パタ
    ーンをマスクするためのマスクフラグを格納する
    ことにより、前記パターン・マツチング部は、前
    記マスクフラグに基づいて、前記特定単位標準パ
    ターンを除去した標準パターンを用いてパター
    ン・マツチングを行う如く構成したことを特徴と
    する特許請求の範囲第1項記載のパターン・マツ
    チング装置。
JP57063292A 1982-04-16 1982-04-16 パタ−ン・マツチング装置 Granted JPS58179899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57063292A JPS58179899A (ja) 1982-04-16 1982-04-16 パタ−ン・マツチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57063292A JPS58179899A (ja) 1982-04-16 1982-04-16 パタ−ン・マツチング装置

Publications (2)

Publication Number Publication Date
JPS58179899A JPS58179899A (ja) 1983-10-21
JPH0421879B2 true JPH0421879B2 (ja) 1992-04-14

Family

ID=13225099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57063292A Granted JPS58179899A (ja) 1982-04-16 1982-04-16 パタ−ン・マツチング装置

Country Status (1)

Country Link
JP (1) JPS58179899A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5136136A (ja) * 1974-09-21 1976-03-26 Konishiroku Photo Ind Harogenkaginshashinkankozairyo no shorihoho
JPS5858598A (ja) * 1981-10-02 1983-04-07 株式会社日立製作所 音声認識方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5136136A (ja) * 1974-09-21 1976-03-26 Konishiroku Photo Ind Harogenkaginshashinkankozairyo no shorihoho
JPS5858598A (ja) * 1981-10-02 1983-04-07 株式会社日立製作所 音声認識方式

Also Published As

Publication number Publication date
JPS58179899A (ja) 1983-10-21

Similar Documents

Publication Publication Date Title
JPS60158498A (ja) パターン照合装置
US4868879A (en) Apparatus and method for recognizing speech
JPH0421879B2 (ja)
JPS6332394B2 (ja)
JPS6312312B2 (ja)
JPH067343B2 (ja) パタ−ン識別装置
JPS63179398A (ja) 音声認識方法
JPH02210500A (ja) 標準パターン登録方式
JPS645320B2 (ja)
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS59211098A (ja) 音声認識装置
JPS58102999A (ja) 音声認識装置
JPS6332399B2 (ja)
JPS5876892A (ja) 音声認識装置
JPH044600B2 (ja)
JPS61235899A (ja) 音声認識装置
JPH0619492A (ja) 音声認識装置
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPS58116595A (ja) 単語音声認識装置
JPS61113099A (ja) 音声認識装置における音声区間検出方式
JPS59124388A (ja) 単語音声認識処理方式
JPS5926796A (ja) 音声認識装置
JPS61137197A (ja) 連続単語音声認識装置
JPH0567037B2 (ja)
JPS58160994A (ja) 音声認識装置