JPS62165695A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS62165695A
JPS62165695A JP61006471A JP647186A JPS62165695A JP S62165695 A JPS62165695 A JP S62165695A JP 61006471 A JP61006471 A JP 61006471A JP 647186 A JP647186 A JP 647186A JP S62165695 A JPS62165695 A JP S62165695A
Authority
JP
Japan
Prior art keywords
pattern
distance calculation
standard
window width
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61006471A
Other languages
English (en)
Inventor
深尾 嘉宏
仁 古木
小坂 泰正
吉明 北爪
俊夫 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Microcomputer System Ltd
Hitachi Ltd
Original Assignee
Hitachi Ltd
Hitachi Microcomputer Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Microcomputer Engineering Ltd filed Critical Hitachi Ltd
Priority to JP61006471A priority Critical patent/JPS62165695A/ja
Publication of JPS62165695A publication Critical patent/JPS62165695A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、パターン認lII装置に関し、例えばDP
マツチングによる音声認識装置に利用して有効な技術に
関するものである。
〔従来の技術〕
DPマツチング法による音声認識は、音声パターンの時
間軸の変動を正規化させてマツチングする方法であり、
高い認識性能が得られることから広く使用されている。
同一人が同一単語を普通に発声した場合でも、音声速度
は種々に変動する。
この結果、音声パターンの時間軸に伸縮が生じる。
この伸縮を正規化させるために、一方のパターンの時間
軸を色々に変化させ、他方のパターンに最大近似させる
。すなわち、入力パターンと標準パターンの特徴ベクト
ルの近いものどうしを対応させ、その対応関係(時間正
規化関数)上の特徴ベクl−ル間距離の総和(累積距離
)をいろいろな対応関係の中から最小のものを求めるこ
とによって、認識を行うものである。
上記音声認識技術に関しては、例えば、■オー入社昭和
56年11月30日付「音声情報処理の基礎j斉藤収三
、中田和男著、頁182〜頁215及び1971年音響
学会誌Vo127 、隘9頁483〜頁490がある。
〔発明が解決しようとする問題点〕
上記時間軸の正規化は、整合窓幅の設定によって行われ
る。すなわち、第2図に示すように、ある入力パターン
に対して、予め記憶された複数の標準パターン(同図で
は標準パターン#1と#2が例として示されている)と
の間に、一定の整合窓幅りが設定されることによって行
われる。もしも、入力パターン側に時間の伸縮がなけれ
ば、同図に点線で示したように各フレーム番号に対応し
たもののみについて、標準パターン#1.92等の距離
演算を行えばよいが、実際には入力パターンには時間軸
の伸縮が存在する。そこで、整合窓幅りを5とした場合
には、入力パターンの1つのフレームに対して、標準パ
ターン#1.#2等はそれに対応したフレームの前後(
正、負)2フレ一ム分のデータについても距駈演算の対
象にされる。
上記のように整合窓幅りを5とした場合、入力パターン
の第1と第2フレームに対して、同図に斜線を付したよ
うに、標準パターン側にはデータが存在しないことが生
じる。このため、標準パターン用のメモリにおいては、
ダミー用のデータエリアが必要になってしまう、この場
合、上記整合窓幅は、それぞれの入力パターンに対して
その認識率を高(するために、任意に設定されるから、
上記ダミー用のデータエリアは、整合幅の最大値を考慮
して設ける必要があり、標準パターンの数の増大、言い
換えるならば、認識可能なj1語の数の増大に伴って上
記ダミー用のメモリエリアが無視できない程度に増大し
てしまう。
この発明の目的は、標準パターンの記憶容量を小さくし
た音声認識装置を提供することにある。
この発明の前記ならびにその他の目的と新規な特徴は、
この明細書の記述および添付図面から明らかになるであ
ろう。
〔問題点を解決するための手段〕
本願において開示される発明のうち代表的なものの概要
を簡単に説明すれば、下記の通りである。
すなわち、一定のサンプリング周期に従ってディジタル
化された入力パターンと標準パターンのデータを受けて
両データの距離を求める距離演算部の出力に、その距離
演算の実行におけるフレーム番号と整合窓幅の情報から
、上記整合窓幅に存在しない標準パターンに対する入力
パターンとの距離演算出力を強制的に最大値とする最大
値回路を付加するものである。
〔作 用1 上記した手段によれば、標準パターンが格納されたメモ
リに、ダミーデータエリアを設ける必要がな(な(、こ
れによって標準パターンが記憶されるメモリの記憶容量
を削減ないし効率良く使用できる。
〔実施例〕
第1図には、この発明が通用された音声認、ia装置の
一実施例のブロック図が示されている。
同図の各回路ブロックは、公知の半導体集積回路の製造
技術によって、特に制限されないが、単結晶シリコンの
ような半導体基板上において形成される。
特に制限されないが、入力パターンは、メモリM1に一
旦格納される。このメモリM1の入力パターン信号は、
一定のサンプリング周期に従ったディジタル化された入
力パターン信号IFMO〜7として出力される。標準バ
クーンは、メモリM2に格納される。このメモリM2に
は、認識すべき子!i数の標準パターンが記憶されてい
る。特に制限されないが、認識すべき単語数を大きくす
るため、上記を嘆準パターンが格納されるメモリ242
は、外部メモリとして構成するものであってもよい。
アドレス演算部ADは、後述する距離演算部ALUで必
要な標準パターンデータを上記メモリM2から参照する
ためのアドレス信号を発生させて上記、メモリM2のア
クセスを行うつ 距離計算部A L TJは、上記2つの対応された両パ
ターンIFMO〜7とMDBUSO〜7の距離計算を行
う。この場合、距離計算は、極端に異なるフレーム相互
での対応づけを除くために、一定幅(整合窓幅)に制限
された範囲内についてのみ行われる。このような距離計
算は、全標準パターンについて行われる。このような距
離計算結果は、照合処理部において、その中からり小兄
積距離にされる標準パターンを選び出して、それをに!
識結果として出力させるものである。
上記距離計算において、例えば、第2図に示すように、
整合窓IIが5の場合、入力パターンの第1及び第2フ
レームにおいて、標準パターン#1、#2’tfの第1
ないし第3フレームの他、斜線を付した計算上のみに存
在する架空のデータが必要になってしまう。具体的には
、入力パターンの第1フレームに対する距離計算には、
標準パターン#1.#2の0.−1フレームのように実
際上は存在しないデータが必要になってしまう。
そこで、この実施例では、次のような最大値回路が設げ
られる。rなわち、Li7回路は、入力パターンのフレ
ーム情11Ftと整合窓幅りを受けて、F i −(L
 −1) /2の減算を行う。例えば、上記整合窓幅T
、−5で、フレームFiが1のとき、Xは、−1のよう
に負の値を持つ。また、Fiが2のとき、0のような値
を持つ。上記のように減算結果が負又は0の値を持つ場
合において、標準パターン#1,62等に対して規則的
に発生されるフ【/−ム情報1〜5を加算して、それが
負ないし0のとき、言い換えるならば、標準パターン側
から見て0.−1のような実存しないフレームが発生し
たとき、判定回路は、上記距離計算部ALUの出力信号
5DRO−3DR9に対応してそれぞれ設けられたナン
ド(NAND)ゲート回路Gにロウレベル(論理″0”
)を供給する。これによって、ナントゲート回路Gの出
力信号は、上記距離計算部ALUの出力信号(距離計算
結果5DRO〜5DR9)に無関係に全ビットが論理“
i”にされる。これによって、照合処理部に供給される
距離計算出力信号は、全ビットが論理“i″にされるこ
とによって最大値にされる。したがって、上記標準パタ
ーン#1.92等における−1.0のように負のフレー
ムに対応された入力パターンとの距離計算出力が大きな
距離値として出力されるから、照合処理において、上記
標準パターンの負のフレーム対応された入力パターンと
の間て綴小思積距離が求められることがない。
これによって、標準パターンが格納されるメモリM2に
おいて、各捩準パターンに対応して上記負のフl/−ム
に相当するデータエリアを設ける必要がなく、そのダミ
ーデータを作成する必要もない。これによって、メモリ
M2のメモリ容量を大幅に削減できるものとなる。
上記した実施例から得、られる作用効果は、以下の通り
である。すなわら、 (1)標準パターンにおいて、整合窓fHの設定に伴い
存在しないフレームでのデータと入力パターンの距離計
算時に、その計算値を最大にさせる回路を設けることに
よって、標準パターンを格納させるメモリにダミーのデ
ータエリアを設ける必要がな(なる。これによって、標
準パターンを格納すべきメモリ容量の大幅な削減を図る
ことができるという効果が得られる。
(2)フレーム情報と整合窓幅情報から、標準パターン
側において存在しないフレームに対する距離計算を識別
し、距離計算部の出力に設けられた論理ゲート回路を制
御するという掻めて簡単な回路の付加のみよって、上記
標準パターンメモリのメモリ容量を削減を図ることがで
きるという効果が得られる。
(3)上記(1)により、距濯計算がその整合窓幅に従
った一定の操り返し処理ができるから、距離計算結果の
画一化を維持することができるとい・う効果が得られる
以上本発明者によってなされた発明を実施例に基づき具
体的に説明したが、この発明は上記実施例に限定される
ものではなく、その要旨を逸脱しない範囲で種々変更可
能であることはいうまでもない。例えば、距離計算部の
出力イε号を最大値にさせる回路は、オア(OR)ゲー
ト回路を用いて、上記判定回路の出力1言号を論理“i
”にして、最大値を形成するものであってもよい。また
、各回路ブロックの具体的構成は、種々の実施形態を探
ることができるものである。
以上の説明では主として本発明者によってなされた発明
をその背景となった利用分野である音声認R’装置に適
用した場合について説明したが、そにれ限定されるもの
ではなく、例えば文字等の各種パターン認識も上記類似
の構成によって実現できるものである。
〔発明の効果〕
本願において開示される発明のうちの代表的なものによ
って得られる効果をPlに説明すれば下記の通りである
。すなわち、フレーム情報と整合窓幅Wj報から、標準
パターン側において存在しないフレームに対する距離計
算を識別し、距離計算部の出力を最大にさせる回路をす
ることにより、上記標準バクーンメモリのメモ°J容屋
を削減ないし効率的に使うことができる。
【図面の簡単な説明】
第1図は、この発明の一実施例を示すブロンク図、 第2図は、標準パターンと入力パターンの距離計算処理
を説明するための相関図である。 Ml・・入力パターンメモリ、M2・・標準パターンメ
モリ、ALU・・距離演算部、AD・・アドレス発生部 代理人弁理士 小川 勝那′ \。

Claims (1)

  1. 【特許請求の範囲】 1、一定のサンプリング周期に従ってディジタル化され
    た入力パターンと標準パターンのデータを受けて両デー
    タの距離を求める距離演算部と、上記距離演算結果の最
    小値を求める照合部と、上記距離演算の実行フレーム番
    号と整合窓幅の情報から、上記整合窓幅に存在しない標
    準パターンと入力パターンに対応した距離演算出力を強
    制的に最大値とする最大値回路とを含むことを特徴とす
    るパターン認識装置。 2、上記最大値回路は、整合窓幅と入力パターンのフレ
    ーム情報から求められる標準パターンのフレーム情報が
    負であることを検出する判定回路と、この判定出力によ
    り、上記距離演算部の出力信号を強制的に論理“i”と
    する論理ゲート回路からなることを特徴とする特許請求
    の範囲第1項記載のパターン認識装置。
JP61006471A 1986-01-17 1986-01-17 パタ−ン認識装置 Pending JPS62165695A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61006471A JPS62165695A (ja) 1986-01-17 1986-01-17 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61006471A JPS62165695A (ja) 1986-01-17 1986-01-17 パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS62165695A true JPS62165695A (ja) 1987-07-22

Family

ID=11639368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61006471A Pending JPS62165695A (ja) 1986-01-17 1986-01-17 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS62165695A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161782A (ja) * 1983-03-04 1984-09-12 Matsushita Electric Ind Co Ltd パタ−ン・マツチング方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161782A (ja) * 1983-03-04 1984-09-12 Matsushita Electric Ind Co Ltd パタ−ン・マツチング方法

Similar Documents

Publication Publication Date Title
CA1180812A (en) Method and apparatus for speech recognition and reproduction
US5073939A (en) Dynamic time warping (DTW) apparatus for use in speech recognition systems
EP0103245B1 (en) Pattern matching apparatus
JP2013531275A (ja) 発話音声処理
JPS60211498A (ja) 連続音声認識装置
JPS62165695A (ja) パタ−ン認識装置
US5974381A (en) Method and system for efficiently avoiding partial matching in voice recognition
US4790017A (en) Speech processing feature generation arrangement
US4872201A (en) Pattern matching apparatus employing compensation for pattern deformation
JPH0552517B2 (ja)
JPS6332596A (ja) 音声認識装置
JP3052520B2 (ja) パターン分類装置
JPS58114176A (ja) 図形認識装置
JPS6312000A (ja) 音声認識装置
Wong et al. Reducing computational complexity of dynamic time warping-based isolated word recognition with time scale modification
JPS58176698A (ja) パターンマッチング装置
JPS5972498A (ja) パタ−ン比較装置
JPS62161200A (ja) 連続音声認識装置
Verhasselt et al. Acoustic-phonetic decoding using a transition controlled neural net
JPS61121090A (ja) 音声認識装置
JPS6039696A (ja) 音声認識方法
JPS61281298A (ja) 音声認識装置
JPS59170893A (ja) 単語音声認識方法
Yun et al. A Segmental-feature HMM using parametric trajectory model
JPS6225796A (ja) 音声認識装置