JP2882791B2 - パターン比較方式 - Google Patents

パターン比較方式

Info

Publication number
JP2882791B2
JP2882791B2 JP62238336A JP23833687A JP2882791B2 JP 2882791 B2 JP2882791 B2 JP 2882791B2 JP 62238336 A JP62238336 A JP 62238336A JP 23833687 A JP23833687 A JP 23833687A JP 2882791 B2 JP2882791 B2 JP 2882791B2
Authority
JP
Japan
Prior art keywords
pattern
voice
component
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62238336A
Other languages
English (en)
Other versions
JPS63226692A (ja
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62238336A priority Critical patent/JP2882791B2/ja
Priority to DE19873733659 priority patent/DE3733659A1/de
Priority to GB8723297A priority patent/GB2196460B/en
Priority to FR878713744A priority patent/FR2604816B1/fr
Publication of JPS63226692A publication Critical patent/JPS63226692A/ja
Priority to US07/464,638 priority patent/US5033089A/en
Priority to GB9017697A priority patent/GB2233137B/en
Application granted granted Critical
Publication of JP2882791B2 publication Critical patent/JP2882791B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、パターン比較方式、より詳細には、パター
ン認識におけるパターン照合に関する。 従来技術 パターン方式の中で最も一般的なものはパターンマッ
チングを利用する方式である。この方式は、あらかじめ
登録された標準パターンと入力された未知入力間の類似
性を求め、未知入力が登録された中のどのパターンに最
も近いかを判定するものである。この方式を現実に適用
する際には周囲のノイズが対象としているパターンの中
に混入してくる問題がある。例えば、音声誤認を考える
なら認識中に周囲で突発的な雑音が発せられた場合、或
いは、発声時の口唇の開閉音が音声について入ってしま
ったような場合、パターン照合部では雑音がついたまま
の状態で標準パターンと比較するため正しい類似性が求
められないことになる。又、雑音に対して過敏であると
上述のような雑音添加が起こり易いが、雑音に対する感
度を下げると雑音を抽出しなくはなるが音声の一部が欠
落するような事態をひき起こすことが多くなる。例え
ば、ストップ(stop)のような語尾が子音単独で発声さ
れやすい単語の場合、最後の/p/が抽出出来ずに欠落す
ることがある。 第7図は、上述のごときストップを照合する場合の一
例を説明するための図で、(a)が標準パターン、
(b)が入力されたパターンであるとする。標準パター
ン(a)は正確に単語全体のパターンを有しているが、
パターン(b)は/p/が欠落しており、パターンの終端
はパターン(a)の/p/がパターン(b)の/o/と対応づ
けて照合される。このため、両者の類似性が小さくなり
誤認識を引き起こすことになってしまう。このような誤
対応は端点フリーの動的計画法を利用することで防ぐこ
ともできるが、冒頭、末尾のパターンが欠落すること
や、雑音が添加することがあり、本来、計算量が多い方
法が更に演算量を増してしまうという欠点がある。 また、パターンマッチング法は、上述のように、あら
かじめ何らかの方法で作られた標準パターンと入力の未
知パターンとを比較し、類似性を求め、未知パターンを
最大類似度を得た標準パターンのカテゴリーに分類する
というものであるが、音声認識に限らずパターンマッチ
ングではいかに正確にパターンを切り出すかが重要であ
る。特に音声を切り出す際に周囲の雑音が一緒に混入し
ないためには、小さい雑音性の音は切り出さないように
閾値を設定しなければならない。 音声区間の検出方法は特に限定するものではないが、
例えば、第8図に示すような音声のエネルギーの大きさ
から周囲のバックグラウンドノイズと分けるものが一般
的である。この方法では音声が入力されるまえにノイズ
レベルのエネルギー閾値Aを決めておき、その閾値より
も大きな音が入力された時点から閾値より下がるまでを
音声区間とするものである。これが音声区間検出の際の
考え方の基本であるが、雑音と区分するため、いろいろ
の改良がなされている。また、特徴量としては特定のも
のを利用する必要はなく、もっとも一般的なパワースペ
クトルやLPC、更にはケプストラムなど、どれを用いて
も良い。この中からパワースペクトルを例にあげると、
入力された音声をバンドパスフィルタ群に印加せしめれ
ば実現出来、バンドパスフィルタの特性をどのように選
ぶかで自由に分析のしかたが変えられる。この音声区間
検出部と特徴量変換部はどちらが音声入力部側に配置さ
れても問題はない。こうすると雑音性の子音のエネルギ
ーが小さいもの、例えば、/F/の音のようなものが音声
の始端又は終端についていると、これが切り出しにくく
なってしまう。第9図(a)には/FAMILY/の標準パター
ン、(b)には入力パターンを示すが、図示のように、
標準パターンでは正確に切り出されているものが、認識
時には同じ音声でありながら/F/の音が欠落してしまう
ことがある。このため、正常な照合ができず、類似度が
小さくなって誤認識をひきおこす原因となってしまう。 目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、一部が欠損したパターン,雑音が添加したパ
ターンを使用しながら正しいパターン比較を行うことの
できるパターン比較方式を提供することを目的としてな
されたものである。 構成 本発明は、上記目的を達成するために、第1の音声パ
ターンとあらかじめ登録されている第2の音声パターン
を比較する際に、音声パターン中の音声生成上の不安定
成分の有無を調べ、第1、第2の音声パターンの少なく
とも一方に上記不安定成分が存在する場合は、各音声パ
ターンを上記不安定成分とそれを除いた安定成分に分離
し、上記安定成分のみを対応させて比較すること、或い
は、第1の音声パターンとあらかじめ辞書に登録されて
いる第2の音声パターンを比較する際に、音声パターン
中の音声生成上の不安定成分の有無を調べ、第1、第2
の音声パターンのいずれにも上記不安定成分が存在する
場合は、各音声パターンを上記不安定成分とそれを除い
た安定成分に分離し、それぞれの成分毎に対応させて比
較することを特徴としたものである。以下、本発明の実
施例に基いて説明する。 第1図は、本発明の一実施例を説明するためのブロッ
ク線図で、図中、1は音声入力部、2はパワー測定部、
3は特徴量変換部、4は無音位置計測部、5は無音位置
(末尾)判定部、6はマーク付加部、7は辞書、8はマ
ーク判定部、9はパターン削除部、10はパターン照合部
で、この実施例は2つのパターンを比較する際にパター
ンの始端又は終端から一定長内にエネルギーの極小が存
在するか否かを調べ、一方のパターンにのみ極小が存在
する場合には、極小を有するパターンの始端又は終端か
ら極小までのパターンをとり除いた後、両者のパターン
を比較するようにしたものである。 まず、音声が入力されて特徴量に変換される過程で、
音声のパワーを測定する。音声の入力部はマイクロフォ
ンで実行できるし、パワー測定は音声帯域だけのバンド
パスフィルタの出力を検波することによって実現でき
る。特徴量は多種知られているがバンドパスフィルタ群
により簡単に抽出できるパワースペクトラムなどいずれ
でも良い。測定されたパワーの大きさから無音区間が音
声のどこに位置しているかを計測する。例えば、この無
音の位置が音声末尾から100ms以内にあるかどうかによ
って特徴量変換されたパターン(特徴パターン)にマー
クを付加する。一方、辞書の中にあるパターンをとり出
し先の特徴パターンと同じマークが付いているかどうか
をチェックし、マークが同じ場合には通常通りパターン
照合部へ入って行く。辞書のパターンの作成法はここで
は特に説明しないが同様のやり方で辞書パターンの末尾
に無音があるかどうかによってあらかじめマークをつけ
ておく。辞書のマークと入力のマークが異なっている場
合は無音を持つ方の無音以後パターン末尾までを削除
し、冒頭から無音までのパターンを用いて照合する。例
えば、第2図に示すごとく、辞書中のパターン(a)が
正常で入力パターンであるパターン(b)の末尾が欠落
している場合を考えると、この場合、パターン(a)は
末尾に無音があるというマークを持ち、パターン(b)
は無音がないというマークになる。そこで辞書パターン
であるパターン(a)の末尾の/p/を削除した状態のパ
ターン(c)を作り、パターン(b)と(c)を対応づ
けして照合する。なお、以上には、音声末尾の欠落につ
いて述べたが、本発明は末尾に限定されるものではな
く、冒頭について同様の事を行なうことも出来る。 第3図は、音声の冒頭に欠落がある場合のパターン比
較の例を示す図で、図中、11は無音位置(冒頭)判定部
で、その他、第1図に示した実施例と同様の作用をする
部分には第1図の場合と同一の参照番号が付してある。
而して、この実施例は、冒頭100ms以内に無音があるか
どうかによって前記実施例と同様に冒頭の部分を削除し
た後、照合することになる。この場合は辞書のパターン
は正常で完全なものと考え、入力された音声の先頭に口
唇開閉によるノイズ或いは突発的に発生したノイズが付
加されたものとなる。 第4図は、その場合の一例を説明するための図で、例
えば、「移動」/ido/と発声した時、パターン(a)の
ごとく冒頭にノイズNがついてしまったような場合、こ
のノイズの後に無音区間が生じるので、無音位置計測部
4及び無音位置(冒頭)判定部11によってこの無音区間
が冒頭100ms以内に生じていることを確認し、無音区間
有のマークを付加する。一方、辞書パターン(b)は無
音がないことからパターン(a)の無音区間より先頭に
近い部分パターン削除部9によって削除され、解除され
た後パターン照合部10で照合される。照合の手段は限定
されるものではないがパターン長を線形伸縮するような
計算量の少ないものが望ましい。この場合、言うまでも
なくパターン(a)の時間長は冒頭の無音以後に変更し
ておく。又、無音区間の計測部4は音声が入力されない
状態で環境ノイズを記録しておき、音声が入力された際
にその音声のレベルがノイズと同等とみなせる時、ここ
を無音区間として無音区間信号を出せば良く、位置計測
部11では音声区間の立上り,立下りを示す信号ラインの
信号と比較して位置を計測すれば良い。 而して、本実施例は音声の冒頭につきやすい口唇開閉
の音はパルス状で幅が短かく音声が発声されるまでに無
音が発生すること、又、音声末尾の落ちやすい音は子音
が単独に発声されたものが多く、母音が一緒に発声され
た場合、母音が大きなエネルギーを持つことから欠落す
ることはないし、更に子音もその前の音に続いて発声さ
れたものは欠落しにくいが、単独つまり前の音と離れて
いる場合に欠落しやすく、従って、必ずその前に無音区
間を有していることに注目したものである。ここでは冒
頭のノイズ添加と末尾の子音欠落を別々に述べたが勿論
それらを同一システム中でやることが望ましい。 なお、以上には、音声のパターン照合を例にとって説
明したが、本発明は、音声にのみ限定されるものでない
ことは容易に理解できよう。 上述のように、上記実施例によると、音声の発声に伴
って避けることのできない口の開閉音,又は周囲の突発
的なノイズがあってもそれをとり除いてパターンの照合
ができるだけでなく、パターンの末尾にあるべき音声が
欠落した場合にも、欠落をみこした照合が可能となり、
このため、パターン照合の精度を向上させることができ
る。 第5図は、本発明の他の実施例を説明するためのブロ
ック線図で、図中、21はマイクロフォン、22は音声区間
検出部、23aは高域フィルタ、23bは低域フィルタ、24は
特徴抽出部、25は乗算器、26は比較器、27は(F)フラ
グ、28は比較器、29は第3レジスタ、30は辞書レジス
タ、31はマーク比較器、32はレジスタ部で、第1レジス
タ32a及び第2レジスタ32bよりなっている。33は類似度
判定部で、この実施例は、/F/のような弱い雑音声の子
音の特徴はそれを周波数分析した時に周波数成分が音声
領域の高域部分に集中していることに注目してなされた
ものである。具体的には、音声を入力する手段と、入力
された音声を信号に変換する手段と、変換された信号中
の周波数の高い成分と低い成分の保有を調べ、高い成分
の方が多い時、その継続時間を求め、照合に際し、一方
にのみ該高周波数成分が多い部分がある時、この部分を
とり除いた後、照合するようにしている。 第5図において、マイクロフォンから入力された音声
は音声区間が検出されて特徴量になおされ、パターンと
して第3のレジスタ29へ貯えられる。それと同時に同じ
信号の高域成分と低域成分が各々フィルターで分析され
て大きさが比較される。高域とは1〜6KHz,低域とは200
〜1KHz程度で高域の方が低域の2倍より大きい場合に、
仮りに/F/フラグと称するフラグを立てるようにする。
又、音声区間検出部からの信号によって音声の始端と終
端信号が比較器28へ送られ音声の始端又は終端に/F/フ
ラグが立っていると第3のレジスタ29にマークをつけ、
/F/の継続長を記録しておく。次に辞書レジスタ30から
標準パターンをとり出し、そのマークが入力と同じかど
うかを調べ、同じ場合はそのまま第1レジスタ32a、第
2レジスタ32bへパターンを格納して照合し類似度を求
める。マークが異る時、例えば標準パターンの先頭に/F
/なしのマークがあり、入力パターンには/F/ありの時
は、入力パターンの先頭の/F/フレームだけずらした時
点を音声の始端とみなし、そこから音声末尾までを第1
レジスタ32aに、標準パターンはそのまま第2レジスタ3
2bへ入れて両者を比較する。これは入力に/F/がなく標
準パターンについていても同様である。従って、音声区
間の切り出しミスがあり標準パターンか入力の先頭又は
末尾の/F/が欠落してもそれを補って正確な照合が出来
るようになる。なお、ここで標準パターンの登録につい
ては特に限定するものではない。 第6図は照合すべき標準パターンと入力パターンの両
方の同じ位置に/F/音がある場合の照合例を説明するた
めのブロック図で、図中、34はレジスタ部で第4のレジ
スタ34a及び第5のレジスタ34bから成っている。33は第
1の類似度判定部、35は第2の類似度判定部、36は加算
部で、その他、第5図に示した実施例と同様の作用をす
る部分には第5図の場合と同一の参照番号が付してあ
る。 今、例として冒頭に/F/がついているとすると、マー
ク比較によって両パターンの冒頭に/F/音がついている
ことがわかり、それぞれの/F/のパターン長もわかる。
そこで入力パターンの先頭から/F/音を指定された長さ
を第1のレジスタ32a、標準パターンのそれを第2のレ
ジスタ32bへ、又、残りの部分を入力パターンは第4の
レジスタ34a、標準パターンは第5のレジスタ34bへ入
れ、レジスタ32aと32b、34aと34bで類似度を求め、その
和によって全体の類似度とする。ただし、ここではみか
け上レジスタ32a,32b,34a,34bに分けたが、通常はレジ
スタ32aと32bがあれば良く、類似度1を求めた後に同じ
レジスタに上記レジスタ34a,34bの内容を入れ類似度1
に次の類似度を加算する。又、類似度1と類似度2を別
々に求めて加算しているが特に加算に限定するものでは
なくレジスタ32aと32bで類似度を計算するための要素を
求め、レジスタ34a,34bで同じく要素を求め、それらの
要素の和から全体の類似度を計算しても良い。 上述のように、これら第5図及び第6図に示した実施
例によるとパターンの一部が欠落しても、正常な照合が
できる。 効果 以上の説明から明らかなように、本発明によると、パ
ターンの一部が欠落していても、又、雑音が添加したパ
ターンを使用しても、正しいパターンの比較を行うこと
のできるパターン比較方式を提供することができる。
【図面の簡単な説明】 第1図は、本発明の一実施例を説明するためのブロック
線図、第2図は、第1図に示した実施例の動作説明をす
るためのパターン照合図、第3図は、本発明の他の実施
例を説明するためのブロック線図、第4図は、第3図に
示した実施例の動作説明をするためのパターン照合図、
第5図及び第6図は、それぞれ本発明の他の実施例を説
明するためのブロック図、第7乃至第9図は、本発明の
技術背景を説明するためのパターン図である。 1……音声入力部、2……パワー測定部、3……特徴量
変換部、4……無音位置計測部、5……無音位置(末
尾)判定部、6……マーク付加部、7……辞書、8……
マーク判定部、9……パターン削除部、10……パターン
照合部、11……無音位置(冒頭)判定部、21……マイク
ロフォン、22……音声区間検出部、23a……高域フィル
タ、23b……低域フィルタ、24……特徴抽出部、25……
乗算器、26……比較器、27……(F)フラグ、28……比
較器、29……第3レジスタ、30……辞書レジスタ、31…
…マーク比較器、32……レジスタ部、33……類似度判定
部、34……レジスタ部、35……類似度判定部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 531 G10L 3/00 571 G10L 5/06

Claims (1)

  1. (57)【特許請求の範囲】 1.第1の音声パターンとあらかじめ辞書に登録されて
    いる第2の音声パターンを比較する際に、音声パターン
    中の音声生成上の不安定成分の有無を調べ、第1、第2
    の音声パターンの少なくとも一方に上記不安定成分が存
    在する場合は、各音声パターンを上記不安定成分とそれ
    を除いた安定成分に分離し、上記安定成分のみを対応さ
    せて比較することを特徴とするパターン比較方式。 2.第1の音声パターンとあらかじめ辞書に登録されて
    いる第2の音声パターンを比較する際に、音声パターン
    中の音声生成上の不安定成分の有無を調べ、第1、第2
    の音声パターンのいずれにも上記不安定成分が存在する
    場合は、各音声パターンを上記不安定成分とそれを除い
    た安定成分に分離し、それぞれの成分毎に対応させて比
    較することを特徴とするパターン比較方式。
JP62238336A 1986-10-03 1987-09-21 パターン比較方式 Expired - Lifetime JP2882791B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP62238336A JP2882791B2 (ja) 1986-10-03 1987-09-21 パターン比較方式
DE19873733659 DE3733659A1 (de) 1986-10-03 1987-10-05 Verfahren zum vergleichen von mustern
GB8723297A GB2196460B (en) 1986-10-03 1987-10-05 Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems
FR878713744A FR2604816B1 (fr) 1986-10-03 1987-10-05 Procede de comparaison de formes dans un systeme de reconnaissance de formes
US07/464,638 US5033089A (en) 1986-10-03 1990-01-05 Methods for forming reference voice patterns, and methods for comparing voice patterns
GB9017697A GB2233137B (en) 1986-10-03 1990-08-13 Methods for forming registered voice patterns for use in pattern comparison in pattern recognition

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP23690186 1986-10-03
JP61-236901 1986-10-03
JP62238336A JP2882791B2 (ja) 1986-10-03 1987-09-21 パターン比較方式

Publications (2)

Publication Number Publication Date
JPS63226692A JPS63226692A (ja) 1988-09-21
JP2882791B2 true JP2882791B2 (ja) 1999-04-12

Family

ID=26532934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62238336A Expired - Lifetime JP2882791B2 (ja) 1986-10-03 1987-09-21 パターン比較方式

Country Status (1)

Country Link
JP (1) JP2882791B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2363236B (en) * 2000-06-05 2002-06-12 Motorola Inc Method and apparatus for mitigating the effect of transmission errors in a distributed speech recognition process and system
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868097A (ja) * 1981-10-20 1983-04-22 日産自動車株式会社 車両用音声認識装置
JPS599080A (ja) * 1982-07-07 1984-01-18 Alps Electric Co Ltd プリンタ

Also Published As

Publication number Publication date
JPS63226692A (ja) 1988-09-21

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
JPS62217295A (ja) 音声認識方式
JPH0222398B2 (ja)
JPS6247320B2 (ja)
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
JP2882791B2 (ja) パターン比較方式
JP2996019B2 (ja) 音声認識装置
JPS6138479B2 (ja)
JP2745562B2 (ja) ノイズ適応形音声認識装置
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP2534241B2 (ja) パタ―ン比較方法
JP3020999B2 (ja) パターン登録方法
JP2882792B2 (ja) 標準パターン作成方式
JP3032551B2 (ja) 音声標準パターン登録方法
JP2666296B2 (ja) 音声認識装置
JP2534240B2 (ja) パタ―ン比較方法
JP2534242B2 (ja) パタ―ン比較方法
JP3031081B2 (ja) 音声認識装置
JP3457578B2 (ja) 音声合成を用いた音声認識装置および音声認識方法
JPS59170894A (ja) 音声区間の切り出し方式
JPS63213899A (ja) 話者照合方式
JP2768938B2 (ja) パターン比較方法
JP3065691B2 (ja) 音声認識装置
JP3049711B2 (ja) 音声処理装置
JP2892004B2 (ja) 単語音声認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080205

Year of fee payment: 9