JPS63226692A - パターン比較方式 - Google Patents
パターン比較方式Info
- Publication number
- JPS63226692A JPS63226692A JP62238336A JP23833687A JPS63226692A JP S63226692 A JPS63226692 A JP S63226692A JP 62238336 A JP62238336 A JP 62238336A JP 23833687 A JP23833687 A JP 23833687A JP S63226692 A JPS63226692 A JP S63226692A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- voice
- section
- register
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 18
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000005259 measurement Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
14分更
本発明は、パターン比較方式、より詳細には、パターン
認識におけるパターン照合に関する。
認識におけるパターン照合に関する。
災米艮亙
パターン方式の中で最も一般的なものはパターンマツチ
ングを利用する方式である。この方式はあらかじめ登録
された標準パターンと入力された未知入力間の類似性を
求め、未知入力が登録された中のどのパターンに最も近
いかを判定するものである。この方式を現実に適用する
際には周囲のノイズが対象としているパターンの中に混
入してくる問題がある6例えば、音声誤認を考えるなら
認識中に周囲で突発的な雑音が発せられた場合、或いは
、発声時の口唇の開閉音が音声について入ってしまった
ような場合、パターン照合部では雑音がついたままの状
態で標準パターンと比較するため正しい類似性が求めら
れないことになる。
ングを利用する方式である。この方式はあらかじめ登録
された標準パターンと入力された未知入力間の類似性を
求め、未知入力が登録された中のどのパターンに最も近
いかを判定するものである。この方式を現実に適用する
際には周囲のノイズが対象としているパターンの中に混
入してくる問題がある6例えば、音声誤認を考えるなら
認識中に周囲で突発的な雑音が発せられた場合、或いは
、発声時の口唇の開閉音が音声について入ってしまった
ような場合、パターン照合部では雑音がついたままの状
態で標準パターンと比較するため正しい類似性が求めら
れないことになる。
又、雑音に対して過敏であると上述のような雑音添加が
起こり易いが、雑音に対する感度を下げると雑音を抽出
しなくはなるが音声の一部が欠落するような事態をひき
起こすことが多くなる。例えば、ストップ(stop)
のような語尾が子音単独で発声されやすい単語の場合5
最後の/ p /が抽出出来ずに欠落することがある。
起こり易いが、雑音に対する感度を下げると雑音を抽出
しなくはなるが音声の一部が欠落するような事態をひき
起こすことが多くなる。例えば、ストップ(stop)
のような語尾が子音単独で発声されやすい単語の場合5
最後の/ p /が抽出出来ずに欠落することがある。
第7図は、上述のごときストップを照合する場合の一例
を説明するための図で、(a)が標準パターン、(b)
が入力されたパターンであるとする。標準パターン(、
)は正確に単語全体のパターンを有しているが、パター
ン(b)は/p/が欠落しており、パターンの終端はパ
ターン(a)の/ p /がパターン(b)の/ o
/と対応づけて照合される。このため、両者の類似性が
小さくなり誤認識を引き起こすことになってしまう、こ
のような誤対応は端点フリーの動的計画法を利用するこ
とで防ぐこともできるが、W頭、末尾のパターンが欠落
することや、雑音が添加することがあり、本来、計算量
が多い方法が更に演算量を増してしまうという欠点があ
る。
を説明するための図で、(a)が標準パターン、(b)
が入力されたパターンであるとする。標準パターン(、
)は正確に単語全体のパターンを有しているが、パター
ン(b)は/p/が欠落しており、パターンの終端はパ
ターン(a)の/ p /がパターン(b)の/ o
/と対応づけて照合される。このため、両者の類似性が
小さくなり誤認識を引き起こすことになってしまう、こ
のような誤対応は端点フリーの動的計画法を利用するこ
とで防ぐこともできるが、W頭、末尾のパターンが欠落
することや、雑音が添加することがあり、本来、計算量
が多い方法が更に演算量を増してしまうという欠点があ
る。
また、パターンマツチング法は、上述のように、あらか
じめ何らかの方法で作られた標準パターンと入力の未知
パターンとを比較し、類似性を求め、未知パターンを最
大類似度を得た標準パターンのカテゴリーに分類すると
いうものであるが、音声認識に限らずパターンマツチン
グではいかに正確にパターンを切り出すかが重要である
。特に音声を切り出す際に周囲の雑音が一緒に混入しな
いためには、小さい雑音性の音は切り出さないように閾
値を設定しなければならない。
じめ何らかの方法で作られた標準パターンと入力の未知
パターンとを比較し、類似性を求め、未知パターンを最
大類似度を得た標準パターンのカテゴリーに分類すると
いうものであるが、音声認識に限らずパターンマツチン
グではいかに正確にパターンを切り出すかが重要である
。特に音声を切り出す際に周囲の雑音が一緒に混入しな
いためには、小さい雑音性の音は切り出さないように閾
値を設定しなければならない。
音声区間の検出方法は特に限定するものではないが9例
えば、第8図に示すような音声のエネルギーの大きさか
ら周囲のバックグラウンドノイズと分けるものが一般的
である。この方法では音声が入力されるまえにノイズレ
ベルのエネルギー閾値Aを決めておき、その閾値よりも
大きな音が入力された時点から閾値より下がるまでを音
声区間とするものである。これが音声区間検出の際の考
え方の基本であるが、雑音と区分するため、いろいろの
改良がなされている。また、特徴量としては特定のもの
を利用する必要はなく、もっとも一般的なパワースペク
トルやLPG、更にはケプストラムなど、どれを用いて
も良い、この中からパワースペクトルを例にあげると、
入力された音声をバンドパスフィルタ群に印加せしめれ
ば実現出来、バンドパスフィルタの特性をどのように選
ぶかで自由に分析のしかたが変えられる。この音声区間
検出部と特徴量変換部はどちらが音声入力部側に配置さ
れても問題はない。こうすると雑音性の子音のエネルギ
ーが小さいもの、例えば。
えば、第8図に示すような音声のエネルギーの大きさか
ら周囲のバックグラウンドノイズと分けるものが一般的
である。この方法では音声が入力されるまえにノイズレ
ベルのエネルギー閾値Aを決めておき、その閾値よりも
大きな音が入力された時点から閾値より下がるまでを音
声区間とするものである。これが音声区間検出の際の考
え方の基本であるが、雑音と区分するため、いろいろの
改良がなされている。また、特徴量としては特定のもの
を利用する必要はなく、もっとも一般的なパワースペク
トルやLPG、更にはケプストラムなど、どれを用いて
も良い、この中からパワースペクトルを例にあげると、
入力された音声をバンドパスフィルタ群に印加せしめれ
ば実現出来、バンドパスフィルタの特性をどのように選
ぶかで自由に分析のしかたが変えられる。この音声区間
検出部と特徴量変換部はどちらが音声入力部側に配置さ
れても問題はない。こうすると雑音性の子音のエネルギ
ーが小さいもの、例えば。
/F/の音のようなものが音声の始端又は終端について
いると、これが切り出しにくくなってしまう。第9図(
a)には/FAMILY/の標準パターン、(b)には
入カバターンを示すが、図示のように、標準パターンで
は正確に切り出されているものが、認識時には同じ音声
でありながら/F/の音が欠落してしまうことがある。
いると、これが切り出しにくくなってしまう。第9図(
a)には/FAMILY/の標準パターン、(b)には
入カバターンを示すが、図示のように、標準パターンで
は正確に切り出されているものが、認識時には同じ音声
でありながら/F/の音が欠落してしまうことがある。
このため、正常な照合ができず、類似度が小さくなって
誤認識をひきおこす原因となってしまう。
誤認識をひきおこす原因となってしまう。
l−一部
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、一部が欠損したパターン、雑音が添加したパター
ンを使用しながら正しいパターン比較を行うことのでき
るパターン比較方式を提供することを目的としてなされ
たものである。
特に、一部が欠損したパターン、雑音が添加したパター
ンを使用しながら正しいパターン比較を行うことのでき
るパターン比較方式を提供することを目的としてなされ
たものである。
璽−一双
本発明は、上記目的を達成するために、第1の音声パタ
ーンとあらかじめ登録されている第2の音声パターンを
比較する際に、音声パターン中の音声生成上の不安定成
分の有無を調べ、第1.第2の音声パターンの少なくと
も一方に上記不安定成分が存在する場合は、各音声パタ
ーンを上記不安定成分とそれを除いた安定成分に分離し
、上記安定成分のみを対応させて比較すること、或いは
。
ーンとあらかじめ登録されている第2の音声パターンを
比較する際に、音声パターン中の音声生成上の不安定成
分の有無を調べ、第1.第2の音声パターンの少なくと
も一方に上記不安定成分が存在する場合は、各音声パタ
ーンを上記不安定成分とそれを除いた安定成分に分離し
、上記安定成分のみを対応させて比較すること、或いは
。
第1の音声パターンとあらかじめ辞書に登録されている
第2の音声パターンを比較する際に、音声パターン中の
音声生成上の不安定成分の有無を調べ、第1、第2の音
声パターンのいずれにも上記不安定成分が存在する場合
は、各音声パターンを上記不安定成分とそれを除いた安
定成分に分離し。
第2の音声パターンを比較する際に、音声パターン中の
音声生成上の不安定成分の有無を調べ、第1、第2の音
声パターンのいずれにも上記不安定成分が存在する場合
は、各音声パターンを上記不安定成分とそれを除いた安
定成分に分離し。
それぞれの成分毎に対応させて比較することを特徴とし
たものである。以下5本発明の実施例に基いて説明する
。
たものである。以下5本発明の実施例に基いて説明する
。
第1図は、本発明の一実施例を説明するためのブロック
線図で、図中、1は音声入力部、2はパワー測定部、3
は特徴量変換部、4は無音位置計測部、5は無音位置(
末尾)判定部、6はマーク付加部、7は辞書、8はマー
ク判定部、9はパターン削除部、10はパターン照合部
で、この実施例は2つのパターンを比較する際にパター
ンの始端又は終端から一定長内にエネルギーの極小が存
在するか否かを調べ、一方のパターンにのみ極小が存在
する場合には、極小を有するパターンの始端又は終端か
ら極小までのパターンをとり除いた後、両者のパターン
を比較するようにしたものである。
線図で、図中、1は音声入力部、2はパワー測定部、3
は特徴量変換部、4は無音位置計測部、5は無音位置(
末尾)判定部、6はマーク付加部、7は辞書、8はマー
ク判定部、9はパターン削除部、10はパターン照合部
で、この実施例は2つのパターンを比較する際にパター
ンの始端又は終端から一定長内にエネルギーの極小が存
在するか否かを調べ、一方のパターンにのみ極小が存在
する場合には、極小を有するパターンの始端又は終端か
ら極小までのパターンをとり除いた後、両者のパターン
を比較するようにしたものである。
まず、音声が入力されて特微量に変換され、ろ過程で、
音声のパワーを測定する。音声、の入力部はマイクロフ
ォンで実行できるし、パワー測定は音声帯域だけのバン
ドパスフィルタの出力を検波することによって実現でき
る。特微量は多種知られているがバンドパスフィルタ群
により簡単に抽出できるパワースペクトラムなどいずれ
でも良い。
音声のパワーを測定する。音声、の入力部はマイクロフ
ォンで実行できるし、パワー測定は音声帯域だけのバン
ドパスフィルタの出力を検波することによって実現でき
る。特微量は多種知られているがバンドパスフィルタ群
により簡単に抽出できるパワースペクトラムなどいずれ
でも良い。
測定されたパワーの大きさから無音区間が音声のどこに
位置しているかを計測する。例えば、この無音の位置が
音声末尾から100+ns以内にあるかどうかによって
特徴量変換されたパターン(特徴パターン)にマークを
付加する。一方、辞書の中にあるパターンをとり出し先
の特徴パターンと同じマークが付いているかどうかをチ
ェックし、マークが同じ場合には通常通りパターン照合
部へ入って行く、辞書のパターンの作成法はここでは特
に説明しないが同様のやり方で辞書パターンの末尾に無
音があるかどうかによってあらかじめマークをつけてお
く。辞書のマークと入力のマークが異なっている場合は
無音を持つ方の無音以後パターン末尾までを削除し、冒
頭から無音までのパターンを用いて照合する0例えば、
第2図に示すごとく、辞書中のパターン(a)が正常で
入カバターンであるパターン(b)の末尾が欠落してい
る場合を考えると、この場合、パターン(a)は末尾に
無音があるというマークを持ち、パターン(b)は無音
がないというマークになる。そこで辞書パターンである
パターン(a)の末尾の/p/を削除した状態のパター
ン(c)を作り。
位置しているかを計測する。例えば、この無音の位置が
音声末尾から100+ns以内にあるかどうかによって
特徴量変換されたパターン(特徴パターン)にマークを
付加する。一方、辞書の中にあるパターンをとり出し先
の特徴パターンと同じマークが付いているかどうかをチ
ェックし、マークが同じ場合には通常通りパターン照合
部へ入って行く、辞書のパターンの作成法はここでは特
に説明しないが同様のやり方で辞書パターンの末尾に無
音があるかどうかによってあらかじめマークをつけてお
く。辞書のマークと入力のマークが異なっている場合は
無音を持つ方の無音以後パターン末尾までを削除し、冒
頭から無音までのパターンを用いて照合する0例えば、
第2図に示すごとく、辞書中のパターン(a)が正常で
入カバターンであるパターン(b)の末尾が欠落してい
る場合を考えると、この場合、パターン(a)は末尾に
無音があるというマークを持ち、パターン(b)は無音
がないというマークになる。そこで辞書パターンである
パターン(a)の末尾の/p/を削除した状態のパター
ン(c)を作り。
パターン(b)と(c)を対応づけして照合する。
なお1以上には、音声末尾の欠落について述べたが、本
発明は末尾に限定されるものではなく、冒頭について同
様の事を行なうことも出来る。
発明は末尾に限定されるものではなく、冒頭について同
様の事を行なうことも出来る。
第3図は、音声の冒頭に欠落がある場合のパターン比較
の例を示す図で1図中、11は無音位置(冒頭)判定部
で、その他、第1図に示した実施例と同様の作用をする
部分には第1図の場合と同一の参照番号が付しである。
の例を示す図で1図中、11は無音位置(冒頭)判定部
で、その他、第1図に示した実施例と同様の作用をする
部分には第1図の場合と同一の参照番号が付しである。
而して、この実施例は、冒頭Looms以内に無音があ
るかどうかによって前記実施例と同様に冒頭の部分を削
除した後、照合することになる。この場合は辞書のパタ
ーンは正常で完全なものと考え、入力された音声の先頭
に口唇開閉によるノイズ或いは突発的に発生したノイズ
が付加されたものとなる。
るかどうかによって前記実施例と同様に冒頭の部分を削
除した後、照合することになる。この場合は辞書のパタ
ーンは正常で完全なものと考え、入力された音声の先頭
に口唇開閉によるノイズ或いは突発的に発生したノイズ
が付加されたものとなる。
第4図は、その場合の一例を説明するための図で、例え
ば、「移動J/ido/と発声した時、パターン(a)
のごとく冒頭にノイズNがついてしまったような場合、
このノイズの後に無音区間が生じるので、無音位置計測
部4及び無音位置(冒頭)判定部11によってこの無音
区間が冒頭100+ns以内に生じていることを確認し
、無音区間有のマークを付加する。一方、辞書パターン
(b)は無音がないことからパターン(a)の無音区間
より先頭に近い部分パターン削除部9によって削除され
、解除された後パターン照合部10で照合される。照合
の手段は限定されるものではないがパターン長を線形伸
縮するような計算量の少ないものが望ましい、この場合
、言うまでもなくパターン(a)の時間長は冒頭の無音
以後に変更しておく。又、無音区間の計測部4は音声が
入力されない状態で環境ノイズを記録しておき、音声が
入力された際にその音声のレベルがノイズと同等とみな
せる時、ここを無音区間として無音区間信号を出せば良
く、位置計測部11では音声区間の立上り、立下りを示
す信号ラインの信号と比較して位置を針側すれば良い。
ば、「移動J/ido/と発声した時、パターン(a)
のごとく冒頭にノイズNがついてしまったような場合、
このノイズの後に無音区間が生じるので、無音位置計測
部4及び無音位置(冒頭)判定部11によってこの無音
区間が冒頭100+ns以内に生じていることを確認し
、無音区間有のマークを付加する。一方、辞書パターン
(b)は無音がないことからパターン(a)の無音区間
より先頭に近い部分パターン削除部9によって削除され
、解除された後パターン照合部10で照合される。照合
の手段は限定されるものではないがパターン長を線形伸
縮するような計算量の少ないものが望ましい、この場合
、言うまでもなくパターン(a)の時間長は冒頭の無音
以後に変更しておく。又、無音区間の計測部4は音声が
入力されない状態で環境ノイズを記録しておき、音声が
入力された際にその音声のレベルがノイズと同等とみな
せる時、ここを無音区間として無音区間信号を出せば良
く、位置計測部11では音声区間の立上り、立下りを示
す信号ラインの信号と比較して位置を針側すれば良い。
而して、本実施例は音声の冒頭につきやすい口唇開閉の
音はパルス状で幅が短かく音声が発声されるまでに無音
が発生すること、又、音声末尾の落ちやすい音は子音が
単独に発声されたものが多く、母音が一緒に発声された
場合、母音が大きなエネルギーを持つことから欠落する
ことはないし、更に子音もその前の音に続いて発声され
たものは欠落しにくいが、単独つまり前の音と離れてい
る場合に欠落しやすく、従って、必ずその前に無音区間
を有していることに注目したものである。ここでは冒頭
のノイズ添加と末尾の子音欠落を別々に述べたが勿論そ
れらを同一システム中でやることが望ましい。
音はパルス状で幅が短かく音声が発声されるまでに無音
が発生すること、又、音声末尾の落ちやすい音は子音が
単独に発声されたものが多く、母音が一緒に発声された
場合、母音が大きなエネルギーを持つことから欠落する
ことはないし、更に子音もその前の音に続いて発声され
たものは欠落しにくいが、単独つまり前の音と離れてい
る場合に欠落しやすく、従って、必ずその前に無音区間
を有していることに注目したものである。ここでは冒頭
のノイズ添加と末尾の子音欠落を別々に述べたが勿論そ
れらを同一システム中でやることが望ましい。
なお1以上には、音声のパターン照合を例にとって説明
したが1本発明は、音声にのみ限定されるものでないこ
とは容易に理解できよう。
したが1本発明は、音声にのみ限定されるものでないこ
とは容易に理解できよう。
上述のように、上記実施例によると、音声の発声に伴っ
て避けることのできない口の開閉前、又は周囲の突発的
なノイズがあってもそれをとり除いてパターンの照合が
できるだけでなく、パターンの末尾にあるべき音声が欠
落した場合にも、欠落をみこした照合が可能となり、こ
のため、パターン照合の精度を向上させることができる
。
て避けることのできない口の開閉前、又は周囲の突発的
なノイズがあってもそれをとり除いてパターンの照合が
できるだけでなく、パターンの末尾にあるべき音声が欠
落した場合にも、欠落をみこした照合が可能となり、こ
のため、パターン照合の精度を向上させることができる
。
第5図は1本発明の他の実施例を説明するためのブロッ
ク線図で、図中、21はマイクロフォン、22は音声区
間検出部、23aは高域フィルタ、23bは低域フィル
タ、24は特徴抽出部、25は乗算器、26は比較器、
27は(F)フラグ。
ク線図で、図中、21はマイクロフォン、22は音声区
間検出部、23aは高域フィルタ、23bは低域フィル
タ、24は特徴抽出部、25は乗算器、26は比較器、
27は(F)フラグ。
28は比較器、29は第3レジスタ、30は辞書レジス
タ、31はマーク比較器、32はレジスタ部で、第ルジ
スタ32a及び第2レジスタ32bよりなっている。3
3は類似度判定部で、この実施例は、/F/のような弱
い雑音声の子音の特徴はそれを周波数分析した時に周波
数成分が音声領域の高域部分に集中していることに注目
してなされたものである。具体的には、音声を入力する
手段と、入力された音声を信号に変換する手段と、変換
された信号中の周波数の高い成分と低い成分の保有を調
べ、高い成分の方が多い時、その継続時間を求め、照合
に際し、一方にのみ該高周波数成分が多い部分がある時
、この部分をとり除いた後、照合するようにしている。
タ、31はマーク比較器、32はレジスタ部で、第ルジ
スタ32a及び第2レジスタ32bよりなっている。3
3は類似度判定部で、この実施例は、/F/のような弱
い雑音声の子音の特徴はそれを周波数分析した時に周波
数成分が音声領域の高域部分に集中していることに注目
してなされたものである。具体的には、音声を入力する
手段と、入力された音声を信号に変換する手段と、変換
された信号中の周波数の高い成分と低い成分の保有を調
べ、高い成分の方が多い時、その継続時間を求め、照合
に際し、一方にのみ該高周波数成分が多い部分がある時
、この部分をとり除いた後、照合するようにしている。
第5図において、マイクロフォンから入力された音声は
音声区間が検出されて特徴量になおされ。
音声区間が検出されて特徴量になおされ。
パターンとして第3のレジスタ29へ貯えられる。
それと同時に同じ信号の高域成分と低域成分が各々フィ
ルターで分析されて大きさが比較される。
ルターで分析されて大きさが比較される。
高域とは1〜6KHz、低域とは200〜IK七程度で
高域の方が低域の2倍より大きい場合に、仮りに/F/
フラグと称するフラグを立てるようにする。又、音声区
間検出部からの信号によって音声の始端と終端信号が比
較器28へ送られ音声の始端又は終端に/F/フラグが
立っていると第3のレジスタ29にマークをつけ、/F
/の継続長を記録しておく0次に辞書レジスタ30から
標準パターンをとり出し、そのマークが入力と同じかど
うかを調べ、同じ場合はそのまま第ルジスタ32a、第
2レジスタ32bヘパターンを格納して照合し類似度を
求める。マークが異る時、例えば標準パターンの先頭に
/F/なしのマークがあり、入カバターンには/F/あ
りの時は、入カバターンの先頭の/F/フレームだけず
らした時点を音声の始端とみなし、そこから音声末尾ま
でを第ルジスタ32aに、標準パターンはそのまま第2
レジスタ32bへ入れて両者を比較する。これは入力に
/F/がなく標準パターンについていても同様である。
高域の方が低域の2倍より大きい場合に、仮りに/F/
フラグと称するフラグを立てるようにする。又、音声区
間検出部からの信号によって音声の始端と終端信号が比
較器28へ送られ音声の始端又は終端に/F/フラグが
立っていると第3のレジスタ29にマークをつけ、/F
/の継続長を記録しておく0次に辞書レジスタ30から
標準パターンをとり出し、そのマークが入力と同じかど
うかを調べ、同じ場合はそのまま第ルジスタ32a、第
2レジスタ32bヘパターンを格納して照合し類似度を
求める。マークが異る時、例えば標準パターンの先頭に
/F/なしのマークがあり、入カバターンには/F/あ
りの時は、入カバターンの先頭の/F/フレームだけず
らした時点を音声の始端とみなし、そこから音声末尾ま
でを第ルジスタ32aに、標準パターンはそのまま第2
レジスタ32bへ入れて両者を比較する。これは入力に
/F/がなく標準パターンについていても同様である。
従って、音声区間の切り出しミスがあり標準パターンか
入力の先頭又は末尾の/F/が欠落してもそれを補って
正確な照合が出来るようになる。なお、ここで標準パタ
ーンの登録については特に限定するものではない。
入力の先頭又は末尾の/F/が欠落してもそれを補って
正確な照合が出来るようになる。なお、ここで標準パタ
ーンの登録については特に限定するものではない。
第6図は照合すべき標準パターンと入カバターンの両方
の同じ位置に/F/音がある場合の照合例を説明するた
めのブロック図で、図中、34はレジスタ部で第4のレ
ジスタ34a及び第5のレジスタ34bから成っている
。33は第1の類似度判定部、35は第2の類似度判定
部、36は加算部で、その他、第5図に示した実施例と
同様の作用をする部分には第5図の場合と同一の参照番
号が付しである。
の同じ位置に/F/音がある場合の照合例を説明するた
めのブロック図で、図中、34はレジスタ部で第4のレ
ジスタ34a及び第5のレジスタ34bから成っている
。33は第1の類似度判定部、35は第2の類似度判定
部、36は加算部で、その他、第5図に示した実施例と
同様の作用をする部分には第5図の場合と同一の参照番
号が付しである。
今、例として冒頭に/F/かついているとすると、マー
ク比較によって両パターンの冒頭に/F/音がついてい
ることがわかり、それぞれの/F/のパターン長もわか
る。そこで入カバターンの先頭から/F/音を指定され
た長さを第1のレジスタ32a、標準パターンのそれを
第2のレジスタ32bへ、又、残りの部分を入カバター
ンは第4のレジスタ34a、標準パターンは第5のレジ
スタ34bへ入れ、レジスタ32aと32b、34aと
34bで類似度を求め、その和によって全体の類似度と
する。ただし、ここではみかけ上レジスタ32a、32
b、34a、34bに分けたが、通常はレジスタ32a
と32bがあれば良く、類似度1を求めた後に同じレジ
スタに上記レジスタ34a、34bの内容を入れ類似度
1に次の類似度を加算する。又、類似度1と類似度2を
別々に求めて加算しているが特に加算に限定するもので
はなくレジスタ32aと32bで類似度を計算するため
の要素を求め、レジスタ34a。
ク比較によって両パターンの冒頭に/F/音がついてい
ることがわかり、それぞれの/F/のパターン長もわか
る。そこで入カバターンの先頭から/F/音を指定され
た長さを第1のレジスタ32a、標準パターンのそれを
第2のレジスタ32bへ、又、残りの部分を入カバター
ンは第4のレジスタ34a、標準パターンは第5のレジ
スタ34bへ入れ、レジスタ32aと32b、34aと
34bで類似度を求め、その和によって全体の類似度と
する。ただし、ここではみかけ上レジスタ32a、32
b、34a、34bに分けたが、通常はレジスタ32a
と32bがあれば良く、類似度1を求めた後に同じレジ
スタに上記レジスタ34a、34bの内容を入れ類似度
1に次の類似度を加算する。又、類似度1と類似度2を
別々に求めて加算しているが特に加算に限定するもので
はなくレジスタ32aと32bで類似度を計算するため
の要素を求め、レジスタ34a。
34bで同じく要素を求め、それらの要素の和から全体
の類似度を計算しても良い。
の類似度を計算しても良い。
上述のように、これら第5図及び第6図に示した実施例
によるとパターンの一部が欠落しても、正常な照合がで
きる。
によるとパターンの一部が欠落しても、正常な照合がで
きる。
効 果
以上の説明から明らかなように、本発明によると、パタ
ーンの一部が欠落していても、又、雑音が添加したパタ
ーンを使用しても、正しいパターンの比較を行うことの
できるパターン比較方式を提供することができる。
ーンの一部が欠落していても、又、雑音が添加したパタ
ーンを使用しても、正しいパターンの比較を行うことの
できるパターン比較方式を提供することができる。
第1図は、本発明の一実施例を説明するためのブロック
線図、第2図は、第1図に示した実施例の動作説明をす
るためのパターン照合図、第3図は1本発明の他の実施
例を説明するためのブロック線図、第4図は、第3図に
示した実施例の動作説明をするためのパターン照合図、
第5図及び第6図は、それぞれ本発明の他の実施例を説
明するためのブロック図、第7乃至第9図は、本発明の
技術背景を説明するためのパターン図である。 1・・・音声入力部、2・・・パワー測定部、3・・・
特徴量変換部、4・・・無音位置計測部、5・・・無音
位置(末尾)判定部、6・・・マーク付加部、7・・・
辞書、8・・・マーク判定部、9・・・パターン削除部
、10・・・パターン照合部、11・・・無音位置(冒
m)判定部、21・・・マイクロフォン、22・・・音
声区間検出部、23a・・・高域フィルタ、23b・・
・低域フィルタ、24・・・特徴抽出部、25・・・乗
算器、26・・・比較器。 27・・・(F)フラグ、28・・・比較器、29・・
・第3レジスタ、30・・・辞書レジスタ、31・・・
マーク比較器、32・・・レジスタ部、33・・・類似
度判定部、34・・・レジスタ部、35・・・類似度判
定部。 第 1z 第 2 図 第 3 図 第 4 図 瀉 5 [F] 第 6 IA 蔦 7 図 富8図 第 9図 Co)匡工p工=■コ (b) 口=ゴロ50
線図、第2図は、第1図に示した実施例の動作説明をす
るためのパターン照合図、第3図は1本発明の他の実施
例を説明するためのブロック線図、第4図は、第3図に
示した実施例の動作説明をするためのパターン照合図、
第5図及び第6図は、それぞれ本発明の他の実施例を説
明するためのブロック図、第7乃至第9図は、本発明の
技術背景を説明するためのパターン図である。 1・・・音声入力部、2・・・パワー測定部、3・・・
特徴量変換部、4・・・無音位置計測部、5・・・無音
位置(末尾)判定部、6・・・マーク付加部、7・・・
辞書、8・・・マーク判定部、9・・・パターン削除部
、10・・・パターン照合部、11・・・無音位置(冒
m)判定部、21・・・マイクロフォン、22・・・音
声区間検出部、23a・・・高域フィルタ、23b・・
・低域フィルタ、24・・・特徴抽出部、25・・・乗
算器、26・・・比較器。 27・・・(F)フラグ、28・・・比較器、29・・
・第3レジスタ、30・・・辞書レジスタ、31・・・
マーク比較器、32・・・レジスタ部、33・・・類似
度判定部、34・・・レジスタ部、35・・・類似度判
定部。 第 1z 第 2 図 第 3 図 第 4 図 瀉 5 [F] 第 6 IA 蔦 7 図 富8図 第 9図 Co)匡工p工=■コ (b) 口=ゴロ50
Claims (2)
- (1)第1の音声パターンとあらかじめ辞書に登録され
ている第2の音声パターンを比較する際に、音声パター
ン中の音声生成上の不安定成分の有無を調べ、第1、第
2の音声パターンの少なくとも一方に上記不安定成分が
存在する場合は、各音声パターンを上記不安定成分とそ
れを除いた安定成分に分離し、上記安定成分のみを対応
させて比較することを特徴とするパターン比較方式。 - (2)第1の音声パターンとあらかじめ辞書に登録され
ている第2の音声パターンを比較する際に、音声パター
ン中の音声生成上の不安定成分の有無を調べ、第1、第
2の音声パターンのいずれにも上記不安定成分が存在す
る場合は、各音声パターンを上記不安定成分とそれを除
いた安定成分に分離し、それぞれの成分毎に対応させて
比較することを特徴とするパターン比較方式。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62238336A JP2882791B2 (ja) | 1986-10-03 | 1987-09-21 | パターン比較方式 |
GB8723297A GB2196460B (en) | 1986-10-03 | 1987-10-05 | Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems |
DE19873733659 DE3733659A1 (de) | 1986-10-03 | 1987-10-05 | Verfahren zum vergleichen von mustern |
FR878713744A FR2604816B1 (fr) | 1986-10-03 | 1987-10-05 | Procede de comparaison de formes dans un systeme de reconnaissance de formes |
US07/464,638 US5033089A (en) | 1986-10-03 | 1990-01-05 | Methods for forming reference voice patterns, and methods for comparing voice patterns |
GB9017697A GB2233137B (en) | 1986-10-03 | 1990-08-13 | Methods for forming registered voice patterns for use in pattern comparison in pattern recognition |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23690186 | 1986-10-03 | ||
JP61-236901 | 1986-10-03 | ||
JP62238336A JP2882791B2 (ja) | 1986-10-03 | 1987-09-21 | パターン比較方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63226692A true JPS63226692A (ja) | 1988-09-21 |
JP2882791B2 JP2882791B2 (ja) | 1999-04-12 |
Family
ID=26532934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62238336A Expired - Lifetime JP2882791B2 (ja) | 1986-10-03 | 1987-09-21 | パターン比較方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2882791B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003536108A (ja) * | 2000-06-05 | 2003-12-02 | モトローラ・インコーポレイテッド | 分散型音声認識プロセス及びシステムにおける伝送エラーの影響を緩和する方法及び装置 |
JP2006251147A (ja) * | 2005-03-09 | 2006-09-21 | Canon Inc | 音声認識方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5868097A (ja) * | 1981-10-20 | 1983-04-22 | 日産自動車株式会社 | 車両用音声認識装置 |
JPS599080A (ja) * | 1982-07-07 | 1984-01-18 | Alps Electric Co Ltd | プリンタ |
-
1987
- 1987-09-21 JP JP62238336A patent/JP2882791B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5868097A (ja) * | 1981-10-20 | 1983-04-22 | 日産自動車株式会社 | 車両用音声認識装置 |
JPS599080A (ja) * | 1982-07-07 | 1984-01-18 | Alps Electric Co Ltd | プリンタ |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003536108A (ja) * | 2000-06-05 | 2003-12-02 | モトローラ・インコーポレイテッド | 分散型音声認識プロセス及びシステムにおける伝送エラーの影響を緩和する方法及び装置 |
JP2006251147A (ja) * | 2005-03-09 | 2006-09-21 | Canon Inc | 音声認識方法 |
JP4667082B2 (ja) * | 2005-03-09 | 2011-04-06 | キヤノン株式会社 | 音声認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2882791B2 (ja) | 1999-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0077194B1 (en) | Speech recognition system | |
JPS63226692A (ja) | パターン比較方式 | |
JPH11231897A (ja) | 音声認識装置及び方法 | |
JP2882792B2 (ja) | 標準パターン作成方式 | |
JPH045198B2 (ja) | ||
ES2297839T3 (es) | Sistema y metodo para el reconocimiento de voz en tiempo real independiente del usuario. | |
JP2666296B2 (ja) | 音声認識装置 | |
JP2968976B2 (ja) | 音声認識装置 | |
JP3049711B2 (ja) | 音声処理装置 | |
JPS6194095A (ja) | 音声認識装置 | |
JP2534241B2 (ja) | パタ―ン比較方法 | |
JPS63213899A (ja) | 話者照合方式 | |
JPS59170894A (ja) | 音声区間の切り出し方式 | |
JPS63278100A (ja) | 音声認識装置 | |
JP3020999B2 (ja) | パターン登録方法 | |
JP3032551B2 (ja) | 音声標準パターン登録方法 | |
JP3125928B2 (ja) | 音声認識装置 | |
JP3065691B2 (ja) | 音声認識装置 | |
JPS61260299A (ja) | 音声認識装置 | |
JP2534240B2 (ja) | パタ―ン比較方法 | |
JPH0316038B2 (ja) | ||
JPS60175098A (ja) | 音声認識装置 | |
KR900016943A (ko) | 음성인식장치 | |
JPS63131197A (ja) | パターン比較方法 | |
JPS60138599A (ja) | 音声区間検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080205 Year of fee payment: 9 |