JPS6070497A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6070497A JPS6070497A JP58181001A JP18100183A JPS6070497A JP S6070497 A JPS6070497 A JP S6070497A JP 58181001 A JP58181001 A JP 58181001A JP 18100183 A JP18100183 A JP 18100183A JP S6070497 A JPS6070497 A JP S6070497A
- Authority
- JP
- Japan
- Prior art keywords
- segment boundary
- input
- detection means
- segment
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、母音と子音のセグメント境界を検出して認識
を行う音声認識装置に関するものである。
を行う音声認識装置に関するものである。
従来例の構成とその問題点
近11ミ、人間−機械系の入力手段として音声が注目を
集めており、各種の音声認識装置が商品化されている。
集めており、各種の音声認識装置が商品化されている。
この様な音声認識装置には単語単位の認識を行うものと
、単音節単位の認識を行うものとがある。単音節認識で
は母音と子音のセグメント境界の検出精度が認識率に大
きな影響を及ぼす。
、単音節単位の認識を行うものとがある。単音節認識で
は母音と子音のセグメント境界の検出精度が認識率に大
きな影響を及ぼす。
また単語認識においては語頭の検出精度が認識率に大き
な影響を及ばすが、語頭の音節のセグメント境界によシ
語頭の位置合わせを効果的に行うことができる。したが
って単音節認識、単語認識のいずれの場合でもセグメン
ト境界を正しく検出することが重要である。
な影響を及ばすが、語頭の音節のセグメント境界によシ
語頭の位置合わせを効果的に行うことができる。したが
って単音節認識、単語認識のいずれの場合でもセグメン
ト境界を正しく検出することが重要である。
以下図面を参照しながら、従来の音声認識装置について
説明を行う。
説明を行う。
第1図は従来の音声認識装置の構成を示すものである。
第1図において、1は音声を電気信号に変換するマイク
ロホン等からなる入力手段、2は入力手段2により変換
された電気信号から母音と子音のセグメント境界を検出
するセグメント境界検出手段、3はセグメント境界検出
手段2によって検出されたセグメント境界を基準にして
前記電気信号から音声の特徴を抽出する特徴抽出手段、
4は特徴抽出手段3によって抽出された音声の特徴を入
カバターンとして一時的に記憶する入カバターン記憶手
段、6は認識させたい音声の特徴を標準パターンとして
予め登録しておく標準パターン記憶手段、6は入カバタ
ーン記憶手段4と標準パターン記憶手段5の内の一方と
特徴抽出手段3と全連結するモード切換スイッチである
。7は入力共ターン記憶手段4に記憶されている人カバ
ターンと標準パターン記憶手段5に既に記憶されている
複数の標準パターンとを比較し入力音声を特定の単語あ
るいは単音節と認識する認識処理手段、8は認識処理手
段子によって認識された単語あるいは単音節に対応する
信号を出力する出力手段である。
ロホン等からなる入力手段、2は入力手段2により変換
された電気信号から母音と子音のセグメント境界を検出
するセグメント境界検出手段、3はセグメント境界検出
手段2によって検出されたセグメント境界を基準にして
前記電気信号から音声の特徴を抽出する特徴抽出手段、
4は特徴抽出手段3によって抽出された音声の特徴を入
カバターンとして一時的に記憶する入カバターン記憶手
段、6は認識させたい音声の特徴を標準パターンとして
予め登録しておく標準パターン記憶手段、6は入カバタ
ーン記憶手段4と標準パターン記憶手段5の内の一方と
特徴抽出手段3と全連結するモード切換スイッチである
。7は入力共ターン記憶手段4に記憶されている人カバ
ターンと標準パターン記憶手段5に既に記憶されている
複数の標準パターンとを比較し入力音声を特定の単語あ
るいは単音節と認識する認識処理手段、8は認識処理手
段子によって認識された単語あるいは単音節に対応する
信号を出力する出力手段である。
以上のように構成された音声認識装置について以下その
動作を説明する。
動作を説明する。
1ず登録モード時には、モード切換スイッチ6を標準パ
ターン記憶手段S側に接続し、認識すべき音声を入力手
段1に入力することにより登録を行う。即ち入力された
音声を入力手段1によって電気信号に変換し、セグメン
ト境界検出手段2によりセグメント境界を検出し、この
セグメント境界を基準にして特徴抽出手段3により音声
の特徴を抽出して、標準パターン記憶手段6にこの音声
の特徴を登録する。
ターン記憶手段S側に接続し、認識すべき音声を入力手
段1に入力することにより登録を行う。即ち入力された
音声を入力手段1によって電気信号に変換し、セグメン
ト境界検出手段2によりセグメント境界を検出し、この
セグメント境界を基準にして特徴抽出手段3により音声
の特徴を抽出して、標準パターン記憶手段6にこの音声
の特徴を登録する。
次に認識モード時には、モード切換スイッチ6を入カバ
ターン記憶手段4側に倒し、予め登録されている音声の
内から所望のものを発声して入力手段1に入力する。入
力された音声は入力手段1により電気信号に変換され、
セグメント境界検出手段2によりセグメント境界が検出
され、このセグメント境界を基準にして特徴抽出手段3
により音声の特徴が抽出される。抽出された音声の特徴
は入カバターン記憶手段4に記憶される。次に認識処理
手段7では、入カバターン記憶手段4に記憶されている
入カバターンと標準パターン記憶手段6に記憶されてい
る複数の標準パターンとが比較され、最も類似している
音声に対応した信号か出力手段8から出力される。
ターン記憶手段4側に倒し、予め登録されている音声の
内から所望のものを発声して入力手段1に入力する。入
力された音声は入力手段1により電気信号に変換され、
セグメント境界検出手段2によりセグメント境界が検出
され、このセグメント境界を基準にして特徴抽出手段3
により音声の特徴が抽出される。抽出された音声の特徴
は入カバターン記憶手段4に記憶される。次に認識処理
手段7では、入カバターン記憶手段4に記憶されている
入カバターンと標準パターン記憶手段6に記憶されてい
る複数の標準パターンとが比較され、最も類似している
音声に対応した信号か出力手段8から出力される。
以上のように構成された音声認識装置では、母音と子音
のセグメント境界の検出精度が認識率に大きな影響を及
ぼす。特に登録モード時にセグメント境界の検出誤りが
生じた場合には、誤ったセグメント境界を基準にして抽
出された特徴が登録されるため認識率が著しく低下する
。したがって種々のセグメント境界検出方法が提案され
ているが、いずれも100%確実にセグメント境界を検
出することは不可能であり、セグメント境界検出誤りに
よる認識率の低下が問題となっている。
のセグメント境界の検出精度が認識率に大きな影響を及
ぼす。特に登録モード時にセグメント境界の検出誤りが
生じた場合には、誤ったセグメント境界を基準にして抽
出された特徴が登録されるため認識率が著しく低下する
。したがって種々のセグメント境界検出方法が提案され
ているが、いずれも100%確実にセグメント境界を検
出することは不可能であり、セグメント境界検出誤りに
よる認識率の低下が問題となっている。
発明の目的
本発明は上述の欠点をN消し、セグメント境界が正しく
検出されているかどうか全判定することにより高い認識
率を得ることのできる音声認識装置を提供することを目
的とする。
検出されているかどうか全判定することにより高い認識
率を得ることのできる音声認識装置を提供することを目
的とする。
発明の構成
本発明は、母音と子音のセグメント境界を検出するセグ
メント境界検出手段と、予め各母音の特徴を記憶する母
音記憶手段と、前記セグメント境界検出手段により母音
部と判定された部分のq′!J′徴と前記(、−J g
記憶手段に記憶されている各母音の特徴とを比較するこ
とによりセグメント境界検出が正しく行われているかど
うかを判定するセグメンテーンヨン誤り検出手段を備え
た音声認識装置であり、セグメント境界検出誤りによる
認R率の低下を解消するものである。
メント境界検出手段と、予め各母音の特徴を記憶する母
音記憶手段と、前記セグメント境界検出手段により母音
部と判定された部分のq′!J′徴と前記(、−J g
記憶手段に記憶されている各母音の特徴とを比較するこ
とによりセグメント境界検出が正しく行われているかど
うかを判定するセグメンテーンヨン誤り検出手段を備え
た音声認識装置であり、セグメント境界検出誤りによる
認R率の低下を解消するものである。
実施例の説明
氏上本発明の一実施例について、図面を参照しながら説
明する。
明する。
第2図は本発明の一実施例における音声認識装置の構成
を示すものである。第2図において、1は入力手段、2
/−iセグメント境界検出手段、3は特徴抽出手段、4
は入カバターン記憶手段、6け標準パターン記憶手段、
6はモード切換スイッチ、7は認識処理手段、8は出力
手段で、以上は第1図の構成と同じものである。第1図
の構成と異なる点は、予め各母音の特徴を記憶しておく
母音記憶手段9と、セグメント境界検出手段2により母
音部と判定された部分の特徴と母音記憶手段9に記憶さ
れている各母音とを比較することによりセグメント境界
が正しく検出されているかどうかを判定するセグメンテ
ーション誤り検出手段10を設けた点である。
を示すものである。第2図において、1は入力手段、2
/−iセグメント境界検出手段、3は特徴抽出手段、4
は入カバターン記憶手段、6け標準パターン記憶手段、
6はモード切換スイッチ、7は認識処理手段、8は出力
手段で、以上は第1図の構成と同じものである。第1図
の構成と異なる点は、予め各母音の特徴を記憶しておく
母音記憶手段9と、セグメント境界検出手段2により母
音部と判定された部分の特徴と母音記憶手段9に記憶さ
れている各母音とを比較することによりセグメント境界
が正しく検出されているかどうかを判定するセグメンテ
ーション誤り検出手段10を設けた点である。
以上のように構成された音声認識装置について、以下そ
の動作を説明する。
の動作を説明する。
登録モード時には、まず単母音ア、イ、つ、工。
オ並びにンを発声し入力手段1に入力することにより母
音記憶手段9に母音の特徴を記憶させる。
音記憶手段9に母音の特徴を記憶させる。
その後認識すべき音声を入力手段1に入力する。
入力手段1は入力音声を電気信号に変換し、セグメント
境界検出手段2はセグメント境界を検出する。セグメン
テーンヨン誤り検出手段1oはセグメント境界検出手段
2によって母音部であると判定された部分の特徴を抽出
し、母音記憶手段9に記憶されている各母音のパターン
と比較することによりセグメント境界が正しく検出され
ているかどうか判定する。
境界検出手段2はセグメント境界を検出する。セグメン
テーンヨン誤り検出手段1oはセグメント境界検出手段
2によって母音部であると判定された部分の特徴を抽出
し、母音記憶手段9に記憶されている各母音のパターン
と比較することによりセグメント境界が正しく検出され
ているかどうか判定する。
この様子を第3図を用いて詳しく述べる。第3図におい
て、11は単音節音声の電力を示している。セグメント
境界検出手段2によりセグメント境界12が検出される
。セグメント境界の前が子音部、後ろが母音部と見なさ
れる。セグメンテーンヨン誤り検出手段10はセグメン
ト境界32より数+71r、Bec後ろの部分13(た
とえば20〜30mBeC後ろ)の特徴を抽出する0こ
の特徴が母音記憶手段9に記憶されている母音・くター
ンのいずれかに類似している場合にセグメント境界が正
しく検出されていると判定し、母音パターンのいずれと
も類似していない場合にセグメント境界が誤って検出さ
れたと判定する。なぜなら第3図のようにセグメント境
界検出が正しく行われている場合には130部分は母音
部であるので、この部分の特徴は母音記憶手段9に記憶
されている母音パターンのいずれかに類似するからであ
る。また第4図に示すようにセグメント境界14が誤っ
て検出された場合、検出されたセグメント境界14の2
0〜30 trr、sec後ろの部分16は真のセグメ
ント境界16より前である。したがって15の部分で抽
出された特徴は子音部のパターンとなっており、母音記
憶手段9に記憶されている母音パターンのいずれとも類
似しない。
て、11は単音節音声の電力を示している。セグメント
境界検出手段2によりセグメント境界12が検出される
。セグメント境界の前が子音部、後ろが母音部と見なさ
れる。セグメンテーンヨン誤り検出手段10はセグメン
ト境界32より数+71r、Bec後ろの部分13(た
とえば20〜30mBeC後ろ)の特徴を抽出する0こ
の特徴が母音記憶手段9に記憶されている母音・くター
ンのいずれかに類似している場合にセグメント境界が正
しく検出されていると判定し、母音パターンのいずれと
も類似していない場合にセグメント境界が誤って検出さ
れたと判定する。なぜなら第3図のようにセグメント境
界検出が正しく行われている場合には130部分は母音
部であるので、この部分の特徴は母音記憶手段9に記憶
されている母音パターンのいずれかに類似するからであ
る。また第4図に示すようにセグメント境界14が誤っ
て検出された場合、検出されたセグメント境界14の2
0〜30 trr、sec後ろの部分16は真のセグメ
ント境界16より前である。したがって15の部分で抽
出された特徴は子音部のパターンとなっており、母音記
憶手段9に記憶されている母音パターンのいずれとも類
似しない。
以上のようにして、セグメ/テ〜/ヨン誤り検出手段1
0によりセグメント境界が正しいと判定された場合には
、特徴抽出手段3によりセグメント境界を基準にして音
声の特徴が抽出され、標準パターン記憶手段6に登録さ
れる。セグメント境界検出が誤りであると判定された場
合にはその音声に対する処理は中止され、再び入力手段
1に音声が入力されるのを待つ。
0によりセグメント境界が正しいと判定された場合には
、特徴抽出手段3によりセグメント境界を基準にして音
声の特徴が抽出され、標準パターン記憶手段6に登録さ
れる。セグメント境界検出が誤りであると判定された場
合にはその音声に対する処理は中止され、再び入力手段
1に音声が入力されるのを待つ。
認Rモード時も同様にセグメンテーンヨン誤り検出手段
1oによってセグメント境界が正しく検出されているか
どうか判定され、正しい場合のみ認識が行われ結果が出
力される。セグメント境界検出を誤った場合は何も出力
されない。
1oによってセグメント境界が正しく検出されているか
どうか判定され、正しい場合のみ認識が行われ結果が出
力される。セグメント境界検出を誤った場合は何も出力
されない。
以上のように本実施例によれば、予め記憶された母音パ
ターンとセグメント境界検出手段により母音部と判定さ
れた部分の特徴とを比較することにより、容易にセグメ
ント境界が正しく検出されているかどうか判定すること
かできる。セグメント境界検出を誤ったまま登録が行わ
れると誤った特徴が登録されるため著しく認識率が低下
するか、セグメント境界検出が正しいものだけを登録す
ることによりこのような認識率の低下を解消することに
なる。また認識時においてもセグメント境界検出を誤る
と誤認識となる場合がほとんどである。
ターンとセグメント境界検出手段により母音部と判定さ
れた部分の特徴とを比較することにより、容易にセグメ
ント境界が正しく検出されているかどうか判定すること
かできる。セグメント境界検出を誤ったまま登録が行わ
れると誤った特徴が登録されるため著しく認識率が低下
するか、セグメント境界検出が正しいものだけを登録す
ることによりこのような認識率の低下を解消することに
なる。また認識時においてもセグメント境界検出を誤る
と誤認識となる場合がほとんどである。
したがってセグメント境界検出を誤ったものに対して認
識処理を行わないことにより、誤った結果が出力される
のを防ぎ、認榊率が上昇するとともに使い勝手のよい認
識装置となる。
識処理を行わないことにより、誤った結果が出力される
のを防ぎ、認榊率が上昇するとともに使い勝手のよい認
識装置となる。
なお、本実施例では登録・認識いずれのモードにおいて
もセグメンテーション誤りの検出を行っているが、セグ
メンテーション誤りによる影響の大きい登録モード時の
みに誤り検出を行ってもよい。またセグメンテーション
誤り検出後の処理忙ついて、本実施例ではその音声に対
する処理を中止し再入力を待つことになっているが、別
の方法で再びセグメント境界を検出し直すことにより正
しいセグメント境界を検出するようにしてもよい。
もセグメンテーション誤りの検出を行っているが、セグ
メンテーション誤りによる影響の大きい登録モード時の
みに誤り検出を行ってもよい。またセグメンテーション
誤り検出後の処理忙ついて、本実施例ではその音声に対
する処理を中止し再入力を待つことになっているが、別
の方法で再びセグメント境界を検出し直すことにより正
しいセグメント境界を検出するようにしてもよい。
発明の効果
以上のように本発明は、母音と子音のセグメント境界を
検出するセグメント境界検出手段と、予め各母音の特徴
を記憶する母音記憶手段と、前記セグメント境界検出手
段により母音部と判定された部分の特徴と母音記憶手段
に記憶している各母音の特徴とを比較することによりセ
グメント境界検出が正しく行われているかどうかを判定
するセグメンテーション誤り検出手段とを設けることに
より、セグメント境界検出誤りによる認識率の低下を解
消することができ、その効果は犬なるものがある0
検出するセグメント境界検出手段と、予め各母音の特徴
を記憶する母音記憶手段と、前記セグメント境界検出手
段により母音部と判定された部分の特徴と母音記憶手段
に記憶している各母音の特徴とを比較することによりセ
グメント境界検出が正しく行われているかどうかを判定
するセグメンテーション誤り検出手段とを設けることに
より、セグメント境界検出誤りによる認識率の低下を解
消することができ、その効果は犬なるものがある0
【図面の簡単な説明】
第1図は従来の音声認識装置のプロ・ツク構成図1、第
2図は本発明の一実施例における音声認識装置のブロッ
ク構成図、第3図は正しいセグメント境界検出が行なわ
れた場合を示す模式図、第4図は誤ったセグメント境界
検出が行なわれた場合を示す模式図である0 1・・・・・入力手段、2・・・・・・セグメント境界
検出手段、3・・・・・特徴抽出手段、4・・・・・・
入カッリーン記憶手段、5・・・・・・標準・々ターン
記憶手段、6・・・・・・モード切換スイッチ、7・・
・・・・認識処理手段、8・・・・・・出力手段、9・
・・・・母音記憶手段、10・・・・・・セグメンテー
ション誤り検出手段。
2図は本発明の一実施例における音声認識装置のブロッ
ク構成図、第3図は正しいセグメント境界検出が行なわ
れた場合を示す模式図、第4図は誤ったセグメント境界
検出が行なわれた場合を示す模式図である0 1・・・・・入力手段、2・・・・・・セグメント境界
検出手段、3・・・・・特徴抽出手段、4・・・・・・
入カッリーン記憶手段、5・・・・・・標準・々ターン
記憶手段、6・・・・・・モード切換スイッチ、7・・
・・・・認識処理手段、8・・・・・・出力手段、9・
・・・・母音記憶手段、10・・・・・・セグメンテー
ション誤り検出手段。
Claims (1)
- 入力音声を電気信号に変換する入力手段と、前記電気信
号から音声の母音と子音のセグメント境界を検出するセ
グメント境界検出手段と、前記セグメント境界検出手段
によシ検出されたセグメント境界が正しいかどうかを検
出するセグメンテーション誤り検出手段と、前記セグメ
ンテーション誤り検出手段によりセグメント境界が正し
いと判定された場合にセグメント境界を基準にして母音
部と子音部の特徴を抽出する特徴抽出手段と、前記特徴
抽出手段によって抽出された音声の特徴を入カバターン
として一時的に記憶する入カバターン記憶手段と、前記
記憶手段とは別に音声の特徴を標準パターンとして予め
登録する標準パターン記憶手段と、前記両パターン記憶
手段に記憶された入カバターンと標準パターンとを比較
し入カバターンを特定の標準パターンと認識する認識処
理手段と、前記認識処理手段によって認識された標準パ
ターンに対応する信号を出力する出力手段とを備え、前
記セグメンテーション誤り検出手段は予め記憶した母音
部の特徴と前記セグメント境界検出手段により母音部と
判定された部分の特徴とを比較することによりセグメン
テーション誤りを検出することを特徴とする音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58181001A JPS6070497A (ja) | 1983-09-28 | 1983-09-28 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58181001A JPS6070497A (ja) | 1983-09-28 | 1983-09-28 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6070497A true JPS6070497A (ja) | 1985-04-22 |
Family
ID=16092994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58181001A Pending JPS6070497A (ja) | 1983-09-28 | 1983-09-28 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6070497A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0522441U (ja) * | 1991-08-30 | 1993-03-23 | 富士通機電株式会社 | 券排出機構 |
-
1983
- 1983-09-28 JP JP58181001A patent/JPS6070497A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0522441U (ja) * | 1991-08-30 | 1993-03-23 | 富士通機電株式会社 | 券排出機構 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
JPH02163819A (ja) | テキスト処理装置 | |
US4769844A (en) | Voice recognition system having a check scheme for registration of reference data | |
JPS6070497A (ja) | 音声認識装置 | |
US6438521B1 (en) | Speech recognition method and apparatus and computer-readable memory | |
JP3039453B2 (ja) | 音声認識装置 | |
JP3031081B2 (ja) | 音声認識装置 | |
JP2547541B2 (ja) | 単音節音声認識装置 | |
JPS59195300A (ja) | 音声認識装置 | |
JPS6048100A (ja) | 音声認識装置 | |
JPS62164097A (ja) | 音声判別方式 | |
JPS61240298A (ja) | 音声認識装置 | |
JPH01155399A (ja) | 単語音声認識方式 | |
JPS5961893A (ja) | 標準パタ−ン更新機能付音声入力装置 | |
JPH07210186A (ja) | 音声登録装置 | |
JPS62111295A (ja) | 音声認識装置 | |
JPS60147797A (ja) | 音声認識装置 | |
JPS61165797A (ja) | 音声認識装置 | |
JPS62227199A (ja) | 単音節音声認識装置 | |
JPS61261798A (ja) | 音声認識装置 | |
JPS62165700A (ja) | 音声判定装置 | |
JPS6147994A (ja) | 音声認識方式 | |
JPS58179899A (ja) | パタ−ン・マツチング装置 | |
JPH079598B2 (ja) | 音声認識装置における標準パラメ−タの修正方法 | |
JPS6334479B2 (ja) |