JPS62286099A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPS62286099A JPS62286099A JP12980186A JP12980186A JPS62286099A JP S62286099 A JPS62286099 A JP S62286099A JP 12980186 A JP12980186 A JP 12980186A JP 12980186 A JP12980186 A JP 12980186A JP S62286099 A JPS62286099 A JP S62286099A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- standard
- section
- pattern
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
3、発明の詳細な説明
[産業上の利用分野]
本発明は、音声タイプライタなどに好適な音声認識方式
に関するものである。
に関するものである。
[従来技術及び問題点]
従来、音声認識の最も代表的な手法として、パタンマツ
チング法が知られている。この手法は、入力音声の特徴
パラメータを抽出し、これと予めメモリに登録されてい
る多数の標準音声の特徴パラメータとを個々に比較し、
最も類似している特徴パラメータの標準音声を認識結果
とするものである。しかし、認識率は必ずしも実用に適
う程には高くなく、誤認識があった時に救うすべもなか
った。一方、認識率を高めるべく、例えば、特開昭60
−19199号公報に示されるように特徴パラメータ抽
出による判別手段に加え、入力音声の原波形パワーパタ
ンと、標準音声の原波形パワーパタンとのパタンマツチ
ングを併用することも知られているが、これによれば、
標準パタンの登録数が増えるほどに音声認識のための比
較演算処理に時間が掛かり、応答が遅れる欠点がある。
チング法が知られている。この手法は、入力音声の特徴
パラメータを抽出し、これと予めメモリに登録されてい
る多数の標準音声の特徴パラメータとを個々に比較し、
最も類似している特徴パラメータの標準音声を認識結果
とするものである。しかし、認識率は必ずしも実用に適
う程には高くなく、誤認識があった時に救うすべもなか
った。一方、認識率を高めるべく、例えば、特開昭60
−19199号公報に示されるように特徴パラメータ抽
出による判別手段に加え、入力音声の原波形パワーパタ
ンと、標準音声の原波形パワーパタンとのパタンマツチ
ングを併用することも知られているが、これによれば、
標準パタンの登録数が増えるほどに音声認識のための比
較演算処理に時間が掛かり、応答が遅れる欠点がある。
[発明の目的]
本発明はこのような従来欠点に鑑みて為されたもので、
その目的とするところは音声認識率の向上を図ると同時
に迅速な応答を達成することにある。
その目的とするところは音声認識率の向上を図ると同時
に迅速な応答を達成することにある。
し問題点を解決するための手段]
この目的を達成するため本発明は、音声の特徴パラメー
タ抽出により入力未知パタンと、予め登録される多数の
標準パタンとの類似度を算出し、この算出値から類似度
の高い標準パタン候補を複数選出し、この選出した複数
の標準パタン候補について音声の原波形パワー、その1
次差分、零交差数の1又は複数に基づく類似度を算出す
ることにより、入力未知パタンに最も類似した標準パタ
ンを選定するものである。
タ抽出により入力未知パタンと、予め登録される多数の
標準パタンとの類似度を算出し、この算出値から類似度
の高い標準パタン候補を複数選出し、この選出した複数
の標準パタン候補について音声の原波形パワー、その1
次差分、零交差数の1又は複数に基づく類似度を算出す
ることにより、入力未知パタンに最も類似した標準パタ
ンを選定するものである。
[実施例]
以下に本発明の一実施例を図面と共に説明する。
第1図は音声認識装置をブロック図で示したもので1は
音声入力部、2はフィルタ部、3は標本化部、4は音声
検出部、5は分析計算部、6は標準パタンメモリ部、7
はマツチング部、8は認識結果出力部、9は標準パタン
メモリ部6あるいはマツチング部7と分析計算部5とを
接続するモード切換スイッチである。しかして、前記分
析計算部5には音声入力部1に入力される音声の特徴パ
ラメータを抽出する手法の1つである線形予測係数(L
PC係数)の計算と、ユークリッド距離計算に必要なデ
ータである音声信号の原波形パワー、その−次差分、及
び零交差数の計算とを行なう演算処理回路が組み込まれ
ている。
音声入力部、2はフィルタ部、3は標本化部、4は音声
検出部、5は分析計算部、6は標準パタンメモリ部、7
はマツチング部、8は認識結果出力部、9は標準パタン
メモリ部6あるいはマツチング部7と分析計算部5とを
接続するモード切換スイッチである。しかして、前記分
析計算部5には音声入力部1に入力される音声の特徴パ
ラメータを抽出する手法の1つである線形予測係数(L
PC係数)の計算と、ユークリッド距離計算に必要なデ
ータである音声信号の原波形パワー、その−次差分、及
び零交差数の計算とを行なう演算処理回路が組み込まれ
ている。
次に音声認識のための操作手順を説明すると、先ず、標
準音声の特徴パラメータを予め標準パタンメモリ部6に
登録するが、このためにはモード切換スイッチ9を標準
パタンメモリ部6側に接続した後、音声を音声入力部1
に入力する。そうするとその音声入力部に取り込まれた
音声信号はフィルタ部2で濾波されたのち、標本化部3
で標本化され、音声検出部4でその当声信号の開始時点
を検知すると同時にその標本化データが分析計算部5へ
送り込まれる。そして該分析計算部5で前述のLPC係
数、原波形パワー、その−次差分、零交差数が夫々計算
され、その計算結果が標準パタンメモリ部6に貯えられ
る。このようにして多数の標準パタンを予め登録してお
き、次に音声認識を行なわせるには、モード切換スイッ
チ9の接続をマツチング部7側へ切り替え、認識させる
べき音声を音声入力部1へ入力する。そうすると、その
音声信号が標準パタンの登録のときと同じようにフィル
タ部2、標本化部3、音声検出部4を介して分析計算部
5へ送り込まれ、該分析計算部5でLPC係数、原波形
パワー、その−次差分、零交差数が夫々計算される。そ
してその計算結果がマツチング部7へ送り込まれるが、
該マツチング部7では、第2図にそのフローチャートを
示したように、最初に認識させるべき入力未知パタンと
、前述の予め登録される標準パタンとてLPG係数の比
較からWL R(Wetghted ! 1keiih
oodRatio)距離(特徴パラメータの類似度)を
算出し、この算出値から類似度の高い標準パタン候補を
複数(例えば、第1候補〜第3候補)選出する。
準音声の特徴パラメータを予め標準パタンメモリ部6に
登録するが、このためにはモード切換スイッチ9を標準
パタンメモリ部6側に接続した後、音声を音声入力部1
に入力する。そうするとその音声入力部に取り込まれた
音声信号はフィルタ部2で濾波されたのち、標本化部3
で標本化され、音声検出部4でその当声信号の開始時点
を検知すると同時にその標本化データが分析計算部5へ
送り込まれる。そして該分析計算部5で前述のLPC係
数、原波形パワー、その−次差分、零交差数が夫々計算
され、その計算結果が標準パタンメモリ部6に貯えられ
る。このようにして多数の標準パタンを予め登録してお
き、次に音声認識を行なわせるには、モード切換スイッ
チ9の接続をマツチング部7側へ切り替え、認識させる
べき音声を音声入力部1へ入力する。そうすると、その
音声信号が標準パタンの登録のときと同じようにフィル
タ部2、標本化部3、音声検出部4を介して分析計算部
5へ送り込まれ、該分析計算部5でLPC係数、原波形
パワー、その−次差分、零交差数が夫々計算される。そ
してその計算結果がマツチング部7へ送り込まれるが、
該マツチング部7では、第2図にそのフローチャートを
示したように、最初に認識させるべき入力未知パタンと
、前述の予め登録される標準パタンとてLPG係数の比
較からWL R(Wetghted ! 1keiih
oodRatio)距離(特徴パラメータの類似度)を
算出し、この算出値から類似度の高い標準パタン候補を
複数(例えば、第1候補〜第3候補)選出する。
そして次にこの選出した複数の標準パタン候補について
、前述の原波形パワー、その1次差分、零交差数を用い
たユークリッド距離(類似度)の計算を次式により行な
い、この算出値を用いて前述の各標準パタン候補のWL
R距離算出値に重み付けを行ない、その計算値の最も小
さい標準パタンを選定し、これを認識結果とする。
、前述の原波形パワー、その1次差分、零交差数を用い
たユークリッド距離(類似度)の計算を次式により行な
い、この算出値を用いて前述の各標準パタン候補のWL
R距離算出値に重み付けを行ない、その計算値の最も小
さい標準パタンを選定し、これを認識結果とする。
ここに
Dニュークリッド距離
Po:標準音声の原波形パワー
Pl;未知入力音声の原波形パワー
Do;標準音声原波形パワーの一次差分D1:未知入力
音声原波形パワーの一次差分Zo:標準音声の零交差数 Z]:未知入力音声の零交差数 なお、ユークリッド距離の計算は常識のように原波形パ
ワー、その−次差分、あるいは零交差数の3つの項を全
て考慮するのが最適であるが、必要に応じてその中の1
つ、又は2つの項を省略してもよい。
音声原波形パワーの一次差分Zo:標準音声の零交差数 Z]:未知入力音声の零交差数 なお、ユークリッド距離の計算は常識のように原波形パ
ワー、その−次差分、あるいは零交差数の3つの項を全
て考慮するのが最適であるが、必要に応じてその中の1
つ、又は2つの項を省略してもよい。
この結果を第3図に示すが、本発明の音声認識方式によ
れば、従来の特徴パラメータ抽出のみによる類似度算出
方式よりも有意差が認められる程度に格段に認識率が向
上した。また、従来技術として示した特開昭60−19
199号公報のように、登録される全ての標準パタンに
ついて特徴パラメータ抽出と、原波形パワーのパタンマ
ツヂングを行なうものに比較して応答時間が定性的では
あるかかなり短縮された。
れば、従来の特徴パラメータ抽出のみによる類似度算出
方式よりも有意差が認められる程度に格段に認識率が向
上した。また、従来技術として示した特開昭60−19
199号公報のように、登録される全ての標準パタンに
ついて特徴パラメータ抽出と、原波形パワーのパタンマ
ツヂングを行なうものに比較して応答時間が定性的では
あるかかなり短縮された。
[発明の効果コ
以上説明したように本発明によれば、音声の認識率の向
上が図れる。また、特徴パラメータ抽出により類似度の
高い標準パタン候補を多数登録の標準パタンの中から絞
り、細手法による類似度計算をこの標準パタン候補に限
り行なうものであるから、音声認識に応答時間がそれ程
長くなることもなく、産業上の利用価値は極めて高い。
上が図れる。また、特徴パラメータ抽出により類似度の
高い標準パタン候補を多数登録の標準パタンの中から絞
り、細手法による類似度計算をこの標準パタン候補に限
り行なうものであるから、音声認識に応答時間がそれ程
長くなることもなく、産業上の利用価値は極めて高い。
図面は本発明の一実施例を示したもので、第1図は音声
認識装置のブロック図、第2図は要部を説明するフロー
ヂャート、第3図は音声認識率の比較データである。 5・・分析計算部、6・・標準パタンメモリ部、7・・
マツチング部。 第1図 第2図
認識装置のブロック図、第2図は要部を説明するフロー
ヂャート、第3図は音声認識率の比較データである。 5・・分析計算部、6・・標準パタンメモリ部、7・・
マツチング部。 第1図 第2図
Claims (1)
- 音声の特徴パラメータ抽出により入力未知パタンと、予
め登録される多数の標準パタンとの類似度を算出し、こ
の算出値から類似度の高い標準パタン候補を複数選出し
、この選出した複数の標準パタン候補について音声の原
波形パワー、その1次差分、零交差数の1又は複数に基
づく類似度を算出することにより、入力未知パタンに最
も類似した標準パタンを選定するようにしたことを特徴
とする音声認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12980186A JPS62286099A (ja) | 1986-06-04 | 1986-06-04 | 音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12980186A JPS62286099A (ja) | 1986-06-04 | 1986-06-04 | 音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62286099A true JPS62286099A (ja) | 1987-12-11 |
Family
ID=15018563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12980186A Pending JPS62286099A (ja) | 1986-06-04 | 1986-06-04 | 音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62286099A (ja) |
-
1986
- 1986-06-04 JP JP12980186A patent/JPS62286099A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62286099A (ja) | 音声認識方式 | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
JPS5953897A (ja) | 音声認識装置 | |
JPS61223796A (ja) | 音声区間検出回路 | |
JPS58190999A (ja) | 音声認識装置 | |
JP2655637B2 (ja) | 音声パターン照合方式 | |
JPS60166993A (ja) | 単語音声認識装置 | |
JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
JPS6111886A (ja) | 文字認識方式 | |
JPS62286100A (ja) | 単音節認識方式 | |
JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
JPS59211098A (ja) | 音声認識装置 | |
JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
JPS62115498A (ja) | 無声破裂子音識別方式 | |
JPS5953899A (ja) | 音声認識装置 | |
JPH0443277B2 (ja) | ||
JPS593498A (ja) | 音声認識装置 | |
JPS5953898A (ja) | 音声認識装置 | |
JPS60185998A (ja) | 音声認識装置における辞書更新方式 | |
JPS63798B2 (ja) | ||
JPH0142025B2 (ja) | ||
JPS6070496A (ja) | 音声認識処理方式 | |
JPS5962985A (ja) | 楽譜認識におけるグル−プ化方式 | |
JPH0314000A (ja) | 音声認識装置 | |
JPS6026399A (ja) | 単語認識装置 |