JPS62286099A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS62286099A
JPS62286099A JP12980186A JP12980186A JPS62286099A JP S62286099 A JPS62286099 A JP S62286099A JP 12980186 A JP12980186 A JP 12980186A JP 12980186 A JP12980186 A JP 12980186A JP S62286099 A JPS62286099 A JP S62286099A
Authority
JP
Japan
Prior art keywords
voice
standard
section
pattern
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12980186A
Other languages
English (en)
Inventor
吉村 元一
剛一 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP12980186A priority Critical patent/JPS62286099A/ja
Publication of JPS62286099A publication Critical patent/JPS62286099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 [産業上の利用分野] 本発明は、音声タイプライタなどに好適な音声認識方式
に関するものである。
[従来技術及び問題点] 従来、音声認識の最も代表的な手法として、パタンマツ
チング法が知られている。この手法は、入力音声の特徴
パラメータを抽出し、これと予めメモリに登録されてい
る多数の標準音声の特徴パラメータとを個々に比較し、
最も類似している特徴パラメータの標準音声を認識結果
とするものである。しかし、認識率は必ずしも実用に適
う程には高くなく、誤認識があった時に救うすべもなか
った。一方、認識率を高めるべく、例えば、特開昭60
−19199号公報に示されるように特徴パラメータ抽
出による判別手段に加え、入力音声の原波形パワーパタ
ンと、標準音声の原波形パワーパタンとのパタンマツチ
ングを併用することも知られているが、これによれば、
標準パタンの登録数が増えるほどに音声認識のための比
較演算処理に時間が掛かり、応答が遅れる欠点がある。
[発明の目的] 本発明はこのような従来欠点に鑑みて為されたもので、
その目的とするところは音声認識率の向上を図ると同時
に迅速な応答を達成することにある。
し問題点を解決するための手段] この目的を達成するため本発明は、音声の特徴パラメー
タ抽出により入力未知パタンと、予め登録される多数の
標準パタンとの類似度を算出し、この算出値から類似度
の高い標準パタン候補を複数選出し、この選出した複数
の標準パタン候補について音声の原波形パワー、その1
次差分、零交差数の1又は複数に基づく類似度を算出す
ることにより、入力未知パタンに最も類似した標準パタ
ンを選定するものである。
[実施例] 以下に本発明の一実施例を図面と共に説明する。
第1図は音声認識装置をブロック図で示したもので1は
音声入力部、2はフィルタ部、3は標本化部、4は音声
検出部、5は分析計算部、6は標準パタンメモリ部、7
はマツチング部、8は認識結果出力部、9は標準パタン
メモリ部6あるいはマツチング部7と分析計算部5とを
接続するモード切換スイッチである。しかして、前記分
析計算部5には音声入力部1に入力される音声の特徴パ
ラメータを抽出する手法の1つである線形予測係数(L
PC係数)の計算と、ユークリッド距離計算に必要なデ
ータである音声信号の原波形パワー、その−次差分、及
び零交差数の計算とを行なう演算処理回路が組み込まれ
ている。
次に音声認識のための操作手順を説明すると、先ず、標
準音声の特徴パラメータを予め標準パタンメモリ部6に
登録するが、このためにはモード切換スイッチ9を標準
パタンメモリ部6側に接続した後、音声を音声入力部1
に入力する。そうするとその音声入力部に取り込まれた
音声信号はフィルタ部2で濾波されたのち、標本化部3
で標本化され、音声検出部4でその当声信号の開始時点
を検知すると同時にその標本化データが分析計算部5へ
送り込まれる。そして該分析計算部5で前述のLPC係
数、原波形パワー、その−次差分、零交差数が夫々計算
され、その計算結果が標準パタンメモリ部6に貯えられ
る。このようにして多数の標準パタンを予め登録してお
き、次に音声認識を行なわせるには、モード切換スイッ
チ9の接続をマツチング部7側へ切り替え、認識させる
べき音声を音声入力部1へ入力する。そうすると、その
音声信号が標準パタンの登録のときと同じようにフィル
タ部2、標本化部3、音声検出部4を介して分析計算部
5へ送り込まれ、該分析計算部5でLPC係数、原波形
パワー、その−次差分、零交差数が夫々計算される。そ
してその計算結果がマツチング部7へ送り込まれるが、
該マツチング部7では、第2図にそのフローチャートを
示したように、最初に認識させるべき入力未知パタンと
、前述の予め登録される標準パタンとてLPG係数の比
較からWL R(Wetghted ! 1keiih
oodRatio)距離(特徴パラメータの類似度)を
算出し、この算出値から類似度の高い標準パタン候補を
複数(例えば、第1候補〜第3候補)選出する。
そして次にこの選出した複数の標準パタン候補について
、前述の原波形パワー、その1次差分、零交差数を用い
たユークリッド距離(類似度)の計算を次式により行な
い、この算出値を用いて前述の各標準パタン候補のWL
R距離算出値に重み付けを行ない、その計算値の最も小
さい標準パタンを選定し、これを認識結果とする。
ここに Dニュークリッド距離 Po:標準音声の原波形パワー Pl;未知入力音声の原波形パワー Do;標準音声原波形パワーの一次差分D1:未知入力
音声原波形パワーの一次差分Zo:標準音声の零交差数 Z]:未知入力音声の零交差数 なお、ユークリッド距離の計算は常識のように原波形パ
ワー、その−次差分、あるいは零交差数の3つの項を全
て考慮するのが最適であるが、必要に応じてその中の1
つ、又は2つの項を省略してもよい。
この結果を第3図に示すが、本発明の音声認識方式によ
れば、従来の特徴パラメータ抽出のみによる類似度算出
方式よりも有意差が認められる程度に格段に認識率が向
上した。また、従来技術として示した特開昭60−19
199号公報のように、登録される全ての標準パタンに
ついて特徴パラメータ抽出と、原波形パワーのパタンマ
ツヂングを行なうものに比較して応答時間が定性的では
あるかかなり短縮された。
[発明の効果コ 以上説明したように本発明によれば、音声の認識率の向
上が図れる。また、特徴パラメータ抽出により類似度の
高い標準パタン候補を多数登録の標準パタンの中から絞
り、細手法による類似度計算をこの標準パタン候補に限
り行なうものであるから、音声認識に応答時間がそれ程
長くなることもなく、産業上の利用価値は極めて高い。
【図面の簡単な説明】
図面は本発明の一実施例を示したもので、第1図は音声
認識装置のブロック図、第2図は要部を説明するフロー
ヂャート、第3図は音声認識率の比較データである。 5・・分析計算部、6・・標準パタンメモリ部、7・・
マツチング部。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 音声の特徴パラメータ抽出により入力未知パタンと、予
    め登録される多数の標準パタンとの類似度を算出し、こ
    の算出値から類似度の高い標準パタン候補を複数選出し
    、この選出した複数の標準パタン候補について音声の原
    波形パワー、その1次差分、零交差数の1又は複数に基
    づく類似度を算出することにより、入力未知パタンに最
    も類似した標準パタンを選定するようにしたことを特徴
    とする音声認識方式。
JP12980186A 1986-06-04 1986-06-04 音声認識方式 Pending JPS62286099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12980186A JPS62286099A (ja) 1986-06-04 1986-06-04 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12980186A JPS62286099A (ja) 1986-06-04 1986-06-04 音声認識方式

Publications (1)

Publication Number Publication Date
JPS62286099A true JPS62286099A (ja) 1987-12-11

Family

ID=15018563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12980186A Pending JPS62286099A (ja) 1986-06-04 1986-06-04 音声認識方式

Country Status (1)

Country Link
JP (1) JPS62286099A (ja)

Similar Documents

Publication Publication Date Title
JPS62286099A (ja) 音声認識方式
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS5953897A (ja) 音声認識装置
JPS61223796A (ja) 音声区間検出回路
JPS58190999A (ja) 音声認識装置
JP2655637B2 (ja) 音声パターン照合方式
JPS60166993A (ja) 単語音声認識装置
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS6111886A (ja) 文字認識方式
JPS62286100A (ja) 単音節認識方式
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS59211098A (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPS62115498A (ja) 無声破裂子音識別方式
JPS5953899A (ja) 音声認識装置
JPH0443277B2 (ja)
JPS593498A (ja) 音声認識装置
JPS5953898A (ja) 音声認識装置
JPS60185998A (ja) 音声認識装置における辞書更新方式
JPS63798B2 (ja)
JPH0142025B2 (ja)
JPS6070496A (ja) 音声認識処理方式
JPS5962985A (ja) 楽譜認識におけるグル−プ化方式
JPH0314000A (ja) 音声認識装置
JPS6026399A (ja) 単語認識装置