JPS59211100A - 登録型音声認識方法 - Google Patents

登録型音声認識方法

Info

Publication number
JPS59211100A
JPS59211100A JP8613583A JP8613583A JPS59211100A JP S59211100 A JPS59211100 A JP S59211100A JP 8613583 A JP8613583 A JP 8613583A JP 8613583 A JP8613583 A JP 8613583A JP S59211100 A JPS59211100 A JP S59211100A
Authority
JP
Japan
Prior art keywords
speech
section
noise
vowel
certain value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8613583A
Other languages
English (en)
Inventor
別所 由実
藤恵 英樹
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8613583A priority Critical patent/JPS59211100A/ja
Publication of JPS59211100A publication Critical patent/JPS59211100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は登録型音声認識方法に関するものである0 従来例の構成とその問題点 音声認識装置を通常の室内で使用する際、音声入力時の
環境に応じて音声と同時に雑音も入力され、その雑音の
影響により音声認識率が低下する。
そのため、雑音下でも対応できる音声認識方法を開発す
ることが要望されている。
以下に従来の音声認識方法について説明する。
第1図は従来の音声認識方法のフローチャートである。
図中番号の1から6までは標準音声テータ処理3ベー・
ノ 部、1′から5′1では入力音声データ処理部である。
1,1′は音声データの取りこみ部、2.2′はデータ
の周波数分析部、3.3’は音声区間抽出部、6.6′
は正規化部である。8は正規化後の標準音声パターンと
入力音声パターン間の照合部であり、9は認識結果出方
部である。
以上のように構成された従来の音声認識方法の音声区間
抽出部では、フレームごとに全周波数帯域のエネルギー
を算出し、エネルギーが一定値以上のフレームを音声区
間として抽出している。
し力)シ、上記のような音声区間抽出方法では、入力音
声に混入する雑音が大きくなると、無音声区間でも全周
波数帯域のエネルギーが一定値以上になり、音声区間と
判断されるために音声区間抽出が不可能となる。
したがって、入力音声に混入する雑音が大きい場合、音
声認識率が著しく低下するという問題があった。
発明の目的 本発明は、上記従来の問題点を解消するもので、混入雑
音が低レベルの場合の音声認識率全低下させずに、混入
雑音が高レベルの場合でも高い音声認識率を示す音声認
識方法を提供すること全目的とする。
発明の構成 本発明は混入雑音が低レベルの場合1は子音部と母音部
を含んだ音声パターンで照合し、混入雑音が高レベルの
場合は母音部の音声パターンで照合するようにして高い
認識率が得られるようにしたものである。
まず、標準音声に関してはフレームごとに全周波数帯域
のエネルギーが一定値以上である区間を音声区間として
抽出し、この抽出した区間の中で母音部のホルマント周
波数付近のエネルギーが一定値以上であるフレーム番号
も記録しておく。
次に、音声入力の際に無音声区間で雑音全敗りこみ、混
入雑音の大小全判断する。
混入雑音が低レベルと判断された場合は標準音声、入力
部ともに従来の方式と同様に全周波数帯域のエネルギー
が一定値以上である区間全音声信6、。
号部と判断しパターン照合を行う。
混入雑音が高レベルと判断された場合は、標準音声、入
力音声ともに全周波数帯域のエネルギーが一定値以上で
あり、かつ母音のホルマント周波数付近のエネルギーが
一定値以上である区間を音声信号部と判断し、パターン
照合を行う。
実施例の説明 第2図は本発明の一実施例における音声認識方法のフロ
ーチャートである。
図中番号の1から61では標準音声処理部、1′から5
′までは入力音声処理部である。
1.1′は音声データ取り込み部、2.2′はデータの
周波数分析部、3.3′は音声区間抽出部、4.4′ 
 は母音のホルマント周波数付近のエネルギーが一定値
以上である区間の検出部、5.5’は正規化部である。
6は入力音声の混入雑音が高レベルと判断された場合、
標準音声パターンに対して母音のホルマント周波数付近
のエネルギーが一定値以上となる区間たけ全抽出するこ
とにより、パターンを補正する部分である。
67、−び 7は入力音声に混入する雑音のレベル判定部、8は標準
音声パターンと入力音声パターン間の照合部であり、9
は認識結果出力部である。
次にこの音声認識方法について動作全説明する。
標準音声、入力音声に対して1フレーム16チヤンネル
として、20ollzから6.a K llz 4での
帯域全3分の1オクターブに区切った分析データを作成
する。
捷ず、標準音声分析データに対してフレームごとに全チ
ャンネルの総和値が指定した第1トリガレベル以上であ
れば音声区間として抽出して正規化全行い、標準音声パ
ターンを作成する。なお、区間抽出直後に母音のホルマ
ント周波数付近に相当する3チヤンネル(中心周波数3
15[IZ)から7チヤンネル(中心周波数80002
)4でのデータ値の最大値が指定した第2トリガレベル
以上であるフレーム番号を記録しておく0 次に、入力音声信号の無音声区間分析データの全チャン
ネルの総和値が第3トリガレベル以上であると、雑音レ
ベルが高いと判断し、トリガレベ7ベージ ル以下であると雑音レベルが低いと判断する0雑音が低
レベルと判断された場合は入力音声の各フレームの全チ
ャンネルの総和値がトリガレベル(その1)以」二であ
れば、音声区間として抽出して正規化を行い、入力音声
パターン全作成するOそ(−で先に作成した標準音声パ
ターンと)Zターン照合を行う。
雑音が高レベルと判断された場合は、捷ず、先に作成し
た標準音声パターンに対して母音のホルマント チヤンネルまでのデータ値の最大値が指定した第2トリ
ガレベル以上である区間を抽出し、再度標準音声パター
ンを作成する。次に入力音声分析データに対しても全チ
ャンネルの総和値が指定した第1トリガレベル以上であ
り、かつ母音のホルマント周波数付近に相当する3チャ
ンネルから7チヤンネルまでのデータ値の最大値が指定
した第2トリガレベル以上である区間を音声区間として
抽出して正規化全行い、入力音声ノ゛々ターン全作成す
る。そして再度作成した標準音声・くターンとノくター
ン照合を行う。
以−ヒのように本実施例によれば、1ず3チヤンネルか
ら7チヤンネルのデータの最大値全第2トリガレベルと
比較する方法全役けることにより、母音部を予測するこ
とができる。混入雑音が高レベルの場合、雑音の影響を
受けにくいと予測さ扛る母音部たけ全抽出することによ
り、音声区間抽出が可能となるため、音声認識率を向上
させることができる。
また、混入雑音が低レベルの場合は混入雑音が高レベル
の場合とは異なり、子音部と母音部を共に含む区間を音
声区間として抽出することに一Il:す、従来の認識率
ヲ作持することができる。
また、標準音声に対して全チャンネルの総和値が第1ト
リガレベル以上である区間を音声区間として抽出し、母
音のホルマント周波数付近に相当する3チヤンネルから
7チヤンネルまでのデータの最大値が第21リガレベル
以上であるフレーム番号を記録することにより、複数の
標準音声パターンを登録しなくても混入雑音が低レベル
の場合91・−ジ には子音部と母音部を含んだ標準音声パターンを照合し
、混入雑音が高レベルの場合には母音部の標準音声パタ
ーンを照合することができる。
発明の効果 以上のように本発明は、標準音声,入力音声ともに混入
雑音が低レベルの場合は全周波数帯域のエネルギーが一
定値以上である区間全音声区間として抽出し、混入雑音
が高レベルの場合は全周波数帯域のエネルギーが一定値
以上であり、かつ母音のホルマント周波数付近のエネル
ギーが一定値以上である区間を音声区間として抽出する
ことにより、混入雑音が低レベルの場合は子音部と母音
部を含めた音声パターンで照合を行い、混入雑音が高レ
ベルの場合は雑音の影響を受けにくいと予測される母音
部の音声パターンで照合を行うことになる。
そのため、混入雑音が高レベルの場合でも音声区間抽出
が可能となり、音声認識率は向上する。
また、混入雑音が低レベルの場合の音声認識率は従来の
認識率k[持できる。
107、−6。
【図面の簡単な説明】
第1図は従来の音声認識方法の70−チャート、第2図
は本発明の一実施例における音声認識方法のフローチャ
ートである。 1・・・・・・標準音声入力部、2・・・・・・標準音
声データ分析部、3・・・・・・標準音声区間抽出部、
4・・・・・・標準音声母音予測部及び予測フレーム番
号検出部、5・・・・・・標準音声正規化部、6・・・
・・・標準音声パターン補正部、1′・・・・・・入力
音声入力部、2′・・・・・・入力音声データ分析部、
3′・・・・・・入力音声区間抽出部、4′・・・・・
・入力音声母音予測部及び音声区間再抽出部、6′・・
・・・・入力音声正規化部、7・・・・・・入力音声混
入雑音の有無判定部、8・・・・・・パターン照合部、
9・・・・・・認識結果出力部。

Claims (3)

    【特許請求の範囲】
  1. (1)入力音声に混入する雑音が低レベルの場合は子音
    部と母音部を含んた音声パターン全照合し、混入する雑
    音が高レベルの場合は母音部の音声パターンを照合する
    ことを特徴とする登録型音声認識方法。
  2. (2)入力音声データより混入雑音レベルを判定し、雑
    音が低レベルと判定された場合は周波数分析された音声
    テークに対して全周波数帯域のエネルギーが一定値以上
    である区間を音声信号部と判断してパターン照合を行い
    、雑音が高レベルと判定された場合は全周波数帯域のエ
    ネルギーが一定値以上であり、かつ母音のホルマント周
    波数付近のエネルギーが一定値以上である区間を音声信
    号部と判断してパターン照合を行うことを特徴とする特
    許請求の範囲第1項記載の登録型音声認識方法。 2/ニー+ア
  3. (3)標準音声に対して全周波数帯域のエネルギーが一
    定値以上である区間を抽出し、この抽出した区間全対照
    に母音のホルマント周波数付近のエネルギーが一定値以
    上であるフレーム番号を記録しておくことを特徴とする
    特許請求の範囲第2項記載の登録型音声認識方法。
JP8613583A 1983-05-16 1983-05-16 登録型音声認識方法 Pending JPS59211100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8613583A JPS59211100A (ja) 1983-05-16 1983-05-16 登録型音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8613583A JPS59211100A (ja) 1983-05-16 1983-05-16 登録型音声認識方法

Publications (1)

Publication Number Publication Date
JPS59211100A true JPS59211100A (ja) 1984-11-29

Family

ID=13878267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8613583A Pending JPS59211100A (ja) 1983-05-16 1983-05-16 登録型音声認識方法

Country Status (1)

Country Link
JP (1) JPS59211100A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106799A (ja) * 1986-10-24 1988-05-11 富士通株式会社 音声検出装置
JPS6481997A (en) * 1987-09-24 1989-03-28 Nec Corp Voice detection system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63106799A (ja) * 1986-10-24 1988-05-11 富士通株式会社 音声検出装置
JPS6481997A (en) * 1987-09-24 1989-03-28 Nec Corp Voice detection system

Similar Documents

Publication Publication Date Title
EP0240329A2 (en) Noise compensation in speech recognition
JPS59211100A (ja) 登録型音声認識方法
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JP3106543B2 (ja) 音声信号処理装置
JP3346200B2 (ja) 音声認識装置
JP3474949B2 (ja) 音声認識装置
JP2989231B2 (ja) 音声認識装置
JPS59105697A (ja) 音声認識装置
JP3020999B2 (ja) パターン登録方法
JPS6147994A (ja) 音声認識方式
JP2844592B2 (ja) 離散単語音声認識装置
JPH0376471B2 (ja)
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPH07210186A (ja) 音声登録装置
JPS60208800A (ja) 単語音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JPH0731506B2 (ja) 音声認識方法
JPS6350899A (ja) 音声認識装置
JPS62238599A (ja) 音声区間検出方法
JPS5934597A (ja) 音声認識処理装置
JPS62293299A (ja) 音声認識方法
JPS625298A (ja) 音声認識装置
JPH02100099A (ja) 音声認識装置
JPS6350897A (ja) 音声認識装置
JPS60233700A (ja) 音声パタ−ン照合方法