JPH0477795A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0477795A
JPH0477795A JP2190801A JP19080190A JPH0477795A JP H0477795 A JPH0477795 A JP H0477795A JP 2190801 A JP2190801 A JP 2190801A JP 19080190 A JP19080190 A JP 19080190A JP H0477795 A JPH0477795 A JP H0477795A
Authority
JP
Japan
Prior art keywords
noise
standard pattern
speech
input
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2190801A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2190801A priority Critical patent/JPH0477795A/ja
Publication of JPH0477795A publication Critical patent/JPH0477795A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は騒音環境下で入力される音声に対して高い認識
性能を得ることのできる音声認識装置に関する。
(従来の技術) 音声認識装置を実用化する場合、認識性能低下の大きな
要因となる環境騒音が問題となる。このような環境騒音
に対処するべ(、従来ては予め異なる雑音を付加した複
数種の標準パターンを準備しておき、認識時の騒音に最
も近い雑音が付加された標桑パターンを選択的に用いて
入力音声を認識処理したり、予め準備されている標準パ
ターンに認識時における騒音を付加して入力音声に対す
る認識処理に供する等の工夫がなされている。
つまり入力音声の認識処理に用いられる標準パターンに
雑音を付加することで、上記入力音声に含まれる環境騒
音の雑音に対処することが種々試みられている。
然し乍ら、騒音環境下で発声される音声には、ランバー
ド(Lombard)効果と称される音声自身のパター
ン変形が生じることが否めない。このような音声自信の
パターン変形には、上述した標準パターンに対する雑音
の付加では対処することができず、その認識性能を高め
る上での問題となっている。
(発明が解決しようとする課題) このように従来では、騒音環境下で発声される音声自身
の変形については格別な配慮が払われてなく、これに起
因して認識性能を高めるにも限度があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、騒音環境下で発声人力される音
声についても高い認識性能を確保することのできる音声
認識装置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明は入力音声を分析処理して求められる入力音声パ
ターンと、予め登録した標準パターンとを照合して前記
入力音声を認識する音声認識装置に係り、 特に人力音声を分析して標準パターンを求めて登録する
際、例えば所定の騒音を出力する等して、音声認識時に
入力音声に加わると予想され環境騒音下で、標準パター
ンを作成する為の音声を入力するようにしたことを特徴
とするものである。
(作 用) このようにして、例えば騒音を与えながらその騒音環境
下で標準パターンの作成に倶される音声を入力するよう
に構成することで、環境騒音に起因する変形を生じた音
声を求めることが可能となるので、ランバード(Lom
bard)効果による発声変形を受けた音声を標準パタ
ーンとして登録することが可能となる。この結果、騒音
環境下で人力される音声を認識処理する場合でも、その
音声変形を配慮した標準パターンを用いて認識処理する
ことができるので、その認識性能を十分に高くすること
が可能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る音声認識
装置について説明する。
第1図は実施例装置の概略的な全体構成を示す図で、第
2図はその処理動作の概略的な手順を示す図である。
この実施例装置は、大略的には第1図に示すように入力
音声を分析処理して入力音声パターンを求め、この入力
音声パターンと予め登録されている標準パターンとを照
合して前記入力音声を認識する音声認識処理部Aと、前
記標準パターンの登録時に騒音を出力する為の騒音発生
部Bとにより構成される。
音声認識処理部Aは、発声者が発声した音声を入力する
為のマイクロフォンや電話機におけるハンドセットの送
話部等により実現される音声入力部1と、この音声入力
部lから入力された音声を音響分析してその特徴パラメ
ータを求める音響分析部2とを前処理機構部として備え
る。音声区間検出部3は上述した如く音響分析して求め
られた入力音声の特徴パラメータから、例えばその音声
パワーの変化から入力音声の始端と終端とを検出して入
力音声区間を求め、その入力音声区間の特徴パラメータ
を入力音声パターンとして抽出する。
このようにして求められる入力音声パターンが類似度演
算部4に与えられ、予め標準パターン記憶部5に登録さ
れている各種の入力音声に対する標準パターンとの照合
に供される。この類似度演算部4は、上記入力音声パタ
ーンと標準パターンとの類似度を、例えばDTW法や複
合類似度法により算出するものである。判定部6は、こ
の類似度演算部4で求められた人力音声パターンと各種
音声についての標準パターンとの類似度を相互に比較し
、例えば最も高い類似度を得た標準パターンの音声カテ
ゴリを前記人力音声に対する認識結果として求める。
尚、標準パターン作成部7は、前述した音声区間検出部
3で求められた入力音声の特徴パラメータから、その入
力音声の標準パターンを作成し、これを前記標準パター
ン記憶部5に登録するものである。この標準パターン作
成部7に起動による標準パターンの作成と、その標準パ
ターンの前記標準パターン記憶部5への登録は前記騒音
発生部Bを作動させながら行われる。
一方、騒音発生部Bは、音声認識時における騒音環境を
想定して予め種々の雑音を記憶した騒音記憶部11と、
この騒音記憶部IIに記憶されている騒音(雑音)を前
記標準パターンの作成時に発声者に対して出力する騒音
出力部12とを備えて構成される。上記騒音記憶部11
は、例えばカセットテープレコーダや音声録音再生用L
SI等によって構成されるもので、予め収集された騒音
環境下での雑音を登録記憶したものである。また上記騒
音出力部12は、スピーカや前述した電話機におけるハ
ンドセットの受話部等により実現される。
尚、騒音入力部13を別個に備え、標準パターンを登録
するに先立って認識時に存在すると思われる騒音をその
都度入力し、これを前記騒音記憶部11に登録するよう
にしても良い。
このように構成された騒音発生部Bは、前記標準パター
ンの作成・登録時に起動されるもので、標準パターンを
作成・登録する為の音声を発声入力する際、前述した如
く騒音記憶部11に記憶された騒音(雑音)を発声者に
聞かせるものである。
即ち、第2図にその処理動作の概略的な手順を示すよう
に、本装置は音声認識モートと標準パターンの登録モー
ドとの2種類の動作モートを儒え、選択指定された動作
モードを判定してそのモートに従った動作を実行する(
ステップa)。
しかして登録モードが設定された場合、先ず前記騒音発
生部Bを起動して騒音を発生させ(ステップb)、この
騒音を発声者(音声登録者)に聞かせなから当該発声者
が発声した音声を入力する(ステップC)。この騒音の
発生出力を前述したハンドセットの受話部から行い、発
生者の音声をその送話部から入力するようにすれば、そ
の騒音の混入を招くことのない音声入力が可能となる。
この結果、騒音環境下での発声時に見られる、ランバー
ド(Lombard)効果による発声変形を受けた音声
を上記騒音とは切り離して入力することが可能となり、
また騒音に起因する音声区間の検出誤りを防ぐことも可
能となる。つまり上述したようにハンドセットを用いて
標準パターン登録用の音声を入力する場合には、必然的
にその送話部を口元に近付けて発声することになり、し
かも騒音は受話部から発声者の耳元たけに直接的に与え
られることになる。この結果、騒音の混入を招くことな
く、ランバード(LoIIbard)効果による発声変
形を受けた音声だけを明瞭に入力することが可能となる
標準パターンの作成とその登録は、上述した如くして入
力された音声を、例えばバンドパスフィルタリングやL
PG分析等の手法を用いて音響的に分析処理し、その分
析結果として求められる入力音声パターンを標準パター
ンとして作成しくステップd)、これを前記標準パター
ン記憶部5に入力音声のカテゴリと共に記憶することに
よりなされる(ステップe)。このような標準パターン
の作成時には、前述した如く求められる入力音声パター
ンに対して、適宜線形伸長処理や主成分分析処理を施し
、これを標準パターンとして登録する。
尚、人力音声パターンをそのまま標準パターンとして登
録するような場合には、標準パターン作成部7を省略し
て装置を構成することもてきる。
以上のようにして、予め認識対象とする音声についての
標準パターンを生成し、これを標準パターン記憶部5に
登録することにより人力音声を認識処理する為の準備が
整えられる。そして標準パターンの登録処理が終了した
とき、前記騒音の発生出力か停止される。
しかして人力音声を認識処理する場合には、認識モード
を設定し、前記音声入力部lから認識対象とする音声を
発声入力して行われる(ステップf)。この場合には、
入力音声を前述したように音響的に分析して入力音声パ
ターンを求め(ステップg)、BK入力音声パターンと
前述した如く標準パターン記憶部5に登録された標準パ
ターンとの類似度をそれぞれ計算する(ステップh)。
そして各標準パターンとの間で求められた類似度を相互
に比較し、例えば類似度が最も高い標準パターンの音声
カテゴリを認識結果として出力する(ステップi)。
かくしてこのように構成された本装置によれば、標準パ
ターンの登録時に発声者に騒音を聞かせながら音声の発
声を行なわせるので、騒音に起因するランバード(Lo
mbard)効果による発声変形を受けた音声を発声さ
せることが可能となる。この結果、その音声変形を生じ
た入力音声から標準パターンを作成し、これを登録する
ことか可能となるので、実際の音声認識処理を行う環境
下で騒音の影響を受けて変形した音声が人力される場合
であっても、これを高性能に認識することが可能となる
。換言すれば、ランバード(Lombard)効果によ
る発声変形を配慮した高性能な標準パターン辞書を準備
しておくことか可能となり、高性能な音声認識処理を行
うことが可能となる。
従って本装置を自動車電話のダイヤラー等に応用し、通
話先の電話番号を音声人力するような場合であっても、
自動車の走行音やカーオーディオの音等の騒音の影響を
受けながら発声される入力音声を高性能に正しく認識す
ることが可能となる。
この際、標準パターンに雑音を付加して認識処理を実行
し、音声と共に入力される雑音の影響を排除するような
機能を併用しても良いことは勿論のことである。
尚、本発明は上述した実施例に限定されるものではない
。例えば入力音声に対する音響的な分析処理の手法や、
入力音声パターンと標準パターンとの照合処理の手法に
ついては、従来より種々提唱されている音声認識の手法
を適宜採用可能である。また自動車電話に応用すること
のみならず、種々の職場環境や家庭内での各種音声入力
制御機器についても応用することができる。また標準パ
ターンに対する学習処理手法についても種々変形するこ
とができる。要するに本発明は、騒音環境下における音
声発声時にランバード(Lombard)効果の影響を
受けて変形する音声パターンを予め標準パターンとして
求めるようにしたものであり、その要旨を逸脱しない範
囲で種々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、標準パターンの登
録時に発声者に対して騒音を聞がせながら音声の発声を
行わせるので、人力音声がランバード(1,ombar
d)効果による音声変形するような場合であっても、こ
れを高性能に認識することができる。しかも非常に簡易
にして認識性能の高い標準パターン辞書を構築すること
ができる等の実用上多大なる効果を奏することができる
【図面の簡単な説明】
図は本発明の一実施例に係る音声認識装置について示す
もので、第1図は実施例装置の概略構成図、第2図は実
施例装置の概略的な処理の流れを示す図である。 A・・・音声認識処理部、B・・・騒音発生部、1・・
・音声入力部、2・・・音響分析部、3・・・音声区間
検出部、4・・・類似度演算部、5・・・標準パターン
記憶部、6・・・判定部、7・・・標準パターン作成部
、11・・・騒音記憶部、12・・・騒音出力部、13
・・・騒音入力部。 出願人代理人 弁理士 鈴江武彦

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声を分析処理して求められる入力音声パタ
    ーンと、予め登録した標準パターンとを照合して前記入
    力音声を認識する音声認識装置において、入力音声を分
    析して求められる入力音声パターンを標準パターンとし
    て登録する際、音声認識時に入力音声に加わると予想さ
    れ環境騒音下で音声を入力し、この入力音声を分析処理
    して標準パターンを求める手段を備えたことを特徴とす
    る音声認識装置。
  2. (2)標準パターンの登録時に所定の騒音を出力する手
    段を備えたことを特徴とする請求項(1)に記載の音声
    認識装置。
JP2190801A 1990-07-20 1990-07-20 音声認識装置 Pending JPH0477795A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2190801A JPH0477795A (ja) 1990-07-20 1990-07-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2190801A JPH0477795A (ja) 1990-07-20 1990-07-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0477795A true JPH0477795A (ja) 1992-03-11

Family

ID=16263972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2190801A Pending JPH0477795A (ja) 1990-07-20 1990-07-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0477795A (ja)

Similar Documents

Publication Publication Date Title
JP4085924B2 (ja) 音声処理装置
EP1301922B1 (en) System and method for voice recognition with a plurality of voice recognition engines
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
CN109065067A (zh) 一种基于神经网络模型的会议终端语音降噪方法
US20070276658A1 (en) Apparatus and Method for Detecting Speech Using Acoustic Signals Outside the Audible Frequency Range
JP2004527006A (ja) 分散型音声認識システムにおける音声アクティブな状態を送信するためのシステム及び方法
TW546632B (en) System and method for efficient storage of voice recognition models
JP5039879B2 (ja) スピーチエネーブル装置のユーザインターフェースの完全性をテストする方法および装置
JP3970776B2 (ja) 雑音環境条件および周波数不一致条件において音声認識を改良するためのシステムおよび方法
JP2005338454A (ja) 音声対話装置
JPH0477795A (ja) 音声認識装置
JPH09198085A (ja) 電話をベースとする音声認識用時変特徴スペース処理手順
JP2010164992A (ja) 音声対話装置
JPH04324499A (ja) 音声認識装置
JP2000122678A (ja) 音声認識機器制御装置
JP2000311077A (ja) 音声情報入力装置
KR20180087038A (ko) 화자 특성을 고려하는 음성합성 기능의 보청기 및 그 보청 방법
US20230217194A1 (en) Methods for synthesis-based clear hearing under noisy conditions
JPH0194398A (ja) 音声標準パターンの作成方法
Pacheco et al. Spectral subtraction for reverberation reduction applied to automatic speech recognition
KR100278640B1 (ko) 이동 전화기를 위한 음성 다이얼링 장치 및방법
JP2975808B2 (ja) 音声認識装置
JPH11109987A (ja) 音声認識装置
KR100647291B1 (ko) 음성의 특징을 이용한 음성 다이얼링 장치 및 방법
Sathiamoorthy et al. Performance of Speaker Verification Using CSM and TM