JPS58181099A - 音声識別装置 - Google Patents

音声識別装置

Info

Publication number
JPS58181099A
JPS58181099A JP57065142A JP6514282A JPS58181099A JP S58181099 A JPS58181099 A JP S58181099A JP 57065142 A JP57065142 A JP 57065142A JP 6514282 A JP6514282 A JP 6514282A JP S58181099 A JPS58181099 A JP S58181099A
Authority
JP
Japan
Prior art keywords
voice
audio
signal
noise
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57065142A
Other languages
English (en)
Other versions
JPH023520B2 (ja
Inventor
憲司 嶋
日比野 昌弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP57065142A priority Critical patent/JPS58181099A/ja
Publication of JPS58181099A publication Critical patent/JPS58181099A/ja
Publication of JPH023520B2 publication Critical patent/JPH023520B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音声識別装置に関し、特に、音声を入ルし、
その音声の内容に基づいて各種被IIIIN1機器を制
御するために用いられるような音声識別装置の改良に関
する。
たとえば,自勧巾などにおいて運転者がラジオなどのl
4IIIIl機器を操作する場合には、一般に手動的に
わなうことが多い。しかし、運転者が車を運転中にラジ
オなどを操作するためには、しばしば?R締を前方から
機器の操作部に移す必要があり、このことが脇見運転の
原因になり、非常に危険を伴う。また、最近では運転者
用の電子式卓上計粋機が実用に供され−〔いるが、この
ような電子式卓[昌會算機を、運転しながら操作するこ
とは不可能に近いものであった。この他にも、窓の開閉
やその他の串載機器を操作する場合においても同様の問
題歳を生じていた。
そこぐ、運転者が手動的な操作によることなく、フジA
の電源投入や窓の開閉などをすることができれば便利で
ある。このためには、運転者が「ラジ4jと発音したと
き、このg角を識別してその識別結果に基づいてラジオ
をtII1御するような音声入力IllIII装置が考
えられる。このような音庚入力制御装瞳では、運転者の
近傍にマイクロホンを設けておき、このマイクロホンに
入力された音声を識別する。どころが,自動車の窓が開
かれていると、外部からの騒音がマイクロホンに混入し
てしまい、運転者の発音した音声と騒音との識別が極め
て困難になり、車載機器などを誤動作させる原因となっ
ていた。
それゆえに、この発明の主たる目的は、外部からの騒音
と人間の発音した音声とを容易に識別し得る音声識別装
置を提供することである。
この発明を要約すれば、発音者の近傍に所定の間隔を隔
てて第1および第2の入力手段を配置しておき、それぞ
れの音声入力手段から出ルされた音轡入力信号から予め
定める周波数帯域成分の音轡信号を抽出し、それぞれの
音声信号の相関関係を演算し、その演算結果に基づいて
音南電気信号変換手段から出力ざれた音轡信号が発音者
の発音した音声に基づくものであるかあるいは騒音に基
づくものであるかを判別するように構成したちのCある
この発明の上述の目的およびその他の目的と特徴は以ト
に図面を参照して行なう詳細な説明から一層明らh1と
なろう。
第1図はこの発明の一実施例が適用された自動車を横h
向から見た概略図であり、第2図は同じく運転当の後方
向から見た概略図であり、第3図μ向しく自動車の車内
の概略図である。
まず.第1図ないし第3図を参照しc1この発明のII
襞につい(説明する。運転者11は車体12に設Gノら
れている座席13に看席し、シフトレバー14&jよび
スデアリングホイール15を操作して運転する。計器盤
16にはたとえばカーラジ417が取付けられている。
また、天井20には、運転者]1の正面方向に直交して
等距離の位置に所定の藺陥を有して第1および第2の音
声入力手段とじむのマイクロホン17と18とが取付1
ノられ(いる。さらに、これらのマイクロホン17と1
8との闇には指向性マイクロホン19が設けられている
運転者11がたとえばラジオ17の電源を投入しようと
する場合は、予め定められている制御用の音声(以下、
キーワードと称する)を発音する。
この音声は空気中を伝播し、マイクロホン17と18と
19とに入る。このとき、マイクロホン17と18が運
転者11から等距離の位胃に設けられているので、音声
はこれらのマイクロホン17と18とに同時に伝播され
ることになる。マイクロホン17と18とに入力された
音声は電気信号に変換ざれて音声信号となり、この2つ
の音声信号の相互相関係数が求められる。騒音が入力さ
れ“ていない場合には、相関係数は1に近い値が得られ
、音声信号は騒音に比べて十分に大きいことが相関係数
の値から示される。逆に、大きな騒音が入力された場合
には相関係数はOに近い値が得られ、音声信号は騒音に
比べて十分に小さいことが示される。そして、この相互
相関係数の値に基づいて、指向性マイクロホン19から
出力される音声信号を認議するか否かを判別する。そし
て、相互相関係数が1に近い値であれば、指向性マイク
uホン19から出力される音声信号と予め記憶されてい
るキーワードの音声パラメータとを比較し、いずれのキ
ーワードであるかを判別する。そして、この判別結果に
基づいてたとえばラジオ17などの各種車載―器を制御
する。
なお、[述の説明では、音轡認識用の音轡信号を指而性
マイクロホン19から出力するようにしたが、特に指向
性マイクロホン19を設けることなく、冫イクロホン1
7または18のいずれか一方からの音轡信号を認謙する
ようにしてもよい。
しかしながら、運転者11の発音した音声を分析して認
識を行なうための音声信号の8./N比としては=1分
高いものが好ましく、周囲雑音を除去できる^指向性マ
イクロホンを用いるのが望ましい。
第4図は音声信号と騒音との関係を駅明するための図で
あり、第5A図および第5B図は相互相関係数の計算結
果例を示す図である。
次に、2つのマイクロホン17と18とから出tiされ
る商声信号の相互相関について説明する。
lR4図において、騒音発生1i100として、この場
合は一例として自動車騒音について考えてみる。
運転者11はマイクロホン17と18とから等距離に口
許がくる位習に座っており、運転者11の前方には自動
車のフロントガラス(図示せず),後方にはリアウイン
ドウ(図示せず)が存在するものとし、騒音発生源10
0は運転者11の側方にあるものとする。
騒音発生源100から騒音がマイクロホン17と18と
に伝播する遅延時闇差をτ0とし、その振幅差はマイク
ロホン17と18との閤隔dに比べて、マイクロホン1
7と18とから騒音源100の距離が十分に大きいもの
とみなして考慮せずに同一であるとする。また、騒音源
100からの騒音はマイクロホン17と18とに同一の
振幅と時間で伝播するものとする。このとき、マイクロ
ホン17と18との時藺信号a(t)とb(t)は、音
声信号をs(t),騒音発生源100からの騒音n(t
)とすると、 a(t)−s(t)+n(t)”11)b(t)−s(
t)+n(t+rO)・・・(2)と表わすことができ
る。ここぐ、相互相関関数φab(Z’)Jjよび正規
化相互相関関数Φ(r>はそれぞれ、 rある。但し、φaa(0).φbb(0)は、a(L
),b(t)の自己相gl11数φaa(r),φbb
<τ)のそれぞれτ=0のときの値であって、パワーを
表わし−(おり、 で表現できる。ここで、 s(t)−Ssinωst n(t”)−Nsin(cJnt とする。但し、ωs,ωnはS(t).n(t)の角周
波数であり、S.Nはs(t),n(t)の振幅を示し
ている。そして、ωS−2πfs,ωn−2πfnであ
るとすると、正規化相互相関関数Φ(τ)は、 Φ《τ》 ={S2cosωSτ 十N’cosωn(τ+τo))/(S’+N’)・・
・《7》 であり、またで一〇とすれば、 Φ(0) =(S’+N’cosωnτo)/(S2+N’)・・
・《8》 である。
さらに、s(t).n(t)がそれぞれL個.M個の正
弦波から成立つている場合には、となるので、 であり、またτ−0とすれば、 である。
前述の第《8》式において、τo=333μSつまりマ
イクロホン17と18との闇隔dが約11.3G一にお
ける計算結果を第5A図に示している。この第5A図か
ら明らかなように、側方がら入ってくる騒音が大きくな
りかつS/Nが小さくなるに従い正規化相関関数の小さ
くなることがわかる。但し、正弦波の場合には、1/τ
0の周波数の整数倍に近い周波数の騒音の場合には、第
5A図に示したようにはならないことは明らかであるの
で、実際にはそのような成分を小さくした状ll′c求
める必要がある。
また、前述の第《12》式において、τ0−333μS
(d)−11.3c一における計算結果を第5B図に示
している。この第5B図では、騒音0(【)を n(t)−0.4sin(2π−100)t+1.Os
in(2π−400)t +1.Osin(2π・1000)t +−1.Osin(2π−3100)t・・・(13) とし、100Hz,400Hz,1kHz.3.ikl
−1zの4つの周波数成分が0.4.1“.1.1の比
率で含まれているものとした。この場合には、τo=3
33μsの周期に近い3.1kHzの成分や低い周波数
成分を含んでいるので、Φ(0)はぎほど小さくはなら
ないが、それでもS7・′へが小さくな菰と、Φ(0)
が小さくなる傾向が見られる。
この発明は2つめマイクロホン17と18とから出力さ
れる音声信号の相関関係を用いて音声信号のS/N比を
推定し、その値によって認識結果の有効あるいは無効を
決定したり、類似度計算に重み付けしたりすることによ
って、騒音による誤認識や誤判定を防止できるような音
声識別装Wを構成できる。以下に、この発明の実施例に
ついて詳細に説明する。
第6図はこの発明の一実施例の概略ブロック図である。
前述の第2図および第3図に示したマイクロホン17か
らの音声信号は増幅器21で増幅され、フィルタ22に
よって識別したい周波数帯域《通常は音真周波数帯域》
のみが抽出され、相互相関係数計算機25に与えられる
。他方のマイクロホン18からの音轡信号は同様にして
増幅器23で増幅され、フィルタ24によって謙別じた
い周波数帯域成分のみが抽出されて相互相関係数計篩機
25に与えられる。この相互相関係数計眸1125は入
力された2つの音声信号から相互相関係数Φ(0)を求
めるものである。この相互相関係数計篩機によって計粋
された相互相関係数Φ《0》の値によってS/Nを推定
することができる。このために、相互相関係数計算機2
5で計算された相互相関係数Φ(0)が比較器26に与
えられる。比較器26には予め定める相関係数を記憶す
るための相関係数しきい値レジスタ27が接続される。
そして、比較器26は相互相関係数計111125で8
1粋された相互相関係数Φ《0》の値と.相関係数しき
い値レジスタ2lに記憶されている相関係数とを比較し
、指向性マイクロホン19から出力される音声信号を認
識するために騒音が小さいか否かの判定を行なう。そし
て、その判定信号を音声i!識認識回路29に与える。
−7],指向性マイクロホン19は2つのマイクロホン
191と192とを含み、それぞれから出ノノされた音
声信号は増幅器193およiplQ4で増幅され、加算
器195で加算ざれてフィルタ28に与えられる。この
フィルタ28は音声信号とじて不必要な低周波領域や高
周波領域の信号成分を除去するためのものである。フィ
ルタ28の出力{11号は音声認識回路29に与えられ
る。音声認識回路29は後述の第8図で詳細に説明する
が、入力された騒音の混入した音声信号から特徴パラメ
ータを抽出し、メモリ38に予め登録されている音声パ
ラメータとの類似度を求め、その類似度が一致している
と判断するのに十分でない場合には、入力された音声信
号を判定できないことを出力し、最も類似度が大きくか
つ類似度が十分に大きい場合にはそのデータであると判
定して出力するものである。
音肉iiiii回路29には比較器26から音声の騒音
判定信号が与えられており、この信号が騒音であること
を示している場合には、音声認識回路29は騒音または
判定不能を表わす信号を出力することによって、騒音が
大きいときに各種機器、この実施例ではラジオ17が誤
動作しないように構成される。
第7A図は第6図に示す相互相関係数計算機25の一例
を示す概略ブロック図である。第7A図において、a(
t)はマイクロホン17がら出力される音声信号の時間
成分であり、b(t)はマイクロホン18から出力ざれ
る音声信号の時閤成分である。そして、乗算器251と
積分器254と掛稗器257は前述の第(5)式を演算
するものである。すなわち、乗算器251はaを2乗し
、これを積分1254で積分し、掛算器257によって
■を無限大にしてφaa(0)を演算する。また、乗篩
器252と積分器256と掛算器259は前述の第(6
》式の演算を行なうものである。
すなわら、乗篩器252はbを2乗し、積分器はb2を
積分し、掛碑器259は第(6)式の王を無限大にして
φbb(0)を求める。掛算器257と259との出力
は乗算器260で乗算され、1,・2減表器261によ
ってその平方根が求められる。したがって、1/2減l
I器261の出力には、前述の弟《4》式の分母の演算
結果が得られることになる。
一方、乗禅器253と積分器255と掛算器258は前
述の第《3》式の演禅を行なうものである。すなわち、
乗算器253はaとbとを乗算し、それを積分器255
が積分し、掛算258が1を無限大にして第《3》式に
示すφabを出力する。
この出力は割算器262に与えられ、1/2減衰器26
1の出力によって除算され、第(4》式が演篩される。
そして、その出力はEXP263によってもとに戻ざれ
、Φ(0)が出力される。すなわち、この第7A図に示
す相互相関係数計綽機25は、マイクロホン17および
18から出力される音声信号に基づいて、騒音が小さい
場合にはΦ(0)−1を出力し、騒音が大きい場合には
Φ(0)−1を出力する。
第7B図は相互相関係数計算機の他の例を示す概略プロ
ック図である。第7B図において、2乗平均値回路(R
MS)266は時圓成分aの2乗平均を開根するもので
あり、C「2を演篩する。
加算器264はaとbとを加算し、RMS267によっ
てその2乗平均値/”(−ti−+−T)”が演算され
る。加算器265はaと−bとを加算するものであり、
RM8268はその結果の2乗平均値j(a−b)’を
演算する。RM8268はbの2乗平均値(T’を演算
する。各RMS266ないし269の演眸結果は演算回
路269によってA’+82/4CDを演算し、Φ(0
)を求める。
1118図は第6図に含まれる音声!iI11回路29
の員体的なブロック図である。この第8図に示す音肉認
謙回路29は従来から知られたチャネルフィルタを用い
たものであって、以下その構成と動作について簡単に説
明する。入力遮断スイッチ291には入力信号として第
6図に示すフィルタ28から指向性マイクロホン19か
らの音声人hOI号が与えられる。また、入力遮断スイ
ッチ291には制御信号として第6図に示す比較器26
から音AM@判定信号が入力される。そして、入力遮断
スイッチ291は音声騒音判定信号が音声を表わ”jt
R@であるとき閉じられてmlm動作を行ない得る状鍜
となり、音声でないつまり騒音であると判定され【いる
ときには開いて認識動作を停止した状態となる。このよ
うな機能を有する入力遮断スfツチ291を介して音声
信号がブリエンファシス回路292に与えられる。ブリ
エンファシス回路292は入力された音声信号のうちの
300ないし5kHzの帯域成分のみを通過させる6d
B/OCt程麿の特性を有するフィルタである。
ブリエンファシス回路292を通過した音声信号は、バ
ンドバスフィルタ(BPF)301ないし308に与え
られる。これらのバンドパスフィルタ301ないし30
8はそれぞれ予め定められた帯域成分の音声信号のみを
通過させて、後段の整流回路311ないし318に与え
る。この整流回路311ないし318はそれぞれバンド
バスフィルタ301ないし308の出力信号を整流して
直流電圧に変換する。整流された直流電圧はローパスフ
ィルタ321ないし328に与えられる。
これらのローパスフィルタ321ないし328は、一種
の積分機能を有したものであって、入力された信号に重
み付けをして加算し、その信号をトリが回路34に与え
る。トリガ回路34は入力ざれた信号の変化に応じて音
声の終端を検出し、CP1ノ35に対して音声期間であ
ることを表わす信号を与える。また、ローバスフィルタ
321ないし328のそれぞれ出力信号はマルチブレク
サ33にもえられる。マルチプレクサ33には、CPU
35から入出力インタフェイス36を介してローバスフ
ィルタ321ないし328のそれぞれの出力伯号を切替
るための切替信号が与えられる。そして、マルチプレク
サ33はその切替信号に応答して、いずれかのローバス
フィルタの出力をA−[)変換器37に与える。A−D
変換器37は、入力されたアナログ電圧をディジタル値
に変換するものである。このディジタル値に変換された
信号は、入出力インタフエイス36を介してCPU35
に与えられる。メモリ38は音声認謙に必要な1ログラ
ムを記憶するプログラムメモリ381と、@轡認謙に必
要なデータを記憶する音声パラメータメモリ382とを
含む。音轡パラメータメモリ382は予め登録された分
析パラメータを記憶する登録部としての記憶領域383
と、入出力インタフェイス36から出力ざれた音声パラ
メータを記憶する入力部としての記憶領域384と、2
00asec程1(の信号の分析パラメータを記憶する
ためのバッファ部としての記憶餉域385とを含む。2
00i+sec程度の信号の分析パラメータを記憶する
のは、音ml!謙をする上において音轡期開としてはト
リガ回路34によって音声期間であると判定された時点
以前も極めて重要であるので、類似度を計算する際には
バッフ冫部385の内容から始点部を棚って検出するた
めである。
次に、動作について説明する。入力遮断スイッチ291
は16図に示す比較器26から騒音であることを表わす
判定信号が入力されるとその接点をーき、音声であるこ
とを表わす判定信号が入力されればその接点を閉じる。
接点が閉じられると、B声人h信号はプリエンファシス
(ロ)路292,バンドパスフィルタ301ないし30
8,整流回路311ないし318およびローバスフィル
タ321ないし328に順次与えられる。マルチプレク
サ33はCPU35から入出力インタフェイス3′゛6
を介して出力される切替信号に応答して、各ローバスフ
ィルタ321ないし328のそれぞれの出力を順次選択
してA−D変換器37に与える。
A−D変換器37は入力された信号をディジタル一に変
換し、入出力インタフェイス36を介してIi!Sパラ
メータメモリ382の入カ部384に記憶させる。一方
、トリガ回路34はローパスフィルタ321ないし32
8のいずれかから信号が入シされると、音声期園の終了
を判断し、CPLI35に割込信号を与える。応じて、
CPυ35は入力部384に記憶した音声パラメータと
登録部383に予め記憶している音声パラメー゜夕との
内容を比較し、ある値以上の類似度が得られないときに
は判定不能の出力を行ない、ある値以上の類似度が得ら
れたときには最も類似度の^いキーワードを呂崗認謙デ
ータとして入出力インタフェイス36N出で出力する。
なお、類似度の計算のために用いる音声期閣としては、
トリガ回路34によ〕(音一期閣であると判定された時
点以前も極め−(膳襞であるので、CPLJ35はバッ
フ?部385k配憶されている過去200asecの音
声パラメータについての類似度も計篩する。
このように音声認識回路29を構成することに五っ(、
@轡.騒音判定信号によって音声認識の機能を停止した
り機能させたりすることができるので、騒音の大きいと
きの*a識を未然に防止することができる。
第9図は音轡認識回路の他の例を示すブロック図である
。前述の第8図に示す音声認識回路29では、入力遮断
スイッチ291を設け、騒音が大きいときにはこのスイ
ッチ291の接点を開いて音声入力信号を音声認識回路
29に与えないようにした。しかしながら、第9図に示
す実施例では、入力遮断スイッチ291を設けることな
く、CPU35に音声.騒音判定信号を与えるようにす
る.そして、騒音が大きいときにはCPU35による音
声認識動作を禁止するものである。それ以外は前述の第
8図と同じである。
第10図はこの発明の他の実施例の概略ブロック図であ
る。前述の第6図に示す実施例では、前述の第《4》式
のΦ(τ)のτを0としたとき相互相関係数を相互相関
係数計算機25で計算し、Φ(0)の値に応じてマイク
ロホン17と18とに入力された音声が人闇の発音した
音声であるかあるいは外郎からの騒音であるかを判定す
るようにした。しかし、この第10図に示す実施例では
、弟(4)式における相互相関関数Φ(τ)を相互相関
関数組韓1132で計篩する。これは人聞の発aした8
声の場合はτ一〇の近傍にΦ(τ)が最入線を有し、騒
音は側方から入力されると想定し〔いるので、1τ1が
かなりOよりも離れた位置にCきることを用いたもので
ある。このために、相互相関関数計Il機32から相互
相関係数を計算(ノてΦ(τ)を求めた後、このΦ《τ
》がらΦ(r)が蟻大となるτの値を2つのマイクロホ
ン17と18から出力される信号の遅れ時間を遅れ時閣
検出″a331検出する。そして、その遅れ時mをコー
ド化して出hし、その遅れ時閤の範囲が@肉であると判
定すべき範囲かそれとも騒音と判定すべき範囲かを相関
関数しきい値レジスタ34の値によって比較して判定し
、音声であるが騒音であるかを表わす判定信号を出力す
る。それ以外は前述の第6図と同じである。
#111図はこの発明のその他の実施例を示すプロック
図である。この実施例は騒音は側方から入るとしている
ので、1τ1−0から離れた位置に騒音のパワーが集中
することに着目して騒音の判定個号を出力するものであ
る。すなわち、Φ(τ]のうらΦ(0)およびΦ(0)
の近傍に人闇の発音した音声か集中し、それ以外は騒音
とみなすことができることに着目し、前述の第10図に
示す実論例と同様にして、相互相関関数計算器32によ
って相互相関関数の(τ)を演篩する。そして、鰻大値
検出器35によって相互相関関数Φ(τ)の最大値を求
める。また、相互相関関数l1篩lII32は相互相関
係数Φ(0)を出力し、相互相関関数Φ《τ》を相互相
関係数Φ(0)によって演篩1!36’j:割篩Jる。
そじ(、演算器36で演篩され7.:IIの人込さとし
きい値レジスタ37に記憶されている値とを比較器26
で比較し、音声であるかあるいはII音?”あるかを判
定するようにしたしのぐある。それ以外は前述の第10
図に示す実施例と同じぐある。
112図はこの発明のさらにその他の実施例を示す1ロ
ック図であり、第13図は重み関数と音轡,Mm比との
関係の一例を示す図である。
構成において、マイクロホン17と18とから出力ざれ
る呂声信号に基づいて相互相関係数計算機25kよって
相互相関係教Φ(0)を求める部分は前述の第6図に示
す実施例と同じである。そし(、相互相関係数計算機2
5によって求められた相互相関係数は音轡/騒音比対応
信号として類似1[計II曙45に与えられる。
−h.指向性マイクロホン19から出hされた@一伯号
はフィルタ28を介して音声パラメータ抽出器47に与
えられる。なお、フィルタ28は前述の第8図に示すプ
リ1ンフ?シス回路292を占んrいるものとする。@
真パラメータ抽出器47は同じく第8図に示すバンドバ
スフィルタ301ないし308.整流回路311ないし
318およびローバスフィルタ321ないし328など
含む。そして、音声パラメータ抽出器47は各バンドパ
スフィルタ301ないし308のそれぞれIN波数帯域
に応じた信号の強さを出ルし、それを音声パラメータメ
モリ38に与える。この音声パラメータメモリ38は前
述の第8図に示したものど同じものが用いられる。但し
、入力部384には音声の有無にかかわらす類似度計算
機45が入力部384に記憶されたデータに従って計枠
しているとき以外は常時音声パラメータ抽出器47から
出力される音声パラメータを順次更新するように構成さ
れる。
また、前記音声パラメータ抽出器47は指向性マイクロ
ホン19に入力された音声の音の大ぎさ(音圧)に対応
した信号を出力し、これを音声期間判定器48に与える
。音声期閣判定器48はその信号に基づいて音声期間を
決定し、その結果を音声期間レジスタ49に記憶する。
そして、この音声期閤レジスタ49の内容は類似度計算
1145に与えられる。類似度計111145は音声期
間レジスタ49に記憶されている音声期間に基づいて、
音声の始端からたとえば200msec以前と音声の終
ったこととを検知し、終端を決定した時点から音肉パラ
メータメモリ38の入力部384に記憶されていてかつ
音声期閣レジスタ49によって区圓が設定された音肉パ
ラメータのデータと、音声パラメータメモリ38に登録
されているキーワードの音西パラメータのデータとの閣
の類似度の計碑を開始する。この計粋において、類似度
計禅1145は相互相関係数計篩機25から出力される
音声,/M音比対応信号を重み関数として類似度の計韓
を行なう。
なお、この実施例では、音声パラメータ抽出器47から
得られる音轡パラメータは、5isecごとに8種類の
データを取込み、たとえば1秒あたり200回の峙閣軸
に沿ったデータとして得るようにしている。ここで、計
算量を減少するために、時闇の変化の少ない部分のデー
タを捨てることによって情報量を一定量まで減少させる
ような処理を行なっておく。今、1回の取込むデータを
N種.時閤軸h向のデータの長さをMとし、音声パラメ
ータメモリ38の登録部383に記憶されでいる@崗パ
ラメータの1!素をTij,入力された音声の幽轡パラ
メータの要素をPijとしたとき、よく知られたユーク
リッド距“離dは として表わされる。通常、類似度と距II(この場合k
はd》どは、逆数の関係がある。この実施例では、音声
,′騒音の比率に対応したW”(SN)なる更み付けを
行なったユークリッド距IIIldwは、を用いて類似
度を求めている。重み関数W(SN)は一例として、第
13図のようなものが用いられている。但し、第13図
において横軸はSN比.縦軸は麟みを表わしている。
このようにして得られた類似度から、あまりに類似度が
小さい場合には判定不能であるとするが、ある値以1の
類似度がある場合には最大値の類似度を有するキーワー
ドであるとキーワード判定器46において判定し、イン
タフエイス31にそのキーワードに対応した信号を送出
し、ラジオ17の制御を行なう。なお、類似度計算機4
5およびキーワード判定[146は、たとえばマイクロ
コンピュータなどによって構成できる。
上述のごとく音声/騒音比によって重みを変えて距離ま
たは類似度計算を行なうことによって、SN比が大きい
ときの音声パラメータ同士の比較を優先的に行ない、S
N比が小さいときの値はなるべく無視するように構成す
ることによって、音肉・II音比のよくないときの認識
性能を向上できかつ瞬時的に音声/騙音比が低下したと
きの誤認識を特に減少することができる。もちろん、第
13図に示した横軸のS/Nは前述の第5A図で示した
S.′Nを用いてもよいことは言うまでもない。
また、第13図において重み彌数W(SN)は連続的に
変化する関数としたが、簡単なためには、たとえばS/
N−17dBから上を1,下を0と16ような2値によ
る重み付けを行なってもよい。
第14図はこの発明のさらにその他の実施例を示すブロ
ック図である。この第14図に示す実施例は、前述の第
12図に示す類似度計算機45に与える音声/騒音比対
応信号に代えて前述の第10図に示す音声,Ii音判定
信号を与えるようにしたものである。そして、類似度計
粋機45は音声.騒音判定信号が2値であるため、重み
関数W(SN)としても2値として出力する。
第15図はこの発明のさらにその他の実施例を示すブロ
ック図である。この第15図に示す実施例は、前述の第
12図に示す類似度計算機45に与える音声/騒音比対
応信号に代えて前述の第11図に示す演算器43からの
信号を用いるようにしたものである。そして、割算器4
3がらの信号に基づいて、重み関数の値を変えて距離ま
たは類似度計算を行なう。もちろん2値関数として扱っ
てもよいことは言うまでもない。
なお、前述の第10図.第11図.第14図および第1
5図に示す相互相関関数計算機39として、前述の第(
3)式および第(4)式における周期Tを無限大とする
極限を求めないで、ある有限区園において数値計算する
方法がよく用いられる。この場合、データの良さはマイ
ク口ホン17と18との閤隔(30cm程度)の空気の
伝播時閣の2倍(約2ssec)より長ければ計算でき
るが、精度を上げるために10倍以上長くするように構
成される。
なお、上述の実施例において、マイクロホン17と18
は運転者11の口許から等距離にあるものとして説明し
たが、これは必ずしも必要でなく、2つのマイクロホン
17と18から出力され゜る運転者の音声信号の時閤差
をずらせて前述の説明と同様に行なうことができること
は言うまでもない。
また、上述の説明では、この発明を車のラジオ17を制
御するための音声識別装置として説明したが、これに限
ることなくその他の制御対象を制御するために用いても
よいことは言うまでもない。
以上のように、この発明によれば、比較的高い&i@の
中においても大閤の発音した音肉を極めて正確に識別す
ることができる。
【図面の簡単な説明】
第1図はこの発明の一実論例が適用された自動車を横方
向から見た概略図である。第2図は同じく運転者の後方
向から見た概略図である。第3図は同じく自動車の車内
の概略図である。第4図は音声信号と騒音との関係を説
明するための図である。第5A図および第5B図は相関
係数の計算結果の例を示す図である。第6図はこの発明
の一実施例の概略ブロック図である。第7A図および第
7B図は相関関数計算機の一例を示す概略ブロック図で
ある。第8図は第6図に含まれる音声認識回路の具体的
なブロック図である。第9図は音声認識回路の他の例を
示すブロック図である。第10図はこの発明の他の実施
例の概略ブロック図である。第11図はこの発明のその
他の実施例を示す概略ブロック図である。第12図はこ
の発明のさらにその他の実施例を示す概略ブロック図で
ある。第13図は重み関数と音声/騒音比との関係の−
例を示す図である。第14図はこの発明のその他の実施
例を示すブロック図である。第15図はこの発明の他の
実施例のブロック図である。 図において、17.18.19はマイクロホン、25は
相互相関係数計算機、26は比較器、27,41.44
はレジスタ、29は音声認識回路、31はインタフエイ
ス、38は音声パラメータメモリ、39は相互相関関数
計算機、40は送れ時間検出器、42は最大値検出器、
43は割算器、45は類似度計算器、46はキーワード
判定器、47は音声パラメータ抽出器、48は音声期闇
判定器、49は音声期間レジスタを示す。 633一 一634 635 一636 637 ト続補正書(一知 1,,{?1、57年8月20日 4’ru’lIiJ二官殿 1.・Itf+の表示特願昭57−68141!2.発
明の8称 音声mJilttiit 3.抽市をする者 事件との関係特許出願人 住所東京都千代[11区丸の内二丁目2番3号8作(6
01)三菱電機株式会と1. 代表古゛進−=11一祠ル==和一 ,1.代理人片山仁八郎 住所東京都千代I1区丸の内二丁目2番3号三菱電代株
式会社内 氏名(6699)弁理士詰:1い2,。鴇,3)3&ユ
が一5.補正の対象 明細書の全文および図面 6.補正の内容 (1)明細書の全文を別紙のとおり。 (2)図面の第1図.第2図.第4図.第6図,第7A
図.第7B図.第10all,第11図.第12図.第
14図および第15図を別紙のとおり. 全文訂正明細書 1.発明の名称 音声戴別輪置 2、特許請求の範囲 (1)発音者の発音した音声なllllJするための音
声識別@胃であって、 それぞれが前記発音者の近傍に所定の一隅を有して配置
され、入力された音声を電気信号に変換する少なくとも
第1および第2の音声入力手段を含む音声電気信号変換
手段、 前記第1の音声入力手段から出力される音声入力信号か
ら予め定める周波数帯域成分の音声信号を抽出する第1
のフィルタ手段、 前記第2の音声入力手段から出力される音声入力信号か
ら前記第1のフィルタ手段と同一の周波数帯域成分の音
声信号を抽出する第2のフィルタ手段、 前記第1および第2のフィルタ手段から抽出されたそれ
ぞれの音声信号の相肛演算する相1良算手段、および 前記相11算手段からの演算結果に碁づいて、前記音声
電気信号変換手段から出力される音声信号が前記発音者
の発音した音声に基づくものであるかあるいは騒音に基
づくものであるかを判別する音声判別手段を備えた、音
声識別装置.(2》前記音声判別手段は、 予め定める音声対騒音比としての値を記憶する記憶手段
、 前記記憶手段に記憶している音声対騒音比と前記相11
算手段出力とを比較し、音声対騒音比の大小を表わす信
号を出力する比較手段、および前記比較手段からの音声
対騒音比の大小を表わす信号に基づいて、前記音声電気
信号変換手段から入力された音声信号の音声認識を行な
うかあるいは音声認識を不能にする音声認識手段を含む
、特許諺求の@囲第1項記載の音声識別装置。 (3)前記@肌算手段は、前記第1および第2のフィル
タ手段から出力された音声入力信号のそれぞれの時薗差
に対応した相関係数を演算する相関係数演算手段を含み
、 前記記憶手段は予め定める相関係数を音声対騒音比対応
信号として記憶し、 前配比較手段は前記相関係数演算手段出力と前記記憶手
段に記憶している相関係数とを比較して発音者の発音し
た音声と騒音との比に応じた音声a音判定信号を出力す
るようにした、特許請求の@曲第2項記載の音声識別装
置。 (4)前記音声判別手段は、 前記相関係数演桿手段出力から相関係数の最大値を有す
る時藺を検出する遅れ時閤検出手段と、前配第1および
第2の音声入力手段出力の音声入力信号のそれぞれの8
I問差を中央値とし、それから所定の時関のtillの
値を記憶する時簡範囲記憶手段と、 前記遅れnm検出手段によって検出された遅れ時閣と前
記時藺範囲記憶手段の内容とを比較し、遡れ時閤が前記
時閤範囲記憶手段の内容に碁づくaS内に含まれている
ことに応じて音声判定信号を出力し、前記範囲外であれ
ば騒音判定信号を出hする1112の比較手段と、 前記第2の比較手段からの音声判定信@に応じて前記音
声電気信号変換手段から入力された音声入力信号のml
mを能動化し、前配騒音判定信号に応じて前記認識を不
能化する第2の音声認識手段とを含む、特許請求の範囲
第1項記載の音声謙別@胃。 《5》前記第1または第2の音声lI真手段は、前記音
声電気信号変換手段出力に基づいて音声パラメータを抽
出する音声パラメータ抽出手段と、 予め定める音声パラメータを記憶する音声パラメータ記
憶手段と、 前記音声パラメータ抽出手段から−の音声パラメータと
前記音声パラメータ記憶手段に記憶している音声パラメ
ータとの類似度を演禅する類似度演算手段と、 前記類似度演算手段による類似度の演算結果に基づいて
いずれの音声であるかを判定するキーワー.ド判定手段
とを含み、 前記隅似度演綽手段は、前記相関係数演算手段出hの相
関係数に基づく音声対騒音比対応信号に応じた重み関数
を11l曙して類似度演算を行なうようにした、特許請
求の軛囲第2墳または第4塙に記載の音声厘別@胃。 《6》前記重み関数は2値信号である、特許請求の範囲
第5項記載の音声謙別装胃。 (7》前記音声電気信号変換手段は、前記音声判別手段
に音声m号を与える第3の音轡入力手段を含む、特許請
求の範囲第1項記載の音**別V4@。 《8》船記13の音声入力手段は指向性マイクロホンを
含む、特許請求の箱囲第7項記載の音轡減別鶴置。 (9)前記第1および第2の音声入力手段はそれぞれ前
記発音者の口許から等距離の位一に配置される、特許請
求の範囲第1項記載の音声識別@ぼ。 3.R明の詳報な説明 この発明は音声識別装置に関し、特に、音声を入hし、
その音声の内容に基づいて各種被制御機器を制御するた
めに用いられるような音声露別装置の改良に関する。 たとえば、自動車などにおいて運転者がラジオなどの車
載機器を操作する場合には、一般に手動的に行なうこと
が多い。しかし、運転者が車を運転中にラジオなどを操
作するためには、しばしば視糠を前方から機器の操作部
に移す必要があり、このことが脇見運転の原因になり、
非常に危険を伴う。また、Ia近では運転者用の車載用
計算機が実用に供されているが、このような阜載用計算
一機を、運転しながら操作することは不司能に近いもの
であった。この他にも、窓の開閉やその他の車載機器を
操作する場合においても同様のfat題点を生じていた
。 そこで、運転者が手動的な操作によることなく、ラジオ
の電源投入や窓のrla閏などをすることができれば便
利である。このためには、運転嵜が「ラジオ」と発音し
たとき、この音声を識別してその謙別枯果に基づいてラ
ジオをIlljrするような音声入力Ill御輪置が考
えられる。このような音一入力制mu置では、運転者の
近傍にマイクロホンを設けておき、このマイクロホンに
入力された音声を識別する。ところが、自動車の窓が開
かれていると、外部からの騒音がマイクロホンに混入し
てしまい、運転者の発音した音轡と騒音との識別が楡め
C圃雌になり、車載嶺器などを誤動作させる原因となっ
ていた。 それゆえに、この発明の主たる目的は、外部からのM@
と人閑の発音したisとを容易に識別し得る音声繊別@
一を捉供することである。 この発明を要約すれば、発音者の近傍に所定のlI陽を
隔てて第1および第2の入力手段を配置しておき、それ
ぞれの音声入力手段から出力された音声人力信号から予
め定める周波数帯域成分の音P信号を抽出し、それぞれ
の音声信号の相関を演算し、その演算Ii!1果に碁づ
い゛(音声電気信号変換手段から出力された音声信号が
発音者の発音した音声に基づくものであるかあるいは騒
音に基づくものであるかを判別ずるようk構成したもの
である。 この発明の上述の目的およびその他の目的と特徴は以下
に図面を参照して行なう詳細な説明から一層明らかとな
ろう。 ill図はこの発明の一実施例か通用された自動車を横
方向から見た概略図であり、′IR21は同じく運転者
の後方内から見た概略図であり、第3図は同じく自動車
の車内の概略図である。 まず、Wi1図ないし第3躬を参照しで、この発明の概
襞について説明する。運転者11は車体12に設けられ
ている座席13に着席し、シフトレバー14およびスデ
アリングホイール15を操作して運転する。計器I!1
6にはたとえばカーラジA7が取付けられている。また
、天井20には、運転者11の正曲方向に直交して等距
離の位置に所だの闇隔.を有して第1iJ3よび第2の
音声人ノ】手段としてのマイクロホン17と18とが取
付けられている。さらに、これらのマイクロホン17と
18との藺には指向性マイクロホン19が設けられてい
る。 運転者11がたとえばラジオ7の電源を投入しようと1
る場合は、予め定められている制御用の@F!(玖下、
キーワードと称する》を発音する。 この名Toμ空気中を伝播し、マイクロホン17と18
と19とk入る。このとき、マイクロホン17と18が
運転者11から等距離の位g&:設けられているので、
音声はこれらのマイクロホン17と18と&−同峙に伝
播されることになる。マイクO小ン17と18と(入力
された音声は電気信号に置換されて音肯イ^りとなり、
この2つの音声信1の相n@関係数が求められる。騒音
が入力されていない場合には、相関係教は1に近い値が
得られ、音fvi伯号は騒音に比べて十分に大きいこと
が相関係数の伯から示される。逆に、大きな騒音が人力
された場合には相関係数は0に近い値が得られ、音肉信
号はii@に比べて十分に小さいことが小される。そし
て、この相U相関係数の値に蟇づい−(、指向性マイク
ロホン19から出力される音肖偵号を認識するか否かを
判別する。そして、相豆相関係数が1に近い値であれば
、指向性マイクL]ホン19から出力される音声信号と
予め記憶されているキーワードの音声パラメータとを比
較し、いずれのキーワードであるかを判別する。そして
、この判別結果に基づいてたとえばラジオ7などの各種
車載機器を制御する。 なお、上述の説明では、音P認戴用の音声信号を指向性
マイクロホン19から出力するようにしたが、特に指向
性マイクロホン19を設けることなく、マイクロホン1
7または18のいずれか一方からの音一信号を認識する
ようにしてもよい。 しかしながら、運転者11の発音した音声を分析して認
識を行なうための音声信号のS/N比としては十分高い
ものが好ましく、周囲雑音を除去できる高指向性マイク
ロホンを用いるのが望ましい。 第4図は音声信号と騒音との関係を説明するための図で
あり、第5A図および第5B図は相互相関係数の計算結
果例を示す図である。 次に、2つのマイクロホン17と18とから出力される
音声信号の相互相関について説明する。 第4図において、騒音発生Ii100として、この場合
は一例として自動車騒音について考えてみる。 運転#114Jマイクロホン17と18とから等距Il
1k日計がくる位駅に座っており、運転者11のirh
&こは自wJ串のフロン1−ガラス(図示せず),17
3にはリアウインドウ(図示ttr>が存在するものと
し、騒音宛生miooは運転者11の側方kあるものと
寸る。 騒音発生鎗゛100から&igKがマイクロホン17と
18とに伝播する遅延時園差をτ0とし、その&II1
差はマイクロホン17と18との閣隔dに比べ又、マイ
クロホン17と18とから騒音源100の距離が十分に
人込いものとみなして考慮せずに振幅は同一であると{
る。また、運転者11により発生された音声信号3a,
3bはマイクロホン1lと18とに同一の振幅と時間で
伝播するものとプる。このとき、マイクロホン17と1
8との峙−{6月a(()とb(t>は、音声信号をS
(l).騒置発生源100からの騒音n(t>とすると
、 a(j)”S(t)十r+(L)”’(1)b(t)−
s(t)+n(t+τo)−(2)と表わすことができ
る。ここで、相互相関関数φab(τ》および正規化相
互相関関数Φ(τ》はそれぞれ、 ψab(τ》 である。但し、φaa(0).φbb(0)は、a(t
),b(t)の自己相関関数φaa(r),φbb(τ
)のそれぞれτ−0のときの値であって、パワーを表わ
しており、 で表現できる。ここで、 S(t)【SslnωS【 n(+)−Nslnωnt とリる.a1シ、ωS,ωnはs(t),n(t)の角
同波数であり、S,NはS(t).n(t)の振幅を示
L,(いる。そして、(lノs−2πfs,ωn−Qy
:tnテあると{ると、止規化相互相rI4lIl数の
(r>は、′ Φ〈τ) −.f3’OOS(IJsr −+N′COS(t)n(τ−}τQ)),.’(3’
+N2)・・・(ア) であり、まt二τ−0とすれは、 Φ【0》 −(S’−IN’008(nnro)/(S”+N2)
・・・(8》 である。 さらに、s(t),n(t)がそれぞれLm,M個の正
弦波から成立っている場合には、となるので、 であり、またτ−0とすれば、 である。 前述の第(8)式において、τo−333μSつまりマ
イクロホン17と18との闇隔dが約11.30一にお
ける計禅桔果を第5A図に示している。この15A図か
ら明らかなように、鍔方がら入ってくる騒音が大きくな
りかつS/Nが小さくなるに従い正規化相関関数の小さ
くなることがわかる。但し、正弦波の場合には、17′
τ0の周波数の整数暗に近い周波数の&i音の場合には
、第5A図に示したよ)にはならないことは朗らかであ
るので、実際にはそのような成分を小さくした状j1(
−求める必要がある。 また、前述の厄《12》式において、τo=333μs
,d−11.3cmにおける計篩結果を第5B図に示し
ている。この第5B図では、騒酋n《【》を n([)一0.43i『+(27L−i00)I+l.
Osin(2π・400)t +1.Qsir+(2vi・1000>j+1.0si
n(2π・3100)t ・・・(13) とし、100Hz.400Hz.’IkHz,3.1k
Hzの4つの周波数成分が0.4.1.1.1の比率で
含まれているものとした。この場合には、τo−333
μsの同期に近い3.1kHzの成分や低い周波数成分
を含んでいるので、Φ《0》はさほど小さくはならない
が、それでもS/Nか小さくなると、Φ《0》が小さく
なる傾向が見られる。 この発明は2つのマイクロホン17と18とから出力さ
れる音P信号の相関関係を用いて音轡信号のS/N比を
推定し、その値によって認識結果の有効あるいは無効を
決定したり、類似度計算に重み付けしたりすることによ
って、騒音による誤認wAや誤判定を防止できるような
音声識別装置を構成できる。以下に、この発明の実施例
について詳細に説明する。 第6図はこの発明の一寅施例の概略ブロック図である。 前述のw42図および第3図に示したマイクロホン17
からの音声伽号は増幅器21で増幅され、フィルタ22
によって識別したい周波数帯域《通常は音轡周波数帯域
》のみが抽出され、相互相関係数計算4125に与えら
れる。他方のマイクロホン18からの音声信号は同様に
して増幅器23で増幅ざれ、フィルタ24によって識別
したい周波数帯域成分のみが抽出されて相互相関係数針
詩機25に与えられる。この相互相関係数計算機2b+
.t入力された2つの音声信号から相互相関係数Φ(0
)を求めるものである。この相互相関係数針紳様によっ
て計禅された相互相一係数Φ〈0》の値によってS/N
を推定することができる。このために、相互相関係数針
算lI25で計算された相互相関係数Φ(0)が比較器
26に与えられる。比較器26には予め定める相関係数
を記憶ζるための相関係数しきい値レジスタ27が接続
される。そして比−校126は相互相関係数計稗機25
で計綽された相互相関係数Φ(0)の値ど相関係数しき
い値レジスタ27に記憶されている相関係数とを比較し
、指向性マイクロホン19から出力される音声信号をl
!識するために騒音が小さいか否かの判定を行なう。そ
して、その判定偽号を音声認m認識回路29に与える。 一方、指向性マイクロホン19は2つのマイク1ホン1
91と192とを含み、それぞれから出力された音声信
号は増幅器193および194で増幅され、加碑器19
5で加桿されてフィルタ28に与えられる。このフィル
タ28は音声信号として不必要な低周波領域や高周波領
域の信号成分を除去するためのものである。フィルタ2
日の出力信号は音声認識回路29に与えられる。音声認
識回路29は後述の第8図で詳細に説明するが、入力さ
れた騒音の混入した音声信号から特徴パラメータを抽出
し、メモリ38に予め登録されている音轡パラメータと
の類似度を求め、その類似度が一致していると判断する
のに十分でない場合には、入力された音声信号を判定で
きないことを出力し、最も類似度が大きくかつ類似度が
十分に大きい場合にはそのデータであると判定して出力
するものである。 音声lI減回路29には比較器26から音声の騒音判定
信号が与えられており、この信号が騒音であることを示
している場合には、音声am回路29は騒音または判定
不能を表わす信号を出力することによって、騒音が大き
いときに各種機器、この実施例ではラジオ7が誤動作し
ないように構成さtLる。 第7Δ図は′/#6図に示す相互相関係数計算機25の
一例を示1概略ブロック図である。第7A図Vおいて、
a(t)はマイクロホン17から出力さわる音声他号て
あり、b(t)はマイクロホン18から出力される音轡
信号である。そして、乗稗121251と積分!!25
4と対数変換器257は前述の!(5)式を演粋するも
のである。すなわら、乗婢器251はaを2乗し、これ
を積分器254で柚分し、対数蛮換器257によって対
数化し、対数化されたφaa(0)を演粋する。また、
重碑器252と積分器256と対数変換器259は前述
の第《6》式の演算を行なうものである。 すなわち、業稗器252はbを2乗し、積分器はb;を
積分し、対数麦換器259は先の対数変換′a257と
同様に対数化されたφbb(0)を求める。対数変換器
257と259との出力は加算器260′c2Xl算さ
れ、1/2減資器261によっテその平方根に対応した
処理が行なわれる。したがって、172減貞器261の
出力には、前述の第(4)式の分母に対応した結果が得
られることになる。 一方、乗算器253と積分器255と対数賓換器258
は前述の第(3)式のτ一〇のときの演算を行なうもの
である。すなわち、乗算器253はaとbとを乗算し、
それを積分器255が積分し、対数変換器258は第(
3)式のφab(0)の対数化された値を出力する。こ
の出力は加稗器262に与えられ、1/2減衰器261
の出力と減算され、指数蛮換器263によって指数化し
てもとに戻され、Φ(0)が出力される。すなわち、こ
の第7A図に示す相互相関係数計稗1125は、マイク
ロホン17および18から出力される音轡信号に基づい
て、騒音が小さい場合にはΦ(0)=1を出力し、騒音
が大きい場合にはΦ《0)一1を出力する。 第78lI1は相互相関係数計算機の他の例を示す概略
ブロック図である。第7BvAにおいて、2鍬平均値回
路(RMS)266は時間成分aの2乗平均を開根する
ものであり、(T=”を演棹する。 加神器264はaとbとを加算し、RMS267rよっ
T.イの2乗平均一a+]1が演算さわる。加粋器26
5はaとーbとを如禅するものであり、RMS268は
その結果の21F平均値J(a−−’b)’を演算する
。RMS268#bの2亀平均値,’T’”を演飾する
。各RMS266ないし269の演vI結宋は演粋回路
269によってA2−82/4CDを演算し、Φ《0》
を求める。 mo図1,L第6図に含まれる音座認臓回路29の具体
的ljブロック図である。この第8@1k示す音声籠鳳
回路29は従来から知られたチャネルフィルタを川いた
ものであって、以下イの構成と動作1ついて簡単に説明
する。入力遮断スイッチ291に41人力信号として第
6図に示すフィルタ28から指向性マイクロホン19か
らの音一人力信号がちλられる,また、入力遮断スイッ
チ291には−1御伯号として第6図に示す比較器26
から音}&IM!判定信号が入力される。そして、入力
遮断ス−インチ291は名声騒音判定信号が音声を表わ
リ4hG’(あるとき閉じられて認識動作を行ない得る
状態となり、音声でないつまり騒音であると判定されて
いるときには開いてawA動作を停止した状態となる。 このような機能を有する入力遮断スイッチ291を介し
て音声信号がブリエンファシス回路292に与えられる
。ブリエンファシス回路292は入力された音声信号の
うちの300ないし5kHzの帯域成分のみを通過させ
る6dB/OCt程度の特性を有するフィルタである。 プリエンファシス回路292を通過した音声信号は、バ
ンドバスフィルタ(BPF)301ないし308に与え
られる。これらのバンドパスフィルタ301ないし30
8はそれぞれ予め定められた帯域成分の音声信号のみを
通過させて、後段の整流回路311ないし318に与え
る。この整流回路311ないし318はそれぞれバンド
バスフィルタ301ないし308の出力信号を整流して
直流電圧に変換する。整流された直流電圧はローパスフ
ィルタ321ないし328に与えられる。 これらのローパスフィルタ321ないし328は、一種
の積分機能を有したものである。さらに、入カされた信
号に踵み付けをしで加算し、その信号を1・リガ回路3
4に与え,る。1・リガ回路34は入力されたtX号の
変化に応じてa声の始端と終端を検出し、CPtJ35
に対して音声期間であることを臭わす信目を与える。ま
た、ローバスフィルタ321ないし328のそれぞ4t
出h信号はマルチブレクサ333に5λられる。マルチ
ブレクサ33には、CPjJ35から人出力インタフ上
.イス36を介して0−バスフィルタ321ないし32
8のそれぞれの出力fJ号を切鋳るための切替信号が与
えられる。そしC1マルヂノレクサ33はその切!!信
月に応答して、いずれかのローバスフィルタの出力をA
−D変撲器37に与える。A−D変換器37は、入力さ
れたアナログ電圧をデCジタル値に変換するものぐある
。このデfジタル値に変換された信号は、入出力インタ
フェイス36を介しUCPU35に与えられる。メモリ
38は音声1I二必殼なプログラムを記Illるプログ
ラムメモリ381と、音声l!職に必要なデータを記憶
する音角八シメータメモリ382とを含む。音声バラメ
ータメモリ382は予め登録された分析パラメータを記
憶する登録部としての記憶傾域383と、入出力インタ
フエイス36から出力された音声パラメータを記憶する
入力部としての記憶領域384と、200+sac程度
の信号の分析パラメータを記憶するためのバッ77部と
しての記憶領域385とを含む。200ssec程度の
信号の分析パラメータを記憶するのは、音声認識をする
上において音声期閤としてはトリガ回路34によって音
声期間であると判定された時点以前も極めて重要である
ので、類似度を計算する際にはバツフ冫部385の内容
から始点部を欄って検出するためである。 次に、動作について説明する。入力遮断スイッチ291
は第6図に示す比較器26から騒音であることを表わす
判定信号が入力されるとその接点をlNlと、音声であ
ることを表わす判定信号が入力されればその接点を閉じ
る。接点が閉じられると、音声入力信号はブリエンフ7
シス回路292,バンドバスフィルタ301ないし30
8.整流回路311ないし318およびローパスフィル
タ321ないし328に順次与えられる。マルチプレク
サ33はCPLI35から入出力インタフエイス36を
介して出力ざれる切替信号に応答して、各ローバスフィ
ルタ321ないし328のそれぞれの出力を順次選択し
てA−DI換器37に与える。 A−D変換器37は入力された信号をデイジタル値に変
換し、入出力インタフエイス36を介して音声パラメー
タメモリ382の入力部384に記憶させる。一方、ト
リガ回路34はローバスフィルタ321ないし328の
信号によって、音声期閣の終了を判断し、CPU35に
割込信号を与える。応じて、CPU35は入力部384
に記憶した音声パラメータと登録部383に予め記憶し
ている音声パラメータとの内容を比較し、ある値以[の
類似度が得られないときには判定不能の出力を行ない、
ある値以上の類似度が得られたときには最も類似度の高
いキーワードを音声認識データとして入出力インタフエ
イス36経由で出力する。 なお、類似度の計算のために用いる音声期聞としては、
トリガ回路34によって音声期閤であると判定された時
点以前も極めてl1!!であるので、CPLI35はバ
ツフ7部385に記憶されている過去200g+sec
の音声パラメータkついての類似度も計算する。 このように音声m11回路29を構成することによって
、音声,騒音判定信号によって音声認識の機能を停止し
たり機能させたりすることができるので、騒音の大きい
ときの誤認識を未然に防止することができる。 第9図は音声認鳳回路の他の例を示すブロック図である
。前述の第8図に示す音声I!I1回W129では、入
力遮断スイッチ291を設け、騒音が大きいときにはこ
のスイッチ291の接点を開いて音声入力信号を音声m
I1回路29に与えないようにした。しかしながら、第
9図に示す実施例では、入力遮断スイッチ291を設け
ることなく、CPLJ35に音声,騒音判定信号を与え
るようにする。 そして、騒音が大きいときにはCPLJ35による音声
am動作を禁止するものである。それ以外は前述の第8
図と興じである。 第10図はこの発明の他の実施例の概略ブロック図であ
る。前述の第6図に示す実施例では、前述のl(4)式
のΦ(τ》のτを0としたとき相h相関係数を相互相関
係数計算機25で計稗し、Φ(0)の値に応じてマイク
ロホン17と18とに入力された音声が入閣の発音した
き声であるかあるいは外部からの騒音であるかを判定す
るようにした。しかし、この第10図に示す実施例では
、111(4)式における相互相関関数Φ(τ》を相互
相関関数計IFm3’9で計算する。これは人聞の発音
した音声の場合はτ−0の近傍にΦ(τ》が最大値を有
し、騒音は側方から入力ざれると想定しているので、τ
一〇近傍以外の位置にできることを用いたものである。 このために、相互相関関数計$11132から相互相関
係数を計禅してΦ(τ゛)を求めた後、このΦ(τ)か
らの(τ)が最大となるτの値を2つのマイクロホン1
7と18から出力される伯号の遅れ時間を遅れ時間検出
器33で検出する。そして、その遅れ時閤をコード化し
て出力し、その遅れ時間の範囲が音声であると判定すべ
き範囲かそれとも騒音と判定すべき軛囲がを相関関数し
きい値レジスタ34の値によって比較して判定し、音声
であるか騒音であるかを表わす判定信号を出力する。そ
れ以外は前述の第6図と同じである。 第11図はこの発明のその他の実施例を示すブロック図
である。この実施例は騒音は側方から入るとしているの
で、τ一〇から鐘れた位胃に騒音のパワーが業中するこ
とに着目して騒音の判定信号を出力するものである。す
なわち、Φ(τ)のうちの《0》およびΦ《0》の近傍
に人間の発音した音声が集中し、それ以外は騒音とみな
すことができることに着目し、前述の第10図に示す実
施例と同様にして、相互相関関数計算器32によって相
互相関関数Φ(τ)を演禅する。そして、最大嬢検出器
35によって相互相関関数Φ(τ)の最大値を求める。 また、相互相関関数計算III32は相互相関係数Φ(
0)を出力し、相互相関関数の(r)を相互相関係数の
《0》によって演算器36で割粋する。そして、演篩!
l36で演算された値の大きさとしきい値レジスタ37
に記憶されている値とを比較器26で比較し、音声であ
るかあるいは騒音であるかを判定するようにしたもので
ある。それ以外は前述の第10図に示す実施例と同じで
ある。 I@12図はこの発明のさらにその他の実施例を示すブ
ロック図であり、第13図は重み関数と音轡/騒a比と
の関係の一例を示す図である。 構成において、マイクロホン17と18とから出力され
る音声信号に基づいて相互相関係数計算1125(よっ
て相互相関係数Φ(0)を求める部分は前述の第6図に
示す実施例と同じである。そして、相互相関係数計算1
125によって求められた相互相関係数は音声/騒音比
対応信号として類似度針算1145に与えられる。 一方、指向性マイクロホン19から出力された音声慎号
はフィルタ28を介して音声パラメータ抽出1147に
与えられる。なお、フィルタ28は前述の第8図に示す
ブリエンフ7シス回路292を含んでいるものとする。 音声パラメータ抽出器47は同じく第8図に示すバンド
パスフィルタ301ないし308,整流回路311ない
し318およびローバスフィルタ321ないし328な
ど含む。そして、音声パラメータ抽出器47は各バンド
バスフィルタ301ないし308のそれぞれ周波数帯域
に応じた信号の強さを出力し、それを音声パラメータメ
モリ38に与える。この音声パラメータメモリ38は前
述の第8図に示したものと同じものが用いられる。但し
、入力部384には音声の有無にかかわらす類似度計算
機45が入力部384に記憶されたデータに従って計算
しているとき以外は常時音声パラメータ抽出1147か
ら出力される音声パラメータを順次更新するように構成
される。 また、前記音声パラメータ抽出器47は指向性マイクロ
ホン19に入力された音声の音の大きさ(音圧)に対応
した信号を出力し、これを音声期閣判定器48に与える
。音声期間判定器48はその信号に基づいて音声期間を
決定し、その結果を音声期閤レジスタ49に記憶する。 そして、この音轡期閣レジスタ49の内容は類似度計算
機45に与えられる。類似度計棹1145は音声期間レ
ジスタ49に記憶ざれている音声期閣に基づいて、音轡
の始端からたとえば200■aee以前と音声の終った
こととを検知し、終端を決定した時点から音声パラメー
タメモリ38の入力部384に記憶されていてかつ音声
*nmレジスタ49によって区聞が設定された音声パラ
メータのデータと、音声パラメータメモリ38に登録ざ
れているキーワードの音声パラメータのデータとの図の
類似度の計算を開始する。この計算において、類似度計
算機45は相互相関係数針粋III25から出力される
音声/騒音比対応信号を重み関数として類似度のat稗
を行なう。 なお、この実施例では、音声パラメータ抽出器47から
得られる音声パラメータは、5ssecごとに8種類の
データを取込み、たとえば1秒あたり200回の時閤軸
に沿ったデータとして得るようにしている。ここで、計
算慟を減少するために、時薗の変化の少ない部分のデー
タを捨てることによって情報量を一定量まで減少させる
ような処理を行なっておく。今、1回の取込むデータを
N種,時閣軸方向のデータの長さをM個とし、音声パラ
メータメモリ38の登録部383に記憶されている音声
パラメータのamをTIJ.入力された音轡の音声パラ
メータのII索をPiJとしたとき、よく知られたユー
クリッド距離dは として表わされる。ここで1は1回に取込まれたN種う
ちの種類に、jは時閣軸方向のデータの順序にそれぞれ
対応している。通常、類似度と距離(この場合にはd)
とは、逆数の関係がある。この実施例では、音声/騒音
の比率に対応したW(SN>なる重み付けを行なったユ
ークリッド距離dWは、 を用いて類似度を求めている。重み関数W(SN)は一
例として、第13ailのようなものが用いられている
。但し、Jlflla図において横軸はSN比,縦軸は
膿みを表わしている。 このようにして轡られた類似度から、あまりに類似度が
小さい場合には判定不能であるとするが、ある値以上の
類似度がある場合には最大値の類似度を有するキーワー
ドであるとキーワード判定器46において判定し、イン
タフエイス31にそのキーワードに対応した信号を送出
し、ラジオ7の制御を行なう。なお、類似度計算機45
およびキーワード判定器46は、たとえばマイクロコン
ピュータなどによって構成できる。 上述のごとく音声/騒音比によって重みを変えて距離ま
たは類似度計算を行なうことによって、SN比が大きい
ときの音声パラメータ同士の比較を優先的に行ない、S
N比が小さいときの値はなるべく無視するように構成す
ることによって、音一/′騒音比のよくないときの認識
性能を向上できかつ瞬時的に音声/騒音比が低下したと
きのllIl!謙を特に減少することができる。もちろ
ん、第13図に示した横軸のS/Nは前述の第5A図で
示したS/Nを用いてもよいことは言うまでもない。 また、第13図において重み関数W(SN)は連続的に
変化する関数としたが、簡単なためには、たとえばS/
N−17dBから上を1,下をOとするような2Iによ
る重み付けを行なってもよい。 第14図はこの発明のさらにその他の実施例を示すブロ
ック図である。この第14図に示す実施例は、前述の第
12図に示す類似度計算1145に与える音一ン騒音比
対応信号に代えて前述の第10図に示す音声,騒音判定
信号を与えるようにしたものである。そして、類似度計
算機45は音一,騒音判定信号が2値であるため、重み
a数W(SN》としても2値として出力する。 W415図はこの発明のさらにその他の実施例を示すブ
ロック図である。この第15図に示す実施例は、前述の
第12図に示す類似度計算1145に与える音声/騒音
比対応信号に代えて前述の第11図に示す演算器43か
らの信号を用いるようにしたものである。そして、割$
11143からの信号に基づいて、重み関数の値を麦え
て距離または類似度計算を行なう。もちろん2値関数と
して扱ってもよいことは言うまでもない。 なお、前述の第10図,第11図.第14図および第1
5図に示す相互相関関数計算機39として、前述の第《
3》式および第(4)式における周期Tを無限大とする
極限を求めないで、ある有限区閤において数値計禅する
方法がよく用いられる。この場合、データの長さはマイ
クロホン17と18との閣隔(30c一程度》の空気の
伝播時間の2倍(約7msec)より長ければ計算でき
るが、精度を上げるために10倍以上長くするように構
成ざれる。 なお、上述の実施例において、マイクロホン17と18
は運転者11の口許から等距離にあるものとして説明し
たが、これは必ずしも必要でなく、2つのマイクロホン
17と18から出力される運転者の音声信号の時閤差を
ずらせて前述の説明と同嫌に行なうことができることは
言うまでもない。 また、−[述の説明では、この発明を串のラジオ7を制
御するための音声識別@麿として説明したが、これに限
ることなくその他の制御対象を制御するために用いても
よいことは言うまでもない。 以上のように、この発明によれば、比較的高い騒音の中
においても人闇の発音した音声を極めて正確に謙別する
ことができる。 4.図面の簡単な説明 第1図はこの発明の一寅施例が適用された自動車を横方
向から見た概略図である。第2図は同じく運転者の後方
向から見た概略図である。第3図は同じく自動車の車内
の概略図である。第4図は音声信号と騒音との関係を説
明するための図である。第5A図および第58図は相関
係数の計弊結果の例を示す図である。第6図はこの発明
の一実施例の概略ブロック図である。第7A図および第
7B図は相関関数計算機の一例を示す概略ブロック図で
ある。第8図は第6図に含まれる音声Il!識回路の具
体的なブロック図である。第9図は音声l1l1回路の
他の例を示すブロック図である。第10図はこの発明の
他の実施例の概略ブロック図である。第11図はこの発
明のその他の実施例を示す概略ブロック図である。第1
2図はこの発明のさらにその他の実施例を示す概略ブロ
ック図である。第13図は重み間数と音声/w4音比と
の閏係の一例を示す図である。第14図はこの発明のそ
の他の1Il#1例を示すプOツク図である。第15図
はこの発明の他の実施例のブロック図である。 図において、17.18.19はマイクロホン、25は
相互相関係数計算機、26は比較器、27,41.44
はレジスタ、29は音声認識回路、31はインタフエイ
ス、38は音声パラメータメモリ、39は相互相関関数
計算機、40は遅れ時間検出器、42は最大値検出器、
43は割算器、45は類似度計算器、46はキーワード
判定器、47は音声パラメータ抽出器、48は音声期闇
判定器、49は音声期間レジスタを示す。 648一 649= 650 651

Claims (1)

  1. 【特許請求の範囲】 《1》発音者の発音した音声を識別するための音声識別
    装曽てあって、 それぞれが前記発音者の近傍に所定の閲隔を有して配置
    され、入力された音声を電気信号に変換する少なくとも
    第1およびW42の音声入力手段を含む音肉電気信号変
    換手段、 前記第1の音声入力手段から出力される音声入力信号か
    ら予め定める周波数帯域成分の音声信号を抽出する第1
    のフィルタ手段、 前記第2の音声入力手段から出hされる音声入力信号か
    ら前記第1のフィルタ手段と同一の周波数帯域成分の音
    声信号を抽出する第2のフィルタ手段、 前記第1および第2のフィルタ手段から抽出されたそれ
    ぞれの音声信号の相関関係を演算する相関関係演算手段
    、社よd 前記相関関係演算手段からの演算結果に基づいて、前記
    音声電気信号変換手段から出力される音声信号が前記発
    音者の発音した音声に基づくものであるかあるいは騒音
    に基づくものであるかを判別する音声判別手段を備えた
    、音声識別装置。 《2》前記音声判別手段は、 予め定める音声対騒音比としての一を記憶する記憶手段
    、 前記記憶手段に記憶している音声対騒音比と前記相関関
    係演算手段出hとを比iし、音声対騒音比の大小を表わ
    す信号を出力する比較手段、および 前記比較手段からの音声対騒音比の大小を表わす信号に
    基づいて、前記音声電気信号変換手段から入力ざれた音
    声信号の音声aSを行なうがあるいは音声認謙を不能に
    する音声認識手段を含む、特許請求の範囲第1項記載の
    音声識別装置。 《3》前記相関関係演算手段は、前記第1および第2の
    フィルタ手段から出力された音声入力信号のそれぞれの
    時閣差に対応した相関係数な演算する相関係数演算手段
    を含み、 前記記憶手段は予め定める相関係数を音声対騒音比対応
    信号として記憶し、 前記比較手段は前記相関係数演算手段出力と前記記憶手
    段に記憶している相関係数とを比較して発音者の発音し
    た音声と騒音との比に応じた音声騒音判定信号を出力す
    るようにした、特許請求の範囲第2項記載の音声識別装
    置。 (4)前記音声判別手段は、 前記相関係数演算手段出力から相関係数の最大値を有す
    る時間を検出する遅れ時間検出手段と、前記第1および
    第2の音声入力手段出力の音声入力信号のそれぞれの時
    間差を中央値とし、それから所定の時閣の範囲の値を記
    憶する時間範囲記憶手段と、 前記遅れ時園検出手段によって検出された遅れ時閤と前
    記時間範囲記憶手段の内容とを比較し、遅れ時間が前記
    詩閤範囲記憶手段の内容に基づく範囲内に含まれている
    ことに応じて音声判定信号を出力し、前記範囲外であれ
    ば騒音判定信号を出hジる第2の比較手段と、 前記第2の比較手段からの音轡判定信号に応じて前記音
    声電気信号変換手段から入力された音声入力信号の認識
    を能動化し、前記騒音判定信号に応じて前記認識を不能
    化する第2の音声認識手段とを含む、特許請求の範囲第
    1項記載の音声識別装置。 (5)前記第1または第2の音声IIIIi手段は、前
    記音声電気信号変換手段出力に基づいて音轡パラメータ
    を抽出する音轡パラメータ抽出手段と、 予め定める音声パラメータを配憶する音声パラメータ記
    憶手段と、 前記音声パラメータ抽出手段からの音声パラメータと前
    記音轡パラメータ記憶手段に記憶している音声パラメー
    タとの類似度を演算する類似度演紳手段と、 前配類似度演算手段による類似度の演算結果に基づいて
    いずれの音声であるかを判定するキーワード判定手段と
    を含み、 前記類似度演算手段は、前記相関係数演算手段出hの相
    関係数に基づく音声対騒音比対応信号に応じた重み関数
    を考慮して類似度演算を行なうようにした、特許請求の
    範囲第2項または第4項に記載の音声識別装置。 (6)前記重み関数は2値信号である、特許請求の範囲
    第5項記載の音声識別装胃。 (7)前記音声電気信号変換手段は、前記音声判別手段
    に音声信号を与える第3の音声入力手段を含む、特許請
    求の範囲第1項記載の音肉謙別装置。 (8)前記第3の音声入力手段は指向性マイクロホンを
    含む、特許請求の範囲第7項記載の音声識別装置。 (9)前記第1およびlllI2の音声入力手段はそれ
    ぞれ前記発音者の口許から等距離の位置に配置される、
    特許請求の範囲第1項記載の音真識別装置。
JP57065142A 1982-04-16 1982-04-16 音声識別装置 Granted JPS58181099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57065142A JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57065142A JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Publications (2)

Publication Number Publication Date
JPS58181099A true JPS58181099A (ja) 1983-10-22
JPH023520B2 JPH023520B2 (ja) 1990-01-23

Family

ID=13278332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57065142A Granted JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Country Status (1)

Country Link
JP (1) JPS58181099A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61176678U (ja) * 1985-04-23 1986-11-04
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP2007251801A (ja) * 2006-03-17 2007-09-27 Sony Corp 音響信号処理装置及び音響信号処理方法並びに音響信号処理用プログラム
JP2010175465A (ja) * 2009-01-30 2010-08-12 Secom Co Ltd 話者方向推定装置
WO2010109708A1 (ja) * 2009-03-25 2010-09-30 株式会社東芝 受音信号処理装置、方法およびプログラム
DE102010023615A1 (de) 2009-06-23 2011-01-05 FUJITSU LIMITED, Kawasaki-shi Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
JP2011170266A (ja) * 2010-02-22 2011-09-01 Secom Co Ltd 識別装置及び発声検出装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135204A (en) * 1977-04-27 1978-11-25 Western Electric Co Signal processor
JPS5763937A (en) * 1980-10-06 1982-04-17 Nippon Telegr & Teleph Corp <Ntt> Noise suppression system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135204A (en) * 1977-04-27 1978-11-25 Western Electric Co Signal processor
JPS5763937A (en) * 1980-10-06 1982-04-17 Nippon Telegr & Teleph Corp <Ntt> Noise suppression system

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61176678U (ja) * 1985-04-23 1986-11-04
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP4518817B2 (ja) * 2004-03-09 2010-08-04 日本電信電話株式会社 収音方法、収音装置、収音プログラム
JP2007251801A (ja) * 2006-03-17 2007-09-27 Sony Corp 音響信号処理装置及び音響信号処理方法並びに音響信号処理用プログラム
JP2010175465A (ja) * 2009-01-30 2010-08-12 Secom Co Ltd 話者方向推定装置
WO2010109708A1 (ja) * 2009-03-25 2010-09-30 株式会社東芝 受音信号処理装置、方法およびプログラム
DE102010023615A1 (de) 2009-06-23 2011-01-05 FUJITSU LIMITED, Kawasaki-shi Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
US8638952B2 (en) 2009-06-23 2014-01-28 Fujitsu Limited Signal processing apparatus and signal processing method
JP2011170266A (ja) * 2010-02-22 2011-09-01 Secom Co Ltd 識別装置及び発声検出装置

Also Published As

Publication number Publication date
JPH023520B2 (ja) 1990-01-23

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP5115818B2 (ja) 音声信号強調装置
JP3611223B2 (ja) 音声認識装置及び方法
JPS58181099A (ja) 音声識別装置
JP2000322098A (ja) 音声認識装置
US7177806B2 (en) Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
Okuno et al. Listening to two simultaneous speeches
KR20210000802A (ko) 인공지능 음성 인식 처리 방법 및 시스템
CN113707156B (zh) 一种用于车载的语音识别方法及系统
JP2701431B2 (ja) 音声認識装置
JP2002297199A (ja) 合成音声判別方法と装置及び音声合成装置
EP1102240A1 (en) Interval normalization device for voice recognition input voice
JP3106543B2 (ja) 音声信号処理装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
EP0100773B1 (en) Speech recognition system for an automotive vehicle
JPH04230796A (ja) 音声信号処理装置
JP2004317822A (ja) 感情分析・表示装置
JPH11327593A (ja) 音声認識システム
JP2007171637A (ja) 音声処理装置
JP3588929B2 (ja) 音声認識装置
US20230239617A1 (en) Ear-worn device and reproduction method
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JP4255897B2 (ja) 話者認識装置
JP2000039900A (ja) 自己診断機能付き音声対話装置