JPS58176700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS58176700A
JPS58176700A JP57059024A JP5902482A JPS58176700A JP S58176700 A JPS58176700 A JP S58176700A JP 57059024 A JP57059024 A JP 57059024A JP 5902482 A JP5902482 A JP 5902482A JP S58176700 A JPS58176700 A JP S58176700A
Authority
JP
Japan
Prior art keywords
voice
input
frequency
switches
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57059024A
Other languages
English (en)
Inventor
信之 寺浦
久米 一秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
NipponDenso Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NipponDenso Co Ltd filed Critical NipponDenso Co Ltd
Priority to JP57059024A priority Critical patent/JPS58176700A/ja
Publication of JPS58176700A publication Critical patent/JPS58176700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発F!A#−i、例えばエンジン音等の騒音の影響
を効果的に低減できるように改良した音声認識装置に関
する。
例えば、自動車等の車輛に搭載する音声認識装置におい
て、音声認w&ヲ確実に実行させるために最も大きな障
害となるのは、車室内の特に走行時における騒音である
。したがって、車載用の音声認識装置でその音声入力部
が要求される条件として\は、必要な入力音声のみを効
率よく捕捉し、それ以外の騒音はできるかぎシ捕捉しな
いようにすることである。また、会議室、工場内環で使
用する音声認識装置においても、周囲騒音に対して同様
のことが云える。
従来、このような条件を満足させるための入力手段とし
ては、まずノイズキャンセル型マイクロ7オンを使用す
ることであり、第2に指向性の高いマイクロフォンを使
用することである。
ノイズキャンセル型マイクロフォンh、球面波のみに感
応するように構成されるもので、したがって、口元に接
近して設置する必要がある。
このため、常圧頭部に固定器具を用いて固定しなければ
ならず、例えば運転者にとってわずられしいものとなる
。また、頭部を圧迫するために、疲労感を与えるので、
音声認識装置の入力部として用いることは不適尚である
。また、音声入力を行なう同乗者等に対してのこの型の
マイクロフォンの装着を求めることは実用的でない。
また、指向性の高いマイクロフォンを用いるようにした
のでは、運転者もしくは同乗者の発声位置が異なるため
、発声者の位置に常に指向性を向けることは、固定さ九
たマイクロフォンによっては不可能である。
また、指向性の高いマイクロフォンは、複数のマイクロ
フォンを用い、そのそれぞれの入力の和もしくは差を単
にとるように構成している。
しかし、この手段では特定の方向にしか全周波数範囲に
指向性を高めることは不可能である。
例えば2つのマイクロフォンを平行にして設置した場合
KFi、両マイクロフォンの中点に対して垂直な方向の
みに全周波数範囲にわたって指向性を高めることが可能
である。このことは、音源と両マイクロフォンへの行路
差に依存して指向性を作り出しており、行路差と音波の
波長との関係によって位相がずれることにより、特定の
周波数に対しては指向性?有するが、他の周波数に対し
ては逆に打ち消し合うという現象が生ずるからである。
したがって、複数のマイクロフォン入力を波形領域でそ
の和もしくは差をとるような構成としても、任意の方向
に対して、全周波数範囲にわたって指向性を高めること
は不可能である。
この発明は上記のような点に鑑みなされたもので、例え
ば車載用とした場合に車室内で発声された音声を考慮す
る全周波数範囲にわたって、できる限り効率が良く且つ
エンジン音等の周囲騒音の影響を充分減少して、例えば
走行中の車室内等圧おいても常に安定した認識操作が実
行されるようにする音声認識装@を提供しようとするも
のである。
すなわち、この発明に係る音声認識装置は、検数のスイ
ッチと共に複数のマイクロフォンを配置設定し、このマ
イクロフォンそれぞれからの人力音声tそれぞれ周波数
分析し、選択的に操作される上記スイッチの操作に対応
して、この操作されたスイッチ位置に対する上記分析周
波数帯域のすべてについて指向性を有するように設定さ
れ九重み係数を選択すると共に、この選択された重み係
数を入力音声の各周波数成分に乗じてその和によって各
周波数成分を算出し認識に供するようにしたものである
認識装置を設置する室内に設置された複数のスイッチの
中のいずれかが操作されると、室内に設置された複数の
マイクロフォンのそれぞれの人力音声の周波数分析を行
ない、演算装置でその各周波数成分のサンプリンダを行
なう。また、記憶装置tK上記複数のスイッチとそのス
イッチ毎に付属する!リセットスイ、チに対応して、各
周波数成分毎の各マイクロフォン入力の重み1にあらか
じめ記憶設定する。この重み係数は車室内の特定位置に
各周波数毎に指向性が高く、且つエンジン音等の騒音醇
ヲひろわないように設定される。
そして、記憶装置に記憶された重み係数を操作されたス
イッチさらにグリセットスイッチに対応して選択し、サ
ンプリンダされた各マイクロフォンからの入力音声の各
周波数成分に対して上記重み係数を乗じ、その和をとる
ことによりて各周波数成分を求め、これにもとすいて音
声・ダターンを作成し・9ターン1.サンプによって音
声u*rt行なわせるようKする。
以下図面を参照してこの発明の一実施例を説明する。こ
の実施例は車載用としたものを示すもので、第1図はそ
の構成を示す。すなわち、音声認識装置を搭載する自動
軍勢の車室内には、それぞれ位置を異ならせて複数、例
えば3個のマイクロフォン111〜1lef配瞳設定す
る。
このマイクロフォン11a〜11にれぞれ捕捉された音
声は、それぞれ増幅器12a〜12cで増幅し、帯域通
過フィルタ群13a〜13cに供給する。
このフィルタ群1ota〜13eは、それぞれ供給され
た入力音声を周波数分析するもので、それぞれが第2図
に示すように構成されている。
すなわち、前段の増幅器12から得られる入力音声の信
号を複数例えばF個の帯域通過フィルタ14a〜14F
に並列的に供給するもので、このフィルタ141〜J4
Fそれぞれの通過帯中心周波数は、対数軸上で順次等間
隔となるように設、定されている。そして、これら帯域
通過フィルタ14&〜14F’if通過した信号は、そ
れぞれ検波器15a〜15Fで一線して、通過信号のレ
ベルに対応したアナログ状の信号とするものである。
このように構成される帯域通過フィルタ群lja〜13
eからの出力信号は、マルチプレクサ16に供給して順
次読み取られるようにし、このマルチプレクサ16から
取り出される信号はい変換器11でディジタル信号に変
換し、CPU J & K供給する。このCPU 1 
B K対してはタイマー19からクロ、り信号を与える
もので、このCPo 1 Bによって上記マルチプレク
サ16が制御されるようにする。また、このCPU J
 8には重み係数tp憶する記憶装置20、CPU78
のプログラム?記憶する記憶装置2ノ、さらに一時記憶
用の記憶装置22が結合されるもので、この記憶装置2
2に対してはメモリバラファツジ用の蓄電池23が設け
られる。この蓄電池23は例えば自動車エンジーンの起
動用吟のものを用いる・ また、車室内には複数のスイッチ24a。
24b・・・が配置されるもやで、このスイッチ24m
、24b・・・は音声入力を行なう時に選択的その1つ
が操作されるもので、音声入力のための発声位置と、以
後の入力音声は音声入力のための音声であることt示す
作用をする。車室内にはさらに複数個゛のグリセットス
イッチ25a。
25b・・・が配置されるもので、こめスイッチ25m
、25b−は上記スイッチ24m、24b・・・で指定
された発声位置を微調整するものである。具体的には、
特定位置に指向性を集中するために用いる重み係数を指
定する。そして、これらスイッチ24m、24b・・・
およびデリセ。
トスイ、チ25m、25b・・・の操作信号は、それぞ
れCPU 1 B K結合する。26td音声V誠によ
って制御される機器、例えば車載用エアコンである。
次に上記のような装置の動作を第3図に示す流れ図にし
たがって説明する。まず、電源が投入されると、CPo
 1 Bは起動され、ステ、プ101に進んでスイッチ
24m、24b・・・を検出し、操作されたか否かを判
定する。「NO」の場合は再びステ、fzolにもどり
、上記検出動作を繰り返す。スイッチ24*、24b・
・・の中の1つが操作されたとすると「YEsJとなり
、以後音声が入力されると判定してステ、プ102に進
む、ここで祉、ステップ101によって操作されたと判
定されたスイッチに対応する!リセットスイッチj j
 a p J j b−・・の中の1つを検出する0次
に、ステップiosに進み、ステップ102で検゛出さ
れたグリセットスイッチの設定値に従って、重み係数な
配憶装置20から読み出し一時記憶装置22に転送する
ここて、重み係数は次のように行列で表現され、一般的
にF個のマイクロフォン入力を有する場合に である。このWt−以後重み行列と呼ぶ。
ここで、Wm、thm番目のマイクロフォン入力に対す
る1番目の帯域通過フィルタの検波W力のサンプリング
値の重み係数である。Fは、各帯域通過フィルタ群13
h〜13eに含まれる帯域通過フィルタの個数である。
この重み係数行列は、指定し得る発声位置の数だけ記憶
装置20に記憶設定されるもので、この重み係数がセッ
トされた状態でステップ104に進み、音声のサンプリ
ングを行なう。
第3図はこの音声サンプリングの過程?示すもので、こ
の音声サンプリングの過程に入ると、ステ、ゾ201に
進み、有効な音声入力の回数を示す指標1’1rljに
初期設定し、ステップ202で有効音声入力後の無効な
入力の回数を示す指標t’ir OJK初期設定する。
次に、ステ、プ203に進み、タイマー19の割シ込み
信号による割り込みによって、マルチプレクサ16を制
御するとと゛により、帯域通過フィルタ群131〜13
eの検波出力?順にA/D変換器17でディジタル状に
変換し、サンプリングを行なう。
ここで、第m番目のン゛イクロフォン入力の第1番目の
サンプリングデータ(特徴ベクトル)を4とすると ”?’ = (’T、1 ”T、2 ””T、f ”・
マT、r )   ”’<2)が得られる。ここで、マ
Ttは第m番目のマイクロフォン入力の、第1番目のサ
ンプリングの第f番目の帯域通過フィルタの検波出力の
サンプリング値を示す。
次に、ステ、プ204に進み、ステップ203で得られ
た各マイクロフォン入力の重み和をとることにより、発
声音の各周波数成分を推定する。一般的にM個のマイク
ロフォン入力ヲ有する場合、1回のサンプリングによっ
て得られるデータは次のような行列として表わされる。
サンプリングデータ′fr:(3)式のように行列表現
すると、重み和は(1)式で示した重み行列とのスカラ
ー積をとること罠よシ得られ、推定される各周波数成分
か′ら成る特徴ベクトルkV、とすると次のようになる
V1= vl−W−’             −・
(4)次にステップ205に進み、特徴ベクトルV。
の音声/4ワーの計算を行なう。音声ノ9ワーPiとし
て、ここでは次式を用いる。
P =Σ v2             ・・・(5
)i、ヨ1.  、i、f ただし’  vi、fは特徴ベクトルYiOf番目の帯
域通過フィルタに対応する成分である。
次にステ、デ206に進み、特徴ベクトルiが有効な音
声入力を代表しているか否かを判定するもので、この判
定#′iあらかじめ定められたしきい値P0に対して次
式を満九すか否かによって行なう。
Pt>Po                ・・・(
6)このステ、プ206で判定結果が「YES」の場合
はステ、ゾ207に進み、有効音声入力後の無効入力回
数を示す指標tが「0」に等しい否かを判定する。この
ステラf207でrYEsJの判定の場合はステップ2
10に進み、lに「1」を加えてステ、グ203に戻る
。また、「NO」の判定の場合はステップ20Bに進み
、過去を回の無効入力は単語内に含まれる無音部分てあ
ったと判定し、その2回の特徴ベクトルは発音された単
語の短時間の音声を代表する有効な入力であるとして、
1Ktk加えてlス、テ、 7’ 209に進み、tを
「0」にリセットシてステップ210に進む。
上記ステ、ゾ206で無効入力「NO」であると判定さ
れた場合は、ステ、プ211で1が「1」に等しいか否
かを判定する。そしてrYEsJの場合は音声は未だ発
せられていないと判定し、ステップ203に戻る。また
rNOJの場合はステップ211に進み、tがあらかじ
め定められたしきい値りより大きいか否か全判定する。
そしてrYEsJの場合は単語内に含まれる無音部分よ
り充分長い無音部分があり、音声入力は終了したと判定
してステップ214に進み、1があらかじめ定めたしき
い値Iよりも大きいか否かを判定する。このステツf2
14で1NO」の結果が得られた場合は、音声が発せら
れ且つ音声入力は終了したが、音声入力時間か小さいた
め有効な入力であると判定し、ステ、プ201に戻って
再び音声入力の検出を行なう。またrYESJの場合は
、有効な音声入力があり且つこれが終了したとして音声
サンプリングの過程を終了する。
また、前記ステ、ゾ212で「NO」の判定がされた場
合は、単語内に含まれる無音部分である可能性があると
して、ステ、1213でtに「1」を加え、ステップ2
03に戻る。
このようにして第3図のステ、7ax 04の音声サン
プリングの過程が終了するとステ、グ105に進み、ス
テ、デ104でサンプリングされた入力音声パターンと
あらかじめ登録された標準パターンとのパターンマ、チ
ンダを行なうO ここで、登録されている標準・母ターンの数をN個とし
、入力音声ノfターンとn番目の標準・苧ターンとの類
似度tDnとすると、各標準パターンに対して次式のよ
うに類似度ベクトル01求める。
D =(Dl、D2・・・Dn・・・DN  )   
      −(7)次Vこ、ステ、デ106・K進み
入力音声に対応する標準・母ターンがあるか否かを判定
する。この判定は例えば次のようにして行なう。
すなわち、類似度ベクトルDの中で最大の成分1kDM
とし、2番目に大きい成分’kDwwとし、あらかじめ
設定されたしきい値DT、DTに対して次式が同時に満
たされるか否かを判定する。
DM ) DT      ・・・(8)Da −DM
M :> DT   ・・・(9)上記(8)式を満た
さない場合は入力音声に対応する標準パターンは存在せ
ず、誤った音声が入力されたと判定する。また、(9)
式を満たさない場合は、入力音声はM番目の標準・臂タ
ーンに対応する可能性が高いがMM番目の標準/母ター
ンを有意な差がなく、区別できないと判定する。
さらに(8) (9)の両式を満たさない場合、有効な
入力がなかつ九として、演算t−終了する。(8) (
9)両式を同時に満たす場合には、入力音声はM番目の
標準・臂ターンに対応すると判定し、ステップ107V
C進み、入力音声に対応する制御をエアコン26に対し
て行ない、1回の音声入力の認識制御動作を終える。
したがって、上記のように構成される装置によれば、特
に指向特性等を考慮することなく、車室内に固定配置さ
れたマイクロフォンをそのまま用いることができる。こ
の場合、固定されたマイクロフォンは例えば車室内に突
起として出る構造とする必要はなく、外観上からまた安
全上からも効果的なものとすることができる。
ま念、入力者は例えば運転者等に特定されることがなく
、在室者全てがその位置に応じたスイッチを選択操作す
ることKよって入力可能となるものであシ、音声認識装
置としての機能向上に大きな効果を発揮するものである
尚、上記実施例では、周波数分析手段として帯域通過フ
ィルタを用いた例を示したが、音声波形そのものをサン
プリングし、FFT(高速フーリエ変換)によって周波
数成分を抽出しても、同様の効果をあげることができる
また、このような音声認識装置は実施例等で説明したよ
うな車載用に限らず、そのまま会議室等の多数の人の存
在する室内、または騒音条件の良くない工場等において
も効果的に使用できる。
次 以上のようKこの発明によれば、音声された位置を、ス
イッチ類によって検出することによって、発声位置に最
も指向性?有するようなマイクロフォンの各周波数成分
に対する重み係数が選択されるものであり、指令入力の
ための発声音声?高い信号対雑音比で捕捉することがで
きる。したがって、音声の認i!1m!率の向上に非常
に大きな効果を発揮する。特に、発声位置が特定される
ことのないものであるため、在室する複数の八によって
適宜音声入力可能となるものである。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る音声認識装5iを説
明する構成図、第2図は上記装置の特に帯域通過フィル
タ群部を取シ出して示す図、m3図は上記装置の作用を
説明する流れ図、第4図は上記流れ図の音声サンプリン
グ部を説明する流れ図である。 11 m〜l 1 e・=マイクロフォン、13゜13
a〜13c・・・帯域通過フィルタ群、14@。 J4b・・・帯域通過フィルタ、15th、15b・−
・検波器、16・・・マルチプレクサ−% 18−・C
PU 。 24m 、 24 b −、−スイッチ、25m 、2
5b・・・、・・・デリセットスイ、チ、20=−記憶
装置(重み係数記憶)。 出願人代理人  弁理士 鈴 江 武 2第1図 第2図 第3図

Claims (2)

    【特許請求の範囲】
  1. (1)  室内に位置を異ならせて設置した複数の  
    3マイクロフオンと、このマイクロフォンそれぞれで検
    知した音声をそれぞれ周波数分析する手段と、上記室内
    に位置を異ならせて配置した複数のスイッチと、この複
    数のスイッチの選択的操作によシその操作されたスイッ
    チに対応する位置に対して上記周波数分析手段の分析周
    波数帯域のすべてについて指向性?有するように指定さ
    れた重み係数を選択する手段とを具備し、上記各マイク
    ロフォン人力に対応する入力音声の各周波数成分に対し
    て、上記選択された重み係数を乗じ、その和によって入
    力音声の各周波数成分を算出して認識するようにしたこ
    とを特徴とする音声認識装置。
  2. (2)上記スイッチは、その位置をさらに微調指定する
    ノリセットスイッチを含み、このプリセットスイッチの
    操作により発生位置?さらに指定して各周波数成分に対
    する重み係数の組みt選択し得るよう圧した特許請求の
    範囲第1項記載の装置。
JP57059024A 1982-04-09 1982-04-09 音声認識装置 Pending JPS58176700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57059024A JPS58176700A (ja) 1982-04-09 1982-04-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57059024A JPS58176700A (ja) 1982-04-09 1982-04-09 音声認識装置

Publications (1)

Publication Number Publication Date
JPS58176700A true JPS58176700A (ja) 1983-10-17

Family

ID=13101299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57059024A Pending JPS58176700A (ja) 1982-04-09 1982-04-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPS58176700A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6186800U (ja) * 1984-11-05 1986-06-06

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6186800U (ja) * 1984-11-05 1986-06-06
JPH0210559Y2 (ja) * 1984-11-05 1990-03-15

Similar Documents

Publication Publication Date Title
Christiansen et al. Detecting and locating key words in continuous speech using linear predictive coding
JPS6031315B2 (ja) スピ−チから周辺ノイズを濾波する方法および装置
US20200105293A1 (en) Sound event detection
JPH0743598B2 (ja) 音声認識方法
US8199928B2 (en) System for processing an acoustic input signal to provide an output signal with reduced noise
KR101704510B1 (ko) 사운드 신호 처리 방법, 사운드 신호 처리 장치 및 상기 사운드 신호 처리 장치가 설치된 차량
Jitsuhiro et al. Rejection of out-of-vocabulary words using phoneme confidence likelihood
Toyoda et al. Environmental sound recognition by multilayered neural networks
JPS58176700A (ja) 音声認識装置
Hu et al. Robust speaker's location detection in a vehicle environment using GMM models
JP2992324B2 (ja) 音声区間検出方法
JPH03203488A (ja) 音声リモートコントロール装置
CN110675890B (zh) 声音信号处理装置以及声音信号处理方法
JPH03208099A (ja) 音声認識装置及び方法
JPS6367197B2 (ja)
Couvreur et al. On the use of artificial reverberation for ASR in highly reverberant environments
JPS5885498A (ja) 音声入力装置
Sluyter et al. Improvements of the harmonic-sieve pitch extraction scheme and an appropriate method for voiced-unvoiced detection
JP2000039900A (ja) 自己診断機能付き音声対話装置
JPH03200298A (ja) 音声制御装置
JPH024920B2 (ja)
Kuah et al. A neural network-based text independent voice recognition system
US11437019B1 (en) System and method for source authentication in voice-controlled automation
JPH0451376B2 (ja)
JPH0442299A (ja) 音声区間検出装置