JPH023520B2 - - Google Patents

Info

Publication number
JPH023520B2
JPH023520B2 JP57065142A JP6514282A JPH023520B2 JP H023520 B2 JPH023520 B2 JP H023520B2 JP 57065142 A JP57065142 A JP 57065142A JP 6514282 A JP6514282 A JP 6514282A JP H023520 B2 JPH023520 B2 JP H023520B2
Authority
JP
Japan
Prior art keywords
voice
signal
audio
input
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57065142A
Other languages
English (en)
Other versions
JPS58181099A (ja
Inventor
Kenji Shima
Masahiro Hibino
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP57065142A priority Critical patent/JPS58181099A/ja
Publication of JPS58181099A publication Critical patent/JPS58181099A/ja
Publication of JPH023520B2 publication Critical patent/JPH023520B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

【発明の詳細な説明】 この発明は音声識別装置に関し、特に、音声を
入力し、その音声の内容に基づいて各種被制御機
器を制御するために用いられるような音声識別装
置の改良に関する。
たとえば、自動車などにおいて運転者がラジオ
などの車載機器を操作する場合には、一般に手動
的に行なうことが多い。しかし、運転者が車を運
転中にラジオなどを操作するためには、しばしば
視線を前方から機器の操作部に移す必要があり、
このことが脇見運転の原因になり、非常に危険を
判う。また、最近では運転者用の車載用計算機が
実用に供されているが、このような車載用計算機
を、運転しながら操作することは不可能に近いも
のであつた。この他にも、窓の開閉やその他の車
載機器を操作する場合においても同様の問題点を
生じていた。
そこで、運転者が手動的な操作によることな
く、ラジオの電源投入や窓の開閉などをすること
ができれば便利である。このためには、運転者が
「ラジオ」と発音したとき、この音声を識別して
その識別結果に基づいてラジオを制御するような
音声入力制御装置が考えられる。このような音声
入力制御装置では、運転者の近傍にマイクロホン
を設けておき、このマイクロホンに入力された音
声を識別する。ところが、自動車の窓が開かれて
いると、外部からの騒音がマイクロホンに混入し
てしまい、運転者の発音と騒音との識別が極めて
困難になり、車載機器などを誤動作させる原因と
なつていた。
それゆえに、この発明の主たる目的は、外部か
らの騒音と人間の発音した音声とを容易に識別し
得る音声識別装置を提供することである。
この発明を要約すれば、発音者の近傍に所定の
間隔を隔てて第1および第2の入力手段を配置し
ておき、それぞれの音声入力手段から出力された
音声入力信号から予め定める周波数帯域成分の音
声信号を抽出し、それぞれ音声信号の相関を演算
し、その演算結果に基づいて音声電気信号変換手
段から出力された音声信号が発音者の発音した音
声に基づくものであるかあるいは騒音に基づくも
のであるかを判別するように構成したものであ
る。
この発明の上述の目的およびその他の目的と特
徴は以下に図面を参照して行なう詳細な説明から
一層明らかとなろう。
第1図はこの発明の一実施例が適用された自動
車を横方向から見た概略図であり、第2図は同じ
く運転者の後方向から見た概略図であり、第3図
は同じく自動車の車内の概略図である。
まず、第1図ないし第3図を参照して、この発
明の概要について説明する。運転者11は車体1
2に設けられている座席13に着席し、シフトレ
バー14およびステアリングホイール15を操作
して運転する。計器盤16にはたとえばカーラジ
オ7が取付けられている。また、天井20には、
運転者11の正面方向に直交して等距離の位置に
所定の間隔を有して第1および第2の音声入力手
段としてのマイクロホン17と18とが取付けら
れている。さらに、これらのマイクロホン17と
18との間には指向性マイクロホン19が設けら
れている。
運転者11がたとえばラジオ7の電源を投入し
ようとする場合は、予め定められている制御用の
音声(以下、キーワードと称する)を発音する。
この発音は空気中を伝播し、マイクロホン17と
18と19とに入る。このとき、マイクロホン1
7と18が運転者11から等距離の位置に設けら
れているので、音声はこれらのマイクロホン17
と18とに同時に伝播されることになる。マイク
ロホン17と18とに入力された音声は電気信号
に変換されて音声信号となり、この2つの音声信
号の相互関係数が求められる。騒音が入力されて
いない場合には、相関係数は1に近い値が得ら
れ、音声信号は騒音に比べて十分に大きいことが
相関係数の値から示される。逆に、大きな騒音が
入力された場合には相関係数は0に近い値が得ら
れ、音声信号は騒音に比べて十分に小さいことが
示される。そして、この相互相関係数の値に基づ
いて、指向性マイクロホン19から出力される音
声信号を認識するか否かを判別する。そして、相
互相関係数が1に近い値であれば、指向性マイク
ロホン19から出力される音声信号と予め記憶さ
れているキーワードの音声パラメータとを比較
し、いずれのキーワードであるかを判別する。そ
して、この判別結果に基づいてたとえばラジオ7
などの各種車載機器を制御する。
なお、上述の説明では、音声認識用の音声信号
を指向性マイクロホン19から出力するようにし
たが、特に指向性マイクロホン19を設けること
なく、マイクロホン17または18のいずれかか
一方からの音声信号を認識するようにしてもよ
い。しかしながら、運転者11の発音した音声を
分析して認識を行なうための音声信号のS/N比
としては十分高いものが好ましく、周囲雑音を除
去できる高指向性マイクロホンを用いるのが望ま
しい。
第4図は音声信号と騒音との関係を説明するた
めの図であり、第5A図および第5B図は相互相
関係数の計算結果を示す図である。
次に、2つのマイクロホン17と18とから出
力される音声信号の相互相関について説明する。
第4図において、騒音発生源100として、この
場合は一例として自動車騒音について考えてみ
る。運転者11はマイクロホン17と18とから
等距離に口許がくる位置に座つており、運転者1
1の前方には自動車のフロントガラス(図示せ
ず)、後方にもリアウインドウ(図示せず)が存
在するものとし、騒音発生源100は運転者11
の側方にあるものとする。
騒音発生源100から騒音がマイクロホン17
と18とに伝播する遅延時間差をτ0とし、その振
幅差はマイクロホン17と18との間隔dに比べ
て、マイクロホン17と18とから騒音源100
の距離が十分に大きいものとみなして考慮せずに
振幅な同一であるとする。また、運転者11によ
り発生された音声信号Sa,Sbはマイクロホン1
7と18とに同一の振幅と時間で伝播するものと
する。このとき、マイクロホン17と18との時
間信号a(t)とb(t)は、音声信号をs(t)、
騒音発生源100からの騒音n(t)とすると、 a(t)=s(t)+n(t) …(1) b(t)=s(t)+n(t+τ0) …(2) と表わすことができる。ここで、相互相関関数
φab(τ)および正規化相互相関関数Φ(τ)はそ
れぞれ、 φab(τ)=lim T−∞1/2T∫T -Ta(t)b(t+τ)dt
…(3) Φ(τ)=φab(τ)/√(O)φbb(O)…(4
) である。但し、φaa(O)、φbb(O)は、a(t)、
b(t)の自己相関関数φaa(τ)、φbb(τ)のそ
れぞれτ=0のときの値であつて、パワーを表わ
しており、 φaa(O)=lim T−∞1/2T∫T -Ta2(t)dt …(5) φbb(O)=lim T−∞1/2TT -Tb2(t)dt …(6) で表現できる。ここで、 s(t)=Ssinωst n(t)=Nsinωnt とする。但し、ωs、ωnはs(t)、n(t)の角
周波数であり、S、Nはs(t)、n(t)の振幅
を示している。そして、ωs=2πfs、ωn=2πfnで
あるとすると、正規化相互相関関数Φ(τ)は、 Φ(τ)={S2cosωsτ +N2cosωn(τ+τ0)}/(S2+N2) …(7) であり、またτ=0とすれば、 Φ(O)=(S2+N2cosωnτ0)/(S2+N2) …(8) である。
さらに、s(t)、n(t)がそれぞれL個、M
個の正弦波から成立つている場合には、 s(t)=Ll=1 Slsinωslt …(9) n(t)=Ml=1 Nlsinωnlt …(10) となるので、 であり、またτ=0とすれば、 である。
前述の第(8)式において、τ0=333μsつまりマイ
クロホン17と18との間隔dが約1.13cmにおけ
る計算結果を第5A図に示している。この第5A
図から明らかなように、側方から入つてくる騒音
が大きくなりかつS/Nが小さくなるに従い正規
化相関関数の小さくなることがわかる。但し、正
弦波の場合には、1/τ0の周波数の整数倍に近い
周波数の騒音の場合には、第5A図に示したよう
にはならないことは明らかであるので、実際には
そのような成分を小さくした状態で求める必要が
ある。
また、前述の第(12)式において、τ0=333μs、d
=11.3cmにおける計算結果を第5B図に示してい
る。この第5B図では、騒音n(t)を n(t)=0.4sin(2π・100)t +1.0sin(2π・400)t +1.0sin(2π・1000)t +1.0sin(2π・3100)t …(13) とし、100Hz、400Hz、1kHz、3.1kHzの4つの周波
数成分が0.4、1、1、1の比率で含まれている
ものとした。この場合には、τ0=333μsの周期に
近い3.1kHzの成分や低い周波数成分を含んでいる
ので、Φ(O)はさほど小さくはならないが、そ
れでもS/Nが小さくなると、Φ(O)が小さく
なる傾向が見られる。
この発明は2つのマイクロホン17と18とか
ら出力される音声信号の相関関係を用いて音声信
号のS/N比を推定し、その値によつて認識結果
の有効あるいは無効を決定したり、類似度計算に
重み付けたりすることによつて、騒音による誤認
識や誤判定を防止できるような音声識別装置を構
成できる。以下に、この発明の実施例について詳
細に説明する。
第6図はこの発明の一実施例の概略ブロツク図
である。前述の第2図および第3図に示したマイ
クロホン17からの音声信号は増幅器21で増幅
され、フイルタ22によつて識別したい周波数帯
域(通常は音声周波数帯域)のみが抽出され、相
互相関係数計算機25に与えられる。他方のマイ
クロホン18からの音声信号は同様にして増幅器
23で増幅され、フイルタ24によつて識別した
い周波数帯域成分のみが抽出されて相互相関係数
計算機25に与えられる。この相互相関係数計算
機25は入力された2つの音声信号から相互相関
係数Φ(O)を求めるものである。この相互相関
係数計算機によつて計算された相互相関係数Φ
(O)の値によつてS/Nを推定することができ
る。このために、相互相関係数計算機25で計算
された相互相関係数Φ(O)が比較器26に与え
られる。比較器26には予め定める相関係数を記
憶するための相関係数しきい値レジスタ27が接
続される。そして、比較器26は相互相関係数計
算機25で計算された相互相関係数Φ(O)の値
と相関係数しきい値レジスタ27に記憶されてい
る相関数係数とを比較し、指向性マイクロホン1
9から出力される音声信号を認識するために騒音
が小さい否かの判定を行なう。そして、その判定
信号を音声認識認識回路29に与える。
一方、指向性マイクロホン19は2つのマイク
ロホン191と192とを含み、それぞれから出
力された音声信号は増幅器193および194で
増幅され、加算器195で加算されてフイルタ2
8に与えられる。このフイルタ28は音声信号と
して不必要な低周波域や高周波領域の信号成分を
除去するためのものである。フイルタ28の出力
信号は音声認識回路29に与えられる。音声認識
回路29は後述の第8図で詳細に説明するが、入
力された騒音の混入した音声信号から特徴パラメ
ータを抽出し、メモリ38に予め登録されている
音声パラメータとの類似度を求め、その類似度が
一致していると判断するのに十分でない場合に
は、入力された音声信号を判定できないことを出
力し、最も類似度が大きくかつ類似度が十分に大
きい場合にはそのデータであると判定して出力す
るものである。
音声認識回路29には比較器26から音声の騒
音判定信号が与えられており、この信号が騒音で
あることを示している場合には、音声認識回路2
9は騒音または判定不能を表わす信号を出力する
ことによつて、騒音が大きいときに各種機器、こ
の実施例ではラジオ7が誤動作しないように構成
される。
第7A図は第6図に示す相互相関係数計算機2
5の一例を示す概略ブロツク図である。第7A図
において、a(t)はマイクロホン17から出力
される音声信号であり、b(t)はマイクロホン
18から出力される音声信号である。そして、乗
算器251と積分器254と対数変換器257は
前述の第(5)式を演算するものである。すなわち、
乗算器251はaを2乗し、これを積分器254
で積分し、対数変換器257によつて対数化し、
対数化されたφ3a(O)を演算する。また、乗算
器252乗算器256と対数変換器259は前述
の第(6)式の演算を行なうものである。すなわち、
乗算器252はbを2乗し、積分器はb2を積分
し、対数変換器259は先の対数変換器257と
同様に対数化されたφbb(O)を求める。対数変
換器257と259との出力は加算器260で加
算され、1/2減衰器261によつてその平方根に
対応した処理が行なわれる。したがつて、1/2減
衰器261の出力には、前述の第(4)式の分母に対
応した結果が得られることになる。
一方、乗算器253と積分器255と対数変換
器258は前述の第(3)式のτ=0のときの演算を
行なうものである。すなわち、乗算器253はa
とbとを乗算し、それを積分器255が積分し、
対数変換器258は第(3)式のφab(O)の対数化
された値を出力する。この出力は加算器262に
与えられ、1/2減衰器261の出力と減算され、
指数変換器263によつて指数化してもとに戻さ
れ、Φ(O)が出力される。すなわち、この第7
A図に示す相互相関係数計算機25は、マイクロ
ホン17および18から出力される音声信号に基
づいて、騒音が小さい場合にはΦ(O)=1を出力
し、騒音が大きい場合にはΦ(O)=1を出力す
る。
第7B図は相互相関係数計算機の他の例を示す
概略ブロツク図である。第7B図において、2乗
平均値回路(RMS)266は時間成分aの2乗
平均を開根するものであり、√2を演算する。加
算器264はaとbとを加算し、RMS267に
よつてその2乗平均値√(+)2が演算される。
加算器265はaと−bとを加算するものであ
り、RMS268はその結果の2乗平均値√(−
b)2を演算する。RMS268はbの2乗平均値
2を演算する。各RMS266ないし269の
演算結果は演算回路269によつてA2−B2
4CDを演算し、Φ(O)を求める。
第8図は第6図に含まれる音声認識回路29の
具体的なブロツク図である。この第8図に示す音
声認識回路29は従来から知られたチヤネルフイ
ルタを用いたものであつて、以下その構成と動作
について簡単に説明する。入力遮断スイツチ29
1には入力信号として第6図に示すフイルタ28
から指向性マイクロホン19からの音声入力信号
が与えられる。また、入力遮断スイツチ291に
は制御信号として第6図に示す比較器26から音
声騒音判定信号が入力される。そして、入力遮断
スイツチ291は音声騒音判定信号が音声を表わ
す信号であるとき閉じられて認識動作を行ない得
る状態となり、音声でないつまり騒音であると判
定されているときには開いて認識動作を停止した
状態となる。このような機能を有する入力遮断ス
イツチ291を介して音声信号がプリエンフアシ
ス回路292に与えられる。プリエンフアシス回
路292は入力された音声信号のうちの300ない
し5kHzの帯域成分のみを通過させる6dB/oct程
度の特性を有するフイルタである。
プリエンフアシス回路292を通過した音声信
号は、バンドパスフイルタ(BPF)301ない
し308に与えられる。これらのバンドパスフイ
ルタ301ないし308はそれぞれ予め定められ
た帯域成分の音声信号のみを通過させて、後段の
整流回路311ないし318に与える。この整流
回路311ないし318はそれぞれバンドパスフ
イルタ301ないし308の出力信号を整流して
直流電圧に変換する。整流された直流電圧はロー
パスフイルタ321ないし328に与えられる。
これらのローパスフイルタ321ないし328
は、一種の積分機能を有したものである。さら
に、入力された信号に重み付けをして加算し、そ
の信号をトリガ回路34に与える。トリガ回路3
4は入力された信号の変化に応じて音声の始端と
終端を検出し、CPU35に対して音声期間であ
ることを表わす信号を与える。また、ローパスフ
イルタ321ないし328のそれぞれ出力信号は
マルチプレクサ33に与えられる。マルチプレク
サ33には、CPU35から入出力インタフエイ
ス36を介してローパスフイルタ321ないし3
28のそれぞれの出力信号を切替るための切替信
号が与えられる。そして、マルチプレクサ33は
その切替信号に応答して、いずれかのローパスフ
イルタの出力をA−D変換器37に与える。A−
D変換器37は、入力されたアナログ電圧をデジ
タル値に変換するものである。このデジタル値に
変換された信号は、入出力インタフエイス36を
介してCPU35に与えられる。メモリ38は音
声認識に必要なプログラムを記憶するプログラム
メモリ381と、音声認識に必要なデータを記憶
する音声パラメータメモリ382とを含む。音声
パラメータメモリ382は予め登録された分析パ
ラメータを記憶する登録部として記憶領域383
と、入出力インタフエイス36から出力された音
声パラメータを記憶する入力部としての記憶領域
384と、200msec程度の信号の分析パラメータ
を記憶するためのバツフア部としての記憶領域3
85とを含む。200msec程度の信号の分析パラメ
ータを記憶するのは、音声認識をする上において
音声期間としてはトリガ回路34によつて音声期
間であると判定された時点以前も極めて重要であ
るので、類似度を計算する際にはバツフア部38
5の内容から始点部を溯つて検出するためであ
る。
次に、動作について説明する。入力遮断スイツ
チ291は第6図に示す比較器26から騒音であ
ることを表わす判定信号が入力されるとその接点
を開き、音声であることを表わす判定信号が入力
されればその接点を閉じる。接点が閉じられる
と、音声入力信号はプリエンフアシス回路29
2、バンドパスフイルタ301ないし308、整
流回路311ないし318およびローパスフイル
タ321ないし328に順次与えられる。マルチ
プレクサ33はCPU35から入出力インタフエ
イス36を介して出力される切替信号に応答し
て、各ローパスフイルタ321ないし328のそ
れぞれの出力を順次選択してA−D変換器37に
与える。A−D変換器37は入力された信号をデ
イジタル値に変換し、入出力インタフエイス36
を介して音声パラメータメモリ382の入力部3
84に記憶させる。一方、トリガ回路34はロー
パスフイルタ321ないし328の信号によつ
て、音声期間の終了を判断し、CPU35に割込
信号を与える。応じて、CPU35は入力部38
4に記憶した音声パラメータと登録部383に予
め記憶している音声パラメータとの内容を比較
し、ある値以上の類似度が得られないときには判
定不能の出力を行ない、ある値以上の類似度が得
られたときには最も類似度の高いキーワードを音
声認識データとして入出力インタフエイス36経
由で出力する。なお、類似度の計算のために用い
る音声期間としては、トリガ回路34によつて音
声期間であると判定された時点以前も極めて重要
であるので、CPU35はバツフア部385に記
憶されている過去200msecの音声パラメータにつ
いての類似度も計算する。
このように入力遮断スイツチ29を構成するこ
とによつて、音声、騒音判定信号によつて音声認
識の機能を停止したり機能させたりすることがで
きるので、騒音の大きいときの誤認識を未然に防
止することができる。
第9図は音声識別回路の他の例を示すブロツク
図であり。前述の第8図に示す音声認識回路29
では、入力遮断スイツチ291を設け、騒音が大
きいときにはこのスイツチ291の接点を開いて
音声入力信号を音声認識回路29に与えないよう
にした。しかしながら、第9図に示す実施例で
は、入力遮断スイツチ291を設けることなく、
CPU35に音声、騒音判定信号を与えるように
する。そして、騒音が大きいときにはCPU35
による音声認識動作を禁止するものである。それ
以外は前述の第8図と同じである。
第10図はこの発明の他の実施例の概略ブロツ
ク図である。前述の第6図に示す実施例では、前
述の第(4)式のΦ(τ)を0としたとき相互相関係
数を相互相関係数計算機25で計算し、Φ(O)
の値に応じてマイクロホン17と18とに入力さ
れた音声が人間の発音した音声であるかあるいは
外部からの騒音であるかを判定するようにした。
しかし、この第10図に示す実施例では、第(4)式
における相互相関関数Φ(τ)を相互相関関数計
算機39で計算する。これは人間の発音した音声
の場合はτ=0の近傍にΦ(τ)が最大を有し、
騒音は側方から入力されると想定しているので、
τ=0近傍以外の位置にできることを用いたもの
である。このために、相互相関関数計算機32か
ら相互相関係数を計算してΦ5(τ)を求めた後、
このΦ(τ)からΦ(τ)が最大となるτの値を2
つのマイクロホン17と18から出力される信号
の遅れ時間検出器33で検出する。そして、その
遅れ時間をコード化して出力し、その遅れ時間の
範囲が音声であると判定すべき範囲かそれとも騒
音と判定すべき範囲かを相関関数しきい値レジス
タ34の値によつて比較して判定し、音声である
かを表わす判定信号を出力する。それ以外は前述
の第6図と同じである。
第11図はこの発明のその他の実施例を示すブ
ロツク図である。この実施例は騒音は側方から入
るとしているので、τ=0から離れた位置で騒音
のパワーが集中することに着目して騒音の判定信
号を出力するものである。すなわち、Φ(τ)の
うちΦ(O)およびΦ(O)の近傍に人間の発音が
集中し、それ以外は騒音とみなすことができるこ
とに着目し、前述の第10図に示す実施例と同様
にして、相互相関関数計算器32によつて相互相
関係関数Φ(τ)を演算する。そして、最大値検
出器35によつて相互相関関数Φ(τ)の最大値
を求める。また、相互相関関数計算機32は相互
相関係数Φ(O)を出力し、相互相関関数Φ(τ)
を相互相関係数(O)によつて演算器36で割算
する。そして、演算器36で演算された値の大き
さとしきい値レジスタ37に記憶されている値と
を比較器26で比較し、音声であるかあるいは騒
音であるかを判定するようにしたものである。そ
れ以外は前述の第10図に示す実施例と同じであ
る。
第12図はこの発明のさらにその他の実施例を
示すブロツク図であり、第13図は重み関数と音
声/騒音比との関係の一例を示す図である。
構成において、マイクロホン17と18とから
出力される音声信号に基づいて相互相関係数計算
機25によつて相互相関係数Φ(O)を求める部
分は前述の第6図に示す実施例と同じである。そ
して、相互相関係数計算機25によつて求められ
た相互相関係数は音声/騒音比対応信号として類
似度計算機45に与えられる。
一方、指向性マイクロホン19から出力された
音声信号はフイルタ28を介して音声パラメータ
抽出器47に与えられる。なお、フイルタ28は
前述の第8図に示すプリエンフアシス回路292
を含んでいるものとする。音声パラメータ抽出器
47は同じく第8図に示すバンドパスフイルタ3
01ないし308、整流回路311ないし318
およびローパスフイルタ321ないし328など
含む。そして、音声パラメータ抽出器47は各バ
ンドパスフイルタ301ないし308のそれぞれ
周波数帯域に応じた信号の強さを出力し、それを
音声パラメータメモリ38に与える。この音声パ
ラメータメモリ38は前述の第8図に示したもの
と同じものが用いられる。但し、入力部384に
は音声の有無にかかわらず類似度計算機45が入
力部384に記憶されたデータに従つて計算して
いるとき以外は常時音声パラメータ抽出器47か
ら出力される音声パラメータを順次更新するよう
に構成される。
また、前記音声パラメータ抽出器47は指向性
マイクロホン19に入力された音声の音の大きさ
(音圧)に対応した信号を出力し、これを音声期
間判定器48に与える。音声期間判定器48はそ
の信号に基づいて音声期間を決定し、その結果を
音声期間レジスタ49に記憶する。そして、この
音声期間レジスタ49の内容は類似度計算機45
に与えられる。類似度計算機45は音声期間レジ
スタ49に記憶されている音声期間に基づいて、
音声の始端からたとえば200msec以前と音声の終
つたことを検知し、終端を決定した時点から音声
パラメータメモリ38の入力部384に記憶され
ていてかつ音声期間レジスタ49によつて区間が
設定された音声パラメータのデータと、音声パラ
メータメモリ38に登録されているキーワードの
音声パラメータのデータとの間の類似度の計算を
開始する。この計算において、類似度計算機45
は相互相関係数計算機25から出力される音声/
騒音比対応信号を重み関数として類似度の計算を
行なう。
なお、この実施例では、音声パラメータ抽出器
47から得られる音声パラメータは、5msecご
とに8種類のデータを取込み、たとえば1秒あた
り200回の時間軸に沿つたデータとして得るよう
にしている。ここで、計算量を減少するために、
時間の変化の少ない部分のデータを捨てることに
よつて情報量を一定量まで減少させるような処理
を行なつておく。今、1回の取込むデータをN
種、時間軸方向のデータの長さをM個とし、音声
パラメータメモリ38の登録部383に記憶され
ている音声パラメータの要素をTij、入力された
音声の音声パラメータの要素をPijとしたとき、
よく知られたユークリツド距離dは d=Mj=1 Ni=1 (Tij−Pij)2 …(14) として表わされる。ここでiは1回に取込まれた
N種うちの種類に、jは時間軸方向のデータの順
序にそれぞれ対応している。通常、類似度と距離
(この場合にはd)とは、逆数の関係がある。こ
の実施例では、音声/騒音の比率に対応したW
(SN)なる重み付けを行なつたユークリツド距離
dWは、 dW=Mj=1 W(SN)・Ni=1 (Tij−Pij)2 …(15) を用いて類似度を求めている。重み関数W(SN)
は一例として、第13図のようなものが用いられ
ている。但し、第13図において横軸はSN比、
縦軸は重みを表わしている。
このようにして得られた類似度から、あまりに
類似度が小さい場合には判定不能であるとする
が、ある値以上の類似度がある場合には最大値の
類似度を有するキーワードであるとキーワード判
定器46において判定し、インタフエイス31に
そのキーワードに対応した信号を送出し、ラジオ
7の制御を行なう。なお、類似度計算機45およ
びキーワード判定器46は、たとえばマイクロコ
ンピユータなどによつて構成できる。
上述のごとく音声/騒音比によつて重みを変え
て距離または類似度計算を行なうことによつて、
SN比が大きいときの音声パラメータ同士の比較
を優先的に行ない、SN比が小さいときの値はな
るべく無視するように構成することによつて、音
声/騒音比のよくないときの認識性能を向上でき
かつ瞬時的に音声/騒音比が低下したときの誤認
識を特に減少することができる。もちろん、第1
3図に示した横軸のS/Nは前述の第5A図で示
したS/Nを用いてもよいことは言うまでもな
い。また、第13図において重み関数W(SN)は
連続的に変化する関数としたが、簡単なために
は、たとえばS/N=17dBから上を1、下を0
とするような2値による重み付けを行なつてもよ
い。
第14図はこの発明のさらにその他の実施例を
示すブロツク図である。この第14図に示す実施
例は、前述の第12図に示す類似度計算機45に
与える音声/騒音比対応信号に代えて前述の第1
0図に示す音声、騒音判定信号を与えるようにし
たものである。そして、類似度計算機45は音
声、騒音判定信号が2値であるため、重み関数W
(SN)としても2値として出力する。
第15図はこの発明のさらにその他の実施例を
示すブロツク図である。この第15図に示す実施
例は、前述の第12図に示す類似度計算機45に
与える音声/騒音比対応信号に代えて前述の第1
図に示す演算器43からの信号を用いるようにし
たものである。そして、割算器43からの信号に
基づいて、重み関数の値を変えて距離または類似
度計算を行なう。もちろん2値関数として扱つて
もよいことは言うまでもない。
なお、前述の第10図、第11図、第14図お
よび第15図に示す相互相関関数計算機39とし
て、前述の第(3)式および第(4)式における周期Tを
無限大とする極限を求めないで、ある有限区間に
おいて数値計算する方法がよく用いられる。この
場合、データの長さはマイクロホン17と18と
の間隔(30cm程度)の空気の伝播時間の2倍(約
2msec)より長ければ計算できるが、精度を上
げるために10倍以上長くするように構成される。
なお、上述の実施例において、マイクロホン1
7と18は運転者11の口許から等距離にあるも
のとして説明したが、これは必ずしも必要でな
く、2つのマイクロホン17と18から出力され
る運転者の音声信号の時間差をずらせて前述の説
明と同様に行なうことができることは言うまでも
ない。
また、上述の説明では、この発明を車のラジオ
7を制御するための音声識別装置として説明した
が、これに限ることなくその他の制御対象を制御
するために用いてもよいことは言うまでもない。
以上のように、この発明によれば、比較的高い
騒音の中においても人間の発音した極めて正確に
識別することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例が適用された自動
車を横方向から見た概略図である。第2図は同じ
く運転者の後方向から見た概略図である。第3図
は同じく自動車の車内の概略図である。第4図は
音声信号と騒音との関係を説明するための図であ
る。第5A図および第5B図は相関係数の計算結
果の例を示す図である。第6図はこの発明の一実
施例の概略ブロツク図である。第7A図および第
7B図は相関関数計算機の一例を示す概略ブロツ
ク図である。第8図は第6図に含まれる音声認識
回路の具体的なブロツク図である。第9図は音声
認識回路の他の例を示すブロツク図である。第1
0図はこの発明の他の実施例の概略ブロツク図で
ある。第11図はこの発明のその他の実施例を示
す概略ブロツク図である。第12図はこの発明の
さらにその他の実施例を示す概略ブロツク図であ
る。第13図は重み関数と音声/騒音比との関係
の一例を示す図である。第14図はこの発明のそ
の他の実施例を示すブロツク図である。第15図
はこの発明の他の実施例のブロツク図である。 図において、17,18,19はマイクロホ
ン、25は相互相関係数計算機、26は比較器、
27,41,44はレジスタ、29は音声認識回
路、31はインタフエイス、38は音声パラメー
タメモリ、39は相互相関関数計算機、40は遅
れ時間検出器、42は最大値検出器、43は割算
器、45は類似度計算機、46はキーワード判定
器、47は音声パラメータ抽出器、48は音声期
間判定器、49は音声期間レジスタを示す。

Claims (1)

  1. 【特許請求の範囲】 1 発音者の発音した音声を識別するための音声
    識別装置であつて、 それぞれが前記発音者の近傍に所定の間隔を有
    して配置され、入力された音声を電気信号に変換
    する少なくとも第1および第2の音声入力手段を
    含む音声電気信号変換手段、 前記第1の音声入力手段から出力される音声入
    力信号から予め定める周波数帯域成分の音声信号
    を抽出する第1のフイルタ手段、 前記第2の音声入力手段から出力される音声入
    力信号から前記第1のフイルタ手段と同一の周波
    数帯域成分の音声信号を抽出する第2のフイルタ
    手段、 前記第1および第2のフイルタ手段から抽出さ
    れたそれぞれの音声信号の相関を演算する相関演
    算手段、および 前記相関演算手段からの演算結果に基づいて、
    前記音声電気信号変換手段から出力される音声信
    号が前記発音者の発音した音声に基づくものであ
    るかあるいは騒音に基づくものであるかを判別す
    る音声判別手段を備えた、音声識別装置。 2 前記音声判別手段は、 予め定める音声対騒音比としての値を記憶する
    記憶手段、 前記記憶手段に記憶している音声対騒音比と前
    記相関演算手段出力とを比較し、音声対騒音比の
    大小を表わす信号を出力する比較手段、および 前記比較手段からの音声対騒音比の大小を表わ
    す信号に基づいて、前記音声電気信号変換手段か
    ら入力された音声信号の音声認識を行なうかある
    いは音声認識を不能にする音声認識手段を含む、
    特許請求の範囲第1項記載の音声識別装置。 3 前記相関演算手段は、前記第1および第2の
    フイルタ手段から出力された音声入力信号のそれ
    ぞれの時間差に対応した相関係数を演算する相関
    係数演算手段を含み、 前記記憶手段は予め定める相関係数を音声対騒
    音比対応信号として記憶し、 前記比較手段は前記相関係数演算手段出力と前
    記記憶手段に記憶している相関係数とを比較して
    発音者の発音した音声と騒音との比に応じた音声
    騒音判定信号を出力するようにした、特許請求の
    範囲第2項記載の音声識別装置。 4 前記音声判別手段は、 前記相関係数演算手段出力から相関係数の最大
    値を有する時間を検出する遅れ時間検出手段と、 前記第1および第2の音声入力手段出力の音声
    入力信号のそれぞれの時間差を中央値とし、それ
    から所定の時間の範囲の値を記憶する時間範囲記
    憶手段と、 前記遅れ時間検出手段によつて検出された遅れ
    時間と前記時間範囲記憶手段の内容とを比較し、
    遅れ時間が前記時間範囲記憶手段の内容に基づく
    範囲内に含まれていることに応じて音声判定信号
    を出力し、前記範囲外であれば騒音判定信号を出
    力する第2の比較手段と、 前記第2の比較手段からの音声判定信号に応じ
    て前記音声電気信号変換手段から入力された音声
    入力信号の認識を能動化し、前記騒音判定信号に
    応じて前記認識を不能化する第2の音声認識手段
    とを含む、特許請求の範囲第1項記載の音声識別
    装置。 5 前記第1または第2の音声認識手段は、 前記音声電気信号変換手段出力に基づいて音声
    パラメータを抽出する音声パラメータ抽出手段
    と、 予め定める音声パラメータを記憶する音声パラ
    メータ記憶手段と、 前記音声パラメータ抽出手段からの音声パラメ
    ータと前記音声パラメータ記憶手段に記憶してい
    る音声パラメータとの類似度を演算する類似度演
    算手段と、 前記類似度演算手段による類似度の演算結果に
    基づいていずれの音声であるかを判定するキーワ
    ード判定手段とを含み、 前記類似度演算手段は、前記相関係数演算手段
    出力の相関係数に基づく音声対騒音比対応信号に
    応じた重み関数を考慮して類似度演算を行なうよ
    うにした、特許請求の範囲第2項または第4項に
    記載の音声識別装置。 6 前記重み関数は2値信号である、特許請求の
    範囲第5項記載の音声識別装置。 7 前記音声電気信号変換手段は、前記音声判別
    手段に音声信号を与える第3の音声入力手段を含
    む、特許請求の範囲第1項記載の音声識別装置。 8 前記第3の音声入力手段は指向性マイクロホ
    ンを含む、特許請求の範囲第7項記載の音声識別
    装置。 9 前記第1および第2の音声入力手段はそれぞ
    れ前記発音者の口許から等距離の位置に配置され
    る、特許請求の範囲第1項記載の音声識別装置。
JP57065142A 1982-04-16 1982-04-16 音声識別装置 Granted JPS58181099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57065142A JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57065142A JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Publications (2)

Publication Number Publication Date
JPS58181099A JPS58181099A (ja) 1983-10-22
JPH023520B2 true JPH023520B2 (ja) 1990-01-23

Family

ID=13278332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57065142A Granted JPS58181099A (ja) 1982-04-16 1982-04-16 音声識別装置

Country Status (1)

Country Link
JP (1) JPS58181099A (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61176678U (ja) * 1985-04-23 1986-11-04
JP4518817B2 (ja) * 2004-03-09 2010-08-04 日本電信電話株式会社 収音方法、収音装置、収音プログラム
JP2007251801A (ja) * 2006-03-17 2007-09-27 Sony Corp 音響信号処理装置及び音響信号処理方法並びに音響信号処理用プログラム
JP5271734B2 (ja) * 2009-01-30 2013-08-21 セコム株式会社 話者方向推定装置
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
JP5272920B2 (ja) 2009-06-23 2013-08-28 富士通株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP5439221B2 (ja) * 2010-02-22 2014-03-12 セコム株式会社 発声検出装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135204A (en) * 1977-04-27 1978-11-25 Western Electric Co Signal processor
JPS5763937A (en) * 1980-10-06 1982-04-17 Nippon Telegr & Teleph Corp <Ntt> Noise suppression system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53135204A (en) * 1977-04-27 1978-11-25 Western Electric Co Signal processor
JPS5763937A (en) * 1980-10-06 1982-04-17 Nippon Telegr & Teleph Corp <Ntt> Noise suppression system

Also Published As

Publication number Publication date
JPS58181099A (ja) 1983-10-22

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
US8200488B2 (en) Method for processing speech using absolute loudness
JP3654045B2 (ja) 音声認識装置
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JPH023520B2 (ja)
US7542577B2 (en) Input sound processor
JP2000163098A (ja) 音声認識装置
US7177806B2 (en) Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system
JP2701431B2 (ja) 音声認識装置
JP3384165B2 (ja) 音声認識装置
WO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
JP2992324B2 (ja) 音声区間検出方法
JP3106543B2 (ja) 音声信号処理装置
JP2564821B2 (ja) 音声判定検出装置
JP7172120B2 (ja) 音声認識装置及び音声認識方法
JP2007171637A (ja) 音声処理装置
JP2016080767A (ja) 周波数成分抽出装置、周波数成分抽出方法及び周波数成分抽出プログラム
JP2825272B2 (ja) エレベータ装置
JP2004272048A (ja) 運転者状態判定装置、および運転者状態判定装置用プログラム
US20230239617A1 (en) Ear-worn device and reproduction method
JPH03160499A (ja) 音声認識装置
JPS5885498A (ja) 音声入力装置
JP3003130B2 (ja) 音声認識装置
JPH09127982A (ja) 音声認識装置
JP4568905B2 (ja) マイクロホン装置および発話検出装置