JP2003114699A - 車載音声認識システム - Google Patents

車載音声認識システム

Info

Publication number
JP2003114699A
JP2003114699A JP2001307698A JP2001307698A JP2003114699A JP 2003114699 A JP2003114699 A JP 2003114699A JP 2001307698 A JP2001307698 A JP 2001307698A JP 2001307698 A JP2001307698 A JP 2001307698A JP 2003114699 A JP2003114699 A JP 2003114699A
Authority
JP
Japan
Prior art keywords
voice recognition
voice
vehicle
speaker
recognition system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001307698A
Other languages
English (en)
Inventor
Akinori Usami
彰規 宇佐美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Wiring Systems Ltd
AutoNetworks Technologies Ltd
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Wiring Systems Ltd
AutoNetworks Technologies Ltd
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Wiring Systems Ltd, AutoNetworks Technologies Ltd, Sumitomo Electric Industries Ltd filed Critical Sumitomo Wiring Systems Ltd
Priority to JP2001307698A priority Critical patent/JP2003114699A/ja
Publication of JP2003114699A publication Critical patent/JP2003114699A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 音声認識において誤認識を少なくする。 【解決手段】 マイクロホンアレイ2で話者の位置を特
定し、話者識別装置5で話者識別したりしながら、各話
者毎に異なる音声データをそれぞれ音声認識する。話者
が同時に発音している場合であっても、音声データが混
在していない状態で音声認識できるので、誤認識が少な
くなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、車両内の搭乗者
の発音を音声認識する車載音声認識システムに関する。
【0002】
【従来の技術】複数の音声情報を連続的に発声し、同時
に情報を表示する表示画面上に表示させる表示数を指定
すると、音声を指定した表示数から構成させる複数の単
語とみなして音声認識を行う技術がある(従来例:特開
平9−237098号)。
【0003】
【発明が解決しようとする課題】上記の従来例では、複
数の単語を連続的に認識する場合に、認識処理を行う瞬
間において、発声単語が1つであることを前提としてい
る。
【0004】しかしながら、2名以上の人が同時に発声
した場合、音声認識する対象の語彙が2名以上によって
同時に発声されることになるため、2つ以上の音声が重
畳してしまい、認識すべき音声として処理することが困
難となって誤認識するおそれがある。
【0005】そこで、この発明の課題は、同時に複数の
話者が発声しているときにも誤認識が生じにくい車載音
声認識システムを提供することにある。
【0006】
【課題を解決するための手段】上記課題を解決すべく、
請求項1に記載の発明は、車両内の搭乗者の発音を音声
認識する車載音声認識システムであって、複数のマイク
ロホンが配置されてなるマイクロホンアレイと、前記マ
イクロホンアレイについて指定された指向特性を実現さ
せて、遅延または進み処理を行うことにより複数の音声
または雑音を分離し必要な音声データのみを分離する信
号処理装置と、前記マイクロホンアレイで採取した各話
者の音声データの識別を行って各話者の特定を行う話者
識別装置と、前記信号処理装置で分離されたそれぞれの
前記音声データを用いて音声識別を行う音声認識装置と
を備えるものである。
【0007】請求項2に記載の発明は、請求項1に記載
の車載音声認識システムであって、前記信号処理装置
が、1フレームずつ前記音声を分離し、前記音声認識装
置が、音声認識で得られる探索途中結果を各発声データ
毎に一時的に保存しつつ、当該探索途中結果を切り替え
ながら、複数の発声データを時間差で音声認識処理する
ものである。
【0008】請求項3に記載の発明は、請求項1に記載
の車載音声認識システムであって、前記信号処理装置で
分離された音声データのそれぞれにつき、複数の音声認
識装置で各々音声認識処理するものである。
【0009】請求項4に記載の発明は、請求項1ないし
請求項3のいずれかに記載の車載音声認識システムであ
って、前記信号処理装置は、マイクロホンアレイの指向
性を所定の位置の方向に対応するよう設定するものであ
る。
【0010】請求項5に記載の発明は、請求項4に記載
の車載音声認識システムであって、前記所定の位置が、
運転席の位置及び助手席の位置を含むものである。
【0011】請求項6に記載の発明は、請求項1ないし
請求項3のいずれかに記載の車載音声認識システムであ
って、前記信号処理装置は、任意の方向にいる複数の話
者を音源探索により方向を特定し、それぞれの特定した
方向に指向性が向くように設定された指向特性を用い
て、前記マイクロホンアレイの指向性を設定するもので
ある。
【0012】請求項7に記載の発明は、請求項1ないし
請求項6のいずれかに記載の車載音声認識システムであ
って、前記音声データに話者の発音した音声が含まれて
いなかった場合に、前記音声認識装置が、前記音声デー
タの音声認識処理を休止するものである。
【0013】請求項8に記載の発明は、請求項1ないし
請求項7のいずれかに記載の車載音声認識システムであ
って、所定の外部通信機器を接続するためのハンズフリ
ー装置をさらに備え、前記ハンズフリー装置が、前記話
者識別装置で特定された話者の音声データを前記外部通
信機器に転送するものである。
【0014】請求項9に記載の発明は、請求項8に記載
の車載音声認識システムであって、前記話者識別装置
が、予め登録されている称呼に基づいて話者を特定する
ものである。
【0015】請求項10に記載の発明は、請求項8に記
載の車載音声認識システムであって、前記外部通信機器
を用いて前記ハンズフリー装置で車室内の複数の話者と
通話を行う場合、前記信号処理装置で分離された音声デ
ータについて常に音声パワーの比較を行い、一番パワー
が強いデータのみを転送させるものである。
【0016】
【発明の実施の形態】一般に、自動車内の運転席、助手
席または任意位置で同時に1話者以上の話者が音声認識
語彙を発声しマイクロホンで音を収録した場合、複数の
音声が重畳したデータとなる。この発明は、2個以上の
マイクロホンを規則的または不規則に配置し、各マイク
ロホンの出力信号に対して遅延または進みの操作を行う
ことで特定方向に強い指向特性を持たせ、収録した音を
発声話者方向毎に分離するものである。
【0017】<構成>図1はこの発明の一の実施の形態
に係る車載音声認識システムを示すブロック図である。
この車載音声認識システムは、図1の如く、システム全
体の制御を司る中央制御部1と、複数のマイクロホン2
a,2b,…2mが等間隔または不規則に一直線上また
は平面上にあるいは立体的に配置されてなるマイクロホ
ンアレイ2と、このマイクロホンアレイ2の各マイクロ
ホン2a,2b,…2mで変換されたアナログ波形をデ
ジタル信号に変換するA/D変換装置3と、指定された
指向特性を実現させ、複数の音声または雑音を分離し必
要な音声データのみを分離する信号処理装置4と、発声
した話者の識別を行って各話者の特定を行う話者識別装
置5と、信号処理装置4で信号処理を行った音声波形デ
ータを用いて音声識別を行う音声認識装置6と、音声を
再生するスピーカ7と、スピーカ7への音声再生のため
デジタル信号からアナログ信号に変換するD/A変換装
置8と、外部通信を行うための携帯電話装置9(外部通
信機器)と接続させて外部との通話を可能とするハンズ
フリー装置10とを備える。
【0018】中央制御部1は、ROM及びRAMが接続
されたCPUが使用され、ROM等内に予め格納された
ソフトウェアプログラムに従って動作する機能要素であ
る。この中央制御部1のソフトウェアプログラムによっ
て定義される動作機能としては、例えば、パワーシート
などの各種の車載電子装置12を制御する車載制御装置
11から音声入力開始要求があったか否かを判定する機
能と、A/D変換装置3への動作開始要求を行ってマイ
クロホンアレイ2で受音した波形のA/D変換値(図2
中の符号21)を取得する機能と、それぞれの話者方向
に指向性が強く成るようA/D変換装置3から取得した
A/D変換値21を信号処理装置4に渡すとともに話者
位置探索要求を行う機能と、信号処理装置4で分離され
た話者それぞれの発声データ結果を得る機能と、この発
声データ結果のそれぞれを音声認識装置6に渡す機能
と、音声認識装置6での音声認識結果を取得する機能
と、この音声認識結果に基づいて各種の車載電子装置1
2の制御を行うよう車載制御装置11に指令する機能
(図2中の車載電子機器制御処理22)と、信号処理装
置4で信号処理(図2中の符号23)を行った後のデー
タを例えばハンズフリー装置10を通じて携帯電話装置
9に転送する機能とがある。
【0019】信号処理装置4は、図2中の信号処理23
を司るものであり、ROM及びRAMが接続されたCP
Uが使用され、ROM等内に予め格納されたソフトウェ
アプログラムに従って動作する機能要素である。この信
号処理装置4のソフトウェアプログラムによって定義さ
れる動作機能としては、中央制御部1から話者位置探索
要求があったか否かの判定を行う機能と、この話者位置
探索要求があったときにA/D変換装置3で変換された
結果を用いて指向特性を連続的に変化させながら音声情
報が含まれているか確認をし、音声情報が含まれている
場合に、その方向を獲得して発声している全ての話者の
方向についての情報(図2中の話者位置情報24)を検
出する機能と、検出した全ての話者位置情報について、
これらの話者方向または固定方向に対し指向性を持たせ
るための信号処理23を行って、当該信号処理結果とし
て得られた音声データを話者発声データ(図2中の音声
波形25a〜25c)として中央制御部1に渡す機能と
がある。
【0020】話者識別装置5は、ROM及びRAMが接
続されたCPUが使用され、ROM等内に予め格納され
たソフトウェアプログラムに従って動作する機能要素で
ある。この話者識別装置5のソフトウェアプログラムに
よって定義される動作機能としては、話者の肉声の特徴
パラメータを予めデータベース化して記憶部(図示せ
ず)内に格納しておき、例えばハンズフリー装置10か
ら中央制御部1を通じて要求があったときに、データベ
ース内の話者の肉声の特徴パラメータをハンズフリー装
置10に出力する機能がある。また、話者識別装置5
は、予め登録されている氏名やニックネーム等の称呼が
音声認識装置6で認識されたときに、その認識結果に基
づいて話者を特定する機能をも有している。
【0021】音声認識装置6は、ROM及びRAMが接
続されたCPUが使用され、ROM等内に予め格納され
たソフトウェアプログラムに従って動作する機能要素で
ある。この音声認識装置6のソフトウェアプログラムに
よって定義される動作機能としては、全ての話者につい
て、分離した話者の1フレーム分の音声データを取得し
て音声認識処理(図2中の符号26)を行う機能と、こ
の1フレーム分の処理を行った時の探索途中結果を分離
された各話者の探索途中結果27a,27b,…27n
として保存しつつ、これと併せて1つ前に行った時に得
られた分離話者探索途中結果27a,27b,…27n
を全ての話者について音声認識処理26時に利用させる
機能と、これらの音声認識結果を中央制御部1に送信す
る機能とがある。
【0022】ハンズフリー装置10は、所定のクレード
ルに携帯電話装置9を設置したときに当該携帯電話装置
9に接続して相互に信号の受け渡しを行う装置であり、
ROM及びRAMが接続されたCPUが内蔵されてお
り、ROM等内に予め格納されたソフトウェアプログラ
ムに従って図2中のハンズフリー処理28を行う機能要
素である。このハンズフリー装置10のソフトウェアプ
ログラムによって定義される動作機能としては、通話す
べき話者の位置が特定されているか否かを判定する機能
と、話者の位置が分かっている場合に信号処理装置4に
よって分離された話者の1フレーム分の音声データから
話者方向に対応した音声データを選択し携帯電話装置9
(外部通信機器)にデータを転送する機能と、話者の特
定ができていない場合に分離した各音声データに基づい
て話者識別装置5から与えられた特徴パラメータを算出
し、ゆう度計算(ゆう度関数を最大にするパラメータ値
を求めて推論を行う演算)に基づいて、予め記憶してい
る基準情報と比較することにより通話すべき話者を特定
し、この特定した話者に対応した音声データを選択し携
帯電話等の外部通信機器にデータを転送する機能と、話
者を特定することができなかった場合に、各発声話者の
特徴パラメータから隠れマルコフモデル(HMM)また
はガウス混合モデル(GMM)を作成して登録を行う機
能とがある。尚、隠れマルコフモデル(HMM)または
ガウス混合モデル(GMM)は、これより後刻に話者特
定を行う際のゆう度計算にこれらのモデルを利用できる
ようにするためのものである。
【0023】<動作>上記構成の車載音声認識システム
の動作を説明する。まず、図3のステップSA01にお
いて、車載制御装置11から音声入力開始要求があった
ときに、中央制御部1がその旨を判定し、A/D変換装
置3にA/D変換動作の開始要求を発する。A/D変換
装置3では、ステップSA03において、マイクロホン
アレイ2の各マイクロホン2a,2b,…2mで採取さ
れたアナログ式の音声情報をA/D変換し、中央制御部
1はA/D変換装置3から出力されるA/D変換値21
を取得する(図2中のA/D値取得処理31)。
【0024】次のステップSA04で、中央制御部1
は、A/D変換値21を信号処理装置4に渡すとともに
話者位置探索要求を行って指向性の信号処理を行う。
【0025】この信号処理装置4における指向性の信号
処理の具体的な処理手順を図4に示す。まずステップS
B01において、信号処理装置4は、中央制御部1から
話者位置探索要求があったかどうかを判断する。そし
て、話者位置探索要求があった場合には、次のステップ
SB02に進み、中央制御部1からA/D変換値21
(A/D値)を取得した後、全ての領域を走査したかど
うかを判断し(ステップSB03)、走査すべき領域が
存在している場合に、ステップSB04に進む。ステッ
プSB04では、マイクロホンアレイ2の各マイクロホ
ン2a,2b,…2mの指向特性を連続的に変化させな
がら、ステップSB05のように中央制御部1からのA
/D変換値21としての音声情報が含まれているか否か
を確認する(図2中の音源探索処理29)。そして、音
声情報が含まれている場合に、その方向を算出して獲得
し、RAM(図示せず)内に登録した後にステップSB
02に戻る。尚、ステップSB05で音声情報が含まれ
ていないと判断した場合には、ステップSB06の処理
を省略してステップSB02に戻る。
【0026】ここで、信号処理装置4における指向性に
ついては、初期的には、事前に運転席側、助手席側に指
向性が向くように設定された指向特性を用いる。このよ
うにすることで、効率の良い指向性の特定を行うことが
できる。
【0027】このようにして、全ての領域の走査を終了
した場合には(ステップSA03)ステップSB07に
進み、発声している話者の方向を分離できているかどう
かを確認する。ただし、ステップSB03からステップ
SB07に進んだ時点では、まだ話者の分離が行われて
いないため、ステップSB08に進み、分離したい話者
の方向に指向特性を実現するためのマイクロホンアレイ
処理(アレー処理)を行う(指向性の特定)。このマイ
クロホンアレイ処理は、複数のマイクロホン2a,2
b,…2mの出力信号(A/D変換値21)を用いて、
これらのマイクロホン2a,2b,…2mの物理的な位
置及び方向を変化させずに、音声データの位相差等を利
用した信号処理によって目的とする方向に指向特性を強
くする既知の技術である。
【0028】そして、ステップSB09において、検出
した全ての話者位置情報24について、これらの話者方
向または固定方向に対し指向性を持たせるための信号処
理23を行って、当該信号処理結果として得られた音声
データを話者発声データ(図2中の音声波形25a〜2
5c)としてRAM(図示せず)内に書き込み、これを
中央制御部1に渡す。
【0029】再び図3に戻り、中央制御部1は、ステッ
プSA05において、車載制御装置11から音声認識開
始要求があったか否かを判断する。音声認識開始要求が
あったと判断した場合は、ステップSA06に進む。
【0030】そして、ステップSA06で音声認識処理
(図2中の符号26参照)を実行する。
【0031】この音声認識処理26の具体的な処理手順
を図5に示す。まずステップSC01において、音声認
識装置6は、1フレーム分の分離した話者発声データ2
5a〜25cを中央制御部1から取得し、ステップSC
02で取得したフレームが先頭かどうかを判断する。そ
して、判断結果が肯定的であった場合には、次のステッ
プSC03に進み、予め保有している音声パターンデー
タに対するパターン認識を行うことで音声認識動作を行
う。
【0032】ここで、音声データは1フレーム毎に与え
られることから、その1フレームの音声データに対し
て、当該音声データの音声パターンに基づいて、音声認
識対象となる音声データに話者の発音した音声が含まれ
ていないかどうかを判断する。そして、音声データに話
者の発音した音声が含まれていなかった場合には、音声
認識装置6は、音声データの音声認識処理を休止する。
これにより、ノイズを音声認識してしまう事態を防止し
て、できるだけ誤認識を抑制しながら、しかも処理負荷
低減を行うことができる。
【0033】そして、音声認識処理が終了したか否かを
判断し(ステップSC04)、終了していないと判断し
た場合には、ステップSC05で、分離した話者の音声
認識の探索途中結果(図2中の符号27a〜27n参
照)を一旦保存する。そして、ステップSC06におい
て、全ての話者について処理を終了したか否かを判断す
る。ここで、まだ全ての話者についての処理を終了して
いないと判断した場合には、再びステップSC01に戻
り、1フレーム分の分離した話者発声データ25a〜2
5cを中央制御部1から取得する。そして、ステップS
C02で取得したフレームが先頭でない場合に、ステッ
プSC07に進み、ステップSC05で保存した分離し
た話者の音声認識の探索途中結果27a〜27nを設定
し、これに後続する音声データの音声認識動作を続行す
る(ステップSC03)。
【0034】このようにしてステップSC01〜SC0
7の動作を繰り返し行い、ステップSC04で音声認識
動作を終了したと判断した場合に、ステップSC08に
進んで、分離した話者の音声認識結果を中央制御部1に
転送する。そして、ステップSC06で、さらに他の話
者について音声認識すべきかどうかを判断する。そし
て、ステップSC01〜SC08の動作を繰り返し行
い、全ての話者について音声認識動作が終了した時点
で、音声認識装置6の処理が完了する。
【0035】再び図3に戻り、中央制御部1は、ステッ
プSA07において全ての音声認識処理26が終了した
か否かを判断する。そして、終了していなければ、ステ
ップSA03〜ステップSA07の動作を繰り返す。そ
して、音声認識処理が終了した時点で、ステップSA0
8でA/D変換装置3に対してA/D変換の停止を要求
する。そして、ステップSA09で、音声認識結果に基
づいて車載制御装置11に対して制御要求を行い、これ
に従って車載制御装置11が各車載電子装置12の制御
を行う(図2中の車載電子機器制御処理22)。この場
合は、図7のステップSE1のように、まず音声認識結
果に基づいて、動作させるべき車載電子装置12を選択
し、ステップSE2で、選択した車載電子装置12(機
器)に種々の設定要求を行えばよい。
【0036】次に、信号処理装置4で信号処理(図2中
の符号23)を行った後のデータをハンズフリー装置1
0を通じて携帯電話装置9に転送する動作について説明
する。
【0037】まず図3中のステップSA05おいて、音
声認識開始要求がなされなかった場合、ステップSA1
0に進み、中央制御部1はハンズフリー装置10からハ
ンズフリー開始要求があるか否かを判断する。ハンズフ
リー開始要求があると判断した場合は、次のステップS
A11に進み、ハンズフリー処理(図2中の符号28)
を実行する。
【0038】図6はハンズフリー装置10でのハンズフ
リー処理28の動作手順を示すフローチャートである。
まずステップSD01において、ハンズフリー装置10
は、通話すべき話者の位置が特定されているか否かを判
定する。そして、通話すべき話者の位置が特定されてい
ないと判定した場合は、ステップSD02に進み、話者
識別処理(図2中の符号32)が終了しているかどうか
を判断する。そして、ステップSD02で話者識別が終
了していなければ、各話者の特徴パラメータを話者識別
装置5に要求し、これに呼応して与えられた話者の肉声
の特徴パラメータを算出し(ステップSD03)、ゆう
度計算(ステップSD04)を行って予め記憶している
基準情報と比較して話者識別を行い、ステップSD02
に戻って、再び話者識別が終了したか否かを判断する。
このゆう度計算結果を用いて話者を識別する際には、話
者識別装置5が、予め登録されている氏名やニックネー
ム等の称呼が音声認識装置6で認識されたときに、その
認識結果に基づいて話者を特定するのが望ましい。
【0039】次に、ステップSD05において、話者識
別の結果として、既知の話者の識別ができたか否かを確
認する。その結果が肯定的であった場合には、その既知
の話者について、信号処理装置4によって分離された話
者についての1フレーム分の話者発声データ25a〜2
5cを選択して取得し、ステップSD07で、ハンズフ
リー装置10を通じて携帯電話装置9(外部通信機器)
に話者発声データ25a〜25cを転送する。これによ
り、自動的に話者を認識して携帯電話装置9での通話を
行うことができる。
【0040】一方、ステップSD05において、既知の
話者の識別を行うことができなかった場合は、ステップ
SD08に進む。
【0041】ステップSD08では、既知の話者を特定
することができなかった場合の処理として、各発声話者
の特徴パラメータを算出し(ステップSD09)、隠れ
マルコフモデル(HMM)またはガウス混合モデル(G
MM)を算出(ステップSD10)して、その登録を行
う(ステップSD011)。そして、後刻に話者特定を
行う場合に、ステップSD04のゆう度計算にこれらの
モデルを利用すればよい。
【0042】これらのハンズフリー処理28において
は、携帯電話装置9から通話のための音声データが与え
られたときに、ハンズフリー装置10及び中央制御部1
を通じて音声データがD/A変換装置8に与えられ、こ
のD/A変換装置8で音声データがD/A変換され(図
2中のD/A値出力処理33)、スピーカ7で音声再生
される。
【0043】また、1つの携帯電話装置9を用いてハン
ズフリー装置10で車室内の複数の話者と通話を行う場
合、信号処理装置4で分離された音声データについて常
に音声パワーの比較を行い、一番パワーが強いデータの
みを転送させ、通話話者以外の音声やエンジン雑音、ロ
ード雑音を取り除いた状態で通信品質の高い音声で外部
との通信を行うようにする。これにより、通話話者のみ
の音声を取得して、容易に通信品質を向上させることが
できる。
【0044】以上のように、マイクロホンアレイ2で複
数の話者の音声を採取したときに、それぞれの話者につ
いての発声データとして分離した後、その分離した音声
データについて音声認識等を行うので、例えば図8に示
すように、運転席41や助手席42等にそれぞれ話者4
3,44が搭乗している場合に、マイクロホンアレイ2
の指向特性範囲45〜47を容易に変化させながら音声
データを採取し、これに基づいてそれぞれの話者43,
44毎に容易に音声認識を行うことができる。したがっ
て、音声認識における誤認識の発生率を大幅に低減でき
る。
【0045】特に、分離した各話者毎の音声認識処理時
に生成される1フレーム分の探索途中結果を保存しなが
ら、各話者について切り替えながらタイムシェアリング
で全ての話者についての音声認識を行うので、1つの音
声認識装置6を用いて複数の話者の発声データを認識す
ることが可能となる。
【0046】尚、上記実施の形態では、探索途中結果を
保存しながらタイムシェアリングで全ての単一の音声を
音声認識装置6で音声認識していたが、複数の音声認識
装置6を搭乗者数に対応して設置しておき、分離された
音声データをそれぞれの音声認識装置6で音声認識して
もよい。
【0047】
【発明の効果】請求項1に記載の発明によれば、マイク
ロホンアレイで複数の話者の音声を採取したときに、そ
れぞれの話者についての発声データとして分離した後、
その分離した音声データについて音声認識等を行うの
で、例えば運転席や助手席等にそれぞれ話者が搭乗して
いる場合に、マイクロホンアレイの指向特性範囲を容易
に変化させながら音声データを採取し、これに基づいて
それぞれの話者毎に容易に音声認識を行うことができ
る。したがって、音声認識における誤認識の発生率を大
幅に低減できる。
【0048】請求項2に記載の発明によれば、分離した
各話者毎の音声認識処理時に生成される1フレーム分の
探索途中結果を保存しながら、各話者について切り替え
ながらタイムシェアリングで全ての話者についての音声
認識を行うので、単一の音声認識装置を用いて複数の話
者の発声データを認識することが可能となる。
【0049】請求項3に記載の発明によれば、同時に複
数の音声認識装置で各音声データを音声認識処理できる
ので、処理負荷効率及び処理時間効率を向上できる。
【0050】請求項4及び請求項5に記載の発明によれ
ば、運転席や助手席等の予め定められた位置に対応する
ようにマイクロホンアレイの指向性を設定するので、効
率の良い指向性の特定を行うことができる。
【0051】請求項6に記載の発明によれば、任意の方
向にいる複数の話者を音源探索により方向を特定し、そ
れぞれの特定した方向に指向性が向くように設定された
指向特性を用いて、マイクロホンアレイの指向性を設定
しているので、任意の位置の話者を容易に特定すること
ができる。
【0052】請求項7に記載の発明によれば、音声認識
対象となる音声データに話者の発音した音声が含まれて
いないかどうかを判断し、音声データに話者の発音した
音声が含まれていなかった場合に、音声認識装置が、音
声データの音声認識処理を休止するようにしているの
で、ノイズを音声認識してしまう事態を防止して、でき
るだけ誤認識を抑制しながら、処理負荷低減を行うこと
ができる。
【0053】請求項8に記載の発明によれば、話者識別
装置で特定された話者の音声データを、ハンズフリー装
置により外部通信機器に転送するので、聞き取りやすい
音声データを外部通信機器に転送することができる。
【0054】請求項9に記載の発明によれば、話者識別
装置により、容易に話者を識別することができる。
【0055】請求項10に記載の発明によれば、信号処
理装置で分離された音声データについて常に音声パワー
の比較を行い、一番パワーが強いデータのみを外部通信
機器に転送させることができるので、常に中心となって
発声している話者の音声を転送することができ便利であ
る。
【図面の簡単な説明】
【図1】この発明の一の実施の形態に係る車載音声認識
システムを示すブロック図である。
【図2】この発明の一の実施の形態に係る車載音声認識
システムのソフトウェア構成を示すブロック図である。
【図3】この発明の一の実施の形態に係る車載音声認識
システムの動作を示すフローチャートである。
【図4】この発明の一の実施の形態に係る車載音声認識
システムの動作を示すフローチャートである。
【図5】この発明の一の実施の形態に係る車載音声認識
システムの動作を示すフローチャートである。
【図6】この発明の一の実施の形態に係る車載音声認識
システムの動作を示すフローチャートである。
【図7】車載電子装置を制御する際の動作を示すフロー
チャートである。
【図8】マイクロホンアレイの指向性を示す図である。
【符号の説明】
1 中央制御部 2 マイクロホンアレイ 2a〜2m マイクロホン 3 A/D変換装置 4 信号処理装置 5 話者識別装置 6 音声認識装置 7 スピーカ 8 D/A変換装置 9 携帯電話装置 10 ハンズフリー装置 11 車載制御装置 12 車載電子装置 21 A/D変換値 22 車載電子機器制御処理 23 信号処理 24 話者位置情報 25a〜25c 話者発声データ 26 音声認識処理 27a〜27n 探索途中結果 28 ハンズフリー処理 31 A/D値取得処理 33 D/A値出力処理
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 21/02 G10L 3/00 571C H04M 1/00 511 1/725 551J H04R 1/40 320 3/02 301E (72)発明者 宇佐美 彰規 愛知県名古屋市南区菊住1丁目7番10号 株式会社オートネットワーク技術研究所内 Fターム(参考) 5D015 DD02 KK01 LL09 5K027 AA16 HH20

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 車両内の搭乗者の発音を音声認識する車
    載音声認識システムであって、 複数のマイクロホンが配置されてなるマイクロホンアレ
    イと、 前記マイクロホンアレイについて指定された指向特性を
    実現させて、遅延または進み処理を行うことにより複数
    の音声または雑音を分離し必要な音声データのみを分離
    する信号処理装置と、 前記信号処理装置で分離されたそれぞれの前記音声デー
    タを用いて音声識別を行う音声認識装置とを備える車載
    音声認識システム。
  2. 【請求項2】 請求項1に記載の車載音声認識システム
    であって、 前記信号処理装置が、1フレームずつ前記音声を分離
    し、 前記音声認識装置が、音声認識で得られる探索途中結果
    を各発声データ毎に一時的に保存しつつ、当該探索途中
    結果を切り替えながら、複数の発声データを時間差で音
    声認識処理することを特徴とする車載音声認識システ
    ム。
  3. 【請求項3】 請求項1に記載の車載音声認識システム
    であって、 前記信号処理装置で分離された音声データのそれぞれに
    つき、複数の音声認識装置で各々音声認識処理すること
    を特徴とする車載音声認識システム。
  4. 【請求項4】 請求項1ないし請求項3のいずれかに記
    載の車載音声認識システムであって、 前記信号処理装置は、マイクロホンアレイの指向性を所
    定の位置の方向に対応するよう設定することを特徴とす
    る車載音声認識システム。
  5. 【請求項5】 請求項4に記載の車載音声認識システム
    であって、 前記所定の位置が、運転席の位置及び助手席の位置を含
    むことを特徴とする車載音声認識システム。
  6. 【請求項6】 請求項1ないし請求項3のいずれかに記
    載の車載音声認識システムであって、 前記信号処理装置は、任意の方向にいる複数の話者を音
    源探索により方向を特定し、それぞれの特定した方向に
    指向性が向くように設定された指向特性を用いて、前記
    マイクロホンアレイの指向性を設定することを特徴とす
    る車載音声認識システム。
  7. 【請求項7】 請求項1ないし請求項6のいずれかに記
    載の車載音声認識システムであって、 前記音声データに話者の発音した音声が含まれていなか
    った場合に、前記音声認識装置が、前記音声データの音
    声認識処理を休止することを特徴とする車載音声認識シ
    ステム。
  8. 【請求項8】 請求項1ないし請求項7のいずれかに記
    載の車載音声認識システムであって、 前記マイクロホンアレイで採取した各話者の音声データ
    の識別を行って各話者の特定を行う話者識別装置と、 所定の外部通信機器を接続するためのハンズフリー装置
    をさらに備え、 前記ハンズフリー装置が、前記話者識別装置で特定され
    た話者の音声データを前記外部通信機器に転送すること
    を特徴とする車載音声認識システム。
  9. 【請求項9】 請求項8に記載の車載音声認識システム
    であって、 前記話者識別装置が、予め登録されている称呼に基づい
    て話者を特定することを特徴とする車載音声認識システ
    ム。
  10. 【請求項10】 請求項8に記載の車載音声認識システ
    ムであって、 前記外部通信機器を用いて前記ハンズフリー装置で車室
    内の複数の話者と通話を行う場合、前記信号処理装置で
    分離された音声データについて常に音声パワーの比較を
    行い、一番パワーが強いデータのみを転送させることを
    特徴とする車載音声認識システム。
JP2001307698A 2001-10-03 2001-10-03 車載音声認識システム Pending JP2003114699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001307698A JP2003114699A (ja) 2001-10-03 2001-10-03 車載音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001307698A JP2003114699A (ja) 2001-10-03 2001-10-03 車載音声認識システム

Publications (1)

Publication Number Publication Date
JP2003114699A true JP2003114699A (ja) 2003-04-18

Family

ID=19127124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001307698A Pending JP2003114699A (ja) 2001-10-03 2001-10-03 車載音声認識システム

Country Status (1)

Country Link
JP (1) JP2003114699A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005350018A (ja) * 2004-06-14 2005-12-22 Honda Motor Co Ltd 車載用電子制御装置
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
WO2006025106A1 (ja) * 2004-09-01 2006-03-09 Hitachi, Ltd. 音声認識システム、音声認識方法およびそのプログラム
WO2007139040A1 (ja) * 2006-05-25 2007-12-06 Yamaha Corporation 音声状況データ生成装置、音声状況可視化装置、音声状況データ編集装置、音声データ再生装置、および音声通信システム
US7599836B2 (en) 2004-05-26 2009-10-06 Nuance Communications, Inc. Voice recording system, recording device, voice analysis device, voice recording method and program
US8010359B2 (en) 2005-03-16 2011-08-30 Fujitsu Limited Speech recognition system, speech recognition method and storage medium
WO2012023268A1 (ja) * 2010-08-16 2012-02-23 日本電気株式会社 多マイクロホン話者分類装置、方法およびプログラム
JP2013083751A (ja) * 2011-10-07 2013-05-09 Denso Corp 車両用装置
US8818459B2 (en) 2011-11-09 2014-08-26 Denso Corporation Hands-free device
KR20140131956A (ko) * 2012-03-16 2014-11-14 뉘앙스 커뮤니케이션즈, 인코포레이티드 사용자 전용 자동 음성 인식
EP3163573A1 (en) 2015-10-27 2017-05-03 Panasonic Intellectual Property Management Co., Ltd. Speech collector in car cabin
KR20180135595A (ko) * 2017-06-13 2018-12-21 현대자동차주식회사 음성 명령 기반 작업 선택 장치, 차량, 음성 명령 기반 작업 선택 방법
WO2019130399A1 (ja) * 2017-12-25 2019-07-04 三菱電機株式会社 音声認識装置、音声認識システム及び音声認識方法
WO2020079733A1 (ja) * 2018-10-15 2020-04-23 三菱電機株式会社 音声認識装置、音声認識システム、及び音声認識方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599836B2 (en) 2004-05-26 2009-10-06 Nuance Communications, Inc. Voice recording system, recording device, voice analysis device, voice recording method and program
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
JP2005350018A (ja) * 2004-06-14 2005-12-22 Honda Motor Co Ltd 車載用電子制御装置
US7428454B2 (en) 2004-06-14 2008-09-23 Honda Motor Co., Ltd. Electronic control system built into vehicle
WO2006025106A1 (ja) * 2004-09-01 2006-03-09 Hitachi, Ltd. 音声認識システム、音声認識方法およびそのプログラム
US8010359B2 (en) 2005-03-16 2011-08-30 Fujitsu Limited Speech recognition system, speech recognition method and storage medium
WO2007139040A1 (ja) * 2006-05-25 2007-12-06 Yamaha Corporation 音声状況データ生成装置、音声状況可視化装置、音声状況データ編集装置、音声データ再生装置、および音声通信システム
WO2012023268A1 (ja) * 2010-08-16 2012-02-23 日本電気株式会社 多マイクロホン話者分類装置、方法およびプログラム
US8885847B2 (en) 2011-10-07 2014-11-11 Denso Corporation Vehicular apparatus
JP2013083751A (ja) * 2011-10-07 2013-05-09 Denso Corp 車両用装置
US8818459B2 (en) 2011-11-09 2014-08-26 Denso Corporation Hands-free device
US10789950B2 (en) 2012-03-16 2020-09-29 Nuance Communications, Inc. User dedicated automatic speech recognition
KR20140131956A (ko) * 2012-03-16 2014-11-14 뉘앙스 커뮤니케이션즈, 인코포레이티드 사용자 전용 자동 음성 인식
KR101641448B1 (ko) * 2012-03-16 2016-07-20 뉘앙스 커뮤니케이션즈, 인코포레이티드 사용자 전용 자동 음성 인식
EP3163573A1 (en) 2015-10-27 2017-05-03 Panasonic Intellectual Property Management Co., Ltd. Speech collector in car cabin
US9953641B2 (en) 2015-10-27 2018-04-24 Panasonic Intellectual Property Management Co., Ltd. Speech collector in car cabin
KR20180135595A (ko) * 2017-06-13 2018-12-21 현대자동차주식회사 음성 명령 기반 작업 선택 장치, 차량, 음성 명령 기반 작업 선택 방법
KR102437833B1 (ko) * 2017-06-13 2022-08-31 현대자동차주식회사 음성 명령 기반 작업 선택 장치, 차량, 음성 명령 기반 작업 선택 방법
JPWO2019130399A1 (ja) * 2017-12-25 2020-04-23 三菱電機株式会社 音声認識装置、音声認識システム及び音声認識方法
WO2019130399A1 (ja) * 2017-12-25 2019-07-04 三菱電機株式会社 音声認識装置、音声認識システム及び音声認識方法
WO2020079733A1 (ja) * 2018-10-15 2020-04-23 三菱電機株式会社 音声認識装置、音声認識システム、及び音声認識方法
JPWO2020079733A1 (ja) * 2018-10-15 2021-02-15 三菱電機株式会社 音声認識装置、音声認識システム、及び音声認識方法

Similar Documents

Publication Publication Date Title
JP2003114699A (ja) 車載音声認識システム
US8639508B2 (en) User-specific confidence thresholds for speech recognition
KR100984528B1 (ko) 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
US5640485A (en) Speech recognition method and system
CN1160698C (zh) 噪声信号中语音的端点定位
US20020087306A1 (en) Computer-implemented noise normalization method and system
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
US9564120B2 (en) Speech adaptation in speech synthesis
US20020128820A1 (en) Method for recognizing speech using eigenpronunciations
US8744421B2 (en) Method of initiating a hands-free conference call
JP2002540703A (ja) 通話容易化装置用の口頭ユーザインターフェイス
JP2002536885A (ja) 音声起動移動電話通話応答装置
US20130211828A1 (en) Speech processing responsive to active noise control microphones
EP1525577B1 (en) Method for automatic speech recognition
JPH08307509A (ja) 手を使わずに電話機のダイアル操作を行う方法および装置
JP2002536691A (ja) 音声認識除去方式
JPH1152976A (ja) 音声認識装置
US20120197643A1 (en) Mapping obstruent speech energy to lower frequencies
EP1110207B1 (en) A method and a system for voice dialling
KR20140067687A (ko) 대화형 음성인식이 가능한 차량 시스템
JP4478146B2 (ja) 音声認識システム、音声認識方法およびそのプログラム
WO2014141574A1 (ja) 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム
JP2004301875A (ja) 音声認識装置