JP2019176430A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2019176430A
JP2019176430A JP2018065656A JP2018065656A JP2019176430A JP 2019176430 A JP2019176430 A JP 2019176430A JP 2018065656 A JP2018065656 A JP 2018065656A JP 2018065656 A JP2018065656 A JP 2018065656A JP 2019176430 A JP2019176430 A JP 2019176430A
Authority
JP
Japan
Prior art keywords
microphone
voice recognition
voice
microphones
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018065656A
Other languages
English (en)
Inventor
塚本 淳
Atsushi Tsukamoto
淳 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018065656A priority Critical patent/JP2019176430A/ja
Publication of JP2019176430A publication Critical patent/JP2019176430A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】複数のマイクロフォンを含む音声認識装置において、集音効率を向上させ音声認識の成功率を向上させる。【解決手段】車両に搭載される音声認識装置10は、複数の座席にそれぞれ対応して配置された複数のマイク12と、複数のマイク12のそれぞれに対応して、少なくとも1つずつ設けられた複数のランプ13と、複数の座席に設けられた着座センサ30からの信号を取得する通信部15と、制御部21とを有する。制御部21は、複数のマイク12に入力される音圧および着座センサ30からの信号に基づいて、音声入力に使用するマイク12を選択し、該選択されたマイク12に対応するランプ13を点灯させる。【選択図】図1

Description

本発明は、音声認識装置に関する。
車両に搭載される音声認識装置において、運転者のみならず、運転者以外の車両の搭乗者の発話を認識させたいことがある。例えば、搭乗者は、音声認識によりオーディオ機器の音量を変えたり、テレビのチャンネルを変えたりすることがある。このため、発話スイッチおよびマイクロフォンを運転席側と助手席側に設けて、複数の利用者で音声認識装置を利用できるようにすることが提案されている(例えば、特許文献1参照)。
また、音声処理装置において、車両内に複数のマイクロフォンを配置し、1つのマイクロフォンを音声入力用とし、他の1つのマイクロフォンを雑音入力用とし、ユーザに対して音声入力用のマイクロフォンの方向を示すために、ランプを点灯させることが提案されている(例えば、特許文献2参照)。特許文献2では、音声処理装置が、より大きい入力音声信号レベルを出力するマイクロフォンを、音声入力用のマイクロフォンとして自動的に選択することも開示されている。
特開2006−119520号公報 特開2014−178339号公報
特許文献1に記載の音声認識装置では、複数のマイクロフォンを配置して、何れかのマイクロフォンに入力された音声に基づいて音声認識をするとき、発話者が、使用時点で音声入力を行うことが可能なマイクロフォンの位置が分からない場合がある。そのような場合、発話者が入力を行うことが可能なマイクロフォンと異なるマイクロフォンの方向を向いて発話するため、集音効率が低下し音声認識の成功率が低下することがある。
また、特許文献2に記載の音声認識装置では、入力音声信号レベルに基づいて音声入力用のマイクロフォンを選択したとき、発話者の顔の向き、姿勢、および、車両内の雑音の発生状況等の状態によって、発話者に最も近いマイクロフォンが選択されない場合がありうる。そのような場合、発話者から離れて位置するマイクロフォンに対して音声を入力するため、集音効率が低下し音声認識の成功率が低下することが生じうる。
かかる事情に鑑みてなされた本発明の目的は、複数のマイクロフォンを含む音声認識装置において、集音効率を向上させ音声認識の成功率を向上させることにある。
上記目的を達成する本開示の一実施形態に係る音声認識装置は、車両に搭載される音声認識装置において、複数の座席にそれぞれ対応して配置された複数のマイクロフォンと、前記複数のマイクロフォンのそれぞれに対応して、少なくとも1つずつ設けられた複数のランプと、前記複数の座席に設けられた着座センサからの信号を取得する通信部と、前記複数のマイクロフォンに入力される音圧および前記着座センサからの信号に基づいて、音声入力に使用するマイクロフォンを選択し、該選択されたマイクロフォンに対応する前記ランプを点灯させる制御部とを備えることを特徴とするものである。
本開示によれば、複数のマイクロフォンに入力される音圧および着座センサからの信号に基づいて、音声入力に使用するマイクロフォンを選択し、選択されたマイクロフォンに対応するランプを点灯させるようにしている。これによって、マイクロフォンを選択する精度が向上するとともに、発話者の顔の向きを音声の入力を受けるマイクロフォンに向けることにより、集音効率を向上させ音声認識の成功率を向上させることができる。
本発明の一実施形態に係る音声認識装置の概略構成を示すブロック図である。 図1に示す音声認識装置の各構成要素の車両内での配置例を示す模式的な平面図である。 図1の音声認識装置の処理の一例を示すフローチャートである。
以下、本発明の実施形態について、図面を参照して説明する。
(音声認識装置の構成)
図1に、本発明の一実施形態に係る音声認識装置10の概略構成を示すブロック図を示す。音声認識装置10は、人の話す音声を取得し発話内容を認識し、認識結果を出力する。音声認識装置10は、例えば車両に搭載することができる。本願において、車両には乗用車、トラック、バス、大型・小型特殊車両等を含むがこれらに限られない。音声認識装置10は、装置本体部11、複数のマイクロフォン12(以下、適宜「マイク12」と表記する)、複数のランプ13を含む。さらに、音声認識装置10は、複数の起動スイッチ14を含むことができる。また、音声認識装置10は、車両の各座席に設けられた複数の着座センサ30と通信することができる。音声認識装置10は、着座センサ30を含んで構成されてよい。
図2は、図1に示した音声認識装置10の各構成要素の車両内での配置例を示す平面図である。図2においては、車両の外形を実線で示しているが、見易さのため座席および音声認識装置10の各構成要素と重なる部分は、線の表示を省略している。また、車両内の座席および音声認識装置10の各構成要素は、破線で示している。図2の車両は、運転席、助手席および2つの後部座席の合計4つの座席を備えている。車両の座席数は4に限られず、法律上可能な範囲で任意の複数の座席が可能である。図2において、音声認識装置10の各構成要素を繋ぐ配線等については省略している。マイク12、ランプ13、起動スイッチ14および着座センサ30は、図2に図示の例ではそれぞれ各座席に対応して合計4つずつ設けられており、各構成要素を示す符号にa〜dを付与してそれぞれを区別している。マイク12a〜12d、ランプ13a〜13d、起動スイッチ14a〜14d、着座センサ30a〜30d、および、各座席の対応関係は、装置本体部10において例えばテーブルとして保持される。
音声認識装置10の装置本体部11は、例えば、ダッシュボードの中に配置することができる。装置本体部11は、ダッシュボード内に限られず、ダッシュボード上、車室内の天井部等車室内の任意の場所、または、ラゲッジ・スペース内等に配置することが可能である。
マイク12a〜12dは、例えば、各座席の前方の車室内の天井部に取付けられている。図示の例では、マイク12aは、運転席の斜め左前方に配置される。マイク12bは、助手席の斜め右前方に配置される。マイク12cは運転席の後部座席の斜め左前方に配置される。マイク12dは、助手席の後部座席の斜め右前方に配置される。マイク12a〜12での配置はこれらに限られず、種々の場所に配置することが可能である。例えば、マイク12aは、ステアリングホイールの近傍に配置することができる。マイク12bは、助手席の前のダッシュボード上に配置することができる。マイク12cおよび12dは、前部座席の後ろ側に配置することができる。マイク12a〜12dは、音声認識の対象となる音声の入力を受けることが可能である。マイク12a〜12dは、装置本体部11と有線または無線通信手段により接続されている。
ランプ13a〜13dは、それぞれマイク12a〜12dに近接して配置される。ランプ13a〜13dは、マイク12a〜12dと一体として構成されてよい。ランプ13a〜13dは、点灯されることによって、音声認識中の各時点において音声入力に使用されるマイク12a〜12dを示す。音声入力に使用されるマイク12a〜12dを使用マイクとよぶ。使用マイクは、音声認識の対象となる音声の入力を受けているマイク12であることを意味する。ランプ13a〜13dは、例えば、LED(Light Emitting Diode)発光体、有機EL(Electro-Luminescence)発光体、白熱電球等を含む。ランプ13a〜13dは、装置本体部11に電気的に接続されている。ランプ13a〜13dは、ランプ点灯のための電力を装置本体部11から供給されてよい。
起動スイッチ14a〜14dは、音声認識を起動させるスイッチである。起動スイッチ14a〜14dとしては、押しボタン型のスイッチを用いることができる。起動スイッチ14a〜14dは、押す度に一回ずつ信号を発生させる。搭乗者は、音声認識装置10を起動させたいとき、座席近くの起動スイッチ14a〜14dを押すことができる。起動スイッチ14a〜14dは、車両の各座席に対応して設けることができる。したがって、起動スイッチ14a〜14dは、それぞれ、マイク12a〜12dに対応しているということができる。起動スイッチ14a〜14dは、各座席の近くに配置することができる。起動スイッチ14a〜14dは、装置本体部11と有線または無線通信手段により接続されている。本開示において、音声認識装置10は、搭乗者の音声により起動することができるように構成されるので、起動スイッチ14a〜14dは必ずしも必要な構成要素ではない。
着座センサ30a〜30dは、搭乗者が座席に座っていることを検知するセンサである。着座センサ30a〜30dは、車両の各座席シートに組み込まれた感圧センサを用いることができる。着座センサ30は、所定値以上の圧力(荷重)を検出すると、座席に搭乗者が座っているものとして検知する。着座センサ30a〜30dとしては、感圧センサを用いるものに限られない。座席に座る搭乗者を光学センサ等他の検出手段を用いて検出することも可能である。着座センサ30a〜30dとしては、予め車両に装備されたものを使用することができる。着座センサ30a〜30dの一部または全部は、音声認識装置10のために設置されてよい。
装置本体部11は、単一の、または、複数のプロセッサを含んで構成される。プロセッサには、特定のプログラムを読み込ませることにより、プログラムされた機能を実行する汎用プロセッサおよび、特定の処理に特化した専用プロセッサが含まれる。専用プロセッサとしては、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)およびFPGA(Field-Programmable Gate Array)等を採用しうる。プロセッサは、演算中の情報を記憶するための1つまたは複数のメモリを有することができる。メモリは、ROM(read only memory)、RAM(Random Access Memory)、フラッシュメモリ、磁気ディスク、光学ディスク等を含みうる。
装置本体部11の各構成要素を、図1を用いて説明する。装置本体部11は、通信部15、音声認識起動部16、発話者位置特定部17、音声信号入力部18、ランプ制御部19および音声認識部20の各機能ブロックを含む。音声認識起動部16、発話者位置特定部17、音声信号入力部18、および、ランプ制御部19の各機能の前部又は一部は、1つまたは複数のプロセッサからなる制御部21により実行されてよい。制御部21は、音声認識装置10全体を制御してよい。
通信部15は、複数の座席に設けられた着座センサ30からの信号を取得する。通信部15は、着座センサ30からの信号を直接受信してよい。あるいは、通信部15は、着座センサ30に接続された車両内の制御装置から、間接的に着座センサ30からの信号を受信してよい。着座センサ30と通信部15との間は、有線または無線の通信手段により通信可能である。
音声認識起動部16は、音声認識装置10の音声認識機能を起動し、音声認識処理を開始させることができる。音声認識起動部16は、起動スイッチ14が押されたとき、起動スイッチ14からの信号を受けて、音声信号入力部18および音声認識部20を起動することができる。音声認識起動部16は、押された起動スイッチ14(14a〜14dの何れか)の識別情報を、発話者位置特定部17に通知する。
本実施形態のより重要な特徴として、音声認識起動部16は、起動スイッチ14によらず、何れかの搭乗者により、マイク12から予め定められた音声認識処理の起動用のキーワードの音声入力があったとき、音声認識部20を起動することができる。マイク12a〜12dの何れも、キーワードの入力を待ち受けることができる。この場合、音声認識起動部16は、後述するように、音声信号入力部18から、音声認識処理を起動する信号と、音声認識の起動指示があったマイク12(マイク12a〜12dの何れか)の識別情報とを受け取る。音声認識起動部16は、音声認識の起動指示があったマイク12の識別情報を、発話者位置特定部17に通知する。
発話者位置特定部17は、通信部15を介して、着座センサ30から車両の搭乗者の着座位置の情報を取得する。また、発話者位置特定部17は、音声認識起動部16から、押された起動スイッチ14の識別情報、および/または、音声認識の起動指示を受けたマイク12の識別情報を取得する。発話者位置特定部17は、これらの情報から、音声の入力をしようとする発話者の着座位置を特定する。何れの情報も同じ座席に発話者が着座していることを示す場合は、その座席に発話者が位置すると判断することができる。発話者の着座位置を示す情報に不整合がある場合、発話者位置特定部17は、予め定めた判定方法に従って、発話者の位置を特定する。
判定方法には、種々のものが可能である。例えば、起動スイッチ14の何れかが押され、発話者位置特定部17が、音声認識起動部16から起動スイッチ14の識別情報を受けた場合を想定する。この場合、発話者位置特定部17は、起動スイッチ14の識別情報を優先し、着座センサ30からの搭乗者の着座位置の情報によらず、起動スイッチ14の識別情報に対応する座席に発話者がいると判断することができる。
また、例えば、発話者位置特定部17が、複数のマイク12のうちマイク12cによって検出されたキーワードの音圧が最大であり、且つ、着座センサ30cからは座席に搭乗者は無く、着座センサ30dからは座席に搭乗者がいるという信号を受けた場合を想定する。その場合、着座センサ30dの座席(助手席側の後部座席)にいる搭乗者が発話したキーワードの音声(音圧)を、マイク12cが検出したものと考えられるので、発話者位置特定部17は助手席側の後部座席に発話者が位置すると判定することができる。発話者の顔の向きがマイク12dよりもマイク12cに向いている場合などに、このように、発話者の座席と異なる座席に対応するマイクが、起動指示の音声を検出することがありうる。
発話者位置特定部17は、特定した発話者の座席に基づいて、発話者の着座位置に最も近いマイク12(マイク12a〜12dの何れか)を、使用マイクとして決定する。例えば、発話者位置特定部17は、各座席とマイク12a〜12dとの対応関係を示すテーブルに基づいて使用マイクを決定する。発話者位置特定部17は、決定されたマイク12の識別情報を音声信号入力部18およびランプ制御部19に通知する。
音声信号入力部18は、マイク12からの音声信号を受信する有線インタフェースおよび無線のインタフェースが含まれる。有線のインタフェースには、アナログ音声端子、HDMI(登録商標)(High-Definition Multimedia Interface)、IEEE802.3、USB(Universal Serial Bus)、IEEE1394等を含む種々の規格に準拠する通信インタフェースを含むが、これらに限られない。無線インタフェースにはBluetooth(登録商標)、IEEE802.11等に準拠する通信インタフェースを含むが、これらに限られない。音声信号入力部18は、アナログ音声信号をデジタル信号に変換するA/D変換器を備えることができる。
音声信号入力部18は、発話者位置特定部17からの指示により起動されることができる。音声信号入力部18は、発話者位置特定部17により決定された使用マイク(マイク12a〜12dの何れか)からの音声の入力を受ける。音声信号入力部18は、音声認識処理中において、使用マイクであるマイク12から取得した音声信号をデジタル信号として音声認識部20に送信する。使用マイク以外のマイク12からの音声信号は、音声認識部20に送信されない。
音声信号入力部18は、音声認識処理のほとんどが停止した状態で、複数のそれぞれのマイク12から、音声認識処理を起動させるために予め定められたキーワード入力のみを待ち受けることができる。例えば、発話者が、「認識開始」と発話したとき、音声信号入力部18は、この発話内容が予め登録されたキーワードに一致することを認識する。音声信号入力部18は、起動指示のためのキーワードの入力をうけたとき、音声認識処理を起動する信号と、音声認識の起動指示があったマイク12(マイク12a〜12dの何れか)の識別情報とを音声認識起動部16に送信する。音声認識処理を起動させるためのキーワードの認識は、音声認識部20で行ってもよい。または、音声認識処理を起動させるためのキーワードの認識は、音声信号入力部18および音声認識部20とは別のモジュールを設けて実行させてもよい。
音声信号入力部18は、複数のマイク12から音声認識起動用のキーワードを受信することがある。音声信号入力部18は、各マイク12が受けたキーワードの音圧に基づいて、起動指示を受けたマイク12を特定する。音声信号入力部18は、最も大きい音圧を受けたマイク12を、起動指示を受けたマイク12として特定することができる。音圧は、音声信号入力部18が受信する信号強度により検知しうる。その後、音声信号入力部18は、音声認識起動部16に対して、マイク12から起動指示があったことと、起動指示を受けたマイク12(マイク12a〜12dの何れか)の識別情報を通知する。
ランプ制御部19は、発話者位置特定部17によって認識対象のマイク12として決定されたマイク12(マイク12a〜12dの何れか)に対応するランプ13(ランプ13a〜13dの何れか)を点灯させる。ランプ制御部19は、音声信号入力部18から音声認識処理の終了を通知されたとき、ランプ13を消灯する。音声認識処理の終了の通知は、音声信号入力部18ではなく、音声認識部20が行ってもよい。
音声認識部20は、音声信号入力部18から取得した音声信号に対して、音声認識処理を実行する。音声認識結果は、例えばテキストデータ、コマンド、または、複数の選択肢の一つを示す識別情報等として出力される。音声認識処理には、種々の公知の技術を採用することができる。具体的には、音声認識部20は、短い時間区間ごとに音声信号に対して周波数分析を行うことにより、特徴量を抽出する。音声認識部20は、抽出した特徴量の時系列のパターンに対して、隠れマルコフモデルなどの音響モデルにより音を識別する。さらに、音声認識部20は、発話辞書およびN−gram等の言語モデルを用いて、蓄積されている単語の中から最も妥当な単語を選択する。音声認識部20は、音声認識処理プログラムを実行する音声認識エンジンと、音声およびテキストのデータベースとを含む。音声認識部20は、音声およびテキストのデータベースとして、ネットワークで接続された車両外部のデータベースを使用してもよい。
また、音声認識部20は、所定の場合、音声認識処理を終了する。例えば、音声認識部20は、利用者から音声認識終了の指示を音声で受けたとき、音声認識処理を終了することができる。音声認識部20は、音声認識処理の開始後一定時間以上継続して音声の入力がないとき、音声認識処理を終了することができる。音声認識部20が音声認識処理を終了するとき、音声信号入力部18を介して、ランプ制御部19に音声認識処理の終了を通知することができる。音声認識部20は、音声信号入力部18を介さずに直接的に、または、別の経路によりランプ制御部19に音声認識処理の終了を通知してもよい。
(音声認識装置の処理のフロー)
以下に、音声認識装置10が実行する音声認識処理のフローを、図3を用いて説明する。本明細書で開示される方法は、音声認識装置10に搭載されるプロセッサがプログラムに従って実行することができる。そのようなプログラムは、非一時的なコンピュータ可読媒体において記憶されることが可能である。非一時的なコンピュータ可読媒体の例としては、ハードディスク、RAM、ROM、フラッシュメモリ、CD−ROM、光記憶デバイス、磁気記憶デバイス等を含むが、これらに限定されない。
まず、音声認識起動部16が、起動指示を受けて、音声信号入力部18および音声認識部20を起動する(ステップS01)。起動指示には、起動スイッチ14からの信号、および、マイク12から入力される音声による起動指示が含まれるが、以下に説明する処理フローでは音声により起動指示を受けるものとする。マイク12からの起動指示は、音声信号入力部18を介して、音声認識起動部16に通知される。すなわち、車両の搭乗者の一人が、何れかのマイク12に向かって「認識開始」のようなキーワードを発話して指示をしたときに、音声認識処理が開始される。
次に、発話者位置特定部17が、音声認識起動部16からの音声認識の起動指示があったマイク12の識別情報、および、着座センサ30からの信号の示す着座位置の情報に基づいて、発話者の着座位置を特定する(ステップS02)。さらに、発話者位置特定部17は、特定した発話者の着座位置に基づいて、音声認識に使用するマイク12である使用マイクを選択する(ステップS03)。使用マイクとしては、発話者の着座位置に対応し着座位置に最も近いマイク12が選択される。使用マイクが選択されると、音声信号入力部18は、選択された使用マイクからの音声信号を受けて、音声認識部20に送信する。他のマイク12からの音声は、音声認識部20に送信されない。このとき、使用マイク以外のマイク12は、音声信号入力部18により停止されてよい。使用マイク以外のマイク12は停止されず、各マイク12が受ける音圧を監視するために、出力信号を音声信号入力部18に送信し続けてよい。また、発話者位置特定部17は、使用マイクの識別情報をランプ制御部19に通知する。
ランプ制御部19は、使用マイクであるマイク12に対応するランプ13を点灯させる(ステップS04)。ランプ13はマイク12に隣接して配置され、または、マイク12と一体的に構成されるので、ランプ13が点灯すると、発話者は、使用マイクであるマイク12を容易に識別することができる。このため、発話者は、音声認識処理が終了しない限り(ステップS05:No)、ランプ13が点灯中のマイク12に顔を向けて発話をすることができる。
音声認識部20は、所定の場合、音声認識が終了したものと判断して、ランプ制御部19に音声認識処理の終了を通知する(ステップS05:Yes)。所定の場合には、「音声認識中止」のような音声認識終了の指示を音声で受けた場合、および、一定時間以上継続して音声の入力が無い場合を含む。音声認識処理が終了したとの通知を受けると、ランプ制御部19は、使用マイクに対応するランプ13を消灯する(ステップS06)。これにより、発話者は音声認識が終了したことを確認することができる。
以上説明したように、本実施形態の音声認識装置10によれば、複数のマイク12に入力される音圧および着座センサ30からの信号に基づいて、音声入力に使用するマイク12を選択することが可能である。これによって、発話者に近いマイクが自動的に選択されるので、車両の搭乗者が音声認識装置10を利用しやすくなっている。また、着座センサ30からの情報を複数のマイク12からの音圧の情報と共に用いることにより、発話者に近いマイク12を選択する精度が向上する。さらに、選択されたマイク12に対応するランプ13を点灯させるようにしたので、発話者の顔の向きを音声認識に使用されているマイク12に向けることにより、集音効率を向上させ音声認識の成功率を向上させることができる。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、音声認識装置10を構成する各機能ブロックは、図1に図示したものに限られない。図1に図示した各機能ブロックは、複数のブロックを1つに統合すること、1つのブロックを複数に分解すること、複数のブロック間で組み換えを行うこと等、本発明の範囲内で種々の変更が可能である。また、図3に示した音声認識処理の手順は、本発明の範囲内で順序を変更し、または、組み代えを行うことが可能である。
例えば、上述の実施形態において、音声認識起動部16および発話者位置特定部17は、単一の機能ブロックとして構成することができる。また、上記実施形態では、音声信号入力部18は、起動指示のキーワードを受けたとき、入力された起動指示の音圧に基づいて、起動指示を受けたマイク12を特定して、音声認識起動部16にそのマイク12の識別情報を通知するものとした。しかし、音声信号入力部18は、起動指示を受けた複数のマイク12ごとの音圧の情報を音声認識起動部16に送信してよい。音声認識起動部16はマイク12ごとの音圧の情報を発話者位置特定部17に送信し、発話者位置特定部17において、搭乗者の着座位置と各マイク12からの音圧の情報とに基づいて、発話者の着座位置を判定するようにしてよい。
上述の実施形態において音声認識起動部16は、搭乗者による起動スイッチ14の操作、または、音声によるキーワードの発話により、音声認識処理を起動するものとした。しかし、音声認識処理を起動する方法は、これに限られない。例えば、音声認識装置10内のプログラム、または、他の装置からの要求により、音声認識処理を起動することも可能である。そのような場合、発話者位置特定部17は、音声認識処理の開始後、音声信号入力部18で初めに所定の閾値以上の音圧を受けたマイク12の識別情報と、着座センサ30から取得される着座位置を示す信号とに基づいて、使用マイクを選択してよい。
また、上記実施形態において、使用マイクは、音声認識の起動時にのみ決定されていた。しかし、使用マイクは、音声認識中に音声信号入力部18により検出される複数のマイク12が受ける音圧および着座センサ30からの信号に基づいて、複数のマイクの間で変更可能であってよい。そのようにすることによって、搭乗者が着座している座席の中から、その時点の発話者が着座する座席が判定され、その座席に最も近いマイク12が使用マイクとなる。発話者は、使用マイクが変更されたことを、点灯するランプ13が変わることにより知ることができる。
さらに、音声認識に使用される使用マイクは、同時に1つに限られない。発話者位置特定部17は、2つ以上のマイク12を使用マイクとすることもできる。その場合、ランプ制御部19は、複数の使用マイクに対応して、複数のランプ13を点灯させる。
10 音声認識装置
11 装置本体部
12,12a〜12d マイクロフォン(マイク)
13,13a〜13d ランプ
14,14a〜14d 起動スイッチ
15 通信部
16 音声認識起動部
17 発話者位置特定部
18 音声信号入力部
19 ランプ制御部
20 音声認識部
21 制御部
30,30a〜30d 着座センサ

Claims (1)

  1. 車両に搭載される音声認識装置において、
    複数の座席にそれぞれ対応して配置された複数のマイクロフォンと、
    前記複数のマイクロフォンのそれぞれに対応して、少なくとも1つずつ設けられた複数のランプと、
    前記複数の座席に設けられた着座センサからの信号を取得する通信部と、
    前記複数のマイクロフォンに入力される音圧および前記着座センサからの信号に基づいて、音声入力に使用するマイクロフォンを選択し、該選択されたマイクロフォンに対応する前記ランプを点灯させる制御部と
    を備える音声認識装置。
JP2018065656A 2018-03-29 2018-03-29 音声認識装置 Pending JP2019176430A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018065656A JP2019176430A (ja) 2018-03-29 2018-03-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018065656A JP2019176430A (ja) 2018-03-29 2018-03-29 音声認識装置

Publications (1)

Publication Number Publication Date
JP2019176430A true JP2019176430A (ja) 2019-10-10

Family

ID=68167407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018065656A Pending JP2019176430A (ja) 2018-03-29 2018-03-29 音声認識装置

Country Status (1)

Country Link
JP (1) JP2019176430A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210040854A (ko) * 2020-08-27 2021-04-14 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 음성 데이터 처리 방법, 장치 및 지능형 차량
CN113113005A (zh) * 2021-03-19 2021-07-13 大众问问(北京)信息科技有限公司 语音数据处理方法、装置、计算机设备和存储介质
CN113890918A (zh) * 2021-11-12 2022-01-04 深圳康佳电子科技有限公司 多点式远场语音交互设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210040854A (ko) * 2020-08-27 2021-04-14 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 음성 데이터 처리 방법, 장치 및 지능형 차량
JP2021144248A (ja) * 2020-08-27 2021-09-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. 音声データ処理方法、装置及びスマート車両
KR102553234B1 (ko) * 2020-08-27 2023-07-06 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디. 음성 데이터 처리 방법, 장치 및 지능형 차량
CN113113005A (zh) * 2021-03-19 2021-07-13 大众问问(北京)信息科技有限公司 语音数据处理方法、装置、计算机设备和存储介质
CN113890918A (zh) * 2021-11-12 2022-01-04 深圳康佳电子科技有限公司 多点式远场语音交互设备

Similar Documents

Publication Publication Date Title
US8005681B2 (en) Speech dialog control module
CN106209138B (zh) 一种车辆谨慎紧急响应系统及方法
JP4131978B2 (ja) 音声認識機器制御装置
JP2019176430A (ja) 音声認識装置
KR102437833B1 (ko) 음성 명령 기반 작업 선택 장치, 차량, 음성 명령 기반 작업 선택 방법
US20190073999A1 (en) Techniques for spatially selective wake-up word recognition and related systems and methods
WO2019201304A1 (zh) 基于人脸识别的语音处理方法及其设备
JP6501217B2 (ja) 情報端末システム
CN108016383B (zh) 自主车辆进出的系统及方法
US20180174581A1 (en) Voice-activated vehicle lighting control hub
US20170262256A1 (en) Environment based entertainment
US20180170242A1 (en) Bluetooth-enabled vehicle lighting control hub
CN111556826A (zh) 声音识别装置、声音识别系统及声音识别方法
US11938820B2 (en) Voice control of vehicle systems
JP2001013994A (ja) 複数搭乗者機器用音声制御装置、複数搭乗者機器用音声制御方法及び車両
TW201515879A (zh) 汽車及其語音控制系統
WO2019016938A1 (ja) 音声認識装置及び音声認識方法
JP7347244B2 (ja) エージェント装置、エージェントシステム及びプログラム
CN113163299A (zh) 声音信号控制装置、声音信号控制系统以及计算机可读取的记录介质
EP3782856B1 (en) Device control apparatus, and control method for controlling devices
JP2019176431A (ja) 音声認識装置
US20200160854A1 (en) Voice recognition supporting device and voice recognition supporting program
JP2018005163A (ja) 運転支援装置および運転支援方法
JP2004184803A (ja) 車両用音声認識装置
JP2008309865A (ja) 音声認識装置および音声認識方法