JP2020160181A - 音声処理装置及び音声処理方法 - Google Patents

音声処理装置及び音声処理方法 Download PDF

Info

Publication number
JP2020160181A
JP2020160181A JP2019057249A JP2019057249A JP2020160181A JP 2020160181 A JP2020160181 A JP 2020160181A JP 2019057249 A JP2019057249 A JP 2019057249A JP 2019057249 A JP2019057249 A JP 2019057249A JP 2020160181 A JP2020160181 A JP 2020160181A
Authority
JP
Japan
Prior art keywords
seat
voice
speaker
driver
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019057249A
Other languages
English (en)
Inventor
番場 裕
Yutaka Banba
裕 番場
智史 山梨
Tomohito Yamanashi
智史 山梨
南生也 持木
Naoya Mochiki
南生也 持木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2019057249A priority Critical patent/JP2020160181A/ja
Publication of JP2020160181A publication Critical patent/JP2020160181A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】車両等の移動体における使用に、より適した改善を実現する。【解決手段】音声処理装置1は、マイク部を用いて音声を収音する指向性収音処理部2と、指向性収音処理部2からの音声に対する音声認識処理により制御対象を制御するための認識キーワードを音声から抽出する音声認識部3と、認識キーワードを発した話者の位置を特定して発話位置情報を出力する話者位置特定部4と、制御対象を制御する制御信号を発生する音声認識結果制御部5と、を備える。音声認識結果制御部5は、認識キーワード、発話位置情報および車両10の運転状態を示す運転状態情報に基づいて、制御信号を発生するか否かを切り替える。【選択図】図1

Description

本開示は、音声認識を利用した音声処理装置及び音声処理方法に関する。
従来、車室内において、対象機器を音声により制御する車載用の音声処理装置が開発されている。例えば、特許文献1においては、音声の誤認識を低減する装置が提案されている。
特開2003−114699号公報
しかしながら、車両等の移動体に特有の事情から、良好な音声認識制御のためには、更なる改善が必要であった。
本開示は、上述した従来の事情に鑑みて案出され、車両等の移動体における使用に、より適した改善を実現することができる音声処理装置及び音声処理方法を提供することを目的とする。
本開示は、一態様として、マイク部を用いて音声を収音する収音部と、前記収音部からの音声に対する音声認識処理により制御対象を制御するための認識キーワードを前記音声から抽出する音声認識部と、前記認識キーワードを発した話者の位置を特定して発話位置情報を出力する話者位置特定部と、前記制御対象を制御する制御信号を発生する音声認識結果制御部と、を備え、前記音声認識結果制御部は、前記認識キーワード、前記発話位置情報および移動体の運転状態を示す運転状態情報に基づいて、前記制御信号を発生するか否かを切り替える、音声処理装置を提供する。
また、本開示は、一態様として、マイク部を用いて音声を収音し、収音した音声に対する音声認識処理により制御対象を制御するための認識キーワードを前記音声から抽出し、前記認識キーワードを発した話者の位置を特定して発話位置情報を出力し、前記認識キーワード、前記発話位置情報および移動体の運転状態を示す運転状態情報に基づいて、前記制御対象を制御するための制御信号を発生するか否かを切り替える、音声処理方法を提供する。
本開示によれば、車両等の移動体における使用に、より適した改善を実現することができる。
実施の形態1における音声処理装置1の構成の一例を示す図 認識ワードDBに登録されている音声認識結果制御情報の一例を示す説明図 認識ワードDBに登録されている音声認識結果制御情報の一例を示す説明図 実施の形態に係る音声処理装置の第1動作例を説明するためのフローチャート 実施の形態に係る音声処理装置の第2動作例を説明するためのフローチャート 実施の形態2における音声処理装置の構成例を示す図 実施の形態3における音声処理装置の構成例を示す図
(本開示に至った知見)
車室内において発せられたユーザの音声を、音声認識技術により解析して、対象機器を制御する音声処理装置が開発されており、例えば、カーナビゲーションシステム等に活用されている。また、自動車の運転の一部の機能は自動化されつつあり、自動運転の技術進展も目覚ましい。今後、音声により運転操作の一部が実行されることも考えられる。
しかしながら、車室内に運転者以外の同乗者が存在する場合には、同乗者の音声によって、運転者が期待しない操作が行われる可能性がある。
例えば、同乗者が電話中に、ナビゲーションシステムを動作させるキーワードを発してしまった場合には、運転者の意図に拘わらず、ナビゲーションシステムが同乗者の発話に応じて動作することも考えられる。また、例えば、同乗者がシートアジャスターの操作を発話により行うことで、運転者の意図に拘わらず、運転席のシートアジャスターが駆動されるおそれもある。また、同乗者の発話により、窓の開閉が運転者の意図に反して行われる可能性もある。
このような運転者が意図しない操作が行われないように、運転者の声のみを収音して対象機器の操作を行うことも考えられるが、この場合には、同乗者は音声では何らの操作も行うことができなくなる。例えば、助手席や後部座席のシートアジャスターの駆動や窓の開閉、後部座席に配置したモニタの制御等についても、同乗者の発話によっては駆動制御することができなくなってしまう。
そこで、本開示では、音声による操作指示の発話者、運転状態等に応じて、各種の制御を実行する音声処理装置の構成例を示す。
以下、適宜図面を適宜参照しながら、本開示に係る音声処理装置及び音声処理方法を具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になることを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるものであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
以下の実施の形態では、本開示に係る音声処理装置及び音声処理方法の一例として、車両等の移動体の車室内での対象機器の音声制御のための装置に適用した構成例について説明する。
なお、以下の説明では、音声処理装置を自動車等の車両の各部の操作制御に適用する例を説明するが、これに限定されるものではなく、車両等の移動体において複数の位置に位置する複数の操作者によって、対象機器を操作する各種操作機器に適用してもよい。
(実施の形態1)
本実施の形態においては、発話の位置が運転席であるか運転席以外であるかを区別すると共に、運転状態に応じて、音声認識により許可される機能を切り替えることで、運転席にいる運転者及び運転席以外にいる同乗者を含む搭乗者の意図に即した音声制御を行うことを可能にする。
図1は実施の形態1における音声処理装置1の構成の一例を示す図である。音声処理装置1は、車両10に搭載される。車両10の車室内には、例えば、運転席chD、助手席chP1及び左右の後部座席chP2,chP3(これらを区別する必要がない場合には、単に座席chと称する)が設けられる。なお、運転席chD以外の座席を同乗者用座席chPとも称する。また、後部座席chP2,chP3を区別する必要がない場合には、これらを後部座席chPRと称する。
また、車両10の車室内には、複数のマイク部mcD,mcP1〜mcP3(これらを区別する必要がない場合には単にマイク部mcと称する)も設けられている。なお、座席数、マイク部数は、これに限られない。
音声処理装置1は、主に、収音部の一例としての指向性収音処理部2、複数の音声認識部3−1〜3−4(これらを個々に区別する必要がない場合には音声認識部3と称する)、話者位置特定部4、音声認識結果制御部5及び認識ワードデータベース(DB)6を有して構成される。音声認識結果制御部5の出力は、例えばカーナビゲーション装置20等の各種制御対象機器に与えられる。
なお、音声処理装置1の各部は、CPU(Central Processing Unit)やFPGA(Field Programmable Gate Array)等を用いたプロセッサによって構成されていてもよく、図示しないメモリに記憶されたプログラムに従って動作して各部を制御するものであってもよいし、ハードウェアの電子回路で機能の一部又は全部を実現するものであってもよい。
運転席chDの右前方(例えばダッシュボードの右側前面)には、運転者hmDが発声する音声を収音するためのマイク部mcDが配置されてよい。助手席chP1の左前方(例えばダッシュボードの左側前面)には、同乗者hmP1が発声する音声を収音するためのマイク部mcP1が配置されてよい。左側の後部座席chP2の左前方(例えば左リアドアトリム内)には、後部座席chP2に座る同乗者hmP2が発生する音声を収音するためのマイク部mcP2が配置されてよい。右側の後部座席chP3の右前方(例えば右リアドアトリム内)には、後部座席chP3に座る同乗者hmP3が発生する音声を収音するためのマイク部mcP3が配置されてよい。
なお、各マイク部mcD,mcP1〜mcP3の配置位置は、これに限られない。また、以下の説明では、運転者hmD及び同乗者hmP1〜hmP3は、それぞれ運転席chD,助手席chP1,後部座席chP2,chP3に位置するものとする。
マイク部mcは、指向性マイクロホン又は無指向性マイクロホンにより構成されていてもよい。マイク部mcを構成する各マイクロホンとしては、小型のMEMS(micro electro mechanical systems)マイクが用いられてもよいし、エレクトレットコンデンサーマイクロホン(ECM:Electret Condenser Microphone)が用いられてもよい。マイク部mcは、ビームフォーミング可能なマイクロホン、例えば各座席の方向に指向性を形成して指向方向の音声を収音可能なマイクロホンアレイを採用してもよい。
車両10のダッシュボードには、カーナビゲーション装置20が配置されてよい。音声処理装置1は、車両10内の所定の位置、例えば、ダッシュボードの内部や座席の内部等に収容されて配置されてよい。
カーナビゲーション装置20は、音声処理装置1の出力先の一例である。カーナビゲーション装置20は、音声認識結果制御部5から出力される制御信号を入力し、制御信号に対応する動作を行う。例えば、カーナビゲーション装置20は、ディスプレイに地図データを表示し、車両の進路を誘導するナビゲーションを行う。
なお、音声認識結果制御部5の出力先としては、カーナビゲーション装置20に限らず、パネルメータ、テレビ、オーディオ機器、携帯電話等の電子機器であってもよい。更に、音声認識結果制御部5は、図示しない電子制御ユニット(ECU:Electronic Control Unit)に各種制御信号を送信することもできる。これにより、音声認識結果制御部5の出力によって、例えば、窓の開閉、シートアジャスターの駆動、サイドミラーの画角調整等の各種制御を行うことも可能である。
また、図1では、車両に4人が乗車している場合を示したが、乗車する人数は、この人数に限られない。乗車人数は、車両の最大乗車定員を上限とし、この範囲内で4人、6人、9人等の人数であってもよい。
マイク部mcD,mcP1〜mcP3は、それぞれ周囲から収音した音声を指向性収音処理部2に出力する。マイク部mcが無指向性マイクロホン又は単一の指向性マイクロホンにより構成されている場合には、指向性収音処理部2はマイク部mcから入力された音声をそれぞれ増幅する。指向性収音処理部2は、増幅した各マイク部mcからの音声をそれぞれ音声認識部3−1〜3−4に出力する。
また、マイク部mcが例えばマイクロホンアレイにより構成されている場合には、指向性収音処理部2は、マイク部mcD,mcP1〜mcP3毎に、所定の指向性が得られるように演算処理(指向性収音処理)を行う。こうして、指向性収音処理部2は、マイク部mcD,mcP1〜mcP3から、それぞれ所定の指向性を有して取得された音声を得る。なお、図1の各マイク部mcD,mcP1〜mcP3から延びた破線は、各マイク部mcD,mcP1〜mcP3の指向性による収音可能な方向を示している。各指向性収音処理部2は、各マイク部mcの出力に基づく指向性収音処理後の各音声をそれぞれ音声認識部3−1〜3−4に出力する。
音声認識部3−1〜3−4は、それぞれ入力された音声に対する音声認識処理を行う。音声認識部3−1〜3−4は、語彙辞書等を用いた公知の音声認識処理によって、それぞれ入力された音声に基づくキーワードを認識キーワードとして抽出する。音声認識部3は、抽出した認識キーワード(例えばテキストデータ)を音声認識結果制御部5に出力する。
認識ワードDB6は、認識キーワードと各種制御対象の制御に用いる制御信号との対応関係が登録されたデータベースである。音声認識結果制御部5は認識ワードDB6を参照することで、運転者hmD及び同乗者hmP1〜hmP3が発した音声に基づく制御信号を出力する。
本実施の形態においては、音声認識結果制御部5は、制御信号の生成に際して、音声認識部3からの認識キーワードだけでなく、話者位置特定部4からの後述する発話位置情報及び車両10の運転状態を示す運転状態情報を用いるようになっている。なお、運転状態情報としては、少なくとも車両が運転中であるか運転停止中であるかを識別する情報を含む。運転状態情報としては、ECUから得られる各種情報、例えば、車速や位置情報等の検知情報やハンドル操作やブレーキ操作等の操作に関する情報等がある。また、車両10内に搭載された図示しないGPS(Global Positioning System)等の測位装置からの情報を運転状態情報として用いてもよい。
話者位置特定部4は、指向性収音処理部2からマイク部mcの出力に基づく各音声を取得する。話者位置特定部4は、音声認識結果制御部5に入力された認識キーワードが、車両10に乗車しているいずれの座席chにいる人が発した音声によるものかを特定する。
例えば、話者位置特定部4は、指向性収音処理部2の出力からマイク部mcD,mcP1〜mcP3の出力の各音圧レベルを判定し、音圧レベルが最も高いマイク部mcを判定して話者のいる座席chを特定してもよい。
運転者hmD及び同乗者hmP1〜P3が発した音声は、マイク部mcD,mcP1〜mcP3のいずれにおいても収音される可能性がある。しかし、各マイク部mcD,mcP1〜mcP3の出力のうち、話者に最も近接した位置のマイク部mcの出力の音圧レベルが最も高くなるものと考えられる。特に、各マイク部mcが比較的鋭い指向性を有する場合には、音圧レベルの差は顕著となり、マイク部mcD,mcP1〜mcP3の出力の音圧レベルから、話者がいる座席chを正確に特定できるものと考えられる。
なお、話者位置特定部4は、マイク部mcの出力が入力される指向性収音処理部2の入力端子及びこれらの入力端子に対応する出力端子のうちのいずれの端子からの出力の音圧レベルが高いかによって、いずれのマイク部mcの出力が最も音圧レベルが高いかを判定してもよい。また、マイク部mcは、自機を識別するID情報を音声に付加して出力してもよい。この場合には、話者位置特定部4は、ID情報を用いて、最も高い音圧レベルの出力を出力したマイク部mcに隣接した座席chを判定してもよい。
話者位置特定部4は、最も高い音圧レベルの音声を出力したマイク部mcが、マイク部mcDの場合には話者は運転席chDに位置すると判定して、話者の位置が運転席chDであることを示す発話位置情報を出力する。同様に、話者位置特定部4は、最も高い音圧レベルの音声を出力したマイク部mcがマイク部mcP1の場合には話者の位置が助手席chP1であることを示す発話位置情報を出力し、マイク部mcP2の場合には話者の位置が後部座席chP2であることを示す発話位置情報を出力し、マイク部mcP3の場合には話者の位置が後部座席chP3であることを示す発話位置情報を出力する。話者位置特定部4は、発話位置情報を音声認識結果制御部5に出力する。
なお、話者位置特定部4は、発話位置情報として、運転席chDであるか運転席以外の同乗者用座席chPであるかを示す情報を出力してもよく、更に、同乗者用座席chPのうち助手席chP1であるか後部座席chPRであるかの区別を含む情報を出力してもよい。
本実施の形態においては、認識ワードDB6には、認識キーワード毎に、運転状態情報と発話位置情報とに基づく制御情報が設定された音声認識結果制御情報が登録されている。
音声認識結果制御部5は、音声認識部3からの認識キーワードが入力されると、運転状態情報及び発話位置情報に基づいて、運転中であるか運転停止中であるか、及び、発話位置が運転席chDであるかその他の同乗者用座席chPであるかを判定する。音声認識結果制御部5は、この判定結果に従って、認識キーワードに対応して認識ワードDB6に登録されている制御情報の読み出しを行うようになっている。音声認識結果制御部5は読み出した制御情報に基づいて、各制御対象を制御するための制御信号を発生して出力する。
図2及び図3は認識ワードDB6に登録されている音声認識結果制御情報の一例を示す説明図である。図2及び図3では、認識キーワードに対応する操作に応じて、運転中か運転停止中かによって、発話位置毎に異なる制御信号を発生する制御を示している。なお、図2は車両10の走行に比較的大きな影響を与える操作に関するものであり、図3は車両10の走行への影響が比較的小さい操作に関するものである。
<電子ミラー操作>
例えば、図2では、ミラーのズームイン等の電子ミラーを操作するための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。図2における「制御禁止」は、「認識キーワードに対応する制御信号」が登録されていないことを示しているか、又は制御信号の発生を禁止する情報が登録されていることを示している。
また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されていてもよいことを示している。
音声認識結果制御部5は、話者位置特定部4からの認識キーワードによって、電子ミラーを操作するための認識キーワードが入力された場合には、運転状態情報によって運転停止中が示されたときには、発話位置が運転席chDであるか同乗者用座席chPであるかに拘わらず、認識ワードDB6に基づいて「認識キーワードに対応する制御信号」の情報を認識ワードDB6から読み出して制御信号を生成する。これにより、運転停止中には、発話位置がいずれの座席chであっても、音声により電子ミラーの操作が可能である。
なお、図2に示すように、運転停止中において、発話位置が同乗者用座席chPの場合には、操作内容によって動作を制限するための「機能を制限した制御信号」を登録してもよい。
一方、運転状態情報によって運転中であることが示された場合には、音声認識結果制御部5は、発話位置情報に基づいて認識キーワードを発した発話位置が運転席chDであるか同乗者用座席chPであるかを判定する。音声認識結果制御部5は、発話位置が運転席chDである場合には、認識ワードDB6に基づいて「認識キーワードに対応する制御信号」の情報を認識ワードDB6から読み出して制御信号を生成する一方、発話位置が同乗者用座席chPである場合には、認識ワードDB6には「制御禁止」が登録されているので、制御信号を発生しない。これにより、運転中においては、運転席chDに位置する運転者hmDの音声のみによって、電子ミラーの操作が可能となり、同乗者用座席chPにいる同乗者hmP1〜hmP3が電子ミラーの操作のためのキーワードを発したとしても、電子ミラーを操作するための制御信号は発生せず、電子ミラーは動作しない。
<ドアミラー操作、ヘッドライト操作>
また、図2では、ドアミラー操作、ヘッドライト操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されていてもよいことを示している。
また、この例においても、運転停止中において、発話位置が同乗者用座席chPの場合には、操作内容によって動作を制限する「機能を制限した制御信号」を登録してもよい。
<座席アジャスター操作>
また、図2では、座席アジャスター操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されていてもよい。
なお、この例においても、運転停止中において、発話位置が同乗者用座席chPの場合には、操作内容によって動作を制限する「機能を制限した制御信号」を登録してもよい。
また、この例においては、発話位置が同乗者用座席chPの場合において、認識キーワードによる操作対象が助手席chP1又は後部座席chPRである場合には、運転中及び運転停止中であっても、「認識キーワードに対応する制御信号」を登録するようになっていてもよい。
<ナビゲーションシステムの地図操作>
運転中においては、ナビゲーションシステムの地図表示により、運転操作を効果的に支援することが可能である。例えば、交差点での左折専用レーンの案内表示、高速インターチェンジに入る際の専用レーン等の案内表示が表示されている場合には、その表示を優先して、他の表示のための地図操作を禁止した方がよい。
そこで、図2では、ナビゲーションシステムの地図操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されていてもよい。
また、この例においても、運転停止中において、発話位置が同乗者用座席chPの場合には、操作内容によって動作を制限する「機能を制限した制御信号」を登録してもよい。
<自動/手動運転のスイッチ操作>
また、図2では、自動/手動運転のスイッチ操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されていてもよい。
また、この例においても、運転停止中において、発話位置が同乗者用座席chPの場合には、操作内容によって動作を制限する「機能を制限した制御信号」を登録してもよい。
<前列モニタの操作>
図3の「前列モニタ」は、例えばダッシュボードに取り付けられて、ナビゲーションシステムのモニタ等を利用して運転者が視認できるテレビジョン放送等の表示に用いるモニタを意味している。この前列モニタの操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「制御禁止」が登録されているのに対し、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されている。
<後列モニタの操作>
図3の「後列モニタ」は、例えば後部座席前方の天井等に取り付けられて、主に後部座席に位置する同乗者hmP2,hmP3が映像を視認できる例えば車載リアシートエンターテインメント(RSE)用のモニタを意味している。この後列モニタの操作のための認識キーワードに対して、運転中及び運転停止中のいずれの場合にも、発話位置が運転席chDである場合でも同乗者用座席chPである場合で、「認識キーワードに対応する制御信号」が登録されている。
<夜間の室内灯のON/OFF操作>
また、図3では、夜間の室内灯のON/OFF操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されている。
<高速道路での窓の開閉操作>
また、図3では、高速道路での窓の開閉操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」が登録されている。なお、換気のために少しだけ窓を開けることを許可するために、運転中において発話位置が同乗者用座席chPの場合でも、「機能を制限した制御信号」を登録してもよい。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されている。
<空調やシート暖房の操作>
図3では、空調やシート暖房の操作のための認識キーワードに対して、運転中及び運転停止中のいずれの場合にも、発話位置が運転席chDである場合でも同乗者用座席chPである場合で、「認識キーワードに対応する制御信号」が登録されている。
<音楽再生、ボリューム操作>
また、図3では、音楽再生、ボリューム操作のための認識キーワードに対して、運転中には、発話位置が運転席chDである場合には「認識キーワードに対応する制御信号」が登録されているのに対し、発話位置が同乗者用座席chPの場合には「制御禁止」又は「機能を制限した制御信号」が登録されている。また、運転停止中においては、発話位置が運転席chDである場合でも同乗者用座席chPである場合でも「認識キーワードに対応する制御信号」が登録されている。
なお、図2及び図3における「認識キーワードに対応する制御信号」の情報は、制御対象を操作するための認識キーワードが検出された場合に、当該認識キーワードに対応する制御信号の発生を許可するものであるともいえる。また、「制御禁止」の情報は、制御対象を操作する認識キーワードに対応する発話が検出されたとしても、当該認識キーワードに対応する制御信号の発生を許可しない制御であるともいえる。
従って、図2は、運転停止中には、制御信号の発生を概ね許可し、運転中には、発話位置が運転席chDである場合に制御信号の発生を許可し、発話位置が同乗者用座席chPである場合に制御信号の発生を許可しない動作の例であるといってもよい。すなわち、運転中の場合に、発話位置が運転席か運転席以外かによって、認識キーワードの有効/無効(制御信号の発生/制御禁止)を切り替える場合に相当する。
また、図3は、運転停止中には、制御信号の発生を許可し、運転中には、発話位置及び制御内容に応じて制御信号の発生の許可、制御禁止を制御する動作の例であるといってもよい。すなわち、運転停止中の場合に、発話位置及び制御内容に応じて認識キーワードの有効/無効(制御信号の発生/制御禁止)を切り替える場合に相当する。このように、本実施の形態は、認識キーワードに応じて生成する制御信号を、発話位置情報及び運転状態情報に基づいて切り替える制御を行うものであるといってもよい。
なお、図2及び図3の声認識結果制御情報の設定は一例であり、別の設定が行われていてもよく、また、ユーザ操作によって設定の登録及び変更ができるようになっていてもよい。
また、認識ワードDB6としては、図2,図3に示すものだけでなく、認識キーワードに対応した制御信号を登録した一般的なキーワードDBと、認識キーワード毎に座席chと運転状態とに基づいて許可又は禁止の情報が登録された許可禁止DBとを用いてもよい。この場合には、音声認識結果制御部5は、発話位置情報及び運転状態情報に基づいて許可禁止DBを参照し、許可された場合にのみキーワードDBを参照して制御情報を読み出して制御信号を生成するようになっていてもよい。
次に、本実施の形態の音声処理装置の動作について説明する。
図4は、実施の形態に係る音声処理装置の第1動作例を説明するためのフローチャートである。なお、図4は図2の例において、運転停止中に、「認識キーワードに対応する制御信号」が登録されている場合に対応したものである。
いま、車両10の運転席chD、助手席chP1、後部座席chP2及び後部座席chP3にそれぞれ運転者hmD、同乗者hmP1〜hmP3が座っているものとする。各マイク部mcは、それぞれ周囲音声を収音して指向性収音処理部2に出力する。指向性収音処理部2は、各マイク部mcが収音した音声をそれぞれ音声認識部3−1〜3−4及び話者位置特定部4に与える。
音声認識部3−1〜3−4は、それぞれ入力された音声に対する音声認識処理を行う。これにより、音声認識部3−1〜3−4は、入力された音声から認識キーワードを抽出する。音声認識部3は、抽出した認識キーワードを音声認識結果制御部5に出力する。
また、話者位置特定部4は、指向性収音処理部2の出力に基づいて、音声認識部3により抽出された認識キーワードが、主にいずれのマイク部mcにより収音されて取得されたものであるかを検出する。話者位置特定部4は、この検出結果に基づいて発話位置が運転席chD、助手席chP1、後部座席chP2又は後部座席chP3のいずれであるかを判定して、この判定結果を発話位置情報として音声認識結果制御部5に出力する。
音声認識結果制御部5は、音声認識部3から認識キーワードを取得し(図4のステップS1)、話者位置特定部4から発話位置情報を取得する(ステップS2)。更に、音声認識結果制御部5は、ECU等から運転状態情報を取得する(ステップS3)。
音声認識結果制御部5は、ステップS4において、運転状態情報に基づいて現在車両10が運転中である否かを判定する。運転状態情報は、例えば、ハンドル操作、ブレーキ操作、速度等に関する情報を含んでおり、音声認識結果制御部5は、運転状態情報に基づいて現在運転中であるか運転停止中であるかを判定することができる。
いま、運転状態情報により運転停止中であることが示されているものとする。この場合には、音声認識結果制御部5は、ステップS4からステップS6に処理を移行して、認識キーワードの受付処理を行い、認識キーワードに対応する制御信号を発生する。例えば、運転者hmD又は同乗者hmP1が、図2に示す各操作のためのキーワードを発声するものとする。音声認識結果制御部5は、ステップS1においてこの認識キーワードを取り込むと、この認識キーワードを用いて認識ワードDB6を参照し、認識キーワードに対応する制御信号の情報を読み出して制御信号を発生する。音声認識結果制御部5は、発生した制御信号を制御対象の機器に出力する。
例えば、運転者hmDがナビゲーションシステムの地図操作のためのキーワードを発声すると、このキーワードに対応する制御信号がカーナビゲーション装置20に供給され、発声したキーワードに対応してカーナビゲーション装置20の地図操作が行われる。
また、例えば、同乗者hmPが同乗者用座席chPのアジャスター操作のためのキーワードを発声すると、このキーワードに対応する制御信号がECUに供給され、発声したキーワードに対応して座席が駆動される。
次に、運転状態情報により運転中であることが示されているものとする。この場合には、音声認識結果制御部5は、ステップS4からステップS5に処理を移行して、発話位置情報に基づいて認識キーワードの発話位置が運転席chDであるか否かを判定する。音声認識結果制御部5は、発話位置が運転席chDである場合には、ステップS6の処理を実行し、認識キーワードの受付処理を行い、認識キーワードに対応する制御信号を発生する。一方、発話位置が同乗者用座席chPである場合には、音声認識結果制御部5は、処理をステップS7に移行し、制御禁止に対応する認識キーワードの却下処理を行い、認識キーワードを受け付け不可にして制御信号を発生しない。
例えば、運転中において運転者hmDがドアミラー操作のためのキーワードを発声すると、このキーワードに対応する制御信号がECUに供給され、発声したキーワードに対応してドアミラーが駆動される。
しかし、運転中においては、同乗者hmPがドアミラー操作のためのキーワードを発声したとしても、音声認識結果制御部5は、制御信号を発生することはなく、発声したキーワードに対応してドアミラーが駆動されることはない。
これにより、運転中においては、運転者hmDがキーワードを発声しなければ運転に影響を与える可能性のある操作が行われることはない。すなわち、運転者hmDが意図しない操作が、同乗者hmPの発声により実行されることはなく、運転者hmDの意図通りの操作が行われる。一方、運転停止中においては、運転者hmD及び同乗者hmPの発声したキーワードに応じた操作が可能であり、各搭乗者の意図に即した音声制御が可能である。
なお、本実施の形態においては、制御対象機能又は認識キーワードによって、運転停止中においても、制御信号の発生を禁止することも可能である。また、制御対象機能又は認識キーワードによって、運転中において、運転者hmDによる音声制御を禁止することも可能である。以下に、このような制御を可能にする第2動作例を示す。
図5は、実施の形態に係る音声処理装置の第2動作例を説明するためのフローチャートである。図5において、図4と同一手順には同一符号を付してある。ステップS1〜S5の処理については、図4と同様であるため、説明を省略する。
音声認識結果制御部5は、図5のステップS4において運転中であるか否かを判定する。音声認識結果制御部5は、運転中の場合、ステップS5に処理を移行し、発話位置が運転席chDであるか否かを判定する。音声認識結果制御部5は、運転中において発話位置が運転席chDの場合には、認識ワードDB6の運転席からの操作について設定した情報に基づいて制御信号の発生又は制御禁止の処理を実行する(ステップS11)。すなわち、運転中で運転席からの指示の場合の設定情報に応じて、認識キーワードの受付処理又は却下処理を行う。また、音声認識結果制御部5は、運転中において発話位置が同乗者用座席chPの場合には、認識ワードDB6の運転席以外からの操作について設定した情報に基づいて制御信号の発生又は制御禁止の処理を実行する(ステップS12)。すなわち、運転中で同乗者用座席からの指示の場合の設定情報に応じて、認識キーワードの受付処理又は却下処理を行う。
また、ステップS4において、運転停止中の場合、音声認識結果制御部5は、ステップS10に処理を移行し、発話位置が運転席chDであるか否かを判定する。音声認識結果制御部5は、運転停止中において発話位置が運転席chDの場合には、認識ワードDB6の運転席からの操作について設定した情報に基づいて制御信号の発生又は制御禁止の処理を実行する(ステップS13)。すなわち、運転停止中で運転席からの指示の場合の設定情報に応じて、認識キーワードの受付処理又は却下処理を行う。また、音声認識結果制御部5は、運転停止中において発話位置が同乗者用座席chPの場合には、認識ワードDB6の運転席以外からの操作について設定した情報に基づいて制御信号の発生又は制御禁止の処理を実行する(ステップS14)。すなわち、運転停止中で同乗者用座席からの指示の場合の設定情報に応じて、認識キーワードの受付処理又は却下処理を行う。
このように本実施の形態においては、運転席からの発話と運転席以外からの発話とを区別すると共に、運転状態に応じて、音声認識により許可される機能を切り替えることで、運転者及び同乗者を含む搭乗者の意図に即した音声制御を行うことを可能にする。
なお、上記実施の形態では、発話位置については運転席chDであるか同乗者用座席chPであるかに応じて制御信号の発生を制御する例を説明したが、運転席chD、助手席chP1、後部座席chP2、chP3毎に制御信号の発生を制御できるようになっていてもよく、また、前列の運転席chD及び助手席chP1であるか後列の後部座席chPRであるかに応じて制御信号の発生を制御できるようになっていてもよい。
(実施の形態2)
図6は実施の形態2における音声処理装置の構成例を示す図である。図6において、図1と同一の構成要素には同一符号を付して説明を省略する。
本実施の形態は認識キーワード及び発話位置情報の取得方法が実施の形態1と異なる。本実施の形態においては、複数のマイク部mcに代えて1つのマイク部mc2のみを採用すると共に、指向性収音処理部2に代えて指向性収音処理部12を採用し、音声認識部3に代えて音声認識部13を採用した点が実施の形態1と異なる。
マイク部mc2は、運転者hmD及び3人の同乗者hmPに囲まれた位置、例えば、センターコンソールの後端の位置やその上の天井の位置等に配置される。なお、マイク部mc2の位置はこれに限らない。
マイク部mc2としては、ビームフォーミング可能で、例えば各座席の方向に指向性を形成して指向方向の音声を収音可能なマイクロホンアレイを採用する。マイク部mc2は収音した音声を指向性収音処理部12及び話者位置特定部4に出力する。
指向性収音処理部12は、話者位置特定部4に制御されて、マイク部mc2の出力から所定の指向性が得られるように演算処理(指向性収音処理)を行う。指向性収音処理部12は、話者位置特定部4に制御されて、マイク部mc2の指向方向を変化させながら、マイク部mc2の出力を取り込んで、音声認識部13に出力する。
話者位置特定部4は、マイク部mc2の指向方向を変化させながらマイク部mc2の出力の例えば音圧レベルを検出することで、最大音圧レベルを得る状態、すなわち、マイク部mc2の指向方向とマイク部mc2に対する話者の方向とが一致する状態を検出する。話者位置特定部4は、この状態においてマイク部mc2の指向方向を固定すると共に、この指向方向に位置する座席chを発話位置情報として音声認識結果制御部5に出力する。なお、話者位置特定部4は、各マイク部mcから出力される信号の相関に基づいて、発話位置情報を出力するとしてもよい。具体的には、例えば、複数のマイク部mcから出力される信号に基づいて各マイク部mcへの到達時間差を算出するCSP(Cross-power Spectrum Phase analysis)法を用いて、音源位置を推定するとしても良い。このとき、CSP法を用いて推定された音源位置と各座席chとの位置を比較して、最も近い座席chを発話位置情報として音声認識結果制御部5に出力するとしてよい。また、これに限らず、各マイク部mcから出力される信号の入力波形の相関を用いて音源の位置を推定するなどの手法も適宜用いるとしてよい。
音声認識部13は、音声認識部3と同様の構成であり、マイク部mc2の指向方向が固定された状態において取得された音声に対して、音声認識処理を実行する。音声認識部13は、音声認識処理の結果得られた認識キーワードを音声認識結果制御部5に出力する。
他の構成は実施の形態1と同様である。
このように構成された実施の形態においては、指向性収音処理部12は、単一のマイク部mc2を用いて、話者の位置する方向に指向性を向けて話者の音声を取得する。また、話者位置特定部4は、マイク部mc2の指向方向に位置する座席chを発話位置情報として取得する。
音声認識部13は、取得された音声から認識キーワードを抽出して音声認識結果制御部5に出力する。本実施の形態においても、音声認識結果制御部5は、認識キーワード、発話位置情報及び運転状態情報に基づいて、認識ワードDB6を参照することで、制御対象を制御するための制御信号を発生する。
このように、本実施の形態においても、実施の形態1と同様の効果を得ることができる。また、本実施の形態においては、単一のマイク部mc2のみを採用すればよく、複数のマイク部を配置する必要がないという利点がある。
(実施の形態3)
図7は実施の形態3における音声処理装置の構成例を示す図である。図7において、図1、図6と同一の構成要素には同一符号を付して説明を省略する。
本実施の形態は認識キーワード及び発話位置情報の取得方法が実施の形態2と異なる。本実施の形態においては、マイク部mc2に代えて1つのマイク部mc3を採用すると共に、収音部の一例として、指向性収音処理部12に代えて収音処理部22を採用し、話者位置特定部4に代えて、話者位置特定部の一例として、話者認識部23、話者位置照合部24及び話者位置照合データベース(DB)25を採用した点が実施の形態2と異なる。
マイク部mc3は、運転者hmD及び3人の同乗者hmPの音声を収音可能な位置に配置される。図7では、センターコンソールの後端の位置に配置される例を示しているが、これに限らない。
マイク部mc3としては、同時に運転席chD及び同乗者用座席chPの各位置からの音声を収音することができれば、指向性を有していても無指向性のマイクロホンを採用してもよい。なお、図7の例ではマイク部mc3としては無指向性のマイクロホンが採用される。マイク部mc3は、周囲の音声を収音し、収音した音声を収音処理部22及び話者認識部23に出力する。
収音処理部22は、マイク部mc3からの音声を音声認識部13に出力する。音声認識部13は、入力された音声から認識キーワードを抽出して音声認識結果制御部5に出力する。
話者認識部23は、公知の音声認識処理によって、話者を特定する。例えば、話者認識部23は、話者の音声特徴を記憶した図示しないメモリを有しており、マイク部mc3からの音声について特徴を抽出し、抽出した音声特徴とメモリに記憶された音声特徴との比較によって、話者を特定する。なお、話者認識部23が有するメモリには、予め運転者hmD及び各同乗者hmPの音声特徴が記憶されているものとする。話者認識部23は、特定した話者に関する情報を話者位置照合部24に出力する。
話者位置照合DB25は、各話者と各話者の位置との対応関係、すなわち、各話者が運転席chD、各同乗者用座席chPのうちのいずれの座席chに位置するかを示す情報を登録したデータベースである。
話者位置照合部24は、話者認識部23からの話者に関する情報を用いて話者位置照合DB25を参照することにより、話者の位置を示す発話位置情報を生成して音声認識結果制御部5に出力する。
他の構成は実施の形態1と同様である。
このように構成された実施の形態においては、収音処理部22は、例えば無指向性のマイク部mc3を用いて話者の音声を取得する。音声認識部13は収音された音声から認識キーワードを抽出して音声認識結果制御部5に出力する。
一方、話者認識部23は、音声認識処理によって、話者が登録された運転者hmD及び各同乗者hmPのいずれであるかを特定する。話者位置照合部24は、話者認識部23によって特定された話者について、その位置(座席ch)を話者位置照合DB25を参照することで求め、発話位置情報として音声認識結果制御部5に出力する。
本実施の形態においても、音声認識結果制御部5は、認識キーワード、発話位置情報及び運転状態情報に基づいて、認識ワードDB6を参照することで、制御対象を制御するための制御信号を発生する。
このように、本実施の形態においても、実施の形態1,2と同様の効果を得ることができる。また、本実施の形態においては、単一のマイク部mc3としても無指向性のマイクロホンを採用すればよく、また、比較的自由に設置位置を選択することができるという利点がある。
以上のように、本実施の形態の音声処理装置1は、マイク部mcD,mcP1〜mcP3を用いて、指向性収音処理部2が音声を収音する。音声認識部3は、指向性収音処理部2からの音声に対する音声認識処理により制御対象を制御するための認識キーワードを音声から抽出する。また、話者位置特定部4は、認識キーワードを発した話者の位置を特定して発話位置情報を出力する。音声認識結果制御部5は、制御対象を制御する制御信号を発生する。音声認識結果制御部5は、認識キーワード、発話位置情報および車両10の運転状態を示す運転状態情報に基づいて、制御信号を発生するか否かを切り替える。
これにより、認識キーワードを発した話者の位置及び運転状態に基づいて、制御信号が切り替えられる。話者の位置は、話者が位置する車両10の座席の位置、すなわち、例えば運転席chDか同乗者用座席chPかに対応しており、運転者hmDか同乗者hmPかに応じて制御信号が切り替えられることになる。更に、運転状態情報により、例えば、運転中であるか運転停止中であるかに応じて制御信号が切り替えられる。従って、例えば、車両10の走行に影響を与える操作については、運転者hmDが発した認識キーワードに応じた制御信号を発生する一方、同乗者hmPが発した認識キーワードについては無視することも可能である。また、車両10の走行に影響を与えない操作については、運転者hmD及び同乗者hmPのいずれにも認識キーワードに応じた制御信号を発生する制御が可能であり、車両10の運転を妨げることなく、運転者hmD及び同乗者hmPの意図に即した音声制御が可能となる。
また、本実施の形態の音声処理装置では、音声認識結果制御部5は、話者の位置が運転席chDか運転席以外chPかに応じて、発生する制御信号を切り替える。これにより、運転席chDに位置する運転者hmDと運転席以外chPに位置する同乗者hmPとで、制御信号の切り替えが可能である。
また、本実施の形態の音声処理装置では、音声認識結果制御部5は、前記車両10の運転中において、話者の位置が運転席以外chPである場合には、制御信号を発生しない。これにより、車両10の走行に影響を与える操作が、運転者hmD以外の同乗者hmPによって行われることを防止することができる。
また、本実施の形態の音声処理装置では、音声認識結果制御部5は、運転状態情報に基づいて、ミラー操作、ライト操作、座席調整、ナビゲーションシステムの地図操作又は自動運転の切り替え操作のうちの少なくとも一つが行われたことが示された場合には、車両10の運転中であるものと判定する。これにより、これらの操作については、例えば運転者hmDのみに許可する等の制御が可能である。
また、本実施の形態の音声処理装置では、音声認識結果制御部5は、前記車両10が運転停止中の場合には、前記話者の位置が運転席chDである場合と運転席以外chPである場合とで、同一の前記制御信号を発生する。これにより、運転停止中において、運転者hmD及び運転者以外の同乗者hmPについて、各自が希望する音声制御が可能となる。
また、本実施の形態の音声処理装置では、話者位置特定部4は、車両10の運転席chD及び運転席以外chPの座席にそれぞれ対応したマイク部mcD,mcP1〜mcP3を用いて収音された各音声の音圧レベルに基づいて、話者の位置を特定する。これにより、話者が運転席chD、運転席以外chPの各座席のいずれに位置するかを特定することができ、各話者毎の制御が可能となる。
また、本実施の形態の音声処理装置では、話者位置特定部4は、車両10の運転席chD及び前記運転席以外chPの座席方向に指向方向を変更可能なマイク部mc2の指向方向に基づいて、話者の位置を特定する。これにより、単一のマイク部mc2を用いて話者の位置を特定することができ、マイクの設置の自由度が増大する。
また、本実施の形態の音声処理装置では、話者位置特定部の一例に相当する話者認識部23、話者位置照合部24及び話者位置照合DB25は、車両10の運転席chD及び前記運転席以外chPの座席に位置する話者の音声を認識し、話者と座席との対応関係の登録情報を用いて、話者の位置を特定する。これにより、マイク部mc3を任意の位置に配置することができ、マイク部mc3の設置の自由度を増大させることができると共に、無指向性の簡単な構成のマイク部mc3を採用することができる。
また、本実施の形態の音声処理方法は、マイク部mcD,mcP1〜mcP3を用いて音声を収音し、収音した音声に対する音声認識処理により制御対象を制御するための認識キーワードを音声から抽出し、認識キーワードを発した話者の位置を特定して発話位置情報を出力し、認識キーワード、発話位置情報および車両10の運転状態を示す運転状態情報に基づいて、制御対象を制御するための制御信号を発生するか否かを切り替える。これにより、認識キーワードを発した話者の位置及び運転状態情報に基づいて、制御信号を切り替えることができ、運転状態及び話者に応じた音声制御が可能となる。
以上、図面を参照しながら各種の実施の形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
本開示は、車両等における使用に、より適した改善を実現可能な音声処理装置及び音声処理方法として有用である。
1 音声処理装置
2 指向性収音処理部
3 音声認識部
4 話者位置特定部
5 音声認識結果制御部
6 認識ワードDB
10 車両
12 指向性収音処理部
13 音声認識部
20 カーナビゲーション装置
chD 運転席
chP1 助手席
chP2 後部座席
chP3 後部座席
hmD 運転者
hmP1 同乗者
hmP2 同乗者
hmP3 同乗者
mcD マイク部
mcP1 マイク部
mcP2 マイク部
mcP3 マイク部

Claims (9)

  1. マイク部を用いて音声を収音する収音部と、
    前記収音部からの音声に対する音声認識処理により制御対象を制御するための認識キーワードを前記音声から抽出する音声認識部と、
    前記認識キーワードを発した話者の位置を特定して発話位置情報を出力する話者位置特定部と、
    前記制御対象を制御する制御信号を発生する音声認識結果制御部と、
    を備え、
    前記音声認識結果制御部は、前記認識キーワード、前記発話位置情報および移動体の運転状態を示す運転状態情報に基づいて、前記制御信号を発生するか否かを切り替える、
    音声処理装置。
  2. 前記音声認識結果制御部は、前記話者の位置が運転席か運転席以外かに応じて、前記制御信号を発生するか否かを切り替える、
    請求項1に記載の音声処理装置。
  3. 前記音声認識結果制御部は、前記運転状態情報が示す前記移動体の前記運転状態が運転中であって、前記発話位置情報の示す前記話者の位置が運転席以外である場合には、前記制御信号を発生しない、
    請求項1に記載の音声処理装置。
  4. 前記音声認識結果制御部は、前記運転状態情報に基づいて、ミラー操作、ライト操作、座席調整、ナビゲーションシステムの地図操作又は自動運転の切り替え操作のうちの少なくとも一つが行われたことが示された場合には、前記移動体の運転中であるものと判定する、
    請求項3に記載の音声処理装置。
  5. 前記音声認識結果制御部は、前記運転状態情報が示す前記移動体の前記運転状態が運転停止中である場合には、前記発話位置情報の示す前記話者の位置が運転席である場合と運転席以外である場合とで、同一の前記制御信号を発生する、
    請求項1に記載の音声処理装置。
  6. 前記話者位置特定部は、前記移動体の運転席及び前記運転席以外の座席にそれぞれ対応したマイク部を用いて収音された各音声の音圧レベルに基づいて、前記話者の位置を特定する、
    請求項1に記載の音声処理装置。
  7. 前記話者位置特定部は、前記移動体の運転席及び前記運転席以外の座席方向に指向方向を変更可能なマイク部の前記指向方向に基づいて、前記話者の位置を特定する、
    請求項1に記載の音声処理装置。
  8. 前記話者位置特定部は、前記移動体の運転席及び前記運転席以外の座席に位置する話者の音声を認識し、話者と座席との対応関係の登録情報を用いて、前記話者の位置を特定する、
    請求項1に記載の音声処理装置。
  9. マイク部を用いて音声を収音し、
    収音した音声に対する音声認識処理により制御対象を制御するための認識キーワードを前記音声から抽出し、
    前記認識キーワードを発した話者の位置を特定して発話位置情報を出力し、
    前記認識キーワード、前記発話位置情報および移動体の運転状態を示す運転状態情報に基づいて、前記制御対象を制御するための制御信号を発生するか否かを切り替える、
    音声処理方法。
JP2019057249A 2019-03-25 2019-03-25 音声処理装置及び音声処理方法 Pending JP2020160181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019057249A JP2020160181A (ja) 2019-03-25 2019-03-25 音声処理装置及び音声処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019057249A JP2020160181A (ja) 2019-03-25 2019-03-25 音声処理装置及び音声処理方法

Publications (1)

Publication Number Publication Date
JP2020160181A true JP2020160181A (ja) 2020-10-01

Family

ID=72643110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019057249A Pending JP2020160181A (ja) 2019-03-25 2019-03-25 音声処理装置及び音声処理方法

Country Status (1)

Country Link
JP (1) JP2020160181A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220037187A (ko) * 2020-09-17 2022-03-24 주식회사 인텔로이드 차량용 음성 인식 장치, 이를 이용한 차량 문제상황 처리 방법 및 컴퓨터 프로그램

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220037187A (ko) * 2020-09-17 2022-03-24 주식회사 인텔로이드 차량용 음성 인식 장치, 이를 이용한 차량 문제상황 처리 방법 및 컴퓨터 프로그램
KR102491119B1 (ko) 2020-09-17 2023-01-25 주식회사 인텔로이드 차량용 음성 인식 장치, 이를 이용한 차량 문제상황 처리 방법 및 컴퓨터 프로그램

Similar Documents

Publication Publication Date Title
US6889189B2 (en) Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations
KR101643560B1 (ko) 음성 인식 장치, 그를 가지는 차량 및 그 방법
EP1908640B1 (en) Voice control of vehicular elements from outside a vehicular cabin
JP5972372B2 (ja) 車載情報装置
WO2017081960A1 (ja) 音声認識制御システム
CN103873004B (zh) 用于自动适配车辆的内部空间中噪声音量的装置和方法
US20070038444A1 (en) Automatic control of adjustable elements associated with a vehicle
JP7068986B2 (ja) エージェントシステム、エージェント制御方法、およびプログラム
JP6604151B2 (ja) 音声認識制御システム
US20200152203A1 (en) Agent device, agent presentation method, and storage medium
CN103863224B (zh) 用于自动适配车辆内部空间中的噪声音量的装置和方法
CN110968048B (zh) 智能体装置、智能体控制方法以及存储介质
JP2017090612A (ja) 音声認識制御システム
JP2017090614A (ja) 音声認識制御システム
JP2004354930A (ja) 音声認識システム
KR101755308B1 (ko) 음성 인식 모듈, 그를 가지는 단말기 및 차량
JP2020160181A (ja) 音声処理装置及び音声処理方法
JP4410378B2 (ja) 音声認識方法および装置
CN110194181B (zh) 驾驶支持方法、车辆和驾驶支持系统
JP2019197964A (ja) マイク制御装置
JP6775897B2 (ja) 車内会話支援装置
JP7407665B2 (ja) 音声出力制御装置および音声出力制御プログラム
JP2020144285A (ja) エージェントシステム、情報処理装置、移動体搭載機器制御方法、及びプログラム
US10812924B2 (en) Control apparatus configured to control sound output apparatus, method for controlling sound output apparatus, and vehicle
US20230206918A1 (en) Speech Recognition System and Method for Providing Speech Recognition Service