JP2020030322A - 音声操作装置および音声操作システム - Google Patents
音声操作装置および音声操作システム Download PDFInfo
- Publication number
- JP2020030322A JP2020030322A JP2018155811A JP2018155811A JP2020030322A JP 2020030322 A JP2020030322 A JP 2020030322A JP 2018155811 A JP2018155811 A JP 2018155811A JP 2018155811 A JP2018155811 A JP 2018155811A JP 2020030322 A JP2020030322 A JP 2020030322A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- output
- operation instruction
- unit
- voices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Abstract
【課題】複数のユーザが時間的に重複して操作指示の発声を行う場合に、操作対象に対して適切なタイミングで操作指示を出力することができる音声操作装置および音声操作システムを提供すること。【解決手段】実施形態に係る音声操作装置は、受付部と、判定部と、出力部とを備える。受付部は、操作対象への操作指示に関する音声の入力を受け付ける。判定部は、受付部によって複数の音声が時間的に重複して受け付けられたか否かを判定する。出力部は、判定部によって複数の音声が時間的に重複して受け付けられたと判定された場合に、複数の音声に対応する操作指示を音声の発声時期に応じた順序で操作対象へ出力する。【選択図】図1
Description
開示の実施形態は、音声操作装置および音声操作システムに関する。
従来、車両に搭載され、車載装置への操作指示に関する音声が入力される場合に、音声認識によって操作対象の車載装置および操作内容を判定し、車載装置に対して操作内容を実行させるための操作指示を出力する音声操作装置がある(例えば、特許文献1参照)。
しかしながら、従来の音声操作装置は、複数のユーザが時間的に重複して操作指示の発声を行う場合に、操作対象に対して適切なタイミングで操作指示を出力することができないことがある。
実施形態の一態様は、上記に鑑みてなされたものであって、複数のユーザが時間的に重複して操作指示の発声を行う場合に、操作対象に対して適切なタイミングで操作指示を出力することができる音声操作装置および音声操作システムを提供することを目的とする。
実施形態の一態様に係る音声操作装置は、受付部と、判定部と、出力部とを備える。受付部は、操作対象への操作指示に関する音声の入力を受け付ける。判定部は、前記受付部によって複数の前記音声が時間的に重複して受け付けられたか否かを判定する。出力部は、前記判定部によって前記複数の音声が時間的に重複して受け付けられたと判定された場合に、前記複数の音声に対応する前記操作指示を前記音声の発声時期に応じた順序で前記操作対象へ出力する。
実施形態の一態様に係る音声操作装置および音声操作システムは、複数のユーザが時間的に重複して操作指示の発声を行う場合に、操作対象に対して適切なタイミングで操作指示を出力することができる。
以下、添付図面を参照して、音声操作装置および音声操作システムの実施形態を詳細に説明する。なお、以下に示す実施形態によりこの発明が限定されるものではない。以下では、車両に搭載され、車載装置等への操作指示に関する音声が入力される場合に、音声認識した操作指示を操作対象となる装置へ出力する車両用の音声操作装置を例に挙げて説明する。
なお、実施形態に係る音声操作装置は、車両用に限定されるものではなく、例えば、一般住宅等に設けられ、音声によって入力される操作指示を操作対象となる任意の装置へ出力する所謂スマートスピーカ等の音声操作装置であってもよい。
図1は、実施形態に係る音声操作装置が操作指示を出力する順番の一例を示す説明図である。図1に示すように、車両では、例えば、あるユーザU1が時刻t1から時刻t3まで、カーナビゲーション装置(以下、「カーナビ」と記載する)に対する操作指示を発声することがある。
このとき、車両では、1人目のユーザU1がカーナビに対する操作指示を発声している最中に、2人目のユーザU2が時刻t2からエアコンに対する操作指示を発話して時刻t4で終話する場合がある。
かかる場合、音声操作装置は、カーナビへの操作指示に関する音声の入力を受け付けている期間に、複数の音声が時間的に重複して受け付けられたか否かを判定する。そして、音声操作装置は、複数の音声が時間的に重複して受け付けられたと判定した場合に、複数の音声に対応する操作指示を音声の発声時期に応じた順序で操作対象へ出力する。
例えば、音声操作装置は、発声開始時期が早い順に操作指示を操作対象へ出力する。図1に示すケースでは、音声操作装置は、1人目のユーザU1の方が2人目のユーザU2よりも先に発話しているため、カーナビに対する操作指示を1番目にカーナビへ出力し、エアコンに対する操作指示を2番目にエアコンへ出力する。
これにより、音声操作装置1は、複数のユーザU1,U2が時間的に重複して操作指示の発声を行う場合に、双方の操作対象に対して、例えば、発声開始時期が早い順に順次適切なタイミングで操作指示を出力することができる。
したがって、音声操作装置は、例えば、操作指示が時間的に重複したことによって、後から発声したユーザU2の操作指示が実行されずに、ユーザU2が不満を抱く等といった問題の発生を防止することができる。
なお、ここでは、発声開始時期が早い順に操作指示を操作対象へ出力する場合について説明したが、音声操作装置から操作対象へ出力する操作指示の出力順序は、発声開始時期が早い順に限定されるものではない。音声操作装置は、音声が入力される状況や設定によって、発声開始時期が早い順以外の順序で操作指示を操作対象へ出力することもできる。
次に、図2を参照し、実施形態に係る音声操作装置1の構成の一例について説明する。図2は、実施形態に係る音声操作装置1の構成の一例を示すブロック図である。図2に示すように、音声操作装置1は、マイク4と、スピーカ5と、ディスプレイ6と、操作対象7−1〜7−n(nは、2以上の自然数)とに接続される。
マイク4は、車室内の音声を集音して音声操作装置1へ出力する。なお、図2には、1個のマイク4を図示しているが、音声操作装置1は、車両に複数のマイクが設けられる場合には、複数のマイクに接続され、それぞれのマイクによって集音される音声が入力される。車両に複数のマイクが設けられる場合の一例については、図8を参照して後述する。
スピーカ5は、音声操作装置1から入力される音声を出音する。例えば、スピーカ5は、音声操作装置1が音声による操作指示を受け付けた場合に、操作指示を発声したユーザに対して行う回答等の音声を出音する。
なお、図2には、1個のスピーカを図示しているが、音声操作装置1は、車両に複数のスピーカが設けられる場合には、それぞれのスピーカから個別または一斉に回答等の音声を出力させる。車両に複数のスピーカが設けられる場合の一例については、図8を参照して後述する。
ディスプレイ6は、例えば、音声操作装置1から入力される画像を表示する。例えば、ディスプレイ6は、音声操作装置1が音声による操作指示を受け付けた場合に、操作指示に対する回答等の画像を表示する。ディスプレイ6による回答の表示例については、図5を参照して後述する。
操作対象7−1〜7−nは、例えば、カーナビ、エアコン、パワーウィンドウ、およびA/V(オーディオ/ビデオ)機器等の車載装置である。なお、操作対象7−1〜7−nは、車載装置に限定されるものではなく、例えば、ユーザが車両に持ち込んだスマートフォンや携帯A/V機器等、音声による操作が可能な任意の電子機器であってもよい。以下、操作対象7−1〜7−nのうち、任意の操作対象を指す場合には、操作対象7と記載する場合がある。
音声操作装置1は、制御部2と記憶部3とを備える。記憶部3は、例えば、データフラッシュ等の情報記憶デバイスであり、優先順位情報31を記憶する。ここで、図3を参照し、実施形態に係る優先順位情報31の一例について説明する。
図3は、実施形態に係る優先順位情報31の一例を示す説明図である。図3に示すように、優先順位情報31は、音声によって操作指示が入力される複数種類の操作と、各操作の優先順位とが対応付けられた情報である。
図3に示すHは、優先度がHighレベルのカテゴリであることを示しており、Mは、優先度がMiddleレベルのカテゴリであることを示しており、Lは、優先度がLowレベルのカテゴリであることを示している。優先順位情報31では、例えば、カーナビの目的地設定操作や目的地検索操作等といった車両の走行に関連する操作が優先度でHighレベルのカテゴリに含まれる。
また、例えば、エアコンの温度設定操作やパワーウィンドウによる車窓開放操作等といった車室内環境に関連する操作が優先度でMiddleレベルのカテゴリに含まれる。また、例えば、音楽再生操作や映像再生操作等といったエンターテインメントに関連する操作が優先度でLowレベルのカテゴリに含まれる。
図2へ戻り、制御部2について説明する。制御部2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを有するマイクロコンピュータや各種の回路を含む。
制御部2は、CPUがROMに記憶されたプログラムを、RAMを作業領域として使用して実行することにより機能する受付部21と、音声認識部22と、判定部23と、出力部24とを備える。
なお、制御部2が備える受付部21、音声認識部22、判定部23、および出力部24は、一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。
受付部21、制御部2が備える音声認識部22、判定部23、および出力部24は、それぞれ以下に説明する情報処理の作用を実現または実行する。なお、制御部2の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
受付部21は、マイク4から操作指示に関する音声の入力を受け付ける。受付部21は、マイクから受け付ける音声を音声認識部22へ出力する。音声認識部22は、受付部21から入力される音声を音声認識し、音声による操作対象7と操作対象7に対する操作指示の内容とを示す情報を判定部23へ出力する。
また、音声認識部22は、ユーザによって発声される音声の発声開始タイミング(時刻)を示す情報と、ユーザによって発声される音声の発声終了タイミング(時刻)を示す情報とを判定部23へ出力する。
このとき、音声認識部22は、音声操作装置1を起動させるための予め設定されたウェィクアップワードを認識した時刻を発声開始タイミングとして決定する。また、音声認識部22は、音声認識を開始した後に所定時間(例えば、2〜3秒間)無音の状態が継続した時点の時刻を発声終了タイミングとして決定する。
判定部23は、音声認識部22から入力される情報に基づいて、受付部21によって複数の音声が時間的に重複して受け付けられたか否かを判定する。そして、音声認識部22は、複数の音声が時間的に重複して受け付けられていないと判定した場合、その旨を示す情報と音声認識部22によって音声認識された操作対象7および操作対象7に対する操作指示の内容を示す情報とを出力部24へ出力する。
出力部24は、複数の音声が時間的に重複して受け付けられていない場合、つまり、一人のユーザからの音声による操作指示が受け付けられた場合には、音声認識された操作対象7へ操作指示を出力する。そして、出力部24は、操作指示に対する回答の音声をスピーカ5によって出力させる。
また、判定部23は、複数の音声が時間的に重複して受け付けられたと判定した場合、その旨を示す情報と音声認識部22によって音声認識された各操作対象7および各操作対象7に対する操作指示の内容を示す情報とを出力部24へ出力する。
さらに、判定部23は、複数のユーザによって時間的に重複して発声される各音声の発声開始タイミング(時刻)を示す情報と、各音声の発声終了タイミング(時刻)を示す情報とを判定部23へ出力する。
出力部24は、判定部23から入力される各音声の発声開始タイミング(時刻)を示す情報と、各音声の発声終了タイミング(時刻)を示す情報とに基づき、各音声の発声時期に応じた順序で音声に含まれる操作指示を操作対象7へ出力する。
ここで、図4を参照し、実施形態に係る操作指示の出力順序決定手順の一例について説明する。図4は、実施形態に係る操作指示の出力順序決定手順を示す説明図である。図4に示すように、出力部24は、例えば、時刻t11で1人目のユーザU11がカーナビに対する目的地設定操作のための発声を開始した場合、1人目のユーザU11によって発声された操作指示の出力順番を1番目に決定する。
その後、1人目のユーザU11の発声途中に、例えば、時刻t12で2人目のユーザU2が車窓開放操作のための発声を開始する場合がある。かかる場合、出力部24は、1人目のユーザU1と2人目のユーザU2以外に発声するユーザがいなければ、2人目のユーザU2によって発声された操作指示の出力順番を2番に決定することができる。
ただし、図4に示すように、例えば、2人目のユーザU2の発声開始と同時に、時刻t12で3人目のユーザU3がエアコンに対する温度設定操作のための発声を開始し、4人目のユーザU4がA/V機器に対する音楽再生操作のための発声を開始する場合がある。
かかる場合、出力部24は、3人のユーザU2,U3,U4の発声開始時期が同時であるため、発声開始時期からだけでは3人のユーザU2,U3,U4によって発声された操作指示の出力順番を決定することができない。
そこで、出力部24は、複数のユーザが同時に発声を開始する場合には、音声の発声終了時期が早い順に操作指示を出力する。図4に示す例では、出力部24は、同時に発声を開始した3人のユーザU2,U3,U4のうち、3人目のユーザU3が最初に時刻t13で発声を終了した場合、3人目のユーザU3による操作指示の出力順番を1人目のユーザU1に次ぐ2番目に決定する。
これにより、出力部24は、同時に発声を開始した3人のユーザU2,U3,U4のうち、既に操作指示の内容が確定している3人目のユーザU3の操作指示を他の2人のユーザU2,U3による発声終了を待たずに操作対象7へ出力することができる。したがって、音声操作装置1は、発声が終了している3人目のユーザU3の待ち時間を短縮することができる。
その後、図4に示すように、時刻t14で2人目のユーザU2と、4人目のユーザU4とが同時に発声を終了する場合がある。かかる場合、出力部24は、2人のユーザU2,U4の発声終了時期が同時であるため、発声終了時期からだけでは2人のユーザU2,U4によって発声された操作指示の出力順番を決定することができない。
そこで、出力部24は、複数のユーザが同時に発声を開始し、同時に発声を終了する場合には、優先順位情報31に基づいて優先順位が高い順に操作指示を出力する。図4に示す例では、2人目のユーザU2による車窓開放操作が優先度でMiddleレベルのカテゴリに含まれ、4人目のユーザU4による音楽再生操作が優先度でLowレベルのカテゴリに含まれており、2人目のユーザU2の操作指示の方が優先順位が高い。
このため、出力部24は、2人目のユーザU2による操作指示の出力順番を3番に決定し、4人目のユーザU4による操作指示の出力順番を4番に決定する。これにより、出力部24は、例えば、ユーザの嗜好に関連する操作指示よりもユーザの体調に関連する操作指示を優先的に適切なタイミングで操作対象7へ出力することができる。
そして、出力部24は、上記のように出力する順番が決定した操作指示から順次、操作対象7へ出力する。このように、出力部24は、発声開始時期、発声終了時期、および操作指示の優先順位を考慮した順序で操作指示を操作対象7へ出力することにより、ユーザの心理、体調、処理時間を鑑みて適切なタイミングで操作指示を各操作対象7へ出力することができる。なお、操作指示は、一回の音声入力による操作指示のみならず、複数回の音声入力を必要とする場合に一連の音声群として取扱い、優先順位を調整することも可能である。
図2へ戻り、出力部24の説明を続ける。出力部24は、時間的に重複して受け付けられた複数の音声に含まれる各操作指示を対応する操作対象7へ順次出力した場合、複数の操作指示への回答の出力が時間的に重複することがある。
かかる場合に、出力部24は、時間的に重複する複数の回答を同時にスピーカ5から出力させると、回答がユーザにとって聞き取りにくくなる。
そこで、出力部24は、複数の操作指示への回答の出力が時間的に重複する場合、先に操作対象7へ出力した操作指示への回答の音声をスピーカ5によって出力させ、後に操作対象7へ出力した操作指示への回答の文字をディスプレイ6によって表示させる。
例えば、出力部24は、図4に示したタイミングで4人のユーザU1〜U4から音声による操作指示が受け付けられた場合、例えば、図5に示すように、「自宅を目的地に設定しました。」という音声による回答をスピーカ5によって出力させる。
同時に、出力部24は、例えば、「#温度を25度に設定しました。」、「#窓を開放します。」、「#音楽を再生します。」という文字による回答を操作指示の出力順にディスプレイ6に一覧表示させる。
これにより、出力部24は、複数の操作指示への回答の出力が時間的に重複する場合に、音声による操作指示に対する回答の応答性を向上させることで、音声操作装置1からの回答を待つユーザの待ち時間を最小限に抑えることができる。
次に、図6を参照し、実施形態に係る音声操作装置1の制御部2が実行する処理の一例について説明する。図6は、実施形態に係る音声操作装置1の制御部2が実行する処理の一例を示すフローチャートである。
制御部2は、操作対象7への操作指示に関する音声の入力を受け付けた場合に、図6に示す処理を実行する。具体的には、図6に示すように、制御部2は、音声の入力を受け付けると、まず、音声認識を行う(ステップS101)。
続いて、制御部2は、重複する音声があるか否かを判定する(ステップS102)。そして、制御部2は、重複する音声がないと判定した場合(ステップS102,No)、音声に含まれる操作指示を操作対象7へ出力し(ステップS110)、処理をステップS109へ移す。
また、制御部2は、重複する音声があると判定した場合(ステップS102,Yes)、重複する音声の順番を発声開始が早かった順と決定する(ステップS103)。続いて、制御部2は、発声開始が同時の音声があるか否かを判定する(ステップS104)。
そして、制御部2は、発声開始が同時の音声がないと判定した場合(ステップS104,No)、処理をステップS108へ移す。また、制御部2は、発声開始が同時の音声があると判定した場合(ステップS104,Yes)、発声開始が同時の音声の順番を発声終了が早かった順と決定する(ステップS105)。
続いて、制御部2は、発声終了が同時の音声があるか否かを判定する(ステップS106)。そして、制御部2は、発声終了が同時の音声がないと判定した場合(ステップS106,No)、処理をステップS108へ移す。
また、制御部2は、発声終了が同時の音声があると判定した場合(ステップS106,Yes)、発声終了が同時の音声の順番を優先順位が高い順と決定する(ステップS107)。続いて、制御部2は、決定した順番で音声の操作指示を操作対象7へ出力する(ステップS108)。
最後に、制御部2は、操作指示に対応する回答を出力して(ステップS109)、処理を終了する。そして、制御部2は、次回、操作対象7への操作指示に関する音声の入力を受け付けた場合に、ステップS101から処理を開始する。
なお、上述した音声操作装置1の構成および動作は一例であり、種々の変形が可能である。以下、図7および図8を参照し、実施形態の変形例について説明する。
図7は、実施形態に係る音声操作装置1が操作指示を出力する順番の変形例を示す説明図である。図8は、実施形態に係る音声操作装置1による回答方法の変形例を示す説明図である。
上述した実施形態では、音声操作装置1は、発声開始時期が早い順に操作指示を出力する場合について説明したが、発声開始時期とは無関係に、発声終了時期が早い順に操作指示を出力することもできる。
例えば、図7に示すように、車両では、1人目のユーザU1が時刻t21から時刻t24まで、カーナビに対する目的地設定操作の操作指示を発声することがある。そして、車両では、1人目のユーザU1が発声している最中に、2人目のユーザU2が時刻t22から時刻t23まで、エアコンに対する温度設定操作の操作指示を発声する場合がある。
音声操作装置1は、このように、1人目のユーザU1の方が先に発声を開始しても、2人目のユーザU2の方が1人目のユーザU1よりも先に発声を終了する場合、2人目のユーザU2の操作指示を1番目に、1人目のユーザU1の操作指示を2番目に出力する。
つまり、音声操作装置1は、2人目のユーザU2による温度設定操作の操作指示を1番目にエアコンへ出力し、その後、1人目のユーザU1による目的地設定操作の操作指示を2番目にカーナビへ出力する。
これにより、音声操作装置1は、1人目のユーザU1が発声している最中に既に操作指示の内容が確定している2人目のユーザU2の操作指示を1人目のユーザU1による発声終了を待たずにエアコンへ出力することができる。
したがって、音声操作装置1は、発声が終了している2人目のユーザU2の待ち時間を短縮し、その後、1人目のユーザU1の発声が終了した場合、直ちに1人目のユーザU1の操作指示をカーナビへ出力することで時間を有効活用した処理を行うことができる。
また、図8に示すように、音声操作装置1は、複数のマイク41〜44と、複数のスピーカ51〜54が設けられた車両Cに搭載される場合がある。ここで、マイク41およびスピーカ51は、運転者Dに向けて指向性が設定され、マイク42およびスピーカ52は、助手席の乗員P1に向けて指向性が設定されているものとする。
また、マイク43およびスピーカ53は、右側後部座席の乗員P2に向けて指向性が設定され、マイク44およびスピーカ54は、左側後部座席の乗員P3に向けて指向性が設定されているものとする。
音声操作装置1は、かかる車両Cにおいて時間的に重複する複数の音声による操作指示を受け付ける場合、音声が入力されるマイク41〜44を判別することによって、発声者を特定可能である。
このため、音声操作装置1は、例えば、運転者Dと運転者以外の乗員P1〜P3の音声が時間的に重複する場合には、発声開始時期や発声終了時期を問わず、運転者Dの操作指示を優先的に操作対象へ出力する。
なお、音声操作装置1は、重複する音声から音声認識によって運転者Dと他の乗員P1〜P3とを特定する機能を備える場合にも、同様に、運転者Dの操作指示を優先的に操作対象へ出力する。
これにより、音声操作装置1は、例えば、運転者Dが車両の走行に関連する重要な操作指示を発声する場合に、他の操作指示よりも優先的に運転者Dの操作指示に応じた動作を操作対象7に行わせることができる。
そして、音声操作装置1は、運転者Dの操作指示を優先させた後、他の操作指示の発声が時間的に重複している場合には、前述した実施形態と同様に、操作指示の発声開始時期や発声終了時期に応じた順序で操作指示を操作対象7へ出力する。
その後、音声操作装置1は、複数の操作指示に対する回答の出力が時間的に重複する場合、複数のスピーカ51〜55を使用することによって、運転者Dおよび各乗員P1〜P3に対して並行して回答を出力することができる。
なお、ここまで、音声操作装置1が音声指示の内容を音声認識する音声認識部22を備える場合について説明してきたが、音声操作装置1は、必ずしも音声認識部22を備えている必要はない。
次に、図9を参照し、音声認識部22を備えていない音声操作装置1aによって前述した実施形態と同様の音声操作を可能とする音声操作システム100について説明する。図9は、実施形態に係る音声操作システム100の構成の一例を示す説明図である。
ここでは、図9に示す構成要素のうち、図2に示す構成要素と同一の構成要素については、図2示す符号と同一の符号を付することにより重複する説明を省略する。図9に示すように、音声操作装置1aは、音声認識部22(図2参照)を備えていない点を除き、図2に示す音声操作装置1と同様の構成であり、マイク4、スピーカ5、ディスプレイ6、および操作対象7−1〜7−nと接続される。
また、音声操作装置1aは、例えば、インターネット等の通信ネットワークNを介して、音声認識部111を備えるサーバ装置110と無線通信可能に接続される。かかる音声操作装置1aの受付部21は、操作指示の内容を音声認識する機能は備えていないが、前述のウェィクアップワードを音声認識する機能は備える。
このため、受付部21は、ウェィクアップワードの入力を受け付ける場合に、以後に入力される音声をサーバ装置110へ送信する。サーバ装置110は、音声操作装置1aから受信する音声から音声認識部111によって操作指示の内容を音声認識し、操作指示の内容を音声操作装置1aへ送信する。
音声操作装置1aの受付部21は、サーバ装置110から受信する操作指示等の情報を判定部23へ出力する。そして、判定部23および出力部24は、図2に示す音声操作装置1の判定部23および出力部24と同様の処理を実行する。
これにより、音声操作装置1aは、図2に示す音声操作装置1よりも簡易な構成で音声操作装置1と同様に、複数のユーザが時間的に重複して操作指示の発声を行う場合、操作対象7に対して適切なタイミングで操作指示を出力することができる。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
1,1a 音声操作装置
2 制御部
21 受付部
22,111 音声認識部
23 判定部
24 出力部
3 記憶部
31 優先順位情報
4,41〜44 マイク
5,51〜54 スピーカ
6 ディスプレイ
7,7−1〜7−n 操作対象
100 音声操作システム
110 サーバ装置
N 通信ネットワーク
C 車両
U1〜U4 ユーザ
D 運転者
P1〜P3 乗員
2 制御部
21 受付部
22,111 音声認識部
23 判定部
24 出力部
3 記憶部
31 優先順位情報
4,41〜44 マイク
5,51〜54 スピーカ
6 ディスプレイ
7,7−1〜7−n 操作対象
100 音声操作システム
110 サーバ装置
N 通信ネットワーク
C 車両
U1〜U4 ユーザ
D 運転者
P1〜P3 乗員
Claims (8)
- 操作対象への操作指示に関する音声の入力を受け付ける受付部と、
前記受付部によって複数の前記音声が時間的に重複して受け付けられたか否かを判定する判定部と、
前記判定部によって前記複数の音声が時間的に重複して受け付けられたと判定された場合に、前記複数の音声に対応する前記操作指示を前記音声の発声時期に応じた順序で前記操作対象へ出力する出力部と
を備えることを特徴とする音声操作装置。 - 前記出力部は、
前記音声の発声開始時期が早い順に前記操作指示を前記操作対象へ出力する
ことを特徴とする請求項1に記載の音声操作装置。 - 前記出力部は、
前記音声の発声終了時期が早い順に前記操作指示を前記操作対象へ出力する
ことを特徴とする請求項1に記載の音声操作装置。 - 前記操作指示の優先順位を記憶する記憶部
をさらに備え、
前記出力部は、
前記記憶部に記憶された優先順位に応じた順序で前記操作指示を前記操作対象へ出力する
ことを特徴とする請求項1〜3のいずれか一つに記載の音声操作装置。 - 前記出力部は、
前記順序で先に出力した前記操作指示への回答をスピーカによって出力させ、後に出力した操作指示への回答を表示装置によって出力させる
ことを特徴とする請求項1〜4のいずれか一つに記載の音声操作装置。 - 前記出力部は、
前記操作指示への回答を前記操作指示の発声者へ指向性が設定される指向性スピーカによって出力させる
ことを特徴とする請求項1〜5のいずれか一つに記載の音声操作装置。 - 前記出力部は、
前記操作対象に対する操作において複数回の音声入力を必要とする場合、一連の音声群として順序を調整する
ことを特徴とする請求項1〜6のいずれか一つに記載の音声操作装置。 - 操作対象への操作指示に関する音声の入力を受け付ける受付部と、
前記受付部によって受け付けられた音声をサーバ装置へ送信し、前記サーバ装置から前記音声に含まれる前記操作指示の音声認識結果を受信する通信部と、
前記受付部によって複数の前記音声が時間的に重複して受け付けられたか否かを判定する判定部と、
前記判定部によって前記複数の音声が時間的に重複して受け付けられたと判定された場合に、前記複数の音声に対応する前記操作指示を前記音声の発声時期に応じた順序で前記操作対象へ出力する出力部と
を備える音声操作装置と、
前記サーバ装置と
を備えることを特徴とする音声操作システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018155811A JP2020030322A (ja) | 2018-08-22 | 2018-08-22 | 音声操作装置および音声操作システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018155811A JP2020030322A (ja) | 2018-08-22 | 2018-08-22 | 音声操作装置および音声操作システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020030322A true JP2020030322A (ja) | 2020-02-27 |
Family
ID=69622446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018155811A Pending JP2020030322A (ja) | 2018-08-22 | 2018-08-22 | 音声操作装置および音声操作システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020030322A (ja) |
-
2018
- 2018-08-22 JP JP2018155811A patent/JP2020030322A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11600269B2 (en) | Techniques for wake-up word recognition and related systems and methods | |
US8407057B2 (en) | Machine, system and method for user-guided teaching and modifying of voice commands and actions executed by a conversational learning system | |
EP1768103B1 (en) | Device in which selection is activated by voice and method in which selection is activated by voice | |
US20150039316A1 (en) | Systems and methods for managing dialog context in speech systems | |
WO2013168254A1 (ja) | 移動体用ナビゲーションシステム | |
US11521612B2 (en) | Vehicle control apparatus and method using speech recognition | |
JP6767082B2 (ja) | 車内通話制御装置、車内通話システムおよび車内通話制御方法 | |
JP7023823B2 (ja) | 車載装置及び音声認識方法 | |
JP2020095121A (ja) | 音声認識システム、学習済みモデルの生成方法、音声認識システムの制御方法、プログラム、及び移動体 | |
WO2024078460A1 (zh) | 语音处理方法、语音交互方法、服务器及存储介质 | |
JP2020030322A (ja) | 音声操作装置および音声操作システム | |
JP5074759B2 (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
US20190196780A1 (en) | Sound outputting device, sound outputting method, and sound outputting program storage medium | |
US11996099B2 (en) | Dialogue system, vehicle, and method of controlling dialogue system | |
CN110737422A (zh) | 一种声音信号采集方法及装置 | |
JP2004301875A (ja) | 音声認識装置 | |
US20220262371A1 (en) | Voice request sequencing | |
JP2020152298A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020060730A (ja) | 音声認識装置 | |
US20230298581A1 (en) | Dialogue management method, user terminal and computer-readable recording medium | |
JP7217209B2 (ja) | 音声対話装置、音声対話方法、及びプログラム | |
JPWO2019058453A1 (ja) | 音声対話制御装置および音声対話制御方法 | |
KR20090096337A (ko) | 큰소리 발성에 기반을 둔 어학 시스템 및 방법 | |
JP2008309865A (ja) | 音声認識装置および音声認識方法 | |
JPH07219582A (ja) | 車載用音声認識装置 |