JP2015004703A - 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム - Google Patents
電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム Download PDFInfo
- Publication number
- JP2015004703A JP2015004703A JP2013128232A JP2013128232A JP2015004703A JP 2015004703 A JP2015004703 A JP 2015004703A JP 2013128232 A JP2013128232 A JP 2013128232A JP 2013128232 A JP2013128232 A JP 2013128232A JP 2015004703 A JP2015004703 A JP 2015004703A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- audio signal
- transfer
- electronic device
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【課題】 転送先である携帯端末側の音声入力待ち状態を適切に終了させることができる、「電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム」を提供する。
【解決手段】 本実施例に係る車載装置100において、転送処理手段170は、マイクロフォン130から音声を入力する音声入力部172、音声信号からノイズ成分を除去する音声信号抽出部174、抽出された音声信号をスマートフォン200に転送する音声信号転送部176、抽出された音声信号に基づき発話の終了を検知する発話終了検知部178、検知された発話の終了時点に応答して音声信号の転送を停止する転送制御部180を備えている。音声信号の転送が停止されることで、スマートフォン200は、音声入力待ち状態を自動的に解除することができる。
【選択図】 図3
【解決手段】 本実施例に係る車載装置100において、転送処理手段170は、マイクロフォン130から音声を入力する音声入力部172、音声信号からノイズ成分を除去する音声信号抽出部174、抽出された音声信号をスマートフォン200に転送する音声信号転送部176、抽出された音声信号に基づき発話の終了を検知する発話終了検知部178、検知された発話の終了時点に応答して音声信号の転送を停止する転送制御部180を備えている。音声信号の転送が停止されることで、スマートフォン200は、音声入力待ち状態を自動的に解除することができる。
【選択図】 図3
Description
本発明は、携帯端末等の外部機器の音声対話型機能等を利用する電子装置に関し、特に、電子装置から携帯端末への音声信号の転送を制御する転送技術に関する。
現在、スマートフォン等の携帯端末に搭載された音声対話型機能が普及し、例えば、秘書機能アプリケーションなどにより提供される音声対話型サービスを利用することが可能になってきている。典型的な音声対話型機能とは、機器が自然言語処理を用いて発話された言語を認識し、質問に答えたり、簡単な会話をしたり、Webサービスの情報の利用を促したりするものである。
このような音声対話型サービスは、日常生活のさまざまな場面で利用されるが、例えば、車両での運転中に、携帯電話機やスマートフォンなどを持って通話したり、表示画面を操作することは危険であり、法令上、そのような行為は禁止されている。そこで、携帯電話機等を手で持つことなく音声入出力を可能に利用する、いわゆるハンズフリー機能が用いられている。
ハンズフリー機能のある利用態様では、携帯端末を車載装置にBluetooth(登録商標)等により接続し、車内マイク等を介して入力された運転者の音声信号が車載装置から携帯端末へ転送され、携帯端末から車載装置へ音声信号が転送させ、それが車内スピーカ等から出力される。これにより、ユーザーは、車内においてもハンズフリーな状態で音声対話型サービスを利用することができる。
特許文献1には、車両の音声認識装置における音声入力に関し、ドライバの様々な状況を考慮して音声区間を正確に検出し、ドライバの音声を精度良く認識するための技術が開示されている。音声認識装置は、マイクからの音声が入力されると、音声入力の開始を発話開始条件と比較して検出する一方、音声入力レベルが予め設定しておいたレベル以下となる状態が終話検出時間連続した場合に音声入力の終了を検出して、入力された音声の認識処理が行われる(特許文献1)。
従来、携帯端末等に搭載されている音声対話型サービスあるいは音声認識を車内で利用する場合、安全性や利便性などの観点からハンズフリー機能を用いるため、車載装置から携帯端末へと音声信号を転送していた。このとき、車載装置は、マイクに入力された音声信号を携帯端末に転送するのみで、発話の検知や会話内容の解析などの音声認識処理は全て携帯端末側で行われていた。
しかしながら、携帯端末側の音声認識機能は、車内などでの利用を想定していないため、音声信号に含まれる車内特有のノイズ、例えば、走行時に生じる風切音、エンジン音、タイヤ磨耗音などのロードノイズを適切に取り除くことができず、その結果、これらノイズをユーザーの発話と誤認してしまい、音声入力待ち状態から抜け出せなくなる場合があった。
また、ハンズフリー機能で使用される携帯端末とヘッドセット間の音声入出力を行うためのBluetooth(登録商標)のプロファイル、例えば、Headset Profile (HSP)には、転送先である携帯端末側に対して音声入力待ち状態を解除させるコマンドが存在しないため、車載装置側から携帯端末の音声入力待ち状態を解除する手段がなく、このため、ユーザーは、車両を停止させ、わざわざボタン操作等を行い、携帯端末の音声入力待ち状態を強制的に終了する必要があった。このように、携帯端末側の音声対話型サービスあるいは音声認識を車内で利用する場合、携帯端末側では、ユーザーの発話の終了時を正確に検出することができず、音声入力待ち状態が継続され、ユーザーが強制的に音声入力待ち状態を終了するように指示しなければならなかった。
本発明は、このような従来の課題を解決し、転送先である携帯端末等の外部装置の音声入力待ち状態を適切に終了させることができる、電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システムを提供することを目的とする。
本発明に係る電子装置は、音声を入力する音声入力手段と、前記音声入力手段により入力された音声信号を外部装置に転送する転送手段と、前記音声入力手段により入力された音声信号の発話の終了を検知する検知手段と、前記検知手段により発話の終了が検知されたとき、前記外部装置への前記音声信号の転送を停止する制御手段とを有し、外部装置を接続される。
好ましくは、前記電子装置は車両に搭載され、前記電子装置はさらに、前記音声入力手段により入力された音声信号の認識を行う音声認識手段を備え、前記音声認識手段は、前記音声信号から少なくとも車両に特有のノイズ成分を除去する手段を含み、前記検知手段は、前記ノイズ成分が除去された音声信号に基づき発話の終了を検知する。また、前記転送手段は、前記音声認識手段から受け取った音声信号を外部装置へ転送可能であり、前記制御手段は、前記検知手段により発話の終了が検知されたとき、前記音声認識手段による音声信号の出力を停止させる。
好ましくは、前記制御手段は、前記検知手段により発話の終了が検知されたとき、前記転送手段による音声信号の出力を停止させることができる、または、前記音声入力手段による音声信号の出力を停止させることができる。また、前記音声入力手段は、ハンズフリー機能により音声を入力することができる。
本発明に係る音声信号の転送方法は、車載電子装置に入力された音声信号からノイズ成分を除去するステップと、ノイズが除去された音声信号に基づき発話の終了を検知するステップと、発話の終了が検知されたことに応答して前記音声信号の前記外部装置への転送を停止するステップとを備え、車載電子装置に入力された音声信号を外部装置へ転送することができる。
本発明に係る音声信号の転送プログラムは、車載電子装置に入力された音声信号からノイズ成分を除去するステップと、ノイズが除去された音声信号に基づき発話の終了を検知するステップと、発話の終了が検知されたことに応答して前記音声信号の前記外部装置への転送を停止するステップとを備え、入力された音声信号を外部装置へ転送する機能を備えた車載電子装置が実行する。
本発明に係る音声処理システムは、電子装置と、前記電子装置に接続されかつ音声対話機能を備えた外部装置とを含み、前記電子装置は、音声を入力する音声入力手段と、前記音声入力手段により入力された音声信号を外部装置に転送する転送手段と、前記音声入力手段により入力された音声信号の発話の終了を検知する検知手段と、前記発話の終了が検知されたとき、前記外部装置への前記音声信号の転送を停止する転送制御手段とを有し、前記外部装置は、前記電子装置から転送された音声信号に基づき音声認識を行う音声認識手段を含んでいる。
本発明によれば、電子装置側において発話の終了が検知されたときに音声信号の転送を停止するようにしたので、転送先である外部装置側の音声入力待ち状態を自動的に解除することができる。これにより、ユーザーは、例えば、携帯端末の音声対話型サービスを車内で利用する際、携帯端末を直接操作し、音声入力待ち状態を強制的に終了させるような煩雑な作業から解放される。
次に、本発明の実施の形態について図面を参照して詳細に説明する。本発明の好ましい実施態様に係る車内音声処理システムは、車内において、音声認識機能を備えた車載装置を介して、外部機器である携帯端末の音声対話型サービスまたは音声認識機能を利用する。
車載装置は、概して車両に搭載された電子装置であり、種々の機能を搭載することができる。例えば、車載装置は、オーディオデータやビデオデータを再生する機能、目的地までの経路を案内するナビゲーション機能、テレビ/ラジオ放送を受信する機能、インターネットなどのネットワークに接続する通信機能などを搭載することができる。さらに車載装置は、種々の外部機器、例えば、携帯端末、ハンズフリー用のヘッドセット等との接続が可能であり、好ましい態様では、車載装置と外部機器とは、Bluetooth等の離無線通信によって接続される。ハンズフリー機能は、車載装置、あるいは車載装置に接続された携帯端末へのいずれの音声入出力を可能にし、その際、音声入出力は、ヘッドセットを介して行われたり、あるいは車内マイクや車内スピーカを介して行われる。さらに、車載装置は、接続された携帯端末の入出力手段として機能することが可能であり、携帯端末の表示部に表示された画像情報を車載装置の表示部に映し出すこともできる。
車内音声処理システムの好ましい実施態様では、スマートフォン等の携帯端末が車載装置に接続される。携帯端末は、インターネット、イントラネット、無線LAN、WiFi等のネットワーク通信を介してデータの送受を行うことができる無線通信機能、ユーザーの音声を認識し、会話内容を解析して応答する音声対話型機能、および車載装置等の外部機器との間で通信状態を確立する接続機能を備えたものであればよい。音声対話型機能は、ユーザーと対話することができ、会話内容に基づき、例えば、時計機能、メモ機能やスケジュール機能などと連携し、ユーザーの問い掛けに対して音声やテキストのメッセージで応答したり、所望するデータを提示することができる。音声対話型機能は、これ以外にも、各種ニュースや料理レシピなどをチェックするため、インターネット等のネットワーク通信を促すものであってもよい。携帯端末は、例えば、多機能型携帯電話機(スマートフォン)、携帯電話機、ノート型PC、タブレット型PC、その他の同様の端末であることができる。
次に、本発明の実施例に係る車内音声処理システムについて説明する。図1は、本実施例の車内音声処理システムの概要を示す図である。同図に示すように、本実施例の車内音声処理システム10は、車載装置100と、その車載装置100に無線または有線により接続されたスマートフォン200とを備える。ここでは、携帯端末としてスマートフォンが用いられる例を示すが、上記したように携帯端末はスマートフォン以外の端末であってもよい。
車載装置100は、ビデオ機能やオーディオ機能などを搭載し、ビデオ画像や指示画像などの画面データを表示するための表示部110、音声を出力するためのスピーカ120を備える。車載装置100はさらには、音声を入力するマイクロフォン130を含み、マイクロフォン130は、ユーザーからの音声指示を受け取るときの音声入力手段、あるいはスマートフォン200の音声対話型サービス等を利用するときの音声入力手段として機能する。スピーカ120、マイクロフォン130には、例えば、車内スピーカ、車内マイクが使用されるが、これ以外にも、車載装置100に無線または有線で接続されたヘッドフォンセットが使用されてもよい。また、車載装置100は、ミラーリンク機能を備え、車載装置100の入出力手段は、あたかもスマートフォン200の遠隔用の入出力手段として機能することも可能である。
典型的なスマートフォン200は、公衆電話回線網210を利用する電話機能、インターネット等のネットワーク通信220を利用するデータ通信機能、車載装置100やヘッドフォンセットなどの外部機器を介して音声通話などを行うハンズフリー機能を備えている。スマートフォン200は、さらに、ユーザーと擬人的に対話してコミュニケーションをはかり、ユーザーに所望の情報を提供する音声対話型機能を備えている。音声認識機能を利用する音声対話型サービスは、ユーザーの発話内容に応じて、例えば、友人に電話するため、公衆電話回線網210への接続を促したり、現在時刻、天気予報、各種ニュースなどをチェックするため、ネットワーク通信220により各種情報をダウンロードしたり、配信サイトへの接続を促したりする。
車載装置100は、接続手段300によってスマートフォン200に接続される。接続手段300は、その接続方法を特に限定するものではなく、例えば、Bluetooth(登録商標)、無線LAN(登録商標)、WiFi(登録商標)、USB(登録商標)などによって両者を接続することができる。接続手段300は、車載装置100とスマートフォン200の間でデータや制御信号の双方向通信を行うものであることができる。本実施例のように、車載装置100を介してスマートフォン200の音声対話型サービスを利用する場合、車載装置100とスマートフォン200間の接続には、好ましくは、Bluetooth(登録商標)のBT HSP(Headset Profile)が用いられる。BT HSPは、車内マイク、車内スピーカまたはヘッドフォンセットなどを用いてハンズフリーによる音声信号の転送を実現するためのプロファイルであって、接続した機器同士間での音声データの送受信を可能にする。車載装置100とスマートフォン200とは、音声データを送受信するため、BT HSPやBT HFP(Hands-Free Profile)のような同一の通信プロトコルを相互に保持している。
接続手段300は、音声データ以外にも、ミラーリンク機能による画像データや制御信号の送信を可能にし、例えば、車載装置100の表示部110でタッチ入力された信号をスマートフォン200へ送信したり、スマートフォン200上に表示される画像データを車載装置100へ送信する。
図2は、車載装置100の一構成例を示すブロック図である。車載装置100は、CD、DVD、ブルーレイディスク、ハードディスク装置などに格納されたオーディオデータやビデオデータを再生したり、デジタルテレビ放送、AM/FMラジオ放送などを受信するマルチメディア再生部140、自車位置周辺の道路地図を表示したり、目的地までの誘導経路を案内するナビゲーション部142、入力された音声信号の音声認識を行う音声認識モジュール144、外部のネットワーク等とデータ通信を行うことを可能にする通信部146、スマートフォン200やその他の電子機器等との間の接続手段300による接続を確立する接続部148、プログラムやデータ等を記憶する記憶部150、音声や画像等を出力する出力部152、ユーザー操作や音声等を入力する入力部154、マイクロコントローラやマイクロプロセッサ等を含みプログラムを実行することで各部を制御する制御部160を含んで構成される。なお、ここに示される構成は例示であり、車載装置100は、このような構成に限定されるものではない。
接続部148は、スマートフォン200との間で音声信号の入出力を可能にするためのBluetoothモジュール(以下、BTモジュールと略す)を含んで構成される。BTモジュールには、例えば、HSPなどのプロファイルが含まれており、車載装置100とスマートフォン200間の音声信号や各種制御信号の送受信を可能にする。また、接続部148は、これ以外にも、外部機器との間でUSBケーブル、WiFi等の無線LANによる接続を可能にするものであってもよい。
制御部160は、車載装置100の各部の機能を制御するが、ここでは、その中の1つである音声信号の転送処理の詳細を説明する。図3は、音声信号の転送処理を実行する転送処理手段の機能的な構成を示す図である。同図に示すように、転送処理手段170は、マイクロフォン130から音声を入力しこれを音声信号に変換する音声入力部172と、音声信号に含まれるノイズ成分を除去し音声信号を抽出する音声信号抽出部174と、抽出された音声信号をスマートフォン200に転送する音声信号転送部176と、ノイズ除去された音声信号に基づき発話の終了時点を検知する発話終了検知部178と、発話の終了時点が検知されたとき、音声信号の転送を制御する転送制御部180を備えている。好ましい態様では、音声認識モジュール144が、音声信号抽出部174および発話終了検知部178の機能を包含することができ、接続部148のBTモジュールが音声信号転送部176の機能を包含することができる。
音声入力部172は、マイクロフォン130から入力された音声をアナログ音声信号に変換し、この音声信号を、音声信号抽出部174へ提供する。音声信号抽出部176は、公知のノイズ除去手段により、音声信号に含まれる車両環境に特有のノイズ成分を除去する。好ましくは、音声信号抽出部174は、音声の強度、周波数特性、またはノイズパターンなどのフィルタ条件が設定されたフィルタ機能を用いて、風切音、エンジン音、タイヤ磨耗音、走行音などのノイズ成分を除去する。また、音声信号抽出部174は、適応型フィルタを用いたノイズキャンセラによってノイズ成分を除去することも可能である。例えば、車両における騒音を補正する技術は、特開2012−15664号、特開2012−15665号などに開示されている。
音声信号転送部176は、音声信号抽出部174によってノイズ成分が除去された音声信号をデジタル信号に変換し、デジタル音声信号をBTモジュールを介してスマートフォン200に転送する。
発話終了検知部178は、音声信号抽出部176によってノイズ除去された音声信号に基づき、ユーザーの発話終了の時点を検知する。発話終了検知部178は、例えば、音声信号の音声レベルが一定強度以下となった状態が一定期間継続されたとき、それを発話の終了と判定して検知することができる。好ましくは、発話終了検知部178は、音声レベルに係る第1のしきい値、継続期間に係る第2のしきい値を保持し、音声レベルが第1のしきい値を下回った状態になった時点からカウントを始め、そのカウントした期間が第2のしきい値を超えたとき、発話終了を検知する。
転送制御部180は、発話終了検知部178が発話の終了と検知したとき、音声信号転送部176による転送を中断または停止させる。その結果、車載装置100からスマートフォン200へと音声信号が途絶えることとなる。車載装置100からスマートフォン200への音声信号の転送を停止させる方法には、音声信号転送部176の動作または出力を停止させる以外にも、転送制御部180が音声入力部174の入力を停止させたり、音声信号抽出部174による出力を停止させるようにしてもよい。
図4に、音声対話型サービスの機能を搭載したスマートフォン200の一構成例を示す。この音声対話型サービスは、車載装置100による遠隔操作によって起動させることが可能である。スマートフォン200は、典型的に、ユーザーからの入力を受け取る入力部230、公衆電話回線網210やネットワーク通信220を介しての通信を可能にする通信部232、ディスプレイの表示を制御する表示制御部234、スピーカからの音声出力を制御する音声出力部236、車載装置100等の電子機器との間で接続手段300による接続を確立する接続部238、マイクロコントローラやマイクロプロセッサ等を含みプログラムを実行することで各部を制御する制御部240、音声対話型機能を利用する秘書アプリケーションなどのソフトウエアやプログラム等を格納するプログラムメモリ242、および種々のデータを格納するデータメモリ244を備えている。
接続部238は、車載装置100との間で音声信号の入出力を可能にするためのBTモジュールを含んで構成される。当該BTモジュールには、例えば、HSPなどのプロファイルが含まれており、車載装置100とスマートフォン200間で音声信号や各種制御信号の送受信を可能にする。さらに接続部238は、BTモジュール以外にも、外部機器との間でUSBケーブル、WiFi等による接続を可能にするものであってもよい。
図5は、音声対話型プログラム250の機能的な構成を示す図である。同図に示すように、音声対話型プログラム250は、車載装置100からの音声信号を入力する音声信号入力部252、入力された音声信号に基づき音声を認識する音声認識部254、認識された音声に基づき、キーワード等を抽出して発話内容を解析する発話内容解析部256、解析された発会話内容に応じて、適切な応答を作成する応答作成部258を備えている。
音声認識部254は、入力した音声信号、すなわち、ユーザーの発話を解析し、発話された言語を文字データに変換して取り出すことができる。例えば、統計的手法が用いられ、音声の特徴を大量に蓄積した学習用データに基づき、音声信号と蓄積した特徴とを比較しながら、最も特徴に近い言語系列を認識結果として出力する。音声認識部254は、これ以外にも、その他の音声認識処理手法を用いてもよい。取り出された文字データは、ユーザーの発話として、例えば、車載装置100やスマートフォン200の表示部に出力することができる。
発話内容解析部256は、認識された言語から、各種キーワードを抽出して、発話内容を解析する。そして、応答作成部258は、解析された発話内容に応じて、ユーザーが所望する情報を特定して、適切な応答メッセージなどを作成する。応答メッセージには、例えば、音声合成技術により作成された音声データ、または文字列からなるテキストデータが用いられる。また、応答作成部258は、音声データやテキストデータによる応答メッセージに限らず、例えば、現在時刻を示す時計表示、1週間の天気予報を示す週間天気予報表示、1ヶ月のスケジュールを示す予定表表示などの画像データを作成するものであってもよい。
次に、本発明の実施例における車内音声処理システムの動作について図面を参照して説明する。図6は、車内音声処理システムの転送制御を説明する図である。ハンズフリー機能を用いて音声対話型サービスを車内で利用する場合、車載装置100にヘッドセットが接続され、車載装置100とスマートフォン200間がBTモジュールを介して接続される。
図6(a)に示すように、マイクロフォン130から入力された音声は、音声入力部172によって音声信号に変換され、当該音声信号は、音声認識モジュール144と、接続部148のBTモジュール148Aを介して、スマートフォン200に転送される。音声認識モジュール144は、図3に示したように、音声信号抽出部174、発話終了検知部178を含み、BTモジュール148Aは、音声信号転送部176を含む。
車載装置100に搭載された音声認識モジュール144は、車両環境のノイズを除去するのに最適化されているため、スマートフォン200に搭載された音声認識モジュールと比較して、入力された音声信号の発話終了時点を正確に検知することができる。音声認識モジュール144の認識結果は、転送制御部180へ伝えられ、転送制御部180は、BTモジュール148Aによる転送を停止させる。
また、他の態様として、転送制御部180は、音声認識モジュール144の出力を停止させることで、音声認識モジュール144からBTモジュール148Aへ音声信号が入力されないようにし、BTモジュール148Aから音声信号が出力されないように制御してもよい。例えば、転送制御部180は、音声認識モジュール144への電力供給を遮断するような制御を行うことで音声認識モジュール144の動作または出力を停止させたり、あるいは音声認識モジュール144が非活性化されるような制御信号を音声認識モジュール144へ提供する。
さらなる他の態様として、転送制御部180は、破線で示すように音声入力部172の入力が停止されるように、すなわち音声入力部172からの音声信号が認識モジュール144へ出力されないようにしてもよいし、あるいは音声認識モジュール144の音声認識結果が完全にミュート(音声出力レベルがゼロないし実質的に消音レベル)されるようにしてもよい。これにより、スマートフォン200では、音声信号を入力することができなくなるため、音声認識部254(図5を参照)は、音声の入力待ち状態を自動的に解除することができる。
図6(a)では、音声認識モジュール144と、BTモジュール148Aとが音声入力部172に直列に接続されているが、図6(b)に示すように、音声入力部172の出力に音声認識モジュール144と、BTモジュール148Aとが音声入力部を並列に接続してもよい。この場合、転送制御部180は、BTモジュール148Aの転送動作を停止させるか音声入力部172の出力を停止させる。
図7は、本発明の実施例における車内音声処理システムの動作を説明する動作フローである。音声対話型サービスを車内で利用する場合、車載装置100とスマートフォン200とは、例えば、BT HSPにより互いに接続される。このとき、車載装置100は、ミラーリンク機能により、あたかもスマートフォン200の遠隔用の入出力装置として機能する。
ユーザーが車載装置100から音声対話型サービスを起動すると(S100)、車載装置100では、ハンズフリー機能による音声入力モードとなり(S102)、スマートフォン200では車載装置100から転送される音声信号の入力を待機する音声入力待ち状態となる(S104)。
例えば、ユーザーが「今、何時ですか?」と発話すると、音声入力部172によって音声信号に変換され、次いで、音声信号抽出部174によって音声信号に含まれる、車内特有のロードノイズが除去される(S106)。次いで、発話終了検知部178によって、抽出された音声信号の発話の終了時が検知される(S108)。
発話終了検知部178は、発話後の音声信号のレベルが第1のしきい値を下回ったときにカウントを開始する。そして、カウント値が、予め設定された第2のしきい値、例えば、3秒を超えたとき、発話終了検知部178は、発話の終了があったものとみなし、当該時刻を発話の終了時点として検知する。
発話終了検知部178によって発話の終了が検知されると、転送制御部180は、上記図6に示した方法により、音声信号の転送を停止させる(S110)。その結果、スマートフォン200では、車載装置100からの音声信号の入力が途絶えるため、スマートフォン200側の音声認識部254は、自動的に音声入力待ち状態を解除することができる(S112)。
その後、スマートフォン200では、音声認識部254、発話内容解析部256によって発話内容が解析され(S114)、応答作成部258は、その解析結果に応じて応答メッセージを作成する(S116)。例えば、ユーザーが「今、何時ですか?」と問い掛ける質問に対して、スマートフォン200は現在時刻を尋ねられていることを推測し、「15時30分です。」との応答メッセージを作成する。車載装置100は、スマートフォン200が作成した応答メッセージを受け取り、応答メッセージに対応する音声あるいはテキストを出力する(S118)。
このように、本実施例によれば、車載装置100にスマートフォン200を接続して音声対話型サービスを車内で利用するとき、車載装置100の音声認識モジュールを利用して音声の終了時点を正確に検出するようにしたので、スマートフォン200の音声入力待ち状態を正確なタイミングで自動的に解除することができる。その結果、ユーザーは、音声入力待ち状態を解除するため、ボタン操作等を行うような煩雑な作業から解放される。
図8は、車載装置の表示例を示す図である。表示部110には、「今、何時ですか?」というユーザーの発話400と、「15時30分です。」という応答メッセージ410とが時系列に表示される。本実施例では、スマートフォン200側の音声入力待ち状態が自動的に解除されるため、このような会話が滞ることなく、発話400と応答メッセージ410とが継続的に相互に繰り返される。
以上説明したように、本実施例によれば、スマートフォンに搭載された音声対話型サービス等の音声機能を車内で利用するとき、車載装置に搭載された音声認識モジュールによって検知された発話の終了時点に応答して、スマートフォンへの音声信号の転送を停止するようにしたので、スマートフォンは、より正確なタイミングで音声入力待ち状態を自動的に解除することができる。
上記実施例では、車載装置にスマートフォンを外部接続する例を説明したが、これに限らず、特定の使用環境で利用される電子装置にスマートフォン等の携帯端末が接続されたときに、当該電子装置に搭載された音声認識モジュールを利用して発話の終了時点を検知するようにしてもよい。この場合、電子装置の音声認識モジュールは、特定の使用環境に応じて発生する特有のノイズを除去する機能を備えている。
本発明は、上記実施例に限定されるものではなく、特許請求の範囲に記載された発明の要旨の範囲において、種々の変形・変更が可能である。
100:車載装置 110:表示部
120:スピーカ 130:マイクロフォン
144:音声認識モジュール 148A:BTモジュール
170:転送処理手段 172:音声入力部
174:音声信号抽出部 176:音声信号転送部
178:発話終了検知部 180:転送制御部
200:スマートフォン 210:公衆電話回線網
220:ネットワーク通信 252:音声信号取得部
254:音声認識部 256:発話内容解析部
258:応答作成部 400:発話
410:応答メッセージ
120:スピーカ 130:マイクロフォン
144:音声認識モジュール 148A:BTモジュール
170:転送処理手段 172:音声入力部
174:音声信号抽出部 176:音声信号転送部
178:発話終了検知部 180:転送制御部
200:スマートフォン 210:公衆電話回線網
220:ネットワーク通信 252:音声信号取得部
254:音声認識部 256:発話内容解析部
258:応答作成部 400:発話
410:応答メッセージ
Claims (9)
- 外部装置を接続可能な電子装置であって、
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声信号を外部装置に転送する転送手段と、
前記音声入力手段により入力された音声信号の発話の終了を検知する検知手段と、
前記検知手段により発話の終了が検知されたとき、前記外部装置への前記音声信号の転送を停止する制御手段と、
を有する、電子装置。 - 前記電子装置は車両に搭載され、
前記電子装置はさらに、前記音声入力手段により入力された音声信号の認識を行う音声認識手段を備え、
前記音声認識手段は、前記音声信号から少なくとも車両に特有のノイズ成分を除去する手段を含み、
前記検知手段は、前記ノイズ成分が除去された音声信号に基づき発話の終了を検知する、請求項1に記載の電子装置。 - 前記転送手段は、前記音声認識手段から受け取った音声信号を外部装置へ転送可能であり、前記制御手段は、前記検知手段により発話の終了が検知されたとき、前記音声認識手段による音声信号の出力を停止させる、請求項2に記載の電子装置。
- 前記制御手段は、前記検知手段により発話の終了が検知されたとき、前記転送手段による音声信号の出力を停止させる、請求項1に記載の電子装置。
- 前記制御手段は、前記検知手段により発話の終了が検知されたとき、前記音声入力手段による音声信号の入力を停止させる、請求項1に記載の電子装置。
- 前記音声入力手段は、ハンズフリー機能により音声を入力する、請求項1ないし5いずれか1つに記載の電子装置。
- 車載電子装置に入力された音声信号を外部装置へ転送する音声信号の転送方法であって、
車載電子装置に入力された音声信号からノイズ成分を除去するステップと、
ノイズが除去された音声信号に基づき発話の終了を検知するステップと、
発話の終了が検知されたことに応答して前記音声信号の前記外部装置への転送を停止するステップと、
を有する、音声信号の転送方法。 - 入力された音声信号を外部装置へ転送する機能を備えた車載電子装置が実行する音声信号の転送プログラムであって、
車載電子装置に入力された音声信号からノイズ成分を除去するステップと、
ノイズが除去された音声信号に基づき発話の終了を検知するステップと、
発話の終了が検知されたことに応答して前記音声信号の前記外部装置への転送を停止するステップと、
を有する音声信号の転送プログラム。 - 電子装置と、前記電子装置に接続されかつ音声対話機能を備えた外部装置とを含む、音声処理システムであって、
前記電子装置は、
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声信号を外部装置に転送する転送手段と、
前記音声入力手段により入力された音声信号の発話の終了を検知する検知手段と、
前記発話の終了が検知されたとき、前記外部装置への前記音声信号の転送を停止する制御手段とを有し、
前記外部装置は、
前記電子装置から転送された音声信号に基づき音声認識を行う音声認識手段を含む、音声処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128232A JP2015004703A (ja) | 2013-06-19 | 2013-06-19 | 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128232A JP2015004703A (ja) | 2013-06-19 | 2013-06-19 | 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015004703A true JP2015004703A (ja) | 2015-01-08 |
Family
ID=52300682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013128232A Pending JP2015004703A (ja) | 2013-06-19 | 2013-06-19 | 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015004703A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020514171A (ja) * | 2017-02-20 | 2020-05-21 | ジャーマン オート ラボズ ガル ゲーエムベーハーGerman Auto Labs Gal Gmbh | 自動車運転者の支援のための方法及び装置 |
US10755731B2 (en) | 2016-09-08 | 2020-08-25 | Fujitsu Limited | Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection |
-
2013
- 2013-06-19 JP JP2013128232A patent/JP2015004703A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10755731B2 (en) | 2016-09-08 | 2020-08-25 | Fujitsu Limited | Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection |
JP2020514171A (ja) * | 2017-02-20 | 2020-05-21 | ジャーマン オート ラボズ ガル ゲーエムベーハーGerman Auto Labs Gal Gmbh | 自動車運転者の支援のための方法及び装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9978369B2 (en) | Method and apparatus for voice control of a mobile device | |
US11676601B2 (en) | Voice assistant tracking and activation | |
KR101907406B1 (ko) | 통신 서비스 운용 방법 및 시스템 | |
JP5273215B2 (ja) | 近距離無線通信装置 | |
JP2015130554A (ja) | 音声処理装置、音声処理システム、音声処理方法、音声処理プログラム | |
CN106954115B (zh) | 一种设备控制方法及装置 | |
CN103617795A (zh) | 一种车载语音识别控制方法及系统 | |
CN104104789A (zh) | 语音接听方法与移动终端装置 | |
US20080254746A1 (en) | Voice-enabled hands-free telephone system for audibly announcing vehicle component information to vehicle users in response to spoken requests from the users | |
US9147396B2 (en) | Voice recognition device and voice recognition method | |
US20130072237A1 (en) | Voice controlled cell phone | |
CN110049193A (zh) | 基于车载hud和方向盘蓝牙控制的微信消息回复装置 | |
EP3502864A1 (en) | Information processing device, information processing method, and program | |
KR20170085761A (ko) | 차량용 음성 인식 제어 장치 및 그 방법 | |
US11355135B1 (en) | Phone stand using a plurality of microphones | |
JP2015004703A (ja) | 電子装置、音声信号の転送方法、音声信号の転送プログラム及び音声処理システム | |
CN105227777A (zh) | 接听方法及语音通信装置 | |
US20110183725A1 (en) | Hands-Free Text Messaging | |
EP3686884B1 (en) | Method for voice control of a mobile device | |
KR20120009189A (ko) | 차량 상태 표시 시스템 및 그의 이동 단말기 상태 표시 방법 | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
KR20150053276A (ko) | 이동통신단말기와 차량 헤드유닛이 연계된 음성 처리 방법과 그 시스템 | |
JP6910721B2 (ja) | 電子装置および情報端末システム | |
CN110611524A (zh) | 蓝牙数据信息传输方法及装置 | |
US20190214006A1 (en) | Communication system, communication method, and computer-readable storage medium |