JP2009300537A

JP2009300537A - 音声作動システム、音声作動方法および車載装置

Info

Publication number: JP2009300537A
Application number: JP2008152227A
Authority: JP
Inventors: Isao Tanaka; 勲田中
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 2008-06-10
Filing date: 2008-06-10
Publication date: 2009-12-24

Abstract

【課題】車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させること。
【解決手段】端末装置の音声認識部が、音声を認識し、端末装置の認識結果送信部が、認識結果を車載装置へ向けて送信し、車載装置の作動制御部が、端末装置から送信された認識結果に基づいて自装置を作動制御するように音声作動システムを構成する。また、携帯端末装置を特定の利用者が利用する場合に、携帯端末装置の学習処理部が、特定の利用者の音声特性を学習し、音声抽出処理部が、学習結果に基づき、入力された音の中から特定の利用者に係る音声を抽出するように構成する。
【選択図】図２

Description

この発明は、端末装置および前記端末装置と通信する車載装置を備え、端末装置と車載装置を用いて車載装置を音声に基づいて作動させる音声作動システム、音声作動方法および車載装置に関し、特に、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システム、音声作動方法および車載装置に関するものである。

近年、自動車には、音楽や映像の視聴、ナビゲーション情報の表示などを行うことができる車載装置が搭載されることが一般的となってきている。また、このような車載装置の中には、利用者の音声を認識して操作コマンド等へ変換を行う音声認識機能を有するものも登場してきている。

また、車載装置に対して電子機器を無線接続し、車載装置と電子機器とを連動させることも行われている。このような無線接続を行う場合、Ｂｌｕｅｔｏｏｔｈ（登録商標）と呼ばれる無線通信規格が用いられることが多い。ここで、Ｂｌｕｅｔｏｏｔｈ（登録商標）とは、２．４ＧＨｚの周波数帯を用いる無線通信規格であり、半径数十メートル範囲内の無線通信が可能である。

たとえば、特許文献１には、車載装置に対してＢｌｕｅｔｏｏｔｈ（登録商標）を用いてマイクを無線接続し、このマイクから入力された音声を車載装置で音声認識することによって、車載装置を音声作動させる技術が開示されている。

特開２００１−２３９８９７号公報

しかしながら、特許文献１の技術は、車載装置側で音声認識処理を行うため、車載装置の処理負荷が高くなり、車載装置の作動が遅延するという問題があった。特に、車載装置が、ナビゲーション機能や、オーディオ機能といった複数の機能を有する場合、音声認識処理に伴う処理負荷が、その他の機能へ及ぼす影響は大きくなる。

なお、車載装置に複数のＣＰＵ（Central Processing Unit）を搭載するなどして、音声認識処理とその他の処理とを並行処理することも考えられるが、車載装置全体としての処理量に変わりはないうえ、車載装置の製造コストが上がるため好ましくない。

これらのことから、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システムあるいは音声作動方法をいかにして実現するかが大きな課題となっている。

この発明は、上述した従来技術による問題点を解消するためになされたものであり、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システム、音声作動方法および車載装置を提供することを目的とする。

上述した課題を解決し、目的を達成するため、本発明は、端末装置および前記端末装置と通信する車載装置を備え、前記端末装置と前記車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動システムであって、前記端末装置は、前記音声を認識する音声認識手段と、前記音声認識手段による認識結果を送信する認識結果送信手段とを備え、前記車載装置は、前記端末装置の前記認識結果送信手段によって送信された前記認識結果に基づいて自装置を作動制御する作動制御手段を備えたことを特徴とする。

また、本発明は、端末装置および前記端末装置と通信する車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動方法であって、前記端末装置が前記音声を認識する音声認識工程と、前記端末装置が前記音声認識工程による認識結果を送信する認識結果送信工程と、前記車載装置が前記端末装置の前記認識結果送信工程によって送信された前記認識結果に基づいて自装置を作動制御する作動制御工程とを含んだことを特徴とする。

また、本発明は、端末装置と通信し、音声に基づいて作動する車載装置であって、前記音声の認識結果を前記端末装置から受信し、受信した前記認識結果に基づいて自装置を作動制御する作動制御手段を備えたことを特徴とする。

本発明によれば、端末装置が音声を認識し、端末装置が認識結果を送信し、車載装置が端末装置から送信された認識結果に基づいて自装置を作動制御することとしたので、端末装置側で音声認識処理を行うことで、車載装置側に過度な処理負荷をかけることなく車載装置を音声作動させることができるという効果を奏する。

以下に添付図面を参照して、この発明に係る音声作動システムおよび音声作動方法の好適な実施例を詳細に説明する。なお、以下では、携帯電話などの携帯端末装置１０と、ナビゲーション機能やオーディオ・ビジュアル機能を備えた車載装置２０とで、音声作動システム１を構成する場合について説明するが、携帯端末装置１０としてＰＤＡ（Personal Digital Assistant）やノートブックパソコンといった携帯可能な端末装置を用いることとしてもよい。

また、以下では、実施例１として携帯端末装置１０自体が音声認識処理を行う場合について、実施例２として携帯端末装置１０が外部装置である音声認識サーバ装置３０に対して音声認識処理を依頼する場合について、それぞれ説明する。

まず、実施例１に係る音声作動システム１の概要について図１を用いて説明する。図１は、実施例１に係る音声作動システムの概要を示す図である。なお、同図では、利用者が「目的地」などの操作用コマンドを携帯端末装置１０のマイクへ向けて発声し、車載装置２０が作動を完了した場合には、携帯端末装置１０のスピーカーから作動完了を示すメッセージ（同図では、「「目的値」検索モードへ変更しました」）を再生する場合について示している。

同図に示すように、利用者が、携帯端末装置１０に対して操作用コマンドを発声すると、携帯端末装置１０は、音声認識処理を実行する（同図の（１）参照）。そして、音声認識処理における認識結果を車載装置２０へ向けて送信する（同図の（２）参照）。ここで、認識結果は、たとえば、テキスト形式のデータである。

携帯端末装置１０から認識結果を受信した車載装置２０は、受信した認識結果に基づく作動制御を行い（同図の（３）参照）、作動結果を携帯端末装置１０へ向けて送信する（同図の（４）参照）。ここで、作動結果は、たとえば、テキスト形式のデータである。なお、作動結果として音声データを用いることとしてもよい。

つづいて、車載装置２０から作動結果を受信した携帯端末装置１０は、受信した作動結果を音声へ変換してスピーカーから出力する。なお、車載装置２０が作動結果として音声データを応答する場合には、携帯端末装置１０は、この音声データを再生してスピーカーから出力することになる。

このように、実施例１に係る音声作動システム１では、車載装置２０ではなく携帯端末装置１０が、音声認識処理を行うこととしたので、車載装置２０の処理負荷を軽減することができる。また、携帯端末装置１０が音声認識処理を行うことで、携帯端末装置１０を利用する利用者の声質を学習し、学習結果に基づく音声認識処理が可能となり、音声認識精度を向上させることが可能となる。なお、かかる学習処理については、図５等を用いて後述する。

次に、実施例１に係る音声作動システム１の構成について図２を用いて説明する。図２は、実施例１に係る音声作動システム１の構成を示すブロック図である。同図に示すように、音声作動システム１は、利用者が携帯する携帯電話などの携帯端末装置１０と、車両に搭載された車載装置２０とから構成される。

まず、携帯端末装置１０の構成について説明する。携帯端末装置１０は、利用者の音声を入力するマイク１１と、音声メッセージを再生するスピーカー１２と、Ｂｌｕｅｔｏｏｔｈ（登録商標）による通信（走行データ、ナビ情報、楽曲情報、楽曲データ等）を行うＢＴ（ブルートゥース）通信部１３と、音声認識処理等を行う制御部１４とを備えている。また、制御部１４は、音声認識部１４ａと、認識結果送信部１４ｂと、作動結果受信部１４ｃと、音声合成部１４ｄとをさらに備えている。

マイク１１は、利用者によって入力された音声波形を制御部１４の音声認識部１４ａへ渡す処理を行う。また、スピーカー１２は、制御部１４の音声合成部１４ｄから受け取った音声データ等を再生する。また、ＢＴ通信部１３は、車載装置２０との間で通信リンク確立のためのペアリング処理を実行したうえで、通信リンク確立後は、携帯端末装置１０／車載装置２０間のデータ送受信を行うデバイスである。

制御部１４は、マイク１１から受け取った音声波形について音声認識処理を行い、音声認識処理の認識結果を車載装置２０へ送信する制御を行うとともに、車載装置２０から受け取った作動結果を音声へ変換してスピーカー１２へ出力する制御を行う。なお、この制御部１４は、基板上に回路として構成してもよいし、コンピュータプログラムとして構成してもよい。

音声認識部１４ａは、マイク１１から受け取った音声波形について音声認識処理を行い、認識結果を認識結果送信部１４ｃへ渡す処理を行う処理部である。たとえば、この音声認識部１４ａは、「目的地」と発声された音声波形を、「モクテキチ」というテキストデータへ変換する。なお、この音声認識部１４ａが受け付ける操作コマンドを図示しないメモリ等へ記憶しておき、メモリ上の操作コマンドと一致する認識結果のみを認識結果送信部１４ｂへ出力したり、メモリ上の操作コマンドと一致した認識結果を、たとえば、数字やアルファベットからなる識別子へ変換して認識結果送信部１４ｂへ出力したりすることとしてもよい。

認識結果送信部１４ｂは、音声認識部１４ａから受け取った認識結果をＢＴ通信部１３経由で車載装置２０へ向けて送信する処理を行う処理部である。また、作動結果受信部１４ｃは、ＢＴ通信部１３経由で車載装置２０から受け取った作動結果を音声合成部１４ｄへ出力する処理を行う処理部である。ここで、作動結果は、たとえば、「モクテキチケンサクモードヘヘンコウシマシタ」等のテキスト形式のデータである。

音声合成部１４ｄは、作動結果受信部１４ｃから受け取った作動結果を、音声データへ変換し、変換後の音声データをスピーカー１２に対して出力する処理を行う処理部である。なお、車載装置２０から作動結果として音声データを受け取るように構成する場合には、この音声合成部１４ｄは、音声データを再生する機能のみを備えることとすればよい。

次に、車載装置２０の構成について説明する。なお、同図には、本実施例１に係る音声作動システムの特徴を説明するために必要な構成要素のみを示しており、ナビゲーション機能、オーディオ機能、ビジュアル機能等に関する記載は省略している。同図に示すように、車載装置２０は、ＢＴ通信部２１と、制御部２２とを備えており、制御部２２は、作動制御部２２ａと、作動結果送信部２２ｂとをさらに備えている。

ＢＴ（ブルートゥース）通信部２１は、携帯端末装置１０との間で通信リンク確立のためのペアリング処理を実行したうえで、通信リンク確立後は、携帯端末装置１０／車載装置２０間のデータ送受信を行うデバイスである。

制御部２０は、携帯端末装置１０から受け取ったテキスト形式の認識結果（音声認識結果）に基づいて自装置を作動制御するとともに、作動結果を携帯端末装置１０に対して送信する制御を行う処理部である。作動制御部２２ａは、ＢＴ通信部２１経由で携帯端末装置１０から認識結果（音声認識結果）を受け取り、受け取った認識結果に基づいて自装置を作動させる処理を行う。たとえば、この作動制御部２２ａは、ナビゲーション機能における検索モードについて、携帯端末装置１０から「モクテキチ」との認識結果を受け取った場合には、検索モードを目的地検索モードへと変更する。

作動結果送信部２２ｂは、作動制御部２２ａによる作動制御の結果をＢＴ通信部２１経由で携帯端末装置１０へ送信する処理を行う処理部である。たとえば、この作動結果送信部２２ｂは、作動制御部２２ａが、ナビゲーション機能における検索モードを目的地検索モードへと変更した場合には、「モクテキチケンサクモードヘヘンコウシマシタ」等のテキスト形式のデータを携帯端末装置１０へ向けて送信する。

なお、本実施例１では、テキスト形式の作動結果を送信する場合について説明するが、テキスト形式の作動結果を音声データへ変換したり、テキスト形式の作動結果に合致する音声データを検索したりしたうえで、携帯端末装置１０へ送信することとしてもよい。また、本実施例１では、携帯端末装置１０が作動結果を再生する場合について説明するが、車載装置２０と接続された図示しないスピーカーで作動結果を再生することとしてもよい。

次に、図２に示した音声作動システム１における各装置間の初期処理について図３を用いて説明する。図３は、音声作動システム１における初期処理の処理手順を示すフローチャートである。なお、同図のステップＳ１０１に示す「音声認識アプリ」は、図２に示した制御部１４に対応するコンピュータプログラムである。

同図に示すように、携帯端末装置１０は、音声認識アプリを起動し（ステップＳ１０１）、車載装置２０との間でペアリング処理を実行する（ステップＳ１０２）。一方、車載装置２０も、携帯端末装置１０との間でペアリング処理を実行し（ステップＳ１０３）、ペアリングが完了したならば、音声入力を促すメッセージを携帯端末装置１０へ送信して初期処理を終了する（ステップＳ１０４）。また、ペアリングが完了した携帯端末装置１０は、車載装置２０から受け取った音声入力を促すメッセージを再生して（ステップＳ１０５）初期処理を終了する。

なお、同図では、携帯端末装置１０における音声認識アプリの起動を起点として携帯端末装置１０／車載装置２０間のペアリングを開始する場合について示した。しかしながら、これに限らず、まず、携帯端末装置１０／車載装置２０間のペアリングを実行し、ペアリング完了後に、携帯端末装置１０または車載装置２０のいずれかが音声認識アプリの起動を指示することとしてもよい。

次に、図２に示した音声作動システム１における各装置間の通常処理について図４を用いて説明する。図４は、音声作動システム１における通常処理の処理手順を示すフローチャートである。なお、図４に示す通常処理は、図３に示した初期処理の完了後に各装置において実行される。

同図に示すように、携帯端末装置１０で利用者による音声入力が行われると（ステップＳ２０１）、音声認識部１４ａは、音声認識処理を実行する（ステップＳ２０２）。つづいて、認識結果送信部１４ｂは、認識結果（音声認識結果）を車載装置２０へ向けて送信する（ステップＳ２０３）。

認識結果を受け取った車載装置２０では、作動制御部２２ａが、受け取った認識結果に基づいて作動制御を実行し（ステップＳ２０４）、作動結果送信部２２ｂは、作動結果を携帯端末装置１０へ向けて送信する（ステップＳ２０５）。つづいて、作動結果を受け取った携帯端末装置１０では、音声合成部１４ｄが、作動結果を再生し（ステップＳ２０６）、ステップＳ２０１以降の処理を繰り返す。なお、ステップＳ２０３において、携帯端末装置１０側で認識結果から車載装置２０の作動制御用コマンドを作成して車載装置２０へ送信し、車載装置１０は、受信した作動制御用コマンドに基づいて動作することとしてもよい。

次に、図２に示した音声認識部１４ａの変形例について図５を用いて説明する。図５は、音声認識部１４ａの変形例を示すブロック図である。なお、同図では、変形例として利用者の声質を学習する機能を備えた音声認識部１５を示している。また、同図では、マイク１１以外の各構成要件の記載を省略しているが、図４に示していない各構成要件については、図２と同様である。

同図に示すように、音声認識部１５は、学習処理部１５ａと、音声抽出処理部１５ｂと、音声認識処理部１５ｃとをさらに備えている。学習処理部１５ａは、日常的に携帯端末装置１０を利用する特定の利用者の声質を分析して図示しないメモリ等に記憶し、携帯端末装置１０に対応する特定の利用者の声を他の利用者やノイズと区別するための情報を、音声抽出処理部１５ｂへ提供する処理を行う処理部である。

音声抽出処理部１５ｂは、学習処理部１５ａから提供された情報に基づき、マイク１１から受け取った音声信号の中から、携帯端末装置１０に対応する特定の利用者の声に対応する音声信号を抽出する処理を行う処理部である。また、音声認識処理部１５ｃは、音声抽出処理部１５ｂによって抽出された音声信号について図２に示した音声認識部１４ａと同様の音声認識処理を行う処理部である。なお、音声認識処理部１５ｃによる認識結果は、認識結果送信部１４ｂ（図２参照）へ出力される。

次に、音声認識部１４ａの代わりに図５に示した音声認識部１５を備えた携帯端末装置１０を用いた場合における各装置間の通常処理について図６を用いて説明する。図６は、図５に示した音声認識部１５を用いた音声作動システム１における通常処理の処理手順を示すフローチャートである。同図に示すように、携帯端末装置１０は、学習処理部１５ａによって生成された学習結果を、図示しないメモリ等から読み出し（ステップＳ３０１）、利用者による音声入力が行われたならば（ステップＳ３０２）、音声抽出処理部１５ｂは、学習結果に基づく音声抽出を行う（ステップＳ３０３）。

そして、音声認識処理部１５ｃは、音声認識処理を実行し（ステップＳ３０４）、認識結果送信部１４ｂは、認識結果（音声認識結果）を車載装置２０へ向けて送信する（ステップＳ３０５）。認識結果を受け取った車載装置２０では、作動制御部２２ａが、受け取った認識結果に基づいて作動制御を実行し（ステップＳ３０６）、作動結果送信部２２ｂは、作動結果を携帯端末装置１０へ向けて送信する（ステップＳ３０７）。

つづいて、作動結果を受け取った携帯端末装置１０では、音声合成部１４ｄが、作動結果を再生し（ステップＳ３０８）、ステップＳ３０２以降の処理を繰り返す。このように、携帯端末装置１０に対応する利用者の声質を学習し、入力された音声波形の中から学習結果に対応する音声波形を抽出することで、マイク１１から入力される他人の話し声や、雑音、音楽等の影響を排除しつつ、高精度な音声認識を行うことが可能となる。

上述してきたように、本実施例１では、端末装置の音声認識部が、音声波形を認識し、端末装置の認識結果送信部が、認識結果を車載装置へ向けて送信し、車載装置の作動制御部が、端末装置から送信された認識結果に基づいて自装置を作動制御することとしたので、車載装置側ではなく端末装置側で音声認識処理を行うことで、車載装置側に過度な処理負荷をかけることなく車載装置を音声作動させることができる。

また、携帯電話などの携帯端末装置を用いることで、マイクを車内に固定する必要がなく、車内のあらゆる場所から音声コマンドを入力することができる。たとえば、運転席のみならず、後部座席からも音声コマンドの入力が可能となる。

また、本実施例１では、携帯端末装置を特定の利用者が利用する場合に、携帯端末装置の学習処理部が、特定の利用者の音声特性を学習し、音声抽出処理部が、学習結果に基づき、入力された音の中から特定の利用者に係る音声波形を抽出することとしたので、音声認識の精度を向上させることができる。

ところで、上述した実施例１では、携帯端末装置自身が音声認識処理を実行する場合について示したが、音声認識処理を外部装置へ依頼することとしてもよい。そこで、以下に示す実施例２では、携帯端末装置が外部装置である音声認識サーバ装置へ音声認識処理を依頼する場合について説明することとする。

図７は、実施例２に係る音声作動システム１ａの構成を示すブロック図である。同図に示すように、音声作動システム１ａは、携帯端末装置１０ａと、車載装置２０と、音声認識サーバ装置３０とから構成される。ここで、車載装置２０に含まれる各構成要素は図２と同様であるため記載を省略している。また、音声認識サーバ装置３０は、図２に示した携帯端末装置１０の音声認識部１４ａと同様の音声認識処理部および同図に示す携帯端末装置１０ａの通信部１６と同様の通信部を備えているものとする。なお、以下では、実施例１に係る音声作動システム１と同様の構成については、説明を省略するか簡単な説明にとどめることとする。

同図に示すように、携帯端末装置１４は、図２に示した音声認識部１４ａ（図７の破線矩形を参照）の代わりに、音声送信部１４ａａおよび認識結果受信部１４ａｂを備えており、また、音声認識サーバ装置３０と通信するための通信部１６を備えている。

音声送信部１４ａａは、マイク１１から入力された音声波形を通信部１６経由で音声認識サーバ装置３０へ向けて送信する処理を行う処理部である。なお、この音声送信部１４ａａは、入力された音声波形を所定の時間にわたってバッファリングしたうえで音声認識サーバ装置３０へ送信することとしてもよいし、入力された音声波形を随時、音声認識サーバ装置３０へ送信することとしてもよい。

認識結果受信部１４ａｂは、音声認識サーバ装置３０による音声認識結果を通信部１６経由で受け取り、受け取った認識結果（音声認識結果）を認識結果送信部１４ｂへ出力する処理を行う処理部である。また、通信部１６は、基地局等と無線通信するための通信デバイスであり、携帯端末装置１０ａ／音声認識サーバ装置３０間のデータ通信を行う。

音声認識サーバ装置３０は、基地局内またはインターネット等のネットワーク上に設けられ、携帯端末装置１０ａから受け取った音声波形について音声認識処理を実行し、認識結果をテキスト形式データ等で応答する処理を行う装置である。

次に、実施例２に係る音声作動システム１ａの処理手順について図８を用いて説明する。図８は、実施例２に係る音声作動システム１ａの処理手順を示すフローチャートである。同図に示すように、携帯端末装置１０ａへ、マイク１１経由で音声入力がなされると（ステップＳ４０１）、音声送信部１４ａａは、入力された音声波形を音声認識サーバ装置３０へ向けて送信する（ステップＳ４０２）。

かかる音声波形を受信した音声認識サーバ装置３０は、音声認識処理を実行し（ステップＳ４０３）、認識結果（音声認識結果）を携帯端末装置１０ａへ向けて送信する（ステップＳ４０４）。そして、携帯端末装置１０ａの認識結果受信部１４ａｂは、音声認識サーバ装置３０から受け取った認識結果を認識結果送信部１４ｂへ出力して（ステップＳ４０５）処理を終了する。なお、ステップＳ４０５につづいて、携帯端末装置１０ａ／車載装置２０間の通信が行われることになる。

次に、実施例２に係る音声作動システム１ａが、図５を用いて説明した学習機能（学習処理部１５ａおよび音声抽出処理部１５ｂ）をさらに備えている場合について、図９を用いて説明する。図９は、図５に示した音声認識部１５を用いた実施例２に係る音声作動システム１ａの処理手順を示すフローチャートである。

同図に示すように、携帯端末装置１０ａは、学習処理部１５ａによって生成された学習結果を、図示しないメモリ等から読み出し（ステップＳ５０１）、利用者による音声入力が行われたならば（ステップＳ５０２）、音声抽出処理部１５ｂは、学習結果に基づく音声抽出を行う（ステップＳ５０３）。

そして、音声送信部１４ａａは、ステップＳ５０３において抽出した音声波形を音声認識サーバ装置３０に対して送信する（ステップＳ５０４）。かかる音声波形を受信した音声認識サーバ装置３０は、音声認識処理を実行し（ステップＳ５０５）、認識結果（音声認識結果）を携帯端末装置１０ａへ送信する（ステップＳ５０６）。

つづいて、音声認識サーバ装置３０から認識結果を受信した携帯端末装置１０ａの認識結果受信部１４ａｂは、認識結果を認識結果送信部１４ｂへ出力して（ステップＳ５０７）処理を終了する。なお、ステップＳ５０７につづいて、携帯端末装置１０ａ／車載装置２０間の通信が行われることになる。

このように、本実施例２では、携帯端末装置の音声送信部が、音声波形を音声認識サーバ装置へ送信し、認識結果受信部が、音声認識サーバ装置から認識結果を受信することとしたので、携帯端末装置とネットワーク接続された音声認識サーバ装置が、音声認識処理を実行することによって、携帯端末装置の処理負荷を低減することができるとともに、携帯端末装置が音声認識機能を備えていない場合であっても、音声コマンドの生成が可能となる。

ところで、上述した各実施例では、１台の携帯端末装置を用いる場合について説明したが、車載装置と無線接続する携帯端末装置の数に特に制限はない。また、Ｂｌｕｅｔｏｏｔｈ（登録商標）を用いた通信では、車載装置側で、自装置に接続された各携帯端末装置の識別子を管理することができる。

そこで、かかる管理機能を利用し、たとえば、ドライバーとして登録された携帯端末装置から入力可能な音声コマンドを特定のコマンドのみに制限したり、ドライバー以外の乗車者として登録された携帯端末装置からは、すべての音声コマンドを入力可能としたり、することとしてもよい。

この場合、車載装置は、各携帯端末装置に対して許容する音声コマンドの種別を含んだ許容情報を記憶し、携帯端末装置から受け取った認識結果が許容情報において許容された種別である場合に、かかる音声コマンドに対応する作動制御を実行することになる。

また、車載装置から入手した車両走行データあるいは携帯端末装置に備わるＧＰＳ機能に基づき、走行中であるか停車中であるかを認識し、走行中には制限すべきコマンドを停車中に送信するといった送信タイミング調整を携帯端末装置に行わせることとしてもよい。

以上のように、本発明に係る音声作動システムおよび音声作動方法は、車両内における音声作動制御に適している。また、本発明に係る音声作動システムおよび音声作動方法を室内や屋外に設置された通信機器の音声作動制御に適用することもできる。

実施例１に係る音声作動システムの概要を示す図である。実施例１に係る音声作動システムの構成を示すブロック図である。音声作動システムにおける初期処理の処理手順を示すフローチャートである。音声作動システムにおける通常処理の処理手順を示すフローチャートである。音声認識部の変形例を示すブロック図である。図５に示した音声認識部を用いた音声作動システムにおける通常処理の処理手順を示すフローチャートである。実施例２に係る音声作動システムの構成を示すブロック図である。実施例２に係る音声作動システムの処理手順を示すフローチャートである。図５に示した音声認識部を用いた実施例２に係る音声作動システムの処理手順を示すフローチャートである。

符号の説明

１、１ａ音声作動システム
１０、１０ａ携帯端末装置
１１マイク
１２スピーカー
１３ＢＴ通信部
１４制御部
１４ａ音声認識部
１４ａａ音声送信部
１４ａｂ認識結果受信部
１４ｂ認識結果送信部
１４ｃ作動結果受信部
１４ｄ音声合成部
１５音声認識部
１５ａ学習処理部
１５ｂ音声抽出処理部
１５ｃ音声認識処理部
１６通信部
２０車載装置
２１ＢＴ通信部
２２制御部
２２ａ作動制御部
２２ｂ作動結果送信部
３０音声認識サーバ装置

Claims

端末装置および前記端末装置と通信する車載装置を備え、前記端末装置と前記車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動システムであって、
前記端末装置は、
前記音声を認識する音声認識手段と、
前記音声認識手段による認識結果を送信する認識結果送信手段と
を備え、
前記車載装置は、
前記端末装置の前記認識結果送信手段によって送信された前記認識結果に基づいて自装置を作動制御する作動制御手段
を備えたことを特徴とする音声作動システム。
前記端末装置は、
特定の利用者が使用する携帯端末装置であって、
前記音声認識手段は、
前記特定の利用者の音声特性を学習する学習手段と、
前記学習手段による学習結果に基づき、入力された音の中から前記特定の利用者に係る前記音声を抽出する音声抽出手段と
をさらに備えたことを特徴とする請求項１に記載の音声作動システム。
前記音声認識手段は、
前記音声を音声認識サーバ装置へ送信する送信手段と、
前記音声認識サーバ装置から前記認識結果を受信する認識結果受信手段と
をさらに備えたことを特徴とする請求項１または２に記載の音声作動システム。
前記車載装置は、
前記作動制御手段による前記作動制御の結果である作動結果を送信する作動結果送信手段
をさらに備え、
前記端末装置は、
前記作動結果送信手段によって送信された前記作動結果を音声へ変換する音声変換手段
をさらに備えたことを特徴とする請求項１、２または３に記載の音声作動システム。
前記車載装置は、
前記作動制御手段による前記作動制御の結果である作動結果を音声へ変換する音声変換手段と、
前記音声変換手段によって変換された前記音声を出力する音声出力手段と
をさらに備えたことを特徴とする請求項１、２または３に記載の音声作動システム。
前記車載装置は、
各前記端末装置に対して許容する前記作動制御の種別を含んだ許容情報を記憶する許容情報記憶手段
をさらに備え、
前記作動制御手段は、
前記認識結果が前記許容情報において許容された前記種別である場合に前記作動制御を実行することを特徴とする請求項１〜５のいずれか一つに記載の音声作動システム。
端末装置および前記端末装置と通信する車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動方法であって、
前記端末装置が前記音声を認識する音声認識工程と、
前記端末装置が前記音声認識工程による認識結果を送信する認識結果送信工程と、
前記車載装置が前記端末装置の前記認識結果送信工程によって送信された前記認識結果に基づいて自装置を作動制御する作動制御工程と
を含んだことを特徴とする音声作動方法。
端末装置と通信し、音声に基づいて作動する車載装置であって、
前記音声の認識結果を前記端末装置から受信し、受信した前記認識結果に基づいて自装置を作動制御する作動制御手段
を備えたことを特徴とする車載装置。