JP2009300537A - 音声作動システム、音声作動方法および車載装置 - Google Patents

音声作動システム、音声作動方法および車載装置 Download PDF

Info

Publication number
JP2009300537A
JP2009300537A JP2008152227A JP2008152227A JP2009300537A JP 2009300537 A JP2009300537 A JP 2009300537A JP 2008152227 A JP2008152227 A JP 2008152227A JP 2008152227 A JP2008152227 A JP 2008152227A JP 2009300537 A JP2009300537 A JP 2009300537A
Authority
JP
Japan
Prior art keywords
voice
terminal device
recognition
vehicle
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008152227A
Other languages
English (en)
Inventor
Isao Tanaka
勲 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2008152227A priority Critical patent/JP2009300537A/ja
Publication of JP2009300537A publication Critical patent/JP2009300537A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させること。
【解決手段】端末装置の音声認識部が、音声を認識し、端末装置の認識結果送信部が、認識結果を車載装置へ向けて送信し、車載装置の作動制御部が、端末装置から送信された認識結果に基づいて自装置を作動制御するように音声作動システムを構成する。また、携帯端末装置を特定の利用者が利用する場合に、携帯端末装置の学習処理部が、特定の利用者の音声特性を学習し、音声抽出処理部が、学習結果に基づき、入力された音の中から特定の利用者に係る音声を抽出するように構成する。
【選択図】 図2

Description

この発明は、端末装置および前記端末装置と通信する車載装置を備え、端末装置と車載装置を用いて車載装置を音声に基づいて作動させる音声作動システム、音声作動方法および車載装置に関し、特に、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システム、音声作動方法および車載装置に関するものである。
近年、自動車には、音楽や映像の視聴、ナビゲーション情報の表示などを行うことができる車載装置が搭載されることが一般的となってきている。また、このような車載装置の中には、利用者の音声を認識して操作コマンド等へ変換を行う音声認識機能を有するものも登場してきている。
また、車載装置に対して電子機器を無線接続し、車載装置と電子機器とを連動させることも行われている。このような無線接続を行う場合、Bluetooth(登録商標)と呼ばれる無線通信規格が用いられることが多い。ここで、Bluetooth(登録商標)とは、2.4GHzの周波数帯を用いる無線通信規格であり、半径数十メートル範囲内の無線通信が可能である。
たとえば、特許文献1には、車載装置に対してBluetooth(登録商標)を用いてマイクを無線接続し、このマイクから入力された音声を車載装置で音声認識することによって、車載装置を音声作動させる技術が開示されている。
特開2001−239897号公報
しかしながら、特許文献1の技術は、車載装置側で音声認識処理を行うため、車載装置の処理負荷が高くなり、車載装置の作動が遅延するという問題があった。特に、車載装置が、ナビゲーション機能や、オーディオ機能といった複数の機能を有する場合、音声認識処理に伴う処理負荷が、その他の機能へ及ぼす影響は大きくなる。
なお、車載装置に複数のCPU(Central Processing Unit)を搭載するなどして、音声認識処理とその他の処理とを並行処理することも考えられるが、車載装置全体としての処理量に変わりはないうえ、車載装置の製造コストが上がるため好ましくない。
これらのことから、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システムあるいは音声作動方法をいかにして実現するかが大きな課題となっている。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、車載装置に対して過度な処理負荷をかけることなく車載装置を音声作動させることができる音声作動システム、音声作動方法および車載装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、端末装置および前記端末装置と通信する車載装置を備え、前記端末装置と前記車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動システムであって、前記端末装置は、前記音声を認識する音声認識手段と、前記音声認識手段による認識結果を送信する認識結果送信手段とを備え、前記車載装置は、前記端末装置の前記認識結果送信手段によって送信された前記認識結果に基づいて自装置を作動制御する作動制御手段を備えたことを特徴とする。
また、本発明は、端末装置および前記端末装置と通信する車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動方法であって、前記端末装置が前記音声を認識する音声認識工程と、前記端末装置が前記音声認識工程による認識結果を送信する認識結果送信工程と、前記車載装置が前記端末装置の前記認識結果送信工程によって送信された前記認識結果に基づいて自装置を作動制御する作動制御工程とを含んだことを特徴とする。
また、本発明は、端末装置と通信し、音声に基づいて作動する車載装置であって、前記音声の認識結果を前記端末装置から受信し、受信した前記認識結果に基づいて自装置を作動制御する作動制御手段を備えたことを特徴とする。
本発明によれば、端末装置が音声を認識し、端末装置が認識結果を送信し、車載装置が端末装置から送信された認識結果に基づいて自装置を作動制御することとしたので、端末装置側で音声認識処理を行うことで、車載装置側に過度な処理負荷をかけることなく車載装置を音声作動させることができるという効果を奏する。
以下に添付図面を参照して、この発明に係る音声作動システムおよび音声作動方法の好適な実施例を詳細に説明する。なお、以下では、携帯電話などの携帯端末装置10と、ナビゲーション機能やオーディオ・ビジュアル機能を備えた車載装置20とで、音声作動システム1を構成する場合について説明するが、携帯端末装置10としてPDA(Personal Digital Assistant)やノートブックパソコンといった携帯可能な端末装置を用いることとしてもよい。
また、以下では、実施例1として携帯端末装置10自体が音声認識処理を行う場合について、実施例2として携帯端末装置10が外部装置である音声認識サーバ装置30に対して音声認識処理を依頼する場合について、それぞれ説明する。
まず、実施例1に係る音声作動システム1の概要について図1を用いて説明する。図1は、実施例1に係る音声作動システムの概要を示す図である。なお、同図では、利用者が「目的地」などの操作用コマンドを携帯端末装置10のマイクへ向けて発声し、車載装置20が作動を完了した場合には、携帯端末装置10のスピーカーから作動完了を示すメッセージ(同図では、「「目的値」検索モードへ変更しました」)を再生する場合について示している。
同図に示すように、利用者が、携帯端末装置10に対して操作用コマンドを発声すると、携帯端末装置10は、音声認識処理を実行する(同図の(1)参照)。そして、音声認識処理における認識結果を車載装置20へ向けて送信する(同図の(2)参照)。ここで、認識結果は、たとえば、テキスト形式のデータである。
携帯端末装置10から認識結果を受信した車載装置20は、受信した認識結果に基づく作動制御を行い(同図の(3)参照)、作動結果を携帯端末装置10へ向けて送信する(同図の(4)参照)。ここで、作動結果は、たとえば、テキスト形式のデータである。なお、作動結果として音声データを用いることとしてもよい。
つづいて、車載装置20から作動結果を受信した携帯端末装置10は、受信した作動結果を音声へ変換してスピーカーから出力する。なお、車載装置20が作動結果として音声データを応答する場合には、携帯端末装置10は、この音声データを再生してスピーカーから出力することになる。
このように、実施例1に係る音声作動システム1では、車載装置20ではなく携帯端末装置10が、音声認識処理を行うこととしたので、車載装置20の処理負荷を軽減することができる。また、携帯端末装置10が音声認識処理を行うことで、携帯端末装置10を利用する利用者の声質を学習し、学習結果に基づく音声認識処理が可能となり、音声認識精度を向上させることが可能となる。なお、かかる学習処理については、図5等を用いて後述する。
次に、実施例1に係る音声作動システム1の構成について図2を用いて説明する。図2は、実施例1に係る音声作動システム1の構成を示すブロック図である。同図に示すように、音声作動システム1は、利用者が携帯する携帯電話などの携帯端末装置10と、車両に搭載された車載装置20とから構成される。
まず、携帯端末装置10の構成について説明する。携帯端末装置10は、利用者の音声を入力するマイク11と、音声メッセージを再生するスピーカー12と、Bluetooth(登録商標)による通信(走行データ、ナビ情報、楽曲情報、楽曲データ等)を行うBT(ブルートゥース)通信部13と、音声認識処理等を行う制御部14とを備えている。また、制御部14は、音声認識部14aと、認識結果送信部14bと、作動結果受信部14cと、音声合成部14dとをさらに備えている。
マイク11は、利用者によって入力された音声波形を制御部14の音声認識部14aへ渡す処理を行う。また、スピーカー12は、制御部14の音声合成部14dから受け取った音声データ等を再生する。また、BT通信部13は、車載装置20との間で通信リンク確立のためのペアリング処理を実行したうえで、通信リンク確立後は、携帯端末装置10/車載装置20間のデータ送受信を行うデバイスである。
制御部14は、マイク11から受け取った音声波形について音声認識処理を行い、音声認識処理の認識結果を車載装置20へ送信する制御を行うとともに、車載装置20から受け取った作動結果を音声へ変換してスピーカー12へ出力する制御を行う。なお、この制御部14は、基板上に回路として構成してもよいし、コンピュータプログラムとして構成してもよい。
音声認識部14aは、マイク11から受け取った音声波形について音声認識処理を行い、認識結果を認識結果送信部14cへ渡す処理を行う処理部である。たとえば、この音声認識部14aは、「目的地」と発声された音声波形を、「モクテキチ」というテキストデータへ変換する。なお、この音声認識部14aが受け付ける操作コマンドを図示しないメモリ等へ記憶しておき、メモリ上の操作コマンドと一致する認識結果のみを認識結果送信部14bへ出力したり、メモリ上の操作コマンドと一致した認識結果を、たとえば、数字やアルファベットからなる識別子へ変換して認識結果送信部14bへ出力したりすることとしてもよい。
認識結果送信部14bは、音声認識部14aから受け取った認識結果をBT通信部13経由で車載装置20へ向けて送信する処理を行う処理部である。また、作動結果受信部14cは、BT通信部13経由で車載装置20から受け取った作動結果を音声合成部14dへ出力する処理を行う処理部である。ここで、作動結果は、たとえば、「モクテキチケンサクモードヘヘンコウシマシタ」等のテキスト形式のデータである。
音声合成部14dは、作動結果受信部14cから受け取った作動結果を、音声データへ変換し、変換後の音声データをスピーカー12に対して出力する処理を行う処理部である。なお、車載装置20から作動結果として音声データを受け取るように構成する場合には、この音声合成部14dは、音声データを再生する機能のみを備えることとすればよい。
次に、車載装置20の構成について説明する。なお、同図には、本実施例1に係る音声作動システムの特徴を説明するために必要な構成要素のみを示しており、ナビゲーション機能、オーディオ機能、ビジュアル機能等に関する記載は省略している。同図に示すように、車載装置20は、BT通信部21と、制御部22とを備えており、制御部22は、作動制御部22aと、作動結果送信部22bとをさらに備えている。
BT(ブルートゥース)通信部21は、携帯端末装置10との間で通信リンク確立のためのペアリング処理を実行したうえで、通信リンク確立後は、携帯端末装置10/車載装置20間のデータ送受信を行うデバイスである。
制御部20は、携帯端末装置10から受け取ったテキスト形式の認識結果(音声認識結果)に基づいて自装置を作動制御するとともに、作動結果を携帯端末装置10に対して送信する制御を行う処理部である。作動制御部22aは、BT通信部21経由で携帯端末装置10から認識結果(音声認識結果)を受け取り、受け取った認識結果に基づいて自装置を作動させる処理を行う。たとえば、この作動制御部22aは、ナビゲーション機能における検索モードについて、携帯端末装置10から「モクテキチ」との認識結果を受け取った場合には、検索モードを目的地検索モードへと変更する。
作動結果送信部22bは、作動制御部22aによる作動制御の結果をBT通信部21経由で携帯端末装置10へ送信する処理を行う処理部である。たとえば、この作動結果送信部22bは、作動制御部22aが、ナビゲーション機能における検索モードを目的地検索モードへと変更した場合には、「モクテキチケンサクモードヘヘンコウシマシタ」等のテキスト形式のデータを携帯端末装置10へ向けて送信する。
なお、本実施例1では、テキスト形式の作動結果を送信する場合について説明するが、テキスト形式の作動結果を音声データへ変換したり、テキスト形式の作動結果に合致する音声データを検索したりしたうえで、携帯端末装置10へ送信することとしてもよい。また、本実施例1では、携帯端末装置10が作動結果を再生する場合について説明するが、車載装置20と接続された図示しないスピーカーで作動結果を再生することとしてもよい。
次に、図2に示した音声作動システム1における各装置間の初期処理について図3を用いて説明する。図3は、音声作動システム1における初期処理の処理手順を示すフローチャートである。なお、同図のステップS101に示す「音声認識アプリ」は、図2に示した制御部14に対応するコンピュータプログラムである。
同図に示すように、携帯端末装置10は、音声認識アプリを起動し(ステップS101)、車載装置20との間でペアリング処理を実行する(ステップS102)。一方、車載装置20も、携帯端末装置10との間でペアリング処理を実行し(ステップS103)、ペアリングが完了したならば、音声入力を促すメッセージを携帯端末装置10へ送信して初期処理を終了する(ステップS104)。また、ペアリングが完了した携帯端末装置10は、車載装置20から受け取った音声入力を促すメッセージを再生して(ステップS105)初期処理を終了する。
なお、同図では、携帯端末装置10における音声認識アプリの起動を起点として携帯端末装置10/車載装置20間のペアリングを開始する場合について示した。しかしながら、これに限らず、まず、携帯端末装置10/車載装置20間のペアリングを実行し、ペアリング完了後に、携帯端末装置10または車載装置20のいずれかが音声認識アプリの起動を指示することとしてもよい。
次に、図2に示した音声作動システム1における各装置間の通常処理について図4を用いて説明する。図4は、音声作動システム1における通常処理の処理手順を示すフローチャートである。なお、図4に示す通常処理は、図3に示した初期処理の完了後に各装置において実行される。
同図に示すように、携帯端末装置10で利用者による音声入力が行われると(ステップS201)、音声認識部14aは、音声認識処理を実行する(ステップS202)。つづいて、認識結果送信部14bは、認識結果(音声認識結果)を車載装置20へ向けて送信する(ステップS203)。
認識結果を受け取った車載装置20では、作動制御部22aが、受け取った認識結果に基づいて作動制御を実行し(ステップS204)、作動結果送信部22bは、作動結果を携帯端末装置10へ向けて送信する(ステップS205)。つづいて、作動結果を受け取った携帯端末装置10では、音声合成部14dが、作動結果を再生し(ステップS206)、ステップS201以降の処理を繰り返す。なお、ステップS203において、携帯端末装置10側で認識結果から車載装置20の作動制御用コマンドを作成して車載装置20へ送信し、車載装置10は、受信した作動制御用コマンドに基づいて動作することとしてもよい。
次に、図2に示した音声認識部14aの変形例について図5を用いて説明する。図5は、音声認識部14aの変形例を示すブロック図である。なお、同図では、変形例として利用者の声質を学習する機能を備えた音声認識部15を示している。また、同図では、マイク11以外の各構成要件の記載を省略しているが、図4に示していない各構成要件については、図2と同様である。
同図に示すように、音声認識部15は、学習処理部15aと、音声抽出処理部15bと、音声認識処理部15cとをさらに備えている。学習処理部15aは、日常的に携帯端末装置10を利用する特定の利用者の声質を分析して図示しないメモリ等に記憶し、携帯端末装置10に対応する特定の利用者の声を他の利用者やノイズと区別するための情報を、音声抽出処理部15bへ提供する処理を行う処理部である。
音声抽出処理部15bは、学習処理部15aから提供された情報に基づき、マイク11から受け取った音声信号の中から、携帯端末装置10に対応する特定の利用者の声に対応する音声信号を抽出する処理を行う処理部である。また、音声認識処理部15cは、音声抽出処理部15bによって抽出された音声信号について図2に示した音声認識部14aと同様の音声認識処理を行う処理部である。なお、音声認識処理部15cによる認識結果は、認識結果送信部14b(図2参照)へ出力される。
次に、音声認識部14aの代わりに図5に示した音声認識部15を備えた携帯端末装置10を用いた場合における各装置間の通常処理について図6を用いて説明する。図6は、図5に示した音声認識部15を用いた音声作動システム1における通常処理の処理手順を示すフローチャートである。同図に示すように、携帯端末装置10は、学習処理部15aによって生成された学習結果を、図示しないメモリ等から読み出し(ステップS301)、利用者による音声入力が行われたならば(ステップS302)、音声抽出処理部15bは、学習結果に基づく音声抽出を行う(ステップS303)。
そして、音声認識処理部15cは、音声認識処理を実行し(ステップS304)、認識結果送信部14bは、認識結果(音声認識結果)を車載装置20へ向けて送信する(ステップS305)。認識結果を受け取った車載装置20では、作動制御部22aが、受け取った認識結果に基づいて作動制御を実行し(ステップS306)、作動結果送信部22bは、作動結果を携帯端末装置10へ向けて送信する(ステップS307)。
つづいて、作動結果を受け取った携帯端末装置10では、音声合成部14dが、作動結果を再生し(ステップS308)、ステップS302以降の処理を繰り返す。このように、携帯端末装置10に対応する利用者の声質を学習し、入力された音声波形の中から学習結果に対応する音声波形を抽出することで、マイク11から入力される他人の話し声や、雑音、音楽等の影響を排除しつつ、高精度な音声認識を行うことが可能となる。
上述してきたように、本実施例1では、端末装置の音声認識部が、音声波形を認識し、端末装置の認識結果送信部が、認識結果を車載装置へ向けて送信し、車載装置の作動制御部が、端末装置から送信された認識結果に基づいて自装置を作動制御することとしたので、車載装置側ではなく端末装置側で音声認識処理を行うことで、車載装置側に過度な処理負荷をかけることなく車載装置を音声作動させることができる。
また、携帯電話などの携帯端末装置を用いることで、マイクを車内に固定する必要がなく、車内のあらゆる場所から音声コマンドを入力することができる。たとえば、運転席のみならず、後部座席からも音声コマンドの入力が可能となる。
また、本実施例1では、携帯端末装置を特定の利用者が利用する場合に、携帯端末装置の学習処理部が、特定の利用者の音声特性を学習し、音声抽出処理部が、学習結果に基づき、入力された音の中から特定の利用者に係る音声波形を抽出することとしたので、音声認識の精度を向上させることができる。
ところで、上述した実施例1では、携帯端末装置自身が音声認識処理を実行する場合について示したが、音声認識処理を外部装置へ依頼することとしてもよい。そこで、以下に示す実施例2では、携帯端末装置が外部装置である音声認識サーバ装置へ音声認識処理を依頼する場合について説明することとする。
図7は、実施例2に係る音声作動システム1aの構成を示すブロック図である。同図に示すように、音声作動システム1aは、携帯端末装置10aと、車載装置20と、音声認識サーバ装置30とから構成される。ここで、車載装置20に含まれる各構成要素は図2と同様であるため記載を省略している。また、音声認識サーバ装置30は、図2に示した携帯端末装置10の音声認識部14aと同様の音声認識処理部および同図に示す携帯端末装置10aの通信部16と同様の通信部を備えているものとする。なお、以下では、実施例1に係る音声作動システム1と同様の構成については、説明を省略するか簡単な説明にとどめることとする。
同図に示すように、携帯端末装置14は、図2に示した音声認識部14a(図7の破線矩形を参照)の代わりに、音声送信部14aaおよび認識結果受信部14abを備えており、また、音声認識サーバ装置30と通信するための通信部16を備えている。
音声送信部14aaは、マイク11から入力された音声波形を通信部16経由で音声認識サーバ装置30へ向けて送信する処理を行う処理部である。なお、この音声送信部14aaは、入力された音声波形を所定の時間にわたってバッファリングしたうえで音声認識サーバ装置30へ送信することとしてもよいし、入力された音声波形を随時、音声認識サーバ装置30へ送信することとしてもよい。
認識結果受信部14abは、音声認識サーバ装置30による音声認識結果を通信部16経由で受け取り、受け取った認識結果(音声認識結果)を認識結果送信部14bへ出力する処理を行う処理部である。また、通信部16は、基地局等と無線通信するための通信デバイスであり、携帯端末装置10a/音声認識サーバ装置30間のデータ通信を行う。
音声認識サーバ装置30は、基地局内またはインターネット等のネットワーク上に設けられ、携帯端末装置10aから受け取った音声波形について音声認識処理を実行し、認識結果をテキスト形式データ等で応答する処理を行う装置である。
次に、実施例2に係る音声作動システム1aの処理手順について図8を用いて説明する。図8は、実施例2に係る音声作動システム1aの処理手順を示すフローチャートである。同図に示すように、携帯端末装置10aへ、マイク11経由で音声入力がなされると(ステップS401)、音声送信部14aaは、入力された音声波形を音声認識サーバ装置30へ向けて送信する(ステップS402)。
かかる音声波形を受信した音声認識サーバ装置30は、音声認識処理を実行し(ステップS403)、認識結果(音声認識結果)を携帯端末装置10aへ向けて送信する(ステップS404)。そして、携帯端末装置10aの認識結果受信部14abは、音声認識サーバ装置30から受け取った認識結果を認識結果送信部14bへ出力して(ステップS405)処理を終了する。なお、ステップS405につづいて、携帯端末装置10a/車載装置20間の通信が行われることになる。
次に、実施例2に係る音声作動システム1aが、図5を用いて説明した学習機能(学習処理部15aおよび音声抽出処理部15b)をさらに備えている場合について、図9を用いて説明する。図9は、図5に示した音声認識部15を用いた実施例2に係る音声作動システム1aの処理手順を示すフローチャートである。
同図に示すように、携帯端末装置10aは、学習処理部15aによって生成された学習結果を、図示しないメモリ等から読み出し(ステップS501)、利用者による音声入力が行われたならば(ステップS502)、音声抽出処理部15bは、学習結果に基づく音声抽出を行う(ステップS503)。
そして、音声送信部14aaは、ステップS503において抽出した音声波形を音声認識サーバ装置30に対して送信する(ステップS504)。かかる音声波形を受信した音声認識サーバ装置30は、音声認識処理を実行し(ステップS505)、認識結果(音声認識結果)を携帯端末装置10aへ送信する(ステップS506)。
つづいて、音声認識サーバ装置30から認識結果を受信した携帯端末装置10aの認識結果受信部14abは、認識結果を認識結果送信部14bへ出力して(ステップS507)処理を終了する。なお、ステップS507につづいて、携帯端末装置10a/車載装置20間の通信が行われることになる。
このように、本実施例2では、携帯端末装置の音声送信部が、音声波形を音声認識サーバ装置へ送信し、認識結果受信部が、音声認識サーバ装置から認識結果を受信することとしたので、携帯端末装置とネットワーク接続された音声認識サーバ装置が、音声認識処理を実行することによって、携帯端末装置の処理負荷を低減することができるとともに、携帯端末装置が音声認識機能を備えていない場合であっても、音声コマンドの生成が可能となる。
ところで、上述した各実施例では、1台の携帯端末装置を用いる場合について説明したが、車載装置と無線接続する携帯端末装置の数に特に制限はない。また、Bluetooth(登録商標)を用いた通信では、車載装置側で、自装置に接続された各携帯端末装置の識別子を管理することができる。
そこで、かかる管理機能を利用し、たとえば、ドライバーとして登録された携帯端末装置から入力可能な音声コマンドを特定のコマンドのみに制限したり、ドライバー以外の乗車者として登録された携帯端末装置からは、すべての音声コマンドを入力可能としたり、することとしてもよい。
この場合、車載装置は、各携帯端末装置に対して許容する音声コマンドの種別を含んだ許容情報を記憶し、携帯端末装置から受け取った認識結果が許容情報において許容された種別である場合に、かかる音声コマンドに対応する作動制御を実行することになる。
また、車載装置から入手した車両走行データあるいは携帯端末装置に備わるGPS機能に基づき、走行中であるか停車中であるかを認識し、走行中には制限すべきコマンドを停車中に送信するといった送信タイミング調整を携帯端末装置に行わせることとしてもよい。
以上のように、本発明に係る音声作動システムおよび音声作動方法は、車両内における音声作動制御に適している。また、本発明に係る音声作動システムおよび音声作動方法を室内や屋外に設置された通信機器の音声作動制御に適用することもできる。
実施例1に係る音声作動システムの概要を示す図である。 実施例1に係る音声作動システムの構成を示すブロック図である。 音声作動システムにおける初期処理の処理手順を示すフローチャートである。 音声作動システムにおける通常処理の処理手順を示すフローチャートである。 音声認識部の変形例を示すブロック図である。 図5に示した音声認識部を用いた音声作動システムにおける通常処理の処理手順を示すフローチャートである。 実施例2に係る音声作動システムの構成を示すブロック図である。 実施例2に係る音声作動システムの処理手順を示すフローチャートである。 図5に示した音声認識部を用いた実施例2に係る音声作動システムの処理手順を示すフローチャートである。
符号の説明
1、1a 音声作動システム
10、10a 携帯端末装置
11 マイク
12 スピーカー
13 BT通信部
14 制御部
14a 音声認識部
14aa 音声送信部
14ab 認識結果受信部
14b 認識結果送信部
14c 作動結果受信部
14d 音声合成部
15 音声認識部
15a 学習処理部
15b 音声抽出処理部
15c 音声認識処理部
16 通信部
20 車載装置
21 BT通信部
22 制御部
22a 作動制御部
22b 作動結果送信部
30 音声認識サーバ装置

Claims (8)

  1. 端末装置および前記端末装置と通信する車載装置を備え、前記端末装置と前記車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動システムであって、
    前記端末装置は、
    前記音声を認識する音声認識手段と、
    前記音声認識手段による認識結果を送信する認識結果送信手段と
    を備え、
    前記車載装置は、
    前記端末装置の前記認識結果送信手段によって送信された前記認識結果に基づいて自装置を作動制御する作動制御手段
    を備えたことを特徴とする音声作動システム。
  2. 前記端末装置は、
    特定の利用者が使用する携帯端末装置であって、
    前記音声認識手段は、
    前記特定の利用者の音声特性を学習する学習手段と、
    前記学習手段による学習結果に基づき、入力された音の中から前記特定の利用者に係る前記音声を抽出する音声抽出手段と
    をさらに備えたことを特徴とする請求項1に記載の音声作動システム。
  3. 前記音声認識手段は、
    前記音声を音声認識サーバ装置へ送信する送信手段と、
    前記音声認識サーバ装置から前記認識結果を受信する認識結果受信手段と
    をさらに備えたことを特徴とする請求項1または2に記載の音声作動システム。
  4. 前記車載装置は、
    前記作動制御手段による前記作動制御の結果である作動結果を送信する作動結果送信手段
    をさらに備え、
    前記端末装置は、
    前記作動結果送信手段によって送信された前記作動結果を音声へ変換する音声変換手段
    をさらに備えたことを特徴とする請求項1、2または3に記載の音声作動システム。
  5. 前記車載装置は、
    前記作動制御手段による前記作動制御の結果である作動結果を音声へ変換する音声変換手段と、
    前記音声変換手段によって変換された前記音声を出力する音声出力手段と
    をさらに備えたことを特徴とする請求項1、2または3に記載の音声作動システム。
  6. 前記車載装置は、
    各前記端末装置に対して許容する前記作動制御の種別を含んだ許容情報を記憶する許容情報記憶手段
    をさらに備え、
    前記作動制御手段は、
    前記認識結果が前記許容情報において許容された前記種別である場合に前記作動制御を実行することを特徴とする請求項1〜5のいずれか一つに記載の音声作動システム。
  7. 端末装置および前記端末装置と通信する車載装置を用いて前記車載装置を音声に基づいて作動させる音声作動方法であって、
    前記端末装置が前記音声を認識する音声認識工程と、
    前記端末装置が前記音声認識工程による認識結果を送信する認識結果送信工程と、
    前記車載装置が前記端末装置の前記認識結果送信工程によって送信された前記認識結果に基づいて自装置を作動制御する作動制御工程と
    を含んだことを特徴とする音声作動方法。
  8. 端末装置と通信し、音声に基づいて作動する車載装置であって、
    前記音声の認識結果を前記端末装置から受信し、受信した前記認識結果に基づいて自装置を作動制御する作動制御手段
    を備えたことを特徴とする車載装置。
JP2008152227A 2008-06-10 2008-06-10 音声作動システム、音声作動方法および車載装置 Pending JP2009300537A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008152227A JP2009300537A (ja) 2008-06-10 2008-06-10 音声作動システム、音声作動方法および車載装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008152227A JP2009300537A (ja) 2008-06-10 2008-06-10 音声作動システム、音声作動方法および車載装置

Publications (1)

Publication Number Publication Date
JP2009300537A true JP2009300537A (ja) 2009-12-24

Family

ID=41547527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008152227A Pending JP2009300537A (ja) 2008-06-10 2008-06-10 音声作動システム、音声作動方法および車載装置

Country Status (1)

Country Link
JP (1) JP2009300537A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011242594A (ja) * 2010-05-18 2011-12-01 Denso Corp 情報提示システム
CN102745143A (zh) * 2012-07-24 2012-10-24 上海车音网络科技有限公司 可自动调整的车载托架
JP2013062681A (ja) * 2011-09-13 2013-04-04 Advanced Media Inc 入力支援システム
WO2013141390A1 (en) 2012-03-22 2013-09-26 Sony Corporation Information processing device, information processing method, information processing program, and terminal device
US8612036B2 (en) 2011-03-22 2013-12-17 Panasonic Corporation Portable terminal, pairing system and pairing method
JP2016046796A (ja) * 2014-08-25 2016-04-04 現代自動車株式会社Hyundaimotor Company サウンドデータ両方向ミラーリングシステム
KR101619260B1 (ko) 2014-11-10 2016-05-10 현대자동차 주식회사 차량 내 음성인식 장치 및 방법
US9414179B2 (en) 2012-03-15 2016-08-09 Sony Corporation Operational control of an apparatus through a terminal device
JPWO2014103035A1 (ja) * 2012-12-28 2017-01-12 株式会社レイトロン 音声認識デバイス
US10382605B2 (en) 2015-04-16 2019-08-13 Toyota Jidosha Kabushiki Kaisha Vehicular information processing system, vehicle-mounted device, method for providing text data, and program for providing the same
US10984792B2 (en) 2018-01-11 2021-04-20 Toyota Jidosha Kabushiki Kaisha Voice output system, voice output method, and program storage medium
US11011167B2 (en) 2018-01-10 2021-05-18 Toyota Jidosha Kabushiki Kaisha Communication system, communication method, and computer-readable storage medium
JP7093181B2 (ja) 2014-11-20 2022-06-29 マイクロソフト テクノロジー ライセンシング,エルエルシー 車両ベースのマルチモーダルインターフェース
US11884280B2 (en) 2018-01-11 2024-01-30 Toyota Jidosha Kabushiki Kaisha Vehicle control device, vehicle control method, and non-transitory computer readable medium storing vehicle control program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0451799A (ja) * 1990-06-20 1992-02-20 Hitachi Ltd 遠隔制御方式
JPH1168912A (ja) * 1997-08-18 1999-03-09 N T T Hokkaido Ido Tsushinmo Kk インタフェース装置
JP2002261966A (ja) * 2000-09-08 2002-09-13 Matsushita Electric Works Ltd コミュニケーション支援システムおよび撮影装置
JP2004104757A (ja) * 2002-07-16 2004-04-02 Advanced Media Inc 音声入力装置
JP2006251699A (ja) * 2005-03-14 2006-09-21 Denso Corp 音声認識装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0451799A (ja) * 1990-06-20 1992-02-20 Hitachi Ltd 遠隔制御方式
JPH1168912A (ja) * 1997-08-18 1999-03-09 N T T Hokkaido Ido Tsushinmo Kk インタフェース装置
JP2002261966A (ja) * 2000-09-08 2002-09-13 Matsushita Electric Works Ltd コミュニケーション支援システムおよび撮影装置
JP2004104757A (ja) * 2002-07-16 2004-04-02 Advanced Media Inc 音声入力装置
JP2006251699A (ja) * 2005-03-14 2006-09-21 Denso Corp 音声認識装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011242594A (ja) * 2010-05-18 2011-12-01 Denso Corp 情報提示システム
US8612036B2 (en) 2011-03-22 2013-12-17 Panasonic Corporation Portable terminal, pairing system and pairing method
JP2013062681A (ja) * 2011-09-13 2013-04-04 Advanced Media Inc 入力支援システム
US9414179B2 (en) 2012-03-15 2016-08-09 Sony Corporation Operational control of an apparatus through a terminal device
US11327712B2 (en) 2012-03-22 2022-05-10 Sony Corporation Information processing device, information processing method, information processing program, and terminal device
WO2013141390A1 (en) 2012-03-22 2013-09-26 Sony Corporation Information processing device, information processing method, information processing program, and terminal device
US10452347B2 (en) 2012-03-22 2019-10-22 Sony Corporation Information processing device, information processing method, and terminal device for generating information shared between the information processing device and the terminal device
CN102745143A (zh) * 2012-07-24 2012-10-24 上海车音网络科技有限公司 可自动调整的车载托架
JPWO2014103035A1 (ja) * 2012-12-28 2017-01-12 株式会社レイトロン 音声認識デバイス
CN105743862B (zh) * 2014-08-25 2020-11-10 现代自动车株式会社 用于声音数据的双向镜像系统
CN105743862A (zh) * 2014-08-25 2016-07-06 现代自动车株式会社 用于声音数据的双向镜像系统
JP2016046796A (ja) * 2014-08-25 2016-04-04 現代自動車株式会社Hyundaimotor Company サウンドデータ両方向ミラーリングシステム
US9870770B2 (en) 2014-11-10 2018-01-16 Hyundai Motor Company Voice recognition device and method in vehicle
KR101619260B1 (ko) 2014-11-10 2016-05-10 현대자동차 주식회사 차량 내 음성인식 장치 및 방법
JP7093181B2 (ja) 2014-11-20 2022-06-29 マイクロソフト テクノロジー ライセンシング,エルエルシー 車両ベースのマルチモーダルインターフェース
US10382605B2 (en) 2015-04-16 2019-08-13 Toyota Jidosha Kabushiki Kaisha Vehicular information processing system, vehicle-mounted device, method for providing text data, and program for providing the same
US11011167B2 (en) 2018-01-10 2021-05-18 Toyota Jidosha Kabushiki Kaisha Communication system, communication method, and computer-readable storage medium
US10984792B2 (en) 2018-01-11 2021-04-20 Toyota Jidosha Kabushiki Kaisha Voice output system, voice output method, and program storage medium
US11884280B2 (en) 2018-01-11 2024-01-30 Toyota Jidosha Kabushiki Kaisha Vehicle control device, vehicle control method, and non-transitory computer readable medium storing vehicle control program

Similar Documents

Publication Publication Date Title
JP2009300537A (ja) 音声作動システム、音声作動方法および車載装置
JP6501217B2 (ja) 情報端末システム
KR101972955B1 (ko) 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US9420431B2 (en) Vehicle telematics communication for providing hands-free wireless communication
US7356471B2 (en) Adjusting sound characteristic of a communication network using test signal prior to providing communication to speech recognition server
US20150032374A1 (en) Information Terminal, Server Device, Searching System, and Searching Method Thereof
US20100203830A1 (en) Systems and Methods for Implementing Hands Free Operational Environments
US20100306309A1 (en) System and Method for Executing Hands-Free Operation of an Electronic Calendar Application Within a Vehicle
US9564120B2 (en) Speech adaptation in speech synthesis
CN103617795A (zh) 一种车载语音识别控制方法及系统
US20180074661A1 (en) Preferred emoji identification and generation
CN104205038A (zh) 信息处理设备,信息处理方法,信息处理程序和终端设备
JP2010130223A (ja) 音声操作システムおよび音声操作方法
CN103986490A (zh) 仲裁通过移动应用进行流传输的音频源的系统和方法
JP2017138536A (ja) 音声処理装置
JP2019179116A (ja) 音声理解プログラム、音声理解装置および音声理解方法
KR20140067687A (ko) 대화형 음성인식이 가능한 차량 시스템
WO2018059595A1 (zh) 车载无线交互方法、控制设备和车载设备
CN105246048B (zh) 车辆计算系统经由辅助端口与移动装置通信的方法和系统
JP2014062944A (ja) 情報処理装置
WO2014108981A1 (ja) 車載情報システムおよび音声認識適応方法
CN101523483A (zh) 在汽车中通过语音再现文本信息的方法
CN106131100A (zh) 用于模块远程请求处理的方法和设备
JP2017181667A (ja) 音声認識装置および音声認識方法
KR20210095569A (ko) 에이전트 시스템, 서버 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110527

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120821