JP6105321B2

JP6105321B2 - 通信装置、通信システム、通信方法、及び、プログラム

Info

Publication number: JP6105321B2
Application number: JP2013032057A
Authority: JP
Inventors: 祐長田
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 2013-02-21
Filing date: 2013-02-21
Publication date: 2017-03-29
Anticipated expiration: 2033-02-21
Also published as: JP2014164325A; US9262796B2; US20140236601A1

Description

本発明は、ユーザの音声の認識結果を用いる技術に関する。

従来より、ユーザとキャラクタとの対話により機器の操作の円滑化を図る、いわゆるエージェント機能が知られている（例えば、特許文献１参照。）。例えば、ナビゲーション機器のディスプレイに表示されたキャラクタから「行き先は？」との問い掛けに対し、ユーザが「レストラン」と発声すると、付近のレストランがナビゲーションの目的地に設定される。このようなエージェント機能を用いることで、ユーザは、キャラクタとの対話を通して機器の操作や情報の検索を容易に行うことができる。

特開２００６−１５４９２６号公報

上記のようなエージェント機能では、ユーザとキャラクタとのコミュニケーションを円滑にするため、動作を伴ったキャラクタ画像の表示や様々な問い掛け処理を継続的に行うことが望まれる。

しかしながら、キャラクタ画像の表示を継続して行うと、画像の表示処理とユーザの声の受信処理とが同時に行われる場合が生じ得る。この場合、機器の処理負荷が過大となり処理の停止状態（いわゆる、フリーズ）が発生し、音声の受信中にキャラクタ画像の動作が停止する恐れがあった。キャラクタ画像の動作が停止すると、ユーザとキャラクタとの円滑なコミュニケーションが阻害され、ユーザとの対話により機器の操作を容易に行うというエージェント機能の効果を十分に発揮できない恐れがあった。

本発明は、上記課題に鑑みてなされたものであり、ユーザの音声の受信中においてもキャラクタ画像の動作を停止させず、エージェント機能の効果を発揮できる技術を提供することを目的とする。

上記課題を解決するため、請求項１の発明は、車載装置と通信する通信装置であって、ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、を備え、前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。

また、請求項２の発明は、請求項１に記載の通信装置において、前記生成手段は、前記キャラクタ画像を所定の頻度で生成し、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を生成する頻度を低下させる。

また、請求項３の発明は、請求項１または２に記載の通信装置において、前記生成手段は、前記ユーザの音声の受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加する。

また、請求項４の発明は、請求項１ないし３のいずれかに記載の通信装置において、前記受信手段は、前記ユーザから開始指示がなされた後に、前記音声の受信を開始し、前記送信手段は、前記開始指示がなされた場合に、前記キャラクタ画像を送信する頻度を低下させる。

また、請求項５の発明は、請求項１ないし４のいずれかに記載の通信装置において、前記車載装置に対する前記ユーザの操作に係る操作信号を受信する操作信号受信手段と、前記操作信号受信手段が受信した前記操作信号に対応する処理を実行する実行手段と、をさらに備え、前記操作信号受信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信する。

また、請求項６の発明は、特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、前記通信装置は、ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、を備え、前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。

また、請求項７の発明は、請求項６に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、少なくとも一部の前記特定情報の提供を停止する。

また、請求項８の発明は、請求項７に記載の通信システムにおいて、前記通信装置は、前記サーバ装置に前記特定情報の提供の停止を解除させる解除信号を送信する解除手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報を記憶する第１記憶手段、をさらに備え、前記サーバ装置は、前記解除信号を受信した場合に、前記第１記憶手段に記憶した前記特定情報の提供を行う。

また、請求項９の発明は、請求項７または８に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合は、前記特定情報の提供を行う。

また、請求項１０の発明は、請求項９に記載の通信システムにおいて、前記通信装置は、キャッシュメモリを備え、前記受信容量は、前記キャッシュメモリに一時的に記憶できる容量である。

また、請求項１１の発明は、請求項８に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合において、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合に、前記特定情報の提供を行い、前記通信装置に提供すべき特定情報の容量が前記受信容量より大きい場合に、前記特定情報を前記第１記憶手段に記憶する。

また、請求項１２の発明は、請求項９ないし１１のいずれかに記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に、前記サーバ装置から提供された特定情報を一時的に記憶する第２記憶手段、をさらに備え、前記送信手段は、前記ユーザの音声の受信が終了した後に、前記第２記憶手段に一時的に記憶された前記特定情報を前記車載装置に送信する。

また、請求項１３の発明は、特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、前記通信装置は、ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、を備え、前記サーバ装置は、前記停止信号を受信すると、少なくとも一部の前記特定情報の提供を停止する。

また、請求項１４の発明は、車載装置と通信する通信方法であって、（ａ）ユーザと対話を行うためのキャラクタ画像を生成する工程と、（ｂ）前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、（ｃ）前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、を備え、前記工程（ｂ）は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。

また、請求項１５の発明は、車載装置と通信する通信装置に含まれるコンピュータにより実行可能なプログラムであって、前記コンピュータに、（ａ）ユーザと対話を行うためのキャラクタ画像を生成する工程と、（ｂ）前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、（ｃ）前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、を実行させ、前記工程（ｂ）は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。

請求項１ないし１５の発明によれば、ユーザの音声の受信中はキャラクタ画像の送信頻度を低下させるので、画像送信の処理と音声受信の処理とが重複した場合であっても、音声受信の処理を行うと共に車載装置においてキャラクタ画像の表示を継続することができる。

また、特に請求項２の発明によれば、ユーザの音声の受信中はキャラクタ画像の生成頻度を低下させるので、画像生成の処理と音声受信の処理とが重複した場合であっても、音声受信の処理を行うと共に車載装置においてキャラクタ画像の表示を継続することができる。

また、特に請求項３の発明によれば、ユーザの音声を受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加するので、ユーザは通信装置が音声を受信中であることを認識することができる。

また、特に請求項４の発明によれば、ユーザからの開始指示がなされた場合に、キャラクタ画像を送信する頻度を低下させるので、遅滞なくキャラクタ画像の送信頻度を低下させることができる。

また、特に請求項５の発明によれば、ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信するので、音声の受信による処理負荷が増加した場合であっても、ユーザの全ての操作に対応する処理を実行することがないため、通信装置の処理負荷が過大となるのを防止できる。

また、特に請求項７及び１３の発明によれば、サーバ装置は少なくとも一部の特定情報の提供を停止するので、通信装置で音声の受信中にサーバ装置から特定情報が提供されても、通信装置の処理負荷が過大となるのを防止できる。

また、特に請求項８の発明によれば、解除信号に応じて記憶手段に記憶された特定情報が提供されるので、通信装置は、音声の受信中に提供が停止されていた特定情報の提供を受けることができる。

また、特に請求項９の発明によれば、サーバ装置は停止信号を受信した場合であって、提供すべき情報の容量が受信容量以内である場合に特定情報の提供を行うので、通信装置は処理負荷を過大とせずに特定情報の提供を受けることができる。

また、特に請求項１０の発明によれば、サーバ装置から提供される特定情報の容量をキャッシュメモリに一時的に記憶できる容量とすることで、通信装置は処理負荷を過大とせずに提供情報の提供を受けることができる。

また、特に請求項１１の発明によれば、サーバ装置は、提供すべき特定情報の容量が受信容量より大きい場合には解除信号を受信してから特定情報の提供を行うので、通信装置はユーザの音声の受信中に処理負荷が過大となるのを防止できる。

また、特に請求項１２の発明によれば、ユーザの音声の受信が終了した後に、第２記憶手段に一時的に記憶された特定情報を車載装置に送信するので、通信装置はユーザの音声の受信中に処理負荷が過大となるのを防止し、音声の受信が終了した後に特定情報の提供を受けることができる。

図１は、通信システムの概要を示す図である。図２は、エージェント機能の概要を示す図である。図３は、ディスプレイの表示例を示す図である。図４は、ディスプレイの表示例を示す図である。図５は、通信装置及び車載装置の構成を示す図である。図６は、サーバ装置の構成を示す図である。図７は、エージェント機能の処理手順を示す図である。図８は、エージェント機能の処理手順を示す図である。図９は、エージェント機能の処理手順を示す図である。図１０は、エージェント画像の例を示す図である。図１１は、ディスプレイの表示例を示す図である。

以下、図面を参照しつつ本発明の実施の形態について説明する。

＜１．音声処理システムの概要＞
図１は、本実施の形態に係る通信システム１０の概要を示す。通信システム１０は、車両１内に持ち込まれる通信装置２、車両１に搭載される車載装置３、及び、車両１の外部に配置されるサーバ装置４を備えている。

車載装置３は、目的地までのルートを案内するナビゲーション機能と楽曲を再生するオーディオ機能と備えている。

サーバ装置４と通信装置２とは、インターネット等のネットワーク５を介し、相互にデータを送受信する。

通信システム１０は、車載装置３のディスプレイに人物等のキャラクタ画像を表示する。ユーザは、表示されたキャラクタとの対話により、車載装置３に所望の動作を実行させることができる。通信システム１０は、このようなユーザとキャラクタとの対話により機器の操作を行う、いわゆるエージェント機能を備える。

エージェント機能では、車両１のユーザ（代表的にはドライバ）の発話による音声を対象とした音声認識処理を行い、その認識結果に応じた動作を実行する。車両１のユーザは、様々な音声を発声することで、機器の操作や情報の検索を行うことができる。

また、エージェント機能では、サーバ装置４が生成した特定の情報が通信装置２を介して車載装置３へ送信（提供）され、車載装置３にて情報が表示される。このような情報は、例えば気象情報や道路交通情報であり、ユーザは車両１内において最新の情報を参照することができる。

図２は、通信システム１０が実行するエージェント機能の概要を示す。図２に示すように、サーバ装置４は、ユーザの音声を認識し、意味を解釈する音声認識部４１ａを備えている。

エージェント機能では、まず、車載装置３がユーザの音声を取得し、その音声を示す音声データを通信装置２に送信する（矢印Ｃ１）。通信装置２は、受信した音声データをサーバ装置４に送信する（矢印Ｃ２）。次に、サーバ装置４の音声認識部４１ａが、受信した音声データに対し音声認識処理を実行し、音声データをユーザの音声を表す文字データ（テキスト）に変換する。音声認識部４１ａは、音声認識処理の認識結果である文字データの意味に該当する施設等をデータベースから検索し、検索結果を通信装置２に送信する（矢印Ｃ３）。通信装置２は、音声認識部４１ａによる音声認識処理の処理結果として、施設等の検索結果をサーバ装置４から受信する。そして、通信装置２は、受信した処理結果に応じ、検索結果を一覧で表示する画像を生成する。例えば、ユーザが「近くのレストラン」と発声していた場合、通信装置２は車両１の周辺に存在するレストランの検索結果一覧をサーバ装置４から受信し、検索結果の一覧画像を生成する。そして、生成した画像を車載装置３へ送信する（矢印Ｃ４）。ユーザは、車載装置３のディスプレイに表示された検索結果の一覧から一つの項目を選択することで、例えば当該レストランをナビゲーション機能の目的地に設定することができる。

また、サーバ装置４が生成した各種情報が通信装置２を介して車載装置３へ送信される（矢印Ｃ３）。通信装置２は、情報を表示する画像を生成して車載装置３へ送信する（矢印Ｃ４）。これにより、車載装置３にて情報が表示され、ユーザは車両１内において気象情報や道路交通情報等の最新の情報を参照することができる。

このように通信装置２及び車載装置３は、サーバ装置４と協働することで、車両１のユーザの音声に応じた動作を実行したり、情報を提供するエージェント機能を実現する。なお、本実施の形態の説明においては、画像の「表示」処理は、ディスプレイに画像を表示する処理のみならず、画像の生成処理及び生成した画像の送信処理を含んで説明する場合がある。

図３は、車載装置３の例を示す。ディスプレイ３３各種情報を表示する表示装置としてディスプレイ３３を備える。ディスプレイ３３は、タッチパネル機能を備え、ユーザの接触による操作を受け付け可能である。ディスプレイ３３は、左半面にナビゲーション画像ＮＶを表示し、右半面にエージェント画像ＥＧを表示する。ナビゲーション画像ＮＶは車載装置３で生成して表示され、エージェント画像ＥＧは通信装置２から送信されて表示される。

エージェント画像ＥＧには、キャラクタ画像ＣＧ、操作に用いられるメニュ画像ＭＮ、及び、各種アイコンＩＣ１からＩＣ３が含まれる。なお、キャラクタ画像ＣＧは人物であることが好ましい。ユーザとの対話を行うためである。ただし、擬人化された動物や物であってもよい。つまり、ユーザとのコミュニケーションに資する画像であればよい。

また、車載装置３は、スピーカ３４とユーザの声（音声）を取得するためのマイクロフォン３５とを備える。スピーカ３４からはユーザへの問い掛け等が音声で出力される。例えば、「行き先は？」等である。マイクロフォン３５は、ノイズを取得しないよう、マイクアイコンＩＣ３がユーザにより操作された場合に作動する。

ユーザはこのようなエージェント画像ＥＧを参照しつつ、キャラクタとの対話を通じてタッチパネルへの操作やマイクロフォン３５への音声による操作を行うことができる。

図４は、車載装置３の他の例を示す。エージェント機能では、サーバ装置４が生成した各種情報がネットワーク５及び通信装置２を介して車載装置３へ送信され、車載装置３にて情報が表示される。サーバ装置４は、所定時間毎や特定の事象が発生した場合、又はユーザの事前の設定に応じ、情報を生成及び送信する。例えば、図４に示すように、サーバ装置４から提供された気象情報ＴＡがディスプレイ３３に表示される。また、スピーカ３４から音声としても出力される。ユーザは車両１内において、最新の情報を視聴することができる。

以下、このようなエージェント機能を実現する通信システム１０について、詳細に説明する。

＜２．通信装置及び車載装置の構成＞
図５は、通信装置２及び車載装置３の構成を示す。図５上段は通信装置２の構成であり、図５下段は車載装置３の構成である。

通信装置２は、制御部２１、ディスプレイ２２、通信部２３、記憶部２４、カードスロット２５、及び、連携部２６を備える。

制御部２１は、通信装置２の全体を統括的に制御するマイクロコンピュータであり、ＣＰＵ、ＲＡＭ、及びＲＯＭを備える。また、ＣＰＵは、キャッシュメモリ２１ｆを備えている。制御部２１が備える各部の動作については、後述する。

ディスプレイ２２は、文字や図形等の各種情報を表示して、ユーザに情報を提示する表示装置である。例えば、液晶ディスプレイ、プラズマディスプレイ、有機ＥＬディスプレイ等である。なお、ディスプレイ２２は、タッチパネルを備え、ユーザの操作に用いられる。

通信部２３は、ネットワーク５を介してサーバ装置４と無線通信を行い、サーバ装置４と連携してエージェント機能に必要なデータの送受信を行う。例えば、取得したユーザの音声を音声データとしてサーバ装置４に送信し、サーバ装置４から音声認識処理の検索結果を取得する。通信装置２は、通信部２３を備えることにより、車載装置３とサーバ装置４との間におけるデータの中継器として機能する。

記憶部２４は、各種データを記憶するメモリである。例えば、ＥＥＰＲＯＭ（Electrical Erasable Programmable Read-Only memory）、フラッシュメモリ、磁気ディスクを備えたハードディスクドライブ等の不揮発性の記憶装置である。記憶部２４は、容量データ２４ａ及びプログラム２４ｂを記憶している。

容量データ２４ａは、サーバ装置４から送信されるデータを通信装置２で記憶可能な容量を示し、［ＧＢ］（ＧｉｇａＢｙｔｅ：ギガバイト）や［ＭＢ］（ＭｅｇａＢｙｔｅ：メガバイト）等の単位で示される。容量データ２４ａは、制御部２１の備えるＣＰＵのキャッシュメモリ２１ｆの容量である。

プログラム２４ｂは、制御部２１により読み出され、制御部２１が通信装置２を制御するために実行されるファームウェアである。

カードスロット２５は、フラッシュメモリ等の可搬性記録媒体であるメモリカード２５ａの差込口である。カードスロット２５は、メモリカード２５ａからのデータの読み取りや、メモリカード２５ａへのデータの書き込みを行う。

連携部２６は、車載装置３とケーブルで接続され、車載装置３とデータの送受信を行う。

また、制御部２１は、記憶部２４に記憶されたプログラム２４ｂに従い、ＣＰＵの演算処理により実現される各種機能を備える。図中に示す画像生成部２１ａ、実行部２１ｂ、停止部２１ｃ、解除部２１ｄ、及び、通知部２１ｅは、プログラム２５ｂに従って演算処理を行うことで実現される制御部２１の機能及びハードウェアである。

画像生成部２１ａは、エージェント機能で使用されるユーザとの対話を行うためのキャラクタ画像ＣＧ、操作に用いられるメニュ画像ＭＮやアイコン画像ＩＣ、ユーザへのメッセージ画像、及び、サーバ装置４から送信された検索結果や情報を表す画像を生成する。画像生成部２１ａは、画像を生成するとスクリーンキャプチャを行い、生成した画像データをディスプレイ２２へ送信する。画像生成部２１ａは、キャラクタ画像ＣＧを生成する際には、キャラクタの一部又は全部の画像中における位置を少しずつ変化させた画像を生成する。そして、画像データを連続的にディスプレイ２２へ送信することで、ユーザはディスプレイ２２上で動作を伴ったキャラクタを参照することができ、エージェント機能の効果を高めることができる。例えば、エージェント機能を実行中においては、画像生成部２１ａは１秒間に３０画像のキャラクタ画像ＣＧを生成する。なお、生成する画像数が多いほどキャラクタは滑らかに動作して見えるが、一方で通信装置２の処理負荷は増加することとなる。

実行部２１ｂは、ディスプレイ２２のタッチパネルが受け付けたユーザの操作内容を示す操作信号や、後述のマイクロフォン３５が取得したユーザの音声を示す音声データを受信し、これら操作信号や音声データに対応する処理を実行する。

停止部２１ｃは、サーバ装置４へ停止信号を送信し、サーバ装置４が情報を送信するのを停止する。

解除部２１ｄは、サーバ装置４において停止部２１ｃにより情報送信が停止された場合に、サーバ装置４へ解除信号を送信し、情報送信の停止を解除する。

通知部２１ｅは、記憶部２４に記憶された容量データ２４ａを参照し、サーバ装置４へ容量データ２４ａを送信する。

キャッシュメモリ２１ｆは、制御部２１のＣＰＵに備わる高速小容量のＲＡＭである。キャッシュメモリ２１ｆを利用することで、制御部４１は、記憶部２４より高速にデータの入出力を行うことができる。

このような各種機能を備える制御部２１は、連携部２６を制御して画像生成部２１ａが生成したキャラクタ画像ＣＧを車載装置３へ所定頻度で送信し、送信したキャラクタ画像ＣＧを車載装置３で表示させる手段としても機能する。

車載装置３は、制御部３１、連携部３２、ディスプレイ３３、スピーカ３４、マイクロフォン３５、ナビゲーション部３６、及び、記憶部３７を備える。

制御部３１は、車載装置３全体を統括的に制御するマイクロコンピュータであり、ＣＰＵ、ＲＡＭ、及びＲＯＭを備える。また、制御部３１は、ディスプレイ３３及びスピーカ３４と電気的に接続され、ディスプレイ３３に各種情報を表示させ、スピーカ３４から各種音声を出力させる。

連携部３２は、通信装置２とケーブルで接続され、通信装置２とデータの送受信を行う。

ディスプレイ３３は、文字や図形等の各種情報を表示して、車両１のドライバに情報を提示する表示装置である。例えば、液晶ディスプレイ、プラズマディスプレイ、有機ＥＬディスプレイ等である。なお、ディスプレイ３３は、タッチパネルを備え、ユーザの操作に用いられる。

スピーカ３４は、制御部３１からの信号に応じた音声を出力し、車両１のドライバに音声情報を報知する。

マイクロフォン３５は、ユーザの発話による音声を集音する。マイクロフォン３５は、集音して得られた音声情報を制御部３１に入力する。なお、道路上の騒音等を不必要に集音しないよう、正面の感度が高い単一指向性のマイクロフォンを採用することが望ましい。

ナビゲーション部３６は、目的地までの走行経路を案内するナビゲーション機能を実行する。ナビゲーション部３６は、ユーザにより目的地が設定されると、ＧＰＳ等の測位システムで取得される車両１の現在位置から目的地までの経路を導出し、ユーザへ案内を行う。また、ナビゲーション部３６は、記憶部３７に記憶された地図データ３７ａを用いて車両１周辺の地図画像を生成する。地図画像は、制御部３１によりディスプレイ３３に表示され、走行中等にユーザにより参照される。

記憶部３７は、フラッシュメモリ等の不揮発性の記憶装置であり、各種情報を記憶する。記憶部３７は、ナビゲーション機能で用いられる地図データ３７ａの他、プログラム３７ｂを記憶している。地図データ３７ａは、道路データ及び施設データを記録している。

プログラム３７ｂは、制御部３１により読み出され、制御部３１が車載装置３を制御するために実行されるファームウェアである。

＜３．サーバの構成＞
図６は、サーバ装置４の構成を示す。サーバ装置４は、制御部４１、記憶部４２、及び、通信部４３を備える。

制御部４１は、ＣＰＵ、ＲＡＭ、及びＲＯＭを備えたコンピュータである。後述の記憶部４２に記憶されたプログラム４２ｄに従いＣＰＵが演算処理を実行し、制御部４１の各種機能が実現される。制御部４１は、音声認識部４１ａ、情報生成部４１ｂを備える。

音声認識部４１ａは、後述の音声認識辞書４２ａを参照し、ユーザの音声の特徴量に基づいてユーザの音声を文字に変換する。そして、音声認識処理の認識結果として、ユーザの音声を表す文字データを生成する。

また、音声認識部４１ａは、音声認識処理の認識結果の文字データから、助詞や接続詞等の不用語を消去し、単語を抽出する。そして、抽出した単語と、後述の意味判定辞書４２ｂとに基いて、ユーザの音声がどのような意味に該当するか判定する。音声認識部４１ａは、その検索条件を満足するデータをデータベース４２ｃから検索する。検索条件は、例えば、「近く」等の距離や「レストラン」等の施設種別等である。この検索において、車両１の位置が必要な場合は、通信装置２のナビゲーション部３６から車両１の位置を取得すればよい。そして、音声認識部４１ａは、音声認識処理の処理結果として、その検索結果を通信装置２に通信部４３を介して送信する。

情報生成部４１ｂは、サーバ装置４がネットワーク５を介して接続された通信装置２を持つユーザに対し、通知すべき情報を生成する。例えば、気象情報や道路交通情報である。また、地域の情報や経済情報等、ユーザにより予め指定された情報である。情報は所定時間毎又は所定イベントが発生した都度、文字データとして生成される。情報生成部４１ｂにより生成された情報は、ネットワーク５を介して通信装置２へ送信される。

記憶部４２は、例えば、ハードディスク等の不揮発性の記憶装置であり、各種情報を記憶している。記憶部４２は、音声認識辞書４２ａ、意味判定辞書４２ｂ、データベース４２ｃ、及び、プログラム４２ｄを記憶している。

音声認識辞書４２ａは、音声認識部４１ａがユーザの音声を認識する際に参照する辞書である。音声認識辞書４２ａは、音声の特徴量と文字との対応関係を示すデータを含む。

意味判定辞書４２ｂは、音声認識部４１ａによりユーザの音声の意味を判定する際に参照される辞書である。音声認識辞書４２ａは、単語と意味との対応関係を示すデータを含む。

データベース４２ｃは、音声認識部４１ａが検索対象とするデータベースである。データベース４２ｃは、ナビゲーション機能の目的地の候補となる多数の施設のデータを含む。データベース４２ｃに含まれるデータは、定期的に最新のものに更新される。

プログラム４２ｄは、制御部４１により読み出され、制御部４１がサーバ装置４を制御するために実行されるファームウェアである。

通信部４３は、ネットワーク５に接続され、ネットワーク５に接続可能な他の通信装置とデータ通信が可能である。このため、通信部４３は、通信装置２とネットワーク５を介し、データの送受信を行う。

＜４．エージェント機能の処理手順＞
次に、通信システム１０によるエージェント機能の処理手順を図７から図１１を用いて説明する。図７から図９は、エージェント機能の処理のフローチャートを示す。図中、左のフローチャートは車載装置３、中央は通信装置２、右はサーバ装置４の処理手順を示す。図１０及び図１１は、車載装置３のディスプレイ３３での表示例を示す。

まず、図７から図９を参照し、エージェント機能の処理手順を説明する。エージェント機能の開始前は、車載装置３の制御部３１が、ディスプレイ３３に車両１周辺の地図を含むナビゲーション画像ＮＶを表示する。このような状態において、連携部２６と連携部３２とがケーブルで接続され、通信装置２と車載装置３との通信が確立されると、エージェント機能が開始される。通信装置２の制御部２１は、キャラクタ画像ＣＧを含むエージェント画像ＥＧを生成し、車載装置３へ送信する。車載装置３は、ディスプレイ３３の左半面に車両１周辺の地図を含むナビゲーション画像ＮＶを表示し、右半面にキャラクタ画像ＣＧを含むエージェント画像ＥＧを表示する。

エージェント機能が開始されると、車載装置３の制御部３１が、ユーザがディスプレイ３３のタッチパネルをタッチして所望の操作を行おうとしているか否か判断する（ステップＳ１１）。所望の操作とは、例えば、諸機能の設定操作やオーディオの操作等である。

制御部３１は、ユーザによるタッチパネルへのタッチがないと判断する場合は（ステップＳ１１でＮｏ）、通信装置２から送信されるキャラクタ画像ＣＧを含むエージェント画像ＥＧの表示を行う（ステップＳ１３）。

一方、制御部３１は、ユーザによるタッチパネルへのタッチがあると判断する場合は（ステップＳ１１でＹｅｓ）、タッチされたタッチパネル上の座標を示す信号を操作信号として通信装置２へ送信する（ステップＳ１２）。

通信装置２の画像生成部２１ａは、車載装置３から送信された操作信号に含まれる座標に基づき、ユーザの所望する操作を判別し、当該操作に対応するキャラクタ画面を生成する（ステップＳ１３）。例えば、生成されるキャラクタ画像ＣＧは、ユーザの操作を受け付けた旨を示すジェスチャー及び動作を伴ったキャラクタの画像である。また、ユーザの操作がない場合には、ディスプレイ３３上でキャラクタを動作させるための画像を生成する（ステップＳ１３）。したがって、画像生成部２１ａは、動きのあるキャラクタ画像ＣＧを生成するために、キャラクタの位置を少しずつ変化させた静止画を複数生成する。ユーザの音声を受信しない期間において生成する画像数は、例えば、画像を表示させた場合に１秒間に３０画像を表示できる画像数である。なお、生成する画像数が多いほど、キャラクタは滑らかな動作で表示される。

通信装置２の制御部２１は、連携部２６を制御し、生成された複数のキャラクタ画像ＣＧを車載装置３へ順次送信する（ステップＳ３２）。この際、制御部２１は、１秒間に３０画像を送信する。これにより、車載装置３のディスプレイ３３では、滑らかに動作するキャラクタ画像ＣＧを表示することができる。

車載装置３の制御部３１は、通信装置２から送信されたキャラクタ画像ＣＧをディスプレイ３３に表示する。複数のキャラクタ画像ＣＧをディスプレイ３３に順次表示することで、ユーザはタッチパネルに対する操作に対応したジェスチャーと動作を伴ったキャラクタ画像ＣＧを参照することができ、キャラクタとのコミュニケーションを通じた操作を行うことができる。

次に、車載装置３の制御部３１は、ユーザが音声による操作を行おうとしているか否か判断する（ステップＳ１４）。すなわち、エージェント画像ＥＧのマイクアイコンＩＣ３の座標にタッチがあったか否か判断する。

制御部３１は、該当座標にタッチがなかったと判断する場合は（ステップＳ１４でＮｏ）、ステップＳ１１に戻り、以後ステップＳ１１からステップＳ１４を繰り返し実行する。また、制御部３１は、該当座標にタッチがあったと判断する場合は（ステップＳ１４でＹｅｓ）、音声操作の開始指示信号を通信装置２へ送信する（ステップＳ１５）。

一方、通信装置２の制御部２１は、ステップＳ５２でキャラクタ画像ＣＧの送信を実行すると、車載装置３からの開始指示信号を受信したか否か判断する（ステップＳ５３）。制御部２１は、開始指示信号を受信していないと判断すると（ステップＳ５３でＮｏ）、再度キャラクタ画像ＣＧの生成と送信を実行する（ステップＳ３１及びステップＳ３２）。この際、画像生成部２１ａは、画像を表示させた場合に１秒間に３０画像を表示できる画像数を生成及び送信する。これにより、ユーザは、音声操作の開始指示前、すなわち音声の非受信中において、滑らかに動作するキャラクタ画像ＣＧを車載装置３のディスプレイ３３で参照することができる。

一方、制御部２１は、開始指示信号を受信したと判断すると（ステップＳ３３でＹｅｓ）、以下の４つの処理を実行する。まず、第１の処理として、画像生成部２１ａがキャラクタ画像ＣＧの生成頻度を低減する（ステップＳ３４）。例えば、１秒間に３０画像を生成していた場合に、１秒間に１画像の生成とする。図１０は、キャラクタ画像ＣＧの生成頻度及び送信頻度の例を示す。図１０に示すように、画像生成部２１ａは、キャラクタの動きを少しずつ変化させた画像ＥＧａ、ＥＧｂ、及び、ＥＧｃを１秒毎に順次生成する。なお、画像ＥＧａ、ＥＧｂ、及び、ＥＧｃを生成後、３つの画像を記憶部２４に記憶しておいてもよい。この場合は、一旦、３つの画像ＥＧａ、ＥＧｂ、及び、ＥＧｃを生成した後は、新たな画像を生成する必要はない。このように、ユーザの音声の受信中はキャラクタ画像ＣＧの生成頻度を低下させるので、画像生成の処理と音声受信の処理とが重複した場合であっても、処理負荷を過大とせずに、音声受信の処理を行うと共に車載装置においてキャラクタ画像ＣＧの表示を継続することができる。

次に、第２の処理として、制御部２１がキャラクタ画像ＣＧの送信頻度を低減する（ステップＳ３５）。例えば、１秒間に３０画像を送信していた場合に、１秒間に１画像の送信とする。例えば、図１０の矢印に示す順序で、画像ＥＧａ、ＥＧｂ、及び、ＥＧｃを１秒毎に順次来り返し送信する。画像に少しずつ変化のあるキャラクタ画像ＣＧが順次送信されることにより、送信頻度が低減されても、キャラクタ画像ＣＧはディスプレイ３３において動作を伴って表示される。このように、ユーザの音声の受信中はキャラクタ画像ＣＧの送信頻度を低下させるので、画像送信の処理と音声受信の処理とが重複した場合であっても、処理負荷を過大とせずに、音声受信の処理を行うと共に車載装置においてキャラクタ画像ＣＧの表示を継続することができる。また、ユーザからの開始指示がなされた場合に、キャラクタ画像ＣＧを送信する頻度を低下させるので、遅滞なくキャラクタ画像ＣＧの送信頻度を低下させることができる。

次に、第３の処理として、制御部２１は、車載装置３のディスプレイ３３におけるタッチ領域を制限する（ステップＳ３６）。すなわち、ユーザがタッチ可能なボタン数を減少させる処理を行う。制御部２１は、音声入力をキャンセルするキャンセルボタン（後述）の座標以外の座標の操作信号を受信しない（当該座標に対応する処理を実行しない）ことでタッチ用のボタンを無効化する。このように、制御部２１は、ユーザの音声の受信中は音声の非受信中よりも少ない操作に係る操作信号を受信するので、音声の受信による処理負荷が増加した場合であっても、ユーザの全ての操作に対応する処理を実行することがない。このため、通信装置２の処理負荷が過大となるのを防止できる。なお、車載装置３の制御部３１は、ディスプレイ３３に表示した無効化されたタッチ用のボタンであるアイコンＩＣ１からＩＣ３の色調を低下（いわゆる、トーンダウン）させることが好ましい。タッチしても実行されないボタンであることを認識することで、ユーザは故障でないことを判別でき、また実行されない不要な操作を行うことがない。また、無効化されたボタンを表示しないようにしてもよい。

次に、第４の処理として、画像生成部２１ａは、エージェント画像ＥＧに音声を受信中である旨を付加する（ステップＳ３７）。図１１は、エージェント画像ＥＧに音声を受信中である旨を付加した例である。図１１に示すように、画像生成部２１ａは、例えば、「ただ今、音声を受信中です。」との画像ＪＡをキャラクタ画像ＣＧと並べて表示する。これにより、キャラクタ画像の生成及び送信の頻度が低下し、キャラクタの動作の滑らかさが多少低下した場合であっても、ユーザは音声を受信中であることを認識することにより、異常の発生でないと判断できる。なお、第４の処理において、エージェント画像ＥＧに音声入力の「キャンセル」を行うキャンセルボタンＣＡを表示する。後述するように、ユーザは、キャンセルボタンＣＡにタッチすることで、タッチ座標が通信装置２へ送信され、音声入力を中止することができる。

これら第１ないし第４の処理が実行されることにより、通信装置２の制御部２１における画像生成及び送信の処理負荷を低減させることができる。したがって、通信装置２の制御部２１においてユーザの音声の受信及び送信処理が増大しても、通信装置２の処理負荷が過大となることがない。さらに、キャラクタ画像ＣＧの生成頻度及び送信頻度を低減させても、キャラクタ画像ＣＧはディスプレイ３３において動作を伴って表示されるため、ユーザとの対話により車載装置３の操作を可能とするエージェント機能の効果を損なうことがない。

次に、ユーザが任意の音声を発声すると、車載装置３の制御部３１がマイクロフォン３５から出力される音声データを受信し、ユーザの音声を取得する（ステップＳ１６）。なお、開始指示がなされた後、所定時間（例えば、１０秒間）ユーザが音声を発声せず、制御部３１がユーザの音声を取得できなかった場合、制御部３１が音声の受信を終了する旨のメッセージをディスプレイ３３に表示させ、音声受信の処理を終了させてもよい。

制御部３１がユーザの音声を取得すると、連携部３２を介して音声データを通信装置２へ送信する（ステップＳ１７）（図２の矢印Ｃ１）。通信装置２は、車載装置３から音声データを受信すると、音声データをサーバ装置４へ送信する（ステップＳ３８）（図２の矢印Ｃ２）。

さらに、通信装置２はユーザの音声をサーバ装置４へ送信すると、サーバ装置４による情報提供を停止させる停止信号をサーバ装置４へ送信する（ステップＳ３９）。停止信号は、制御部２１の停止部２１ｃにより送信される。音声の受信処理中にサーバ装置４から情報が提供され、処理負荷が増加しないようにするためである。

また、通信装置２は停止信号をサーバ装置４へ送信すると、サーバ装置４からの提供情報を受信可能な容量をサーバ装置４へ通知する（ステップＳ４０）。音声の受信処理中にサーバ装置４から大きな容量の情報が提供されないようにするためである。受信可能容量の通知は、制御部２１の通知部２１ｅが、記憶部２４に記憶されている容量データ２４ａを参照し、連携部２６を介してサーバ装置４へ通知を行う。なお、容量データ２４ａは、制御部２１の備えるＣＰＵのキャッシュメモリ２１ｆの容量である。このため、通知部２１ｅは、提供情報を受信可能な容量をサーバ装置４へ通知する際には、容量データ２４ａを参照する。

このような通信装置２及び車載装置３の処理の間、サーバ装置４では所定の条件下で提供情報の生成が行われる（ステップＳ７１）。サーバ装置４での提供情報の生成は、前述の通り、所定時間毎や、気象状況、道路交通状況の変化等に応じて実行される。

サーバ装置４は、提供情報を生成すると、通信装置２から音声データを受信したか判断する（ステップＳ７２）。

サーバ装置４は、音声データを受信していないと判断すると（ステップＳ７２でＮｏ）、生成した提供情報を通信装置２へ送信する（ステップＳ８０）（図２の矢印Ｃ３）。サーバ装置４が音声データを受信していない場合は、通信装置２も音声を処理していないと考えられ、情報を提供しても通信装置２の処理負荷が過大となることがないからである。

一方、サーバ装置４は、音声データを受信していると判断すると（ステップＳ７２でＹｅｓ）、通信装置２から停止信号が送信されたか否か判断する（ステップＳ７３）。

サーバ装置４は、通信装置２から停止信号が送信されていないと判断すると（ステップＳ７３でＮｏ）、生成した提供情報を通信装置２へ送信する（ステップＳ８０）。なお、停止信号はユーザが声を発してから送信されるため、停止信号が送信されていない場合は、通信装置２の処理負荷が増大するような音声が入力されておらず、生成した提供情報を通信装置２へ送信することができる。

一方、サーバ装置４は、通信装置２から停止信号が送信されていると判断すると（ステップＳ７３でＹｅｓ）、生成した提供情報が通信装置２での受信可能な容量以内か否か判断する（ステップＳ７６）。サーバ装置４は、受信可能な容量以内であると判断すると（ステップＳ７６でＹｅｓ）、生成した提供情報を通信装置２へ送信する（ステップＳ８０）。これにより、サーバ装置４は停止信号を受信した場合であって、提供すべき情報の容量が受信容量以内である場合に情報の提供を行うので、通信装置２は処理負荷を過大とせずに情報の提供を受けることができる。なお、前述の通り、受信可能な容量とは、通信装置２の制御部２１が備えるＣＰＵのキャッシュメモリ２１ｆの記憶容量である。キャッシュメモリ２１ｆに対する情報の書き込み及び読み出しは、高速に処理できるため、通信装置２の処理負荷を過大とすることがない。

一方、サーバ装置４は、受信可能な容量以内でないと判断すると（ステップＳ７６でＮｏ）、生成した提供情報を記憶部４２に記憶する（ステップＳ７７）。なお、記憶部４２に記憶された提供情報は、後に情報の提供停止が解除された際に読み出されて通信装置２へ送信される。すなわち、サーバ装置４は、提供すべき情報の容量が受信可能容量より大きい場合には解除信号を受信してから情報の提供を行うので、通信装置２はユーザの音声の受信中に処理負荷が過大となるのを防止できる。

このような通信装置２及びサーバ装置４の処理の間、車載装置３は、ユーザに対し情報の受信を行うか否かの問合せを行う（ステップＳ１８）。このような問合せは、車載装置３のディスプレイ３３にタッチパネル用のボタンを表示し、ユーザのタッチ操作に基づいて行えばよい。

車載装置３の制御部３１は、ユーザのタッチ操作に基づき、ユーザが情報を受信する旨の操作をしたと判断すると（ステップＳ１８でＹｅｓ）、情報提供の停止処理の解除を行う解除信号を通信装置２へ送信する（ステップＳ１９）。なお、情報提供の停止処理の解除を行う場合には、エージェント画像ＥＧの更新を一時中断し、車載装置３の処理負荷を軽減すればよい。ユーザが情報を受信することを優先したと考えられるからである。一方、車載装置３の制御部３１は、ユーザが情報を受信しない旨の操作をしたと判断すると（ステップＳ１８でＮｏ）、後に説明するステップＳ２１以下の処理に進む。

通信装置２は、車載装置３から解除信号を受信すると、受信した解除信号をサーバ装置４へ送信する（ステップＳ４１）。解除信号は、制御部２１の解除部２１ｄにより送信される。

サーバ装置４では、通信装置２から解除信号が送信されたか否か判断する（ステップＳ７８）。サーバ装置４は、解除信号が送信されていないと判断すると（ステップＳ７８でＮｏ）、後に説明するステップＳ８１以下の処理に進む。

一方、サーバ装置４は、解除信号が送信されたと判断すると（ステップＳ７８でＹｅｓ）、記憶部４２に記憶しておいた提供情報を読み出し（ステップＳ７９）、通信装置２へ送信を行う（ステップＳ８０）。このように、サーバ装置４は解除信号に応じて記憶部４２に記憶した情報を提供するので、通信装置２は音声の受信中に提供が停止されていた情報の提供を受けることができる。

通信装置２の制御部２１は、サーバ装置４から提供情報が送信されると、提供情報を記憶部２４又はキャッシュメモリ２１ｆに記憶させる（ステップＳ４２）。制御部２１は、送信された提供情報が受信可能容量より多い場合は、提供情報を記憶部２４に記憶させる。また、提供情報が受信可能容量以下の場合は、提供情報をキャッシュメモリ２１ｆに記憶させる。サーバ装置４から提供される情報の容量をキャッシュメモリ２１ｆに一時的に記憶できる容量とすることで、通信装置２は処理負荷を過大とせずに情報の提供を受けることができる。キャッシュメモリ２１ｆに対する情報の書き込み及び読み出しは、高速に処理できるからである。

次に、通信装置２の制御部２１は、解除信号を既に受信しているか否か判断する（ステップＳ４３）。制御部２１は、解除信号を受信していると判断する場合は（ステップＳ４３でＹｅｓ）、記憶部２４又はキャッシュメモリ２１ｆから提供情報を読み出す（ステップＳ４４ａ）。そして、画像生成部２１ａが提供情報を表示する画像を生成し、生成した画像を車載装置３へ送信する（ステップＳ４５）（図２の矢印Ｃ４）。一方、制御部２１は、解除信号を受信していないと判断する場合であって（ステップＳ４３でＮｏ）、キャッシュメモリ２１ｆに提供情報が記憶されている場合は、提供情報を読み出し（ステップＳ４４ｂ）、車載装置３へ送信する（ステップＳ４５）。なお、解除信号を受信しておらずユーザの音声の処理が継続している場合であっても、キャッシュメモリ２１ｆからの提供情報の読み出しは高速に処理できるため、通信装置２において処理負荷が過大とならない。

車載装置３は、通信装置２から提供情報が送信されると、ディスプレイ３３に情報を表示する（ステップＳ２０）。情報の表示は、図４に示すように、エージェント画像ＥＧに提供情報ＤＡを表示して行う。これにより、ユーザはサーバ装置４から提供された最新の気象情報や道路交通情報を参照することができる。

次に、車載装置３の制御部３１は、ユーザにより音声入力のキャンセルがあったか否か判断する（ステップＳ２１）。制御部３１は、ディスプレイ３３のタッチパネルに表示したキャンセルボタンＣＡに対し、ユーザがタッチ操作を行ったか否かにより判断する。

制御部３１は、音声入力のキャンセルがあったと判断する場合は（ステップＳ２１でＹｅｓ）、キャンセル信号を通信装置２へ送信する。また、キャンセルがないと判断する場合は（ステップＳ２１でＮｏ）、キャンセル信号の送信は行わず、後述のステップＳ２４へ進む。

通信装置２は、車載装置３から受信したキャンセル信号をサーバ装置４へ送信する（ステップＳ４６）。

次に、サーバ装置４が、通信装置２からキャンセル信号が送信されたか否か判断する（ステップＳ８１）。サーバ装置４は、キャンセル信号が送信されたと判断すると（ステップＳ８１でＹｅｓ）、ステップＳ７７で記憶部４２に記憶しておいた提供情報の読み出し処理を行う（ステップＳ８２）。そして、読み出した提供情報を通信装置２へ送信する（ステップＳ８３）（矢印Ｃ３）。なお、音声入力がキャンセルされた後に、提供情報を通信装置２へ送信するため、情報の提供により通信装置２の処理負荷が過大となることはない。

一方、サーバ装置４は、キャンセル信号が送信されていないと判断すると（ステップＳ８１でＮｏ）、後述のステップＳ８４の処理へ進む。

車載装置３では、ユーザによる音声入力のキャンセルがないとした場合に実行される判断である、音声入力が終了したか否かの判断を行う（ステップＳ２２）。音声入力が終了したか否かの判断は、ユーザの発声がなくなってから所定時間が経過したか否かにより行われる。所定時間は、例えば３[秒]である。

車載装置３は、ユーザの音声入力が終了していないと判断する場合は（ステップＳ２２でＮｏ）、ステップＳ１６の処理に戻り、ユーザの音声の受信を継続する。その後、ステップＳ１６以下の処理を再度実行する。

一方、車載装置３は、ユーザの音声入力が終了したと判断する場合は（ステップＳ２２でＹｅｓ）、音声入力が終了した旨を示す音声終了信号を通信装置２へ送信する（ステップＳ２３）。

通信装置２は、車載装置３から音声終了信号を受信すると、受信した音声終了信号をサーバ装置４へ送信する（ステップＳ４７）。

サーバ装置４では、音声終了信号の受信の有無に基づき、ユーザによる音声の入力が終了したか否か判断される（ステップＳ８４）。サーバ装置４の制御部４１は、音声の入力が終了しないと判断する場合は（ステップＳ８４でＮｏ）、ステップＳ７１の提供情報の生成の処理に戻り、ステップＳ７１以下を再度実行する。

一方、サーバ装置４の制御部４１は、音声の入力が終了したと判断する場合は（ステップＳ８４でＹｅｓ）、ステップＳ７７で記憶部４２に記憶しておいた提供情報の読み出し処理を行う（ステップＳ８５）。そして、読み出した提供情報を通信装置２へ送信する（ステップＳ８６）（矢印Ｃ３）。なお、音声入力が終了した後に、提供情報を通信装置２への送信するため、情報の提供により通信装置２の処理負荷が過大となることはない。

通信装置２では、ステップＳ４７で音声終了信号をサーバ装置４へ送信すると、記憶部２４から提供情報を読み出す（ステップＳ４８）。そして、画像生成部２１ａが提供情報を表示する画像を生成し、生成した画像を車載装置３へ送信する（ステップＳ４９）（図２の矢印Ｃ４）。ユーザの音声の受信が終了した後に、通信装置２の記憶部２４に一時的に記憶した情報を車載装置３に送信するので、通信装置２はユーザの音声の受信中に処理負荷が過大となるのを防止し、車載装置３は音声の受信が終了した後に情報の提供を受けることができる。

また、通信装置２は、ステップＳ８２又はステップＳ８６の処理によりサーバ装置４から提供情報が送信されると、車載装置３へ提供情報を表示する画像を送信する（ステップＳ４９）（図２の矢印Ｃ４）。

車載装置３は、通信装置２からの提供情報を受信すると、ディスプレイ３３に提供情報を表示する（ステップＳ２４）。情報の表示は、図４に示すように、エージェント画像ＥＧに提供情報ＤＡを表示して行う。これにより、ユーザはサーバ装置４から提供された最新の気象情報や道路交通情報を参照することができる。

次に、サーバ装置４の音声認識部４１ａが、受信したユーザの音声を認識する音声認識処理を以下のように実行する（ステップＳ８７）。まず、音声認識部４１ａは、音声データのうちユーザの音声が含まれる区間を抽出する。例えば、音声データのうち所定の閾値を超えるレベルの信号が連続する区間を抽出する。

次に、音声認識部４１ａは、音声認識辞書４２ａを参照し、ユーザの音声の特徴量に基づいてユーザの音声を文字データに変換する。そして、変換した文字データから、助詞や接続詞等の不用語を消去して単語を抽出する。

次に、音声認識部４１ａは、抽出した単語を検索条件として意味判定辞書４２ｂを用い、ユーザの音声がどのような意味に該当するか検索を行う。検索条件は、例えば「レストラン」等の種別条件、「近く」等の距離条件等である。検索において、車両１の位置が必要な場合は、車載装置３のナビゲーション部３６から車両１の位置を取得すればよい。そして、音声認識部４１ａは、検索条件に合致するデータをデータベースから検索し、検索結果を通信装置２に通信部４３を介して送信する（ステップＳ８８）（図２の矢印Ｃ３）。ステップＳ８８が実行されると、サーバ装置４の処理は終了する。

通信装置２は、サーバ装置４から送信された音声認識の検索結果を、通信部２３を介して受信する。通信装置２の画像生成部２１ａは、受信した検索結果に基づいた画像を生成する（ステップＳ５０）。画像生成部２１ａにより生成される画像は、例えば、エージェント画像ＥＧに検索結果の一覧を付加した画像である。また、例えば、一覧に含まれる各項目が施設である場合には、施設の位置がナビゲーション画像ＮＶ上においてアイコンによって示される。

画像生成部２１ａにより検索結果に基づいた画像が生成されると、制御部２１は連携部２６を介して画像を車載装置３へ送信する（ステップＳ５１）（図２の矢印Ｃ４）。ステップＳ５１が実行されると、通信装置２の処理は終了する。

車載装置３は、検索結果に基づいた画像を受信すると、ディスプレイに当該画像を表示する（ステップＳ２５）。ステップＳ２５が実行されると、車載装置３の処理は終了する。検索結果が施設である場合、ユーザが表示された画像に示される検索結果一覧の項目の一つを選択すると、ナビゲーション部３６により当該項目の施設がナビゲーション機能の目的地に設定される。以降、ナビゲーション部３６は、この目的地までのルート案内を実行する。

以上のように、本実施の形態においては、ユーザとの対話を行うエージェント機能の実行において、静止画を連続して表示することで動作を伴うキャラクタ画像ＣＧを表示する際、ユーザの音声の受信中か非受信中かに応じて、表示する静止画の数を変える。すなわち、ユーザの音声の受信中には、通信装置２は、キャラクタ画像ＣＧを車載装置３へ送信する頻度を低下させることで表示する静止画の数を減らす。これにより、音声の受信処理とキャラクタ画像ＣＧの送信処理が同時に実行されても、通信装置２の処理負荷が過大となることがない。したがって、処理負荷が過大となった場合に生じる処理停止状態（いわゆる、フリーズ）を回避でき、音声の受信中におけるキャラクタ画像ＣＧの動作停止を防止できる。

＜５．変形例＞
以上、本発明の実施の形態について説明したが、この発明は上記実施の形態に限定されるものではなく様々な変形が可能である。以下、このような変形例について説明する。なお、上記実施の形態及び以下で説明する形態を含む全ての形態は、適宜、組み合わせ可能である。

上記実施の形態では、通信装置２はサーバ装置４と協働することによりエージェント機能を実行すると説明したが、通信装置２が単独でエージェント機能を実行可能としてもよい。この場合、通信装置２が、音声認識部４１ａを備えればよい。また、通信装置２は、サーバ装置４との協働によるエージェント機能と、通信装置２単独でのエージェント機能とのいずれも実行可能とし、サーバ装置４との通信状態に応じていずれを実行するかを選択してもよい。

また、上記実施の形態では、車載装置３にマイクロフォンを備えたが、通信装置２にマイクロフォンを備え、通信装置２のマイクロフォンからユーザの音声を入力し、サーバ装置４へ送信してもよい。

また、上記実施の形態では、車載装置３は、車両１に搭載される装置として説明したが、携帯電話やスマートフォン等の車両１に固定して設置されない可搬性の装置であってもよい。

また、上記実施の形態では、通信装置２と車載装置３とは、別体の装置として説明したが、一体の装置であってもよい。

また、上記実施の形態では、音声認識部４１ａが検索結果を送信するとしたが、コマンドを送信してもよい。例えば、ユーザにより音量の調整や再生楽曲の選曲を意味する音声が発話された場合、サーバ装置４から音量調整や楽曲選曲を示すコマンドが通信装置２に送信され、車載装置３にて当該コマンドが実行されてもよい。

また、上記実施の形態では、通信装置２と車載装置３とは、ケーブルで接続されるとしたが、無線通信で接続されてもよい。

また、上記実施の形態では、サーバ装置４にキャラクタ画像ＣＧのデータベースを備え、キャラクタやキャラクタの衣装を変更可能としてもよい。いわゆるエンターテイメント性を向上させることで、ユーザは自らの嗜好に合致したキャラクタとの対話を楽しみながら、エージェント機能を使用することができる。

また、上記実施の形態では、通信装置２及び車載装置３のユーザは、車両１のドライバであると説明したが、ドライバ以外の乗車者であってもよい。

また、上記実施の形態では、音声認識処理をサーバ装置４で行っていたが、通信装置２で行ってもよい。この場合、サーバ装置４はデータベースによる施設等の検索や提供情報の生成を行えばよい。

また、上記実施の形態では、プログラムに従ったＣＰＵの演算処理によってソフトウェア的に各種機能が実現されると説明したが、これら機能のうちの一部は電気的なハードウェア回路により実現されてもよい。

１車両
２通信装置
３車載装置
４サーバ装置
５ネットワーク
１０通信システム

Claims

車載装置と通信する通信装置であって、
ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
を備え、
前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とする通信装置。
請求項１に記載の通信装置において、
前記生成手段は、前記キャラクタ画像を所定の頻度で生成し、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を生成する頻度を低下させること特徴とする通信装置。
請求項１または２に記載の通信装置において、
前記生成手段は、前記ユーザの音声の受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加することを特徴とする通信装置。
請求項１ないし３のいずれかに記載の通信装置において、
前記受信手段は、前記ユーザから開始指示がなされた後に、前記音声の受信を開始し、
前記送信手段は、前記開始指示がなされた場合に、前記キャラクタ画像を送信する頻度を低下させること特徴とする通信装置。
請求項１ないし４のいずれかに記載の通信装置において、
前記車載装置に対する前記ユーザの操作に係る操作信号を受信する操作信号受信手段と、
前記操作信号受信手段が受信した前記操作信号に対応する処理を実行する実行手段と、
をさらに備え、
前記操作信号受信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信することを特徴とする通信装置。
特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、
前記通信装置は、
ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
を備え、
前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させることを特徴とする通信システム。
請求項６に記載の通信システムにおいて、
前記通信装置は、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、をさらに備え、
前記サーバ装置は、前記停止信号を受信した場合に、少なくとも一部の前記特定情報の提供を停止することを特徴とする通信システム。
請求項７に記載の通信システムにおいて、
前記通信装置は、前記サーバ装置に前記特定情報の提供の停止を解除させる解除信号を送信する解除手段、をさらに備え、
前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報を記憶する第１記憶手段、をさらに備え、
前記サーバ装置は、前記解除信号を受信した場合に、前記第１記憶手段に記憶した前記特定情報の提供を行うことを特徴とする通信システム。
請求項７または８に記載の通信システムにおいて、
前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、
前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合は、前記特定情報の提供を行うことを特徴とする通信システム。
請求項９に記載の通信システムにおいて、
前記通信装置は、キャッシュメモリを備え、
前記受信容量は、前記キャッシュメモリに一時的に記憶できる容量であることを特徴とする通信システム。
請求項８に記載の通信システムにおいて、
前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、
前記サーバ装置は、前記停止信号を受信した場合において、
前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合に、前記特定情報の提供を行い、
前記通信装置に提供すべき特定情報の容量が前記受信容量より大きい場合に、前記特定情報を前記第１記憶手段に記憶することを特徴とする通信システム。
請求項９ないし１１のいずれかに記載の通信システムにおいて、
前記通信装置は、前記ユーザの音声の受信中に、前記サーバ装置から提供された特定情報を一時的に記憶する第２記憶手段、をさらに備え、
前記送信手段は、前記ユーザの音声の受信が終了した後に、前記第２記憶手段に一時的に記憶された前記特定情報を前記車載装置に送信することを特徴とする通信システム。
特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、
前記通信装置は、
ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、
を備え、
前記サーバ装置は、前記停止信号を受信すると、少なくとも一部の前記特定情報の提供を停止することを特徴とする通信システム。
車載装置と通信する通信方法であって、
（ａ）ユーザと対話を行うためのキャラクタ画像を生成する工程と、
（ｂ）前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、
（ｃ）前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、
を備え、
前記工程（ｂ）は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とする通信方法。
車載装置と通信する通信装置に含まれるコンピュータにより実行可能なプログラムであって、
前記コンピュータに、
（ａ）ユーザと対話を行うためのキャラクタ画像を生成する工程と、
（ｂ）前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、
（ｃ）前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、
を実行させ、
前記工程（ｂ）は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とするプログラム。