JP6105321B2 - 通信装置、通信システム、通信方法、及び、プログラム - Google Patents

通信装置、通信システム、通信方法、及び、プログラム Download PDF

Info

Publication number
JP6105321B2
JP6105321B2 JP2013032057A JP2013032057A JP6105321B2 JP 6105321 B2 JP6105321 B2 JP 6105321B2 JP 2013032057 A JP2013032057 A JP 2013032057A JP 2013032057 A JP2013032057 A JP 2013032057A JP 6105321 B2 JP6105321 B2 JP 6105321B2
Authority
JP
Japan
Prior art keywords
voice
user
character image
communication device
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013032057A
Other languages
English (en)
Other versions
JP2014164325A (ja
Inventor
祐 長田
祐 長田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2013032057A priority Critical patent/JP6105321B2/ja
Priority to US14/177,676 priority patent/US9262796B2/en
Publication of JP2014164325A publication Critical patent/JP2014164325A/ja
Application granted granted Critical
Publication of JP6105321B2 publication Critical patent/JP6105321B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)

Description

本発明は、ユーザの音声の認識結果を用いる技術に関する。
従来より、ユーザとキャラクタとの対話により機器の操作の円滑化を図る、いわゆるエージェント機能が知られている(例えば、特許文献1参照。)。例えば、ナビゲーション機器のディスプレイに表示されたキャラクタから「行き先は?」との問い掛けに対し、ユーザが「レストラン」と発声すると、付近のレストランがナビゲーションの目的地に設定される。このようなエージェント機能を用いることで、ユーザは、キャラクタとの対話を通して機器の操作や情報の検索を容易に行うことができる。
特開2006−154926号公報
上記のようなエージェント機能では、ユーザとキャラクタとのコミュニケーションを円滑にするため、動作を伴ったキャラクタ画像の表示や様々な問い掛け処理を継続的に行うことが望まれる。
しかしながら、キャラクタ画像の表示を継続して行うと、画像の表示処理とユーザの声の受信処理とが同時に行われる場合が生じ得る。この場合、機器の処理負荷が過大となり処理の停止状態(いわゆる、フリーズ)が発生し、音声の受信中にキャラクタ画像の動作が停止する恐れがあった。キャラクタ画像の動作が停止すると、ユーザとキャラクタとの円滑なコミュニケーションが阻害され、ユーザとの対話により機器の操作を容易に行うというエージェント機能の効果を十分に発揮できない恐れがあった。
本発明は、上記課題に鑑みてなされたものであり、ユーザの音声の受信中においてもキャラクタ画像の動作を停止させず、エージェント機能の効果を発揮できる技術を提供することを目的とする。
上記課題を解決するため、請求項1の発明は、車載装置と通信する通信装置であって、 ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、を備え、前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。
また、請求項2の発明は、請求項1に記載の通信装置において、前記生成手段は、前記キャラクタ画像を所定の頻度で生成し、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を生成する頻度を低下させる。
また、請求項3の発明は、請求項1または2に記載の通信装置において、前記生成手段は、前記ユーザの音声の受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加する。
また、請求項4の発明は、請求項1ないし3のいずれかに記載の通信装置において、前記受信手段は、前記ユーザから開始指示がなされた後に、前記音声の受信を開始し、前記送信手段は、前記開始指示がなされた場合に、前記キャラクタ画像を送信する頻度を低下させる。
また、請求項5の発明は、請求項1ないし4のいずれかに記載の通信装置において、前記車載装置に対する前記ユーザの操作に係る操作信号を受信する操作信号受信手段と、前記操作信号受信手段が受信した前記操作信号に対応する処理を実行する実行手段と、をさらに備え、前記操作信号受信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信する。
また、請求項6の発明は、特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、前記通信装置は、ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、を備え、前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。
また、請求項7の発明は、請求項6に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、少なくとも一部の前記特定情報の提供を停止する。
また、請求項8の発明は、請求項7に記載の通信システムにおいて、前記通信装置は、前記サーバ装置に前記特定情報の提供の停止を解除させる解除信号を送信する解除手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報を記憶する第1記憶手段、をさらに備え、前記サーバ装置は、前記解除信号を受信した場合に、前記第1記憶手段に記憶した前記特定情報の提供を行う。
また、請求項9の発明は、請求項7または8に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合は、前記特定情報の提供を行う。
また、請求項10の発明は、請求項9に記載の通信システムにおいて、前記通信装置は、キャッシュメモリを備え、前記受信容量は、前記キャッシュメモリに一時的に記憶できる容量である。
また、請求項11の発明は、請求項8に記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、前記サーバ装置は、前記停止信号を受信した場合において、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合に、前記特定情報の提供を行い、前記通信装置に提供すべき特定情報の容量が前記受信容量より大きい場合に、前記特定情報を前記第1記憶手段に記憶する。
また、請求項12の発明は、請求項9ないし11のいずれかに記載の通信システムにおいて、前記通信装置は、前記ユーザの音声の受信中に、前記サーバ装置から提供された特定情報を一時的に記憶する第2記憶手段、をさらに備え、前記送信手段は、前記ユーザの音声の受信が終了した後に、前記第2記憶手段に一時的に記憶された前記特定情報を前記車載装置に送信する。
また、請求項13の発明は、特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、前記通信装置は、ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、を備え、前記サーバ装置は、前記停止信号を受信すると、少なくとも一部の前記特定情報の提供を停止する。
また、請求項14の発明は、車載装置と通信する通信方法であって、(a)ユーザと対話を行うためのキャラクタ画像を生成する工程と、(b)前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、(c)前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、を備え、前記工程(b)は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。
また、請求項15の発明は、車載装置と通信する通信装置に含まれるコンピュータにより実行可能なプログラムであって、前記コンピュータに、(a)ユーザと対話を行うためのキャラクタ画像を生成する工程と、(b)前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、(c)前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、を実行させ、前記工程(b)は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させる。
請求項1ないし15の発明によれば、ユーザの音声の受信中はキャラクタ画像の送信頻度を低下させるので、画像送信の処理と音声受信の処理とが重複した場合であっても、音声受信の処理を行うと共に車載装置においてキャラクタ画像の表示を継続することができる。
また、特に請求項2の発明によれば、ユーザの音声の受信中はキャラクタ画像の生成頻度を低下させるので、画像生成の処理と音声受信の処理とが重複した場合であっても、音声受信の処理を行うと共に車載装置においてキャラクタ画像の表示を継続することができる。
また、特に請求項3の発明によれば、ユーザの音声を受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加するので、ユーザは通信装置が音声を受信中であることを認識することができる。
また、特に請求項4の発明によれば、ユーザからの開始指示がなされた場合に、キャラクタ画像を送信する頻度を低下させるので、遅滞なくキャラクタ画像の送信頻度を低下させることができる。
また、特に請求項5の発明によれば、ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信するので、音声の受信による処理負荷が増加した場合であっても、ユーザの全ての操作に対応する処理を実行することがないため、通信装置の処理負荷が過大となるのを防止できる。
また、特に請求項7及び13の発明によれば、サーバ装置は少なくとも一部の特定情報の提供を停止するので、通信装置で音声の受信中にサーバ装置から特定情報が提供されても、通信装置の処理負荷が過大となるのを防止できる。
また、特に請求項8の発明によれば、解除信号に応じて記憶手段に記憶された特定情報が提供されるので、通信装置は、音声の受信中に提供が停止されていた特定情報の提供を受けることができる。
また、特に請求項9の発明によれば、サーバ装置は停止信号を受信した場合であって、提供すべき情報の容量が受信容量以内である場合に特定情報の提供を行うので、通信装置は処理負荷を過大とせずに特定情報の提供を受けることができる。
また、特に請求項10の発明によれば、サーバ装置から提供される特定情報の容量をキャッシュメモリに一時的に記憶できる容量とすることで、通信装置は処理負荷を過大とせずに提供情報の提供を受けることができる。
また、特に請求項11の発明によれば、サーバ装置は、提供すべき特定情報の容量が受信容量より大きい場合には解除信号を受信してから特定情報の提供を行うので、通信装置はユーザの音声の受信中に処理負荷が過大となるのを防止できる。
また、特に請求項12の発明によれば、ユーザの音声の受信が終了した後に、第2記憶手段に一時的に記憶された特定情報を車載装置に送信するので、通信装置はユーザの音声の受信中に処理負荷が過大となるのを防止し、音声の受信が終了した後に特定情報の提供を受けることができる。
図1は、通信システムの概要を示す図である。 図2は、エージェント機能の概要を示す図である。 図3は、ディスプレイの表示例を示す図である。 図4は、ディスプレイの表示例を示す図である。 図5は、通信装置及び車載装置の構成を示す図である。 図6は、サーバ装置の構成を示す図である。 図7は、エージェント機能の処理手順を示す図である。 図8は、エージェント機能の処理手順を示す図である。 図9は、エージェント機能の処理手順を示す図である。 図10は、エージェント画像の例を示す図である。 図11は、ディスプレイの表示例を示す図である。
以下、図面を参照しつつ本発明の実施の形態について説明する。
<1.音声処理システムの概要>
図1は、本実施の形態に係る通信システム10の概要を示す。通信システム10は、車両1内に持ち込まれる通信装置2、車両1に搭載される車載装置3、及び、車両1の外部に配置されるサーバ装置4を備えている。
車載装置3は、目的地までのルートを案内するナビゲーション機能と楽曲を再生するオーディオ機能と備えている。
サーバ装置4と通信装置2とは、インターネット等のネットワーク5を介し、相互にデータを送受信する。
通信システム10は、車載装置3のディスプレイに人物等のキャラクタ画像を表示する。ユーザは、表示されたキャラクタとの対話により、車載装置3に所望の動作を実行させることができる。通信システム10は、このようなユーザとキャラクタとの対話により機器の操作を行う、いわゆるエージェント機能を備える。
エージェント機能では、車両1のユーザ(代表的にはドライバ)の発話による音声を対象とした音声認識処理を行い、その認識結果に応じた動作を実行する。車両1のユーザは、様々な音声を発声することで、機器の操作や情報の検索を行うことができる。
また、エージェント機能では、サーバ装置4が生成した特定の情報が通信装置2を介して車載装置3へ送信(提供)され、車載装置3にて情報が表示される。このような情報は、例えば気象情報や道路交通情報であり、ユーザは車両1内において最新の情報を参照することができる。
図2は、通信システム10が実行するエージェント機能の概要を示す。図2に示すように、サーバ装置4は、ユーザの音声を認識し、意味を解釈する音声認識部41aを備えている。
エージェント機能では、まず、車載装置3がユーザの音声を取得し、その音声を示す音声データを通信装置2に送信する(矢印C1)。通信装置2は、受信した音声データをサーバ装置4に送信する(矢印C2)。次に、サーバ装置4の音声認識部41aが、受信した音声データに対し音声認識処理を実行し、音声データをユーザの音声を表す文字データ(テキスト)に変換する。音声認識部41aは、音声認識処理の認識結果である文字データの意味に該当する施設等をデータベースから検索し、検索結果を通信装置2に送信する(矢印C3)。通信装置2は、音声認識部41aによる音声認識処理の処理結果として、施設等の検索結果をサーバ装置4から受信する。そして、通信装置2は、受信した処理結果に応じ、検索結果を一覧で表示する画像を生成する。例えば、ユーザが「近くのレストラン」と発声していた場合、通信装置2は車両1の周辺に存在するレストランの検索結果一覧をサーバ装置4から受信し、検索結果の一覧画像を生成する。そして、生成した画像を車載装置3へ送信する(矢印C4)。ユーザは、車載装置3のディスプレイに表示された検索結果の一覧から一つの項目を選択することで、例えば当該レストランをナビゲーション機能の目的地に設定することができる。
また、サーバ装置4が生成した各種情報が通信装置2を介して車載装置3へ送信される(矢印C3)。通信装置2は、情報を表示する画像を生成して車載装置3へ送信する(矢印C4)。これにより、車載装置3にて情報が表示され、ユーザは車両1内において気象情報や道路交通情報等の最新の情報を参照することができる。
このように通信装置2及び車載装置3は、サーバ装置4と協働することで、車両1のユーザの音声に応じた動作を実行したり、情報を提供するエージェント機能を実現する。なお、本実施の形態の説明においては、画像の「表示」処理は、ディスプレイに画像を表示する処理のみならず、画像の生成処理及び生成した画像の送信処理を含んで説明する場合がある。
図3は、車載装置3の例を示す。ディスプレイ33各種情報を表示する表示装置としてディスプレイ33を備える。ディスプレイ33は、タッチパネル機能を備え、ユーザの接触による操作を受け付け可能である。ディスプレイ33は、左半面にナビゲーション画像NVを表示し、右半面にエージェント画像EGを表示する。ナビゲーション画像NVは車載装置3で生成して表示され、エージェント画像EGは通信装置2から送信されて表示される。
エージェント画像EGには、キャラクタ画像CG、操作に用いられるメニュ画像MN、及び、各種アイコンIC1からIC3が含まれる。なお、キャラクタ画像CGは人物であることが好ましい。ユーザとの対話を行うためである。ただし、擬人化された動物や物であってもよい。つまり、ユーザとのコミュニケーションに資する画像であればよい。
また、車載装置3は、スピーカ34とユーザの声(音声)を取得するためのマイクロフォン35とを備える。スピーカ34からはユーザへの問い掛け等が音声で出力される。例えば、「行き先は?」等である。マイクロフォン35は、ノイズを取得しないよう、マイクアイコンIC3がユーザにより操作された場合に作動する。
ユーザはこのようなエージェント画像EGを参照しつつ、キャラクタとの対話を通じてタッチパネルへの操作やマイクロフォン35への音声による操作を行うことができる。
図4は、車載装置3の他の例を示す。エージェント機能では、サーバ装置4が生成した各種情報がネットワーク5及び通信装置2を介して車載装置3へ送信され、車載装置3にて情報が表示される。サーバ装置4は、所定時間毎や特定の事象が発生した場合、又はユーザの事前の設定に応じ、情報を生成及び送信する。例えば、図4に示すように、サーバ装置4から提供された気象情報TAがディスプレイ33に表示される。また、スピーカ34から音声としても出力される。ユーザは車両1内において、最新の情報を視聴することができる。
以下、このようなエージェント機能を実現する通信システム10について、詳細に説明する。
<2.通信装置及び車載装置の構成>
図5は、通信装置2及び車載装置3の構成を示す。図5上段は通信装置2の構成であり、図5下段は車載装置3の構成である。
通信装置2は、制御部21、ディスプレイ22、通信部23、記憶部24、カードスロット25、及び、連携部26を備える。
制御部21は、通信装置2の全体を統括的に制御するマイクロコンピュータであり、CPU、RAM、及びROMを備える。また、CPUは、キャッシュメモリ21fを備えている。制御部21が備える各部の動作については、後述する。
ディスプレイ22は、文字や図形等の各種情報を表示して、ユーザに情報を提示する表示装置である。例えば、液晶ディスプレイ、プラズマディスプレイ、有機ELディスプレイ等である。なお、ディスプレイ22は、タッチパネルを備え、ユーザの操作に用いられる。
通信部23は、ネットワーク5を介してサーバ装置4と無線通信を行い、サーバ装置4と連携してエージェント機能に必要なデータの送受信を行う。例えば、取得したユーザの音声を音声データとしてサーバ装置4に送信し、サーバ装置4から音声認識処理の検索結果を取得する。通信装置2は、通信部23を備えることにより、車載装置3とサーバ装置4との間におけるデータの中継器として機能する。
記憶部24は、各種データを記憶するメモリである。例えば、EEPROM(Electrical Erasable Programmable Read-Only memory)、フラッシュメモリ、磁気ディスクを備えたハードディスクドライブ等の不揮発性の記憶装置である。記憶部24は、容量データ24a及びプログラム24bを記憶している。
容量データ24aは、サーバ装置4から送信されるデータを通信装置2で記憶可能な容量を示し、[GB](Giga Byte:ギガバイト)や[MB](Mega Byte:メガバイト)等の単位で示される。容量データ24aは、制御部21の備えるCPUのキャッシュメモリ21fの容量である。
プログラム24bは、制御部21により読み出され、制御部21が通信装置2を制御するために実行されるファームウェアである。
カードスロット25は、フラッシュメモリ等の可搬性記録媒体であるメモリカード25aの差込口である。カードスロット25は、メモリカード25aからのデータの読み取りや、メモリカード25aへのデータの書き込みを行う。
連携部26は、車載装置3とケーブルで接続され、車載装置3とデータの送受信を行う。
また、制御部21は、記憶部24に記憶されたプログラム24bに従い、CPUの演算処理により実現される各種機能を備える。図中に示す画像生成部21a、実行部21b、停止部21c、解除部21d、及び、通知部21eは、プログラム25bに従って演算処理を行うことで実現される制御部21の機能及びハードウェアである。
画像生成部21aは、エージェント機能で使用されるユーザとの対話を行うためのキャラクタ画像CG、操作に用いられるメニュ画像MNやアイコン画像IC、ユーザへのメッセージ画像、及び、サーバ装置4から送信された検索結果や情報を表す画像を生成する。画像生成部21aは、画像を生成するとスクリーンキャプチャを行い、生成した画像データをディスプレイ22へ送信する。画像生成部21aは、キャラクタ画像CGを生成する際には、キャラクタの一部又は全部の画像中における位置を少しずつ変化させた画像を生成する。そして、画像データを連続的にディスプレイ22へ送信することで、ユーザはディスプレイ22上で動作を伴ったキャラクタを参照することができ、エージェント機能の効果を高めることができる。例えば、エージェント機能を実行中においては、画像生成部21aは1秒間に30画像のキャラクタ画像CGを生成する。なお、生成する画像数が多いほどキャラクタは滑らかに動作して見えるが、一方で通信装置2の処理負荷は増加することとなる。
実行部21bは、ディスプレイ22のタッチパネルが受け付けたユーザの操作内容を示す操作信号や、後述のマイクロフォン35が取得したユーザの音声を示す音声データを受信し、これら操作信号や音声データに対応する処理を実行する。
停止部21cは、サーバ装置4へ停止信号を送信し、サーバ装置4が情報を送信するのを停止する。
解除部21dは、サーバ装置4において停止部21cにより情報送信が停止された場合に、サーバ装置4へ解除信号を送信し、情報送信の停止を解除する。
通知部21eは、記憶部24に記憶された容量データ24aを参照し、サーバ装置4へ容量データ24aを送信する。
キャッシュメモリ21fは、制御部21のCPUに備わる高速小容量のRAMである。キャッシュメモリ21fを利用することで、制御部41は、記憶部24より高速にデータの入出力を行うことができる。
このような各種機能を備える制御部21は、連携部26を制御して画像生成部21aが生成したキャラクタ画像CGを車載装置3へ所定頻度で送信し、送信したキャラクタ画像CGを車載装置3で表示させる手段としても機能する。
車載装置3は、制御部31、連携部32、ディスプレイ33、スピーカ34、マイクロフォン35、ナビゲーション部36、及び、記憶部37を備える。
制御部31は、車載装置3全体を統括的に制御するマイクロコンピュータであり、CPU、RAM、及びROMを備える。また、制御部31は、ディスプレイ33及びスピーカ34と電気的に接続され、ディスプレイ33に各種情報を表示させ、スピーカ34から各種音声を出力させる。
連携部32は、通信装置2とケーブルで接続され、通信装置2とデータの送受信を行う。
ディスプレイ33は、文字や図形等の各種情報を表示して、車両1のドライバに情報を提示する表示装置である。例えば、液晶ディスプレイ、プラズマディスプレイ、有機ELディスプレイ等である。なお、ディスプレイ33は、タッチパネルを備え、ユーザの操作に用いられる。
スピーカ34は、制御部31からの信号に応じた音声を出力し、車両1のドライバに音声情報を報知する。
マイクロフォン35は、ユーザの発話による音声を集音する。マイクロフォン35は、集音して得られた音声情報を制御部31に入力する。なお、道路上の騒音等を不必要に集音しないよう、正面の感度が高い単一指向性のマイクロフォンを採用することが望ましい。
ナビゲーション部36は、目的地までの走行経路を案内するナビゲーション機能を実行する。ナビゲーション部36は、ユーザにより目的地が設定されると、GPS等の測位システムで取得される車両1の現在位置から目的地までの経路を導出し、ユーザへ案内を行う。また、ナビゲーション部36は、記憶部37に記憶された地図データ37aを用いて車両1周辺の地図画像を生成する。地図画像は、制御部31によりディスプレイ33に表示され、走行中等にユーザにより参照される。
記憶部37は、フラッシュメモリ等の不揮発性の記憶装置であり、各種情報を記憶する。記憶部37は、ナビゲーション機能で用いられる地図データ37aの他、プログラム37bを記憶している。地図データ37aは、道路データ及び施設データを記録している。
プログラム37bは、制御部31により読み出され、制御部31が車載装置3を制御するために実行されるファームウェアである。
<3.サーバの構成>
図6は、サーバ装置4の構成を示す。サーバ装置4は、制御部41、記憶部42、及び、通信部43を備える。
制御部41は、CPU、RAM、及びROMを備えたコンピュータである。後述の記憶部42に記憶されたプログラム42dに従いCPUが演算処理を実行し、制御部41の各種機能が実現される。制御部41は、音声認識部41a、情報生成部41bを備える。
音声認識部41aは、後述の音声認識辞書42aを参照し、ユーザの音声の特徴量に基づいてユーザの音声を文字に変換する。そして、音声認識処理の認識結果として、ユーザの音声を表す文字データを生成する。
また、音声認識部41aは、音声認識処理の認識結果の文字データから、助詞や接続詞等の不用語を消去し、単語を抽出する。そして、抽出した単語と、後述の意味判定辞書42bとに基いて、ユーザの音声がどのような意味に該当するか判定する。音声認識部41aは、その検索条件を満足するデータをデータベース42cから検索する。検索条件は、例えば、「近く」等の距離や「レストラン」等の施設種別等である。この検索において、車両1の位置が必要な場合は、通信装置2のナビゲーション部36から車両1の位置を取得すればよい。そして、音声認識部41aは、音声認識処理の処理結果として、その検索結果を通信装置2に通信部43を介して送信する。
情報生成部41bは、サーバ装置4がネットワーク5を介して接続された通信装置2を持つユーザに対し、通知すべき情報を生成する。例えば、気象情報や道路交通情報である。また、地域の情報や経済情報等、ユーザにより予め指定された情報である。情報は所定時間毎又は所定イベントが発生した都度、文字データとして生成される。情報生成部41bにより生成された情報は、ネットワーク5を介して通信装置2へ送信される。
記憶部42は、例えば、ハードディスク等の不揮発性の記憶装置であり、各種情報を記憶している。記憶部42は、音声認識辞書42a、意味判定辞書42b、データベース42c、及び、プログラム42dを記憶している。
音声認識辞書42aは、音声認識部41aがユーザの音声を認識する際に参照する辞書である。音声認識辞書42aは、音声の特徴量と文字との対応関係を示すデータを含む。
意味判定辞書42bは、音声認識部41aによりユーザの音声の意味を判定する際に参照される辞書である。音声認識辞書42aは、単語と意味との対応関係を示すデータを含む。
データベース42cは、音声認識部41aが検索対象とするデータベースである。データベース42cは、ナビゲーション機能の目的地の候補となる多数の施設のデータを含む。データベース42cに含まれるデータは、定期的に最新のものに更新される。
プログラム42dは、制御部41により読み出され、制御部41がサーバ装置4を制御するために実行されるファームウェアである。
通信部43は、ネットワーク5に接続され、ネットワーク5に接続可能な他の通信装置とデータ通信が可能である。このため、通信部43は、通信装置2とネットワーク5を介し、データの送受信を行う。
<4.エージェント機能の処理手順>
次に、通信システム10によるエージェント機能の処理手順を図7から図11を用いて説明する。図7から図9は、エージェント機能の処理のフローチャートを示す。図中、左のフローチャートは車載装置3、中央は通信装置2、右はサーバ装置4の処理手順を示す。図10及び図11は、車載装置3のディスプレイ33での表示例を示す。
まず、図7から図9を参照し、エージェント機能の処理手順を説明する。エージェント機能の開始前は、車載装置3の制御部31が、ディスプレイ33に車両1周辺の地図を含むナビゲーション画像NVを表示する。このような状態において、連携部26と連携部32とがケーブルで接続され、通信装置2と車載装置3との通信が確立されると、エージェント機能が開始される。通信装置2の制御部21は、キャラクタ画像CGを含むエージェント画像EGを生成し、車載装置3へ送信する。車載装置3は、ディスプレイ33の左半面に車両1周辺の地図を含むナビゲーション画像NVを表示し、右半面にキャラクタ画像CGを含むエージェント画像EGを表示する。
エージェント機能が開始されると、車載装置3の制御部31が、ユーザがディスプレイ33のタッチパネルをタッチして所望の操作を行おうとしているか否か判断する(ステップS11)。所望の操作とは、例えば、諸機能の設定操作やオーディオの操作等である。
制御部31は、ユーザによるタッチパネルへのタッチがないと判断する場合は(ステップS11でNo)、通信装置2から送信されるキャラクタ画像CGを含むエージェント画像EGの表示を行う(ステップS13)。
一方、制御部31は、ユーザによるタッチパネルへのタッチがあると判断する場合は(ステップS11でYes)、タッチされたタッチパネル上の座標を示す信号を操作信号として通信装置2へ送信する(ステップS12)。
通信装置2の画像生成部21aは、車載装置3から送信された操作信号に含まれる座標に基づき、ユーザの所望する操作を判別し、当該操作に対応するキャラクタ画面を生成する(ステップS13)。例えば、生成されるキャラクタ画像CGは、ユーザの操作を受け付けた旨を示すジェスチャー及び動作を伴ったキャラクタの画像である。また、ユーザの操作がない場合には、ディスプレイ33上でキャラクタを動作させるための画像を生成する(ステップS13)。したがって、画像生成部21aは、動きのあるキャラクタ画像CGを生成するために、キャラクタの位置を少しずつ変化させた静止画を複数生成する。ユーザの音声を受信しない期間において生成する画像数は、例えば、画像を表示させた場合に1秒間に30画像を表示できる画像数である。なお、生成する画像数が多いほど、キャラクタは滑らかな動作で表示される。
通信装置2の制御部21は、連携部26を制御し、生成された複数のキャラクタ画像CGを車載装置3へ順次送信する(ステップS32)。この際、制御部21は、1秒間に30画像を送信する。これにより、車載装置3のディスプレイ33では、滑らかに動作するキャラクタ画像CGを表示することができる。
車載装置3の制御部31は、通信装置2から送信されたキャラクタ画像CGをディスプレイ33に表示する。複数のキャラクタ画像CGをディスプレイ33に順次表示することで、ユーザはタッチパネルに対する操作に対応したジェスチャーと動作を伴ったキャラクタ画像CGを参照することができ、キャラクタとのコミュニケーションを通じた操作を行うことができる。
次に、車載装置3の制御部31は、ユーザが音声による操作を行おうとしているか否か判断する(ステップS14)。すなわち、エージェント画像EGのマイクアイコンIC3の座標にタッチがあったか否か判断する。
制御部31は、該当座標にタッチがなかったと判断する場合は(ステップS14でNo)、ステップS11に戻り、以後ステップS11からステップS14を繰り返し実行する。また、制御部31は、該当座標にタッチがあったと判断する場合は(ステップS14でYes)、音声操作の開始指示信号を通信装置2へ送信する(ステップS15)。
一方、通信装置2の制御部21は、ステップS52でキャラクタ画像CGの送信を実行すると、車載装置3からの開始指示信号を受信したか否か判断する(ステップS53)。制御部21は、開始指示信号を受信していないと判断すると(ステップS53でNo)、再度キャラクタ画像CGの生成と送信を実行する(ステップS31及びステップS32)。この際、画像生成部21aは、画像を表示させた場合に1秒間に30画像を表示できる画像数を生成及び送信する。これにより、ユーザは、音声操作の開始指示前、すなわち音声の非受信中において、滑らかに動作するキャラクタ画像CGを車載装置3のディスプレイ33で参照することができる。
一方、制御部21は、開始指示信号を受信したと判断すると(ステップS33でYes)、以下の4つの処理を実行する。まず、第1の処理として、画像生成部21aがキャラクタ画像CGの生成頻度を低減する(ステップS34)。例えば、1秒間に30画像を生成していた場合に、1秒間に1画像の生成とする。図10は、キャラクタ画像CGの生成頻度及び送信頻度の例を示す。図10に示すように、画像生成部21aは、キャラクタの動きを少しずつ変化させた画像EGa、EGb、及び、EGcを1秒毎に順次生成する。なお、画像EGa、EGb、及び、EGcを生成後、3つの画像を記憶部24に記憶しておいてもよい。この場合は、一旦、3つの画像EGa、EGb、及び、EGcを生成した後は、新たな画像を生成する必要はない。このように、ユーザの音声の受信中はキャラクタ画像CGの生成頻度を低下させるので、画像生成の処理と音声受信の処理とが重複した場合であっても、処理負荷を過大とせずに、音声受信の処理を行うと共に車載装置においてキャラクタ画像CGの表示を継続することができる。
次に、第2の処理として、制御部21がキャラクタ画像CGの送信頻度を低減する(ステップS35)。例えば、1秒間に30画像を送信していた場合に、1秒間に1画像の送信とする。例えば、図10の矢印に示す順序で、画像EGa、EGb、及び、EGcを1秒毎に順次来り返し送信する。画像に少しずつ変化のあるキャラクタ画像CGが順次送信されることにより、送信頻度が低減されても、キャラクタ画像CGはディスプレイ33において動作を伴って表示される。このように、ユーザの音声の受信中はキャラクタ画像CGの送信頻度を低下させるので、画像送信の処理と音声受信の処理とが重複した場合であっても、処理負荷を過大とせずに、音声受信の処理を行うと共に車載装置においてキャラクタ画像CGの表示を継続することができる。また、ユーザからの開始指示がなされた場合に、キャラクタ画像CGを送信する頻度を低下させるので、遅滞なくキャラクタ画像CGの送信頻度を低下させることができる。
次に、第3の処理として、制御部21は、車載装置3のディスプレイ33におけるタッチ領域を制限する(ステップS36)。すなわち、ユーザがタッチ可能なボタン数を減少させる処理を行う。制御部21は、音声入力をキャンセルするキャンセルボタン(後述)の座標以外の座標の操作信号を受信しない(当該座標に対応する処理を実行しない)ことでタッチ用のボタンを無効化する。このように、制御部21は、ユーザの音声の受信中は音声の非受信中よりも少ない操作に係る操作信号を受信するので、音声の受信による処理負荷が増加した場合であっても、ユーザの全ての操作に対応する処理を実行することがない。このため、通信装置2の処理負荷が過大となるのを防止できる。なお、車載装置3の制御部31は、ディスプレイ33に表示した無効化されたタッチ用のボタンであるアイコンIC1からIC3の色調を低下(いわゆる、トーンダウン)させることが好ましい。タッチしても実行されないボタンであることを認識することで、ユーザは故障でないことを判別でき、また実行されない不要な操作を行うことがない。また、無効化されたボタンを表示しないようにしてもよい。
次に、第4の処理として、画像生成部21aは、エージェント画像EGに音声を受信中である旨を付加する(ステップS37)。図11は、エージェント画像EGに音声を受信中である旨を付加した例である。図11に示すように、画像生成部21aは、例えば、「ただ今、音声を受信中です。」との画像JAをキャラクタ画像CGと並べて表示する。これにより、キャラクタ画像の生成及び送信の頻度が低下し、キャラクタの動作の滑らかさが多少低下した場合であっても、ユーザは音声を受信中であることを認識することにより、異常の発生でないと判断できる。なお、第4の処理において、エージェント画像EGに音声入力の「キャンセル」を行うキャンセルボタンCAを表示する。後述するように、ユーザは、キャンセルボタンCAにタッチすることで、タッチ座標が通信装置2へ送信され、音声入力を中止することができる。
これら第1ないし第4の処理が実行されることにより、通信装置2の制御部21における画像生成及び送信の処理負荷を低減させることができる。したがって、通信装置2の制御部21においてユーザの音声の受信及び送信処理が増大しても、通信装置2の処理負荷が過大となることがない。さらに、キャラクタ画像CGの生成頻度及び送信頻度を低減させても、キャラクタ画像CGはディスプレイ33において動作を伴って表示されるため、ユーザとの対話により車載装置3の操作を可能とするエージェント機能の効果を損なうことがない。
次に、ユーザが任意の音声を発声すると、車載装置3の制御部31がマイクロフォン35から出力される音声データを受信し、ユーザの音声を取得する(ステップS16)。なお、開始指示がなされた後、所定時間(例えば、10秒間)ユーザが音声を発声せず、制御部31がユーザの音声を取得できなかった場合、制御部31が音声の受信を終了する旨のメッセージをディスプレイ33に表示させ、音声受信の処理を終了させてもよい。
制御部31がユーザの音声を取得すると、連携部32を介して音声データを通信装置2へ送信する(ステップS17)(図2の矢印C1)。通信装置2は、車載装置3から音声データを受信すると、音声データをサーバ装置4へ送信する(ステップS38)(図2の矢印C2)。
さらに、通信装置2はユーザの音声をサーバ装置4へ送信すると、サーバ装置4による情報提供を停止させる停止信号をサーバ装置4へ送信する(ステップS39)。停止信号は、制御部21の停止部21cにより送信される。音声の受信処理中にサーバ装置4から情報が提供され、処理負荷が増加しないようにするためである。
また、通信装置2は停止信号をサーバ装置4へ送信すると、サーバ装置4からの提供情報を受信可能な容量をサーバ装置4へ通知する(ステップS40)。音声の受信処理中にサーバ装置4から大きな容量の情報が提供されないようにするためである。受信可能容量の通知は、制御部21の通知部21eが、記憶部24に記憶されている容量データ24aを参照し、連携部26を介してサーバ装置4へ通知を行う。なお、容量データ24aは、制御部21の備えるCPUのキャッシュメモリ21fの容量である。このため、通知部21eは、提供情報を受信可能な容量をサーバ装置4へ通知する際には、容量データ24aを参照する。
このような通信装置2及び車載装置3の処理の間、サーバ装置4では所定の条件下で提供情報の生成が行われる(ステップS71)。サーバ装置4での提供情報の生成は、前述の通り、所定時間毎や、気象状況、道路交通状況の変化等に応じて実行される。
サーバ装置4は、提供情報を生成すると、通信装置2から音声データを受信したか判断する(ステップS72)。
サーバ装置4は、音声データを受信していないと判断すると(ステップS72でNo)、生成した提供情報を通信装置2へ送信する(ステップS80)(図2の矢印C3)。サーバ装置4が音声データを受信していない場合は、通信装置2も音声を処理していないと考えられ、情報を提供しても通信装置2の処理負荷が過大となることがないからである。
一方、サーバ装置4は、音声データを受信していると判断すると(ステップS72でYes)、通信装置2から停止信号が送信されたか否か判断する(ステップS73)。
サーバ装置4は、通信装置2から停止信号が送信されていないと判断すると(ステップS73でNo)、生成した提供情報を通信装置2へ送信する(ステップS80)。なお、停止信号はユーザが声を発してから送信されるため、停止信号が送信されていない場合は、通信装置2の処理負荷が増大するような音声が入力されておらず、生成した提供情報を通信装置2へ送信することができる。
一方、サーバ装置4は、通信装置2から停止信号が送信されていると判断すると(ステップS73でYes)、生成した提供情報が通信装置2での受信可能な容量以内か否か判断する(ステップS76)。サーバ装置4は、受信可能な容量以内であると判断すると(ステップS76でYes)、生成した提供情報を通信装置2へ送信する(ステップS80)。これにより、サーバ装置4は停止信号を受信した場合であって、提供すべき情報の容量が受信容量以内である場合に情報の提供を行うので、通信装置2は処理負荷を過大とせずに情報の提供を受けることができる。なお、前述の通り、受信可能な容量とは、通信装置2の制御部21が備えるCPUのキャッシュメモリ21fの記憶容量である。キャッシュメモリ21fに対する情報の書き込み及び読み出しは、高速に処理できるため、通信装置2の処理負荷を過大とすることがない。
一方、サーバ装置4は、受信可能な容量以内でないと判断すると(ステップS76でNo)、生成した提供情報を記憶部42に記憶する(ステップS77)。なお、記憶部42に記憶された提供情報は、後に情報の提供停止が解除された際に読み出されて通信装置2へ送信される。すなわち、サーバ装置4は、提供すべき情報の容量が受信可能容量より大きい場合には解除信号を受信してから情報の提供を行うので、通信装置2はユーザの音声の受信中に処理負荷が過大となるのを防止できる。
このような通信装置2及びサーバ装置4の処理の間、車載装置3は、ユーザに対し情報の受信を行うか否かの問合せを行う(ステップS18)。このような問合せは、車載装置3のディスプレイ33にタッチパネル用のボタンを表示し、ユーザのタッチ操作に基づいて行えばよい。
車載装置3の制御部31は、ユーザのタッチ操作に基づき、ユーザが情報を受信する旨の操作をしたと判断すると(ステップS18でYes)、情報提供の停止処理の解除を行う解除信号を通信装置2へ送信する(ステップS19)。なお、情報提供の停止処理の解除を行う場合には、エージェント画像EGの更新を一時中断し、車載装置3の処理負荷を軽減すればよい。ユーザが情報を受信することを優先したと考えられるからである。一方、車載装置3の制御部31は、ユーザが情報を受信しない旨の操作をしたと判断すると(ステップS18でNo)、後に説明するステップS21以下の処理に進む。
通信装置2は、車載装置3から解除信号を受信すると、受信した解除信号をサーバ装置4へ送信する(ステップS41)。解除信号は、制御部21の解除部21dにより送信される。
サーバ装置4では、通信装置2から解除信号が送信されたか否か判断する(ステップS78)。サーバ装置4は、解除信号が送信されていないと判断すると(ステップS78でNo)、後に説明するステップS81以下の処理に進む。
一方、サーバ装置4は、解除信号が送信されたと判断すると(ステップS78でYes)、記憶部42に記憶しておいた提供情報を読み出し(ステップS79)、通信装置2へ送信を行う(ステップS80)。このように、サーバ装置4は解除信号に応じて記憶部42に記憶した情報を提供するので、通信装置2は音声の受信中に提供が停止されていた情報の提供を受けることができる。
通信装置2の制御部21は、サーバ装置4から提供情報が送信されると、提供情報を記憶部24又はキャッシュメモリ21fに記憶させる(ステップS42)。制御部21は、送信された提供情報が受信可能容量より多い場合は、提供情報を記憶部24に記憶させる。また、提供情報が受信可能容量以下の場合は、提供情報をキャッシュメモリ21fに記憶させる。サーバ装置4から提供される情報の容量をキャッシュメモリ21fに一時的に記憶できる容量とすることで、通信装置2は処理負荷を過大とせずに情報の提供を受けることができる。キャッシュメモリ21fに対する情報の書き込み及び読み出しは、高速に処理できるからである。
次に、通信装置2の制御部21は、解除信号を既に受信しているか否か判断する(ステップS43)。制御部21は、解除信号を受信していると判断する場合は(ステップS43でYes)、記憶部24又はキャッシュメモリ21fから提供情報を読み出す(ステップS44a)。そして、画像生成部21aが提供情報を表示する画像を生成し、生成した画像を車載装置3へ送信する(ステップS45)(図2の矢印C4)。一方、制御部21は、解除信号を受信していないと判断する場合であって(ステップS43でNo)、キャッシュメモリ21fに提供情報が記憶されている場合は、提供情報を読み出し(ステップS44b)、車載装置3へ送信する(ステップS45)。なお、解除信号を受信しておらずユーザの音声の処理が継続している場合であっても、キャッシュメモリ21fからの提供情報の読み出しは高速に処理できるため、通信装置2において処理負荷が過大とならない。
車載装置3は、通信装置2から提供情報が送信されると、ディスプレイ33に情報を表示する(ステップS20)。情報の表示は、図4に示すように、エージェント画像EGに提供情報DAを表示して行う。これにより、ユーザはサーバ装置4から提供された最新の気象情報や道路交通情報を参照することができる。
次に、車載装置3の制御部31は、ユーザにより音声入力のキャンセルがあったか否か判断する(ステップS21)。制御部31は、ディスプレイ33のタッチパネルに表示したキャンセルボタンCAに対し、ユーザがタッチ操作を行ったか否かにより判断する。
制御部31は、音声入力のキャンセルがあったと判断する場合は(ステップS21でYes)、キャンセル信号を通信装置2へ送信する。また、キャンセルがないと判断する場合は(ステップS21でNo)、キャンセル信号の送信は行わず、後述のステップS24へ進む。
通信装置2は、車載装置3から受信したキャンセル信号をサーバ装置4へ送信する(ステップS46)。
次に、サーバ装置4が、通信装置2からキャンセル信号が送信されたか否か判断する(ステップS81)。サーバ装置4は、キャンセル信号が送信されたと判断すると(ステップS81でYes)、ステップS77で記憶部42に記憶しておいた提供情報の読み出し処理を行う(ステップS82)。そして、読み出した提供情報を通信装置2へ送信する(ステップS83)(矢印C3)。なお、音声入力がキャンセルされた後に、提供情報を通信装置2へ送信するため、情報の提供により通信装置2の処理負荷が過大となることはない。
一方、サーバ装置4は、キャンセル信号が送信されていないと判断すると(ステップS81でNo)、後述のステップS84の処理へ進む。
車載装置3では、ユーザによる音声入力のキャンセルがないとした場合に実行される判断である、音声入力が終了したか否かの判断を行う(ステップS22)。音声入力が終了したか否かの判断は、ユーザの発声がなくなってから所定時間が経過したか否かにより行われる。所定時間は、例えば3[秒]である。
車載装置3は、ユーザの音声入力が終了していないと判断する場合は(ステップS22でNo)、ステップS16の処理に戻り、ユーザの音声の受信を継続する。その後、ステップS16以下の処理を再度実行する。
一方、車載装置3は、ユーザの音声入力が終了したと判断する場合は(ステップS22でYes)、音声入力が終了した旨を示す音声終了信号を通信装置2へ送信する(ステップS23)。
通信装置2は、車載装置3から音声終了信号を受信すると、受信した音声終了信号をサーバ装置4へ送信する(ステップS47)。
サーバ装置4では、音声終了信号の受信の有無に基づき、ユーザによる音声の入力が終了したか否か判断される(ステップS84)。サーバ装置4の制御部41は、音声の入力が終了しないと判断する場合は(ステップS84でNo)、ステップS71の提供情報の生成の処理に戻り、ステップS71以下を再度実行する。
一方、サーバ装置4の制御部41は、音声の入力が終了したと判断する場合は(ステップS84でYes)、ステップS77で記憶部42に記憶しておいた提供情報の読み出し処理を行う(ステップS85)。そして、読み出した提供情報を通信装置2へ送信する(ステップS86)(矢印C3)。なお、音声入力が終了した後に、提供情報を通信装置2への送信するため、情報の提供により通信装置2の処理負荷が過大となることはない。
通信装置2では、ステップS47で音声終了信号をサーバ装置4へ送信すると、記憶部24から提供情報を読み出す(ステップS48)。そして、画像生成部21aが提供情報を表示する画像を生成し、生成した画像を車載装置3へ送信する(ステップS49)(図2の矢印C4)。ユーザの音声の受信が終了した後に、通信装置2の記憶部24に一時的に記憶した情報を車載装置3に送信するので、通信装置2はユーザの音声の受信中に処理負荷が過大となるのを防止し、車載装置3は音声の受信が終了した後に情報の提供を受けることができる。
また、通信装置2は、ステップS82又はステップS86の処理によりサーバ装置4から提供情報が送信されると、車載装置3へ提供情報を表示する画像を送信する(ステップS49)(図2の矢印C4)。
車載装置3は、通信装置2からの提供情報を受信すると、ディスプレイ33に提供情報を表示する(ステップS24)。情報の表示は、図4に示すように、エージェント画像EGに提供情報DAを表示して行う。これにより、ユーザはサーバ装置4から提供された最新の気象情報や道路交通情報を参照することができる。
次に、サーバ装置4の音声認識部41aが、受信したユーザの音声を認識する音声認識処理を以下のように実行する(ステップS87)。まず、音声認識部41aは、音声データのうちユーザの音声が含まれる区間を抽出する。例えば、音声データのうち所定の閾値を超えるレベルの信号が連続する区間を抽出する。
次に、音声認識部41aは、音声認識辞書42aを参照し、ユーザの音声の特徴量に基づいてユーザの音声を文字データに変換する。そして、変換した文字データから、助詞や接続詞等の不用語を消去して単語を抽出する。
次に、音声認識部41aは、抽出した単語を検索条件として意味判定辞書42bを用い、ユーザの音声がどのような意味に該当するか検索を行う。検索条件は、例えば「レストラン」等の種別条件、「近く」等の距離条件等である。検索において、車両1の位置が必要な場合は、車載装置3のナビゲーション部36から車両1の位置を取得すればよい。そして、音声認識部41aは、検索条件に合致するデータをデータベースから検索し、検索結果を通信装置2に通信部43を介して送信する(ステップS88)(図2の矢印C3)。ステップS88が実行されると、サーバ装置4の処理は終了する。
通信装置2は、サーバ装置4から送信された音声認識の検索結果を、通信部23を介して受信する。通信装置2の画像生成部21aは、受信した検索結果に基づいた画像を生成する(ステップS50)。画像生成部21aにより生成される画像は、例えば、エージェント画像EGに検索結果の一覧を付加した画像である。また、例えば、一覧に含まれる各項目が施設である場合には、施設の位置がナビゲーション画像NV上においてアイコンによって示される。
画像生成部21aにより検索結果に基づいた画像が生成されると、制御部21は連携部26を介して画像を車載装置3へ送信する(ステップS51)(図2の矢印C4)。ステップS51が実行されると、通信装置2の処理は終了する。
車載装置3は、検索結果に基づいた画像を受信すると、ディスプレイに当該画像を表示する(ステップS25)。ステップS25が実行されると、車載装置3の処理は終了する。検索結果が施設である場合、ユーザが表示された画像に示される検索結果一覧の項目の一つを選択すると、ナビゲーション部36により当該項目の施設がナビゲーション機能の目的地に設定される。以降、ナビゲーション部36は、この目的地までのルート案内を実行する。
以上のように、本実施の形態においては、ユーザとの対話を行うエージェント機能の実行において、静止画を連続して表示することで動作を伴うキャラクタ画像CGを表示する際、ユーザの音声の受信中か非受信中かに応じて、表示する静止画の数を変える。すなわち、ユーザの音声の受信中には、通信装置2は、キャラクタ画像CGを車載装置3へ送信する頻度を低下させることで表示する静止画の数を減らす。これにより、音声の受信処理とキャラクタ画像CGの送信処理が同時に実行されても、通信装置2の処理負荷が過大となることがない。したがって、処理負荷が過大となった場合に生じる処理停止状態(いわゆる、フリーズ)を回避でき、音声の受信中におけるキャラクタ画像CGの動作停止を防止できる。
<5.変形例>
以上、本発明の実施の形態について説明したが、この発明は上記実施の形態に限定されるものではなく様々な変形が可能である。以下、このような変形例について説明する。なお、上記実施の形態及び以下で説明する形態を含む全ての形態は、適宜、組み合わせ可能である。
上記実施の形態では、通信装置2はサーバ装置4と協働することによりエージェント機能を実行すると説明したが、通信装置2が単独でエージェント機能を実行可能としてもよい。この場合、通信装置2が、音声認識部41aを備えればよい。また、通信装置2は、サーバ装置4との協働によるエージェント機能と、通信装置2単独でのエージェント機能とのいずれも実行可能とし、サーバ装置4との通信状態に応じていずれを実行するかを選択してもよい。
また、上記実施の形態では、車載装置3にマイクロフォンを備えたが、通信装置2にマイクロフォンを備え、通信装置2のマイクロフォンからユーザの音声を入力し、サーバ装置4へ送信してもよい。
また、上記実施の形態では、車載装置3は、車両1に搭載される装置として説明したが、携帯電話やスマートフォン等の車両1に固定して設置されない可搬性の装置であってもよい。
また、上記実施の形態では、通信装置2と車載装置3とは、別体の装置として説明したが、一体の装置であってもよい。
また、上記実施の形態では、音声認識部41aが検索結果を送信するとしたが、コマンドを送信してもよい。例えば、ユーザにより音量の調整や再生楽曲の選曲を意味する音声が発話された場合、サーバ装置4から音量調整や楽曲選曲を示すコマンドが通信装置2に送信され、車載装置3にて当該コマンドが実行されてもよい。
また、上記実施の形態では、通信装置2と車載装置3とは、ケーブルで接続されるとしたが、無線通信で接続されてもよい。
また、上記実施の形態では、サーバ装置4にキャラクタ画像CGのデータベースを備え、キャラクタやキャラクタの衣装を変更可能としてもよい。いわゆるエンターテイメント性を向上させることで、ユーザは自らの嗜好に合致したキャラクタとの対話を楽しみながら、エージェント機能を使用することができる。
また、上記実施の形態では、通信装置2及び車載装置3のユーザは、車両1のドライバであると説明したが、ドライバ以外の乗車者であってもよい。
また、上記実施の形態では、音声認識処理をサーバ装置4で行っていたが、通信装置2で行ってもよい。この場合、サーバ装置4はデータベースによる施設等の検索や提供情報の生成を行えばよい。
また、上記実施の形態では、プログラムに従ったCPUの演算処理によってソフトウェア的に各種機能が実現されると説明したが、これら機能のうちの一部は電気的なハードウェア回路により実現されてもよい。
1 車両
2 通信装置
3 車載装置
4 サーバ装置
5 ネットワーク
10 通信システム

Claims (15)

  1. 車載装置と通信する通信装置であって、
    ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
    前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
    前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
    を備え、
    前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とする通信装置。
  2. 請求項1に記載の通信装置において、
    前記生成手段は、前記キャラクタ画像を所定の頻度で生成し、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を生成する頻度を低下させること特徴とする通信装置。
  3. 請求項1または2に記載の通信装置において、
    前記生成手段は、前記ユーザの音声の受信中は、ユーザの音声を受信中である旨を前記キャラクタ画像に付加することを特徴とする通信装置。
  4. 請求項1ないし3のいずれかに記載の通信装置において、
    前記受信手段は、前記ユーザから開始指示がなされた後に、前記音声の受信を開始し、
    前記送信手段は、前記開始指示がなされた場合に、前記キャラクタ画像を送信する頻度を低下させること特徴とする通信装置。
  5. 請求項1ないし4のいずれかに記載の通信装置において、
    前記車載装置に対する前記ユーザの操作に係る操作信号を受信する操作信号受信手段と、
    前記操作信号受信手段が受信した前記操作信号に対応する処理を実行する実行手段と、
    をさらに備え、
    前記操作信号受信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも少ない操作に係る操作信号を受信することを特徴とする通信装置。
  6. 特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、
    前記通信装置は、
    ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
    前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
    前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
    を備え、
    前記送信手段は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させることを特徴とする通信システム。
  7. 請求項6に記載の通信システムにおいて、
    前記通信装置は、前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、をさらに備え、
    前記サーバ装置は、前記停止信号を受信した場合に、少なくとも一部の前記特定情報の提供を停止することを特徴とする通信システム。
  8. 請求項7に記載の通信システムにおいて、
    前記通信装置は、前記サーバ装置に前記特定情報の提供の停止を解除させる解除信号を送信する解除手段、をさらに備え、
    前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報を記憶する第1記憶手段、をさらに備え、
    前記サーバ装置は、前記解除信号を受信した場合に、前記第1記憶手段に記憶した前記特定情報の提供を行うことを特徴とする通信システム。
  9. 請求項7または8に記載の通信システムにおいて、
    前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、
    前記サーバ装置は、前記停止信号を受信した場合に、前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合は、前記特定情報の提供を行うことを特徴とする通信システム。
  10. 請求項9に記載の通信システムにおいて、
    前記通信装置は、キャッシュメモリを備え、
    前記受信容量は、前記キャッシュメモリに一時的に記憶できる容量であることを特徴とする通信システム。
  11. 請求項8に記載の通信システムにおいて、
    前記通信装置は、前記ユーザの音声の受信中に前記特定情報を受信できる受信容量を前記サーバ装置に通知する通知手段、をさらに備え、
    前記サーバ装置は、前記停止信号を受信した場合において、
    前記通信装置に提供すべき特定情報の容量が前記受信容量以内である場合に、前記特定情報の提供を行い、
    前記通信装置に提供すべき特定情報の容量が前記受信容量より大きい場合に、前記特定情報を前記第1記憶手段に記憶することを特徴とする通信システム。
  12. 請求項9ないし11のいずれかに記載の通信システムにおいて、
    前記通信装置は、前記ユーザの音声の受信中に、前記サーバ装置から提供された特定情報を一時的に記憶する第2記憶手段、をさらに備え、
    前記送信手段は、前記ユーザの音声の受信が終了した後に、前記第2記憶手段に一時的に記憶された前記特定情報を前記車載装置に送信することを特徴とする通信システム。
  13. 特定情報を提供するサーバ装置と、前記サーバ装置から提供された前記特定情報を車載装置へ送信する通信装置とを含む通信システムであって、
    前記通信装置は、
    ユーザと対話を行うためのキャラクタ画像を生成する生成手段と、
    前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる送信手段と、
    前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する受信手段と、
    前記ユーザの音声の受信中は、前記サーバ装置に前記特定情報の提供を停止させる停止信号を送信する停止手段、
    を備え、
    前記サーバ装置は、前記停止信号を受信すると、少なくとも一部の前記特定情報の提供を停止することを特徴とする通信システム。
  14. 車載装置と通信する通信方法であって、
    (a)ユーザと対話を行うためのキャラクタ画像を生成する工程と、
    (b)前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、
    (c)前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、
    を備え、
    前記工程(b)は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とする通信方法。
  15. 車載装置と通信する通信装置に含まれるコンピュータにより実行可能なプログラムであって、
    前記コンピュータに、
    (a)ユーザと対話を行うためのキャラクタ画像を生成する工程と、
    (b)前記キャラクタ画像を前記車載装置に所定の頻度で送信して表示させる工程と、
    (c)前記車載装置における前記キャラクタ画像との対話に係るユーザの音声を、前記車載装置から受信する工程と、
    を実行させ、
    前記工程(b)は、前記ユーザの音声の受信中は、該音声の非受信中よりも前記キャラクタ画像を送信する頻度を低下させること特徴とするプログラム。
JP2013032057A 2013-02-21 2013-02-21 通信装置、通信システム、通信方法、及び、プログラム Active JP6105321B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013032057A JP6105321B2 (ja) 2013-02-21 2013-02-21 通信装置、通信システム、通信方法、及び、プログラム
US14/177,676 US9262796B2 (en) 2013-02-21 2014-02-11 Communication apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013032057A JP6105321B2 (ja) 2013-02-21 2013-02-21 通信装置、通信システム、通信方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2014164325A JP2014164325A (ja) 2014-09-08
JP6105321B2 true JP6105321B2 (ja) 2017-03-29

Family

ID=51351902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013032057A Active JP6105321B2 (ja) 2013-02-21 2013-02-21 通信装置、通信システム、通信方法、及び、プログラム

Country Status (2)

Country Link
US (1) US9262796B2 (ja)
JP (1) JP6105321B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6275606B2 (ja) * 2014-09-17 2018-02-07 株式会社東芝 音声区間検出システム、音声始端検出装置、音声終端検出装置、音声区間検出方法、音声始端検出方法、音声終端検出方法およびプログラム
CN104477115B (zh) * 2014-11-28 2017-04-12 广东好帮手电子科技股份有限公司 语音控制导航及全景分屏显示的方法及系统
JP2020067785A (ja) * 2018-10-24 2020-04-30 本田技研工業株式会社 制御装置、エージェント装置及びプログラム
JP7318337B2 (ja) * 2019-06-14 2023-08-01 カシオ計算機株式会社 表示制御装置及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249720B1 (en) * 1997-07-22 2001-06-19 Kabushikikaisha Equos Research Device mounted in vehicle
JP2001201352A (ja) 2000-01-19 2001-07-27 Matsushita Electric Ind Co Ltd 移動端末装置と通信センター装置と位置情報提供装置
JP2006084184A (ja) 2004-09-14 2006-03-30 Ntt Docomo Inc 3次元gisナビゲーション方法、3次元gisナビゲーションサーバおよび3次元gisナビゲーションシステム
JP2006154926A (ja) * 2004-11-25 2006-06-15 Denso Corp キャラクタ表示を利用した電子機器操作システム及び電子機器
EP2091784B1 (en) * 2006-12-20 2012-02-01 Johnson Controls Technology Company Remote display reproduction system and method
JP5413321B2 (ja) * 2010-07-20 2014-02-12 株式会社デンソー 通信システム、車載端末、および携帯端末
JP2012040992A (ja) * 2010-08-20 2012-03-01 Fujitsu Ten Ltd 車載装置
JP2012099027A (ja) * 2010-11-04 2012-05-24 Toshiba Corp 映像出力装置、映像出力方法

Also Published As

Publication number Publication date
JP2014164325A (ja) 2014-09-08
US9262796B2 (en) 2016-02-16
US20140236601A1 (en) 2014-08-21

Similar Documents

Publication Publication Date Title
AU2013200153B2 (en) Method and apparatus for executing a user function using voice recognition
JP6105321B2 (ja) 通信装置、通信システム、通信方法、及び、プログラム
JP2016156996A (ja) 電子機器、方法及びプログラム
CN103716454A (zh) 利用语音识别执行预设操作模式的方法和设备
KR101457116B1 (ko) 음성 인식 및 모션 인식을 이용한 전자 장치 및 그의 제어 방법
CN104964693B (zh) 具有改进的导航工具的地图应用
CN110830368B (zh) 即时通讯消息发送方法及电子设备
JP6284104B2 (ja) 情報通信端末、対話提供方法
EP3040837A1 (en) Text entry method with character input slider
JP5494318B2 (ja) 携帯端末および通信システム
JP5986468B2 (ja) 表示制御装置、表示システム及び表示制御方法
CN111145735B (zh) 电子设备及其操作方法
JP2018081102A (ja) 通信装置、通信方法、及び、プログラム
CN114121013A (zh) 语音控制方法、装置、电子设备及存储介质
JP2021124780A (ja) 情報処理装置及び情報処理プログラム
JP2017116354A (ja) 交通情報出力システム及び交通情報出力方法
EP2806364B1 (en) Method and apparatus for managing audio data in electronic device
JP6115202B2 (ja) 音声認識システム、方法およびプログラム
US20240149886A1 (en) Vehicle-mounted device and system
JP2018124805A (ja) 車載情報端末及び情報検索プログラム
JP2012083919A (ja) 情報処理装置、アプリケーションの連係方法及びプログラム
AU2015271922A1 (en) Method and apparatus for executing a user function using voice recognition
JP2018169316A (ja) 通信端末、サーバ装置、移動案内システム及びコンピュータプログラム
KR20180071677A (ko) 결제 서비스를 제공하기 위한 전자 장치 및 이의 제어 방법
JP5895878B2 (ja) 入力支援システム、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170302

R150 Certificate of patent or registration of utility model

Ref document number: 6105321

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250