JP2014191295A - 音声認識システム - Google Patents

音声認識システム Download PDF

Info

Publication number
JP2014191295A
JP2014191295A JP2013068853A JP2013068853A JP2014191295A JP 2014191295 A JP2014191295 A JP 2014191295A JP 2013068853 A JP2013068853 A JP 2013068853A JP 2013068853 A JP2013068853 A JP 2013068853A JP 2014191295 A JP2014191295 A JP 2014191295A
Authority
JP
Japan
Prior art keywords
application
software
information
symbol
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013068853A
Other languages
English (en)
Other versions
JP6167605B2 (ja
Inventor
Kazutomo Tsuchikawa
和友 土川
Kiyohiko Sawada
清彦 澤田
Masato Maeda
正人 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2013068853A priority Critical patent/JP6167605B2/ja
Publication of JP2014191295A publication Critical patent/JP2014191295A/ja
Application granted granted Critical
Publication of JP6167605B2 publication Critical patent/JP6167605B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】車両系のアプリケーションを音声認識により車両系のソフトウェア上で実行させる構成において、情報系のアプリケーションの名称の辞書を作成する手間を省きつつ、情報系のアプリケーションも音声認識により情報系のソフトウェア上で実行させる。
【解決手段】音声認識システム1は、情報系のアプリケーションの名称をミドルウェアを介して車両系のソフトウェアに取込み、情報系のアプリケーションの名称に対して記号(数字等)を対応付ける。ユーザが記号を発話すると、その発話した記号が対応付けられた情報系のアプリケーションを起動する。ユーザが所望の情報系のアプリケーションの名称に対して対応付けられた記号を発話することで、その発話した記号が対応付けられた情報系のアプリケーションを実行させることができる。
【選択図】図1

Description

本発明は、第1のアプリケーションを音声認識の機能を用いて第1のソフトウェア上で実行させると共に、前記第1のアプリケーションとは種別が異なる第2のアプリケーションを第2のソフトウェア上で実行させる音声認識システムに関する。
従来より、音声認識に関する技術として、例えば特許文献1に開示されている技術が供されている。
特開2000−67319号公報
ところで、複数のソフトウェアを同一のオペレーティングシステム(OS)上で動作させる構成が考えられている。例えば車両の現在位置を示す位置データ等を扱う車両系のアプリケーションを実行する車両系のソフトウェアと、画像データや音楽データ等の大容量のデータを扱う情報系のアプリケーションを実行する情報系のソフトウェアとを同一のオペレーティングシステム上で動作させる構成がある。このような構成では、車両系のソフトウェアに音声認識の機能を持たせることで、例えばナビゲーション等の車両系のアプリケーションを音声認識の機能を用いて実行させることが可能となる。この場合、車両系のアプリケーションと同様に、情報系のアプリケーションも音声認識の機能を用いて実行させたいという要望がある。
しかしながら、車両系のアプリケーションの名称がある程度固定化されているのに対し、情報系のアプリケーションが外部から通信網を介して配信された配信アプリケーション等の多種多様であるという事情から、情報系のアプリケーションの名称は多種多様である。そのため、アプリケーションの名称の発音が難解な場合もあり、情報系のアプリケーションの名称の辞書(音認辞書)を作成したとしても、正確に音声認識することができないという問題がある。又、辞書を作成するには、テキストデータを音素に変換(G2P変換)する必要があり、情報系のアプリケーションを更新する都度、その新たに追加された情報系のアプリケーションの名称の辞書を作成する(更新する)構成では、多大な手間が発生し、負荷が増大するという問題がある。
本発明は、上記した事情に鑑みてなされたものであり、その目的は、第1のアプリケーションを音声認識の機能を用いて第1のソフトウェア上で実行させる構成において、第2のアプリケーションの名称の辞書を作成する手間を省きつつ、第2のアプリケーションも音声認識の機能を用いて第2のソフトウェア上で実行させることができる音声認識システムを提供することにある。
請求項1に記載した発明によれば、処理実行手段は、第1のアプリケーションを音声認識の機能を用いて第1のソフトウェア上で実行させると共に、第1のアプリケーションとは種別が異なる第2のアプリケーションを第2のソフトウェア上で実行させる。対応付け手段は、第2のアプリーションの名称に対して記号を個別に対応付ける。提示制御手段は、対応付け手段により対応付けられた第2のアプリケーションの名称と記号との対応付けをユーザに対して提示手段により提示する。処理実行手段は、ユーザが発話した音声を第1のソフトウェア上で音声認識し、ユーザが発話した音声が、第2のアプリケーションの名称に対して対応付け手段により対応付けられた記号であると第1のソフトウェア上で音声認識すると、その記号が対応付けられた第2のアプリケーションを第2のソフトウェア上で実行させる。
このように第2のアプリケーションの名称と記号(例えば数字や色等)とを対応付けてユーザに対して提示し、ユーザが記号を発話すると、その記号が対応付けられた第2のアプリケーションを第2のソフトウェア上で実行させるので、ユーザが所望の(起動させたい)第2のアプリケーションの名称を発話しなくとも、その所望の第2のアプリケーションの名称に対して対応付けられた記号を発話することで、その発話した記号が対応付けられた第2のアプリケーションを実行させることができる。即ち、発音が難解な第2のアプリケーションの名称の辞書を作成する必要がなく、発音が容易な記号の辞書を作成することで、第2のアプリケーションの名称の辞書を作成する手間を省きつつ、第2のアプリケーションを音声認識の機能を用いて第2のソフトウェア上で実行させることができる。
本発明の第1の実施形態のソフトウェアの構成を示す図 機能ブロック図 対応付け表示処理を示すフローチャート アプリケーション起動待機処理を示すフローチャート 対応付け表示画面を示す図 起動表示画面を示す図 対応付け表示画面を示す図 対応付け表示画面を示す図 本発明の第2の実施形態の対応付け処理を示すフローチャート 対応付け表示処理を示すフローチャート
(第1の実施形態)
以下、本発明を、車両に搭載可能な車両用の音声認識システムに適用した第1の実施形態について、図1から図8を参照して説明する。音声認識システム1は、例えば車両に対して着脱可能に取付けられている周知の車両用ナビゲーション装置等の車両用装置に組込まれている。音声認識システム1は、図2に示すように、本発明に関連する機能ブロックとして、制御部2と、入出力インタフェース(IF)部3と、A/D変換部(ADC)4と、D/A変換部(DAC)5と、SDカード6とを有する。
制御部2は、CPU、RAM、ROM及びI/Oバス等を有する周知のマイクロコンピュータから構成されており、ROM等に記憶されているコンピュータプログラムを実行して音声認識システム1の動作全般を制御する。入出力IF部3は、制御部2からのデータの入力及び制御部2へのデータの出力を制御する機能を有する。
マイクロホン7は、車室内においてユーザが発話した音声を入力し易い部位に設置されている。マイクロホン7は、ユーザが発話した音声を入力すると、その入力したアナログ信号の音声を入力音声としてA/D変換部4に出力する。A/D変換部4は、マイクロホン7からアナログ信号の入力音声を入力すると、その入力したアナログ信号の入力音声をデジタル信号に変換して入出力インタフェース部3に出力する。入出力インタフェース部3は、A/D変換部4からデジタル信号の入力音声を入力すると、その入力したデジタル信号の入力音声を制御部2に出力する。
又、入出力インタフェース部3は、制御部2からデジタル信号の出力音声を入力すると、その入力したデジタル信号の出力音声をD/A変換部5に出力する。D/A変換部5は、入出力インタフェース部3からデジタル信号の出力音声を入力すると、その入力したデジタル信号の出力音声をアナログ信号に変換してスピーカ8に出力する。スピーカ8は、D/A変換部5からアナログ信号の出力音声を入力すると、その入力したアナログ信号の出力音声を外部に向けて出力する。スピーカ8は、車室内において出力する音声をユーザが聴き取り易い部位に設置されている。
SDカード6は、制御部2がテキストデータを音素に変換(G2P変換)して作成した辞書(音認辞書)を記憶する。タッチパネル9は、各種の表示画面を表示する表示部9a(提示手段に相当)と、ユーザからの操作入力を表示部9aに表示されるタッチキーにより受付ける操作受付部9bとを有する。表示部9aは、制御部2から入出力インタフェース部3を介して表示指示信号を入力すると、その入力した表示指示信号に応じた表示画面を表示する。又、操作受付部9bは、ユーザからの操作入力を受付けると、その受付けた操作入力を示す操作検知信号を入出力インタフェース部3を介して制御部2に出力する。
上記した構成において、制御部2は、機能に応じて、処理実行部2a(処理実行手段に相当)と、対応付け部2b(対応付け手段に相当)と、表示制御部2c(提示制御手段に相当)とを有する。制御部2は、ソフトウェアの構成として、図1に示すように、CPUを含むハードウェア上にオペレーティングシステム(OS)を実装しており、オペレーティングシステム上に車両系のソフトウェア(第1のソフトウェア)と情報系のソフトウェア(第2のソフトウェア)とを実装している。オペレーティングシステムは、例えばBSP(Board Support Package)及びLinux(登録商標)のカーネル等を含む。
車両系のソフトウェアは、車両系に特化したデータを扱う車両系のアプリケーション(第1のアプリケーション)を実行するソフトウェアである。車両系に特化したデータとは、エンジン制御等のパワートレーン系の制御に関するデータ、エアコン制御等のボディ系の制御に関するデータであり、例えば車両の現在位置を示す位置データ等である。車両系のソフトウェアには、音声認識の機能が実装されている。車両系のソフトウェアが音声認識の機能を実装していることで、例えばナビゲーション等の車両系のアプリケーションを音声認識の機能を用いて実行させることが可能である。例えばユーザが特定の施設の名称を発話すると、そのユーザが発話した施設の名称を音声認識して特定することで、ユーザが施設の名称や電話番号等を操作入力しなくても、その施設を目的地として設定する等が可能となる。
情報系のソフトウェアは、情報系に特化したデータを扱う情報系のアプリケーション(第2のアプリケーション)を実行するソフトウェアである。情報系に特化したデータとは、画像(動画、静止画)コンテンツを構成する画像データや音楽コンテンツを構成する音楽データ等である。情報系のアプリケーションは、例えばコンテンツ提供会社等が管理するサーバ11から通信網を介して配信される(ダウンロードされる)配信アプリケーション等を含む。又、情報系のアプリケーションは、情報系のソフトウェアが単独で実行するアプリケーションと、車両用装置に組込まれているソフトウェア(HUP:Head Unit Proxy)と例えばスマートフォン等の携帯情報端末12に組込まれているソフトウェア(HAP:Handset Application Proxy)とがBluetooth(登録商標)のプロファイル上で連携して実行するアプリケーションとを含む。車両系のアプリケーション及び情報系のアプリケーションを対比すると、このように情報系のアプリケーションが外部から配信される配信アプリケーション等を含むことから、情報系のアプリケーションの更新頻度は車両系のアプリケーションの更新頻度よりも高い。
又、サーバ11から通信網を介して配信される配信アプリケーションは、そのプログラムやデータの容量や構造が、音声認識システム1に実装されている情報系のソフトウェアのリソース(記憶容量や演算速度等)とは関係なく構築されている。そのため、配信アプリケーションは、情報系のソフトウェアが有するリソースを越えたリソースを必要とする場合がある。情報系のソフトウェアのリソースを十分に確保することができないと、配信アプリケーションの処理が遅延したり停止したりする場合がある。このような事情から、情報系のソフトウェアと車両系のソフトウェアとは、情報系のソフトウェアの動作異常が車両系のソフトウェアの動作に波及しないように分離して実装されており、両者の間でミドルウェアを介してデータ(テキストデータ等)を授受する構成となっている。
処理実行部2aは、上記した車両系のアプリケーションを音声認識の機能を用いて車両系のソフトウェア上で実行させると共に、情報系のアプリケーションを情報系のソフトウェア上で実行させる。対応付け部2bは、後述するように情報系のアプリケーションの名称に対して記号を個別に対応付ける。表示制御部2cは、情報系のアプリケーションの名称と記号との対応付け等を入出力インタフェース部3を介してタッチパネル9の表示部9aに表示させる。
次に、上記した構成の作用について、図3から図8も参照して説明する。制御部2は、本発明に関連して図3及び図4にフローチャートにより示す処理を行う。尚、制御部2は、音声認識システム1を起動すると、その起動した直後に、情報系のソフトウェアが実行可能な情報系のアプリケーションが存在していれば(記憶していれば)、その情報系のアプリケーションの名称(テキストデータ)を、当該情報系のソフトウェアからミドルウェアを介して車両系のソフトウェアに取込む。又、制御部2は、音声認識システム1を起動すると、音声認識を行うのに必要な準備を開始する。
制御部2は、例えばユーザがPTT(Push to Talk)スイッチ(図示せず)を押下したことを特定すると、図3に示す対応付け表示処理を開始する。制御部2は、対応付け表示処理を開始すると、ユーザが「Show Applications」を発話したか否かを監視する(ステップS1)。即ち、制御部2は、ユーザが発話した音声をマイクロホン7からADC4を介して入力すると、その入力した音声を車両系のソフトウェアに実装されている音声認識の機能を用いて音声認識する。制御部2は、ユーザが発話した音声が「Show Applications」に一致すると、ユーザが「Show Applications」を発話したと特定する(ステップS1:YES)。ユーザが「Show Applications」を発話することが、情報系のアプリケーションを提示するトリガである。又、「Show Applications」が情報系のアプリケーションの提示を指示する音声である。
次いで、制御部2は、情報系のソフトウェアが実行可能な情報系のアプリケーションの名称を車両系のソフトウェアに取込んでいるか否かを判定し、記号を対応付け可能な情報系のアプリケーションが存在するか否かを判定する(ステップS2)。制御部2は、記号を対応付け可能な情報系のアプリケーションが存在すると特定すると(ステップS2:YES)、その記号を対応付け可能な情報系のアプリケーションを特定する(ステップS3)。次いで、制御部2は、その特定した情報系のアプリケーションの名称に対して対応付け部2により記号を個別に対応付ける(ステップS4)。そして、制御部2は、情報系のアプリケーションの名称と記号との対応付けを示す対応付け表示画面を表示制御部2cによりタッチパネル9の表示部9aに表示させ(ステップS5)、対応付け表示処理を終了する。
具体的に説明すると、制御部2は、記号を対応付け可能な情報系のアプリケーションとして、例えば「Facebook(登録商標)」、「Twitter(登録商標)」、「Michelin(登録商標)」等を特定し、記号として「1」、「2」、「3」等の数字を用いる場合であれば、「Facebook」に対して「1」を対応付け、「Twitter」に対して「2」を対応付け、「Michelin」に対して「3」を対応付ける。そして、制御部2は、図5に示すように、「Facebook」と「1」との対応付け、「Twitter」と「2」との対応付け、「Michelin」と「3」との対応付け等を示す対応付け表示画面21をタッチパネル9の表示部9aに表示させる。即ち、ユーザは、対応付け表示画面21を確認することで、音声認識により起動可能な情報系のアプリケーションの種類を把握することができ、それぞれの情報系のアプリケーションを起動させる場合に何れの記号を発話すれば良いかを把握することができる。
尚、制御部2は、対応付け表示画面21では、ユーザが発話した音声を音声認識可能であることを示すアイコン21a、ユーザが発話した音声(この場合は「Show Applications」)、情報系のアプリケーションと記号との対応付けの一覧である対応付けリスト21c、「戻る」キー21d、「前ページ」キー21e、「次ページ」キー21fを表示している。制御部2は、ユーザが「戻る」キー21dを押下したと特定すると、直前の表示画面(例えばメニュー表示画面等)を表示する。制御部2は、ユーザが「前ページ」キー21eを押下したと特定すると、前ページ分の対応付けリスト21cが存在すれば、前ページ分の対応付けリスト21cを表示し、ユーザが「次ページ」キー21fを押下したと特定すると、次ページ分の対応付けリスト21cが存在すれば、次ページ分の対応付けリスト21cを表示する。
制御部2は、対応付け表示処理を終了すると、図4に示すアプリケーション起動待機処理を開始する。制御部2は、アプリケーション起動待機処理を開始すると、ユーザが情報系のアプリケーションの名称に対して対応付け部2により対応付けられた記号を発話したか否かを監視する(ステップS11)。即ち、制御部2は、ここでも、ユーザが発話した音声をマイクロホン7からADC4を介して入力すると、その入力した音声を車両系のソフトウェアに実装されている音声認識の機能を用いて音声認識する。制御部2は、ユーザが発話した音声が、情報系のアプリケーションの名称に対して対応付けられた記号に一致すると、ユーザが当該記号を発話したと特定する(ステップS11:YES)。次いで、制御部2は、そのユーザが発話した記号を特定し(ステップS12)、その特定した記号が対応付けられた情報系のアプリケーションが存在するか否かを判定する(ステップS13)。
制御部2は、その特定した記号が対応付けられた情報系のアプリケーションが存在すると特定すると(ステップS13:YES)、その特定した記号が対応付けられた情報系のアプリケーションを特定する(ステップS14)。次いで、制御部2は、その特定した情報系のアプリケーションの起動を通知する起動表示画面を表示制御部2cによりタッチパネル9の表示部9aに表示させる(ステップS15)。そして、制御部2は、その特定した情報系のアプリケーションを実行処理部2aにより情報系のソフトウェア上で起動する(実行させる)(ステップS16)。
具体的に説明すると、制御部2は、図5に示すように情報系のアプリケーションの名称に対して記号が対応付けられている場合あれば、ユーザが例えば「1(ナンバーワン)」を発話すると、図6に示すように、「1」が対応付けられた「Facebook」の起動を通知する起動表示画面22を表示させ、「Facebook」を情報系のソフトウェア上で起動する。又、ユーザが例えば「2(ナンバートゥ)」を発話すると、「2」が対応付けられた「Twitter」の起動を通知する起動表示画面を表示させ、「Twitter」を情報系のソフトウェア上で起動する。又、ユーザが例えば「3(ナンバースリー)」を発話すると、「3」が対応付けられた「Michelin」の起動を通知する起動表示画面を表示させ、「Michelin」を情報系のソフトウェア上で起動する。
尚、制御部2は、起動表示画面22では、ユーザが発話した音声を音声認識可能であることを示すアイコン22a、ユーザが発話した音声に対して起動する情報系のアプリケーションの名称(この場合は「1 Facebook」)22b、「戻る」キー22cを表示している。制御部2は、ユーザが「戻る」キー22cを押下したと特定すると、この場合も直前の表示画面(この場合は、図5に示した対応付け表示画面)を表示する。
以上に説明した処理を制御部2が行うことで、ユーザは、起動させたい情報系のアプリケーションの名称である「Facebook」と発話しなくとも、「1(ナンバーワン)」と発話すれば、「Facebook」を起動させることができ、「Facebook」のサービスを受けることができる。同様に、ユーザは、「2(ナンバートゥ)」を発話すれば、「Twitter」を起動させることができ、「3(ナンバースリー)」を発話すれば、「Michelin」を起動させることができる。
尚、図5に示した対応付けリスト21cはユーザが押下可能なキーを兼用しており、制御部2は、ユーザが対応付けリスト21cの何れかの範囲を押下したと特定すると、ユーザが発話した場合と同様に、そのユーザが押下した範囲の情報系のアプリケーションの起動を通知する起動表示画面を表示させ、その情報系のアプリケーションを情報系のソフトウェア上で起動する。
又、上記した構成では、記号として数字を用いる場合を説明したが、複数の情報系のアプリケーションの名称に対して数字を対応付ける場合には、「1」、「2」、「3」のように規則的に並ぶ数字を対応付けなくとも、ランダムに並ぶ数字を対応付けても良い。又、図7に示すように、記号として色を用いても良い。制御部2が例えば「Facebook」に対して「RED」が対応付けられた場合であれば、ユーザは、「RED(レッド)」と発話すれば、「Facebook」を起動させることができる。尚、図7に示す「R」以外の例えば「B」、「Y」、「G」、「W」、「V」は、それぞれ「B(ブルー)」、「Y(イエロー)」、「G(グリーン)」、「W(ホワイト)」、「V(バイオレッド)」を示す。
更に、図8に示すように、記号として例えば動物等のキャラクラを用いても良い。制御部2が例えば「Facebook」に対して「CAT」が対応付けられた場合であれば、ユーザは、「CAT(キャット)」と発話すれば、「Facebook」を起動させることができる。尚、図8では図示しないが「C」は猫の絵を示すアイコンでも良い。又、図8に示す「C」以外の例えば「D」、「M」、「R」、「E」、「T」は、それぞれ「D(ドッグ)」、「M(マウス)」、「R(ラビット)」、「E(エレファント)」、「T(タイガー)」を示し、それぞれの動物の絵を示すアイコンでも良い。又、このように対応付けられる記号をユーザが任意に選択可能としても良く、制御部2は、情報系のアプリケーションの名称に対して当該ユーザが任意に選択した記号(例えば趣向に合う記号、発話し易い記号、馴染みのある記号等)を優先的に対応付けても良い。
以上に説明したように第1の実施形態によれば、情報系のアプリケーションの名称をミドルウェアを介して車両系のソフトウェアに取込み、情報系のアプリケーションの名称に対して記号(数字や色等)を対応付け、ユーザが記号を発話すると、その発話した記号が対応付けられた情報系のアプリケーションを起動するようにした。これにより、ユーザが所望の(起動させたい)情報系のアプリケーションの名称を発話しなくとも、その所望の情報系のアプリケーションの名称に対して対応付けられた記号を発話することで、その発話した記号が対応付けられた情報系のアプリケーションを実行させることができる。
即ち、発音が難解な情報系のアプリケーションの名称の辞書を作成する必要がなく、発音が容易な記号の辞書を作成することで、情報系のアプリケーションの名称の辞書を作成する手間を省きつつ、情報系のアプリケーションを音声認識の機能を用いて情報系のソフトウェア上で実行させることができ、利便性を高めることができる。特に、情報系のアプリケーションが外部から配信される配信アプリケーション等を含み、情報系のアプリケーションの更新頻度が高く、ユーザが初めて見るアプリケーションの名称もあり得るという事情を考慮すると、その初めて見るアプリケーションの名称を発話する必要もない。又、このように音声認識を用いる際の利便性を高めることで、ユーザが音声認識の機能を運転中に用いる場合でも、運転への集中が妨げられることもない。又、この場合は、ユーザが「Show Applications」を発話したことをトリガとして情報系のアプリケーションに対して記号を対応付けるので、ユーザが意識することなく、情報系のアプリケーションと記号とを対応付けることができる。
(第2の実施形態)
次に、本発明の第2の実施形態について、図9及び図10を参照して説明する。尚、上記した第1の実施形態と同一部分については説明を省略し、第1の実施形態と異なる部分について説明する。第1の実施形態は、ユーザが「Show Applications」を発話したことをトリガとし、情報系のアプリケーションの名称に対して記号を対応付ける構成であるが、第2の実施形態は、ユーザが「Show Applications」を発話したこととは関係なく、情報系のアプリケーションの名称に対して記号を対応付ける構成である。
制御部2は、ユーザが例えば情報系のアプリケーションを表示させる操作を行ったと特定すると、図9に示す対応付け処理を開始する。制御部2は、対応付け処理を開始すると、記号を対応付け可能な情報系のアプリケーションが存在するか否かを判定する(ステップS21)。
制御部2は、記号を対応付け可能な情報系のアプリケーションが存在すると特定すると(ステップS21:YES)、その記号を対応付け可能な情報系のアプリケーションのリストを示す表示画面を表示制御部2cによりタッチパネル9の表示部9aに表示させる(ステップS22)。次いで、制御部2は、ユーザが情報系のアプリケーションの名称に対して記号を対応付ける操作を行うのを監視する(ステップS23)。
制御部2は、ユーザが情報系のアプリケーションの名称に対して記号を対応付ける操作(所定操作)を行ったと特定すると(ステップS23:YES)、そのユーザの操作に応じて情報系のアプリケーションの名称に対して対応付け部2により記号を個別に対応付ける(ステップS24)。制御部2は、例えばユーザが何れかの情報系のアプリケーションの名称を選択した上で何れかの記号を選択する操作を行うことで、その選択した情報系のアプリケーションの名称に対して当該選択した記号を個別に対応付ける。即ち、第2の実施形態では、第1の実施形態とは異なり、ユーザが自分の意思により所望の情報系のアプリケーションの名称に対して所望の記号を対応付けることが可能である。
そして、制御部2は、情報系のアプリケーションの名称と記号との対応付けを所定の記憶領域に記憶し(ステップS25)、対応付け処理を終了する。尚、この場合、情報系のアプリケーションの名称と記号とを音声認識を用いて対応付けても良い。即ち、制御部2は、例えばユーザが何れかの情報系のアプリケーションの名称を選択した上で何れかの記号を発話することで、その選択した情報系のアプリケーションの名称に対して当該選択した記号を個別に対応付けても良い。
制御部2は、第1の実施形態と同様に、例えばユーザがPTTスイッチを押下したことを特定すると、図10に示す対応付け表示処理を開始する。制御部2は、対応付け表示処理を開始すると、ユーザが「Show Applications」を発話したか否かを監視する(ステップS31)。制御部2は、ユーザが「Show Applications」を発話したと特定すると(ステップS31:YES)、情報系のアプリケーションの名称と記号との対応付けを所定の記憶領域に記憶しているか否かを判定する(ステップS32)。制御部2は、情報系のアプリケーションの名称と記号との対応付けを記憶していると特定すると(ステップS32:YES)、情報系のアプリケーションの名称と記号との対応付けを所定の記憶領域から読出し(ステップS33)、情報系のアプリケーションの名称と記号との対応付けを示す対応付け表示画面を表示制御部2cによりタッチパネル9の表示部9aに表示させ(ステップS34)、対応付け表示処理を終了する。これ以降、制御部2は、第1の実施形態と同様に、対応付け表示処理を終了すると、アプリケーション起動待機処理を開始する。
以上に説明したように第2の実施形態によれば、上記した第1の実施形態と同様に、情報系のアプリケーションの名称の辞書を作成する手間を省きつつ、情報系のアプリケーションを音声認識の機能を用いて情報系のソフトウェア上で実行させることができ、利便性を高めることができる。又、この場合は、ユーザが操作を行ったことをトリガとして情報系のアプリケーションに対して記号を対応付けるので、ユーザが意識した上で、情報系のアプリケーションと記号とを対応付けることができる。
(その他の実施形態)
本発明は、上記した実施形態にのみ限定されるものではなく、以下のように変形又は拡張することができる。
情報系のアプリケーションと記号との対応付けを予め設定した所定周期にしたがって定期的に行っても良い。その場合、情報系のアプリケーションと記号との対応付けを行ったことをユーザに対して知らせるようにしても良い。
図面中、1は音声認識システム、2aは処理実行部(処理実行手段)、2bは対応付け部(対応付け手段)、2cは表示制御部(提示制御手段)、9aは表示部(提示手段)である。

Claims (6)

  1. 第1のアプリケーションを音声認識の機能を用いて第1のソフトウェア上で実行すると共に、前記第1のアプリケーションとは種別が異なる第2のアプリケーションを第2のソフトウェア上で実行する処理実行手段(2a)と、
    前記第2のアプリーションの名称に対して記号を個別に対応付ける対応付け手段(2b)と、
    前記対応付け手段により対応付けられた前記第2のアプリケーションの名称と記号との対応付けをユーザに対して提示手段(9a)により提示する提示制御手段(2c)と、を備え、
    前記処理実行手段は、ユーザが発話した音声を前記第1のソフトウェア上で音声認識し、ユーザが発話した音声が前記対応付け手段により前記第2のアプリケーションの名称に対して対応付けられた記号であると前記第1のソフトウェア上で音声認識した場合に、前記対応付け手段により当該記号が対応付けられた前記第2のアプリケーションを前記第2のソフトウェア上で実行することを特徴とする音声認識システム。
  2. 請求項1に記載した音声認識システムにおいて、
    前記対応付け手段は、前記提示制御手段が前記第2のアプリケーションを前記提示手段により提示するトリガが発生した場合に、前記第2のアプリーションの名称に対して前記記号を個別に対応付けることを特徴とする音声認識システム。
  3. 請求項2に記載した音声認識システムにおいて、
    前記対応付け手段は、前記提示制御手段が前記第2のアプリケーションを前記提示手段により提示するトリガが発生した場合として、ユーザが前記第2のアプリケーションの提示を指示する音声を発話した場合に、前記第2のアプリーションの名称に対して前記記号を個別に対応付けることを特徴とする音声認識システム。
  4. 請求項1に記載した音声認識システムにおいて、
    前記対応付け手段は、ユーザが前記第2のアプリーションの名称と前記記号を個別に対応付ける所定操作を行った場合に、前記第2のアプリーションの名称に対して前記記号とを当該所定操作に応じて個別に対応付けることを特徴とする音声認識システム。
  5. 請求項1から4の何れか一項に記載した音声認識システムにおいて、
    前記処理実行手段は、前記第1のアプリケーションとして車両系のアプリケーションを音声認識の機能を用いて前記第1のソフトウェアとして車両系のソフトウェア上で実行すると共に、前記第2のアプリケーションとして情報系のアプリケーションを前記第2のソフトウェアとして情報系のソフトウェア上で実行することを特徴とする音声認識システム。
  6. 請求項5に記載した音声認識システムにおいて、
    前記処理実行手段は、前記情報系のアプリケーションとして外部から通信網を介して配信された配信アプリケーションを前記情報系のソフトウェア上で実行することを特徴とする音声認識システム。
JP2013068853A 2013-03-28 2013-03-28 音声認識システム Expired - Fee Related JP6167605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013068853A JP6167605B2 (ja) 2013-03-28 2013-03-28 音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013068853A JP6167605B2 (ja) 2013-03-28 2013-03-28 音声認識システム

Publications (2)

Publication Number Publication Date
JP2014191295A true JP2014191295A (ja) 2014-10-06
JP6167605B2 JP6167605B2 (ja) 2017-07-26

Family

ID=51837559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013068853A Expired - Fee Related JP6167605B2 (ja) 2013-03-28 2013-03-28 音声認識システム

Country Status (1)

Country Link
JP (1) JP6167605B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254612A (zh) * 2015-06-15 2016-12-21 中兴通讯股份有限公司 一种语音控制方法及装置
US11211067B2 (en) 2018-09-20 2021-12-28 Dynabook Inc. Electronic device and control method
JP7475079B2 (ja) 2020-09-08 2024-04-26 株式会社ユピテル 装置及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102453833B1 (ko) 2018-05-10 2022-10-14 삼성전자주식회사 전자 장치 및 그 제어 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11337365A (ja) * 1998-05-29 1999-12-10 Clarion Co Ltd ナビゲーションシステム及び方法並びにナビゲーション用ソフトウェアを記録した記録媒体
JP2004086029A (ja) * 2002-08-28 2004-03-18 Honda Motor Co Ltd クライアント/サーバ型車両情報通信システム
JP2006146182A (ja) * 2004-11-16 2006-06-08 Microsoft Corp 音声コマンドを明瞭化する集中化された方法およびシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11337365A (ja) * 1998-05-29 1999-12-10 Clarion Co Ltd ナビゲーションシステム及び方法並びにナビゲーション用ソフトウェアを記録した記録媒体
JP2004086029A (ja) * 2002-08-28 2004-03-18 Honda Motor Co Ltd クライアント/サーバ型車両情報通信システム
JP2006146182A (ja) * 2004-11-16 2006-06-08 Microsoft Corp 音声コマンドを明瞭化する集中化された方法およびシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254612A (zh) * 2015-06-15 2016-12-21 中兴通讯股份有限公司 一种语音控制方法及装置
US11211067B2 (en) 2018-09-20 2021-12-28 Dynabook Inc. Electronic device and control method
JP7475079B2 (ja) 2020-09-08 2024-04-26 株式会社ユピテル 装置及びプログラム

Also Published As

Publication number Publication date
JP6167605B2 (ja) 2017-07-26

Similar Documents

Publication Publication Date Title
US11676601B2 (en) Voice assistant tracking and activation
JP6570651B2 (ja) 音声対話装置および音声対話方法
US10424298B2 (en) Voice processing device
US7203651B2 (en) Voice control system with multiple voice recognition engines
US20150039316A1 (en) Systems and methods for managing dialog context in speech systems
JP6167605B2 (ja) 音声認識システム
JP5570641B2 (ja) 携帯端末装置、車載器、情報提示方法及び情報提示プログラム
US7548861B2 (en) Speech recognition system
EP3663906A1 (en) Information processing device, voice recognition system, and information processing method
JP2015068866A (ja) 車両用装置、サーバ、及び、情報処理方法
EP3226239B1 (en) Voice command system
JP2010130223A (ja) 音声操作システムおよび音声操作方法
KR101724748B1 (ko) 차량용 음성인식 장치
KR20220143683A (ko) 전자 개인 비서 조정
JP5277704B2 (ja) 音声認識装置及びこれを用いる車両システム
JP2019001428A (ja) 車載装置、音声操作システムおよび音声操作方法
JP2020060730A (ja) 音声認識装置
JP2014062944A (ja) 情報処理装置
JP5350567B1 (ja) 携帯端末装置、車載器、情報提示方法及び情報提示プログラム
JP5979303B2 (ja) 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム
JPWO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
US20180190287A1 (en) Selection system and method
US20210233516A1 (en) Agent system, agent server, and computer readable recording medium
KR101556578B1 (ko) 차량용 avn 장치 안내 정보를 스마트폰 사용자 언어로 변환 제공하는 음성 안내 시스템 및 방법
JP2013068665A (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170612

R151 Written notification of patent or utility model registration

Ref document number: 6167605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees