JPWO2014109104A1

JPWO2014109104A1 - 音声認識装置、音声認識プログラム及び音声認識方法

Info

Publication number: JPWO2014109104A1
Application number: JP2014556325A
Authority: JP
Inventors: 宗紀杉田
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2013-01-08
Filing date: 2013-10-21
Publication date: 2017-01-19
Also published as: CN104903846A; US20150348555A1; EP2945052B1; CN104903846B; EP2945052A4; EP2945052A1; WO2014109104A1

Abstract

本発明の目的は、より利便性の高い音声認識装置の技術を提供することにある。本発明に係る音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、所定の画面において接触指示受付部による指示の受け付けが制限されると、所定の画面における選択肢を選択された回数に応じた順に音声出力する選択肢読上部と、を備え、音声指示受付部は、選択肢読上部により出力された選択肢のいずれかについて指示を受け付ける、ことを特徴とする。

Description

本発明は、音声認識装置の技術に関するものである。本発明は２０１３年１月８日に出願された日本国特許の出願番号２０１３−１３７３の優先権を主張し、文献の参照による織り込みが認められる指定国については、その出願に記載された内容は参照により本出願に織り込まれる。

従来、電子機器に関連する状態を検出する検出手段と、検出された状態の少なくとも一部に基づいて音声認識を開始するか否かまたは音声認識を終了するか否かを判定する判定手段とを有し、判定結果に基づいて音声認識の開始または終了を決定して、音声認識を行い、その認識結果に基づいて所定の動作を行わせる電子機器の技術がある。特許文献１には、このような装置についての技術が記載されている。

特開２００３−１９５８９１号公報

上記のような装置では、音声認識が開始された後であっても、例えば、ユーザーが指示対象の名称等を失念あるいは不正確にしか記憶していない場合には、発話による音声の指示が適切なものとならず、意図通りの操作を行うことができなくなってしまう場合がある。

本発明の目的は、より利便性の高い音声認識装置の技術を提供することにある。

上記課題を解決すべく、本発明に係る音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上部と、を備え、前記音声指示受付部は、前記選択肢読上部により出力された前記選択肢のいずれかについて指示を受け付ける、ことを特徴とする。

また、上記音声認識装置であって、前記選択肢読上部は、前記音声指示受付部により受け付けた前記選択肢が、前記所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、前記遷移先画面の前記絞込条件によって絞り込まれた選択肢をさらに音声出力する、ことを特徴とするものであってもよい。

また、上記音声認識装置であって、前記選択肢読上部は、前記音声指示受付部により受け付けた前記選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、前記決定条件により特定される前記処理対象について前記所定の処理を行う、ことを特徴とするものであってもよい。

また、上記音声認識装置であって、前記選択肢読上部は、前記所定の画面における選択肢のうち表示済みの選択肢について除外して音声出力を行う、ことを特徴とするものであってもよい。

また、上記音声認識装置であって、前記所定の画面におけるそれぞれの前記選択肢は、所定の楽曲ファイルを特定し、前記選択肢読上部は、前記楽曲ファイルごとに当該楽曲ファイルの少なくとも一部を再生することで前記選択肢の音声出力を行う、ことを特徴とするものであってもよい。

また、上記音声認識装置であって、前記接触指示受付部と、前記音声指示受付部と、が指示を受け付けた選択肢について、前記選択履歴情報の選択された回数を更新する履歴作成部、を備えることを特徴とするものであってもよい。

また、上記音声認識装置であって、移動体に搭載され、前記移動体が所定の速度以上で移動を開始すると、前記接触指示受付部による指示の受け付けを制限する入力受付切替部、を備えることを特徴とするものであってもよい。

また、本発明に係る音声認識プログラムは、コンピュータに、音声認識手順を実行させるプログラムであって、前記コンピュータを、制御手段と、接触する操作により指示を受け付ける接触指示受付手段と、音声による操作により指示を受け付ける音声指示受付手段と、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶手段として機能させ、前記制御手段に対して、所定の画面において前記接触指示受付手段による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上手順と、を実行させ、前記音声指示受付手段では、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付ける、ことを特徴とする。

また、本発明に係る音声認識装置による音声認識方法は、前記音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、を備え、所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上ステップと、前記音声指示受付部により、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付けるステップと、を実施することを特徴とする。

本願発明によれば、より利便性の高い音声認識装置の技術を提供することが可能となる。

ナビゲーション装置の概略構成図である。リンクテーブルの構成を示す図である。画面定義テーブルの構成を示す図である。選択履歴テーブルの構成例を示す図である。画面遷移の構成例を示す図である。ナビゲーション装置の演算処理部の機能構成図である。音声操作引き継ぎ処理のフロー図である。選択対象が絞込条件の場合のタッチ操作画面の出力画面例を示す図である。選択対象が絞込条件の場合のタッチ操作禁止画面の出力画面例を示す図である。選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。選択対象が絞込条件の場合のタッチ操作画面の出力画面例を示す図である。選択対象が絞込条件の場合のタッチ操作禁止画面の出力画面例を示す図である。選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。

以下に、本発明に係るナビゲーション装置１００について、図面を参照して説明する。

図１に、ナビゲーション装置１００の全体構成図を示す。ナビゲーション装置１００は、地図情報を表示して、ナビゲーション装置１００の現在地を示す地点と、設定された目的地までの経路を誘導する情報とを示すことが可能ないわゆるナビゲーション装置である。

ナビゲーション装置１００は、演算処理部１と、ディスプレイ２と、記憶装置３と、音声入出力装置４（音声入力装置としてマイクロフォン４１、音声出力装置としてスピーカ４２を備える）と、入力装置５と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）装置６と、車速センサ７と、ジャイロセンサ８と、ＧＰＳ(ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ)受信装置９と、ＦＭ多重放送受信装置１０と、ビーコン受信装置１１と、車載ネットワーク通信装置１２と、を備えている。

演算処理部１は、様々な処理を行う中心的ユニットである。例えば各種センサ７,８やＧＰＳ受信装置９、ＦＭ多重放送受信装置１０等から出力される情報に基づいて現在地を算出する。また、得られた現在地の情報に基づいて、表示に必要な地図データを記憶装置３あるいはＲＯＭ装置６から読み出す。

また、演算処理部１は、読み出した地図データをグラフィックス展開し、そこに現在地を示すマークを重ねてディスプレイ２へ表示する。また、記憶装置３あるいはＲＯＭ装置６に記憶されている地図データ等を用いて、現在地又はユーザーから指示された出発地と、目的地（または、経由地や立ち寄り地）と、を結ぶ最適な経路である推奨経路を探索する。また、スピーカ４２やディスプレイ２を用いてユーザーを誘導する。

ナビゲーション装置１００の演算処理部１は、各デバイス間をバス２５で接続した構成である。演算処理部１は、数値演算及び各デバイスを制御するといった様々な処理を実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２１と、記憶装置３から読み出した地図データ、演算データなどを格納するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２２と、プログラムやデータを格納するＲＯＭ２３と、各種ハードウェアを演算処理部１と接続するためのＩ／Ｆ（インターフェイス）２４と、を有する。

ディスプレイ２は、演算処理部１等で生成されたグラフィックス情報を表示するユニットである。ディスプレイ２は、液晶ディスプレイ、有機ＥＬディスプレイなどで構成される。

記憶装置３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）や不揮発性メモリカードといった、少なくとも読み書きが可能な記憶媒体で構成される。

この記憶媒体には、通常の経路探索装置に必要な地図データ（地図上の道路を構成するリンクのリンクデータを含む）であるリンクテーブル２００と、ナビゲーション装置１００において表示される画面の定義情報である画面定義テーブル３００と、画面単位で、各画面において選択する候補となる選択肢が実際に選択された選択回数を選択肢ごとに対応付ける選択履歴テーブル４００と、が記憶されている。また、記憶装置３の記憶媒体には、一または二以上の楽曲ファイル、再生対象とする楽曲ファイルを識別する識別情報と当該複数の楽曲ファイルの再生順序とを規定するプレイリストに関する情報等が記憶されている。なお、各楽曲ファイルには、楽曲のアーティストを特定する情報、作曲家、ジャンル、当該楽曲が収められたアルバム名等の属性情報がメタ情報として含まれる。

図２は、リンクテーブル２００の構成を示す図である。リンクテーブル２００は、地図上の区画された領域であるメッシュの識別コード（メッシュＩＤ）２０１ごとに、そのメッシュ領域に含まれる道路を構成する各リンクのリンクデータ２０２を含んでいる。

リンクデータ２０２は、リンクの識別子であるリンクＩＤ２１１ごとに、リンクを構成する２つのノード（開始ノード、終了ノード）の座標情報２２２、リンクを含む道路の種別を示す道路種別２２３、リンクの長さを示すリンク長２２４、予め記憶されたリンク旅行時間２２５、開始接続リンクおよび終了接続リンク２２６、リンクを含む道路の制限速度を示す制限速度２２７などを含んでいる。なお、開始接続リンクおよび終了接続リンク２２６は、当該リンクの開始ノードに接続するリンクである開始接続リンクと、当該リンクの終了ノードに接続するリンクである終了接続リンクと、を特定する情報である。

なお、ここでは、リンクを構成する２つのノードについて開始ノードと終了ノードとを区別することで、同じ道路の上り方向と下り方向とを、それぞれ別のリンクとして管理するようにしているが、これに限られない。例えば、リンクを構成する２つのノードについて開始ノードと終了ノードとを区別しないものであってもよい。

図３は、画面定義テーブル３００の構成を示す図である。画面定義テーブル３００は、画面ＩＤ３０１と、画面階層３０２と、上階層画面３０３と、画面内ページＩＤ３０４と、下階層画面３０５と、音声操作引き継ぎ可否３０６と、を対応付けた情報を含んでいる。

画面ＩＤ３０１は、画面を特定する情報である。画面階層３０２は、画面遷移体系の中で画面ＩＤ３０１により特定される画面が位置する階層を特定する情報である。上階層画面３０３は、画面ＩＤ３０１により特定される画面の直上階層の画面を特定する情報である。画面内ページＩＤ３０４は、画面ＩＤ３０１により特定される画面が選択肢の量が増えると複数ページに表示が分かれる構成である場合に、その分けられたページを特定する情報である。下階層画面３０５は、画面ＩＤ３０１により特定される画面の直下階層の画面を特定する情報である。音声操作引き継ぎ可否３０６は、画面ＩＤ３０１により特定される画面を表示中に手動操作を受け付けなくなった場合に音声操作に入力方法を引き継ぐページであるか否かを特定する情報である。

図４は、選択履歴テーブル４００の構成を示す図である。選択履歴テーブル４００は、画面ＩＤ４０１と、選択肢４０２と、選択回数４０３と、を対応付けた情報を含んでいる。

画面ＩＤ４０１は、画面を特定する情報である。選択肢４０２は、画面ＩＤ４０１により特定される画面において表示される選択肢を特定する情報である。なお、選択肢４０２には、最終的に操作する対象を特定するための決定条件、例えば再生する楽曲ファイルのファイル名や目的地として設定する施設の施設名等を特定する情報が含まれる。また、選択肢４０２には、決定条件そのものではないが決定条件を絞り込むための条件である絞込条件、例えば再生する楽曲ファイルのアーティストや目的地として設定する施設のカテゴリを特定する情報も含まれる。また、選択肢４０２には、「戻る」や「ＯＫ」、「キャンセル」ボタン等の手動操作を受け付けるための情報についても含まれる。

選択回数４０３は、選択肢４０２に関して実際に選択された回数を特定する情報である。例えば、ある画面において選択肢の一つが過去に５回選択されているとすると、当該選択肢の選択回数４０３には選択された回数が「５回」であることを特定する情報が格納される。

図１に戻って説明する。音声入出力装置４は、音声入力装置としてマイクロフォン４１と、音声出力装置としてスピーカ４２と、を備える。マイクロフォン４１は、ユーザーやその他の搭乗者が発した声などのナビゲーション装置１００の外部の音声を取得し、音声操作を受け付ける。

スピーカ４２は、演算処理部１で生成されたユーザーへのメッセージを音声として出力する。マイクロフォン４１とスピーカ４２は、車両の所定の部位に、別個に配されている。ただし、一体の筐体に収納されていても良い。ナビゲーション装置１００は、マイクロフォン４１及びスピーカ４２を、それぞれ複数備えることができる。

入力装置５は、ユーザーからの指示をユーザーによる手動操作を介して受け付ける装置である。入力装置５は、タッチパネル５１と、ダイヤルスイッチ５２と、その他のハードスイッチ（図示しない）であるスクロールキー、縮尺変更キーなどで構成される。また、入力装置５には、ナビゲーション装置１００に対して遠隔で操作指示を行うことができるリモートコントローラが含まれる。リモートコントローラは、ダイヤルスイッチやスクロールキー、縮尺変更キーなどを備え、各キーやスイッチが操作された情報をナビゲーション装置１００に送出することができる。

タッチパネル５１は、ディスプレイ２の表示面側に搭載され、表示画面を透視可能である。タッチパネル５１は、ディスプレイ２に表示された画像のＸＹ座標と対応した手動操作が行われたタッチ位置を特定し、タッチ位置を座標に変換して出力する。タッチパネル５１は、感圧式または静電式の入力検出素子などにより構成される。なお、タッチパネル５１は、同時に複数のタッチ位置を検出することのできるマルチタッチを実現できるものであってもよい。

ダイヤルスイッチ５２は、時計回り及び反時計回りに回転可能に構成され、所定の角度の回転ごとにパルス信号を発生し、演算処理部１に出力する。演算処理部１では、パルス信号の数から、回転角度を求める。

ＲＯＭ装置６は、ＣＤ-ＲＯＭやＤＶＤ-ＲＯＭ等のＲＯＭや、ＩＣ（Integrated Circuit）カードといった、少なくとも読み取りが可能な記憶媒体で構成されている。この記憶媒体には、例えば、動画データや、音声データなどが記憶されている。

車速センサ７,ジャイロセンサ８およびＧＰＳ受信装置９は、ナビゲーション装置１００で現在地（例えば、自車位置）を検出するために使用されるものである。車速センサ７は、車速を算出するのに用いる値を出力するセンサである。ジャイロセンサ８は、光ファイバジャイロや振動ジャイロ等で構成され、移動体の回転による角速度を検出するものである。ＧＰＳ受信装置９は、ＧＰＳ衛星からの信号を受信し移動体とＧＰＳ衛星間の距離と距離の変化率とを３個以上の衛星に対して測定することで移動体の現在地、進行速度および進行方位を測定するものである。

ＦＭ多重放送受信装置１０は、ＦＭ放送局から送られてくるＦＭ多重放送信号を受信する。ＦＭ多重放送には、ＶＩＣＳ（ＶｅｈｉｃｌｅＩｎｆｏｒｍａｔｉｏｎＣｏｍｍｕｎｉｃａｔｉｏｎＳｙｓｔｅｍ：登録商標）情報の概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報、天気情報などやＦＭ多重一般情報としてラジオ局が提供する文字情報などがある。

ビーコン受信装置１１は、ＶＩＣＳ情報などの概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報、天気情報や緊急警報などを受信する。例えば、光により通信する光ビーコン、電波により通信する電波ビーコン等の受信装置である。

車載ネットワーク通信装置１２は、ナビゲーション装置１００を、図示しない車両の制御ネットワーク規格であるＣＡＮ（ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋ）等に対応するネットワークに接続させ、ネットワークに接続された他の車両制御装置であるＥＣＵ（Ｅｌｅｃｔｒｏｎｉｃｃｏｎｔｒｏｌｕｎｉｔ）とＣＡＮメッセージをやり取りすることで通信を行う装置である。

図５は、本実施形態における操作画面に関する画面遷移の構成例を示す図である。本実施形態においては、画面遷移は階層構造で表され、より深い階層の画面は、より浅い階層すなわち上位階層の画面よりも具体的な情報の入出力を担う画面、あるいは処理結果を示す画面としてデザインされる。ただし、直接的な遷移関係を持たない画面同士は、具体化の度合いに差異があっても差し支えはない。例えば、アーティストを選択する画面を経由して絞り込みが行われた楽曲選択画面と、絞り込みが行われない楽曲選択画面とでは、いずれも楽曲を選択する画面であるが、画面遷移上の階層が異なっていてもよい。また、各画面においては、入力制限部１０５によって手動操作が制限されていない状態では、手動操作と音声操作とのいずれの操作も受け付けることが可能であり、入力制限部１０５によって手動操作が制限されている状態では、音声操作を受け付けることが可能である。

図５に例示するように、本実施形態においては、最上位となる第０階層５０１にメニュー画面５１１が存在し、メニュー画面５１１から下位の階層となる第１階層５０２のアーティスト選択画面５２１と、プレイリスト選択画面５２２と、アルバム選択画面５２３と、のいずれかの画面への遷移を行う指示を受け付けるボタン等が選択肢として設けられている。

ここで、アーティスト選択画面５２１は、記憶装置３あるいはＲＯＭ装置６に格納された楽曲ファイルに含まれるメタ情報に当該楽曲に関するアーティストを特定する情報が含まれる場合に、当該アーティストの楽曲を他のアーティストの楽曲と区別して絞り込むための絞込条件の入力を受け付ける画面である。また、アーティスト選択画面５２１には、楽曲の演奏等を行うアーティストを特定する選択肢が表示される。いずれのアーティストの選択肢が選択された場合であっても、下位の階層となる第２階層５０３のアーティスト楽曲選択画面５３１へ遷移するよう構成されている。

また、プレイリスト選択画面５２２は、記憶装置３あるいはＲＯＭ装置６に、当該記憶装置３等に格納された楽曲ファイルの再生順序を特定するプレイリスト情報が含まれる場合に、当該プレイリストの楽曲を再生する指示を受け付ける、すなわち決定条件の入力を受け付ける画面である。

アルバム選択画面５２３は、記憶装置３あるいはＲＯＭ装置６に格納された楽曲ファイルに含まれるメタ情報にアルバムを特定する情報が含まれる場合に、当該アルバムの楽曲を他のアルバムの楽曲から区別して絞り込むための絞込条件の入力を受け付ける画面である。また、アルバム選択画面５２３には、楽曲が一つまたは複数で所定の順に束ねて管理される単位であるアルバムを特定する選択肢が表示されるが、いずれのアルバムの選択肢が選択された場合であっても、下位の階層となる第２階層５０３のアルバム楽曲選択画面５３３へ遷移するよう構成されている。

アーティスト選択画面５２１から遷移するアーティスト楽曲選択画面５３１は、選択されたアーティストの楽曲に絞り込んだ楽曲を選択可能に提示し、楽曲ファイルを特定する決定条件の入力を受け付ける画面である。また、アーティスト楽曲選択画面５３１には、楽曲を特定する選択肢が表示される。いずれの楽曲の選択肢が選択された場合であっても、下位の階層となる第３階層５０４の楽曲再生画面５４１へ遷移するよう構成されている。また、アーティスト楽曲選択画面５３１に表示が収まらないほどに表示する楽曲の選択肢が多い場合には、アーティスト楽曲選択画面５３１を複数のページに分割表示するための画面としてアーティスト楽曲選択（ページ２）５３２が追加され、アーティスト楽曲選択画面（ページ１）５３１とアーティスト楽曲選択画面（ページ２）とが相互に進退可能に表示される。なお、ページ間の表示範囲の変更操作については、変更前後のページを切り替えるようにしてもよいし、スクロール等の操作により各ページに含まれる選択肢を連続的に変化させて表示範囲を変更させることを可能としてもよい。

アルバム選択画面５２３から遷移するアルバム楽曲選択画面５３３は、選択されたアルバムの楽曲に絞り込んだ楽曲を選択可能に提示し、楽曲ファイルを特定する決定条件の入力を受け付ける画面である。また、アルバム楽曲選択画面５３３には、楽曲を特定する選択肢が表示される。いずれの楽曲の選択肢が選択された場合であっても、下位の階層となる第３階層５０４の楽曲再生画面５４２へ遷移するよう構成されている。なお、アルバム楽曲選択画面５３３に表示が収まらないほどに表示する楽曲の選択肢が多い場合のページ追加については、上記アーティスト楽曲選択画面５３１、５３２と同様である。

アーティスト楽曲選択画面（ページ１）５３１あるいはアーティスト楽曲選択画面（ページ２）５３２から遷移する楽曲再生画面５４１は、決定条件の入力がなされた楽曲ファイルに関連する情報を提示する画面である。例えば、楽曲再生画面５４１には、楽曲ファイルの再生に関連する動画や静止画の表示と、楽曲の長さに対する再生済み部分の長さをインジケータで示す表示と、楽曲の再生、停止、一時停止、早送り、巻き戻し、出力音量の調整等の操作パネル等の表示等が表示される。

アルバム楽曲選択画面５３３から遷移する楽曲再生画面５４２は、決定条件の入力がなされた楽曲ファイルに関連する情報を提示する画面である。例えば、楽曲再生画面５４２には、楽曲ファイルに関連する動画や静止画の表示と、楽曲の長さに対する再生済み部分の長さをインジケータで示す表示と、楽曲の再生、停止、一時停止、早送り、巻き戻し、出力音量の調整等の操作パネル等の表示等が表示される。

図６は、演算処理部１の機能ブロック図である。図示するように、演算処理部１は、基本制御部１０１と、入力受付部１０２と、出力処理部１０３と、操作履歴作成部１０４と、入力制限部１０５と、入力受付切替部１０６と、選択肢読上部１０７と、を含む。

基本制御部１０１は、様々な処理を行う中心的な機能部であり、処理内容に応じて、他の機能部の動作を制御する。また、各種センサ、ＧＰＳ受信装置９等の情報を取得し、マップマッチング処理等を行って現在地を特定する。また、随時、走行した日付および時刻と、位置と、を対応付けて、リンクごとに走行履歴を記憶装置３に記憶する。さらに、各処理部からの要求に応じて、現在時刻を出力する。

また、基本制御部１０１は、現在地又はユーザーから指示された出発地と、目的地（または、経由地や立ち寄り地）とを結ぶ最適な経路である推奨経路を探索する。当該経路探索においては、ダイクストラ法等の経路探索ロジックを用いて、道路の所定の区間（リンク）に対して予め設定されたリンクコストに基づいて、リンクコストが最小となる経路を探索する。

また、基本制御部１０１は、現在地が推奨経路から逸脱しないよう、推奨経路を表示させつつスピーカ４２やディスプレイ２を用いてユーザーを誘導する。

入力受付部１０２は、入力装置５またはマイクロフォン４１を介して入力されたユーザーからの手動操作あるいは音声操作を受け付け、その音声操作に関する情報であるタッチの座標位置や、音声情報とともに、要求内容に対応する処理を実行するように基本制御部１０１へ伝達する。例えば、ユーザーが推奨経路の探索を要求したときは、その要求指示を基本制御部１０１に要求する。すなわち、入力受付部１０２は、接触を伴う手動操作により指示を受け付ける接触指示受付部であるといえる。また、入力受付部１０２は、音声による操作（音声操作）により指示を受け付ける音声指示受付部であるともいえる。

出力処理部１０３は、例えばポリゴン情報等、表示させる画面を構成する情報を受け取り、ディスプレイ２に描画するための信号に変換してディスプレイ２に対して描画する指示を行う。

操作履歴作成部１０４は、楽曲ファイルの実行や、目的地の設定等のナビゲーション装置１００における所定の処理について、受け付けた絞込条件あるいは決定条件の入力の履歴を作成する。具体的には、操作履歴作成部１０４は、楽曲ファイルの実行（再生）時や、経路探索の目的地設定時に入力を受け付けた絞込条件あるいは決定条件である選択肢のそれぞれについて、実行（選択入力を指示）された回数を計数し、選択履歴テーブル４００の選択回数４０３として記憶装置３に格納させる。

入力制限部１０５は、ナビゲーション装置１００が搭載された車両等の状態に応じて、入力を制限することを決定する。具体的には、入力制限部１０５は、車両が停車中には、入力受付部１０２に対するタッチパネル５１あるいはダイヤルスイッチ５２を介した手動操作およびマイクロフォン４１を介した音声操作のいずれによる操作も受け付けるが、一定速度以上となる走行中には、入力受付部１０２に対するタッチパネル５１あるいはダイヤルスイッチ５２を介した手動操作を制限することを決定する。また、入力制限部１０５は、車両を移動させるギヤが選択されている場合、すなわちパーキングギヤを選択されていない場合等には、入力受付部１０２に対するタッチパネル５１あるいはダイヤルスイッチ５２を介した手動操作を制限することを決定する。

入力受付切替部１０６は、入力制限部１０５の決定を受けて、出力処理部１０３に対して、「走行中」等の所定の画面操作無効化メッセージを表示するよう指示し、入力受付部１０２に対して、タッチパネル５１あるいはダイヤルスイッチ５２を介した手動操作を制限するとともに、音声入出力装置４を介した音声操作を受け付けるよう指示して入力方法を切り替える。

選択肢読上部１０７は、入力受付切替部１０６により入力方法が切り替えられると、切り替えられた時点において表示されていた画面上の選択肢およびそれ以降の遷移画面上の選択肢を、その選択された回数に応じた順でスピーカ４２等を介して音声により出力する。すなわち、選択肢読上部１０７は、所定の画面において入力制限部１０５により手動操作の受け付けが制限されると、所定の画面における選択肢を選択された回数に応じた順に音声出力するといえる。

また、当該選択肢の音声出力処理においては、選択肢読上部１０７は、選択肢ごとに音声操作を受け付ける所定の期間である音声操作受付期間を設けて、当該期間においては入力受付部１０２による音声操作を受け付ける。所定の音声操作（例えば、肯定を意味する「はい」、「オーケー」あるいは「イエス」等の音声操作）を受け付けた場合には、選択肢読上部１０７は、当該音声操作受付期間に係る選択肢が選択入力されたものとして、遷移先画面（下階層画面等）の選択肢を特定し、特定した選択肢の読み上げおよび選択入力の受け付けを開始する。

所定の音声操作を受け付けない場合（例えば、無反応の場合、無音の場合あるいは否定を意味する「いいえ」、「次」、「ネクスト」、「ノー」等の音声操作を受け付けた場合）には、選択肢読上部１０７は、次の選択肢を、スピーカ４２等を介して音声により出力し、所定の音声操作受付期間を設けて、当該期間に入力受付部１０２による音声操作を受け付ける。

また、選択肢読上部１０７は、音声操作により受け付けた選択肢が、所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、遷移先画面の絞込条件によって絞り込まれた選択肢をさらに音声出力する。

また、選択肢読上部１０７は、音声操作により受け付けた選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、決定条件により特定される処理対象について所定の処理を行う。

また、選択肢読上部１０７は、所定の画面における選択肢のうち表示済みの選択肢については、除外して音声出力を行う。

上記した演算処理部１の各機能部、すなわち基本制御部１０１、入力受付部１０２、出力処理部１０３、操作履歴作成部１０４、入力制限部１０５、入力受付切替部１０６、選択肢読上部１０７は、ＣＰＵ２１が所定のプログラムを読み込み実行することにより構築される。そのため、ＲＡＭ２２には、各機能部の処理を実現するためのプログラムが記憶されている。

なお、上記した各構成要素は、ナビゲーション装置１００の構成を、理解を容易にするために、主な処理内容に応じて分類したものである。そのため、構成要素の分類の仕方やその名称によって、本願発明が制限されることはない。ナビゲーション装置１００の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

また、各機能部は、ハードウェア（ＡＳＩＣ、ＧＰＵなど）により構築されてもよい。また、各機能部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

［動作の説明］次に、ナビゲーション装置１００が実施する音声操作引き継ぎ処理の動作について説明する。図７は、ナビゲーション装置１００が実施する音声操作引き継ぎ処理を示すフロー図である。このフローは、ナビゲーション装置１００の起動後に、ナビゲーション装置１００が搭載された車両が走行を開始した場合等において入力制限部１０５により手動操作の制限が決定された場合であって、入力受付切替部１０６により手動操作および音声操作のいずれも受け付ける入力方法から手動操作の受け付けを制限して音声操作を受け付ける入力方法へと入力方法が切り替えられると、実施される。

まず、選択肢読上部１０７は、操作制限時の画面ＩＤを特定する（ステップＳ００１）。具体的には、選択肢読上部１０７は、入力制限部１０５により手動操作が制限された状態において表示されていた画面がメニュー画面から起動された所定の機能の画面表示である場合に、当該機能について表示されていた画面ＩＤを特定する。

そして、選択肢読上部１０７は、当該画面における選択候補を特定する（ステップＳ００２）。具体的には、選択肢読上部１０７は、ステップＳ００１にて特定した画面ＩＤで特定される画面において選択可能に表示されていた選択肢を、選択候補として特定する。なお、選択肢読上部１０７は、当該画面について、音声操作引き継ぎ可否３０６を参照し、引き継ぎが可能でない場合には、音声操作引き継ぎ処理の動作を終了するようにしてもよい。

そして、選択肢読上部１０７は、選択候補ごとに過去の選択回数を特定する（ステップＳ００３）。具体的には、選択肢読上部１０７は、ステップＳ００２において特定された選択候補である選択肢のそれぞれについて、選択履歴テーブル４００において対応付けられた選択回数４０３を読み出して、選択回数を特定する。

そして、選択肢読上部１０７は、操作制限時に表示中の画面内ページＩＤを特定する（ステップＳ００４）。具体的には、選択肢読上部１０７は、入力制限部１０５により手動操作が制限された状態となった状況で表示されていた画面においてページ間の表示範囲の変更操作が実施されていた場合には、すでに参照を終えたページすなわち表示後に表示範囲から除外されたページを特定する。なお、選択肢読上部１０７は、入力制限部１０５により入力が制限された状態において表示されていた画面においてスクロール等によりページ間の表示範囲の変更操作が実施されていた場合には、すでに参照を終えたページすなわち表示後に表示範囲から除外された選択肢を特定する。

そして、選択肢読上部１０７は、選択候補から表示中の画面内の以降のページに含まれる候補を抽出する（ステップＳ００５）。具体的には、選択肢読上部１０７は、ステップＳ００２において特定した選択候補のうち、ステップＳ００４において特定した参照を終えたページに含まれる選択候補（または、スクロールの場合には表示範囲から除外された選択候補）を除外することで、選択候補の抽出を行う。

そして、選択肢読上部１０７は、抽出した選択候補を過去の選択回数が多い順にイントロ音声又は候補読み上げを行う（ステップＳ００６）。具体的には、選択肢読上部１０７は、ステップＳ００５において抽出した選択候補について、ステップＳ００３において特定した選択回数の多い順にソートし、選択回数が多い選択候補の読上げを行う。当該読上げの処理に際しては、選択肢読上部１０７は、選択候補が決定条件である場合には、当該選択候補が決定条件を受け付けた場合に実行される処理の一部を開始し、選択候補が絞込条件である場合には選択肢の名称等を音声で出力する。例えば、選択候補が楽曲である場合には、決定条件に該当し、選択肢読上部１０７は楽曲の先頭から所定時間（例えば３秒）再生して音声を出力する。また例えば、選択候補がアーティストである場合には、絞込条件に該当し、選択肢読上部１０７はアーティストの名称をＴＳ（ＴｅｘｔｔｏＳｐｅｅｃｈ）等により音声出力する。

そして、選択肢読上部１０７は、選択を指示する音声操作を受け付けたか否かを判定する（ステップＳ００７）。具体的には、選択肢読上部１０７は、入力受付部１０２に対して、ステップＳ００６において読み上げを行っている候補について、肯定又は否定の選択を指示する音声操作を受け付けたか否かを判定する。選択を指示する音声操作を受け付けていない場合には、選択肢読上部１０７は、所定の音声操作受付期間内（例えば、選択肢の読み上げ開始後であって、選択肢の読み上げ終了後２秒以内）においては反復的に、選択を指示する音声操作を受け付けたか否かを判定する。

選択を指示する音声操作を受け付けた場合（ステップＳ００７において「Ｙｅｓ」の場合）には、選択肢読上部１０７は、選択を指示する音声を認識した時点において出力していた候補の選択を受け付ける（ステップＳ００８）。具体的には、選択肢読上部１０７は、選択を指示する音声が肯定を示すものであれば、ステップＳ００６において読上げられていた選択肢を特定し、当該選択肢が選択入力されたものとして受け付ける。選択を指示する音声が肯定を示すものではない場合には、選択肢読上部１０７は当該音声を無視して、未だ読上げを行っていない選択肢のうち選択回数が多い次点の選択肢について、ステップＳ００６の処理を実行する。

そして、選択肢読上部１０７は、遷移先画面に表示を遷移させ、選択を受け付けたファイルを実行する（ステップＳ００９）。具体的には、選択肢読上部１０７は、選択入力された選択肢についての下階層画面３０５を特定して、当該選択肢が決定条件であれば当該選択肢のファイルを実行する。すなわち、選択肢読上部１０７は、楽曲が選択入力されたものと受け付けられた場合には、当該楽曲の再生を開始する。当該選択肢が絞込条件であれば、選択肢読上部１０７は、選択入力された選択肢についての下階層画面３０５を特定して、当該下階層画面表示時において操作制限がなされたものとして音声操作引き継ぎ処理を実施する。

以上が、音声操作引き継ぎ処理の処理フローである。音声操作引き継ぎ処理によれば、手動操作中あるいは音声操作中に、手動操作の制限が実施された場合に、音声操作による入力の継続が可能となる。

図８は、選択対象が絞込条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示されるアーティスト選択の入力を受け付ける画面であるアーティスト選択画面５２１の例示画面６００を示す図である。

例示画面６００には、上階層へ戻るための指示を受け付けるＢＡＣＫボタン領域６００Ａと、アーティストの選択入力を受け付けるアーティスト選択ボタン領域６００Ｂと、が含まれており、アーティスト選択ボタン領域６００Ｂに表示されたアーティスト名のそれぞれは、当該アーティスト名の選択入力を固有に受け付ける選択肢に相当する。

図９は、選択対象が絞込条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示されるアーティスト選択の入力を受け付ける画面であるアーティスト選択画面５２１において、手動操作の制限がなされた場合の例示画面６００を示す図である。

例示画面６００には、選択肢を手動操作不可能に表示されたＢＡＣＫボタン領域６００Ａと、選択肢を手動操作不可能に表示されたアーティスト選択ボタン領域６００Ｂと、がグレイアウトして表示されている。さらに、例示画面６００には、走行中であるため手動操作が制限される旨を示すメッセージ領域６１０が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置１００は、入力装置５による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス６２０が音声出力される。

音声ガイダンス６２０においては、最も選択回数の多い選択肢である「Artist-0005」がまず音声により読み上げられ、続けて「から再生しますか？」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Artist-0005」に関する絞込条件が特定されたものとして、当該アーティストに係る楽曲を選択する次画面であるアーティスト楽曲選択画面５３１の選択肢が同様に音声で読み上げられることとなる（図１１参照）。肯定的な音声操作がなされない場合には、さらに、再生回数が次点の「Artist-0033」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、再生回数が次々点の「Artist-0084」が音声により読み上げられる。

図１０は、選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示される楽曲選択の入力を受け付ける画面であるアーティスト楽曲選択画面５３１の例示画面７００を示す図である。

例示画面７００には、上階層へ戻るための指示を受け付けるＢＡＣＫボタン領域７００Ａと、楽曲の選択入力を受け付けるアーティスト楽曲選択ボタン領域７００Ｂと、が含まれており、アーティスト楽曲選択ボタン領域７００Ｂに表示された楽曲名のそれぞれは、当該楽曲の選択入力を固有に受け付ける選択肢に相当する。

図１１は、選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示されるアーティスト楽曲選択の入力を受け付ける画面であるアーティスト楽曲選択画面５３１において、手動操作の制限がなされた場合の例示画面７００を示す図である。

例示画面７００には、選択肢を手動操作不可能に表示されたＢＡＣＫボタン領域７００Ａと、選択肢を手動操作不可能に表示されたアーティスト楽曲選択ボタン領域７００Ｂと、がグレイアウトして表示されている。さらに、例示画面７００には、走行中であるため手動操作が制限される旨を示すメッセージ領域７１０が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置１００は、入力装置５による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス７２０が音声出力される。

音声ガイダンス７２０においては、最も再生回数の多い選択肢である「Song-0005」の冒頭部分（例えば、冒頭の３秒間あるいは前奏部分）の音声がまず再生される（イントロ再生）。あわせて、当該選択肢である曲名を音声出力され、その後「から再生しますか？」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Song-0005」に関する決定条件が特定されたものとして、当該楽曲の再生時に詳細情報を示す楽曲再生画面５４１が表示され、当該楽曲が再生され音声出力がなされることとなる。肯定的な音声操作がなされない場合には、さらに、再生回数が次点の「Song-0001」の冒頭部分の音声が再生される。そして、肯定的な音声操作がなされない場合には、再生回数が次々点の「Song-0012」の冒頭部分の音声が再生される。

図１２は、選択対象が絞込条件の場合のタッチ操作画面の別の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示される目的地選択の入力を受け付ける例示画面８００を示す図である。

例示画面８００には、上階層へ戻るための指示を受け付けるＢＡＣＫボタン領域８００Ａと、ジャンルの選択入力を受け付けるジャンル選択ボタン領域８００Ｂと、が含まれており、ジャンル選択ボタン領域８００Ｂに表示されたジャンル名のそれぞれは、ジャンルの選択入力を固有に受け付ける選択肢に相当する。

図１３は、選択対象が絞込条件の場合のタッチ操作禁止画面の別の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示されるジャンル選択の入力を受け付ける画面であるジャンル選択画面において、手動操作の制限がなされた場合の例示画面８００を示す図である。

例示画面８００には、選択肢を手動操作不可能に表示されたＢＡＣＫボタン領域８００Ａと、選択肢を手動操作不可能に表示されたジャンル選択ボタン領域８００Ｂと、がグレイアウトして表示されている。さらに、例示画面８００には、走行中であるため手動操作が制限される旨を示すメッセージ領域８１０が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置１００は、入力装置５による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス８２０が音声出力される。

音声ガイダンス８２０においては、最も選択回数の多い選択肢である「Genre-0007」がまず音声により読み上げられ、続けて「から選択しますか？」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Genre-0007」に関する絞込条件が特定されたものとして、当該ジャンルに係る施設を選択する次画面の選択肢が同様に音声で読み上げられることとなる（図１５参照）。肯定的な音声操作がなされない場合には、さらに、選択回数が次点の「Genre-0021」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、選択回数が次々点の「Genre-0077」が音声により読み上げられる。

図１４は、選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示される施設選択の入力を受け付ける例示画面９００を示す図である。

例示画面９００には、上階層へ戻るための指示を受け付けるＢＡＣＫボタン領域９００Ａと、施設の選択入力を受け付ける施設選択ボタン領域９００Ｂと、が含まれており、施設選択ボタン領域９００Ｂに表示された施設名のそれぞれは、施設の選択入力を固有に受け付ける選択肢に相当する。

図１５は、選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置１００において表示される施設選択の入力を受け付ける画面である施設選択画面において、手動操作の制限がなされた場合の例示画面９００を示す図である。

例示画面９００には、選択肢を手動操作不可能に表示されたＢＡＣＫボタン領域９００Ａと、選択肢を手動操作不可能に表示された施設選択ボタン領域９００Ｂと、がグレイアウトして表示されている。さらに、例示画面９００には、走行中であるため手動操作が制限される旨を示すメッセージ領域９１０が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置１００は、入力装置５による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス９２０が音声出力される。

音声ガイダンス９２０においては、最も選択回数の多い選択肢である「Facility-0090」がまず音声により読上げられ、続けて「を選択しますか？」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Facility-0090」に関する決定条件が特定されたものとして、当該施設を目的地とする経路表示画面が表示され、当該経路が推奨経路として設定されることとなる。肯定的な音声操作がなされない場合には、さらに、選択回数が次点の「Facility-0038」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、選択回数が次々点の「Facility-0002」が音声により読み上げられる。

以上、本発明の実施形態について説明した。本発明の上記実施形態によると、より利便性の高い音声認識装置を提供できる。

本発明は、上記の実施形態に制限されない。上記実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、上記実施形態では、画面遷移は階層構造で表され、より深い階層の画面は、より浅い階層すなわち上位階層の画面よりも具体的な情報の入出力を担う画面、あるいは処理結果を示す画面としてデザインされることを想定しているが、これに限られない。

例えば、入力項目が多量にある画面等が含まれる場合に、入力画面が複数の画面の遷移を伴うような構造となるものであってもよい。すなわち、すでに入力操作を行った画面が遷移内にある場合であっても、上記実施形態によれば、適切に音声による入力が可能といえる。

また例えば、上記実施形態では、絞込条件の選択肢を選ぶ際に手動操作が制限された場合に、音声操作により絞込条件の選択肢の入力を受け付けるものとしているが、これに限られない。例えば、決定条件である楽曲を特定する音声の入力を受け付けると当該楽曲の再生を行うようにしてもよい。また例えば、「いつもの」等の所定の予約語の音声操作を受け付けると、遷移前の画面において既に受け付けた絞込条件によって楽曲を絞り込み、再生回数の多い順にイントロ再生を開始するようにしてもよい。このように変形することで、より利便性を高くすることができる。

また例えば、上記実施形態における選択履歴テーブル４００を利用者に応じてネットワークを介してアクセス可能な記憶領域に設けるようにして、ナビゲーション装置１００からは通信を介して選択回数を取得するようにしてもよい。このようにすることで、複数のナビゲーション装置１００間で選択履歴を共有することが可能となる。

以上、本発明について、実施形態を中心に説明した。なお、上記実施形態は自動車に搭載可能なナビゲーション装置１００を想定しているが、これに限らず、移動体全般のナビゲーション装置あるいは移動体全般の装置に適用することができる。

１・・・演算処理部、２・・・ディスプレイ、３・・・記憶装置、４・・・音声出入力装置、５・・・入力装置、６・・・ＲＯＭ装置、７・・・車速センサ、８・・・ジャイロセンサ、９・・・ＧＰＳ受信装置、１０・・・ＦＭ多重放送受信装置、１１・・・ビーコン受信装置、１２・・・車載ネットワーク通信装置、２１・・・ＣＰＵ、２２・・・ＲＡＭ、２３・・・ＲＯＭ、２４・・・Ｉ／Ｆ、２５・・・バス、４１・・・マイクロフォン、４２・・・スピーカ、５１・・・タッチパネル、５２・・・ダイヤルスイッチ、１００・・・ナビゲーション装置、１０１・・・基本制御部、１０２・・・入力受付部、１０３・・・出力処理部、１０４・・・操作履歴作成部、１０５・・・入力制限部、１０６・・・入力受付切替部、１０７・・・選択肢読上部、２００・・・リンクテーブル、３００・・・画面定義テーブル、４００・・・選択履歴テーブル

Claims

画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、
接触する操作により指示を受け付ける接触指示受付部と、
音声による操作により指示を受け付ける音声指示受付部と、
所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上部と、を備え、
前記音声指示受付部は、前記選択肢読上部により出力された前記選択肢のいずれかについて指示を受け付ける、
ことを特徴とする音声認識装置。
請求項１に記載の音声認識装置であって、
前記選択肢読上部は、
前記音声指示受付部により受け付けた前記選択肢が、前記所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、前記遷移先画面の前記絞込条件によって絞り込まれた選択肢をさらに音声出力する、
ことを特徴とする音声認識装置。
請求項１または２に記載の音声認識装置であって、
前記選択肢読上部は、
前記音声指示受付部により受け付けた前記選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、前記決定条件により特定される前記処理対象について前記所定の処理を行う、
ことを特徴とする音声認識装置。
請求項１〜３のいずれか一項に記載の音声認識装置であって、
前記選択肢読上部は、前記所定の画面における選択肢のうち表示済みの選択肢について除外して音声出力を行う、
ことを特徴とする音声認識装置。
請求項１〜４のいずれか一項に記載の音声認識装置であって、
前記所定の画面におけるそれぞれの前記選択肢は、所定の楽曲ファイルを特定し、
前記選択肢読上部は、前記楽曲ファイルごとに当該楽曲ファイルに係る楽曲の少なくとも一部を再生することで前記選択肢の音声出力を行う、
ことを特徴とする音声認識装置。
請求項１〜５のいずれか一項に記載の音声認識装置であって、
前記接触指示受付部と、前記音声指示受付部と、が指示を受け付けた選択肢について、前記選択履歴情報の選択された回数を更新する履歴作成部、
を備えることを特徴とする音声認識装置。
請求項１〜６のいずれか一項に記載の音声認識装置であって、移動体に搭載され、
前記移動体が所定の速度以上で移動を開始すると、前記接触指示受付部による指示の受け付けを制限する入力受付切替部、
を備えることを特徴とする音声認識装置。
コンピュータに、音声認識手順を実行させるプログラムであって、
前記コンピュータを、制御手段と、接触する操作により指示を受け付ける接触指示受付手段と、音声による操作により指示を受け付ける音声指示受付手段と、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶手段として機能させ、
前記制御手段に対して、
所定の画面において前記接触指示受付手段による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上手順と、を実行させ、
前記音声指示受付手段では、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付ける、
ことを特徴とする音声認識プログラム。
音声認識装置による音声認識方法であって、
前記音声認識装置は、
画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、
接触する操作により指示を受け付ける接触指示受付部と、
音声による操作により指示を受け付ける音声指示受付部と、を備え、
所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上ステップと、
前記音声指示受付部により、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付けるステップと、
を実施することを特徴とする音声認識方法。