JPWO2014109104A1 - 音声認識装置、音声認識プログラム及び音声認識方法 - Google Patents
音声認識装置、音声認識プログラム及び音声認識方法 Download PDFInfo
- Publication number
- JPWO2014109104A1 JPWO2014109104A1 JP2014556325A JP2014556325A JPWO2014109104A1 JP WO2014109104 A1 JPWO2014109104 A1 JP WO2014109104A1 JP 2014556325 A JP2014556325 A JP 2014556325A JP 2014556325 A JP2014556325 A JP 2014556325A JP WO2014109104 A1 JPWO2014109104 A1 JP WO2014109104A1
- Authority
- JP
- Japan
- Prior art keywords
- screen
- voice
- option
- instruction
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 43
- 230000007704 transition Effects 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 22
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 24
- 238000004891 communication Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009941 weaving Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/041—Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
- G06F3/0412—Digitisers structurally integrated in a display
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本発明の目的は、より利便性の高い音声認識装置の技術を提供することにある。本発明に係る音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、所定の画面において接触指示受付部による指示の受け付けが制限されると、所定の画面における選択肢を選択された回数に応じた順に音声出力する選択肢読上部と、を備え、音声指示受付部は、選択肢読上部により出力された選択肢のいずれかについて指示を受け付ける、ことを特徴とする。
Description
本発明は、音声認識装置の技術に関するものである。本発明は2013年1月8日に出願された日本国特許の出願番号2013−1373の優先権を主張し、文献の参照による織り込みが認められる指定国については、その出願に記載された内容は参照により本出願に織り込まれる。
従来、電子機器に関連する状態を検出する検出手段と、検出された状態の少なくとも一部に基づいて音声認識を開始するか否かまたは音声認識を終了するか否かを判定する判定手段とを有し、判定結果に基づいて音声認識の開始または終了を決定して、音声認識を行い、その認識結果に基づいて所定の動作を行わせる電子機器の技術がある。特許文献1には、このような装置についての技術が記載されている。
上記のような装置では、音声認識が開始された後であっても、例えば、ユーザーが指示対象の名称等を失念あるいは不正確にしか記憶していない場合には、発話による音声の指示が適切なものとならず、意図通りの操作を行うことができなくなってしまう場合がある。
本発明の目的は、より利便性の高い音声認識装置の技術を提供することにある。
上記課題を解決すべく、本発明に係る音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上部と、を備え、前記音声指示受付部は、前記選択肢読上部により出力された前記選択肢のいずれかについて指示を受け付ける、ことを特徴とする。
また、上記音声認識装置であって、前記選択肢読上部は、前記音声指示受付部により受け付けた前記選択肢が、前記所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、前記遷移先画面の前記絞込条件によって絞り込まれた選択肢をさらに音声出力する、ことを特徴とするものであってもよい。
また、上記音声認識装置であって、前記選択肢読上部は、前記音声指示受付部により受け付けた前記選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、前記決定条件により特定される前記処理対象について前記所定の処理を行う、ことを特徴とするものであってもよい。
また、上記音声認識装置であって、前記選択肢読上部は、前記所定の画面における選択肢のうち表示済みの選択肢について除外して音声出力を行う、ことを特徴とするものであってもよい。
また、上記音声認識装置であって、前記所定の画面におけるそれぞれの前記選択肢は、所定の楽曲ファイルを特定し、前記選択肢読上部は、前記楽曲ファイルごとに当該楽曲ファイルの少なくとも一部を再生することで前記選択肢の音声出力を行う、ことを特徴とするものであってもよい。
また、上記音声認識装置であって、前記接触指示受付部と、前記音声指示受付部と、が指示を受け付けた選択肢について、前記選択履歴情報の選択された回数を更新する履歴作成部、を備えることを特徴とするものであってもよい。
また、上記音声認識装置であって、移動体に搭載され、前記移動体が所定の速度以上で移動を開始すると、前記接触指示受付部による指示の受け付けを制限する入力受付切替部、を備えることを特徴とするものであってもよい。
また、本発明に係る音声認識プログラムは、コンピュータに、音声認識手順を実行させるプログラムであって、前記コンピュータを、制御手段と、接触する操作により指示を受け付ける接触指示受付手段と、音声による操作により指示を受け付ける音声指示受付手段と、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶手段として機能させ、前記制御手段に対して、所定の画面において前記接触指示受付手段による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上手順と、を実行させ、前記音声指示受付手段では、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付ける、ことを特徴とする。
また、本発明に係る音声認識装置による音声認識方法は、前記音声認識装置は、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、接触する操作により指示を受け付ける接触指示受付部と、音声による操作により指示を受け付ける音声指示受付部と、を備え、所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上ステップと、前記音声指示受付部により、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付けるステップと、を実施することを特徴とする。
本願発明によれば、より利便性の高い音声認識装置の技術を提供することが可能となる。
以下に、本発明に係るナビゲーション装置100について、図面を参照して説明する。
図1に、ナビゲーション装置100の全体構成図を示す。ナビゲーション装置100は、地図情報を表示して、ナビゲーション装置100の現在地を示す地点と、設定された目的地までの経路を誘導する情報とを示すことが可能ないわゆるナビゲーション装置である。
ナビゲーション装置100は、演算処理部1と、ディスプレイ2と、記憶装置3と、音声入出力装置4(音声入力装置としてマイクロフォン41、音声出力装置としてスピーカ42を備える)と、入力装置5と、ROM(Read Only Memory)装置6と、車速センサ7と、ジャイロセンサ8と、GPS(Global Positioning System)受信装置9と、FM多重放送受信装置10と、ビーコン受信装置11と、車載ネットワーク通信装置12と、を備えている。
演算処理部1は、様々な処理を行う中心的ユニットである。例えば各種センサ7,8やGPS受信装置9、FM多重放送受信装置10等から出力される情報に基づいて現在地を算出する。また、得られた現在地の情報に基づいて、表示に必要な地図データを記憶装置3あるいはROM装置6から読み出す。
また、演算処理部1は、読み出した地図データをグラフィックス展開し、そこに現在地を示すマークを重ねてディスプレイ2へ表示する。また、記憶装置3あるいはROM装置6に記憶されている地図データ等を用いて、現在地又はユーザーから指示された出発地と、目的地(または、経由地や立ち寄り地)と、を結ぶ最適な経路である推奨経路を探索する。また、スピーカ42やディスプレイ2を用いてユーザーを誘導する。
ナビゲーション装置100の演算処理部1は、各デバイス間をバス25で接続した構成である。演算処理部1は、数値演算及び各デバイスを制御するといった様々な処理を実行するCPU(Central Processing Unit)21と、記憶装置3から読み出した地図データ、演算データなどを格納するRAM(Random Access Memory)22と、プログラムやデータを格納するROM23と、各種ハードウェアを演算処理部1と接続するためのI/F(インターフェイス)24と、を有する。
ディスプレイ2は、演算処理部1等で生成されたグラフィックス情報を表示するユニットである。ディスプレイ2は、液晶ディスプレイ、有機ELディスプレイなどで構成される。
記憶装置3は、HDD(Hard Disk Drive)や不揮発性メモリカードといった、少なくとも読み書きが可能な記憶媒体で構成される。
この記憶媒体には、通常の経路探索装置に必要な地図データ(地図上の道路を構成するリンクのリンクデータを含む)であるリンクテーブル200と、ナビゲーション装置100において表示される画面の定義情報である画面定義テーブル300と、画面単位で、各画面において選択する候補となる選択肢が実際に選択された選択回数を選択肢ごとに対応付ける選択履歴テーブル400と、が記憶されている。また、記憶装置3の記憶媒体には、一または二以上の楽曲ファイル、再生対象とする楽曲ファイルを識別する識別情報と当該複数の楽曲ファイルの再生順序とを規定するプレイリストに関する情報等が記憶されている。なお、各楽曲ファイルには、楽曲のアーティストを特定する情報、作曲家、ジャンル、当該楽曲が収められたアルバム名等の属性情報がメタ情報として含まれる。
図2は、リンクテーブル200の構成を示す図である。リンクテーブル200は、地図上の区画された領域であるメッシュの識別コード(メッシュID)201ごとに、そのメッシュ領域に含まれる道路を構成する各リンクのリンクデータ202を含んでいる。
リンクデータ202は、リンクの識別子であるリンクID211ごとに、リンクを構成する2つのノード(開始ノード、終了ノード)の座標情報222、リンクを含む道路の種別を示す道路種別223、リンクの長さを示すリンク長224、予め記憶されたリンク旅行時間225、開始接続リンクおよび終了接続リンク226、リンクを含む道路の制限速度を示す制限速度227などを含んでいる。なお、開始接続リンクおよび終了接続リンク226は、当該リンクの開始ノードに接続するリンクである開始接続リンクと、当該リンクの終了ノードに接続するリンクである終了接続リンクと、を特定する情報である。
なお、ここでは、リンクを構成する2つのノードについて開始ノードと終了ノードとを区別することで、同じ道路の上り方向と下り方向とを、それぞれ別のリンクとして管理するようにしているが、これに限られない。例えば、リンクを構成する2つのノードについて開始ノードと終了ノードとを区別しないものであってもよい。
図3は、画面定義テーブル300の構成を示す図である。画面定義テーブル300は、画面ID301と、画面階層302と、上階層画面303と、画面内ページID304と、下階層画面305と、音声操作引き継ぎ可否306と、を対応付けた情報を含んでいる。
画面ID301は、画面を特定する情報である。画面階層302は、画面遷移体系の中で画面ID301により特定される画面が位置する階層を特定する情報である。上階層画面303は、画面ID301により特定される画面の直上階層の画面を特定する情報である。画面内ページID304は、画面ID301により特定される画面が選択肢の量が増えると複数ページに表示が分かれる構成である場合に、その分けられたページを特定する情報である。下階層画面305は、画面ID301により特定される画面の直下階層の画面を特定する情報である。音声操作引き継ぎ可否306は、画面ID301により特定される画面を表示中に手動操作を受け付けなくなった場合に音声操作に入力方法を引き継ぐページであるか否かを特定する情報である。
図4は、選択履歴テーブル400の構成を示す図である。選択履歴テーブル400は、画面ID401と、選択肢402と、選択回数403と、を対応付けた情報を含んでいる。
画面ID401は、画面を特定する情報である。選択肢402は、画面ID401により特定される画面において表示される選択肢を特定する情報である。なお、選択肢402には、最終的に操作する対象を特定するための決定条件、例えば再生する楽曲ファイルのファイル名や目的地として設定する施設の施設名等を特定する情報が含まれる。また、選択肢402には、決定条件そのものではないが決定条件を絞り込むための条件である絞込条件、例えば再生する楽曲ファイルのアーティストや目的地として設定する施設のカテゴリを特定する情報も含まれる。また、選択肢402には、「戻る」や「OK」、「キャンセル」ボタン等の手動操作を受け付けるための情報についても含まれる。
選択回数403は、選択肢402に関して実際に選択された回数を特定する情報である。例えば、ある画面において選択肢の一つが過去に5回選択されているとすると、当該選択肢の選択回数403には選択された回数が「5回」であることを特定する情報が格納される。
図1に戻って説明する。音声入出力装置4は、音声入力装置としてマイクロフォン41と、音声出力装置としてスピーカ42と、を備える。マイクロフォン41は、ユーザーやその他の搭乗者が発した声などのナビゲーション装置100の外部の音声を取得し、音声操作を受け付ける。
スピーカ42は、演算処理部1で生成されたユーザーへのメッセージを音声として出力する。マイクロフォン41とスピーカ42は、車両の所定の部位に、別個に配されている。ただし、一体の筐体に収納されていても良い。ナビゲーション装置100は、マイクロフォン41及びスピーカ42を、それぞれ複数備えることができる。
入力装置5は、ユーザーからの指示をユーザーによる手動操作を介して受け付ける装置である。入力装置5は、タッチパネル51と、ダイヤルスイッチ52と、その他のハードスイッチ(図示しない)であるスクロールキー、縮尺変更キーなどで構成される。また、入力装置5には、ナビゲーション装置100に対して遠隔で操作指示を行うことができるリモートコントローラが含まれる。リモートコントローラは、ダイヤルスイッチやスクロールキー、縮尺変更キーなどを備え、各キーやスイッチが操作された情報をナビゲーション装置100に送出することができる。
タッチパネル51は、ディスプレイ2の表示面側に搭載され、表示画面を透視可能である。タッチパネル51は、ディスプレイ2に表示された画像のXY座標と対応した手動操作が行われたタッチ位置を特定し、タッチ位置を座標に変換して出力する。タッチパネル51は、感圧式または静電式の入力検出素子などにより構成される。なお、タッチパネル51は、同時に複数のタッチ位置を検出することのできるマルチタッチを実現できるものであってもよい。
ダイヤルスイッチ52は、時計回り及び反時計回りに回転可能に構成され、所定の角度の回転ごとにパルス信号を発生し、演算処理部1に出力する。演算処理部1では、パルス信号の数から、回転角度を求める。
ROM装置6は、CD-ROMやDVD-ROM等のROMや、IC(Integrated Circuit)カードといった、少なくとも読み取りが可能な記憶媒体で構成されている。この記憶媒体には、例えば、動画データや、音声データなどが記憶されている。
車速センサ7,ジャイロセンサ8およびGPS受信装置9は、ナビゲーション装置100で現在地(例えば、自車位置)を検出するために使用されるものである。車速センサ7は、車速を算出するのに用いる値を出力するセンサである。ジャイロセンサ8は、光ファイバジャイロや振動ジャイロ等で構成され、移動体の回転による角速度を検出するものである。GPS受信装置9は、GPS衛星からの信号を受信し移動体とGPS衛星間の距離と距離の変化率とを3個以上の衛星に対して測定することで移動体の現在地、進行速度および進行方位を測定するものである。
FM多重放送受信装置10は、FM放送局から送られてくるFM多重放送信号を受信する。FM多重放送には、VICS(Vehicle Information Communication System:登録商標)情報の概略現況交通情報、規制情報、SA/PA(サービスエリア/パーキングエリア)情報、駐車場情報、天気情報などやFM多重一般情報としてラジオ局が提供する文字情報などがある。
ビーコン受信装置11は、VICS情報などの概略現況交通情報、規制情報、SA/PA(サービスエリア/パーキングエリア)情報、駐車場情報、天気情報や緊急警報などを受信する。例えば、光により通信する光ビーコン、電波により通信する電波ビーコン等の受信装置である。
車載ネットワーク通信装置12は、ナビゲーション装置100を、図示しない車両の制御ネットワーク規格であるCAN(Controller Area Network)等に対応するネットワークに接続させ、ネットワークに接続された他の車両制御装置であるECU(Electronic control unit)とCANメッセージをやり取りすることで通信を行う装置である。
図5は、本実施形態における操作画面に関する画面遷移の構成例を示す図である。本実施形態においては、画面遷移は階層構造で表され、より深い階層の画面は、より浅い階層すなわち上位階層の画面よりも具体的な情報の入出力を担う画面、あるいは処理結果を示す画面としてデザインされる。ただし、直接的な遷移関係を持たない画面同士は、具体化の度合いに差異があっても差し支えはない。例えば、アーティストを選択する画面を経由して絞り込みが行われた楽曲選択画面と、絞り込みが行われない楽曲選択画面とでは、いずれも楽曲を選択する画面であるが、画面遷移上の階層が異なっていてもよい。また、各画面においては、入力制限部105によって手動操作が制限されていない状態では、手動操作と音声操作とのいずれの操作も受け付けることが可能であり、入力制限部105によって手動操作が制限されている状態では、音声操作を受け付けることが可能である。
図5に例示するように、本実施形態においては、最上位となる第0階層501にメニュー画面511が存在し、メニュー画面511から下位の階層となる第1階層502のアーティスト選択画面521と、プレイリスト選択画面522と、アルバム選択画面523と、のいずれかの画面への遷移を行う指示を受け付けるボタン等が選択肢として設けられている。
ここで、アーティスト選択画面521は、記憶装置3あるいはROM装置6に格納された楽曲ファイルに含まれるメタ情報に当該楽曲に関するアーティストを特定する情報が含まれる場合に、当該アーティストの楽曲を他のアーティストの楽曲と区別して絞り込むための絞込条件の入力を受け付ける画面である。また、アーティスト選択画面521には、楽曲の演奏等を行うアーティストを特定する選択肢が表示される。いずれのアーティストの選択肢が選択された場合であっても、下位の階層となる第2階層503のアーティスト楽曲選択画面531へ遷移するよう構成されている。
また、プレイリスト選択画面522は、記憶装置3あるいはROM装置6に、当該記憶装置3等に格納された楽曲ファイルの再生順序を特定するプレイリスト情報が含まれる場合に、当該プレイリストの楽曲を再生する指示を受け付ける、すなわち決定条件の入力を受け付ける画面である。
アルバム選択画面523は、記憶装置3あるいはROM装置6に格納された楽曲ファイルに含まれるメタ情報にアルバムを特定する情報が含まれる場合に、当該アルバムの楽曲を他のアルバムの楽曲から区別して絞り込むための絞込条件の入力を受け付ける画面である。また、アルバム選択画面523には、楽曲が一つまたは複数で所定の順に束ねて管理される単位であるアルバムを特定する選択肢が表示されるが、いずれのアルバムの選択肢が選択された場合であっても、下位の階層となる第2階層503のアルバム楽曲選択画面533へ遷移するよう構成されている。
アーティスト選択画面521から遷移するアーティスト楽曲選択画面531は、選択されたアーティストの楽曲に絞り込んだ楽曲を選択可能に提示し、楽曲ファイルを特定する決定条件の入力を受け付ける画面である。また、アーティスト楽曲選択画面531には、楽曲を特定する選択肢が表示される。いずれの楽曲の選択肢が選択された場合であっても、下位の階層となる第3階層504の楽曲再生画面541へ遷移するよう構成されている。また、アーティスト楽曲選択画面531に表示が収まらないほどに表示する楽曲の選択肢が多い場合には、アーティスト楽曲選択画面531を複数のページに分割表示するための画面としてアーティスト楽曲選択(ページ2)532が追加され、アーティスト楽曲選択画面(ページ1)531とアーティスト楽曲選択画面(ページ2)とが相互に進退可能に表示される。なお、ページ間の表示範囲の変更操作については、変更前後のページを切り替えるようにしてもよいし、スクロール等の操作により各ページに含まれる選択肢を連続的に変化させて表示範囲を変更させることを可能としてもよい。
アルバム選択画面523から遷移するアルバム楽曲選択画面533は、選択されたアルバムの楽曲に絞り込んだ楽曲を選択可能に提示し、楽曲ファイルを特定する決定条件の入力を受け付ける画面である。また、アルバム楽曲選択画面533には、楽曲を特定する選択肢が表示される。いずれの楽曲の選択肢が選択された場合であっても、下位の階層となる第3階層504の楽曲再生画面542へ遷移するよう構成されている。なお、アルバム楽曲選択画面533に表示が収まらないほどに表示する楽曲の選択肢が多い場合のページ追加については、上記アーティスト楽曲選択画面531、532と同様である。
アーティスト楽曲選択画面(ページ1)531あるいはアーティスト楽曲選択画面(ページ2)532から遷移する楽曲再生画面541は、決定条件の入力がなされた楽曲ファイルに関連する情報を提示する画面である。例えば、楽曲再生画面541には、楽曲ファイルの再生に関連する動画や静止画の表示と、楽曲の長さに対する再生済み部分の長さをインジケータで示す表示と、楽曲の再生、停止、一時停止、早送り、巻き戻し、出力音量の調整等の操作パネル等の表示等が表示される。
アルバム楽曲選択画面533から遷移する楽曲再生画面542は、決定条件の入力がなされた楽曲ファイルに関連する情報を提示する画面である。例えば、楽曲再生画面542には、楽曲ファイルに関連する動画や静止画の表示と、楽曲の長さに対する再生済み部分の長さをインジケータで示す表示と、楽曲の再生、停止、一時停止、早送り、巻き戻し、出力音量の調整等の操作パネル等の表示等が表示される。
図6は、演算処理部1の機能ブロック図である。図示するように、演算処理部1は、基本制御部101と、入力受付部102と、出力処理部103と、操作履歴作成部104と、入力制限部105と、入力受付切替部106と、選択肢読上部107と、を含む。
基本制御部101は、様々な処理を行う中心的な機能部であり、処理内容に応じて、他の機能部の動作を制御する。また、各種センサ、GPS受信装置9等の情報を取得し、マップマッチング処理等を行って現在地を特定する。また、随時、走行した日付および時刻と、位置と、を対応付けて、リンクごとに走行履歴を記憶装置3に記憶する。さらに、各処理部からの要求に応じて、現在時刻を出力する。
また、基本制御部101は、現在地又はユーザーから指示された出発地と、目的地(または、経由地や立ち寄り地)とを結ぶ最適な経路である推奨経路を探索する。当該経路探索においては、ダイクストラ法等の経路探索ロジックを用いて、道路の所定の区間(リンク)に対して予め設定されたリンクコストに基づいて、リンクコストが最小となる経路を探索する。
また、基本制御部101は、現在地が推奨経路から逸脱しないよう、推奨経路を表示させつつスピーカ42やディスプレイ2を用いてユーザーを誘導する。
入力受付部102は、入力装置5またはマイクロフォン41を介して入力されたユーザーからの手動操作あるいは音声操作を受け付け、その音声操作に関する情報であるタッチの座標位置や、音声情報とともに、要求内容に対応する処理を実行するように基本制御部101へ伝達する。例えば、ユーザーが推奨経路の探索を要求したときは、その要求指示を基本制御部101に要求する。すなわち、入力受付部102は、接触を伴う手動操作により指示を受け付ける接触指示受付部であるといえる。また、入力受付部102は、音声による操作(音声操作)により指示を受け付ける音声指示受付部であるともいえる。
出力処理部103は、例えばポリゴン情報等、表示させる画面を構成する情報を受け取り、ディスプレイ2に描画するための信号に変換してディスプレイ2に対して描画する指示を行う。
操作履歴作成部104は、楽曲ファイルの実行や、目的地の設定等のナビゲーション装置100における所定の処理について、受け付けた絞込条件あるいは決定条件の入力の履歴を作成する。具体的には、操作履歴作成部104は、楽曲ファイルの実行(再生)時や、経路探索の目的地設定時に入力を受け付けた絞込条件あるいは決定条件である選択肢のそれぞれについて、実行(選択入力を指示)された回数を計数し、選択履歴テーブル400の選択回数403として記憶装置3に格納させる。
入力制限部105は、ナビゲーション装置100が搭載された車両等の状態に応じて、入力を制限することを決定する。具体的には、入力制限部105は、車両が停車中には、入力受付部102に対するタッチパネル51あるいはダイヤルスイッチ52を介した手動操作およびマイクロフォン41を介した音声操作のいずれによる操作も受け付けるが、一定速度以上となる走行中には、入力受付部102に対するタッチパネル51あるいはダイヤルスイッチ52を介した手動操作を制限することを決定する。また、入力制限部105は、車両を移動させるギヤが選択されている場合、すなわちパーキングギヤを選択されていない場合等には、入力受付部102に対するタッチパネル51あるいはダイヤルスイッチ52を介した手動操作を制限することを決定する。
入力受付切替部106は、入力制限部105の決定を受けて、出力処理部103に対して、「走行中」等の所定の画面操作無効化メッセージを表示するよう指示し、入力受付部102に対して、タッチパネル51あるいはダイヤルスイッチ52を介した手動操作を制限するとともに、音声入出力装置4を介した音声操作を受け付けるよう指示して入力方法を切り替える。
選択肢読上部107は、入力受付切替部106により入力方法が切り替えられると、切り替えられた時点において表示されていた画面上の選択肢およびそれ以降の遷移画面上の選択肢を、その選択された回数に応じた順でスピーカ42等を介して音声により出力する。すなわち、選択肢読上部107は、所定の画面において入力制限部105により手動操作の受け付けが制限されると、所定の画面における選択肢を選択された回数に応じた順に音声出力するといえる。
また、当該選択肢の音声出力処理においては、選択肢読上部107は、選択肢ごとに音声操作を受け付ける所定の期間である音声操作受付期間を設けて、当該期間においては入力受付部102による音声操作を受け付ける。所定の音声操作(例えば、肯定を意味する「はい」、「オーケー」あるいは「イエス」等の音声操作)を受け付けた場合には、選択肢読上部107は、当該音声操作受付期間に係る選択肢が選択入力されたものとして、遷移先画面(下階層画面等)の選択肢を特定し、特定した選択肢の読み上げおよび選択入力の受け付けを開始する。
所定の音声操作を受け付けない場合(例えば、無反応の場合、無音の場合あるいは否定を意味する「いいえ」、「次」、「ネクスト」、「ノー」等の音声操作を受け付けた場合)には、選択肢読上部107は、次の選択肢を、スピーカ42等を介して音声により出力し、所定の音声操作受付期間を設けて、当該期間に入力受付部102による音声操作を受け付ける。
また、選択肢読上部107は、音声操作により受け付けた選択肢が、所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、遷移先画面の絞込条件によって絞り込まれた選択肢をさらに音声出力する。
また、選択肢読上部107は、音声操作により受け付けた選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、決定条件により特定される処理対象について所定の処理を行う。
また、選択肢読上部107は、所定の画面における選択肢のうち表示済みの選択肢については、除外して音声出力を行う。
上記した演算処理部1の各機能部、すなわち基本制御部101、入力受付部102、出力処理部103、操作履歴作成部104、入力制限部105、入力受付切替部106、選択肢読上部107は、CPU21が所定のプログラムを読み込み実行することにより構築される。そのため、RAM22には、各機能部の処理を実現するためのプログラムが記憶されている。
なお、上記した各構成要素は、ナビゲーション装置100の構成を、理解を容易にするために、主な処理内容に応じて分類したものである。そのため、構成要素の分類の仕方やその名称によって、本願発明が制限されることはない。ナビゲーション装置100の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。
また、各機能部は、ハードウェア(ASIC、GPUなど)により構築されてもよい。また、各機能部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。
[動作の説明]次に、ナビゲーション装置100が実施する音声操作引き継ぎ処理の動作について説明する。図7は、ナビゲーション装置100が実施する音声操作引き継ぎ処理を示すフロー図である。このフローは、ナビゲーション装置100の起動後に、ナビゲーション装置100が搭載された車両が走行を開始した場合等において入力制限部105により手動操作の制限が決定された場合であって、入力受付切替部106により手動操作および音声操作のいずれも受け付ける入力方法から手動操作の受け付けを制限して音声操作を受け付ける入力方法へと入力方法が切り替えられると、実施される。
まず、選択肢読上部107は、操作制限時の画面IDを特定する(ステップS001)。具体的には、選択肢読上部107は、入力制限部105により手動操作が制限された状態において表示されていた画面がメニュー画面から起動された所定の機能の画面表示である場合に、当該機能について表示されていた画面IDを特定する。
そして、選択肢読上部107は、当該画面における選択候補を特定する(ステップS002)。具体的には、選択肢読上部107は、ステップS001にて特定した画面IDで特定される画面において選択可能に表示されていた選択肢を、選択候補として特定する。なお、選択肢読上部107は、当該画面について、音声操作引き継ぎ可否306を参照し、引き継ぎが可能でない場合には、音声操作引き継ぎ処理の動作を終了するようにしてもよい。
そして、選択肢読上部107は、選択候補ごとに過去の選択回数を特定する(ステップS003)。具体的には、選択肢読上部107は、ステップS002において特定された選択候補である選択肢のそれぞれについて、選択履歴テーブル400において対応付けられた選択回数403を読み出して、選択回数を特定する。
そして、選択肢読上部107は、操作制限時に表示中の画面内ページIDを特定する(ステップS004)。具体的には、選択肢読上部107は、入力制限部105により手動操作が制限された状態となった状況で表示されていた画面においてページ間の表示範囲の変更操作が実施されていた場合には、すでに参照を終えたページすなわち表示後に表示範囲から除外されたページを特定する。なお、選択肢読上部107は、入力制限部105により入力が制限された状態において表示されていた画面においてスクロール等によりページ間の表示範囲の変更操作が実施されていた場合には、すでに参照を終えたページすなわち表示後に表示範囲から除外された選択肢を特定する。
そして、選択肢読上部107は、選択候補から表示中の画面内の以降のページに含まれる候補を抽出する(ステップS005)。具体的には、選択肢読上部107は、ステップS002において特定した選択候補のうち、ステップS004において特定した参照を終えたページに含まれる選択候補(または、スクロールの場合には表示範囲から除外された選択候補)を除外することで、選択候補の抽出を行う。
そして、選択肢読上部107は、抽出した選択候補を過去の選択回数が多い順にイントロ音声又は候補読み上げを行う(ステップS006)。具体的には、選択肢読上部107は、ステップS005において抽出した選択候補について、ステップS003において特定した選択回数の多い順にソートし、選択回数が多い選択候補の読上げを行う。当該読上げの処理に際しては、選択肢読上部107は、選択候補が決定条件である場合には、当該選択候補が決定条件を受け付けた場合に実行される処理の一部を開始し、選択候補が絞込条件である場合には選択肢の名称等を音声で出力する。例えば、選択候補が楽曲である場合には、決定条件に該当し、選択肢読上部107は楽曲の先頭から所定時間(例えば3秒)再生して音声を出力する。また例えば、選択候補がアーティストである場合には、絞込条件に該当し、選択肢読上部107はアーティストの名称をTS(Text to Speech)等により音声出力する。
そして、選択肢読上部107は、選択を指示する音声操作を受け付けたか否かを判定する(ステップS007)。具体的には、選択肢読上部107は、入力受付部102に対して、ステップS006において読み上げを行っている候補について、肯定又は否定の選択を指示する音声操作を受け付けたか否かを判定する。選択を指示する音声操作を受け付けていない場合には、選択肢読上部107は、所定の音声操作受付期間内(例えば、選択肢の読み上げ開始後であって、選択肢の読み上げ終了後2秒以内)においては反復的に、選択を指示する音声操作を受け付けたか否かを判定する。
選択を指示する音声操作を受け付けた場合(ステップS007において「Yes」の場合)には、選択肢読上部107は、選択を指示する音声を認識した時点において出力していた候補の選択を受け付ける(ステップS008)。具体的には、選択肢読上部107は、選択を指示する音声が肯定を示すものであれば、ステップS006において読上げられていた選択肢を特定し、当該選択肢が選択入力されたものとして受け付ける。選択を指示する音声が肯定を示すものではない場合には、選択肢読上部107は当該音声を無視して、未だ読上げを行っていない選択肢のうち選択回数が多い次点の選択肢について、ステップS006の処理を実行する。
そして、選択肢読上部107は、遷移先画面に表示を遷移させ、選択を受け付けたファイルを実行する(ステップS009)。具体的には、選択肢読上部107は、選択入力された選択肢についての下階層画面305を特定して、当該選択肢が決定条件であれば当該選択肢のファイルを実行する。すなわち、選択肢読上部107は、楽曲が選択入力されたものと受け付けられた場合には、当該楽曲の再生を開始する。当該選択肢が絞込条件であれば、選択肢読上部107は、選択入力された選択肢についての下階層画面305を特定して、当該下階層画面表示時において操作制限がなされたものとして音声操作引き継ぎ処理を実施する。
以上が、音声操作引き継ぎ処理の処理フローである。音声操作引き継ぎ処理によれば、手動操作中あるいは音声操作中に、手動操作の制限が実施された場合に、音声操作による入力の継続が可能となる。
図8は、選択対象が絞込条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示されるアーティスト選択の入力を受け付ける画面であるアーティスト選択画面521の例示画面600を示す図である。
例示画面600には、上階層へ戻るための指示を受け付けるBACKボタン領域600Aと、アーティストの選択入力を受け付けるアーティスト選択ボタン領域600Bと、が含まれており、アーティスト選択ボタン領域600Bに表示されたアーティスト名のそれぞれは、当該アーティスト名の選択入力を固有に受け付ける選択肢に相当する。
図9は、選択対象が絞込条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示されるアーティスト選択の入力を受け付ける画面であるアーティスト選択画面521において、手動操作の制限がなされた場合の例示画面600を示す図である。
例示画面600には、選択肢を手動操作不可能に表示されたBACKボタン領域600Aと、選択肢を手動操作不可能に表示されたアーティスト選択ボタン領域600Bと、がグレイアウトして表示されている。さらに、例示画面600には、走行中であるため手動操作が制限される旨を示すメッセージ領域610が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置100は、入力装置5による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス620が音声出力される。
音声ガイダンス620においては、最も選択回数の多い選択肢である「Artist-0005」がまず音声により読み上げられ、続けて「から再生しますか?」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Artist-0005」に関する絞込条件が特定されたものとして、当該アーティストに係る楽曲を選択する次画面であるアーティスト楽曲選択画面531の選択肢が同様に音声で読み上げられることとなる(図11参照)。肯定的な音声操作がなされない場合には、さらに、再生回数が次点の「Artist-0033」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、再生回数が次々点の「Artist-0084」が音声により読み上げられる。
図10は、選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示される楽曲選択の入力を受け付ける画面であるアーティスト楽曲選択画面531の例示画面700を示す図である。
例示画面700には、上階層へ戻るための指示を受け付けるBACKボタン領域700Aと、楽曲の選択入力を受け付けるアーティスト楽曲選択ボタン領域700Bと、が含まれており、アーティスト楽曲選択ボタン領域700Bに表示された楽曲名のそれぞれは、当該楽曲の選択入力を固有に受け付ける選択肢に相当する。
図11は、選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示されるアーティスト楽曲選択の入力を受け付ける画面であるアーティスト楽曲選択画面531において、手動操作の制限がなされた場合の例示画面700を示す図である。
例示画面700には、選択肢を手動操作不可能に表示されたBACKボタン領域700Aと、選択肢を手動操作不可能に表示されたアーティスト楽曲選択ボタン領域700Bと、がグレイアウトして表示されている。さらに、例示画面700には、走行中であるため手動操作が制限される旨を示すメッセージ領域710が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置100は、入力装置5による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス720が音声出力される。
音声ガイダンス720においては、最も再生回数の多い選択肢である「Song-0005」の冒頭部分(例えば、冒頭の3秒間あるいは前奏部分)の音声がまず再生される(イントロ再生)。あわせて、当該選択肢である曲名を音声出力され、その後「から再生しますか?」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Song-0005」に関する決定条件が特定されたものとして、当該楽曲の再生時に詳細情報を示す楽曲再生画面541が表示され、当該楽曲が再生され音声出力がなされることとなる。肯定的な音声操作がなされない場合には、さらに、再生回数が次点の「Song-0001」の冒頭部分の音声が再生される。そして、肯定的な音声操作がなされない場合には、再生回数が次々点の「Song-0012」の冒頭部分の音声が再生される。
図12は、選択対象が絞込条件の場合のタッチ操作画面の別の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示される目的地選択の入力を受け付ける例示画面800を示す図である。
例示画面800には、上階層へ戻るための指示を受け付けるBACKボタン領域800Aと、ジャンルの選択入力を受け付けるジャンル選択ボタン領域800Bと、が含まれており、ジャンル選択ボタン領域800Bに表示されたジャンル名のそれぞれは、ジャンルの選択入力を固有に受け付ける選択肢に相当する。
図13は、選択対象が絞込条件の場合のタッチ操作禁止画面の別の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示されるジャンル選択の入力を受け付ける画面であるジャンル選択画面において、手動操作の制限がなされた場合の例示画面800を示す図である。
例示画面800には、選択肢を手動操作不可能に表示されたBACKボタン領域800Aと、選択肢を手動操作不可能に表示されたジャンル選択ボタン領域800Bと、がグレイアウトして表示されている。さらに、例示画面800には、走行中であるため手動操作が制限される旨を示すメッセージ領域810が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置100は、入力装置5による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス820が音声出力される。
音声ガイダンス820においては、最も選択回数の多い選択肢である「Genre-0007」がまず音声により読み上げられ、続けて「から選択しますか?」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Genre-0007」に関する絞込条件が特定されたものとして、当該ジャンルに係る施設を選択する次画面の選択肢が同様に音声で読み上げられることとなる(図15参照)。肯定的な音声操作がなされない場合には、さらに、選択回数が次点の「Genre-0021」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、選択回数が次々点の「Genre-0077」が音声により読み上げられる。
図14は、選択対象が決定条件の場合のタッチ操作画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示される施設選択の入力を受け付ける例示画面900を示す図である。
例示画面900には、上階層へ戻るための指示を受け付けるBACKボタン領域900Aと、施設の選択入力を受け付ける施設選択ボタン領域900Bと、が含まれており、施設選択ボタン領域900Bに表示された施設名のそれぞれは、施設の選択入力を固有に受け付ける選択肢に相当する。
図15は、選択対象が決定条件の場合のタッチ操作禁止画面の出力画面例を示す図である。具体的には、ナビゲーション装置100において表示される施設選択の入力を受け付ける画面である施設選択画面において、手動操作の制限がなされた場合の例示画面900を示す図である。
例示画面900には、選択肢を手動操作不可能に表示されたBACKボタン領域900Aと、選択肢を手動操作不可能に表示された施設選択ボタン領域900Bと、がグレイアウトして表示されている。さらに、例示画面900には、走行中であるため手動操作が制限される旨を示すメッセージ領域910が表示され、「走行中」のメッセージが表示されている。当該画面が表示されている場合には、ナビゲーション装置100は、入力装置5による手動操作を受け付けない状態となっている。また、当該画面の表示とともに、音声ガイダンス920が音声出力される。
音声ガイダンス920においては、最も選択回数の多い選択肢である「Facility-0090」がまず音声により読上げられ、続けて「を選択しますか?」と指示を催促するメッセージが音声により読み上げられる。ここで、肯定の音声操作がなされると、「Facility-0090」に関する決定条件が特定されたものとして、当該施設を目的地とする経路表示画面が表示され、当該経路が推奨経路として設定されることとなる。肯定的な音声操作がなされない場合には、さらに、選択回数が次点の「Facility-0038」が音声により読み上げられる。そして、肯定的な音声操作がなされない場合には、選択回数が次々点の「Facility-0002」が音声により読み上げられる。
以上、本発明の実施形態について説明した。本発明の上記実施形態によると、より利便性の高い音声認識装置を提供できる。
本発明は、上記の実施形態に制限されない。上記実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、上記実施形態では、画面遷移は階層構造で表され、より深い階層の画面は、より浅い階層すなわち上位階層の画面よりも具体的な情報の入出力を担う画面、あるいは処理結果を示す画面としてデザインされることを想定しているが、これに限られない。
例えば、入力項目が多量にある画面等が含まれる場合に、入力画面が複数の画面の遷移を伴うような構造となるものであってもよい。すなわち、すでに入力操作を行った画面が遷移内にある場合であっても、上記実施形態によれば、適切に音声による入力が可能といえる。
また例えば、上記実施形態では、絞込条件の選択肢を選ぶ際に手動操作が制限された場合に、音声操作により絞込条件の選択肢の入力を受け付けるものとしているが、これに限られない。例えば、決定条件である楽曲を特定する音声の入力を受け付けると当該楽曲の再生を行うようにしてもよい。また例えば、「いつもの」等の所定の予約語の音声操作を受け付けると、遷移前の画面において既に受け付けた絞込条件によって楽曲を絞り込み、再生回数の多い順にイントロ再生を開始するようにしてもよい。このように変形することで、より利便性を高くすることができる。
また例えば、上記実施形態における選択履歴テーブル400を利用者に応じてネットワークを介してアクセス可能な記憶領域に設けるようにして、ナビゲーション装置100からは通信を介して選択回数を取得するようにしてもよい。このようにすることで、複数のナビゲーション装置100間で選択履歴を共有することが可能となる。
以上、本発明について、実施形態を中心に説明した。なお、上記実施形態は自動車に搭載可能なナビゲーション装置100を想定しているが、これに限らず、移動体全般のナビゲーション装置あるいは移動体全般の装置に適用することができる。
1・・・演算処理部、2・・・ディスプレイ、3・・・記憶装置、4・・・音声出入力装置、5・・・入力装置、6・・・ROM装置、7・・・車速センサ、8・・・ジャイロセンサ、9・・・GPS受信装置、10・・・FM多重放送受信装置、11・・・ビーコン受信装置、12・・・車載ネットワーク通信装置、21・・・CPU、22・・・RAM、23・・・ROM、24・・・I/F、25・・・バス、41・・・マイクロフォン、42・・・スピーカ、51・・・タッチパネル、52・・・ダイヤルスイッチ、100・・・ナビゲーション装置、101・・・基本制御部、102・・・入力受付部、103・・・出力処理部、104・・・操作履歴作成部、105・・・入力制限部、106・・・入力受付切替部、107・・・選択肢読上部、200・・・リンクテーブル、300・・・画面定義テーブル、400・・・選択履歴テーブル
Claims (9)
- 画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、
接触する操作により指示を受け付ける接触指示受付部と、
音声による操作により指示を受け付ける音声指示受付部と、
所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上部と、を備え、
前記音声指示受付部は、前記選択肢読上部により出力された前記選択肢のいずれかについて指示を受け付ける、
ことを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置であって、
前記選択肢読上部は、
前記音声指示受付部により受け付けた前記選択肢が、前記所定の画面から遷移する遷移先画面の選択肢を絞り込む絞込条件を指定するものである場合には、前記遷移先画面の前記絞込条件によって絞り込まれた選択肢をさらに音声出力する、
ことを特徴とする音声認識装置。 - 請求項1または2に記載の音声認識装置であって、
前記選択肢読上部は、
前記音声指示受付部により受け付けた前記選択肢が、所定の処理の処理対象として決定する決定条件を指定するものである場合には、前記決定条件により特定される前記処理対象について前記所定の処理を行う、
ことを特徴とする音声認識装置。 - 請求項1〜3のいずれか一項に記載の音声認識装置であって、
前記選択肢読上部は、前記所定の画面における選択肢のうち表示済みの選択肢について除外して音声出力を行う、
ことを特徴とする音声認識装置。 - 請求項1〜4のいずれか一項に記載の音声認識装置であって、
前記所定の画面におけるそれぞれの前記選択肢は、所定の楽曲ファイルを特定し、
前記選択肢読上部は、前記楽曲ファイルごとに当該楽曲ファイルに係る楽曲の少なくとも一部を再生することで前記選択肢の音声出力を行う、
ことを特徴とする音声認識装置。 - 請求項1〜5のいずれか一項に記載の音声認識装置であって、
前記接触指示受付部と、前記音声指示受付部と、が指示を受け付けた選択肢について、前記選択履歴情報の選択された回数を更新する履歴作成部、
を備えることを特徴とする音声認識装置。 - 請求項1〜6のいずれか一項に記載の音声認識装置であって、移動体に搭載され、
前記移動体が所定の速度以上で移動を開始すると、前記接触指示受付部による指示の受け付けを制限する入力受付切替部、
を備えることを特徴とする音声認識装置。 - コンピュータに、音声認識手順を実行させるプログラムであって、
前記コンピュータを、制御手段と、接触する操作により指示を受け付ける接触指示受付手段と、音声による操作により指示を受け付ける音声指示受付手段と、画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶手段として機能させ、
前記制御手段に対して、
所定の画面において前記接触指示受付手段による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上手順と、を実行させ、
前記音声指示受付手段では、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付ける、
ことを特徴とする音声認識プログラム。 - 音声認識装置による音声認識方法であって、
前記音声認識装置は、
画面と当該画面における選択肢とを対応付けた画面定義情報と、前記選択肢ごとに選択された回数を特定する選択履歴情報と、を記憶する記憶部と、
接触する操作により指示を受け付ける接触指示受付部と、
音声による操作により指示を受け付ける音声指示受付部と、を備え、
所定の画面において前記接触指示受付部による指示の受け付けが制限されると、前記所定の画面における選択肢を前記選択された回数に応じた順に音声出力する選択肢読上ステップと、
前記音声指示受付部により、前記選択肢読上手順において出力された前記選択肢のいずれかについて指示を受け付けるステップと、
を実施することを特徴とする音声認識方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001373 | 2013-01-08 | ||
JP2013001373 | 2013-01-08 | ||
PCT/JP2013/078498 WO2014109104A1 (ja) | 2013-01-08 | 2013-10-21 | 音声認識装置、音声認識プログラム及び音声認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2014109104A1 true JPWO2014109104A1 (ja) | 2017-01-19 |
Family
ID=51166769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014556325A Pending JPWO2014109104A1 (ja) | 2013-01-08 | 2013-10-21 | 音声認識装置、音声認識プログラム及び音声認識方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150348555A1 (ja) |
EP (1) | EP2945052B1 (ja) |
JP (1) | JPWO2014109104A1 (ja) |
CN (1) | CN104903846B (ja) |
WO (1) | WO2014109104A1 (ja) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
JP2017062300A (ja) * | 2015-09-24 | 2017-03-30 | セイコーエプソン株式会社 | 半導体装置、システム、電子機器、及び、音声認識方法 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
FR3044436B1 (fr) * | 2015-11-27 | 2017-12-01 | Thales Sa | Procede d'utilisation d'un dispositif d'interface homme-machine pour aeronef comportant une unite de reconnaissance de la parole |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) * | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
CN107342082A (zh) * | 2017-06-29 | 2017-11-10 | 北京小米移动软件有限公司 | 基于语音交互的音频处理方法、装置及音频播放设备 |
US11099540B2 (en) | 2017-09-15 | 2021-08-24 | Kohler Co. | User identity in household appliances |
US10887125B2 (en) | 2017-09-15 | 2021-01-05 | Kohler Co. | Bathroom speaker |
US11314214B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Geographic analysis of water conditions |
US10448762B2 (en) | 2017-09-15 | 2019-10-22 | Kohler Co. | Mirror |
US11093554B2 (en) | 2017-09-15 | 2021-08-17 | Kohler Co. | Feedback for water consuming appliance |
JP6911730B2 (ja) * | 2017-11-29 | 2021-07-28 | 京セラドキュメントソリューションズ株式会社 | 表示装置、画像処理装置、処理実行方法、処理実行プログラム |
JP6717537B2 (ja) * | 2018-02-22 | 2020-07-01 | 三菱電機株式会社 | 操作制限制御装置及び操作制限制御方法 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11231848B2 (en) * | 2018-06-28 | 2022-01-25 | Hewlett-Packard Development Company, L.P. | Non-positive index values of panel input sources |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
CN112802474A (zh) * | 2019-10-28 | 2021-05-14 | 中国移动通信有限公司研究院 | 语音识别方法、装置、设备及存储介质 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11756544B2 (en) * | 2020-12-15 | 2023-09-12 | Google Llc | Selectively providing enhanced clarification prompts in automated assistant interactions |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125766A (ja) * | 1999-10-28 | 2001-05-11 | Sumitomo Electric Ind Ltd | 車両に搭載される機器の制御装置および方法 |
JP2002311986A (ja) * | 2001-04-17 | 2002-10-25 | Alpine Electronics Inc | ナビゲーション装置 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3951705B2 (ja) | 2001-12-27 | 2007-08-01 | 株式会社デンソー | 電子機器 |
AU2002336458A1 (en) * | 2002-09-06 | 2004-03-29 | Jordan R. Cohen | Methods, systems, and programming for performing speech recognition |
JP2008532200A (ja) * | 2005-03-04 | 2008-08-14 | ミュージックアイピー コーポレイション | 再生リストを作成するためのスキャンシャッフル |
US7870142B2 (en) * | 2006-04-04 | 2011-01-11 | Johnson Controls Technology Company | Text to grammar enhancements for media files |
JP2012234341A (ja) * | 2011-04-28 | 2012-11-29 | Toshiba Corp | 映像表示装置およびメニュー画面表示方法 |
US8811938B2 (en) * | 2011-12-16 | 2014-08-19 | Microsoft Corporation | Providing a user interface experience based on inferred vehicle state |
-
2013
- 2013-10-21 US US14/759,537 patent/US20150348555A1/en not_active Abandoned
- 2013-10-21 EP EP13870530.6A patent/EP2945052B1/en active Active
- 2013-10-21 CN CN201380069575.2A patent/CN104903846B/zh active Active
- 2013-10-21 WO PCT/JP2013/078498 patent/WO2014109104A1/ja active Application Filing
- 2013-10-21 JP JP2014556325A patent/JPWO2014109104A1/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125766A (ja) * | 1999-10-28 | 2001-05-11 | Sumitomo Electric Ind Ltd | 車両に搭載される機器の制御装置および方法 |
JP2002311986A (ja) * | 2001-04-17 | 2002-10-25 | Alpine Electronics Inc | ナビゲーション装置 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104903846A (zh) | 2015-09-09 |
US20150348555A1 (en) | 2015-12-03 |
EP2945052B1 (en) | 2017-12-20 |
CN104903846B (zh) | 2017-07-28 |
EP2945052A4 (en) | 2016-08-10 |
EP2945052A1 (en) | 2015-11-18 |
WO2014109104A1 (ja) | 2014-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2014109104A1 (ja) | 音声認識装置、音声認識プログラム及び音声認識方法 | |
JP6501217B2 (ja) | 情報端末システム | |
JP4933129B2 (ja) | 情報端末および簡略−詳細情報の表示方法 | |
JP6457492B2 (ja) | 車両用機器 | |
WO2003078930A1 (fr) | Dispositif de navigation a bord d'un vehicule | |
CN107315749B (zh) | 媒体处理方法、装置、设备和系统 | |
JP2011111061A (ja) | 車載表示システム | |
US20090234565A1 (en) | Navigation Device and Method for Receiving and Playing Sound Samples | |
JP2007071946A (ja) | 車載情報端末 | |
JP2011086210A (ja) | 車載器 | |
JP2006260648A (ja) | オーディオ装置 | |
JP2015162019A (ja) | 車両用表示制御装置 | |
JP3873953B2 (ja) | 再生装置及びプログラム | |
JP5011856B2 (ja) | コンテンツ提案装置、コンテンツ提案方法及びプログラム | |
JP2018063133A (ja) | コンテンツ再生提案装置およびコンテンツ再生提案プログラム | |
JP2012042481A (ja) | ナビゲーション装置 | |
JP2008224508A (ja) | ナビゲーション装置 | |
JP2006133006A (ja) | 車載用コンテンツ再生装置 | |
JP5028045B2 (ja) | 車載表示装置 | |
JP7252045B2 (ja) | 情報制御装置、情報制御方法およびプログラム | |
JP2019016276A (ja) | 表示制御装置および表示制御方法 | |
JP5029336B2 (ja) | 車載オーディオ装置 | |
JP2006103520A (ja) | オーディオ再生機能付きナビゲーション装置及び情報端末、オーディオデータ再生方法、及びオーディオデータ再生設定方法 | |
JP2007078530A (ja) | ナビゲーション装置 | |
CN106941649A (zh) | 改变车辆的音频输出模式的方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170626 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170919 |