JP5762660B2 - 音声認識装置、認識結果表示装置および表示方法 - Google Patents
音声認識装置、認識結果表示装置および表示方法 Download PDFInfo
- Publication number
- JP5762660B2 JP5762660B2 JP2015515343A JP2015515343A JP5762660B2 JP 5762660 B2 JP5762660 B2 JP 5762660B2 JP 2015515343 A JP2015515343 A JP 2015515343A JP 2015515343 A JP2015515343 A JP 2015515343A JP 5762660 B2 JP5762660 B2 JP 5762660B2
- Authority
- JP
- Japan
- Prior art keywords
- operation button
- display
- unit
- stop
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 50
- 238000003860 storage Methods 0.000 claims description 43
- 238000001514 detection method Methods 0.000 claims description 23
- 238000013459 approach Methods 0.000 claims description 7
- 238000003825 pressing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 21
- 230000036544 posture Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 101000760620 Homo sapiens Cell adhesion molecule 1 Proteins 0.000 description 1
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Description
例えば特許文献1には、ユーザが発話した音声を認識し、その認識結果を表示する音声認識装置であって、ユーザが発話するとその音声の認識結果であるショートカットボタンが表示画面の左下付近に表示され、当該ショートカットボタンをユーザが押下することで、ショートカット機能が実行されることが記載されている。
この発明は、ユーザにより発話された音声を認識する音声認識装置であり、当該音声認識装置が起動されている場合は常時、音声を認識するものである。なお、以下の実施の形態では、この発明の音声認識装置を車両等の移動体に搭載されるナビゲーション装置に適用した場合を例に挙げて説明するが、車両以外の他の移動体用のナビゲーション装置であってもよいし、ナビゲーションシステムのサーバに適用してもよい。また、スマートフォン、タブレットPC、携帯電話等の携帯情報端末等にインストールされるナビゲーションシステムのアプリケーション等に適用してもよい。
図1は、この発明の実施の形態1における音声認識装置の一例を示すブロック図である。この音声認識装置は、制御部1、マイク2、音声取得部3、音声認識辞書4、音声認識部5、操作ボタン生成部6、表示制御部7、表示部8、操作ボタン表示更新停止/再開部9、指示入力部10、カメラ11、視線検出部12、姿勢検出部13を備えている。
表示制御部7は、操作ボタン生成部6により生成された操作ボタンの表示部8への表示、操作ボタンの表示位置変更、所定時間表示された操作ボタンの削除等の指示出力を行うことで、操作ボタンの表示更新を制御するとともに、表示部8における操作ボタンの表示更新が停止中であるか否かを判定する。また、表示部8に表示されている操作ボタンに関する情報、例えば操作ボタン名称や操作ボタンの表示部8における表示位置などを管理する。
図2は、地図等が表示された表示画面(表示部8)の操作ボタン表示領域60に、操作ボタン61,62が表示された画面例を示す図である。そして、ユーザによって当該操作ボタン61または62が選択されると、制御部1は当該選択された操作ボタンに対応するジャンル検索を実行する。なお、音声認識部5では、周知技術であるキーワードスポッティングによって施設ジャンル名の認識が行われるものとする。
図3は操作ボタン表示領域60が小さく、その中に操作ボタンは1つしか表示できない場合の操作ボタンの表示更新方法を示す図である。
図4は、操作ボタン表示領域60に、2個の操作ボタンが表示できる場合の操作ボタンの表示更新方法を示す図である。
例えば、図4では、操作ボタン表示領域60に操作ボタンが表示される際に、1つ目の操作ボタンが操作ボタン表示領域60の中の下の位置に表示されるようにしているが、上から表示されるようにしてもよい。
ユーザが操作ボタンを押下しようとしているか否かを判断する手法としては、様々なものが考えられるが、ここでは、視線検出部12を用いてユーザの視線を検出して判断するもの、姿勢検出部13を用いてユーザの所定の姿勢を検出して判断するもの、および、指示入力部10を用いてユーザにより所定の操作が行われたことにより判断するもののいずれかを用いることとする。
さらに、操作ボタン表示更新停止/再開部9は、所定の条件を満たさない場合(すなわち、ユーザが操作ボタンを押下しようとしていないと判断された場合)に、表示制御部7に対して、操作ボタンの表示更新を再開する指示出力を行う。
さらに、当該所定時間は、この音声認識装置が搭載されている移動体の走行状態、例えば、走行速度や走行している道路等に応じて変化させてもよい。
図5は、例えば図3に示すように、操作ボタン表示領域の中に操作ボタンが1つしか表示できない場合の操作ボタンの生成および表示の処理を示したフローチャートである。
次に、音声認識部5は、音声取得部3によりデジタル化された音声信号から、ユーザが発話した内容に該当する音声区間を検出し、該音声区間の音声データの特徴量を抽出し、その特徴量に基づいて音声認識辞書4を参照して認識処理を行い、認識結果を出力する(ステップST02)。
その後、表示制御部7は、表示部8に既に表示されている操作ボタンがあるか否かを判定する(ステップST04)。
また、ステップST04において、表示されている操作ボタンがない場合(ステップST04のNOの場合)は、ステップST03において操作ボタン生成部6により生成された操作ボタンを表示する指示出力を表示部8に対して行う(ステップST07)。
図6は、例えば図4に示すように、操作ボタン表示領域60に操作ボタンが複数(図4の場合には2個)表示できる場合の操作ボタンの生成および表示の処理を示したフローチャートである。
ステップST13において操作ボタンを生成した後、表示制御部7は、表示部8の操作ボタン表示領域60に既に表示されている操作ボタンの個数を判定する(ステップST14)。
また、ステップST15において、表示されている操作ボタンが所定個数(操作ボタン表示領域60に表示できる最大個数)より少ない場合(ステップST15のNOの場合、例えば図4(b)の場合)には、操作ボタン表示更新停止/再開部9による操作ボタンの表示内容の更新を停止する指示信号にかかわらず、操作ボタン生成部6により生成された操作ボタン(図4(c)の操作ボタン62)を表示する指示出力を表示部8に対して行う(ステップST18)。
まず、表示制御部7は、表示部8の操作ボタン表示領域60に表示されている操作ボタンについて、表示開始から所定時間が経過した操作ボタンがあるか否かを判定する(ステップST21)。表示後、所定時間が経過している操作ボタンがない場合(ステップST21のNOの場合)は、ステップST21の処理へ戻る。
まず、操作ボタン表示更新停止/再開部9は、視線検出部12、姿勢検出部13、指示入力部10から、各種情報を取得する(ステップST31)。各種情報とは、具体的には、視線検出部12からの視線情報、姿勢検出部13からの姿勢情報、指示入力部10からの操作情報、タッチパネルへの物体の接近/接触情報、表示更新が停止されている時間の少なくとも1つ以上のことである。
一方、所定の条件(表示更新停止の条件)を満たさなくなった場合(ステップST32のNOの場合)は、表示更新再開の指示出力を行う(ステップST34)。
例えば、図3に示すように、操作ボタン表示領域60の中に操作ボタンが1つしか表示できない場合に、操作ボタンが表示されていない状態(図3(a)の状態)において、ユーザAが「コンビニ行きたいね」と発話すると、音声認識部5によって認識処理が行われ認識結果として「コンビニ」を出力する(図5のステップST01〜ST02)。
ここで、表示部8の操作ボタン表示領域60には操作ボタンが表示されていないので(ステップST04のNOの場合)、表示制御部7は、操作ボタン61を表示するよう表示部8に対して指示出力する(ステップST07)。その結果、図3(b)に示すように操作ボタン61が表示される。
この結果、操作ボタンの表示更新が停止中であると判定されるので(ステップST05のYESの場合)、「銀行」という操作ボタン62は表示部8に表示されない。
この結果、操作ボタンの表示更新が停止中ではないと判断されるので(ステップST05のNOの場合)、表示制御部7は、「コンビニ」という操作ボタン61を消去して「銀行」という操作ボタン62を表示するよう表示部8に指示出力する(ステップST06、図3(c))。
そして、図4(b)に示すように、既に「コンビニ」という操作ボタン61が1つだけ表示されている場合を例に説明する。この状態で、ユーザBが「銀行にもよらないと」と発話すると、「銀行」という操作ボタン62が生成される(図6のステップST11〜ST13)。
しかし、表示部8に表示されている操作ボタンの個数が1つであるため(ステップST14、ステップST15のNOの場合)、表示更新停止中であるか否かにかかわらず、「銀行」という操作ボタン62を表示する指示信号を出力する(ステップST18)。
その結果、図4(c)のように、「銀行」という操作ボタン62が表示される。
このとき、例えばユーザAが「近くに駐車場ないかな」と発話すると、「駐車場」という操作ボタン63が生成される(ステップST11〜ST13)。
このとき、例えばユーザAが「近くに駐車場ないかな」と発話すると、「駐車場」という操作ボタン63が生成されるところまでは、前述の場合と同様である(ステップST11〜ST13)。
その結果、図4(d)のように、「駐車場」という操作ボタン63が表示される。
図9は、この発明の実施の形態2における音声認識装置の一例を示すブロック図である。なお、実施の形態1で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。以下に示す実施の形態2では、実施の形態1と比べると、表示更新停止表現記憶部14と表示更新再開表現記憶部15を備え、操作ボタン表示更新停止/再開部9が、音声認識部5の音声認識により表示更新の停止/再開を行う点が異なる。
表示更新停止表現記憶部14には、「ストップ」「停止」「更新停止」等、操作ボタンの表示更新停止を意味する単語が記憶されている。
表示更新再開表現記憶部15には、「再開」「更新再開」等、操作ボタンの表示更新再開を意味する単語が記憶されている。
図10は、操作ボタン表示更新停止/再開部9が音声認識により操作ボタンの表示更新停止/再開の指示出力を行う処理を示すフローチャートである。
次に、操作ボタン表示更新停止/再開判定部9は、当該認識結果が表示更新停止表現記憶部14に存在するか否かを判定する(ステップST42)。存在する場合(ステップST42のYESの場合)には、表示制御部7に対して表示更新停止の指示出力を行う(ステップST43)。
また、ステップST41で取得した認識結果が表示更新再開表現記憶部15にも存在しない場合(ステップST44のNOの場合)は、処理を終了する。
これにより、ユーザは操作ボタンの表示更新が停止中か否かを視覚的に判断することができる。また、操作ボタンを目立たせることで選択し易くなる。
そして、表示更新停止中に、ユーザにより操作ボタン表示領域に対してスクロール操作がなされると、操作ボタン表示履歴記憶部に記憶された情報に基づいて、過去に表示された操作ボタンを消去された順に表示するような制御を行う。
ここでは、操作ボタン表示領域60に表示可能な操作ボタンの最大個数は「3」とする。図11(a)は、「コンビニ」の操作ボタン61、「銀行」の操作ボタン62、「スーパー」の操作ボタン63が表示された後、さらに「駐車場」の操作ボタン64が表示されたことにより、最初に表示された「コンビニ」の操作ボタン61が消去された状態を示している。
例えば、操作ボタン表示履歴記憶部に「コンビニ」「銀行」の順で操作ボタンに関する情報が記憶されている場合において、さらに、「コンビニ」の操作ボタンに関する情報が取得されたとしても、これについては既に記憶部に記憶されているので記憶しない。
これにより、同一の操作ボタンが複数表示されることを防止することができる。
このとき、操作ボタン表示領域60には関係なく、表示部8に表示可能な最大個数分の操作ボタンを表示するように指示出力してもよいし、最大個数を超えない所定の個数分を表示するように指示出力してもよい。
以上の実施の形態1,2では、この発明における音声認識装置を、車両等の移動体に搭載されるナビゲーション装置に適用した場合を例に説明したが、適用するのは車載用のナビゲーション装置に限らず、人、車両、鉄道、船舶または航空機等を含む移動体用のナビゲーション装置であってもよいし、音声認識システムのサーバやナビゲーションシステムのサーバに適用してもよい。また、スマートフォン、タブレットPC、携帯電話等の携帯情報端末等にインストールされる音声認識システムのアプリケーションやナビゲーションシステムのアプリケーション等、どのような形態のものにも適用することができる。
この構成においては、車載装置100がサーバ102と直接通信するか、または、車載装置100が携帯情報端末101を経由してサーバ102と通信する場合が考えられる。サーバ102は、上記実施の形態1,2で説明した音声認識装置として機能する。また、車載装置100は、サーバ102による認識結果をユーザに提供するための表示部8を少なくとも備える表示装置として機能する。
この場合、サーバ102が音声認識辞書4と音声認識部5を備える音声認識サーバであり、認識結果表示装置である車載装置100は、制御部1、音声取得部3、操作ボタン生成部6、表示制御部7、表示部8、操作ボタン表示更新停止/再開部9および通信機能(音声データ送信部、認識結果取得部)を備えている。
この場合、車載装置100は基本的に音声取得機能、通信機能および表示機能のみを有し、サーバ102による音声認識結果を受信してユーザに提供する。
すなわち、サーバ102が表示部8以外を備える音声認識装置であり、この音声認識装置であるサーバ102が、ユーザにより発話された音声を認識して認識結果を表示装置である車載装置100に表示させる。
このように構成しても、実施の形態1,2と同様な効果を得ることができる。
この構成においては、車載装置100が携帯情報端末101を経由してサーバ102と通信する場合が考えられ、携帯情報端末101のアプリケーションが、サーバ102と連携して音声認識処理を行う。また、車載装置100は、携帯情報端末101とサーバ102による認識結果をユーザに提供するための表示部8を少なくとも備える表示装置として機能する。
すなわち、携帯情報端末101のアプリケーションにより、ユーザにより発話された音声を認識した認識結果を表示装置である車載装置100に表示させる。
このように構成しても、実施の形態1,2と同様な効果を得ることができる。
Claims (18)
- ユーザにより発話された音声を認識して認識結果を表示する音声認識装置において、
前記ユーザにより発話された音声を検知して取得する音声取得部と、
前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記音声取得部により取得された音声データを認識し、認識結果を出力する音声認識部と、
前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
前記操作ボタン生成部により生成された操作ボタンを表示する表示部と、
前記表示部における前記操作ボタンの表示内容を制御する表示制御部と、
前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止/再開部とを備え、
前記操作ボタン表示更新停止/再開部は、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
前記表示制御部は、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示更新を停止するよう前記表示部に対して指示を行う
ことを特徴とする音声認識装置。 - 前記ユーザによる各種操作の指示を受け付ける指示入力部をさらに備え、
前記操作ボタン表示更新停止/再開部は、前記指示入力部により所定の操作が受け付けられた場合に、前記ユーザが前記操作ボタンを押下しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
ことを特徴とする請求項1記載の音声認識装置。 - 前記指示入力部は、物体の接近を検知する近接センサを備えるものであり、
前記所定の操作が受け付けられた場合とは、前記近接センサからの信号に基づいて、前記近接センサと前記物体との距離を算出し、当該算出された距離が所定値以下または所定値より小さい場合のことである
ことを特徴とする請求項2記載の音声認識装置。 - 前記ユーザの視線を検出する視線検出部をさらに備え、
前記操作ボタン表示更新停止/再開部は、前記視線検出部により前記表示部に対する前記ユーザの視線が検出された場合に、前記ユーザが前記操作ボタンを操作しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
ことを特徴とする請求項1記載の音声認識装置。 - 前記ユーザの姿勢を検出する姿勢検出部をさらに備え、
前記操作ボタン表示更新停止/再開部は、前記姿勢検出部により所定の姿勢が検出された場合に、前記ユーザが前記操作ボタンを押下しようとしていると判断して前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
ことを特徴とする請求項1記載の音声認識装置。 - 前記表示部に表示されている操作ボタンが所定個数より少ない場合は、
前記操作ボタン表示更新停止/再開部は、前記ユーザが前記操作ボタンを操作しようとしていると判断した場合であっても、前記操作ボタンの表示内容の更新停止を指示しない
ことを特徴とする請求項1記載の音声認識装置。 - 前記操作ボタンの表示更新停止を意味する単語が記憶されている表示更新停止表現記憶部をさらに備え、
前記操作ボタン表示更新停止/再開部は、前記音声認識部により出力された認識結果が前記表示更新停止表現記憶部に存在すると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力する
ことを特徴とする請求項1記載の音声認識装置。 - 前記操作ボタン表示更新停止/再開部は、前記操作ボタンを前記ユーザが操作しようとしていると判断しなかった場合には、前記操作ボタンの表示内容の更新再開を指示する指示信号を出力し、
前記表示制御部は、前記表示部における前記操作ボタンの更新が停止中であって、かつ、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新再開の指示信号を受けた場合は、前記表示部に表示されている操作ボタンの表示更新を再開するよう前記表示部に対して指示を行う
ことを特徴とする請求項1記載の音声認識装置。 - 前記操作ボタン表示更新停止/再開部は、前記操作ボタンの表示内容の更新を停止する指示信号を出力してから、当該操作ボタンに対する操作がされないまま所定時間経過した場合に、前記操作ボタンの表示内容の更新を再開する
ことを特徴とする請求項1記載の音声認識装置。 - 前記音声認識装置は、移動体に搭載されるものであり、
前記操作ボタン表示更新停止/再開部は、前記移動体の走行状態に応じて、前記所定時間を変更する
ことを特徴とする請求項9記載の音声認識装置。 - 前記表示制御部は、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示態様を変更する
ことを特徴とする請求項1記載の音声認識装置。 - 前記表示態様とは、前記操作ボタンの大きさ、色、文字フォントの少なくとも1つ以上のことである
ことを特徴とする請求項11記載の音声認識装置。 - 前記表示部に表示された操作ボタンの表示履歴を記憶する操作ボタン表示履歴記憶部をさらに備え、
前記表示制御部は、前記操作ボタンの表示更新によって前記表示部から前記操作ボタンが消去される度に、当該消去された操作ボタンに関する情報を前記操作ボタン表示履歴記憶部に記憶するとともに、前記操作ボタンの表示更新停止中に、前記操作ボタンに対するスクロール操作が行われると、前記操作ボタン表示履歴記憶部に記憶されている操作ボタンを表示するよう前記表示部に対して指示を行う
ことを特徴とする請求項1記載の音声認識装置。 - 前記表示部に表示された操作ボタンの表示履歴を記憶する操作ボタン表示履歴記憶部をさらに備え、
前記表示制御部は、前記操作ボタンの表示更新によって前記表示部から前記操作ボタンが消去される度に、当該消去された操作ボタンに関する情報を前記操作ボタン表示履歴記憶部に記憶するとともに、前記操作ボタンの表示更新停止中に、前記操作ボタン表示履歴記憶部に記憶されている操作ボタンを一覧表示するよう前記表示部に対して指示を行う
ことを特徴とする請求項1記載の音声認識装置。 - 前記操作ボタン生成部により生成された操作ボタンに関する情報を記憶する操作ボタン生成履歴記憶部をさらに備え、
前記表示制御部は、前記操作ボタン生成部により生成された操作ボタンが、前記操作ボタンの表示更新停止中であったために前記表示部に表示されなかった操作ボタンに関する情報を、前記操作ボタン生成履歴記憶部に記憶させるよう指示を行うとともに、前記操作ボタンの表示更新再開の指示信号を受けると、前記表示部に表示中の操作ボタンに代えて、前記操作ボタン生成履歴記憶部に記憶されている情報に基づく操作ボタンを、前記表示部に表示するよう指示出力を行う
ことを特徴とする請求項1記載の音声認識装置。 - ユーザにより発話された音声の認識結果を表示する認識結果表示装置において、
前記ユーザにより発話された音声を検知して取得する音声取得部と、
前記認識結果表示装置が起動している間は常時、前記音声取得部により取得された音声データを音声認識サーバへ送信し、当該サーバにおいて音声認識された認識結果を取得する認識結果取得部と、
前記認識結果取得部により取得された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
前記操作ボタン生成部により生成された操作ボタンを表示する表示部と、
前記表示部における前記操作ボタンの表示内容を制御する表示制御部と、
前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止/再開部とを備え、
前記操作ボタン表示更新停止/再開部は、前記表示部に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
前記表示制御部は、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示部に表示されている操作ボタンの表示更新を停止するよう前記表示部に対して指示を行う
ことを特徴とする認識結果表示装置。 - ユーザにより発話された音声を認識して認識結果を表示装置に表示させる音声認識装置であって、
前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記ユーザにより発話された音声を認識し、認識結果を出力する音声認識部と、
前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成する操作ボタン生成部と、
前記操作ボタン生成部により生成された操作ボタンを前記表示装置に表示する際の表示内容を制御する表示制御部と、
前記表示装置に表示されている操作ボタンを前記ユーザが操作しようとしているか否かに基づいて、前記表示制御部に対して前記操作ボタンの表示内容の更新停止および再開を指示する指示信号を出力する操作ボタン表示更新停止/再開部とを備え、
前記操作ボタン表示更新停止/再開部は、前記操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力し、
前記表示制御部は、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示装置に表示されている操作ボタンの表示更新を停止するよう前記表示装置に対して指示を行う
ことを特徴とする音声認識装置。 - 音声認識装置が、ユーザにより発話された音声を認識して認識結果を表示装置に表示させる表示方法であって、
音声認識部が、前記音声認識装置が起動している間は常時、音声認識辞書を参照して、前記ユーザにより発話された音声を認識し、認識結果を出力するステップと、
ボタン生成部が、前記音声認識部により出力された認識結果に対応する機能を有する操作ボタンを生成するステップと、
操作ボタン表示更新停止/再開部が、前記表示装置に表示されている操作ボタンを前記ユーザが操作しようとしていると判断した場合に、前記操作ボタンの表示内容の更新停止を指示する指示信号を出力するステップと、
表示制御部が、前記操作ボタン表示更新停止/再開部から前記操作ボタンの表示内容の更新停止の指示信号を受けた場合に、前記表示装置に表示されている操作ボタンの表示更新を停止するよう前記表示装置に対して指示を行うステップと
を備えたことを特徴とする表示方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/064072 WO2014188512A1 (ja) | 2013-05-21 | 2013-05-21 | 音声認識装置、認識結果表示装置および表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5762660B2 true JP5762660B2 (ja) | 2015-08-12 |
JPWO2014188512A1 JPWO2014188512A1 (ja) | 2017-02-23 |
Family
ID=51933102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015515343A Expired - Fee Related JP5762660B2 (ja) | 2013-05-21 | 2013-05-21 | 音声認識装置、認識結果表示装置および表示方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9767799B2 (ja) |
JP (1) | JP5762660B2 (ja) |
CN (1) | CN105246743B (ja) |
DE (1) | DE112013007103T5 (ja) |
WO (1) | WO2014188512A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017061300A1 (ja) * | 2015-10-05 | 2017-04-13 | パイオニア株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9786296B2 (en) * | 2013-07-08 | 2017-10-10 | Qualcomm Incorporated | Method and apparatus for assigning keyword model to voice operated function |
JP6642424B2 (ja) * | 2014-06-03 | 2020-02-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
KR102301880B1 (ko) * | 2014-10-14 | 2021-09-14 | 삼성전자 주식회사 | 전자 장치 및 이의 음성 대화 방법 |
US9741342B2 (en) * | 2014-11-26 | 2017-08-22 | Panasonic Intellectual Property Corporation Of America | Method and apparatus for recognizing speech by lip reading |
WO2016103465A1 (ja) * | 2014-12-26 | 2016-06-30 | 三菱電機株式会社 | 音声認識システム |
JP6477123B2 (ja) * | 2015-03-25 | 2019-03-06 | 株式会社デンソー | 操作システム |
JP6739907B2 (ja) * | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US9898250B1 (en) * | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9858927B2 (en) * | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
JP6690484B2 (ja) * | 2016-09-15 | 2020-04-28 | 富士通株式会社 | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 |
KR102068182B1 (ko) * | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102552486B1 (ko) * | 2017-11-02 | 2023-07-06 | 현대자동차주식회사 | 차량의 음성인식 장치 및 방법 |
JP2019105756A (ja) * | 2017-12-13 | 2019-06-27 | トヨタ自動車株式会社 | 車載音声出力装置 |
JP7226332B2 (ja) * | 2017-12-20 | 2023-02-21 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7069795B2 (ja) * | 2018-02-15 | 2022-05-18 | 京セラドキュメントソリューションズ株式会社 | 電子機器 |
JP7281683B2 (ja) * | 2018-02-22 | 2023-05-26 | パナソニックIpマネジメント株式会社 | 音声制御情報出力システム、音声制御情報出力方法およびプログラム |
JP7192220B2 (ja) * | 2018-03-05 | 2022-12-20 | コニカミノルタ株式会社 | 画像処理装置、情報処理装置及びプログラム |
CN112867985A (zh) | 2018-05-07 | 2021-05-28 | 谷歌有限责任公司 | 确定在中断第二会话的中止后是否自动恢复第一自动助理会话 |
JP7266418B2 (ja) * | 2019-02-14 | 2023-04-28 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN113067769B (zh) * | 2021-03-31 | 2023-03-10 | 百度在线网络技术(北京)有限公司 | 路由器重启方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005311883A (ja) * | 2004-04-23 | 2005-11-04 | Alpine Electronics Inc | 電話帳システム及び電話装置 |
WO2006067855A1 (ja) * | 2004-12-24 | 2006-06-29 | Navitime Japan Co., Ltd. | 先導経路案内システム、携帯型経路先導案内装置およびプログラム |
JP2008014818A (ja) * | 2006-07-06 | 2008-01-24 | Denso Corp | 作動制御装置、プログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE391986T1 (de) * | 2000-11-23 | 2008-04-15 | Ibm | Sprachnavigation in webanwendungen |
US20030191629A1 (en) * | 2002-02-04 | 2003-10-09 | Shinichi Yoshizawa | Interface apparatus and task control method for assisting in the operation of a device using recognition technology |
JP2009116769A (ja) * | 2007-11-09 | 2009-05-28 | Sony Corp | 入力装置、入力装置の制御方法、及びプログラム |
CN101158584B (zh) * | 2007-11-15 | 2011-01-26 | 熊猫电子集团有限公司 | 车载gps的语音目的地导航实现方法 |
JP2010205130A (ja) * | 2009-03-05 | 2010-09-16 | Denso Corp | 制御装置 |
KR101639383B1 (ko) * | 2009-11-12 | 2016-07-22 | 삼성전자주식회사 | 근접 터치 동작 감지 장치 및 방법 |
DE112010005918B4 (de) * | 2010-10-01 | 2016-12-22 | Mitsubishi Electric Corp. | Spracherkennungsvorrichtung |
US9223461B1 (en) * | 2010-12-08 | 2015-12-29 | Wendell Brown | Graphical user interface |
US8898592B2 (en) * | 2011-06-30 | 2014-11-25 | International Business Machines Corporation | Grouping expanded and collapsed rows in a tree structure |
US9075514B1 (en) * | 2012-12-13 | 2015-07-07 | Amazon Technologies, Inc. | Interface selection element display |
US9639322B2 (en) * | 2013-01-09 | 2017-05-02 | Mitsubishi Electric Corporation | Voice recognition device and display method |
HK1186912A2 (en) * | 2013-01-25 | 2014-03-21 | Zhipei Wang | Remote control system and device |
KR20140110452A (ko) * | 2013-03-08 | 2014-09-17 | 삼성전자주식회사 | 전자장치에서 근접 터치를 이용한 사용자 인터페이스 제어 방법 및 장치 |
JP2014203208A (ja) * | 2013-04-03 | 2014-10-27 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
JP6330565B2 (ja) * | 2014-08-08 | 2018-05-30 | 富士通株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
-
2013
- 2013-05-21 DE DE112013007103.7T patent/DE112013007103T5/de not_active Withdrawn
- 2013-05-21 CN CN201380076789.2A patent/CN105246743B/zh not_active Expired - Fee Related
- 2013-05-21 WO PCT/JP2013/064072 patent/WO2014188512A1/ja active Application Filing
- 2013-05-21 US US14/777,180 patent/US9767799B2/en active Active
- 2013-05-21 JP JP2015515343A patent/JP5762660B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005311883A (ja) * | 2004-04-23 | 2005-11-04 | Alpine Electronics Inc | 電話帳システム及び電話装置 |
WO2006067855A1 (ja) * | 2004-12-24 | 2006-06-29 | Navitime Japan Co., Ltd. | 先導経路案内システム、携帯型経路先導案内装置およびプログラム |
JP2008014818A (ja) * | 2006-07-06 | 2008-01-24 | Denso Corp | 作動制御装置、プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017061300A1 (ja) * | 2015-10-05 | 2017-04-13 | パイオニア株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2014188512A1 (ja) | 2014-11-27 |
DE112013007103T5 (de) | 2016-03-03 |
CN105246743B (zh) | 2017-03-29 |
US9767799B2 (en) | 2017-09-19 |
JPWO2014188512A1 (ja) | 2017-02-23 |
US20160035352A1 (en) | 2016-02-04 |
CN105246743A (zh) | 2016-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5762660B2 (ja) | 音声認識装置、認識結果表示装置および表示方法 | |
JP5921722B2 (ja) | 音声認識装置および表示方法 | |
JP6400109B2 (ja) | 音声認識システム | |
JP5677650B2 (ja) | 音声認識装置 | |
JP5925313B2 (ja) | 音声認識装置 | |
JP5893217B2 (ja) | 音声認識装置および表示方法 | |
WO2013005248A1 (ja) | 音声認識装置およびナビゲーション装置 | |
CN105355202A (zh) | 语音识别装置、具有语音识别装置的车辆及其控制方法 | |
JP2012213132A (ja) | 車両用装置および情報表示システム | |
JP4466379B2 (ja) | 車載音声認識装置 | |
US20100229116A1 (en) | Control aparatus | |
JP6214297B2 (ja) | ナビゲーション装置および方法 | |
WO2013069060A1 (ja) | ナビゲーション装置および方法 | |
JP6522009B2 (ja) | 音声認識システム | |
JP6536018B2 (ja) | 音声制御システム、音声制御方法、及び音声制御プログラム | |
US20170214778A1 (en) | Vehicle and control method for the vehicle | |
JP2017102320A (ja) | 音声認識装置 | |
JP2008233009A (ja) | カーナビゲーション装置及びカーナビゲーション装置用プログラム | |
JPWO2013069060A1 (ja) | ナビゲーション装置、方法およびプログラム | |
JP2014232289A (ja) | 誘導音声調整装置、誘導音声調整方法および誘導音声調整プログラム | |
JP2006195909A (ja) | 施設検索装置 | |
JP2010205079A (ja) | 手書文字入力システム | |
JPWO2013005248A1 (ja) | 音声認識装置およびナビゲーション装置 | |
JP2001249682A (ja) | 登録名称の読み入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150501 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5762660 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |