JP5673330B2 - 音声入力装置 - Google Patents
音声入力装置 Download PDFInfo
- Publication number
- JP5673330B2 JP5673330B2 JP2011097408A JP2011097408A JP5673330B2 JP 5673330 B2 JP5673330 B2 JP 5673330B2 JP 2011097408 A JP2011097408 A JP 2011097408A JP 2011097408 A JP2011097408 A JP 2011097408A JP 5673330 B2 JP5673330 B2 JP 5673330B2
- Authority
- JP
- Japan
- Prior art keywords
- voice input
- voice
- user
- input
- switching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012937 correction Methods 0.000 claims description 42
- 230000007704 transition Effects 0.000 claims description 17
- 238000000034 method Methods 0.000 description 33
- 230000008569 process Effects 0.000 description 30
- 238000004891 communication Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012905 input function Methods 0.000 description 5
- 101100048435 Caenorhabditis elegans unc-18 gene Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
ユーザーが発する音声が入力され、入力された音声に基づいて操作コマンドを実行する音声入力装置であって、
前記ユーザーの、前記音声の入力に係る習熟レベルを特定する習熟レベル特定手段と、
音声の入力モードを、予め登録された登録済発話内容を前記ユーザーに提示するガイド有り入力モードと、前記登録済発話内容が非提示とされるガイド無し入力モードとを切り替える形で設定する入力モード設定手段と、
を備え、前記入力モード設定手段は、音声入力の入力受け付けが開始されるに伴い設定する前記ガイド無し入力モードを、前記習熟レベル特定手段によって特定される前記習熟レベルが高いほど、前記音声入力の開始時点からより遅いタイミングで前記ガイド有り入力モードに切り替えるものであり、
さらに、前記音声入力の開始時点から前記ガイド有り入力モードに切り替えるまでの切替待ち時間と、前記習熟レベルとを対応付けた切替タイミング情報を記憶する切替タイミング記憶手段を備え、
前記入力モード設定手段は、前記切替タイミング情報に基づいて前記入力モードを切り替えるものであり、前記習熟レベルと前記切替タイミング情報とに基づいて特定される、前記ガイド無し入力モードから前記ガイド有り入力モードに切り替える切替タイミングを予め定められた補正情報に基づいて補正し、補正された切替タイミングにて当該切り替えを実行することを特徴とする。
10 音声入力装置
11 制御部
12 音声認識部
13 音声入力部
14 音声合成部
15 音声出力部
16 記憶装置
17 音声入力開始/終了操作部
18 習熟レベル更新情報取得部
21 ナビゲーション装置
22 オーディオ装置
23 空調装置
24 パワーウィンドウ装置
25 通信部
26 通信部
4 表示装置
T 切替待ち時間
Claims (12)
- ユーザーが発する音声が入力され、入力された音声に基づいて操作コマンドを実行する音声入力装置であって、
前記ユーザーの、前記音声の入力に係る習熟レベルを特定する習熟レベル特定手段と、
音声の入力モードを、予め登録された登録済発話内容を前記ユーザーに提示するガイド有り入力モードと、前記登録済発話内容が非提示とされるガイド無し入力モードとを切り替える形で設定する入力モード設定手段と、
を備え、前記入力モード設定手段は、音声入力の入力受け付けが開始されるに伴い設定する前記ガイド無し入力モードを、前記習熟レベル特定手段によって特定される前記習熟レベルが高いほど、前記音声入力の開始時点からより遅いタイミングで前記ガイド有り入力モードに切り替えるものであり、
さらに、前記音声入力の開始時点から前記ガイド有り入力モードに切り替えるまでの切替待ち時間と、前記習熟レベルとを対応付けた切替タイミング情報を記憶する切替タイミング記憶手段を備え、
前記入力モード設定手段は、前記切替タイミング情報に基づいて前記入力モードを切り替えるものであり、前記習熟レベルと前記切替タイミング情報とに基づいて特定される、前記ガイド無し入力モードから前記ガイド有り入力モードに切り替える切替タイミングを予め定められた補正情報に基づいて補正し、補正された切替タイミングにて当該切り替えを実行することを特徴とする音声入力装置。 - 前記習熟レベル特定手段は、ユーザーが発する音声を入力する音声入力手段が音声入力を受け付けている音声入力受付時間の総時間が長いほど前記習熟レベルを高く特定するものである請求項1に記載の音声入力装置。
- 前記習熟レベル特定手段は、ユーザーが発する音声を入力する音声入力手段が音声入力の受け付け状態となった総回数が多いほど前記習熟レベルを高く特定するものである請求項1に記載の音声入力装置。
- 前記切替タイミング情報は、前記習熟レベルとして複数のレベルを離散的に有し、それら各レベルに対し前記切替待ち時間が対応付けられている請求項1ないし請求項3のいずれか1項に記載の音声入力装置。
- 前記切替タイミング情報は、前記習熟レベルが高くなるほど前記切替待ち時間が長くなっていく連続的な対応関係を有している請求項1ないし請求項4のいずれか1項に記載の音声入力装置。
- 前記切替タイミング情報は、前記習熟レベルが一定レベル以上となると、前記切替待ち時間が一定となる請求項4又は請求項5に記載の音声入力装置。
- 前記切替タイミング情報は、前記習熟レベルの最も低いレベルに対し、前記切替待ち時間無しが対応付けられている請求項4ないし請求項6のいずれか1項に記載の音声入力装置。
- ユーザー情報を登録する形でユーザー登録を行うユーザー登録手段と、登録されたユーザーを特定する登録ユーザー特定手段と、登録されたユーザー毎に前記習熟レベルを記憶する習熟レベル記憶手段と、を備え、前記習熟レベル特定手段は、前記登録ユーザー特定手段によって特定されたユーザーの習熟レベルを特定し、前記入力モード設定手段は、特定されたユーザーの習熟レベルと前記切替タイミング情報とに基づいて、前記入力モードを切り替えるものである請求項1ないし請求項7のいずれか1項に記載の音声入力装置。
- 前記ガイド有り入力モードの設定時に前記音声入力により実行可能となる予め決められた1以上の前記操作コマンドを有する操作階層が複数設けられた階層構造を有するとともに、それら操作階層には、操作コマンドとして階層を上下いずれかに遷移させる階層遷移コマンドが設けられ、該階層遷移コマンドの実行を繰り返すことにより、最上位の操作階層から途中に1以上の分岐を経て任意の最下位の操作階層まで遷移可能とされており、前記補正情報が前記操作階層毎に定められている請求項1ないし請求項8のいずれか1項に記載の音声入力装置。
- 前記ユーザーの音声入力実績を特定する音声入力実績特定手段を備え、前記補正情報が前記音声入力実績に応じて定められている請求項1ないし請求項9のいずれか1項に記載の音声入力装置。
- 前記ユーザーの予め定められた操作状況を特定する操作状況特定手段を備え、前記補正情報が前記操作状況毎に定められている請求項1ないし請求項10のいずれか1項に記載の音声入力装置。
- 前記ユーザーは車両のドライバーであり、該ユーザーが運転する車両の予め定められた車両状況を特定する車両状況特定手段を備え、前記補正情報が前記車両状況毎に定められている請求項1ないし請求項11のいずれか1項に記載の音声入力装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097408A JP5673330B2 (ja) | 2011-04-25 | 2011-04-25 | 音声入力装置 |
US13/447,578 US8831952B2 (en) | 2011-04-25 | 2012-04-16 | Voice input device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097408A JP5673330B2 (ja) | 2011-04-25 | 2011-04-25 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230191A JP2012230191A (ja) | 2012-11-22 |
JP5673330B2 true JP5673330B2 (ja) | 2015-02-18 |
Family
ID=47022014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011097408A Expired - Fee Related JP5673330B2 (ja) | 2011-04-25 | 2011-04-25 | 音声入力装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8831952B2 (ja) |
JP (1) | JP5673330B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5686903B2 (ja) * | 2011-09-13 | 2015-03-18 | 三菱電機株式会社 | ナビゲーション装置および方法 |
JP2015018146A (ja) * | 2013-07-12 | 2015-01-29 | 株式会社Nttドコモ | 機能管理システム及び機能管理方法 |
KR101558354B1 (ko) * | 2013-11-13 | 2015-10-20 | 현대자동차 주식회사 | 차량용 블라인드 콘트롤 시스템 |
US10163455B2 (en) * | 2013-12-03 | 2018-12-25 | Lenovo (Singapore) Pte. Ltd. | Detecting pause in audible input to device |
US20160253150A1 (en) * | 2015-02-27 | 2016-09-01 | Navico Holding As | Voice Controlled Marine Electronics Device |
US10504509B2 (en) * | 2015-05-27 | 2019-12-10 | Google Llc | Providing suggested voice-based action queries |
JP6553111B2 (ja) | 2017-03-21 | 2019-07-31 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
KR20200109467A (ko) * | 2019-03-13 | 2020-09-23 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
JP7418076B2 (ja) * | 2019-07-16 | 2024-01-19 | キヤノン株式会社 | 情報処理システム、情報処理装置、情報処理方法 |
US20220415321A1 (en) * | 2021-06-25 | 2022-12-29 | Samsung Electronics Co., Ltd. | Electronic device mounted in vehicle, and method of operating the same |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5446756A (en) * | 1990-03-19 | 1995-08-29 | Celsat America, Inc. | Integrated cellular communications system |
US6453281B1 (en) * | 1996-07-30 | 2002-09-17 | Vxi Corporation | Portable audio database device with icon-based graphical user-interface |
JPH1138995A (ja) * | 1997-07-16 | 1999-02-12 | Denso Corp | 音声認識装置及びナビゲーションシステム |
US6295391B1 (en) * | 1998-02-19 | 2001-09-25 | Hewlett-Packard Company | Automatic data routing via voice command annotation |
US6075534A (en) * | 1998-03-26 | 2000-06-13 | International Business Machines Corporation | Multiple function graphical user interface minibar for speech recognition |
US6012030A (en) * | 1998-04-21 | 2000-01-04 | Nortel Networks Corporation | Management of speech and audio prompts in multimodal interfaces |
US6701095B1 (en) | 1999-01-08 | 2004-03-02 | Ricoh Company, Ltd. | Office information system having a device which provides an operational message of the system when a specific event occurs |
JP2001022370A (ja) | 1999-07-12 | 2001-01-26 | Fujitsu Ten Ltd | 音声案内装置 |
US7024366B1 (en) * | 2000-01-10 | 2006-04-04 | Delphi Technologies, Inc. | Speech recognition with user specific adaptive voice feedback |
US7444353B1 (en) * | 2000-01-31 | 2008-10-28 | Chen Alexander C | Apparatus for delivering music and information |
US6519566B1 (en) * | 2000-03-01 | 2003-02-11 | International Business Machines Corporation | Method for hands-free operation of a pointer |
US7027975B1 (en) * | 2000-08-08 | 2006-04-11 | Object Services And Consulting, Inc. | Guided natural language interface system and method |
JP4268325B2 (ja) | 2000-08-14 | 2009-05-27 | パイオニア株式会社 | 音声操作語句の提示装置及び提示方法 |
US7899500B2 (en) * | 2002-09-24 | 2011-03-01 | At&T Intellectual Property I, L. P. | Apparatus and method for providing hands-free operation of a device |
JP4304952B2 (ja) * | 2002-10-07 | 2009-07-29 | 三菱電機株式会社 | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム |
JP2004333543A (ja) * | 2003-04-30 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 音声対話システム及び音声対話方法 |
DE10348408A1 (de) * | 2003-10-14 | 2005-05-19 | Daimlerchrysler Ag | Nutzeradaptive Dialogunterstützung für Sprachdialogsysteme |
ATE403215T1 (de) * | 2003-10-21 | 2008-08-15 | Koninkl Philips Electronics Nv | Intelligente spracherkennung mit benutzeroberflächen |
JP2005321488A (ja) | 2004-05-07 | 2005-11-17 | Canon Inc | 音声出力装置および操作表示装置および音声出力制御方法および操作表示制御方法およびプログラムおよび記憶媒体 |
JP2006011002A (ja) | 2004-06-25 | 2006-01-12 | Advanced Telecommunication Research Institute International | 音声応答装置、音声応答方法および音声応答プログラム |
JP4260788B2 (ja) * | 2005-10-20 | 2009-04-30 | 本田技研工業株式会社 | 音声認識機器制御装置 |
US8015014B2 (en) * | 2006-06-16 | 2011-09-06 | Storz Endoskop Produktions Gmbh | Speech recognition system with user profiles management component |
US8880402B2 (en) * | 2006-10-28 | 2014-11-04 | General Motors Llc | Automatically adapting user guidance in automated speech recognition |
US8150699B2 (en) * | 2007-05-17 | 2012-04-03 | Redstart Systems, Inc. | Systems and methods of a structured grammar for a speech recognition command system |
-
2011
- 2011-04-25 JP JP2011097408A patent/JP5673330B2/ja not_active Expired - Fee Related
-
2012
- 2012-04-16 US US13/447,578 patent/US8831952B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012230191A (ja) | 2012-11-22 |
US8831952B2 (en) | 2014-09-09 |
US20120271636A1 (en) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5673330B2 (ja) | 音声入力装置 | |
JP4804052B2 (ja) | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 | |
US8200429B2 (en) | Vehicle navigation apparatus | |
US7822613B2 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
US20040006479A1 (en) | Voice control system | |
JP4973722B2 (ja) | 音声認識装置、音声認識方法、及びナビゲーション装置 | |
US20110288871A1 (en) | Information presentation system | |
US20100229116A1 (en) | Control aparatus | |
JP2008014818A (ja) | 作動制御装置、プログラム | |
US20130013314A1 (en) | Mobile computing apparatus and method of reducing user workload in relation to operation of a mobile computing apparatus | |
JP5151602B2 (ja) | ナビゲーション装置。 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JP4930486B2 (ja) | 音声認識システム及びナビゲーション装置 | |
JP4258890B2 (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JP7296650B2 (ja) | システム及びプログラム | |
JP4453377B2 (ja) | 音声認識装置、プログラム及びナビゲーション装置 | |
JP4705398B2 (ja) | 音声案内装置、音声案内装置の制御方法及び制御プログラム | |
JPH11126089A (ja) | 音声対話装置 | |
WO2006028171A1 (ja) | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP3679033B2 (ja) | ナビゲーション装置 | |
JP3865038B2 (ja) | ナビゲーション装置および記憶媒体 | |
JP2002267471A (ja) | 車両用ナビゲーション装置 | |
JP2020153678A (ja) | 報知制御装置、および、報知制御方法 | |
JP4107210B2 (ja) | ナビゲーション装置 | |
JP2012145433A (ja) | ナビゲーション装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20121017 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141215 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5673330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |