JPWO2015162638A1 - ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム - Google Patents
ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム Download PDFInfo
- Publication number
- JPWO2015162638A1 JPWO2015162638A1 JP2016514543A JP2016514543A JPWO2015162638A1 JP WO2015162638 A1 JPWO2015162638 A1 JP WO2015162638A1 JP 2016514543 A JP2016514543 A JP 2016514543A JP 2016514543 A JP2016514543 A JP 2016514543A JP WO2015162638 A1 JPWO2015162638 A1 JP WO2015162638A1
- Authority
- JP
- Japan
- Prior art keywords
- user
- voice
- unit
- candidate
- guidance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000006870 function Effects 0.000 claims description 184
- 238000003860 storage Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 230000004044 response Effects 0.000 description 8
- 235000012054 meals Nutrition 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Abstract
Description
そこで、複数のボタンに、そのボタンの機能に関連する音声認識を紐付けることで、手順を覚えることなく、一回の発話で目的の機能を実行可能とするユーザインターフェースがある(特許文献1)。
図1はこの発明の実施の形態1におけるユーザインターフェースシステムを示す図である。ユーザインターフェースシステム1は、ユーザインターフェース制御装置2と、候補選択部5と、ガイダンス出力部7と、機能実行部10とを備えている。候補選択部5、ガイダンス出力部7および機能実行部10は、ユーザインターフェース制御装置2により制御される。また、ユーザインターフェース制御装置2は、推定部3、候補決定部4、ガイダンス生成部6、音声認識部8、機能決定部9を有する。以下、ユーザインターフェースシステムが自動車の運転に用いられる場合を例に説明する。
上記実施の形態1においては、ガイダンス出力部7から出力されるガイダンスに対するユーザの音声入力1回でユーザが希望する機能を実行する例を説明した。実施の形態2においては、音声認識部8による認識結果が複数である場合、または認識された音声に対応する機能が複数ある場合等、ユーザの音声入力1回で実行する機能を決定できない場合にも、簡単な操作で機能の実行を可能とするユーザインターフェース制御装置およびユーザインターフェースシステムについて説明する。
ユーザが発話したキーワードが幅広い意味のキーワードであった場合、機能が特定できず実行できなかったり、多くの機能候補を表示して選択に時間がかかってしまったりする。例えば、「どこへ行きますか?」という問いに対して、ユーザが「アミューズメントパーク」と発話した場合、「アミューズメントパーク」に属する施設は多数あるため、特定することができない。また、多数のアミューズメントパークの施設名を候補として表示するとユーザが選択するのに時間がかかる。そこで、ユーザの発話したキーワードが幅広い意味の言葉であった場合に、意図推定技術を利用してユーザが行いたいであろう音声操作の候補を推定し、推定した結果を音声操作の候補、すなわち音声操作の入り口として具体的に提示し、次の発話で目的の機能を実行できるようにすることが本実施の形態の特徴である。
上記各実施の形態においては、推定部3が推定した音声操作の候補をユーザに提示するように構成したが、推定部3が推定した音声操作の候補の尤度がどれも低い場合には、ユーザの意図に一致する確率の低い候補が提示されてしまうことになる。そこで、本実施の形態4においては、推定部3が決定した各候補の尤度が低い場合に、上位概念化して提示することとしたものである。
Claims (10)
- 現在の状況に関する情報に基づいてユーザの意図する音声操作を推定する推定部と、
前記推定部で推定された複数の音声操作の候補から1つの候補をユーザが選択するための候補選択部と、
ユーザが選択した前記候補についてユーザの音声入力を促すガイダンスを出力するガイダンス出力部と、
前記ガイダンスに対するユーザの音声入力に対応する機能を実行する機能実行部と
を備えるユーザインターフェースシステム。 - 前記ユーザの音声入力に対応する機能の候補が複数ある場合に、ユーザにより1つの機能の候補が選択されるよう、前記複数の機能の候補を提示することを特徴とする請求項1記載のユーザインターフェースシステム。
- 前記推定部は、前記ユーザの音声入力が上位概念の言葉である場合に、前記上位概念の言葉に含まれる下位概念の音声操作の候補を、現在の状況に関する情報に基づいて推定し、
前記候補選択部は、前記推定部で推定された下位概念の音声操作の候補を提示することを特徴とする請求項1記載のユーザインターフェースシステム。 - 前記推定部は、推定された複数の音声操作の候補の尤度が低い場合に、前記複数の候補の上位概念の音声操作の候補を推定結果として前記候補選択部に出力し、
前記候補選択部は、前記上位概念の音声操作の候補を提示することを特徴とする請求項1記載のユーザインターフェースシステム。 - 現在の状況に関する情報に基づいてユーザの意図する音声操作を推定する推定部と、
前記推定部で推定された複数の音声操作の候補からユーザの選択に基づき決定された1つの候補についてユーザの音声入力を促すガイダンスを生成するガイダンス生成部と、
前記ガイダンスに対するユーザの音声入力を認識する音声認識部と、
認識された音声入力に対応する機能を実行するよう指示情報を出力する機能決定部と
を備えるユーザインターフェース制御装置。 - 前記音声認識部により認識されたユーザの音声入力に対応する機能の候補が複数あるか否かを判断し、複数あると判断した場合に、前記複数の機能の候補をユーザに提示するよう前記判断結果を出力する認識判断部を更に備えることを特徴とする請求項5記載のユーザインターフェース制御装置。
- 前記音声認識部は、前記ユーザの音声入力が上位概念の言葉であるか下位概念の言葉であるかを判断し、
前記推定部は、前記ユーザの音声入力が上位概念の言葉である場合に、前記上位概念の言葉に含まれる下位概念の音声操作の候補を、現在の状況に関する情報に基づいて推定し、
前記ガイダンス生成部は、前記下位概念の音声操作の候補からユーザの選択に基づき決定された1つの候補についてガイダンスを生成することを特徴とする請求項5記載のユーザインターフェース制御装置。 - 前記推定部は、推定された複数の音声操作の候補の尤度が低い場合に、前記複数の候補の上位概念の音声操作の候補を推定結果として出力し、
前記ガイダンス生成部は、推定された前記上位概念の音声操作の候補についてユーザの音声入力を促すガイダンスを生成することを特徴とする請求項5記載のユーザインターフェース制御装置。 - 現在の状況に関する情報に基づいてユーザの意図する音声操作を推定するステップと、
前記推定ステップで推定された複数の音声操作の候補からユーザの選択に基づき決定された1つの候補についてユーザの音声入力を促すガイダンスを生成するステップと、
前記ガイダンスに対するユーザの音声入力を認識するステップと、
認識された音声入力に対応する機能を実行するよう指示情報を出力するステップと
を備えるユーザインターフェース制御方法。 - 現在の状況に関する情報に基づいてユーザの意図する音声操作を推定する推定処理と、
前記推定処理により推定された複数の音声操作の候補からユーザの選択に基づき決定された1つの候補についてユーザの音声入力を促すガイダンスを生成するガイダンス生成処理と、
前記ガイダンスに対するユーザの音声入力を認識する音声認識処理と、
認識された音声入力に対応する機能を実行するよう指示情報を出力する処理とをコンピュータに実行させるユーザインターフェース制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/002263 WO2015162638A1 (ja) | 2014-04-22 | 2014-04-22 | ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5968578B2 JP5968578B2 (ja) | 2016-08-10 |
JPWO2015162638A1 true JPWO2015162638A1 (ja) | 2017-04-13 |
Family
ID=54331839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514543A Expired - Fee Related JP5968578B2 (ja) | 2014-04-22 | 2014-04-22 | ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170010859A1 (ja) |
JP (1) | JP5968578B2 (ja) |
CN (1) | CN106233246B (ja) |
DE (1) | DE112014006614B4 (ja) |
WO (1) | WO2015162638A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6348831B2 (ja) * | 2014-12-12 | 2018-06-27 | クラリオン株式会社 | 音声入力補助装置、音声入力補助システムおよび音声入力方法 |
JP6477551B2 (ja) * | 2016-03-11 | 2019-03-06 | トヨタ自動車株式会社 | 情報提供装置及び情報提供プログラム |
US10282218B2 (en) * | 2016-06-07 | 2019-05-07 | Google Llc | Nondeterministic task initiation by a personal assistant module |
CN107277225B (zh) * | 2017-05-04 | 2020-04-24 | 北京奇虎科技有限公司 | 语音控制智能设备的方法、装置和智能设备 |
WO2019082630A1 (ja) * | 2017-10-23 | 2019-05-02 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
CN108132805B (zh) * | 2017-12-20 | 2022-01-04 | 深圳Tcl新技术有限公司 | 语音交互方法、装置及计算机可读存储介质 |
CN108520748B (zh) | 2018-02-01 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 一种智能设备功能引导方法及系统 |
CN110231863B (zh) * | 2018-03-06 | 2023-03-24 | 斑马智行网络(香港)有限公司 | 语音交互方法和车载设备 |
JP2019159883A (ja) * | 2018-03-14 | 2019-09-19 | アルパイン株式会社 | 検索システム、検索方法 |
DE102018206015A1 (de) * | 2018-04-19 | 2019-10-24 | Bayerische Motoren Werke Aktiengesellschaft | Benutzerkommunikation an Bord eines Kraftfahrzeugs |
WO2019239582A1 (ja) * | 2018-06-15 | 2019-12-19 | 三菱電機株式会社 | 機器制御装置、機器制御システム、機器制御方法、および、機器制御プログラム |
CN108881466B (zh) * | 2018-07-04 | 2020-06-26 | 百度在线网络技术(北京)有限公司 | 交互方法和装置 |
JP7103074B2 (ja) * | 2018-08-31 | 2022-07-20 | コニカミノルタ株式会社 | 画像形成装置及び操作方法 |
JP7063844B2 (ja) * | 2019-04-26 | 2022-05-09 | ファナック株式会社 | ロボット教示装置 |
JP7063843B2 (ja) * | 2019-04-26 | 2022-05-09 | ファナック株式会社 | ロボット教示装置 |
JP7388006B2 (ja) * | 2019-06-03 | 2023-11-29 | コニカミノルタ株式会社 | 画像処理装置及びプログラム |
CN112397062A (zh) * | 2019-08-15 | 2021-02-23 | 华为技术有限公司 | 语音交互方法、装置、终端及存储介质 |
DE102021106520A1 (de) * | 2021-03-17 | 2022-09-22 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Betreiben eines digitalen Assistenten eines Fahrzeugs, computerlesbares Medium, System, und Fahrzeug |
WO2023042277A1 (ja) * | 2021-09-14 | 2023-03-23 | ファナック株式会社 | 操作訓練装置、操作訓練方法、およびコンピュータ読み取り可能な記憶媒体 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3980791B2 (ja) * | 1999-05-03 | 2007-09-26 | パイオニア株式会社 | 音声認識装置を備えたマンマシンシステム |
JP3530109B2 (ja) * | 1999-05-31 | 2004-05-24 | 日本電信電話株式会社 | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 |
JP2002092029A (ja) * | 2000-09-20 | 2002-03-29 | Denso Corp | ユーザ情報推定装置 |
JP2003167895A (ja) * | 2001-11-30 | 2003-06-13 | Denso Corp | 情報検索システム、サーバおよび車載端末 |
JP4140375B2 (ja) * | 2002-12-19 | 2008-08-27 | 富士ゼロックス株式会社 | サービス検索装置、サービス検索システム及びサービス検索プログラム |
JP5044236B2 (ja) * | 2007-01-12 | 2012-10-10 | 富士フイルム株式会社 | コンテンツ検索装置、およびコンテンツ検索方法 |
DE102007036425B4 (de) * | 2007-08-02 | 2023-05-17 | Volkswagen Ag | Menügesteuertes Mehrfunktionssystem insbesondere für Fahrzeuge |
JP5638210B2 (ja) * | 2009-08-27 | 2014-12-10 | 京セラ株式会社 | 携帯電子機器 |
WO2013014709A1 (ja) * | 2011-07-27 | 2013-01-31 | 三菱電機株式会社 | ユーザインタフェース装置、車載用情報装置、情報処理方法および情報処理プログラム |
CN103207881B (zh) * | 2012-01-17 | 2016-03-02 | 阿里巴巴集团控股有限公司 | 查询方法和装置 |
-
2014
- 2014-04-22 WO PCT/JP2014/002263 patent/WO2015162638A1/ja active Application Filing
- 2014-04-22 JP JP2016514543A patent/JP5968578B2/ja not_active Expired - Fee Related
- 2014-04-22 US US15/124,303 patent/US20170010859A1/en not_active Abandoned
- 2014-04-22 DE DE112014006614.1T patent/DE112014006614B4/de not_active Expired - Fee Related
- 2014-04-22 CN CN201480078112.7A patent/CN106233246B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2015162638A1 (ja) | 2015-10-29 |
CN106233246A (zh) | 2016-12-14 |
CN106233246B (zh) | 2018-06-12 |
US20170010859A1 (en) | 2017-01-12 |
JP5968578B2 (ja) | 2016-08-10 |
DE112014006614T5 (de) | 2017-01-12 |
DE112014006614B4 (de) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5968578B2 (ja) | ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム | |
US20220301566A1 (en) | Contextual voice commands | |
JP6570651B2 (ja) | 音声対話装置および音声対話方法 | |
US10839805B2 (en) | Disambiguating input based on context | |
KR101418163B1 (ko) | 컨텍스트 정보를 이용한 음성 인식 복구 | |
JP5158174B2 (ja) | 音声認識装置 | |
EP2518447A1 (en) | System and method for fixing user input mistakes in an in-vehicle electronic device | |
JP6966979B2 (ja) | 対話システムの制御方法、対話システム及びプログラム | |
JP2011203349A (ja) | 音声認識システム及び自動検索システム | |
JP2003032388A (ja) | 通信端末装置及び処理システム | |
JP2020129130A (ja) | 情報処理装置 | |
AU2020264367B2 (en) | Contextual voice commands | |
JP5446540B2 (ja) | 情報検索装置、制御方法及びプログラム | |
JPWO2019058453A1 (ja) | 音声対話制御装置および音声対話制御方法 | |
EP3035207A1 (en) | Speech translation device | |
JP2018194849A (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160530 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5968578 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |