JP2020003925A - 対話システムの制御方法、対話システム及びプログラム - Google Patents
対話システムの制御方法、対話システム及びプログラム Download PDFInfo
- Publication number
- JP2020003925A JP2020003925A JP2018120888A JP2018120888A JP2020003925A JP 2020003925 A JP2020003925 A JP 2020003925A JP 2018120888 A JP2018120888 A JP 2018120888A JP 2018120888 A JP2018120888 A JP 2018120888A JP 2020003925 A JP2020003925 A JP 2020003925A
- Authority
- JP
- Japan
- Prior art keywords
- mode
- touch panel
- information
- voice
- interactive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims description 42
- 230000002452 interceptive effect Effects 0.000 claims description 63
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 235000021438 curry Nutrition 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 235000013305 food Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/1633—Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
- G06F1/1637—Details related to the display arrangement, including those related to the mounting of the display in the housing
- G06F1/1643—Details related to the display arrangement, including those related to the mounting of the display in the housing the display being associated to a digitizer, e.g. laptops that can be used as penpads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/1633—Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
- G06F1/1684—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
- G06F1/1686—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675 the I/O peripheral being an integrated camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/1633—Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
- G06F1/1684—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
- G06F1/1694—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675 the I/O peripheral being a single or a set of motion sensors for pointer control or gesture input obtained by sensing movements of the portable computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/0304—Detection arrangements using opto-electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04886—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Computing Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
図2は、制御装置100の一例を示す図である。制御装置100は、プロセッサ1と、メモリ2と、ストレージ装置3と、タッチパネル4と、音声入力装置5と、音声出力装置6と、ネットワークI/F7と、画像入力装置8と、センサ9と、を含む計算機で構成される。
次に、各機能部の概要について説明する。音声情報取得部20は、音声入力装置5に利用者200の発話(音声)が入力されると、音声認識を実行して音声に対応するテキストを出力する。音声認識は、例えば、隠れマルコフモデルなど周知または公知の技術を用いれば良い。音声認識データベース31は、例えば、音響モデルと、辞書と、言語モデルなど音声認識に必要な情報が予め格納されている。
以下、制御部21が利用するデータについて説明する。まず、制御部21が利用する表示及び発話情報データベース32には、シナリオ300と、店舗テーブル400が含まれる。
図3は、制御装置100で行われる対話処理の一例を示すフローチャートである。この処理は、制御部21が、センサ情報取得部23や画像情報取得部22からの情報に基づいて、新たな利用者200が出現したときに実行される。
以下に、上記処理によってタッチパネル4に表示される画面の一例について説明する。図6Aは、タッチパネル4の初期画面500の一例を示す図である。初期画面500は、施設の案内役としてのアバター(またはキャラクタ)600が画面の左下に表示される。吹き出し502には、アバター600からのメッセージが表示される。
図7A〜図7Cは、本実施例の変形例を示し、上記実施例のシナリオ300による対話に代わって、自然言語によるランダムな対話で施設の案内を実施する例を示す。
なお、上記実施例では、制御装置100に、音声情報取得部20や画像情報取得部22及びセンサ情報取得部23を含む例を示したが、これらの音声認識や画像認識あるいはセンサ情報の判定処理は、ネットワーク(図示省略)を介して接続された他の計算機で実行してもよい。
2 メモリ
3 ストレージ装置
4 タッチパネル
5 音声入力装置
6 音声出力装置
8 画像入力装置
9 センサ
20 音声情報取得部
21 制御部
22 画像情報取得部
23 センサ情報取得部
31 音声認識データベース
32 表示及び発話情報データベース
33 環境及びユーザ使用状況テーブル
Claims (10)
- プロセッサと、メモリと、音声入力装置と、音声出力装置と、タッチ入力が可能な表示部を含むタッチパネルを有する対話システムの制御方法であって、
前記プロセッサが、1以上の選択肢を含む問い合わせ情報を生成して、前記音声出力装置または前記タッチパネルから出力する問い合わせステップと、
前記プロセッサが、前記音声入力装置または前記タッチパネルから前記問い合わせ情報に対する回答を受け付ける入力ステップと、
前記プロセッサが、前記回答に対応する案内情報の候補を生成して、前記音声出力装置または前記タッチパネルから出力する案内ステップと、
前記プロセッサが、前記問い合わせ情報に基づいて、前記タッチ入力を受け付ける領域である選択肢を前記タッチパネルに出力する第1の対話モードと、前記問い合わせ情報に基づくコメントを前記タッチパネル、或いは前記音声出力装置で出力する第2の対話モードを、当該対話システムの運用状況に応じて選択するモード切替ステップと、
を含み、
前記問い合わせステップ及び前記案内ステップは、
前記モード切替ステップで選択された第1の対話モードまたは第2の対話モードを使用することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
前記案内情報の候補の数であって、
前記モード切替ステップは、
前記案内情報の候補の数が所定の第1の閾値以下の場合には前記第1の対話モードを選択し、前記案内情報の候補の数が前記第1の閾値を超える場合には前記第2の対話モードを選択することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
前記音声入力装置が検出した騒音の値であって、
前記モード切替ステップは、
前記騒音の値が所定の第2の閾値以下の場合には前記第2の対話モードを選択し、前記騒音の値が前記第2の閾値を超える場合には前記第1の対話モードを選択することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
前回選択された対話モードであって、
前記モード切替ステップは、
前記前回選択された第1の対話モードまたは第2の対話モードを維持することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
前記音声入力装置が受け付けた音声を音声認識した結果に基づく音声認識精度であって、
前記モード切替ステップは、
前記音声認識精度が、所定の第3の閾値以下の場合には前記第1の対話モードを選択し、前記音声認識精度が前記第3の閾値を超える場合には前記第2の対話モードを選択することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
当該対話システムを使用する利用者の状況をセンサで検出したセンサ情報であって、
前記モード切替ステップは、
前記センサ情報に基づいて、前記第1の対話モードと前記第2の対話モードのいずれかを選択することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記対話システムの運用状況は、
前記問い合わせ情報を生成するシナリオの実行状況であって、
前記モード切替ステップは、
前記シナリオに設定された対話モードに基づいて、前記第1の対話モードと前記第2の対話モードのいずれかを選択することを特徴とする対話システムの制御方法。 - 請求項1に記載の対話システムの制御方法であって、
前記音声入力装置が受け付けた音声を音声認識した結果を前記タッチパネルに表示することを特徴とする対話システムの制御方法。 - プロセッサと、メモリと、音声入力装置と、音声出力装置と、タッチ入力が可能な表示部を含むタッチパネルを有する対話システムであって、
1以上の選択肢を含む問い合わせ情報を生成して、前記音声出力装置または前記タッチパネルから出力する問い合わせ部と、
前記音声入力装置または前記タッチパネルから前記問い合わせ情報に対する回答を受け付ける入力部と、
前記回答に対応する案内情報の候補を生成して、前記音声出力装置または前記タッチパネルから出力する案内部と、
前記問い合わせ情報に基づいて、前記タッチ入力を受け付ける領域である選択肢を前記タッチパネルに出力する第1の対話モードと、前記問い合わせ情報に基づくコメントを前記タッチパネル、或いは前記音声出力装置で出力する第2の対話モードを、当該対話システムの運用状況に応じて選択するモード切替部と、
を有し、
前記問い合わせ部及び前記案内部は、
前記モード切替部で選択された第1の対話モードまたは第2の対話モードを使用することを特徴とする対話システム。 - プロセッサと、メモリと、音声入力装置と、音声出力装置と、タッチ入力が可能な表示部を含むタッチパネルを有する計算機を制御させるためのプログラムであって、
1以上の選択肢を含む問い合わせ情報を生成して、前記音声出力装置または前記タッチパネルから出力する問い合わせステップと、
前記音声入力装置または前記タッチパネルから前記問い合わせ情報に対する回答を受け付ける入力ステップと、
前記回答に対応する案内情報の候補を生成して、前記音声出力装置または前記タッチパネルから出力する案内ステップと、
前記問い合わせ情報に基づいて、前記タッチ入力を受け付ける領域である選択肢を前記タッチパネルに出力する第1の対話モードと、前記問い合わせ情報に基づくコメントを前記タッチパネル、或いは前記音声出力装置で出力する第2の対話モードを、当該計算機の運用状況に応じて選択するモード切替ステップと、
を前記計算機に実行させ、
前記問い合わせステップ及び前記案内ステップは、
前記モード切替ステップで選択された第1の対話モードまたは第2の対話モードを使用することを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018120888A JP6966979B2 (ja) | 2018-06-26 | 2018-06-26 | 対話システムの制御方法、対話システム及びプログラム |
EP19163997.0A EP3588493B1 (en) | 2018-06-26 | 2019-03-20 | Method of controlling dialogue system, dialogue system, and storage medium |
US16/360,048 US11068288B2 (en) | 2018-06-26 | 2019-03-21 | Method of controlling communication system including mode switching between modes for receiving a touch input or an audio input, communication system, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018120888A JP6966979B2 (ja) | 2018-06-26 | 2018-06-26 | 対話システムの制御方法、対話システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020003925A true JP2020003925A (ja) | 2020-01-09 |
JP6966979B2 JP6966979B2 (ja) | 2021-11-17 |
Family
ID=65904074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018120888A Active JP6966979B2 (ja) | 2018-06-26 | 2018-06-26 | 対話システムの制御方法、対話システム及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11068288B2 (ja) |
EP (1) | EP3588493B1 (ja) |
JP (1) | JP6966979B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021103580A (ja) * | 2020-05-25 | 2021-07-15 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | スマートバックミラーのインタラクション方法、装置、電子機器及び記憶媒体 |
CN114327731A (zh) * | 2021-12-31 | 2022-04-12 | 北京字跳网络技术有限公司 | 信息显示方法、装置、设备及介质 |
WO2022097569A1 (ja) * | 2020-11-09 | 2022-05-12 | 富士フイルム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2022254670A1 (ja) * | 2021-06-03 | 2022-12-08 | 日産自動車株式会社 | 表示制御装置及び表示制御方法 |
JP7371843B1 (ja) | 2023-01-31 | 2023-10-31 | 株式会社ティファナ ドットコム | 遺失物管理システム、及びプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7339124B2 (ja) * | 2019-02-26 | 2023-09-05 | 株式会社Preferred Networks | 制御装置、システム及び制御方法 |
US11694682B1 (en) * | 2019-12-11 | 2023-07-04 | Amazon Technologies, Inc. | Triggering voice control disambiguation |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991112A (ja) * | 1995-07-19 | 1997-04-04 | Toshiba Corp | マルチモーダル対話装置及び対話方法 |
JP2004054080A (ja) * | 2002-07-23 | 2004-02-19 | Omron Corp | データ入力方法およびデータ入力装置 |
US20040236574A1 (en) * | 2003-05-20 | 2004-11-25 | International Business Machines Corporation | Method of enhancing voice interactions using visual messages |
JP2006188098A (ja) * | 2004-12-28 | 2006-07-20 | Pioneer Electronic Corp | 対話装置、対話方法、対話プログラムおよびコンピュータに読み取り可能な記録媒体 |
JP2011002534A (ja) * | 2009-06-17 | 2011-01-06 | Brother Industries Ltd | 音声認識装置 |
JP2013211057A (ja) * | 2013-06-19 | 2013-10-10 | Omron Corp | 制御装置および方法、並びにプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3267047B2 (ja) * | 1994-04-25 | 2002-03-18 | 株式会社日立製作所 | 音声による情報処理装置 |
JPH1124813A (ja) * | 1997-07-03 | 1999-01-29 | Fujitsu Ltd | マルチモーダル入力統合システム |
WO2002033541A2 (en) * | 2000-10-16 | 2002-04-25 | Tangis Corporation | Dynamically determining appropriate computer interfaces |
EP1614102A4 (en) * | 2002-12-10 | 2006-12-20 | Kirusa Inc | VOICE ENTRY DESAMBIGUATION TECHNIQUES BASED ON THE USE OF MULTIMODAL INTERFACES |
JP2010026686A (ja) | 2008-07-17 | 2010-02-04 | Life Interface:Kk | 統合的インタフェースを有する対話型コミュニケーション端末及びそれを用いたコミュニケーションシステム |
US20140369527A1 (en) * | 2011-09-22 | 2014-12-18 | Earsoft Limited | Dynamic range control |
US9173074B2 (en) * | 2012-05-27 | 2015-10-27 | Qualcomm Incorporated | Personal hub presence and response |
EP3809407A1 (en) * | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US20170206064A1 (en) * | 2013-03-15 | 2017-07-20 | JIBO, Inc. | Persistent companion device configuration and deployment platform |
US20150314454A1 (en) * | 2013-03-15 | 2015-11-05 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
US8896561B1 (en) * | 2013-03-27 | 2014-11-25 | Keysight Technologies, Inc. | Method for making precise gestures with touch devices |
KR101623856B1 (ko) * | 2014-10-17 | 2016-05-24 | 현대자동차주식회사 | 에이브이엔 장치, 차량, 및 에이브이엔 장치의 제어방법 |
GB2533795A (en) * | 2014-12-30 | 2016-07-06 | Nokia Technologies Oy | Method, apparatus and computer program product for input detection |
JP2018120888A (ja) | 2017-01-23 | 2018-08-02 | キヤノン株式会社 | 半導体装置及び基板 |
US10558426B2 (en) * | 2017-12-08 | 2020-02-11 | Google Llc | Graphical user interface rendering management by voice-driven computing infrastructure |
-
2018
- 2018-06-26 JP JP2018120888A patent/JP6966979B2/ja active Active
-
2019
- 2019-03-20 EP EP19163997.0A patent/EP3588493B1/en active Active
- 2019-03-21 US US16/360,048 patent/US11068288B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991112A (ja) * | 1995-07-19 | 1997-04-04 | Toshiba Corp | マルチモーダル対話装置及び対話方法 |
JP2004054080A (ja) * | 2002-07-23 | 2004-02-19 | Omron Corp | データ入力方法およびデータ入力装置 |
US20040236574A1 (en) * | 2003-05-20 | 2004-11-25 | International Business Machines Corporation | Method of enhancing voice interactions using visual messages |
JP2006188098A (ja) * | 2004-12-28 | 2006-07-20 | Pioneer Electronic Corp | 対話装置、対話方法、対話プログラムおよびコンピュータに読み取り可能な記録媒体 |
JP2011002534A (ja) * | 2009-06-17 | 2011-01-06 | Brother Industries Ltd | 音声認識装置 |
JP2013211057A (ja) * | 2013-06-19 | 2013-10-10 | Omron Corp | 制御装置および方法、並びにプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021103580A (ja) * | 2020-05-25 | 2021-07-15 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッドBeijing Baidu Netcom Science Technology Co., Ltd. | スマートバックミラーのインタラクション方法、装置、電子機器及び記憶媒体 |
JP7204804B2 (ja) | 2020-05-25 | 2023-01-16 | 阿波▲羅▼智▲聯▼(北京)科技有限公司 | スマートバックミラーのインタラクション方法、装置、電子機器及び記憶媒体 |
WO2022097569A1 (ja) * | 2020-11-09 | 2022-05-12 | 富士フイルム株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2022254670A1 (ja) * | 2021-06-03 | 2022-12-08 | 日産自動車株式会社 | 表示制御装置及び表示制御方法 |
CN114327731A (zh) * | 2021-12-31 | 2022-04-12 | 北京字跳网络技术有限公司 | 信息显示方法、装置、设备及介质 |
CN114327731B (zh) * | 2021-12-31 | 2023-11-14 | 北京字跳网络技术有限公司 | 信息显示方法、装置、设备及介质 |
JP7371843B1 (ja) | 2023-01-31 | 2023-10-31 | 株式会社ティファナ ドットコム | 遺失物管理システム、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6966979B2 (ja) | 2021-11-17 |
US11068288B2 (en) | 2021-07-20 |
EP3588493A1 (en) | 2020-01-01 |
EP3588493B1 (en) | 2023-01-18 |
US20190391828A1 (en) | 2019-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6966979B2 (ja) | 対話システムの制御方法、対話システム及びプログラム | |
US20220301566A1 (en) | Contextual voice commands | |
KR102596446B1 (ko) | 모바일 디바이스들에서의 모달리티 학습 | |
KR101703911B1 (ko) | 인식된 음성 개시 액션에 대한 시각적 확인 | |
KR102036786B1 (ko) | 제안되는 보이스 기반의 액션 쿼리들을 제공 | |
US9002698B2 (en) | Speech translation apparatus, method and program | |
JP6983118B2 (ja) | 対話システムの制御方法、対話システム及びプログラム | |
US10811005B2 (en) | Adapting voice input processing based on voice input characteristics | |
EP3584787A1 (en) | Headless task completion within digital personal assistants | |
US9552080B2 (en) | Incremental feature-based gesture-keyboard decoding | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
JP6178198B2 (ja) | 音声翻訳システム、方法およびプログラム | |
US20170357521A1 (en) | Virtual keyboard with intent-based, dynamically generated task icons | |
US10860289B2 (en) | Flexible voice-based information retrieval system for virtual assistant | |
US20170010859A1 (en) | User interface system, user interface control device, user interface control method, and user interface control program | |
US9583105B2 (en) | Modification of visual content to facilitate improved speech recognition | |
US20160092104A1 (en) | Methods, systems and devices for interacting with a computing device | |
JP6950708B2 (ja) | 情報処理装置、情報処理方法、および情報処理システム | |
JPWO2020017151A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPWO2019103007A1 (ja) | 情報処理装置及び情報処理方法 | |
WO2016136208A1 (ja) | 音声対話装置、音声対話システム、および、音声対話装置の制御方法 | |
JP2017182395A (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
KR101766301B1 (ko) | 전자기기에서 문자 입력 방법 및 장치 | |
KR20180025265A (ko) | 휴대 단말기 및 그 휴대 단말기에서 문자입력 방법 | |
JP2001043225A (ja) | データ変更型言語処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210601 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211022 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6966979 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |