JP6440513B2 - 音声認識機能を用いた情報提供方法および機器の制御方法 - Google Patents
音声認識機能を用いた情報提供方法および機器の制御方法 Download PDFInfo
- Publication number
- JP6440513B2 JP6440513B2 JP2015018416A JP2015018416A JP6440513B2 JP 6440513 B2 JP6440513 B2 JP 6440513B2 JP 2015018416 A JP2015018416 A JP 2015018416A JP 2015018416 A JP2015018416 A JP 2015018416A JP 6440513 B2 JP6440513 B2 JP 6440513B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- instruction
- information
- display
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 276
- 230000006854 communication Effects 0.000 claims description 63
- 238000004891 communication Methods 0.000 claims description 60
- 238000004590 computer program Methods 0.000 claims description 14
- 241001465754 Metazoa Species 0.000 claims description 8
- 230000008569 process Effects 0.000 description 186
- 238000001514 detection method Methods 0.000 description 116
- 238000012545 processing Methods 0.000 description 100
- 230000004044 response Effects 0.000 description 78
- 230000005236 sound signal Effects 0.000 description 23
- 230000006870 function Effects 0.000 description 21
- 230000005540 biological transmission Effects 0.000 description 20
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 230000008054 signal transmission Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
- H04N21/4826—End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明の基礎となった知見は以下のとおりである。
図1は、本実施の形態における情報提供システムが表示機器に対して実行する情報提供方法の概要を示すシーケンス図である。本実施の形態における情報提供システムは、ディスプレイを有する表示機器とユーザの音声を入力可能な音声入力機器とに接続される。ここで「接続される」とは、電気信号の送受信ができるように電気的に接続されることを意味する。「接続」は、有線に限らず無線でもよい。2つの機器の間に他の機器(例えば、スイッチングハブ、ルータ、パーソナルコンピュータ(PC)等)が接続され、それらを介して電気信号の送受信が行われ得る状態も、2つの機器が接続されている状態に該当する。
図10は、本実施の形態における情報提供システムが表示機器に対して実行する制御方法の概要を示すシーケンス図である。本実施の形態における情報提供システムは、表示機器も音声認識機能を備えている点で実施の形態1とは異なる。以下、実施の形態1と異なる点を中心に説明し、重複する事項については説明を省略することがある。
102 音声認識部
103 指示文字列検出部
104 対話管理部
105 応答文生成部
106 音声合成部
107 制御信号生成部
108 入力装置
109 選択状態検出部
110 選択状態管理部
111 選択情報検出部
112 出力回路
113a、113b 通信回路
114a、114b 制御回路
115 命令文字列検出部
120 サーバ
121 クライアント
601 入力装置による人物指定の例
602 人物指定による個人認証結果の例
701 地図における場所を指定する例
702 地図における場所が指定された表示例
901 番組一覧の表示例
902 リモートコントローラ
903 番組一覧から番組を選択した例
904 リモコンと音声認識で番組内容の表示を行った例
1000 従来の番組情報提示装置
1001 マイクロフォン
1002 音声認識部
1003 指示文字列検出部
1004 音声合成部
1005 制御信号生成部
1006 入力装置
1007 出力部
Claims (17)
- ユーザの音声を入力可能な音声入力装置に接続され、ディスプレイを有する表示機器の制御方法であって、
前記表示機器のコンピュータに、
選択可能な複数の項目を含む表示画面を前記ディスプレイに表示させ、
前記ディスプレイの前記表示画面において、前記複数の項目の中の一の項目が選択されたことを検知させ、
前記一の項目が選択されたことが検知されていないときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記音声指示を他のコンピュータへ送信させ、
前記一の項目が選択されたことが検知されているときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記第1音声情報から前記指示内容を認識させて前記音声指示が実行可能であるか否かを判断させ、
前記指示内容が実行可能であると判断されたとき、前記指示内容を実行させ、前記指示内容が実行できないと判断されたとき、前記音声指示を他のコンピュータへ送信させる、
制御方法。 - 前記表示機器の前記コンピュータに、さらに、
前記音声指示に指示語を示す第2音声情報が含まれているか否かを判断させ、
前記一の項目が選択されたことが検知され、前記第1音声情報から前記指示内容が認識され、かつ、前記音声指示に前記第2音声情報が含まれていると判断された場合、前記指示内容を実行させ、
前記音声指示に前記第2音声情報が含まれていると判断されなかった場合、前記音声指示を前記他のコンピュータへ送信させる、
請求項1に記載の制御方法。 - 前記指示内容は、前記一の項目に関連する情報を検索する指示であり、前記指示内容に基づく検索結果をユーザへ通知させる、請求項1または2に記載の制御方法。
- 前記表示機器はネットワークを介してサーバと接続され、前記一の項目に関連する情報を、前記サーバ内のデータベースを参照して検索させる、請求項3に記載の制御方法。
- 前記検索結果を前記ディスプレイに表示させる、請求項3に記載の制御方法。
- 前記音声入力装置は、前記表示機器に含まれる、請求項1に記載の制御方法。
- 前記表示機器はさらに、音声を出力可能な音声出力装置と接続され、前記検索結果を前記音声出力装置からの音声として出力させる検索結果情報を、前記音声出力装置に送信させる、請求項3に記載の制御方法。
- 前記音声出力装置は、前記表示機器に含まれる、請求項7に記載の制御方法。
- 前記複数の項目の各々は、テレビ番組に関するメタデータまたはテレビ番組のコンテンツを示す項目である、請求項1に記載の制御方法。
- 前記メタデータは、テレビ番組名、チャンネル名、前記テレビ番組の概容、前記テレビ番組の注目度、および前記テレビ番組のおすすめ度の少なくとも1つを示す、請求項9に記載の制御方法。
- 前記テレビ番組のコンテンツは、人物、動物、車、地図、文字、数字の少なくとも1つを示す情報を含む、請求項9に記載の制御方法。
- 前記表示画面は特定地域における地図を表し、前記複数の項目の各々は前記地図上の任意の座標、または前記地図上のオブジェクトである、請求項1に記載の制御方法。
- 前記オブジェクトは、前記地図上の建造物を示す、請求項12に記載の制御方法。
- 前記オブジェクトは、前記地図上の道路を示す、請求項12に記載の制御方法。
- 前記オブジェクトは、前記地図上の地名を示す、請求項12に記載の制御方法。
- ユーザの音声を入力可能な音声入力装置に接続され、ディスプレイを有する表示機器に実行させるコンピュータプログラムであって、
前記コンピュータプログラムは前記表示機器のコンピュータに、
選択可能な複数の項目を含む表示画面を前記ディスプレイに表示させ、
前記ディスプレイの前記表示画面において、前記複数の項目の中の一の項目が選択されたことを検知させ、
前記一の項目が選択されたことが検知されていないときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記音声指示を他のコンピュータへ送信させ、
前記一の項目が選択されたことが検知されているときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記第1音声情報から前記指示内容を認識させて前記音声指示が実行可能であるか否かを判断させ、
前記指示内容が実行可能であると判断されたとき、前記指示内容を実行させ、前記指示内容が実行できないと判断されたとき、前記音声指示を他のコンピュータへ送信させる、
コンピュータプログラム。 - ユーザの音声を入力可能な音声入力装置に接続された表示機器であって、
ディスプレイと、
制御回路と、
通信回路と、
を備え、
前記制御回路は、
選択可能な複数の項目を含む表示画面を前記ディスプレイに表示させ、
前記ディスプレイの前記表示画面において、前記複数の項目の中の一の項目が選択されたことを検知し、
前記一の項目が選択されたことを検知していないときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記音声指示を他のコンピュータに送信するように前記通信回路に指示し、
前記一の項目が選択されたことを検知しているときに、前記音声入力装置から指示内容を表す第1音声情報を含む音声指示が受信された場合、前記第1音声情報から前記指示内容を認識して前記音声指示が実行可能であるか否かを判断し、
前記指示内容が実行可能であると判断したとき、前記指示内容を実行し、前記指示内容が実行できないと判断したとき、前記音声指示を他のコンピュータへ送信するように前記通信回路に指示する、
表示機器。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015018416A JP6440513B2 (ja) | 2014-05-13 | 2015-02-02 | 音声認識機能を用いた情報提供方法および機器の制御方法 |
EP15165890.3A EP2945157A3 (en) | 2014-05-13 | 2015-04-30 | Information provision method using voice recognition function and control method for device |
US14/701,538 US20150331665A1 (en) | 2014-05-13 | 2015-05-01 | Information provision method using voice recognition function and control method for device |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014099550 | 2014-05-13 | ||
JP2014099550 | 2014-05-13 | ||
JP2014100223 | 2014-05-14 | ||
JP2014100223 | 2014-05-14 | ||
JP2015018416A JP6440513B2 (ja) | 2014-05-13 | 2015-02-02 | 音声認識機能を用いた情報提供方法および機器の制御方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018216166A Division JP6670364B2 (ja) | 2014-05-13 | 2018-11-19 | 音声認識機能を用いた情報提供方法および機器の制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015232868A JP2015232868A (ja) | 2015-12-24 |
JP6440513B2 true JP6440513B2 (ja) | 2018-12-19 |
Family
ID=53274361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015018416A Active JP6440513B2 (ja) | 2014-05-13 | 2015-02-02 | 音声認識機能を用いた情報提供方法および機器の制御方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20150331665A1 (ja) |
EP (1) | EP2945157A3 (ja) |
JP (1) | JP6440513B2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10170114B2 (en) | 2013-05-30 | 2019-01-01 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
KR102298767B1 (ko) * | 2014-11-17 | 2021-09-06 | 삼성전자주식회사 | 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법 |
CN106157955A (zh) | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种语音控制方法及装置 |
EP3392740A4 (en) * | 2015-12-18 | 2018-12-19 | Sony Corporation | Information processing device, information processing method, and program |
KR20180101926A (ko) * | 2017-03-06 | 2018-09-14 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 어플리케이션 제어 방법 |
DE102017105689A1 (de) * | 2017-03-16 | 2018-09-20 | Knorr-Bremse Systeme für Nutzfahrzeuge GmbH | Drehschalter zum Steuern einer, insbesondere elektronischen, Parkbremsvorrichtung eines Fahrzeugs |
CN117215514A (zh) * | 2017-10-03 | 2023-12-12 | 谷歌有限责任公司 | 具有延迟考虑的显示模式相关响应生成 |
WO2019094895A1 (en) * | 2017-11-13 | 2019-05-16 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
JP7080038B2 (ja) * | 2017-11-20 | 2022-06-03 | キヤノン株式会社 | 音声制御システム、制御方法及びプログラム |
KR102532300B1 (ko) | 2017-12-22 | 2023-05-15 | 삼성전자주식회사 | 어플리케이션 실행 방법 및 이를 위한 장치 |
CN108376067A (zh) * | 2018-03-08 | 2018-08-07 | 腾讯科技(深圳)有限公司 | 一种应用操作方法及其设备、存储介质、终端 |
CN108683937B (zh) * | 2018-03-09 | 2020-01-21 | 百度在线网络技术(北京)有限公司 | 智能电视的语音交互反馈方法、系统及计算机可读介质 |
JP7010073B2 (ja) * | 2018-03-12 | 2022-01-26 | 株式会社Jvcケンウッド | 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム |
US11289070B2 (en) * | 2018-03-23 | 2022-03-29 | Rankin Labs, Llc | System and method for identifying a speaker's community of origin from a sound sample |
JP7114307B2 (ja) * | 2018-04-12 | 2022-08-08 | 株式会社Nttドコモ | 情報処理装置 |
CN108769745A (zh) * | 2018-06-29 | 2018-11-06 | 百度在线网络技术(北京)有限公司 | 视频播放方法和装置 |
US11341985B2 (en) | 2018-07-10 | 2022-05-24 | Rankin Labs, Llc | System and method for indexing sound fragments containing speech |
WO2020024227A1 (zh) * | 2018-08-02 | 2020-02-06 | 深圳迈瑞生物医疗电子股份有限公司 | 一种细胞分析方法、细胞分析装置及存储介质 |
CN109493862B (zh) * | 2018-12-24 | 2021-11-09 | 深圳Tcl新技术有限公司 | 终端、语音服务器的确定方法和计算机可读存储介质 |
US10990939B2 (en) * | 2019-04-15 | 2021-04-27 | Advanced New Technologies Co., Ltd. | Method and device for voice broadcast |
CN110575040B (zh) * | 2019-09-09 | 2021-08-20 | 珠海格力电器股份有限公司 | 智能窗帘的控制方法、控制终端和智能窗帘控制系统 |
CN112788375B (zh) * | 2019-11-04 | 2023-04-25 | 海信视像科技股份有限公司 | 显示设备、显示方法及计算设备 |
JP7442331B2 (ja) | 2020-02-05 | 2024-03-04 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
JP7442330B2 (ja) * | 2020-02-05 | 2024-03-04 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
WO2021183421A2 (en) | 2020-03-09 | 2021-09-16 | John Rankin | Systems and methods for morpheme reflective engagement response |
CN115334342A (zh) * | 2021-04-22 | 2022-11-11 | Vidaa(荷兰)国际控股有限公司 | 显示设备以及语音拾取方法 |
CN117827139A (zh) * | 2022-09-29 | 2024-04-05 | 华为技术有限公司 | 人机交互的方法、电子设备及系统 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5386494A (en) * | 1991-12-06 | 1995-01-31 | Apple Computer, Inc. | Method and apparatus for controlling a speech recognition function using a cursor control device |
US6543052B1 (en) * | 1999-07-09 | 2003-04-01 | Fujitsu Limited | Internet shopping system utilizing set top box and voice recognition |
US20030093419A1 (en) * | 2001-08-17 | 2003-05-15 | Srinivas Bangalore | System and method for querying information using a flexible multi-modal interface |
JP3997459B2 (ja) * | 2001-10-02 | 2007-10-24 | 株式会社日立製作所 | 音声入力システムおよび音声ポータルサーバおよび音声入力端末 |
JP4175141B2 (ja) | 2003-02-26 | 2008-11-05 | 松下電器産業株式会社 | 音声認識機能を有する番組情報表示装置 |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
JP4273354B2 (ja) * | 2006-10-18 | 2009-06-03 | 船井電機株式会社 | ディジタルテレビジョン受信機 |
US8219406B2 (en) * | 2007-03-15 | 2012-07-10 | Microsoft Corporation | Speech-centric multimodal user interface design in mobile technology |
US20090113475A1 (en) * | 2007-08-21 | 2009-04-30 | Yi Li | Systems and methods for integrating search capability in interactive video |
US8958848B2 (en) * | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US8589161B2 (en) * | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9571784B2 (en) * | 2009-10-30 | 2017-02-14 | Verizon Patent And Licensing Inc. | Media content watch list systems and methods |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
JP5316453B2 (ja) * | 2010-03-24 | 2013-10-16 | ブラザー工業株式会社 | ヘッドマウントディスプレイおよびプログラム |
JP5658641B2 (ja) * | 2011-09-15 | 2015-01-28 | 株式会社Nttドコモ | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
WO2013170383A1 (en) * | 2012-05-16 | 2013-11-21 | Xtreme Interactions Inc. | System, device and method for processing interlaced multimodal user input |
KR101330671B1 (ko) * | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
US20140180874A1 (en) * | 2012-12-21 | 2014-06-26 | Lucy Ma Zhao | Local product comparison system |
US9792014B2 (en) * | 2013-03-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | In-place contextual menu for handling actions for a listing of items |
US20150046294A1 (en) * | 2013-08-09 | 2015-02-12 | Samsung Electronics Co., Ltd. | Display apparatus, the method thereof and item providing method |
KR20150018127A (ko) * | 2013-08-09 | 2015-02-23 | 삼성전자주식회사 | 디스플레이 장치 및 그 방법 |
KR20150020756A (ko) * | 2013-08-19 | 2015-02-27 | 삼성전자주식회사 | 디스플레이 장치, 그 방법 및 아이템 제공 방법 |
CN105659179B (zh) * | 2013-08-21 | 2018-07-17 | 霍尼韦尔国际公司 | 用于与hvac控制器相交互的设备和方法 |
US20150261494A1 (en) * | 2014-03-14 | 2015-09-17 | Google Inc. | Systems and methods for combining selection with targeted voice activation |
-
2015
- 2015-02-02 JP JP2015018416A patent/JP6440513B2/ja active Active
- 2015-04-30 EP EP15165890.3A patent/EP2945157A3/en not_active Withdrawn
- 2015-05-01 US US14/701,538 patent/US20150331665A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2945157A3 (en) | 2015-12-09 |
JP2015232868A (ja) | 2015-12-24 |
EP2945157A2 (en) | 2015-11-18 |
US20150331665A1 (en) | 2015-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6440513B2 (ja) | 音声認識機能を用いた情報提供方法および機器の制御方法 | |
KR102429436B1 (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
US20210311975A1 (en) | Language agnostic command-understanding digital assistant | |
CN110058834B (zh) | 智能设备仲裁和控制 | |
KR102490776B1 (ko) | 디지털 개인 비서 내에서 헤드리스로 작업을 완료하기 위한 기법 | |
JP6375521B2 (ja) | 音声検索装置、音声検索方法、および表示装置 | |
US10860289B2 (en) | Flexible voice-based information retrieval system for virtual assistant | |
JP2020527753A (ja) | ビューに基づく音声インタラクション方法、装置、サーバ、端末及び媒体 | |
KR102115926B1 (ko) | 애플리케이션의 음성 제어 시스템 및 애플리케이션의 음성 제어 방법 | |
KR20180046208A (ko) | 음성 명령에 기초하여 애플리케이션을 실행하는 방법 및 장치 | |
US20140365215A1 (en) | Method for providing service based on multimodal input and electronic device thereof | |
KR20190019401A (ko) | 전자 장치 및 그 제어 방법 | |
KR20130082339A (ko) | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 | |
WO2020079941A1 (ja) | 情報処理装置及び情報処理方法、並びにコンピュータプログラム | |
JP2009205579A (ja) | 音声翻訳装置およびプログラム | |
JP6154489B2 (ja) | ユーザのデータ入力に応じて情報提供を行うための端末装置、プログラム、およびサーバ装置 | |
EP3916723B1 (en) | Devices for providing search results in response to user utterances | |
KR20210036527A (ko) | 사용자 발화를 처리하는 전자 장치 및 그 작동 방법 | |
KR20200106703A (ko) | 사용자 선택 기반의 정보를 제공하는 방법 및 장치 | |
TW201512968A (zh) | 以語音辨識來發生事件裝置及方法 | |
JP6670364B2 (ja) | 音声認識機能を用いた情報提供方法および機器の制御方法 | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
WO2017199486A1 (ja) | 情報処理装置 | |
JP2021531923A (ja) | ネットワークアプリケーションを制御するためのシステムおよびデバイス | |
CN207946726U (zh) | 一种基于语音识别的一体机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6440513 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |