JP6360484B2 - 音声対話制御方法 - Google Patents
音声対話制御方法 Download PDFInfo
- Publication number
- JP6360484B2 JP6360484B2 JP2015535302A JP2015535302A JP6360484B2 JP 6360484 B2 JP6360484 B2 JP 6360484B2 JP 2015535302 A JP2015535302 A JP 2015535302A JP 2015535302 A JP2015535302 A JP 2015535302A JP 6360484 B2 JP6360484 B2 JP 6360484B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- information
- instruction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 118
- 230000008569 process Effects 0.000 claims description 87
- 230000003993 interaction Effects 0.000 claims description 67
- 230000007935 neutral effect Effects 0.000 claims description 22
- 238000007726 management method Methods 0.000 description 119
- 238000012545 processing Methods 0.000 description 94
- 238000004891 communication Methods 0.000 description 80
- 238000010586 diagram Methods 0.000 description 63
- 230000004044 response Effects 0.000 description 56
- 230000006870 function Effects 0.000 description 29
- 230000002452 interceptive effect Effects 0.000 description 21
- 238000004590 computer program Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 238000007405 data analysis Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00352—Input means
- H04N1/00403—Voice input means, e.g. voice commands
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Description
前記音声入力装置から前記音声対話システムに対する第1指示内容を表す第1指示情報を受信し、
前記音声入力装置から前記第1指示情報を受信した場合、前記第1指示情報に含まれる前記第1指示情報を入力したユーザの音声特徴量を示す第1音声情報を抽出し、前記第1指示情報が表す第1指示内容を認識し、
前記指示内容の認識結果から前記第1指示内容に基づいて実行する処理を一意に特定できなかった場合は、前記処理を一意に特定するために必要な情報を入力するようにユーザへ促す指示要求通知を行い、
前記指示要求通知後に、前記音声入力装置からユーザが発話した音声である発話情報を受信した場合、前記発話情報に含まれる前記発話情報を入力したユーザの音声特徴量を示す第2音声情報を抽出し、前記抽出された第1音声情報と前記第2音声情報とが一致するか否かを判断し、
前記第1音声情報と前記第2音声情報とが一致しないと判断された場合は、前記発話情報の入力が受け付けられない旨の通知を実行するか、または前記第1指示内容及び前記音声情報の入力に基づいて特定される処理を実行しないものである。
本発明者は、従来技術において、以下の問題が生じることを見出した。
ユーザの音声を入力する音声入力装置へ接続し、ユーザの音声に応答する音声対話システムにおける音声対話制御方法であって、
前記音声入力装置から前記音声対話システムに対する第1指示内容を表す第1指示情報を受信し、
前記音声入力装置から前記第1指示情報を受信した場合、前記第1指示情報に含まれる前記第1指示情報を入力したユーザの音声特徴量を示す第1音声情報を抽出し、前記第1指示情報が表す第1指示内容を認識し、
前記第1指示内容の認識結果から前記第1指示内容に基づいて実行する処理を一意に特定できなかった場合は、前記処理を一意に特定するために必要な情報を入力するようにユーザへ促す指示要求通知を行い、
前記指示要求通知後に、前記音声入力装置からユーザが発話した音声である発話情報を受信した場合、前記発話情報に含まれる前記発話情報を入力したユーザの音声特徴量を示す第2音声情報を抽出し、前記抽出された第1音声情報と前記第2音声情報とが一致するか否かを判断し、
前記第1音声情報と前記第2音声情報とが一致しないと判断された場合は、前記発話情報の入力が受け付けられない旨の通知を実行するか、または前記第1指示内容及び前記音声情報の入力に基づいて特定される処理を実行しない。
前記メモリから前記第1音声情報を読み出して、前記第1音声情報と前記第2音声情報とが一致するか否かを判断してもよい。
前記特定された処理は前記電化機器の動作を制御する制御処理であってもよい。
前記指示要求通知後に前記ネットワークによる接続が切断されたことを検出した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記音声対話システムの音声受付状態をニュートラルに設定してもよい。
前記指示要求通知後に前記ネットワークによる接続が切断されたことを検出した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記ネットワークが切断されたことを前記ユーザへ通知してもよい。
まず、実施の形態における音声対話システムが提供するサービスの全体像について説明する。
以下、2名以上のユーザが同一機器を使用する場合において、音声対話システムが、複数のユーザの音声指示に対して、応答可能なユーザを適切に制限する方法について説明する。
図23は、実施の形態2に係る音声対話システムの構成を示す図である。実施の形態2では、実施の形態1と同一要素には同一符号が付され、詳細な説明は省略される。以下では、実施の形態1との相違点を中心に、実施の形態2が説明される。
以上、実施の形態に係る音声対話システムについて説明したが、本開示は、この実施の形態に限定されるものではない。
図27は、サービスの類型1(自社データセンタ型クラウドサービス)における音声対話システムが提供するサービスの全体像を示す図である。本類型では、サービスプロバイダ4120がグループ4100から情報を取得し、ユーザに対してサービスを提供する。本類型では、サービスプロバイダ4120が、データセンタ運営会社の機能を有している。すなわち、サービスプロバイダ4120が、ビッグデータを管理するクラウドサーバ4111を保有している。したがって、データセンタ運営会社は存在しない。
図28は、サービスの類型2(IaaS利用型クラウドサービス)における音声対話システムが提供するサービスの全体像を示す図である。ここで、IaaSとは、インフラストラクチャー・アズ・ア・サービスの略であり、コンピュータシステムを構築及び稼動させるための基盤そのものを、インターネット経由のサービスとして提供するクラウドサービス提供モデルである。
図29は、サービスの類型3(PaaS利用型クラウドサービス)における音声対話システムが提供するサービスの全体像を示す図である。ここで、PaaSとは、プラットフォーム・アズ・ア・サービスの略であり、ソフトウェアを構築及び稼動させるための土台となるプラットフォームを、インターネット経由のサービスとして提供するクラウドサービス提供モデルである。
図30は、サービスの類型4(SaaS利用型クラウドサービス)における音声対話システムが提供するサービスの全体像を示す図である。ここで、SaaSとは、ソフトウェア・アズ・ア・サービスの略である。SaaS利用型クラウドサービスは、例えば、データセンタ(クラウドサーバ)を保有しているプラットフォーム提供者が提供するアプリケーションを、データセンタ(クラウドサーバ)を保有していない会社又は個人などの利用者がインターネットなどのネットワーク経由で使用できる機能を有するクラウドサービス提供モデルである。
111 クラウドサーバ
240 3001 音声入出力装置
300 処理回路
301 集音回路
302 音声出力回路
303 通信回路
300 CPU
320 メモリ
341 機器ID
400 機器
410 入出力回路
430 CPU
440 メモリ
441 機器ID
450 通信回路
470 処理回路
530 CPU
540 メモリ
541 ゲートウェイID
550 通信回路
570 処理回路
600 音響・言語モデルDB
610 ユーザ管理DB
620 機器状態管理DB
625 発話理解辞書DB
630 機器機能管理DB
640 対話フレームDB
650 通信回路
670 処理回路
700 通信部
710 音声認識部
720 話者識別部
730 発話理解部
740 状態管理部
750 応答生成部
760 音声合成部
800 通信部
810 受信データ解析部
820 送信データ生成部
900 通信部
910 機器制御部
1000 集音部
1010 音声検出部
1020 音声区間切り出し部
1030 通信部
1040 音声出力部
Claims (12)
- ユーザの音声を入力する音声入力装置へ接続し、ユーザの音声に応答する音声対話システムにおける音声対話制御方法であって、
前記音声入力装置から前記音声対話システムに対する第1指示内容を表す第1指示情報を受信し、
前記受信した第1指示情報に含まれる前記第1指示情報を入力したユーザの音声特徴量を示す第1音声情報を抽出し、前記第1指示情報が表す第1指示内容を認識し、
(1)前記第1指示内容の認識結果から前記第1指示内容に基づいて実行する処理を一意に特定できなかった場合は、前記処理を一意に特定するために必要な情報を入力するようにユーザへ促す指示要求通知を行い、(2)前記第1指示内容の認識結果から前記第1指示内容に基づいて実行する処理を一意に特定できた場合は、前記特定された処理を実行し、
前記指示要求通知後に、受信した前記音声入力装置からユーザが発話した音声である発話情報から当該発話情報を入力したユーザの音声特徴量を示す第2音声情報を抽出し、前記抽出された第1音声情報と前記第2音声情報とが一致するか否かを判断し、
(3)前記第1音声情報と前記第2音声情報とが一致しないと判断された場合は、前記発話情報の入力が受け付けられない旨の通知を実行するか、または前記第1指示内容及び前記発話情報の入力に基づいて特定される処理を実行せず、(4)前記第1音声情報と前記第2音声情報とが一致すると判断された場合は、前記受信した発話情報の表わす音声内容を認識し、前記第1指示内容及び前記音声内容の認識結果に基づいて実行する処理を一意に特定し、前記特定された処理を実行する、
音声対話制御方法。 - 前記指示要求通知後において、前記音声入力装置から前記処理を一意に特定するための第2指示内容を表す第2指示情報を前記発話情報として受信した場合、前記第2指示情報の表す第2指示内容を認識し、前記第1指示内容及び前記第2指示内容の認識結果に基づいて実行する処理を一意に特定し、前記第2指示情報に含まれる前記第2指示情報を入力したユーザの音声特徴量を示す第2音声情報を抽出し、前記第1音声情報と前記第2音声情報とが一致するか否かを判断する、
請求項1に記載の音声対話制御方法。 - 前記抽出された第1音声情報をメモリに記憶し、
前記メモリから前記第1音声情報を読み出して、前記第1音声情報と前記第2音声情報とが一致するか否かを判断する、
請求項1又は2記載の音声対話制御方法。 - 前記特定された処理は任意の情報を検索する検索処理である、
請求項1に記載の音声対話制御方法。 - 前記音声対話システムはさらに電化機器と接続し、
前記特定された処理は前記電化機器の動作を制御する制御処理である、
請求項1に記載の音声対話制御方法。 - 前記特定された処理の実行が完了した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記音声対話システムの音声受付状態をニュートラルに設定する、
請求項1に記載の音声対話制御方法。 - 前記指示要求通知後に所定時間経過した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記音声対話システムの音声受付状態をニュートラルに設定する、
請求項1〜6のいずれか一に記載の音声対話制御方法。 - 前記音声入力装置と前記音声対話システムとはネットワークによって接続され、
前記指示要求通知後に前記ネットワークによる接続が切断されたことを検出した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記音声対話システムの音声受付状態をニュートラルに設定する、
請求項1〜6のいずれか一に記載の音声対話制御方法。 - 前記音声入力装置と前記音声対話システムとはネットワークによって接続され、
前記指示要求通知後に前記ネットワークによる接続が切断されたことを検出した場合、前記ユーザと前記音声対話システムとの音声対話を終了し、前記ネットワークが切断されたことを前記ユーザへ通知する、
請求項1〜6のいずれか一に記載の音声対話制御方法。 - 前記ネットワークが切断されたことの前記ユーザへの通知は、前記切断されたことを示す音声を出力することで行われる、
請求項9記載の音声対話制御方法。 - 前記ネットワークが切断されたことの前記ユーザへの通知は、前記切断されたことを示す画像を出力することで行われる、
請求項9記載の音声対話制御方法。 - 前記第1音声情報と前記第2音声情報とが一致すると判断された場合は、前記特定された処理を実行する、
請求項2に記載の音声対話制御方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361873115P | 2013-09-03 | 2013-09-03 | |
US61/873,115 | 2013-09-03 | ||
JP2014150870 | 2014-07-24 | ||
JP2014150870 | 2014-07-24 | ||
PCT/JP2014/004255 WO2015033523A1 (ja) | 2013-09-03 | 2014-08-20 | 音声対話制御方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117719A Division JP6567737B2 (ja) | 2013-09-03 | 2018-06-21 | 音声対話制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015033523A1 JPWO2015033523A1 (ja) | 2017-03-02 |
JP6360484B2 true JP6360484B2 (ja) | 2018-07-18 |
Family
ID=52628025
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015535302A Expired - Fee Related JP6360484B2 (ja) | 2013-09-03 | 2014-08-20 | 音声対話制御方法 |
JP2018117719A Expired - Fee Related JP6567737B2 (ja) | 2013-09-03 | 2018-06-21 | 音声対話制御方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117719A Expired - Fee Related JP6567737B2 (ja) | 2013-09-03 | 2018-06-21 | 音声対話制御方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9472193B2 (ja) |
EP (2) | EP3043348B1 (ja) |
JP (2) | JP6360484B2 (ja) |
WO (1) | WO2015033523A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861449B2 (en) | 2015-05-19 | 2020-12-08 | Sony Corporation | Information processing device and information processing method |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101958902B1 (ko) * | 2011-09-30 | 2019-07-03 | 삼성전자주식회사 | 전자기기들의 그룹 제어 방법 및 그를 위한 전자기기 관리 시스템 |
JP6282516B2 (ja) | 2014-04-08 | 2018-02-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 複数機器の音声操作システム、音声操作方法及び、プログラム |
US9911410B2 (en) * | 2015-08-19 | 2018-03-06 | International Business Machines Corporation | Adaptation of speech recognition |
JP6710037B2 (ja) * | 2015-10-23 | 2020-06-17 | シャープ株式会社 | 通信装置 |
US9653075B1 (en) * | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
JP6571587B2 (ja) * | 2016-05-18 | 2019-09-04 | 日本電信電話株式会社 | 音声入力装置、その方法、及びプログラム |
CN105913839A (zh) * | 2016-05-30 | 2016-08-31 | 合肥华凌股份有限公司 | 一种智能冰箱、服务器及语音控制系统和方法 |
CN107765838A (zh) * | 2016-08-18 | 2018-03-06 | 北京北信源软件股份有限公司 | 人机交互辅助方法及装置 |
JP6659514B2 (ja) | 2016-10-12 | 2020-03-04 | 東芝映像ソリューション株式会社 | 電子機器及びその制御方法 |
KR102338990B1 (ko) * | 2017-01-23 | 2021-12-14 | 현대자동차주식회사 | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 |
US11430434B1 (en) * | 2017-02-15 | 2022-08-30 | Amazon Technologies, Inc. | Intelligent privacy protection mediation |
CN106847292B (zh) * | 2017-02-16 | 2018-06-19 | 平安科技(深圳)有限公司 | 声纹识别方法及装置 |
US11276395B1 (en) * | 2017-03-10 | 2022-03-15 | Amazon Technologies, Inc. | Voice-based parameter assignment for voice-capturing devices |
KR20180118461A (ko) * | 2017-04-21 | 2018-10-31 | 엘지전자 주식회사 | 음성 인식 장치 및 음성 인식 방법 |
CN107492379B (zh) * | 2017-06-30 | 2021-09-21 | 百度在线网络技术(北京)有限公司 | 一种声纹创建与注册方法及装置 |
KR102396147B1 (ko) * | 2017-08-22 | 2022-05-10 | 삼성전자 주식회사 | 음성 명령을 이용한 동작을 수행하는 전자 장치 및 전자 장치의 동작 방법 |
CN107393541B (zh) * | 2017-08-29 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | 信息验证方法和装置 |
EP3690794A4 (en) * | 2017-09-28 | 2021-06-09 | Kyocera Corporation | INSTALLATION MANAGEMENT SYSTEM AND PROCESS |
JP6972149B2 (ja) | 2017-09-28 | 2021-11-24 | 京セラ株式会社 | 音声命令システム及び音声命令方法 |
US10706846B1 (en) * | 2018-01-12 | 2020-07-07 | Amazon Technologies, Inc. | Question answering for a voice user interface |
JP7000257B2 (ja) * | 2018-06-05 | 2022-01-19 | トヨタ自動車株式会社 | 音声認識システム |
JP7173670B2 (ja) | 2018-08-07 | 2022-11-16 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 音声制御コマンド生成方法および端末 |
US11100926B2 (en) * | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
JP7135731B2 (ja) * | 2018-10-31 | 2022-09-13 | コニカミノルタ株式会社 | 画像形成システム、制御装置、および画像形成装置 |
JP7242248B2 (ja) * | 2018-10-31 | 2023-03-20 | キヤノン株式会社 | 電子機器、その制御方法、およびそのプログラム |
JP7023823B2 (ja) * | 2018-11-16 | 2022-02-22 | アルパイン株式会社 | 車載装置及び音声認識方法 |
CN109510844B (zh) * | 2019-01-16 | 2022-02-25 | 中民乡邻投资控股有限公司 | 一种基于声纹的对话交流式的账号注册方法及装置 |
JP7159892B2 (ja) * | 2019-02-04 | 2022-10-25 | コニカミノルタ株式会社 | 画像形成装置、画像形成システム、および情報処理方法 |
CN109887512A (zh) * | 2019-03-15 | 2019-06-14 | 深圳市奥迪信科技有限公司 | 智慧酒店客房控制方法及系统 |
CN112447177B (zh) * | 2019-09-04 | 2022-08-23 | 思必驰科技股份有限公司 | 全双工语音对话方法及系统 |
CN110517684B (zh) * | 2019-09-10 | 2022-03-08 | 百度在线网络技术(北京)有限公司 | 用于智能设备的控制方法、装置、智能设备及存储介质 |
JP7363425B2 (ja) * | 2019-12-03 | 2023-10-18 | セイコーエプソン株式会社 | プログラム、情報処理装置の制御方法、および画像処理システム |
CN112309403B (zh) * | 2020-03-05 | 2024-08-02 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
US12026196B2 (en) * | 2020-04-03 | 2024-07-02 | Comcast Cable Communications, Llc | Error detection and correction for audio cache |
CN111559341A (zh) * | 2020-04-28 | 2020-08-21 | 东风汽车集团有限公司 | 汽车声纹识别控制系统及其控制方法 |
CN112398701A (zh) * | 2021-01-18 | 2021-02-23 | 南京纳新信息科技有限公司 | 一种基于互联网应用的智能语音识别系统 |
EP4377953A1 (en) * | 2021-09-07 | 2024-06-05 | Volkswagen Aktiengesellschaft | A method for providing a functionality of a digital assistant in a vehicle, a system, a vehicle, an electronic control device and a computer program product |
CN114724566A (zh) * | 2022-04-18 | 2022-07-08 | 中国第一汽车股份有限公司 | 语音处理方法、装置、存储介质及电子设备 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07302351A (ja) * | 1994-05-09 | 1995-11-14 | Canon Inc | 画像・音声応答装置及び画像・音声応答方法 |
JPH11306195A (ja) * | 1998-04-24 | 1999-11-05 | Mitsubishi Electric Corp | 情報検索システムおよび情報検索方法 |
US7447635B1 (en) * | 1999-10-19 | 2008-11-04 | Sony Corporation | Natural language interface control system |
DE60120062T2 (de) * | 2000-09-19 | 2006-11-16 | Thomson Licensing | Sprachsteuerung von elektronischen Geräten |
JP3529049B2 (ja) * | 2002-03-06 | 2004-05-24 | ソニー株式会社 | 学習装置及び学習方法並びにロボット装置 |
JP4396216B2 (ja) * | 2003-10-17 | 2010-01-13 | 日産自動車株式会社 | 車載用情報提供対話装置、システムおよび方法 |
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP3962766B2 (ja) * | 2004-10-08 | 2007-08-22 | 松下電器産業株式会社 | 対話支援装置 |
JP4542974B2 (ja) * | 2005-09-27 | 2010-09-15 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
JP2007193138A (ja) * | 2006-01-19 | 2007-08-02 | Ricoh Co Ltd | 画像形成装置 |
JP4131978B2 (ja) * | 2006-02-24 | 2008-08-13 | 本田技研工業株式会社 | 音声認識機器制御装置 |
GB0616070D0 (en) * | 2006-08-12 | 2006-09-20 | Ibm | Speech Recognition Feedback |
JP2008064885A (ja) * | 2006-09-05 | 2008-03-21 | Honda Motor Co Ltd | 音声認識装置、音声認識方法、及び音声認識プログラム |
DE102006057159A1 (de) * | 2006-12-01 | 2008-06-05 | Deutsche Telekom Ag | Verfahren zur Klassifizierung der gesprochenen Sprache in Sprachdialogsystemen |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US8724779B2 (en) * | 2012-03-20 | 2014-05-13 | International Business Machines Corporation | Persisting customer identity validation during agent-to-agent transfers in call center transactions |
US9093075B2 (en) * | 2012-04-20 | 2015-07-28 | Google Technology Holdings LLC | Recognizing repeated speech in a mobile computing device |
US9015045B2 (en) * | 2013-03-11 | 2015-04-21 | Nuance Communications, Inc. | Method for refining a search |
-
2014
- 2014-08-20 EP EP14842716.4A patent/EP3043348B1/en not_active Not-in-force
- 2014-08-20 EP EP17183210.8A patent/EP3261087A1/en not_active Withdrawn
- 2014-08-20 WO PCT/JP2014/004255 patent/WO2015033523A1/ja active Application Filing
- 2014-08-20 JP JP2015535302A patent/JP6360484B2/ja not_active Expired - Fee Related
-
2015
- 2015-05-01 US US14/702,259 patent/US9472193B2/en not_active Expired - Fee Related
-
2018
- 2018-06-21 JP JP2018117719A patent/JP6567737B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861449B2 (en) | 2015-05-19 | 2020-12-08 | Sony Corporation | Information processing device and information processing method |
Also Published As
Publication number | Publication date |
---|---|
EP3043348A1 (en) | 2016-07-13 |
EP3043348B1 (en) | 2017-10-04 |
JP2018169624A (ja) | 2018-11-01 |
JPWO2015033523A1 (ja) | 2017-03-02 |
US20150235642A1 (en) | 2015-08-20 |
EP3043348A4 (en) | 2016-07-13 |
JP6567737B2 (ja) | 2019-08-28 |
WO2015033523A1 (ja) | 2015-03-12 |
EP3261087A1 (en) | 2017-12-27 |
US9472193B2 (en) | 2016-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6567737B2 (ja) | 音声対話制御方法 | |
CN111880645B (zh) | 基于用户的语音输入确定目标设备并控制目标设备的服务器及其操作方法 | |
CN108010523B (zh) | 信息处理方法以及记录介质 | |
US9721572B2 (en) | Device control method and electric device | |
EP2674941B1 (en) | Terminal apparatus and control method thereof | |
EP3402210B1 (en) | Display apparatus, electronic device, interactive system, and controlling methods thereof | |
KR20170093629A (ko) | 음성인식 장치 및 방법, 음성인식시스템 | |
EP2728890A2 (en) | Broadcast receiving apparatus, server and control methods thereof | |
US20170133013A1 (en) | Voice control method and voice control system | |
KR101914708B1 (ko) | 서버 및 서버의 제어 방법 | |
JP2014003609A (ja) | ディスプレイ装置、ディスプレイ装置の制御方法、サーバ及びサーバの制御方法 | |
KR20130140423A (ko) | 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법 | |
JP6908461B2 (ja) | 情報処理方法及びプログラム | |
KR20140089863A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR20140089871A (ko) | 대화형 서버, 그 제어 방법 및 대화형 시스템 | |
JP2018120203A (ja) | 情報処理方法及びプログラム | |
KR20210033167A (ko) | 전자장치 및 그 음성인식 제어방법 | |
JP2002247666A (ja) | 機器制御方法および機器制御システム | |
KR20200127823A (ko) | 허브 디바이스, 허브 디바이스 및 복수의 디바이스를 포함하는 멀티 디바이스 시스템 및 그 동작 방법 | |
KR20140026220A (ko) | 단말 장치 및 단말 장치의 제어 방법 | |
KR20190099676A (ko) | 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템 | |
KR20160012233A (ko) | 대화형 서버, 그 제어 방법 및 대화형 시스템 | |
KR20140137263A (ko) | 대화형 서버, 디스플레이 장치 및 제어 방법 | |
JP2016009456A (ja) | 行動ログを管理するためのシステム、行動ログの管理装置、電子機器、行動ログの検索方法、および、プログラム | |
CN113851130A (zh) | 一种基于家庭网关设备的通用智能设备语音操控方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170313 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20170419 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170419 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20171206 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180622 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6360484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |