JP2007226642A - 音声認識機器制御装置 - Google Patents
音声認識機器制御装置 Download PDFInfo
- Publication number
- JP2007226642A JP2007226642A JP2006048572A JP2006048572A JP2007226642A JP 2007226642 A JP2007226642 A JP 2007226642A JP 2006048572 A JP2006048572 A JP 2006048572A JP 2006048572 A JP2006048572 A JP 2006048572A JP 2007226642 A JP2007226642 A JP 2007226642A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- content
- controlled
- active state
- state change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008859 change Effects 0.000 claims abstract description 131
- 238000000034 method Methods 0.000 claims description 83
- 230000008569 process Effects 0.000 claims description 81
- 230000004044 response Effects 0.000 claims description 71
- 230000035807 sensation Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 abstract description 28
- 230000000007 visual effect Effects 0.000 description 12
- 239000012536 storage buffer Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015541 sensory perception of touch Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】使用者から発話が入力される音声入力手段3と、入力された発話の内容を認識する音声認識手段4と、少なくとも認識された発話の内容に基づいて複数の機器5a〜5cのうちの制御対象となる機器を特定し、該特定した機器の動作を制御する機器制御手段6とを備える。各機器5a〜5cにおける動作の状態変化のうち、少なくとも使用者からの発話により生じた状態変化以外の状態変化を、制御対象となる機器を特定するための第1補助情報として記憶する状態変化記憶手段7を備える。機器制御手段6は、認識された発話の内容に基づいて制御対象となる機器を特定する第1機器特定処理を実行し、第1機器特定処理により該機器を特定できなかった場合には、少なくとも第1補助情報を該機器を特定するために用いる。
【選択図】図1
Description
Claims (7)
- 使用者から発話が入力される音声入力手段と、
前記音声入力手段に入力された発話の内容を認識する音声認識手段と、
少なくとも前記音声認識手段により認識された発話の内容に基づいて、複数の機器のうちの制御対象となる機器を特定し、該特定した機器の動作を制御する機器制御手段とを備えた音声認識機器制御装置において、
前記複数の機器の各機器における動作の状態変化のうち、少なくとも前記使用者からの発話により生じた状態変化以外の状態変化を、前記制御対象となる機器を特定するための第1補助情報として記憶する状態変化記憶手段を備え、
前記機器制御手段は、前記音声認識手段により認識された発話の内容に基づいて、前記制御対象となる機器を特定する第1機器特定処理を実行し、該第1機器特定処理により該機器を特定できなかった場合には、少なくとも前記状態変化記憶手段により記憶された前記第1補助情報を、該機器を特定するために用いることを特徴とする音声認識機器制御装置。 - 前記状態変化記憶手段は、前記第1補助情報として、前記各機器において自動的に生じた状態変化を記憶することを特徴とする請求項1記載の音声認識機器制御装置。
- 前記音声入力手段は、前記使用者と該使用者以外の他者とから発話がそれぞれ入力され、
前記音声認識手段は、前記音声入力手段に入力された発話の内容を、前記使用者からの発話の内容と前記他者からの発話の内容とに分別して認識し、
前記状態変化記憶手段は、前記第1補助情報として、前記他者の発話により生じた前記各機器における動作の状態変化を記憶することを特徴とする請求項1記載の音声認識機器制御装置。 - 前記音声認識手段は、前記音声入力手段に入力された発話の内容を、人の有する感覚のうちの予め定められた複数種類の感覚のいずれかに対応付けて認識し、
前記状態変化記憶手段は、前記第1補助情報を、前記複数種類の感覚のいずれかに対応付けて記憶し、
前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報のうちの、前記音声認識手段により認識した前記発話の内容が対応付けられた感覚の種類と同一の種類の感覚に対応する該第1補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項3のうちいずれか1項記載の音声認識機器制御装置。 - 前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報のうちの最新の第1補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項4のうちいずれか1項記載の音声認識機器制御装置。
- 前記状態変化記憶手段は、前記第1補助情報に加えて、前記使用者の発話により生じた状態変化を、前記制御対象となる機器を特定するための第2補助情報として記憶し、
前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報を用いて、該機器を特定する第2機器特定処理を実行し、該第2機器特定処理により該機器を特定できなかった場合には、該状態変化記憶手段により記憶された前記第2補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項5のうちいずれか1項記載の音声認識機器制御装置。 - 前記使用者への応答を出力する応答出力手段と、
前記音声認識手段により認識された発話の内容に関連した前記第1補助情報が複数ある場合に、該複数の第1補助情報のうちから前記制御対象となる機器を特定するために用いる第1補助情報が絞り込まれるように、前記応答を制御する応答制御手段とを備えることを特徴とする請求項1〜請求項6のうちいずれか1項記載の音声認識機器制御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048572A JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
US11/656,943 US8484033B2 (en) | 2006-02-24 | 2007-01-24 | Speech recognizer control system, speech recognizer control method, and speech recognizer control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048572A JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007226642A true JP2007226642A (ja) | 2007-09-06 |
JP4131978B2 JP4131978B2 (ja) | 2008-08-13 |
Family
ID=38445097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006048572A Expired - Fee Related JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8484033B2 (ja) |
JP (1) | JP4131978B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015025856A (ja) * | 2013-07-24 | 2015-02-05 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
WO2015098079A1 (ja) * | 2013-12-26 | 2015-07-02 | パナソニックIpマネジメント株式会社 | 音声認識処理装置、音声認識処理方法、および表示装置 |
JP2016148957A (ja) * | 2015-02-10 | 2016-08-18 | ホーチキ株式会社 | 機器管理装置、機器管理方法、及びプログラム |
JP2017503282A (ja) * | 2013-10-28 | 2017-01-26 | 自立 余 | 自然表現の処理方法、処理及び応答方法、装置、及びシステム |
JP2018533036A (ja) * | 2015-08-19 | 2018-11-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 通信方法、サーバー、およびデバイス |
WO2018216914A1 (ko) * | 2017-05-24 | 2018-11-29 | 네이버 주식회사 | 음성요청에 대응하는 정보 전달 향상을 위한 출력 |
WO2020144884A1 (ja) * | 2019-01-11 | 2020-07-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 方法、制御装置、及びプログラム |
JP2021182051A (ja) * | 2020-05-18 | 2021-11-25 | トヨタ自動車株式会社 | エージェント連携装置 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
DE602007004620D1 (de) * | 2007-10-01 | 2010-03-18 | Harman Becker Automotive Sys | Sprachgesteuerte Einstellung von Fahrzeugteilen |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
EP2863385B1 (en) * | 2012-06-19 | 2019-03-06 | NTT Docomo, Inc. | Function execution instruction system, function execution instruction method, and function execution instruction program |
US9293138B2 (en) * | 2013-05-14 | 2016-03-22 | Amazon Technologies, Inc. | Storing state information from network-based user devices |
EP3043348B1 (en) | 2013-09-03 | 2017-10-04 | Panasonic Intellectual Property Corporation of America | Voice interaction control method |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
KR102596430B1 (ko) * | 2016-08-31 | 2023-10-31 | 삼성전자주식회사 | 화자 인식에 기초한 음성 인식 방법 및 장치 |
US10147423B2 (en) * | 2016-09-29 | 2018-12-04 | Intel IP Corporation | Context-aware query recognition for electronic devices |
KR102392087B1 (ko) * | 2017-07-10 | 2022-04-29 | 삼성전자주식회사 | 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법 |
CN108597508B (zh) * | 2018-03-28 | 2021-01-22 | 京东方科技集团股份有限公司 | 用户识别方法、用户识别装置和电子设备 |
CN112786046B (zh) * | 2021-01-15 | 2022-05-17 | 宁波方太厨具有限公司 | 多设备语音控制方法、系统、设备及可读存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
JP3980791B2 (ja) * | 1999-05-03 | 2007-09-26 | パイオニア株式会社 | 音声認識装置を備えたマンマシンシステム |
US20020193989A1 (en) * | 1999-05-21 | 2002-12-19 | Michael Geilhufe | Method and apparatus for identifying voice controlled devices |
JP2001075594A (ja) * | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
US7010332B1 (en) * | 2000-02-21 | 2006-03-07 | Telefonaktiebolaget Lm Ericsson(Publ) | Wireless headset with automatic power control |
JP3827058B2 (ja) | 2000-03-03 | 2006-09-27 | アルパイン株式会社 | 音声対話装置 |
US6505161B1 (en) * | 2000-05-01 | 2003-01-07 | Sprint Communications Company L.P. | Speech recognition that adjusts automatically to input devices |
JP2002041276A (ja) * | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US6662137B2 (en) * | 2000-12-19 | 2003-12-09 | Hewlett-Packard Development Company, L.P. | Device location discovery by sound |
US7092886B2 (en) * | 2000-12-19 | 2006-08-15 | Hewlett-Packard Development Company, L.P. | Controlling the order of output of multiple devices |
US20020198714A1 (en) * | 2001-06-26 | 2002-12-26 | Guojun Zhou | Statistical spoken dialog system |
KR100438838B1 (ko) * | 2002-01-29 | 2004-07-05 | 삼성전자주식회사 | 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법 |
JP4363076B2 (ja) * | 2002-06-28 | 2009-11-11 | 株式会社デンソー | 音声制御装置 |
WO2005062293A1 (ja) * | 2003-12-05 | 2005-07-07 | Kabushikikaisha Kenwood | オーディオ機器制御装置、オーディオ機器制御方法及びプログラム |
JP2006201749A (ja) * | 2004-12-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声による選択装置、及び選択方法 |
-
2006
- 2006-02-24 JP JP2006048572A patent/JP4131978B2/ja not_active Expired - Fee Related
-
2007
- 2007-01-24 US US11/656,943 patent/US8484033B2/en not_active Expired - Fee Related
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015025856A (ja) * | 2013-07-24 | 2015-02-05 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
JP2017503282A (ja) * | 2013-10-28 | 2017-01-26 | 自立 余 | 自然表現の処理方法、処理及び応答方法、装置、及びシステム |
US9753914B2 (en) | 2013-10-28 | 2017-09-05 | Zili Yu | Natural expression processing method, processing and response method, device, and system |
US9760565B2 (en) | 2013-10-28 | 2017-09-12 | Zili Yu | Natural expression processing method, processing and response method, device, and system |
WO2015098079A1 (ja) * | 2013-12-26 | 2015-07-02 | パナソニックIpマネジメント株式会社 | 音声認識処理装置、音声認識処理方法、および表示装置 |
JPWO2015098079A1 (ja) * | 2013-12-26 | 2017-03-23 | パナソニックIpマネジメント株式会社 | 音声認識処理装置、音声認識処理方法、および表示装置 |
US9905225B2 (en) | 2013-12-26 | 2018-02-27 | Panasonic Intellectual Property Management Co., Ltd. | Voice recognition processing device, voice recognition processing method, and display device |
JP2016148957A (ja) * | 2015-02-10 | 2016-08-18 | ホーチキ株式会社 | 機器管理装置、機器管理方法、及びプログラム |
JP2018533036A (ja) * | 2015-08-19 | 2018-11-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 通信方法、サーバー、およびデバイス |
US11049499B2 (en) | 2015-08-19 | 2021-06-29 | Huawei Technologies Co., Ltd. | Communication method, server, and device |
US12094462B2 (en) | 2015-08-19 | 2024-09-17 | Huawei Technologies Co., Ltd. | Communication method, server, and device |
WO2018216914A1 (ko) * | 2017-05-24 | 2018-11-29 | 네이버 주식회사 | 음성요청에 대응하는 정보 전달 향상을 위한 출력 |
US11341966B2 (en) | 2017-05-24 | 2022-05-24 | Naver Corporation | Output for improving information delivery corresponding to voice request |
WO2020144884A1 (ja) * | 2019-01-11 | 2020-07-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 方法、制御装置、及びプログラム |
JP2021182051A (ja) * | 2020-05-18 | 2021-11-25 | トヨタ自動車株式会社 | エージェント連携装置 |
US11740865B2 (en) | 2020-05-18 | 2023-08-29 | Toyota Jidosha Kabushiki Kaisha | Agent coordination device, agent coordination method and recording medium |
JP7347324B2 (ja) | 2020-05-18 | 2023-09-20 | トヨタ自動車株式会社 | エージェント連携装置 |
Also Published As
Publication number | Publication date |
---|---|
US20070203699A1 (en) | 2007-08-30 |
JP4131978B2 (ja) | 2008-08-13 |
US8484033B2 (en) | 2013-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4131978B2 (ja) | 音声認識機器制御装置 | |
US11887590B2 (en) | Voice enablement and disablement of speech processing functionality | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
US10365887B1 (en) | Generating commands based on location and wakeword | |
US10706853B2 (en) | Speech dialogue device and speech dialogue method | |
EP3496098A1 (en) | Generating personalized audio content based on mood | |
EP1450349B1 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
JP2008058409A (ja) | 音声認識方法及び音声認識装置 | |
JPWO2017145373A1 (ja) | 音声認識装置 | |
JP2005331882A (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
JP2004510239A (ja) | ディクテーションとコマンドの区別を向上させる方法 | |
US10431221B2 (en) | Apparatus for selecting at least one task based on voice command, vehicle including the same, and method thereof | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JP2017090612A (ja) | 音声認識制御システム | |
JP3842497B2 (ja) | 音声処理装置 | |
JP2009251388A (ja) | 母国語発話装置 | |
JP4905522B2 (ja) | 機器制御装置、機器制御方法及びプログラム | |
JP7274404B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
KR20220073513A (ko) | 대화 시스템, 차량 및 대화 시스템의 제어 방법 | |
JP2007101892A (ja) | 音声認識装置 | |
JP2009025411A (ja) | 音声認識装置およびプログラム | |
JP2008157987A (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
JP2007286376A (ja) | 音声案内システム | |
JP7175221B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2004029354A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080529 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4131978 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140606 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |