JP4131978B2 - 音声認識機器制御装置 - Google Patents
音声認識機器制御装置 Download PDFInfo
- Publication number
- JP4131978B2 JP4131978B2 JP2006048572A JP2006048572A JP4131978B2 JP 4131978 B2 JP4131978 B2 JP 4131978B2 JP 2006048572 A JP2006048572 A JP 2006048572A JP 2006048572 A JP2006048572 A JP 2006048572A JP 4131978 B2 JP4131978 B2 JP 4131978B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- content
- active state
- controlled
- state change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000008859 change Effects 0.000 claims description 129
- 238000000034 method Methods 0.000 claims description 83
- 230000008569 process Effects 0.000 claims description 81
- 230000004044 response Effects 0.000 claims description 72
- 230000035807 sensation Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 description 26
- 230000000007 visual effect Effects 0.000 description 12
- 239000012536 storage buffer Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015541 sensory perception of touch Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
Claims (7)
- 使用者から発話が入力される音声入力手段と、
前記音声入力手段に入力された発話の内容を認識する音声認識手段と、
少なくとも前記音声認識手段により認識された発話の内容に基づいて、複数の機器のうちの制御対象となる機器を特定し、該特定した機器の動作を制御する機器制御手段とを備えた音声認識機器制御装置において、
前記複数の機器の各機器における動作の状態変化のうち、少なくとも前記使用者からの発話により生じた状態変化以外の状態変化を、前記制御対象となる機器を特定するための第1補助情報として記憶する状態変化記憶手段を備え、
前記機器制御手段は、前記音声認識手段により認識された発話の内容に基づいて、前記制御対象となる機器を特定する第1機器特定処理を実行し、該第1機器特定処理により該機器を特定できなかった場合には、少なくとも前記状態変化記憶手段により記憶された前記第1補助情報を、該機器を特定するために用いることを特徴とする音声認識機器制御装置。 - 前記状態変化記憶手段は、前記第1補助情報として、前記各機器において自動的に生じた状態変化を記憶することを特徴とする請求項1記載の音声認識機器制御装置。
- 前記音声入力手段は、前記使用者と該使用者以外の他者とから発話がそれぞれ入力され、
前記音声認識手段は、前記音声入力手段に入力された発話の内容を、前記使用者からの発話の内容と前記他者からの発話の内容とに分別して認識し、
前記状態変化記憶手段は、前記第1補助情報として、前記他者の発話により生じた前記各機器における動作の状態変化を記憶することを特徴とする請求項1記載の音声認識機器制御装置。 - 前記音声認識手段は、前記音声入力手段に入力された発話の内容を、人の有する感覚のうちの予め定められた複数種類の感覚のいずれかに対応付けて認識し、
前記状態変化記憶手段は、前記第1補助情報を、前記複数種類の感覚のいずれかに対応付けて記憶し、
前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報のうちの、前記音声認識手段により認識した前記発話の内容が対応付けられた感覚の種類と同一の種類の感覚に対応する該第1補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項3のうちいずれか1項記載の音声認識機器制御装置。 - 前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報のうちの最新の第1補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項4のうちいずれか1項記載の音声認識機器制御装置。
- 前記状態変化記憶手段は、前記第1補助情報に加えて、前記使用者の発話により生じた状態変化を、前記制御対象となる機器を特定するための第2補助情報として記憶し、
前記機器制御手段は、前記第1機器特定処理により前記制御対象となる機器を特定できなかった場合には、前記状態変化記憶手段により記憶された前記第1補助情報を用いて、該機器を特定する第2機器特定処理を実行し、該第2機器特定処理により該機器を特定できなかった場合には、該状態変化記憶手段により記憶された前記第2補助情報を、該機器を特定するために用いることを特徴とする請求項1〜請求項5のうちいずれか1項記載の音声認識機器制御装置。 - 前記使用者への応答を出力する応答出力手段と、
前記音声認識手段により認識された発話の内容に関連した前記第1補助情報が複数ある場合に、該複数の第1補助情報のうちから前記制御対象となる機器を特定するために用いる第1補助情報が絞り込まれるように、前記応答を制御する応答制御手段とを備えることを特徴とする請求項1〜請求項6のうちいずれか1項記載の音声認識機器制御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048572A JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
US11/656,943 US8484033B2 (en) | 2006-02-24 | 2007-01-24 | Speech recognizer control system, speech recognizer control method, and speech recognizer control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006048572A JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007226642A JP2007226642A (ja) | 2007-09-06 |
JP4131978B2 true JP4131978B2 (ja) | 2008-08-13 |
Family
ID=38445097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006048572A Expired - Fee Related JP4131978B2 (ja) | 2006-02-24 | 2006-02-24 | 音声認識機器制御装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8484033B2 (ja) |
JP (1) | JP4131978B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
ATE456490T1 (de) * | 2007-10-01 | 2010-02-15 | Harman Becker Automotive Sys | Sprachgesteuerte einstellung von fahrzeugteilen |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US20150095024A1 (en) * | 2012-06-19 | 2015-04-02 | Ntt Docomo, Inc. | Function execution instruction system, function execution instruction method, and function execution instruction program |
US9293138B2 (en) * | 2013-05-14 | 2016-03-22 | Amazon Technologies, Inc. | Storing state information from network-based user devices |
JP6223739B2 (ja) * | 2013-07-24 | 2017-11-01 | 株式会社Nttドコモ | 機能実行指示システム及び機能実行指示方法 |
EP3043348B1 (en) * | 2013-09-03 | 2017-10-04 | Panasonic Intellectual Property Corporation of America | Voice interaction control method |
CN103593340B (zh) | 2013-10-28 | 2017-08-29 | 余自立 | 自然表达信息处理方法、处理及回应方法、设备及系统 |
EP3089157B1 (en) | 2013-12-26 | 2020-09-16 | Panasonic Intellectual Property Management Co., Ltd. | Voice recognition processing device, voice recognition processing method, and display device |
US9898459B2 (en) | 2014-09-16 | 2018-02-20 | Voicebox Technologies Corporation | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US9626703B2 (en) | 2014-09-16 | 2017-04-18 | Voicebox Technologies Corporation | Voice commerce |
US9747896B2 (en) | 2014-10-15 | 2017-08-29 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US9552816B2 (en) * | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
JP6449039B2 (ja) * | 2015-02-10 | 2019-01-09 | ホーチキ株式会社 | 機器管理装置、機器管理方法、及びプログラム |
CN106469040B (zh) * | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
KR102596430B1 (ko) * | 2016-08-31 | 2023-10-31 | 삼성전자주식회사 | 화자 인식에 기초한 음성 인식 방법 및 장치 |
US10147423B2 (en) * | 2016-09-29 | 2018-12-04 | Intel IP Corporation | Context-aware query recognition for electronic devices |
KR101934954B1 (ko) * | 2017-05-24 | 2019-01-03 | 네이버 주식회사 | 음성요청에 대응하는 정보 전달 향상을 위한 출력 |
KR102392087B1 (ko) * | 2017-07-10 | 2022-04-29 | 삼성전자주식회사 | 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법 |
CN108597508B (zh) * | 2018-03-28 | 2021-01-22 | 京东方科技集团股份有限公司 | 用户识别方法、用户识别装置和电子设备 |
JP2020112692A (ja) * | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
JP7347324B2 (ja) | 2020-05-18 | 2023-09-20 | トヨタ自動車株式会社 | エージェント連携装置 |
CN112786046B (zh) * | 2021-01-15 | 2022-05-17 | 宁波方太厨具有限公司 | 多设备语音控制方法、系统、设备及可读存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
JP3980791B2 (ja) * | 1999-05-03 | 2007-09-26 | パイオニア株式会社 | 音声認識装置を備えたマンマシンシステム |
US20020193989A1 (en) * | 1999-05-21 | 2002-12-19 | Michael Geilhufe | Method and apparatus for identifying voice controlled devices |
JP2001075594A (ja) * | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
US7010332B1 (en) * | 2000-02-21 | 2006-03-07 | Telefonaktiebolaget Lm Ericsson(Publ) | Wireless headset with automatic power control |
JP3827058B2 (ja) | 2000-03-03 | 2006-09-27 | アルパイン株式会社 | 音声対話装置 |
US6505161B1 (en) * | 2000-05-01 | 2003-01-07 | Sprint Communications Company L.P. | Speech recognition that adjusts automatically to input devices |
JP2002041276A (ja) * | 2000-07-24 | 2002-02-08 | Sony Corp | 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体 |
US7092886B2 (en) * | 2000-12-19 | 2006-08-15 | Hewlett-Packard Development Company, L.P. | Controlling the order of output of multiple devices |
US6662137B2 (en) * | 2000-12-19 | 2003-12-09 | Hewlett-Packard Development Company, L.P. | Device location discovery by sound |
US20020198714A1 (en) * | 2001-06-26 | 2002-12-26 | Guojun Zhou | Statistical spoken dialog system |
KR100438838B1 (ko) * | 2002-01-29 | 2004-07-05 | 삼성전자주식회사 | 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법 |
JP4363076B2 (ja) * | 2002-06-28 | 2009-11-11 | 株式会社デンソー | 音声制御装置 |
JP4533845B2 (ja) * | 2003-12-05 | 2010-09-01 | 株式会社ケンウッド | オーディオ機器制御装置、オーディオ機器制御方法及びプログラム |
JP2006201749A (ja) * | 2004-12-21 | 2006-08-03 | Matsushita Electric Ind Co Ltd | 音声による選択装置、及び選択方法 |
-
2006
- 2006-02-24 JP JP2006048572A patent/JP4131978B2/ja not_active Expired - Fee Related
-
2007
- 2007-01-24 US US11/656,943 patent/US8484033B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8484033B2 (en) | 2013-07-09 |
US20070203699A1 (en) | 2007-08-30 |
JP2007226642A (ja) | 2007-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4131978B2 (ja) | 音声認識機器制御装置 | |
JP4260788B2 (ja) | 音声認識機器制御装置 | |
US20210104238A1 (en) | Voice enablement and disablement of speech processing functionality | |
EP1450349B1 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
WO2017145373A1 (ja) | 音声認識装置 | |
JP2008058409A (ja) | 音声認識方法及び音声認識装置 | |
JP2004510239A (ja) | ディクテーションとコマンドの区別を向上させる方法 | |
JP2005331882A (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
US10431221B2 (en) | Apparatus for selecting at least one task based on voice command, vehicle including the same, and method thereof | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JP2017090612A (ja) | 音声認識制御システム | |
JP3842497B2 (ja) | 音声処理装置 | |
JP2009251388A (ja) | 母国語発話装置 | |
JP4905522B2 (ja) | 機器制御装置、機器制御方法及びプログラム | |
JP7274404B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
KR20220073513A (ko) | 대화 시스템, 차량 및 대화 시스템의 제어 방법 | |
JP2007101892A (ja) | 音声認識装置 | |
JP2009025411A (ja) | 音声認識装置およびプログラム | |
JP2008157987A (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
JP7175221B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2004029354A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2007286376A (ja) | 音声案内システム | |
JP2007004052A (ja) | 音声対話装置及び音声理解結果生成方法 | |
KR20220130952A (ko) | 이모지 생성 장치, 차량 및 이모지 생성 방법 | |
JP2006023444A (ja) | 音声対話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080529 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4131978 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140606 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |