JPWO2018100743A1 - 制御装置および機器制御システム - Google Patents
制御装置および機器制御システム Download PDFInfo
- Publication number
- JPWO2018100743A1 JPWO2018100743A1 JP2018553628A JP2018553628A JPWO2018100743A1 JP WO2018100743 A1 JPWO2018100743 A1 JP WO2018100743A1 JP 2018553628 A JP2018553628 A JP 2018553628A JP 2018553628 A JP2018553628 A JP 2018553628A JP WO2018100743 A1 JPWO2018100743 A1 JP WO2018100743A1
- Authority
- JP
- Japan
- Prior art keywords
- control
- information
- voice information
- voice
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000003860 storage Methods 0.000 claims description 48
- 230000004044 response Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
- H04M2201/405—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
図1は、本発明の第1実施形態に係る機器制御システム1の全体構成の一例を示す図である。図1に示すように、第1実施形態に係る機器制御システム1は、第1制御装置10と、第2制御装置20と、音声認識サーバ30と、制御対象機器40(制御対象機器40A、制御対象機器40B)と、を含んで構成されている。第1制御装置10と、第2制御装置20と、音声認識サーバ30と、制御対象機器40とは、LANやインターネットなどの通信手段に接続されており、互いに通信されるようになっている。
第2実施形態では、ユーザ指示取得部21が、ユーザによる操作部に対する操作をユーザ指示として受け付ける場合について説明する。第2実施形態に係る機器制御システム1の全体構成は、図1に示した第1実施形態に係る構成と同一であるため、重複する説明は省略する。
Claims (13)
- ユーザによる制御対象機器を制御するためのユーザ指示を取得するユーザ指示取得部と、
前記ユーザ指示に応じて、前記制御対象機器に対する制御内容を示す音声情報であって、前記ユーザ指示とは異なる情報である補助音声情報を含む、制御音声情報を生成する制御音声情報生成部と、
前記生成した制御音声情報を、音声認識処理を実行する音声認識サーバへ出力する制御音声情報出力部と、
を含む制御装置。 - 前記ユーザ指示は、前記ユーザが発話した音声である発話音声情報であり、
前記制御音声情報生成部は、前記発話音声情報に前記補助音声情報を付加した前記制御音声情報を生成する、
請求項1に記載の制御装置。 - 前記制御音声情報は、前記発話音声情報の先頭または末尾に前記補助音声情報を付加して生成される、
請求項2に記載の制御装置。 - 前記発話音声情報に前記制御対象機器を特定可能な情報が含まれるか否かを判断する判断部、をさらに含み、
前記判断部が前記発話音声情報に前記制御対象機器を特定可能な情報が含まれないと判断した場合に、前記生成部は前記発話音声情報に前記補助音声情報を付加した前記制御音声情報を生成する、
請求項2または3に記載の制御装置。 - 前記補助音声情報は、前記制御対象機器を一意に特定する情報である、
請求項1から4のいずれか一項に記載の制御装置。 - 前記補助音声情報は、前記制御対象機器の動作を示す情報である、
請求項1から4のいずれか一項に記載の制御装置。 - 前記ユーザ指示は、前記ユーザによる操作部に対する操作を示す操作指示情報であり、
前記制御音声情報生成部は、前記操作指示情報に対応し、予め記憶部に記憶されている前記補助音声情報に基づいて前記制御音声情報を生成する、
請求項1に記載の制御装置。 - 前記操作指示情報と、前記補助音声情報とを対応付けて前記記憶部に登録する補助音声情報登録部、をさらに含む、
請求項7に記載の制御装置。 - 制御音声情報出力部が出力した制御音声情報を示す音声情報を保持する履歴情報記憶部、をさらに含み、
前記制御音声情報生成部は、前記履歴情報記憶部に保持されている音声情報に基づいて前記制御音声情報を生成する、
請求項7に記載の制御装置。 - 前記補助音声情報は、時間情報が対応付けられた複数の動作を示す情報を含む、
請求項7から9のいずれか一項に記載の制御装置。 - 前記制御音声情報が音声認識処理されることにより得られた制御コマンドに従って前記制御対象機器を制御する機器制御部、をさらに含む、
請求項1から8のいずれか一項に記載の制御装置。 - 前記制御対象機器は、オーディオ機器である、
請求項1から11のいずれか一項に記載の制御装置。 - 第1制御装置と、第2制御装置と、制御対象機器と、を含む機器制御システムであって、
前記第1制御装置は、
ユーザによる前記制御対象機器を制御するためのユーザ指示を取得するユーザ指示取得部と、
前記ユーザ指示に応じて、前記制御対象機器に対する制御内容を示す音声情報であって、前記ユーザ指示とは異なる情報である補助音声情報を含む、制御音声情報を生成する制御音声情報生成部と、
前記生成した制御音声情報を、音声認識処理を実行する音声認識サーバへ出力する制御音声情報出力部と、を含み、
前記第2制御装置は、
前記音声認識サーバで実行された音声認識処理の認識結果に基づいて、前記制御対象機器を動作させるための制御コマンドを生成する制御コマンド生成部と、
前記制御コマンドに従って前記制御対象機器を制御する機器制御部と、を含む、
機器制御システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/085976 WO2018100743A1 (ja) | 2016-12-02 | 2016-12-02 | 制御装置および機器制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018100743A1 true JPWO2018100743A1 (ja) | 2019-08-08 |
JP6725006B2 JP6725006B2 (ja) | 2020-07-15 |
Family
ID=62242023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018553628A Active JP6725006B2 (ja) | 2016-12-02 | 2016-12-02 | 制御装置および機器制御システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180182399A1 (ja) |
JP (1) | JP6725006B2 (ja) |
WO (1) | WO2018100743A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018101459A1 (ja) | 2016-12-02 | 2018-06-07 | ヤマハ株式会社 | コンテンツ再生機器、収音機器、及びコンテンツ再生システム |
KR102471493B1 (ko) * | 2017-10-17 | 2022-11-29 | 삼성전자주식회사 | 전자 장치 및 음성 인식 방법 |
JP6962158B2 (ja) | 2017-12-01 | 2021-11-05 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
JP7192208B2 (ja) * | 2017-12-01 | 2022-12-20 | ヤマハ株式会社 | 機器制御システム、デバイス、プログラム、及び機器制御方法 |
JP7067082B2 (ja) | 2018-01-24 | 2022-05-16 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
US10803864B2 (en) | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11308947B2 (en) * | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
CN110956960A (zh) * | 2018-09-27 | 2020-04-03 | 中强光电股份有限公司 | 智能语音系统及利用智能语音系统控制投影机的方法 |
JP2022028094A (ja) * | 2018-12-21 | 2022-02-15 | ソニーグループ株式会社 | 情報処理装置、制御方法、情報処理端末、情報処理方法 |
US11869494B2 (en) * | 2019-01-10 | 2024-01-09 | International Business Machines Corporation | Vowel based generation of phonetically distinguishable words |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53166306U (ja) * | 1978-06-08 | 1978-12-26 | ||
JPH01318444A (ja) * | 1988-06-20 | 1989-12-22 | Canon Inc | 自動ダイヤル装置 |
JP2002315069A (ja) * | 2001-04-17 | 2002-10-25 | Misawa Homes Co Ltd | 遠隔制御装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7995768B2 (en) * | 2005-01-27 | 2011-08-09 | Yamaha Corporation | Sound reinforcement system |
CN101268715B (zh) * | 2005-11-02 | 2012-04-18 | 雅马哈株式会社 | 电话会议装置 |
US20110054894A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Speech recognition through the collection of contact information in mobile dictation application |
US8290780B2 (en) * | 2009-06-24 | 2012-10-16 | International Business Machines Corporation | Dynamically extending the speech prompts of a multimodal application |
US8626511B2 (en) * | 2010-01-22 | 2014-01-07 | Google Inc. | Multi-dimensional disambiguation of voice commands |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US20130089300A1 (en) * | 2011-10-05 | 2013-04-11 | General Instrument Corporation | Method and Apparatus for Providing Voice Metadata |
CN103077165A (zh) * | 2012-12-31 | 2013-05-01 | 威盛电子股份有限公司 | 自然语言对话方法及其系统 |
CN103020047A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
US9779752B2 (en) * | 2014-10-31 | 2017-10-03 | At&T Intellectual Property I, L.P. | Acoustic enhancement by leveraging metadata to mitigate the impact of noisy environments |
US10509626B2 (en) * | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
-
2016
- 2016-12-02 WO PCT/JP2016/085976 patent/WO2018100743A1/ja active Application Filing
- 2016-12-02 JP JP2018553628A patent/JP6725006B2/ja active Active
-
2018
- 2018-02-23 US US15/903,436 patent/US20180182399A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53166306U (ja) * | 1978-06-08 | 1978-12-26 | ||
JPH01318444A (ja) * | 1988-06-20 | 1989-12-22 | Canon Inc | 自動ダイヤル装置 |
JP2002315069A (ja) * | 2001-04-17 | 2002-10-25 | Misawa Homes Co Ltd | 遠隔制御装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2018100743A1 (ja) | 2018-06-07 |
US20180182399A1 (en) | 2018-06-28 |
JP6725006B2 (ja) | 2020-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018100743A1 (ja) | 制御装置および機器制御システム | |
US11527243B1 (en) | Signal processing based on audio context | |
KR102304052B1 (ko) | 디스플레이 장치 및 그의 동작 방법 | |
US8117036B2 (en) | Non-disruptive side conversation information retrieval | |
JP6482911B2 (ja) | 機器制御方法および電気機器 | |
JP5134876B2 (ja) | 音声通信装置及び音声通信方法並びにプログラム | |
JP6440346B2 (ja) | ディスプレイ装置、電子装置、対話型システム及びそれらの制御方法 | |
JP2018106148A (ja) | 多重話者音声認識修正システム | |
KR20140089863A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
JP2014093778A (ja) | 放送受信装置、サーバおよびその制御方法 | |
JP6716300B2 (ja) | 議事録生成装置、及び議事録生成プログラム | |
JP7406874B2 (ja) | 電子機器、その制御方法、およびそのプログラム | |
US10002611B1 (en) | Asynchronous audio messaging | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
WO2016103465A1 (ja) | 音声認識システム | |
WO2018020828A1 (ja) | 翻訳装置および翻訳システム | |
JP2020064300A (ja) | 備忘録作成システム、備忘録作成方法、および備忘録作成システムのログ管理サーバのプログラム | |
JP2005241971A (ja) | プロジェクタシステム、マイク装置、プロジェクタ制御装置およびプロジェクタ | |
JP2003215707A (ja) | プレゼンテーションシステム | |
JP2020061046A (ja) | 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム | |
JP2019179081A (ja) | 会議支援装置、会議支援制御方法およびプログラム | |
KR102089593B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
JP7489232B2 (ja) | 情報処理システム、情報処理方法、及び情報処理プログラム | |
KR101715381B1 (ko) | 전자장치 및 그 제어방법 | |
JP7471979B2 (ja) | 会議支援システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200608 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6725006 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |