JP7192348B2 - 制御装置、制御システム及びプログラム - Google Patents
制御装置、制御システム及びプログラム Download PDFInfo
- Publication number
- JP7192348B2 JP7192348B2 JP2018178334A JP2018178334A JP7192348B2 JP 7192348 B2 JP7192348 B2 JP 7192348B2 JP 2018178334 A JP2018178334 A JP 2018178334A JP 2018178334 A JP2018178334 A JP 2018178334A JP 7192348 B2 JP7192348 B2 JP 7192348B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- target device
- volume
- information
- operation instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 17
- 238000011022 operating instruction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
- Facsimiles In General (AREA)
- User Interface Of Digital Computer (AREA)
Description
である。
なお、ここで、特定の語句とは、対象機器を一意的に特定する語句を除いて対象機器が任意であることを示す語句であり、例えば「どれでも」「適当」等が挙げられる。
なお、ここで、距離に関する特定の語句とは、ユーザからの距離を示す概念的な語句である。ユーザから近い場合は、「この」「こちら」「これ」「近くの」等であり、これよりも遠い場合は、「その」「そちら」「それ」等である。さらに遠い場合は、「あの」「あちら」「あれ」「遠くの」等である。
なお、ここで、近称とは、ユーザからの距離が近い物や場所を示す指示語であり、例えば「これ」「こちら」「これ」等である。
なお、ここで、遠称とは、ユーザからの遠い物や場所を示す指示語であり、例えば「あれ」「あちら」「あの」等である。
図1は、本発明の実施形態に係る制御システム10の全体を示す。
なお、スマートスピーカとは、AI(人口知能)アシスタント機能を持つスピーカである。
なお、音声入力部20a,20b,20cでは音声の音量を絶対値として検知する必要はなく、それぞれの音量の相対値が検知できるようにしてもよい。。
なお、図4においては、前述した外部サーバ14は省略されている。
なお、画像形成装置18a,18b,18cの音声入力部20a,20b,20cからの発話情報が得られなかった場合にステップS36で対象機器候補が無いと判定されるが、音声入力部20a,20b,20cからの発話情報が得られたとしても音量が予め定められた値よりも小さい場合にも対象機器候補が無いと判定されるようにしてもよい。
また、画像形成装置を一意に特定する語句ではなく、距離に関する特定の語句、例えば「この」「こちら」「これ」等の近称があれば、受け付けた音声の音量が最大の画像形成装置へ操作命令を送信し、「あの」「あちら」「あれ」等の遠称があれば、音量が最小の画像形成装置へ操作命令を送信し、「その」「そちら」「それ」等の中称があれば、音量が中間の画像形成装置へ操作命令を送信する。
なお、中称とは、ユーザからの距離が近称と遠称との間の距離の物や場所を示す指示語である。
また、上記実施形態においては、対象機器を画像形成装置としたが、これに限らず、対象機器には電気製品や自動車等が含まれる。
12 音声受付装置
14 外部サーバ
16 制御サーバ
18a,18b,18c 画像形成装置
20a,20b,20c 音声入力部
22 ネットワーク
24 発話情報データベース
26 CPU
28 メモリ
30 記憶装置
32 ネットワークインターフェイス
33 バス
34 制御部
36 CPU
38 メモリ
40 記憶装置
42 ネットワークインターフェイス
44 音声入力部インターフェイス
46 機器制御部
48 音声入力部
50 操作指示送信部
52 回答音声受信部
54 音声出力部
56 時刻取得部
58 発話情報送信部
60 操作命令受信部
62 操作実行部
64 操作指示受信部
66 時刻取得部
68 発話情報検索部
70 回答音声情報送信部
72 発話情報受信部
74 操作命令送信部
Claims (13)
- 音声による又は音声から生成された操作指示を受け付ける第1の受付手段と、
対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第2の受付手段と、
前記第2の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、
前記対象機器特定手段により特定された対象機器に前記第1の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、
を有し、
前記第1の受付手段により受け付けられる操作指示には距離に関する特定の語句が含まれ、前記対象機器特定手段は、前記距離に関する特定の語句と、前記第2の受付手段により受け付けた音量に関する情報とにより対象機器を特定する制御装置。 - 前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項1記載の制御装置。
- 前記対象機器特定手段は、前記第2の受付手段により、予め定められた時間内に複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項2記載の制御装置。
- 前記第1の受付手段により受け付けられる操作指示に特定の語句が含まれる場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項2記載の制御装置。
- 前記第1の受付手段により受け付けられる操作指示に対象機器の指定が含まれない場合に、前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項2記載の制御装置。
- 前記対象機器特定手段は、前記第2の受付手段により複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記距離に関する特定の語句が近称の場合は、前記第2の受付手段により受け付けた音声の音量が他のものより大きい対象機器を特定する請求項1記載の制御装置。
- 前記対象機器特定手段は、前記第2の受付手段により複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記距離に関する特定の語句が遠称の場合は、前記第2の受付手段により受け付けた音声の音量が他のものより小さい対象機器を特定する請求項1または6記載の制御装置。
- 前記第2の受付手段により受け付けた全ての対象機器に対応した音声の音量が予め定められた値よりも小さい場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項1から7のいずれか1項に記載の制御装置。
- 前記対象機器特定手段は、前記第1の受付手段が操作指示を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声の音量に関する情報を取得した場合に対象機器を特定する請求項1から8のいずれか1項に記載の制御装置。
- 前記第1の受付手段が操作指示を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声の音量に関する情報を取得できない場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項1から9いずれか1項に記載の制御装置。
- 音声を受け付ける音声受付装置と、
前記音声受付装置により受け付けられた音声の音量に関する情報により対象機器を制御する制御装置と、
を有し、
制御装置は、
前記音声受付装置からの音声による又は音声から生成された操作指示を受け付ける第1の受付手段と、
前記対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第2の受付手段と、
前記第2の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、
前記対象機器特定手段により特定された対象機器に前記第1の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、
を有し、
前記第1の受付手段により受け付けられる操作指示には距離に関する特定の語句が含まれ、前記対象機器特定手段は、前記距離に関する特定の語句と、前記第2の受付手段により受け付けた音量に関する情報とにより対象機器を特定する制御システム。 - 前記音声受付装置は音声を出力する音声出力部をさらに有し、前記音声出力部は前記操作命令の送信先の対象機器を識別する識別情報を音声として出力する請求項11に記載の制御システム。
- 音声による又は音声から生成された操作指示を受け付けるステップと、
対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付けるステップと、
受け付けた音量に関する情報により対象機器を特定するステップと、
特定された対象機器に、受け付けた操作指示に基づく操作命令を送信するステップと、
をコンピュータに実行させるためのプログラムであって、
受け付けられる操作指示には距離に関する特定の語句が含まれ、前記距離に関する特定の語句と、受け付けた音量に関する情報とにより対象機器を特定するプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018178334A JP7192348B2 (ja) | 2018-09-25 | 2018-09-25 | 制御装置、制御システム及びプログラム |
CN201910167191.3A CN110941414B (zh) | 2018-09-25 | 2019-03-06 | 控制装置、控制方法、控制系统及计算机可读记录介质 |
US16/569,847 US11373648B2 (en) | 2018-09-25 | 2019-09-13 | Control device, control system, and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018178334A JP7192348B2 (ja) | 2018-09-25 | 2018-09-25 | 制御装置、制御システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020052485A JP2020052485A (ja) | 2020-04-02 |
JP7192348B2 true JP7192348B2 (ja) | 2022-12-20 |
Family
ID=69883278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018178334A Active JP7192348B2 (ja) | 2018-09-25 | 2018-09-25 | 制御装置、制御システム及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11373648B2 (ja) |
JP (1) | JP7192348B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7192348B2 (ja) * | 2018-09-25 | 2022-12-20 | 富士フイルムビジネスイノベーション株式会社 | 制御装置、制御システム及びプログラム |
JP7200702B2 (ja) * | 2019-01-30 | 2023-01-10 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026158A (ja) | 2007-07-20 | 2009-02-05 | Oki Electric Ind Co Ltd | 対象物指定装置、対象物指定方法およびコンピュータプログラム |
JP2018036397A (ja) | 2016-08-30 | 2018-03-08 | シャープ株式会社 | 応答システムおよび機器 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657425A (en) * | 1993-11-15 | 1997-08-12 | International Business Machines Corporation | Location dependent verbal command execution in a computer based control system |
JP2002091491A (ja) | 2000-09-20 | 2002-03-27 | Sanyo Electric Co Ltd | 複数機器の音声制御システム |
US8484146B2 (en) * | 2006-01-18 | 2013-07-09 | Sony Corporation | Interaction device implementing a bayesian's estimation |
JP2012155651A (ja) * | 2011-01-28 | 2012-08-16 | Sony Corp | 信号処理装置および方法、並びに、プログラム |
JP2013106315A (ja) * | 2011-11-16 | 2013-05-30 | Toshiba Corp | 情報端末、家電機器、情報処理方法および情報処理プログラム |
JP6282516B2 (ja) | 2014-04-08 | 2018-02-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 複数機器の音声操作システム、音声操作方法及び、プログラム |
CN106557802B (zh) * | 2015-09-30 | 2019-08-30 | 东芝存储器株式会社 | 存储装置以及信息处理系统 |
WO2017220856A1 (en) * | 2016-06-23 | 2017-12-28 | Paumax Oy | Electronic accessory incorporating dynamic user-controlled audio muting capabilities, related methods and communications terminal |
JP7037426B2 (ja) * | 2018-04-25 | 2022-03-16 | 京セラ株式会社 | 電子機器及び処理システム |
US20210118443A1 (en) * | 2018-04-27 | 2021-04-22 | Sony Corporation | Information processing device and information processing method |
JP7192348B2 (ja) * | 2018-09-25 | 2022-12-20 | 富士フイルムビジネスイノベーション株式会社 | 制御装置、制御システム及びプログラム |
-
2018
- 2018-09-25 JP JP2018178334A patent/JP7192348B2/ja active Active
-
2019
- 2019-09-13 US US16/569,847 patent/US11373648B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009026158A (ja) | 2007-07-20 | 2009-02-05 | Oki Electric Ind Co Ltd | 対象物指定装置、対象物指定方法およびコンピュータプログラム |
JP2018036397A (ja) | 2016-08-30 | 2018-03-08 | シャープ株式会社 | 応答システムおよび機器 |
Also Published As
Publication number | Publication date |
---|---|
CN110941414A (zh) | 2020-03-31 |
US20200098365A1 (en) | 2020-03-26 |
US11373648B2 (en) | 2022-06-28 |
JP2020052485A (ja) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102117574B1 (ko) | 자기-학습 자연 언어 이해를 갖는 다이얼로그 시스템 | |
US11887604B1 (en) | Speech interface device with caching component | |
EP3251115B1 (en) | Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing | |
CN105741836B (zh) | 声音识别装置以及声音识别方法 | |
US9336773B2 (en) | System and method for standardized speech recognition infrastructure | |
US9959863B2 (en) | Keyword detection using speaker-independent keyword models for user-designated keywords | |
US20180342257A1 (en) | System and Method for Building a Voice Database | |
US8938388B2 (en) | Maintaining and supplying speech models | |
US20200034108A1 (en) | Dynamic Volume Adjustment For Virtual Assistants | |
US20050234720A1 (en) | Voice application system | |
JP7192348B2 (ja) | 制御装置、制御システム及びプログラム | |
WO2018084910A1 (en) | Systems and methods for interrelating text transcript information with video and/or audio information | |
JP7347217B2 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
US10861453B1 (en) | Resource scheduling with voice controlled devices | |
CN111902865A (zh) | 文本无关的说话者识别 | |
KR20210148057A (ko) | 음성 인식 방법 및 이에 사용되는 장치 | |
JP6689953B2 (ja) | 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム | |
JP5901694B2 (ja) | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム | |
KR20200016774A (ko) | 사용자 음성 발화를 처리하기 위한 시스템 및 그의 동작 방법 | |
EP3716040A1 (en) | Image forming apparatus and job execution method | |
JP6481643B2 (ja) | 音声処理システムおよび音声処理方法 | |
KR20180074152A (ko) | 보안성이 강화된 음성 인식 방법 및 장치 | |
CN110941414B (zh) | 控制装置、控制方法、控制系统及计算机可读记录介质 | |
JP7139937B2 (ja) | 音声処理システム、ジョブ生成装置、ジョブ生成方法およびジョブ生成プログラム | |
JP7205308B2 (ja) | ジョブ生成装置、画像処理装置、ジョブ生成方法およびジョブ生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20201102 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7192348 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |