JP7447458B2 - Control device, control system and control program - Google Patents
Control device, control system and control program Download PDFInfo
- Publication number
- JP7447458B2 JP7447458B2 JP2019225082A JP2019225082A JP7447458B2 JP 7447458 B2 JP7447458 B2 JP 7447458B2 JP 2019225082 A JP2019225082 A JP 2019225082A JP 2019225082 A JP2019225082 A JP 2019225082A JP 7447458 B2 JP7447458 B2 JP 7447458B2
- Authority
- JP
- Japan
- Prior art keywords
- setting
- voice
- control
- image processing
- guidance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 245
- 230000006870 function Effects 0.000 description 36
- 238000000034 method Methods 0.000 description 35
- 238000000605 extraction Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 23
- 239000000284 extract Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000135 prohibitive effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Accessory Devices And Overall Control Thereof (AREA)
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、ユーザーによって入力される音声に応じて画像処理装置を制御する制御装置、制御システム及び制御プログラムに関する。 The present invention relates to a control device, a control system, and a control program that control an image processing device according to audio input by a user.
従来、MFP(Multifunction Peripherals)などの画像処理装置において、ユーザーの視覚を利用しないで操作可能とする技術が提案されている(例えば、特許文献1)。この従来の画像処理装置は、音声認識部を備えており、ユーザーによって入力される音声に基づいて各種設定項目に対する設定を行うように構成されている。また、この従来の画像処理装置は、音声認識部による音声認識結果を復唱音声として音声出力部から出力するように構成されている。そのため、ユーザーは、画像処理装置から出力される復唱音声を聞くことにより、自身で発した音声が画像処理装置において正しく認識されたかどうかを把握することができる。 2. Description of the Related Art Conventionally, a technique has been proposed that allows an image processing apparatus such as an MFP (Multifunction Peripherals) to be operated without using the user's vision (for example, Patent Document 1). This conventional image processing device includes a voice recognition section and is configured to perform settings for various setting items based on voice input by a user. Further, this conventional image processing device is configured to output the voice recognition result by the voice recognition section as a repeating voice from the voice output section. Therefore, by listening to the repeated voice output from the image processing device, the user can understand whether the voice he or she has uttered has been correctly recognized by the image processing device.
上記従来の画像処理装置は、ユーザーによって発せられた音声に対応する1つの設定項目を特定することができると、復唱音声を出力するようにしている。 The conventional image processing apparatus described above outputs a repeating sound when one setting item corresponding to the sound uttered by the user can be specified.
しかしながら、この種の画像処理装置には、様々な設定項目が存在し、ユーザーの音声に対応する1つの設定項目を必ず特定できるとは限らず、ユーザーの音声に対応する設定として複数の設定候補が抽出されることもある。例えば、ユーザーが「両面」と発声した場合、コピー機能において読み取り原稿の両面設定と複写出力する際の両面設定とが存在すると共に、スキャン機能においても読み取り原稿の両面設定が存在し、それら複数の両面設定が候補として抽出されることになる。 However, this type of image processing device has various setting items, and it is not always possible to identify one setting item that corresponds to the user's voice, and there are multiple setting candidates as settings that correspond to the user's voice. may be extracted. For example, if the user says "duplex", the copy function has two-sided settings for the scanned original and the two-sided setting for copy output, and the scan function also has two-sided settings for the scanned original, and these multiple settings exist. Duplex settings will be extracted as candidates.
上述した従来の画像処理装置では、ユーザーの音声に対応する設定として複数の設定候補が抽出された場合に何ら対応策が採られていない。そのため、ユーザーは、自身で発した音声に対応する設定として複数の設定候補が存在する場合に、それら複数の設定候補のうちから所望の設定候補を選択することができないという課題がある。 In the conventional image processing apparatus described above, no countermeasure is taken when a plurality of setting candidates are extracted as settings corresponding to the user's voice. Therefore, when a plurality of setting candidates exist as settings corresponding to the voice uttered by the user, there is a problem in that the user cannot select a desired setting candidate from among the plurality of setting candidates.
また、この種の画像処理装置は、複数のユーザーによって共有される装置であるため、一人のユーザーによる占有時間をなるべく短くすることが望まれる。ところが、従来の画像処理装置は、複数の設定候補のうちからユーザーが所望する設定候補を効率的に選択することができないため、一人のユーザーによる画像処理装置の占有時間が長くなってしまうという問題もある。 Further, since this type of image processing device is a device shared by a plurality of users, it is desirable to reduce the time occupied by one user as much as possible. However, with conventional image processing devices, it is not possible for a user to efficiently select a desired setting candidate from among a plurality of setting candidates, resulting in a problem that a single user occupies the image processing device for a long time. There is also.
本発明は、上述した従来の問題点を解決するためになされたものであり、ユーザーが発した音声に基づいて複数の設定候補が抽出される場合であっても、ユーザーに効率的に所望の設定候補を選択させることを可能にした画像処理装置の制御装置、制御システム及び制御プログラムを提供することを目的とする。 The present invention has been made to solve the above-mentioned conventional problems, and even when multiple setting candidates are extracted based on the voice uttered by the user, the present invention allows the user to efficiently select the desired setting. It is an object of the present invention to provide a control device, a control system, and a control program for an image processing apparatus that make it possible to select setting candidates.
上記目的を達成するため、請求項1に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項2に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項3に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする構成である。
請求項4に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする構成である。
In order to achieve the above object, the invention according to claim 1 provides a control device for controlling an image processing device, the control device controlling the image processing device to control the settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user. a setting specifying means to specify, and guidance information for generating voice guidance representing the contents of the settings specified by the setting specifying means, and outputting voice guidance based on the guide information from a predetermined voice output means. and a control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result, the guidance information outputting means , when the setting specifying means determines that the number of setting candidates is less than a predetermined number, outputting the guidance information for audio guidance of the setting candidates less than the predetermined number. .
The invention according to
The guidance information output means outputs the guidance information for audio guidance of the predetermined number or more setting candidates when the setting specifying means determines that there are more than a predetermined number of setting candidates. This is a characteristic configuration.
The invention according to
and the guidance information output means is configured to provide voice guidance for prompting the user to confirm a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. This configuration is characterized by outputting the guidance information of.
The invention according to
請求項5に係る発明は、請求項1乃至4のいずれかの制御装置において、前記制御手段は、前記設定特定手段において前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記複数の設定候補を提示することを特徴とする構成である。
The invention according to
請求項6に係る発明は、請求項1乃至5のいずれかの制御装置において、前記画像処理装置は、表示手段を有し、前記制御手段は、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする構成である。 The invention according to claim 6 is the control device according to any one of claims 1 to 5 , wherein the image processing device has a display means, and the control means causes the plurality of setting candidates to be displayed on the display means. This is a configuration characterized by presentation by.
請求項7に係る発明は、請求項1乃至6のいずれかの制御装置において、前記制御手段は、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする構成である。
The invention according to
請求項8に係る発明は、請求項7の制御装置において、前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする構成である。
The invention according to
請求項9に係る発明は、請求項7の制御装置において、前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする構成である。
The invention according to
請求項10に係る発明は、請求項6の制御装置において、前記制御手段は、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする構成である。
The invention according to
請求項11に係る発明は、請求項10の制御装置において、前記制御手段は、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする構成である。
The invention according to
請求項12に係る発明は、請求項6、10又は11の制御装置において、前記制御手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする構成である。
The invention according to
請求項13に係る発明は、請求項1乃至12のいずれかの制御装置において、前記設定特定手段は、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする構成である。 According to a thirteenth aspect of the invention, in the control device according to any one of claims 1 to 12 , when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result, the setting specifying means changes the current setting state. On the other hand, this configuration is characterized in that setting candidates that satisfy prohibitive conditions are excluded from the plurality of setting candidates.
請求項14に係る発明は、請求項1乃至13いずれかの制御装置において、前記制御装置は、前記画像処理装置と通信可能なサーバーであることを特徴とする構成である。
The invention according to
請求項15係る発明は、請求項1乃至13いずれかの制御装置において、前記制御装置は、前記画像処理装置に設けられることを特徴とする構成である。
The invention according to
請求項16に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための案内情報を出力することを特徴とする構成である。
請求項17に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための案内情報を出力することを特徴とする構成である。
請求項18に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための案内情報を出力することを特徴とする構成である。
請求項19に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、案内情報を出力しないことを特徴とする構成である。
The invention according to
The invention according to
The invention according to
The invention according to
請求項20に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項21に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記複数の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項22に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする構成である。
請求項23に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする構成である。
The invention according to
The invention according to
The invention according to
The invention according to claim 23 is a control program that is executed by a processor to control an image processing device, the control program causing the processor to control the image processing device based on a voice recognition result of a voice uttered by a user. a setting specifying step for specifying settings to be reflected; generating guidance information for voice guidance representing the contents of the settings specified in the setting specifying step; and generating voice guidance based on the guidance information to a predetermined voice output means. and a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result, The guide information output step is characterized in that the guide information is not output when it is determined in the setting specifying step that a predetermined number or more of setting candidates exist.
請求項24に係る発明は、請求項20乃至23のいずれかの制御プログラムにおいて、前記制御ステップは、前記設定特定ステップにおいて前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記所定数以上の設定候補を提示することを特徴とする構成である。
The invention according to claim 24 is the control program according to any one of
請求項25に係る発明は、請求項20乃至24のいずれかの制御プログラムにおいて、前記画像処理装置は、表示手段を有し、前記制御ステップは、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする構成である。
The invention according to
請求項26に係る発明は、請求項20乃至25のいずれかの制御プログラムにおいて、前記制御ステップは、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする構成である。
The invention according to
請求項27に係る発明は、請求項26の制御プログラムにおいて、前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする構成である。
The invention according to
請求項28に係る発明は、請求項26の制御プログラムにおいて、前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする構成である。
The invention according to claim 28 is the control program according to
請求項29に係る発明は、請求項25の制御プログラムにおいて、前記制御ステップは、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする構成である。
The invention according to claim 29 is the control program according to
請求項30に係る発明は、請求項29の制御プログラムにおいて、前記制御ステップは、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする構成である。 The invention according to claim 30 is the control program according to claim 29 , wherein the control step changes the image size of the thumbnail image corresponding to each of the plurality of setting candidates according to a predetermined priority order. The configuration is as follows.
請求項31に係る発明は、請求項25、29又は30の制御プログラムにおいて、前記制御ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする構成である。
The invention according to
請求項32に係る発明は、請求項20乃至31のいずれかの制御プログラムにおいて、前記設定特定ステップは、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする構成である。
The invention according to
本発明によれば、音声認識結果に対応する複数の設定候補が存在すると判定された場合にそれら複数の設定候補を提示するため、ユーザーは提示された複数の設定候補のうちから所望する設定候補を効率的に選択することができるようになる。 According to the present invention, when it is determined that a plurality of setting candidates corresponding to the voice recognition result exist, the plurality of setting candidates are presented, so that the user can select a desired setting candidate from among the presented plural setting candidates. will be able to select efficiently.
以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する要素には同一符号を付しており、それらについての重複する説明は省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In the embodiments described below, common elements are given the same reference numerals, and redundant explanations thereof will be omitted.
図1は、本実施形態において画像処理装置2を制御するための制御システム1の一例を示す図である。この制御システム1は、ユーザーのローカル環境に設置される画像処理装置2と、ローカル環境に設置されて音声の入出力を行う音声入出力装置3と、LAN(Local Area Network)などのローカルネットワーク4と、インターネット上のクラウド5に設置される音声認識装置7と、クラウド5に設置されて画像処理装置2を制御する制御装置8と、クラウド5上で音声認識装置7と制御装置8とを通信可能に接続するネットワーク9とを備える。
FIG. 1 is a diagram showing an example of a control system 1 for controlling an
画像処理装置2は、例えばMFP(Multifunction Peripherals)などと呼ばれる装置であって、コピー機能、スキャン機能、プリント機能、FAX機能などの複数の機能を有する装置である。画像処理装置2は、装置本体の上部にスキャナ部17を備え、スキャナ部17の下部にプリンタ部18を備えている。また、画像処理装置2は、内部にFAX部を備えている。画像処理装置2は、それらスキャナ部17、プリンタ部及びFAX部を適宜動作させることにより、ユーザーによって指定されたジョブを実行する。また、画像処理装置2は、装置本体の正面側にユーザーが操作可能な操作パネル11を備えている。この操作パネル11は、ユーザーが手動操作を行うことにより、各種ジョブの設定などを行うことができるユーザーインタフェースである。
The
音声入出力装置3は、例えばスマートスピーカーやAIスピーカーなどと呼ばれる装置であって、ユーザーと対話を行うことができる装置である。この音声入出力装置3は、ユーザーが画像処理装置2を音声で操作できるようにするために、画像処理装置2と同じ環境に設置される。尚、図1では、音声入出力装置3が画像処理装置2と別体として構成される場合を例示しているが、これに限られるものではない。例えば、音声入出力装置3は、画像処理装置2に内蔵されたものであっても構わない。
The audio input/
ローカルネットワーク4は、画像処理装置2と音声入出力装置3とを通信可能に接続する。またローカルネットワーク4は、インターネットにも接続されている。そのため、画像処理装置2及び音声入出力装置3は、クラウド5に設置されている音声認識装置7や制御装置8と通信を行うことが可能である。
The
音声認識装置7は、音声を解析して音声をテキスト化する装置である。例えば、音声認識装置7には、人工知能(AI)による音声認識機能が搭載されており、入力する音声情報を高速かつ高精度にテキスト化することができる。本実施形態の音声認識装置7は、図1に示すようにクラウド5上にサーバーとして設置される。そのため、音声認識装置7による音声認識機能を、複数のローカル環境から利用することができる。
The
制御装置8は、ローカル環境に設置される画像処理装置2を遠隔制御するための装置である。この制御装置8もクラウド5上にサーバーとして設置されている。そのため、制御装置8は、複数のローカル環境に設置されている複数の画像処理装置2を個別に制御することができる。
The
上記のような制御システム1は、ローカル環境においてユーザーが画像処理装置2を操作するためのキーワードを音声で発した場合に、ユーザーの音声に応じて画像処理装置2が動作するように構成される。
The control system 1 as described above is configured such that when a user vocally utters a keyword for operating the
図2は、制御システム1における概略動作を示す図である。音声入出力装置3は、画像処理装置2を音声操作するための装置であり、予め画像処理装置2の装置モデル(装置タイプ)やアドレスに関する装置情報を保持している。この音声入出力装置3は、画像処理装置2と同じローカル環境に設置されることにより、画像処理装置2の近傍位置でユーザーが発する音声を入力することができる。そしてユーザーが画像処理装置2を操作するための音声を発すると、音声入出力装置3は、その音声を入力し、音声情報D1を生成する。この音声情報D1は、音声入出力装置3からクラウド5上の音声認識装置7へと送信される。このとき、音声入出力装置3は、画像処理装置2の装置情報を付加した音声情報D1を音声認識装置7へ送信する。
FIG. 2 is a diagram schematically showing the operation of the control system 1. As shown in FIG. The audio input/
音声認識装置7は、音声入出力装置3から音声情報D1を受信すると、音声情報D1を解析することにより、ユーザーが発した音声をテキストD2に変換する。すなわち、音声認識装置7は、音声認識結果として、ユーザーの音声に対応するテキストD2を生成する。この音声認識装置7は、音声入出力装置3から音声情報D1を受信してテキストD2を生成すると、そのテキストD2をクラウド5内で制御装置8へ送信する。このとき、音声認識装置7は、音声情報D1に付加されていた装置情報を、テキストD2に付加した状態で制御装置8へ送信する。
When the
制御装置8は、音声認識装置7の音声認識結果に基づいて画像処理装置2を制御するコマンドD4を生成する。すなわち、制御装置8は、音声認識装置7から受信するテキストD2に基づいてコマンドD4を生成するのである。このとき、制御装置8は、テキストD2に付加されている装置情報に基づき画像処理装置2の装置モデルを特定し、その装置モデルに対応したコマンドD4を生成する。また、制御装置8は、テキストD2に付加されている装置情報に基づき、コマンドD4の送信先となる画像処理装置2のアドレスを特定する。そして制御装置8は、コマンドD4を、画像処理装置2へ送信することにより、画像処理装置2を制御する。
The
例えば、ユーザーが画像処理装置2に対するジョブの設定を音声で指示した場合、制御装置8は、音声認識装置7から受信するテキストD2に基づいて画像処理装置2に反映すべき設定を特定し、その設定を画像処理装置2に反映させるためのコマンドD4を生成する。そして制御装置8は、そのコマンドD4を画像処理装置2へ送信することにより、ジョブの設定を反映させる。
For example, when a user instructs the
また、ユーザーが画像処理装置2に対してジョブの実行を音声で指示した場合、制御装置8は、音声認識装置7から受信するテキストD2に基づいて画像処理装置2にジョブを実行させるためのコマンドD4を生成する。そして制御装置8は、そのコマンドD4を画像処理装置2へ送信することにより、画像処理装置2にジョブを実行させる。
Further, when the user instructs the
このように制御装置8は、音声認識装置7による音声認識結果に基づいて画像処理装置2に行わせる処理を特定し、その特定した処理に対応するコマンドD4を画像処理装置2へ送信することにより、画像処理装置2を制御する。
In this way, the
また、制御装置8は、音声認識結果に基づいて特定した処理に基づく音声案内を行うための案内情報D3を生成する。この案内情報D3は、テキストデータとして生成される。そして制御装置8は、テキストデータとして生成した案内情報D3を音声認識装置7へ送信する。音声認識装置7は、制御装置8から音声案内のための案内情報D3を受信すると、案内情報D3をテキストデータから音声情報に変換する。そして音声認識装置7は、音声情報に変換した案内情報D3を、音声情報D1の送信元である音声入出力装置3へ送信する。これにより、音声入出力装置3では、案内情報D3に基づく音声出力が行われる。例えば、ユーザーがジョブの設定操作を音声で行った場合、制御装置8は、その設定の内容をテキストデータで表した案内情報D3を生成して音声認識装置7へ送信する。音声認識装置7は、テキストデータを音声情報に変換することにより、ユーザーによる設定の内容を音声出力するための案内情報D3を生成する。そして音声認識装置7は、音声情報に変換した案内情報D3を音声入出力装置3へ送信する。音声入出力装置3は、音声認識装置7から案内情報D3を受信すると、その案内情報D3に基づく音声出力を行う。したがって、ユーザーは、自身で発した音声がどのように認識されたかを音声入出力装置3からの出力音声で把握することができる。
Further, the
このような制御システム1によれば、ユーザーは、画像処理装置2の操作パネル11を手動で操作しなくても、音声操作を行うことが可能である。そのため、例えばユーザーが荷物を抱えていて両手を使うことができない場合や、画像処理装置2から数メートル程度離れた位置にいる場合であっても、画像処理装置2を音声で操作することができるので、利便性が高い。
According to such a control system 1, the user can perform voice operations without manually operating the
図3は、画像処理装置2のハードウェア構成及び機能構成の一例を示すブロック図である。画像処理装置2は、そのハードウェア構成として、制御部10と、操作パネル11と、通信インタフェース14と、記憶部15と、スキャナ部17と、プリンタ部18と、FAX部19とを備えている。制御部10は、図示を省略するCPUとメモリとを備えている。制御部10は、そのCPUにおいて所定のプログラムが実行されることにより、各部の動作を制御する。
FIG. 3 is a block diagram showing an example of the hardware configuration and functional configuration of the
操作パネル11は、表示部12と、操作部13とを備えている。表示部12は、例えばカラー液晶ディスプレイで構成され、ユーザーが操作可能な各種の操作画面を表示する。操作部13は、例えばタッチパネルキーや押しボタンキーなどによって構成され、ユーザーによる手動操作を受け付ける。
The
通信インタフェース14は、画像処理装置2をローカルネットワーク4に接続するためのものである。画像処理装置2は、この通信インタフェース14を介してローカルネットワーク4に接続されている様々な機器と通信を行うことができる。また、画像処理装置2は、この通信インタフェース14を介して、制御装置8から送信されるコマンドD4を受信する。
The
記憶部15は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などによって構成される不揮発性の記憶デバイスである。この記憶部15には、操作パネル11の表示部12に表示するための画面情報16が記憶される。この画面情報16は、表示部12に表示するための複数の操作画面に関する情報や、各操作画面に含まれる設定項目等に関する情報、複数の操作画面を階層構造として定義した情報などが含まれる。尚、記憶部15には、この他にも制御部10のCPUによって実行されるプログラムや各種データなどが記憶される。
The
スキャナ部17は、ユーザーによってセットされる原稿を光学的に読み取って画像データを生成する。スキャナ部17は、制御部10によって設定されるジョブ設定(原稿の読み取り設定など)に基づいて原稿の読み取り動作を行う。例えば、ジョブ設定において原稿の両面読み取りが指定されている場合、スキャナ部17は、原稿の表裏両面に対する読み取り動作を行う。
The
プリンタ部18は、入力する画像データに基づいて印刷用紙などのシート材に画像形成を行うことにより印刷出力を行う。プリンタ部18は、制御部10によって設定されるジョブ設定(原稿の読み取り設定など)に基づく印刷出力を行う。例えば、ジョブ設定において両面印刷が指定されている場合、プリンタ部18は、シート材の表裏両面に対して画像形成を行う。
The
FAX部は、図示を省略する公衆電話網を介してFAXデータの送受信を行うものである。 The FAX unit transmits and receives FAX data via a public telephone network (not shown).
制御部10は、パネル制御部20とジョブ制御部21とを備えている。操作パネル11に関する制御を行うとき、制御部10は、パネル制御部20を機能させる。また、ジョブの設定又は実行に関する制御を行うとき、制御部10は、ジョブ制御部21を機能させる。
The
パネル制御部20は、操作パネル11の表示部12に表示する操作画面を制御したり、操作部13に対して行われるユーザーの手動操作を受け付けたりする。例えば、パネル制御部20は、記憶部15に記憶されている画面情報16に基づき、表示部12に表示している操作画面をユーザーの操作に基づいて更新したり、遷移させたりする。尚、パネル制御部20は、ユーザーが操作パネル11を手動操作していない状態が所定時間以上継続すると、表示部12に対する給電を停止し、操作パネル11を省電力モードへと移行させる。
The
ジョブ制御部21は、ジョブの設定及び実行を統括的に制御する。ジョブ制御部21は、ジョブ設定部22を備えている。ジョブ設定部22は、ジョブの設定を行う処理部である。すなわち、ジョブ設定部22は、コピー機能などの複数の機能のうちのユーザーが使用しようとする機能を特定し、その特定した機能に対する各種設定項目の設定値をデフォルト値からユーザーによって指定された値に変更し、ジョブの設定を行う。
The
例えば、ユーザーが操作パネル11に対する手動操作を行ってジョブの設定を行う場合、操作パネル11の表示部12には、パネル制御部20によって各種の操作画面が表示される。ユーザーはその操作画面に対する操作を順次行っていくことで所望のジョブ設定を行う。このようにユーザーが操作パネル11に対する手動操作を行っているとき、ジョブ設定部22は、パネル制御部20から出力される操作情報に基づいてジョブの設定を行う。
For example, when a user manually operates the
また、ユーザーが画像処理装置2を操作するための音声を発した場合、制御部10は、通信インタフェース14を介して制御装置8から送信されるコマンドD4を受信する。制御部10は、そのコマンドD4を解析して制御装置8からの指示を特定する。その指示がジョブの設定を反映させるための設定反映指示である場合、ジョブ設定部22は、その設定反映指示に基づいてジョブの設定を行う。
Further, when the user makes a sound to operate the
またジョブ制御部21は、ユーザーによってジョブの実行が指示された場合、スキャナ部17、プリンタ部18及びFAX部19のそれぞれを駆動し、ユーザーによって指定されたジョブを実行する。
Further, when the job execution is instructed by the user, the
次に図4は、制御装置8のハードウェア構成及び機能構成を示す図である。制御装置8は、図4(a)に示すように、そのハードウェア構成として、制御部40と、記憶部41と、通信インタフェース42とを備えている。
Next, FIG. 4 is a diagram showing the hardware configuration and functional configuration of the
制御部40は、CPU43とメモリ44とを備えている。CPU43は、記憶部41に記憶されているプログラム25を読み出して実行する演算処理ユニット(プロセッサー)である。メモリ44は、CPU43がプログラム25を実行することに伴って発生する一時的なデータなどを記憶する。
The
記憶部41は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などで構成される不揮発性の記憶デバイスである。この記憶部41には、画像処理装置2を制御するためのプログラム25と、キーワード情報26と、優先順位情報27とが予め記憶される。
The
通信インタフェース42は、制御装置8が他の機器と通信を行うためのものである。例えば、制御部40は、この通信インタフェース42を介して音声認識装置7から出力されるテキストD2を受信することができる。また、制御部40は、通信インタフェース42を介して案内情報D3を音声認識装置7へ送信したり、また、コマンドD4をローカル環境に設置されている画像処理装置2へ送信したりすることができる。
The
制御部40のCPU43は、記憶部41のプログラム25を読み出して実行することにより、図4(b)に示すように、制御部40を、設定特定部31、案内情報出力部32及び装置制御部33として機能させる。
The
設定特定部31は、音声認識装置7から出力されるテキストD2に基づいて画像処理装置2に反映すべき設定を特定する処理部である。設定特定部31は、設定候補抽出部34を備えている。設定候補抽出部34は、テキストD2に対応する設定候補を抽出する。設定候補抽出部34は、テキストD2を受信することに伴って機能し、記憶部41に記憶されているキーワード情報26に基づいて設定候補を抽出する。
The
図5は、キーワード情報26の一例を示す図である。キーワード情報26は、図5に示すように、画像処理装置2に対して設定可能な設定項目及び設定値に対してキーワードが対応付けられた情報であり、画像処理装置2の装置モデルごとに定義される情報である。キーワードは、画像処理装置2に対して各種の設定を行うことが可能なワードであり、例えば、各設定項目の設定値に対応している。ただし、図5に示すように、キーワード情報26には、同じキーワードが異なる設定項目に登録されていることもある。例えば、図5に示すキーワード情報26では、「リョウメン」というキーワードが、コピー機能設定時にスキャナ部17に対して原稿の両面読み取りを指示するキーワードと、コピー機能設定時にプリンタ部18に対して両面印刷を指示するキーワードと、スキャン機能設定時にスキャナ部17に対して原稿の両面読み取りを指示するキーワードと、プリント機能設定時にプリンタ部18に対して両面印刷を指示するキーワードとの4つの設定項目に対して登録されている。
FIG. 5 is a diagram showing an example of the
設定候補抽出部34は、ユーザーの音声に基づいて変換されたテキストD2に基づいてキーワード情報26を検索することにより、テキストD2に一致するキーワードがキーワード情報26に登録されているか否かを判断する。そして設定候補抽出部34は、テキストD2に一致するキーワードがキーワード情報26に登録されている場合、テキストD2に一致するキーワードが登録されている設定項目と設定値との組み合わせを設定候補として抽出する。そのため、設定候補抽出部34は、テキストD2に対応する設定候補として、1つの設定候補を抽出することもあれば、また複数の設定候補を抽出することもある。例えば、ユーザーが「リョウメン」という音声を発した場合、設定候補抽出部34は、図5に示すキーワード情報26を参照すると、4つの設定候補を抽出することになる。また、設定候補抽出部34は、テキストD2に対応する設定候補を1つも抽出することができないこともある。
The setting
また、設定候補抽出部34は、画像処理装置2に対する現在の設定状態を把握しており、上記のようにして抽出した設定候補が、現在の設定状態に対する禁則条件を満たす場合には、その設定候補を除外する。例えば、画像処理装置2がスキャン機能において原稿を読み取って生成した画像データをコンパクトPDFとして出力する際にモノクロ出力を選択することができない設定となっている場合において、ユーザーが既に「モノクロ出力」を設定している状態で「PDF」という音声を発したと仮定する。この場合、設定候補抽出部34は、設定候補として、例えば、PDF、暗号化PDF、PDFA、サーチャブルPDF、コンパクトPDFといった5つの設定候補を抽出する。しかし、ユーザーが既に「モノクロ出力」を設定しているため、コンパクトPDFが禁則条件を満たす設定候補となり、設定候補抽出部34は、コンパクトPDFを設定候補から除外する。その結果、設定候補抽出部34は、PDF、暗号化PDF、PDFA、及び、サーチャブルPDFの4つの設定候補を抽出することになる。
Further, the setting
設定特定部31は、設定候補抽出部34によって設定候補が抽出されなかった場合、案内情報出力部32及び装置制御部33を機能させることなく処理を終了する。ただし、この場合、設定特定部31は、案内情報出力部32を機能させ、案内情報出力部32に「設定項目を特定することができませんでした」という案内情報D3を生成させ、音声認識装置7を介して音声入出力装置3へ出力させるようにしても構わない。
If the setting
一方、設定候補抽出部34によって1つの設定候補が抽出された場合、設定特定部31は、その1つの設定候補を、画像処理装置2に反映すべき設定として特定することができる。この場合、設定特定部31は、案内情報出力部32及び装置制御部33を機能させ、案内情報出力部32及び装置制御部33のそれぞれに対して画像処理装置2に反映すべき設定を通知する。
On the other hand, when one setting candidate is extracted by the setting
また、設定候補抽出部34によって複数の設定候補が抽出された場合にも、設定特定部31は、案内情報出力部32及び装置制御部33を機能させる。そして設定特定部31は、設定候補抽出部34によって抽出された複数の設定候補を、案内情報出力部32及び装置制御部33のそれぞれへ通知する。このとき、設定特定部31は、設定候補抽出部34によって抽出された設定候補の数が所定数(例えば、「3」)以上であるか否かを判断する。そして所定数以上の設定候補が抽出されている場合、設定特定部31は、案内情報出力部32及び装置制御部33のそれぞれに対して設定候補が所定数以上であることを通知する。尚、所定数は、「3」に限られるものではなく、2以上の値であれば良い。
Further, even when a plurality of setting candidates are extracted by the setting
案内情報出力部32は、ユーザーに対して音声案内を行うための各種の案内情報D3をテキストデータとして生成し、その案内情報D3を音声認識装置7へ送信する処理部である。例えば、案内情報出力部32は、設定特定部31から出力される設定候補を音声案内のためのテキストデータとして表現した案内情報D3を生成する。設定候補抽出部34によって1つの設定候補が抽出された場合、案内情報出力部32は、その1つの設定候補をテキストデータで表した案内情報D3を生成する。また、設定候補抽出部34によって複数の設定候補が抽出されており、それら設定候補の数が所定数未満である場合、案内情報出力部32は、それら複数の設定候補を1つずつ順番に音声出力するために各設定候補のテキストデータを配列した案内情報D3を生成する。
The guidance
さらに、設定候補抽出部34によって複数の設定候補が抽出されており、それら設定候補の数が所定数以上である場合、案内情報出力部32は、設定モードに応じた処理を行う。設定モードには、案内情報D3を生成しない第1のモードと、複数の設定候補を1つずつ順番に音声出力するための案内情報D3を生成する第2のモードと、ユーザーに操作パネル11の確認を促すための案内情報D3を生成する第3のモードとの3つのモードがある。案内情報出力部32には、それら3つのモードのうちから、ユーザーによって予め選択されたモードが設定されている。例えば、第1のモードが設定されている場合、案内情報出力部32は、案内情報D3を出力しない。また、第2のモードが設定されている場合、案内情報出力部32は、所定数未満の設定候補が抽出された場合と同様に、所定数以上の設定候補を1つずつ順番に音声出力するための案内情報D3を生成して音声認識装置7へ出力する。さらに第3のモードが設定されている場合、案内情報出力部32は、例えば「操作パネルの表示画面を確認してください」といったテキストデータの案内情報D3を生成して音声認識装置7へ出力する。
Furthermore, if a plurality of setting candidates have been extracted by the setting
尚、第2のモードと第3のモードは、案内情報出力部32において同時に設定されていても構わない。第2のモードと第3のモードとが同時に設定されている場合、案内情報出力部32は、例えば「操作パネルの表示画面を確認してください」といったテキストデータの次に複数の設定候補のそれぞれに対応するテキストデータを配列した案内情報D3を生成する。
Note that the second mode and the third mode may be set at the same time in the guide
装置制御部33は、画像処理装置2に対して各種のコマンドD4を送信することにより、画像処理装置2を制御する処理部である。この装置制御部33は、表示制御部35と、設定反映部36とを備えている。表示制御部35は、画像処理装置2の操作パネル11に表示される操作画面を制御するものである。設定反映部36は、画像処理装置2に対するユーザーが所望する設定を反映させる処理部である。
The
装置制御部33は、設定特定部31において画像処理装置2に反映すべき設定が特定された場合、設定反映部36を機能させる。すなわち、設定反映部36は、音声認識結果に基づいて1つの設定候補だけが抽出された場合に機能する。そして設定反映部46は、設定特定部31において特定された設定を画像処理装置2に反映させるためのコマンドD4を生成し、画像処理装置2へ送信する。画像処理装置2は、そのコマンドD4を受信すると、設定反映部36によって指定された設定を反映させる。つまり、画像処理装置2は、ユーザーの音声に対応する設定を自動的に行うのである。そのため、ユーザーは、操作パネル11に対する操作を行わなくても、画像処理装置2に対して所望の設定を行うことができる。
The
一方、設定候補抽出部34によって複数の設定候補が抽出され、設定特定部31において画像処理装置2に反映すべき設定を特定することができなかった場合、設定反映部36は、コマンドD4を生成しない。
On the other hand, if the setting
また、装置制御部33は、設定特定部31において所定数以上の設定候補が抽出された場合、表示制御部35を機能させる。表示制御部35は、設定特定部31において音声認識結果に対応する複数の設定候補が存在すると判定された場合に、ユーザーに対してそれら複数の設定候補を提示する制御手段である。表示制御部35は、設定特定部31において所定数以上の設定候補が抽出された場合に、それら所定数以上の設定候補を画像処理装置2の操作パネル11に表示させるためのコマンドD4を生成し、画像処理装置2へ送信する。画像処理装置2は、このコマンドD4を受信すると、音声認識結果に対応して抽出された所定数以上の設定候補を表示した選択画面を生成し、その選択画面を操作パネル11の表示部12に表示する。このとき、画像処理装置2において生成される選択画面には、制御装置8において抽出された所定数以上の設定候補のそれぞれに対応する設定項目が含まれる。そのため、ユーザーは、画像処理装置2の操作パネル11に表示される選択画面を確認することにより、自身が発した音声に対応する複数の設定項目を簡単且つ速やかに把握することができ、それらの複数の設定項目のうちから所望の設定項目を効率的に選択することができる。
Furthermore, when the
また、表示制御部35は、所定数以上の設定候補が抽出された場合、それら所定数以上の設定項目を所定の優先順位に従って表示させるためのコマンドD4を生成する。そのため、表示制御部35は、所定数以上の設定候補が抽出された場合、優先順位情報27を参照する。優先順位情報27は、複数の設定項目に対する優先順位が予め定められた情報である。例えば、優先順位は、ユーザーによる設定頻度が高い順に予め定められる。また、優先順位は、各設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められたものであっても構わない。この場合、例えば、トップ画面からの階層が浅い設定候補の優先順位が高くなり、トップ画面からの階層が深い設定項目の優先順位が低くなるように予め定められる。
Further, when a predetermined number or more setting candidates are extracted, the
また、表示制御部35は、選択画面として、所定数以上の設定候補のそれぞれに対応するサムネイル画像を配置した画面を画像処理装置2に生成させるようにしても良い。この場合、表示制御部35は、優先順位情報27において規定された優先順位に基づいて選択画面に表示するサムネイル画像の画像サイズを変化させるようにしても良い。例えば、優先順位の高い設定候補に対応するサムネイル画像の画像サイズを、優先順位の低い設定候補に対応するサムネイル画像の画像サイズよりも大きいサイズとすることで、ユーザーにとって優先順位の高い設定候補を選択しやすい画面とすることができる。
Further, the
尚、案内情報出力部32は、第2のモードが設定されている場合において、所定数以上の設定候補を1つずつ順番に音声出力するための案内情報D3を生成するとき、上記と同様に、優先順位情報27に規定された優先順位に基づき、優先順位の高い設定候補から順に音声出力されるようにテキストデータを配列した案内情報D3を生成するようにしても良い。
Note that when the second mode is set, the guidance
次に、制御装置8及び画像処理装置2における連携動作の流れについて説明する。まず図6は、制御装置8が音声認識結果に基づいて画像処理装置2に反映すべき設定を特定することができた場合の流れを示す図である。制御装置8は、音声認識装置7から出力されるテキストD2を取得すると、テキストD2に基づいて画像処理装置2に対する設定候補を抽出する処理を行う(プロセスP10)。このとき、テキストD2に基づいて1つの設定候補が抽出することができると、制御装置8は、その1つの設定候補が画像処理装置2に反映すべき設定内容であると特定することができる(プロセスP11)。そして制御装置8は、特定した設定を含む設定反映指示D41を、コマンドD4として画像処理装置2へ送信する。
Next, the flow of cooperative operations in the
画像処理装置2は、制御装置8から設定反映指示D41を受信すると、その設定反映指示D41に基づき、設定反映処理を行う(プロセスP12)。すなわち、画像処理装置2は、ユーザーが音声で指示した設定を装置内部に反映させるのである。したがって、ユーザーは、操作パネル11に対する手動操作を行うことなく、画像処理装置2に対する各種設定を行うことができる。
When the
次に図7は、制御装置8が音声認識結果に基づいて所定数以上の設定候補を抽出した場合の流れを示す図である。制御装置8は、音声認識装置7から出力されるテキストD2を取得すると、テキストD2に基づいて画像処理装置2に対する設定候補を抽出する処理を行う(プロセスP10)。このとき、テキストD2に基づいて所定数以上の設定候補を抽出すると、制御装置8は、画像処理装置2に反映すべき設定を特定することができない。そのため、制御装置8は、所定数以上の設定候補のうちからユーザーが所望する設定候補の選択を促すための選択画面表示指示D42を、コマンドD4として画像処理装置2へ送信する。この選択画面表示指示D42には、音声認識結果に基づいて抽出された所定数以上の設定候補を示す情報が含まれる。また、選択画面表示指示D42には、上述したように、所定数以上の設定候補を所定の優先順位に従って表示させるための指示が含まれていても良い。
Next, FIG. 7 is a diagram showing a flow when the
画像処理装置2は、制御装置8から選択画面表示指示D42を受信すると、その選択画面表示指示D42に基づき、所定数以上の設定候補を配置した選択画面を生成し、操作パネル11の表示部12に選択画面を表示する(プロセスP13)。これにより、ユーザーは、自身で発した音声に対応する設定候補が所定数以上存在する場合であっても、操作パネル11の表示部12に表示される選択画面を見ることにより、所定数以上の設定候補のうちから所望の設定候補を速やかに選択することができる。そのため、仮に音声入出力装置3が所定数以上の設定候補を順番に音声出力している状態であっても、ユーザーは、音声入出力装置3による音声出力の途中で所望の設定候補を選択することが可能であり、画像処理装置2に対する設定に要する時間を短縮することができる。また、ユーザーは、操作パネル11に表示される選択画面を確認した後、所望の設定候補を手動操作によって選択することができるし、また音声操作によって選択することもできる。
When the
次に、制御装置8において行われる処理手順について詳しく説明する。図8乃至図10は、制御装置8において行われる処理手順の一例を示すフローチャートである。この処理は、制御装置8のCPU43がプログラム25を実行することによって行われる処理であり、CPU43によって繰り返し実行される処理である。
Next, the processing procedure performed in the
制御装置8は、この処理を開始すると、図8に示すように、音声認識装置7による音声認識結果であるテキストD2を受信したか否かを判断する(ステップS10)。音声認識結果を受信していない場合(ステップS10でNO)、制御装置8による処理は終了する。これに対し、音声認識結果を受信した場合(ステップS10でYES)、制御装置8は、テキストD2に付加されている装置情報に基づき、画像処理装置2の装置モデルを特定し(ステップS11)、その装置モデルに対応するキーワード情報26を読み出す(ステップS12)。そして制御装置8は、設定候補抽出処理を実行する(ステップS13)。
When the
図9は、設定候補抽出処理(ステップS13)の詳細な処理手順の一例を示すフローチャートである。制御装置8は、設定候補抽出処理を開始すると、ステップS12で読み出したキーワード情報26を参照し、テキストD2に対応する設定候補を全て抽出する(ステップS20)。このとき、1つの設定候補だけが抽出されることもあれば、複数の設定候補が抽出されることもある。また、設定候補が1つも抽出されないこともある。設定候補が1つも抽出されなかった場合、制御装置8による処理はその時点で終了する。
FIG. 9 is a flowchart illustrating an example of a detailed processing procedure of the setting candidate extraction process (step S13). When the
ステップS20において少なくとも1つの設定候補が抽出された場合、制御装置8は、ユーザーによって既に指定された現在の設定状態を確認し(ステップS21)、禁則判定を行う(ステップS22)。すなわち、制御装置8は、ステップS20で抽出した少なくとも1つの設定候補の中に、現在の設定状態に対する禁則条件を満たす設定候補が存在するか否かを判定する。その結果、禁則条件に合致する設定候補が存在する場合(ステップS23でYES)、制御装置8は、禁則条件に合致する設定候補を除外する(ステップS24)。尚、禁則条件に合致する設定候補を除外した結果、設定候補が1つの残らないこととなった場合、制御装置8による処理はその時点で終了する。一方、禁則条件に合致する設定候補が存在しない場合(ステップS23でNO)、制御装置8は、ステップS20で抽出した設定候補を、有効な設定候補として認定する。以上で、設定候補抽出処理が終了する。
If at least one setting candidate is extracted in step S20, the
図8のフローチャートに戻り、次に制御装置8は、設定候補抽出処理(ステップS13)において1つの設定候補だけが抽出されたか否かを判断する(ステップS14)。1つの設定候補だけが抽出された場合(ステップS14でYES)、制御装置8は、その1つの設定候補を、画像処理装置2に反映すべき設定として特定することができる。この場合、制御装置8は、画像処理装置2に対して設定反映指示D41を送信する(ステップS15)。つまり、制御装置8は、音声認識結果に基づいて特定した設定を画像処理装置2に反映させるのである。そして制御装置8は、画像処理装置2に反映させた設定をユーザーに音声案内するための案内情報D3をテキストデータとして生成し(ステップS16)、その案内情報D3を音声認識装置7へ送信する(ステップS17)。これにより、音声認識装置7は、テキストデータで表現された案内情報D3を音声情報に変換し、音声情報に変換した案内情報D3を音声入出力装置3へ送信する。そして音声入出力装置3は、音声情報に変換された案内情報D3に基づく音声出力を行うので、画像処理装置2に反映された設定をユーザーに報知することができる。ユーザーは、音声入出力装置3から出力される音声を聞くことにより、自身で発した音声が正しく認識され、所望の設定がなされたか否かを確認することができる。
Returning to the flowchart of FIG. 8, next, the
一方、設定候補抽出処理(ステップS13)において複数の設定候補が抽出された場合(ステップS14でNO)、制御装置8は、設定候補提示処理を行う(ステップS18)。図10は、その設定候補提示処理(ステップS18)の詳細な処理手順の一例を示すフローチャートである。制御装置8は、設定候補提示処理を開始すると、まず音声認識結果に基づいて抽出された設定候補の数を確認する(ステップS30)。そして制御装置8は、所定数以上の設定候補が抽出されたか否かを判断する(ステップS31)。
On the other hand, if a plurality of setting candidates are extracted in the setting candidate extraction process (step S13) (NO in step S14), the
所定数以上の設定候補が抽出された場合(ステップS31でYES)、制御装置8は、優先順位情報27を読み出し(ステップS32)、優先順位情報27に予め定められている優先順位に基づいて所定数以上の設定候補の優先順位を決定する(ステップS33)。そして制御装置8は、決定した優先順位に基づいて所定数以上の設定候補を表示させるための選択画面表示指示D42を生成し、その選択画面表示指示D42を画像処理装置2へ送信する(ステップS34)。また、制御装置8は、設定モードに応じてユーザーに対する音声案内を行うための案内情報D3をテキストデータとして生成し(ステップS35)、その案内情報D3を音声認識装置7へ送信する(ステップS36)。尚、制御装置8における設定モードが第1のモードであれば、ステップS35、S36の処理は行われず、音声入出力装置3による音声出力は行われない。
If a predetermined number or more of setting candidates are extracted (YES in step S31), the
一方、所定数以上の設定候補が抽出されていない場合(ステップS31でNO)、制御装置8は、抽出された複数の設定候補を順番に音声出力するための案内情報D3をテキストデータとして生成し(ステップS37)、その案内情報D3を音声認識装置7へ送信する(ステップS38)。つまり、本実施形態における制御装置8は、音声認識結果に基づいて抽出された設定候補の数が所定数未満であれば、複数の設定候補を順番に音声出力したとしても、音声出力が終了するまでにそれ程長い時間を要しないため、画像処理装置2の操作パネル11には選択画面を表示させないようにしている。そのため、ユーザーが画像処理装置2から離れた場所で音声操作を行っている場合には、操作パネル11に対して無駄な表示を行わなくて済み、操作パネル11が省電力モードであれば、その省電力モードを継続することができる。
On the other hand, if the predetermined number or more of setting candidates have not been extracted (NO in step S31), the
尚、上記においては、制御装置8が、画像処理装置2に対するコマンドD4として、設定反映指示D41と選択画面表示指示D42を送信する場合を例示したが、これらは単なる一例である。すなわち、制御装置8は、設定反映指示D41及び選択画面表示指示D42以外にも、様々なコマンドD4を生成することができる。例えば、制御装置8は、ユーザーによる指示がジョブの実行指示である場合には、ジョブ実行指示をコマンドD4として生成する。
In addition, although the case where the
次に画像処理装置2における処理手順について説明する。図11は、画像処理装置2において行われる処理手順の一例を示すフローチャートである。尚、図11では、画像処理装置2が制御装置8からコマンドを受信した場合の処理手順のみを示している。画像処理装置2は、この処理を開始すると、制御装置8からコマンドD4を受信したか否かを判断する(ステップS40)。制御装置8からコマンドD4を受信していない場合(ステップS40でNO)、画像処理装置2による処理は終了する。一方、制御装置8からコマンドD4を受信している場合(ステップS40でYES)、画像処理装置2は、受信したコマンドD4が設定反映指示D41であるか否かを判断する(ステップS41)。コマンドD4が設定反映指示D41である場合(ステップS41でYES)、画像処理装置2は、ジョブ設定部22を機能させ、設定反映指示D41に基づく設定を反映させたジョブ設定を行う(ステップS42)。
Next, the processing procedure in the
また、コマンドD4が設定反映指示D41でなかった場合(ステップS41でNO)、画像処理装置2は、コマンドD4が選択画面表示指示D42であるか否かを判断する(ステップS43)。コマンドD4が選択画面表示指示D42である場合(ステップS43でYES)、画像処理装置2は、パネル制御部20を機能させ、所定数以上の設定候補を表示するための選択画面を生成する(ステップS44)。このとき、パネル制御部20は、選択画面表示指示D42において所定数以上の設定候補のそれぞれに対して優先順位が設定されていれば、その優先順位に基づいて所定数以上の設定候補をレイアウトした選択画面を生成する。そしてパネル制御部20は、選択画面表示指示D42に基づいて生成した選択画面を操作パネル11の表示部12に表示する(ステップS45)。例えば、制御装置8からコマンドD4を受信した時点において操作パネル11が省電力モードである場合、パネル制御部20は、表示部12への給電を開始して選択画面を表示する。この場合、パネル制御部20は、選択画面の表示開始から所定時間が経過するまでの間、表示部12を点滅表示させることでユーザーが操作パネル11を注目できるように注意喚起を行うようにしても良い。尚、このような注意喚起は、例えばスピーカーから所定のビープ音などを発することで実現しても良い。
Further, if the command D4 is not a setting reflection instruction D41 (NO in step S41), the
図12は、操作パネル11の表示部12に表示される選択画面G10の一例を示す図である。制御装置8においてユーザーの音声認識結果に基づく設定候補として所定数以上の設定候補が抽出された場合、画像処理装置2は、操作パネル11の表示部12に対して図12に示すような選択画面G10を表示する。図12では、ユーザーが「リョウメン」という音声を発した場合の選択画面G10の一例を示している。この選択画面G10には、所定数以上の設定候補を表示するための設定候補表示領域R1が含まれており、その設定候補表示領域R1に、所定数以上の設定候補のそれぞれに対応するサムネイル画像61,62,63,64が表示される。これらのサムネイル画像61,62,63,64の画像サイズは、制御装置8において決定された優先順位に基づくサイズとなっている。ここで、優先順位がユーザーによる設定頻度の高いものから順に設定されているとすると、ユーザーは、画像サイズの最も大きいサムネイル画像62が最も設定頻度の高い設定項目であることを把握することができる。つまり、選択画面G10は、ユーザーにとって設定頻度の高い設定項目を選択しやすい画面となっているのである。したがって、ユーザーは、音声入出力装置3から出力される音声案内を全て聞かなくても、設定頻度の高い設定項目を効率的に選択することが可能である。
FIG. 12 is a diagram showing an example of the selection screen G10 displayed on the
図12に示す選択画面G1が表示されているとき、ユーザーは、所望の設定候補を選択する操作として操作パネル11に対する手動操作を行うことができる。例えば、ユーザーは、複数のサムネイル画像61,62,63,64のうちから所望の設定候補に対応するサムネイル画像をタッチし、選択画面G10内の操作ボタンB1を操作することにより、一の設定候補を選択することができる。尚、ユーザーは、手動操作だけでなく、音声を発することによって所望の設定候補を選択することもできる。
When the selection screen G1 shown in FIG. 12 is displayed, the user can manually operate the
図13は、図12とは異なる選択画面G11の例を示す図である。制御装置8においてユーザーの音声認識結果に基づく設定候補として所定数以上の設定候補が抽出された場合、画像処理装置2は、操作パネル11の表示部12に対して図13に示すような選択画面G11を表示しても良い。図13でも、ユーザーが「リョウメン」という音声を発した場合の選択画面G11の例を示している。この選択画面G11においても、所定数以上の設定候補を表示するための設定候補表示領域R1が含まれており、その設定候補表示領域R1に、所定数以上の設定候補のそれぞれがリスト形式で表示される。所定数以上の設定候補のリストは、例えば優先順位の高いものからリストの上位に表示される。したがって、ユーザーは、音声入出力装置3から出力される音声案内を全て聞かなくても、優先順位の高い設定項目を効率的に選択することが可能である。尚、図13では、複数の設定候補のうちから、ユーザーがコピー機能のプリンタ部18に対する両面印刷をオンに設定することを選択した場合を例示している。
FIG. 13 is a diagram showing an example of a selection screen G11 different from that in FIG. 12. When the
図11のフローチャートに戻り、画像処理装置2は、受信したコマンドD4が選択画面表示指示D42でなかった場合(ステップS43でNO)、ジョブの実行指示であるか否かを判断する(ステップS46)。コマンドD4がジョブの実行指示である場合(ステップS46でYES)、画像処理装置2は、ジョブ制御部21を機能させ、ユーザーによって指定されたジョブの実行を開始する(ステップS47)。
Returning to the flowchart of FIG. 11, if the received command D4 is not a selection screen display instruction D42 (NO in step S43), the
一方、受信したコマンドD4がジョブの実行指示でもなかった場合(ステップS46でNO)、画像処理装置2は、受信したコマンドD4に基づき、上述した処理以外のその他の処理を実行する(ステップS48)。以上で、画像処理装置2による処理が終了する。
On the other hand, if the received command D4 is not a job execution instruction (NO in step S46), the
以上のように、本実施形態の制御システム1は、クラウド5上に設置されている制御装置8が、ユーザーの発した音声に基づいて画像処理装置2を遠隔制御するように構成されている。そして、本実施形態の制御装置8は、ユーザーの発した音声に対応する設定候補として、所定数以上の設定候補を抽出すると、画像処理装置2の操作パネル11に、それら所定数以上の設定候補を表示させるようにしている。そのため、本実施形態の制御装置8は、所定数以上の設定候補を抽出した場合に、それらの所定数以上の設定候補を順番に音声でユーザーに聞かせなくても、所定数以上の設定候補を視認させることで、ユーザーに効率的に所望の設定候補を選択させることができる。それ故、ユーザーが所望の設定候補を選択するまでの時間を短縮することが可能であり、画像処理装置2が一人のユーザーによって占有されてしまう時間を短くすることができる。
As described above, the control system 1 of this embodiment is configured such that the
以上、本発明に関する好ましい実施形態について説明したが、本発明は、上記実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to the contents described in the above embodiments, and various modifications can be applied.
例えば、上記各実施形態では、音声認識装置7と制御装置8とが別体である場合を例示した。しかし、本発明は、音声認識装置7と制御装置8とが別体であるものに限られるものではない。例えば、制御装置8は、音声認識装置7と一体的に構成されるものであっても構わない。
For example, in each of the above embodiments, the
また、上記実施形態では、制御装置8がクラウド5上にサーバーとして設置される場合を説明したが、これに限られるものではない。例えば、制御装置8は、ローカル環境に設置されるサーバーであっても構わない。また、制御装置8は、画像処理装置2の内部に設けられるものであっても構わない。画像処理装置2に制御装置8が設けられる場合、その制御装置8は、上述のように音声認識装置7の機能を更に備えたものであっても構わない。
Further, in the above embodiment, a case has been described in which the
また、上記実施形態では、音声入出力装置3と画像処理装置2とが別体である場合を例示した。しかし、本発明は、それに限られるものでもない。すなわち、画像処理装置2は、上述した音声入出力装置3の機能を備えているものであっても構わない。
Further, in the above embodiment, the case where the audio input/
また、上記実施形態では、音声入出力装置3は、音声の入出力を行う装置である場合を例示した。しかし、音声入出力装置3は、音声の入力のみを行う装置であっても構わない。この場合、上述した音声入出力装置3は、音声入力装置としてのみ機能する。
Further, in the above embodiment, the audio input/
また、上記実施形態では、制御装置8の記憶部41に予めプログラム25がインストールされている場合を例示した。しかし、プログラム25は、例えば通信インタフェース42などを介して制御装置8にインストールされるものであっても構わない。この場合、プログラム25は、インターネットなどを介してダウンロード可能な態様で提供される。また、これに限らず、プログラム25は、CD-ROMやUSBメモリなどのコンピュータ読み取り可能な記録媒体に記録された態様で提供されるものであっても構わない。
Further, in the embodiment described above, the case where the
1 制御システム
2 画像処理装置
3 音声入出力装置
7 音声認識装置
8 制御装置
25 プログラム
31 設定特定部(設定特定手段)
32 案内情報出力部(案内情報出力手段)
33 装置制御部
34 設定候補抽出部
35 表示制御部(制御手段)
36 設定反映部
1
32 Guidance information output unit (guidance information output means)
33
36 Setting reflection section
Claims (32)
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御装置。 A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means outputs the guidance information for audio guidance of the setting candidates that are less than the predetermined number, when the setting identification means determines that the number of the setting candidates is less than a predetermined number. Characteristic control device.
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御装置。 A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guide information output means is characterized in that, when the setting specifying means determines that a predetermined number or more of setting candidates exist, the guide information output means outputs the guide information for audio guidance of the predetermined number or more of setting candidates. Control device.
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする制御装置。 A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means is configured to output the guidance for audio guidance that prompts the user to check a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. A control device characterized by outputting information .
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする制御装置。 A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The control device is characterized in that the guidance information output means does not output the guidance information when the setting identification means determines that a predetermined number or more of setting candidates exist .
前記制御手段は、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする請求項1乃至5のいずれかに記載の制御装置。 The image processing device has a display means,
6. The control device according to claim 1, wherein the control means presents the plurality of setting candidates by displaying them on the display means.
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための案内情報を出力することを特徴とする制御システム。 an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guide information output means is characterized in that, when the setting specifying means determines that the number of setting candidates is less than a predetermined number, the guide information output means outputs guide information for providing voice guidance for the setting candidates that are less than the predetermined number. control system.
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための案内情報を出力することを特徴とする制御システム。 an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
Control characterized in that the guidance information output means outputs guidance information for audio guidance of the predetermined number or more setting candidates when the setting specifying means determines that there are more than a predetermined number of setting candidates. system.
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための案内情報を出力することを特徴とする制御システム。 an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
a control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means is configured to output guidance information for audio guidance that prompts the user to check a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. A control system characterized by outputting .
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、案内情報を出力しないことを特徴とする制御システム。 an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The control system is characterized in that the guide information output means does not output the guide information when the setting specifying means determines that a predetermined number or more of setting candidates exist .
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ、
前記案内情報出力ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御プログラム。 A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The guidance information output step outputs the guidance information for audio guidance of the setting candidates that are less than the predetermined number, when it is determined in the setting specifying step that the number of setting candidates is less than a predetermined number. Characteristic control program.
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ、
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記複数の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御プログラム。 A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The control program is characterized in that the guidance information output step outputs the guidance information for audio guidance of the plurality of setting candidates when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates. .
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ、
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする制御プログラム。 A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The guidance information output step includes, when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates, the guidance for audio guidance prompting the user to check a display means provided in the image processing device. A control program characterized by outputting information .
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ、
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする制御プログラム。 A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The control program is characterized in that the guidance information output step does not output the guidance information if it is determined in the setting identification step that a predetermined number or more of setting candidates exist .
前記制御ステップは、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする請求項20乃至24のいずれかに記載の制御プログラム。 The image processing device has a display means,
25. The control program according to claim 20, wherein the control step presents the plurality of setting candidates by displaying them on the display means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019225082A JP7447458B2 (en) | 2019-12-13 | 2019-12-13 | Control device, control system and control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019225082A JP7447458B2 (en) | 2019-12-13 | 2019-12-13 | Control device, control system and control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021096493A JP2021096493A (en) | 2021-06-24 |
JP7447458B2 true JP7447458B2 (en) | 2024-03-12 |
Family
ID=76431381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019225082A Active JP7447458B2 (en) | 2019-12-13 | 2019-12-13 | Control device, control system and control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7447458B2 (en) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250587A (en) | 1999-03-01 | 2000-09-14 | Hitachi Ltd | Voice recognition device and voice recognizing and translating device |
JP2002355486A (en) | 2001-06-01 | 2002-12-10 | Toshiba Corp | Washing machine |
JP2003051887A (en) | 2001-08-06 | 2003-02-21 | Minolta Co Ltd | Control system and control method |
JP2004045616A (en) | 2002-07-10 | 2004-02-12 | Equos Research Co Ltd | On-board device, data preparation device and data preparation program |
JP2007206886A (en) | 2006-01-31 | 2007-08-16 | Canon Inc | Information processor and method |
JP2009252238A (en) | 2008-04-08 | 2009-10-29 | Lg Electronics Inc | Mobile terminal and its menu control method |
US20120303267A1 (en) | 2009-07-27 | 2012-11-29 | Robert Bosch Gmbh | Method and system for improving speech recognition accuracy by use of geographic information |
US20140095159A1 (en) | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
JP2016009901A (en) | 2014-06-23 | 2016-01-18 | シャープ株式会社 | Compound machine and display control method |
JP2017015361A (en) | 2015-07-06 | 2017-01-19 | 東芝ホームテクノ株式会社 | Heating cooker |
JP2018049510A (en) | 2016-09-23 | 2018-03-29 | 富士ゼロックス株式会社 | Information processing device and program |
JP2019003631A (en) | 2017-06-09 | 2019-01-10 | ネイバー コーポレーションNAVER Corporation | Device, method, computer program, and recording medium for providing information |
JP2019198987A (en) | 2018-05-14 | 2019-11-21 | コニカミノルタ株式会社 | Operation screen display device, image processing apparatus, and program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09292895A (en) * | 1996-04-25 | 1997-11-11 | Matsushita Electric Ind Co Ltd | Human and machine interface device |
-
2019
- 2019-12-13 JP JP2019225082A patent/JP7447458B2/en active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250587A (en) | 1999-03-01 | 2000-09-14 | Hitachi Ltd | Voice recognition device and voice recognizing and translating device |
JP2002355486A (en) | 2001-06-01 | 2002-12-10 | Toshiba Corp | Washing machine |
JP2003051887A (en) | 2001-08-06 | 2003-02-21 | Minolta Co Ltd | Control system and control method |
JP2004045616A (en) | 2002-07-10 | 2004-02-12 | Equos Research Co Ltd | On-board device, data preparation device and data preparation program |
JP2007206886A (en) | 2006-01-31 | 2007-08-16 | Canon Inc | Information processor and method |
JP2009252238A (en) | 2008-04-08 | 2009-10-29 | Lg Electronics Inc | Mobile terminal and its menu control method |
US20120303267A1 (en) | 2009-07-27 | 2012-11-29 | Robert Bosch Gmbh | Method and system for improving speech recognition accuracy by use of geographic information |
US20140095159A1 (en) | 2012-09-28 | 2014-04-03 | Samsung Electronics Co., Ltd. | Image processing apparatus and control method thereof and image processing system |
JP2016009901A (en) | 2014-06-23 | 2016-01-18 | シャープ株式会社 | Compound machine and display control method |
JP2017015361A (en) | 2015-07-06 | 2017-01-19 | 東芝ホームテクノ株式会社 | Heating cooker |
JP2018049510A (en) | 2016-09-23 | 2018-03-29 | 富士ゼロックス株式会社 | Information processing device and program |
JP2019003631A (en) | 2017-06-09 | 2019-01-10 | ネイバー コーポレーションNAVER Corporation | Device, method, computer program, and recording medium for providing information |
JP2019198987A (en) | 2018-05-14 | 2019-11-21 | コニカミノルタ株式会社 | Operation screen display device, image processing apparatus, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021096493A (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4717461B2 (en) | Information input device, information input method, and information input program | |
JP4826662B2 (en) | Image processing apparatus and voice operation history information sharing method | |
JP5121560B2 (en) | Workflow execution device, workflow execution method, computer program | |
US11172082B2 (en) | Information processing apparatus, information processing system, and information processing method | |
US20200076969A1 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
JP2006330576A (en) | Apparatus operation system, speech recognition device, electronic apparatus, information processor, program, and recording medium | |
EP3696610B1 (en) | Image forming apparatus, display control method, and carrier means | |
EP3716040A1 (en) | Image forming apparatus and job execution method | |
JP7192220B2 (en) | Image processing device, information processing device and program | |
JP2010049432A (en) | Display screen control device and method thereof, and information processor | |
JP5343652B2 (en) | Operation screen control apparatus, image forming apparatus, and computer program | |
JP2024109559A (en) | Image processing system and control method thereof | |
JP7263869B2 (en) | Information processing device and program | |
JP7293963B2 (en) | Information processing device and information processing program | |
JP2011222046A (en) | Image processor and operation item discrimination table sharing method | |
JP2020123817A (en) | Image forming system, image forming apparatus, image forming method, and program | |
US11823672B2 (en) | Voice-operated system, controller, computer-readable recording medium, and processing device | |
JP7447458B2 (en) | Control device, control system and control program | |
US10606531B2 (en) | Image processing device, and operation control method thereof | |
US11647129B2 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
JP7314499B2 (en) | Information processing system, information processing device, job control method and job control program | |
JP2020149602A (en) | Controller, image formation system, and program | |
JP7383885B2 (en) | Information processing device and program | |
US11700338B2 (en) | Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor | |
JP2007295400A (en) | Image processing method, information processing apparatus, and image processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7447458 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |