JP7447458B2 - Control device, control system and control program - Google Patents

Control device, control system and control program Download PDF

Info

Publication number
JP7447458B2
JP7447458B2 JP2019225082A JP2019225082A JP7447458B2 JP 7447458 B2 JP7447458 B2 JP 7447458B2 JP 2019225082 A JP2019225082 A JP 2019225082A JP 2019225082 A JP2019225082 A JP 2019225082A JP 7447458 B2 JP7447458 B2 JP 7447458B2
Authority
JP
Japan
Prior art keywords
setting
voice
control
image processing
guidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019225082A
Other languages
Japanese (ja)
Other versions
JP2021096493A (en
Inventor
宏樹 田島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019225082A priority Critical patent/JP7447458B2/en
Publication of JP2021096493A publication Critical patent/JP2021096493A/en
Application granted granted Critical
Publication of JP7447458B2 publication Critical patent/JP7447458B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、ユーザーによって入力される音声に応じて画像処理装置を制御する制御装置、制御システム及び制御プログラムに関する。 The present invention relates to a control device, a control system, and a control program that control an image processing device according to audio input by a user.

従来、MFP(Multifunction Peripherals)などの画像処理装置において、ユーザーの視覚を利用しないで操作可能とする技術が提案されている(例えば、特許文献1)。この従来の画像処理装置は、音声認識部を備えており、ユーザーによって入力される音声に基づいて各種設定項目に対する設定を行うように構成されている。また、この従来の画像処理装置は、音声認識部による音声認識結果を復唱音声として音声出力部から出力するように構成されている。そのため、ユーザーは、画像処理装置から出力される復唱音声を聞くことにより、自身で発した音声が画像処理装置において正しく認識されたかどうかを把握することができる。 2. Description of the Related Art Conventionally, a technique has been proposed that allows an image processing apparatus such as an MFP (Multifunction Peripherals) to be operated without using the user's vision (for example, Patent Document 1). This conventional image processing device includes a voice recognition section and is configured to perform settings for various setting items based on voice input by a user. Further, this conventional image processing device is configured to output the voice recognition result by the voice recognition section as a repeating voice from the voice output section. Therefore, by listening to the repeated voice output from the image processing device, the user can understand whether the voice he or she has uttered has been correctly recognized by the image processing device.

特開2006-235040号公報Japanese Patent Application Publication No. 2006-235040

上記従来の画像処理装置は、ユーザーによって発せられた音声に対応する1つの設定項目を特定することができると、復唱音声を出力するようにしている。 The conventional image processing apparatus described above outputs a repeating sound when one setting item corresponding to the sound uttered by the user can be specified.

しかしながら、この種の画像処理装置には、様々な設定項目が存在し、ユーザーの音声に対応する1つの設定項目を必ず特定できるとは限らず、ユーザーの音声に対応する設定として複数の設定候補が抽出されることもある。例えば、ユーザーが「両面」と発声した場合、コピー機能において読み取り原稿の両面設定と複写出力する際の両面設定とが存在すると共に、スキャン機能においても読み取り原稿の両面設定が存在し、それら複数の両面設定が候補として抽出されることになる。 However, this type of image processing device has various setting items, and it is not always possible to identify one setting item that corresponds to the user's voice, and there are multiple setting candidates as settings that correspond to the user's voice. may be extracted. For example, if the user says "duplex", the copy function has two-sided settings for the scanned original and the two-sided setting for copy output, and the scan function also has two-sided settings for the scanned original, and these multiple settings exist. Duplex settings will be extracted as candidates.

上述した従来の画像処理装置では、ユーザーの音声に対応する設定として複数の設定候補が抽出された場合に何ら対応策が採られていない。そのため、ユーザーは、自身で発した音声に対応する設定として複数の設定候補が存在する場合に、それら複数の設定候補のうちから所望の設定候補を選択することができないという課題がある。 In the conventional image processing apparatus described above, no countermeasure is taken when a plurality of setting candidates are extracted as settings corresponding to the user's voice. Therefore, when a plurality of setting candidates exist as settings corresponding to the voice uttered by the user, there is a problem in that the user cannot select a desired setting candidate from among the plurality of setting candidates.

また、この種の画像処理装置は、複数のユーザーによって共有される装置であるため、一人のユーザーによる占有時間をなるべく短くすることが望まれる。ところが、従来の画像処理装置は、複数の設定候補のうちからユーザーが所望する設定候補を効率的に選択することができないため、一人のユーザーによる画像処理装置の占有時間が長くなってしまうという問題もある。 Further, since this type of image processing device is a device shared by a plurality of users, it is desirable to reduce the time occupied by one user as much as possible. However, with conventional image processing devices, it is not possible for a user to efficiently select a desired setting candidate from among a plurality of setting candidates, resulting in a problem that a single user occupies the image processing device for a long time. There is also.

本発明は、上述した従来の問題点を解決するためになされたものであり、ユーザーが発した音声に基づいて複数の設定候補が抽出される場合であっても、ユーザーに効率的に所望の設定候補を選択させることを可能にした画像処理装置の制御装置、制御システム及び制御プログラムを提供することを目的とする。 The present invention has been made to solve the above-mentioned conventional problems, and even when multiple setting candidates are extracted based on the voice uttered by the user, the present invention allows the user to efficiently select the desired setting. It is an object of the present invention to provide a control device, a control system, and a control program for an image processing apparatus that make it possible to select setting candidates.

上記目的を達成するため、請求項1に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項2に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項3に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする構成である。
請求項4に係る発明は、画像処理装置を制御する制御装置であって、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする構成である。
In order to achieve the above object, the invention according to claim 1 provides a control device for controlling an image processing device, the control device controlling the image processing device to control the settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user. a setting specifying means to specify, and guidance information for generating voice guidance representing the contents of the settings specified by the setting specifying means, and outputting voice guidance based on the guide information from a predetermined voice output means. and a control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result, the guidance information outputting means , when the setting specifying means determines that the number of setting candidates is less than a predetermined number, outputting the guidance information for audio guidance of the setting candidates less than the predetermined number. .
The invention according to claim 2 is a control device for controlling an image processing device, comprising: a setting specifying means for specifying a setting to be reflected in the image processing device based on a voice recognition result of a voice uttered by a user; guidance information output means for generating guidance information for audio guidance representing the content of the settings specified by the setting identification means, and outputting audio guidance based on the guidance information from a predetermined audio output means; and the setting identification means. a control means for presenting the plurality of setting candidates when the means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
The guidance information output means outputs the guidance information for audio guidance of the predetermined number or more setting candidates when the setting specifying means determines that there are more than a predetermined number of setting candidates. This is a characteristic configuration.
The invention according to claim 3 is a control device for controlling an image processing device, comprising: a setting specifying means for specifying a setting to be reflected in the image processing device based on a voice recognition result of a voice uttered by a user; guidance information output means for generating guidance information for audio guidance representing the content of the settings specified by the setting identification means, and outputting audio guidance based on the guidance information from a predetermined audio output means; and the setting identification means. a control means for presenting the plurality of setting candidates when the means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
and the guidance information output means is configured to provide voice guidance for prompting the user to confirm a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. This configuration is characterized by outputting the guidance information of.
The invention according to claim 4 is a control device for controlling an image processing device, comprising: a setting specifying means for specifying a setting to be reflected in the image processing device based on a voice recognition result of a voice uttered by a user; guidance information output means for generating guidance information for audio guidance representing the content of the settings specified by the setting identification means, and outputting audio guidance based on the guidance information from a predetermined audio output means; and the setting identification means. control means for presenting the plurality of setting candidates when the means determines that there are a plurality of setting candidates corresponding to the voice recognition result; This configuration is characterized in that when it is determined that there are more than three setting candidates, the guidance information is not output.

請求項に係る発明は、請求項1乃至4のいずれかの制御装置において、前記制御手段は、前記設定特定手段において前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記複数の設定候補を提示することを特徴とする構成である。 The invention according to claim 5 is the control device according to any one of claims 1 to 4 , wherein the control means determines that there are a predetermined number or more of setting candidates corresponding to the voice recognition result in the setting specifying means. In this case, the plurality of setting candidates are presented.

請求項に係る発明は、請求項1乃至5のいずれかの制御装置において、前記画像処理装置は、表示手段を有し、前記制御手段は、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする構成である。 The invention according to claim 6 is the control device according to any one of claims 1 to 5 , wherein the image processing device has a display means, and the control means causes the plurality of setting candidates to be displayed on the display means. This is a configuration characterized by presentation by.

請求項に係る発明は、請求項1乃至のいずれかの制御装置において、前記制御手段は、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする構成である。 The invention according to claim 7 is the control device according to any one of claims 1 to 6 , wherein the control means presents the plurality of setting candidates according to a predetermined priority order.

請求項に係る発明は、請求項の制御装置において、前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする構成である。 The invention according to claim 8 is the control device according to claim 7 , wherein the priority order is determined in descending order of frequency of setting by the user.

請求項に係る発明は、請求項の制御装置において、前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする構成である。 The invention according to claim 9 is the control device according to claim 7 , wherein the priority order is determined in advance based on a hierarchy of an operation screen that includes setting items corresponding to the setting candidates. .

請求項10に係る発明は、請求項の制御装置において、前記制御手段は、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする構成である。 The invention according to claim 10 is the control device according to claim 6 , wherein the control means causes the display means to display a thumbnail image corresponding to each of the plurality of setting candidates.

請求項11に係る発明は、請求項10の制御装置において、前記制御手段は、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする構成である。 The invention according to claim 11 is the control device according to claim 10 , wherein the control means changes the image size of the thumbnail image corresponding to each of the plurality of setting candidates according to a predetermined priority order. The configuration is as follows.

請求項12に係る発明は、請求項6、10又は11の制御装置において、前記制御手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする構成である。 The invention according to claim 12 is the control device according to claim 6, 10, or 11 , in which the control means, when the setting specifying means determines that the number of the setting candidates is less than a predetermined number, This configuration is characterized in that setting candidates are not displayed on the display means.

請求項13に係る発明は、請求項1乃至12のいずれかの制御装置において、前記設定特定手段は、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする構成である。 According to a thirteenth aspect of the invention, in the control device according to any one of claims 1 to 12 , when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result, the setting specifying means changes the current setting state. On the other hand, this configuration is characterized in that setting candidates that satisfy prohibitive conditions are excluded from the plurality of setting candidates.

請求項14に係る発明は、請求項1乃至13いずれかの制御装置において、前記制御装置は、前記画像処理装置と通信可能なサーバーであることを特徴とする構成である。 The invention according to claim 14 is the control device according to any one of claims 1 to 13 , wherein the control device is a server capable of communicating with the image processing device.

請求項15係る発明は、請求項1乃至13いずれかの制御装置において、前記制御装置は、前記画像処理装置に設けられることを特徴とする構成である。 The invention according to claim 15 is the control device according to any one of claims 1 to 13 , wherein the control device is provided in the image processing device.

請求項16に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための案内情報を出力することを特徴とする構成である。
請求項17に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための案内情報を出力することを特徴とする構成である。
請求項18に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための案内情報を出力することを特徴とする構成である。
請求項19に係る発明は、画像処理装置と、前記画像処理装置を音声操作するための音声を入力する音声入力装置と、前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、を備える制御システムであって、前記制御装置は、前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、を備え、前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、案内情報を出力しないことを特徴とする構成である。
The invention according to claim 16 provides an image processing device, an audio input device for inputting audio for audio operating the image processing device, and controlling the image processing device based on the audio input to the audio input device. A control system comprising: a control device that specifies settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device; , a guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means; and the settings. control means for presenting the plurality of setting candidates when the specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result; If it is determined that the number of setting candidates is less than a predetermined number, guidance information for audio guidance of the setting candidates less than the predetermined number is output .
The invention according to claim 17 provides an image processing device, an audio input device for inputting audio for audio operating the image processing device, and controlling the image processing device based on the audio input to the audio input device. A control system comprising: a control device that specifies settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device; , a guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means; and the settings. control means for presenting the plurality of setting candidates when the specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result; This configuration is characterized in that when it is determined that a predetermined number or more of setting candidates exist, guidance information for audio guidance of the predetermined number or more of setting candidates is output.
The invention according to claim 18 provides an image processing device, an audio input device for inputting audio for audio operating the image processing device, and controlling the image processing device based on the audio input to the audio input device. A control system comprising: a control device that specifies settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device; , a guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means; and the settings. control means for presenting the plurality of setting candidates when the specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result; This configuration is characterized in that when it is determined that a predetermined number or more of setting candidates exist, guidance information for audio guidance is output for prompting the user to confirm the display means provided in the image processing apparatus.
The invention according to claim 19 provides an image processing device, an audio input device for inputting audio for audio operating the image processing device, and controlling the image processing device based on the audio input to the audio input device. A control system comprising: a control device that specifies settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device; , a guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means; and the settings. control means for presenting the plurality of setting candidates when the specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result; This configuration is characterized in that when it is determined that a predetermined number or more of setting candidates exist, guidance information is not output.

請求項20に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項21に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記複数の設定候補を音声案内するための前記案内情報を出力することを特徴とする構成である。
請求項22に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする構成である。
請求項23に係る発明は、プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、を実行させ、前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする構成である。
The invention according to claim 20 is a control program that is executed by a processor to control an image processing device, the control program causing the processor to control the image processing device based on a voice recognition result of a voice uttered by a user. a setting specifying step for specifying settings to be reflected; generating guidance information for voice guidance representing the contents of the settings specified in the setting specifying step; and generating voice guidance based on the guidance information to a predetermined voice output means. and a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result , The guidance information output step outputs the guidance information for audio guidance of the setting candidates that are less than the predetermined number, when it is determined in the setting specifying step that the number of setting candidates is less than a predetermined number. This is a characteristic configuration.
The invention according to claim 21 is a control program that is executed by a processor to control an image processing device, the control program causing the processor to control the image processing device based on a voice recognition result of a voice uttered by a user. a setting specifying step for specifying settings to be reflected; generating guidance information for voice guidance representing the contents of the settings specified in the setting specifying step; and generating voice guidance based on the guidance information to a predetermined voice output means. and a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result, The guidance information output step outputs the guidance information for audio guidance of the plurality of setting candidates when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates. be.
The invention according to claim 22 is a control program that is executed by a processor to control an image processing device, the control program causing the processor to control the image processing device based on a voice recognition result of a voice uttered by a user. a setting specifying step for specifying settings to be reflected; generating guidance information for voice guidance representing the contents of the settings specified in the setting specifying step; and generating voice guidance based on the guidance information to a predetermined voice output means. and a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result, The guidance information output step includes, when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates, the guidance for audio guidance prompting the user to check a display means provided in the image processing device. This configuration is characterized by outputting information.
The invention according to claim 23 is a control program that is executed by a processor to control an image processing device, the control program causing the processor to control the image processing device based on a voice recognition result of a voice uttered by a user. a setting specifying step for specifying settings to be reflected; generating guidance information for voice guidance representing the contents of the settings specified in the setting specifying step; and generating voice guidance based on the guidance information to a predetermined voice output means. and a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result, The guide information output step is characterized in that the guide information is not output when it is determined in the setting specifying step that a predetermined number or more of setting candidates exist.

請求項24に係る発明は、請求項20乃至23のいずれかの制御プログラムにおいて、前記制御ステップは、前記設定特定ステップにおいて前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記所定数以上の設定候補を提示することを特徴とする構成である。 The invention according to claim 24 is the control program according to any one of claims 20 to 23 , wherein in the control step, it is determined in the setting specifying step that there are a predetermined number or more of setting candidates corresponding to the voice recognition result. In this case, the configuration is characterized in that the predetermined number or more of setting candidates are presented.

請求項25に係る発明は、請求項20乃至24のいずれかの制御プログラムにおいて、前記画像処理装置は、表示手段を有し、前記制御ステップは、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする構成である。 The invention according to claim 25 is the control program according to any one of claims 20 to 24 , wherein the image processing device has a display means, and the control step causes the plurality of setting candidates to be displayed on the display means. This is a configuration characterized by presentation by.

請求項26に係る発明は、請求項20乃至25のいずれかの制御プログラムにおいて、前記制御ステップは、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする構成である。 The invention according to claim 26 is the control program according to any one of claims 20 to 25 , wherein the control step presents the plurality of setting candidates according to a predetermined priority order.

請求項27に係る発明は、請求項26の制御プログラムにおいて、前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする構成である。 The invention according to claim 27 is the control program according to claim 26 , wherein the priority order is determined in descending order of frequency of setting by the user.

請求項28に係る発明は、請求項26の制御プログラムにおいて、前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする構成である。 The invention according to claim 28 is the control program according to claim 26 , wherein the priority order is determined in advance based on a hierarchy of an operation screen that includes setting items corresponding to the setting candidates. .

請求項29に係る発明は、請求項25の制御プログラムにおいて、前記制御ステップは、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする構成である。 The invention according to claim 29 is the control program according to claim 25 , wherein the control step causes the display means to display a thumbnail image corresponding to each of the plurality of setting candidates.

請求項30に係る発明は、請求項29の制御プログラムにおいて、前記制御ステップは、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする構成である。 The invention according to claim 30 is the control program according to claim 29 , wherein the control step changes the image size of the thumbnail image corresponding to each of the plurality of setting candidates according to a predetermined priority order. The configuration is as follows.

請求項31に係る発明は、請求項2529又は30の制御プログラムにおいて、前記制御ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする構成である。 The invention according to claim 31 is the control program according to claim 25 , 29 , or 30 , in which, in the control step, when it is determined in the setting specifying step that the number of setting candidates is less than a predetermined number, This configuration is characterized in that setting candidates are not displayed on the display means.

請求項32に係る発明は、請求項20乃至31のいずれかの制御プログラムにおいて、前記設定特定ステップは、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする構成である。 The invention according to claim 32 is the control program according to any one of claims 20 to 31 , when the setting specifying step determines that there are a plurality of setting candidates corresponding to the voice recognition result, the setting specifying step selects the current setting state. On the other hand, this configuration is characterized in that setting candidates that satisfy prohibitive conditions are excluded from the plurality of setting candidates.

本発明によれば、音声認識結果に対応する複数の設定候補が存在すると判定された場合にそれら複数の設定候補を提示するため、ユーザーは提示された複数の設定候補のうちから所望する設定候補を効率的に選択することができるようになる。 According to the present invention, when it is determined that a plurality of setting candidates corresponding to the voice recognition result exist, the plurality of setting candidates are presented, so that the user can select a desired setting candidate from among the presented plural setting candidates. will be able to select efficiently.

画像処理装置を制御するための制御システムの一例を示す図である。FIG. 1 is a diagram illustrating an example of a control system for controlling an image processing device. 制御システムの動作の概略を示す図である。FIG. 2 is a diagram schematically showing the operation of the control system. 画像処理装置のハードウェア構成及び機能構成の一例を示すブロック図である。FIG. 2 is a block diagram illustrating an example of the hardware configuration and functional configuration of an image processing device. 制御装置のハードウェア構成及び機能構成を示す図である。It is a diagram showing the hardware configuration and functional configuration of a control device. キーワード情報の一例を示す図である。It is a figure showing an example of keyword information. 制御装置が音声認識結果に基づいて画像処理装置に反映すべき設定を特定することができた場合の流れを示す図である。FIG. 6 is a diagram showing a flow when the control device is able to specify settings to be reflected in the image processing device based on the voice recognition result. 制御装置が音声認識結果に基づいて所定数以上の設定候補を抽出した場合の流れを示す図である。FIG. 6 is a diagram showing a flow when the control device extracts a predetermined number or more of setting candidates based on a voice recognition result. 制御装置において行われる処理手順の一例を示すフローチャートである。3 is a flowchart illustrating an example of a processing procedure performed in the control device. 設定候補抽出処理の詳細な処理手順の一例を示すフローチャートである。7 is a flowchart illustrating an example of a detailed processing procedure of setting candidate extraction processing. 設定候補提示処理の詳細な処理手順の一例を示すフローチャートである。7 is a flowchart illustrating an example of a detailed processing procedure of setting candidate presentation processing. 画像処理装置において行われる処理手順の一例を示すフローチャートである。3 is a flowchart illustrating an example of a processing procedure performed in the image processing device. 操作パネルの表示部に表示される選択画面の一例を示す図である。FIG. 3 is a diagram showing an example of a selection screen displayed on the display section of the operation panel. 図12とは異なる選択画面の例を示す図である。13 is a diagram showing an example of a selection screen different from that in FIG. 12. FIG.

以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する要素には同一符号を付しており、それらについての重複する説明は省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In the embodiments described below, common elements are given the same reference numerals, and redundant explanations thereof will be omitted.

図1は、本実施形態において画像処理装置2を制御するための制御システム1の一例を示す図である。この制御システム1は、ユーザーのローカル環境に設置される画像処理装置2と、ローカル環境に設置されて音声の入出力を行う音声入出力装置3と、LAN(Local Area Network)などのローカルネットワーク4と、インターネット上のクラウド5に設置される音声認識装置7と、クラウド5に設置されて画像処理装置2を制御する制御装置8と、クラウド5上で音声認識装置7と制御装置8とを通信可能に接続するネットワーク9とを備える。 FIG. 1 is a diagram showing an example of a control system 1 for controlling an image processing device 2 in this embodiment. This control system 1 includes an image processing device 2 installed in a user's local environment, an audio input/output device 3 installed in the local environment for inputting and outputting audio, and a local network 4 such as a LAN (Local Area Network). , a voice recognition device 7 installed in a cloud 5 on the Internet, a control device 8 installed in the cloud 5 and controlling the image processing device 2, and communication between the voice recognition device 7 and the control device 8 on the cloud 5. and a network 9 that can be connected.

画像処理装置2は、例えばMFP(Multifunction Peripherals)などと呼ばれる装置であって、コピー機能、スキャン機能、プリント機能、FAX機能などの複数の機能を有する装置である。画像処理装置2は、装置本体の上部にスキャナ部17を備え、スキャナ部17の下部にプリンタ部18を備えている。また、画像処理装置2は、内部にFAX部を備えている。画像処理装置2は、それらスキャナ部17、プリンタ部及びFAX部を適宜動作させることにより、ユーザーによって指定されたジョブを実行する。また、画像処理装置2は、装置本体の正面側にユーザーが操作可能な操作パネル11を備えている。この操作パネル11は、ユーザーが手動操作を行うことにより、各種ジョブの設定などを行うことができるユーザーインタフェースである。 The image processing device 2 is a device called, for example, an MFP (Multifunction Peripherals), and has multiple functions such as a copy function, a scan function, a print function, and a FAX function. The image processing device 2 includes a scanner section 17 at the top of the device body, and a printer section 18 at the bottom of the scanner section 17. The image processing device 2 also includes a FAX section inside. The image processing device 2 executes the job specified by the user by appropriately operating the scanner section 17, printer section, and FAX section. The image processing device 2 also includes an operation panel 11 that can be operated by a user on the front side of the device main body. The operation panel 11 is a user interface that allows the user to perform settings for various jobs through manual operations.

音声入出力装置3は、例えばスマートスピーカーやAIスピーカーなどと呼ばれる装置であって、ユーザーと対話を行うことができる装置である。この音声入出力装置3は、ユーザーが画像処理装置2を音声で操作できるようにするために、画像処理装置2と同じ環境に設置される。尚、図1では、音声入出力装置3が画像処理装置2と別体として構成される場合を例示しているが、これに限られるものではない。例えば、音声入出力装置3は、画像処理装置2に内蔵されたものであっても構わない。 The audio input/output device 3 is a device called, for example, a smart speaker or an AI speaker, and is a device that can interact with a user. This audio input/output device 3 is installed in the same environment as the image processing device 2 so that the user can operate the image processing device 2 by voice. Although FIG. 1 illustrates a case where the audio input/output device 3 is configured separately from the image processing device 2, the present invention is not limited to this. For example, the audio input/output device 3 may be built into the image processing device 2.

ローカルネットワーク4は、画像処理装置2と音声入出力装置3とを通信可能に接続する。またローカルネットワーク4は、インターネットにも接続されている。そのため、画像処理装置2及び音声入出力装置3は、クラウド5に設置されている音声認識装置7や制御装置8と通信を行うことが可能である。 The local network 4 communicably connects the image processing device 2 and the audio input/output device 3. The local network 4 is also connected to the Internet. Therefore, the image processing device 2 and the voice input/output device 3 can communicate with the voice recognition device 7 and the control device 8 installed in the cloud 5.

音声認識装置7は、音声を解析して音声をテキスト化する装置である。例えば、音声認識装置7には、人工知能(AI)による音声認識機能が搭載されており、入力する音声情報を高速かつ高精度にテキスト化することができる。本実施形態の音声認識装置7は、図1に示すようにクラウド5上にサーバーとして設置される。そのため、音声認識装置7による音声認識機能を、複数のローカル環境から利用することができる。 The speech recognition device 7 is a device that analyzes speech and converts speech into text. For example, the speech recognition device 7 is equipped with a speech recognition function using artificial intelligence (AI), and can convert input speech information into text at high speed and with high precision. The speech recognition device 7 of this embodiment is installed as a server on the cloud 5, as shown in FIG. Therefore, the speech recognition function of the speech recognition device 7 can be used from a plurality of local environments.

制御装置8は、ローカル環境に設置される画像処理装置2を遠隔制御するための装置である。この制御装置8もクラウド5上にサーバーとして設置されている。そのため、制御装置8は、複数のローカル環境に設置されている複数の画像処理装置2を個別に制御することができる。 The control device 8 is a device for remotely controlling the image processing device 2 installed in the local environment. This control device 8 is also installed on the cloud 5 as a server. Therefore, the control device 8 can individually control a plurality of image processing devices 2 installed in a plurality of local environments.

上記のような制御システム1は、ローカル環境においてユーザーが画像処理装置2を操作するためのキーワードを音声で発した場合に、ユーザーの音声に応じて画像処理装置2が動作するように構成される。 The control system 1 as described above is configured such that when a user vocally utters a keyword for operating the image processing device 2 in a local environment, the image processing device 2 operates according to the user's voice. .

図2は、制御システム1における概略動作を示す図である。音声入出力装置3は、画像処理装置2を音声操作するための装置であり、予め画像処理装置2の装置モデル(装置タイプ)やアドレスに関する装置情報を保持している。この音声入出力装置3は、画像処理装置2と同じローカル環境に設置されることにより、画像処理装置2の近傍位置でユーザーが発する音声を入力することができる。そしてユーザーが画像処理装置2を操作するための音声を発すると、音声入出力装置3は、その音声を入力し、音声情報D1を生成する。この音声情報D1は、音声入出力装置3からクラウド5上の音声認識装置7へと送信される。このとき、音声入出力装置3は、画像処理装置2の装置情報を付加した音声情報D1を音声認識装置7へ送信する。 FIG. 2 is a diagram schematically showing the operation of the control system 1. As shown in FIG. The audio input/output device 3 is a device for operating the image processing device 2 by voice, and holds device information regarding the device model (device type) and address of the image processing device 2 in advance. By installing the audio input/output device 3 in the same local environment as the image processing device 2, it is possible to input audio emitted by a user at a position near the image processing device 2. When the user utters a voice for operating the image processing device 2, the voice input/output device 3 inputs the voice and generates voice information D1. This voice information D1 is transmitted from the voice input/output device 3 to the voice recognition device 7 on the cloud 5. At this time, the voice input/output device 3 transmits the voice information D1 to which the device information of the image processing device 2 is added to the voice recognition device 7.

音声認識装置7は、音声入出力装置3から音声情報D1を受信すると、音声情報D1を解析することにより、ユーザーが発した音声をテキストD2に変換する。すなわち、音声認識装置7は、音声認識結果として、ユーザーの音声に対応するテキストD2を生成する。この音声認識装置7は、音声入出力装置3から音声情報D1を受信してテキストD2を生成すると、そのテキストD2をクラウド5内で制御装置8へ送信する。このとき、音声認識装置7は、音声情報D1に付加されていた装置情報を、テキストD2に付加した状態で制御装置8へ送信する。 When the speech recognition device 7 receives the speech information D1 from the speech input/output device 3, it analyzes the speech information D1 and converts the speech uttered by the user into text D2. That is, the voice recognition device 7 generates text D2 corresponding to the user's voice as a voice recognition result. This voice recognition device 7 receives voice information D1 from the voice input/output device 3 and generates a text D2, and then transmits the text D2 to the control device 8 within the cloud 5. At this time, the voice recognition device 7 transmits the device information added to the voice information D1 to the control device 8 with the device information added to the text D2.

制御装置8は、音声認識装置7の音声認識結果に基づいて画像処理装置2を制御するコマンドD4を生成する。すなわち、制御装置8は、音声認識装置7から受信するテキストD2に基づいてコマンドD4を生成するのである。このとき、制御装置8は、テキストD2に付加されている装置情報に基づき画像処理装置2の装置モデルを特定し、その装置モデルに対応したコマンドD4を生成する。また、制御装置8は、テキストD2に付加されている装置情報に基づき、コマンドD4の送信先となる画像処理装置2のアドレスを特定する。そして制御装置8は、コマンドD4を、画像処理装置2へ送信することにより、画像処理装置2を制御する。 The control device 8 generates a command D4 to control the image processing device 2 based on the voice recognition result of the voice recognition device 7. That is, the control device 8 generates the command D4 based on the text D2 received from the speech recognition device 7. At this time, the control device 8 identifies the device model of the image processing device 2 based on the device information added to the text D2, and generates a command D4 corresponding to the device model. Furthermore, the control device 8 identifies the address of the image processing device 2 to which the command D4 is to be sent, based on the device information added to the text D2. The control device 8 then controls the image processing device 2 by transmitting the command D4 to the image processing device 2.

例えば、ユーザーが画像処理装置2に対するジョブの設定を音声で指示した場合、制御装置8は、音声認識装置7から受信するテキストD2に基づいて画像処理装置2に反映すべき設定を特定し、その設定を画像処理装置2に反映させるためのコマンドD4を生成する。そして制御装置8は、そのコマンドD4を画像処理装置2へ送信することにより、ジョブの設定を反映させる。 For example, when a user instructs the image processing device 2 to set up a job by voice, the control device 8 specifies the settings to be reflected in the image processing device 2 based on the text D2 received from the voice recognition device 7, and A command D4 for reflecting the settings on the image processing device 2 is generated. Then, the control device 8 transmits the command D4 to the image processing device 2 to reflect the job settings.

また、ユーザーが画像処理装置2に対してジョブの実行を音声で指示した場合、制御装置8は、音声認識装置7から受信するテキストD2に基づいて画像処理装置2にジョブを実行させるためのコマンドD4を生成する。そして制御装置8は、そのコマンドD4を画像処理装置2へ送信することにより、画像処理装置2にジョブを実行させる。 Further, when the user instructs the image processing device 2 to execute a job by voice, the control device 8 issues a command to cause the image processing device 2 to execute the job based on the text D2 received from the voice recognition device 7. Generate D4. Then, the control device 8 transmits the command D4 to the image processing device 2, thereby causing the image processing device 2 to execute the job.

このように制御装置8は、音声認識装置7による音声認識結果に基づいて画像処理装置2に行わせる処理を特定し、その特定した処理に対応するコマンドD4を画像処理装置2へ送信することにより、画像処理装置2を制御する。 In this way, the control device 8 specifies the process to be performed by the image processing device 2 based on the voice recognition result by the voice recognition device 7, and sends the command D4 corresponding to the specified process to the image processing device 2. , controls the image processing device 2.

また、制御装置8は、音声認識結果に基づいて特定した処理に基づく音声案内を行うための案内情報D3を生成する。この案内情報D3は、テキストデータとして生成される。そして制御装置8は、テキストデータとして生成した案内情報D3を音声認識装置7へ送信する。音声認識装置7は、制御装置8から音声案内のための案内情報D3を受信すると、案内情報D3をテキストデータから音声情報に変換する。そして音声認識装置7は、音声情報に変換した案内情報D3を、音声情報D1の送信元である音声入出力装置3へ送信する。これにより、音声入出力装置3では、案内情報D3に基づく音声出力が行われる。例えば、ユーザーがジョブの設定操作を音声で行った場合、制御装置8は、その設定の内容をテキストデータで表した案内情報D3を生成して音声認識装置7へ送信する。音声認識装置7は、テキストデータを音声情報に変換することにより、ユーザーによる設定の内容を音声出力するための案内情報D3を生成する。そして音声認識装置7は、音声情報に変換した案内情報D3を音声入出力装置3へ送信する。音声入出力装置3は、音声認識装置7から案内情報D3を受信すると、その案内情報D3に基づく音声出力を行う。したがって、ユーザーは、自身で発した音声がどのように認識されたかを音声入出力装置3からの出力音声で把握することができる。 Further, the control device 8 generates guidance information D3 for performing voice guidance based on the process specified based on the voice recognition result. This guide information D3 is generated as text data. The control device 8 then transmits the guidance information D3 generated as text data to the voice recognition device 7. When the voice recognition device 7 receives the guidance information D3 for voice guidance from the control device 8, it converts the guidance information D3 from text data into voice information. The voice recognition device 7 then transmits the guidance information D3 converted into voice information to the voice input/output device 3 that is the source of the voice information D1. Thereby, the audio input/output device 3 performs audio output based on the guide information D3. For example, when a user performs a job setting operation by voice, the control device 8 generates guidance information D3 expressing the contents of the setting in text data and transmits it to the voice recognition device 7. The voice recognition device 7 generates guidance information D3 for audio outputting the contents of the settings made by the user by converting text data into voice information. The voice recognition device 7 then transmits the guidance information D3 converted into voice information to the voice input/output device 3. When the voice input/output device 3 receives the guidance information D3 from the voice recognition device 7, it performs voice output based on the guidance information D3. Therefore, the user can understand from the output voice from the voice input/output device 3 how the voice he/she uttered is recognized.

このような制御システム1によれば、ユーザーは、画像処理装置2の操作パネル11を手動で操作しなくても、音声操作を行うことが可能である。そのため、例えばユーザーが荷物を抱えていて両手を使うことができない場合や、画像処理装置2から数メートル程度離れた位置にいる場合であっても、画像処理装置2を音声で操作することができるので、利便性が高い。 According to such a control system 1, the user can perform voice operations without manually operating the operation panel 11 of the image processing device 2. Therefore, even if the user is carrying luggage and cannot use both hands, or is located several meters away from the image processing device 2, the image processing device 2 can be operated by voice. Therefore, it is highly convenient.

図3は、画像処理装置2のハードウェア構成及び機能構成の一例を示すブロック図である。画像処理装置2は、そのハードウェア構成として、制御部10と、操作パネル11と、通信インタフェース14と、記憶部15と、スキャナ部17と、プリンタ部18と、FAX部19とを備えている。制御部10は、図示を省略するCPUとメモリとを備えている。制御部10は、そのCPUにおいて所定のプログラムが実行されることにより、各部の動作を制御する。 FIG. 3 is a block diagram showing an example of the hardware configuration and functional configuration of the image processing device 2. As shown in FIG. The image processing device 2 includes, as its hardware configuration, a control section 10, an operation panel 11, a communication interface 14, a storage section 15, a scanner section 17, a printer section 18, and a FAX section 19. . The control unit 10 includes a CPU and memory (not shown). The control unit 10 controls the operation of each unit by executing a predetermined program in its CPU.

操作パネル11は、表示部12と、操作部13とを備えている。表示部12は、例えばカラー液晶ディスプレイで構成され、ユーザーが操作可能な各種の操作画面を表示する。操作部13は、例えばタッチパネルキーや押しボタンキーなどによって構成され、ユーザーによる手動操作を受け付ける。 The operation panel 11 includes a display section 12 and an operation section 13. The display unit 12 is configured with, for example, a color liquid crystal display, and displays various operation screens that can be operated by the user. The operation unit 13 includes, for example, touch panel keys, push button keys, etc., and accepts manual operations by the user.

通信インタフェース14は、画像処理装置2をローカルネットワーク4に接続するためのものである。画像処理装置2は、この通信インタフェース14を介してローカルネットワーク4に接続されている様々な機器と通信を行うことができる。また、画像処理装置2は、この通信インタフェース14を介して、制御装置8から送信されるコマンドD4を受信する。 The communication interface 14 is for connecting the image processing device 2 to the local network 4. The image processing device 2 can communicate with various devices connected to the local network 4 via this communication interface 14. The image processing device 2 also receives a command D4 sent from the control device 8 via this communication interface 14.

記憶部15は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などによって構成される不揮発性の記憶デバイスである。この記憶部15には、操作パネル11の表示部12に表示するための画面情報16が記憶される。この画面情報16は、表示部12に表示するための複数の操作画面に関する情報や、各操作画面に含まれる設定項目等に関する情報、複数の操作画面を階層構造として定義した情報などが含まれる。尚、記憶部15には、この他にも制御部10のCPUによって実行されるプログラムや各種データなどが記憶される。 The storage unit 15 is a nonvolatile storage device configured with a hard disk drive (HDD), solid state drive (SSD), or the like. This storage section 15 stores screen information 16 to be displayed on the display section 12 of the operation panel 11. This screen information 16 includes information regarding a plurality of operation screens to be displayed on the display unit 12, information regarding setting items included in each operation screen, information defining a plurality of operation screens as a hierarchical structure, and the like. Note that the storage unit 15 also stores programs executed by the CPU of the control unit 10, various data, and the like.

スキャナ部17は、ユーザーによってセットされる原稿を光学的に読み取って画像データを生成する。スキャナ部17は、制御部10によって設定されるジョブ設定(原稿の読み取り設定など)に基づいて原稿の読み取り動作を行う。例えば、ジョブ設定において原稿の両面読み取りが指定されている場合、スキャナ部17は、原稿の表裏両面に対する読み取り動作を行う。 The scanner unit 17 optically reads a document set by a user and generates image data. The scanner section 17 performs a document reading operation based on job settings (document reading settings, etc.) set by the control section 10 . For example, if double-sided reading of a document is specified in the job settings, the scanner unit 17 performs a reading operation for both the front and back sides of the document.

プリンタ部18は、入力する画像データに基づいて印刷用紙などのシート材に画像形成を行うことにより印刷出力を行う。プリンタ部18は、制御部10によって設定されるジョブ設定(原稿の読み取り設定など)に基づく印刷出力を行う。例えば、ジョブ設定において両面印刷が指定されている場合、プリンタ部18は、シート材の表裏両面に対して画像形成を行う。 The printer unit 18 performs printout by forming an image on a sheet material such as printing paper based on input image data. The printer unit 18 performs print output based on job settings (document reading settings, etc.) set by the control unit 10. For example, if double-sided printing is specified in the job settings, the printer unit 18 forms images on both the front and back sides of the sheet material.

FAX部は、図示を省略する公衆電話網を介してFAXデータの送受信を行うものである。 The FAX unit transmits and receives FAX data via a public telephone network (not shown).

制御部10は、パネル制御部20とジョブ制御部21とを備えている。操作パネル11に関する制御を行うとき、制御部10は、パネル制御部20を機能させる。また、ジョブの設定又は実行に関する制御を行うとき、制御部10は、ジョブ制御部21を機能させる。 The control section 10 includes a panel control section 20 and a job control section 21. When controlling the operation panel 11, the control section 10 causes the panel control section 20 to function. Furthermore, when controlling job settings or execution, the control unit 10 causes the job control unit 21 to function.

パネル制御部20は、操作パネル11の表示部12に表示する操作画面を制御したり、操作部13に対して行われるユーザーの手動操作を受け付けたりする。例えば、パネル制御部20は、記憶部15に記憶されている画面情報16に基づき、表示部12に表示している操作画面をユーザーの操作に基づいて更新したり、遷移させたりする。尚、パネル制御部20は、ユーザーが操作パネル11を手動操作していない状態が所定時間以上継続すると、表示部12に対する給電を停止し、操作パネル11を省電力モードへと移行させる。 The panel control unit 20 controls the operation screen displayed on the display unit 12 of the operation panel 11 and receives manual operations performed by the user on the operation unit 13. For example, the panel control unit 20 updates or transitions the operation screen displayed on the display unit 12 based on the user's operation based on the screen information 16 stored in the storage unit 15. Note that if the user does not manually operate the operation panel 11 for a predetermined period of time or more, the panel control section 20 stops power supply to the display section 12 and shifts the operation panel 11 to the power saving mode.

ジョブ制御部21は、ジョブの設定及び実行を統括的に制御する。ジョブ制御部21は、ジョブ設定部22を備えている。ジョブ設定部22は、ジョブの設定を行う処理部である。すなわち、ジョブ設定部22は、コピー機能などの複数の機能のうちのユーザーが使用しようとする機能を特定し、その特定した機能に対する各種設定項目の設定値をデフォルト値からユーザーによって指定された値に変更し、ジョブの設定を行う。 The job control unit 21 comprehensively controls job settings and execution. The job control section 21 includes a job setting section 22. The job setting section 22 is a processing section that performs job settings. That is, the job setting unit 22 identifies the function that the user intends to use among multiple functions such as the copy function, and changes the setting values of various setting items for the specified function from default values to values specified by the user. and configure the job settings.

例えば、ユーザーが操作パネル11に対する手動操作を行ってジョブの設定を行う場合、操作パネル11の表示部12には、パネル制御部20によって各種の操作画面が表示される。ユーザーはその操作画面に対する操作を順次行っていくことで所望のジョブ設定を行う。このようにユーザーが操作パネル11に対する手動操作を行っているとき、ジョブ設定部22は、パネル制御部20から出力される操作情報に基づいてジョブの設定を行う。 For example, when a user manually operates the operation panel 11 to set a job, the panel control section 20 displays various operation screens on the display section 12 of the operation panel 11. The user performs desired job settings by sequentially performing operations on the operation screen. When the user performs manual operations on the operation panel 11 in this way, the job setting section 22 performs job settings based on the operation information output from the panel control section 20.

また、ユーザーが画像処理装置2を操作するための音声を発した場合、制御部10は、通信インタフェース14を介して制御装置8から送信されるコマンドD4を受信する。制御部10は、そのコマンドD4を解析して制御装置8からの指示を特定する。その指示がジョブの設定を反映させるための設定反映指示である場合、ジョブ設定部22は、その設定反映指示に基づいてジョブの設定を行う。 Further, when the user makes a sound to operate the image processing device 2, the control unit 10 receives a command D4 transmitted from the control device 8 via the communication interface 14. The control unit 10 analyzes the command D4 and identifies the instruction from the control device 8. If the instruction is a setting reflection instruction for reflecting job settings, the job setting unit 22 performs job settings based on the setting reflection instruction.

またジョブ制御部21は、ユーザーによってジョブの実行が指示された場合、スキャナ部17、プリンタ部18及びFAX部19のそれぞれを駆動し、ユーザーによって指定されたジョブを実行する。 Further, when the job execution is instructed by the user, the job control unit 21 drives each of the scanner unit 17, printer unit 18, and FAX unit 19 to execute the job specified by the user.

次に図4は、制御装置8のハードウェア構成及び機能構成を示す図である。制御装置8は、図4(a)に示すように、そのハードウェア構成として、制御部40と、記憶部41と、通信インタフェース42とを備えている。 Next, FIG. 4 is a diagram showing the hardware configuration and functional configuration of the control device 8. As shown in FIG. As shown in FIG. 4A, the control device 8 includes a control section 40, a storage section 41, and a communication interface 42 as its hardware configuration.

制御部40は、CPU43とメモリ44とを備えている。CPU43は、記憶部41に記憶されているプログラム25を読み出して実行する演算処理ユニット(プロセッサー)である。メモリ44は、CPU43がプログラム25を実行することに伴って発生する一時的なデータなどを記憶する。 The control unit 40 includes a CPU 43 and a memory 44. The CPU 43 is an arithmetic processing unit (processor) that reads and executes the program 25 stored in the storage section 41. The memory 44 stores temporary data generated as the CPU 43 executes the program 25.

記憶部41は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などで構成される不揮発性の記憶デバイスである。この記憶部41には、画像処理装置2を制御するためのプログラム25と、キーワード情報26と、優先順位情報27とが予め記憶される。 The storage unit 41 is a non-volatile storage device such as a hard disk drive (HDD) or solid state drive (SSD). The storage unit 41 stores in advance a program 25 for controlling the image processing device 2, keyword information 26, and priority information 27.

通信インタフェース42は、制御装置8が他の機器と通信を行うためのものである。例えば、制御部40は、この通信インタフェース42を介して音声認識装置7から出力されるテキストD2を受信することができる。また、制御部40は、通信インタフェース42を介して案内情報D3を音声認識装置7へ送信したり、また、コマンドD4をローカル環境に設置されている画像処理装置2へ送信したりすることができる。 The communication interface 42 is for the control device 8 to communicate with other devices. For example, the control unit 40 can receive the text D2 output from the speech recognition device 7 via the communication interface 42. Further, the control unit 40 can transmit the guidance information D3 to the voice recognition device 7 via the communication interface 42, and can also transmit the command D4 to the image processing device 2 installed in the local environment. .

制御部40のCPU43は、記憶部41のプログラム25を読み出して実行することにより、図4(b)に示すように、制御部40を、設定特定部31、案内情報出力部32及び装置制御部33として機能させる。 The CPU 43 of the control unit 40 reads and executes the program 25 in the storage unit 41, thereby controlling the control unit 40 to include the setting specifying unit 31, the guidance information output unit 32, and the device control unit, as shown in FIG. 4(b). Function as 33.

設定特定部31は、音声認識装置7から出力されるテキストD2に基づいて画像処理装置2に反映すべき設定を特定する処理部である。設定特定部31は、設定候補抽出部34を備えている。設定候補抽出部34は、テキストD2に対応する設定候補を抽出する。設定候補抽出部34は、テキストD2を受信することに伴って機能し、記憶部41に記憶されているキーワード情報26に基づいて設定候補を抽出する。 The setting specifying unit 31 is a processing unit that specifies settings to be reflected in the image processing device 2 based on the text D2 output from the speech recognition device 7. The setting specifying section 31 includes a setting candidate extracting section 34. The setting candidate extraction unit 34 extracts setting candidates corresponding to the text D2. The setting candidate extraction unit 34 functions upon receiving the text D2, and extracts setting candidates based on the keyword information 26 stored in the storage unit 41.

図5は、キーワード情報26の一例を示す図である。キーワード情報26は、図5に示すように、画像処理装置2に対して設定可能な設定項目及び設定値に対してキーワードが対応付けられた情報であり、画像処理装置2の装置モデルごとに定義される情報である。キーワードは、画像処理装置2に対して各種の設定を行うことが可能なワードであり、例えば、各設定項目の設定値に対応している。ただし、図5に示すように、キーワード情報26には、同じキーワードが異なる設定項目に登録されていることもある。例えば、図5に示すキーワード情報26では、「リョウメン」というキーワードが、コピー機能設定時にスキャナ部17に対して原稿の両面読み取りを指示するキーワードと、コピー機能設定時にプリンタ部18に対して両面印刷を指示するキーワードと、スキャン機能設定時にスキャナ部17に対して原稿の両面読み取りを指示するキーワードと、プリント機能設定時にプリンタ部18に対して両面印刷を指示するキーワードとの4つの設定項目に対して登録されている。 FIG. 5 is a diagram showing an example of the keyword information 26. As shown in FIG. 5, the keyword information 26 is information in which keywords are associated with setting items and setting values that can be set for the image processing device 2, and is defined for each device model of the image processing device 2. This is the information that will be used. The keyword is a word that allows various settings to be made to the image processing device 2, and corresponds to, for example, the setting value of each setting item. However, as shown in FIG. 5, the same keyword may be registered in different setting items in the keyword information 26. For example, in the keyword information 26 shown in FIG. 5, the keyword "Ryomen" is a keyword that instructs the scanner section 17 to read both sides of the document when the copy function is set, and a keyword that instructs the printer section 18 to print both sides of the document when the copy function is set. , a keyword that instructs the scanner section 17 to read both sides of the document when setting the scan function, and a keyword that instructs the printer section 18 to print on both sides of the document when setting the print function. is registered.

設定候補抽出部34は、ユーザーの音声に基づいて変換されたテキストD2に基づいてキーワード情報26を検索することにより、テキストD2に一致するキーワードがキーワード情報26に登録されているか否かを判断する。そして設定候補抽出部34は、テキストD2に一致するキーワードがキーワード情報26に登録されている場合、テキストD2に一致するキーワードが登録されている設定項目と設定値との組み合わせを設定候補として抽出する。そのため、設定候補抽出部34は、テキストD2に対応する設定候補として、1つの設定候補を抽出することもあれば、また複数の設定候補を抽出することもある。例えば、ユーザーが「リョウメン」という音声を発した場合、設定候補抽出部34は、図5に示すキーワード情報26を参照すると、4つの設定候補を抽出することになる。また、設定候補抽出部34は、テキストD2に対応する設定候補を1つも抽出することができないこともある。 The setting candidate extraction unit 34 determines whether a keyword matching the text D2 is registered in the keyword information 26 by searching the keyword information 26 based on the text D2 converted based on the user's voice. . Then, when a keyword matching the text D2 is registered in the keyword information 26, the setting candidate extraction unit 34 extracts a combination of a setting item and a setting value for which a keyword matching the text D2 is registered as a setting candidate. . Therefore, the setting candidate extraction unit 34 may extract one setting candidate or a plurality of setting candidates as the setting candidate corresponding to the text D2. For example, when the user utters the voice "Ryoumen", the setting candidate extraction unit 34 will extract four setting candidates by referring to the keyword information 26 shown in FIG. 5. Furthermore, the setting candidate extraction unit 34 may not be able to extract any setting candidates corresponding to the text D2.

また、設定候補抽出部34は、画像処理装置2に対する現在の設定状態を把握しており、上記のようにして抽出した設定候補が、現在の設定状態に対する禁則条件を満たす場合には、その設定候補を除外する。例えば、画像処理装置2がスキャン機能において原稿を読み取って生成した画像データをコンパクトPDFとして出力する際にモノクロ出力を選択することができない設定となっている場合において、ユーザーが既に「モノクロ出力」を設定している状態で「PDF」という音声を発したと仮定する。この場合、設定候補抽出部34は、設定候補として、例えば、PDF、暗号化PDF、PDFA、サーチャブルPDF、コンパクトPDFといった5つの設定候補を抽出する。しかし、ユーザーが既に「モノクロ出力」を設定しているため、コンパクトPDFが禁則条件を満たす設定候補となり、設定候補抽出部34は、コンパクトPDFを設定候補から除外する。その結果、設定候補抽出部34は、PDF、暗号化PDF、PDFA、及び、サーチャブルPDFの4つの設定候補を抽出することになる。 Further, the setting candidate extracting unit 34 grasps the current setting state of the image processing device 2, and if the setting candidate extracted as described above satisfies the prohibition condition for the current setting state, the setting candidate Eliminate candidates. For example, if the image processing device 2 is set to not be able to select monochrome output when outputting image data generated by reading a document using the scan function as a compact PDF, the user has already selected "monochrome output". Assume that the user utters the sound "PDF" while the settings are being made. In this case, the setting candidate extraction unit 34 extracts five setting candidates, such as PDF, encrypted PDF, PDFA, searchable PDF, and compact PDF, as setting candidates. However, since the user has already set "monochrome output", the compact PDF becomes a setting candidate that satisfies the prohibition condition, and the setting candidate extraction unit 34 excludes the compact PDF from the setting candidates. As a result, the setting candidate extraction unit 34 extracts four setting candidates: PDF, encrypted PDF, PDFA, and searchable PDF.

設定特定部31は、設定候補抽出部34によって設定候補が抽出されなかった場合、案内情報出力部32及び装置制御部33を機能させることなく処理を終了する。ただし、この場合、設定特定部31は、案内情報出力部32を機能させ、案内情報出力部32に「設定項目を特定することができませんでした」という案内情報D3を生成させ、音声認識装置7を介して音声入出力装置3へ出力させるようにしても構わない。 If the setting candidate extraction unit 34 does not extract any setting candidates, the setting specifying unit 31 ends the process without causing the guidance information output unit 32 and the device control unit 33 to function. However, in this case, the setting specifying section 31 causes the guidance information output section 32 to function, causes the guidance information output section 32 to generate the guidance information D3 that says "setting item could not be specified", and the voice recognition device 7 It is also possible to output it to the audio input/output device 3 via the audio input/output device 3.

一方、設定候補抽出部34によって1つの設定候補が抽出された場合、設定特定部31は、その1つの設定候補を、画像処理装置2に反映すべき設定として特定することができる。この場合、設定特定部31は、案内情報出力部32及び装置制御部33を機能させ、案内情報出力部32及び装置制御部33のそれぞれに対して画像処理装置2に反映すべき設定を通知する。 On the other hand, when one setting candidate is extracted by the setting candidate extracting section 34, the setting specifying section 31 can specify the one setting candidate as a setting to be reflected in the image processing device 2. In this case, the setting specifying unit 31 causes the guidance information output unit 32 and the device control unit 33 to function, and notifies each of the guidance information output unit 32 and the device control unit 33 of the settings to be reflected in the image processing device 2. .

また、設定候補抽出部34によって複数の設定候補が抽出された場合にも、設定特定部31は、案内情報出力部32及び装置制御部33を機能させる。そして設定特定部31は、設定候補抽出部34によって抽出された複数の設定候補を、案内情報出力部32及び装置制御部33のそれぞれへ通知する。このとき、設定特定部31は、設定候補抽出部34によって抽出された設定候補の数が所定数(例えば、「3」)以上であるか否かを判断する。そして所定数以上の設定候補が抽出されている場合、設定特定部31は、案内情報出力部32及び装置制御部33のそれぞれに対して設定候補が所定数以上であることを通知する。尚、所定数は、「3」に限られるものではなく、2以上の値であれば良い。 Further, even when a plurality of setting candidates are extracted by the setting candidate extraction section 34, the setting specifying section 31 causes the guidance information output section 32 and the device control section 33 to function. Then, the setting specifying unit 31 notifies each of the guidance information output unit 32 and the device control unit 33 of the plurality of setting candidates extracted by the setting candidate extracting unit 34. At this time, the setting specifying unit 31 determines whether the number of setting candidates extracted by the setting candidate extracting unit 34 is greater than or equal to a predetermined number (for example, “3”). If a predetermined number or more of setting candidates have been extracted, the setting specifying unit 31 notifies each of the guidance information output unit 32 and the device control unit 33 that the number of setting candidates is the predetermined number or more. Note that the predetermined number is not limited to "3" and may be any value of 2 or more.

案内情報出力部32は、ユーザーに対して音声案内を行うための各種の案内情報D3をテキストデータとして生成し、その案内情報D3を音声認識装置7へ送信する処理部である。例えば、案内情報出力部32は、設定特定部31から出力される設定候補を音声案内のためのテキストデータとして表現した案内情報D3を生成する。設定候補抽出部34によって1つの設定候補が抽出された場合、案内情報出力部32は、その1つの設定候補をテキストデータで表した案内情報D3を生成する。また、設定候補抽出部34によって複数の設定候補が抽出されており、それら設定候補の数が所定数未満である場合、案内情報出力部32は、それら複数の設定候補を1つずつ順番に音声出力するために各設定候補のテキストデータを配列した案内情報D3を生成する。 The guidance information output unit 32 is a processing unit that generates various types of guidance information D3 for providing voice guidance to the user as text data, and transmits the guidance information D3 to the voice recognition device 7. For example, the guidance information output unit 32 generates guidance information D3 that represents the setting candidates output from the setting identification unit 31 as text data for voice guidance. When one setting candidate is extracted by the setting candidate extraction unit 34, the guidance information output unit 32 generates guidance information D3 representing the one setting candidate in text data. Further, if a plurality of setting candidates have been extracted by the setting candidate extraction unit 34 and the number of these setting candidates is less than a predetermined number, the guidance information output unit 32 sequentially selects the plurality of setting candidates one by one by voice. Guidance information D3 in which text data of each setting candidate is arranged is generated for output.

さらに、設定候補抽出部34によって複数の設定候補が抽出されており、それら設定候補の数が所定数以上である場合、案内情報出力部32は、設定モードに応じた処理を行う。設定モードには、案内情報D3を生成しない第1のモードと、複数の設定候補を1つずつ順番に音声出力するための案内情報D3を生成する第2のモードと、ユーザーに操作パネル11の確認を促すための案内情報D3を生成する第3のモードとの3つのモードがある。案内情報出力部32には、それら3つのモードのうちから、ユーザーによって予め選択されたモードが設定されている。例えば、第1のモードが設定されている場合、案内情報出力部32は、案内情報D3を出力しない。また、第2のモードが設定されている場合、案内情報出力部32は、所定数未満の設定候補が抽出された場合と同様に、所定数以上の設定候補を1つずつ順番に音声出力するための案内情報D3を生成して音声認識装置7へ出力する。さらに第3のモードが設定されている場合、案内情報出力部32は、例えば「操作パネルの表示画面を確認してください」といったテキストデータの案内情報D3を生成して音声認識装置7へ出力する。 Furthermore, if a plurality of setting candidates have been extracted by the setting candidate extraction section 34 and the number of these setting candidates is a predetermined number or more, the guidance information output section 32 performs processing according to the setting mode. The setting modes include a first mode in which no guidance information D3 is generated, a second mode in which guidance information D3 is generated for sequentially outputting multiple setting candidates one by one, and a second mode in which the user is prompted to use the operation panel 11. There are three modes including a third mode that generates guide information D3 for prompting confirmation. The guide information output unit 32 is set with a mode selected in advance by the user from among these three modes. For example, when the first mode is set, the guidance information output unit 32 does not output the guidance information D3. Furthermore, when the second mode is set, the guidance information output unit 32 sequentially outputs a predetermined number or more setting candidates one by one in voice, as in the case where less than a predetermined number of setting candidates are extracted. guidance information D3 is generated and output to the speech recognition device 7. Furthermore, when the third mode is set, the guidance information output unit 32 generates guidance information D3 in the form of text data such as "Please check the display screen of the operation panel" and outputs it to the voice recognition device 7. .

尚、第2のモードと第3のモードは、案内情報出力部32において同時に設定されていても構わない。第2のモードと第3のモードとが同時に設定されている場合、案内情報出力部32は、例えば「操作パネルの表示画面を確認してください」といったテキストデータの次に複数の設定候補のそれぞれに対応するテキストデータを配列した案内情報D3を生成する。 Note that the second mode and the third mode may be set at the same time in the guide information output section 32. When the second mode and the third mode are set at the same time, the guidance information output unit 32 outputs each of the plurality of setting candidates next to text data such as "Please check the display screen of the operation panel". Guide information D3 is generated in which text data corresponding to the text data is arranged.

装置制御部33は、画像処理装置2に対して各種のコマンドD4を送信することにより、画像処理装置2を制御する処理部である。この装置制御部33は、表示制御部35と、設定反映部36とを備えている。表示制御部35は、画像処理装置2の操作パネル11に表示される操作画面を制御するものである。設定反映部36は、画像処理装置2に対するユーザーが所望する設定を反映させる処理部である。 The device control unit 33 is a processing unit that controls the image processing device 2 by transmitting various commands D4 to the image processing device 2. This device control section 33 includes a display control section 35 and a setting reflection section 36. The display control unit 35 controls an operation screen displayed on the operation panel 11 of the image processing device 2. The settings reflection unit 36 is a processing unit that reflects settings desired by the user on the image processing device 2.

装置制御部33は、設定特定部31において画像処理装置2に反映すべき設定が特定された場合、設定反映部36を機能させる。すなわち、設定反映部36は、音声認識結果に基づいて1つの設定候補だけが抽出された場合に機能する。そして設定反映部46は、設定特定部31において特定された設定を画像処理装置2に反映させるためのコマンドD4を生成し、画像処理装置2へ送信する。画像処理装置2は、そのコマンドD4を受信すると、設定反映部36によって指定された設定を反映させる。つまり、画像処理装置2は、ユーザーの音声に対応する設定を自動的に行うのである。そのため、ユーザーは、操作パネル11に対する操作を行わなくても、画像処理装置2に対して所望の設定を行うことができる。 The device control unit 33 causes the setting reflection unit 36 to function when the setting identification unit 31 identifies settings to be reflected in the image processing device 2 . That is, the setting reflection unit 36 functions when only one setting candidate is extracted based on the voice recognition result. Then, the setting reflection section 46 generates a command D4 for reflecting the settings specified by the setting specifying section 31 on the image processing apparatus 2, and transmits it to the image processing apparatus 2. When the image processing device 2 receives the command D4, the image processing device 2 reflects the settings specified by the setting reflection unit 36. In other words, the image processing device 2 automatically makes settings corresponding to the user's voice. Therefore, the user can make desired settings for the image processing device 2 without operating the operation panel 11.

一方、設定候補抽出部34によって複数の設定候補が抽出され、設定特定部31において画像処理装置2に反映すべき設定を特定することができなかった場合、設定反映部36は、コマンドD4を生成しない。 On the other hand, if the setting candidate extracting unit 34 extracts a plurality of setting candidates and the setting specifying unit 31 is unable to specify a setting to be reflected in the image processing device 2, the setting reflecting unit 36 generates the command D4. do not.

また、装置制御部33は、設定特定部31において所定数以上の設定候補が抽出された場合、表示制御部35を機能させる。表示制御部35は、設定特定部31において音声認識結果に対応する複数の設定候補が存在すると判定された場合に、ユーザーに対してそれら複数の設定候補を提示する制御手段である。表示制御部35は、設定特定部31において所定数以上の設定候補が抽出された場合に、それら所定数以上の設定候補を画像処理装置2の操作パネル11に表示させるためのコマンドD4を生成し、画像処理装置2へ送信する。画像処理装置2は、このコマンドD4を受信すると、音声認識結果に対応して抽出された所定数以上の設定候補を表示した選択画面を生成し、その選択画面を操作パネル11の表示部12に表示する。このとき、画像処理装置2において生成される選択画面には、制御装置8において抽出された所定数以上の設定候補のそれぞれに対応する設定項目が含まれる。そのため、ユーザーは、画像処理装置2の操作パネル11に表示される選択画面を確認することにより、自身が発した音声に対応する複数の設定項目を簡単且つ速やかに把握することができ、それらの複数の設定項目のうちから所望の設定項目を効率的に選択することができる。 Furthermore, when the setting specifying section 31 extracts a predetermined number or more of setting candidates, the device control section 33 causes the display control section 35 to function. The display control unit 35 is a control unit that presents a plurality of setting candidates to the user when the setting specifying unit 31 determines that there are a plurality of setting candidates corresponding to the voice recognition result. When the setting specifying unit 31 extracts a predetermined number or more of setting candidates, the display control unit 35 generates a command D4 for displaying the predetermined number or more of setting candidates on the operation panel 11 of the image processing device 2. , is transmitted to the image processing device 2. Upon receiving this command D4, the image processing device 2 generates a selection screen displaying a predetermined number or more of setting candidates extracted in accordance with the voice recognition result, and displays the selection screen on the display unit 12 of the operation panel 11. indicate. At this time, the selection screen generated by the image processing device 2 includes setting items corresponding to each of the predetermined number or more setting candidates extracted by the control device 8. Therefore, by checking the selection screen displayed on the operation panel 11 of the image processing device 2, the user can easily and quickly grasp the multiple setting items corresponding to the voice he/she uttered, and A desired setting item can be efficiently selected from among a plurality of setting items.

また、表示制御部35は、所定数以上の設定候補が抽出された場合、それら所定数以上の設定項目を所定の優先順位に従って表示させるためのコマンドD4を生成する。そのため、表示制御部35は、所定数以上の設定候補が抽出された場合、優先順位情報27を参照する。優先順位情報27は、複数の設定項目に対する優先順位が予め定められた情報である。例えば、優先順位は、ユーザーによる設定頻度が高い順に予め定められる。また、優先順位は、各設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められたものであっても構わない。この場合、例えば、トップ画面からの階層が浅い設定候補の優先順位が高くなり、トップ画面からの階層が深い設定項目の優先順位が低くなるように予め定められる。 Further, when a predetermined number or more setting candidates are extracted, the display control unit 35 generates a command D4 for displaying the predetermined number or more setting items according to a predetermined priority order. Therefore, the display control unit 35 refers to the priority information 27 when a predetermined number or more setting candidates are extracted. The priority information 27 is information in which priorities for a plurality of setting items are determined in advance. For example, the priority order is predetermined in descending order of frequency of setting by the user. Further, the priority order may be predetermined based on the hierarchy of the operation screen that includes setting items corresponding to each setting candidate. In this case, for example, it is predetermined in advance that setting candidates with a shallow hierarchy from the top screen have a high priority, and setting candidates with a deep hierarchy from the top screen have a low priority.

また、表示制御部35は、選択画面として、所定数以上の設定候補のそれぞれに対応するサムネイル画像を配置した画面を画像処理装置2に生成させるようにしても良い。この場合、表示制御部35は、優先順位情報27において規定された優先順位に基づいて選択画面に表示するサムネイル画像の画像サイズを変化させるようにしても良い。例えば、優先順位の高い設定候補に対応するサムネイル画像の画像サイズを、優先順位の低い設定候補に対応するサムネイル画像の画像サイズよりも大きいサイズとすることで、ユーザーにとって優先順位の高い設定候補を選択しやすい画面とすることができる。 Further, the display control unit 35 may cause the image processing device 2 to generate, as the selection screen, a screen in which thumbnail images corresponding to each of a predetermined number or more of setting candidates are arranged. In this case, the display control unit 35 may change the image size of the thumbnail image displayed on the selection screen based on the priority order defined in the priority information 27. For example, by setting the image size of a thumbnail image corresponding to a setting candidate with a high priority to be larger than the image size of a thumbnail image corresponding to a setting candidate with a low priority, the setting candidates with a high priority can be viewed by the user. The screen can be made easy to select.

尚、案内情報出力部32は、第2のモードが設定されている場合において、所定数以上の設定候補を1つずつ順番に音声出力するための案内情報D3を生成するとき、上記と同様に、優先順位情報27に規定された優先順位に基づき、優先順位の高い設定候補から順に音声出力されるようにテキストデータを配列した案内情報D3を生成するようにしても良い。 Note that when the second mode is set, the guidance information output unit 32 generates the guidance information D3 for sequentially outputting a predetermined number or more of setting candidates one by one in the same way as described above. Based on the priority order specified in the priority information 27, the guide information D3 may be generated in which text data is arranged so that the setting candidates with the highest priority order are outputted as audio.

次に、制御装置8及び画像処理装置2における連携動作の流れについて説明する。まず図6は、制御装置8が音声認識結果に基づいて画像処理装置2に反映すべき設定を特定することができた場合の流れを示す図である。制御装置8は、音声認識装置7から出力されるテキストD2を取得すると、テキストD2に基づいて画像処理装置2に対する設定候補を抽出する処理を行う(プロセスP10)。このとき、テキストD2に基づいて1つの設定候補が抽出することができると、制御装置8は、その1つの設定候補が画像処理装置2に反映すべき設定内容であると特定することができる(プロセスP11)。そして制御装置8は、特定した設定を含む設定反映指示D41を、コマンドD4として画像処理装置2へ送信する。 Next, the flow of cooperative operations in the control device 8 and the image processing device 2 will be explained. First, FIG. 6 is a diagram showing the flow when the control device 8 is able to specify settings to be reflected in the image processing device 2 based on the voice recognition result. When the control device 8 acquires the text D2 output from the speech recognition device 7, it performs a process of extracting setting candidates for the image processing device 2 based on the text D2 (process P10). At this time, if one setting candidate can be extracted based on the text D2, the control device 8 can specify that the one setting candidate is the setting content that should be reflected in the image processing device 2 ( Process P11). Then, the control device 8 transmits a setting reflection instruction D41 including the specified settings to the image processing device 2 as a command D4.

画像処理装置2は、制御装置8から設定反映指示D41を受信すると、その設定反映指示D41に基づき、設定反映処理を行う(プロセスP12)。すなわち、画像処理装置2は、ユーザーが音声で指示した設定を装置内部に反映させるのである。したがって、ユーザーは、操作パネル11に対する手動操作を行うことなく、画像処理装置2に対する各種設定を行うことができる。 When the image processing device 2 receives the setting reflection instruction D41 from the control device 8, it performs a setting reflection process based on the setting reflection instruction D41 (process P12). That is, the image processing device 2 reflects the settings given by the user's voice inside the device. Therefore, the user can perform various settings for the image processing apparatus 2 without manually operating the operation panel 11.

次に図7は、制御装置8が音声認識結果に基づいて所定数以上の設定候補を抽出した場合の流れを示す図である。制御装置8は、音声認識装置7から出力されるテキストD2を取得すると、テキストD2に基づいて画像処理装置2に対する設定候補を抽出する処理を行う(プロセスP10)。このとき、テキストD2に基づいて所定数以上の設定候補を抽出すると、制御装置8は、画像処理装置2に反映すべき設定を特定することができない。そのため、制御装置8は、所定数以上の設定候補のうちからユーザーが所望する設定候補の選択を促すための選択画面表示指示D42を、コマンドD4として画像処理装置2へ送信する。この選択画面表示指示D42には、音声認識結果に基づいて抽出された所定数以上の設定候補を示す情報が含まれる。また、選択画面表示指示D42には、上述したように、所定数以上の設定候補を所定の優先順位に従って表示させるための指示が含まれていても良い。 Next, FIG. 7 is a diagram showing a flow when the control device 8 extracts a predetermined number or more of setting candidates based on the voice recognition results. When the control device 8 acquires the text D2 output from the speech recognition device 7, it performs a process of extracting setting candidates for the image processing device 2 based on the text D2 (process P10). At this time, if a predetermined number or more of setting candidates are extracted based on the text D2, the control device 8 cannot specify the settings to be reflected in the image processing device 2. Therefore, the control device 8 transmits a selection screen display instruction D42 to the image processing device 2 as a command D4 to prompt the user to select a desired setting candidate from a predetermined number or more of setting candidates. This selection screen display instruction D42 includes information indicating a predetermined number or more of setting candidates extracted based on the voice recognition result. Furthermore, as described above, the selection screen display instruction D42 may include an instruction to display a predetermined number or more of setting candidates according to a predetermined priority order.

画像処理装置2は、制御装置8から選択画面表示指示D42を受信すると、その選択画面表示指示D42に基づき、所定数以上の設定候補を配置した選択画面を生成し、操作パネル11の表示部12に選択画面を表示する(プロセスP13)。これにより、ユーザーは、自身で発した音声に対応する設定候補が所定数以上存在する場合であっても、操作パネル11の表示部12に表示される選択画面を見ることにより、所定数以上の設定候補のうちから所望の設定候補を速やかに選択することができる。そのため、仮に音声入出力装置3が所定数以上の設定候補を順番に音声出力している状態であっても、ユーザーは、音声入出力装置3による音声出力の途中で所望の設定候補を選択することが可能であり、画像処理装置2に対する設定に要する時間を短縮することができる。また、ユーザーは、操作パネル11に表示される選択画面を確認した後、所望の設定候補を手動操作によって選択することができるし、また音声操作によって選択することもできる。 When the image processing device 2 receives the selection screen display instruction D42 from the control device 8, it generates a selection screen on which a predetermined number or more of setting candidates are arranged based on the selection screen display instruction D42, and displays the selection screen on the display section 12 of the operation panel 11. A selection screen is displayed on (process P13). As a result, even if there are a predetermined number or more of setting candidates corresponding to the voice that the user has uttered, the user can select the predetermined number or more by looking at the selection screen displayed on the display section 12 of the operation panel 11. A desired setting candidate can be quickly selected from among the setting candidates. Therefore, even if the audio input/output device 3 is sequentially outputting a predetermined number or more of setting candidates, the user can select a desired setting candidate while the audio input/output device 3 is outputting audio. Therefore, the time required for setting the image processing device 2 can be shortened. Further, after checking the selection screen displayed on the operation panel 11, the user can select a desired setting candidate by manual operation or by voice operation.

次に、制御装置8において行われる処理手順について詳しく説明する。図8乃至図10は、制御装置8において行われる処理手順の一例を示すフローチャートである。この処理は、制御装置8のCPU43がプログラム25を実行することによって行われる処理であり、CPU43によって繰り返し実行される処理である。 Next, the processing procedure performed in the control device 8 will be explained in detail. 8 to 10 are flowcharts showing an example of a processing procedure performed in the control device 8. This process is a process performed by the CPU 43 of the control device 8 executing the program 25, and is a process repeatedly executed by the CPU 43.

制御装置8は、この処理を開始すると、図8に示すように、音声認識装置7による音声認識結果であるテキストD2を受信したか否かを判断する(ステップS10)。音声認識結果を受信していない場合(ステップS10でNO)、制御装置8による処理は終了する。これに対し、音声認識結果を受信した場合(ステップS10でYES)、制御装置8は、テキストD2に付加されている装置情報に基づき、画像処理装置2の装置モデルを特定し(ステップS11)、その装置モデルに対応するキーワード情報26を読み出す(ステップS12)。そして制御装置8は、設定候補抽出処理を実行する(ステップS13)。 When the control device 8 starts this process, as shown in FIG. 8, the control device 8 determines whether or not the text D2, which is the result of speech recognition by the speech recognition device 7, has been received (step S10). If the voice recognition result has not been received (NO in step S10), the process by the control device 8 ends. On the other hand, when the voice recognition result is received (YES in step S10), the control device 8 identifies the device model of the image processing device 2 based on the device information added to the text D2 (step S11), Keyword information 26 corresponding to the device model is read out (step S12). The control device 8 then executes setting candidate extraction processing (step S13).

図9は、設定候補抽出処理(ステップS13)の詳細な処理手順の一例を示すフローチャートである。制御装置8は、設定候補抽出処理を開始すると、ステップS12で読み出したキーワード情報26を参照し、テキストD2に対応する設定候補を全て抽出する(ステップS20)。このとき、1つの設定候補だけが抽出されることもあれば、複数の設定候補が抽出されることもある。また、設定候補が1つも抽出されないこともある。設定候補が1つも抽出されなかった場合、制御装置8による処理はその時点で終了する。 FIG. 9 is a flowchart illustrating an example of a detailed processing procedure of the setting candidate extraction process (step S13). When the control device 8 starts the setting candidate extraction process, it refers to the keyword information 26 read out in step S12 and extracts all setting candidates corresponding to the text D2 (step S20). At this time, only one setting candidate may be extracted, or a plurality of setting candidates may be extracted. Furthermore, there may be cases where no setting candidates are extracted. If no setting candidates are extracted, the processing by the control device 8 ends at that point.

ステップS20において少なくとも1つの設定候補が抽出された場合、制御装置8は、ユーザーによって既に指定された現在の設定状態を確認し(ステップS21)、禁則判定を行う(ステップS22)。すなわち、制御装置8は、ステップS20で抽出した少なくとも1つの設定候補の中に、現在の設定状態に対する禁則条件を満たす設定候補が存在するか否かを判定する。その結果、禁則条件に合致する設定候補が存在する場合(ステップS23でYES)、制御装置8は、禁則条件に合致する設定候補を除外する(ステップS24)。尚、禁則条件に合致する設定候補を除外した結果、設定候補が1つの残らないこととなった場合、制御装置8による処理はその時点で終了する。一方、禁則条件に合致する設定候補が存在しない場合(ステップS23でNO)、制御装置8は、ステップS20で抽出した設定候補を、有効な設定候補として認定する。以上で、設定候補抽出処理が終了する。 If at least one setting candidate is extracted in step S20, the control device 8 checks the current setting state already designated by the user (step S21), and makes a prohibition determination (step S22). That is, the control device 8 determines whether there is a setting candidate that satisfies the prohibition condition for the current setting state among the at least one setting candidate extracted in step S20. As a result, if there is a setting candidate that matches the prohibition condition (YES in step S23), the control device 8 excludes the setting candidate that matches the prohibition condition (step S24). Note that if, as a result of excluding setting candidates that match the prohibition conditions, there is no remaining setting candidate, the processing by the control device 8 ends at that point. On the other hand, if there is no setting candidate that matches the prohibition condition (NO in step S23), the control device 8 certifies the setting candidate extracted in step S20 as a valid setting candidate. This completes the setting candidate extraction process.

図8のフローチャートに戻り、次に制御装置8は、設定候補抽出処理(ステップS13)において1つの設定候補だけが抽出されたか否かを判断する(ステップS14)。1つの設定候補だけが抽出された場合(ステップS14でYES)、制御装置8は、その1つの設定候補を、画像処理装置2に反映すべき設定として特定することができる。この場合、制御装置8は、画像処理装置2に対して設定反映指示D41を送信する(ステップS15)。つまり、制御装置8は、音声認識結果に基づいて特定した設定を画像処理装置2に反映させるのである。そして制御装置8は、画像処理装置2に反映させた設定をユーザーに音声案内するための案内情報D3をテキストデータとして生成し(ステップS16)、その案内情報D3を音声認識装置7へ送信する(ステップS17)。これにより、音声認識装置7は、テキストデータで表現された案内情報D3を音声情報に変換し、音声情報に変換した案内情報D3を音声入出力装置3へ送信する。そして音声入出力装置3は、音声情報に変換された案内情報D3に基づく音声出力を行うので、画像処理装置2に反映された設定をユーザーに報知することができる。ユーザーは、音声入出力装置3から出力される音声を聞くことにより、自身で発した音声が正しく認識され、所望の設定がなされたか否かを確認することができる。 Returning to the flowchart of FIG. 8, next, the control device 8 determines whether only one setting candidate has been extracted in the setting candidate extraction process (step S13) (step S14). If only one setting candidate is extracted (YES in step S14), the control device 8 can specify the one setting candidate as the setting to be reflected in the image processing device 2. In this case, the control device 8 transmits a setting reflection instruction D41 to the image processing device 2 (step S15). In other words, the control device 8 causes the image processing device 2 to reflect the settings specified based on the voice recognition result. Then, the control device 8 generates guidance information D3 as text data to provide voice guidance to the user about the settings reflected in the image processing device 2 (step S16), and transmits the guidance information D3 to the voice recognition device 7 (step S16). Step S17). Thereby, the voice recognition device 7 converts the guidance information D3 expressed in text data into voice information, and transmits the guidance information D3 converted into voice information to the voice input/output device 3. Since the audio input/output device 3 outputs audio based on the guidance information D3 converted to audio information, it is possible to notify the user of the settings reflected in the image processing device 2. By listening to the voice output from the voice input/output device 3, the user can confirm whether the voice he/she uttered is correctly recognized and the desired settings have been made.

一方、設定候補抽出処理(ステップS13)において複数の設定候補が抽出された場合(ステップS14でNO)、制御装置8は、設定候補提示処理を行う(ステップS18)。図10は、その設定候補提示処理(ステップS18)の詳細な処理手順の一例を示すフローチャートである。制御装置8は、設定候補提示処理を開始すると、まず音声認識結果に基づいて抽出された設定候補の数を確認する(ステップS30)。そして制御装置8は、所定数以上の設定候補が抽出されたか否かを判断する(ステップS31)。 On the other hand, if a plurality of setting candidates are extracted in the setting candidate extraction process (step S13) (NO in step S14), the control device 8 performs a setting candidate presentation process (step S18). FIG. 10 is a flowchart showing an example of a detailed processing procedure of the setting candidate presentation process (step S18). When the control device 8 starts the setting candidate presentation process, it first checks the number of setting candidates extracted based on the voice recognition result (step S30). Then, the control device 8 determines whether or not a predetermined number or more of setting candidates have been extracted (step S31).

所定数以上の設定候補が抽出された場合(ステップS31でYES)、制御装置8は、優先順位情報27を読み出し(ステップS32)、優先順位情報27に予め定められている優先順位に基づいて所定数以上の設定候補の優先順位を決定する(ステップS33)。そして制御装置8は、決定した優先順位に基づいて所定数以上の設定候補を表示させるための選択画面表示指示D42を生成し、その選択画面表示指示D42を画像処理装置2へ送信する(ステップS34)。また、制御装置8は、設定モードに応じてユーザーに対する音声案内を行うための案内情報D3をテキストデータとして生成し(ステップS35)、その案内情報D3を音声認識装置7へ送信する(ステップS36)。尚、制御装置8における設定モードが第1のモードであれば、ステップS35、S36の処理は行われず、音声入出力装置3による音声出力は行われない。 If a predetermined number or more of setting candidates are extracted (YES in step S31), the control device 8 reads the priority information 27 (step S32), and selects a predetermined setting based on the priority order predetermined in the priority information 27. The priority order of the setting candidates of the number or more is determined (step S33). Then, the control device 8 generates a selection screen display instruction D42 for displaying a predetermined number or more of setting candidates based on the determined priority order, and transmits the selection screen display instruction D42 to the image processing device 2 (step S34 ). The control device 8 also generates guidance information D3 as text data for providing voice guidance to the user according to the setting mode (step S35), and transmits the guidance information D3 to the voice recognition device 7 (step S36). . Note that if the setting mode in the control device 8 is the first mode, the processing in steps S35 and S36 is not performed, and the audio input/output device 3 does not output audio.

一方、所定数以上の設定候補が抽出されていない場合(ステップS31でNO)、制御装置8は、抽出された複数の設定候補を順番に音声出力するための案内情報D3をテキストデータとして生成し(ステップS37)、その案内情報D3を音声認識装置7へ送信する(ステップS38)。つまり、本実施形態における制御装置8は、音声認識結果に基づいて抽出された設定候補の数が所定数未満であれば、複数の設定候補を順番に音声出力したとしても、音声出力が終了するまでにそれ程長い時間を要しないため、画像処理装置2の操作パネル11には選択画面を表示させないようにしている。そのため、ユーザーが画像処理装置2から離れた場所で音声操作を行っている場合には、操作パネル11に対して無駄な表示を行わなくて済み、操作パネル11が省電力モードであれば、その省電力モードを継続することができる。 On the other hand, if the predetermined number or more of setting candidates have not been extracted (NO in step S31), the control device 8 generates guidance information D3 as text data for sequentially outputting the plurality of extracted setting candidates by voice. (Step S37), and transmits the guidance information D3 to the voice recognition device 7 (Step S38). In other words, if the number of setting candidates extracted based on the voice recognition result is less than the predetermined number, the control device 8 in the present embodiment ends the voice output even if the plurality of setting candidates are outputted in sequence. Since it does not take that long to complete, the selection screen is not displayed on the operation panel 11 of the image processing device 2. Therefore, if the user is performing voice operations at a location away from the image processing device 2, there is no need to display unnecessary information on the operation panel 11, and if the operation panel 11 is in power saving mode, Power saving mode can be continued.

尚、上記においては、制御装置8が、画像処理装置2に対するコマンドD4として、設定反映指示D41と選択画面表示指示D42を送信する場合を例示したが、これらは単なる一例である。すなわち、制御装置8は、設定反映指示D41及び選択画面表示指示D42以外にも、様々なコマンドD4を生成することができる。例えば、制御装置8は、ユーザーによる指示がジョブの実行指示である場合には、ジョブ実行指示をコマンドD4として生成する。 In addition, although the case where the control device 8 transmits the setting reflection instruction D41 and the selection screen display instruction D42 as the command D4 to the image processing device 2 has been described above, these are merely examples. That is, the control device 8 can generate various commands D4 in addition to the setting reflection instruction D41 and the selection screen display instruction D42. For example, if the user's instruction is a job execution instruction, the control device 8 generates the job execution instruction as the command D4.

次に画像処理装置2における処理手順について説明する。図11は、画像処理装置2において行われる処理手順の一例を示すフローチャートである。尚、図11では、画像処理装置2が制御装置8からコマンドを受信した場合の処理手順のみを示している。画像処理装置2は、この処理を開始すると、制御装置8からコマンドD4を受信したか否かを判断する(ステップS40)。制御装置8からコマンドD4を受信していない場合(ステップS40でNO)、画像処理装置2による処理は終了する。一方、制御装置8からコマンドD4を受信している場合(ステップS40でYES)、画像処理装置2は、受信したコマンドD4が設定反映指示D41であるか否かを判断する(ステップS41)。コマンドD4が設定反映指示D41である場合(ステップS41でYES)、画像処理装置2は、ジョブ設定部22を機能させ、設定反映指示D41に基づく設定を反映させたジョブ設定を行う(ステップS42)。 Next, the processing procedure in the image processing device 2 will be explained. FIG. 11 is a flowchart showing an example of a processing procedure performed in the image processing device 2. As shown in FIG. Note that FIG. 11 only shows the processing procedure when the image processing device 2 receives a command from the control device 8. When the image processing device 2 starts this process, it determines whether or not it has received the command D4 from the control device 8 (step S40). If the command D4 has not been received from the control device 8 (NO in step S40), the processing by the image processing device 2 ends. On the other hand, if the command D4 has been received from the control device 8 (YES in step S40), the image processing device 2 determines whether the received command D4 is a setting reflection instruction D41 (step S41). If the command D4 is the settings reflection instruction D41 (YES in step S41), the image processing device 2 causes the job setting unit 22 to function and performs job settings that reflect the settings based on the settings reflection instruction D41 (step S42). .

また、コマンドD4が設定反映指示D41でなかった場合(ステップS41でNO)、画像処理装置2は、コマンドD4が選択画面表示指示D42であるか否かを判断する(ステップS43)。コマンドD4が選択画面表示指示D42である場合(ステップS43でYES)、画像処理装置2は、パネル制御部20を機能させ、所定数以上の設定候補を表示するための選択画面を生成する(ステップS44)。このとき、パネル制御部20は、選択画面表示指示D42において所定数以上の設定候補のそれぞれに対して優先順位が設定されていれば、その優先順位に基づいて所定数以上の設定候補をレイアウトした選択画面を生成する。そしてパネル制御部20は、選択画面表示指示D42に基づいて生成した選択画面を操作パネル11の表示部12に表示する(ステップS45)。例えば、制御装置8からコマンドD4を受信した時点において操作パネル11が省電力モードである場合、パネル制御部20は、表示部12への給電を開始して選択画面を表示する。この場合、パネル制御部20は、選択画面の表示開始から所定時間が経過するまでの間、表示部12を点滅表示させることでユーザーが操作パネル11を注目できるように注意喚起を行うようにしても良い。尚、このような注意喚起は、例えばスピーカーから所定のビープ音などを発することで実現しても良い。 Further, if the command D4 is not a setting reflection instruction D41 (NO in step S41), the image processing device 2 determines whether the command D4 is a selection screen display instruction D42 (step S43). If the command D4 is a selection screen display instruction D42 (YES in step S43), the image processing device 2 causes the panel control unit 20 to function and generates a selection screen for displaying a predetermined number or more of setting candidates (step S44). At this time, if a priority order is set for each of the predetermined number or more setting candidates in the selection screen display instruction D42, the panel control unit 20 lays out the predetermined number or more setting candidates based on the priority order. Generate a selection screen. The panel control unit 20 then displays the selection screen generated based on the selection screen display instruction D42 on the display unit 12 of the operation panel 11 (step S45). For example, if the operation panel 11 is in the power saving mode at the time of receiving the command D4 from the control device 8, the panel control section 20 starts supplying power to the display section 12 and displays the selection screen. In this case, the panel control unit 20 causes the display unit 12 to blink until a predetermined time has elapsed from the start of displaying the selection screen to alert the user to the operation panel 11. Also good. Note that such an alert may be realized, for example, by emitting a predetermined beep sound from a speaker.

図12は、操作パネル11の表示部12に表示される選択画面G10の一例を示す図である。制御装置8においてユーザーの音声認識結果に基づく設定候補として所定数以上の設定候補が抽出された場合、画像処理装置2は、操作パネル11の表示部12に対して図12に示すような選択画面G10を表示する。図12では、ユーザーが「リョウメン」という音声を発した場合の選択画面G10の一例を示している。この選択画面G10には、所定数以上の設定候補を表示するための設定候補表示領域R1が含まれており、その設定候補表示領域R1に、所定数以上の設定候補のそれぞれに対応するサムネイル画像61,62,63,64が表示される。これらのサムネイル画像61,62,63,64の画像サイズは、制御装置8において決定された優先順位に基づくサイズとなっている。ここで、優先順位がユーザーによる設定頻度の高いものから順に設定されているとすると、ユーザーは、画像サイズの最も大きいサムネイル画像62が最も設定頻度の高い設定項目であることを把握することができる。つまり、選択画面G10は、ユーザーにとって設定頻度の高い設定項目を選択しやすい画面となっているのである。したがって、ユーザーは、音声入出力装置3から出力される音声案内を全て聞かなくても、設定頻度の高い設定項目を効率的に選択することが可能である。 FIG. 12 is a diagram showing an example of the selection screen G10 displayed on the display section 12 of the operation panel 11. When the control device 8 extracts a predetermined number or more of setting candidates based on the user's voice recognition results, the image processing device 2 displays a selection screen as shown in FIG. 12 on the display unit 12 of the operation panel 11. Display G10. FIG. 12 shows an example of the selection screen G10 when the user utters the voice "Ryoumen." This selection screen G10 includes a setting candidate display area R1 for displaying a predetermined number or more of setting candidates, and a thumbnail image corresponding to each of the predetermined number or more setting candidates is displayed in the setting candidate display area R1. 61, 62, 63, and 64 are displayed. The image sizes of these thumbnail images 61, 62, 63, and 64 are based on the priority order determined by the control device 8. Here, if the priority is set in descending order of setting frequency by the user, the user can understand that the thumbnail image 62 with the largest image size is the setting item most frequently set. . In other words, the selection screen G10 is a screen that allows the user to easily select setting items that are set frequently. Therefore, the user can efficiently select setting items that are set frequently without having to listen to all the audio guidance output from the audio input/output device 3.

図12に示す選択画面G1が表示されているとき、ユーザーは、所望の設定候補を選択する操作として操作パネル11に対する手動操作を行うことができる。例えば、ユーザーは、複数のサムネイル画像61,62,63,64のうちから所望の設定候補に対応するサムネイル画像をタッチし、選択画面G10内の操作ボタンB1を操作することにより、一の設定候補を選択することができる。尚、ユーザーは、手動操作だけでなく、音声を発することによって所望の設定候補を選択することもできる。 When the selection screen G1 shown in FIG. 12 is displayed, the user can manually operate the operation panel 11 to select a desired setting candidate. For example, the user touches a thumbnail image corresponding to a desired setting candidate from among the plurality of thumbnail images 61, 62, 63, and 64, and operates the operation button B1 on the selection screen G10 to select one setting candidate. can be selected. Note that the user can select a desired setting candidate not only by manual operation but also by uttering voice.

図13は、図12とは異なる選択画面G11の例を示す図である。制御装置8においてユーザーの音声認識結果に基づく設定候補として所定数以上の設定候補が抽出された場合、画像処理装置2は、操作パネル11の表示部12に対して図13に示すような選択画面G11を表示しても良い。図13でも、ユーザーが「リョウメン」という音声を発した場合の選択画面G11の例を示している。この選択画面G11においても、所定数以上の設定候補を表示するための設定候補表示領域R1が含まれており、その設定候補表示領域R1に、所定数以上の設定候補のそれぞれがリスト形式で表示される。所定数以上の設定候補のリストは、例えば優先順位の高いものからリストの上位に表示される。したがって、ユーザーは、音声入出力装置3から出力される音声案内を全て聞かなくても、優先順位の高い設定項目を効率的に選択することが可能である。尚、図13では、複数の設定候補のうちから、ユーザーがコピー機能のプリンタ部18に対する両面印刷をオンに設定することを選択した場合を例示している。 FIG. 13 is a diagram showing an example of a selection screen G11 different from that in FIG. 12. When the control device 8 extracts a predetermined number or more of setting candidates based on the user's voice recognition results, the image processing device 2 displays a selection screen as shown in FIG. 13 on the display unit 12 of the operation panel 11. G11 may also be displayed. FIG. 13 also shows an example of the selection screen G11 when the user utters the voice "Ryoumen." This selection screen G11 also includes a setting candidate display area R1 for displaying a predetermined number or more of setting candidates, and each of the predetermined number or more setting candidates is displayed in list format in the setting candidate display area R1. be done. A list of setting candidates of a predetermined number or more is displayed, for example, in ascending order of priority. Therefore, the user can efficiently select a setting item with a high priority without listening to all the audio guidance output from the audio input/output device 3. Note that FIG. 13 illustrates a case where the user selects to turn on double-sided printing for the printer section 18 of the copy function from among a plurality of setting candidates.

図11のフローチャートに戻り、画像処理装置2は、受信したコマンドD4が選択画面表示指示D42でなかった場合(ステップS43でNO)、ジョブの実行指示であるか否かを判断する(ステップS46)。コマンドD4がジョブの実行指示である場合(ステップS46でYES)、画像処理装置2は、ジョブ制御部21を機能させ、ユーザーによって指定されたジョブの実行を開始する(ステップS47)。 Returning to the flowchart of FIG. 11, if the received command D4 is not a selection screen display instruction D42 (NO in step S43), the image processing device 2 determines whether it is a job execution instruction (step S46). . If the command D4 is a job execution instruction (YES in step S46), the image processing device 2 causes the job control unit 21 to function and starts executing the job specified by the user (step S47).

一方、受信したコマンドD4がジョブの実行指示でもなかった場合(ステップS46でNO)、画像処理装置2は、受信したコマンドD4に基づき、上述した処理以外のその他の処理を実行する(ステップS48)。以上で、画像処理装置2による処理が終了する。 On the other hand, if the received command D4 is not a job execution instruction (NO in step S46), the image processing device 2 executes other processes other than the above-mentioned processes based on the received command D4 (step S48). . With this, the processing by the image processing device 2 is completed.

以上のように、本実施形態の制御システム1は、クラウド5上に設置されている制御装置8が、ユーザーの発した音声に基づいて画像処理装置2を遠隔制御するように構成されている。そして、本実施形態の制御装置8は、ユーザーの発した音声に対応する設定候補として、所定数以上の設定候補を抽出すると、画像処理装置2の操作パネル11に、それら所定数以上の設定候補を表示させるようにしている。そのため、本実施形態の制御装置8は、所定数以上の設定候補を抽出した場合に、それらの所定数以上の設定候補を順番に音声でユーザーに聞かせなくても、所定数以上の設定候補を視認させることで、ユーザーに効率的に所望の設定候補を選択させることができる。それ故、ユーザーが所望の設定候補を選択するまでの時間を短縮することが可能であり、画像処理装置2が一人のユーザーによって占有されてしまう時間を短くすることができる。 As described above, the control system 1 of this embodiment is configured such that the control device 8 installed on the cloud 5 remotely controls the image processing device 2 based on the voice uttered by the user. Then, when the control device 8 of the present embodiment extracts a predetermined number or more of setting candidates as setting candidates corresponding to the voice uttered by the user, the control device 8 displays the predetermined number or more of the setting candidates on the operation panel 11 of the image processing device 2. I am trying to display it. Therefore, when a predetermined number or more setting candidates are extracted, the control device 8 of the present embodiment extracts the predetermined number or more setting candidates without having to listen to the user hear the predetermined number or more setting candidates sequentially. By visually confirming the settings, the user can efficiently select a desired setting candidate. Therefore, it is possible to shorten the time it takes for the user to select a desired setting candidate, and it is possible to shorten the time that the image processing device 2 is occupied by one user.

以上、本発明に関する好ましい実施形態について説明したが、本発明は、上記実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。 Although the preferred embodiments of the present invention have been described above, the present invention is not limited to the contents described in the above embodiments, and various modifications can be applied.

例えば、上記各実施形態では、音声認識装置7と制御装置8とが別体である場合を例示した。しかし、本発明は、音声認識装置7と制御装置8とが別体であるものに限られるものではない。例えば、制御装置8は、音声認識装置7と一体的に構成されるものであっても構わない。 For example, in each of the above embodiments, the voice recognition device 7 and the control device 8 are separate bodies. However, the present invention is not limited to the voice recognition device 7 and the control device 8 being separate units. For example, the control device 8 may be configured integrally with the voice recognition device 7.

また、上記実施形態では、制御装置8がクラウド5上にサーバーとして設置される場合を説明したが、これに限られるものではない。例えば、制御装置8は、ローカル環境に設置されるサーバーであっても構わない。また、制御装置8は、画像処理装置2の内部に設けられるものであっても構わない。画像処理装置2に制御装置8が設けられる場合、その制御装置8は、上述のように音声認識装置7の機能を更に備えたものであっても構わない。 Further, in the above embodiment, a case has been described in which the control device 8 is installed as a server on the cloud 5, but the present invention is not limited to this. For example, the control device 8 may be a server installed in a local environment. Further, the control device 8 may be provided inside the image processing device 2. When the image processing device 2 is provided with the control device 8, the control device 8 may further include the functions of the voice recognition device 7 as described above.

また、上記実施形態では、音声入出力装置3と画像処理装置2とが別体である場合を例示した。しかし、本発明は、それに限られるものでもない。すなわち、画像処理装置2は、上述した音声入出力装置3の機能を備えているものであっても構わない。 Further, in the above embodiment, the case where the audio input/output device 3 and the image processing device 2 are separate bodies is illustrated. However, the present invention is not limited thereto either. That is, the image processing device 2 may have the functions of the audio input/output device 3 described above.

また、上記実施形態では、音声入出力装置3は、音声の入出力を行う装置である場合を例示した。しかし、音声入出力装置3は、音声の入力のみを行う装置であっても構わない。この場合、上述した音声入出力装置3は、音声入力装置としてのみ機能する。 Further, in the above embodiment, the audio input/output device 3 is a device that inputs and outputs audio. However, the audio input/output device 3 may be a device that only inputs audio. In this case, the audio input/output device 3 described above functions only as an audio input device.

また、上記実施形態では、制御装置8の記憶部41に予めプログラム25がインストールされている場合を例示した。しかし、プログラム25は、例えば通信インタフェース42などを介して制御装置8にインストールされるものであっても構わない。この場合、プログラム25は、インターネットなどを介してダウンロード可能な態様で提供される。また、これに限らず、プログラム25は、CD-ROMやUSBメモリなどのコンピュータ読み取り可能な記録媒体に記録された態様で提供されるものであっても構わない。 Further, in the embodiment described above, the case where the program 25 is installed in advance in the storage unit 41 of the control device 8 is illustrated. However, the program 25 may be installed in the control device 8 via the communication interface 42 or the like, for example. In this case, the program 25 is provided in a downloadable form via the Internet or the like. Furthermore, the program 25 is not limited to this, and the program 25 may be provided in a form recorded on a computer-readable recording medium such as a CD-ROM or a USB memory.

1 制御システム
2 画像処理装置
3 音声入出力装置
7 音声認識装置
8 制御装置
25 プログラム
31 設定特定部(設定特定手段)
32 案内情報出力部(案内情報出力手段)
33 装置制御部
34 設定候補抽出部
35 表示制御部(制御手段)
36 設定反映部
1 Control System 2 Image Processing Device 3 Audio Input/Output Device 7 Voice Recognition Device 8 Control Device 25 Program 31 Setting Specification Unit (Setting Specification Means)
32 Guidance information output unit (guidance information output means)
33 Device control unit 34 Setting candidate extraction unit 35 Display control unit (control means)
36 Setting reflection section

Claims (32)

画像処理装置を制御する制御装置であって、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御装置。
A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means outputs the guidance information for audio guidance of the setting candidates that are less than the predetermined number, when the setting identification means determines that the number of the setting candidates is less than a predetermined number. Characteristic control device.
画像処理装置を制御する制御装置であって、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御装置。
A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guide information output means is characterized in that, when the setting specifying means determines that a predetermined number or more of setting candidates exist, the guide information output means outputs the guide information for audio guidance of the predetermined number or more of setting candidates. Control device.
画像処理装置を制御する制御装置であって、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする制御装置。
A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means is configured to output the guidance for audio guidance that prompts the user to check a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. A control device characterized by outputting information .
画像処理装置を制御する制御装置であって、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする制御装置。
A control device that controls an image processing device,
Setting specifying means for specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The control device is characterized in that the guidance information output means does not output the guidance information when the setting identification means determines that a predetermined number or more of setting candidates exist .
前記制御手段は、前記設定特定手段において前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記複数の設定候補を提示することを特徴とする請求項1乃至4のいずれかに記載の制御装置。 5. The control means presents the plurality of setting candidates when the setting specifying means determines that there are a predetermined number or more of setting candidates corresponding to the voice recognition result . The control device according to any one of . 前記画像処理装置は、表示手段を有し、
前記制御手段は、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする請求項1乃至5のいずれかに記載の制御装置。
The image processing device has a display means,
6. The control device according to claim 1, wherein the control means presents the plurality of setting candidates by displaying them on the display means.
前記制御手段は、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする請求項1乃至のいずれかに記載の制御装置。 7. The control device according to claim 1, wherein the control means presents the plurality of setting candidates according to a predetermined priority order. 前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする請求項に記載の制御装置。 8. The control device according to claim 7 , wherein the priority order is determined in descending order of frequency of setting by the user. 前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする請求項に記載の制御装置。 8. The control device according to claim 7 , wherein the priority order is determined in advance based on a hierarchy of an operation screen that includes a setting item corresponding to the setting candidate. 前記制御手段は、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする請求項に記載の制御装置。 7. The control device according to claim 6 , wherein the control means causes the display means to display thumbnail images corresponding to each of the plurality of setting candidates. 前記制御手段は、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする請求項10に記載の制御装置。 11. The control device according to claim 10 , wherein the control means changes the image size of the thumbnail image corresponding to each of the plurality of setting candidates according to a predetermined priority order. 前記制御手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする請求項6、10又は11に記載の制御装置。 11. The control means does not display the plurality of setting candidates on the display means when the setting specifying means determines that the number of setting candidates is less than a predetermined number. 12. The control device according to 11 . 前記設定特定手段は、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする請求項1乃至12のいずれかに記載の制御装置。 When the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result, the setting specifying means excludes a setting candidate that satisfies a prohibition condition for the current setting state from the plurality of setting candidates. The control device according to any one of claims 1 to 12 . 前記制御装置は、前記画像処理装置と通信可能なサーバーであることを特徴とする請求項1乃至13のいずれかに記載の制御装置。 14. The control device according to claim 1, wherein the control device is a server capable of communicating with the image processing device. 前記制御装置は、前記画像処理装置に設けられることを特徴とする請求項1乃至13のいずれかに記載の制御装置。 14. The control device according to claim 1, wherein the control device is provided in the image processing device. 画像処理装置と、
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための案内情報を出力することを特徴とする制御システム。
an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guide information output means is characterized in that, when the setting specifying means determines that the number of setting candidates is less than a predetermined number, the guide information output means outputs guide information for providing voice guidance for the setting candidates that are less than the predetermined number. control system.
画像処理装置と、
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、前記所定数以上の設定候補を音声案内するための案内情報を出力することを特徴とする制御システム。
an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
Control characterized in that the guidance information output means outputs guidance information for audio guidance of the predetermined number or more setting candidates when the setting specifying means determines that there are more than a predetermined number of setting candidates. system.
画像処理装置と、
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための案内情報を出力することを特徴とする制御システム。
an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
a control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The guidance information output means is configured to output guidance information for audio guidance that prompts the user to check a display means provided in the image processing device when the setting identification means determines that a predetermined number or more of setting candidates exist. A control system characterized by outputting .
画像処理装置と、
前記画像処理装置を音声操作するための音声を入力する音声入力装置と、
前記音声入力装置に入力された音声に基づいて前記画像処理装置を制御する制御装置と、
を備える制御システムであって、
前記制御装置は、
前記音声入力装置に入力された音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定する設定特定手段と、
前記設定特定手段によって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力手段と、
前記設定特定手段において前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御手段と、
を備え
前記案内情報出力手段は、前記設定特定手段において所定数以上の設定候補が存在すると判定された場合、案内情報を出力しないことを特徴とする制御システム。
an image processing device;
a voice input device for inputting voice for voice operating the image processing device;
a control device that controls the image processing device based on audio input to the audio input device;
A control system comprising:
The control device includes:
Setting specifying means for specifying settings to be reflected in the image processing device based on a voice recognition result of the voice input to the voice input device;
Guidance information output means for generating guidance information for voice guidance representing the content of the settings specified by the setting specifying means, and outputting voice guidance based on the guidance information from a predetermined voice output means;
control means for presenting the plurality of setting candidates when the setting specifying means determines that there are a plurality of setting candidates corresponding to the voice recognition result;
Equipped with
The control system is characterized in that the guide information output means does not output the guide information when the setting specifying means determines that a predetermined number or more of setting candidates exist .
プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ
前記案内情報出力ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記所定数未満の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御プログラム。
A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The guidance information output step outputs the guidance information for audio guidance of the setting candidates that are less than the predetermined number, when it is determined in the setting specifying step that the number of setting candidates is less than a predetermined number. Characteristic control program.
プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記複数の設定候補を音声案内するための前記案内情報を出力することを特徴とする制御プログラム。
A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The control program is characterized in that the guidance information output step outputs the guidance information for audio guidance of the plurality of setting candidates when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates. .
プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、ユーザーに前記画像処理装置に設けられている表示手段の確認を促す音声案内のための前記案内情報を出力することを特徴とする制御プログラム。
A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The guidance information output step includes, when it is determined in the setting specifying step that there are a predetermined number or more of setting candidates, the guidance for audio guidance prompting the user to check a display means provided in the image processing device. A control program characterized by outputting information .
プロセッサーによって実行されることにより、画像処理装置を制御する制御プログラムであって、前記プロセッサーに、
ユーザーによって発せられた音声の音声認識結果に基づいて前記画像処理装置に反映すべき設定を特定させる設定特定ステップと、
前記設定特定ステップによって特定された設定の内容を表した音声案内のための案内情報を生成し、前記案内情報に基づく音声案内を所定の音声出力手段から出力させる案内情報出力ステップと、
前記設定特定ステップにおいて前記音声認識結果に対応する複数の設定候補が存在すると判定された場合に、前記複数の設定候補を提示する制御ステップと、
を実行させ
前記案内情報出力ステップは、前記設定特定ステップにおいて所定数以上の設定候補が存在すると判定された場合、前記案内情報を出力しないことを特徴とする制御プログラム。
A control program that is executed by a processor to control an image processing device, the program comprising:
a setting specifying step of specifying settings to be reflected in the image processing device based on the voice recognition result of the voice uttered by the user;
a guidance information output step of generating guidance information for audio guidance representing the content of the settings specified in the settings specifying step, and outputting audio guidance based on the guidance information from a predetermined audio output means;
a control step of presenting the plurality of setting candidates when it is determined in the setting specifying step that there are a plurality of setting candidates corresponding to the voice recognition result;
run the
The control program is characterized in that the guidance information output step does not output the guidance information if it is determined in the setting identification step that a predetermined number or more of setting candidates exist .
前記制御ステップは、前記設定特定ステップにおいて前記音声認識結果に対応する所定数以上の設定候補が存在すると判定された場合に、前記所定数以上の設定候補を提示することを特徴とする請求項20乃至23のいずれかに記載の制御プログラム。 20. The control step presents the predetermined number or more setting candidates when it is determined in the setting specifying step that there are a predetermined number or more setting candidates corresponding to the voice recognition result. 24. The control program according to any one of 23 to 23 . 前記画像処理装置は、表示手段を有し、
前記制御ステップは、前記複数の設定候補を前記表示手段に表示させることによって提示することを特徴とする請求項20乃至24のいずれかに記載の制御プログラム。
The image processing device has a display means,
25. The control program according to claim 20, wherein the control step presents the plurality of setting candidates by displaying them on the display means.
前記制御ステップは、所定の優先順位に従って前記複数の設定候補を提示することを特徴とする請求項20乃至25のいずれかに記載の制御プログラム。 26. The control program according to claim 20, wherein the control step presents the plurality of setting candidates according to a predetermined priority order. 前記優先順位は、ユーザーによる設定頻度が高い順に定められることを特徴とする請求項26に記載の制御プログラム。 27. The control program according to claim 26 , wherein the priority order is determined in descending order of frequency of setting by the user. 前記優先順位は、前記設定候補に対応する設定項目が含まれる操作画面の階層に基づいて予め定められることを特徴とする請求項26に記載の制御プログラム。 27. The control program according to claim 26 , wherein the priority order is determined in advance based on a hierarchy of an operation screen that includes a setting item corresponding to the setting candidate. 前記制御ステップは、前記複数の設定候補のそれぞれに対応するサムネイル画像を前記表示手段に表示させることを特徴とする請求項25に記載の制御プログラム。 26. The control program according to claim 25 , wherein the control step causes the display unit to display thumbnail images corresponding to each of the plurality of setting candidates. 前記制御ステップは、前記複数の設定候補のそれぞれに対応する前記サムネイル画像の画像サイズを所定の優先順位に応じて変化させることを特徴とする請求項29に記載の制御プログラム。 30. The control program according to claim 29 , wherein the control step changes the image size of the thumbnail image corresponding to each of the plurality of setting candidates according to a predetermined priority order. 前記制御ステップは、前記設定特定ステップにおいて前記設定候補の数が所定数未満であると判定された場合、前記複数の設定候補を前記表示手段に表示させないことを特徴とする請求項25、29又は30に記載の制御プログラム。 29. The control step is characterized in that, when it is determined in the setting specifying step that the number of setting candidates is less than a predetermined number, the plurality of setting candidates are not displayed on the display means. The control program according to No. 30 . 前記設定特定ステップは、前記音声認識結果に対応する複数の設定候補が存在すると判定した場合、現在の設定状態に対して禁則条件を満たす設定候補を前記複数の設定候補から除外することを特徴とする請求項20乃至31のいずれかに記載の制御プログラム。 The setting specifying step is characterized in that, when it is determined that there are a plurality of setting candidates corresponding to the voice recognition result, a setting candidate that satisfies a prohibition condition for the current setting state is excluded from the plurality of setting candidates. The control program according to any one of claims 20 to 31 .
JP2019225082A 2019-12-13 2019-12-13 Control device, control system and control program Active JP7447458B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019225082A JP7447458B2 (en) 2019-12-13 2019-12-13 Control device, control system and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019225082A JP7447458B2 (en) 2019-12-13 2019-12-13 Control device, control system and control program

Publications (2)

Publication Number Publication Date
JP2021096493A JP2021096493A (en) 2021-06-24
JP7447458B2 true JP7447458B2 (en) 2024-03-12

Family

ID=76431381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019225082A Active JP7447458B2 (en) 2019-12-13 2019-12-13 Control device, control system and control program

Country Status (1)

Country Link
JP (1) JP7447458B2 (en)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250587A (en) 1999-03-01 2000-09-14 Hitachi Ltd Voice recognition device and voice recognizing and translating device
JP2002355486A (en) 2001-06-01 2002-12-10 Toshiba Corp Washing machine
JP2003051887A (en) 2001-08-06 2003-02-21 Minolta Co Ltd Control system and control method
JP2004045616A (en) 2002-07-10 2004-02-12 Equos Research Co Ltd On-board device, data preparation device and data preparation program
JP2007206886A (en) 2006-01-31 2007-08-16 Canon Inc Information processor and method
JP2009252238A (en) 2008-04-08 2009-10-29 Lg Electronics Inc Mobile terminal and its menu control method
US20120303267A1 (en) 2009-07-27 2012-11-29 Robert Bosch Gmbh Method and system for improving speech recognition accuracy by use of geographic information
US20140095159A1 (en) 2012-09-28 2014-04-03 Samsung Electronics Co., Ltd. Image processing apparatus and control method thereof and image processing system
JP2016009901A (en) 2014-06-23 2016-01-18 シャープ株式会社 Compound machine and display control method
JP2017015361A (en) 2015-07-06 2017-01-19 東芝ホームテクノ株式会社 Heating cooker
JP2018049510A (en) 2016-09-23 2018-03-29 富士ゼロックス株式会社 Information processing device and program
JP2019003631A (en) 2017-06-09 2019-01-10 ネイバー コーポレーションNAVER Corporation Device, method, computer program, and recording medium for providing information
JP2019198987A (en) 2018-05-14 2019-11-21 コニカミノルタ株式会社 Operation screen display device, image processing apparatus, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09292895A (en) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd Human and machine interface device

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250587A (en) 1999-03-01 2000-09-14 Hitachi Ltd Voice recognition device and voice recognizing and translating device
JP2002355486A (en) 2001-06-01 2002-12-10 Toshiba Corp Washing machine
JP2003051887A (en) 2001-08-06 2003-02-21 Minolta Co Ltd Control system and control method
JP2004045616A (en) 2002-07-10 2004-02-12 Equos Research Co Ltd On-board device, data preparation device and data preparation program
JP2007206886A (en) 2006-01-31 2007-08-16 Canon Inc Information processor and method
JP2009252238A (en) 2008-04-08 2009-10-29 Lg Electronics Inc Mobile terminal and its menu control method
US20120303267A1 (en) 2009-07-27 2012-11-29 Robert Bosch Gmbh Method and system for improving speech recognition accuracy by use of geographic information
US20140095159A1 (en) 2012-09-28 2014-04-03 Samsung Electronics Co., Ltd. Image processing apparatus and control method thereof and image processing system
JP2016009901A (en) 2014-06-23 2016-01-18 シャープ株式会社 Compound machine and display control method
JP2017015361A (en) 2015-07-06 2017-01-19 東芝ホームテクノ株式会社 Heating cooker
JP2018049510A (en) 2016-09-23 2018-03-29 富士ゼロックス株式会社 Information processing device and program
JP2019003631A (en) 2017-06-09 2019-01-10 ネイバー コーポレーションNAVER Corporation Device, method, computer program, and recording medium for providing information
JP2019198987A (en) 2018-05-14 2019-11-21 コニカミノルタ株式会社 Operation screen display device, image processing apparatus, and program

Also Published As

Publication number Publication date
JP2021096493A (en) 2021-06-24

Similar Documents

Publication Publication Date Title
JP4717461B2 (en) Information input device, information input method, and information input program
JP4826662B2 (en) Image processing apparatus and voice operation history information sharing method
JP5121560B2 (en) Workflow execution device, workflow execution method, computer program
US11172082B2 (en) Information processing apparatus, information processing system, and information processing method
US20200076969A1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2006330576A (en) Apparatus operation system, speech recognition device, electronic apparatus, information processor, program, and recording medium
EP3696610B1 (en) Image forming apparatus, display control method, and carrier means
EP3716040A1 (en) Image forming apparatus and job execution method
JP7192220B2 (en) Image processing device, information processing device and program
JP2010049432A (en) Display screen control device and method thereof, and information processor
JP5343652B2 (en) Operation screen control apparatus, image forming apparatus, and computer program
JP2024109559A (en) Image processing system and control method thereof
JP7263869B2 (en) Information processing device and program
JP7293963B2 (en) Information processing device and information processing program
JP2011222046A (en) Image processor and operation item discrimination table sharing method
JP2020123817A (en) Image forming system, image forming apparatus, image forming method, and program
US11823672B2 (en) Voice-operated system, controller, computer-readable recording medium, and processing device
JP7447458B2 (en) Control device, control system and control program
US10606531B2 (en) Image processing device, and operation control method thereof
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP7314499B2 (en) Information processing system, information processing device, job control method and job control program
JP2020149602A (en) Controller, image formation system, and program
JP7383885B2 (en) Information processing device and program
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP2007295400A (en) Image processing method, information processing apparatus, and image processing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240212

R150 Certificate of patent or registration of utility model

Ref document number: 7447458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150