JP2019096978A

JP2019096978A - 画像処理システム、画像処理装置及びプログラム

Info

Publication number: JP2019096978A
Application number: JP2017223356A
Authority: JP
Inventors: 博杉浦; Hiroshi Sugiura; 和弘冨安; Kazuhiro Tomiyasu; 澤田　健一; Kenichi Sawada; 健一澤田; 冨田　篤; Atsushi Tomita; 篤冨田; 倫子丸山; Tomoko Maruyama
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2017-11-21
Filing date: 2017-11-21
Publication date: 2019-06-20

Abstract

【課題】複数の画像処理装置２のうち、ユーザーが使用しようとしている画像処理装置２だけをユーザーの音声に反応させることを可能にする。【解決手段】複数の画像処理装置２のそれぞれは、ユーザーが操作可能な操作画面を表示する表示部１３と、ユーザーによる音声の入力を受け付ける音声入力部１５と、操作画面に音声入力用ワードを設定する設定部５２と、音声入力部１５によって受け付けられる音声が、設定部５２により設定された音声入力ワードに一致する場合に、操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映部５３とを備え、設定部５２が、他の画像処理装置２とは異なる音声入力用ワードを操作画面に設定する。【選択図】図８

Description

本発明は、画像処理システム、画像処理装置及びプログラムに関し、特に音声で操作可能な画像処理装置を制御するための技術に関する。

従来、ＭＦＰ（Multifunction Peripherals）などの画像処理装置にマイクなどの音声入力手段を設け、ユーザーが音声を発することでジョブの設定操作などを行えるようにした技術が知られている。例えば特許文献１には、音声操作機能を有する画像処理装置において利用される音声操作に関する情報を、他の画像処理装置で共有できるようにする技術が開示されている。具体的には、画像処理装置は、音声ワードと操作項目とを対応付けた操作項目判別テーブルに、新たな音声ワードと操作項目との対応関係を追加登録して更新すると、その更新された操作項目判別テーブルを他の画像処理装置へ送信することにより、追加登録された情報を共有するようにしている。

ところで、上記のように音声操作機能を有する画像処理装置は、オフィスやコピーセンターなどにおいて複数台が並んで設置されることがある。そのような設置環境では、音声操作機能を有する複数の画像処理装置が互いに近傍位置に設置される。そのため、ユーザーが１つの画像処理装置の前に立って音声を発生すると、その音声が他の画像処理装置にも届いてしまい、他の画像処理装置もユーザーの音声に反応してしまうという問題が発生する。

特開２０１１−２２２０４６号公報

本発明は、上記課題を解決するためになされたものであり、ユーザーが使用しようとしている画像処理装置だけをユーザーの音声に反応させることを可能にする画像処理システム、画像処理装置及びプログラムを提供することを目的とする。

上記目的を達成するため、請求項１に係る発明は、複数の画像処理装置がネットワークを介して接続される画像処理システムであって、前記複数の画像処理装置のそれぞれは、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、前記操作画面に音声入力用ワードを設定する設定手段と、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、を備え、前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。

請求項２に係る発明は、請求項１に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、を更に備え、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項３に係る発明は請求項２に記載の画像処理システムにおいて、前記複数の画像処理装置は、２以上のグループのうちのいずれかのグループに予め分類されており、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、自機と同一のグループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項４に係る発明は、請求項１に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、を更に備え、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項５に係る発明は、請求項４に記載の画像処理システムにおいて、前記距離判別手段は、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、ユーザーとの距離が所定距離以内である画像処理装置を全て含むグループを形成し、当該グループにおいて自機とユーザーとの距離が最も近いか否かを判別し、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項６に係る発明は、請求項１に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、を更に備え、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項７に係る発明は、請求項６に記載の画像処理システムにおいて、前記音量判別手段は、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、所定音量以上の音量を検知した画像処理装置を全て含むグループを形成し、当該グループにおいて自機で検知された音量が最大音量であるか否かを判別し、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項８に係る発明は、請求項２乃至７のいずれかに記載の画像処理システムにおいて、前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴としている。

請求項９に係る発明は、請求項２乃至８のいずれかに記載の画像処理システムにおいて、前記デフォルトの音声入力用ワードとは異なる音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名の類義語に相当するワードであることを特徴としている。

請求項１０に係る発明は、請求項１乃至９のいずれかに記載の画像処理システムにおいて、前記設定手段は、前記操作反映手段によって前記表示手段に表示される前記操作画面が別の画面に遷移するときに、他の画像処理装置とは異なる音声入力用ワードを決定し、遷移後の前記操作画面に設定することを特徴としている。

請求項１１に係る発明は、請求項１０に記載の画像処理システムにおいて、前記操作画面は階層構造を有しており、前記設定手段は、前記表示手段に表示される前記操作画面が下位層の画面である場合、当該操作画面よりも上位層の画面に設定されていた音声入力用ワードが他の画像処理装置において設定されることを禁止することを特徴としている。

請求項１２に係る発明は、請求項１乃至１１のいずれかに記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、複数の機能を有しており、前記操作反映手段は、前記音声操作に基づいて前記複数の機能のうちから一の機能を選択し、前記操作画面として前記一の機能に対応する画面を前記表示手段に表示させ、前記設定手段は、前記操作反映手段によって前記操作画面において表示される機能が別の機能に切り替えられたときに、他の画像処理装置とは異なる音声入力用ワードを決定し、機能切り替え後の前記操作画面に設定することを特徴としている。

請求項１３に係る発明は、請求項１乃至１２のいずれかに記載の画像処理システムにおいて、前記操作反映手段は、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力用ワードに一致した場合に、音声操作中であると判定し、前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定した後、前記操作反映手段によって音声操作中であると判定されている期間内に他の画像処理装置から音声入力用ワードの変更要求を受信した場合に、当該他の画像処理装置に対して変更不可を通知することを特徴としている。

請求項１４に係る発明は、他の画像処理装置とネットワークを介して接続される画像処理装置であって、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、前記操作画面に音声入力用ワードを設定する設定手段と、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、を備え、前記設定手段は、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。

請求項１５に係る発明は、請求項１４に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、を更に備え、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項１６に係る発明は、請求項１４に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、前記距離測定手段によってユーザーとの距離が測定された場合に、前記他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、を更に備え、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項１７に係る発明は、請求項１４に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、前記音量検知手段によって音量が検知された場合に、前記他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、を更に備え、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。

請求項１８に係る発明は、請求項１５乃至１７のいずれかに記載の画像処理装置において、前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴としている。

請求項１９に係る発明は、他の画像処理装置とネットワークを介して接続される画像処理装置において実行されるプログラムであって、前記画像処理装置は、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、を備え、前記プログラムは、前記画像処理装置に、前記操作画面に音声入力用ワードを設定する第１ステップと、前記音声入力手段によって受け付けられる音声が、前記第１ステップにおいて設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う第２ステップと、を実行させ、前記第１ステップは、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。

本発明によれば、音声操作機能を有する複数の画像処理装置が互いに近傍位置に設置されているとしても、ユーザーが使用しようとしている画像処理装置だけをユーザーの音声に反応させることができるようになる。

画像処理システムの概念的構成例を示す図である。画像処理装置のハードウェア構成の一例を示す図である。画面データベースに蓄積される操作画面の例を示す図である。コピー機能基本設定画面の一例を示す図である。コピー機能基本設定画面に対して登録されている複数のパターンの音声入力用ワードの例を示す図である。コピー機能基本設定画面に対して１つのパターンの音声入力用ワードが設定された画面例を示す図である。コピー機能基本設定画面に対して別のパターンの音声入力用ワードが設定された画面例を示す図である。画像処理装置における制御部の機能構成例を示すブロック図である。１つの画像処理装置においてユーザーによる音声操作指示を受け付けた場合の動作プロセスの一例を示す図である。画像処理装置のグループ形成の一例を示す図である。１つの画像処理装置において音量が検知された場合の動作プロセスの一例を示す図である。１つの画像処理装置において人の存在が検知された場合の動作プロセスの一例を示す図である。画像処理装置において行われる処理手順の一例を示すフローチャートである。第１のワード決定処理の詳細な処理手順の一例を示すフローチャートである。第２のワード決定処理の詳細な処理手順の一例を示すフローチャートである。第３のワード決定処理の詳細な処理手順の一例を示すフローチャートである。ワード変更処理の詳細な処理手順の一例を示すフローチャートである。画像処理装置がワード変更通知を受信した場合の処理手順を示すフローチャートである。

以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する部材には同一符号を付しており、それらについての重複する説明は省略する。

図１は、本発明における画像処理システム１の概念的構成例を示す図である。画像処理システム１は、複数の画像処理装置２ａ，２ｂ，２ｃ，２ｄを備えており、それら複数の画像処理装置２ａ，２ｂ，２ｃ，２ｄがＬＡＮ（Local Area Network）などのネットワーク３を介して相互に通信することが可能な構成である。それら複数の画像処理装置２ａ，２ｂ，２ｃ，２ｄは例えば互いに数メートル程度の間隔を隔てた近傍位置に設置される。図１では、４つの画像処理装置２ａ，２ｂ，２ｃ，２ｄがネットワーク３に接続されている場合を例示しているが、画像処理装置２ａ〜２ｄの台数はこれに限られるものではない。尚、以下においては、複数の画像処理装置２ａ，２ｂ，２ｃ，２ｄを特に区別しないときには、それらを総称して画像処理装置２と呼ぶ。

画像処理装置２は、例えばＭＦＰなどで構成され、コピー機能やスキャン機能、プリント機能、ＦＡＸ機能などの複数の機能を備えており、ユーザーによって選択された機能を動作させてジョブを実行することが可能である。画像処理装置２は、ユーザーインタフェースとなる操作パネル４を備えており、その操作パネル４にユーザーが操作可能な操作画面を表示し、ユーザーによるジョブの設定操作やジョブの実行指示を受け付ける。また画像処理装置２は、マイクなどの音声入力手段を有しており、ユーザーによる音声入力を受け付けることも可能である。つまり、画像処理装置２は、操作パネル４に対するユーザーの手動操作を受け付けて各種処理を行うだけでなく、ユーザーによる音声操作を受け付けて手動操作の場合と同様に各種処理を行うことが可能である。

図２は、画像処理装置２のハードウェア構成の一例を示す図である。画像処理装置２は、ハードウェア構成として、上述した操作パネル４の他に、制御部１０と、音声入力部１５と、距離測定センサー１６と、スキャナ部１７と、プリンタ部１８と、ＦＡＸ部１９と、ネットワークインタフェース２０と、記憶装置２１とを備えている。

制御部１０は、ＣＰＵ１１とメモリ１２とを備えており、各部の動作を統括的に制御するものである。ＣＰＵ１１は、記憶装置２１に予め保存されているプログラム２２を読み出して実行することにより、後述する処理部として機能を実現する。メモリ１２は、ＣＰＵ１１がプログラム２２を実行することに伴って発生する一時的なデータなどを記憶するためのものである。

操作パネル４は、表示部１３と操作部１４とを備えている。表示部１３は、例えばカラー液晶ディスプレイなどで構成され、ユーザーが操作可能な操作画面を表示する。操作部１４は、例えば表示部１３の表示画面上に配置されるタッチパネルキーや、表示部１３の表示画面の周囲に配置される押しボタンキーなどによって構成され、ユーザーによる手動操作を受け付ける。

音声入力部１５は、例えばマイクによって構成され、ユーザーによる音声入力を受け付ける。この音声入力部１５は、例えば操作パネル４の内部に搭載され、ユーザーが操作パネル４に向かって発する音声を効果的に検知することが可能である。

距離測定センサー１６は、画像処理装置２の周囲に位置するユーザーを検知し、そのユーザーまでの距離を非接触で測定するセンサーである。例えば、距離測定センサー１６は、画像処理装置２の正面及び側面の近傍に位置するユーザーまでの距離を測定する。

スキャナ部１７は、ユーザーによってセットされる原稿を光学的に読み取って画像データを生成する処理部である。例えばスキャナ部１７は、ユーザーによってコピー機能やスキャン機能が選択されたときに動作して原稿の読み取り動作を行う。

プリンタ部１８は、入力する印刷データに基づいてトナー像を形成し、そのトナー像を印刷用紙などのシート材に転写して定着させることにより、印刷出力を行う処理部である。例えばプリンタ部１８は、ユーザーによってコピー機能やプリント機能が選択されたときに動作し、ユーザーによって指定された印刷データに基づく印刷出力を行う。

ＦＡＸ部１９は、図示を省略する公衆電話網を介してＦＡＸデータの送受信を行う処理部である。ＦＡＸ部１９は、ユーザーによってＦＡＸ機能が選択された場合、或いは、公衆電話網を介してＦＡＸデータを受信した場合に機能し、ＦＡＸデータの送受信を行う。

記憶装置２１は、例えばハードディスクドライブ（ＨＤＤ）やソリッドステートドライブ（ＳＳＤ）などによって構成される不揮発性の記憶手段であり、コンピュータ読み取り可能な記録媒体の一種である。この記憶装置２１には、ＣＰＵ１１によって実行されるプログラム２２が予め記憶される。また記憶装置２１は、画面データベース２３（以下、単に「画面ＤＢ２３」という。）及び音声入力用ワードデータベース２４（以下、単に「音声入力用ワードＤＢ２４」という。）を記憶している。

画面ＤＢ２３は、操作パネル４の表示部１３に表示される各種操作画面を蓄積したデータベースである。図３は、画面ＤＢ２３に蓄積される操作画面の例を示す図である。操作パネル４の表示部１３に表示される操作画面は、図３に示すように階層構造を有しており、ユーザーによる操作（手動操作又は音声操作）に基づいて上位層の操作画面から下位層の操作画面へ遷移するようになっている。最上層の操作画面は、トップ画面であり、コピー機能、スキャン機能、プリント機能及びＦＡＸ機能といった複数の機能のうちからユーザーが所望する機能を選択することが可能な機能選択画面となっている。そしてトップ画面に対してユーザーが機能選択操作を行うと、表示部１３に表示される操作画面は、ユーザーによって選択された機能の基本設定画面に遷移するようになっている。また各機能の基本設定画面の下位層には、第１項目詳細設定画面や第２項目詳細設定画面などが存在する。さらに第１項目詳細設定画面の下位層には第１項目応用設定画面が存在し、第２項目詳細設定画面の下位層には第２項目応用設定画面が存在する。画面ＤＢ２３は、上記のような階層構造を成す各種操作画面の画像データを蓄積している。

図４は、画面ＤＢ２３に蓄積される操作画面の１つであるコピー機能基本設定画面Ｇ１の一例を示す図である。コピー機能基本設定画面Ｇ１は、ユーザーがコピー機能に関する各種設定操作を行うことが可能な画面構成となっている。具体的に説明すると、コピー機能基本設定画面Ｇ１には、原稿画質を設定するための操作項目３０、カラー設定を行うための操作項目３１、コピー濃度を設定するための操作項目３２、用紙設定を行うための操作項目３３、倍率設定を行うための操作項目３４、両面設定を行うための操作項目３５、仕上り設定を行うための操作項目３６、コピー機能に関する応用設定を行うための操作項目３７、コピー部数を設定するための操作項目３８とが含まれる。これらの操作項目３０〜３８は、いずれもユーザーが操作可能な操作ボタンとなっている。そのため、コピー機能基本設定画面Ｇ１が表示部１３に表示されると、ユーザーは、それら操作項目３０〜３８に対するタッチ操作を行うことにより、表示部１３に表示される操作画面を詳細設定画面に遷移させることができる。

音声入力用ワードＤＢ２４は、ユーザーが音声操作を行う際に入力する音声ワードを音声入力用ワードとして登録したデータベースであり、表示部１３に表示される操作画面ごとに音声入力用ワードを対応付けたものである。音声入力用ワードＤＢ２４では、１つの操作画面に対して複数のパターンの音声入力用ワードが登録されている。

図５は、上述したコピー機能基本設定画面Ｇ１に対して登録されている複数のパターンの音声入力用ワードの例を示す図である。図５の例では、パターンＡ、パターンＢ、パターンＣ、…といった複数のパターンの音声入力用ワードがコピー機能基本設定画面Ｇ１に対して登録されている。そして各パターンの音声入力用ワードは、コピー機能基本設定画面Ｇ１（操作画面）に含まれる操作項目ごとに割り当てられており、他のパターンとは重複しないユニークなワードが割り当てられる。

パターンＡの音声入力用ワードは、デフォルトの音声入力用ワードとなっており、操作画面においてユーザーが操作可能な操作項目の名称と同一のワードが使用される。例えばコピー機能基本設定画面Ｇ１に含まれる原稿画質の操作項目３０には、「原稿画質」という音声入力用ワードが割り当てられ、カラーの操作項目３１には、「カラー」という音声入力用ワードが割り当てられる。他の操作項目３２〜３８についても同様である。

これに対し、デフォルトではないパターンＢ，Ｃの音声入力用ワードは、操作画面においてユーザーが操作可能な操作項目の名称と同一ではないワードであって、類義語の相当するワードが使用される。例えば、コピー機能基本設定画面Ｇ１に含まれる原稿画質の操作項目３０には、「文字写真」や「コピー原稿」といった音声入力用ワードが割り当てられ、カラーの操作項目３１には、「色指定」や「モノクロ」といった音声入力用ワードが割り当てられる。他の操作項目３２〜３８についても同様である。

上記のような音声入力用ワードは、各画像処理装置２の操作パネル４の表示部１３に表示される操作画面に対して設定され、その操作画面に含まれる操作項目の近傍位置に合わせて表示される。したがって、ユーザーは、操作画面に含まれる操作項目を音声操作しようとするときに、その操作項目の近傍に表示されている音声入力用ワードを確認して発音することにより、音声操作を行うことが可能になる。

そして本実施形態では、互いに近傍に位置する複数の画像処理装置２において表示される操作画面に対して音声入力用ワードを設定するとき、各画像処理装置２の操作画面に対して互いに異なるパターンの音声入力用ワードを設定する。これにより、互いに近傍に位置する複数の画像処理装置２において表示される音声入力用ワードが互いに異なるワードとなるため、ユーザーが１つの画像処理装置２の前に立って音声入力用ワードを発声した場合であっても、他の画像処理装置２はその音声入力用ワードを音声操作として認識しなくなる。その結果、ユーザーは、自身が発する音声により、所望する１つの画像処理装置２だけに対して音声操作を行うことができるようになる。

図６は、コピー機能基本設定画面Ｇ１に対してパターンＡの音声入力用ワードが設定された場合に表示される操作画面Ｇ２の例を示す図である。図６に示すように、パターンＡの音声入力用ワードが設定されると、操作画面Ｇ２に含まれる複数の操作項目３０〜３８のそれぞれの近傍位置に対し、各操作項目の名称と同一のワードから成る音声入力用ワード４０ａ〜４８ａが表示される。このように、操作画面Ｇ２に対してデフォルトであるパターンＡの音声入力用ワードが設定されると、各操作項目３０〜３８には、同じ名称の音声入力用ワード４０ａ〜４８ａが表示されるため、ユーザーにとって使い勝手の良いものとなる。

図７は、コピー機能基本設定画面Ｇ１に対してパターンＢの音声入力用ワードが設定された場合に表示される操作画面Ｇ３の例を示す図である。図７に示すように、パターンＢの音声入力用ワードが設定されると、操作画面Ｇ２に含まれる複数の操作項目３０〜３８のそれぞれの近傍位置に対し、各操作項目の名称とは異なるワードであって、各操作項目の名称の類義語に相当する音声入力用ワード４０ｂ〜４８ｂが表示される。このように、操作画面Ｇ２に対してデフォルトとは異なるパターンＢの音声入力用ワードが設定されると、各操作項目３０〜３８には、各操作項目３０〜３８とは異なる名称の音声入力用ワード４０ｂ〜４８ｂが表示されるため、ユーザーにとって多少使いづらくなる。尚、パターンＣの音声入力用ワードが操作画面に設定された場合も同様である。

このようにデフォルトであるパターンＡと、デフォルトではないパターンＢ，Ｃでは、ユーザーにとっての利便性が異なるため、本実施形態では、なるべく使い勝手の良いパターンＡの音声入力用ワードを操作画面に設定するようにしている。以下、このような画像処理装置２について詳しく説明する。

図８は、画像処理装置２における制御部１０の機能構成例を示すブロック図である。制御部１０は、上述したＣＰＵ１１がプログラム２２を実行することにより、表示制御部５０、ジョブ制御部５１、設定部５２、操作反映部５３、音声操作指示受付部５４、音量検知部５５、音量判別部５６、距離検出部５７及び距離判別部５８として機能する。

表示制御部５０は、表示部１３に表示する操作画面を制御する。すなわち、表示制御部５０は、記憶装置２１に記憶されている画面ＤＢ２３から表示部１３に表示すべき操作画面の画像データを読み出して表示部１３へ出力することにより、ユーザーが操作可能な操作画面を表示させる。また表示制御部５０は、ユーザーに操作（手動操作又は音声操作）に基づいて表示部１３に表示する操作画面を遷移させるときにも、画面ＤＢ２３から遷移先の操作画面に対応する画像データを読み出して表示部１３へ出力することにより、表示部１３の操作画面を遷移させる。さらに、表示制御部５０は、表示部１３に表示している操作画面に含まれる設定項目の設定値を、ユーザーによって指定された設定値に変更して操作画面を更新することもできる。

また表示制御部５０は、設定部５２によって操作画面に音声入力用ワードが設定されると、操作画面に含まれる操作項目に対して音声入力用ワードを合成した操作画面を生成する。すなわち、表示制御部５０は、画面ＤＢ２３から読み出した操作画面の画像データに対して音声入力用ワードを合成することにより、音声入力用ワードを付加した操作画面を生成するのである。そして表示制御部５０は、音声入力用ワードを付加した操作画面を表示部１３に表示する。

ジョブ制御部５１は、スキャナ部１７、プリンタ部１８及びＦＡＸ部１９のそれぞれを制御することにより、画像処理装置２におけるジョブの実行を制御するものである。例えば、ジョブ制御部５１は、スキャナ部１７、プリンタ部１８及びＦＡＸ部１９のそれぞれに対し、ユーザーによって指定されたジョブの設定などを反映させ、ユーザーによってジョブの実行が指示されることに伴ってジョブの実行を開始する。

設定部５２は、表示部１３に表示される操作画面に対して音声入力用ワードを設定する処理部である。すなわち、設定部５２は、複数のパターンＡ，Ｂ，Ｃのうちから、操作画面に付加する音声入力用ワードのパターンを決定し、その決定したパターンに対応する音声入力用ワードを操作画面に付加することを表示制御部５０へ指示する。これにより、表示制御部５０は、表示部１３に対して操作画面を表示するとき、その操作画面に対して音声入力用ワードを付加して表示するようになる。また設定部５２は、操作画面に設定する音声入力用ワードのパターンを決定すると、その決定したパターンを操作反映部５３へ出力する。

操作反映部５３は、ユーザーによって行われる手動操作や音声操作の内容と特定し、ユーザーによる操作を反映させる処理部である。例えば、ユーザーが操作部１４に対する手動操作を行った場合、操作反映部５３は、操作部１４から出力される操作情報に基づいてユーザーによって行われた操作を特定し、その操作を反映させる処理を行う。これに対し、ユーザーが音声入力部１５に対して音声を入力した場合、操作反映部５３は、ユーザーによって入力された音声を解析し、設定部５２によって操作画面に設定されている音声入力用ワードに一致するか否かを判別する。例えば、操作反映部５３は、音声を解析するのに十分な音量レベルの音声入力があった場合に音声解析を行う。その結果、ユーザーによって入力された音声が音声入力用ワードに一致する場合、操作反映部５３は、音声操作であることを特定し、その音声操作を反映させる処理を行う。

操作反映部５３は、ユーザーによって行われた手動操作又は音声操作が操作画面を更新させるものである場合、表示制御部５０に操作画面の更新指示を出力する。これにより、表示制御部５０は、表示部１３に表示している操作画面を更新する。また操作反映部５３は、ユーザーによって行われた手動操作又は音声操作がジョブの設定や実行を指示するものである場合、ジョブ制御部５１に対してジョブの設定や実行を指示する。これにより、ジョブ制御部５１は、ユーザーによる操作に基づいてジョブの設定や実行を行うようになる。

上記のような構成において設定部５２は、例えば画像処理装置２に対して電源が投入されたとき、表示部１３に表示される操作画面に対して音声入力用ワードを初期設定する。このとき、設定部５２は、デフォルトのパターンＡの音声入力用ワードを選択して操作画面に設定するようにしても良い。この場合、複数の画像処理装置２は電源投入時には、同じパターンＡの音声入力用ワードを操作画面に設定していることになる。

ただし、上記に限られず、設定部５２は、操作画面に対して音声入力用ワードを初期設定するとき、他の画像処理装置２とは異なるパターンの音声入力用ワードを操作画面に設定するようにしても良い。例えば、複数の画像処理装置２は予め管理者などによってグループ化されており、同一グループに含まれる画像処理装置２は電源投入時に互いに異なるパターンの音声入力用ワードを選択して操作画面に初期設定するのである。このとき、同一グループに複数の画像処理装置２が含まれる場合、それら複数の画像処理装置２が互いに通信を行うことにより、他の画像処理装置２が既に設定しているパターンとは異なるパターンの音声入力用ワードを選択して設定するようにしても良い。また同一グループに含まれる複数の画像処理装置２には、予め管理者などによって初期設定するパターンの音声入力用ワードが定められており、電源投入時に予め定められたパターンの音声入力用ワードを設定するようにしても良い。

このような設定部５２は、ユーザーによる音声操作が行われる可能性があることを検知するように構成される。そして設定部５２は、ユーザーによる音声操作が行われる可能性があることを検知すると、操作画面に設定する音声入力用ワードの再設定を行う。この再設定では、ユーザーが音声を発した場合に、近傍に位置する他の画像処理装置２がその音声に反応することがないように、他の画像処理装置２とは異なるパターンの音声入力用ワードが設定されると共に、なるべくユーザーが音声操作を行い易くなるようにデフォルトであるパターンＡの音声入力用ワードが優先的に設定されるようになる。

制御部１０は、ユーザーによる音声操作が行われる可能性があることを検知するために、音声操作指示受付部５４、音量検知部５５、音量判別部５６、距離検出部５７及び距離判別部５８として機能する。これら各部は、例えばユーザーによる音声操作が行われていない状態のときに機能し、ユーザーによる音声操作が行われる可能性があることを検知する。

音声操作指示受付部５４は、例えば操作部１４に含まれる特定の押しボタンキーがユーザーによって操作されることにより、操作パネル４を操作するユーザーが音声操作を行おうとしていることを検知する。音声操作指示受付部５４は、ユーザーによって特定の押しボタンキーが操作されたことを検知すると、設定部５２に対し、ユーザーによる音声操作が行われる可能性があることを通知する。尚、ユーザーが音声操作を行う際に操作する操作キーは、必ずしも押しボタンキーに限られず、操作画面内に表示される操作キーであっても構わない。

設定部５２は、音声操作指示受付部５４からユーザーによる音声操作が行われる可能性があることを示す通知を受信すると、操作画面に対して音声入力用ワードを再設定する。このとき、ユーザーは自機の操作パネル４に対する操作を行っているのであるから、他の画像処理装置２ではなく、自機に対して音声操作を行おうとしていることが明らかである。そのため、設定部５２は、操作画面に対してデフォルトであるパターンＡの音声入力用ワードを優先的に設定する。これにより、ユーザーは、最も使い勝手の良いパターンＡの音声入力用ワードを使用して自機に対する音声操作を行うことができるようになる。

そして設定部５２は、操作画面に対してデフォルトであるパターンＡの音声入力用ワードを設定すると、他の画像処理装置２の音声入力用ワードをパターンＡとは異なる別のパターンＢ，Ｃの音声入力用ワードに設定変更させる。このとき、管理者によって複数の画像処理装置２が予めグループ化されていれば、設定部５２は、自機と同一グループに含まれる他の画像処理装置２の音声入力用ワードを、パターンＡとは異なる別のパターンＢ，Ｃの音声入力用ワードに設定変更させる。また設定部５２は、他の画像処理装置２の音声入力用ワードをパターンＡとは異なる別のパターンの音声入力用ワードに設定変更させるとき、他の全ての画像処理装置２において設定すべき音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードに変更することを指示するようにしても良い。

これに対し、自機の近傍に位置する他の画像処理装置２が既にパターンＡの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンＡの音声入力用ワードを使用することができない。そのため、設定部５２は、パターンＡとは異なるパターンＢ，Ｃの音声入力用ワードを自機の操作画面に再設定する。

音量検知部５５は、音声入力部１５に入力する音の音量を検知するものである。音量検知部５５は、音声入力部１５に入力する音の音量が所定音量レベル以上である場合に、ユーザーによる音声操作が行われる可能性があることを検知する。この場合の所定音量レベルは、例えば操作反映部５３が音声を解析することが可能な程度の音量レベルである。すなわち、ユーザーが画像処理装置２の前に立って音声を発すると、その音声は周囲の雑音よりも音量レベルが高くなるため、音量検知部５５は、そのような音量レベルを検知することにより、ユーザーによる音声操作が行われる可能性があることを検知する。音量検知部５５は、所定音量レベル以上の音を検知すると、音量判別部５６を機能させる。

音量判別部５６は、音量検知部５５によって検知された自機の音量レベルと、他の画像処理装置２において検知された音量レベルとを比較し、自機で検知された音量レベルが最大音量であるか否かを判別する処理部である。音量判別部５６は、音量検知部５５によって所定音量レベル以上の音量が検知されると、ネットワークインタフェース２０を介して他の画像処理装置２に対して音量情報の送信を要求し、他の画像処理装置２において検知された音量レベルを示す音量情報を取得する。そして音量判別部５６は、他の画像処理装置２から音量情報を取得すると、まず所定音量レベル以上の音量を検知した他の画像処理装置２を全て抽出し、抽出した他の画像処理装置２と自機とを含むグループを形成する。このグループは、音量検知部５５によって検知された音量レベルの音声で反応する可能性のある画像処理装置２の集合である。そして音量判別部５６は、当該グループに含まれる全ての画像処理装置２で検知された音量レベルのうち、自機で検知された音量レベルが最大音量であるか否かを判別し、その判別結果を設定部５２へ出力する。

設定部５２は、音量判別部５６から出力される判別結果に基づいて音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードを操作画面に再設定する。例えば、音量判別部５６によって自機で検知された音量レベルが最大音量であると判別された場合、設定部５２は、デフォルトであるパターンＡの音声入力用ワードを操作画面に設定する。そして設定部５２は、自機の操作画面にパターンＡの音声入力用ワードを設定した後、自機と同一グループに含まれる他の画像処理装置２の音声入力用ワードを、パターンＡとは異なるパターンＢ，Ｃの音声入力用ワードに設定変更させる。このとき、設定部５２は、他の画像処理装置２において設定すべき音声入力用ワードのパターンを指示するようにしても良い。

ただし、自機で検知された音量レベルが最大音量であっても、自機の近傍に位置する他の画像処理装置２が既にパターンＡの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンＡの音声入力用ワードを使用することができない。そのような場合、設定部５２は、パターンＡとは異なるパターンＢ，Ｃの音声入力用ワードを操作画面に再設定する。

一方、自機で検知された音量レベルが最大音量ではなかった場合、ユーザーは自機以外の他の画像処理装置２に対して音声操作を行おうとしている可能性が高い。そのため、設定部５２は、デフォルトであるパターンＡの音声入力用ワードを他の画像処理装置２で使用できるようにすべく、自機の操作画面にはパターンＡとは異なるパターンＢ，Ｃの音声入力用ワードを再設定する。

尚、音量検知部５５は、他の画像処理装置２から音量情報の送信要求を受信した場合には、自機で検出した音量レベルを示す音量情報を生成し、ネットワークインタフェース２０を介して、送信要求の発信源である他の画像処理装置２へ送信する。これにより、音量レベルの判別は、他の画像処理装置２においても行うことが可能になる。

距離検出部５７は、距離測定センサー１６によって画像処理装置２の周囲に位置するユーザーが検知されると、距離測定センサー１６からの出力に基づき、ユーザーまでの距離を検出する。そして距離検出部５７は、画像処理装置２の周囲に位置するユーザーまでの距離が所定距離以下の範囲内である場合に、ユーザーによる音声操作が行われる可能性があることを検知する。音量検知部５５は、所定距離以下の範囲内にいるユーザーを検知すると、距離判別部５８を機能させる。

距離判別部５８は、距離検出部５７によって検知されたユーザーとの距離と、他の画像処理装置２において検知されたユーザーとの距離とを比較し、自機とユーザーとの距離が最も近いか否かを判別する処理部である。距離判別部５８は、距離検出部５７によって所定距離以下の範囲内にいるユーザーが検知されると、ネットワークインタフェース２０を介して他の画像処理装置２に距離情報の送信を要求し、他の画像処理装置２において検知されたユーザーとの距離を示す距離情報を取得する。そして距離判別部５８は、他の画像処理装置２から距離情報を取得すると、まず所定距離以下の範囲内でユーザーを検知している他の画像処理装置２を全て抽出し、抽出した他の画像処理装置２と自機とを含むグループを形成する。このグループは、所定距離以下の範囲内に位置するユーザーが音声を発した場合に、その音声に反応する可能性のある画像処理装置２の集合である。そして距離判別部５８は、当該グループに含まれる全ての画像処理装置２で検知されたユーザーとの距離を比較し、自機で検出されたユーザーとの距離が最も近い距離であるか否かを判別し、その判別結果を設定部５２へ出力する。

設定部５２は、距離判別部５８から出力される判別結果に基づいて音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードを操作画面に再設定する。例えば、距離判別部５８によって自機とユーザーとの距離が最も近い距離であると判別された場合、設定部５２は、デフォルトであるパターンＡの音声入力用ワードを操作画面に設定する。また設定部５２は、自機の操作画面にパターンＡの音声入力用ワードを設定した後、自機と同一グループに含まれる他の画像処理装置２の音声入力用ワードを、パターンＡとは異なるパターンＢ，Ｃの音声入力用ワードに設定変更させる。このとき、設定部５２は、他の画像処理装置２において設定すべき音声入力用ワードのパターンを指示するようにしても良い。

ただし、自機で検出されたユーザーとの距離が最も近い場合であっても、自機の近傍に位置する他の画像処理装置２が既にパターンＡの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンＡの音声入力用ワードを使用することができない。そのような場合、設定部５２は、パターンＡとは異なるパターンＢ，Ｃの音声入力用ワードを操作画面に再設定する。

一方、自機で検出されたユーザーとの距離が最も近い距離ではなかった場合、ユーザーは自機以外の他の画像処理装置２に対して音声操作を行おうとしている可能性が高い。そのため、設定部５２は、デフォルトであるパターンＡの音声入力用ワードを他の画像処理装置２で使用できるようにすべく、自機の操作画面にはパターンＡとは異なるパターンＢ，Ｃの音声入力用ワードを再設定する。

尚、距離検出部５７は、他の画像処理装置２から距離情報の送信要求を受信した場合には、自機で検出したユーザーとの距離を示す距離情報を生成し、ネットワークインタフェース２０を介して、送信要求の発信源である他の画像処理装置２へ送信する。これにより、ユーザーとの距離の判別は、他の画像処理装置２においても行うことが可能になる。

以上のように設定部５２は、ユーザーが手動操作で音声操作指示を行った場合、操作パネル４に対して音声を発した場合、或いは、画像処理装置２の近傍位置まで移動した場合に、操作画面に対する音声入力用ワードを再設定する。すなわち、設定部５２は、複数の条件のうちのいずれかの条件が成立したときに、ユーザーによる音声操作が行われる可能性があることを検知し、操作画面に対する音声入力用ワードを再設定するようにしている。ところが、上述した複数の条件のうち同時に２以上の条件が成立することもある。例えば、音量検知部５５が所定音量レベルの音量を検知したときに、距離検出部５７が所定距離以下の範囲内に位置するユーザーを検出することもある。そのような場合、設定部５２は、同時に成立した２以上の条件のうちのいずれかの条件によって操作画面にデフォルトであるパターンＡの音声入力用ワードを設定することができるか否かを判定し、少なくとも１つの条件成立によって操作画面にデフォルトであるパターンＡの音声入力用ワードを設定することができる場合に、パターンＡの音声入力用ワードを操作画面に設定する。つまり、設定部５２は、他の画像処理装置２において既にデフォルトであるパターンＡの音声入力用ワードが使用されていない限り、デフォルトであるパターンＡの音声入力用ワードを優先的に操作画面に設定する。

図９は、複数の画像処理装置２ａ〜２ｄのうちの画像処理装置２ａにおいてユーザーによる音声操作指示を受け付けた場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置２ａ〜２ｄにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置２ａがユーザーによる音声操作指示を受け付けると（プロセスＰ１）、画像処理装置２ａがデフォルトであるパターンＡの音声入力用ワードを使用することを決定する（プロセスＰ２）。そして画像処理装置２ａは、自機で表示している操作画面に対してパターンＡの音声入力用ワードを設定し、表示部１３で表示中の操作画面を更新する（プロセスＰ３）。これにより、画像処理装置２ａで表示される操作画面は、図６で示したような操作画面Ｇ２に切り替わる。これにより、操作画面Ｇ２に含まれる各操作項目３０〜３８と同じ名称の音声入力用ワード４０ａ〜４８ａが各操作項目３０〜３８に付加された状態で表示されるため、ユーザーにとって音声操作し易い画面が表示されるようになる。

画像処理装置２ａは、自機の操作画面にパターンＡの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置２ｂ，２ｃ，２ｄに対してワード変更通知Ｄ１を個別に送信する（プロセスＰ４）。例えば、ワード変更通知Ｄ１には、他の画像処理装置２ｂ，２ｃ，２ｄのそれぞれにおいて使用すべき音声入力用ワードのパターンの指定情報が含まれる。そのため、画像処理装置２ｂは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＢの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ５）。また画像処理装置２ｃは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＣの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ６）。さらに画像処理装置２ｄは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＤの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ７）。

図１０は、画像処理装置２ａを中心とするグループ形成の一例を示す図である。例えば図１０に示すように、管理者が画像処理装置２ａを中心とするグループとして、所定距離の範囲内（領域Ｒ１内）に設置されている複数の画像処理装置２ａ，２ｂ，２ｃ，２ｄを含むグループを予め設定している場合を仮定する。この場合、上述したようにユーザーが画像処理装置２ａに対して音声操作指示を行うと、画像処理装置２ａと同一グループに含まれる他の画像処理装置２ｂ，２ｃ，２ｄのそれぞれが、画像処理装置２ａと異なるパターンの音声入力用ワードであって、互いに異なるパターンの音声入力用ワードを設定する。したがって、グループの中心に位置する画像処理装置２ａに対してユーザーがパターンＡの音声入力用ワードで音声操作を行ったとしても、他の画像処理装置２ｂ，２ｃ，２ｄはユーザーの発する音声に反応することはない。

次に図１１は、複数の画像処理装置２ａ〜２ｄのうちの画像処理装置２ａにおいて音量が検知された場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置２ａ〜２ｄにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置２ａがユーザーによって発せされた所定音量レベル以上の音声を検知すると（プロセスＰ１０）、他の画像処理装置２ｂ，２ｃ，２ｄに対して音量情報の送信を要求し（プロセスＰ１１）、他の画像処理装置２ｂ，２ｃ，２ｄが検知した音量レベルを示す音量情報Ｄ２を取得する（プロセスＰ１２）。そして画像処理装置２ａは、音量判別処理を行い（プロセスＰ１３）、所定音量レベル以上の音量を検知している画像処理装置どうしでグループ形成を行う（プロセスＰ１４）。図１１の例では、画像処理装置２ｂ，２ｃでは、所定音量レベル以上の音量が検知され、画像処理装置２ｄでは、所定音量レベル以上の音量が検知されなかった場合を例示しており、グループ形成処理（プロセスＰ１４）において３つの画像処理装置２ａ，２ｂ，２ｃによるグループ形成が行われた場合を示している。

そして画像処理装置２ａは、自機で検知された音量レベルが同一グループに含まれる他の画像処理装置２ｂ，２ｃで検知された音量レベルと比較して最大音量であった場合、デフォルトであるパターンＡの音声入力用ワードを自機で使用することを決定する（プロセスＰ１５）。そして画像処理装置２ａは、自機で表示している操作画面に対してパターンＡの音声入力用ワードを設定し、表示部１３で表示中の操作画面を更新する（プロセスＰ１６）。これにより、画像処理装置２ａで表示される操作画面は、図６で示したような操作画面Ｇ２に切り替わる。

画像処理装置２ａは、自機の操作画面にパターンＡの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置２ｂ，２ｃに対してワード変更通知Ｄ１を個別に送信する（プロセスＰ１７）。画像処理装置２ｂは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＢの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ１８）。また画像処理装置２ｃは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＣの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ１９）。したがって、画像処理装置２ａに対してユーザーがパターンＡの音声入力用ワードで音声操作を行ったとしても、同一グループに属する他の画像処理装置２ｂ，２ｃはユーザーの発する音声に反応することはない。

尚、図１１の例では、画像処理装置２ｄが画像処理装置２ａとの同一グループを形成していないため、画像処理装置２ａからのワード変更通知Ｄ１が画像処理装置２ｄに対して送信されない。そのため、画像処理装置２ｄは、画像処理装置２ａと同じパターンの音声入力用ワードを操作画面に設定することもある。そのような場合であっても、画像処理装置２ｄは、ユーザーが画像処理装置２ａの前に立って発する音声を十分な音量レベルとして検知しないため、画像処理装置２ａに対して発せられた音声に反応することはない。

次に図１２は、複数の画像処理装置２ａ〜２ｄのうちの画像処理装置２ａにおいて人の存在が検知された場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置２ａ〜２ｄにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置２ａが人の存在を検知すると（プロセスＰ２０）、ユーザーとの距離を測定する（プロセスＰ２１）。そして画像処理装置２ａは、他の画像処理装置２ｂ，２ｃ，２ｄに対して距離情報の送信を要求し（プロセスＰ２２）、他の画像処理装置２ｂ，２ｃ，２ｄが検出したユーザーとの距離を示す距離情報Ｄ３を取得する（プロセスＰ２３）。そして画像処理装置２ａは、距離判別処理を行い（プロセスＰ２４）、ユーザーとの距離が所定距離以下の範囲である画像処理装置どうしでグループ形成を行う（プロセスＰ２５）。図１２の例では、画像処理装置２ｂ，２ｃでは、ユーザーとの距離が所定距離以下の範囲内であるとして検出され、画像処理装置２ｄでは、所定距離を超える距離又はユーザーそのものが検知されていない場合を例示している。そのため、グループ形成処理（プロセスＰ２５）においては、３つの画像処理装置２ａ，２ｂ，２ｃによるグループ形成が行われる。

そして画像処理装置２ａは、自機で検出されたユーザーとの距離が同一グループに含まれる他の画像処理装置２ｂ，２ｃ検出されたユーザーとの距離と比較して最も近い距離であった場合、デフォルトであるパターンＡの音声入力用ワードを自機で使用することを決定する（プロセスＰ２６）。続いて、画像処理装置２ａは、自機で表示している操作画面に対してパターンＡの音声入力用ワードを設定し、表示部１３で表示中の操作画面を更新する（プロセスＰ２７）。これにより、画像処理装置２ａで表示される操作画面は、図６で示したような操作画面Ｇ２に切り替わる。

画像処理装置２ａは、自機の操作画面にパターンＡの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置２ｂ，２ｃに対してワード変更通知Ｄ１を個別に送信する（プロセスＰ２８）。画像処理装置２ｂは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＢの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ２９）。また画像処理装置２ｃは、画像処理装置２ａからワード変更通知Ｄ１を受信すると、パターンＣの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する（プロセスＰ３０）。したがって、画像処理装置２ａに対してユーザーがパターンＡの音声入力用ワードで音声操作を行ったとしても、同一グループに属する他の画像処理装置２ｂ，２ｃはユーザーの発する音声に反応することはない。尚、画像処理装置２ｄについては、ユーザーとの距離が遠いため、ユーザーが発する音声に反応することはない。

上記においては、ユーザーが手動操作で音声操作指示を行った場合、操作パネル４に対して音声を発した場合、或いは、画像処理装置２の近傍位置まで移動した場合に、設定部５２が、操作画面に対する音声入力用ワードを再設定する態様について説明した。しかし、設定部５２は、上述した場合に限られず、例えばユーザーによる操作（音声操作を含む）に基づいて表示部１３に表示する操作画面が別の操作画面に遷移する場合に、その遷移するタイミングで毎回、音声入力用ワードのパターンを再度決定するようにしても良い。すなわち、上述した音声入力用ワードは、階層構造を有する複数の操作画面のそれぞれに対して予め用意されているため、操作画面が遷移すれば、遷移後の新たな操作画面に対して音声入力用ワードを付加する必要がある。一方、画像処理装置２で表示される操作画面が別の操作画面に遷移すれば、その遷移後の操作画面と同じ操作画面が他の画像処理装置２において表示されているとは限らない。そのため、操作画面が遷移するタイミングで音声入力用ワードのパターンを再決定するようにすれば、デフォルトであるパターンＡの音声入力用ワードを使用することができる機会が増えるため、ユーザーにとって音声操作し易くなるという利点がある。

次に画像処理装置２において行われる具体的な処理手順について説明する。図１３乃至図１８は、画像処理装置２において行われる処理手順の一例を示すフローチャートである。この処理は、制御部１０のＣＰＵ１１がプログラム２２を実行することによって順次行われる処理である。画像処理装置２は、この処理を開始すると、まずユーザーによる音声操作指示を受け付けたか否かを判断する（ステップＳ１０）。ユーザーによる音声操作指示を受け付けた場合（ステップＳ１０でＹＥＳ）、画像処理装置２は、第１のワード決定処理を行う（ステップＳ１１）。

図１４は、第１のワード決定処理（ステップＳ１１）の詳細な処理手順の一例を示すフローチャートである。画像処理装置２は、この処理を開始すると、パターンＡの音声入力用ワードを使用可能であるか否かを判断する（ステップＳ３０）。例えば、これよりも前に他の画像処理装置２からパターンＡの音声入力用ワードを使用することが通知されていれば、パターンＡの音声入力用ワードは自機において使用することができない。これに対し、これよりも前に他の画像処理装置２からパターンＡの音声入力用ワードを使用することが通知されていない場合には、パターンＡの音声入力用ワードを自機において使用することができる。

そしてパターンＡの音声入力用ワードを使用可能であると判断した場合（ステップＳ３０でＹＥＳ）、画像処理装置２は、自機で使用する音声入力用ワードとして、デフォルトであるパターンＡの音声入力用ワードを決定する（ステップＳ３１）。また画像処理装置２は、自機で使用する音声入力用ワードをパターンＡに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ３２）。

一方、パターンＡの音声入力用ワードを使用することができないと判断した場合（ステップＳ３０でＮＯ）、画像処理装置２は、自機で使用する音声入力用ワードとして、パターンＡ以外のパターンの音声入力用ワードを決定する（ステップＳ３３）。また画像処理装置２は、自機で使用する音声入力用ワードをパターンＡ以外のパターンに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ３４）。このとき、画像処理装置２は、既にパターンＡを使用している他の画像処理装置２を除き、その他の画像処理装置２で使用する音声入力用ワードのパターンを、パターンＡ以外のパターンから選択して決定する。以上で、第１のワード決定処理が終了する。

図１３に戻り、ユーザーによる音声操作指示を受け付けていない場合（ステップＳ１０でＮＯ）、画像処理装置２は、所定音量レベル以上の音量を検知したか否かを判断する（ステップＳ１２）。その結果、所定音量レベル以上の音量を検知した場合（ステップＳ１２でＹＥＳ）、画像処理装置２は、第２のワード決定処理を行う（ステップＳ１３）。

図１５は、第２のワード決定処理（ステップＳ１３）の詳細な処理手順の一例を示すフローチャートである。画像処理装置２は、この処理を開始すると、ネットワーク３に接続されている他の画像処理装置２から音量情報Ｄ２を取得し（ステップＳ４０）、他の画像処理装置２で検知された音量の判別処理を行う（ステップＳ４１）。そして画像処理装置２は、自機と、所定音量レベル以上の音量を検知した他の画像処理装置２とを含むグループを形成する（ステップＳ４２）。次に画像処理装置２は、ステップＳ４２で形成したグループに含まれる全ての画像処理装置２が検知した音量レベルのうち、自機で検知した音量レベルが最大音量であるか否かを判断する（ステップＳ４３）。

その結果、自機で検知した音量レベルが最大音量である場合（ステップＳ４３でＹＥＳ）、画像処理装置２は、パターンＡの音声入力用ワードを使用可能であるか否かを判断する（ステップＳ４４）。ここでの判断は、図１４のステップＳ３０における判断と同じである。画像処理装置２は、パターンＡの音声入力用ワードを使用可能であると判断した場合（ステップＳ４４でＹＥＳ）、自機で使用する音声入力用ワードとして、デフォルトであるパターンＡの音声入力用ワードを決定する（ステップＳ４５）。さらに画像処理装置２は、自機で使用する音声入力用ワードをパターンＡに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ４６）。このとき、他の画像処理装置２で使用する音声入力用ワードのパターンは、パターンＡ以外のパターンとして決定される。

一方、自機で検知した音量レベルが最大音量ではなかった場合（ステップＳ４３でＮＯ）、或いは、パターンＡの音声入力用ワードを使用することができないと判断した場合（ステップＳ４４でＮＯ）、画像処理装置２は、自機で使用する音声入力用ワードとして、パターンＡ以外のパターンの音声入力用ワードを決定する（ステップＳ４７）。さらに画像処理装置２は、自機で使用する音声入力用ワードをパターンＡ以外のパターンに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ４８）。このときも、画像処理装置２は、既にパターンＡを使用している他の画像処理装置２を除き、その他の画像処理装置２で使用する音声入力用ワードのパターンを、パターンＡ以外のパターンから選択して決定する。以上で、第２のワード決定処理が終了する。

再び図１３に戻り、所定音量レベル以上の音量を検知していない場合（ステップＳ１２でＮＯ）、画像処理装置２は、所定距離以下の範囲内にいるユーザーの存在を検知したか否かを判断する（ステップＳ１４）。その結果、所定距離以下の範囲内にいるユーザーの存在を検知した場合（ステップＳ１４でＹＥＳ）、画像処理装置２は、第３のワード決定処理を行う（ステップＳ１５）。

図１６は、第３のワード決定処理（ステップＳ１５）の詳細な処理手順の一例を示すフローチャートである。画像処理装置２は、この処理を開始すると、ネットワーク３に接続されている他の画像処理装置２から距離情報Ｄ３を取得し（ステップＳ５０）、他の画像処理装置２で検知されたユーザーとの距離の判別処理を行う（ステップＳ５１）。そして画像処理装置２は、自機と、所定距離以下の範囲内にいるユーザーを検知した他の画像処理装置２とを含むグループを形成する（ステップＳ５２）。次に画像処理装置２は、ステップＳ５２で形成したグループに含まれる全ての画像処理装置２が検出したユーザーとの距離のうち、自機で検出したユーザーとの距離が最も近い距離であるか否かを判断する（ステップＳ５３）。

その結果、自機で検出したユーザーとの距離が最も近い距離である場合（ステップＳ５３でＹＥＳ）、画像処理装置２は、パターンＡの音声入力用ワードを使用可能であるか否かを判断する（ステップＳ５４）。ここでの判断は、図１４のステップＳ３０における判断と同じである。画像処理装置２は、パターンＡの音声入力用ワードを使用可能であると判断した場合（ステップＳ５４でＹＥＳ）、自機で使用する音声入力用ワードとして、デフォルトであるパターンＡの音声入力用ワードを決定する（ステップＳ５５）。さらに画像処理装置２は、自機で使用する音声入力用ワードをパターンＡに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ５６）。このとき、他の画像処理装置２で使用する音声入力用ワードのパターンは、パターンＡ以外のパターンとして決定される。

一方、自機で検出したユーザーとの距離が最も近い距離ではなかった場合（ステップＳ５３でＮＯ）、或いは、パターンＡの音声入力用ワードを使用することができないと判断した場合（ステップＳ５４でＮＯ）、画像処理装置２は、自機で使用する音声入力用ワードとして、パターンＡ以外のパターンの音声入力用ワードを決定する（ステップＳ５７）。さらに画像処理装置２は、自機で使用する音声入力用ワードをパターンＡ以外のパターンに決定することに伴い、他の画像処理装置２で使用する音声入力用ワードのパターンを決定する（ステップＳ５８）。このときも、画像処理装置２は、既にパターンＡを使用している他の画像処理装置２を除き、その他の画像処理装置２で使用する音声入力用ワードのパターンを、パターンＡ以外のパターンから選択して決定する。以上で、第３のワード決定処理が終了する。

再び図１３に戻る。画像処理装置２は、上記のようにして音声入力用ワードのパターンを決定すると、その決定したパターンの音声入力用ワードを操作画面に設定し、表示部１３に表示している操作画面を更新する（ステップＳ１６）。また画像処理装置２は、音声操作フラグをオンに設定し（ステップＳ１７）、他の画像処理装置２に対してワード変更通知Ｄ１を送信する（ステップＳ１８）。尚、ステップＳ１８では、音声入力用ワードを変更すべき他の画像処理装置２に対してのみワード変更通知Ｄ１を送信するようにしても良い。またワード変更通知Ｄ１には、自機で設定した音声入力用ワードのパターンに関する情報や、自機において音声操作フラグをオンに設定したことを示す情報が含まれる。これにより、他の画像処理装置２の音声入力用ワードを重複しないように変更することができると共に、自機で設定した音声入力用ワードのパターンや、自機が音声操作中であることを他の画像処理装置２に通知することができる。

その後、画像処理装置２は、ユーザーによる音声入力を受け付けたか否かを判断する（ステップＳ１９）。尚、ここでは、ステップＳ１２で所定音量レベルの音量を検知したときの音声入力に基づき、音声入力を受け付けたと判断するようにしても良い。ユーザーによる音声入力を受け付けた場合（ステップＳ１９でＹＥＳ）、画像処理装置２は、音声認識処理を実行する（ステップＳ２０）。すなわち、画像処理装置２は、ユーザーの音声を解析することにより、音声入力されたワードを特定する。そして画像処理装置２は、音声認識処理によって特定したワードが操作画面に設定された音声入力用ワードに一致するか否かを判断し（ステップＳ２１）、一致する場合には（ステップＳ２１でＹＥＳ）、その音声入力用ワードに対応する操作項目に基づいてユーザーによって行われた音声操作を特定する（ステップＳ２２）。尚、ユーザーによる音声入力を受け付けていない場合（ステップＳ１９でＮＯ）、或いは、音声認識処理で特定したワードが操作画面に設定された音声入力用ワードに一致しなかった場合（ステップＳ２１でＮＯ）には、ステップＳ１９に戻ってユーザーによる音声入力を待機する状態となる。

ユーザーによる音声操作を特定した場合、画像処理装置２は、その音声操作に基づいて操作画面を遷移させるか否かを判断する（ステップＳ２３）。操作画面を遷移させる場合（ステップＳ２３でＹＥＳ）、画像処理装置２は、操作画面遷移処理を実行する（ステップＳ２４）。これにより、表示部１３に表示される操作画面は、ユーザーの音声操作に基づいて別の画面に遷移する。このとき、上位層の操作画面から下位層の操作画面に遷移することもあるし、また下位層の操作画面から上位層の操作画面に遷移することもある。さらには、別の機能の操作画面に遷移することもある。画像処理装置２は、操作画面を遷移させると、ワード変更処理を実行する（ステップＳ２５）。すなわち、画像処理装置２は、表示部１３に表示している操作画面を遷移させたタイミングで、再び音声入力用ワードの設定変更を行うための処理を実行する。尚、操作画面を遷移させない場合（ステップＳ２３でＮＯ）には、ステップＳ２４，Ｓ２５の処理はスキップする。

図１７は、ワード変更処理（ステップＳ２５）の詳細な処理手順の一例を示すフローチャートである。画像処理装置２は、この処理を開始すると、ユーザーによって機能の切り替えが行われたか否かを判断する（ステップＳ６０）。例えば、ユーザーによってスキャン機能からプリント機能に切り替えられたか否か、或いは、コピー機能からＦＡＸ機能に切り替えられたか否かなどを判断する。また画像処理装置２は、トップ画面からユーザーによって機能選択が行われた場合も機能切り替えであると判断する。ユーザーによって機能の切り替えが行われた場合（ステップＳ６０でＹＥＳ）、画像処理装置２は、同一グループ内の他の画像処理装置２において同一の機能が操作されている最中であるか否かを判断する（ステップＳ６１）。このとき、画像処理装置２は、他の画像処理装置２と通信を行うことにより、同一の機能が操作されているか否かを判断するようにしても良い。同一の機能が操作されている場合（ステップＳ６１でＹＥＳ）、画像処理装置２は、同一の機能が操作されている他の画像処理装置２においてパターンＡの音声入力用ワードが使用されているか否かを判断する（ステップＳ６２）。同一の機能が操作されている他の画像処理装置２においてパターンＡの音声入力用ワードが使用されている場合（ステップＳ６２でＹＥＳ）、画像処理装置２は、自機の遷移後の操作画面に対して設定する音声入力用ワードとして、パターンＡ以外の音声入力用ワードを決定する（ステップＳ６３）。一方、同一グループ内の他の画像処理装置２において同一の機能が操作されていない場合（ステップＳ６１でＮＯ）、又は、同一の機能が操作されている他の画像処理装置２においてパターンＡの音声入力用ワードが使用されていない場合（ステップＳ６２でＮＯ）、画像処理装置２は、自機の遷移後の操作画面に対して設定する音声入力用ワードとして、パターンＡの音声入力用ワードを決定する（ステップＳ６４）。尚、ユーザーによって機能の切り替えが行われていない場合（ステップＳ６０でＮＯ）、上記ステップＳ６１〜Ｓ６４の処理はスキップする。

次に画像処理装置２は、操作画面が上位層の画面から下位層の画面に遷移したか否かを判断する（ステップＳ６５）。上位層の画面から下位層の画面に遷移した場合（ステップＳ６５でＹＥＳ）、画像処理装置２は、上位層の操作画面に設定していた音声入力用ワードを他の画像処理装置２において使用禁止に設定する（ステップＳ６６）。すなわち、画像処理装置２は、下位層の画面へ遷移させることに伴い、遷移前の上位層の画面に設定していた音声入力ワードの使用禁止通知を他の画像処理装置２へ送信することにより、他の画像処理装置２において使用されることを禁止する。例えば操作画面が下位層の画面へ遷移したとき、ユーザーは遷移後の画面を確認して所望の操作画面とは異なる画面に遷移したことに気付くことが多い。そのような場合、ユーザーは、比較的直ぐに元の上位層の画面に戻って音声操作を継続することになる。上位層の画面に戻ったとき、前回の音声入力用ワードと異なる音声入力用ワードが設定されていると、ユーザーにとっては音声操作し難くなり、操作性が低下する。そこで画像処理装置２は、操作画面が上位層の画面から下位層の画面に遷移したときには、元の上位層の画面に設定していた音声入力用ワードが他の画像処理装置２において使用されることを禁止することにより、元の上位層の画面に戻った場合でもユーザーが前回と同じ音声入力用ワードを用いて音声操作を継続できるようにしているのである。

また画像処理装置２は、元の上位層の画面に設定していた音声入力用ワードが他の画像処理装置２において使用されることを禁止する時間を設定するようにしても良い。例えば、ユーザーは遷移後の下位層の画面を確認して所望の操作画面であれば、そのまま音声操作を継続するため、直ぐに下位層の画面を元の上位層の画面に戻すことはない。そのため、画像処理装置２は、他の画像処理装置２による使用禁止時間を例えば６０秒程度に設定すれば、別のユーザーに元の上位層の画面に設定していた音声入力用ワードを解放することができるようになる。

次に画像処理装置２は、同一グループ内の他の画像処理装置２において同一階層の操作画面が表示されているか否かを判断する（ステップＳ６７）。このとき、画像処理装置２は、他の画像処理装置２と通信を行うことにより、同一階層の操作画面が表示されているか否かを判断するようにしても良い。他の画像処理装置２において同一階層の操作画面が表示されていない場合（ステップＳ６７でＮＯ）、画像処理装置２は、上位層の操作画面にパターンＡの音声入力用ワードが設定されていたか否かを判断する（ステップＳ６８）。その結果、上位層の操作画面にパターンＡの音声入力用ワードが設定されていた場合（ステップＳ６８でＹＥＳ）、画像処理装置２は、遷移後の下位層の操作画面に設定する音声入力用ワードとして、パターンＡの音声入力用ワードを決定する（ステップＳ６９）。

一方、他の画像処理装置２において同一階層の操作画面が表示されている場合（ステップＳ６７でＹＥＳ）、又は、上位層の操作画面にパターンＡの音声入力用ワードを設定していなかった場合（ステップＳ６８でＮＯ）、画像処理装置２は、同一グループ内の他の画像処理装置２においてパターンＡの音声入力用ワードが使用中であるか否かを判断する（ステップＳ７０）。同一グループ内の他の画像処理装置２においてパターンＡの音声入力用ワードが使用中でない場合（ステップＳ７０でＮＯ）、画像処理装置２は、さらにパターンＡの音声入力用ワードの使用が禁止されているか否かを判断する（ステップＳ７１）。その結果、同一グループ内の他の画像処理装置２においてパターンＡの音声入力用ワードが使用中でなく（ステップＳ７０でＮＯ）、さらにパターンＡの音声入力用ワードの使用が禁止されていない場合（ステップＳ７１でＮＯ）、画像処理装置２は、遷移後の下位層の操作画面に設定する音声入力用ワードとして、パターンＡの音声入力用ワードを決定する（ステップＳ６９）。これに対し、同一グループ内の他の画像処理装置２においてパターンＡの音声入力用ワードが使用中である場合（ステップＳ７０でＹＥＳ）、又は、パターンＡの音声入力用ワードの使用が禁止されている場合（ステップＳ７１でＹＥＳ）、画像処理装置２は、遷移後の下位層の操作画面に対して設定する音声入力用ワードとして、パターンＡ以外の音声入力用ワードを決定する（ステップＳ７２）。尚、上位層の画面から下位層の画面に遷移したものではない場合（ステップＳ６５でＮＯ）、上記ステップＳ６６〜Ｓ７２の処理はスキップする。以上で、ワード変更処理が終了する。

再び図１３に戻る。次に画像処理装置２は、特定した音声操作がジョブ実行指示であるか否かを判断する（ステップＳ２６）。ジョブ実行指示でない場合（ステップＳ２６でＮＯ）、画像処理装置２による処理は、ステップＳ１９へ戻り、上述した処理を繰り返す。これに対し、ジョブ実行指示であった場合（ステップＳ２６でＹＥＳ）、画像処理装置２は、ユーザーによって指定されたジョブを実行する（ステップＳ２７）。そしてジョブの実行が完了すると、画像処理装置２は、音声操作フラグをオフに設定し（ステップＳ２８）、他の画像処理装置２に対して音声操作が終了したことを通知する（ステップＳ２９）。これにより、当該画像処理装置２において使用していた音声入力用ワードが、他の画像処理装置２において使用可能な状態に解放される。

次に図１８は、画像処理装置２が他の画像処理装置２からワード変更通知Ｄ１を受信した場合の処理手順を示すフローチャートである。画像処理装置２は、この処理を開始すると、他の画像処理装置２からワード変更通知Ｄ１を受信するのを待機する状態となる（ステップＳ８０）。そして他の画像処理装置２からワード変更通知Ｄ１を受信すると、画像処理装置２は、音声操作フラグがオンであるか否かを判断する（ステップＳ８１）。音声操作フラグがオンである場合（ステップＳ８１でＹＥＳ）、画像処理装置２は、ワード変更通知Ｄ１の送信元である他の画像処理装置２に対し、変更不可通知を送信する（ステップＳ８２）。すなわち、画像処理装置２は、現在設定されている音声入力用ワードに基づいてユーザーによる音声操作が行われる可能性があるため、他の画像処理装置２からのワード変更通知Ｄ１を拒絶するのである。このとき送信する変更不可通知には、現在表示している操作画面を特定するための情報や、その操作画面に対して現在設定している音声入力用ワードのパターンを示す情報などが含まれる。

一方、音声操作フラグがオフであった場合（ステップＳ８１でＮＯ）、画像処理装置２は、ワード変更通知Ｄ１を解析する（ステップＳ８３）。そして画像処理装置２は、表示部１３に表示している操作画面に対し、ワード変更通知Ｄ１で指定されたパターンの音声入力用ワードを設定し（ステップＳ８４）、操作画面を更新する（ステップＳ８５）。これにより、画像処理装置２において操作画面に設定されている音声入力用ワードは、他の画像処理装置２とは異なる音声入力用ワードに変更される。

以上のように本実施形態の画像処理装置２は、ユーザーが操作可能な操作画面に対して近傍に位置する他の画像処理装置２とは異なるパターンの音声入力用ワードを設定し、その設定した音声入力用ワードに基づいてユーザーによる音声操作を受け付ける。つまり、互いに近傍に位置する複数の画像処理装置２は、互いに異なるパターンの音声入力用ワードを操作画面に設定しており、音声入力用ワードに一致するワードが音声入力されない限り、音声操作として受け付けないようにしている。そのため、ユーザーが１つの画像処理装置２の前に立ってその画像処理装置２に設定されている音声入力用ワードに一致する音声を発したとしても、他の画像処理装置２はユーザーの音声には反応しない。したがって、本実施形態の画像処理システム１によれば、複数の画像処理装置２のうち、ユーザーが使用しようとしている画像処理装置２だけをユーザーの音声に反応させることが可能である。

また本実施形態では、画像処理装置２が操作画面を遷移させるときに音声入力用ワードのパターンを変更できるようにしている。そのため、ユーザーにとって使い易い音声入力用ワードであるパターンＡの音声入力用ワードを使用することができる機会が増えるため、音声操作を行う際の利便性を向上させることができる。

以上、本発明に関する幾つかの実施形態について説明したが、本発明は、上記実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。

例えば上記実施形態において、画像処理装置２は、コピー機能やスキャン機能、プリント機能、ＦＡＸ機能などの複数の機能を備えるＭＦＰを例示した。しかし、画像処理装置２は、必ずしも複数の機能を備えるものに限られない。すなわち、画像処理装置２は、スキャン機能のみを備えたスキャナであっても良いし、プリント機能のみを備えたプリンタであっても構わない。

また上記実施形態では、複数の画像処理装置２が同一の構成を有し、それぞれの画像処理装置２において同一グループ内の音声入力用ワードを決定することができる形態について説明した。しかし、これに限られるものではない。すなわち、複数の画像処理装置２のそれぞれにおいて設定する音声入力用ワードのパターンを決定するのは、複数の画像処理装置２のうちの１つの画像処理装置２であっても構わない。この場合、１つの画像処理装置２は、複数の画像処理装置２のそれぞれにおいて設定する音声入力用ワードのパターンを決定する機能を有しており、自機又は他の画像処理装置２からの要求に応じて、複数の画像処理装置２の情報を収集し、複数の画像処理装置２のそれぞれにおいて異なるパターンの音声入力用ワードを決定するように構築すれば良い。そして、他の画像処理装置２は、１つの画像処理装置２からの指示に基づいて、自機で表示する操作画面に指定されたパターンの音声入力用ワードを設定すれば良い。さらには、複数の画像処理装置２のそれぞれにおいて設定する音声入力用ワードのパターンを決定するのは、専用のサーバー装置であっても構わない。

１画像処理システム
２（２ａ，２ｂ，２ｃ，２ｄ）画像処理装置
３ネットワーク
１３表示部（表示手段）
１５音声入力部（音声入力手段）
１６距離測定センサー（距離測定手段）
２２プログラム
５２設定部（設定手段）
５３操作反映部（操作反映手段）
５４音声操作指示受付部（音声操作指示受付手段）
５５音量検知部（音量検知手段）
５６音量判別部（音量判別手段）
５８距離判別部（距離判別手段）

Claims

複数の画像処理装置がネットワークを介して接続される画像処理システムであって、
前記複数の画像処理装置のそれぞれは、
ユーザーが操作可能な操作画面を表示する表示手段と、
ユーザーによる音声の入力を受け付ける音声入力手段と、
前記操作画面に音声入力用ワードを設定する設定手段と、
前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、
を備え、
前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とする画像処理システム。
前記複数の画像処理装置のそれぞれは、
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、
を更に備え、
前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１に記載の画像処理システム。
前記複数の画像処理装置は、２以上のグループのうちのいずれかのグループに予め分類されており、
前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、自機と同一のグループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項２に記載の画像処理システム。
前記複数の画像処理装置のそれぞれは、
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、
前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、
を更に備え、
前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１に記載の画像処理システム。
前記距離判別手段は、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、ユーザーとの距離が所定距離以内である画像処理装置を全て含むグループを形成し、当該グループにおいて自機とユーザーとの距離が最も近いか否かを判別し、
前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項４に記載の画像処理システム。
前記複数の画像処理装置のそれぞれは、
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、
前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、
を更に備え、
前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１に記載の画像処理システム。
前記音量判別手段は、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、所定音量以上の音量を検知した画像処理装置を全て含むグループを形成し、当該グループにおいて自機で検知された音量が最大音量であるか否かを判別し、
前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項６に記載の画像処理システム。
前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴とする請求項２乃至７のいずれかに記載の画像処理システム。
前記デフォルトの音声入力用ワードとは異なる音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名の類義語に相当するワードであることを特徴とする請求項２乃至８のいずれかに記載の画像処理システム。
前記設定手段は、前記操作反映手段によって前記表示手段に表示される前記操作画面が別の画面に遷移するときに、他の画像処理装置とは異なる音声入力用ワードを決定し、遷移後の前記操作画面に設定することを特徴とする請求項１乃至９のいずれかに記載の画像処理システム。
前記操作画面は階層構造を有しており、
前記設定手段は、前記表示手段に表示される前記操作画面が下位層の画面である場合、当該操作画面よりも上位層の画面に設定されていた音声入力用ワードが他の画像処理装置において設定されることを禁止することを特徴とする請求項１０に記載の画像処理システム。
前記複数の画像処理装置のそれぞれは、複数の機能を有しており、
前記操作反映手段は、前記音声操作に基づいて前記複数の機能のうちから一の機能を選択し、前記操作画面として前記一の機能に対応する画面を前記表示手段に表示させ、
前記設定手段は、前記操作反映手段によって前記操作画面において表示される機能が別の機能に切り替えられたときに、他の画像処理装置とは異なる音声入力用ワードを決定し、機能切り替え後の前記操作画面に設定することを特徴とする請求項１乃至１１のいずれかに記載の画像処理システム。
前記操作反映手段は、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力用ワードに一致した場合に、音声操作中であると判定し、
前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定した後、前記操作反映手段によって音声操作中であると判定されている期間内に他の画像処理装置から音声入力用ワードの変更要求を受信した場合に、当該他の画像処理装置に対して変更不可を通知することを特徴とする請求項１乃至１２のいずれかに記載の画像処理システム。
他の画像処理装置とネットワークを介して接続される画像処理装置であって、
ユーザーが操作可能な操作画面を表示する表示手段と、
ユーザーによる音声の入力を受け付ける音声入力手段と、
前記操作画面に音声入力用ワードを設定する設定手段と、
前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、
を備え、
前記設定手段は、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とする画像処理装置。
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、
を更に備え、
前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１４に記載の画像処理装置。
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、
前記距離測定手段によってユーザーとの距離が測定された場合に、前記他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、
を更に備え、
前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１４に記載の画像処理装置。
デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、
前記音量検知手段によって音量が検知された場合に、前記他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、
を更に備え、
前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項１４記載の画像処理装置。
前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴とする請求項１５乃至１７のいずれかに記載の画像処理装置。
他の画像処理装置とネットワークを介して接続される画像処理装置において実行されるプログラムであって、
前記画像処理装置は、
ユーザーが操作可能な操作画面を表示する表示手段と、
ユーザーによる音声の入力を受け付ける音声入力手段と、
を備え、
前記プログラムは、前記画像処理装置に、
前記操作画面に音声入力用ワードを設定する第１ステップと、
前記音声入力手段によって受け付けられる音声が、前記第１ステップにおいて設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う第２ステップと、
を実行させ、
前記第１ステップは、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とするプログラム。