JP2019096978A - 画像処理システム、画像処理装置及びプログラム - Google Patents

画像処理システム、画像処理装置及びプログラム Download PDF

Info

Publication number
JP2019096978A
JP2019096978A JP2017223356A JP2017223356A JP2019096978A JP 2019096978 A JP2019096978 A JP 2019096978A JP 2017223356 A JP2017223356 A JP 2017223356A JP 2017223356 A JP2017223356 A JP 2017223356A JP 2019096978 A JP2019096978 A JP 2019096978A
Authority
JP
Japan
Prior art keywords
image processing
voice
input word
processing apparatus
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017223356A
Other languages
English (en)
Inventor
博 杉浦
Hiroshi Sugiura
博 杉浦
和弘 冨安
Kazuhiro Tomiyasu
和弘 冨安
澤田 健一
Kenichi Sawada
健一 澤田
冨田 篤
Atsushi Tomita
篤 冨田
倫子 丸山
Tomoko Maruyama
倫子 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2017223356A priority Critical patent/JP2019096978A/ja
Publication of JP2019096978A publication Critical patent/JP2019096978A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Abstract

【課題】複数の画像処理装置2のうち、ユーザーが使用しようとしている画像処理装置2だけをユーザーの音声に反応させることを可能にする。【解決手段】複数の画像処理装置2のそれぞれは、ユーザーが操作可能な操作画面を表示する表示部13と、ユーザーによる音声の入力を受け付ける音声入力部15と、操作画面に音声入力用ワードを設定する設定部52と、音声入力部15によって受け付けられる音声が、設定部52により設定された音声入力ワードに一致する場合に、操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映部53とを備え、設定部52が、他の画像処理装置2とは異なる音声入力用ワードを操作画面に設定する。【選択図】図8

Description

本発明は、画像処理システム、画像処理装置及びプログラムに関し、特に音声で操作可能な画像処理装置を制御するための技術に関する。
従来、MFP(Multifunction Peripherals)などの画像処理装置にマイクなどの音声入力手段を設け、ユーザーが音声を発することでジョブの設定操作などを行えるようにした技術が知られている。例えば特許文献1には、音声操作機能を有する画像処理装置において利用される音声操作に関する情報を、他の画像処理装置で共有できるようにする技術が開示されている。具体的には、画像処理装置は、音声ワードと操作項目とを対応付けた操作項目判別テーブルに、新たな音声ワードと操作項目との対応関係を追加登録して更新すると、その更新された操作項目判別テーブルを他の画像処理装置へ送信することにより、追加登録された情報を共有するようにしている。
ところで、上記のように音声操作機能を有する画像処理装置は、オフィスやコピーセンターなどにおいて複数台が並んで設置されることがある。そのような設置環境では、音声操作機能を有する複数の画像処理装置が互いに近傍位置に設置される。そのため、ユーザーが1つの画像処理装置の前に立って音声を発生すると、その音声が他の画像処理装置にも届いてしまい、他の画像処理装置もユーザーの音声に反応してしまうという問題が発生する。
特開2011−222046号公報
本発明は、上記課題を解決するためになされたものであり、ユーザーが使用しようとしている画像処理装置だけをユーザーの音声に反応させることを可能にする画像処理システム、画像処理装置及びプログラムを提供することを目的とする。
上記目的を達成するため、請求項1に係る発明は、複数の画像処理装置がネットワークを介して接続される画像処理システムであって、前記複数の画像処理装置のそれぞれは、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、前記操作画面に音声入力用ワードを設定する設定手段と、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、を備え、前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。
請求項2に係る発明は、請求項1に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、を更に備え、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項3に係る発明は請求項2に記載の画像処理システムにおいて、前記複数の画像処理装置は、2以上のグループのうちのいずれかのグループに予め分類されており、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、自機と同一のグループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項4に係る発明は、請求項1に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、を更に備え、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項5に係る発明は、請求項4に記載の画像処理システムにおいて、前記距離判別手段は、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、ユーザーとの距離が所定距離以内である画像処理装置を全て含むグループを形成し、当該グループにおいて自機とユーザーとの距離が最も近いか否かを判別し、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項6に係る発明は、請求項1に記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、を更に備え、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項7に係る発明は、請求項6に記載の画像処理システムにおいて、前記音量判別手段は、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、所定音量以上の音量を検知した画像処理装置を全て含むグループを形成し、当該グループにおいて自機で検知された音量が最大音量であるか否かを判別し、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項8に係る発明は、請求項2乃至7のいずれかに記載の画像処理システムにおいて、前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴としている。
請求項9に係る発明は、請求項2乃至8のいずれかに記載の画像処理システムにおいて、前記デフォルトの音声入力用ワードとは異なる音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名の類義語に相当するワードであることを特徴としている。
請求項10に係る発明は、請求項1乃至9のいずれかに記載の画像処理システムにおいて、前記設定手段は、前記操作反映手段によって前記表示手段に表示される前記操作画面が別の画面に遷移するときに、他の画像処理装置とは異なる音声入力用ワードを決定し、遷移後の前記操作画面に設定することを特徴としている。
請求項11に係る発明は、請求項10に記載の画像処理システムにおいて、前記操作画面は階層構造を有しており、前記設定手段は、前記表示手段に表示される前記操作画面が下位層の画面である場合、当該操作画面よりも上位層の画面に設定されていた音声入力用ワードが他の画像処理装置において設定されることを禁止することを特徴としている。
請求項12に係る発明は、請求項1乃至11のいずれかに記載の画像処理システムにおいて、前記複数の画像処理装置のそれぞれは、複数の機能を有しており、前記操作反映手段は、前記音声操作に基づいて前記複数の機能のうちから一の機能を選択し、前記操作画面として前記一の機能に対応する画面を前記表示手段に表示させ、前記設定手段は、前記操作反映手段によって前記操作画面において表示される機能が別の機能に切り替えられたときに、他の画像処理装置とは異なる音声入力用ワードを決定し、機能切り替え後の前記操作画面に設定することを特徴としている。
請求項13に係る発明は、請求項1乃至12のいずれかに記載の画像処理システムにおいて、前記操作反映手段は、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力用ワードに一致した場合に、音声操作中であると判定し、前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定した後、前記操作反映手段によって音声操作中であると判定されている期間内に他の画像処理装置から音声入力用ワードの変更要求を受信した場合に、当該他の画像処理装置に対して変更不可を通知することを特徴としている。
請求項14に係る発明は、他の画像処理装置とネットワークを介して接続される画像処理装置であって、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、前記操作画面に音声入力用ワードを設定する設定手段と、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、を備え、前記設定手段は、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。
請求項15に係る発明は、請求項14に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、を更に備え、前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項16に係る発明は、請求項14に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、前記距離測定手段によってユーザーとの距離が測定された場合に、前記他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、を更に備え、前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項17に係る発明は、請求項14に記載の画像処理装置において、デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、前記音量検知手段によって音量が検知された場合に、前記他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、を更に備え、前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴としている。
請求項18に係る発明は、請求項15乃至17のいずれかに記載の画像処理装置において、前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴としている。
請求項19に係る発明は、他の画像処理装置とネットワークを介して接続される画像処理装置において実行されるプログラムであって、前記画像処理装置は、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声の入力を受け付ける音声入力手段と、を備え、前記プログラムは、前記画像処理装置に、前記操作画面に音声入力用ワードを設定する第1ステップと、前記音声入力手段によって受け付けられる音声が、前記第1ステップにおいて設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う第2ステップと、を実行させ、前記第1ステップは、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴としている。
本発明によれば、音声操作機能を有する複数の画像処理装置が互いに近傍位置に設置されているとしても、ユーザーが使用しようとしている画像処理装置だけをユーザーの音声に反応させることができるようになる。
画像処理システムの概念的構成例を示す図である。 画像処理装置のハードウェア構成の一例を示す図である。 画面データベースに蓄積される操作画面の例を示す図である。 コピー機能基本設定画面の一例を示す図である。 コピー機能基本設定画面に対して登録されている複数のパターンの音声入力用ワードの例を示す図である。 コピー機能基本設定画面に対して1つのパターンの音声入力用ワードが設定された画面例を示す図である。 コピー機能基本設定画面に対して別のパターンの音声入力用ワードが設定された画面例を示す図である。 画像処理装置における制御部の機能構成例を示すブロック図である。 1つの画像処理装置においてユーザーによる音声操作指示を受け付けた場合の動作プロセスの一例を示す図である。 画像処理装置のグループ形成の一例を示す図である。 1つの画像処理装置において音量が検知された場合の動作プロセスの一例を示す図である。 1つの画像処理装置において人の存在が検知された場合の動作プロセスの一例を示す図である。 画像処理装置において行われる処理手順の一例を示すフローチャートである。 第1のワード決定処理の詳細な処理手順の一例を示すフローチャートである。 第2のワード決定処理の詳細な処理手順の一例を示すフローチャートである。 第3のワード決定処理の詳細な処理手順の一例を示すフローチャートである。 ワード変更処理の詳細な処理手順の一例を示すフローチャートである。 画像処理装置がワード変更通知を受信した場合の処理手順を示すフローチャートである。
以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する部材には同一符号を付しており、それらについての重複する説明は省略する。
図1は、本発明における画像処理システム1の概念的構成例を示す図である。画像処理システム1は、複数の画像処理装置2a,2b,2c,2dを備えており、それら複数の画像処理装置2a,2b,2c,2dがLAN(Local Area Network)などのネットワーク3を介して相互に通信することが可能な構成である。それら複数の画像処理装置2a,2b,2c,2dは例えば互いに数メートル程度の間隔を隔てた近傍位置に設置される。図1では、4つの画像処理装置2a,2b,2c,2dがネットワーク3に接続されている場合を例示しているが、画像処理装置2a〜2dの台数はこれに限られるものではない。尚、以下においては、複数の画像処理装置2a,2b,2c,2dを特に区別しないときには、それらを総称して画像処理装置2と呼ぶ。
画像処理装置2は、例えばMFPなどで構成され、コピー機能やスキャン機能、プリント機能、FAX機能などの複数の機能を備えており、ユーザーによって選択された機能を動作させてジョブを実行することが可能である。画像処理装置2は、ユーザーインタフェースとなる操作パネル4を備えており、その操作パネル4にユーザーが操作可能な操作画面を表示し、ユーザーによるジョブの設定操作やジョブの実行指示を受け付ける。また画像処理装置2は、マイクなどの音声入力手段を有しており、ユーザーによる音声入力を受け付けることも可能である。つまり、画像処理装置2は、操作パネル4に対するユーザーの手動操作を受け付けて各種処理を行うだけでなく、ユーザーによる音声操作を受け付けて手動操作の場合と同様に各種処理を行うことが可能である。
図2は、画像処理装置2のハードウェア構成の一例を示す図である。画像処理装置2は、ハードウェア構成として、上述した操作パネル4の他に、制御部10と、音声入力部15と、距離測定センサー16と、スキャナ部17と、プリンタ部18と、FAX部19と、ネットワークインタフェース20と、記憶装置21とを備えている。
制御部10は、CPU11とメモリ12とを備えており、各部の動作を統括的に制御するものである。CPU11は、記憶装置21に予め保存されているプログラム22を読み出して実行することにより、後述する処理部として機能を実現する。メモリ12は、CPU11がプログラム22を実行することに伴って発生する一時的なデータなどを記憶するためのものである。
操作パネル4は、表示部13と操作部14とを備えている。表示部13は、例えばカラー液晶ディスプレイなどで構成され、ユーザーが操作可能な操作画面を表示する。操作部14は、例えば表示部13の表示画面上に配置されるタッチパネルキーや、表示部13の表示画面の周囲に配置される押しボタンキーなどによって構成され、ユーザーによる手動操作を受け付ける。
音声入力部15は、例えばマイクによって構成され、ユーザーによる音声入力を受け付ける。この音声入力部15は、例えば操作パネル4の内部に搭載され、ユーザーが操作パネル4に向かって発する音声を効果的に検知することが可能である。
距離測定センサー16は、画像処理装置2の周囲に位置するユーザーを検知し、そのユーザーまでの距離を非接触で測定するセンサーである。例えば、距離測定センサー16は、画像処理装置2の正面及び側面の近傍に位置するユーザーまでの距離を測定する。
スキャナ部17は、ユーザーによってセットされる原稿を光学的に読み取って画像データを生成する処理部である。例えばスキャナ部17は、ユーザーによってコピー機能やスキャン機能が選択されたときに動作して原稿の読み取り動作を行う。
プリンタ部18は、入力する印刷データに基づいてトナー像を形成し、そのトナー像を印刷用紙などのシート材に転写して定着させることにより、印刷出力を行う処理部である。例えばプリンタ部18は、ユーザーによってコピー機能やプリント機能が選択されたときに動作し、ユーザーによって指定された印刷データに基づく印刷出力を行う。
FAX部19は、図示を省略する公衆電話網を介してFAXデータの送受信を行う処理部である。FAX部19は、ユーザーによってFAX機能が選択された場合、或いは、公衆電話網を介してFAXデータを受信した場合に機能し、FAXデータの送受信を行う。
記憶装置21は、例えばハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などによって構成される不揮発性の記憶手段であり、コンピュータ読み取り可能な記録媒体の一種である。この記憶装置21には、CPU11によって実行されるプログラム22が予め記憶される。また記憶装置21は、画面データベース23(以下、単に「画面DB23」という。)及び音声入力用ワードデータベース24(以下、単に「音声入力用ワードDB24」という。)を記憶している。
画面DB23は、操作パネル4の表示部13に表示される各種操作画面を蓄積したデータベースである。図3は、画面DB23に蓄積される操作画面の例を示す図である。操作パネル4の表示部13に表示される操作画面は、図3に示すように階層構造を有しており、ユーザーによる操作(手動操作又は音声操作)に基づいて上位層の操作画面から下位層の操作画面へ遷移するようになっている。最上層の操作画面は、トップ画面であり、コピー機能、スキャン機能、プリント機能及びFAX機能といった複数の機能のうちからユーザーが所望する機能を選択することが可能な機能選択画面となっている。そしてトップ画面に対してユーザーが機能選択操作を行うと、表示部13に表示される操作画面は、ユーザーによって選択された機能の基本設定画面に遷移するようになっている。また各機能の基本設定画面の下位層には、第1項目詳細設定画面や第2項目詳細設定画面などが存在する。さらに第1項目詳細設定画面の下位層には第1項目応用設定画面が存在し、第2項目詳細設定画面の下位層には第2項目応用設定画面が存在する。画面DB23は、上記のような階層構造を成す各種操作画面の画像データを蓄積している。
図4は、画面DB23に蓄積される操作画面の1つであるコピー機能基本設定画面G1の一例を示す図である。コピー機能基本設定画面G1は、ユーザーがコピー機能に関する各種設定操作を行うことが可能な画面構成となっている。具体的に説明すると、コピー機能基本設定画面G1には、原稿画質を設定するための操作項目30、カラー設定を行うための操作項目31、コピー濃度を設定するための操作項目32、用紙設定を行うための操作項目33、倍率設定を行うための操作項目34、両面設定を行うための操作項目35、仕上り設定を行うための操作項目36、コピー機能に関する応用設定を行うための操作項目37、コピー部数を設定するための操作項目38とが含まれる。これらの操作項目30〜38は、いずれもユーザーが操作可能な操作ボタンとなっている。そのため、コピー機能基本設定画面G1が表示部13に表示されると、ユーザーは、それら操作項目30〜38に対するタッチ操作を行うことにより、表示部13に表示される操作画面を詳細設定画面に遷移させることができる。
音声入力用ワードDB24は、ユーザーが音声操作を行う際に入力する音声ワードを音声入力用ワードとして登録したデータベースであり、表示部13に表示される操作画面ごとに音声入力用ワードを対応付けたものである。音声入力用ワードDB24では、1つの操作画面に対して複数のパターンの音声入力用ワードが登録されている。
図5は、上述したコピー機能基本設定画面G1に対して登録されている複数のパターンの音声入力用ワードの例を示す図である。図5の例では、パターンA、パターンB、パターンC、…といった複数のパターンの音声入力用ワードがコピー機能基本設定画面G1に対して登録されている。そして各パターンの音声入力用ワードは、コピー機能基本設定画面G1(操作画面)に含まれる操作項目ごとに割り当てられており、他のパターンとは重複しないユニークなワードが割り当てられる。
パターンAの音声入力用ワードは、デフォルトの音声入力用ワードとなっており、操作画面においてユーザーが操作可能な操作項目の名称と同一のワードが使用される。例えばコピー機能基本設定画面G1に含まれる原稿画質の操作項目30には、「原稿画質」という音声入力用ワードが割り当てられ、カラーの操作項目31には、「カラー」という音声入力用ワードが割り当てられる。他の操作項目32〜38についても同様である。
これに対し、デフォルトではないパターンB,Cの音声入力用ワードは、操作画面においてユーザーが操作可能な操作項目の名称と同一ではないワードであって、類義語の相当するワードが使用される。例えば、コピー機能基本設定画面G1に含まれる原稿画質の操作項目30には、「文字写真」や「コピー原稿」といった音声入力用ワードが割り当てられ、カラーの操作項目31には、「色指定」や「モノクロ」といった音声入力用ワードが割り当てられる。他の操作項目32〜38についても同様である。
上記のような音声入力用ワードは、各画像処理装置2の操作パネル4の表示部13に表示される操作画面に対して設定され、その操作画面に含まれる操作項目の近傍位置に合わせて表示される。したがって、ユーザーは、操作画面に含まれる操作項目を音声操作しようとするときに、その操作項目の近傍に表示されている音声入力用ワードを確認して発音することにより、音声操作を行うことが可能になる。
そして本実施形態では、互いに近傍に位置する複数の画像処理装置2において表示される操作画面に対して音声入力用ワードを設定するとき、各画像処理装置2の操作画面に対して互いに異なるパターンの音声入力用ワードを設定する。これにより、互いに近傍に位置する複数の画像処理装置2において表示される音声入力用ワードが互いに異なるワードとなるため、ユーザーが1つの画像処理装置2の前に立って音声入力用ワードを発声した場合であっても、他の画像処理装置2はその音声入力用ワードを音声操作として認識しなくなる。その結果、ユーザーは、自身が発する音声により、所望する1つの画像処理装置2だけに対して音声操作を行うことができるようになる。
図6は、コピー機能基本設定画面G1に対してパターンAの音声入力用ワードが設定された場合に表示される操作画面G2の例を示す図である。図6に示すように、パターンAの音声入力用ワードが設定されると、操作画面G2に含まれる複数の操作項目30〜38のそれぞれの近傍位置に対し、各操作項目の名称と同一のワードから成る音声入力用ワード40a〜48aが表示される。このように、操作画面G2に対してデフォルトであるパターンAの音声入力用ワードが設定されると、各操作項目30〜38には、同じ名称の音声入力用ワード40a〜48aが表示されるため、ユーザーにとって使い勝手の良いものとなる。
図7は、コピー機能基本設定画面G1に対してパターンBの音声入力用ワードが設定された場合に表示される操作画面G3の例を示す図である。図7に示すように、パターンBの音声入力用ワードが設定されると、操作画面G2に含まれる複数の操作項目30〜38のそれぞれの近傍位置に対し、各操作項目の名称とは異なるワードであって、各操作項目の名称の類義語に相当する音声入力用ワード40b〜48bが表示される。このように、操作画面G2に対してデフォルトとは異なるパターンBの音声入力用ワードが設定されると、各操作項目30〜38には、各操作項目30〜38とは異なる名称の音声入力用ワード40b〜48bが表示されるため、ユーザーにとって多少使いづらくなる。尚、パターンCの音声入力用ワードが操作画面に設定された場合も同様である。
このようにデフォルトであるパターンAと、デフォルトではないパターンB,Cでは、ユーザーにとっての利便性が異なるため、本実施形態では、なるべく使い勝手の良いパターンAの音声入力用ワードを操作画面に設定するようにしている。以下、このような画像処理装置2について詳しく説明する。
図8は、画像処理装置2における制御部10の機能構成例を示すブロック図である。制御部10は、上述したCPU11がプログラム22を実行することにより、表示制御部50、ジョブ制御部51、設定部52、操作反映部53、音声操作指示受付部54、音量検知部55、音量判別部56、距離検出部57及び距離判別部58として機能する。
表示制御部50は、表示部13に表示する操作画面を制御する。すなわち、表示制御部50は、記憶装置21に記憶されている画面DB23から表示部13に表示すべき操作画面の画像データを読み出して表示部13へ出力することにより、ユーザーが操作可能な操作画面を表示させる。また表示制御部50は、ユーザーに操作(手動操作又は音声操作)に基づいて表示部13に表示する操作画面を遷移させるときにも、画面DB23から遷移先の操作画面に対応する画像データを読み出して表示部13へ出力することにより、表示部13の操作画面を遷移させる。さらに、表示制御部50は、表示部13に表示している操作画面に含まれる設定項目の設定値を、ユーザーによって指定された設定値に変更して操作画面を更新することもできる。
また表示制御部50は、設定部52によって操作画面に音声入力用ワードが設定されると、操作画面に含まれる操作項目に対して音声入力用ワードを合成した操作画面を生成する。すなわち、表示制御部50は、画面DB23から読み出した操作画面の画像データに対して音声入力用ワードを合成することにより、音声入力用ワードを付加した操作画面を生成するのである。そして表示制御部50は、音声入力用ワードを付加した操作画面を表示部13に表示する。
ジョブ制御部51は、スキャナ部17、プリンタ部18及びFAX部19のそれぞれを制御することにより、画像処理装置2におけるジョブの実行を制御するものである。例えば、ジョブ制御部51は、スキャナ部17、プリンタ部18及びFAX部19のそれぞれに対し、ユーザーによって指定されたジョブの設定などを反映させ、ユーザーによってジョブの実行が指示されることに伴ってジョブの実行を開始する。
設定部52は、表示部13に表示される操作画面に対して音声入力用ワードを設定する処理部である。すなわち、設定部52は、複数のパターンA,B,Cのうちから、操作画面に付加する音声入力用ワードのパターンを決定し、その決定したパターンに対応する音声入力用ワードを操作画面に付加することを表示制御部50へ指示する。これにより、表示制御部50は、表示部13に対して操作画面を表示するとき、その操作画面に対して音声入力用ワードを付加して表示するようになる。また設定部52は、操作画面に設定する音声入力用ワードのパターンを決定すると、その決定したパターンを操作反映部53へ出力する。
操作反映部53は、ユーザーによって行われる手動操作や音声操作の内容と特定し、ユーザーによる操作を反映させる処理部である。例えば、ユーザーが操作部14に対する手動操作を行った場合、操作反映部53は、操作部14から出力される操作情報に基づいてユーザーによって行われた操作を特定し、その操作を反映させる処理を行う。これに対し、ユーザーが音声入力部15に対して音声を入力した場合、操作反映部53は、ユーザーによって入力された音声を解析し、設定部52によって操作画面に設定されている音声入力用ワードに一致するか否かを判別する。例えば、操作反映部53は、音声を解析するのに十分な音量レベルの音声入力があった場合に音声解析を行う。その結果、ユーザーによって入力された音声が音声入力用ワードに一致する場合、操作反映部53は、音声操作であることを特定し、その音声操作を反映させる処理を行う。
操作反映部53は、ユーザーによって行われた手動操作又は音声操作が操作画面を更新させるものである場合、表示制御部50に操作画面の更新指示を出力する。これにより、表示制御部50は、表示部13に表示している操作画面を更新する。また操作反映部53は、ユーザーによって行われた手動操作又は音声操作がジョブの設定や実行を指示するものである場合、ジョブ制御部51に対してジョブの設定や実行を指示する。これにより、ジョブ制御部51は、ユーザーによる操作に基づいてジョブの設定や実行を行うようになる。
上記のような構成において設定部52は、例えば画像処理装置2に対して電源が投入されたとき、表示部13に表示される操作画面に対して音声入力用ワードを初期設定する。このとき、設定部52は、デフォルトのパターンAの音声入力用ワードを選択して操作画面に設定するようにしても良い。この場合、複数の画像処理装置2は電源投入時には、同じパターンAの音声入力用ワードを操作画面に設定していることになる。
ただし、上記に限られず、設定部52は、操作画面に対して音声入力用ワードを初期設定するとき、他の画像処理装置2とは異なるパターンの音声入力用ワードを操作画面に設定するようにしても良い。例えば、複数の画像処理装置2は予め管理者などによってグループ化されており、同一グループに含まれる画像処理装置2は電源投入時に互いに異なるパターンの音声入力用ワードを選択して操作画面に初期設定するのである。このとき、同一グループに複数の画像処理装置2が含まれる場合、それら複数の画像処理装置2が互いに通信を行うことにより、他の画像処理装置2が既に設定しているパターンとは異なるパターンの音声入力用ワードを選択して設定するようにしても良い。また同一グループに含まれる複数の画像処理装置2には、予め管理者などによって初期設定するパターンの音声入力用ワードが定められており、電源投入時に予め定められたパターンの音声入力用ワードを設定するようにしても良い。
このような設定部52は、ユーザーによる音声操作が行われる可能性があることを検知するように構成される。そして設定部52は、ユーザーによる音声操作が行われる可能性があることを検知すると、操作画面に設定する音声入力用ワードの再設定を行う。この再設定では、ユーザーが音声を発した場合に、近傍に位置する他の画像処理装置2がその音声に反応することがないように、他の画像処理装置2とは異なるパターンの音声入力用ワードが設定されると共に、なるべくユーザーが音声操作を行い易くなるようにデフォルトであるパターンAの音声入力用ワードが優先的に設定されるようになる。
制御部10は、ユーザーによる音声操作が行われる可能性があることを検知するために、音声操作指示受付部54、音量検知部55、音量判別部56、距離検出部57及び距離判別部58として機能する。これら各部は、例えばユーザーによる音声操作が行われていない状態のときに機能し、ユーザーによる音声操作が行われる可能性があることを検知する。
音声操作指示受付部54は、例えば操作部14に含まれる特定の押しボタンキーがユーザーによって操作されることにより、操作パネル4を操作するユーザーが音声操作を行おうとしていることを検知する。音声操作指示受付部54は、ユーザーによって特定の押しボタンキーが操作されたことを検知すると、設定部52に対し、ユーザーによる音声操作が行われる可能性があることを通知する。尚、ユーザーが音声操作を行う際に操作する操作キーは、必ずしも押しボタンキーに限られず、操作画面内に表示される操作キーであっても構わない。
設定部52は、音声操作指示受付部54からユーザーによる音声操作が行われる可能性があることを示す通知を受信すると、操作画面に対して音声入力用ワードを再設定する。このとき、ユーザーは自機の操作パネル4に対する操作を行っているのであるから、他の画像処理装置2ではなく、自機に対して音声操作を行おうとしていることが明らかである。そのため、設定部52は、操作画面に対してデフォルトであるパターンAの音声入力用ワードを優先的に設定する。これにより、ユーザーは、最も使い勝手の良いパターンAの音声入力用ワードを使用して自機に対する音声操作を行うことができるようになる。
そして設定部52は、操作画面に対してデフォルトであるパターンAの音声入力用ワードを設定すると、他の画像処理装置2の音声入力用ワードをパターンAとは異なる別のパターンB,Cの音声入力用ワードに設定変更させる。このとき、管理者によって複数の画像処理装置2が予めグループ化されていれば、設定部52は、自機と同一グループに含まれる他の画像処理装置2の音声入力用ワードを、パターンAとは異なる別のパターンB,Cの音声入力用ワードに設定変更させる。また設定部52は、他の画像処理装置2の音声入力用ワードをパターンAとは異なる別のパターンの音声入力用ワードに設定変更させるとき、他の全ての画像処理装置2において設定すべき音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードに変更することを指示するようにしても良い。
これに対し、自機の近傍に位置する他の画像処理装置2が既にパターンAの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンAの音声入力用ワードを使用することができない。そのため、設定部52は、パターンAとは異なるパターンB,Cの音声入力用ワードを自機の操作画面に再設定する。
音量検知部55は、音声入力部15に入力する音の音量を検知するものである。音量検知部55は、音声入力部15に入力する音の音量が所定音量レベル以上である場合に、ユーザーによる音声操作が行われる可能性があることを検知する。この場合の所定音量レベルは、例えば操作反映部53が音声を解析することが可能な程度の音量レベルである。すなわち、ユーザーが画像処理装置2の前に立って音声を発すると、その音声は周囲の雑音よりも音量レベルが高くなるため、音量検知部55は、そのような音量レベルを検知することにより、ユーザーによる音声操作が行われる可能性があることを検知する。音量検知部55は、所定音量レベル以上の音を検知すると、音量判別部56を機能させる。
音量判別部56は、音量検知部55によって検知された自機の音量レベルと、他の画像処理装置2において検知された音量レベルとを比較し、自機で検知された音量レベルが最大音量であるか否かを判別する処理部である。音量判別部56は、音量検知部55によって所定音量レベル以上の音量が検知されると、ネットワークインタフェース20を介して他の画像処理装置2に対して音量情報の送信を要求し、他の画像処理装置2において検知された音量レベルを示す音量情報を取得する。そして音量判別部56は、他の画像処理装置2から音量情報を取得すると、まず所定音量レベル以上の音量を検知した他の画像処理装置2を全て抽出し、抽出した他の画像処理装置2と自機とを含むグループを形成する。このグループは、音量検知部55によって検知された音量レベルの音声で反応する可能性のある画像処理装置2の集合である。そして音量判別部56は、当該グループに含まれる全ての画像処理装置2で検知された音量レベルのうち、自機で検知された音量レベルが最大音量であるか否かを判別し、その判別結果を設定部52へ出力する。
設定部52は、音量判別部56から出力される判別結果に基づいて音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードを操作画面に再設定する。例えば、音量判別部56によって自機で検知された音量レベルが最大音量であると判別された場合、設定部52は、デフォルトであるパターンAの音声入力用ワードを操作画面に設定する。そして設定部52は、自機の操作画面にパターンAの音声入力用ワードを設定した後、自機と同一グループに含まれる他の画像処理装置2の音声入力用ワードを、パターンAとは異なるパターンB,Cの音声入力用ワードに設定変更させる。このとき、設定部52は、他の画像処理装置2において設定すべき音声入力用ワードのパターンを指示するようにしても良い。
ただし、自機で検知された音量レベルが最大音量であっても、自機の近傍に位置する他の画像処理装置2が既にパターンAの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンAの音声入力用ワードを使用することができない。そのような場合、設定部52は、パターンAとは異なるパターンB,Cの音声入力用ワードを操作画面に再設定する。
一方、自機で検知された音量レベルが最大音量ではなかった場合、ユーザーは自機以外の他の画像処理装置2に対して音声操作を行おうとしている可能性が高い。そのため、設定部52は、デフォルトであるパターンAの音声入力用ワードを他の画像処理装置2で使用できるようにすべく、自機の操作画面にはパターンAとは異なるパターンB,Cの音声入力用ワードを再設定する。
尚、音量検知部55は、他の画像処理装置2から音量情報の送信要求を受信した場合には、自機で検出した音量レベルを示す音量情報を生成し、ネットワークインタフェース20を介して、送信要求の発信源である他の画像処理装置2へ送信する。これにより、音量レベルの判別は、他の画像処理装置2においても行うことが可能になる。
距離検出部57は、距離測定センサー16によって画像処理装置2の周囲に位置するユーザーが検知されると、距離測定センサー16からの出力に基づき、ユーザーまでの距離を検出する。そして距離検出部57は、画像処理装置2の周囲に位置するユーザーまでの距離が所定距離以下の範囲内である場合に、ユーザーによる音声操作が行われる可能性があることを検知する。音量検知部55は、所定距離以下の範囲内にいるユーザーを検知すると、距離判別部58を機能させる。
距離判別部58は、距離検出部57によって検知されたユーザーとの距離と、他の画像処理装置2において検知されたユーザーとの距離とを比較し、自機とユーザーとの距離が最も近いか否かを判別する処理部である。距離判別部58は、距離検出部57によって所定距離以下の範囲内にいるユーザーが検知されると、ネットワークインタフェース20を介して他の画像処理装置2に距離情報の送信を要求し、他の画像処理装置2において検知されたユーザーとの距離を示す距離情報を取得する。そして距離判別部58は、他の画像処理装置2から距離情報を取得すると、まず所定距離以下の範囲内でユーザーを検知している他の画像処理装置2を全て抽出し、抽出した他の画像処理装置2と自機とを含むグループを形成する。このグループは、所定距離以下の範囲内に位置するユーザーが音声を発した場合に、その音声に反応する可能性のある画像処理装置2の集合である。そして距離判別部58は、当該グループに含まれる全ての画像処理装置2で検知されたユーザーとの距離を比較し、自機で検出されたユーザーとの距離が最も近い距離であるか否かを判別し、その判別結果を設定部52へ出力する。
設定部52は、距離判別部58から出力される判別結果に基づいて音声入力用ワードのパターンを決定し、その決定したパターンの音声入力用ワードを操作画面に再設定する。例えば、距離判別部58によって自機とユーザーとの距離が最も近い距離であると判別された場合、設定部52は、デフォルトであるパターンAの音声入力用ワードを操作画面に設定する。また設定部52は、自機の操作画面にパターンAの音声入力用ワードを設定した後、自機と同一グループに含まれる他の画像処理装置2の音声入力用ワードを、パターンAとは異なるパターンB,Cの音声入力用ワードに設定変更させる。このとき、設定部52は、他の画像処理装置2において設定すべき音声入力用ワードのパターンを指示するようにしても良い。
ただし、自機で検出されたユーザーとの距離が最も近い場合であっても、自機の近傍に位置する他の画像処理装置2が既にパターンAの音声入力用ワードを設定して他のユーザーによる音声操作を受け付けているような場合には、自機でパターンAの音声入力用ワードを使用することができない。そのような場合、設定部52は、パターンAとは異なるパターンB,Cの音声入力用ワードを操作画面に再設定する。
一方、自機で検出されたユーザーとの距離が最も近い距離ではなかった場合、ユーザーは自機以外の他の画像処理装置2に対して音声操作を行おうとしている可能性が高い。そのため、設定部52は、デフォルトであるパターンAの音声入力用ワードを他の画像処理装置2で使用できるようにすべく、自機の操作画面にはパターンAとは異なるパターンB,Cの音声入力用ワードを再設定する。
尚、距離検出部57は、他の画像処理装置2から距離情報の送信要求を受信した場合には、自機で検出したユーザーとの距離を示す距離情報を生成し、ネットワークインタフェース20を介して、送信要求の発信源である他の画像処理装置2へ送信する。これにより、ユーザーとの距離の判別は、他の画像処理装置2においても行うことが可能になる。
以上のように設定部52は、ユーザーが手動操作で音声操作指示を行った場合、操作パネル4に対して音声を発した場合、或いは、画像処理装置2の近傍位置まで移動した場合に、操作画面に対する音声入力用ワードを再設定する。すなわち、設定部52は、複数の条件のうちのいずれかの条件が成立したときに、ユーザーによる音声操作が行われる可能性があることを検知し、操作画面に対する音声入力用ワードを再設定するようにしている。ところが、上述した複数の条件のうち同時に2以上の条件が成立することもある。例えば、音量検知部55が所定音量レベルの音量を検知したときに、距離検出部57が所定距離以下の範囲内に位置するユーザーを検出することもある。そのような場合、設定部52は、同時に成立した2以上の条件のうちのいずれかの条件によって操作画面にデフォルトであるパターンAの音声入力用ワードを設定することができるか否かを判定し、少なくとも1つの条件成立によって操作画面にデフォルトであるパターンAの音声入力用ワードを設定することができる場合に、パターンAの音声入力用ワードを操作画面に設定する。つまり、設定部52は、他の画像処理装置2において既にデフォルトであるパターンAの音声入力用ワードが使用されていない限り、デフォルトであるパターンAの音声入力用ワードを優先的に操作画面に設定する。
図9は、複数の画像処理装置2a〜2dのうちの画像処理装置2aにおいてユーザーによる音声操作指示を受け付けた場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置2a〜2dにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置2aがユーザーによる音声操作指示を受け付けると(プロセスP1)、画像処理装置2aがデフォルトであるパターンAの音声入力用ワードを使用することを決定する(プロセスP2)。そして画像処理装置2aは、自機で表示している操作画面に対してパターンAの音声入力用ワードを設定し、表示部13で表示中の操作画面を更新する(プロセスP3)。これにより、画像処理装置2aで表示される操作画面は、図6で示したような操作画面G2に切り替わる。これにより、操作画面G2に含まれる各操作項目30〜38と同じ名称の音声入力用ワード40a〜48aが各操作項目30〜38に付加された状態で表示されるため、ユーザーにとって音声操作し易い画面が表示されるようになる。
画像処理装置2aは、自機の操作画面にパターンAの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置2b,2c,2dに対してワード変更通知D1を個別に送信する(プロセスP4)。例えば、ワード変更通知D1には、他の画像処理装置2b,2c,2dのそれぞれにおいて使用すべき音声入力用ワードのパターンの指定情報が含まれる。そのため、画像処理装置2bは、画像処理装置2aからワード変更通知D1を受信すると、パターンBの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP5)。また画像処理装置2cは、画像処理装置2aからワード変更通知D1を受信すると、パターンCの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP6)。さらに画像処理装置2dは、画像処理装置2aからワード変更通知D1を受信すると、パターンDの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP7)。
図10は、画像処理装置2aを中心とするグループ形成の一例を示す図である。例えば図10に示すように、管理者が画像処理装置2aを中心とするグループとして、所定距離の範囲内(領域R1内)に設置されている複数の画像処理装置2a,2b,2c,2dを含むグループを予め設定している場合を仮定する。この場合、上述したようにユーザーが画像処理装置2aに対して音声操作指示を行うと、画像処理装置2aと同一グループに含まれる他の画像処理装置2b,2c,2dのそれぞれが、画像処理装置2aと異なるパターンの音声入力用ワードであって、互いに異なるパターンの音声入力用ワードを設定する。したがって、グループの中心に位置する画像処理装置2aに対してユーザーがパターンAの音声入力用ワードで音声操作を行ったとしても、他の画像処理装置2b,2c,2dはユーザーの発する音声に反応することはない。
次に図11は、複数の画像処理装置2a〜2dのうちの画像処理装置2aにおいて音量が検知された場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置2a〜2dにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置2aがユーザーによって発せされた所定音量レベル以上の音声を検知すると(プロセスP10)、他の画像処理装置2b,2c,2dに対して音量情報の送信を要求し(プロセスP11)、他の画像処理装置2b,2c,2dが検知した音量レベルを示す音量情報D2を取得する(プロセスP12)。そして画像処理装置2aは、音量判別処理を行い(プロセスP13)、所定音量レベル以上の音量を検知している画像処理装置どうしでグループ形成を行う(プロセスP14)。図11の例では、画像処理装置2b,2cでは、所定音量レベル以上の音量が検知され、画像処理装置2dでは、所定音量レベル以上の音量が検知されなかった場合を例示しており、グループ形成処理(プロセスP14)において3つの画像処理装置2a,2b,2cによるグループ形成が行われた場合を示している。
そして画像処理装置2aは、自機で検知された音量レベルが同一グループに含まれる他の画像処理装置2b,2cで検知された音量レベルと比較して最大音量であった場合、デフォルトであるパターンAの音声入力用ワードを自機で使用することを決定する(プロセスP15)。そして画像処理装置2aは、自機で表示している操作画面に対してパターンAの音声入力用ワードを設定し、表示部13で表示中の操作画面を更新する(プロセスP16)。これにより、画像処理装置2aで表示される操作画面は、図6で示したような操作画面G2に切り替わる。
画像処理装置2aは、自機の操作画面にパターンAの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置2b,2cに対してワード変更通知D1を個別に送信する(プロセスP17)。画像処理装置2bは、画像処理装置2aからワード変更通知D1を受信すると、パターンBの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP18)。また画像処理装置2cは、画像処理装置2aからワード変更通知D1を受信すると、パターンCの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP19)。したがって、画像処理装置2aに対してユーザーがパターンAの音声入力用ワードで音声操作を行ったとしても、同一グループに属する他の画像処理装置2b,2cはユーザーの発する音声に反応することはない。
尚、図11の例では、画像処理装置2dが画像処理装置2aとの同一グループを形成していないため、画像処理装置2aからのワード変更通知D1が画像処理装置2dに対して送信されない。そのため、画像処理装置2dは、画像処理装置2aと同じパターンの音声入力用ワードを操作画面に設定することもある。そのような場合であっても、画像処理装置2dは、ユーザーが画像処理装置2aの前に立って発する音声を十分な音量レベルとして検知しないため、画像処理装置2aに対して発せられた音声に反応することはない。
次に図12は、複数の画像処理装置2a〜2dのうちの画像処理装置2aにおいて人の存在が検知された場合の動作プロセスの一例を示す図である。はじめに複数の画像処理装置2a〜2dにおいて表示されている操作画面には、複数のパターンのうちのいずれかのパターンの音声入力用ワードが初期設定されている。その状態で、画像処理装置2aが人の存在を検知すると(プロセスP20)、ユーザーとの距離を測定する(プロセスP21)。そして画像処理装置2aは、他の画像処理装置2b,2c,2dに対して距離情報の送信を要求し(プロセスP22)、他の画像処理装置2b,2c,2dが検出したユーザーとの距離を示す距離情報D3を取得する(プロセスP23)。そして画像処理装置2aは、距離判別処理を行い(プロセスP24)、ユーザーとの距離が所定距離以下の範囲である画像処理装置どうしでグループ形成を行う(プロセスP25)。図12の例では、画像処理装置2b,2cでは、ユーザーとの距離が所定距離以下の範囲内であるとして検出され、画像処理装置2dでは、所定距離を超える距離又はユーザーそのものが検知されていない場合を例示している。そのため、グループ形成処理(プロセスP25)においては、3つの画像処理装置2a,2b,2cによるグループ形成が行われる。
そして画像処理装置2aは、自機で検出されたユーザーとの距離が同一グループに含まれる他の画像処理装置2b,2c検出されたユーザーとの距離と比較して最も近い距離であった場合、デフォルトであるパターンAの音声入力用ワードを自機で使用することを決定する(プロセスP26)。続いて、画像処理装置2aは、自機で表示している操作画面に対してパターンAの音声入力用ワードを設定し、表示部13で表示中の操作画面を更新する(プロセスP27)。これにより、画像処理装置2aで表示される操作画面は、図6で示したような操作画面G2に切り替わる。
画像処理装置2aは、自機の操作画面にパターンAの音声入力用ワードを設定すると、同一グループ内に含まれる他の画像処理装置2b,2cに対してワード変更通知D1を個別に送信する(プロセスP28)。画像処理装置2bは、画像処理装置2aからワード変更通知D1を受信すると、パターンBの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP29)。また画像処理装置2cは、画像処理装置2aからワード変更通知D1を受信すると、パターンCの音声入力用ワードを操作画面に設定し、表示中の操作画面を更新する(プロセスP30)。したがって、画像処理装置2aに対してユーザーがパターンAの音声入力用ワードで音声操作を行ったとしても、同一グループに属する他の画像処理装置2b,2cはユーザーの発する音声に反応することはない。尚、画像処理装置2dについては、ユーザーとの距離が遠いため、ユーザーが発する音声に反応することはない。
上記においては、ユーザーが手動操作で音声操作指示を行った場合、操作パネル4に対して音声を発した場合、或いは、画像処理装置2の近傍位置まで移動した場合に、設定部52が、操作画面に対する音声入力用ワードを再設定する態様について説明した。しかし、設定部52は、上述した場合に限られず、例えばユーザーによる操作(音声操作を含む)に基づいて表示部13に表示する操作画面が別の操作画面に遷移する場合に、その遷移するタイミングで毎回、音声入力用ワードのパターンを再度決定するようにしても良い。すなわち、上述した音声入力用ワードは、階層構造を有する複数の操作画面のそれぞれに対して予め用意されているため、操作画面が遷移すれば、遷移後の新たな操作画面に対して音声入力用ワードを付加する必要がある。一方、画像処理装置2で表示される操作画面が別の操作画面に遷移すれば、その遷移後の操作画面と同じ操作画面が他の画像処理装置2において表示されているとは限らない。そのため、操作画面が遷移するタイミングで音声入力用ワードのパターンを再決定するようにすれば、デフォルトであるパターンAの音声入力用ワードを使用することができる機会が増えるため、ユーザーにとって音声操作し易くなるという利点がある。
次に画像処理装置2において行われる具体的な処理手順について説明する。図13乃至図18は、画像処理装置2において行われる処理手順の一例を示すフローチャートである。この処理は、制御部10のCPU11がプログラム22を実行することによって順次行われる処理である。画像処理装置2は、この処理を開始すると、まずユーザーによる音声操作指示を受け付けたか否かを判断する(ステップS10)。ユーザーによる音声操作指示を受け付けた場合(ステップS10でYES)、画像処理装置2は、第1のワード決定処理を行う(ステップS11)。
図14は、第1のワード決定処理(ステップS11)の詳細な処理手順の一例を示すフローチャートである。画像処理装置2は、この処理を開始すると、パターンAの音声入力用ワードを使用可能であるか否かを判断する(ステップS30)。例えば、これよりも前に他の画像処理装置2からパターンAの音声入力用ワードを使用することが通知されていれば、パターンAの音声入力用ワードは自機において使用することができない。これに対し、これよりも前に他の画像処理装置2からパターンAの音声入力用ワードを使用することが通知されていない場合には、パターンAの音声入力用ワードを自機において使用することができる。
そしてパターンAの音声入力用ワードを使用可能であると判断した場合(ステップS30でYES)、画像処理装置2は、自機で使用する音声入力用ワードとして、デフォルトであるパターンAの音声入力用ワードを決定する(ステップS31)。また画像処理装置2は、自機で使用する音声入力用ワードをパターンAに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS32)。
一方、パターンAの音声入力用ワードを使用することができないと判断した場合(ステップS30でNO)、画像処理装置2は、自機で使用する音声入力用ワードとして、パターンA以外のパターンの音声入力用ワードを決定する(ステップS33)。また画像処理装置2は、自機で使用する音声入力用ワードをパターンA以外のパターンに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS34)。このとき、画像処理装置2は、既にパターンAを使用している他の画像処理装置2を除き、その他の画像処理装置2で使用する音声入力用ワードのパターンを、パターンA以外のパターンから選択して決定する。以上で、第1のワード決定処理が終了する。
図13に戻り、ユーザーによる音声操作指示を受け付けていない場合(ステップS10でNO)、画像処理装置2は、所定音量レベル以上の音量を検知したか否かを判断する(ステップS12)。その結果、所定音量レベル以上の音量を検知した場合(ステップS12でYES)、画像処理装置2は、第2のワード決定処理を行う(ステップS13)。
図15は、第2のワード決定処理(ステップS13)の詳細な処理手順の一例を示すフローチャートである。画像処理装置2は、この処理を開始すると、ネットワーク3に接続されている他の画像処理装置2から音量情報D2を取得し(ステップS40)、他の画像処理装置2で検知された音量の判別処理を行う(ステップS41)。そして画像処理装置2は、自機と、所定音量レベル以上の音量を検知した他の画像処理装置2とを含むグループを形成する(ステップS42)。次に画像処理装置2は、ステップS42で形成したグループに含まれる全ての画像処理装置2が検知した音量レベルのうち、自機で検知した音量レベルが最大音量であるか否かを判断する(ステップS43)。
その結果、自機で検知した音量レベルが最大音量である場合(ステップS43でYES)、画像処理装置2は、パターンAの音声入力用ワードを使用可能であるか否かを判断する(ステップS44)。ここでの判断は、図14のステップS30における判断と同じである。画像処理装置2は、パターンAの音声入力用ワードを使用可能であると判断した場合(ステップS44でYES)、自機で使用する音声入力用ワードとして、デフォルトであるパターンAの音声入力用ワードを決定する(ステップS45)。さらに画像処理装置2は、自機で使用する音声入力用ワードをパターンAに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS46)。このとき、他の画像処理装置2で使用する音声入力用ワードのパターンは、パターンA以外のパターンとして決定される。
一方、自機で検知した音量レベルが最大音量ではなかった場合(ステップS43でNO)、或いは、パターンAの音声入力用ワードを使用することができないと判断した場合(ステップS44でNO)、画像処理装置2は、自機で使用する音声入力用ワードとして、パターンA以外のパターンの音声入力用ワードを決定する(ステップS47)。さらに画像処理装置2は、自機で使用する音声入力用ワードをパターンA以外のパターンに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS48)。このときも、画像処理装置2は、既にパターンAを使用している他の画像処理装置2を除き、その他の画像処理装置2で使用する音声入力用ワードのパターンを、パターンA以外のパターンから選択して決定する。以上で、第2のワード決定処理が終了する。
再び図13に戻り、所定音量レベル以上の音量を検知していない場合(ステップS12でNO)、画像処理装置2は、所定距離以下の範囲内にいるユーザーの存在を検知したか否かを判断する(ステップS14)。その結果、所定距離以下の範囲内にいるユーザーの存在を検知した場合(ステップS14でYES)、画像処理装置2は、第3のワード決定処理を行う(ステップS15)。
図16は、第3のワード決定処理(ステップS15)の詳細な処理手順の一例を示すフローチャートである。画像処理装置2は、この処理を開始すると、ネットワーク3に接続されている他の画像処理装置2から距離情報D3を取得し(ステップS50)、他の画像処理装置2で検知されたユーザーとの距離の判別処理を行う(ステップS51)。そして画像処理装置2は、自機と、所定距離以下の範囲内にいるユーザーを検知した他の画像処理装置2とを含むグループを形成する(ステップS52)。次に画像処理装置2は、ステップS52で形成したグループに含まれる全ての画像処理装置2が検出したユーザーとの距離のうち、自機で検出したユーザーとの距離が最も近い距離であるか否かを判断する(ステップS53)。
その結果、自機で検出したユーザーとの距離が最も近い距離である場合(ステップS53でYES)、画像処理装置2は、パターンAの音声入力用ワードを使用可能であるか否かを判断する(ステップS54)。ここでの判断は、図14のステップS30における判断と同じである。画像処理装置2は、パターンAの音声入力用ワードを使用可能であると判断した場合(ステップS54でYES)、自機で使用する音声入力用ワードとして、デフォルトであるパターンAの音声入力用ワードを決定する(ステップS55)。さらに画像処理装置2は、自機で使用する音声入力用ワードをパターンAに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS56)。このとき、他の画像処理装置2で使用する音声入力用ワードのパターンは、パターンA以外のパターンとして決定される。
一方、自機で検出したユーザーとの距離が最も近い距離ではなかった場合(ステップS53でNO)、或いは、パターンAの音声入力用ワードを使用することができないと判断した場合(ステップS54でNO)、画像処理装置2は、自機で使用する音声入力用ワードとして、パターンA以外のパターンの音声入力用ワードを決定する(ステップS57)。さらに画像処理装置2は、自機で使用する音声入力用ワードをパターンA以外のパターンに決定することに伴い、他の画像処理装置2で使用する音声入力用ワードのパターンを決定する(ステップS58)。このときも、画像処理装置2は、既にパターンAを使用している他の画像処理装置2を除き、その他の画像処理装置2で使用する音声入力用ワードのパターンを、パターンA以外のパターンから選択して決定する。以上で、第3のワード決定処理が終了する。
再び図13に戻る。画像処理装置2は、上記のようにして音声入力用ワードのパターンを決定すると、その決定したパターンの音声入力用ワードを操作画面に設定し、表示部13に表示している操作画面を更新する(ステップS16)。また画像処理装置2は、音声操作フラグをオンに設定し(ステップS17)、他の画像処理装置2に対してワード変更通知D1を送信する(ステップS18)。尚、ステップS18では、音声入力用ワードを変更すべき他の画像処理装置2に対してのみワード変更通知D1を送信するようにしても良い。またワード変更通知D1には、自機で設定した音声入力用ワードのパターンに関する情報や、自機において音声操作フラグをオンに設定したことを示す情報が含まれる。これにより、他の画像処理装置2の音声入力用ワードを重複しないように変更することができると共に、自機で設定した音声入力用ワードのパターンや、自機が音声操作中であることを他の画像処理装置2に通知することができる。
その後、画像処理装置2は、ユーザーによる音声入力を受け付けたか否かを判断する(ステップS19)。尚、ここでは、ステップS12で所定音量レベルの音量を検知したときの音声入力に基づき、音声入力を受け付けたと判断するようにしても良い。ユーザーによる音声入力を受け付けた場合(ステップS19でYES)、画像処理装置2は、音声認識処理を実行する(ステップS20)。すなわち、画像処理装置2は、ユーザーの音声を解析することにより、音声入力されたワードを特定する。そして画像処理装置2は、音声認識処理によって特定したワードが操作画面に設定された音声入力用ワードに一致するか否かを判断し(ステップS21)、一致する場合には(ステップS21でYES)、その音声入力用ワードに対応する操作項目に基づいてユーザーによって行われた音声操作を特定する(ステップS22)。尚、ユーザーによる音声入力を受け付けていない場合(ステップS19でNO)、或いは、音声認識処理で特定したワードが操作画面に設定された音声入力用ワードに一致しなかった場合(ステップS21でNO)には、ステップS19に戻ってユーザーによる音声入力を待機する状態となる。
ユーザーによる音声操作を特定した場合、画像処理装置2は、その音声操作に基づいて操作画面を遷移させるか否かを判断する(ステップS23)。操作画面を遷移させる場合(ステップS23でYES)、画像処理装置2は、操作画面遷移処理を実行する(ステップS24)。これにより、表示部13に表示される操作画面は、ユーザーの音声操作に基づいて別の画面に遷移する。このとき、上位層の操作画面から下位層の操作画面に遷移することもあるし、また下位層の操作画面から上位層の操作画面に遷移することもある。さらには、別の機能の操作画面に遷移することもある。画像処理装置2は、操作画面を遷移させると、ワード変更処理を実行する(ステップS25)。すなわち、画像処理装置2は、表示部13に表示している操作画面を遷移させたタイミングで、再び音声入力用ワードの設定変更を行うための処理を実行する。尚、操作画面を遷移させない場合(ステップS23でNO)には、ステップS24,S25の処理はスキップする。
図17は、ワード変更処理(ステップS25)の詳細な処理手順の一例を示すフローチャートである。画像処理装置2は、この処理を開始すると、ユーザーによって機能の切り替えが行われたか否かを判断する(ステップS60)。例えば、ユーザーによってスキャン機能からプリント機能に切り替えられたか否か、或いは、コピー機能からFAX機能に切り替えられたか否かなどを判断する。また画像処理装置2は、トップ画面からユーザーによって機能選択が行われた場合も機能切り替えであると判断する。ユーザーによって機能の切り替えが行われた場合(ステップS60でYES)、画像処理装置2は、同一グループ内の他の画像処理装置2において同一の機能が操作されている最中であるか否かを判断する(ステップS61)。このとき、画像処理装置2は、他の画像処理装置2と通信を行うことにより、同一の機能が操作されているか否かを判断するようにしても良い。同一の機能が操作されている場合(ステップS61でYES)、画像処理装置2は、同一の機能が操作されている他の画像処理装置2においてパターンAの音声入力用ワードが使用されているか否かを判断する(ステップS62)。同一の機能が操作されている他の画像処理装置2においてパターンAの音声入力用ワードが使用されている場合(ステップS62でYES)、画像処理装置2は、自機の遷移後の操作画面に対して設定する音声入力用ワードとして、パターンA以外の音声入力用ワードを決定する(ステップS63)。一方、同一グループ内の他の画像処理装置2において同一の機能が操作されていない場合(ステップS61でNO)、又は、同一の機能が操作されている他の画像処理装置2においてパターンAの音声入力用ワードが使用されていない場合(ステップS62でNO)、画像処理装置2は、自機の遷移後の操作画面に対して設定する音声入力用ワードとして、パターンAの音声入力用ワードを決定する(ステップS64)。尚、ユーザーによって機能の切り替えが行われていない場合(ステップS60でNO)、上記ステップS61〜S64の処理はスキップする。
次に画像処理装置2は、操作画面が上位層の画面から下位層の画面に遷移したか否かを判断する(ステップS65)。上位層の画面から下位層の画面に遷移した場合(ステップS65でYES)、画像処理装置2は、上位層の操作画面に設定していた音声入力用ワードを他の画像処理装置2において使用禁止に設定する(ステップS66)。すなわち、画像処理装置2は、下位層の画面へ遷移させることに伴い、遷移前の上位層の画面に設定していた音声入力ワードの使用禁止通知を他の画像処理装置2へ送信することにより、他の画像処理装置2において使用されることを禁止する。例えば操作画面が下位層の画面へ遷移したとき、ユーザーは遷移後の画面を確認して所望の操作画面とは異なる画面に遷移したことに気付くことが多い。そのような場合、ユーザーは、比較的直ぐに元の上位層の画面に戻って音声操作を継続することになる。上位層の画面に戻ったとき、前回の音声入力用ワードと異なる音声入力用ワードが設定されていると、ユーザーにとっては音声操作し難くなり、操作性が低下する。そこで画像処理装置2は、操作画面が上位層の画面から下位層の画面に遷移したときには、元の上位層の画面に設定していた音声入力用ワードが他の画像処理装置2において使用されることを禁止することにより、元の上位層の画面に戻った場合でもユーザーが前回と同じ音声入力用ワードを用いて音声操作を継続できるようにしているのである。
また画像処理装置2は、元の上位層の画面に設定していた音声入力用ワードが他の画像処理装置2において使用されることを禁止する時間を設定するようにしても良い。例えば、ユーザーは遷移後の下位層の画面を確認して所望の操作画面であれば、そのまま音声操作を継続するため、直ぐに下位層の画面を元の上位層の画面に戻すことはない。そのため、画像処理装置2は、他の画像処理装置2による使用禁止時間を例えば60秒程度に設定すれば、別のユーザーに元の上位層の画面に設定していた音声入力用ワードを解放することができるようになる。
次に画像処理装置2は、同一グループ内の他の画像処理装置2において同一階層の操作画面が表示されているか否かを判断する(ステップS67)。このとき、画像処理装置2は、他の画像処理装置2と通信を行うことにより、同一階層の操作画面が表示されているか否かを判断するようにしても良い。他の画像処理装置2において同一階層の操作画面が表示されていない場合(ステップS67でNO)、画像処理装置2は、上位層の操作画面にパターンAの音声入力用ワードが設定されていたか否かを判断する(ステップS68)。その結果、上位層の操作画面にパターンAの音声入力用ワードが設定されていた場合(ステップS68でYES)、画像処理装置2は、遷移後の下位層の操作画面に設定する音声入力用ワードとして、パターンAの音声入力用ワードを決定する(ステップS69)。
一方、他の画像処理装置2において同一階層の操作画面が表示されている場合(ステップS67でYES)、又は、上位層の操作画面にパターンAの音声入力用ワードを設定していなかった場合(ステップS68でNO)、画像処理装置2は、同一グループ内の他の画像処理装置2においてパターンAの音声入力用ワードが使用中であるか否かを判断する(ステップS70)。同一グループ内の他の画像処理装置2においてパターンAの音声入力用ワードが使用中でない場合(ステップS70でNO)、画像処理装置2は、さらにパターンAの音声入力用ワードの使用が禁止されているか否かを判断する(ステップS71)。その結果、同一グループ内の他の画像処理装置2においてパターンAの音声入力用ワードが使用中でなく(ステップS70でNO)、さらにパターンAの音声入力用ワードの使用が禁止されていない場合(ステップS71でNO)、画像処理装置2は、遷移後の下位層の操作画面に設定する音声入力用ワードとして、パターンAの音声入力用ワードを決定する(ステップS69)。これに対し、同一グループ内の他の画像処理装置2においてパターンAの音声入力用ワードが使用中である場合(ステップS70でYES)、又は、パターンAの音声入力用ワードの使用が禁止されている場合(ステップS71でYES)、画像処理装置2は、遷移後の下位層の操作画面に対して設定する音声入力用ワードとして、パターンA以外の音声入力用ワードを決定する(ステップS72)。尚、上位層の画面から下位層の画面に遷移したものではない場合(ステップS65でNO)、上記ステップS66〜S72の処理はスキップする。以上で、ワード変更処理が終了する。
再び図13に戻る。次に画像処理装置2は、特定した音声操作がジョブ実行指示であるか否かを判断する(ステップS26)。ジョブ実行指示でない場合(ステップS26でNO)、画像処理装置2による処理は、ステップS19へ戻り、上述した処理を繰り返す。これに対し、ジョブ実行指示であった場合(ステップS26でYES)、画像処理装置2は、ユーザーによって指定されたジョブを実行する(ステップS27)。そしてジョブの実行が完了すると、画像処理装置2は、音声操作フラグをオフに設定し(ステップS28)、他の画像処理装置2に対して音声操作が終了したことを通知する(ステップS29)。これにより、当該画像処理装置2において使用していた音声入力用ワードが、他の画像処理装置2において使用可能な状態に解放される。
次に図18は、画像処理装置2が他の画像処理装置2からワード変更通知D1を受信した場合の処理手順を示すフローチャートである。画像処理装置2は、この処理を開始すると、他の画像処理装置2からワード変更通知D1を受信するのを待機する状態となる(ステップS80)。そして他の画像処理装置2からワード変更通知D1を受信すると、画像処理装置2は、音声操作フラグがオンであるか否かを判断する(ステップS81)。音声操作フラグがオンである場合(ステップS81でYES)、画像処理装置2は、ワード変更通知D1の送信元である他の画像処理装置2に対し、変更不可通知を送信する(ステップS82)。すなわち、画像処理装置2は、現在設定されている音声入力用ワードに基づいてユーザーによる音声操作が行われる可能性があるため、他の画像処理装置2からのワード変更通知D1を拒絶するのである。このとき送信する変更不可通知には、現在表示している操作画面を特定するための情報や、その操作画面に対して現在設定している音声入力用ワードのパターンを示す情報などが含まれる。
一方、音声操作フラグがオフであった場合(ステップS81でNO)、画像処理装置2は、ワード変更通知D1を解析する(ステップS83)。そして画像処理装置2は、表示部13に表示している操作画面に対し、ワード変更通知D1で指定されたパターンの音声入力用ワードを設定し(ステップS84)、操作画面を更新する(ステップS85)。これにより、画像処理装置2において操作画面に設定されている音声入力用ワードは、他の画像処理装置2とは異なる音声入力用ワードに変更される。
以上のように本実施形態の画像処理装置2は、ユーザーが操作可能な操作画面に対して近傍に位置する他の画像処理装置2とは異なるパターンの音声入力用ワードを設定し、その設定した音声入力用ワードに基づいてユーザーによる音声操作を受け付ける。つまり、互いに近傍に位置する複数の画像処理装置2は、互いに異なるパターンの音声入力用ワードを操作画面に設定しており、音声入力用ワードに一致するワードが音声入力されない限り、音声操作として受け付けないようにしている。そのため、ユーザーが1つの画像処理装置2の前に立ってその画像処理装置2に設定されている音声入力用ワードに一致する音声を発したとしても、他の画像処理装置2はユーザーの音声には反応しない。したがって、本実施形態の画像処理システム1によれば、複数の画像処理装置2のうち、ユーザーが使用しようとしている画像処理装置2だけをユーザーの音声に反応させることが可能である。
また本実施形態では、画像処理装置2が操作画面を遷移させるときに音声入力用ワードのパターンを変更できるようにしている。そのため、ユーザーにとって使い易い音声入力用ワードであるパターンAの音声入力用ワードを使用することができる機会が増えるため、音声操作を行う際の利便性を向上させることができる。
以上、本発明に関する幾つかの実施形態について説明したが、本発明は、上記実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。
例えば上記実施形態において、画像処理装置2は、コピー機能やスキャン機能、プリント機能、FAX機能などの複数の機能を備えるMFPを例示した。しかし、画像処理装置2は、必ずしも複数の機能を備えるものに限られない。すなわち、画像処理装置2は、スキャン機能のみを備えたスキャナであっても良いし、プリント機能のみを備えたプリンタであっても構わない。
また上記実施形態では、複数の画像処理装置2が同一の構成を有し、それぞれの画像処理装置2において同一グループ内の音声入力用ワードを決定することができる形態について説明した。しかし、これに限られるものではない。すなわち、複数の画像処理装置2のそれぞれにおいて設定する音声入力用ワードのパターンを決定するのは、複数の画像処理装置2のうちの1つの画像処理装置2であっても構わない。この場合、1つの画像処理装置2は、複数の画像処理装置2のそれぞれにおいて設定する音声入力用ワードのパターンを決定する機能を有しており、自機又は他の画像処理装置2からの要求に応じて、複数の画像処理装置2の情報を収集し、複数の画像処理装置2のそれぞれにおいて異なるパターンの音声入力用ワードを決定するように構築すれば良い。そして、他の画像処理装置2は、1つの画像処理装置2からの指示に基づいて、自機で表示する操作画面に指定されたパターンの音声入力用ワードを設定すれば良い。さらには、複数の画像処理装置2のそれぞれにおいて設定する音声入力用ワードのパターンを決定するのは、専用のサーバー装置であっても構わない。
1 画像処理システム
2(2a,2b,2c,2d) 画像処理装置
3 ネットワーク
13 表示部(表示手段)
15 音声入力部(音声入力手段)
16 距離測定センサー(距離測定手段)
22 プログラム
52 設定部(設定手段)
53 操作反映部(操作反映手段)
54 音声操作指示受付部(音声操作指示受付手段)
55 音量検知部(音量検知手段)
56 音量判別部(音量判別手段)
58 距離判別部(距離判別手段)

Claims (19)

  1. 複数の画像処理装置がネットワークを介して接続される画像処理システムであって、
    前記複数の画像処理装置のそれぞれは、
    ユーザーが操作可能な操作画面を表示する表示手段と、
    ユーザーによる音声の入力を受け付ける音声入力手段と、
    前記操作画面に音声入力用ワードを設定する設定手段と、
    前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、
    を備え、
    前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とする画像処理システム。
  2. 前記複数の画像処理装置のそれぞれは、
    デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、
    を更に備え、
    前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項1に記載の画像処理システム。
  3. 前記複数の画像処理装置は、2以上のグループのうちのいずれかのグループに予め分類されており、
    前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、自機と同一のグループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項2に記載の画像処理システム。
  4. 前記複数の画像処理装置のそれぞれは、
    デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、
    前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、
    を更に備え、
    前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項1に記載の画像処理システム。
  5. 前記距離判別手段は、前記距離測定手段によってユーザーとの距離が測定された場合に、他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、ユーザーとの距離が所定距離以内である画像処理装置を全て含むグループを形成し、当該グループにおいて自機とユーザーとの距離が最も近いか否かを判別し、
    前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項4に記載の画像処理システム。
  6. 前記複数の画像処理装置のそれぞれは、
    デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、
    前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、
    を更に備え、
    前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項1に記載の画像処理システム。
  7. 前記音量判別手段は、前記音量検知手段によって音量が検知された場合に、他の画像処理装置が検知した音量情報を取得し、所定音量以上の音量を検知した画像処理装置を全て含むグループを形成し、当該グループにおいて自機で検知された音量が最大音量であるか否かを判別し、
    前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記グループに含まれる他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項6に記載の画像処理システム。
  8. 前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴とする請求項2乃至7のいずれかに記載の画像処理システム。
  9. 前記デフォルトの音声入力用ワードとは異なる音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名の類義語に相当するワードであることを特徴とする請求項2乃至8のいずれかに記載の画像処理システム。
  10. 前記設定手段は、前記操作反映手段によって前記表示手段に表示される前記操作画面が別の画面に遷移するときに、他の画像処理装置とは異なる音声入力用ワードを決定し、遷移後の前記操作画面に設定することを特徴とする請求項1乃至9のいずれかに記載の画像処理システム。
  11. 前記操作画面は階層構造を有しており、
    前記設定手段は、前記表示手段に表示される前記操作画面が下位層の画面である場合、当該操作画面よりも上位層の画面に設定されていた音声入力用ワードが他の画像処理装置において設定されることを禁止することを特徴とする請求項10に記載の画像処理システム。
  12. 前記複数の画像処理装置のそれぞれは、複数の機能を有しており、
    前記操作反映手段は、前記音声操作に基づいて前記複数の機能のうちから一の機能を選択し、前記操作画面として前記一の機能に対応する画面を前記表示手段に表示させ、
    前記設定手段は、前記操作反映手段によって前記操作画面において表示される機能が別の機能に切り替えられたときに、他の画像処理装置とは異なる音声入力用ワードを決定し、機能切り替え後の前記操作画面に設定することを特徴とする請求項1乃至11のいずれかに記載の画像処理システム。
  13. 前記操作反映手段は、前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力用ワードに一致した場合に、音声操作中であると判定し、
    前記設定手段は、他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定した後、前記操作反映手段によって音声操作中であると判定されている期間内に他の画像処理装置から音声入力用ワードの変更要求を受信した場合に、当該他の画像処理装置に対して変更不可を通知することを特徴とする請求項1乃至12のいずれかに記載の画像処理システム。
  14. 他の画像処理装置とネットワークを介して接続される画像処理装置であって、
    ユーザーが操作可能な操作画面を表示する表示手段と、
    ユーザーによる音声の入力を受け付ける音声入力手段と、
    前記操作画面に音声入力用ワードを設定する設定手段と、
    前記音声入力手段によって受け付けられる音声が、前記設定手段により設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う操作反映手段と、
    を備え、
    前記設定手段は、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とする画像処理装置。
  15. デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    ユーザーによる音声操作指示を受け付ける音声操作指示受付手段と、
    を更に備え、
    前記設定手段は、前記音声操作指示受付手段によって音声操作指示が受け付けられた場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項14に記載の画像処理装置。
  16. デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    自機の周囲に存在するユーザーを検知して該ユーザーとの距離を測定する距離測定手段と、
    前記距離測定手段によってユーザーとの距離が測定された場合に、前記他の画像処理装置がユーザーとの距離を測定した距離情報を取得し、自機とユーザーとの距離が最も近いか否かを判別する距離判別手段と、
    を更に備え、
    前記設定手段は、前記距離判別手段によって自機とユーザーとの距離が最も近いと判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項14に記載の画像処理装置。
  17. デフォルトの音声入力用ワードを含む複数種類の音声入力用ワードを記憶する記憶手段と、
    前記音声入力手段によって受け付けられる音声の音量を検知する音量検知手段と、
    前記音量検知手段によって音量が検知された場合に、前記他の画像処理装置が検知した音量情報を取得し、自機で検知された音量が最大音量であるか否かを判別する音量判別手段と、
    を更に備え、
    前記設定手段は、前記音量判別手段によって自機で検知された音量が最大音量であると判別された場合に、前記デフォルトの音声入力用ワードを前記操作画面に設定すると共に、前記他の画像処理装置に対して前記デフォルトの音声入力用ワードとは異なる音声入力用ワードを設定させることを特徴とする請求項14記載の画像処理装置。
  18. 前記デフォルトの音声入力用ワードは、前記操作画面においてユーザーが操作可能な操作項目名と同一のワードであることを特徴とする請求項15乃至17のいずれかに記載の画像処理装置。
  19. 他の画像処理装置とネットワークを介して接続される画像処理装置において実行されるプログラムであって、
    前記画像処理装置は、
    ユーザーが操作可能な操作画面を表示する表示手段と、
    ユーザーによる音声の入力を受け付ける音声入力手段と、
    を備え、
    前記プログラムは、前記画像処理装置に、
    前記操作画面に音声入力用ワードを設定する第1ステップと、
    前記音声入力手段によって受け付けられる音声が、前記第1ステップにおいて設定された音声入力ワードに一致する場合に、前記操作画面に対する音声操作であると判定し、当該音声操作に基づく処理を行う第2ステップと、
    を実行させ、
    前記第1ステップは、前記他の画像処理装置とは異なる音声入力用ワードを前記操作画面に設定することを特徴とするプログラム。
JP2017223356A 2017-11-21 2017-11-21 画像処理システム、画像処理装置及びプログラム Pending JP2019096978A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017223356A JP2019096978A (ja) 2017-11-21 2017-11-21 画像処理システム、画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017223356A JP2019096978A (ja) 2017-11-21 2017-11-21 画像処理システム、画像処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2019096978A true JP2019096978A (ja) 2019-06-20

Family

ID=66973146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017223356A Pending JP2019096978A (ja) 2017-11-21 2017-11-21 画像処理システム、画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2019096978A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027155A (ja) * 2018-08-10 2020-02-20 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2021015246A (ja) * 2019-07-16 2021-02-12 キヤノン株式会社 情報処理システム、情報処理装置、情報処理方法
JP2021033001A (ja) * 2019-08-22 2021-03-01 コニカミノルタ株式会社 画像形成システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027155A (ja) * 2018-08-10 2020-02-20 コニカミノルタ株式会社 画像処理装置及びプログラム
JP7091925B2 (ja) 2018-08-10 2022-06-28 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2021015246A (ja) * 2019-07-16 2021-02-12 キヤノン株式会社 情報処理システム、情報処理装置、情報処理方法
US11336780B2 (en) 2019-07-16 2022-05-17 Canon Kabushiki Kaisha Information processing system, information processing apparatus, and information processing method
JP7418076B2 (ja) 2019-07-16 2024-01-19 キヤノン株式会社 情報処理システム、情報処理装置、情報処理方法
JP2021033001A (ja) * 2019-08-22 2021-03-01 コニカミノルタ株式会社 画像形成システム
JP7375369B2 (ja) 2019-08-22 2023-11-08 コニカミノルタ株式会社 画像形成システム

Similar Documents

Publication Publication Date Title
US10298790B2 (en) Image-forming apparatus, system, information processing method and storage medium for causing an operation screen to be displayed based on display language information
JP7003720B2 (ja) 画像処理装置、画像処理装置の制御方法、およびプログラム
US20180191920A1 (en) Image processing apparatus, method for controlling image processing apparatus, and storage medium
JP2019096978A (ja) 画像処理システム、画像処理装置及びプログラム
JP2007142912A (ja) 操作パネルおよび操作パネルのカスタマイズシステム
JP2008123378A (ja) 情報処理装置、情報処理装置の制御方法、プログラム及び記憶媒体
JP7206881B2 (ja) 情報処理装置及びプログラム
JP7172551B2 (ja) 情報処理装置及びプログラム
US20200267268A1 (en) Image forming apparatus, display control method, and recording medium
JP2006155269A (ja) 音声ガイドシステムおよびその音声ガイド方法
JP2012203152A (ja) 制御装置、画像形成装置およびプログラム
JP2010061501A (ja) 複合機能システム及び複合機能処理方法
JP2008204443A (ja) 画像処理装置、画像処理装置の操作サポート方法
US10310775B2 (en) Job processing apparatus, method of controlling job processing apparatus, and recording medium for audio guidance
JP2018207186A (ja) 携帯端末および電子システム
JP2005269326A (ja) 画像形成装置及び情報処理方法
JP3780991B2 (ja) ネットワークシステム、電子機器、プログラム、記録媒体
US20120327441A1 (en) Scanners that display setting screens, image forming systems comprising such scanners, and methods for controlling such scanners
JP5754904B2 (ja) 印刷装置、印刷装置の制御方法、及びプログラム
JP6891660B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP5821600B2 (ja) 画像形成装置、設定方法および設定プログラム
JP2018205849A (ja) 携帯端末および電子システム
JP2021052220A (ja) 画像処理システム、音声応答処理方法及びプログラム
JP2020035210A (ja) 情報処理装置、その制御方法、プログラム、および情報処理システム
JP2024028829A (ja) 画像形成システム