JP7131350B2 - 画像処理システム、画像処理装置及びプログラム - Google Patents

画像処理システム、画像処理装置及びプログラム Download PDF

Info

Publication number
JP7131350B2
JP7131350B2 JP2018228803A JP2018228803A JP7131350B2 JP 7131350 B2 JP7131350 B2 JP 7131350B2 JP 2018228803 A JP2018228803 A JP 2018228803A JP 2018228803 A JP2018228803 A JP 2018228803A JP 7131350 B2 JP7131350 B2 JP 7131350B2
Authority
JP
Japan
Prior art keywords
image processing
voice
operation information
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018228803A
Other languages
English (en)
Other versions
JP2020092342A (ja
Inventor
長生 勝田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018228803A priority Critical patent/JP7131350B2/ja
Publication of JP2020092342A publication Critical patent/JP2020092342A/ja
Application granted granted Critical
Publication of JP7131350B2 publication Critical patent/JP7131350B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、画像処理システム、画像処理装置及びプログラムに関する。
従来、コピー、スキャン、ファックス、ドキュメント管理など様々な機能が備わった、複合機あるいはMFP(Multi-Function Peripherals)と呼ばれる画像処理装置が知られている。
近年では、ユーザーが音声によって操作可能な画像処理装置が知られている。画像処理装置には、例えばスマートスピーカーなどの機器が接続され、ユーザーがスマートスピーカーに音声を入力すると、スマートスピーカーの接続先のクラウドに音声入力信号が送信され、クラウドにおいて音声入力信号が文字列に変換され、画像処理装置は当該文字列に変換された操作情報に基づいて処理を実行することができる。
一方で、画像処理装置を、タブレット型コンピューターやスマートフォンなどの端末装置とネットワークを介してデータ通信可能に接続し、端末装置からの遠隔操作に基づいて画像処理装置に所定の処理を実行させる技術が普及している(例えば、特許文献1参照)。
端末装置を介して画像処理装置を音声操作したい場合には、端末装置のマイクを介して音声を入力すると、音声入力信号がインターネットを介してクラウドに送信されるため、同様に画像処理装置によって音声操作に基づく処理を実行させることができる。
特開2005-092368号公報
ユーザーは端末装置をオフィスに設置された画像処理装置など、使用頻度の高いものと常時接続させておくことが一般的である。しかし、出張などで遠く離れた場所に移動した場合には、出張先に設置された画像処理装置を使用することとなる。端末装置を介して出張先の画像処理装置を音声操作したい場合には、端末装置を当該出張先の画像処理装置と連携させる必要がある。しかし、出張先においても普段使用している画像処理装置の機能(例えば、アドレス帳機能)を使用したい場合や、出張先の画像処理装置に音声操作機能が搭載されていない場合などは、不便をきたす。
本発明は上記問題に鑑みてなされたものであって、端末装置を介した画像処理装置の音声操作の利便性を向上可能な画像処理システム、画像処理装置及びプログラムを提供することを課題とする。
上記課題を解決するため、請求項1に記載の画像処理システムは、
少なくとも、第1の画像処理装置と、ネットワークを介して前記第1の画像処理装置と通信可能な第2の画像処理装置と、ネットワークを介して前記第1の画像処理装置と通信可能な端末装置と、ユーザーの音声による操作情報を入力するための音声操作装置と、を備えた画像処理システムであって、
前記第1の画像処理装置は、
ユーザーの音声による操作情報を受け付ける第1の音声操作受付部と、
前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該第1の画像処理装置が実行する通常モード及び前記第2の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部と、
前記仲介モードに設定された場合おいて、前記第2の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部と、
前記通常モードに設定された場合において、前記端末装置と当該第1の画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部と、を備える
ことを特徴とする。
請求項2に記載の発明は、請求項1に記載の画像処理システムにおいて、
前記第1の画像処理装置は、
前記端末装置に、当該第1の画像処理装置に対する操作情報を入力するためのインターフェースを提供する提供部を備え、
前記第1の音声操作受付部は、前記インターフェースを介してユーザーの音声による操作情報を受け付ける
ことを特徴とする。
請求項3に記載の発明は、請求項1又は2に記載の画像処理システムにおいて、
前記モード設定部は、前記端末装置と当該第1の画像処理装置との間の距離が所定の距離以上である場合に、前記仲介モードに設定する
ことを特徴とする。
請求項4に記載の発明は、請求項1から3のいずれか一項に記載の画像処理システムにおいて、
前記指示部は、前記仲介モードに設定された場合において、前記操作情報に基づく処理のうち、前記第2の画像処理装置が有しない機能を要する場合に、当該処理のうち、前記第2の画像処理装置が有する機能によって実現可能なもののみの実行指示を行う
ことを特徴とする。
請求項5に記載の発明は、請求項1から4のいずれか一項に記載の画像処理システムにおいて、
前記第2の画像処理装置は、
ユーザーの音声による操作情報を受け付ける第2の音声操作受付部と、
前記指示部によって処理の実行の指示がなされた場合に、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する無効化部と、を備える
ことを特徴とする。
請求項6に記載の発明は、請求項5に記載の画像処理システムにおいて、
前記第1の画像処理装置は、
前記第2の画像処理装置に対して、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する指示を行う無効化指示部を備え、
前記無効化部は、前記指示部によって処理の実行の指示がなされた場合において、前記無効化指示部によって無効化を指示された場合に、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する
ことを特徴とする。
請求項に記載の発明は、請求項1から6のいずれか一項に記載の画像処理システムにおいて、
前記決定部は、前記端末装置と当該第1の画像処理装置との間の距離が所定の距離未満である場合に、前記音声操作装置を介してユーザーが入力した音声による操作情報に基づいた処理を実行することを決定する
ことを特徴とする。
請求項に記載の画像処理装置は、
少なくとも、ネットワークを介して第2の画像処理装置端末装置及び音声操作装置の各々と通信可能な画像処理装置であって、
ユーザーの音声による操作情報を受け付ける第1の音声操作受付部と、
前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該画像処理装置が実行する通常モード及び前記第2の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部と、
前記仲介モードに設定された場合おいて、前記第2の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部と、
前記通常モードに設定された場合において、前記端末装置と当該画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部と、を備える
ことを特徴とする。
請求項に記載のプログラムは、
少なくとも、ネットワークを介して他の画像処理装置端末装置及び音声操作装置の各々と通信可能な画像処理装置のコンピューターを、
ユーザーの音声による操作情報を受け付ける第1の音声操作受付部、
前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該画像処理装置が実行する通常モード及び前記他の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部、
前記仲介モードに設定された場合おいて、前記他の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部、
前記通常モードに設定された場合において、前記端末装置と当該画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部、
として機能させる。
本発明によれば、端末装置を介した画像処理装置の音声操作の利便性を向上可能な画像処理システム、画像処理装置及びプログラムを提供することができる。
画像処理システムの概略構成を示す図である。 画像処理装置のハードウェア構成の一例を示す図である。 端末装置のハードウェア構成の一例を示す図である。 音声操作装置のハードウェア構成の一例を示す図である。 クラウドサーバーのハードウェア構成の一例を示す図である。 ユーザーによる画像処理装置の音声操作の概念を示す図である。 モード設定処理における画像処理装置の動作を示すフローチャートである。 WebUIの一例を示す図である。 実行処理1における画像処理装置の動作を示すフローチャートである。 第1実施形態に係る画像処理システムの動作を示すラダーチャートである。 実行処理2における画像処理装置の動作を示すフローチャートである。 第2実施形態に係る画像処理システムの動作を示すラダーチャートである。 実行処理3における画像処理装置の動作を示すフローチャートである。
<第1実施形態>
以下、図面を参照して、本発明に係る画像処理システムの第1実施形態について説明する。なお、本発明は、図示例に限定されるものではない。
[画像処理システムの構成]
図1は、画像処理システム100の全体的な構成の例を示す図である。
画像処理システム100は、図1に示すように、画像処理装置1、端末装置2、音声操作装置3、クラウドサーバー4、及び通信回線5などによって構成される。本実施形態に係る画像処理システム100は、画像処理装置1として2台の画像処理装置1A及び画像処理装置1Bを備え、音声操作装置3として2台の音声操作装置3A及び音声操作装置3Bを備える。
まず、画像処理システム100の各装置を相互に接続する、通信回線5について説明する。
画像処理装置1、端末装置2及びクラウドサーバー4は、通信回線5を介してインターネットNに接続されている。通信回線5としては、公衆回線や専用線などが用いられ、LAN(Local Area Network)51、ルーター52、アクセスポイント53及び無線基地局54等を有する。
LAN51A及びLAN51Bは互いに遠く離れた場所に形成されたネットワークであり、ルーター52A及びルーター52Bは、それぞれLAN51AあるいはLAN51BをインターネットNに接続させる。
画像処理装置1AはLAN51Aに、画像処理装置1BはLAN51Bに接続されている。これにより、画像処理装置1A及び画像処理装置1Bは、インターネットNを介して相互に通信することが可能となっている。
アクセスポイント53A及びアクセスポイント53Bは、それぞれ無線クライアントをLAN51AあるいはLAN51Bに接続するための装置である。アクセスポイント53は無線LANに準拠しており、端末装置2の無線通信部21aと通信を行うことが可能である。即ち、端末装置2はアクセスポイント53を介してLAN51に接続される。なお、端末装置2は、アクセスポイント53A及びアクセスポイント53Bのいずれとも接続可能であり、各LAN51に接続された画像処理装置1と通信することができる。
なお、各画像処理装置1と端末装置2とは、後述する近距離無線通信部12a及び近距離無線通信部22bによって近距離無線通信をすることも可能である。
無線基地局54は、インターネットNに接続された、いわゆる携帯電話網と呼ばれる公衆回線の末端に位置し、携帯電話などのクライアントとの間で直接電波の送受信を行う屋外型の無線基地局装置である。無線基地局54は、端末装置2の携帯電話通信部21cと無線通信を行うことにより、端末装置2を、公衆回線を通じてインターネットNに接続させる。
なお、無線基地局54は全国各地に配置され、各々は光ファイバーなどの有線ケーブルによって通信可能に接続されている。したがって、セル方式の移動体通信を行う端末装置2は、移動しながら当該端末装置2が存在するエリアをカバーする無線基地局54が発する電波を順次利用することで、インターネットNに接続されることが可能である。
続いて、画像処理システム100を構成する各装置のハードウェア構成について説明する。
図2は、画像処理装置のハードウェア構成の一例を示す図である。
画像処理装置1は、スキャン、コピー、PCプリント、メール、ファックス、及びボックスなどのサービスを提供する。このような機能を有する画像処理装置は、一般に、複合機あるいはMFP(Multi-Function Peripherals)などと呼ばれる。
スキャンサービスは、後述する画像読取部13によって用紙上の画像を読み取って画像データを生成するサービスである。
コピーサービスは、画像読取部13によって読み取って得られた画像データに基づいて、画像形成部14により画像を用紙に印刷するサービスである。
PCプリントサービスは、パーソナルコンピューターやスマートフォンなどの端末装置2から受信した画像データに基づいて、画像形成部14によって画像を用紙に印刷するサービスである。PCプリントサービスは、ネットワークプリンティングあるいはネットワークプリントなどと呼ばれることもある。
メールサービスは、画像読取部13によって読み取って得られた画像データを、指定された電子メールアドレス宛に送信するサービスである。
ファックスサービスは、画像読取部13によって読み取って得られた画像データを、外部のファクシミリ端末に送信するサービスである。
ボックスサービスは、ユーザーごとにボックスあるいはパーソナルボックスなどと呼ばれる記憶領域を与えておき、各ユーザーが自分の記憶領域によって画像データなどを保存し管理するためのサービスである。ボックスは、パーソナルコンピューターにおけるフォルダ又はディレクトリに相当する。
画像処理装置1は、図2に示すように、制御部10、記憶部11、通信部12、画像読取部13、画像形成部14、操作部15及び表示部16等を備えて構成され、各部はバス17を介して接続されている。
制御部10は、CPU(Central Processing Unit)10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10cを備えて構成される。CPU10aは、記憶部11に記憶されている各種プログラムとの協働により各種処理を実行し、画像処理装置1の動作を統括的に制御する。
なお、画像処理装置1Aの制御部10は、第1の音声操作受付部、モード設定部、指示部、提供部、無効化指示部及び決定部として機能する。また、画像処理装置1Bの制御部10は、第2の音声操作受付部及び無効化部として機能する。
記憶部11は、HDD(Hard Disc Drive)やSSD(Solid State Drive)などによって構成された記憶装置であり、画像処理装置1の各部の動作を制御するためのプログラムや、Webブラウザーを実現するためのWebブラウザープログラム等が記憶されている。
さらに、記憶部11には、端末装置2の表示部25にWebUI(Web User Interface)を形成するためのアプリケーションプログラム等が記憶されている。なお、本実施形態においては、WebUIとは、画像処理装置1の表示部16に表示される表示画面が、Webブラウザーを介して端末装置2の表示部25に表示されることによって形成されるユーザーインターフェースを指すものとし、ユーザーがWebUIを操作することで、端末装置2を介してユーザーが画像処理装置1を遠隔的に操作することを可能となる
また、記憶部11には、後述する処理分担判定において用いられる処理分担テーブルが記憶されている。
なお、各プログラムは、必要に応じてRAM10bにロードされ、CPU10aによって実行される。
通信部12は、外部機器との間でデータ送受信を行うためのインターフェースであり、近距離無線通信部12a、ネットワーク通信部12b及び無線通信部12cを備えて構成される。
近距離無線通信部12aは、近距離無線通信の規格に基づく外部機器との通信に用いられる。本実施形態においては、近距離無線通信部12aは、Bluetooth(登録商標)の規格に対応し、音声操作装置3との通信に用いられるものとする。
ネットワーク通信部12bは、TCP/IP(Transmission Control Protocol/Internet Protocol)などのプロトコルによって、通信回線5に接続された外部機器との通信を行う場合に用いられる。
無線通信部12cは、無線LANの規格、即ちIEEE(Institute of Electrical Engineers)802.11の規格に基づく無線通信に用いられる。即ち、画像処理装置1は、アクセスポイント53を介してLAN51と接続されることが可能である。
なお、本実施形態においては、画像処理装置1は、ネットワーク通信部12bによってLAN51に接続されているものとする。
画像読取部13は、CCD(Charge Coupled Device)、プラテンガラス等を備えて構成され、プラテンガラスの上にセットされたシートに記されている画像をCCDにより読み取って画像データを生成する。
画像形成部14は、画像読取部13により読み取られた画像データのほか、ネットワーク通信部12b等を介して外部装置から受信した画像データに基づいて、用紙に画像を印刷する。なお、画像形成部14は、用紙にトナー画像を形成する電子写真方式であってもよいし、用紙に対してインクを吐出して画像を形成するインクジェット方式であってもよい。
操作部15は、いわゆるハードウェアキーボードであって、テンキー、スタートキー、ストップキー、およびファンクションキーなどによって構成される。
表示部16は、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等のモニタを備えて構成されており、ユーザーに対するメッセージを示す画面、ユーザーがコマンドまたは情報を入力するための画面、及び制御部10が実行した処理の結果を示す画面などを表示する。また、表示部16は、タッチされた位置を示す信号を制御部10へ送る。
図3は、端末装置2のハードウェア構成の一例を示す図である。
端末装置2は、画像処理装置1の上述の機能を遠隔的に使用するためのクライアントである。ユーザーは、ブラウザーを介してWebUIを端末装置2に表示させることで、上述した種々の画像処理装置1の機能を遠隔的に操作することができる。
端末装置2として、スマートフォン、またはタブレット型コンピューターなどの可搬型の装置が用いられる。
端末装置2は、図3に示すように、制御部20、通信部21、音声入力部22、音声出力部23、操作部24及び表示部25等を備えて構成され、各部はバス26を介して接続されている。また、端末装置2には、Webブラウザーなどのアプリケーションソフトウェアが搭載されている。
制御部20は、CPU20a、RAM20b、ROM20cを備えて構成される。
CPU20aは、ROM20cに記憶されている各種プログラムとの協働により各種処理を実行し、端末装置2の動作を統括的に制御する。
ROM20cには、文書作成用のアプリケーション(例えば、ワープロソフト)、メーラー及びスケジューラー等のアプリケーションプログラムが記憶されている。また、ROM20cには、Webブラウザーを実現するためのWebブラウザープログラム等が記憶されている。さらに、ROM20cには、WebUIを形成するためのアプリケーションプログラム等が記憶されている。
なお、各プログラムは、必要に応じてRAM20bにロードされ、CPU20aによって実行される。
通信部21は、外部機器との間でデータ送受信を行うためのインターフェースであり、無線通信部21a、近距離無線通信部21b、携帯電話通信部21cを備えて構成される。
無線通信部21aは、無線LANの規格、即ちIEEE802.11の規格に基づく無線通信に用いられる。即ち、無線クライアントとしての端末装置2は、アクセスポイント53を介してLAN51と接続されることが可能である。
近距離無線通信部21bは、近距離無線通信の規格に基づく外部機器との通信に用いられる。近距離無線通信部21bは、Bluetooth(登録商標)の規格に対応し、画像処理装置1との通信に用いられることが可能である。
携帯電話通信部21cは、無線基地局54との間で電波の送受信を行う。即ち、CDMA(Code Division Multiple Access)2000、W-CMDA(Wideband-CMDA)、又はLTE(Long Term Evolution)などの規格に基づいて、いわゆる携帯電話網と呼ばれる公衆回線を介して通信を行う。
音声入力部22は、マイクやACコンバーターなどを備えて構成され、ユーザーの音声による操作入力を受け付けると、音声入力信号をデジタルの音声入力信号に変換してCPU20aに出力する。
音声出力部23は、DAコンバーター、アンプ、スピーカーなどを備えて構成され、CPU20aから受信した音声出力信号をアナログの音声出力信号に変換して、スピーカーから音声を出力する。
操作部24は、いわゆるホーム画面に戻るためのボタン、音量を調整するためのボタン、及び電源のON/OFFを切り替えるためのボタンなどによって構成される。
表示部25は、画像処理装置1の表示部16と同様に、種々の画面を表示し、タッチされた位置を検知してCPU20aにその位置を通知する。なお、上述の通り、WebUIにより、端末装置2の表示部25を画像処理装置1の表示部16の代わりに使用することができる。
図4は、音声操作装置3のハードウェア構成の一例を示す図である。
音声操作装置3は、画像処理装置1の上述の機能を、ユーザーによる音声操作に基づいて実行させるための装置である。音声操作装置3として、例えば、スマートスピーカーが用いられる。ユーザーは、音声操作装置3に対して音声により指示を出すと、音声操作装置3に入力された音声指示が画像処理装置1に伝達されるため、画像処理装置1に上述した種々の機能を実行させることができる。
音声操作装置3は、図4に示すように、制御部30、通信部31、音声入力部32、音声出力部33及び操作部34等を備えて構成され、各部はバス35を介して接続されている。
制御部30は、CPU30a、RAM30b、ROM30cを備えて構成される。
CPU30aは、ROM30cに記憶されている各種プログラムとの協働により各種処理を実行し、音声操作装置3の動作を統括的に制御する。
ROM30cには、音声操作装置3の各部の動作を制御するためのプログラムが記憶されている。
なお、各プログラムは、必要に応じてRAM30bにロードされ、CPU30aによって実行される。
通信部31は、外部機器との間でデータ送受信を行うためのインターフェースであり、無線通信部31a、近距離無線通信部31bを備えて構成される。
無線通信部21aは、無線LANの規格、即ちIEEE802.11の規格に基づく無線通信に用いられる。即ち、無線クライアントとしての音声操作装置3は、アクセスポイント53を介してLAN51と接続されることが可能である。
近距離無線通信部31bは、近距離無線通信の規格に基づく外部機器との通信に用いられる。なお、本実施形態においては、近距離無線通信部21bはBluetooth(登録商標)の規格に対応し、音声操作装置3は、近距離無線通信部31bによって画像処理装置1と通信するものとする。
音声入力部32は、マイクやACコンバーターなどを備えて構成され、ユーザーの音声による操作入力を受け付けると、音声入力信号をデジタルの音声入力信号に変換してCPU30aに出力する。
音声出力部33は、DAコンバーター、アンプ、スピーカーなどを備えて構成され、CPU30aから受信した音声出力信号をアナログの音声出力信号に変換して、スピーカーから音声を出力する。
操作部34は、音量を調整するためのボタン、及び電源のON/OFFを切り替えるためのボタンなどによって構成される。
図5は、クラウドサーバー4のハードウェア構成の一例を示す図である。
クラウドサーバー4は、画像処理装置1から受信した音声入力信号を解析して、音声入力信号を文字列に変換する音声認識処理を実行する。さらに、クラウドサーバー4は、音声認識処理によって生成された文字列(コマンド)を、画像処理装置1に送信する。具体的には、クラウドサーバー4は、音声入力信号と文字列とを対応付けた辞書情報を保持しており、画像処理装置1から受信した音声入力信号の中から人の声の部分を抽出し、当該部分に含まれる信号を、辞書情報を参照して文字列に変換する。なお、クラウドサーバー4は、インターネットを介して取得した多数の人の声を分析し、不特定多数の声や発音の癖を学習する。したがって、端末装置2や音声操作装置3などの端末内にインストールされた音声認識アプリケーションソフトウェアを利用する場合に比べて、高精度で音声入力信号を文字列に変換することができる。
画像処理装置1は、クラウドサーバーから受信したコマンドに基づき、ユーザーから指示された処理を実行することができる。
クラウドサーバー4は、図5に示すように、制御部40、記憶部41及び通信部42等を備えて構成され、各部はバス43を介して接続されている。
制御部40は、CPU40a、RAM40b、ROM40cを備えて構成される。CPU40aは、記憶部41に記憶されている各種プログラムとの協働により各種処理を実行し、クラウドサーバー4の動作を統括的に制御する。また、CPU40aは、画像処理装置1から受信した音声入力信号を、記憶部41に記憶されている辞書情報などに基づいて文字列に変換する音声認識処理を実行する。
記憶部41は、HDD(Hard Disc Drive)やSSD(Solid State Drive)などによって構成された大容量記憶装置であり、クラウドサーバー4の各部の動作を制御するためのプログラムが記憶されている。また、記憶部41には、音声認識処理を実行するために必要な辞書情報などが記憶されている。
なお、各プログラムは、必要に応じてRAM40bにロードされ、CPU40aによって実行される。
通信部42は、外部機器との間でデータ送受信を行うためのインターフェースであり、ネットワーク通信部42aを備えて構成される。
ネットワーク通信部42aは、TCP/IPなどのプロトコルによって、通信回線5に接続された外部機器との通信を行う場合に用いられる。
[画像処理装置の音声操作]
以下、図面を用いて、本実施形態に係る画像処理システム100における、画像処理装置1の音声操作について説明する。なお、画像処理装置1は、表示部16に表示された表示画面上の操作(パネル操作)と、端末装置2又は音声操作装置3に音声を入力して行う操作(音声操作)と、のいずれによっても処理を実行することができる。
図6は、ユーザーによる画像処理装置1の音声操作の概念を示す図である。
図6においては、画像処理装置1Aはユーザー6の勤務先などに設置され、ユーザー6は日常的に画像処理装置1Aを利用しているものとする。一方で、画像処理装置1Bは、ユーザー6の出張先など勤務先から遠く離れた地に設置されているものとする。
図6(A)は、ユーザー6が勤務先において、画像処理装置1Aを音声操作する場合を示す。
ユーザー6は、画像処理装置1Aに接続された音声操作装置3Aに対して、音声によって指示を出す(図中I)。例えば、ユーザー6は画像のコピーを所望している場合、「コピーをしたい。」などのように発声する。
続いて、音声操作装置3Aは、ユーザー6の音声から音声入力信号を生成し、当該音声入力信号を画像処理装置1Aに送信する(図中II)。
画像処理装置1Aは、音声操作装置3から受信した音声入力信号を、インターネットNを介してクラウドサーバー4に送信する(図中III)。
クラウドサーバー4は、画像処理装置1Aから受信した音声入力信号を、音声認識処理によって文字列(コマンド)に変換し、コマンドを画像処理装置1Aに送信する(図中IV)。
画像処理装置1Aは、コマンドをクラウドサーバーから受信すると、ユーザー6からの指示が「コピーをすること」であると認識し、コピーを実行する。
また、ユーザー6は、端末装置2を介して画像処理装置1Aを音声操作することも可能である。
図6(B)は、ユーザー6の勤務先において、端末装置2を介した音声操作を実行する場合を示す。ユーザー6は、端末装置2をアクセスポイント53AによってLAN51Aに接続させると、端末装置2の表示部16にWebUIを形成させることができる。即ち、画像処理装置1Aの表示画面を端末装置2の表示部16に表示させ、端末装置2を介して画像処理装置1Aを操作することが可能となる。
まず、ユーザー6は、端末装置2に対して、音声によって指示を出す(図中I)。
続いて、端末装置2は、ユーザー6の音声から音声入力信号を生成し、当該音声入力信号を、通信回線5を介して画像処理装置1Aに送信する(図中II)。
画像処理装置1Aは、端末装置2から受信した音声入力信号を、インターネットNを介してクラウドサーバー4に送信する(図中III)。
クラウドサーバー4は、画像処理装置1Aから受信した音声入力信号を、音声認識処理によって文字列(コマンド)に変換し、コマンドを画像処理装置1Aに送信する(図中IV)。
画像処理装置1Aは、コマンドをクラウドサーバーから受信すると、ユーザー6から指示された処理を実行する。
なお、図6(C)に示すように、ユーザー6が勤務先で端末装置2を操作する場合において、端末装置2が無線基地局54Aを介してインターネットNと接続されているときであっても、同様に画像処理装置1Aに指示を出すことが可能である。即ち、ユーザー6が端末装置2に対して音声指示を出すと(図中I)、端末装置2は、公衆回線を通じてインターネットNに接続され、通信回線5を通じて画像処理装置1Aに対して音声入力信号を送信し(図中II)、画像処理装置1Aがクラウドサーバー4に音声入力信号を送信すると(図中III)、クラウドサーバーが音声入力信号をコマンドに変換して画像処理装置1Aに送信する(図中IV)ことにより、画像処理装置1Aが処理を実行することが可能となる。なお、無線基地局54Aは、画像処理装置1Aが配置されたエリア、即ちユーザー6の勤務先のエリアをカバー可能な無線基地局である。
次に、図6(D)に示すように、ユーザー6が出張先において画像処理装置1Aを遠隔操作する場合を説明する。
このとき、ユーザー6は、端末装置2をアクセスポイント53BによってLAN51Bに接続させると、インターネットNを介して画像処理装置1Aの表示画面を端末装置2の表示部16に表示させ、端末装置2を介して画像処理装置1Aを操作することが可能となる。
まず、ユーザー6は、端末装置2に対して、音声によって指示を出す(図中I)。
続いて、端末装置2は、ユーザー6の音声から音声入力信号を生成し、当該音声入力信号を、インターネットNを介して画像処理装置1Aに送信する(図中II)。
画像処理装置1Aは、端末装置2から受信した音声入力信号を、インターネットNを介してクラウドサーバー4に送信する(図中III)。
クラウドサーバー4は、画像処理装置1Aから受信した音声入力信号を、音声認識処理によって文字列(コマンド)に変換し、コマンドを画像処理装置1Aに送信する(図中IV)。
画像処理装置1Aは、コマンドをクラウドサーバーから受信すると、ユーザーから指示された処理を実行する。
なお、図6(E)に示すように、ユーザー6が出張先で端末装置2を操作する場合において、端末装置2が無線基地局54Bを介してインターネットNと接続されているときであっても、同様に画像処理装置1Aに指示を出すことが可能である。即ち、ユーザー6が端末装置2に対して音声指示を出すと(図中I)、端末装置2は、公衆回線を通じてインターネットNに接続され、通信回線5を通じて画像処理装置1Aに対して音声入力信号を送信し(図中II)、画像処理装置1Aがクラドサーバー4に音声入力信号を送信すると(図中III)、クラウドサーバーが音声入力信号をコマンドに変換して画像処理装置1Aに送信する(図中IV)ことにより、画像処理装置1Aが処理を実行することが可能となる。なお、無線基地局54Bは、画像処理装置1Bが配置されたエリア、即ちユーザー6の出張先のエリアをカバー可能な無線基地局である。
[モード設定処理]
続いて、画像処理装置1Aが実行するモード設定処理について説明する。モード設定処理は、端末装置2と画像処理装置1Aとの距離に基づいて、仲介モードあるいは通常モードのいずれかに設定する処理である。
上記したように、WebUIによって端末装置2を介して画像処理装置1Aが音声操作される場合において、ユーザーによって近距離から操作される場合(図6(B)又は(C)に相当)と、ユーザーによって遠隔地から操作される場合(図6(D)又は(E)に相当)とがある。近距離からの操作の場合、ユーザーは処理を画像処理装置1A自身によって実行させることを所望していると考えられる。一方で、遠隔地からの操作の場合、ユーザーが近くに設置された画像処理装置1Bによる実行を所望する可能性が高い。
したがって、画像処理装置1Aは、画像処理装置1Aと端末装置2との距離に基づいて、指示された処理を自身で実行する通常モードとするか、画像処理装置1Bによって実行させる仲介モードとするかを判断するものとする。
仲介モードに設定するか否かは、画像処理装置1Aの制御部10が、端末装置2と画像処理装置1Aとの距離が所定の距離以上であるか否かに基づいて判断する。所定の距離であるか否かの判断は、例えば画像処理装置1Aと端末装置2とが近距離無線通信を確立可能な距離であるか否かに基づくものとしてもよい。即ち、近距離無線通信を確立できない場合に、所定の距離以上であると判断することができる。あるいは、端末装置2はモバイルネットワークからの位置情報や、GPS(Global Positioning System)などの測位システムによって自身の位置を測位してられた位置情報を画像処理装置1Aに送信し、画像処理装置1Aは当該位置情報に基づいて端末装置2との距離を算出し、所定の距離以上であるか否かを判断するものとしてもよい。
そして、画像処理装置1Aは、算出された距離が所定の距離以上である場合に、仲介モードに設定する。一方で、所定の距離未満である場合には、通常モードに設定する。
図7は、モード設定処理における画像処理装置1Aの動作を示すフローチャートである。なお、モード設定処理は、画像処理装置1Aの制御部10と記憶部11に記憶されたプログラムとの協働により実現する。
モード設定処理においては、まず、画像処理装置1Aの制御部10は、端末装置2からの接続を確認すると(ステップS101)、端末装置2の位置情報を取得する(ステップS102)。
続いて、制御部10は、端末装置2の位置情報に基づいて当該端末装置2との距離を算出し、所定の距離以内であるか否かを判断する(ステップS103)。制御部10は、所定の距離以内であると判断すると(ステップS103:YES)、ステップS104に移行するが、所定の距離以内ではないと判断すると(ステップS103:NO)、ステップS105へと移行する。
ステップS104では、制御部10は通常モードに設定し、モード設定処理を終了する。
ステップS105では、制御部10は、仲介先の画像処理装置1の選択部を示したユーザーインターフェースを生成する。
図8は、端末装置2の表示部25に表示される表示画面S(ユーザーインターフェース)の一例を示す図である。図8に示すように、画像処理装置1Aは、表示画面Sに端末装置2が利用可能な画像処理装置1として画像処理装置1Bを示した選択部260を表示する。ユーザーは、表示部25上を操作して、利用する画像処理装置1として画像処理装置1Bを選択する。そして、画像処理装置1Aは、画像処理装置1BのIPアドレスや装置名などの識別情報を取得する。具体的には、画像処理装置1Aは通信可能な他の画像処理装置1と、当該画像処理装置1との識別情報とを対応付けたテーブルを予め保持しており、ユーザーにより指定された画像処理装置1Bの識別情報を、テーブルを参照して特定する。
なお、図8示すように、ユーザーが画像処理装置1に付与されたIPアドレスを選択部260に入力することによって、任意の画像処理装置1を選択させるものとしてもよい。
続いて、制御部10は、仲介先情報を取得したか否かを判断する(ステップS106)。仲介先情報とは、仲介先が選択されたことを示す情報と、当該仲介先の画像処理装置1の識別情報と、を含む情報である。制御部10は、取得していないと判断すると(ステップS106:NO)、ステップS106の処理を繰り返すが、取得したと判断すると(ステップS106:YES)、仲介先の画像処理装置1に接続し(ステップS107)、仲介モードに設定し(ステップS108)、モード設定処理を終了する。
[処理分担判定]
仲介モードに設定された場合、原則として画像処理装置1Bによって処理を実行させる。しかし、ユーザーが出張先に設置された画像処理装置1Bではなく、日常的に用いている画像処理装置1Aの機能を実行したい場合がある。例えば、画像処理装置1Aに保存されたアドレス帳に格納された宛先に対してメールを送信したい場合や、スキャンした文書を画像処理装置1Aに保存したい場合などは、画像処理装置1Bではなく画像処理装置1A自身が処理を実行する必要がある。
一方で、コピーやスキャンなどの機能は、ユーザーの近傍に設置されている画像処理装置1Bに実行させる必要がある。
したがって、画像処理装置1Aは、実行指示を受けた処理の内容に応じて、画像処理装置1A自身が実行する自己処理とするか、画像処理装置1Bに実行させる仲介先処理とするかを判断する。
具体的には、画像処理装置1Aは、端末装置2からの要求を受け付けると、各処理をいずれの画像処理装置1によって実行するかを定めた処理分担テーブルに基づいて、上記分類を行う。
例えば、ユーザーが画像読取部13によって読み取った画像データを指定した電子メールアドレス宛に送信する、ScanToEmail機能を利用する場合においては、画像処理装置1Aは、端末装置2に表示させるための宛先一覧を表示した表示画面を生成するが、ユーザーは普段から利用している画像処理装置1Aの記憶部11に記憶されている宛先一覧の利用を希望していると考えられる。したがって、宛先一覧の表示は画像処理装置1A自身が実行する処理に分類される。
一方で、スキャンは、ユーザーの近傍に存在する画像処理装置1Bの画像読取部13を用いて実行するべきであるため、画像処理装置1Bが実行する処理に分類される。
その他、画像処理装置1Aが実行する処理に分類される例としては、ボックスサービスを実行する際に、画像データを画像処理装置1Aの記憶領域に保存する場合、FAXサービス利用時に画像処理装置1Aが保有する宛先一覧を表示した表示画面を生成する場合などが想定される。
また、画像処理装置1Bが実行する処理に分類される例としては、コピーサービス、PCプリントサービス等のほか、HOLD、セキュアプリント、蓄積プリント等のように画像処理装置1の処理が不要な処理が挙げられ、この場合画像処理装置1Aから画像処理装置1Bに向けて選択されたファイルのプリント指示を行い、画像処理装置1Bが当該機能を実行することが想定される。
[画像処理システムの動作]
以下、図面を参照して画像処理システム100の具体的な動作を説明する。なお、以下の説明では、ユーザーが音声操作装置3ではなく、端末装置2を介して、即ちWebUIを利用して画像処理装置1Aを操作することを前提としている。
まず、端末装置2から要求された処理の実行時における、画像処理装置1Aの動作について説明する。
図9は、画像処理装置1Aが行う実行処理1を示すフローチャートである。なお、実行処理1は、画像処理装置1Aの制御部10と記憶部11に記憶されたプログラムとの協働により実現する。
まず、画像処理装置1Aの制御部10は、表示画面を表示するためのデータを生成する(ステップS201)。
続いて、制御部10は、ユーザーにより音声が端末装置2に入力されたか否かを判断する(ステップS202)。制御部10は、音声が入力されていないと判断すると(ステップS202:NO)、ステップS203に移行するが、入力されたと判断すると(ステップS202:YES)、ステップS204に移行する。
ステップS203では、制御部10は、パネル操作があったか否かを判断し、パネル操作があったと判断すると(ステップS203:YES)、ステップS206に移行するが、パネル操作がなかったと判断すると(ステップS203:NO)、ステップS202に戻る。
ステップS204では、制御部10は、音声入力信号をクラウドサーバー4に送信して音声を文字列(コマンド)に変換、即ち音声-指示変換を実行させる。
続いて、制御部10は、クラウドサーバー4から受信したコマンドに基づいて、入力された音声が音声操作であるか否かを判断する(ステップS205)。音声操作ではないと判断した場合(ステップS205:NO)、ステップS202に戻るが、音声操作であると判断した場合(ステップS205:YES)、ステップS206に移行する。
ステップS206では、制御部10は、仲介モードに設定されているか否かを判断する。制御部10は、仲介モードには設定されていない、即ち通常モードに設定されていると判断すると(ステップS206:NO)、要求された処理を全て自己処理し(ステップS207)、実行処理1を終了する。
一方で、制御部10は、仲介モードであると判断すると(ステップS206:YES)、ステップS208へ移行する。
ステップS208では、制御部10は、処理分担判定を実行する。処理分担判定とは、上述したように、処理分担テーブルを参照して処理の分類を行う動作である。
制御部10は、処理分担判定の結果、仲介先の画像処理装置1に実行させる処理が存在するか否かを判断する(ステップS209)。制御部10は、仲介先の画像処理装置1が実行する処理が存在すると判断すると(ステップS209:YES)、ステップS210へと移行するが、存在しないと判断すると(ステップS209:NO)、ステップS207に移行する。
ステップS210においては、制御部10は、自己処理を実行し、続いて仲介先の画像処理装置1に処理を実行させる(ステップS211)。なお、ステップS210の処理とステップS211の処理とは、逆の順であってもよい。
制御部10は、処理を終了したか否かを判断し(ステップS212)、終了していないと判断すると(ステップS212:NO)、ステップS210へと戻るが、終了したと判断すると(ステップS212:YES)、実行処理1を終了する。
続いて、図10のラダーチャートを用いて、画像処理システム100を構成する各装置の動作を説明する。なお、図10においては、仲介モードに設定され、かつすべての処理が仲介先処理に分類されるものとする。
まず、ユーザー6が端末装置2を操作してWebブラウザーを開くと(T101)、端末装置2は、画像処理装置1AのWebUIに接続する(T102)。
続いて、画像処理装置1Aは表示画面を表示するためのデータを生成し、当該データを端末装置2に送信する(T103)。
端末装置2は、表示画面のデータを受信すると、表示部25に表示画面を表示させる(T104)。
ユーザー6が端末装置2に対して音声入力すると(T105)、端末装置2は、音声入力信号を画像処理装置1Aに送信する(106)。
画像処理装置1Aは、音声入力信号を受信すると、当該音声入力信号をクラウドサーバー4に送信する(T107)。
クラウドサーバー4は、音声入力信号を受信すると、音声-指示変換を行い(T108)、音声入力信号を文字列に変換して生成されたコマンドを画像処理装置1Aに送信する(T109)。
画像処理装置1Aは、コマンドを受信すると、モード設定処理を実行する(T110)。モード設定処理は、図8に示した処理であり、ここでは仲介モードに設定されるものとする。続いて、画像処理装置1Aは、処理分担判定を行う(T111)。処理分担判定は、上記したように処理分担テーブルに基づいて自己処理あるいは仲介先処理に分類する処理であり、ここではすべて仲介先処理に分類されるものとする。
次いで、画像処理装置1Aは、仲介先である画像処理装置1Bに仲介先処理実行のコマンドを送信する(T112)。コマンドの送信は、例えばコピーの実行を指示する場合、http:///<画像処理装置1BのIPアドレス>/<COPY>…といった形式で行う。
画像処理装置1Bは、コマンドを受信すると、仲介先処理を実行し(T113)、完了すると終了通知を画像処理装置1Aに送信する(T114)。
画像処理装置1Aは、終了通知を受信すると、終了通知画面を生成するためのデータを端末装置2に送信する(T115)。
端末装置2は、終了通知画面データを受信すると、終了通知画面を表示部25に表示させる(T116)。
以上により、処理を終了する。
なお、上記の例では、仲介モードに設定され、かつすべての処理が仲介先処理に分類されるものとしたが、仲介モードに設定され、かつ画像処理装置1Aの自己処理及び仲介先処理の両方を含む場合は、T111の処理分担判定の後に自己処理を実行し、自己処理及び仲介先処理の両方が終了した時点で終了通知画面データを端末装置2に送信する。また、通常モードに設定された場合には、T110のモードの設定処理の後に自己処理を実行し、自己処理が終了した時点で終了通知画面データを端末装置2に送信する。
以上説明したように、本実施形態に係る画像処理システム100においては、端末装置2を介して画像処理装置1Aに音声による操作情報が入力された場合に、画像処理装置1Aは通常モード及び仲介モードのいずれかに設定し、仲介モードにおいては、画像処理装置1Bに対して操作情報に基づく処理の実行指示を行う。また、画像処理装置1Aと端末装置2との間の距離が所定の距離以上である場合に、仲介モードに設定する。
したがって、ユーザーが画像処理装置を遠隔操作する場合においても、WebUIを利用して端末装置2に対して音声入力することによって、画像処理装置1A及び画像処理装置1Bのいずれの機能も利用することができるため、ユーザーにとって利便性が高い。
また、画像処理装置1Aは、仲介モードに設定された場合において、操作情報に基づく処理の処理分担判定を行い、画像処理装置1Bが有する機能によって実現可能な処理のみを実行するように画像処理装置1Bに対して実行指示を行う。即ち、画像処理装置1A自身が実行すべき処理を画像処理装置1Aが自己処理するため、ユーザーの所望する処理を適当に実行することができる。
<第2実施形態>
以下、図面を参照して、本発明に係る画像処理システムの第2実施形態について説明する。なお、第1実施形態と同一の構成については、同一の符号を付して詳細な説明を省略する。
第2実施形態においては、画像処理装置1Aによって画像処理装置1Bに処理の実行指示がなされた場合には、画像処理装置1Bに接続された音声操作装置3Bからの音声操作を無効化することを特徴とする。
図6(D)及び(E)に示したように、ユーザー6が画像処理装置1Bの近傍で、端末装置2に対して音声入力を行っているとき、音声操作装置3Bが動作中であると、音声操作装置3Bにも音声が入力されうる。音声操作装置3Bは画像処理装置1Bと紐づけられているため、音声操作装置3Bに誤って音声が入力されると、これに基づいて画像処理装置1Bが処理を実行してしまう誤動作が生じる。したがって、仲介モードに設定されている場合には、画像処理装置1Bが音声操作装置3Bを通した音声操作によっては作動しないように、音声操作装置3Bを無効化する。
図11は、画像処理装置1Aが行う実行処理2を示すフローチャートである。なお、実行処理2は、画像処理装置1Aの制御部10と記憶部11に記憶されたプログラムとの協働により実現する。
ステップS301~S307の処理は、図9のステップS201~207の処理と同一であるため、説明を省略する。
ステップS306において、制御部10は、仲介モードであると判断すると(ステップS306:YES)、画像処理装置1Bに対して、音声操作装置3Bの音声操作機能を無効化する、即ち音声操作装置3Bから受信した音声入力信号を無視する、あるいは音声操作装置3Bからの音声入力信号を受信しないよう指示を出す(ステップS308)。
ステップS309~313の処理は、図9のステップS208~S212の処理と同一であるため、詳細な説明を省略する。
ステップS313において、制御部10は、処理を終了したと判断すると(ステップS313:YES)、画像処理装置1Bに対して、音声操作装置3Bを介した音声操作を有効化するよう指示を出す(ステップS314)。
以上により、実行処理2を終了する。
続いて、図12のラダーチャートを用いて、画像処理システム100を構成する各装置の動作を説明する。なお、図12においては、仲介モードに設定され、かつすべての処理が仲介先処理に分類されているものとする。
T201~T211の処理は、図10のT101~T111の処理と同一であるため、説明を省略する。
画像処理装置1Aは、クラウドサーバー4からコマンドを受信すると、画像処理装置1Bに対して、音声操作装置3Bの音声操作機能をOFFにするようコマンドを送信する(T212)。音声操作機能OFFのコマンドの送信は、例えば、http:///<画像処理装置1BのIPアドレス>/<音声操作機能OFFの指示>…といった形式で行う。
画像処理装置1Bは、音声操作機能OFFのコマンドを受信すると、音声操作装置3Bの音声操作機能をOFFにし(T213)、画像処理装置1Aに対して完了通知を送信する(T214)。
画像処理装置1Aは、完了通知を受信すると、画像処理装置1Bに対して仲介先処理実行のコマンドを送信する(T215)。
画像処理装置1Bは、画像処理装置1Aから仲介先処理実行のコマンドを受信すると、仲介先処理を実行する(T216)
T217~T219の処理は、図10のT114~T116の処理と同一であるため、説明を省略する。
以上説明したように、本実施形態に係る画像処理システム100においては、画像処理装置1Aから画像処理装置1Bに対して処理の実行指示がなされた場合において、音声操作装置3Bに対して音声が入力された場合には、音声操作装置3Bに対する音声操作を無効化する。したがって、音声操作装置3Bに対する音声入力に基づく誤動作を未然に防止し、ユーザーが意図する処理を確実に実行することができる。
なお、上記の説明では、音声操作装置3Bの音声操作機能無効化は、画像処理装置1Aからの指示に基づくものとしたが、これに限定されない。画像処理装置1Aから仲介先処理実行のコマンドを受信した場合に、画像処理装置1Bが自ら無効化を判断するものとしてもよい。ただし、誤動作を未然に防ぐためにはできるだけ早い段階で無効化する必要があるため、上記説明のように、予め画像処理装置1Aによって無効化を指示する方が望ましい。
<第3実施形態>
以下、図面を参照して、本発明に係る画像処理システムの第3実施形態について説明する。なお、第1実施形態と同一の構成については、同一の符号を付して詳細な説明を省略する。
第3実施形態においては、通常モードに設定された場合において、ユーザーと画像処理装置1Aとの距離に基づいて、端末装置2あるいは音声操作装置3Aのいずれを介した音声操作にしたがって処理を実行するかを判断する。
ユーザーが画像処理装置1Aの付近にいる場合、画像処理装置1Aを音声操作するとき、端末装置2及び音声操作装置3Aのいずれを介した音声操作を行うこともできる。このとき、通常は端末装置2ではなく音声操作装置3Aを利用することを想定して設計されているため、ユーザーが音声操作装置3Aを操作可能な場所にいるときは、音声操作装置3Aを利用することが望ましい。
したがって、画像処理装置1Aが所定の距離未満であるときには、音声操作装置3Aを介した音声操作に基づく処理を実行するものとし、所定の距離以上であるときには、端末装置2を介した音声操作に基づいて処理を実行するものとする。なお、所定の距離未満であるか否かの判断は、例えば端末装置2の位置情報に基づいて、画像処理装置1Aとの距離が予め設定された所定の距離未満であるか否かを判断する方法が挙げられる。
図13は、画像処理装置1Aが行う実行処理3を示すフローチャートである。なお、実行処理3は、画像処理装置1Aの制御部10と記憶部11に記憶されたプログラムとの協働により実現する。
まず、画像処理装置1Aの制御部10は、表示画面を表示するためのデータを生成する(ステップS401)。
続いて、制御部10は、ユーザーにより端末装置2から音声が入力されたか否かを判断する(ステップS402)。制御部10は、音声が入力されていないと判断すると(ステップS402:NO)、ステップS403に移行するが、入力されたと判断すると(ステップS402:YES)、ステップS406に移行する。
ステップS403では、制御部10は、表示部25が操作された、即ちパネル操作があったか否かを判断し、パネル操作があったと判断すると(ステップS403:YES)、ステップS404に移行するが、パネル操作がなかったと判断すると(ステップS403:NO)、ステップS402に戻る。
ステップS404では、制御部10は、通常モードであるか否かを判断する。制御部10は、通常モードであると判断すると(ステップS404:YES)、自己処理を実行して制御を終了するが(ステップS405)、通常モードではない、即ち仲介モードであると判断すると(ステップS404:NO)、ステップS417に移行する。
ステップS406では、制御部10は、音声入力信号をクラウドサーバー4に送信して音声を文字列に変換、即ち音声-指示変換を実行させる。
次いで、制御部10は、クラウドサーバー4から受信したコマンドを、コマンドAとしてRAM10bなどの一時的な記憶領域に記憶する(ステップS407)。
続いて、制御部10は、入力された音声が、音声操作であるか否かを判断する(ステップS408)。音声操作ではないと判断した場合(ステップS408:NO)、ステップS402に戻るが、音声操作であると判断した場合(ステップS408:YES)、ステップS409に移行する。
ステップS409では、制御部10は、仲介モードであるか否かを判断する。制御部10は、仲介モードであると判断すると(ステップS409:YES)、ステップS417に移行するが、仲介モードではない、即ち通常モードであると判断すると(ステップS409:NO)、ステップS410に移行する。
ステップS410では、制御部10は、音声操作装置3Aから音声が入力されたか否かを判断する(ステップS410)。制御部10は、音声が入力されたと判断すると(ステップS410:YES)、クラウドサーバー4によって音声-指示変換をさせ(ステップS411)、クラウドサーバー4から受信したコマンドを、コマンドBとしてRAM10bなどの一時的な記憶領域に記憶する(ステップS412)。
続いて、制御部10は、コマンドAとコマンドBとが一致するか否かを判断する(ステップS413)。制御部10は、一致すると判断すると(ステップS413:YES)、コマンドAを実行、即ち端末装置2からの指示に従って処理を実行する(ステップS414)。
一方で、制御部10は、一致しないと判断すると(ステップS413:NO)、端末装置2と画像処理装置1Aとが所定の距離未満であるか否かを判断する(ステップS415)。制御部10は、所定の距離未満ではない、即ちユーザーが画像処理装置1Aから少し離れた場所にいると判断すると(ステップS415:NO)、コマンドAの処理を実行する(ステップS414)。即ち、端末装置2からの指示がユーザーの意思を反映させたものであると考えられるため、当該指示に基づいて処理を実行する。
制御部10は、所定の距離未満である、即ちユーザーが画像処理装置1Aの付近にいると判断すると(ステップS415:YES)、コマンドBの処理を実行する(ステップS416)。即ち、端末装置2及び音声操作装置3Aの両方から指示がされた場合には、音声操作装置3Aからの指示を優先させる。
なお、ステップS417~S421及びS422の処理は、図9のステップS208~S212及びS207の処理と同一であるため、説明を省略する。
以上により、実行処理3を終了する。
なお、上記の説明では、端末装置2と画像処理装置1Aとの間の距離に基づいて判断するものとしたが、これに限らず、ユーザーが画像処理装置1Aをパネル操作することで、端末装置2及び音声操作装置3Aのいずれを介した音声操作を行うかを選択するものとしてもよい。
以上説明したように、本実施形態に係る画像処理システム100においては、通常モードに設定された場合において、画像処理装置1Aと端末装置2との距離が所定の距離以下である場合に、音声操作装置3Aに対して入力された操作情報に基づいて処理を実行する。また、端末装置2に入力された操作情報と音声操作装置3Aに対して入力された操作情報とが異なる場合には、前者を優先して実行する。したがって、操作情報を混同する恐れがなく、ユーザーが意図する処理を確実に実行することができる。
[他の実施形態]
以上、本発明に係る実施形態に基づいて具体的に説明したが、画像処理システムを構成する各装置の細部構成及び各装置の細部動作に関しても、本発明の趣旨を逸脱することのない範囲で適宜変更可能である。
例えば、上記実施形態においては、画像処理装置1Aは単一の画像処理装置1Bとの間で仲介モードに設定するものとしたが、これに限らず、複数の他の画像処理装置1との間で仲介モードに設定し、各々の画像処理装置に対して実行指示を行うものとしても構わない。
また、上記の説明では、本発明に係るプログラムのコンピューター読み取り可能な媒体としてHDDや半導体の不揮発性メモリー等を使用した例を開示したが、この例に限定されない。その他のコンピューター読み取り可能な媒体として、CD-ROM等の可搬型記録媒体を適用することが可能である。また、本発明に係るプログラムのデータを、通信回線を介して提供する媒体として、キャリアウエーブ(搬送波)も適用される。
100 画像処理システム
1A 画像処理装置(第1の画像処理装置)
10(1A) 制御部(第1の音声操作受付部、モード設定部、指示部、提供部、無効化指示部、決定部)
11 記憶部
12 通信部
12a 近距離無線通信部
12b ネットワーク通信部
12c 無線通信部
15 操作部
16 表示部
1B 画像処理装置(第2の画像処理装置、他の画像処理装置)
10(1B) 制御部(第2の音声操作受付部、無効化部)
2 端末装置
21 通信部
21a 無線通信部
21b 近距離無線通信部
22 音声入力部
24 操作部
25 表示部
3 音声操作装置
31 通信部
31a 無線通信部
31b 近距離無線通信部
32 音声入力部
4 クラウドサーバー
41 記憶部
42 通信部
42a ネットワーク通信部
5 通信回線
51 LAN
52 ルーター
53 アクセスポイント
54 無線基地局
N インターネット

Claims (9)

  1. 少なくとも、第1の画像処理装置と、ネットワークを介して前記第1の画像処理装置と通信可能な第2の画像処理装置と、ネットワークを介して前記第1の画像処理装置と通信可能な端末装置と、ユーザーの音声による操作情報を入力するための音声操作装置と、を備えた画像処理システムであって、
    前記第1の画像処理装置は、
    ユーザーの音声による操作情報を受け付ける第1の音声操作受付部と、
    前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該第1の画像処理装置が実行する通常モード及び前記第2の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部と、
    前記仲介モードに設定された場合おいて、前記第2の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部と、
    前記通常モードに設定された場合において、前記端末装置と当該第1の画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部と、を備える
    ことを特徴とする画像処理システム。
  2. 前記第1の画像処理装置は、
    前記端末装置に、当該第1の画像処理装置に対する操作情報を入力するためのインターフェースを提供する提供部を備え、
    前記第1の音声操作受付部は、前記インターフェースを介してユーザーの音声による操作情報を受け付ける
    ことを特徴とする請求項1に記載の画像処理システム。
  3. 前記モード設定部は、前記端末装置と当該第1の画像処理装置との間の距離が所定の距離以上である場合に、前記仲介モードに設定する
    ことを特徴とする請求項1又は2に記載の画像処理システム。
  4. 前記指示部は、前記仲介モードに設定された場合において、前記操作情報に基づく処理のうち、前記第2の画像処理装置が有しない機能を要する場合に、当該処理のうち、前記第2の画像処理装置が有する機能によって実現可能なもののみの実行指示を行う
    ことを特徴とする請求項1から3のいずれか一項に記載の画像処理システム。
  5. 前記第2の画像処理装置は、
    ユーザーの音声による操作情報を受け付ける第2の音声操作受付部と、
    前記指示部によって処理の実行の指示がなされた場合に、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する無効化部と、を備える
    ことを特徴とする請求項1から4のいずれか一項に記載の画像処理システム。
  6. 前記第1の画像処理装置は、
    前記第2の画像処理装置に対して、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する指示を行う無効化指示部を備え、
    前記無効化部は、前記指示部によって処理の実行の指示がなされた場合において、前記無効化指示部によって無効化を指示された場合に、前記第2の音声操作受付部が受け付けたユーザーの音声による操作情報を無効化する
    ことを特徴とする請求項5に記載の画像処理システム。
  7. 前記決定部は、前記端末装置と当該第1の画像処理装置との間の距離が所定の距離未満である場合に、前記音声操作装置を介してユーザーが入力した音声による操作情報に基づいた処理を実行することを決定する
    ことを特徴とする請求項1から6のいずれか一項に記載の画像処理システム。
  8. 少なくとも、ネットワークを介して第2の画像処理装置端末装置及び音声操作装置の各々と通信可能な画像処理装置であって、
    ユーザーの音声による操作情報を受け付ける第1の音声操作受付部と、
    前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該画像処理装置が実行する通常モード及び前記第2の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部と、
    前記仲介モードに設定された場合おいて、前記第2の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部と、
    前記通常モードに設定された場合において、前記端末装置と当該画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部と、を備える
    ことを特徴とする画像処理装置。
  9. 少なくとも、ネットワークを介して他の画像処理装置端末装置及び音声操作装置の各々と通信可能な画像処理装置のコンピューターを、
    ユーザーの音声による操作情報を受け付ける第1の音声操作受付部、
    前記端末装置を介してユーザーが音声による操作情報を入力した場合に、当該操作情報に基づく処理を当該画像処理装置が実行する通常モード及び前記他の画像処理装置に実行させる仲介モードのうち、いずれか一方に設定するモード設定部、
    前記仲介モードに設定された場合おいて、前記他の画像処理装置に対して、前記操作情報に基づく処理の実行指示を行う指示部、
    前記通常モードに設定された場合において、前記端末装置と当該画像処理装置との間の距離に基づいて、前記端末装置を介してユーザーが入力した音声による操作情報及び前記音声操作装置を介してユーザーが入力した音声による操作情報のうち、いずれに基づいて処理を実行するかを決定する決定部、
    として機能させるためのプログラム。
JP2018228803A 2018-12-06 2018-12-06 画像処理システム、画像処理装置及びプログラム Active JP7131350B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018228803A JP7131350B2 (ja) 2018-12-06 2018-12-06 画像処理システム、画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018228803A JP7131350B2 (ja) 2018-12-06 2018-12-06 画像処理システム、画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020092342A JP2020092342A (ja) 2020-06-11
JP7131350B2 true JP7131350B2 (ja) 2022-09-06

Family

ID=71013181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018228803A Active JP7131350B2 (ja) 2018-12-06 2018-12-06 画像処理システム、画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7131350B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022030590A (ja) 2020-08-07 2022-02-18 株式会社リコー 管理装置、ネットワークシステムおよびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023636A (ja) 2004-07-09 2006-01-26 Canon Inc 画像形成装置
JP2010000651A (ja) 2008-06-19 2010-01-07 Konica Minolta Business Technologies Inc 画像形成装置
JP2014203024A (ja) 2013-04-09 2014-10-27 コニカミノルタ株式会社 制御装置、画像形成装置、端末装置、制御方法、および制御プログラム
JP2016126667A (ja) 2015-01-07 2016-07-11 コニカミノルタ株式会社 画像形成システム、画像形成装置、遠隔制御方法および遠隔制御プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023636A (ja) 2004-07-09 2006-01-26 Canon Inc 画像形成装置
JP2010000651A (ja) 2008-06-19 2010-01-07 Konica Minolta Business Technologies Inc 画像形成装置
JP2014203024A (ja) 2013-04-09 2014-10-27 コニカミノルタ株式会社 制御装置、画像形成装置、端末装置、制御方法、および制御プログラム
JP2016126667A (ja) 2015-01-07 2016-07-11 コニカミノルタ株式会社 画像形成システム、画像形成装置、遠隔制御方法および遠隔制御プログラム

Also Published As

Publication number Publication date
JP2020092342A (ja) 2020-06-11

Similar Documents

Publication Publication Date Title
US10917369B2 (en) Information processing apparatus, information processing system, and information processing method
JP5994313B2 (ja) 情報提供装置、伝送システムおよびプログラム
JP7071098B2 (ja) 音声制御システム、制御方法およびプログラム
JP6135055B2 (ja) 情報提供装置、伝送システムおよびプログラム
JP6704881B2 (ja) システム
JP7146379B2 (ja) 印刷方法、音声制御システムおよびプログラム
US20110261389A1 (en) Wireless communication system and control method thereof, image input/output apparatus and control method thereof, and storage medium
JP2006330576A (ja) 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体
JP2009194577A (ja) 画像形成装置、音声案内方法及び音声案内プログラム
JP4093251B2 (ja) 画像処理システムおよび画像処理装置
JP6052241B2 (ja) 処理装置、表示システム、表示方法、およびコンピュータプログラム
JP7131350B2 (ja) 画像処理システム、画像処理装置及びプログラム
JP6020056B2 (ja) 画像情報通信装置、画像情報通信システム、画像情報通信装置の制御方法、及び画像情報通信装置の制御プログラム
JP2008040963A (ja) 画像処理システムおよび画像処理装置
US11036441B1 (en) System and method for creation and invocation of predefined print settings via speech input
JP6344233B2 (ja) 画像形成システム、画像形成装置、遠隔制御方法および遠隔制御プログラム
JP7099124B2 (ja) 画像処理装置、画像処理システム及びプログラム
US9161192B2 (en) Storage medium storing address-information display program and communication controlling device
JP6531427B2 (ja) 処理システム、端末装置、処理装置、処理装置制御方法、およびコンピュータプログラム
JP7135022B2 (ja) システム
JP6319499B2 (ja) 情報提供装置、情報提供方法およびプログラム
JP2003274107A (ja) 画像形成装置
JP2024089782A (ja) 情報処理装置、情報処理装置の制御方法、プログラム及び画像形成システム
JP2023065045A (ja) 画像処理装置、システム、画像処理装置の制御方法およびプログラム
JP2004297485A (ja) 複合装置、その制御方法、その制御プログラム、及びその複合装置を含む情報通信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220808

R150 Certificate of patent or registration of utility model

Ref document number: 7131350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150