JP2021052220A - 画像処理システム、音声応答処理方法及びプログラム - Google Patents

画像処理システム、音声応答処理方法及びプログラム Download PDF

Info

Publication number
JP2021052220A
JP2021052220A JP2019171959A JP2019171959A JP2021052220A JP 2021052220 A JP2021052220 A JP 2021052220A JP 2019171959 A JP2019171959 A JP 2019171959A JP 2019171959 A JP2019171959 A JP 2019171959A JP 2021052220 A JP2021052220 A JP 2021052220A
Authority
JP
Japan
Prior art keywords
voice
unit
input
image forming
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019171959A
Other languages
English (en)
Inventor
長生 勝田
Takeo Katsuda
長生 勝田
祐介 御子柴
Yusuke Mikoshiba
祐介 御子柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019171959A priority Critical patent/JP2021052220A/ja
Publication of JP2021052220A publication Critical patent/JP2021052220A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】画像形成部におけるジョブの開始前及び後のいずれにおいても、ユーザーに音声による応答を行えるようにする。【解決手段】本発明の一側面の画像処理システム100の音声処理部3は、画像形成装置1の制御部12に出力した指示に対する応答情報が制御部12から入力された場合に、応答情報に対応する音声情報を音声入出力部2に出力する。制御部12は、画像形成部13によるジョブの開始後に、画像形成部13での処理に関する通知の指示を音声情報処理部14に出力し、音声情報処理部14は、指示に対応する音声情報を音声出力部15に出力する。【選択図】図2

Description

本発明は、画像処理システム、音声応答処理方法及びプログラムに関する。
従来、用紙に画像を形成する画像形成装置において、印刷中のエラーの発生や印刷の終了を、音声のメッセージによってユーザーに伝える機能を有するものがある。
例えば、特許文献1には、各ユーザID及び各イベントに対応した音声データが登録される通知音声サーバーと、通知音声サーバーから送信される音声データを記憶する記憶部を有する画像形成装置と、を備えた印刷システムが記載されている。特許文献1のデータ識別部は、プリンタエンジン部による印刷が正常に終了した場合、印刷終了のイベントに対応する印刷終了音声データを記憶部から読み出して音声再生部に送る。そして、音声再生部は印刷終了音声データを音声化し、音声化された印刷終了音声データをスピーカー部が再生する。
特開2002−051173号公報
ところで、近年、画像形成装置に対して音声入力による操作(以下、「音声操作」とも称する)が可能な画像処理システムが増えている。このような画像形成システムにおいて、ユーザーから発せられた音声は、音声認識機能を備えるスマートスピーカー等よりなる音声入出力装置に入力される。音声入出力装置では、入力された音声が音声データに変換され、該音声データは、クラウド等に設けられた音声処理サーバーに送信される。そして、音声処理サーバーから画像形成装置に対して、音声入出力装置に入力された音声に対応する指示(コマンド)が送信される。
音声入出力装置に入力された音声操作に対して、音声による応答(以下、「音声応答」とも称する)が行われる場合、音声処理サーバーから音声入出力装置に対して、応答音声の情報が送信される。そして、該応答音声の情報に対応する音声が、音声入出力装置から出力される。
しかしながら、音声処理サーバーにおける上述した音声応答処理は、音声入出力装置から入力された音声に対応する指示を画像形成装置に送信した時点で終了する。したがって、音声操作に基づくジョブが画像形成装置で開始された後に、画像形成装置内でエラーが発生した場合、該エラーをユーザーに音声で通知することはできなかった。また、画像形成装置におけるジョブの実行の終了を、音声によってユーザーに知らせることもできなかった。
本発明はこのような状況に鑑みてなされたものである。本発明の目的は、画像形成部におけるジョブの開始前及び後のいずれにおいても、ユーザーに音声による応答を行えるようにすることを目的とする。
上記課題を解決するため、本発明の一側面を反映した画像処理システムは、画像形成部と、音声入出力部と、音声処理部と、制御部と、音声情報処理部と、音声出力部と、を備える。画像形成部は、記録材に画像を形成する。音声入出力部は、画像形成部が実行するジョブに関する指示として入力された音声を音声情報に変換して出力するとともに、入力された音声情報に対応する音声を放音する。音声処理部は、音声入出力部から入力される音声情報に対して音声解析処理を行い、音声解析処理の結果と予め対応付けられたジョブに関する指示を制御部に出力する。制御部は、ジョブを画像形成部に実行させる制御を行う。音声情報処理部は、制御部から入力される指示に対応する音声情報を生成する。音声出力部は、音声情報処理部から入力される音声情報に対応する音声を放音する。そして、音声処理部は、指示に対する応答情報が制御部から入力された場合に、応答情報に対応する音声情報を音声入出力部に出力する。制御部は、画像形成部によるジョブの開始後に、画像形成部での処理に関する通知の指示を音声情報処理部に出力する。
本発明によれば、画像形成部におけるジョブの開始前及び後のいずれにおいても、画像形成部が実行するジョブに関する指示を行ったユーザーに対して、音声による応答を行えるようになる。なお、上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の第1の実施形態に係る画像処理システムの概略構成図である。 本発明の第1の実施形態に係る画像処理システムに含まれる画像形成装置及び音声入出力装置の制御系の構成例を示すブロック図である。 本発明の第1の実施形態に係る音声指示に基づく画像処理システムの動作の例を示すシーケンス図である。 本発明の第1の実施形態に係る音声処理サーバーによる音声応答処理の手順の例を示すフローチャートである。 本発明の第1の実施形態に係る画像形成装置による音声応答処理の手順の例を示すフローチャートである。 本発明の第2の実施形態に係る音声操作への切り替え操作に基づく画像処理システムの動作の例を示すシーケンス図である。 本発明の第2の実施形態に係る画像形成装置による音声応答処理の手順の例を示すフローチャートである。 本発明の第2の実施形態に係る操作表示部の画面上における音声操作ボタンの形成例を示す図である。 本発明の第3の実施形態に係る音声操作及びパネル操作に基づく画像処理システムの動作の例を示すシーケンス図である。 本発明の第3の実施形態に係る音声処理サーバーによる音声応答処理の手順の例を示すフローチャートである。 本発明の第3の実施形態に係る画像形成装置による音声応答処理の手順の例を示すフローチャートである。
以下、本発明を実施するための形態例について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素は、同一の符号を付し、構成要素の重複説明は省略する。
<第1の実施形態>
[画像処理システムの構成]
まず、図1を参照して、本発明の第1の実施の形態に係る画像処理システムの構成について説明する。図1は、本発明の第1の実施形態に係る画像処理システム100の概要構成図である。
図1に示す画像処理システム100は、画像形成装置1と、音声入出力装置2(音声入出力部の一例)と、音声処理サーバー3(音声処理部の一例)とを備える。音声入出力装置2及び音声処理サーバー3間、並びに、音声処理サーバー3及び画像形成装置1間は、公衆交換電話網やIP(Internet Protocol)網などよりなるネットワークNを介して接続される。
画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能等を有するMFP(Multi-Functional Peripherals)で構成される。画像形成装置1は、不図示のプリンタコントローラー等から送信された画像データに基づいて用紙(記録材の一例)に画像形成を行い、該画像が形成された用紙を印刷物として出力する。本実施形態に係る画像形成装置1は、音声処理サーバー3から送信される音声情報を再生して、自身が有する音声出力部15(図2参照)から出力させる音声応答処理部14(音声情報処理部の一例:図2参照)を備える。
音声入出力装置2は、例えば、スマートスピーカーで構成され、不図示のマイクロフォン及びスピーカーを備える。音声入出力装置2は、マイクロフォンが集音した音声、例えば、ユーザーによって発話された操作指示を音声データ(以下、「音声情報」とも称する)に変換し、該音声情報を音声処理サーバー3に送信(出力)する。また、音声入出力装置2は、音声処理サーバー3から送信される音声情報を再生して、スピーカーから出力する。
音声処理サーバー3は、例えば、不図示のクラウド上に設けられ、その機能はクラウドアプリケーションサービスとして提供される。音声処理サーバー3は、音声入出力装置2から送信(入力)された音声情報に対して音声解析処理を行う。そして、音声処理サーバー3は、音声解析処理の結果に対応する、画像形成装置1へのコマンド(指示)や応答音声情報、通知音声情報などを記憶部313(図2参照)から抽出して、音声入出力装置2又は画像形成装置1に送信する。
応答音声情報は、音声入出力装置2へのユーザーの発話による操作指示(音声操作)に対する応答情報を伝える音声であり、通知音声情報は、エラーの発生やジョブの終了などの、画像形成装置1からの通知情報を伝える音声である。画像形成装置1へのコマンドには、例えば、印刷やコピー、スキャンなどのジョブの設定指示や、該ジョブの開始指示などがある。
本実施形態では、音声操作に基づいて行われたジョブの設定が終了した場合、ユーザーに音声による応答(通知を含む)を行う装置が、音声入出力装置2から画像形成装置1に切り替わる。具体的には、音声処理サーバー3から画像形成装置1に対してジョブの開始が指示されるまでの間、すなわち、ジョブに関する設定が行われている間においては、ユーザーに対する音声による応答は、音声入出力装置2から行われる。一方、音声処理サーバー3から画像形成装置1に対してジョブの開始が指示された後においては、ユーザーに対する音声による応答は、画像形成装置1から行われる。例えば、禁則等の設定ミスが見つかった場合の音声による応答や、動作中の不具合(エラー)についての音声による通知などは、画像形成装置1から行われる。
なお、本実施形態では、音声処理サーバー3がクラウド上に設けられる例を挙げたが、本発明はこれに限定されない。音声処理サーバー3は、画像形成装置1内に設けられてもよく、不図示のオンプレミスサーバー等の内部に設けられてもよい。また、音声処理サーバー3と画像形成装置1との間に、ジョブに関する音声情報を音声処理サーバー3から受信して保存したり画像形成装置1にジョブを渡したりする中継サーバー等が設けられてもよい。
[画像処理システムを構成する画像形成装置及び音声入出力装置の制御系の構成]
次に、図2を参照して、画像処理システム100に含まれる画像形成装置1及び音声入出力装置2の制御系の構成例について説明する。図2は、画像処理システム100に含まれる画像形成装置1及び音声入出力装置2の制御系の構成例を示すブロック図である。
[画像形成装置の制御系の構成]
まず、画像形成装置1の制御系の構成について説明する。図2に示すように、画像形成装置1は、通信部11と、制御部12と、画像形成部13と、音声応答処理部14と、音声出力部15と、操作表示部16と、を含む。
通信部11は、ネットワークNを介して接続される音声処理サーバー3との間で行われる各種データの送受信動作を制御する。
制御部12は、CPU(Central Processing Unit)120と、RAM(Random Access Memory)121と、ROM(Read Only Memory)122と、記憶部123と、を含む。
CPU120は、ROM122に記憶されているシステムプログラムや画像形成処理プログラムなどの各種処理プログラムを読み出してRAM121に展開し、展開したプログラムに従って画像形成装置1の各部の動作を制御する。
例えば、CPU120は、音声処理サーバー3から入力されるコマンドに対応付けられた画像形成処理(画像処理)を、画像形成部13に実行させる制御を行う。また、CPU120は、ユーザーによる音声による操作指示に基づく設定において禁則等の設定ミスがあった場合や、画像形成装置1におけるジョブの実行中にエラーが発生した場合などに、音声応答処理部14に対して、ユーザーへの音声による応答又は音声による通知の実施を指示する。
RAM121は、CPU120により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアを形成し、ジョブのキュー、各種動作の設定等を記憶する。
ROM122は、半導体メモリ等の不揮発性メモリ等により構成され、画像形成装置1に対応するシステムプログラム、及び、該システムプログラム上で実行可能な画像形成処理プログラム、音声応答処理プログラム等を記憶する。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU120は、当該プログラムコードに従った動作を逐次実行する。
記憶部123は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などにより構成され、画像形成装置1に係る各種の設定データや、CPU120から音声応答処理部14に対して送信される各種指示に対応する音声データ(音声応答情報、音声通知情報等)などを記憶する。
画像形成部13は、不図示のプリンタコントローラー等から送信された画像データに基づいて用紙に画像形成を行い、該画像が形成された用紙を印刷物として出力する。具体的には、画像形成部13は、不図示の帯電装置と、感光ドラムと、露光装置と、転写ベルトと、定着装置と、を備える。
そして、画像形成部13は、まず、帯電装置により帯電された感光体ドラムに対して、露光装置から画像に応じた光を照射させることにより、感光ドラムの周上に静電潜像を形成させる。次いで、画像形成部13は、現像装置から感光体にトナーを供給させることにより、帯電した静電潜像上にトナーを付着させてトナー像を現像させる。次いで、画像形成部13は、トナー像を転写ベルトに1次転写させるとともに、転写ベルトに転写されたトナー像をから用紙に2次転写させ、さらに、定着装置に、用紙上に転写されたトナー像を用紙に定着させる。
なお、本実施形態では、画像形成部13が電子写真方式を用いて画像形成を行う例を挙げたが、本発明はこれに限定されない。本発明の画像処理システム、画像形成装置では、インクジェット方式等の他の方式で画像形成を行う画像形成部が用いられてもよい。
音声応答処理部14は、CPU120から入力される指示に対応する音声情報を生成(記憶部123等から抽出)して、音声出力部15に出力する。CPU120からの指示は、上述したように、音声による操作指示に基づく設定において禁則等の設定ミスがあった場合や、動作中にエラーが発生した場合などに行われる。
音声出力部15は、例えば、スピーカーで構成され、音声応答処理部14から入力される音声情報を再生して音声として出力する。
操作表示部16は、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)等よりなる表示部と、タッチセンサ等よりなる操作入力部とが一体に形成されたタッチパネルとして構成される。
なお、本実施形態では、表示部及び操作入力部が操作表示部16として一体に形成される例を挙げたが、本発明はこれに限定されない。表示部と、キーボードやマウス等よりなる操作入力部とが、それぞれ別々に構成されてもよい。または、タッチパネルとして構成された操作表示部16に加えて、キーボードやマウス等よりなる操作入力部を備える構成としてもよい。
[音声処理サーバーの制御系の構成]
次に、同じく図2を参照して、音声処理サーバー3の制御系の構成について説明する。図2に示すように、音声処理サーバー3は、制御部31と、通信部32と、音声解析部33と、を含む。
制御部31は、CPU310と、RAM311と、ROM312と、記憶部313と、を含む。
CPU310は、ROM312に記憶されているシステムプログラムや音声処理プログラムなどの各種処理プログラムを読み出してRAM311に展開し、展開したプログラムに従って音声処理サーバー3の各部の動作を制御する。
例えば、CPU310は、音声入出力装置2から音声情報が送信された場合に、該音声情報に対応する、画像処理のジョブに関する各種指示を、通信部32を介して画像形成装置1に送信させる制御を行う。また、CPU310は、例えば、画像形成装置1から応答情報が送信された場合に、該応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信させる制御を行う。
RAM311は、CPU310により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアを形成する。
ROM312は、半導体メモリ等の不揮発性メモリ等により構成され、音声処理サーバー3に対応するシステムプログラム、及び、該システムプログラム上で実行可能な音声処理プログラム等を記憶する。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU310は、当該プログラムコードに従った動作を逐次実行する。
記憶部313は、HDDやSSDなどにより構成され、音声処理サーバー3に係る各種の設定データや、音声解析部33による音声解析結果と対応付けられた、画像処理のジョブに関する指示等を記憶する。
通信部32は、ネットワークNを介して接続される音声入出力装置2との間で行われる各種データの送受信動作を制御する。
音声解析部33は、音声入出力装置2から送信される音声情報を解析して、音声解析結果に対応する指示、例えば、設定情報やジョブの開始指示などを記憶部313から読み出し、制御部31に出力する。また、音声解析部33は、音声入出力装置2から送信される音声情報を解析して、音声解析結果に対応する応答音声情報や通知音声情報などを記憶部313から読み出し、制御部31に出力する。
[画像処理システムによる音声応答処理]
次に、図3〜図5を参照して、本発明の第1の実施形態に係る画像処理システム100による音声応答処理方法について説明する。図3は、音声操作に基づく画像処理システム100の動作の例を示すシーケンス図である。図4は、音声処理サーバー3による音声応答処理の手順の例を示すフローチャートであり、図5は、画像形成装置1による音声応答処理の手順の例を示すフローチャートである。
[画像処理システム全体の動作]
最初に、図3を参照して、画像処理システム100全体の動作の例について説明する。まず、ユーザーから音声入出力装置2に対して「3部コピーして」と発話することによる操作指示が行われ、該操作指示を音声入出力装置2が検知する(ステップS1)。次いで、ステップS1で入力された「3部コピーして」という発話音声に対応する音声情報が、音声入出力装置2から音声処理サーバー3に送信される(ステップS2)。
次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する画像形成装置1の設定情報(コピー3部)が送信される(ステップS3)。次いで、画像形成装置1の制御部12による制御に基づいて、通信部11(図2参照)から音声処理サーバー3に対して、画像形成装置1が設定情報を受け付けたことを示す応答情報が送信される(ステップS4)。次いで、音声処理サーバー3から音声入出力装置2に対して、応答情報に対応する応答音声情報が送信される(ステップS5)。
次いで、音声入出力装置2からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS6)。具体的には「3部コピーですね、設定しました」の音声が音声入出力装置2から出力される。
次いで、音声入出力装置2から出力された音声を聞いたユーザーから音声入出力装置2に対して、「開始」と発話することによる操作指示が入力され、該操作指示の発話音声が音声入出力装置2に検知される(ステップS7)。次いで、音声入出力装置2から音声処理サーバー3に対して、ステップS7で検知された「開始」という発話音声に対応する音声情報が送信される(ステップS8)。次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する指示として、ジョブの開始指示が送信される(ステップS9)。
次いで、画像形成装置1の制御部12による制御に基づいて、通信部11から音声処理サーバー3に対して、画像形成装置1がジョブの開始指示を受け付けたことを示す応答情報が送信される(ステップS10)。次いで、音声処理サーバー3から音声入出力装置2に対して、応答情報に対応するジョブ設定終了通知音声情報が送信される(ステップS11)。
次いで、音声入出力装置2からユーザーに対して、ジョブ設定終了通知音声情報に基づく音声による応答が行われる(ステップS12)。具体的には「MFPへのジョブ設定を終了し、ジョブの開始を指示しました。今後の音声による応答はMFPから行います」の音声が、音声入出力装置2から出力される。
次いで、画像形成装置1の制御部12から音声応答処理部14に対して、音声応答の開始指示が行われる(ステップS13)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、音声応答の開始指示に対応する応答音声情報が送信される(ステップS14)。
次いで、画像形成装置1の音声出力部15からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS15)。具体的には「MFPはジョブを開始しました」の音声が、画像形成装置1の音声出力部15から出力される。
画像形成装置1内でエラーが発生した場合、画像形成装置1の制御部12から音声応答処理部14に対して、警告エラーの通知指示が行われる(ステップS16)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、警告エラーの通知指示に対応する通知音声情報が送信される(ステップS17)。
次いで、画像形成装置1の音声出力部15からユーザーに対して、通知音声情報に基づく音声通知が行われる(ステップS18)。具体的には「エラーが発生しました」の音声が、画像形成装置1の音声出力部15から出力される。
画像形成装置1でのジョブの実行が終了した場合、画像形成装置1の制御部12から音声応答処理部14に対して、ジョブの終了通知指示が行われる(ステップS19)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、ジョブの終了通知指示に対応する通知音声情報が送信される(ステップS20)。
次いで、画像形成装置1の音声出力部15からユーザーに対して、通知音声情報に基づく音声による応答が行われる(ステップS21)。具体的には「MFPでのジョブは完了しました」の音声が、画像形成装置1の音声出力部15から出力される。
[音声処理サーバーにおける音声応答処理]
次に、図4を参照して、音声処理サーバー3における音声応答処理について説明する。まず、音声処理サーバー3は、起動等の開始処理を行う(ステップS31)。次いで、音声処理サーバー3の制御部31は、音声入出力装置2からジョブの設定の指示に対応する音声情報が送信されたか否かを判定する(ステップS32)。ジョブの設定の指示に対応する音声情報には、例えば「n部コピーして」、「n部スキャンして」(nは1以上の整数)等の音声情報がある。ステップS32で、ジョブの設定の指示に対応する音声情報は送信されていないと判定された場合(ステップS32がNO判定の場合)、制御部31は、ステップS32の判定を繰り返す。
一方、ステップS32で、ジョブの設定の指示に対応する音声情報は送信されたと判定された場合(ステップS32がYES判定の場合)、制御部31は、音声情報に対応する設定情報を、通信部32を介して画像形成装置1に送信する制御を行う(ステップS33)。例えば、ジョブの設定の指示に対応する音声情報として、「n部コピーして」が送信された場合、ステップS33では、「コピーn部」等の設定情報が音声処理サーバー3から画像形成装置1に送信される。
次いで、制御部31は、画像形成装置1から、ステップS33で設定情報を送信したことに対する応答情報は送信されたか否かを判定する(ステップS34)。ステップS34で、画像形成装置1から応答情報は送信されていないと判定された場合(ステップS34がNO判定の場合)、制御部31は、ステップS34の判定を繰り返す。
一方、ステップS34で、画像形成装置1から応答情報が送信されたと判定された場合(ステップS34がYES判定の場合)、制御部31は、画像形成装置1から送信された応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信する(ステップS35)。
次いで、音声処理サーバー3の制御部31は、音声入出力装置2から、ジョブの開始指示に対応する音声情報は送信されたか否かを判定する(ステップS36)。ジョブの開始指示に対応する音声情報には、例えば、「開始」等がある。ステップS36で、音声入出力装置2からジョブの開始指示に対応する音声情報は送信されていないと判定された場合(ステップS36がNO判定の場合)、制御部31は、ステップS36の判定を繰り返す。
一方、ステップS36で、音声入出力装置2からジョブの開始指示に対応する音声情報が送信されたと判定された場合(ステップS36がYES判定の場合)、制御部31は、音声情報に対する指示としてのジョブの開始指示を、通信部32を介して画像形成装置1に送信する(ステップS37)。
次いで、制御部31は、ステップS37でジョブの開始指示を送信したことに対する応答情報は送信されたか否かを判定する(ステップS38)。ステップS38で、画像形成装置1から応答情報は送信されていないと判定された場合(ステップS38がNO判定の場合)、制御部31は、ステップS38の判定を繰り返す。
一方、ステップS38で、画像形成装置1から応答情報が送信されたと判定された場合(ステップS38がYES判定の場合)、制御部31は、音声入出力装置2を介した音声応答処理を終了する(ステップS39)。音声入出力装置2を介した音声応答処理とは、すなわち、画像形成装置1の制御部12から送信される応答情報に対応する音声情報を、音声入出力装置2に送信する処理である。ステップS39の処理後、音声による応答を行う装置が、音声処理サーバー3から画像形成装置1に切り替わる。
[画像形成装置における音声応答処理]
次に、図5を参照して、画像形成装置1における音声応答処理について説明する。まず、画像形成装置1は、起動等の開始処理を行う(ステップS41)。次いで、画像形成装置1の制御部12(図2参照)は、音声処理サーバー3から指示は送信したか否かを判定する(ステップS42)。音声処理サーバー3から送信される指示には、ジョブの設定に関する指示である設定情報や、ジョブ開始指示などがある。
ステップS42で、音声処理サーバー3から指示は送信されていないと判定された場合(ステップS42がNO判定の場合)、画像形成装置1の制御部12は、ステップS41の判定を繰り返す。一方、ステップS42で音声処理サーバー3から指示が送信されたと判定された場合(ステップS42がYES判定の場合)、制御部12は、受信した指示はジョブの開始指示であるか否かを判定する(ステップS43)。
ステップS43で、ジョブの開始指示ではないと判定された場合(ステップS43がNO判定の場合)、すなわち、指示はジョブに関する設定情報であると判定された場合、制御部12は、音声処理サーバー3から送信された設定情報に基づいて各部の設定を行う(ステップS44)。ステップS44の処理後、制御部12は、ステップS42の判定を行う。
一方、ステップS43で、音声処理サーバー3から送信された指示はジョブの開始指示であると判定された場合(ステップS43がYES判定の場合)、制御部12は、音声応答処理部14を起動する(ステップS45)。次いで、制御部12は、ステップS44で設定された内容に基づいてジョブを実行する(ステップS46)。
次いで、制御部12は、ジョブの実行中にエラーが発生したか否かを判定する(ステップS47)。ステップS47で、エラーが発生したと判定された場合(ステップS47がYES判定の場合)、制御部12は、エラー処理を行う(ステップS48)。次いで、制御部12は、音声出力部15を介した音声応答処理を行う(ステップS49)。ステップS49の音声応答処理では、例えば、「エラーが発生しました」等の、エラーの発生をユーザーに通知する応答や、「紙詰まりが発生しています」等の、エラーの内容の通知などが、音声出力部15を介して行われる。
ステップS47がNO判定の場合、又は、ステップS49の処理後、制御部12は、ジョブが終了したか否かを判定する(ステップS50)。ステップS50で、ジョブは終了していないと判定された場合(ステップS50がNO判定の場合)、制御部12は、ステップS47の判定を行う。一方、ステップS50で、ジョブは終了したと判定された場合(ステップS50がYES判定の場合)、制御部12は、音声応答処理部14を制御して、音声出力部15からジョブの終了を音声でユーザーに通知させる(ステップS51)。次いで、制御部12は、音声出力部15を介した音声応答処理を終了する(ステップS52)。なお、図5に示す結合子Aは、図11のステップS155の後に結合される。
上述した第1の実施形態では、ユーザーから音声操作が行われた場合、音声処理サーバー3からの指示に応じて画像形成装置1の制御部12から出力される応答情報に対応する音声が、音声入出力装置2から出力される。つまり、音声入出力装置2からユーザーに対する音声による応答が行われる。そして、画像形成部13でのジョブの開始後には、制御部12からの音声応答の開始指示に基づいて、画像形成装置1の音声出力部15から、音声応答の指示に対応する音声が出力される。それゆえ、本実施形態によれば、画像形成部13におけるジョブの開始前及び後のいずれにおいても、ユーザーに音声による応答を行えるようになる。
ところで、画像形成装置1におけるジョブの開始前及び後の両方においてユーザーに音声による応答を行うことは、音声入出力装置2による応答を、画像形成装置1によるジョブが開始した後にも継続することによっても実現することができる。しかしながら、この手法を用いた場合、画像形成装置1でのジョブの実行が完了するまでの間、音声入出力装置2が画像形成装置1に専有された状態となってしまう。画像形成装置1でエラーが発生した場合には、画像形成装置1による音声入出力装置2の専有時間は、エラーの解除までと、より一層長くなってしまう。
そして、音声入出力装置2が画像形成装置1に専有されている間は、ユーザーは音声入出力装置2を他の用途で使用することができなくなる。また、音声入出力装置2がクラウド上の音声処理サーバー3と通信を行う時間も長くなり、その分通信コストも嵩んでしまう。本実施形態によれば、このような問題を発生させることなく、ジョブの開始前及び後の両方においてユーザーに音声による応答を行うことができる。
また、上述した第1の実施形態では、画像形成装置1の制御部からジョブの開始指示への応答情報が音声処理サーバー3に送信された場合に、ユーザーに音声による応答を行う装置が、音声入出力装置2から画像形成装置1(音声出力部15)に切り替わることの通知が音声入出力装置2から出力される。このような通知がないまま、音声による応答を行う装置が音声入出力装置2から画像形成装置1(音声出力部15)に切り替わった場合、ユーザーの混乱を招いてしまう可能性がある。
音声入出力装置2は、例えると、画像形成装置1を代理で操作する人にあたり、画像形成装置1の動作とは異なる動作をするものである。実際に人が画像形成装置1の代理で作業を行う場合には、代理の人が行う作業と、画像形成装置1による動作とを、ユーザーは容易に区別することができる。しかしながら、音声入出力装置2と画像形成装置1とはどちらも機械であるため、ユーザーは、音声入出力装置2と画像形成装置1とを一体のものであると認識してしまう。
したがって、音声応答の出力元が、画像形成装置1と一体であると認識していた音声入出力装置2から、画像形成装置1の本体に切り替わった場合、ユーザーは、画像形成装置1から発せられた音声が、自分が音声入出力装置2に対して発話した操作指示に対応する音声であると認識できないことが想定される。
本実施形態では、音声による応答を行う装置が音声入出力装置2から画像形成装置1に切り替わることが、音声入出力装置2からユーザーに音声で通知されるため、音声による応答を行う装置が画像形成装置1に変わった場合にも、ユーザーは音声による応答の内容が自分宛のものであると理解できる。これにより、ユーザーは、エラー処理等の対応を迅速に行うことができ、適切な行動をとることができるようになる。
なお、上述した第1の実施形態では、音声による応答を行う装置が音声入出力装置2から画像形成装置1に切り替わることを通知する音声が、音声入出力装置2から出力される例を挙げたが、本発明はこれに限定されない。音声による応答を行う装置が切り替わることを通知する音声は、画像形成装置1の音声出力部15から出力されてもよい。
また、上述した第1の実施形態では、音声による応答を行う装置が切り替わることの通知を、音声を介して行う例を挙げたが、本発明はこれに限定されない。画像形成装置1の操作表示部16の画面上にメッセージ等を表示することにより通知してもよい。
<第2の実施形態>
次に、図6及び図7を参照して、本発明の第2の実施形態に係る画像処理システム100による音声応答処理方法について説明する。図6は、音声操作への切り替え操作に基づく画像処理システム100の動作の例を示すシーケンス図であり、図7は、画像形成装置1による音声応答処理の手順の例を示すフローチャートである。なお、本実施形態に係る画像処理システム100の構成は、図1に示した構成と同様であるため、ここではその説明は省略する。また、本実施形態に係る画像処理システム100を構成する各部の制御系の構成は、図2に示した構成と同様であるため、ここではその説明は省略する。
本実施形態では、ユーザーにより操作指示の方法を音声操作に切り替える操作が行われた場合に、音声による応答を行う装置が音声入出力装置2から画像形成装置1に切り替わることを、画像形成装置1の音声出力部15から音声で通知する。音声による通知は、例えば「ジョブの開始までに入力された音声による操作は、音声処理サーバーで処理します。ジョブ開始後の音声応答はMFPから行います」等のメッセージによって行うことができる。音声操作に切り替える操作には、例えば、画像形成装置1の操作表示部16(図2参照)の画面上に配置された「音声操作」ボタンを押下する操作等がある。
図8は、操作表示部16の画面上における音声操作ボタンの形成例を示す図である。図8に示す例では、画像形成装置1の操作表示部16の画面の右下の位置に、音声操作ボタンBnが配置されている。ユーザーによってこの音声操作ボタンBnが押下された場合、画像形成装置1の制御部12は、画像形成装置1による音声応答処理を開始する。
なお、本実施形態では、画像形成装置1の操作表示部16の画面上に配置された音声操作ボタンBnが押下された場合に、音声応答処理が開始される例を挙げたが、本発明はこれに限定されない。音声応答処理の開始を指示する所定の音声(言葉)がユーザーによって発せられたことを、音声入出力装置2を介して音声処理サーバー3が検知した場合に、音声応答処理が開始されてもよい。
[画像処理システムによる音声応答処理]
図6を参照して、音声操作への切り替え操作に基づく画像処理システム100の動作について説明する。まず、ユーザーによって、画像形成装置1の操作表示部16の画面上に配置された音声操作ボタンBnが押下され、該押下を画像形成装置1の制御部12が検知する(ステップS61)。次いで、画像形成装置1の制御部12は、音声処理サーバー3に起動を指示する(ステップS62)。
次いで、音声処理サーバー3から画像形成装置1に対して、音声応答が可能である旨が通知される(ステップS63)。次いで、画像形成装置1の制御部12から音声応答処理部14に対して、音声応答の開始指示が送信される(ステップS64)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、音声応答の開始指示に対応する応答音声情報が送信される(ステップS65)。
次いで、画像形成装置1の音声出力部15からユーザーに対して、応答音声情報に基づく音声応答が行われる(ステップS66)。具体的には「ジョブの開始までに入力された音声による操作は、音声処理サーバーで処理します。ジョブ開始後の音声応答はMFPから行います」の音声が、画像形成装置1の音声出力部15から出力される。
次いで、ユーザーから音声入出力装置2に対して、設定に関する操作指示が発話によって行われ、該操作指示の音声を音声入出力装置2が検知する(ステップS67)。設定に関する操作指示には、例えば、「3部コピーして」等の操作指示がある。次いで、ステップS67で入力された操作指示に対応する音声情報が、音声入出力装置2から音声処理サーバー3に送信される(ステップS68)。
次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する画像形成装置1の設定情報が送信される(ステップS69)。次いで、画像形成装置1の制御部12による制御に基づいて、通信部11から音声処理サーバー3に対して、画像形成装置1が設定情報を受け付けたことを示す応答情報が送信される(ステップS70)。次いで、音声処理サーバー3から音声入出力装置2に対して、応答情報に対応する応答音声情報が送信される(ステップS71)。
次いで、音声入出力装置2からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS72)。具体的には「3部コピーですね、設定しました」等の音声が音声入出力装置2から出力される。
次いで、音声入出力装置2から出力された音声を聞いたユーザーから音声入出力装置2に対して、「開始」と発話することによる操作指示が入力され、該操作指示の音声が音声入出力装置によって検知される(ステップS73)。次いで、音声入出力装置2から音声処理サーバー3に対して、ステップS73で検知された「開始」という発話音声に対応する音声情報が送信される(ステップS74)。次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する指示として、ジョブの開始指示が送信される(ステップS75)。
次いで、画像形成装置1の制御部12から音声応答処理部14に対して、画像形成装置1がジョブの開始指示を受け付けたことをユーザーに通知するための、ジョブの開始通知指示が送信される(ステップS76)。次いで、音声応答処理部14から音声出力部15に対して、ジョブの開始通知指示に対応する応答音声情報が送信される(ステップS77)。次いで、音声入出力装置2からユーザーに対して、応答音声情報に基づく音声応答が行われる(ステップS78)。具体的には「MFPはジョブを開始しました」の音声が、画像形成装置1の音声出力部15から出力される。
画像形成装置1内でエラーが発生した場合、画像形成装置1の制御部12から音声応答処理部14に対して、警告エラーの開始指示が行われる(ステップS79)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、警告エラーの開始指示に対応する応答音声情報が送信される(ステップS80)。次いで、画像形成装置1の音声出力部15からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS81)。具体的には「エラーが発生しました」の音声が、画像形成装置1の音声出力部15から出力される。
画像形成装置1でのジョブの実行が終了した場合、画像形成装置1の制御部12から音声応答処理部14に対して、ジョブの終了通知指示が行われる(ステップS82)。次いで、画像形成装置の音声応答処理部14から音声出力部15に対して、ジョブの終了通知指示に対応する応答音声情報が送信される(ステップS83)。次いで、画像形成装置1の音声出力部15からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS84)。具体的には「MFPでのジョブは完了しました」の音声が、画像形成装置1の音声出力部15から出力される。
[画像形成装置における音声応答処理]
次に、図7を参照して、画像形成装置1における音声応答処理について説明する。まず、画像形成装置1は、操作表示部16の画面に音声操作ボタンBnを表示させる処理を行う(ステップS91)。次いで、画像形成装置1の制御部12は、ユーザーによって音声操作ボタンBnが押下されたか否かを判定する(ステップS92)。ステップS92で、音声操作ボタンBnは押下されていないと判定された場合(ステップS92がNO判定の場合)、制御部12は、操作表示部16に入力された操作に対応する処理を実行する(ステップS93)。
次いで、制御部12は、ジョブが終了したか否かを判定する(ステップS94)。ステップS94で、ジョブは終了していないと判定された場合(ステップS94がNO判定の場合)、制御部12は、ステップS92の判定を行う。一方、ステップS94で、ジョブは終了したと判定された場合(ステップS94がYES判定の場合)、制御部12は、処理を終了する。
ステップS92で、音声操作ボタンBnが押下されたと判定された場合(ステップS92がYES判定の場合)、制御部12は、音声応答処理部14を起動する(ステップS95)。次いで、音声応答処理部14は、音声による応答を行う装置がジョブの開始後に変更する旨を、音声出力部15を介してユーザーに通知する(ステップS96)。
次いで、制御部12は、音声入出力装置2から音声情報が送信されたか否かを判定する(ステップS97)。ステップS97で、音声入出力装置2から音声情報は送信されていないと判定された場合(ステップS97がNO判定の場合)、制御部12は、ステップS97の判定を繰り返す。
一方、ステップS97で、音声入出力装置2から音声情報が送信されたと判定された場合(ステップS97がYES判定の場合)、制御部12は、音声情報はジョブの開始指示に対応する音声情報であるか否かを判定する(ステップS98)。ステップS98で、おジョブの開始指示に対応する音声情報ではないと判定された場合(ステップS98がNO判定の場合)、制御部12は、音声処理サーバー3から送信された設定情報に基づいて設定を行う(ステップS99)。ステップS99の処理後、制御部12はステップS97の判定を行う。
ステップS98で、ジョブの開始指示に対応する音声情報であると判定された場合(ステップS98がYES判定の場合)、制御部12は、開始が指示されたジョブを画像形成部13に実行させる(ステップS100)。ステップS101〜ステップS106の処理は、図5に示したステップS47〜ステップS52と同一である。つまり、制御部12は、画像形成装置1内でエラーが発生した場合には、音声出力部15を介してユーザーにエラーを通知し、ジョブが終了した場合には、音声出力部15を介してユーザーにジョブの終了を通知する。そして、ジョブの終了とともに、画像形成装置1での音声応答処理も終了する。
上述した第2の実施形態によれば、音声による応答を行う装置がジョブの開始後に画像形成装置1に切り替わることが、事前にユーザーに通知されるため、音声による応答を行う装置が実際に切り替わった時にユーザーが混乱してしまうことを防ぐことができる。
なお、上述した第2の実施形態では、画像形成装置1の操作表示部16(図2参照)の画面上に配置された音声操作ボタンBnがユーザーによって押下された時に、音声による応答を行う装置がジョブの開始後に切り替わることの通知が行われる例を挙げたが、本発明はこれに限定されない。例えば、音声操作ボタンBnの押下が行われる前に、予め上記通知を操作表示部16の画面に表示しておいてもよい。
また、本実施形態では、音声による応答を行う装置が切り替わることを、切り替えが行われる前に事前にユーザーに通知する例を挙げたが、本発明はこれに限定されない。音声による応答を行う装置が切り替わることの予告や、切り替わり実施の通知等は行わずに、音声応答の際の音声を音声入出力装置2と画像形成装置1とで異ならせることによって、切り替えの実施をユーザーに認識させてもよい。例えば、音声入出力装置2から出力される音声が、男性の声である場合には、画像形成装置1からは、女性の音声による応答を行うようにしてもよい。このような処理を行うことにより、音声による応答を行う装置が途中で画像形成装置1に切り替わったことを、ユーザーは容易に把握することができる。
<第3の実施形態>
次に、図9〜図11を参照して、本発明の第3の実施形態に係る画像処理システム100による音声応答処理方法について説明する。図9は、音声操作及びパネル操作に基づく画像処理システム100の動作の例を示すシーケンス図である。図10は、音声処理サーバー3による音声応答処理の手順の例を示すフローチャートであり、図11は、画像形成装置1による音声応答処理の手順の例を示すフローチャートである。なお、本実施形態に係る画像処理システム100の構成は、図1に示した構成と同様であるため、ここではその説明は省略する。また、本実施形態に係る画像処理システム100を構成する各部の制御系の構成は、図2に示した構成と同様であるため、ここではその説明は省略する。
上述した第1の実施形態及び第2の実施形態では、ユーザーが、画像形成装置1へのジョブの開始指示を行うまでの間、継続して音声入出力装置2への音声操作を行う場合を想定した。しかしながら、実際には、ジョブの開始指示に至るまでの間に、音声操作指示とパネル操作(操作表示部16の操作入力部への操作)との併用が始まったり、音声操作からパネル操作に切り替わったりすることがある。
本実施形態では、このように操作指示の方式が途中で切り替わった場合、画像形成装置1の制御部12が、操作表示部16の操作による操作指示に切り替わったことを通知する所定の音又は音声を音声出力部15に出力させる。そして、音声処理サーバー3は、画像形成装置1の音声出力部15から出力された所定の音又は音声を検知した場合に、パネル操作による指示に切り替えるか否かを確認するメッセージを、音声入出力装置2から音声でユーザーに通知させる。ユーザーによって、パネル操作による操作指示への切り替えを承諾する指示が「はい」等の発話により行われた場合、音声処理サーバー3は、音声による応答を行う装置が音声入出力装置2から画像形成装置1に切り替わることを、音声入出力装置2からユーザーに通知し、音声応答処理を終了する。画像形成装置1では、操作指示の方式が音声操作からパネル操作に切り替わっているため、音声応答処理は行われない。
なお、操作指示の方法の切り替えの可否をユーザーに確認する通知は、操作表示部16の画面に文字で表示されてもよい。また、上記確認のメッセージに対するユーザーによる回答も、パネル操作を介して行われてもよい。
[画像処理システムによる音声応答処理方法]
まず、図9を参照して、画像処理システム100全体の動作の例について説明する。ユーザーから音声入出力装置2に対して「3部コピーして」と発話することによる操作指示が行われ、該操作指示を音声入出力装置2が検知する(ステップS111)。次いで、ステップS111で入力された「3部コピーして」という発話音声に対応する音声情報が、音声入出力装置2から音声処理サーバー3に送信される(ステップS112)。
次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する画像形成装置1の設定情報(コピー3部)が送信される(ステップS113)。次いで、画像形成装置1の制御部12による制御に基づいて、通信部11から音声処理サーバー3に対して、画像形成装置1が設定情報を受け付けたことを示す応答情報が送信される(ステップS114)。次いで、音声処理サーバー3から音声入出力装置2に対して、応答情報に対応する応答音声情報が送信される(ステップS115)。
次いで、音声入出力装置2からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS116)。具体的には「3部コピーですね、設定しました」の音声が音声入出力装置2から出力される。
次いで、画像形成装置1の操作表示部16に対して、ユーザーによる操作が入力される(ステップS117)。次いで、画像形成装置1の制御部12は、音声出力部15に対して、予め設定された所定の通知音(又は音声)を出力させる指示を行う(ステップS118)。次いで、該指示に基づいて、音声出力部15から所定の通知音が出力される(ステップS119)。そして、音声出力部15から出力された通知音は、音声入出力装置2によっても検知される。
なお、ここでは音声出力部15から所定の通知音が出力される例を挙げたが、本発明はこれに限定されない。ステップS119において、音声出力部15から「MFPから音声応答を引き継ぎました」等の音声応答メッセージを出力してもよい。このような通知を行うことにより、ユーザーは、音声による応答を行う装置が音声入出力装置2から画像形成装置1に切り替わったことを、より明確に把握することができる。
次いで、音声入出力装置2は、画像形成装置1の音声出力部15から出力された通知音(又は、音声応答メッセージ)を検知し、検知した通知音の音声情報(通知音音声情報)を音声処理サーバー3に送信する(ステップS120)。次いで、音声処理サーバー3から音声入出力装置2に対して、パネル操作に切り替えるか否かを確認するための操作指示切替確認音声情報を送信する(ステップS121)。次いで、音声入出力装置2からユーザーに対して、操作指示切替確認音声情報に対応する音声が出力される(ステップS122)。具体的には、「パネル操作に切り替えますか?」等の音声が音声入出力装置2から出力される。
次いで、ユーザーから「はい」と発話することによる操作指示が音声入出力装置2に入力され、音声入出力装置2によって発話音声が検知される(ステップS123)。次いで、音声入出力装置2から音声処理サーバー3に対して、ステップS123で検知された「はい」という発話音声に対応する音声情報が送信される(ステップS124)。次いで、音声処理サーバー3から画像形成装置1に対して、音声情報に対応する指示として、音声操作からパネル操作への切り替え指示が送信される(ステップS125)。
次いで、画像形成装置1の制御部12から音声処理サーバー3に対して、画像形成装置1が切り替え指示を受け付けたことを示す応答情報が送信される(ステップS126)。次いで、音声処理サーバー3から音声入出力装置2に対して、応答情報に対応する応答音声情報が送信される(ステップS127)。次いで、音声入出力装置2からユーザーに対して、応答音声情報に基づく音声による応答が行われる(ステップS128)。具体的には「音声操作からパネル操作に切り替えます」の音声が、音声出力部15から出力される。
[音声処理サーバーによる音声応答処理]
次に、図10を参照して、音声処理サーバー3における音声応答処理について説明する。まず、音声処理サーバー3は、起動等の開始処理を行う(ステップS131)。次いで、音声処理サーバー3の制御部31(図2参照)は、音声入出力装置2から、ジョブの開始指示に対応する音声情報は送信されたか否かを判定する(ステップS132)。ステップS132で、音声入出力装置2からジョブの開始指示に対応する音声情報が送信されたと判定された場合(ステップS132がYES判定の場合)、制御部31は、ジョブの開始指示を、通信部11を介して画像形成装置1に送信する(ステップS133)。
次いで、音声処理サーバー3の制御部31は、画像形成装置1からジョブの開始指示に対応する応答情報が送信されたか否かを判定する(ステップS134)。ステップS134で、画像形成装置1から応答情報は送信されていないと判定された場合(ステップS134がNO判定の場合)、制御部31は、ステップS134の判定を繰り返す。
一方、ステップS134で、画像形成装置1から応答情報が送信されたと判定された場合(ステップS134がYES判定の場合)、制御部31は、音声入出力装置2を介した音声応答処理を終了する(ステップS135)。ステップS132で、音声入出力装置2からジョブの開始指示に対応する音声情報は送信されていないと判定された場合(ステップS132がNO判定の場合)、制御部31は、音声入出力装置2から、通知音音声情報は送信されたか否かを判定する(ステップS136)。
ステップS136で、通知音音声情報は送信されていないと判定された場合(ステップS136がNO判定の場合)、音声処理サーバー3の制御部31は、音声入出力装置2から送信された音声情報に対応する設定情報を、通信部32を介して画像形成装置1に送信する(ステップS137)。
次いで、制御部31は、ステップS136で設定情報を送信したことに対する応答情報は送信されたか否かを判定する(ステップS138)。ステップS138で、画像形成装置1から応答情報は送信されていないと判定された場合(ステップS138がNO判定の場合)、制御部31は、ステップS138の判定を繰り返す。
一方、ステップS138で、画像形成装置1から応答情報が送信されたと判定された場合(ステップS138がYES判定の場合)、制御部31は、画像形成装置1から送信された応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信する(ステップS139)。ステップS139の処理後、音声処理サーバー3の制御部31は、ステップS132の判定を行う。すなわち、音声入出力装置2から、ジョブの開始指示に対応する音声情報が入力されたか否かを判定する。
ステップS136で、通知音音声情報は送信されたと判定された場合(ステップS136がYES判定の場合)、音声処理サーバー3の制御部31は、操作指示切替確認音声情報を、通信部32を介して画像形成装置1に送信する(ステップS140)。次いで、制御部31は、音声入出力装置2から、パネル操作への切り替えの承諾に対応する音声情報は送信されたか否かを判定する(ステップS141)。ステップS141で、パネル操作への切り替えの承諾に対応する音声情報は送信されていないと判定された場合(ステップS141がNO判定の場合)、制御部31は、ステップS132の判定を行う。すなわち、音声入出力装置2から、ジョブの開始指示に対応する音声情報は送信されたか否かを判定する。
一方、ステップS141で、パネル操作への切り替えの承諾に対応する音声情報は送信されたと判定された場合(ステップS141がYES判定の場合)、制御部31は、画像形成装置1から送信された応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信する(ステップS142)。具体的には、制御部31は、「音声操作からパネル操作に切り替えます」等の音声を、音声入出力装置2に送信する。
[画像形成装置による音声応答処理]
次に、図11を参照して、画像形成装置1における音声応答処理について説明する。まず、画像形成装置1は、起動等の開始処理を行う(ステップS151)。次いで、画像形成装置1の制御部12(図2参照)は、音声処理サーバー3から指示を受信したか否かを判定する(ステップS152)。ステップS152で、音声処理サーバー3から指示は受信していないと判定された場合(ステップS152がNO判定の場合)、画像形成装置1の制御部12は、ステップS152の判定を繰り返す。
一方、ステップS152で、音声処理サーバー3から指示を受信したと判定された場合(ステップS152がYES判定の場合)、制御部12は、受信した指示はジョブの開始指示であるか否かを判定する(ステップS153)。ステップS153で、受信した指示はジョブの開始指示であると判定された場合(ステップS153がYES判定の場合)、制御部12は音声応答処理部14を起動する(ステップS154)。次いで、制御部12は、開始が指示されたジョブを実行する(ステップS155)。ステップS155の処理後、制御部12は、図5のステップS47の判定を行う。すなわち、画像形成装置1においてエラーが発生したか否かを判定する。
一方、ステップS153で、ジョブの開始指示ではないと判定された場合(ステップS153がNO判定の場合)、制御部12は、ユーザーによって操作表示部16に操作が入力されたか否かを判定する(ステップS156)。ステップS156で、操作表示部16に操作は入力されていないと判定された場合(ステップS156がNO判定の場合)、制御部12は、音声処理サーバー3から送信された設定情報に基づいて設定を行う(ステップS157)。ステップS157の処理後、制御部12は、ステップS152の判定を行う。すなわち、音声処理サーバー3から指示を受信したか否かを判定する。
一方、ステップS156で、操作表示部16に操作は入力されたと判定された場合(ステップS156がYES判定の場合)、制御部12は、音声出力部15に、操作表示部16に操作が入力されたことを通知する所定の通知音を出力させる(ステップS158)。
次いで、制御部12は、音声処理サーバー3から、音声操作からパネル操作への切り替え指示は送信されたか否かを判定する(ステップS159)。ステップS159で、切り替え指示は送信されていないと判定された場合(ステップS159がNO判定の場合)、制御部12はステップS159の判定を繰り返す。一方、ステップS159で、切り替え指示は送信されたと判定された場合(ステップS159がYES判定の場合)、制御部12は、切り替え指示への応答情報を、通信部11を介して音声処理サーバー3に送信する(ステップS160)。次いで、制御部12は、操作表示部16に入力された操作の内容に基づいて設定を行う(ステップS161)。
ステップS161の処理後、制御部12は、ステップS152の判定を行う。すなわち、音声処理サーバー3から指示を受信したか否かを判定する。
上述した第3の実施形態では、画像形成装置1の制御部12は、操作表示部16(の操作入力部)への操作を検知した場合、音声出力部15に所定の通知音又は通知音声を出力させる。そして、音声処理サーバー3は、音声入出力装置2から通知音又は通知音声の音声情報(音声データ)が送信された場合、指示の方法が音声操作からパネル操作に切り替わることの確認に対応する音声情報を、音声入出力装置2に出力する。したがって、本実施形態によれば、ユーザーによる操作指示の方法が音声操作からパネル操作に切り替わった場合にも、そのことを音声処理サーバー3が把握することができる。それゆえ、本実施形態によれば、音声処理サーバー3は、音声入出力装置2を介した音声応答処理の終了処理を適切に行えるようになる。
なお、上述した第3の実施形態では、「はい」等の操作指示に対応する音声情報を音声処理サーバー3が受信した場合に、音声処理サーバー3から画像形成装置1に対して、音声操作からパネル操作への切り替え指示が送信される例を挙げたが、本発明はこれに限定されない。音声処理サーバー3は、操作表示部16への操作が継続して行われていることを検知した場合に、ユーザーがパネル操作への切り替えを承諾したものと判定し、画像形成装置1にパネル操作への切り替え指示を送信してもよい。
<各種変形例>
なお、本発明は上述した実施形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得る。
上述した各実施形態では、音声入出力装置2としてスマートスピーカーが用いられる例を挙げたが、本発明はこれに限定されない。音声入出力装置2として、携帯電話端末やスマートフォンなどの携帯端末装置が用いられてもよい。しかしながら、音声入出力装置2として携帯端末装置が用いられる場合、携帯端末装置を所持したユーザーと画像形成装置1との間の距離が離れていることも想定される。この場合、画像形成装置1の音声出力部15から出力される応答音声や通知音声などをユーザーは聞くことができず、ユーザーは、画像形成装置1を音声で操作することができない。
このように、画像形成装置1と、音声入出力装置2として機能する携帯端末装置を所持したユーザーとの間の距離が離れている場合には、画像形成装置1からユーザーへの応答又は通知は、音声以外の方法で行ってもよい。例えば、メールや、ポップアップメッセージ、バナー通知などを介して、文字によって行ってもよい。
画像形成装置1と、携帯端末装置を所持したユーザーとの間の距離が離れているか否かの判定は、携帯端末装置を用いた画像形成装置1へのログイン時の位置情報等に基づいて、音声処理サーバー3が行うことができる。ログイン時の位置情報としては、画像形成装置1の位置情報、又は、携帯端末装置の位置情報を用いることができる。
ただし、携帯端末装置の位置情報の精度は、数十メートルの範囲の誤差を含むものであるため、携帯端末装置の位置情報を用いる場合には、携帯端末装置を所持したユーザーとの間の距離が離れているか否かについて誤判定が行われる可能性が高くなる。したがって、画像形成装置1の位置情報を用いた判定を行うことが難しい場合には、画像形成装置1の音声出力部15から出力された所定の音又は音声を携帯端末装置が検知できるか否かの情報に基づいて、画像形成装置1及び携帯端末装置間の距離が近いか否かを、音声処理サーバー3が判定してもよい。
音声処理サーバー3は、音声入出力装置2から送信された音声情報が、画像形成装置1の音声出力部15から出力された所定の音又は音声に対応する音声情報であった場合、画像形成装置1及び携帯端末装置間の距離が近いと判断する。そして、音声処理サーバー3は、画像形成装置1に対して、音声応答が可能である旨を通知する。音声処理サーバー3がこのような処理を行うことにより、音声入出力装置2として携帯端末装置が用いられる場合においても、ユーザーは画像形成装置1を音声操作することが可能となる。
また、上述した各実施形態では、音声応答処理部14を画像形成装置1内に設ける例を挙げたが、本発明はこれに限定されない。音声応答処理部14を音声処理サーバー3上に設けてもよい。
1…画像形成装置、2…音声入出力装置、3…音声処理サーバー、11…通信部、12…制御部、13…画像形成部、14…音声応答処理部、15…音声出力部、16…操作表示部、31…制御部、32…通信部、33…音声解析部、100…画像処理システム

Claims (9)

  1. 記録材に画像を形成する画像形成部と、
    前記画像形成部が実行するジョブに関する指示として入力された音声を音声情報に変換して出力するとともに、入力された音声情報に対応する音声を放音する音声入出力部と、
    前記音声入出力部から入力される前記音声情報に対して音声解析処理を行い、前記音声解析処理の結果と予め対応付けられた前記ジョブに関する指示を出力する音声処理部と、
    前記ジョブを前記画像形成部に実行させる制御を行う制御部と、
    前記制御部から入力される指示に対応する音声情報を生成する音声情報処理部と、
    前記音声情報処理部から入力される前記音声情報に対応する音声を放音する音声出力部と、を備え、
    前記音声処理部は、前記指示に対する応答情報が前記制御部から入力された場合に、前記応答情報に対応する音声情報を前記音声入出力部に出力し、
    前記制御部は、前記画像形成部による前記ジョブの開始後に、前記画像形成部での処理に関する通知の指示を前記音声情報処理部に出力する
    画像処理システム。
  2. 前記音声処理部は、前記制御部から、前記ジョブの開始指示への応答情報が送信された場合に、音声による応答を行う部が前記音声入出力部から前記音声出力部に切り替わることを通知する音声情報を、前記音声入出力部に出力する
    請求項1に記載の画像処理システム。
  3. 前記制御部は、前記音声処理部から前記ジョブの開始指示が入力された場合に、音声による応答を行う部が前記音声入出力部から前記音声出力部に切り替わることを通知する音声情報を、前記音声出力部に出力する
    請求項1に記載の画像処理システム。
  4. 文字又は画像を表示する表示部をさらに備え、
    前記制御部は、前記音声入出力部に音声が入力される前、又は、前記音声入出力部に音声が入力された時に、前記ジョブの開始後に音声による応答を行う部が前記音声入出力部から前記音声出力部に切り替わることを通知するメッセージを、前記表示部の画面に表示させる制御を行う
    請求項1に記載の画像処理システム。
  5. ユーザーによる操作が入力される操作入力部をさらに備え、
    前記制御部は、前記操作入力部への操作を検知した場合、前記音声出力部に所定の通知音又は通知音声を出力させ、
    前記音声処理部は、前記音声入出力部から前記通知音又は前記通知音声の音声データが送信された場合、指示の方法が音声入出力部への発話による音声操作から、前記操作入力部に対する手動操作に切り替わることの確認に対応する音声情報を、前記音声入出力部に出力する
    請求項1に記載の画像処理システム。
  6. 前記音声入出力部は、ユーザーに所持される携帯端末装置であり、
    前記音声処理部は、前記携帯端末装置と前記音声出力部との間の距離が所定以上に離れていると判定した場合、前記制御部に対して、前記画像形成部での処理に関する応答を、前記携帯端末装置の画面を介して文字によって前記ユーザーに通知させる制御を行う
    請求項1に記載の画像処理システム。
  7. 前記音声処理部は、前記制御部に対して、前記音声出力部に所定の音又は音声を出力させる指示を行い、前記所定の音又は音声に対応する音声情報が前記音声入出力部から送信された場合に、前記携帯端末装置と前記音声出力部との間の距離は所定の範囲内であると判定する
    請求項6に記載の画像処理システム。
  8. 記録材に画像を形成する画像形成部と、
    前記画像形成部が実行するジョブに関する指示として入力された音声を音声情報に変換して出力するとともに、入力された音声情報に対応する音声を放音する音声入出力部と、
    前記音声入出力部から入力される前記音声情報に対して音声解析処理を行い、前記音声解析処理の結果と予め対応付けられた前記ジョブに関する指示を出力する音声処理部と、
    前記ジョブを前記画像形成部に実行させる制御を行う制御部と、
    前記制御部から入力される指示に対応する音声情報を生成する音声情報処理部と、
    前記音声情報処理部から入力される前記音声情報に対応する音声を放音する音声出力部と、を備えた画像処理システムにおける音声応答処理方法であって、
    前記音声処理部が、前記指示に対する応答情報が前記制御部から入力された場合に、前記応答情報に対応する音声情報を前記音声入出力部に出力する手順と、
    前記制御部が、前記画像形成部による前記ジョブの開始後に、前記画像形成部での処理に関する通知の指示を前記音声情報処理部に出力する手順と、を含む
    音声応答処理方法。
  9. 記録材に画像を形成する画像形成部と、
    前記画像形成部が実行するジョブに関する指示として入力された音声を音声情報に変換して出力するとともに、入力された音声情報に対応する音声を放音する音声入出力部と、
    前記音声入出力部から入力される前記音声情報に対して音声解析処理を行い、前記音声解析処理の結果と予め対応付けられた前記ジョブに関する指示を出力する音声処理部と、
    前記ジョブを前記画像形成部に実行させる制御を行う制御部と、
    前記制御部から入力される指示に対応する音声情報を生成する音声情報処理部と、
    前記音声情報処理部から入力される前記音声情報に対応する音声を放音する音声出力部と、を備えたコンピュータに実行させるプログラムであって、
    前記音声処理部が、前記指示に対する応答情報が前記制御部から入力された場合に、前記応答情報に対応する音声情報を前記音声入出力部に出力する手順と、
    前記制御部が、前記画像形成部による前記ジョブの開始後に、前記画像形成部での処理に関する通知の指示を前記音声情報処理部に出力する手順と、を含む
    プログラム。
JP2019171959A 2019-09-20 2019-09-20 画像処理システム、音声応答処理方法及びプログラム Pending JP2021052220A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019171959A JP2021052220A (ja) 2019-09-20 2019-09-20 画像処理システム、音声応答処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019171959A JP2021052220A (ja) 2019-09-20 2019-09-20 画像処理システム、音声応答処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2021052220A true JP2021052220A (ja) 2021-04-01

Family

ID=75156495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019171959A Pending JP2021052220A (ja) 2019-09-20 2019-09-20 画像処理システム、音声応答処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2021052220A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015853A (ja) * 2001-07-04 2003-01-17 Canon Inc 情報処理装置、情報処理方法、及び、記憶媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015853A (ja) * 2001-07-04 2003-01-17 Canon Inc 情報処理装置、情報処理方法、及び、記憶媒体

Similar Documents

Publication Publication Date Title
US8638461B2 (en) Image forming apparatus and method for providing user interface screen of image forming apparatus
JP2007076250A (ja) 画像形成装置、その制御方法及びプログラム
JP6848295B2 (ja) 画像形成装置及びプログラム
US9531907B2 (en) Method for selecting sheet feed portion for image formation, image forming apparatus, and information processing apparatus
CN111856903B (zh) 图像形成装置、图像形成方法、系统以及非临时记录介质
JP2023053961A (ja) システムおよび制御方法
US11729322B2 (en) Voice operation system, voice operation method, and program
JP2020127104A (ja) 画像形成装置、画像形成システム、および情報処理方法
JP2007174215A (ja) 外部コントローラ、リモート操作システム及び方法
JP6380201B2 (ja) 画像形成装置
JP2011234194A (ja) 画像形成装置、画像処理システム及び処理条件設定実施方法
JP2021052220A (ja) 画像処理システム、音声応答処理方法及びプログラム
US20210092254A1 (en) Address search system, address search method, and program
US9218151B2 (en) Information processing device, image processing device, image processing system, and non-transitory computer readable medium to control execution of image processing based on resource information
JP2019001003A (ja) 画像形成システム及び画像形成方法
JP6455592B2 (ja) 電子機器及び画像形成装置
JP2020015218A (ja) 画像形成装置、及び画像形成システム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP2019085207A (ja) 画像形成装置、画像形成装置の制御方法及びプログラム
JP7115259B2 (ja) 画像形成装置及びプログラム
JP7124551B2 (ja) 画像処理装置、画像処理方法及び制御プログラム
US11494133B2 (en) Image forming system including image forming apparatus configured to output voice guidance to a user during transfer of a job, and method for controlling image forming apparatus
CN108881658B (zh) 数据传送装置、图像形成装置以及图像读取装置
JP2021170154A (ja) 制御装置及びプログラム
JP2022124210A (ja) 表示装置及び画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230523

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231114