JP2021051416A - 音声操作システム、音声操作方法及びプログラム - Google Patents

音声操作システム、音声操作方法及びプログラム Download PDF

Info

Publication number
JP2021051416A
JP2021051416A JP2019172514A JP2019172514A JP2021051416A JP 2021051416 A JP2021051416 A JP 2021051416A JP 2019172514 A JP2019172514 A JP 2019172514A JP 2019172514 A JP2019172514 A JP 2019172514A JP 2021051416 A JP2021051416 A JP 2021051416A
Authority
JP
Japan
Prior art keywords
voice
image forming
forming apparatus
information
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019172514A
Other languages
English (en)
Other versions
JP7415392B2 (ja
Inventor
長生 勝田
Takeo Katsuda
長生 勝田
祐介 御子柴
Yusuke Mikoshiba
祐介 御子柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019172514A priority Critical patent/JP7415392B2/ja
Priority to US17/010,298 priority patent/US11283944B2/en
Publication of JP2021051416A publication Critical patent/JP2021051416A/ja
Priority to US17/671,741 priority patent/US11729322B2/en
Application granted granted Critical
Publication of JP7415392B2 publication Critical patent/JP7415392B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/0048Indicating an illegal or impossible operation or selection to the user
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00474Output means outputting a plurality of functional options, e.g. scan, copy or print
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Facsimiles In General (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Abstract

【課題】音声入力による操作が不可である場合に、操作不可を告げる応答が迅速かつ的確に行うことができるようにする。【解決手段】音声入出力装置2からの音声情報により指示された画像形成装置1の操作を、サーバ3が記憶した情報に基づいて、画像形成装置1での実行の可否を判断し、判断結果が否のとき、音声入出力装置2に否の応答を送信する。そして、その判断での結果が否でないとき、さらに画像形成装置1で実行の可否を判断させ、判断での結果が否であるとき、音声入出力装置1に否の応答を送信するようにして、サーバ3と画像形成装置1で分担して実行の可否を判断するようにした。【選択図】図3

Description

本発明は、音声操作システム、音声操作方法及びプログラムに関する。
従来、用紙に画像を形成する画像形成装置において、装置の構成や状態によって利用できない機能や、機能の複数の組み合わせで利用できないことが決まる機能については、操作画面での表示や警告音の出力でユーザに通知するようにしている。
例えば、カラー印刷ができない画像形成装置では、カラーコピーなどの利用不可の機能については、操作画面上でカラー印刷を選択できないようにする。また、例えば特定のサイズの用紙がトレイに入っていない場合には、トレイに入っていない用紙を利用することはできない。このような状況によって操作できない機能については、操作画面上でグレイアウトと称される通常とは異なる表示形態で操作ボタンを表示して、利用不可であることを通知している。
また、画像をデータ化する規格の一つであるコンパクトPDFと、モノクロとを組み合わせるような、禁止される組み合わせの項目が設定された場合には、該当する操作後に、組み合わせ禁止であることを、操作画面上で文字メッセージにより警告している。
また、これらの表示画面上での警告などと同時に、例えば「ピーピー」といった簡単な警告音を装置が出力することも行われている。
一方、画像形成装置が備える操作パネルによる操作とは別に、近年、画像形成装置に対して音声入力による操作(以下、「音声操作」とも称する)が可能な画像処理システムが提案されている。このような画像形成システムでは、ユーザから発せられた音声は、音声認識機能を備えるスマートスピーカ等よりなる音声入出力装置に入力される。音声入出力装置では、入力された音声が音声データに変換され、該音声データは、クラウド等に設けられた音声処理サーバに送信される。そして、音声処理サーバから画像形成装置に対して、音声入出力装置に入力された音声に対応する指示(コマンド)が送信される。音声処理サーバからの指示を受信した画像形成装置では、印刷などの指示された処理が実行される。
特許文献1には、印刷装置の操作を、スマートスピーカ等の音声制御デバイスで行う技術が記載されている。
特開2019−95520号公報
画像形成装置の操作を、スマートスピーカによる音声入力で行うことを考えた場合、上述した利用できない機能の音声入力時には、音声による応答(音声応答)で指示された操作が無効であることをユーザに伝える必要がある。
このような場合も、スマートスピーカで受け付けた音声入力による指示は、音声処理サーバを経由して画像形成装置に伝送される。そして、指示を受信した画像形成装置において、音声入力による指示に該当する操作が不可であると判別される。画像形成装置で操作が不可であると判別されると、操作不可の応答が画像形成装置から音声処理サーバを経由してスマートスピーカに返送される。すると、スマートスピーカが「指示された操作は実行できません」といった音声を出力して、操作不可であることをユーザに伝える。
このように音声入力を受け付けてから該当する操作が不可である旨の音声による返答は、スマートスピーカから音声処理サーバを経由して画像形成装置までの伝送が往復することで行われる。このため、画像形成装置から操作不可のメッセージが出力されるまでに時間がかかってしまう。したがって、ユーザが操作指示を行ってから、そのユーザの指示に対する応答が来るまで、ユーザが待たされることになり、それによってユーザはストレスを感じることになる。
この問題を解決するためには、音声処理サーバが、画像形成装置の状態を常に監視して、用紙切れやトナー切れなどの状況を音声処理サーバ側が常時把握することが考えられる。このようにすることで、音声処理サーバは、スマートスピーカから音声処理サーバに指示が届いた時点で、画像形成装置での印刷が可能か否かを直ちに判断することができる。したがって、音声処理サーバは、直ちに印刷不可のメッセージ出力をスマートスピーカに指示できるので、応答出力までの時間を短縮することができる。
しかしながら、音声処理サーバが画像形成装置の状態を常時監視するためには、音声処理サーバは、画像形成装置の状態を定期的にモニタしている必要があり、音声処理サーバの負担が非常に高くなってしまうという問題が発生する。
本発明はこのような状況に鑑みてなされたものであり、本発明の目的は、サーバでの負担を増やすことなく、音声入力による操作が不可である場合に、操作不可を告げる応答が迅速かつ的確に行うことができる音声操作システム、音声操作方法及びプログラムを提供することにある。
上記課題を解決するため、本発明の音声操作システムは、記録材に画像を形成する画像形成装置と、画像形成装置の操作に関する音声情報を受け付け、画像形成装置の操作指示を行うサーバと、入力された操作に関する音声を音声情報に変換してサーバに送信すると共に、画像形成装置の操作に関する音声情報の応答の音声情報をサーバから受信して放音する音声入出力装置と、を備えた音声操作システムに適用したものである。
ここで、サーバは、画像形成装置が持つ機能又は構成の内の一部の情報を記憶する記憶部を有し、サーバは、音声入出力装置から伝送された音声情報による操作の可否の判定を、記憶部に記憶された機能又は構成に基づいて行うと共に、記憶部に記憶された機能又は構成で判断できない操作の可否の判定を、画像形成装置で実行させるようにした。
また本発明の音声操作方法は、記録材に画像を形成する画像形成装置と、画像形成装置の操作に関する音声情報を受け付け、画像形成装置の操作指示を行うサーバと、入力された操作に関する音声を音声情報に変換してサーバに送信すると共に、画像形成装置の操作に関する音声情報の応答の音声情報をサーバから受信して放音する音声入出力装置と、を含むシステムで実行される音声操作方法である。
そして、音声入出力装置で、画像形成装置の操作に関する音声を受け付け、変換された音声情報をサーバに送信するステップと、サーバが受信した音声情報により指示された操作が、サーバが記憶した情報に基づいて画像形成装置での実行の可否を判断し、判断結果が否のとき音声入出力装置に否の応答を送信するステップと、判断結果が否でないとき、画像形成装置において、現在の状況に基づいて、指示された操作の実行の可否を判断し、判断結果が否のときサーバを経由して音声入出力装置に否の応答を送信するステップと、を含む。
また本発明のプログラムは、画像形成装置の操作に関する音声情報を音声入出力装置から受け付け、画像形成装置に対して操作指示を行うと共に、操作指示に対する応答の音声情報を音声入出力装置に対して出力するコンピュータに実行させるプログラムであって、音声入出力装置で、画像形成装置の操作に関する音声を受け付けたことで送信される音声情報を受信する手順と、受信手順で受信した音声情報により指示された操作が、コンピュータが記憶した情報に基づいて画像形成装置での実行の可否を判断し、判断結果が否のとき、音声入出力装置に否の応答を送信する第1の操作可否を判断する手順と、第1の操作可否を判断する手順で、判断結果が否でないとき、画像形成装置で実行の可否を判断させ、画像形成装置から判断結果が否の応答を受信したとき、音声入出力装置に否の応答を送信する第2の操作可否を判断する手順と、を含む。
本発明によれば、音声で指示されたユーザからの操作が画像形成装置で実行可能か否かの判断が、操作内容によってサーバと画像形成装置とで分担して行われるので、サーバにおける処理負担の軽減と、音声指示から音声応答までの時間の短縮化の両立を実現することが可能になる。
本発明の第1の実施形態に係る画像処理システムの概略構成図である。 本発明の第1の実施形態に係る画像処理システムに含まれる画像形成装置及び音声入出力装置の制御系の構成例を示すブロック図である。 本発明の第1の実施形態に係る禁則応答の2つの例の概略を説明する図である。 本発明の第1の実施形態に係る禁則判定情報の種別を説明する図である。 本発明の第1の実施形態に係る処理手順の例を示すシーケンス図である。 本発明の第1の実施形態に係る処理例を示すフローチャートである。 本発明の第2の実施形態に係る処理手順の例を示すシーケンス図である。 本発明の第2の実施形態に係る画像形成装置での処理例を示すフローチャートである。 本発明の第2の実施形態に係る音声処理サーバでの処理例を示すフローチャートである。 本発明の第3の実施形態に係る処理手順の例を示すシーケンス図である。 本発明の第3の実施形態に係る画像形成装置での処理例を示すフローチャートである。 本発明の第4の実施形態に係る画像処理システムの概略構成図である。 本発明の第4の実施形態に係る処理手順の例を示すシーケンス図である。 本発明の第4の実施形態に係る処理例を示すフローチャートである。
以下、本発明を実施するための形態例について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素は、同一の符号を付し、複数の実施形態例で構成要素の重複説明は省略する。
<第1の実施形態>
[画像処理システムの構成]
まず、図1を参照して、本発明の第1の実施形態に係る画像処理システムの構成について説明する。図1は、本発明の第1の実施形態に係る画像処理システム100の概要構成図である。
図1に示す画像処理システム100は、画像形成装置1と、音声入出力装置2と、音声処理サーバ3とを備える。音声入出力装置2及び音声処理サーバ3、並びに音声処理サーバ3及び画像形成装置1は、公衆交換電話網やIP(Internet Protocol)網などよりなるネットワークNを介して接続される。
画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能等を有する多機能端末(MFP: Multi-Functional Peripherals)で構成される。画像形成装置1は、不図示のプリンタコントローラ等から送信された画像データに基づいて用紙(記録材の一例)に画像形成を行い、該画像が形成された用紙を印刷物として出力する。
音声入出力装置2は、例えば、スマートスピーカで構成され、不図示のマイクロフォン及びスピーカを備える。音声入出力装置2は、マイクロフォンが集音した音声、例えば、ユーザによって発話された音声による操作指示を音声データ(以下、「音声情報」とも称する)に変換し、この音声情報を音声処理サーバ3に送信する。また、音声入出力装置2は、音声処理サーバ3から送信される音声情報を受信して、スピーカから音声を出力する。
音声処理サーバ3は、例えば、不図示のクラウド上に設けられ、その機能はクラウドアプリケーションサービスとして提供される。音声処理サーバ3は、音声入出力装置2から送信(入力)された音声情報に対して音声解析処理を行う。そして、音声処理サーバ3は、音声解析処理の結果に対応する、画像形成装置1へのコマンド(指示)や応答音声情報、あるいは通知音声情報などを音声入出力装置2又は画像形成装置1に送信する。なお、これらのコマンド(指示)や応答音声情報、あるいは通知音声情報などは、図2で後述する記憶部313から抽出される情報である。
ここで、応答音声情報は、音声入出力装置2へのユーザの発話による操作指示(音声操作)に対する応答情報を伝える音声であり、通知音声情報は、エラーの発生やジョブの終了などの、画像形成装置1からの通知情報を伝える音声である。画像形成装置1へのコマンドには、例えば、印刷やコピー、スキャンなどのジョブの設定指示や、ジョブの開始指示などが含まれる。
なお、本実施形態では、音声処理サーバ3がクラウド上に設けられる例を挙げたが、本発明はこれに限定されない。音声処理サーバ3は、画像形成装置1内に設けられてもよい。また、音声処理サーバ3と画像形成装置1との間に、ジョブに関する情報を中継する別のサーバを設けてもよい。
[画像形成装置及び音声入出力装置の制御系の構成]
次に、図2を参照して、画像処理システム100に含まれる画像形成装置1及び音声入出力装置2の制御系の構成例について説明する。
[画像形成装置の制御系の構成]
まず、画像形成装置1の制御系の構成について説明する。図2に示すように、画像形成装置1は、通信部11、制御部12、画像形成部13、音声応答処理部14、音声出力部15及び操作表示部16を備える。
通信部11は、ネットワークNを介して接続される音声処理サーバ3との間で行われる各種データの送受信動作を制御する。
制御部12は、CPU(Central Processing Unit)120、RAM(Random Access Memory)121、ROM(Read Only Memory)122及び記憶部123を含む。
CPU120は、ROM122に記憶されている、システム全体を制御するシステムプログラムや画像形成処理プログラムなどの各種処理プログラムを読み出してRAM121に展開し、展開したプログラムに従って画像形成装置1の各部の動作を制御する。
例えば、CPU120は、音声処理サーバ3から入力されるコマンドに対応付けられた画像形成処理を、画像形成部13に実行させる制御を行う。また、CPU120は、ユーザによる音声による操作指示に基づく設定において禁則等の設定ミスがあった場合や、画像形成装置1におけるジョブの実行中にエラーが発生した場合などに、音声応答処理部14に対して、ユーザへの音声による応答又は音声により、操作が不可となる旨の通知を指示する。
RAM121は、CPU120により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアを形成し、このRAM121のワークエリアにジョブのキュー、各種動作の設定等が記憶される。
ROM122は、半導体メモリ等の不揮発性メモリ等により構成され、このROM122に画像形成装置1に対応するシステムプログラム、及びシステムプログラム上で実行可能な画像形成処理プログラム、音声応答処理プログラム等が記憶される。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU120は、当該プログラムコードに従った動作を逐次実行する。
記憶部123は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などにより構成され、この記憶部123に、画像形成装置1に係る各種の設定データや、CPU120から音声応答処理部14に対して送信される各種指示に対応する音声データ(音声応答情報、音声通知情報等)などが記憶される。
画像形成部13は、不図示のプリンタコントローラ等から送信された画像データに基づいて用紙に画像形成を行い、画像が形成された用紙を印刷物として出力する。画像形成部13は、不図示の帯電装置、感光ドラム、露光装置、転写ベルト及び定着装置を備える。
そして、画像形成部13は、まず、帯電装置により帯電された感光体ドラムに対して、露光装置から画像に応じた光を照射させることにより、感光ドラムの周上に静電潜像を形成する。次いで、画像形成部13は、現像装置から感光体にトナーを供給させることにより、帯電した静電潜像上にトナーを付着させてトナー像を現像する。次いで、画像形成部13は、トナー像を転写ベルトに1次転写するとともに、転写ベルトに転写されたトナー像を用紙に2次転写し、さらに、定着装置を用いて転写されたトナー像を用紙に定着する。
なお、本実施形態では、画像形成部13が電子写真方式を用いて画像形成を行う例を挙げたが、本発明はこれに限定されない。本発明の画像処理システム、画像形成装置では、インクジェット方式等の他の方式で画像形成を行う画像形成部を用いてもよい。
音声応答処理部14は、CPU120から入力される指示に対応する音声情報を、記憶部123等から抽出して生成し、音声出力部15に出力する。CPU120からの指示は、上述したように、音声による操作指示に基づく設定において禁則等の設定ミスがあった場合や、動作中にエラーが発生した場合などに行われる。
音声出力部15は、例えば、スピーカで構成され、音声応答処理部14から入力される音声情報を再生して音声として出力する。
操作表示部16は、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)等よりなる操作画面の表示部と、タッチセンサ等よりなる操作入力部とが一体に形成されたタッチパネルとして構成される。
なお、本実施形態では、表示部及び操作入力部が操作表示部16として一体に形成される例を挙げたが、本発明はこれに限定されない。表示部と、キーボードやマウス等よりなる操作入力部とが、それぞれ別々に構成されてもよい。または、タッチパネルとして構成された操作表示部16に加えて、キーボードやマウス等よりなる操作入力部を備える構成としてもよい。
[音声処理サーバの制御系の構成]
次に、同じく図2を参照して、音声処理サーバ3の制御系の構成について説明する。図2に示すように、音声処理サーバ3は、制御部31、通信部32及び音声解析部33を備える。
制御部31は、CPU310、RAM311、ROM312及び記憶部313を含む。
CPU310は、ROM312に記憶されているシステムプログラムや音声処理プログラムなどの各種処理プログラムを読み出してRAM311に展開し、展開したプログラムに従って音声処理サーバ3の各部の動作を制御する。
例えば、CPU310は、音声入出力装置2から音声情報が送信された場合に、該音声情報に対応する、画像処理のジョブに関する各種指示を、通信部32を介して画像形成装置1に送信する制御を行う。また、CPU310は、例えば、画像形成装置1から応答情報が送信された場合に、該応答情報に対応する音声情報を、通信部32を介して音声入出力装置2に送信する制御を行う。
RAM311には、CPU310により実行される各種プログラム及びこれらプログラムに係るデータを一時的に記憶するワークエリアが形成される。
ROM312は、半導体メモリ等の不揮発性メモリ等により構成され、ROM312に、音声処理サーバ3に対応するシステムプログラム、及びこのシステムプログラム上で実行可能な音声処理プログラム等が記憶される。これらのプログラムは、コンピュータが読取り可能なプログラムコードの形態で格納され、CPU310は、このプログラムコードに従った動作を逐次実行する。
記憶部313は、HDDやSSDなどにより構成され、この記憶部313に、音声処理サーバ3に係る各種の設定データや、音声解析部33による音声解析結果と対応付けられた、画像処理のジョブに関する指示等が記憶される。
また、記憶部313には、ネットワークNを介して接続される画像形成装置1で実行の可否を示す情報(以下、この情報を「禁則情報」と称する)が記憶されている。記憶部313に記憶される画像形成装置1の禁則情報の詳細は後述するが、この禁足情報には、画像形成装置1の構成又は機能から決まる基本情報と、画像形成装置1の設定などによって発生する追加情報が含まれる。
通信部32は、ネットワークNを介して接続される音声入出力装置2及び画像形成装置1との間で行われる各種データの送受信動作を制御する。
音声解析部33は、音声入出力装置2から送信される音声情報を解析して、音声解析結果に対応する指示、例えば、設定情報やジョブの開始指示などを記憶部313から読み出し、制御部31に出力する。また、音声解析部33は、音声入出力装置2から送信される音声情報を解析して、音声解析結果に対応する応答音声情報や通知音声情報などを記憶部313から読み出し、制御部31に出力する。
[画像処理システムによる音声応答処理]
次に、図3及び図4を参照して、本発明の第1の実施形態に係る画像処理システム100による音声応答処理の概要を説明する。
ここでは、ユーザが音声入出力装置2に対して音声で指示した操作が、画像形成装置1で実行できない場合における応答(禁則応答)の例を示す。
図3(A)に示す例は、ユーザが音声で指示した操作が、画像形成装置1の構成から禁則応答になる場合である。具体的には、ユーザが印刷の設定として、「カラーにして」と音声で音声入出力装置2に対して指示した場合を示す。
ここで、画像形成装置1は、モノクロ印刷は可能であるが、カラー印刷ができない構成である。この画像形成装置1の構成に関する禁則情報は、基本情報として音声処理サーバ3の記憶部313に記憶されている情報である。
したがって、音声入出力装置2から音声情報「カラーにして」が音声処理サーバ3に伝送されたとき、音声処理サーバ3は、記憶部313に記憶されている画像形成装置1の基本情報に基づいて、指示内容の実行が不可であると判断する。
そして、指示内容の実行が不可であると判断した場合、音声処理サーバ3は、音声入出力装置2に対して実行不可を示す音声情報を伝送し、音声入出力装置2は伝送された音声をスピーカから出力(放音)する。
例えば、図3(A)に示すように、音声入出力装置2は、「モノクロ機のためカラー設定はできません」との応答音声を出力し、ユーザに指示内容の実行が不可であることを告知する。
図3(B)に示す例は、ユーザが音声で指示した操作が、複数の機能の組み合わせから禁則応答になる場合である。具体的には、ユーザが原稿のデータ化の設定として、ブラック(モノクロ)を最初に設定した後、「コンパクトPDFにして」と音声で音声入出力装置2に対して指示した場合を示す。
ここで、モノクロとコンパクトPDFの組み合わせは、PDFの規格上から実行できない。このモノクロとコンパクトPDFの組み合わせの可否を示す禁則情報は、音声処理サーバ3の記憶部313には記憶されておらず、音声処理サーバ3が、モノクロとコンパクトPDFの組み合わせの指示を画像形成装置1に対して行うことになる。
このモノクロとコンパクトPDFの組み合わせの指示を受信した画像形成装置1は、実行できない組み合わせと判断し、実行不可を音声処理サーバ3に伝送する。この実行不可の指示を受信した音声処理サーバ3は、音声入出力装置2に対して実行不可を示す音声情報を伝送し、音声入出力装置2が伝送された音声をスピーカから出力(放音)する。
例えば、図3(B)に示すように、音声入出力装置2は、「コンパクトPDFとブラックは同時に設定できません」との応答音声を出力し、ユーザに指示内容の実行が不可であることを告知する。
このように、本発明の第1の実施形態では、音声入出力装置2に対してユーザが音声で指示した操作内容によって、音声処理サーバ3が、直接、実行の不可を音声入出力装置2に返送する場合と、画像形成装置1での判断を経て音声入出力装置2に返送する場合とがある。
図4は、本発明の第1の実施形態における、禁則情報の区別を示す。
本実施形態では、図4に示すように、画像形成装置1で指示された操作を実行できない禁則情報として、基本情報と、追加情報と、その他の情報との3種類が存在する。
基本情報は、画像形成装置1の装置構成の組み合わせから禁止となる利用不可の情報であり、画像形成装置1の状態に係わらず常に禁止となる禁則情報である。
この基本情報は、音声処理サーバ3の記憶部313に記憶される。例えば、カラー印刷が可能な装置構成か、両面印刷が可能な装置構成か、A3サイズの用紙の印刷が可能か、などの装置の構成から決まる禁則情報が、基本情報として記憶部313に記憶される。これらの基本情報は、例えば音声処理サーバ3で操作できる機種の登録時に、画像形成装置1の装置構成の情報を音声処理サーバ3が取得して、記憶部313に記憶される情報である。
追加情報は、設定や機能の組み合わせなどの条件から決まる利用不可の情報であり、画像形成装置1の装置構成に依存しない禁則情報である。この追加情報は、基本情報と同様に音声処理サーバ3の記憶部313に記憶される。但し、追加情報は、基本情報とは異なり機種登録時には記憶されず、画像形成装置1から送信された追加情報を音声処理サーバ3が取得して、記憶部313に記憶される。
その他の情報は、画像形成装置1の状態や状況に応じて禁止となる利用不可の情報である。
この場合の利用不可の情報には、例えば、設定で生じる組み合わせ禁止情報や、警告での組み合わせ禁止項目がある。この場合の利用不可の情報は、画像形成装置1側で判定されるものであり、音声処理サーバ3では判定することができないものである。
[音声処理サーバが禁則情報を取得する処理]
図5は、音声処理サーバ3が、追加情報としての禁則情報を画像形成装置1から取得する処理の流れを示すシーケンス図である。
図5に示すように、画像形成装置1は、電源がオンになると(ステップS101)、画像形成装置1内の制御部12が、装置内の設定情報を読み出して、追加情報に相当する禁則判定情報を取得する(ステップS102)。
取得した禁則判定情報は、画像形成装置1から音声処理サーバ3に伝送される(ステップS103)。音声処理サーバ3が受信した禁則判定情報は、制御部31の制御で記憶部313に記憶される。
[画像形成装置での処理]
図6は、画像形成装置1が禁則判定情報を送信する処理の流れを示すフローチャートである。
まず、画像形成装置1の制御部12は、音声操作機能を起動する(ステップS11)。音声操作機能が起動されると、制御部12は、現在の画像形成装置1の各部の状態を確認し、装置情報を取得する(ステップS12)。
装置情報を取得した画像形成装置1の制御部12は、取得した装置情報から、装置構成に変更があるか否かを判断する(ステップS13)。
このステップS13で、装置構成に変更があると判断された場合には(ステップS13のYES)、制御部12は、新たな装置構成に基づいた禁則判定情報を生成する(ステップS14)。
そして、ステップS13で、装置構成に変更がないと判断された場合(ステップS13のNO)と、ステップS14で新たな禁則判定情報を生成した後に、制御部12は、得られた禁則判定情報を、音声処理サーバ3に対して伝送する(ステップS15)。
このようにして音声処理サーバ3に伝送された禁則判定情報は、音声処理サーバ3の記憶部313に追加情報として記憶される。
以上説明したように、本実施形態例によると、音声操作時には、操作の内容に応じて、音声処理サーバ3で操作不可と判断される場合と、画像形成装置1で操作不可と判断される場合とが発生する。したがって、禁則判定は、音声処理サーバ3と画像形成装置1とで分担して行われるようになる。このため、音声処理サーバ3は、画像形成装置1についての禁則判定情報をすべて記憶する必要がなく、それだけ音声処理サーバ3の記憶部3131に記憶される情報量を削減することができると共に、音声処理サーバ3での判断処理の負担を軽減することができる。
また、音声処理サーバ3が操作不可と判断した場合には、音声処理サーバ3は、画像形成装置1まで操作指令を伝送せずに、直接音声入出力装置2に伝送するので、それだけ迅速に音声入出力装置2のスピーカから、操作否の返答を迅速に出力できるようになる。
一方、画像形成装置1が禁則判定を行う際には、画像形成装置1まで通信が行われることで、音声処理サーバ3が直接判断する場合に比べて返答までの時間が多少長く必要である。しかしながら、このようなケースは、音声処理サーバ3が操作不可と判断できなかった一部の操作指示に限られるため、全体としては操作不可の返答の迅速化を図ることができる。
<第2の実施形態>
次に、図7〜図9を参照して、本発明の第2の実施形態に係る画像処理システムについて説明する。
本発明の第2の実施形態の画像処理システム100の全体構成や、その画像処理システム100内の画像形成装置1及び音声処理サーバ3の構成は、第1の実施形態で説明した図1及び図2の構成と同じであり、重複説明を省略する。
図7は、本実施形態の画像処理システム100で行われる画像形成装置1の音声操作の処理例を示すシーケンス図である。
まず、音声入出力装置2は、電源オンなどで音声操作の開始の処理が行われ(ステップS111)、音声入出力装置2から音声処理サーバ3に、音声操作開始の指示が伝送される(ステップS112)。音声処理サーバ3が音声操作開始の指示を受信したとき、音声処理サーバ3は、画像形成装置1に対して、音声操作開始の指示を送る(ステップS113)。
音声操作開始の指示を受信した画像形成装置1は、自身の装置情報を取得する(ステップS114)。ここでの装置情報としては、装置自身が印刷可能かなどの基本的な状態の他に、各用紙トレイの用紙のサイズ、用紙の有無、用紙綴じ等を行うオプション機器の状態、紙詰まりの有無、等の様々な状況が含まれる。
また、画像形成装置1は、音声処理サーバ3との通信状態や音声処理サーバ3の処理速度などのクラウド環境を取得する(ステップS115)。このクラウド環境の取得は、画像形成装置1が音声処理サーバ3と通信を行って取得してもよいが、前回の通信時の履歴から応答時間などを取得して判断してもよい。
そして、画像形成装置1は、取得したクラウド環境に基づいて、音声処理サーバ3に登録させる禁則判定の追加情報を生成し(ステップS116)、生成した禁則判定の追加情報を音声処理サーバ3に送信する(ステップS117)。音声処理サーバ3が受信した禁則判定の追加情報は、記憶部313(図2)に記憶される。この音声処理サーバ3に送信される追加情報は、ステップS114で判断した装置情報を反映したものである。
このような処理が行われた上で、音声入出力装置2に音声入力があるとき(ステップS118)、音声情報が音声処理サーバ3に伝送される(ステップS119)。ここでの音声入力は、画像形成装置1での印刷などの設定を変更する操作を指示する音声である。
音声情報を受信した音声処理サーバ3は、記憶部313に記憶された画像形成装置1についての情報に基づいて、指示された操作内容が禁則処理に該当するか否かを確認する(ステップS120)。
このステップS120で、禁則処理に該当しないと判断されたとき、音声処理サーバ3は、有効な設定としての音声操作による設定変更の指令を画像形成装置1に送信する(ステップS121)。この設定変更の指令を受信した画像形成装置1は、指示された設定変更が、現在の装置の状態から禁則処理に該当するか否かを確認する(ステップS122)。
また、ステップS121で設定変更の指令を画像形成装置1に送信すると同時に、音声入出力装置2に、設定結果の情報を回答する(ステップS123)。ここでは、ステップS120で、禁則処理に該当しないと判断しているため、音声処理サーバ3は、変更内容についての回答を行う。例えば、「××についての設定を受け付けました。」との音声情報を回答する。また、ステップS120で、禁則処理に該当していると判断された場合には、無効な設定である旨の回答を行い、ステップS121での画像形成装置1に対する指令は行わない。例えば、「××についての設定は無効です。」との音声情報を回答する。
そして、ステップS123の回答を受信した音声入出力装置2は、回答内容を音声として出力する(ステップS124)。すなわち、音声入出力装置2は、変更内容についての音声、又は無効な設定であることの音声を出力する。
一方、ステップS122で指示された設定変更が禁則処理に該当するか否かの確認で、装置の現在の状態から禁則処理に該当すると判断したとき、画像形成装置1は、音声処理サーバ3を経由して音声入出力装置2に対して、無効な設定を示す設定結果を回答する(ステップS125)。すなわち、「××についての設定は無効です。」との音声情報を回答する。この設定結果の回答を受信した音声入出力装置2は、受信した設定が無効であることの音声をスピーカから出力する。
図8は、本実施形態での画像形成装置1の処理例を示すフローチャートである。
画像形成装置1の制御部12(図2)は、音声処理サーバ3からの指令で音声操作が起動したか否かを判断する(ステップS21)。このステップS21で、音声操作が起動されていないと判断された場合には(ステップS21のNO)、ステップS21の判断を繰り返す。
ステップS21で、音声操作が起動したと判断した場合は(ステップS21のYES)、画像形成装置1の制御部12は、画像形成装置1の現在の状況に基づいて装置情報を取得し(ステップS22)、続いて制御部12は、音声処理サーバ3側のクラウド環境を取得する(ステップS23)。
そして、画像形成装置1の制御部12は、ステップS23で取得したクラウド環境に基づいて、ステップS22で取得した装置情報の内から、音声処理サーバ3に対して登録させる禁則判定の追加情報を生成する(ステップS24)。ここでは、例えば取得したクラウド環境から音声処理サーバ3と画像形成装置1との通信速度が遅い状況のとき、登録させる禁則判定の追加情報を比較的多い情報量とする。
ステップS24で生成した禁則判定の追加情報は、画像形成装置1の制御部12の制御で、音声処理サーバ3に送信され、音声処理サーバ3に記憶される(ステップS25)。
図9は、本実施形態での音声処理サーバ3の処理例を示すフローチャートである。
音声処理サーバ3の制御部31は、音声入出力装置2からの指示による音声操作が起動した否かを判断する(ステップS31)。このステップS31で、音声操作が起動されていないと判断された場合(ステップS31のNO)、ステップS31の判断を繰り返す。
ステップS31で、音声操作が起動したと判断した場合には(ステップS31のYES)、音声処理サーバ3の制御部31は、起動した音声入出力装置2に対応した画像形成装置1について記憶した禁則情報を、記憶部313から取得する(ステップS32)。また、このとき、画像形成装置1から禁則情報の送信がある場合には、その送信された禁則情報を記憶部313に記憶する。
その後、音声処理サーバ3の制御部31は、音声入出力装置2からの音声指示を受信した否かを判断する(ステップS33)。このステップS33の判断で、音声指示を受信しない場合(ステップS33のNO)、ステップS33の判断を繰り返す。
そして、ステップS33で、音声指示を受信したと判断された場合(ステップS33のYES)、音声処理サーバ3の制御部31は、指示した受信内容、例えば印刷の設定の指示が、ステップS32で取得した禁則情報に該当するか否かを確認する(ステップS34)。
ステップS34における確認の後、音声処理サーバ3の制御部31は、指示した受信内容が有効か、又は禁則情報に該当するかを判断する(ステップS35)。ステップS34で、有効であると判断された場合には(ステップS35のYES)、音声処理サーバ3の制御部31は、音声指示による設定情報を画像形成装置1に送信する(ステップS36)。このとき、必要により設定を受け付けたことを音声入出力装置2に対して回答してもよい。
また、ステップS34で、禁則に該当すると判断された場合には(ステップS35のNO)、無効な設定である旨の回答を、音声入出力装置2に対して行う(ステップS37)。
以上説明したように、本実施の形態例のように、音声処理サーバ3が回答処理を行う内容を、画像形成装置1からの情報に基づいて動的に設定することで、音声処理サーバ3が迅速に回答処理できる内容が適切に設定され、音声処理サーバ3と画像形成装置1とで音声操作サービス時の操作禁止通知処理を分担する処理が良好に行えるようになる。特にクラウド環境を取得して音声処理サーバ3が保持する禁則情報を追加することで、ネットワークの混雑等により通信速度が遅いような状況や、ネットワークを経由した回答に時間がかかるような状況での回答処理を迅速化でき、ユーザが音声で指示してからの回答までの時間の短時間化に貢献する。
<第3の実施形態>
次に、図10〜図11を参照して、本発明の第3の実施形態に係る画像処理システムについて説明する。
本発明の第3の実施形態の画像処理システム100の全体構成や、その画像処理システム100内の画像形成装置1及び音声処理サーバ3の構成は、第1の実施形態で説明した図1及び図2の構成と同じであり、重複説明を省略する。
図10は、本実施形態の画像処理システム100で行われる画像形成装置1の音声操作の処理例を示すシーケンス図である。
音声入出力装置2に音声入力があるとき(ステップS131)、音声情報が音声処理サーバ3に伝送される(ステップS132)。ここでの音声入力は、画像形成装置1での印刷などの設定を変更する操作を指示する音声である。
音声情報を受信した音声処理サーバ3は、記憶部313に記憶された画像形成装置1についての情報に基づいて、指示された操作内容が禁則処理に該当するか否かを確認する(ステップS133)。
このステップS133で、禁則処理に該当しないと判断したとき、音声処理サーバ3は、有効な設定としての音声操作による設定変更の指令を画像形成装置1に送信する(ステップS134)。この設定変更の指令を受信した画像形成装置1は、自身の装置情報を取得する(ステップS135)。ここでの装置情報には、装置自身が印刷可能かなどの基本的な状態の他に、各用紙トレイの用紙のサイズ、用紙の有無、用紙綴じ等を行うオプション機器の状態、紙詰まりの有無、等の様々な状況が含まれる点は、第2の実施形態での図7のステップS114での処理と同じである。
また、画像形成装置1の制御部12は、音声処理サーバ3との通信状態や音声処理サーバ3の処理速度などのクラウド環境を取得する(ステップS136)。このクラウド環境の取得は、画像形成装置1が音声処理サーバ3と通信を行って取得してもよいが、この場合にも、前回の通信時の履歴から応答時間などを取得して判断してもよい。
そして、画像形成装置1の制御部12は、ステップS135で受信した設定が、禁則に該当するか否かを判定する(ステップS137)。この判定が禁則に該当しない場合には、画像形成装置1は、該当する設定変更を実行し、禁則に該当する場合には、音声処理サーバ3側に設定変更できない旨の回答を行う点は、第2の実施形態と同じであるので、これらの処理は図10では省略している。
そして、ステップS137で、禁則に該当したと判定された場合は、画像形成装置1の制御部12は、このとき判断した禁則に関する情報を、禁則判定追加情報として、音声処理サーバ3に伝送する(ステップS138)。この禁則判定追加情報を受信した音声処理サーバ3では、受信した追加の禁則判定情報が記憶部313に記憶される。
図11は、画像形成装置1での処理例を示すフローチャートである。
画像形成装置1の制御部12(図2)は、音声処理サーバ3から音声操作による指令を受信したか否かを判断する(ステップS41)。このステップS41で、音声操作による指令を受信しないと判断された場合には(ステップS41のNO)、ステップS41の判断を繰り返す。
ステップS41で、音声操作が起動したと判断されたときは(ステップS41のYES)、画像形成装置1の制御部12は、画像形成装置1の現在の状況に基づいて装置情報を取得し(ステップS42)、続いて制御部12は、音声処理サーバ3側のクラウド環境を取得する(ステップS43)。
そして、画像形成装置1の制御部12は、ステップS43で取得したクラウド環境と、ステップS41で受信した設定変更の情報に基づいて、ステップS42で取得した装置情報の内から、音声処理サーバ3に対して登録させる禁則判定の追加情報を生成する(ステップS44)。
ステップS44で生成した禁則判定の追加情報は、画像形成装置1の制御部12の制御で、音声処理サーバ3に送信され、音声処理サーバ3の記憶部313に記憶される(ステップS45)。
<第4の実施形態>
次に、図12〜図14を参照して、本発明の第4の実施形態に係る画像処理システムについて説明する。
本発明の第4の実施形態の画像処理システム100の全体構成や、その画像処理システム100内の画像形成装置1及び音声処理サーバ3の構成は、以下に説明する相違点を除いて、第1の実施形態で説明した図1及び図2の構成と同じであり、重複説明を省略する。
図12は、本発明の第4の実施形態の画像処理システム100の全体構成例を示す。
図12に示す画像処理システム100は、機器管理サーバ4がネットワークNに接続された点が、図1で説明した画像処理システム100と相違する。
すなわち、図12に示す画像処理システム100は、画像形成装置1と、音声入出力装置2と、音声処理サーバ3と、機器管理サーバ4とを備える。
機器管理サーバ4は、ネットワークNに接続された画像形成装置1の装置情報(機器情報)を記憶する記憶部を備えて、装置情報を管理するサーバである。具体的には、図2に示す音声処理サーバ3では、記憶部313に画像形成装置1の装置情報が記憶されるのに対して、本実施形態では、機器管理サーバ4が画像形成装置1の装置情報の少なくとも一部を記憶するようにした。
したがって、音声処理サーバ3は、音声入出力装置2から音声情報が供給されたとき、その音声情報を操作指令に変換して、機器管理サーバ4に送信する処理を行う。また、音声処理サーバ3は、機器管理サーバ4から音声操作の応答などの情報を受信したとき、その応答の情報をユーザに伝える音声情報を生成して、音声入出力装置2に伝送する処理を行う。
また、機器管理サーバ4は、画像形成装置1の装置情報を記憶して、音声処理サーバ3から操作指令を受信したとき、該当する操作指令が実行可能かを判断して、該当する操作指令が実行可能な場合に、画像形成装置1への操作の指示を行う。また、該当する操作指令が実行できない場合に、音声処理サーバ3への回答を行う。
但し、後述するように、音声処理サーバ3で判断可能な一部の情報については、音声処理サーバ3で直接判断して、音声入出力装置2に返答を送信する処理を行う。
図13は、本実施形態の画像処理システム100の音声処理サーバ3及び機器管理サーバ4での処理例を示すシーケンス図である。
まず、画像形成装置1が電源オンになったとする(ステップS141)。このとき、画像形成装置1は、装置構成から決まる禁則情報を機器管理サーバ4に送信する(ステップS142)。ここでの禁則情報は、カラー印刷が不可、両面印刷が不可、等の情報である。
その後、画像形成装置1は、自身の装置情報を取得する(ステップS143)。ここでの装置情報としては、各用紙トレイの用紙のサイズ、用紙の有無、用紙綴じ等を行うオプション機器の状態、紙詰まりの有無、等の様々な状況に応じた情報である。
そして、画像形成装置1は、取得した装置情報に基づいて、現在の装置の状況を、警告情報として機器管理サーバ4に伝送する(ステップS144)。機器管理サーバ4は、受信した警告情報を記憶する。
また、機器管理サーバ4は、音声処理サーバ3との通信状態や通信速度などのクラウド環境を取得する(ステップS145)。
ここで、音声処理サーバ3から音声情報に基づいた指令(有効な設定の指令)が機器管理サーバ4に伝送されたとき(ステップS146)、その指令が機器管理サーバ4から画像形成装置1に伝送される(ステップS147)。
また、機器管理サーバ4では、ステップS142で取得した禁則情報と、ステップS145で取得したクラウド情報に基づいて、音声処理サーバ3に送信する禁則判定追加情報を生成する(ステップS148)。そして、機器管理サーバ4は、生成した禁則判定追加情報を、音声処理サーバ3に送信する(ステップS149)。このとき音声処理サーバ3に送信された禁則判定追加情報は、音声処理サーバ3内に記憶させる。
図14は、機器管理サーバ4での処理例を示すフローチャートである。
機器管理サーバ4は、画像形成装置1から警告情報としての装置情報を取得する(ステップS51)。また、機器管理サーバ4は、音声処理サーバ3との通信状態や通信速度などのクラウド環境を取得する(ステップS52)。
そして、機器管理サーバ4は、音声処理サーバ3から設定についての指令を受信したか否かを判断する(ステップS53)。このステップS53で、設定についての指令を受信しないと判断した場合(ステップS53のNO)、機器管理サーバ4は、ステップS51の処理に戻る。
また、ステップS53で、設定についての指令を受信したと判断した場合(ステップS53のYES)、機器管理サーバ4は、受信した設定が禁則に該当しない場合に画像形成装置1に送信する(ステップS54)。その後、機器管理サーバ4は、受信した警告情報とクラウド環境に基づいて禁則判定追加情報を生成し(ステップS55)、生成した禁則判定情報を音声処理サーバ3に送信する(ステップS56)。
このようにして、音声処理サーバ3と機器管理サーバ4とで、禁則情報の判断を分担すると共に、音声処理サーバ3が記憶する禁則情報をクラウド環境に応じて随時更新することで、音声入出力装置2がユーザからの音声を受け付けてから応答するまでの時間を適切に短縮できるようになる。
<各種変形例>
なお、本発明は上述した実施形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得る。
上述した各実施形態では、音声入出力装置2としてスマートスピーカが用いられる例を挙げたが、本発明はこれに限定されない。音声入出力装置2として、携帯電話端末やスマートフォンなどのユーザが所持した携帯端末装置が用いられてもよい。
また、画像形成装置1の操作に関する回答は、音声入出力装置2(スマートスピーカ)から出力するようにしたが、画像形成装置1が禁則に該当すると判断したときには、画像形成装置1が備えるスピーカから、設定不可の応答の音声又は警告音を出力してもよい。この画像形成装置1内のスピーカからの応答の音声又は警告音の出力は、音声入出力装置2からの応答の音声出力と並行して行うようにしてもよい。あるいは、画像形成装置1内のスピーカからの応答の音声出力を行った場合には、音声入出力装置2からの応答の音声出力は行わないようにしてもよい。
また、画像形成装置1が禁則に該当すると判断したときには、画像形成装置1が備える操作パネル上で、操作や設定の不可を表示してもよい。
さらに、上述した各実施形態例で説明した音声処理サーバ3又は機器管理サーバ4と、画像形成装置1とで音声操作サービス時の操作禁止通知処理を分担して行う例を、それぞれ好適な一例を示したものであり、別の観点から各サーバ3,4と画像形成装置1とで音声操作サービス時の操作禁止通知処理を分担してもよい。例えば、音声操作が行われる頻度が高い項目について、音声処理サーバ3又は機器管理サーバ4が禁則情報を記憶し、音声操作が行われる頻度が低い項目について、画像形成装置1が禁則の判断を行うようにしてもよい。この音声操作が行われる頻度は、例えば過去の音声操作履歴に応じて判断する。このように頻度に応じて分担する場合にも、各サーバ3,4と画像形成装置1とで音声操作サービス時の操作禁止通知処理を分担する際の分担内容が、音声操作履歴の変化に応じて動的に変化することになる。
また、上述した各実施形態例では、画像形成装置1での電源オン時や、システム100での音声操作機能の開始時などの起動時点での機能又は構成に基づいた追加情報を取得して、サーバ3,4に送るようにした。これに対して、画像形成装置1では、装置自身の状況に変化があるかを常に監視して、装置自身の状況に変化があったときに、サーバ3、4に追加又は変更された禁則情報をサーバ3,4に送るようにしてもよい。
また、上述した各実施形態例で説明した各サーバ3,4や画像形成装置1での処理は、その処理手順を実行するプログラムとして構成して、既存のサーバや画像形成装置に実装することで、既存のサーバや画像形成装置を、本発明の画像処理システム100として構成してもよい。プログラムは、半導体メモリや各種ディスクなどの記録媒体に格納することができる。あるいは、インターネット等の伝送媒体を介して、サーバや画像形成装置にプログラムを配布してもよい。
1…画像形成装置、2…音声入出力装置、3…音声処理サーバ、11…通信部、12…制御部、13…画像形成部、14…音声応答処理部、15…音声出力部、16…操作表示部、31…制御部、32…通信部、33…音声解析部、100…画像処理システム

Claims (12)

  1. 記録材に画像を形成する画像形成装置と、
    前記画像形成装置の操作に関する音声情報を受け付け、前記画像形成装置の操作指示を行うサーバと、
    入力された操作に関する音声を音声情報に変換して前記サーバに送信すると共に、前記画像形成装置の操作に関する音声情報の応答の音声情報を前記サーバから受信して放音する音声入出力装置と、を備えた音声操作システムであり、
    前記サーバは、前記画像形成装置が持つ機能又は構成の内の一部の情報を記憶する記憶部を有し、
    前記サーバは、前記音声入出力装置から伝送された音声情報による操作の可否の判定を、前記記憶部に記憶された機能又は構成に基づいて行うと共に、前記記憶部に記憶された機能又は構成で判断できない操作の可否の判定を、前記画像形成装置で実行させる
    音声操作システム。
  2. 前記サーバの記憶部は、前記画像形成装置の基本構成から決まる機能又は構成による基本情報と、前記画像形成装置から伝送された追加情報とを記憶し、
    前記サーバは、前記記憶部に記憶された前記基本情報と前記追加情報とに基づいて、前記画像形成装置での操作の可否の判定を行う
    請求項1に記載の音声操作システム。
  3. 前記追加情報には、複数の機能の組み合わせで可否が決まる情報、又は状況によって可否が変化する情報である
    請求項2に記載の音声操作システム。
  4. 前記画像形成装置の起動時に、その起動時点での機能又は構成に基づいた前記追加情報を前記サーバに送信する
    請求項3に記載の音声操作システム。
  5. 前記追加情報は、前記音声入出力装置による音声応答サービス開始時に、前記画像形成装置から前記サーバに送られて更新される
    請求項2に記載の音声操作システム。
  6. 前記画像形成装置で、操作が否となる状況が解除されたとき、その解除された追加情報が、前記画像形成装置から前記サーバに送られて更新される
    請求項3に記載の音声操作システム。
  7. 前記追加情報は、前記画像形成装置での機能又は構成の変更時に、前記画像形成装置から前記サーバに送られて更新される
    請求項2に記載の音声操作システム。
  8. 前記サーバの記憶部に記憶される追加情報の情報量は、前記サーバと前記画像形成装置との間の通信に要する時間又は通信速度に応じて、動的に設定する
    請求項2に記載の音声操作システム。
  9. 前記音声入出力装置が指示の音声入力を受け付けてから、前記音声入出力装置が応答を出力するまでの応答時間に基づいて、前記サーバの記憶部が記憶する追加情報の情報量を設定する
    請求項2に記載の音声操作システム。
  10. 前記サーバとして、
    前記音声入出力装置と通信を行う音声処理サーバと、
    前記音声処理サーバ及び前記画像形成装置と通信を行う機器管理サーバとを備え、
    前記機器管理サーバが、前記記憶部を備える
    請求項1に記載の音声操作システム。
  11. 記録材に画像を形成する画像形成装置と、
    前記画像形成装置の操作に関する音声情報を受け付け、前記画像形成装置の操作指示を行うサーバと、
    入力された操作に関する音声を音声情報に変換して前記サーバに送信すると共に、前記画像形成装置の操作に関する音声情報の応答の音声情報を前記サーバから受信して放音する音声入出力装置と、を含むシステムで実行される音声操作方法であって、
    前記音声入出力装置で、前記画像形成装置の操作に関する音声を受け付け、変換された音声情報を前記サーバに送信するステップと、
    前記サーバが受信した音声情報により指示された操作が、前記サーバが記憶した情報に基づいて前記画像形成装置での実行の可否を判断し、判断結果が否のとき前記音声入出力装置に否の応答を送信するステップと、
    前記画像形成装置での実行の可否の判断結果が否でないとき、前記画像形成装置において、現在の状況に基づいて、指示された操作の実行の可否を判断し、判断結果が否のとき前記サーバを経由して前記音声入出力装置に否の応答を送信するステップと、を含む
    音声操作方法。
  12. 画像形成装置の操作に関する音声情報を音声入出力装置から受け付け、前記画像形成装置に対して操作指示を行うと共に、操作指示に対する応答の音声情報を前記音声入出力装置に対して出力するコンピュータに実行させるプログラムであって、
    前記音声入出力装置で、前記画像形成装置の操作に関する音声を受け付けたことで送信される音声情報を受信する手順と、
    受信した音声情報により指示された操作が、前記コンピュータが記憶した情報に基づいて前記画像形成装置での実行の可否を判断し、判断結果が否のとき、前記音声入出力装置に否の応答を送信する第1の操作可否を判断する手順と、
    前記第1の操作可否を判断する手順で、判断結果が否でないとき、前記画像形成装置で実行の可否を判断させ、前記画像形成装置から判断結果が否の応答を受信したとき、前記音声入出力装置に否の応答を送信する第2の操作可否を判断する手順と、
    をコンピュータに実行させるプログラム。
JP2019172514A 2019-09-24 2019-09-24 音声操作システム、音声操作方法及びプログラム Active JP7415392B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019172514A JP7415392B2 (ja) 2019-09-24 2019-09-24 音声操作システム、音声操作方法及びプログラム
US17/010,298 US11283944B2 (en) 2019-09-24 2020-09-02 Voice operation system, voice operation method, and program
US17/671,741 US11729322B2 (en) 2019-09-24 2022-02-15 Voice operation system, voice operation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019172514A JP7415392B2 (ja) 2019-09-24 2019-09-24 音声操作システム、音声操作方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021051416A true JP2021051416A (ja) 2021-04-01
JP7415392B2 JP7415392B2 (ja) 2024-01-17

Family

ID=74882238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019172514A Active JP7415392B2 (ja) 2019-09-24 2019-09-24 音声操作システム、音声操作方法及びプログラム

Country Status (2)

Country Link
US (2) US11283944B2 (ja)
JP (1) JP7415392B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7415392B2 (ja) 2019-09-24 2024-01-17 コニカミノルタ株式会社 音声操作システム、音声操作方法及びプログラム
JP2023019219A (ja) * 2021-07-28 2023-02-09 富士フイルムビジネスイノベーション株式会社 印刷システム、情報処理装置及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005070859A (ja) * 2003-08-27 2005-03-17 Canon Inc データ処理装置および印刷装置および印刷制御方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP2008152725A (ja) 2006-12-20 2008-07-03 Fuji Xerox Co Ltd 印刷システムおよび印刷制御装置および印刷制御プログラム。
JP2009054005A (ja) * 2007-08-28 2009-03-12 Konica Minolta Business Technologies Inc 画像形成システム、画像形成装置および画像形成方法
CN108656558A (zh) * 2017-03-29 2018-10-16 三纬国际立体列印科技股份有限公司 运用于3d打印机的语音控制系统及语音控制方法
JP7071098B2 (ja) 2017-11-20 2022-05-18 キヤノン株式会社 音声制御システム、制御方法およびプログラム
JP7415392B2 (ja) 2019-09-24 2024-01-17 コニカミノルタ株式会社 音声操作システム、音声操作方法及びプログラム

Also Published As

Publication number Publication date
US11729322B2 (en) 2023-08-15
JP7415392B2 (ja) 2024-01-17
US11283944B2 (en) 2022-03-22
US20210092243A1 (en) 2021-03-25
US20220174162A1 (en) 2022-06-02

Similar Documents

Publication Publication Date Title
US8705084B2 (en) Image processing system, image processing apparatus and method for controlling the same
JP2006107476A (ja) 画像形成装置及び画像形成装置の設定方法
JP5011425B2 (ja) 印刷システム、印刷装置及び通信端末
US9880789B2 (en) Printing system for distributing print jobs, image forming apparatus and server apparatus
US20200195791A1 (en) Image processing system, cloud server, and program
JP2011126132A (ja) 画像形成装置
JP2022141656A (ja) サーバシステム、印刷装置、制御方法、及び通信システム
US11729322B2 (en) Voice operation system, voice operation method, and program
JP2023053961A (ja) システムおよび制御方法
JP2017042998A (ja) 画像形成システム、画像形成装置および管理装置
JP2015133559A (ja) 画像形成装置、情報端末装置、画像形成システム、画像形成装置管理制御方法、画像形成装置制御プログラムおよび情報端末装置制御プログラム
AU2014280953B2 (en) Information processing device, image processing device, image processing system, and program
JP6542684B2 (ja) 情報処理システム、画像形成装置、転送制御プログラムおよび転送制御方法
JP6561958B2 (ja) 画像形成システム、情報処理装置、及び画像形成装置
JP2012015979A (ja) 情報処理システム、情報処理装置、それらの制御方法、及びプログラム
JP6384457B2 (ja) デモンストレーションシステム
JP6665675B2 (ja) 変換装置、画像形成システム、および変換装置の制御プログラム
JP2019025720A (ja) 画像形成装置及びプログラム
JP2021170154A (ja) 制御装置及びプログラム
JPWO2016158966A1 (ja) 電子機器及び画像形成装置
JP6745671B2 (ja) 印刷装置とその制御方法、及びプログラム
JP2013242736A (ja) 情報処理装置、印刷システム、印刷装置、印刷制御方法及び印刷制御プログラム
JP2018180881A (ja) サーバー及び画像形成システム
JP2020035210A (ja) 情報処理装置、その制御方法、プログラム、および情報処理システム
JP2021052220A (ja) 画像処理システム、音声応答処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231218

R150 Certificate of patent or registration of utility model

Ref document number: 7415392

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150