JP2020134903A - システム、画像形成装置、方法およびプログラム - Google Patents

システム、画像形成装置、方法およびプログラム Download PDF

Info

Publication number
JP2020134903A
JP2020134903A JP2019032508A JP2019032508A JP2020134903A JP 2020134903 A JP2020134903 A JP 2020134903A JP 2019032508 A JP2019032508 A JP 2019032508A JP 2019032508 A JP2019032508 A JP 2019032508A JP 2020134903 A JP2020134903 A JP 2020134903A
Authority
JP
Japan
Prior art keywords
operation command
server
image forming
voice
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019032508A
Other languages
English (en)
Inventor
義宗 張
yi-zong Zhang
義宗 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019032508A priority Critical patent/JP2020134903A/ja
Priority to US16/751,213 priority patent/US20200274979A1/en
Publication of JP2020134903A publication Critical patent/JP2020134903A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1204Improving or facilitating administration, e.g. print management resulting in reduced user or operator actions, e.g. presetting, automatic actions, using hardware token storing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1253Configuration of print job parameters, e.g. using UI at the client
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1253Configuration of print job parameters, e.g. using UI at the client
    • G06F3/1254Automatic configuration, e.g. by driver
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/126Job scheduling, e.g. queuing, determine appropriate device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1278Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
    • G06F3/1285Remote printer device, e.g. being remote from client or server
    • G06F3/1288Remote printer device, e.g. being remote from client or server in client-server-printer device configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00912Arrangements for controlling a still picture apparatus or components thereof not otherwise provided for
    • H04N1/00915Assigning priority to, or interrupting, a particular operation
    • H04N1/0092Assigning priority according to size job or task, e.g. small jobs first

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)
  • Control Or Security For Electrophotography (AREA)

Abstract

【課題】画像形成装置に対し、音声による操作指令を複数のルートで提供する。【解決手段】画像形成装置は、発話の音声を認識し操作指令を生成する装置側生成部101を含み、サーバー300は、音声処理装置200から受信する音声を認識し操作指令を生成するサーバー側生成部324を含み、画像形成装置は、サーバーから受信する操作指令および装置側生成部101が生成する操作指令の一方を処理する。【選択図】図1

Description

本開示はシステム、画像形成装置、方法およびプログラムに関し、特に、音声に基づく指令により画像形成装置を操作するシステム、画像形成装置、方法およびプログラムに関する。
近年、対話型によりマイクで集音した音声を認識し、認識結果に基き装置を操作するための指令を、当該装置に出力する、いわゆるスマートスピーカーが提供されている。このようなスマートスピーカーを介して指令を受ける装置として、画像形成装置が提案されている。この場合、スマートスピーカーが画像形成装置の動作音を指令の音声と誤認識する可能性がある。このような動作音による誤認識を解消するために、例えば、特許文献1(特開2005−219460号公報)は、画像形成装置の稼働中に音声の入力を禁止する。
特開2005−219460号公報
従来は、音声の操作指令を画像形成装置に提供するルートは1つだけであった。ルートが1つだけの場合、そのルートが使えない状況(例えば、装置の動作音による誤動作が発生するので入力を禁止する(特許文献1)、音声認識が外部サーバーで行う場合において通信障害等が発生する場合など)では、画像形成装置に対して音声による指令を提供できなくなる。特に、音声による「キャンセル」の指令が提供できなくなることは装置の正常稼働に影響を与える。したがって、画像形成装置に対し、音声による操作指令を複数のルートで提供することが望まれる。
本開示の一例にかかるシステムは、画像形成装置と、発話の音声を集音する音声処理装置と、サーバーと、を備える。
画像形成装置は、発話の音声を認識し当該画像形成装置の操作指令を生成する装置側生成部を含み、サーバーは、当該サーバーを制御する制御部と、画像形成装置および音声処理装置と通信する通信回路と、を含む。制御部は、音声処理装置から受信する音声を認識し前記操作指令を生成するサーバー側生成部を含む。
画像形成装置は、サーバーから受信する操作指令および装置側生成部が生成する操作指令の一方を処理する。
上述の開示において、画像形成装置は、当該画像形成装置の状態に応じて、サーバーから受信する操作指令および装置側生成部が生成する操作指令の一方を処理する。
上述の開示において、制御部は、画像形成装置が所定状態であるとき、装置側生成部による操作指令の生成を許可するコマンドを画像形成装置に送信するよう通信回路を制御し、および画像形成装置が非所定状態であるとき、装置側生成部による操作指令の生成を禁止するコマンドを画像形成装置に送信するよう通信回路を制御する。
上述の開示において、制御部は、画像形成装置が所定状態であるとき、サーバー側生成部による操作指令の生成を禁止する。
上述の開示において、制御部は、サーバー側生成部による操作指令の生成が禁止される場合、所定通知を出力させるコマンドを音声処理装置に送信する。
上述の開示において、所定状態は、画像形成装置がジョブを実行中の状態を含む。
上述の開示において、装置側生成部が生成する操作指令は、ジョブを実行中の画像形成装置を操作する指令のうち、他の指令よりも優先して処理される操作指令を含む。
上述の開示において、優先して処理される操作指令は、ジョブの実行を停止または中断させるための操作指令を含む。
上述の開示において、画像形成装置は、当該画像形成装置の状態をサーバーに送信する。
上述の開示において、装置側生成部が音声認識により生成するべき操作指令の種類は、サーバー側生成部が音声認識により生成するべき操作指令の種類よりも少ない。
本開示の他の例にかかるサーバーとネットワーク接続される画像形成装置は、画像形成ユニットと、制御部と、を備える。
サーバーは、音声処理装置から受信する発話に基づく音声を認識し前記画像形成ユニットの操作指令を生成するよう構成される。制御部は、発話に基づく音声を認識し操作指令を生成する指令生成部を有し、制御部は、サーバーから受信する操作指令および指令生成部が生成する操作指令の一方を処理する。
本開示の他の例にかかる方法は、サーバーとネットワーク接続される画像形成装置に備えられるプロセッサが実行する方法である。画像形成装置は、さらに画像形成ユニットを備える。サーバーは、音声処理装置から受信する発話に基づく音声を認識し画像形成ユニットを操作する操作指令を生成するよう構成される。
方法は、サーバーから操作指令を受信するステップと、発話に基づく音声を認識し操作指令を生成するステップと、受信するステップにおいて受信される操作指令および生成するステップにおいて生成される操作指令の一方を処理するステップと、を備える。
本開示の他の例では、上記に記載の方法をコンピューターに実行させるためのプログラムが提供される。
本開示の一例によれば、画像形成装置に対し、音声による操作指令を複数のルートで提供することができる。
実施の形態にかかるシステム1の概略的な構成を示す図である。 実施の形態にかかるMFP100のハードウェアの構成の一例を概略的に示す図である。 実施の形態にかかるサーバー300のハードウェア構成の一例を概略的に示す図である。 実施の形態にかかる音声処理装置200のハードウェア構成の一例を概略的に示す図である。 実施の形態にかかるジョブデータ50の構成を概略的に示す図である。 実施の形態にかかるフレーム57の構成を概略的に示す図である。 実施の形態にかかるサーバー300の機能構成の一例を模式的に示す図である。 実施の形態にかかる指令可否テーブル342の一例を模式的に示す図である。 実施の形態にかかるMFP100の機能構成の一例を模式的に示す図である。 実施の形態にかかる可能指令テーブル343の一例を模式的に示す図である。 本実施の形態にかかる処理のフローチャートの一例を示す図である。 本実施の形態にかかるMFP100の状態に応じた処理のフローチャートの一例を示す図である。
以下、図面を参照しつつ、実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらの説明は繰り返さない。
<概要>
本開示の概要を説明する。図1は、実施の形態にかかるシステム1の概略的な構成を示す図である。図1を参照して、システム1は、有線または無線のネットワーク400に接続可能なMFP(Multi-Function Peripherals)100、音声処理装置200および例えばクラウドサーバーを含み得るサーバー300を備える。
システム1は、ユーザーの発話の音声によりMFP100を操作することができる環境を提供する。この環境は、発話の音声による操作指令をMFP100に供給するための2つの(複数の)ルートを有する。
具体的には、1つのルートは、MFP100が備えるマイク177と装置側生成部101により提供される。つまり、装置側生成部101は、マイク177が集音したMFP100の周囲のユーザーの発話による音声を認識処理してMFP100の操作指令572を生成する。また、他のルートは、音声処理装置200とサーバー300のサーバー側生成部324により提供される。具体的には、音声処理装置200は、音声処理装置200の周囲のユーザーの発話による音声を集音し、集音した音声の音声データ40を生成する。例えば、音声処理装置200は、発話によるアナログの音声信号をデジタルの音声データ40に変換する。音声処理装置200は、音声データ40を、ネットワーク400を介してサーバー300に送信する。サーバー300のサーバー側生成部324は、音声処理装置200から受信する音声データ40を認識処理し、MFP100の操作指令571を生成する。サーバー300は、操作指令571をMFP100に送信する。MFP100は、2つのルートのうち一方の操作指令を受付けて処理(実行)する。
これにより、図1のシステムは、MFP100に対し音声による操作指令を2つの(複数の)ルートから提供することができる。したがって、例えば、ユーザーは、2つのルートのうちの一方のルートで、発話による操作指令をMFP100に出力した場合であっても、当該操作指令をキャンセルするための発話による操作指令を他方のルートでMFP100に出力することができる。
また、上記の2つのルートが提供されるとしても、MFP100は、自装置の状態に応じた一方のルートからの操作指令を処理することができる。
例えば、サーバー300は、MFP100の状態に応じて装置側生成部101による操作指令572の生成を禁止するか許可するかを示す禁止/許可コマンド573を生成しMFP100に送信する。装置側生成部101は禁止/許可コマンド573が“禁止”を示すときは操作指令572を生成せず、“許可”を示すときに操作指令572を生成する。これにより、MFP100は、自装置の状態に応じて、すなわち禁止/許可コマンド573に応じて、上記の2つのルートのうちの一方のルートの操作指令を処理することができる。
本開示の一例によれば、発話の音声に基づく操作指令を、サーバーから提供するルートと、当該画像形成装置が生成するルートとの2つの(複数の)ルートで提供できる。また、複数ルートからの操作指令のうち、画像形成装置は、一のルートの操作指令を受付けて処理(実行)する。これにより、音声の認識結果による画像形成装置への操作指令の提供ルートを多様化できる。
<A.構成>
(a1.システムの構成)
再び図1を参照して、システム1の構成を説明する。図1では、ネットワーク400は、LAN(Local Area Network)またはグローバルネットワーク、または、NFC(Near field communication)等の近距離無線通信を含み得る。MFP100は、プリンターまたはコピー機またはそれらの複合機であり、画像形成装置の一実施例である。なお、音声処理装置200またはMFP100は、図示しないがルーター等の中継器を介してネットワーク400に接続されてもよい。また、ネットワーク400に接続されるサーバー300およびMFP100は、をれぞれ、複数台であってもよい。
また、サーバー300は、音声処理装置200からの音声データ40を音声認識処理する場合、音声データ40をその認識結果であるテキストデータ(文字列)に変換する。例えば、ユーザーの発話による「コピーを10部して」の音声データ40の認識結果である操作指令571がMFP100に送信される。
サーバー300は、操作指令571をMFP100に送信する方法として、操作指令571を格納したフレーム57を送信する方法、または、操作指令571を有したジョブデータ50を生成して送信する方法等をとり得る。このジョブデータ50とフレーム57の詳細は後述する。また、MFP100は自装置の状態61を検出して、検出された状態61をサーバー300に定期的に送信する。これによりサーバー300は、MFP100の最も最近の状態を検出することができる。
サーバー300は、MFP100の状態に応じた値が設定された禁止/許可コマンド573を生成し、MFP100に送信する。具体的には、サーバー300は、画像形成装置が所定状態であるとき、装置側生成部101による操作指令572の生成を許可する値が設定された禁止/許可コマンド573を生成し、MFP100に送信する。また、サーバー300は、MFP100が非所定状態であるとき、装置側生成部101による操作指令572の生成を禁止する値が設定された禁止/許可コマンド573をMFP100に送信する。
本実施の形態では、MFP100の状態は、ジョブを実行中に遷移し得る状態を含む。状態は、限定されないが、例えば、MFP100が内蔵する画像形成ユニットのモーターが低速度で回転する低回転モード、モーターが高速に回転してプリントジョブを実行中のモード等を含み得る。このうち上記の所定状態は、本実施の形態では、例えばジョブデータ50に基づくジョブを実行中の状態を含む。ジョブを実行中の状態では、例えばモーターの高速回転音など機械音による騒音が発生して、発話による音声に騒音が混入する可能性が高い、すなわち音声を認識できない、または誤認識する可能性が高い状態とも言える。
これに対して、非所定状態とは、ジョブ実行中ではない状態であって、例えばモーターが低速度で回転するモード等を含む。非所定状態は、発話による音声に騒音が混入しない可能性が高い、すなわち音声を認識できる、または誤認識する可能性が低い状態を含む。
(a2.MFP100のハードウェア構成)
図2は、実施の形態にかかるMFP100のハードウェアの構成の一例を概略的に示す図である。図2を参照して、MFP100は、MFP100を制御するための制御部に相当するCPU(Central Processing Unit)150、プログラムおよびデータを格納するための記憶部160、情報の入出力部170、ネットワーク400を介してサーバー300と通信するための通信I/F(InterFaceの略)156、画像データを含む各種データを記憶するハードディスクなどの記憶部173、データリーダー/ライター174、通信回路175、周囲の音声を集音するマイク177、音声を出力するスピーカー178、人感センサ179および画像形成ユニット180を含む。
MFP100は通信回路175を介して音声処理装置200を含む外部の端末と通信することができる。MFP100は、音声処理装置200が接続される場合は、音声処理装置200から発話による音声を集音することができる。
記憶部160は、CPU10により実行されるプログラムおよびデータを記憶するためのROM(Read Only Memory)、CPU10によりプログラムを実行する際の作業領域として供されるRAM(Random Access Memory)および不揮発メモリなどを含む。
入出力部170は、ディスプレイを含む表示部171およびユーザーがMFP100に情報を入力するために操作する操作部172を含む。ここでは、表示部171と操作部172は、一体的に構成されたタッチパネルとして提供されてもよい。
通信I/F156は、NIC(Network Interface Card)などの回路を含んで構成される。通信I/F156は、サーバー300を含む外部装置とネットワークを介して通信するためのデータ通信部157を含む。データ通信部157は、データを、ネットワーク400を介してサーバー300を含む外部装置に送信するための送信部158、およびネットワーク400を介してサーバー300を含む外部装置からデータを受信する受信部159を含む。
データリーダー/ライター174は、記録媒体176が脱着自在に装着される。データリーダー/ライター174は、装着された記録媒体176からプログラムまたはデータを読出す回路と、記録媒体176にデータを書込む回路を有する。通信回路175は、例えばLAN(Local Area Network)またはNFC(Near Field Communication)などのための通信回路を含む。
画像形成ユニット180は、画像処理部151、画像形成部152、図示しないファクシミリ回路を制御するためのファクシミリ制御部153、図示しないプリンターを制御する画像出力部154および画像読取部155を備える。
画像処理部151は、入力された画像データを処理することにより、たとえば出力される画像の拡大・縮小等の処理を実行する。画像処理部151は、たとえば画像処理用のプロセッサおよびメモリによって実現される。画像形成部152は、トナーカートリッジ、記録用紙を収容するための用紙トレイ、および、感光体等の、記録用紙に画像を形成するためのモーターを含むハードウェア資源、ならびに、記録用紙を搬送するためのモーターを含むハードウェア資源によって実現される。画像読取部155は、原稿を光学的に読み取って画像データを得るためのスキャナー等の、原稿の画像データを生成するように構成されたハードウェア資源によって実現される。画像処理部151、画像形成部152、および画像読取部155のそれぞれの機能は、MFP100においてよく知られたものであるから、ここでは詳細な説明は繰返さない。
画像形成ユニット180は、CPU150から操作指令に基づく制御データを受付けて、制御データに基づき駆動信号(電圧信号または電流信号)を生成し、生成した駆動信号を各部(例えばモーター等のハードウェア)に出力する。これにより、操作指令に従い画像形成ユニット180のハードウェアが動作する。例えば、画像出力部154は、操作指令に従いプリンターを駆動する。
図2では、CPU150は1つとしているが、1または複数のプロセッサを備えるとしてもよい。また、マイク177は、指向性を有していてもよい。例えば、マイク177は人の発話の音声が有する周波数帯域の音声を集音可能な周波数特性を有しても良い。また、MFP100は人感センサ179を備えて、人感センサ179の検知出力に基き、装置側生成部101は人が検知されたときに集音された音声から操作指令572を生成するとしてもよい。また、マイク177は、MFP100の特定の方向から入来する音だけを集音できるよう特性を有しても良い。例えば、装置側生成部101は、人感センサ179の出力に基き、特定の方向に人の存在が検知されると判定したとき、マイク177からの音声に基づく操作指令572を生成するとしてもよい。
(a3.サーバー300のハードウェア構成)
図3は、実施の形態にかかるサーバー300のハードウェア構成の一例を概略的に示す図である。図3を参照して、サーバー300は、サーバー300を制御するためのCPU30、記憶部34、ネットワークコントローラー35およびリーダー/ライター36を含む。記憶部34は、CPU30により実行されるプログラムおよびデータを記憶するためのROM31、RAM32、各種の情報を格納するためのHDD(Hard Disk Drive)33、およびMFP100および音声処理装置200と通信するネットワークコントローラー35を含む。RAM32は、各種情報を記憶する領域と、CPU30でプログラムを実行する際の作業領域とを含む。ネットワークコントローラー35は、MFP100および音声処理装置200と通信するための通信回路の一実施例である。ネットワークコントローラー35は、NICなどを含む。なお、サーバー300は1つのCPU30を備えるが、1または複数のプロセッサを備えても良い。
リーダー/ライター36は、記録媒体37が脱着自在に装着される。リーダー/ライター36は、装着された記録媒体37からプログラムまたはデータを読出す回路と、記録媒体37にデータを書込む回路を有する。
(a4.音声処理装置200のハードウェア構成)
図4は、実施の形態にかかる音声処理装置200のハードウェア構成の一例を概略的に示す図である。図4を参照して、音声処理装置200は、音声処理装置200を制御するための制御部に相当するCPU20、ディスプレイ23、LED(light Emitting Diode)23A、マイク24、ユーザーが音声処理装置200に情報を入力するために操作する操作パネル25、記憶部26、NICまたはLAN回路などの通信回路を含む通信コントローラー27、およびスピーカー29を備える。記憶部26は、CPU20により実行されるプログラムおよびデータを記憶するためのROM21、RAM22、およびハードディスク装置を含むメモリ28を備える。ディスプレイ23と操作パネル25は、一体的に構成されたタッチパネルとして提供されてもよい。音声処理装置200は、通信コントローラー27を介してサーバー300またはMFP100などと通信することができる。
音声処理装置200は、マイク24を介して周囲の発話を含む音声を集音する。CPU20は、集音された音声の音声信号をデジタルデータに変換し、これにより音声データ40を生成する。CPU20はサーバー300からのコマンドに従いマイク24のON(オン)またはOFF(オフ)を切替える。また、音声処理装置200は音声データを再生しスピーカー29から出力する。スピーカー29から出力される音声データは、例えば記憶部26に格納された音声データまたはサーバー300またはMFP100などの外部の装置から受信した音声データが含まれる。
なお、マイク24は、MFP100が備えるマイク177と同様の周波数特性または方向の特性を有していてもよい。また、音声処理装置200も人感センサ(図示せず)を備えて、人感センサの出力に基き、人の存在が検知されると判定したとき、マイク24からの音声に基づく音声データ40を生成するとしてもよい。
<B.ジョブデータ50とフレーム57>
図5は、実施の形態にかかるジョブデータ50の構成を概略的に示す図である。図5のジョブデータ50は、例えば画像出力部154のプリンターに画像を印刷させるためのジョブに対応する。図5を参照してジョブデータ50は、PJLデータ51、PDL(ページ記述言語)データ52およびジョブデータ50の識別子、例えばジョブデータ50のユーザーを識別するユーザーID53を含む。本実施の形態では、サーバー300は、印刷対象となるデータ(以下、印刷対象データという)をPDLデータ52に変換し、PDLデータ52をPJLデータ51およびユーザーID53が付加されたジョブデータ50としてMFP100に送信する。PJLデータ51は、PJL形式で記述された指令を示す。この指令は、サーバー300が音声処理装置200から受信した音声データ40を認識処理することにより生成されるMFP100の操作指令571を含み得る。
ユーザーID53は、ジョブデータ50のユーザーの識別子であり、例えば音声処理装置200またはMFP100のユーザーのログイン名が含まれる。サーバー300のCPU30は、音声処理装置200またはMFP100からユーザーのログイン名を受信することができる。
図5を参照して、PJLデータ51は、PDLデータ52に直接影響を与えない命令が各種規定されている。たとえば、操作指令571(印刷部数の設定に関する指令、MFP100が備える図示されないステープル、パンチなどの機能を用いる場合に当該機能の操作に関する指令など)が記述される。
印刷対象データは、限定されないが、例えば文書データ、図のデータまたは表のデータなどである。サーバー300の記憶部34は、ユーザー毎に、当該ユーザー識別子(ログイン名等)に関連付けて印刷対象データを格納することができる。例えば、サーバー300のCPU30は、受信したユーザー識別子(ログイン名)に関連付けられた記憶部34の印刷対象データをPDLデータ52に変換する。
本実施の形態では、印刷対象データは、サーバー300に格納されているとするが、これに限定されない。変形例として、印刷対象データは、MFP100の記憶部173に格納されていてもよい。この場合は、ジョブデータ50のPDLデータ52は、記憶部173に格納された印刷対象データを示す。具体的には、CPU150は、サーバー300からPJL51とユーザーID53を受信すると、ユーザーID53に関連付けられた記憶部173の印刷対象データをPDLデータ52に変換する。これにより、MFP100のCPU150は、サーバー300から受信したPJL51およびユーザーID53、ならびには、記憶部173の印刷対象データから生成したPDLデータ52からジョブデータ50を生成することができる。
ジョブデータ50はMFP100により処理される。具体的には、画像出力部154は、操作指令571を処理する。これにより、ジョブデータ50のPDLデータ52を、図示しないファームウェアを用いて記憶部160のRAM上でビットマップデータとして展開する。画像出力部154の図示しないプリンターは、ビットマップデータ(PDLデータ52)に従って印刷用紙に対する印字処理を実行し、操作指令571に従い、ステープル機能、指定部数の印刷するためのソーター機能等を駆動する。
本実施の形態では、ジョブデータ50は、上記に述べた印刷ジョブに限定されず、例えばファクシミリ通信ジョブであってもよい。また、操作指令571も、印刷ジョブのための指令に限定されず、ファクシミリ通信ジョブのための操作指令であってもよい。
図6は、実施の形態にかかるフレーム57の構成を概略的に示す図である。図6のフレーム57は、ジョブデータ50とは異なり、処理の対象となるデータ(例えばPDLデータ52等)を含まないフォーマットを有する。フレーム57は、操作指令571とユーザーID53とを含む。操作指令571は、サーバー300が音声処理装置200から受信した音声データ40を認識処理することにより生成されるMFP100を操作するための指令である。
<C.サーバー300の機能構成>
図7は、実施の形態にかかるサーバー300の機能構成の一例を模式的に示す図である。図8は、実施の形態にかかる指令可否テーブル342の一例を模式的に示す図である。図7を参照して、サーバー300は、ネットワークコントローラー35を介して受信される音声データ40を用いて音声認識処理を実施する音声認識エンジン310、および音声認識結果に基づき、操作指令571を生成し、操作指令571を有するジョブデータ50またはフレーム57を生成するMFP制御モジュール320を備える。サーバー300は、生成された操作指令571(ジョブデータ50およびフレーム57)を、MFP100に送信するように、ネットワークコントローラー35を制御する。
音声認識エンジン310またはMFP制御モジュール320は、CPU30が記憶部34または記録媒体37に格納されたプログラムを実行することにより実現される。なお、音声認識エンジン310、またはMFP制御モジュール320は、ASIC(Application Specific Integrated Circuit)またはFPGA(Field-Programmable Gate Array)などの回路、または回路とプログラムの組合せにより実現されてもよい。
また、記憶部34は、辞書340、MFP100の状態を示すMFP状態341、指令可否テーブル342(図8参照)、ON/OFFデータ領域345およびガイダンスデータ344を格納する。辞書340は、MFP100を操作するための複数の指令と、各操作指令に対応のテキストデータ(当該指令を表す文字列からなるテキストデータ)が登録されている。
ON/OFFデータ領域345は、音声処理装置200(より特定的にはマイク24)のON/OFFの切替え、およびMFP100の装置側生成部101による操作指令571の生成の禁止/許可の切替えの履歴を示す。なお、これらの切替えの詳細は後述する。
MFP制御モジュール320は、禁止/許可コマンド生成部321、MFP100からの状態61を受信し、記憶部34にMFP状態341として格納する状態取得部322、操作指令571を生成するサーバー側生成部324および通知部325を含む。禁止/許可コマンド生成部321は、MFP状態341に基づき、MFP100が所定状態であるとき、装置側生成部101による操作指令572の生成を許可する値が設定された禁止/許可コマンド573を生成し、MFP100が非所定状態であるときは、装置側生成部101による操作指令572の生成を禁止する値が設定された禁止/許可コマンド573を生成する。禁止/許可コマンド生成部321は、生成した禁止/許可コマンド573をMFP100に送信するように、ネットワークコントローラー35を制御する。
サーバー側生成部324は、音声認識エンジン310による音声データ40の認識結果に基づく操作指令571を生成する。サーバー側生成部324は、生成した操作指令571をMFP100に送信するように、ネットワークコントローラー35を制御する。
MFP制御モジュール320は、MFP状態341および指令可否テーブル342に基づき、操作指令571を送信するか否かを決定してもよい。MFP制御モジュール320は、MFP状態341に基づき指令可否テーブル342を検索し、検索の結果、所定状態を示すと判断したとき、サーバー側生成部324による操作指令571の生成を禁止すると決定する。
また、この禁止状態において、サーバー側生成部324が指令の生成が禁止される場合、音声処理装置200がユーザーの発話の音声を集音したとき、すなわち音声データ40を受信したとき(または音声認識エンジン310が音声データ40の認識結果を出力するとき)、所定通知を出力するよう音声処理装置を制御してもよい。この所定状態は、MFP状態341がジョブ実行中の状態を含む。また、通知部325は、ガイダンスデータ344に基づき所定通知を出力するコマンドを生成し音声処理装置200に出力する。この所定通知は、例えば、音声を受け付けたがMFP100は所定状態なので指令は送信しない、旨のガイダンスを示す。音声処理装置200は、通知部325から受信するコマンドを実行することにより、所定通知をスピーカー29から音声出力する。これにより、ユーザーに対して、音声処理装置200を介した発話による操作指示は受け付けていないことを通知することができる。
状態取得部322は、MFP100から、MFP100の状態61を受信し、受信した状態61をMFP状態341として記憶部34に格納する。本実施の形態では、MFP100が定期的に自装置の状態61を検出して、サーバー300に送信する、または自装置の状態が変化したときに状態61をサーバー300に送信する。これにより、MFP状態341はMFP100の最新の状態を示す。
なお、状態取得部322が状態61を取得する方法は、これに限定されない。例えば、状態取得部322から定期的にMFP100に問合せを送信し、MFP100は当該問合せの応答として状態61をサーバー300に送信するとしてもよい。また、MFP状態341は、状態61を受信する順番に従う時系列の状態61を含んでもよい。
図8を参照して、指令可否テーブル342は、MFP100が取り得る複数の状態3421と、各状態3421に対応付けられた指令生成可否のデータ3422を有する。指令生成可否のデータ3422は、装置側生成部101に操作指令572の生成を許可(可:OK)する、または生成を禁止する(否:NG)を示す。限定されないが、例えば、指令可否テーブル342は、MFP100の状態3421として、プリンターのモーターの回転速度が低速であり比較的動作音が小さい「低回転モード」および動作音が大きい「プリントジョブ実行中」等を含む。「低回転モード」の状態3421に対応の指令生成可否のデータ3422は「OK」を示し、「プリントジョブ実行中」の状態3421に対応の指令生成可否のデータ3422は「NG」を示す。
この指令可否テーブル342は、MFP100のハードウェア(ローラー、モーター、またはソーターなど)から発生する動作音が大きい状態であるときは、サーバー300からMFP100に対する操作指令571の送信は禁止されて、MFP100から発生する動作音が小さい状態であるときは、操作指令571の送信が許可されることも規定する。本実施の形態では、MFP100から発生する動作音が小さい状態は、MFP100が動作していない状態を含む。
通知部325は、音声データ40による操作指令571がMFP100により処理されたとき、または処理が完了したとき、ガイダンスデータ344に基づき“指令が処理された(または処理完了)”した旨の音声データを生成し、MFP100または音声処理装置200に送信する。これにより、発話の音声データ40による操作指令571が処理されることを、音声処理装置200のスピーカー29またはMFP100のスピーカー178から音声で出力することができる。
なお、通知部325からの通知は、音声処理装置200またはMFP100による音声出力に限定されない。例えば、ランプの点灯、ディスプレイを用いてよく、またはユーザーの携帯型端末に当該通知を送信するとしてもよい。この場合は、MFP100または音声処理装置200から離れて居るユーザーに対しては、携帯型端末から音声、画像または点灯などにより通知することができる。
<D.MFP100の機能構成>
図9は、実施の形態にかかるMFP100の機能構成の一例を模式的に示す図である。図10は、実施の形態にかかる可能指令テーブル343の一例を模式的に示す図である。図9を参照して、MFP100は、指令受付部110、装置側生成部101、指令処理部120、ユーザー指令受付部130および状態提供部140を備える。指令受付部110は、サーバー300から送信された操作指令571(ジョブデータ50またはフレーム57)または禁止/許可コマンド573を通信I/F156を介して受付ける。ユーザー指令受付部130は、ユーザーが操作部172を操作することによりMFP100に対して入力する操作指令を受付ける。指令処理部120は、指令受付部110またはユーザー指令受付部130が受付ける操作指令、または装置側生成部101からの操作指令572を処理する。具体的には、操作指令を解釈して制御データを生成し、生成された制御データを、画像形成ユニット180を含む各部に出力する。
MFP100の画像形成ユニット180の各部では、制御データが例えば電気信号等の駆動信号に変換されて、各部は駆動信号に従い駆動される。その結果、ユーザーは発話により、MFP100を制御することができる。
状態提供部140は、MFP100の状態61を周期的に検知する状態検知部141を含む。状態検知部141は、MFP100の各部から出力される信号またはデータに基づき、または、記憶部160に格納されたMFP100の動作モードを示すモードデータ161に基づき、MFP100の状態61を検知する。状態提供部140は、検知された状態61を周期的にサーバー300に送信する。または、状態提供部140は、MFP100の状態61が変化したとき、状態61をサーバー300に送信する。これにより、状態提供部140は、サーバー300に、MFP100の最近の状態61を送信することができる。
装置側生成部101は、音声認識部106と、音声処理部105を含む。音声認識部106は、マイク177により集音される発話の音声を認識し、音声処理部105は認識結果に基くMFP100(または画像形成ユニット180)を操作する操作指令572を生成する。音声認識部106は、集音された発話による音声データを認識する。音声処理部105は、その認識結果(例えば、文字列のテキストデータ)に基づき記憶部160の可能指令テーブル343を検索する。音声処理部105は、検索の結果に基づき、可能指令テーブル343から認識結果に対応する操作指令572を読出す。これにより、マイク177を介して集音した発話による操作指令572が生成される。
装置側生成部101はMFP状態341または指令受付部110からの禁止/許可コマンド573に基づき、操作指令572を生成するか否かを決定してもよい。具体的には、装置側生成部101は、MFP状態341が所定状態を示すときは、当該操作指令572を生成し、禁止/許可コマンド573が“許可”を示すときは、当該操作指令572を生成する。装置側生成部101は、マイク177をON/OFFすることにより、または音声処理部105または音声認識部106を起動するか停止するかにより、操作指令572を生成するか否かを決定してもよい。
また、指令処理部120は、MFP状態341または指令受付部110からの禁止/許可コマンド573に基づき、装置側生成部101からの操作指令572を各部に出力するか否かを決定してもよい。
これにより、マイク177を介して集音した発話の音声に基づく操作指令572は、MFP状態341が所定状態を示すとき、または禁止/許可コマンド573が“許可”を示すときのみ、画像形成ユニット180の各部に出力される。
なお、音声処理部105が入力する音声は、マイク177からの経路に限定されない。例えば、音声処理装置200がMFP100に接続される場合は、音声処理部105は、音声処理装置200から発話による音声データ40を入力しても良い。
図10を参照して、可能指令テーブル343は、所定種類の操作指令572を含む。所定種類の操作指令572は、MFP100(画像形成ユニット180)がジョブを実行中にMFP100を操作可能な操作指令のうち、他の操作指令よりも優先して処理されるべき種類の指令を含む。より具体的には、操作指令572は、ジョブの実行を停止または中断させるための操作指令(キャンセル、ストップ、止めて)を含む。
このように、装置側生成部101は、発話の音声から、所定種類の操作指令572に限定して認識できればよいから、操作指令572の生成に必要なリソースおよび処理負荷を、サーバー側生成部324に比較して少なくすることができる。
図10に示す各部は、CPU150が記憶部160または記録媒体176に格納されたプログラムを実行することにより実現される。なお、図10の各部は、ASICまたはFPGAなどの回路、または回路とプログラムの組合せにより実現されてもよい。
<E.処理フロー>
図11は、本実施の形態にかかる処理のフローチャートの一例を示す図である。図12は、本実施の形態にかかるMFP100の状態に応じた処理のフローチャートの一例を示す図である。図11と図12のフローチャートは、サーバー300が実施する処理とMFP100が実施する処理が関連付けて示されている。図11と図12では、MFP100は、ジョブデータ50の操作指令571を処理する場合を説明するが、フレーム57の操作指令571を処理する場合であっても同様の処理を適用することができる。
(e1.全体処理)
図11を参照して、MFP100の状態に応じて装置側生成部101が操作指令572を生成するか否かを切替える処理を説明する。まず、ユーザーは、ジョブデータ50の操作指令571を発話する。音声処理装置200は、ユーザーの発話による音声を集音し、音声データ40を生成しサーバー300に送信する。サーバー300は音声データ40を受信し(ステップT1)、音声認識エンジン310は、受信された音声データ40を認識処理し(ステップT3)、サーバー側生成部324は、認識結果に基づく操作指令571を生成する(ステップT5)。サーバー側生成部324は、生成された操作指令571を含むジョブデータ50を生成する(ステップT7)。MFP制御モジュール320は、生成されたジョブデータ50をMFP100に送信するように、ネットワークコントローラー35を制御する(ステップT9)。このとき、操作指令571を含むフレーム57が送信されてもよい。
通知部325は、操作指令571を有するジョブデータ50がMFP100で処理完了した旨の通知574を、例えば音声処理装置200に送信する。音声処理装置200は、通知574に基づく音声をスピーカー29から出力する。
MFP100では、指令受付部110は、サーバー300からジョブデータ50を受信する(ステップT13)。指令処理部120は、指令受付部110を介して受付けたジョブデータ50の操作指令571を処理する(ステップT15)。これにより、画像形成ユニット180の各部に制御データが出力される。
装置側生成部101は、マイク177を介してユーザーの発話による音声を受け付けるか否か、すなわちマイク177から音声が出力されるか否かを判断する(ステップT19)。装置側生成部101は、音声を受付けたことを判断すると(ステップT19でYES)、音声処理部105および音声認識部106は、受付けた音声を認識する(ステップT21)。装置側生成部101は、認識結果に基づき可能指令テーブル343を検索する。装置側生成部101は、検索結果に基づき、認識結果は可能指令テーブル343が有する操作指令572、すなわち上記に述べた優先して処理すべき操作指令572を示すか否かを判断する(ステップT23)。
装置側生成部101は、マイク177を介した音声の認識結果は可能指令テーブル343における優先して処理すべき操作指令572を示すと判定すると(ステップT23でYES)、可能指令テーブル343から検索された操作指令572を指令処理部120に出力する。指令処理部120は、操作指令572を処理することにより、操作指令572に従い各部を画像形成ユニット180の各部を制御する(ステップT25)。ステップT25では、実行中のジョブデータ50の処理が中断または停止する。CPU101は、MFP状態341をジョブデータ50または操作指令571の処理の中断または停止を示すように更新(変更)する(ステップT27)。
一方、装置側生成部101は、マイク177から音声を受付けていないと判定すると(ステップT19でNO)または、受付た音声の認識結果は可能指令テーブル343における操作指令572を示さないと判定すると(ステップT23でNO)、CPU101は、画像形成ユニット180からの出力等に基づき、操作指令571を含むジョブデータ50の処理が終了したか否かを判定する(ステップT29)。CPU101は、操作指令571を含むジョブデータ50の処理が終了していないと判定すると(ステップT29でNO)、ステップT19戻る。また、CPU101は、操作指令571を含むジョブデータ50の処理が終了していると判定すると(ステップT29でYES)、CPU101は、MFP状態341を、操作指令571を含むジョブデータ50の処理が終了したことを示すように更新(変更)する(ステップT31)。
図11によれば、MFP100が操作指令571を含むジョブデータ50のジョブを実行中に、MFP100のマイク177を介して集音したユーザーの発話による音声が操作指令572を示すときは(すなわち、ジョブ実行中に処理され得る操作指令のうち優先して処理されるべき操作指令を示すときは)、操作指令572が処理される。
上記に述べたステップT19で、装置側生成部101が音声を受付けることで、MFP100は、受付けた音声に基づく操作指令572により、操作指令571を含むジョブの実行を中断または停止する。ステップT19で、装置側生成部101が音声を受付けるか否かは、図12に示すように、サーバー300からの禁止/許可コマンド573により、すなわちMFP100の状態に応じて切り替えることができる。
(e2.装置側生成部101による操作指令の生成の許可/禁止)
サーバー300がMFP100の状態に基づく禁止/許可コマンド573を送信する処理を説明する。図12を参照して、サーバー300の状態取得部322は、状態を取得するためのコマンドをMFP100に送信する(ステップS3)。MFP100の状態提供部140はサーバー300から送信された当該コマンドを受付け、状態検知部141は当該コマンドに従いMFP100の状態を検知する(ステップS5,S7)。状態提供部140は、検知された状態61をサーバー300に送信するよう通信I/F156を制御する(ステップS9)。
サーバー300の状態取得部322は、MFP100から状態61を受信し(ステップS11)、記憶部160のMFP状態341を受信した状態61を示すように更新する。禁止/許可コマンド生成部321は、MFP状態341に基づき指令可否テーブル342を検索する(ステップS13)。禁止/許可コマンド生成部321は、検索の結果に基き、指令可否テーブル342から、MFP状態341に一致する状態3421に対応の指令生成可否のデータ3422を読出す。禁止/許可コマンド生成部321は、読出された指令生成可否のデータ3422に従い、装置側生成部101による操作指令572の生成を許可するか禁止するかを判定する(ステップS15)。
例えば、MFP状態341が所定状態である“ジョブ実行中”を示す場合は、対応の指令生成可否のデータ3422は“NG”を示し(図8参照)、禁止/許可コマンド生成部321は、装置側生成部101による操作指令572の生成を禁止すると判定する(ステップS15でNO)。CPU30は、音声処理装置200にOFFのコマンド575を送信する(ステップS17)。音声処理装置200のCPU20は、サーバー300において音声データ40に基づく操作指令571の生成がなされないように音声処理装置200を制御する。例えば、CPU20は、ステップS17でサーバー300から送信されたコマンド575に従い、マイク24をオフにする。これにより、CPU30は、MFP100が所定状態であるとき、サーバー側生成部324による操作指令571の生成を禁止する。
なお、ステップS17では、音声データ40に基づく操作指令571の生成を禁止するために、CPU30は、音声認識エンジン310またはサーバー側生成部324を、処理を実施しないようにオフ状態に設定してもよい。
禁止/許可コマンド生成部321は、“許可”に設定した禁止/許可コマンド573を生成し、MFP100に送信する(ステップS19)。CPU30は、ステップS17で送信したコマンド575またはステップS19で送信した禁止/許可コマンド573を、それぞれ時間データと関連付けて記憶部34のON/OFFデータ領域345に保存(格納)する(ステップS21)。
一方、MFP状態341が非所定状態の“低回転モード”を示す場合は、対応の指令生成可否のデータ3422は“OK”を示し(図8参照)、禁止/許可コマンド生成部321は、装置側生成部101による操作指令572の生成を禁止すると判定する(ステップS15でYES)。
CPU30は、音声処理装置200にONのコマンド575を送信する(ステップS23)。音声処理装置200のCPU20は、サーバー300において音声データ40に基づく操作指令571の生成が許可(実施)されるように音声処理装置200を制御する。例えば、CPU20は、ステップS23でサーバー300から送信されたコマンド575に従い、マイク24をオンにする。
なお、ステップS17では、音声データ40に基づく操作指令571の生成が実施されるようにするために、CPU30は、音声認識エンジン310またはサーバー側生成部324を、処理を実施するようにオン状態に設定してもよい。
禁止/許可コマンド生成部321は、“禁止”に設定した禁止/許可コマンド573を生成し、MFP100に送信する(ステップS25)。CPU30は、ステップS23で送信したコマンド575またはステップS25で送信した禁止/許可コマンド573を時間データと関連付けて記憶部34のON/OFFデータ領域345に保存(格納)する(ステップS27)。
MFP100では、指令受付部110は、サーバー300から禁止/許可コマンド573を受信し(ステップS31)、CPU150は、禁止/許可コマンド573が“禁止”を示すと判定すると(ステップS32で“禁止”)、マイク177が集音した発話の音声に基づく操作指令572の生成を禁止する(生成しない)ように装置側生成部101を制御する(ステップS33)。また、CPU150は、禁止/許可コマンド573が“許可”を示すと判定すると(ステップS32で“許可”)、マイク177が集音した発話の音声に基づく操作指令572の生成を許可(生成する)ように装置側生成部101を制御する(ステップS35)。
図12によれば、サーバー300のCPU30は、MFP100が所定状態(例えば、ジョブ実行状態)であるとき、MFP100の装置側生成部101による操作指令572の生成を許可するための禁止/許可コマンド573を送信し、およびMFP100が非所定状態(例えば、低回転モード)であるとき、装置側生成部101による操作指令572の生成を禁止するための禁止/許可コマンド573を送信する。
図11のステップT19に戻ると、サーバー300からの禁止/許可コマンド573が操作指令572の生成の許可を示すとき、装置側生成部101はマイク177を介してユーザーの発話による音声を受付けることが可能となる(ステップT19でYES)。これに対して、サーバー300からの禁止/許可コマンド573が操作指令572の生成の禁止を示すとき、装置側生成部101はマイク177を介してユーザーの発話による音声を受付けることが不可能となる(ステップT19でNO)。
なお、通知部325は、ステップS21およびステップS27においてON/OFFデータ領域345に格納されているデータを通知してもよい。具体的には、通知部325は、ON/OFFデータ領域345のデータに基き、音声処理装置200(より特定的にはマイク24)のON/OFFの切替え、およびMFP100の装置側生成部101による操作指令571の生成の禁止/許可の切替えの履歴(時系列データ)の通知を作成する。通知部325は、作成した通知を出力コマンドとともに、音声処理装置200またはMFP100に送信する。音声処理装置200は、通知部325からの出力コマンドに従い履歴の通知をスピーカー29から音声出力する。また、MFP100は、通知部325からの出力コマンドに従い、履歴の通知を表示部171またはスピーカー178から出力する。
これにより、ユーザーは、発話による音声処理装置200を介した操作指令571および発話によるMFP100のマイク177を介した操作指令572によるMFP100の操作の履歴(実行中のジョブの中断、停止、キャンセル等)を管理することができる。
(e3.処理の変形例)
図12のステップS17、S23、S33およびS35では、装置側生成部101による操作指令572の生成が許可される場合は、サーバー300での操作指令571の生成が禁止される(音声認識がされない、または音声処理装置200のマイク24がオフ)としているが、操作指令572の生成が許可される場合にサーバー300での操作指令571の生成も許可されてよい。この場合、MFP100が所定状態であるときに、指令処理部120は操作指令571および572の両方を受付けることになる。指令処理部120は、これら受付ける操作指令のうち所定種類の操作指令(可能指令テーブル343に登録されテイル操作指令)のみに限定して処理する。したがって、MFP100が所定状態において意図しない操作指令(すなわち、可能指令テーブル343に登録された操作指令572とは異なる操作指令)が処理される事態を防止することができる。
(e4.処理のさらなる変形例)
図12では、ステップS17とS23において、サーバー300はMFP状態341に応じて音声処理装置200のオン/オフ(マイク24のオン/オフ)の切替えを実施するとともに、ステップS19とS25において、サーバー300は装置側生成部101による操作指令572の生成の許可/禁止の切替えを実施したが、これらを実施する主体はサーバー300に限定されず、MFP100であってもよい。
この場合、MFP100は、状態検知部141が検知するMFP100の状態61に応じて、音声処理装置200のオン/オフ(マイク24のオン/オフ)の切替えを制御するコマンドを音声処理装置200に送信し、また、操作指令572の生成の許可/禁止の切替えを制御するコマンドを装置側生成部101に出力する。これにより、サーバー300とMFP100間のネットワーク400を経由した通信を省略することができる。
<F.プログラム>
本実施の形態では、上記に述べた処理をMFP100およびサーバー300に実行させるためのプログラムが提供される。このようなプログラムは、少なくとも上記の図11または図12のフローチャートに従う処理のプログラムを含む。MFP100およびサーバー300のコンピューターに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM、RAMおよびメモリカードなどのコンピューター読み取り可能な記録媒体176,37に記録させて、プログラム製品として提供することもできる。あるいは、コンピューターに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワーク400を介したダウンロードによって、プログラムを提供することもできる。プログラムは、CPUなどの1つ以上のプロセッサにより、またはプロセッサとASIC,FPGAなどの回路との組合せにより実行され得る。
なお、プログラムは、コンピューターのOS(Operating System)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して、プロセッサに処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、各実施の形態のプログラムに含まれ得る。
また、本実施の形態にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して、プロセッサに処理を実行させる。このような他のプログラムに組込まれたプログラムも、本実施の形態にかかるプログラムに含まれ得る。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 システム、24,177 マイク、40 音声データ、50 ジョブデータ、61,341,3421 状態、101 装置側生成部、105 音声処理部、106 音声認識部、110 指令受付部、120 指令処理部、130 ユーザー指令受付部、140 状態提供部、141 状態検知部、151 画像処理部、152 画像形成部、153 ファクシミリ制御部、154 画像出力部、179 人感センサ、180 画像形成ユニット、200 音声処理装置、300 サーバー、310 音声認識エンジン、320 制御モジュール、321 禁止/許可コマンド生成部、322 状態取得部、324 サーバー側生成部、325 通知部、340 辞書、342 指令可否テーブル、343 可能指令テーブル、344 ガイダンスデータ、345 ON/OFFデータ領域、400 ネットワーク、571,572 操作指令、573 禁止/許可コマンド、574 通知、575 コマンド。

Claims (13)

  1. 画像形成装置と、
    発話の音声を集音する音声処理装置と、
    サーバーと、を備え、
    前記画像形成装置は、
    発話の音声を認識し当該画像形成装置の操作指令を生成する装置側生成部を含み、
    前記サーバーは、
    当該サーバーを制御する制御部と、
    前記画像形成装置および前記音声処理装置と通信する通信回路と、を含み、
    前記制御部は、
    前記音声処理装置から受信する音声を認識し前記操作指令を生成するサーバー側生成部を含み、
    前記画像形成装置は、
    前記サーバーから受信する操作指令および前記装置側生成部が生成する操作指令の一方を処理する、システム。
  2. 前記画像形成装置は、当該画像形成装置の状態に応じて、前記サーバーから受信する操作指令および前記装置側生成部が生成する操作指令の一方を処理する、請求項1に記載のシステム。
  3. 前記制御部は、
    前記画像形成装置が所定状態であるとき、前記装置側生成部による操作指令の生成を許可するコマンドを前記画像形成装置に送信するよう前記通信回路を制御し、および前記画像形成装置が非所定状態であるとき、前記装置側生成部による操作指令の生成を禁止するコマンドを前記画像形成装置に送信するよう前記通信回路を制御する、請求項1または2に記載のシステム。
  4. 前記制御部は、
    前記画像形成装置が所定状態であるとき、前記サーバー側生成部による操作指令の生成を禁止する、請求項1から3のいずれか1項に記載のシステム。
  5. 前記制御部は、前記サーバー側生成部による操作指令の生成が禁止される場合、所定通知を出力させるコマンドを前記音声処理装置に送信する、請求項4に記載のシステム。
  6. 前記所定状態は、前記画像形成装置がジョブを実行中の状態を含む、請求項3から5のいずれか1項に記載のシステム。
  7. 前記装置側生成部が生成する操作指令は、前記ジョブを実行中の前記画像形成装置を操作する指令のうち、他の指令よりも優先して処理される操作指令を含む、請求項6に記載のシステム。
  8. 前記優先して処理される操作指令は、前記ジョブの実行を停止または中断させるための操作指令を含む、請求項6または7に記載のシステム。
  9. 前記画像形成装置は、当該画像形成装置の状態を前記サーバーに送信する、請求項1から8のいずれか1項に記載のシステム。
  10. 前記装置側生成部が音声認識により生成するべき操作指令の種類は、前記サーバー側生成部が音声認識により生成するべき操作指令の種類よりも少ない、請求項1から9のいずれか1項に記載のシステム。
  11. サーバーとネットワーク接続される画像形成装置であって、
    画像形成ユニットと、
    制御部と、を備え、
    前記サーバーは、音声処理装置から受信する発話に基づく音声を認識し前記画像形成ユニットの操作指令を生成するよう構成されて、
    前記制御部は、
    発話に基づく音声を認識し前記操作指令を生成する指令生成部を有し、
    前記制御部は、
    前記サーバーから受信する操作指令および前記指令生成部が生成する操作指令の一方を処理する、画像形成装置。
  12. サーバーとネットワーク接続される画像形成装置に備えられるプロセッサが実行する方法であって、
    前記画像形成装置は、さらに画像形成ユニットを備え、
    前記サーバーは、音声処理装置から受信する発話に基づく音声を認識し前記画像形成ユニットを操作する操作指令を生成するよう構成されて、
    前記方法は、
    前記サーバーから操作指令を受信するステップと、
    発話に基づく音声を認識し前記操作指令を生成するステップと、
    前記受信するステップにおいて受信される操作指令および前記生成するステップにおいて生成される操作指令の一方を処理するステップとを備える、方法。
  13. 請求項12に記載の方法をコンピューターに実行させるためのプログラム。
JP2019032508A 2019-02-26 2019-02-26 システム、画像形成装置、方法およびプログラム Pending JP2020134903A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019032508A JP2020134903A (ja) 2019-02-26 2019-02-26 システム、画像形成装置、方法およびプログラム
US16/751,213 US20200274979A1 (en) 2019-02-26 2020-01-24 System, image forming apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019032508A JP2020134903A (ja) 2019-02-26 2019-02-26 システム、画像形成装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2020134903A true JP2020134903A (ja) 2020-08-31

Family

ID=72142828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019032508A Pending JP2020134903A (ja) 2019-02-26 2019-02-26 システム、画像形成装置、方法およびプログラム

Country Status (2)

Country Link
US (1) US20200274979A1 (ja)
JP (1) JP2020134903A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7459760B2 (ja) 2020-10-27 2024-04-02 セイコーエプソン株式会社 表示システムの制御方法、表示システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013064777A (ja) * 2011-09-15 2013-04-11 Ntt Docomo Inc 端末装置、音声認識プログラム、音声認識方法および音声認識システム
JP2014182307A (ja) * 2013-03-19 2014-09-29 Sharp Corp 音声認識システム、および発話システム
JP2014203024A (ja) * 2013-04-09 2014-10-27 コニカミノルタ株式会社 制御装置、画像形成装置、端末装置、制御方法、および制御プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013064777A (ja) * 2011-09-15 2013-04-11 Ntt Docomo Inc 端末装置、音声認識プログラム、音声認識方法および音声認識システム
JP2014182307A (ja) * 2013-03-19 2014-09-29 Sharp Corp 音声認識システム、および発話システム
JP2014203024A (ja) * 2013-04-09 2014-10-27 コニカミノルタ株式会社 制御装置、画像形成装置、端末装置、制御方法、および制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7459760B2 (ja) 2020-10-27 2024-04-02 セイコーエプソン株式会社 表示システムの制御方法、表示システム

Also Published As

Publication number Publication date
US20200274979A1 (en) 2020-08-27

Similar Documents

Publication Publication Date Title
US11475892B2 (en) Speech control system, speech control method, image processing apparatus, speech control apparatus, and storage medium
JP7195851B2 (ja) システム及び処理装置
KR102533074B1 (ko) 인쇄 시스템, 제어 방법, 및 서버
JP2006330576A (ja) 機器操作システム、音声認識装置、電子機器、情報処理装置、プログラム、及び記録媒体
US20200076969A1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
US11327697B2 (en) Information processing apparatus and startup method for input-output device
US20230254421A1 (en) Image processing system, setting control method, image processing apparatus, and storage medium
US20200193991A1 (en) Image processing system, image forming apparatus, voice input inhibition determination method, and recording medium
JP2019215485A (ja) 画像形成装置、画像形成システム、制御方法および制御プログラム
US11683422B2 (en) Image processing system, image processing apparatus, and image processing method
JP2020134903A (ja) システム、画像形成装置、方法およびプログラム
JP2022001997A (ja) 情報処理装置、情報処理システム、制御方法、並びにプログラム
US20200366800A1 (en) Apparatus
JP7206827B2 (ja) システム、画像形成装置、方法およびプログラム
JP7415350B2 (ja) 音声操作システム、制御装置、および制御プログラム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
US11368593B2 (en) Image forming system allowing voice operation, control method therefor, and storage medium storing control program therefor
US11647130B2 (en) Information processing system capable of connecting a plurality of voice control devices, method of controlling information processing system, and storage medium
JP7261029B2 (ja) サーバシステム、制御方法、通信システム
US11837226B2 (en) Information processing apparatus, information processing method, electronic device and information processing system
JP2022096305A (ja) 情報処理システム、画像処理装置、情報処理システムの制御方法、及びプログラム
JP2021163069A (ja) 情報処理装置及びプログラム
JP2021163074A (ja) 情報処理装置及びプログラム
JP2022007018A (ja) 音声設定システム、音声設定支援装置および音声設定支援プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230411

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231010