JP6939426B2 - 画像処理装置およびその動作制御方法 - Google Patents

画像処理装置およびその動作制御方法 Download PDF

Info

Publication number
JP6939426B2
JP6939426B2 JP2017211524A JP2017211524A JP6939426B2 JP 6939426 B2 JP6939426 B2 JP 6939426B2 JP 2017211524 A JP2017211524 A JP 2017211524A JP 2017211524 A JP2017211524 A JP 2017211524A JP 6939426 B2 JP6939426 B2 JP 6939426B2
Authority
JP
Japan
Prior art keywords
job
voice
detection
target
execution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017211524A
Other languages
English (en)
Other versions
JP2019083497A (ja
Inventor
倫子 丸山
倫子 丸山
和弘 冨安
和弘 冨安
冨田 篤
篤 冨田
澤田 健一
健一 澤田
博 杉浦
博 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2017211524A priority Critical patent/JP6939426B2/ja
Priority to US16/166,382 priority patent/US10606531B2/en
Priority to EP18202838.1A priority patent/EP3480688A1/en
Publication of JP2019083497A publication Critical patent/JP2019083497A/ja
Application granted granted Critical
Publication of JP6939426B2 publication Critical patent/JP6939426B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1205Improving or facilitating administration, e.g. print management resulting in increased flexibility in print job configuration, e.g. job settings, print requirements, job tickets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00912Arrangements for controlling a still picture apparatus or components thereof not otherwise provided for
    • H04N1/00925Inhibiting an operation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Facsimiles In General (AREA)
  • Control Or Security For Electrophotography (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、画像処理装置およびその動作制御方法に関する。
音声認識技術の進歩により、各種の機器において、ユーザが音声により指示を入力する音声操作が実用化されている。一般に、音声操作に際して、ユーザは、発声ボタン(マイクアイコン)を押し、または機器に呼びかける定型の言葉を発し、それにより機器が指示を待ち受ける状態になっ後に指示の言葉を発声する。
他方、コピー機・ファクシミリ機・MFP(Multi-functional Peripheral :多機能機または複合機)などの画像処理装置は、接触式の操作のための操作パネルを備えている。一般に、操作パネルには、スタートキーおよびストップキーなどのハードキーとともに、多様な操作を可能にするタッチパネルディスプレイが配置されている。接触式の操作は、特に設定するべき項目が多いジョブを実行させたい場合のように複雑な操作を行う場合において、音声操作よりも効率がよい。
ところで、ユーザが画像処理装置に所望のジョブを入力して画像処理装置がジョブを実行している最中に、ユーザがそのジョブの設定の誤りに気づいて画像処理装置の動作を停止させたいと思う、という状況が起こり得る。この場合に、とっさに操作パネルのストップキーを押すことができればよいが、ストップキーを押すまでに時間がかかると、その間にジョブの処理はどんどん進行してしまう。結果的に、無駄な印刷が行われてしまったり、誤った宛先へ画像データが送信されてしまったりする。
ジョブの実行を速やかに停止するための先行技術として、特許文献1、2に記載の技術がある。
特許文献1には、ユーザによる操作の発話音声が認識された場合に、動作状態を停止状態に変更する画像形成装置が開示されている。
特許文献2には、処理が開始されてから予め定められた期間内に予め定められた音声を検知した場合に、当該処理を中断するコピー機が開示されている。
特開2010−136335号公報 特開2017−32844号公報
上に述べた特許文献1の技術は、ジョブの実行中は常に音声による停止の指示を受け付けるものである。このため、音声を誤認識するおそれが大きい、つまり誤って動作を停止してしまう状況が起こりやすい、という問題があった。ユーザの意図しない無用の停止により、ジョブの完了が遅れて画像形成の生産性が低下する。
特許文献2の技術では、処理の開始から時間が経過するに従って処理を中断する意味が薄れることが多いとの知見に基づいて、音声による中断の指示を受け付ける時期を処理の開始からの予め定められた経過時間内に制限する。これにより、声の誤認識による不用意な中断を抑えることができる。
しかし、ユーザがジョブを設定した操作の誤りに気づくタイミングは、次のようにジョブの種類によって異なる。
例えば、複数枚の原稿から画像を読み取って用紙に印刷するコピージョブには、各原稿の画像を読取り順に複数枚ずつ印刷するグループコピーと、各原稿の画像を読取り順に1枚ずつ印刷する動作を繰り返して複数部の複製を作成するソートコピーとがある。
操作の誤りの一例として、コピー枚数が所望数よりも多い場合(前のジョブの設定が残っていた場合など)を想定すると、誤りに気づくタイミングについて、次のことが考えられる。
グループコピーの場合には、画像の読取りが終わって印刷が始まってから2枚目の原稿の画像の印刷が始まるまでの間に気づくことが多い。
これに対して、ソートコピーの場合には、所望の部数の印刷が終わった後に以降の部の印刷が始まったときに気づくことが多い。
このようにユーザがジョブを設定する操作の誤りに気づくタイミングは、ジョブの種類によって異なり、しかも種類が同じであっても原稿の枚数およびコピー枚数などといったジョブの条件によって早いタイミングであったり遅いタイミングであったりする。
したがって、ジョブの開始から一定の時間が経過した段階で音声による指示の受け付けをやめてしまっては、ユーザが誤りに気づいても音声により動作を停止させることができない状況が起こるおそれがでてくる。
本発明は、このような問題に鑑みてなされたもので、ジョブの実行の無用の停止を低減するとともに、ユーザが音声により動作を停止させることができない状況を起こりにくくすることを目的とする。
本発明の実施形態に係る画像処理装置は、種類が異なる複数のジョブの実行が可能な画像処理装置であって、入力されたジョブの実行を制御する制御部と、音声検知手段により検知された音声に基づいて、予め定められた複数の対象音声のいずれかが発せられたことを検知する検知部と、を有し、前記制御部は、予めジョブの種類別に定められた設定期間のうちの実行中のジョブに対応する対象設定期間中に前記対象音声が発せられたことが検知された場合に、当該ジョブの実行を停止させる。
本発明によると、ジョブの実行の無用の停止を低減するとともに、ユーザが音声により動作を停止させることができない状況を起こりにくくすることができる。
本発明の一実施形態に係る画像処理装置の概略の構成を示す図である。 画像処理装置のハードウェア構成を示す図である。 音声操作機能に関わる要部の機能的構成の第1例を示す図である。 ジョブ制御部における停止制御の処理の流れを示す図である。 音声検知部における処理の流れを示す図である。 期間テーブルのデータの例を示す図である。 条件テーブルのデータの例を示す図である。 ワードテーブルのデータおよびその更新の例を示す図である。 ソートコピーにおける対象設定期間を示す図である。 マルチ動作において対象音声の検知がジョブの実行の停止に反映される対象停止期間を示す図である。 音声操作機能に関わる要部の機能的構成の第2例を示す図である。 ジョブ制御部における停止制御の処理の流れを示す図である。 音声検知部における処理の流れを示す図である。 期間テーブルのデータの例を示す図である。 画像処理装置における処理の流れを示す図である。 学習記憶処理の流れを示す図である。 再開処理の流れを示す図である。 ソートコピーにおける画像処理装置の処理の流れを示す図である。
図1には本発明の一実施形態に係る画像処理装置1の外観の例が、図2には画像処理装置1のハードウェア構成が、それぞれ示されている。
画像処理装置1は、コピー機、イメージリーダ、ファクシミリ機などの機能を集約したMFP(Multi-functional Peripheral :多機能機または複合機)である。すなわち、画像処理装置1は、コピー、スキャン、およびファクスといった種類の異なる複数のジョブの実行が可能である。そして、コピーにおける印刷動作中に他のコピーの原稿読取り動作を行うなど、複数のジョブを並行して実行するマルチ動作が可能に構成されている。
図1に示すように、画像形成装置1は、操作パネル11、自動原稿送り装置(ADF:Auto Document Feeder)12、フラットベッド型のスキャナ13、プリンタ部14、給紙部15、およびマイクロフォン22を備えている。さらに、図2に示すように、主制御部10、ファクシミリインタフェース16、ネットワークインタフェース17、補助記憶装置18、画像処理部19、制御データベース20、および音声認識部21などを備えている。
操作パネル11は、ユーザによる操作のための画面を表示するタッチパネルディスプレイ11Aと、スタートキー41およびストップキー42などのハードキーが配置されたキー入力部11Bとを有し、入力操作に応じた信号を出力する。この信号に応じて、主制御部10により、画像処理装置1の動作が制御される。
自動原稿送り装置12は、原稿トレイ12Aにセットされたシート状の原稿5をスキャナ13の流し読取り位置へ搬送する。さらに搬送を続けて原稿トレイ12Aの下方の排紙トレイ12Bへ原稿5を排出する。原稿5が複数枚である場合は、原稿トレイ12Aから1枚ずつ次々に取り出して搬送する。自動原稿送り装置12は、スキャナ13のプラテンガラスを覆うカバーとして開閉可能に設けられている。
スキャナ13は、自動原稿送り装置12から搬送されてきた原稿5またはプラテンガラスの上にユーザによりセットされた原稿の画像を読み取って画像データを生成する。モノクロ(グレースケール)およびフルカラーの読取りが可能である。
プリンタ部14は、コピージョブにおいてスキャナ13によって読み取られた画像を給紙部15から供給されたシート(記録用紙)の片面または両面に印刷する。外部のホストから入力されまたは内部のボックスから読み出されたドキュメントおよびファクシミリ通信で受信した画像などの印刷にも用いられる。印刷の方式は、例えば電子写真式でり、モノクロおよびフルカラーの印刷が可能である。インクジェット式または他の方式でもよい。
給紙部15は、多数枚のシートの収納が可能な複数の給紙トレイを備え、選択された給紙トレイからシートを取り出してプリンタ部14に供給する。
マイクロフォン22は、例えばスキャナ12のハウジングの前面部に配置され、画像処理装置1の周辺の音声を電気信号に変換して出力する。マイクロフォン22は、音声を検知する音声検知手段の一例である。
主制御部10は、画像処理装置1の全体的な制御を受け持つ。主制御部10は、CPU10a、RAM10b、ROM10c、および不揮発性メモリ10dを備える。
ROM10cまたは不揮発性メモリ10dには、画像処理装置1をコピー機、ファクシミリ機、およびイメージリーダなどとして動作させるために、自動原稿送り装置12、スキャナ13、およびプリンタ部14などを制御するプログラムが記憶されている。さらに、後に述べる特定の音声が発せられたことを検知したときにジョブの実行を停止する制御を実現するための音声操作プログラムが記憶されている。これらのプログラムは、必要に応じてRAM10bにロードされ、CPU10aによって実行される。
ファクシミリインタフェース16は、外部のファクシミリ端末との間でG3などのプロトコルを用いて画像データをやりとりするためのインタフェースである。通信回線として電話回線、およびインターネットなどが用いられる。
ネットワークインターフェース17は、パーソナルコンピュータおよびスマートフォンといった外部の情報処理装置との間で通信回線を介して通信するためのインタフェースである。通信回線として、ローカルエリアネットワーク回線(LAN回線)、およびインターネットなどが用いられる。
補助記憶装置18は、主制御部10から送られてくる画像データ、外部の装置から転送されてきたドキュメントのデータなどを記憶する。補助記憶装置18として、HDD(Hard Disk Drive )またはSSD(Solid State Drive )などが用いられる。
画像処理部19は、スキャナ13から送られてきた画像データにシェーディング補正や色収差補正といった読取り光学系の特性に関わる処理を施す。さらに、データの形式の変換、およびCPU10aと補助記憶装置18との間で画像データをやりとりする際の画像データの圧縮/伸張などを行う。
制御データベース20は、CPU10aなどが参照する各種データを容易に変更可能な形で格納した記憶手段である。制御データベース20を例えば補助記憶装置18または不揮発性メモリ10dに設けてもよい。制御データベース20に格納される情報には、画像処理装置1のユーザ登録に関する情報のほか、ユーザ(個人またはグループ)にデータ保存領域として割り当てられるボックスに関する情報など、随時に更新する必要な情報が含まれる。
音声認識部21は、マイクロフォン22から入力された音声信号に含まれる人の発した言葉をテキスト化する音声認識エンジンである。発声が困難なユーザのために、ブザー、鈴、ハンドクラップなどの声以外の特定の音声を言葉とみなしてテキスト化することができる。
音声の認識には、音声信号から音素を切り出して音響モデルと比較する公知の音響分析手法を用いることができる。また、音声の認識に際して、例えば音声信号をフーリエ変換する手法により、音声のトーン(人が知覚する音の高低)を判別することができる。
さて、画像処理装置1は、ジョブの実行中において所定の対象音声が発せられたときに、対象音声が発せられたことを検知してジョブの実行を停止する「音声操作機能」を有している。以下、この音声操作機能を中心に画像処理装置1の構成および動作を説明する。
図3には音声操作機能に関わる要部の機能的構成の第1例が、図4にはジョブ制御部における停止制御の処理の流れが、図5には音声検知部における処理の流れが、それぞれ示されている。
図3において、画像処理装置1は、ジョブ制御部50、音声検知部60、期間テーブル80、条件テーブル82、およびワードテーブル84を有する。ジョブ制御部50および音声検知部60の機能は、主制御部10のハードウェアおよびCPU10aが画像処理プログラムを実行することによって実現される。
期間テーブル80は、予めジョブの種類別に定められた設定期間を示し、条件テーブル82は、対象音声が発せられたとの検知結果の得られやすさを決める複数の検知条件を示す。ワードテーブル84は、予め定められた複数の対象音声を示す。条件テーブル82は、サブテーブルの例である。
ジョブ制御部50は、ユーザにより画像処理装置1に入力されたジョブの実行を制御する。すなわち、ジョブ制御部50は、実行するジョブに応じて動作部70に動作指令を与える。また、動作部70からの通知によりジョブの進行状況を把握し、ジョブの進行に合わせて指令先および指令の内容を適宜変更する。動作部70とは、ジョブの実行に関わるハードウェアおよびソフトウェアの総称であり、自動原稿送り装置12、スキャナ13、およびプリンタ部14などを含む。
加えて、ジョブ制御部50は、音声検知部60と連携して音声操作機能を実現する。詳しくは、ジョブ制御部50は、予めジョブの種類別に定められた設定期間のうちの実行中のジョブに対応する対象設定期間中に対象音声が発せられたことが音声検知部60により検知された場合に、動作部70に停止指令を与えてジョブの実行を停止させる。音声検知部60との連携について後にさらに詳しく述べる。
音声検知部60は、マイクロフォン22により検知された音声に基づいて、予め定められた複数の対象音声のいずれかが発せられたことを検知する。音声検知部60は、音声認識部21と照合部23とを有している。なお、「対象音声が発せられたことの検知」を、「対象音声の検知」と記載することがある。
音声認識部21は、上に述べた通り、マイクロフォン22から入力された音声を認識してテキスト化する。
照合部23は、音声認識部21により認識された音声のテキストとワードテーブル84にテキストの形で登録されている複数の対象音声とを照合する。そして、認識された音声が複数の対象音声のいずれかと一致する場合に、対象音声を検知した旨の検知結果をジョブ制御部50に通知する。この場合にジョブの実行が停止される。
図3の例の構成では、音声検知部60は、ジョブ制御部50から検知指令に従って対象音声が発せられたことの検知(音声検知)を行う。つまり、音声検知部60が音声検知を行うか否かをジョブ制御部50が制御する。詳しくは次の通りである。
図4を参照して、ジョブ制御部50は、ジョブの実行に先立って期間テーブル80を参照し、種類別の設定期間のうちの実行の対象である当該ジョブの種類に対して定められている設定期間である対象設定期間を把握する(#501)。つまり、ジョブの進行における如何なるタイミングで音声検知を開始させ、如何なるタイミングで音声検知を終了させるかを決めておく。
ジョブの実行中はジョブの進行状況を監視し(#502)、対象設定期間の開始タイミングが到来すると(#503でYES)、音声検知開始を指令する(#504)。このとき、音声検知モードを通知する。また、対象設定期間の終了タイミングが到来すると(#507でYES)、音声検知終了を指令する(#508)。
そして、音声検知部60から対象音声を検知した旨の検知結果が通知されると(#505でYES)、ジョブの実行を停止させる。検知結果が通知されない場合は(#505でNO)、ジョブを実行を停止させることなく進行の監視を続ける(#502)。
他方、音声検知部60では、図5に示すように処理が行われる。
音声検知部60は、音声検知開始が指令されるのを待つ(#601)。音声検知開始が指令されると(#601でYES)、指令とともに通知される音声検知モードに応じて、マイクロフォン22からの入力を受け付ける音声の音量を設定する(#602)。すなわち、入力感度を高くしたり低くしたりする。入力感度を高くすると、大きな音声も小さな音声も認識することになり、入力感度を低くすると、大きな音声のみを認識し、小さな音声は認識しないことになる。
続いて、直ちに音声認識を開始する(#603)。音声をテキスト化するとともに、必要に応じて音声のトーンを判別する。
認識した音声が対象音声であれば(#604でYES)、その音声が音声検知モードに対応する検知条件に合致する(条件を満たす)か否かをチェックする(#605)。検知条件に合致する場合に(#605でYES)、対象音声を検知した旨をジョブ制御部60に通知する(#606)。音声検知終了が指令されるまで音声検知を行う(#607でNO)。
ジョブの種類によってはジョブの実行中に音声検知開始が複数回指令される場合がある。その場合には、音声検知部60は、音声検知開始が指令されるごとに音声検知終了が指令されるまで音声検知を行う。
図6には期間テーブル80のデータの例が、図7には条件テーブル82のデータの例が、図8にはワードテーブル84のデータおよびその更新の例が、それぞれ示されている。
図6に示す期間テーブル80において、ジョブの種類は、「スキャン」、「ファックス送信」、「コピー」、「グループコピー」、および「ソートコピー」である。これらの種類ごとに、ジョブが複数の進行段階に区分され、さらに各進行段階が設定期間であるか否かが音声検知モード別に定められている。
音声検知モードとして、「する/しないモード」、「レベル変更Aモード」、および「レベル変更Bモード」が設けられている。ユーザは、画像処理装置1に対して適宜に行うの動作設定に際して、これらのモードを択一的に選択することができる。
する/しないモードは、音声検知部60による音声検知を「する(行う)」か「しない(行わない)」かを各進行段階に対して定めるモードである。「する」と定められた進行段階は設定期間となり、「しない」と定められた進行段階は設定期間以外となる。する/しないモードにおける設定期間では、進行段階の区別にかかわらず一律に決められた検知条件に従う音声検知が行われる。
レベル変更Aモードは、図7に示す高・中・低の複数の検知レベル(感度区分)820のいずれかを各進行段階に対して定めるモードである。対象音声が発せられたとの検知結果が最も得られやすい最上位の検知レベル820が「高」であり、次に得られやすい検知レベル820が「中」であり、最も得られにくい最下位の検知レベル820が「低」である。
検知レベル820がいずれであっても音声検知を行うので、レベル変更Aモードの場合は、全ての進行段階が設定期間となる。ただし、対象音声が発せられたとの検知結果の得られやすさは、対応する検知レベルによって異なる。
レベル変更Bモードは、高・中・低の複数の検知レベル820のいずれか、または音声検知を「しない」を各進行段階に対して定めるモードである。いずれかの検知レベル820が定められた進行段階は設定期間となり、「しない」と定められた進行段階は設定期間以外となる。
図7に示すように、条件テーブル82において、各検知レベル820に対して検知条件821が対応づけられている。
検知条件821は、音量条件822、トーン条件823、繰返し条件824、および音声指定条件(対象音声)825を含んでいる。
音量条件822は、音声の音量を限定するものであり、この条件に従って音声検知部50において入力音量が設定される。大音量に限定することにより遠くの声を認識するなどの無駄を低減することができ、小音量を含むよう音量範囲を拡げることにより認識漏れを低減することができる。
トーン条件823は、音声のトーンを限定するものであり、繰返し条件824は、例えば「とまれ_とまれ」のように同じ言葉が繰り返された(反復された)ことを要件とするか否かを指定するものである。音声検知部50において対象音声が検知されたとき、トーン条件823および繰返し条件824に合致するか否かがチェックされる。
音声指定条件825は、発せられたことを検知するべき対象音声である。図7の例においては、音声指定条件825として対象音声のグループが示されている。各グループに属する対象音声は、ワードテーブル84により示される(図8参照)。
画像処理装置1においては、複数の対象音声が検知レベル820の個数と同数の3つグループにクループ分けされている。3つグループは、「正規操作ワード」、「想定ワード」、および「その他」である。
そして、条件テーブル82において、複数の検知レベル820のうち最上位の検知レベル820(高)には、音声指定条件825として全てのグループが対応づけられ、第2位以下の検知レベル820(中または低)には下位になるほど対応するグループの個数が少なくなるよう1以上のグループが音声指定条件825として対応づけられている。
すなわち、最上位の検知レベル820(高)には、正規操作ワード、想定ワード、およびその他が、第2位の検知レベル820(中)には、正規操作ワードと想定ワードとが、最下位の検知レベル820(低)には、正規操作ワードのみが、それぞれ対応づけれている。
上位の検知レベル820に対応する対象音声の個数は下位の検知レベル820に対応する対象音声の個数よりも多いので、音声指定条件825以外の条件822〜824を加味しないとすれば、検知レベル820が上位であるほど、対象音声が検知されたとの検知結果が得られやすい。
正規操作ワードとは、ユーザが音声により停止を指示するための標準の言葉である。図8(A)に示すように、ワードテーブル84において、正規操作ワードとして「ストップ」、「とまれ」、および「ていし」などが登録されている。これらのうち「ストップ」および「とまれ」は、画像処理装置1の工場出荷段階で登録されており、登録属性が「デフォルト」とされている。「ていし」は、ユーザがユーザ設定機能を用いて追加登録したものであり、登録属性が「ユーザ設定」とされている。
想定ワードとは、正規操作ワード以外であって、ユーザがジョブの進行を停止させたいと思ったときに発すると想定される言葉である。主に「しまった」、「やばい」、「ちがう」、「まちがった」などの現状を否定するネガティブワードが想定ワードとされる。
その他とは、正規操作ワードでもなく想定ワードでもない言葉である。とっさに発すると考えられる「あっ」、「うわっ」といった感嘆詞、正規操作ワードまたは想定ワードと同じ意味の方言など、種々の言葉をその他の対象音声として登録しておくことができる。
対象音声の登録に関して、画像処理装置1は、ワードテーブル84の内容を自動的に更新する学習記憶部90を有している。詳しくは、学習記憶部90は、対象音声が発せられたことが検知されてジョブの実行が停止した後に当該ジョブの削除が指示されて実行が取り消された場合に、当該対象音声が条件テーブル82において現在よりも上位の検知レベル820に対応づけられるよう、対象音声のクループ分けを修正する機能である。
図8(A)に示すワードテーブル84は、学習記憶部90による修正が行われる以前の状態であり、図8(B)に示すワードテーブル84bは、学習記憶部90による修正が行われた後の状態である。
図8(A)の状態において、対象音声の「まずい」、「あっ」、および「うわっ」は、いずれもグループ「その他」に属している。したがって、検知レベル820が「高」の対象設定期間に発せられた場合にのみ(図7参照)、発せられたことが検知される。
これに対して、図8(B)の状態においては、「まずい」、「あっ」、および「うわっ」は、いずれもグループ「想定ワード」に属している。登録属性は「デフォルト」から学習記憶機能による登録を意味する「学習」に変更されている。想定ワードであれば、検知レベル820が「高」またが「中」の対象設定期間に発せられた場合に(図7参照)、発せられたことが検知される。
なお、学習記憶部90は、想定ワードのうちのある対象音声が発せられて停止したジョブの実行がその後に取り消されたという状況の発生を記録し、同じ状況が所定回数生じた場合に、当該対象音声を正規操作ワードに昇格させる付加機能を有してよい。
図6に戻って、スキャンは、原稿5から画像を読み取って得られた画像データを送信するジョブである。ユーザによるジョブの設定に際して、送信先として外部の装置または画像処理装置1内のボックスなどが指定される。
ファックス送信は、原稿5から画像を読み取って得られた画像データをファクシミリ通信の規定に適合する形式に変換して送信するジョブである。
スキャンおよびファックス送信では、自動原稿送り装置12を用いてもよいし自動原稿送り装置12を用いずにスキャナ13のプラテンガラスに原稿5をセットしてもよい。原稿5が複数枚である場合に自動原稿送り装置12を用いると、複数枚の読取りと複数枚分の画像データの送信とが1つのジョブとなる。自動原稿送り装置12を用いない場合は、1枚の読取りと1枚分の画像データの送信とが1つのジョブとなるので、原稿枚数と同数のジョブを実行させることになる。
コピーは、1枚の原稿5から画像を読み取って得られた画像データに基づいて、用紙に画像を印刷するジョブである。ユーザがコピー枚数を2以上に設定すると、複数枚の用紙のそれぞれに同じ画像が印刷されて複数枚の複製が得られる。
グループコピーは、自動原稿送り装置12を用いて複数枚の原稿5から画像を連続的に読み取り、得られた画像データに基づいて複数の画像のそれぞれを複数枚ずつ印刷するマルチコピーの一種である。グループコピーでは、複数の画像のそれぞれを読取り順に複数枚ずつ印刷する。
ソートコピーもマルチコピーの一種である。ソートコピーでは、複数の画像のそれぞれを読取り順に1枚ずつ印刷する動作を繰り返して複数部の複製を作成する。
これらの種類のジョブのうちスキャンおよびファックス送信については、進行段階は、読取り初期、読取り中(初期以外)、送信初期、および送信中(初期以外)とされている。
読取り初期とは、ジョブの実行を開始して間もない期間である。例えば自動原稿送り装置12が原稿5の搬送を開始してから1枚目または2枚目の搬送を終えるまでの期間とされる。それよりも短い期間としてもよいし、長い期間としてもよい。なお、流し読み方式では、原稿5を搬送しながら読取りが行われるので、原稿5の搬送が行われる期間と読取りが行われる期間とが重複する。
読取り中とは、読取り初期に続く期間であって、最終の原稿5からの読取りが終わるまでの期間である。
送信初期とは、読取り中に続く期間であって、通信回線への送信データの送り出しを開始するまでの期間である。送信初期は、送信データの準備および送信先との接続を行う期間を含む。
送信中とは、送信初期に続く期間であって、ジョブの実行が終了するまでの期間である。
スキャンおよびファックス送信において、ユーザは、自動原稿送り装置12が原稿トレイ12Aから次々と原稿5を取り出す間に、例えば送信するつもりでなかったシートが混ざっていたこと、向きまたは表裏が正しくないことに気づくことがある。
そこで、少なくとも読取り初期および読取り中は、設定期間に定めれられている。すなわち、音声検知モードがする/しないの場合には、する(音声検知を行う)と定められ、レベル変更Aまたはレベル変更Bの場合には、検知レベル820として高または低が定められている。
これに対して、送信中は、ジョブの開始から原稿枚数に応じた読取り時間が経過した後であるので、ユーザは自己の操作に誤りはないと判断してジョブの終了を待っており、動作を停止したいと思うことは少ないと考えられる。そこで、送信中は、設定期間以外または検知レベル820が低の設定期間に定めれられている。
コピーについては、進行段階は、読取り初期、読取り中(初期以外)、印刷初期、および印刷中(初期以外)とされている。
読取り初期および読取り中は、スキャンおよびファックス送信における読取り初期および読取り中とそれぞれ同様の期間である。
印刷初期とは、印刷動作の初期段階であって、例えば印刷の開始から1枚目の用紙が排出されて所定時間が経過するまでの期間である。
印刷中とは、印刷初期に続く期間であって、ジョブの実行が終了するまでの期間である。
コピーにおいて、ユーザは、スキャンおよびファックス送信の場合と同様に、自動原稿送り装置12が次々と原稿5を搬送する間に、原稿5の誤りに気づくことがある。また、原稿5に誤りはないが、例えばサイズの異なる原稿5が混在する場合において、用紙サイズ指定でなく自動用紙選択(APS)/自動倍率選択(AMS)を指定するべきだったことに気付くことがある。
さらに、印刷が開始された後、排出された1枚目の用紙の印刷結果から、倍率、用紙サイズ、カラー設定、濃度、ページ割り付けなどの印刷条件の指定の誤りがあったことに気付くことがある。
そこで、読取り初期、読取り中、および印刷初期は、設定期間に定めれられている。印刷中は、無用の動作停止を防ぐために、設定期間以外または検知レベル820が低の設定期間に定めれられている。
グループコピーについては、進行段階は、読取り初期、読取り中(初期以外)、印刷初期、印刷中A、印刷中B、および印刷中Cとされている。
読取り初期、読取り中、および印刷初期は、コピーにおける読取り初期、読取り中、および印刷初期とそれぞれ同様の期間である。
印刷中Aとは、1ページ目(1枚目の原稿5)の印刷における印刷初期以外の期間である。
印刷中Bとは、2ページ目以降(2枚目以降の原稿5)の各ページの印刷における初期段階である。
印刷中Cとは、2ページ目以降(2枚目以降の原稿5)の各ページの印刷における初期段階以外の期間である。
グループコピーにおいて、ユーザは、各ページの印刷の初期段階に、1つ前のページの印刷結果からカラーモードなどの印刷条件の指定の誤りがあったことに気付くことがある。特に、1ページ目の印刷枚数が分かる2ページ目の印刷の初期段階に、コピー枚数の指定の誤りがあったことに気付くことがある。
この事情および上に述べた原稿5の誤りまたは印刷条件の指定の誤りなどに気づく状況などを考慮して、グループコピーについて図示の通り設定期間または検知レベル820が定められている。
ソートコピーについては、進行段階は、読取り初期、読取り中(初期以外)、印刷初期、印刷中D、印刷中E、印刷中F、印刷中G、および印刷中Hとされている。
読取り初期、読取り中、および印刷初期は、コピーにおける読取り初期、読取り中、および印刷初期とそれぞれ同様の期間である。
印刷中Dとは、1部目の印刷の初期段階以外の期間である。印刷中Eとは、1部目の印刷の完了直後(完了から所定時間が経過するまでの期間)、すなわち2部目の印刷の初期段階である。
印刷中Fとは、2部目の印刷の初期段階以外の期間である。印刷中Gとは、2部目以降かつ最終部以外の各部の印刷の完了直後である。印刷中Hとは、3部目以降の各部の印刷の初期段階以外の期間である。
ソートコピーにおいて、ユーザは、1部目の用紙束が排出されたときに、ステープル止めまたはパンチ穿孔などの仕上げモードの指定の誤りがあったことに気付くことがある。また、所望の部数の印刷が終わってさらに次の部の印刷が始まったときに、部数の指定が所望値よりも多かったことに気づくことがある。部数の指定を忘れて前のジョブの指定が適用されてしまうことはしばしばある。
これらの事情および上に述べた原稿5の誤りまたは印刷条件の指定の誤りなどに気づく状況などを考慮して、ソートコピーについて図示の通り設定期間または検知レベル820が定められている。
図9にはソートコピーにおける対象設定期間Ttが、図10にはマルチ動作において対象音声の検知をジョブの実行の停止に反映させる態様の例が、それぞれ示されている。
図9は、図6に示した期間テーブル80におけるソートコピーについて定められた設定期間をタイミングチャートの形式で示すものである。図9では、4部の複製を作成する場合が例示されている。
ジョブの実行期間TJは、複数枚の原稿5から画像を読み取る原稿読取り期間と各部の印刷期間とに分かれる。ソートコピーの進行段階のうちの読取り初期および読取り中は、読取り期間に含まれる。印刷初期および印刷中D〜Hのそれぞれは、各部の印刷期間のいずれかに含まれる。
図9の例では、音声検知モードにかかわらず、ジョブの実行に際して、4つの対象設定期間Tt(Tt1,Tt2,Tt3,Tt4)が設けられる。これらの対象設定期間Tt1〜Tt4のいずれかにおいて対象音声が検知されると、ジョブの実行は停止する。
次に、図10を参照してマルチ動作における音声操作機能の態様について述べる。
図10の例では、ジョブAとジョブBとが並行して実行される。ジョブAの種類は例えばグループコピーであり、ジョブBの種類は例えばコピーである。なお、並行して実行する複数のジョブの間で種類が異なる必要はなく、同じ種類のジョブを並行して実行する場合もある。
図10の例では、先にジョブAの実行が開始され、ジョブAの原稿読取り動作が終わるころからユーザによりジョブBの入力操作が行われ、ジョブAの印刷動作と並行してジョブBの原稿読取り動作が行われる。その後、ジョブAの最終ページの印刷が終わると(このときジョブAが実行が終了する)、ジョブBの印刷動作が始まる。
ジョブAの実行期間TJ1には、期間テーブル80に基づいて4つの対象設定期間Tt5,Tt6,Tt7,Tt8が設けられ、ジョブBの実行期間TJ2には、同じく期間テーブル80に基づいて2つの対象設定期間Tt9,Tt10が設けられる。ジョブBの対象設定期間Tt9,Tt10のうち、対象設定期間Tt9の一部がジョブAの対象設定期間Tt7と重複する。
マルチ動作におけるジョブの実行の停止には、2つのモード(停止モードXおよび停止モードY)がある。
停止モードXは、いずれかの対象設定期間Ttにおいて対象音声が検知されたときに、当該対象設定期間Ttが設けられたジョブのみについてその実行を停止し、他のジョブの実行を継続するモードである。停止モードXによると、無用に実行を停止するジョブを少なくして生産性の低下を抑えることができる。
なお、対象音声を発したユーザを識別して識別したユーザが入力したジョブのみの実行を停止するようにしておくことにより、他のジョブとの間で対象設定期間Ttが重複する場合であっても他のジョブの実行を停止せずに済む。
停止モードYは、いずれかの対象設定期間Ttにおいて対象音声が検知されたときに、全てのジョブの実行を停止するモードである。停止モードYによると、対象音声を発したユーザを識別する高度の音声検知が不要となるので、音声認識部21などにおける処理の負担を低減することができる。
図10に示す通り、停止モードXが選択された場合には、ジョブAの実行は、対象設定期間Tt5〜Tt8のいずれかにおいて対象音声が検知されたときに停止する。ジョブBの実行は、対象設定期間Tt9,Tt10のいずれかにおいて対象音声が検知されたときに停止する。
他方、停止モードYが選択された場合には、ジョブAの実行は、対象設定期間Tt5〜Tt8および図中に斜線を付した期間Ta,Tbのいずれかにおいて対象音声が検知されたときに停止する。期間Ta,Tbは、ジョブBの対象設定期間Tt9のうちの対象設定期間Tt7と重複しない期間である。また、ジョブBの実行は、対象設定期間Tt9,Tt10および図中に斜線を付した期間Tcのいずれかにおいて対象音声が検知されたときに停止する。期間Tcは、ジョブAの対象設定期間Tt8である。
図11には音声操作機能に関わる要部の機能的構成の第2例が、図12にはジョブ制御部50bにおける停止制御の処理の流れが、図13には音声検知部における処理の流れが、それぞれ示されている。また、図14には期間テーブル80bのデータの例が示されている。図11において、図3の要素の変形例に相当する要素にはアルファベットの「b」を添えた同一の符合を付し、これらの要素の説明を簡略化する。
図11において、画像処理装置1bは、ジョブ制御部50b、音声検知部60b、期間テーブル80b、およびワードテーブル84bを有する。
ジョブ制御部50bは、入力されたジョブの実行を制御する。すなわち、実行するジョブに応じて動作部70に動作指令を与える。加えて、ジョブ制御部50bは、音声検知部60bと連携して音声操作機能を実現する。そのジョブ制御部50bと音声検知部60bとの連携の態様が上に述べた図3の例と相違する。
図3の例では、対象設定期間Ttにのみ音声検知を行うようジョブ制御部50が音声検知部60を制御する。これとは違って、図11の例では、音声検知部60bは、ジョブの実行中にわたって音声検知を行う。ジョブ制御部50bは、対象音声を検知した旨の検知結果が通知されたときに、期間テーブル80bに基づいて、対象音声が対象設定期間Ttに検知されたか否かを判定する。そして、対象設定期間Ttに検知されたと判定した場合に直ちにジョブの実行を停止させる。
期間テーブル80bは、図14のように、予めジョブの種類別に定められた設定期間を示す。ジョブの種類および各ジョブの進行段階の区分は、図6の期間テーブル80と同様である。期間テーブル80bでは、音声検知の結果に応じた停止制御を「する(行う)」か「しない(行わない)」かを定めることにより、各進行段階を設定期間または設定期間以外に定めている。
音声検知部60bの音声認識部21bは、マイクロフォン22から入力される予め決まった音量範囲の音声をテキスト化する。
照合部23bは、音声認識部21からのテキストとワードテーブル84bに登録されている複数の対象音声とを照合し、いずれかの対象音声と一致する場合に、対象音声を検知した旨の検知結果をジョブ制御部50bに通知する。
ワードテーブル84bは、図8の例とは違って、対象音声のグループ分けをしないものでよい。ただし、グループ分けをしたものでもよい。グループ分けをしたものを用いる場合は、一致した対象音声が属するグループの識別子を検知結果に含めることができる。
図12に示すように、ジョブ制御部50bは、ジョブの実行に先立って期間テーブル80bを参照し、種類別の設定期間のうちの実行の対象である当該ジョブの種類に対して定められている設定期間である対象設定期間を把握する(#511)。
ジョブの実行中に音声検知部60から対象音声を検知した旨の検知結果が通知されると(#512でYES)、ジョブの進行状況をチェックし(#513)、現在の進行段階が対象設定期間であるか否かを判定する(#514)。
そして、対象設定期間であると判定した場合に(#514でYES)、ジョブの実行を停止させる。対象設定期間ではないと判定した場合には(#514でNO)、ジョブを実行を停止させることなく、対象音声の検知結果が通知されるのを待つ(#512)。
図13に示すように、音声検知部60bは、ジョブが実行中であるときに(#611でYES)、音声認識を行う(#612)。そして、認識した音声が対象音声であるか否かをチェックし(#613)、対象音声である場合に(#613でYES)、対象音声を検知した旨を通知する(#614)。
図15には画像処理装置1における処理の流れが、図16には学習記憶処理の流れが、図17には再開処理の流れ、それぞれ示されている。
図15に示すように、ジョブの実行を開始した後(図101でYES)、対象設定期間Ttにおいて対象音声を検知したか否かをチェックする(#102、#103)。対象音声を検知しないままジョブが終了すると(#108でYES)、図15の処理を終える。
対象設定期間Ttに対象音声を検知した場合は(#103でYES)、ジョブの実行を停止して待機する(#104)。
待機中にジョブの削除を指示する入力操作が行われると(#105でYES)、指示に従ってジョブを削除し(#106)、学習記憶処理を実行する(#109)。
待機中においてジョブの削除を指示する入力操作が行われない間は(#105でNO)、再開の指示を受け付ける再開処理を行う(#109)。
図16に示すように、学習記憶処理においては、検知した対象音声のグループが「その他」であった場合に(#201でYES))、その対象音声を「想定ワード」にグループ分けするようワードテーブル84を更新する(#202)。
図17に示すように、再開処理では、検知した対象音声の属するグループに応じて待機時間を第1の時間(長め)または第2の時間(短め)に設定する(#301)。
ジョブの再開を指示する入力操作が行われると(#302でYES)、指示に従ってジョブの実行を再開する(#303)。指示は、例えばタッチパネルディスプレイ11Aに表示される再開ボタンをタッチすることにより入力される。音声による指示の入力を受け付けるようにしてもよい。
再開の指示がないときは(#302でNO)、待機時間が経過していなければ(#305でNO)。図15のフローへリターンする。この場合は待機を継続することになる(#304)。
待機時間が経過すると(#305でYES)、他のジョブの入力操作中であるか否かをチェックする(#306)。入力操作中でなければ(#306でNO)、ジョブの実行を再開する(#303)。
他のジョブの入力操作中であれば(#306でYES)、図15のフローへリターンする。この場合は入力操作が終わるの待ってジョブの実行を再開することになる。
入力操作が終わるのを待つのは、再開を指示したユーザが、他のユーザによる操作の邪魔をしたくないと思うことを想定した配慮である。
図18にはソートコピーにおける画像処理装置1の処理の流れが示されている。図6および図9も参照して、原稿読取りを開始し(#701)、原稿読取りが終了するまで音声検知を行う(#702、#703でNO)。印刷を行っている間において(#704でYES)、印刷の進行状況を確認する(#705)。
各部の印刷初期、すなわち1または2ページ目を印刷しているときには(#706でYES、#709でNO)、音声検知を行う(#707)。印刷初期でなければ(#706でNO)、音声検知を行わない(#708)。
以上の実施形態によると、音声検知による停止制御をジョブの種類に応じて定めた期間に限定して行うので、ジョブの実行の無用の停止を低減するとともにユーザが音声により動作を停止させることができない状況を起こりにくくすることができる。
上に述べた実施形態において、画像処理装置1に設ける音声検知手段は、ユーザの発した音声を検知するものであればよく、マイクロフォン22に限らない。例えばユーザが携帯するスマートフォンまたはワイヤレスマイクロフォンなどからの音声信号を受信する手段であってもよい。また、ユーザがパーソナルコンピュータなどから画像処理装置1を遠隔で操作する場合などにおいて、当該パーソナルコンピュータに備えつけられたマイクロフォンに入力された音声信号を受信する手段であってもよい。
予め複数のユーザのそれぞれの音声を登録しておき、ジョブを入力したユーザが対象音声を発したときに当該ジョブの実行を停止するようにしてもよい。つまり、音声により停止を指示する権限を実行中のジョブを入力したユーザのみに与えることができる。画像処理装置1の管理者にはジョブを入力したユーザではなくても音声により停止を指示する権限を与えてもよい。
その他、画像処理装置1の全体または各部の構成、処理の内容、順序、またはタイミング、検知レベルの区分、各テーブル80,80b,82,82b,84,84bの内容などは、本発明の趣旨に沿って適宜変更することができる。
1 画像処理装置
5 原稿(シート)
22 マイクロフォン(音声検知手段)
50 ジョブ制御部(制御部)
60 音声検知部(検知部)
80,80b 期間テーブル(テーブル)
82 条件テーブル(サブテーブル)
90 学習記憶部
820 検知レベル
825 音声指定条件
Tt,Tt1〜Tt9 対象設定期間

Claims (15)

  1. 種類が異なる複数のジョブの実行が可能な画像処理装置であって、
    入力されたジョブの実行を制御する制御部と、
    音声検知手段により検知された音声に基づいて、予め定められた複数の対象音声のいずれかが発せられたことを検知する検知部と、を有し、
    前記制御部は、予めジョブの種類別に定められた設定期間のうちの実行中のジョブに対応する対象設定期間中に前記対象音声が発せられたことが検知された場合に、当該ジョブの実行を停止させる、
    ことを特徴とする画像処理装置。
  2. ジョブの種類別の前記設定期間を示すテーブルを記憶しており、
    前記検知部は、ジョブの実行中にわたって前記対象音声の検知を行い、
    前記制御部は、前記対象音声が検知されたときに、前記テーブルに基づいて前記ジョブの実行を停止させるか否かを決定する、
    請求項1記載の画像処理装置。
  3. ジョブの種類別の前記設定期間を示すテーブルを記憶しており、
    前記制御部は、前記テーブルに基づいて、前記対象設定期間にのみ前記対象音声の検知を行うよう前記検知部を制御し、前記対象音声が検知されたときに、前記ジョブの実行を停止させる、
    請求項1記載の画像処理装置。
  4. 前記テーブルにおいて、前記設定期間に対して前記対象音声が発せられたとの検知結果の得られやすさを示す複数の検知レベルのいずれかが定められており、
    前記複数の検知レベルのそれぞれに対応する検知条件を示すサブテーブルを記憶しており、
    前記検知部は、前記テーブルおよび前記サブテーブルにより特定されるそのときの前記検知条件に従って、前記対象音声を検知する、
    請求項3記載の画像処理装置。
  5. 前記検知条件は、発せられたことを検知するべき対象音声を指定する音声指定条件を少なくとも含んでおり、
    前記複数の検知レベルのうち最上位の検知レベルには、前記複数の対象音声の全てが前記音声指定条件として対応づけられ、第2位以下の検知レベルには下位になるほど対応する対象音声の個数が少なくなるよう前記複数の対象音声の一部が前記音声指定条件として対応づけられている、
    請求項4記載の画像処理装置。
  6. 前記複数の対象音声が前記検知レベルの個数と同数のグループにクループ分けされ、かつ前記サブテーブルにおいて、前記複数の検知レベルのうち最上位の検知レベルには、前記音声指定条件として全ての前記グループが対応づけられ、第2位以下の検知レベルには下位になるほど対応するグループの個数が少なくなるよう1以上の前記グループが前記音声指定条件として対応づけられている、
    請求項5記載の画像処理装置。
  7. 前記対象音声が検知されて前記ジョブの実行が停止した後に当該ジョブの実行が取り消された場合に、当該対象音声が前記サブテーブルにおいて現在よりも上位の検知レベルに対応づけられるよう、前記対象音声のクループ分けを修正する学習記憶部を有する、
    請求項6記載の画像処理装置。
  8. 前記ジョブは、シートから画像を読み取る読取り処理、シートに画像を形成する印刷処理、および画像データを外部の装置へ送信する通信処理のうちの少なくとも2つを行うものであり、
    前記制御部は、複数の前記ジョブを並行して実行しておりかつこれらのジョブのいずれかの前記対象設定期間において前記対象音声が検知された場合に、当該複数のジョブの実行を共に停止させる、
    請求項1ないし7のいずれかに記載の画像処理装置。
  9. 前記検知部または前記制御部は、前記対象音声が検知されたときに、当該対象音声を発したユーザを識別し、
    前記制御部は、識別された前記ユーザが実行中の前記ジョブに対する停止権限をもつ場合にのみ、前記ジョブの実行を停止させる、
    請求項1ないし8のいずれかに記載の画像処理装置。
  10. 前記制御部は、前記ジョブの実行を停止させてから当該ジョブの実行の取消または再開を指示する操作が行われることなく待機時間が経過したときに、当該ジョブの実行を再開させる、
    請求項1ないし9のいずれかに記載の画像処理装置。
  11. 前記制御部は、前記ジョブの実行を停止させてから当該ジョブの実行の取消または再開を指示する操作が行われることなく待機時間が経過したときに、当該ジョブの実行を再開させ、
    前記待機時間は、最下位の検知レベルのみに対応する前記対象音声が検知されて前記ジョブの実行が停止した場合には、第1の時間とされ、最上位の検知レベルのみに対応する前記対象音声が検知されて前記ジョブの実行が停止した場合には、前記第1の時間よりも短い第2の時間とされる、
    請求項5ないし7のいずれかに記載の画像処理装置。
  12. 前記制御部は、実行を停止させたジョブ以外のジョブを設定する入力操作が行われている最中に前記待機時間が経過した場合には、当該入力操作が終了するのを待って前記ジョブの実行を再開させる、
    請求項10または11記載の画像処理装置。
  13. 種類が異なる複数のジョブの実行が可能な画像処理装置の動作制御方法であって、
    予めジョブの種類別に定められた設定期間のうちの実行中のジョブに対応する対象設定期間中に予め定められた複数の対象音声のいずれかが発せられたことを検知する検知処理を行い、前記対象設定期間中に前記対象音声が発せられたことが検知されたときに当該ジョブの実行を停止させる、
    ことを特徴とする画像処理装置の動作制御方法。
  14. 前記検知処理は、前記対象設定期間にのみ前記対象音声を検知する処理であり、
    前記複数のジョブのそれぞれに対応する前記設定期間に対して、前記対象音声が発せられたとの検知結果の得られやすさを示す複数の検知レベルのいずれかが予め定められ、かつ、当該複数の検知レベルのそれぞれに対応する検知条件が予め定められており、
    前記検知処理において、前記対象設定期間の前記検知レベルに対応する前記検知条件に従って前記対象音声を検知する、
    請求項13記載の画像処理装置の動作制御方法。
  15. 前記検知条件は、発せられたことを検知するべき対象音声を指定する音声指定条件を少
    なくとも含んでおり、
    前記複数の検知レベルのうち最上位の検知レベルには、前記複数の対象音声の全てが前記音声指定条件として対応づけられ、第2位以下の検知レベルには下位になるほど対応する対象音声の個数が少なくなるよう前記複数の対象音声の一部が前記音声指定条件として対応づけられている、
    請求項14記載の画像処理装置の動作制御方法。
JP2017211524A 2017-11-01 2017-11-01 画像処理装置およびその動作制御方法 Active JP6939426B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017211524A JP6939426B2 (ja) 2017-11-01 2017-11-01 画像処理装置およびその動作制御方法
US16/166,382 US10606531B2 (en) 2017-11-01 2018-10-22 Image processing device, and operation control method thereof
EP18202838.1A EP3480688A1 (en) 2017-11-01 2018-10-26 Image processing device, and operation control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017211524A JP6939426B2 (ja) 2017-11-01 2017-11-01 画像処理装置およびその動作制御方法

Publications (2)

Publication Number Publication Date
JP2019083497A JP2019083497A (ja) 2019-05-30
JP6939426B2 true JP6939426B2 (ja) 2021-09-22

Family

ID=64051396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017211524A Active JP6939426B2 (ja) 2017-11-01 2017-11-01 画像処理装置およびその動作制御方法

Country Status (3)

Country Link
US (1) US10606531B2 (ja)
EP (1) EP3480688A1 (ja)
JP (1) JP6939426B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019215485A (ja) * 2018-06-14 2019-12-19 コニカミノルタ株式会社 画像形成装置、画像形成システム、制御方法および制御プログラム
JP2023019219A (ja) 2021-07-28 2023-02-09 富士フイルムビジネスイノベーション株式会社 印刷システム、情報処理装置及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000201245A (ja) * 1999-01-08 2000-07-18 Ricoh Co Ltd 画像形成装置
EP1659770B1 (en) * 2004-11-05 2020-07-15 Brother Kogyo Kabushiki Kaisha Data processing system, data processing device and data processing program
JP4657097B2 (ja) * 2005-12-21 2011-03-23 京セラミタ株式会社 電子機器及び音声操作プログラム
US7555310B2 (en) 2005-12-21 2009-06-30 Kyocera Mita Corporation Electronic apparatus and computer readable medium recorded voice operating program
JP2010136335A (ja) 2008-11-05 2010-06-17 Ricoh Co Ltd 画像形成装置、制御方法およびプログラム
JP5831251B2 (ja) * 2012-01-25 2015-12-09 コニカミノルタ株式会社 画像形成システム、画像形成装置、端末装置、画像形成装置の制御プログラム、および端末装置の制御プログラム
JP2016035514A (ja) 2014-08-04 2016-03-17 キヤノン株式会社 印刷装置、印刷装置の制御方法、及びプログラム
JP6690152B2 (ja) * 2015-08-04 2020-04-28 富士ゼロックス株式会社 処理装置
JP6696246B2 (ja) * 2016-03-16 2020-05-20 富士ゼロックス株式会社 画像処理装置及びプログラム

Also Published As

Publication number Publication date
EP3480688A1 (en) 2019-05-08
US10606531B2 (en) 2020-03-31
JP2019083497A (ja) 2019-05-30
US20190129665A1 (en) 2019-05-02

Similar Documents

Publication Publication Date Title
US11355106B2 (en) Information processing apparatus, method of processing information and storage medium comprising dot per inch resolution for scan or copy
US8314943B2 (en) Image forming apparatus, method of controlling the same based on speech recognition, and computer program product
US11302321B2 (en) Audio-based operation system, method of processing information using audio-based operation and storage medium
JP7188036B2 (ja) 情報処理装置、情報処理システム、および方法
US8422054B2 (en) Remote copy system, image forming apparatus, control method therefor, and storage medium
CN110875993B (zh) 带交互代理功能的图像形成系统及其控制方法和存储介质
JP7159892B2 (ja) 画像形成装置、画像形成システム、および情報処理方法
US11423903B2 (en) Information processing system and information processing method
US20200193991A1 (en) Image processing system, image forming apparatus, voice input inhibition determination method, and recording medium
JP6939426B2 (ja) 画像処理装置およびその動作制御方法
US20090207441A1 (en) Job Processing Apparatus and Method for Controlling the Job Processing Apparatus
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2007021808A (ja) 画像形成装置
JP6582977B2 (ja) 画像形成装置および画像形成装置の制御プログラム
JP2007300223A (ja) 画像処理装置、画像処理装置の制御方法、画像処理装置の制御プログラム、およびコンピュータ読み取り可能な記録媒体
US8736868B2 (en) Image forming apparatus
JP7127424B2 (ja) 画像処理装置及びプログラム
JP7151441B2 (ja) 画像読取装置
US20230388428A1 (en) Image forming apparatus
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP7409135B2 (ja) 処理条件設定システム、処理条件設定方法及びプログラム
JPH0923302A (ja) 画像処理装置
JP5295663B2 (ja) 画像形成装置
JP2020088679A (ja) 画像形成装置
US8416465B2 (en) Reader, and computer readable medium and method therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210816

R150 Certificate of patent or registration of utility model

Ref document number: 6939426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150