JP7230482B2 - 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム - Google Patents

画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム Download PDF

Info

Publication number
JP7230482B2
JP7230482B2 JP2018235296A JP2018235296A JP7230482B2 JP 7230482 B2 JP7230482 B2 JP 7230482B2 JP 2018235296 A JP2018235296 A JP 2018235296A JP 2018235296 A JP2018235296 A JP 2018235296A JP 7230482 B2 JP7230482 B2 JP 7230482B2
Authority
JP
Japan
Prior art keywords
voice input
voice
unit
input
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018235296A
Other languages
English (en)
Other versions
JP2020098229A (ja
Inventor
秀太 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018235296A priority Critical patent/JP7230482B2/ja
Priority to EP19211880.0A priority patent/EP3671350A1/en
Priority to US16/705,342 priority patent/US20200193991A1/en
Priority to CN201911279651.8A priority patent/CN111327780A/zh
Publication of JP2020098229A publication Critical patent/JP2020098229A/ja
Application granted granted Critical
Publication of JP7230482B2 publication Critical patent/JP7230482B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00403Voice input means, e.g. voice commands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • G03G15/50Machine control of apparatus for electrographic processes using a charge pattern, e.g. regulating differents parts of the machine, multimode copiers, microprocessor control
    • G03G15/5016User-machine interface; Display panels; Control console
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • G03G15/50Machine control of apparatus for electrographic processes using a charge pattern, e.g. regulating differents parts of the machine, multimode copiers, microprocessor control
    • G03G15/5075Remote control machines, e.g. by a host
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Description

本発明は、画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラムに関する。
従来、コピー機能やプリンター機能などを備えた複合機(画像形成装置)に対し音声入力による操作を可能にした画像処理システムが存在する。
特許文献1には、音声認識機能をもつ画像形成装置において、複写モード等の機能に対してユーザーが音声認識対象語彙となる名称を自由に設定可能とすることにより、ユーザーが音声発話によって機能を呼び出せるようにする技術が開示されている。また、特許文献2には、操作指示を音声によって入力することができる装置において、音声入力禁止情報リストに登録されている音声入力がなされた際に、操作モードを手動操作に切り替えることにより、パスワード等の機密情報が漏洩してしまうことを防止する技術が開示されている。
特開2007-114297号公報 特開2007-79852号公報
ところで、音声入力による操作が可能な画像処理システムで用いられる画像形成装置においては、従来通りの操作パネルへの操作入力も行われる。つまり、このようなシステムには、操作パネルを操作することによる手動操作と、音声入力装置に音声を入力することによる音声操作との2通りの操作系統が存在する。
手動操作及び音声操作の2通りの操作系統が存在する状況においては、操作パネルに対して操作が入力されているときには、音声入力に基づく処理が実行されることは好ましくない。しかしながら、例えば、画像形成装置の周辺にいる他人が音声を発した場合、その音声に音声入力装置が反応して、音声入力装置が他人の発話音声を音声コマンドと誤認識してしまうことがある。この場合、他人の発話音声を音声入力装置が音声認識した結果に応じた処理が、画像形成装置において実行されてしまう。状況によっては、操作者の意図しない設定でジョブが実行されたり、意図しない宛先にデータが送信されたりするなどの問題が発生してしまう。特許文献1及び2のいずれにも、このような状況の発生を防ぐ技術は開示されていない。
本発明はこのような状況に鑑みてなされたものである。本発明の目的は、操作者による手動操作時に、周囲にいる他人の発話等に基づいて操作者が意図しない処理が実行されてしまうことを防ぐことにある。
上記課題を解決するため、本発明の一側面を反映した画像処理システムは、操作入力部と、音声入力部と、音声認識部と、制御部と、音声入力禁止判定部と、表示部と、を備える。操作入力部には、操作者による手動操作が入力される。音声入力部は、音声を入力し、入力した音声を音声データに変換して出力する。音声認識部は、音声入力部から入力された音声データに対して音声認識処理を行い、認識結果を出力する。制御部は、音声認識部から入力された認識結果と予め対応付けられた処理を実行する。音声入力禁止判定部は、操作者による手動操作中であるか否かを判定し、手動操作中であると判定した場合に、音声入力部に入力された音声を無効化する。そして、音声入力禁止判定部は、音声入力部への音声入力が行われたときに表示部に表示されている画面に関する情報に基づいて、音声入力部への音声入力が行われた区間が音声入力禁止区間であるか否かを判定し、音声入力禁止区間であると判定した場合に、手動操作中であると判定する。
本発明では、操作者による手動操作中には、音声入力部に入力された音声が無効化される。それゆえ、本発明によれば、操作者の周囲にいる他人の発話等に基づいて、操作者が意図しない処理が実行されてしまうことを防ぐことができる。なお、上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の一実施形態に係る画像処理システムの概略構成図である。 本発明の一実施形態に係る画像形成装置の制御系の構成例を示すブロック図である。 本発明の一実施形態に係る音声入力装置の制御系の構成例を示すブロック図である。 本発明の一実施形態に係るジョブ実行関連画面の例を示す図である。 本発明の一実施形態に係る第2の例外コマンドリストの構成例を示す図である。 本発明の一実施形態に係るユーザー設定メニュー画面の例を示す図である。 本発明の一実施形態に係る第3の例外コマンドリストの構成例を示す図である。 本発明の一実施形態に係る音声入力禁止判定部による音声入力禁止判定処理の手順を示すフローチャートである。 本発明の一実施形態に係る音声入力禁止判定部による音声入力禁止判定処理において実行される手動操作判定処理の手順を示すフローチャートである。
以下、本発明を実施するための形態例について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素は、同一の符号を付し、構成要素の重複説明は省略する。
<画像処理システムの構成>
まず、図1を参照して、本発明の一実施形態に係る画像処理システムの構成について説明する。図1は、本発明の一実施形態に係る画像処理システム100の概要構成図である。
図1に示す画像処理システム100は、画像形成装置1と、音声入力装置2(音声入力部の一例)と、クラウド3上に設けられた音声認識部300とを備える。画像形成装置1及び音声入力装置2は、ネットワークNを介して接続される。画像形成装置1及び音声認識部300と、音声入力装置2及び音声認識部300とは、それぞれ、ネットワークNに接続された不図示の公衆回線等を介して接続される。
画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能等を有するMFP(Multi-Functional Peripherals)で構成される。画像形成装置1は、不図示のプリンタコントローラー等から送信された画像データに基づいて用紙(記録材の一例)に画像形成を行い、該画像が形成された用紙を印刷物として出力する。本実施形態に係る画像形成装置1は、操作表示部10(図2参照)に対する手動操作と、音声入力装置2に音声を入力することによる音声操作との2通りの操作系統を有する。
音声入力装置2はマイクロフォン30(図3参照)を備え、該マイクロフォン30が集音した音声、例えば、操作者(ユーザー)によって発話された音声コマンド等を音声データに変換し、変換により得られた音声データをクラウド3上の音声認識部300に送信(出力)する。
音声認識部300は、音声入力装置2から送信(入力)された音声データに対して音声認識処理を行う。また、音声認識部300は、音声認識処理により得られた認識音声に対応する画像形成装置1用のコマンド(認識結果の一例)を生成して、該コマンドを画像形成装置1に送信する。
なお、本実施形態では、クラウド3上の音声認識部300が、音声データの認識音声に応じたコマンドを生成する例を挙げたが、本発明はこれに限定されない。音声認識部300は、認識音声の内容を示すテキスト(認識結果の一例)のみを画像形成装置1に送信し、テキストに応じたコマンドの生成は、画像形成装置1側で行わせる構成としてもよい。
また、本実施形態では、音声認識部300をクラウド3上に設ける例を挙げたが、本発明はこれに限定されない。音声認識部300は、画像形成装置1内に設けられてもよく、不図示のオンプレミスサーバー内に設けられてもよい。
<画像処理システムを構成する画像形成装置及び音声入力装置の制御系の構成>
次に、図2及び図3を参照して、画像処理システム100を構成する画像形成装置1及び音声入力装置2の制御系の構成例について説明する。図2は、画像形成装置1の制御系の構成例を示すブロック図であり、図3は、音声入力装置2の制御系の構成例を示すブロック図である。
[画像形成装置の制御系の構成]
まず、図2を参照して、画像形成装置1の制御系の構成について説明する。図2に示すように、画像形成装置1は、操作表示部10と、制御部11と、不揮発メモリ12と、RAM(Random Access Memory)13と、HDD(Hard Disc Drive)14と、を備える。また、画像形成装置1は、自動原稿搬送部15と、画像読み取り部16と、画像処理部17と、プリンター部18(画像形成部の一例)と、有線通信部19と、無線通信部20と、ファクシミリ通信部21と、を備える。
操作表示部10は、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)等よりなる表示パネル(表示部の一例)と、タッチセンサ等よりなる操作入力部とが一体に形成された操作パネル等で構成される。操作表示部10の画面には、例えば、操作表示部10に対する手動操作の内容に応じた情報、又は、音声入力装置2(図1参照)に音声を入力することによる音声操作の内容に応じた情報が表示される。また、操作表示部10の操作入力部には、操作者による手動操作が入力される。そして、操作表示部10は、操作者により入力された操作の内容に応じた操作信号を生成して、該操作信号を制御部11に供給する。操作信号には、例えば、操作表示部10の表示パネルで表示中の画面(以下、「アクティブ画面」とも称する)の種類及び階層の情報等が含まれる。
なお、本実施形態では、操作入力部及び表示部が操作表示部10として一体に形成される例を挙げたが、本発明はこれに限定されない。表示パネルよりなる表示部と、キーボードやマウス等よりなる操作入力部とが、それぞれ別々に構成されてもよい。または、操作入力部及び表示部が一体に形成された操作表示部10に加えて、キーボードやマウス等よりなる操作入力部をさらに備える構成としてもよい。
制御部11は、例えばCPU(Central Processing Unit)等を含み、画像形成装置1を構成する各部の動作を制御する。具体的には、制御部11は、クラウド3上の音声認識部300から入力されるコマンドに予め対応付けられた、画像形成処理等を含む各種処理を、画像形成装置1を構成する各部に実行させる制御を行う。
また、制御部11は、音声入力禁止判定部110を備える。音声入力禁止判定部110は、音声入力禁止判定処理を行う。具体的には、音声入力禁止判定部110は、操作者による手動操作中であるか否かを判定し、手動操作中であると判定した場合に、音声入力装置2に入力された音声(以下、「音声入力」とも称する)を無効化する。音声入力装置2から入力された音声の無効化は、例えば、以下の手法により実現することができる。
・音声認識部300から送信される認識結果(認識音声の内容を表すテキスト、又は、テキストに対応するコマンド等)に基づく各種制御を、制御部11に実行させない。
・音声認識部300による認識結果を、音声認識部300から画像形成装置1に送信させない。
・音声認識部300による、音声入力装置2から入力された音声データの認識を行わせない。
・音声入力装置2から音声認識部300に対して音声データを送信させない。
音声入力禁止判定部110は、操作者による手動操作中であるか否かの判定を、音声入力が行われた区間が音声入力禁止区間であるか否かを判定することにより行う。音声入力が行われた区間が音声入力禁止区間であると判定した場合、音声入力禁止判定部110は、操作者による手動操作中であると判定する。音声入力が行われた区間が音声入力禁止区間であるか否かの判定は、アクティブ画面(操作表示部10で表示中の画面)に関する情報(以下、「アクティブ画面情報」とも称する)に基づいて行う。アクティブ画面情報には、例えば、アクティブ画面で表示中の画面の種類の情報、アクティブ画面の表示内容に対して操作者から操作表示部10に入力された操作の、所定時間あたりの操作回数の情報、アクティブ画面に表示中の画面の階層の情報等がある。
具体的には、音声入力禁止判定部110は、アクティブ画面が、画像処理システム100に入力されたジョブの実行に関する操作を受け付ける画面(以下「ジョブ実行関連画面」と称する)である場合、音声入力が行われた区間は音声入力禁止区間であると判定する。
また、音声入力禁止判定部110は、アクティブ画面に表示された内容対して操作者から操作表示部10に入力された操作の、所定時間あたりの操作量が、予め定められた所定の操作量閾値を超えた場合、音声入力が行われた区間は音声入力禁止区間であると判定する。さらに、音声入力禁止判定部110は、アクティブ画面の階層が、予め定められた所定の階層数閾値を超えた場合、音声入力が行われた区間は音声入力禁止区間であると判定する。
また、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、操作者によって第1の例外コマンドが入力(発話)された場合には、音声入力を有効化する。第1の例外コマンドは、音声入力による操作の開始(音声入力の有効化)を指示する「ウェイクワード」と称される起動コマンドである。第1の例外コマンドとしてのウェイクワードには、例えば、「音声入力を有効化」等の音声コマンドがあり、第1の例外コマンドは、第1の例外コマンドを規定するテーブルである第1の例外コマンドリストL1によって管理される。
また、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、アクティブ画面に第2の例外コマンドに対応付けられた画面が表示された状態において、第2の例外コマンドが入力された場合には、第2の例外コマンドに設定されている処理を、処理を担当する部に実行させる制御を行う。第2の例外コマンドは、アクティブ画面の操作に関するコマンドであり、操作表示部10に表示される画面の種類毎に設定される。第2の例外コマンドは、第2の例外コマンドを規定するテーブルである第2の例外コマンドリストL2によって管理される。第2の例外コマンドリストL2については、後述の図5を参照して詳述する。
さらに、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、第3の例外コマンドが入力された場合には、入力された第3の例外コマンドに対応する処理を、処理を担当する部に実行させる制御を行う。第3の例外コマンドは、画像処理システム100の状態を問い合せるステータス応答コマンドである。ステータス応答コマンドには、例えば、画像形成装置1が使用する所定の色のトナーの残量を問い合せるコマンドや、画像形成装置1に設定されたIPアドレスを問い合せるコマンドなどがある。第3の例外コマンドは、第3の例外コマンドを規定するテーブルである第3の例外コマンドリストL3によって管理される。第3の例外コマンドリストL3については、後述の図7を参照して詳述する。
不揮発メモリ12は、制御部11が実行するプログラム等の各種データが記憶される記憶部である。不揮発メモリ12には、例外コマンド保存部120が設けられる。例外コマンド保存部120には、第1の例外コマンドリストL1、第2の例外コマンドリストL2、及び、第3の例外コマンドリストL3等が格納される。また、不揮発メモリ12には、音声入力が行われた区間は音声入力禁止区間であるか否かを音声入力禁止判定部110が判定する際に用いる操作量閾値、階層数閾値等も格納される。
なお、本実施形態では、例外コマンド保存部120、各種閾値を不揮発メモリ12内に設ける例を挙げたが、本発明はこれに限定されない。例外コマンド保存部120及び各種閾値は、HDD14内に設けられてもよい。
RAM13は、制御部11がプログラムを実行する際の作業領域として使用される。HDD14には、不図示のプリンタコントローラー等から送信された画像データや、プリンター部18による画像形成済の画像データ等が記憶される。
自動原稿搬送部15は、不図示の原稿トレイに載置された原稿を、不図示のスキャナー部に1枚ずつ自動給送する。画像読み取り部16は、不図示のスキャナー部から入力されたアナログ画像信号に対して、アナログ信号処理、A/D変換処理、シェーディング処理等の各種処理を施し、各種信号処理が施されたデジタル画像データを画像処理部17に出力する。
画像処理部17は、画像読み取り部16で生成されたデジタル画像データや、不図示のプリンタコントローラーから送信された画像データに対して、各種画像処理を施す。
プリンター部18は、画像処理部17で画像処理が施された画像データに基づいて用紙に画像を形成し、画像が形成された用紙を印刷物として出力する。具体的には、プリンター部18は、不図示の帯電装置と、感光ドラムと、露光装置と、転写ベルトと、定着装置と、を備える。そして、プリンター部18は、まず、帯電装置により帯電された感光体ドラムに対して、露光装置から画像に応じた光を照射させることにより、感光ドラムの周上に静電潜像を形成させる。次いで、プリンター部18は、現像装置から感光体にトナーを供給させることにより、帯電した静電潜像上にトナーを付着させてトナー像を現像させる。次いで、プリンター部18は、トナー像を転写ベルトに1次転写させるとともに、転写ベルトに転写されたトナー像をから用紙に2次転写させ、さらに、定着装置に、用紙上に転写されたトナー像を用紙に定着させる。
なお、ここでは、プリンター部18が電子写真方式を用いて画像形成を行う例を挙げたが、本発明はこれに限定されない。本発明の画像処理システム、画像形成装置では、インクジェット方式等の他の方式で画像形成を行うプリンター部を用いてもよい。
有線通信部19は、例えば、NIC(Network Interface Card)、モデム等を含み、ネットワークNに接続される。有線通信部19は、ネットワークNを介して接続される不図示のプリンタコントローラーから送信される画像データ等を受信する。また、有線通信部19は、ネットワークNを介して接続されるクラウド3内の音声認識部300との間で行われる、各種データの送受信動作を制御する。さらに、有線通信部19は、ネットワークNを介して接続される音声入力装置2との間で行われる各種データの送受信動作を制御する。
無線通信部20は、無線通信を介して接続される不図示の各種装置や端末等との間で行われる各種データの送受信動作を制御する。なお、有線通信部19が行う音声認識部300との間で行われる各種データの送受信動作の制御、及び/又は、音声入力装置2との間で行われる各種データの送受信動作の制御を、無線通信部20が行う構成としてもよい。
ファクシミリ通信部21は、不図示の公衆交換電話網又はIP通信網等と接続され、これらの回線を介して接続されるファクシミリ機能を備えた不図示の装置との間で行われる各種データの送受信動作を制御する。
[音声入力装置の制御系の構成]
次に、図3を参照して、音声入力装置2の制御系の構成について説明する。図3に示すように、音声入力装置2は、マイクロフォン30と、制御部31と、不揮発メモリ32と、RAM33と、有線通信部34と、無線通信部35と、音声出力部36と、を備える。
マイクロフォン30は、周囲の音声を集音し、集音した音声を音声データに変換する。マイクロフォン30が収集する周囲の音声には、例えば、操作者により発話された音声コマンドや、操作者の周囲に存在する他人の話し声等が含まれる。マイクロフォン30によって変換された音声データは、無線通信部35を介してクラウド3上の音声認識部300(図2参照)に送信(出力)される。
制御部31は、例えばCPU等を含み、音声入力装置2を構成する各部の動作を制御する。例えば、制御部31は、マイクロフォン30が得た音声データを、無線通信部35を介してクラウド3上の音声認識部300に送信させる制御を行う。また、制御部31は、例えば、ネットワークNを介して接続された画像形成装置1から送信された、ステータス応答コマンドに対する返答(音声データ)を音声出力部36から放音させる制御を行う。
不揮発メモリ32は、制御部31が実行するプログラム等の各種データが記憶される記憶部である。RAM33は、制御部31がプログラムを実行する際の作業領域として使用される。
有線通信部34は、例えばNIC等を含み、ネットワークNに接続される。有線通信部34は、例えば、ネットワークNを介して接続された画像形成装置1から送信される、ステータス応答コマンドに対する返答等を受信する。
無線通信部35は、不図示の公衆回線等に接続され、該公衆回線等を介して接続されるクラウド3内の音声認識部300との間で行われる各種データの送受信動作を制御する。なお、無線通信部35で行う、音声認識部300との間で行われる各種データの送受信動作の制御は、有線通信部34が行ってもよい。
音声出力部36は、例えばスピーカーで構成され、制御部31から入力される音声データを音声に変換して外部に放音する。
[ジョブ実行関連画面の例]
次に、図4を参照して、画像形成装置1の音声入力禁止判定部110が音声入力禁止判定処理を行う際の判断材料の一つであるジョブ実行関連画面の例について説明する。図4は、ジョブ実行関連画面の例を示す図である。
ジョブ実行関連画面は、画像処理システム100に入力されたジョブの実行に関する操作を受け付ける画面であり、例えば、印刷設定画面、コピー画面、ファックス画面、スキャン画面等がある。図4には、ジョブ実行関連画面の一例として、コピー画面を例に示す。
図4に示すコピー画面Sc1の下方には、コピー機能に関する設定項目である「原稿画質」、「カラー」、「濃度」、「用紙」、「倍率」、「画面/ページ集約」、「仕上り」の各設定項目を設定するための各アイコンが、横方向に一列に並んで表示されている。音声入力禁止判定部110は、アクティブ画面が、図4に示すコピー画面Sc1のようなジョブ実行関連画面である場合、音声入力が行われた区間は音声入力禁止区間であると判定する。
[第2の例外コマンドリストの例]
次に、図5を参照して、音声入力禁止判定部110が音声入力禁止判定処理を行う際に参照する第2の例外コマンドリストL2の構成例について説明する。図5は、第2の例外コマンドリストL2の構成例を示す図である。図5に示すように、第2の例外コマンドリストL2は、「画面番号」、「画面名称」、「認識音声」及び「処理」の各項目を有する。
「画面番号」の項目には、操作表示部10に表示される各画面に付与された識別番号としての画面番号が格納される。「画面名称」の項目には、操作表示部10に表示される各画面の名称が格納される。「認識音声」の項目には、第2の例外コマンドの内容をテキストで示したものが格納される。「処理」の項目には、操作者によって第2の例外コマンドが入力された場合に実行される処理の内容が格納される。
そして、第2の例外コマンドリストL2では、画面番号(画面名称)で識別される画面と、「認識音声」に格納された第2の例外コマンドと、「処理」に格納された処理とが対応付けて管理される。例えば、第2の例外コマンドリストL2の一行目においては、画面番号が「画面0100」であり、画面名称が「ユーザー設定メニュー画面」である画面と、「環境設定ボタンを押下」という第2の例外コマンドと、「環境設定ボタン押下処理」という処理内容とが対応付けて管理される。第2の例外コマンドリストL2の二行目においては、画面番号が「画面0100」であり、画面名称が「ユーザー設定メニュー画面」である画面と、「画面カスタマイズ設定を押下」という第2の例外コマンドと、「画面カスタマイズボタン押下処理」という処理内容とが対応付けて管理される。
例えば、画面番号が「画面0100」であり、画面名称が「ユーザー設定メニュー画面」である画面がアクティブ画面である状況において、操作者によって「環境設定ボタン押下」という音声コマンドが発話(音声入力装置2に入力)されたとする。この場合、音声入力禁止判定部110は、その前の時点で手動操作中であると判定していた(音声入力が無効化されていていた)場合にも、第2の例外コマンドである「環境設定ボタン押下」と対応付けられている「環境設定ボタン押下処理」を、制御部11に実行させる制御を行う。
図6は、画面番号が「画面0100」であるユーザー設定メニュー画面Sc2の例を示す図である。図6に示すユーザー設定メニュー画面Sc2の左側には、ユーザー設定メニューの項目を示す、「しおり表示」、「テンキー表示」及び「設定メニュー」の各ボタンが縦方向に一列に並んで表示されている。また、「設定メニュー」の項目において「ユーザー設定」の項目が選択されていることが示されている。
図6に示すユーザー設定メニュー画面Sc2における、メニュー項目の表示位置の右側には、「ユーザー設定」の各設定項目を示すアイコンとして、「1 環境設定」、「2 画面カスタマイズ設定」、「3 コピー設定」、「4 スキャン設定」及び「5 プリンター設定」の各ボタンが縦方向に一列に並んで表示されている。
図6に示すユーザー設定メニュー画面Sc2が操作表示部10に表示されている(アクティブ画面である)状況において、操作者によって「環境設定ボタンを押下」という音声コマンドが音声入力装置2に入力されたとする。この場合、音声入力禁止判定部110は、第2の例外コマンドリストL2に記載の内容に基づいて、制御部11に、ユーザー設定メニュー画面における「環境設定」のボタンを押下させる制御を行う。音声入力禁止判定部110によって上述したような制御が行われることにより、操作者は、音声入力が無効化されている状況下においても、アクティブ画面の操作に関する第2の例外コマンドを発話することにより、アクティブ画面を操作することが可能となる。
[第3の例外コマンドリストの例]
次に、図7を参照して、音声入力禁止判定部110が音声入力禁止判定処理を行う際に参照する第3の例外コマンドリストL3の構成例について説明する。図7は、第3の例外コマンドリストL3の構成例を示す図である。
図7に示すように、第3の例外コマンドリストL3は、「認識音声」及び「処理」の各項目を有する。「認識音声」の項目には、第3の例外コマンドの内容をテキストで示したものが格納される。「処理」の項目には、操作者によって第3の例外コマンドが入力された場合に実行される処理の内容が格納される。そして、第3の例外コマンドリストL3では、「認識音声」及び「処理」が対応付けて管理される。
第3の例外コマンドリストL3の一行目では、「Kのトナー残量を教えて」という第3の例外コマンドと、「Kトナー残量を音声で応答する」という処理の内容とが対応付けて管理される。また、第3の例外コマンドリストL3の二行目では、「IPアドレスを教えて」という第3の例外コマンドと、「IPアドレスを音声で応答する」という処理の内容とが対応付けて管理される。
例えば、操作者によって「Kのトナー残量を教えて」という音声コマンドが音声入力装置2に入力された場合、音声入力禁止判定部110は、K(ブラック)のトナーの残量を、音声入力装置2の音声出力部36(図3参照)から音声で応答させる制御を行う。また、例えば、操作者によって「IPアドレスを教えて」という音声コマンドが音声入力装置2に入力された場合、音声入力禁止判定部110は、画像形成装置1のIPアドレスを、音声入力装置2の音声出力部36から音声で応答させる制御を行う。
音声入力禁止判定部110によってこのような制御が行われることにより、操作者は、音声入力が無効化されている状況下においても、「IPアドレスを教えて」等の、ステータス応答コマンドである第2の例外コマンドを発話することにより、画像処理システム100の状態(ステータス)を容易に把握することが可能となる。
[音声入力禁止判定部による音声入力禁止判定処理]
次に、図8及び図9を参照して、音声入力禁止判定部110による音声入力禁止判定処理の手順について説明する。図8は、音声入力禁止判定部110による音声入力禁止判定処理の手順を示すフローチャートである。図9は、音声入力禁止判定部110による音声入力禁止判定処理において実行される手動操作判定処理の手順を示すフローチャートである。
まず、音声入力禁止判定部110は、音声入力装置2に対して操作者により音声が入力されたか否かを判定する(ステップS1)。本実施形態では、操作者によって音声入力装置2に音声が入力された場合、音声入力装置2によって音声が音声データに変換され、該音声データが、クラウド3上の音声認識部300に入力される。そして、音声認識部300による認識音声に対応するコマンドが、画像形成装置1に入力される。したがって、音声入力禁止判定部110は、音声認識部300からコマンドが入力されたか否かを判定することによって、操作者による音声の入力があったか否かを判定することができる。
ステップS1で、操作者による音声入力はないと判定された場合(ステップS1がNO判定の場合)、音声入力禁止判定部110は、ステップS1の判定を繰り返す。一方、ステップS1で、操作者による音声入力があったと判定された場合(ステップS1がYES判定の場合)、音声入力禁止判定部110は、手動操作判定処理を行う(ステップS2)。手動操作判定処理の手順については、次の図9を参照して詳述する。音声入力禁止判定部110によってステップS2の手動操作判定処理が行われることにより、操作者による手動操作中であるか否かが判定される。
次いで、音声入力禁止判定部110は、手動操作中であるか否かを判定する(ステップS3)。つまり、音声入力禁止判定部110は、ステップS2の手動操作判定処理の結果得られた判定が、「手動操作中」であったか否かを判定する。
ステップS3で、手動操作中ではないと判定された場合(ステップS3がNO判定の場合)、音声入力禁止判定部110は、音声入力を有効化するとともに、ステップS1で入力された音声に対応する処理を、処理を担当する部に実行させる制御を行う(ステップS4)。ステップS4の処理後、音声入力禁止判定部110はステップS1の判定を行う。
一方、ステップS3で、手動操作中であると判定された場合(ステップS3がYES判定の場合)、音声入力禁止判定部110は、ステップS1で入力された音声は第1の例外コマンドであるか否かを判定する(ステップS5)。つまり、音声入力禁止判定部110は、ステップS1で入力された音声が、「音声入力を有効化」等のウェイクワードであるか否かを判定する。
ステップS5で、入力された音声は第1の例外コマンドであると判定された場合(ステップS5がYES判定の場合)、音声入力禁止判定部110は、ステップS4の処理を行う。すなわち、音声入力を有効化するとともに、ステップS1で入力された音声に対応する処理を、処理を担当する部に実行させる制御を行う。
一方、ステップS5で、入力された音声は第1の例外コマンドではないと判定された場合(ステップS5がNO判定の場合)、音声入力禁止判定部110は、ステップS1で入力された音声はアクティブ画面に設定された第2の例外コマンドであるか否かを判定する(ステップS6)。つまり、音声入力禁止判定部110は、ステップS1で入力された音声が、第2の例外コマンドリストL2(図5参照)において、アクティブ画面と対応付けられている第2の例外コマンドであるか否かを判定する。
ステップS6で、入力された音声はアクティブ画面に設定された第2の例外コマンドであると判定された場合(ステップS6がYES判定の場合)、音声入力禁止判定部110は、コマンド(第2の例外コマンド)に割り当てられた処理のみを、処理を担当する部に実行させる制御を行う(ステップS7)。例えば、アクティブ画面が図6に示すユーザー設定メニュー画面Sc2であり、ステップS1で入力された音声が「環境設定ボタンを押下」という音声であった場合、音声入力禁止判定部110は、制御部11に、ユーザー設定メニュー画面における「環境設定」のボタンを押下させる制御を行う。ステップS7の処理後、音声入力禁止判定部110は、ステップS1の判定を行う。
一方、ステップS6で、ステップS1で入力された音声はアクティブ画面に設定された第2の例外コマンドではないと判定された場合(ステップS6がNO判定の場合)、音声入力禁止判定部110は、ステップS1で入力された音声は第3の例外コマンドであるか否かを判定する(ステップS8)。つまり、音声入力禁止判定部110は、ステップS1で入力された音声が「IPアドレスを教えて」等のステータス応答コマンドであるか否かを判定する。
ステップS8で、入力された音声は第3の例外コマンドであると判定された場合(ステップS8がYES判定の場合)、音声入力禁止判定部110は、ステップS7の処理を行う。すなわち、コマンド(第3の例外コマンド)に割り当てられた処理のみを、処理を担当する部に実行させる制御を行う。
一方、ステップS8で、ステップS1で入力された音声は第3の例外コマンドではないと判定された場合(ステップS8がNO判定の場合)、音声入力禁止判定部110は、ステップS1で入力された音声を無効化する(ステップS9)。ステップS9の処理後、音声入力禁止判定部110はステップS1の判定を行う。
次に、図8のステップS2で行う手動操作判定処理の手順について、図9を参照して説明する。
まず、音声入力禁止判定部110は、アクティブ画面はジョブ実行関連画面であるか否かを判定する(ステップS11)。つまり、音声入力禁止判定部110は、図8のステップS1で音声入力が行われたときに操作表示部10に表示されている画面が、印刷設定画面やコピー画面などのジョブ実行関連画面であるか否かを判定する。ステップS11で、アクティブ画面はジョブ実行関連画面であると判定された場合(ステップS11がYES判定の場合)、音声入力禁止判定部110は、音声入力が行われた区間は音声入力禁止区間であると判定し、操作者による手動操作中とみなす(ステップS12)。ステップS12の処理後、音声入力禁止判定部110は手動操作判定処理を終了し、図8のステップS3の判定を行う。
一方、ステップS11で、アクティブ画面はジョブ実行関連画面ではないと判定された場合(ステップS11がNO判定の場合)、音声入力禁止判定部110は、アクティブ画面の表示内容に対する操作者による一定時間あたりの操作量が、予め定められた操作量閾値を超えているか否かを判定する(ステップS13)。「操作量」には、例えば、操作表示部10の画面をタッチした回数、画面上のボタン又は画面とは別に設けられたボタンの押下回数等がある。「一定時間あたりの操作量」と対比される操作量閾値には、その画面に対して操作者が意図的に操作を行っているか否かを判定可能な値が設定される。例えば、操作量閾値には「10秒間に2回」等の値を設定可能である。操作量閾値の値は、この例に限定されず、他の様々な値を取り得る。
ステップS13で、アクティブ画面の表示内容に対する操作者による一定時間あたりの操作量が操作量閾値を超えていると判定された場合(ステップS13がYES判定の場合)、音声入力禁止判定部110は、ステップS12の処理を行う。すなわち、音声入力が行われた区間は音声入力禁止区間であると判定し、操作者による手動操作中とみなす。
一方、ステップS13で、アクティブ画面の表示内容に対する操作者による一定時間あたりの操作量は操作量閾値を超えていないと判定された場合(ステップS13がNO判定の場合)、音声入力禁止判定部110は、アクティブ画面の階層が予め定められた階層数閾値を超えているか否かを判定する(ステップS14)。階層数閾値には、操作者が手動操作を行うことによって達することが想定される画面の遷移の数に相当する階層数を設定可能である。
ステップS14で、アクティブ画面の階層が階層数閾値を超えていると判定された場合(ステップS14がYES判定の場合)、音声入力禁止判定部110は、ステップS12の処理を行う。すなわち、音声入力が行われた区間は音声入力禁止区間であると判定し、操作者による手動操作中とみなす。
一方、ステップS14で、アクティブ画面の階層は階層数閾値を超えていないと判定された場合(ステップS14がNO判定の場合)、音声入力禁止判定部110は、音声入力が行われた区間は音声入力禁止区間ではないと判定し、操作者による手動操作中とはみなさない(ステップS15)。ステップS15の処理後、音声入力禁止判定部110は手動操作判定処理を終了し、図8のステップS3の判定を行う。
なお、図9に示す例では、音声入力禁止判定部110は、ステップ14がNO判定の場合に、音声入力禁止区間ではないと判定し、操作者による手動操作中とはみなさない、というステップS15の処理を行うが、本発明はこれに限定されない。例えば、音声入力禁止判定部110は、ステップS14がNO判定の場合には何の処理も行わずに、手動操作判定処理を終了させてもよい。この場合、音声入力禁止判定部110においては、ステップS12で行った、操作者による手動操作中であるという判定結果のみが保持される。
また、図9に示す例では、音声入力禁止判定部110が、ステップS11、ステップS13及びステップS14の判定のいずれかがYES判定である場合に、音声入力禁止区間であると判定し、操作者による手動操作中とみなす例を挙げたが、本発明はこれに限定されない。音声入力禁止判定部110は、ステップS11、ステップS13及びステップS14のうちの複数又はすべてにおいて行われる判定がYES判定である場合に、音声入力禁止区間であると判定し、操作者による手動操作中とみなしてもよい。
上述した実施形態では、音声入力禁止判定部110によって操作者による手動操作中であると判定された場合、音声入力装置2から音声認識部300への音声データの入力が無効化される。つまり、本実施形態によれば、操作者によって手動操作が行われている時に、周囲にいる他人が発話した場合にも、発話の内容に基づく処理が画像形成装置1で実行されない。それゆえ、本実施形態によれば、周囲にいる他人の発話等に基づいて、操作者が意図しない処理が実行されてしまうことを防ぐことができる。
また、上述した実施形態では、音声入力禁止判定部110は、操作表示部10において表示中のアクティブ画面に関する情報に基づいて、音声入力が行われた区間が音声入力禁止区間であるか否かを判定する。そして、音声入力禁止区間であると判定した場合に、操作者による手動操作中であると判定する。したがって、本実施形態によれば、アクティブ画面で表示中の内容や階層等を含む、アクティブ画面に関する情報に基づいて、操作者によって手動操作が行われているか否かが適切に判定される。
また、上述した実施形態では、音声入力禁止判定部110は、アクティブ画面が、画像処理システム100に入力されたジョブの実行に関する操作を受け付けるジョブ実行関連画面である場合、音声入力が行われた区間は音声入力禁止区間であると判定する。したがって、本実施形態によれば、操作者による音声入力が行われたときに操作表示部10に表示されている画面が、印刷設定画面、コピー画面、ファックス画面、スキャン画面等のジョブ実行関連画面である場合に、操作者による手動操作中であるとみなされ、音声入力が無効化される。それゆえ、本実施形態によれば、操作者の意図しない設定でジョブが実行されたり、意図しない宛先にデータが送信されたりしてしまうなどの問題の発生を防ぐことができる。
また、上述した実施形態では、音声入力禁止判定部110は、アクティブ画面に表示された内容に対して操作者から操作表示部10に入力された操作の、所定時間あたりの操作量が、予め定められた所定の操作量閾値を超えた場合、音声入力が行われた区間は音声入力禁止区間であると判定する。したがって、本実施形態では、操作者が操作表示部10に対して手動操作を行っていると判断が可能な状況において、音声入力が無効化される。それゆえ、本実施形態によれば、操作者が手動操作を行っている際に、周囲にいる他人の発話等に基づいて、操作者が意図しない処理が実行されてしまうことを防ぐことができる。
また、上述した実施形態では、音声入力禁止判定部110は、アクティブ画面の階層が、予め定められた所定の階層数閾値を超えている場合、音声入力が行われた区間は音声入力禁止区間であると判定する。したがって、本実施形態では、操作者が操作表示部10に対して手動操作を行っていると判断が可能な状況において、音声入力が無効化される。それゆえ、本実施形態によれば、操作者が手動操作を行っている際に、周囲にいる他人の発話等に基づいて、操作者が意図しない処理が実行されてしまうことを防ぐことができる。
また、上述した実施形態では、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、音声入力装置2から音声認識部300に入力された音声データが、音声による操作入力の開始を指示する第1の例外コマンドの音声データである場合には、音声入力装置2に入力された音声を有効化にする。つまり、本実施形態では、操作者によって、第1の例外コマンドとしてのウェイクワードが入力された場合に、音声入力が有効化される。それゆえ、本実施形態によれば、操作者が意図的に音声入力を有効化させたい状況において、操作者は必ず音声操作を行えるようになる。
また、上述した実施形態では、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、音声入力装置2から音声認識部300に入力された音声データが、アクティブ画面の操作に関する第2の例外コマンドの音声データである場合には、音声入力装置2に入力された音声を有効化する。したがって、本実施形態では、「アクティブ画面に表示されたボタンの押下」等の第2の例外コマンドが入力された場合に、音声入力が有効化され、操作者による音声操作が可能になる。それゆえ、本実施形態によれば、手動操作による作業が音声操作によってより簡便になるケースにおいて、操作者が音声操作を行うことができるようになる。
また、上述した実施形態では、音声入力禁止判定部110は、操作者による手動操作中であると判定した場合であっても、音声入力装置2から音声認識部300に入力された音声データが、画像処理システム100の状態を問い合せる第3の例外コマンドの音声データである場合には、音声入力装置2に入力された音声を有効化する。したがって、本実施形態では、画像処理システム100の状態を問い合せる等の、操作者による手動作業が妨害されないケースにおいて、操作者が音声操作を行うことができるようになる。
<各種変形例>
なお、本発明は上述した実施形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、その他種々の応用例、変形例を取り得る。
上述した実施形態では、音声入力禁止判定部110を画像形成装置1内に設ける例を挙げたが、本発明はこれに限定されない。音声入力禁止判定部110をクラウド3上に設けることにより、音声入力禁止判定処理をクラウド3側で実行させてもよい。この場合、クラウド3上に設けられた音声入力禁止判定部110は、画像形成装置1のステータス(アクティブ画面情報等)を取得し、取得した内容に基づいて音声入力禁止判定処理を行う。そして、クラウド3上に設けられた音声入力禁止判定部110は、手動操作中ではないと判定した場合にのみ、音声認識した認識音声と対応するコマンドを生成して、該コマンドを画像形成装置1に送信する。
もしくは、音声入力禁止判定部110が実行する音声入力禁止判定処理のうちの手動操作判定処理(図9参照)のみを、クラウド3上に設けた音声入力禁止判定部110に実行させてもよい。
また、上述した実施の形態では、ステータス応答コマンドに対する応答を、音声入力装置2の音声出力部36(図3参照)が行う例を挙げたが、本発明はこれに限定されない。ステータス応答コマンドに対する応答は、画像形成装置1内に設けられた不図示のスピーカーから放音させてもよい。
1…画像形成装置、2…音声入力装置、3…クラウド、10…操作表示部、11…制御部、12…不揮発メモリ、13…RAM、14…HDD、15…自動原稿搬送部、16…画像読み取り部、17…画像処理部、18…プリンター部、19…有線通信部、20…無線通信部、21…ファクシミリ通信部、30…マイクロフォン、31…制御部、32…不揮発メモリ、33…RAM、34…有線通信部、35…無線通信部、36…音声出力部、100…画像処理システム、110…音声入力禁止判定部、120…例外コマンド保存部、300…音声認識部、L1…第1の例外コマンドリスト、L2…第2の例外コマンドリスト、L3…第3の例外コマンドリスト

Claims (10)

  1. 操作者による手動操作が入力される操作入力部と、
    音声を入力し、前記入力した音声を音声データに変換して出力する音声入力部と、
    前記音声入力部から入力された前記音声データに対して音声認識処理を行い、認識結果を出力する音声認識部と、
    前記音声認識部から入力された前記認識結果と予め対応付けられた処理を実行する制御部と、
    前記操作者による手動操作中であるか否かを判定し、前記手動操作中であると判定した場合に、前記音声入力部に入力された音声を無効化する音声入力禁止判定部と
    表示部と、を備え、
    前記音声入力禁止判定部は、前記音声入力部への音声入力が行われたときに前記表示部に表示されている画面に関する情報に基づいて、前記音声入力部への音声入力が行われた区間が音声入力禁止区間であるか否かを判定し、前記音声入力禁止区間であると判定した場合に、前記手動操作中であると判定する
    画像処理システム。
  2. 前記音声入力禁止判定部は、前記音声入力部への音声入力が行われたときに前記表示部に表示されている画面が、画像処理システムに入力されたジョブの実行に関する操作を受け付けるジョブ実行関連画面である場合、前記音声入力部への音声入力が行われた区間は前記音声入力禁止区間であると判定する
    請求項に記載の画像処理システム。
  3. 前記音声入力禁止判定部は、前記表示部において表示中の画面に表示された内容に対して前記操作者から前記操作入力部に入力された操作の、所定時間あたりの操作量が、予め定められた所定の操作量閾値を超えた場合、前記音声入力部への音声入力が行われた区間は前記音声入力禁止区間であると判定する
    請求項又はに記載の画像処理システム。
  4. 前記音声入力禁止判定部は、前記表示部において表示中の画面の階層が、予め定められた所定の階層数閾値を超えている場合、前記音声入力部への音声入力が行われた区間は前記音声入力禁止区間であると判定する
    請求項のいずれか一項に記載の画像処理システム。
  5. 前記音声入力禁止判定部は、前記手動操作中であると判定した場合であっても、前記音声入力部から前記音声認識部に入力された音声データが、音声による操作入力の開始を指示する第1の例外コマンドの音声データである場合には、前記音声入力部に入力された音声を有効化する
    請求項のいずれか一項に記載の画像処理システム。
  6. 前記音声入力禁止判定部は、前記手動操作中であると判定した場合であっても、前記音声入力部から前記音声認識部に入力された音声データが、前記表示部において表示中の画面の操作に関する第2の例外コマンドの音声データである場合には、前記音声入力部に入力された音声を有効化する
    請求項のいずれか一項に記載の画像処理システム。
  7. 前記音声入力禁止判定部は、前記手動操作中であると判定した場合であっても、前記音声入力部から前記音声認識部に入力された音声データが、画像処理システムの状態を問い合せる第3の例外コマンドの音声データである場合には、前記音声入力部に入力された音声を有効化する
    請求項のいずれか一項に記載の画像処理システム。
  8. 操作者による手動操作が入力される操作入力部と、
    記録材に画像を形成する画像形成部と、
    入力された音声を音声入力部が変換した音声データを、音声認識部が音声認識処理することにより得られる認識結果と予め対応付けられた、前記画像形成部による画像形成処理を含む処理を実行する制御部と、
    前記操作者による手動操作中であるか否かを判定し、前記手動操作中であると判定した場合に、前記音声入力部に入力された音声を無効化する音声入力禁止判定部と
    表示部と、を備え、
    前記音声入力禁止判定部は、前記音声入力部への音声入力が行われたときに前記表示部に表示されている画面に関する情報に基づいて、前記音声入力部への音声入力が行われた区間が音声入力禁止区間であるか否かを判定し、前記音声入力禁止区間であると判定した場合に、前記手動操作中であると判定する
    画像形成装置。
  9. 操作入力部が操作者による操作を受け付けることと、
    音声入力部が音声を入力し、前記入力した音声を音声データに変換して出力することと、
    音声認識部が入力された前記音声データに対して音声認識処理を行い、認識結果を出力することと、
    制御部が入力された前記認識結果と予め対応付けられた処理を実行することと、
    音声入力禁止判定部が前記操作者による手動操作中であるか否かを判定し、前記手動操作中であると判定した場合に、前記入力された音声を無効化することと、を含む音声入力禁止判定方法であって、
    前記音声入力禁止判定部は、前記音声入力部への音声入力が行われたときに表示部に表示されている画面に関する情報に基づいて、前記音声入力部への音声入力が行われた区間が音声入力禁止区間であるか否かを判定し、前記音声入力禁止区間であると判定した場合に、前記手動操作中であると判定する
    音声入力禁止判定方法。
  10. 操作入力部が操作者による操作を受け付けることと、
    音声入力部が音声を入力し、前記入力した音声を音声データに変換して出力することと、
    音声認識部が入力された前記音声データに対して音声認識処理を行い、認識結果を出力することと、
    制御部が入力された前記認識結果と予め対応付けられた、記録材に画像を形成する画像形成処理を含む処理を実行することと、
    音声入力禁止判定部が前記操作者による手動操作中であるか否かを判定し、前記手動操作中であると判定した場合に、前記入力された音声を無効化することと、をコンピュータに実行させるプログラムであって、
    前記音声入力禁止判定部は、前記音声入力部への音声入力が行われたときに表示部に表示されている画面に関する情報に基づいて、前記音声入力部への音声入力が行われた区間が音声入力禁止区間であるか否かを判定し、前記音声入力禁止区間であると判定した場合に、前記手動操作中であると判定する
    プログラム。
JP2018235296A 2018-12-17 2018-12-17 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム Active JP7230482B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018235296A JP7230482B2 (ja) 2018-12-17 2018-12-17 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム
EP19211880.0A EP3671350A1 (en) 2018-12-17 2019-11-27 Image processing system, image forming apparatus, voice input inhibition determination method, and program
US16/705,342 US20200193991A1 (en) 2018-12-17 2019-12-06 Image processing system, image forming apparatus, voice input inhibition determination method, and recording medium
CN201911279651.8A CN111327780A (zh) 2018-12-17 2019-12-13 图像处理系统、图像形成装置、判定方法以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018235296A JP7230482B2 (ja) 2018-12-17 2018-12-17 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020098229A JP2020098229A (ja) 2020-06-25
JP7230482B2 true JP7230482B2 (ja) 2023-03-01

Family

ID=68731692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018235296A Active JP7230482B2 (ja) 2018-12-17 2018-12-17 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム

Country Status (4)

Country Link
US (1) US20200193991A1 (ja)
EP (1) EP3671350A1 (ja)
JP (1) JP7230482B2 (ja)
CN (1) CN111327780A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741951B2 (en) * 2019-02-22 2023-08-29 Lenovo (Singapore) Pte. Ltd. Context enabled voice commands
JP7206167B2 (ja) * 2019-08-13 2023-01-17 Tvs Regza株式会社 受信装置
JP2022186364A (ja) 2021-06-04 2022-12-15 キヤノン株式会社 情報処理システム、情報処理装置、情報処理方法、並びにプログラム
JP2022190943A (ja) * 2021-06-15 2022-12-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022564A (ja) 1998-07-03 2000-01-21 Uniden Corp 受信機、コードレス電話機子機、コードレス電話機付きファクシミリ装置及びコードレス留守番電話機
JP2006031725A (ja) 2005-08-10 2006-02-02 Microsoft Corp 文字処理装置
JP2014112129A (ja) 2012-12-05 2014-06-19 Denso Corp 制御装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03243027A (ja) * 1990-02-21 1991-10-30 Oki Electric Ind Co Ltd 車載端末装置
JP2952223B2 (ja) * 1997-10-09 1999-09-20 オリンパス光学工業株式会社 コードイメージ記録装置
GB9911971D0 (en) * 1999-05-21 1999-07-21 Canon Kk A system, a server for a system and a machine for use in a system
JP4659505B2 (ja) * 2005-04-04 2011-03-30 キヤノン株式会社 情報処理方法及び装置
JP4560463B2 (ja) 2005-09-13 2010-10-13 キヤノン株式会社 データ処理装置、データ処理方法及びコンピュータプログラム
JP2007114297A (ja) 2005-10-18 2007-05-10 Canon Inc 音声認識手段を持つ画像形成装置
CN105761719A (zh) * 2016-04-12 2016-07-13 九阳股份有限公司 一种具有语音声控的厨房电器及控制方法
JP6693300B2 (ja) * 2016-06-27 2020-05-13 富士ゼロックス株式会社 情報処理装置及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022564A (ja) 1998-07-03 2000-01-21 Uniden Corp 受信機、コードレス電話機子機、コードレス電話機付きファクシミリ装置及びコードレス留守番電話機
JP2006031725A (ja) 2005-08-10 2006-02-02 Microsoft Corp 文字処理装置
JP2014112129A (ja) 2012-12-05 2014-06-19 Denso Corp 制御装置

Also Published As

Publication number Publication date
JP2020098229A (ja) 2020-06-25
US20200193991A1 (en) 2020-06-18
CN111327780A (zh) 2020-06-23
EP3671350A1 (en) 2020-06-24

Similar Documents

Publication Publication Date Title
JP7230482B2 (ja) 画像処理システム、画像形成装置、音声入力禁止判定方法及びプログラム
US8510115B2 (en) Data processing with automatic switching back and forth from default voice commands to manual commands upon determination that subsequent input involves voice-input-prohibited information
JP7180330B2 (ja) 情報処理システム、情報処理装置、および方法
JP7215118B2 (ja) 情報処理装置、情報処理システム、プログラムおよび方法
US11211069B2 (en) Information processing system, information processing method, and non-transitory recording medium
JP7188036B2 (ja) 情報処理装置、情報処理システム、および方法
US20200076969A1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP7159892B2 (ja) 画像形成装置、画像形成システム、および情報処理方法
US9531907B2 (en) Method for selecting sheet feed portion for image formation, image forming apparatus, and information processing apparatus
US9185257B2 (en) Information processing apparatus and method for job setting within or outside range of use authority of users
JP7284455B2 (ja) 装置
JP2021051416A (ja) 音声操作システム、音声操作方法及びプログラム
US11647129B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2005321488A (ja) 音声出力装置および操作表示装置および音声出力制御方法および操作表示制御方法およびプログラムおよび記憶媒体
JP7218192B2 (ja) 画像形成装置
US11055042B2 (en) Image forming apparatus and method for controlling image forming apparatus
JP2019083497A (ja) 画像処理装置およびその動作制御方法
JP7211181B2 (ja) 制御装置、画像形成システムおよびプログラム
JP7409135B2 (ja) 処理条件設定システム、処理条件設定方法及びプログラム
US11368593B2 (en) Image forming system allowing voice operation, control method therefor, and storage medium storing control program therefor
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP7115259B2 (ja) 画像形成装置及びプログラム
JP7095571B2 (ja) 画像形成装置
JP7127424B2 (ja) 画像処理装置及びプログラム
JP2021170154A (ja) 制御装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230130

R150 Certificate of patent or registration of utility model

Ref document number: 7230482

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150