JP2020064197A - 画像形成装置、音声認識装置、及びプログラム - Google Patents
画像形成装置、音声認識装置、及びプログラム Download PDFInfo
- Publication number
- JP2020064197A JP2020064197A JP2018196340A JP2018196340A JP2020064197A JP 2020064197 A JP2020064197 A JP 2020064197A JP 2018196340 A JP2018196340 A JP 2018196340A JP 2018196340 A JP2018196340 A JP 2018196340A JP 2020064197 A JP2020064197 A JP 2020064197A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- job
- unit
- noise pattern
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 38
- 230000008859 change Effects 0.000 claims description 19
- 230000005856 abnormality Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 description 42
- 230000008569 process Effects 0.000 description 27
- 230000006870 function Effects 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011410 subtraction method Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00352—Input means
- H04N1/00403—Voice input means, e.g. voice commands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00976—Arrangements for regulating environment, e.g. removing static electricity
- H04N1/00994—Compensating for electric noise, e.g. electromagnetic interference
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Electromagnetism (AREA)
- Environmental & Geological Engineering (AREA)
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】ジョブ実行中に入力される音声による実行指示を正確に認識する。【解決手段】画像形成装置は、入力されたジョブを実行するジョブ制御部222と、ジョブ制御部222により実行されるジョブのジョブ実行状態に基づいて発生する自装置の動作音に対応するノイズパターンを判定するノイズパターン判定部221と、ジョブ制御部222が実行中のジョブの種別に応じてノイズパターン判定部221が判定したノイズパターンのデータに基づいて、音を集音する音声入力部150より入力される音データからノイズパターンに該当するノイズを除去するノイズ除去部212と、を有するメインコントローラと、ノイズが除去された音データから実行指示を認識する音声認識部214を有する音声処理部と、を備える。【選択図】図3
Description
本発明は、画像形成装置、音声認識装置、及びプログラムに関する。
従来、FAX機能や複写、印刷機能を有する、いわゆるデジタル複合機などの画像形成装置に対するジョブや各種処理等の実行指示は、操作パネルへのタッチ操作を通じて行われてきた。近年では、操作パネルによる実行指示のみならず、音声入力デバイスに音声を入力することで実行指示(以下、「音声による実行指示」と呼ぶ)を行える画像形成装置が登場している。例えば、ユーザが発話した音声に、画像形成装置が実行可能な処理を示すフレーズが含まれていると、画像形成装置は、音声入力デバイスに入力した音声から抽出したフレーズに対応する音データから特定した実行指示に基づくジョブを実行することが可能である。
このため、ユーザは、画像形成装置に実行指示を行う際に、画像形成装置に触れなくても画像形成装置を操作可能である。これにより、ユーザは、画像形成装置に対する複雑な操作が不要となり、「使いやすさ」、「分かりやすさ」等の利便性が向上する。そのため、ユーザの身体能力、年齢、ユーザの体格等にかかわらず、「使いにくい」、「分からない」という不平不満の要素を解消するユニバーサルデザインへの取組みを促進することができる。
音声入力デバイスとして、例えば、マイクロフォン(以下、「マイク」と略記する。)が用いられる。マイクは、通常、画像形成装置本体に内蔵されるか、画像形成装置の近接箇所に設置される。しかし、ジョブの実行中に音声による実行指示がされる場合、ジョブの実行に伴い画像形成装置の可動部が動作して発生する動作音が、ユーザの音声と共にマイクに混入してしまう場合がある。すると、画像形成装置は、音データを解析しても、動作音がノイズとなってユーザの音声を正確に認識できず、実行指示を特定できなくなって、ジョブ等の実行もできなかった。
動作音が、ユーザの音声と共にマイクに混入してしまうことを防ぐために、例えば、特許文献1及び特許文献2に開示された技術が知られている。
特許文献1には、ユーザから操作に対する発話音声があった場合、画像形成装置が、機器の動作を一時停止させることにより機器動作中に発生する動作音によって音声認識の認識率を低下することを回避する技術が開示されている。
特許文献1には、ユーザから操作に対する発話音声があった場合、画像形成装置が、機器の動作を一時停止させることにより機器動作中に発生する動作音によって音声認識の認識率を低下することを回避する技術が開示されている。
特許文献2には、音声認識装置が屋内で使用される場合と、音声認識装置が車内で使用される場合とで、音声認識装置が、屋内用のノイズキャンセル特性と、車内用のノイズキャンセル特性とを判断して音声認識処理を実行する技術が開示されている。
マイクに入力されるノイズを除去するには、時系列順に入力される音に基づいて、発生するノイズを予測し、予測に従い入力されたノイズの除去を行う方法などがある。しかし、この方法では、定常的に発生している環境音等は除去できても、画像形成装置の動作に伴って発生する、音量や音質の変化が不規則な音を除去することはできない。不規則な音とは、例えば、画像形成装置の内部に搭載されている種々の部品が個々に動作音を発して混ざり合った複雑な音や、異常発生時の異常音など、突発的に発生する音である。
特許文献1に開示された技術では、ユーザから操作に対する発話音声が行われる間、装置が一時停止し、一時停止状態が解除されるまでジョブの実行が停止されるため、ジョブの実行が遅滞する。これにより、ユーザは、画像形成装置の利便性が低下したと感じることとなる。また、特許文献1に開示された技術では、ノイズレベルが高い環境下(例えば、ノイズ音が大きい)において、発話音声があったか否かをそもそも判定することが困難である。
また、特許文献2に開示された技術では、音声認識装置が使用環境下に応じてノイズキャンセル特性を切り替える制御を行うため、それぞれの使用環境で発生する定常的なノイズを低減することしかできなかった。このため、音量や音質の変化が急激な音に対しては、これをノイズとして除去することができなかった。
本発明はこのような状況に鑑みて成されたものであり、本発明の目的は、実行中のジョブが動作音を発生させている環境下においても、音声による実行指示を正確に認識することにある。
本発明に係る画像形成装置は、入力されたジョブを実行する制御部と、制御部により実行されるジョブのジョブ実行状態に基づいて発生する自装置の動作音に対応するノイズパターンを判定するノイズパターン判定部と、制御部が実行中のジョブの種別に応じてノイズパターン判定部が判定したノイズパターンのデータに基づいて、音を集音する入力部より入力される音データから、ノイズパターンに該当するノイズを除去するノイズ除去部と、ノイズが除去された音データから実行指示を認識する音声認識部と、を備える。
本発明によれば、実行中のジョブの種別に応じて選択したノイズパターンのデータに基づいて、音データからノイズパターンに該当するノイズを除去するため、音声によるジョブの実行指示を正確に認識することができる。
上記した以外の課題、構成及び効果は、以下の実施の形態の説明により明らかにされる。
上記した以外の課題、構成及び効果は、以下の実施の形態の説明により明らかにされる。
以下、本発明を実施するための形態例について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素については、同一の符号を付することにより重複する説明を省略する。
[一実施の形態]
<画像形成装置の構成例>
まず、本実施の形態に係る画像形成装置1の構成例について説明する。
図1では、本発明の説明に必要と考える要素又はその関連要素が記載されるが、画像形成装置1はこの例に限られない。
<画像形成装置の構成例>
まず、本実施の形態に係る画像形成装置1の構成例について説明する。
図1では、本発明の説明に必要と考える要素又はその関連要素が記載されるが、画像形成装置1はこの例に限られない。
画像形成装置1は、例えば複写機などの電子写真方式の画像形成装置が一例として挙げられる。図1に示す画像形成装置1は、いわゆるタンデム型カラー画像形成装置とも言われ、複数の感光体を一本の中間転写ベルトに対面させて縦方向に配列することによりフルカラーの画像を形成することが可能である。
画像形成装置1は、画像読取部20、画像形成部40、用紙搬送部50、定着装置60及び操作表示部70備える。
画像読取部20は、走査露光装置の光学系により原稿の画像を走査露光し、その反射光をラインイメージセンサにより読み取って画像信号を得る。
画像読取部20は、走査露光装置の光学系により原稿の画像を走査露光し、その反射光をラインイメージセンサにより読み取って画像信号を得る。
画像形成部40は、用紙P(記録材の一例)に画像を形成する。画像形成部40は、イエロー(Y)の画像を形成する画像形成部40Y、マゼンタ(M)の画像を形成する画像形成部40M、シアン(C)の画像を形成する画像形成部40C及びブラック(K)の画像を形成する画像形成部40Kを備える。画像形成部40Y、40M、40C、40Kは、記録材の一例である樹脂製のシートにもトナー像を転写することが可能である。
画像形成部40Yは、感光体ドラムY及びその周辺に配置された帯電部42Y、レーザーダイオード41Yを有した光書込部43Y、現像装置44Y及びドラムクリーナー45Yを備える。同様に、画像形成部40M、41C、41Kは、感光体ドラムM、C、K及びその周辺に配置された帯電部42M、42C、42K、レーザーダイオード41M、41C、41Kを有した光書込部43M、43C、43K、現像装置44M、44C、44K及びドラムクリーナー45M、45C、45Kを備える。
感光体ドラムYは、帯電部42Yにより表面が一様に帯電しており、感光体ドラムYには、光書込部43Yのレーザーダイオード41Yからの走査露光により潜像が形成される。さらに、現像装置44Yは、トナーで現像することによって感光体ドラムY上の潜像を顕像化する。これにより、感光体ドラムY上には、イエローに対応する画像が形成される。
同様に、感光体ドラムMは、帯電部42Mにより表面が一様に帯電しており、感光体ドラムMには、光書込部43Mのレーザーダイオード41Mからの走査露光により潜像が形成される。さらに、現像装置44Mは、トナーで現像することによって感光体ドラムM上の潜像を顕像に変える。これにより、感光体ドラムM上には、マゼンタに対応する画像が形成される。
感光体ドラムCは、帯電部42Cにより表面が一様に帯電しており、感光体ドラムCには、光書込部43Cのレーザーダイオード41Cからの走査露光により潜像が形成される。さらに、現像装置44Cは、トナーで現像することによって感光体ドラムC上の潜像を顕像に変える。これにより、感光体ドラムC上には、シアンに対応する画像が形成される。
感光体ドラムKは、帯電部42Kにより表面が一様に帯電しており、感光体ドラムKには、光書込部43Kのレーザーダイオード41Kからの走査露光により潜像が形成される。さらに、現像装置44Kは、トナーで現像することによって感光体ドラムK上の潜像を顕像に変える。これにより、感光体ドラムK上には、ブラックに対応する画像が形成される。
感光体ドラムY、M、C、K上に形成された画像は、1次転写ローラー47Y、47M、47C、47Kにより、ベルト状の中間転写体である中間転写ベルト46上の所定位置に逐次1次転写される。中間転写ベルト46上に転写された各色よりなる画像は、用紙搬送部50により所定のタイミングで搬送される用紙Pに対して、2次転写部48で2次転写される。
用紙搬送部50は、用紙Pが収納される複数の給紙装置51と、給紙装置51に収納された用紙Pを繰り出して給紙する給紙部51aを備える。また、用紙搬送部50は、給紙装置51から給紙された用紙Pが搬送される主搬送路53、定着装置60の下流側で主搬送路53から分岐し用紙Pの表裏を反転させる反転搬送路54、及び用紙Pが排紙される排紙トレイ55を備える。
用紙搬送部50は、反転搬送路54と主搬送路53との分岐箇所に設けた切換ゲート53aを備える。主搬送路53を搬送され、2次転写部48及び定着装置60を通過した用紙Pには、画像形成装置1内で上側を向いた面(第一面)に画像が形成される。用紙Pの両面に画像を形成する場合、上側を向いた面に画像が形成された用紙Pが主搬送路53から反転搬送路54に搬送される。そして、反転搬送路54に設けられた用紙反転搬送路56にて用紙Pが反転されて、用紙Pの画像形成面(第一面)が下側を向く。その後、用紙Pが主搬送路53へ搬送される。これにより、表裏反転された用紙Pの上側を向いた他の面(第二面)に画像を形成することが可能となる。
定着装置60は、画像形成部40により形成されたトナー像を用紙Pに定着するため、定着ローラー61及び加圧ローラー62を備える。この定着装置60は、中間転写ベルト46の下流に配置される。そして、定着装置60は、圧着した一対の定着ローラー61と加圧ローラー62により、用紙Pを搬送すると共に、トナー像が2次転写された用紙Pに対して、トナー像を定着させる定着処理を行う。定着ローラー61と加圧ローラー62は、共に定着部材として用いられる。定着ローラー61の内部には、ヒーターHが設けられている。ヒーターHは、定着ローラー61を加熱することで、定着ローラー61と、加圧ローラー62との定着ニップNを通過する用紙Pに熱が伝わるように定着ローラー61の表面を加熱する。加熱された定着ローラー61は、定着ローラー61の軸に対して回転することにより、定着ニップNを通過中の用紙Pに熱を伝える。用紙Pが加熱されることで、用紙P上のトナー像が融解し、用紙Pにトナー像が定着する。
また、操作表示部70は、操作部71、表示部72、マイク201を備える。操作部71は、複数の操作ボタンからなり、ユーザの操作を受け付ける。表示部72は、タッチパネルと、ディスプレイとを備えるタッチパネルディスプレイから構成され、案内画面等のような各種画面をユーザに提示する。表示部72は、タッチ操作用の操作ボタンの画像を表示すると共に、ユーザのタッチ操作を受け付ける。マイク201は、ユーザの音声(音声による実行指示含む)、画像形成装置1から発生する動作音及び環境音などを集音する。
<画像形成装置の要部の構成例>
図2は、画像形成装置1の要部の構成例を示す機能ブロック図である。
画像形成装置1は、メインコントローラ100と、画像読取部20、画像形成部40、操作表示部70、通信部140、音声入力部150(入力部の一例)及び音声処理部160を備える。これらの機能部は、相互に接続されている。
図2は、画像形成装置1の要部の構成例を示す機能ブロック図である。
画像形成装置1は、メインコントローラ100と、画像読取部20、画像形成部40、操作表示部70、通信部140、音声入力部150(入力部の一例)及び音声処理部160を備える。これらの機能部は、相互に接続されている。
メインコントローラ100は、操作表示部70に対するタッチ操作による実行指示、又は通信部140を介して不図示のPC(Personal Computer)端末、プリントコントローラ等から入力する実行指示に基づき、画像読み取り処理(スキャン)、画像形成処理(印刷)等のジョブや各種処理(設定変更)等を実行する。以下の説明では、「ジョブや各種処理等」を、総称して「ジョブ」と呼ぶ。
また、メインコントローラ100は、音声入力部150を通じてジョブの実行を指示するユーザからの音声が入力されると、音声処理部160が認識した実行指示に基づき、ジョブを実行する。
また、メインコントローラ100は、音声入力部150を通じてジョブの実行を指示するユーザからの音声が入力されると、音声処理部160が認識した実行指示に基づき、ジョブを実行する。
画像読取部20、画像形成部40及び操作表示部70は、図1と説明が重複するため詳細な説明を省略する。
通信部140は、例えば、NIC(Network Interface Card)やモデム等で構成され、画像形成装置1の外部のLAN等の不図示のネットワークNと接続されるインターフェースである。通信部140は、例えば、PC端末等との間で接続を確立し、各種データの送受信を実行する。
通信部140は、例えば、NIC(Network Interface Card)やモデム等で構成され、画像形成装置1の外部のLAN等の不図示のネットワークNと接続されるインターフェースである。通信部140は、例えば、PC端末等との間で接続を確立し、各種データの送受信を実行する。
音声入力部150は、音声入力部150が設置された位置における周囲の音を集音する。音声入力部150は、入力した音をデジタル信号の音データに変換して、音声処理部160(後述する図2を参照)に出力する。ここで、音声入力部150に入力する音とは、例えば、画像形成装置1がジョブを実行することで画像形成装置1の内部で発生する動作音や、音声入力部150の前でユーザが発した音声等である。なお、画像形成装置1がジョブのジョブ種別に応じて、異なる動作音が発生する。
音声処理部160は、音声入力部150から入力したデジタル信号の音データからノイズパターンに該当するノイズを除去して音声認識を行い、ユーザが発した音声による実行指示に応じたジョブを特定する。音声処理部160の詳細は、後述の図3で記載する。
メインコントローラ100は、いわゆるコンピュータとして用いられるハードウェアである。メインコントローラ100は、CPU(Central Processing Unit:中央処理装置)105、ROM(Read Only Memory)101、メモリ103を備える。さらに、メインコントローラ100は、HDD(Hard Disk Drive)102、ASIC(Application Specific Integrated Circuit)104を備える。メインコントローラ100の各部は、不図示のバスを介して接続されている。
CPU105は、本実施の形態例に係る各機能を実現するソフトウェアのプログラムコードをROM101から読み出して実行する。図3で説明するノイズパターン判定部221、ジョブ制御部222及び操作受付部223は、CPU105により実行される機能の一部である。
ROM101は、不揮発性メモリの一例として用いられ、CPU105が動作するために必要なプログラムやデータ等を記憶している。
メモリ103は、揮発性メモリの一例として用いられ、CPU105が行う各処理に必要な演算処理の途中に発生した変数やパラメータ等を一時的に記憶する。
ROM101は、不揮発性メモリの一例として用いられ、CPU105が動作するために必要なプログラムやデータ等を記憶している。
メモリ103は、揮発性メモリの一例として用いられ、CPU105が行う各処理に必要な演算処理の途中に発生した変数やパラメータ等を一時的に記憶する。
ASIC104は、画像形成装置1において、CPU105の処理負荷を軽減させるとともに、複雑な各種の処理機能を効率よく、迅速に実行させるため、画像形成装置1の行う各処理の内、一部の処理を実行する。例えば、画像形成装置1に入力された画像データを圧縮してメモリ103に保存するための圧縮処理や、圧縮後の画像データを印刷するために伸長する伸長処理を行う。
また、ASIC104は、音声入力部150に入力された音データを、予め定められた音圧縮方式(例えば、MP3(MPEG Audio Layer 3))に従って音データを圧縮し、圧縮されている音データを予め定められた音伸長方式に従って伸長する。
HDD102は、不揮発性ストレージの一例として用いられ、HDD102には、CPU105が各部を制御するためのプログラム、OS、コントローラー等のプログラム、データが記憶される。HDD102に記憶されるプログラム、データの一部は、ROM101にも記憶されている。HDD102及びROM101は、CPU105によって実行されるプログラムを格納したコンピュータ読取可能な非一過性の記録媒体の一例として用いられる。このため、HDD102には、このプログラムが永続的に格納される。なお、メインコントローラ100によって実行されるプログラムを格納したコンピュータ読取可能な非一過性の記録媒体としては、HDDに限定されず、例えば、SSD(Solid State Drive)、CD−ROM、DVD−ROM等の記録媒体であってもよい。
本実施の形態に係る画像形成装置1は、操作表示部70や通信部140からの実行指示に基づくジョブを実行することができる。同様に、画像形成装置1は、音声入力部150に入力される、ユーザからの音声による実行指示により、ジョブを実行することも可能である。
<画像形成装置に対する音声による実行指示の例>
図3は、音声による実行指示に対する画像形成装置の機能を示す機能ブロック図である。
音声入力部150は、マイク201及びAD変換部(ADC:Analog To Digital Converter)202を備える。
音声処理部160は、ノイズパターン格納部211、ノイズ除去部212、操作パターン格納部213及び音声認識部214を備える。ノイズパターン格納部211は、記憶部の一例として示される。
メインコントローラ100は、ノイズパターン判定部221、ジョブ制御部222及び操作受付部223を備える。
図3は、音声による実行指示に対する画像形成装置の機能を示す機能ブロック図である。
音声入力部150は、マイク201及びAD変換部(ADC:Analog To Digital Converter)202を備える。
音声処理部160は、ノイズパターン格納部211、ノイズ除去部212、操作パターン格納部213及び音声認識部214を備える。ノイズパターン格納部211は、記憶部の一例として示される。
メインコントローラ100は、ノイズパターン判定部221、ジョブ制御部222及び操作受付部223を備える。
マイク201は、設置された位置の周辺から集音した音をアナログ信号のデータとしてAD変換部202に出力する。マイク201は、画像形成装置1の近傍に設置され、ユーザの音声を集音する。音声には、ユーザが画像形成装置1にジョブを実行させるための実行指示に対応するフレーズが含まれる。なお、マイク201は、ユーザが実行指示を発声した時に画像形成装置1がジョブを実行中であれば、ユーザの実行指示の音声とともに、画像形成装置1の可動部が動作することにより発生する動作音を集音する。
AD変換部202は、マイク201が集音したアナログ信号の音データを、デジタル信号の音データに変換する。ユーザが実行指示を発声した時にジョブが実行中であれば、ユーザの音声に動作音が混入した音データが生成される。この動作音が、音データに混入したノイズである。
音データに動作音が混入すると、画像形成装置1は、音データからユーザの音声だけを正確に認識できず、音声による実行指示に基づいてジョブを実行することが困難となる。画像形成装置1が、音声による実行指示を正確に認識するためには、音データからノイズである動作音を除く必要がある。動作音は、画像形成装置の構造上、ジョブの種別に応じてそれぞれ規則的に発生する性質がある。そのため、単一のジョブが実行される場合には、画像形成装置から発生する動作音を予測することができる。そこで、AD変換部202は、変換したデジタル信号の音データを音声処理部160のノイズ除去部212に出力する。
ノイズ除去部212は、メインコントローラ100のジョブ制御部222に実行中のジョブがあれば、実行中のジョブの種別に応じて、ノイズパターン判定部221で判定されたノイズパターンのデータに基づいて、音データから、ノイズパターンに該当するノイズを除去する。ノイズ除去部212によるノイズの除去処理は、AD変換部202からデジタル信号の音データが入力された時に、リアルタイムで行われる。ノイズ除去部212は、ノイズの除去処理を行うため、ジョブ制御部222から、実行中のジョブに関するジョブ情報(例えば、印刷設定)を取得する。これによりノイズパターンのデータをノイズパターン格納部211から正確に取得することができる。
ノイズ除去部212は、ノイズパターンに該当するノイズを除去した音データ(以下、「ノイズ除去済み音データ」と呼ぶ)を音声認識部214に出力する。
なお、AD変換部202からデジタル信号の音データを受信した時に、実行中のジョブがなければ、ノイズ除去部212は、音データをそのまま音声認識部214に出力する。
なお、AD変換部202からデジタル信号の音データを受信した時に、実行中のジョブがなければ、ノイズ除去部212は、音データをそのまま音声認識部214に出力する。
ノイズパターン格納部211には、ジョブ制御部222により実行されるジョブの種別に応じて発生する画像形成装置1(自装置)の動作音に対応するノイズパターンのデータが予め格納されている。また、ノイズパターン格納部211には、ノイズパターン判定部221で生成されるノイズパターンのデータをも新たに格納される。このため、ノイズ除去部212は、ジョブ制御部222が実行中のジョブの種別、複数のジョブの実行状況に応じて、ノイズパターン判定部221が判定したノイズパターンのデータをノイズパターン格納部211から取得し、音データからノイズパターンのデータを除去することができる。
操作パターン格納部213には、ユーザが画像形成装置1にジョブを実行させるための実行指示に対応する音データのパターン(「操作パターンデータ」と呼ぶ)が予め格納されている。また、ジョブの実行を短縮する操作パターンデータがユーザによって定義され、操作パターン格納部213に追加登録されるようにしてもよい。例えば、予め、スキャン処理とプリント処理の両方を行う操作を「操作の1番」と設定しておく。仮に、ユーザが、画像読取部20に載置した原稿に対して、スキャン処理と印刷処理を画像形成装置1に指示する場合、ユーザが「操作の1番」と音声入力する。これにより、一言で複数のジョブ(スキャン処理後に印刷処理)を画像形成装置1に実行させることが可能となる。
音声認識部214は、ノイズ除去済み音データと、操作パターン格納部213から取得した操作パターンデータとを比較する。音声認識部214は、ノイズ除去済み音データと一致する操作パターンデータが存在した場合、実行指示を認識(音声認識)し、操作受付部223にその操作パターンデータに基づく実行指示を出力する。このようにして、音声認識部214は、ノイズ除去済み音データから、音声入力部150を通じて行われる実行指示を認識することができる。
操作受付部223は、音声認識部214から入力されたジョブの実行指示をジョブ制御部222に入力する。このように操作受付部223に、ジョブの実行指示が入力されることを「操作受付」と呼ぶ。
ジョブ制御部222は、操作受付部223から入力された実行指示に基づいて、画像形成装置1に入力されたジョブを実行する。ジョブ制御部222が実行中のジョブの情報、実行中のジョブの実行状態の情報は、ノイズパターン判定部221及びノイズ除去部212に適宜送られる。
ノイズパターン判定部221は、ジョブ制御部222からジョブのジョブ実行状態の情報を取得する。そして、ノイズパターン判定部221は、ジョブ制御部222により実行されるジョブ実行状態に基づいて発生する、画像形成装置1内の動作音に対応するノイズパターンを判定する。なお、ジョブ実行状態は、通常、ジョブ開始からジョブ終了まで変化しない。
しかし、仮に、継続されるはずのジョブ実行状態が変化した場合には、ジョブの動作音に対応するノイズパターンのデータはノイズパターン格納部211に存在しなくなる。これは、ノイズパターンのデータが、ジョブ開始から終了まで継続されるはずのジョブ実行状態時に発生する動作音に基づいて生成されたためである。このため、実行中のジョブのジョブ実行状態が変化した後に、マイク201に音声入力があると、ノイズ除去部212は音データから正確にノイズを除去することができない場合がある。
したがって、ノイズパターン判定部221は、ジョブ制御部222が実行中であるジョブのジョブ実行状態に生じた変化に基づいて、新たにノイズパターンのデータを生成する。例えば、複数のジョブが並行して実行される期間において、先に実行されるジョブの残り、あるいは新たに実行されるジョブがあれば、ジョブ制御部222より該当するジョブのジョブ情報を取得するようにする。
このジョブ情報には、並行して実行されるジョブの種別、実行開始時間等が含まれる。ノイズパターン判定部221は、取得したジョブ情報に基づいて、ジョブ実行状態の変化後にジョブが実行されることで発生する動作音に対応するノイズパターンのデータを新たに生成する。このように、ノイズパターン判定部221は、ジョブ制御部222により、異なる種別の複数のジョブが並行して実行される場合、各ジョブから判定されるノイズパターンのデータを組み合わせて新たなノイズパターンのデータを生成することができる。そして、ノイズパターン判定部221は、新たに生成したノイズパターンのデータをノイズパターン格納部211に格納する。
ノイズ除去部212は、ノイズパターン判定部221により生成された新たなノイズパターンのデータに基づいて、音データから、新たなノイズパターンに該当するノイズを除去する。これにより、ジョブ実行状態が変化した後に、マイク201に新たな実行指示を含む音声入力があった場合でも、ノイズ除去部212は、音データからノイズを除去することができる。
なお、音声処理部160がノイズパターン格納部211を有さない構成であれば、ノイズパターン判定部221は、ジョブ実行状態に基づいて判定したノイズパターンのデータ、及び生成した新たなノイズパターンのデータをノイズ除去部212に直接送ることもできる。そして、ノイズ除去部212は、ノイズパターン格納部211を参照せずに、ノイズパターン判定部221から取得したノイズパターンのデータを用いて、音データからノイズを除去することができる。
ここで、ジョブ実行状態の変化とは、ジョブの実行指示がされる場合、実行中のジョブの途中から並行して別のジョブが実行される場合、並行して実行する複数のジョブのうち1つのジョブが終了する場合、全てのジョブが終了する場合、実行中のジョブに異常が発生する場合、又は異常が解消される場合のいずれかをいう。
例えば、スキャン処理と印刷処理がそれぞれ別に実行される際に発生する動作音に対応するノイズパターンのデータは、ノイズパターン格納部211に格納されている。ここで、実行中のスキャン処理の途中から、印刷処理が開始され、スキャン処理が先に終了すると仮定する。このとき、スキャン処理と印刷処理は部分的に並行して実行される。そして、印刷処理の開始時点からスキャン処理の終了時点に発生する動作音は、スキャン処理と印刷処理に伴う可動部の部品が個々に発した動作音が混ざり合った音となる。そのため、ノイズパターン判定部221は、新たなノイズパターンのデータを作成しなければならない。印刷処理が開始される前と、スキャン処理が終了した後は、それぞれ1つのジョブに応じた動作音が発生しているだけであるので、ノイズパターンのデータはノイズパターン格納部211に格納されている。
実行中のスキャン処理に対して、印刷処理が並行して実行されるタイミングは毎回異なるため、ノイズパターン判定部221は、新たなノイズパターンのデータを都度生成する必要がある。そのため、新たに生成したノイズパターンのデータは、ノイズパターン格納部211に保存したままでもよいし、ジョブが終了し次第、削除してもよい。
また、ジョブ実行状態の変化には、画像形成時において、通紙ジャムや紙切れ等の異常の発生や解消のタイミングなどの場合も含まれる。
例えば、通紙ジャムや紙切れが発生した場合、ギアが用紙Pを噛んだり、用紙Pが排出されず詰まるなど異常な動作音が発生する。この場合、ノイズパターン判定部221は、新たなノイズパターンのデータを生成しなければならない。通紙ジャムや紙切れが解消された後であれば、以降の処理は正常であることが多いため、既に生成され、ノイズパターン格納部211に格納されたノイズパターンのデータが用いられる。
例えば、通紙ジャムや紙切れが発生した場合、ギアが用紙Pを噛んだり、用紙Pが排出されず詰まるなど異常な動作音が発生する。この場合、ノイズパターン判定部221は、新たなノイズパターンのデータを生成しなければならない。通紙ジャムや紙切れが解消された後であれば、以降の処理は正常であることが多いため、既に生成され、ノイズパターン格納部211に格納されたノイズパターンのデータが用いられる。
<ノイズパターン判定部の処理例>
図4は、ノイズパターン判定部221の処理の例を示すフローチャートである。
ノイズパターン判定部221は、ジョブ制御部222から実行中のジョブについて、ジョブ実行状態の変化があるか否かを判定する(S1)。
図4は、ノイズパターン判定部221の処理の例を示すフローチャートである。
ノイズパターン判定部221は、ジョブ制御部222から実行中のジョブについて、ジョブ実行状態の変化があるか否かを判定する(S1)。
ノイズパターン判定部221は、実行中のジョブにジョブ実行状態の変化がないと判定した場合(S1のNo)、ステップS1に戻り、実行中のジョブのジョブ実行状態の変化を再び判定する。すなわち、実行中のジョブにジョブ実行状態の変化がない場合には、ノイズパターン判定部221は、ステップS1の処理を繰り返す。
ノイズパターン判定部221は、実行中のジョブにジョブ実行状態の変化があると判定した場合(S1のYes)、ジョブ制御部222から該当するジョブのジョブ情報を取得する(S2)。該当するジョブとは、例えば、実行中のジョブのジョブ実行状態が変化した後に、引き続き実行するジョブの残り、さらに新たに実行するジョブ等である。
そして、ノイズパターン判定部221は、ジョブ制御部222から取得したジョブ情報に基づいて、ジョブ実行状態の変化後に実行される該当のジョブにより発生する動作音に対応するノイズパターンのデータを新たに生成する(S3)。
このとき、ノイズパターン判定部221は、新たなノイズパターンのデータを生成する際、ノイズパターン格納部211に予め格納されている、ジョブの種別に応じたノイズパターンのデータを参照する。さらに、異なる種別の複数のジョブが並行して実行される場合には、ノイズパターン判定部221は、実行される異なる種別の複数のジョブのノイズパターンを組み合わせた、新たなノイズパターンのデータを生成する。
このとき、ノイズパターン判定部221は、新たなノイズパターンのデータを生成する際、ノイズパターン格納部211に予め格納されている、ジョブの種別に応じたノイズパターンのデータを参照する。さらに、異なる種別の複数のジョブが並行して実行される場合には、ノイズパターン判定部221は、実行される異なる種別の複数のジョブのノイズパターンを組み合わせた、新たなノイズパターンのデータを生成する。
ノイズパターン判定部221は、新たに生成したノイズパターンのデータをノイズパターン格納部211に格納する(S4)。
そして、ノイズパターン判定部221は、ステップS1に戻り、実行中のジョブのジョブ実行状態の変化を再び判定する。
そして、ノイズパターン判定部221は、ステップS1に戻り、実行中のジョブのジョブ実行状態の変化を再び判定する。
<音声による実行指示におけるジョブ実行までの処理例>
図5は、音声による実行指示によるジョブ実行までの処理例を示すフローチャートである。
図5は、音声による実行指示によるジョブ実行までの処理例を示すフローチャートである。
まず、ノイズ除去部212は、音声入力部150のAD変換部202から音声入力、つまりデジタル信号の音データの入力があったか否か判定する(S11)。
ノイズ除去部212は、デジタル信号の音データの入力がなかったと判定した場合(S11のNo)、ステップS11に戻り、デジタル信号の音データの入力の有無を再び判定する。すなわち、デジタル信号の音データの入力がない場合、ノイズ除去部212は、ステップS11の処理を繰り返す。
ノイズ除去部212は、デジタル信号の音データの入力がなかったと判定した場合(S11のNo)、ステップS11に戻り、デジタル信号の音データの入力の有無を再び判定する。すなわち、デジタル信号の音データの入力がない場合、ノイズ除去部212は、ステップS11の処理を繰り返す。
ノイズ除去部212は、デジタル信号の音データの入力があったと判定した場合(S11のYes)、ジョブの実行に伴って画像形成装置1の可動部が動作することにより発生する動作音に対応するノイズパターンのデータをノイズパターン格納部211から取得する(S12)。ただし、ノイズ除去部212は、ノイズパターン判定部221により判定されたノイズパターンのデータを、ノイズパターン判定部221から直接取得してもよい。
次に、ノイズ除去部212は、取得したノイズパターンのデータに基づいて、音データに含まれているノイズを除去する(S13)。ここで、ノイズ除去部212が行うノイズ除去方法については、図6で後述する。その後、ノイズ除去部212は、ノイズパターンのデータが除去された音データ(ノイズ除去済み音データ)を音声認識部214に出力する。
次に、音声認識部214は、入力されたノイズ除去済み音データの音声認識を行う(S14)。このとき、音声認識部214は、入力されたノイズ除去済み音データと、操作パターン格納部213から取得した操作パターンデータとを比較する。なお、既に述べたように、操作パターン格納部213には、ユーザが画像形成装置1にジョブを実行させるための実行指示に対応する音データのパターン(操作パターンデータ)が予め格納されている。
次に、音声認識部214は、ノイズ除去済み音データに実行指示が含まれているか否かを判定する(S15)。音声認識部214は、ノイズ除去済み音データに実行指示が含まれていないと判定した場合(S15のNo)、ステップS11に戻る。
一方、音声認識部214は、ノイズ除去済み音データに実行指示が含まれていると判定した場合(S15のYes)、操作受付部223に判定した実行指示を入力する。
そして、操作受付部223は、音声認識部214が判定した実行指示をジョブ制御部222に出力する。
次に、ジョブ制御部222は、操作受付部223から入力された実行指示に基づきジョブを実行し(S16)、ステップS11に戻る。
そして、操作受付部223は、音声認識部214が判定した実行指示をジョブ制御部222に出力する。
次に、ジョブ制御部222は、操作受付部223から入力された実行指示に基づきジョブを実行し(S16)、ステップS11に戻る。
<ノイズ除去方法>
図6は、音データからノイズを除去する手順の例を説明するための図である。図6のグラフ(1)〜(3)は、縦軸に音の強さ[dB]、横軸に音の周波数[f]を表す。
図6は、音データからノイズを除去する手順の例を説明するための図である。図6のグラフ(1)〜(3)は、縦軸に音の強さ[dB]、横軸に音の周波数[f]を表す。
上述したように本実施の形態に係るノイズ除去部212は、ノイズパターンのデータを用いて、音データからノイズを除去する。したがって、ノイズ除去の手法としては、例えば、一般的に知られているアルゴリズムである、周波数領域でノイズ除去を行うスペクトラム・サブトラクション法を用いることができる。
図6のグラフ(1)は、ユーザの音声に動作音(ノイズ)が混入した音データの周波数分布301を表している。周波数分布301は、ユーザの音声に動作音(ノイズ)が混入された音データのスペクトルを示す。
図6のグラフ(2)は、動作音(ノイズ)に対応するノイズパターンの周波数分布302を表す。つまり、周波数分布302は、ノイズパターンのスペクトルを示す。
図6のグラフ(2)は、動作音(ノイズ)に対応するノイズパターンの周波数分布302を表す。つまり、周波数分布302は、ノイズパターンのスペクトルを示す。
図6のグラフ(3)は、ノイズ除去済み音データの周波数分布303を示す。周波数分布303は、ノイズ除去済み音データのスペクトルを示している。スペクトラム・サブトラクション法を用いると、ノイズ除去部212は、周波数分布301から、周波数分布302を減算することで、周波数分布303を取り出すことができる。
なお、音声認識部214は、周波数分布303から得られる周波数成分から音声認識を行ってもよいし、変換した時系列データから音声認識を行ってもよい。
スペクトラム・サブトラクション法としては、改良されたアルゴリズムが多数提案されており、ノイズ除去部212は、改良されたアルゴリズムを使用してもかまわない。
スペクトラム・サブトラクション法としては、改良されたアルゴリズムが多数提案されており、ノイズ除去部212は、改良されたアルゴリズムを使用してもかまわない。
<まとめ>
以上説明した一実施の形態に係る画像形成装置1は、ジョブの実行中に音声入力があった場合、ノイズ除去部212が入力された音データからノイズパターンのデータを除去する。音声認識部214は、ノイズを除去された音データ(ノイズ除去済み音データ)に基づいて音声認識を行う。ここで、音声認識部214は、ノイズ除去済み音データと一致する実行指示に対応する操作パターンデータが存在すれば、その操作パターンデータに対応する、ジョブの実行指示を操作受付部223に出力する。操作受付部223は、音声認識部214から受け付けたジョブの実行指示をジョブ制御部222に入力する。そして、ジョブ制御部222は、実行指示に基づいてジョブを実行する。
このため、実行中のジョブが動作音を発生させている環境下において、画像形成装置1が音声による実行指示を認識することができる。
以上説明した一実施の形態に係る画像形成装置1は、ジョブの実行中に音声入力があった場合、ノイズ除去部212が入力された音データからノイズパターンのデータを除去する。音声認識部214は、ノイズを除去された音データ(ノイズ除去済み音データ)に基づいて音声認識を行う。ここで、音声認識部214は、ノイズ除去済み音データと一致する実行指示に対応する操作パターンデータが存在すれば、その操作パターンデータに対応する、ジョブの実行指示を操作受付部223に出力する。操作受付部223は、音声認識部214から受け付けたジョブの実行指示をジョブ制御部222に入力する。そして、ジョブ制御部222は、実行指示に基づいてジョブを実行する。
このため、実行中のジョブが動作音を発生させている環境下において、画像形成装置1が音声による実行指示を認識することができる。
また、ノイズパターン判定部221は、実行中のジョブにジョブ実行状態の変化があった場合、引き続き実行するジョブの残り、さらに新たに実行されるジョブがあれば、ジョブ制御部222からジョブ情報を取得する。そして、ノイズパターン判定部221はジョブ情報に基づいて、ジョブ実行状態の変化後に実行される該当のジョブにより発生する動作音に対応するノイズパターンのデータを新たに生成し、ノイズパターン格納部211に格納する。
このため、ノイズ除去部212は、実行するジョブの種別に応じて発生する動作音によるノイズに加え、並行して実行される複数のジョブの干渉音や、通紙ジャム等による異常音などから成る音質や音量の変化が急激なノイズまでも音データから除去することができる。そのため、画像形成装置1は、実行中のジョブによる定常的なノイズ、変化が急激なノイズが発生しているあらゆる状況下において、ジョブに伴う動作を変更することなく、音声による実行指示を正確に認識することができる。
[変形例]
なお、本実施の形態に係る画像形成装置1のマイク201は、図1では操作表示部70に内蔵されているが、画像形成装置1に近接する装置等に設けられてもよい。また、マイク201は、画像形成装置1に内蔵されていてもよい。
なお、本実施の形態に係る画像形成装置1のマイク201は、図1では操作表示部70に内蔵されているが、画像形成装置1に近接する装置等に設けられてもよい。また、マイク201は、画像形成装置1に内蔵されていてもよい。
また、図2では、音声入力部150と音声処理部160を、メインコントローラ100とインターフェースを介して接続している様子が示される。しかし、音声入力部150、音声処理部160、及びメインコントローラ100間との通信は、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークを介して行われてもよい。この場合、音声入力部150、音声処理部160は、それぞれ画像形成装置1に近接する装置として設置されてもよい。
また、音声処理部160は、メインコントローラ100とインターフェースを介して接続している様子が示される。しかし、音声処理部160の一部又はすべての機能をメインコントローラ100に含む構成としてもよい。
また、音声入力部150と音声処理部160を一体化した構成としてもよい。
また、音声入力部150と音声処理部160を一体化した構成としてもよい。
なお、本発明は上述した実施の形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りその他種々の応用例、変形例を取り得ることは勿論である。
例えば、上述した実施の形態は本発明を分かりやすく説明するために装置及びシステムの構成を詳細かつ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されない。また、ここで説明した実施の形態の構成の一部を他の実施の形態の構成に置き換えることは可能であり、さらにはある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることも可能である。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
例えば、上述した実施の形態は本発明を分かりやすく説明するために装置及びシステムの構成を詳細かつ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されない。また、ここで説明した実施の形態の構成の一部を他の実施の形態の構成に置き換えることは可能であり、さらにはある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加、削除、置換をすることも可能である。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
1…画像形成装置、201…音声入力部、212…ノイズ除去部、214…音声認識部、221…ノイズパターン判定部、222…ジョブ制御部
Claims (8)
- 入力されたジョブを実行する制御部と、
前記制御部により実行される前記ジョブのジョブ実行状態に基づいて発生する自装置の動作音に対応するノイズパターンを判定するノイズパターン判定部と、
前記制御部が実行中の前記ジョブの種別に応じて前記ノイズパターン判定部が判定した前記ノイズパターンのデータに基づいて、音を集音する入力部より入力される音データから、前記ノイズパターンに該当するノイズを除去するノイズ除去部と、
前記ノイズが除去された前記音データから実行指示を認識する音声認識部と、を備える
画像形成装置。 - 前記ノイズパターン判定部は、前記制御部により並行して実行される異なる種別の複数の前記ジョブから判定する前記ノイズパターンのデータを組み合わせて新たな前記ノイズパターンのデータを生成し、
前記ノイズ除去部は、生成された新たな前記ノイズパターンのデータに基づいて、音データから、新たな前記ノイズパターンに該当するノイズを除去する
請求項1に記載の画像形成装置。 - 前記ノイズパターン判定部は、前記制御部が実行中である前記ジョブのジョブ実行状態に生じた変化に基づいて、前記ノイズパターンのデータを生成する
請求項1又は2に記載の画像形成装置。 - さらに、前記ノイズパターンのデータを格納する格納部を備え、
前記ノイズパターン判定部は、生成した前記ノイズパターンのデータを前記格納部に格納し、
前記ノイズ除去部は、前記制御部が実行中の前記ジョブの種別に応じて、前記ノイズパターン判定部が判定した前記ノイズパターンのデータを前記格納部から取得する
請求項1〜3のいずれか一項に記載の画像形成装置。 - 前記ジョブ実行状態の変化は、前記ジョブの実行指示がされる場合、実行中の前記ジョブの途中から並行して別の前記ジョブが実行される場合、並行して実行する複数の前記ジョブのうち1つの前記ジョブが終了する場合、全ての前記ジョブが終了する場合、実行中の前記ジョブに異常が発生する場合、又は前記異常が解消される場合のいずれかのタイミングを表す
請求項4に記載の画像形成装置。 - 前記入力部は、前記入力部が設置された位置で集音した音を、前記音データに変換し、前記ノイズ除去部に前記音データを出力する
請求項1に記載の画像形成装置。 - 設置された位置で集音した音を、音データに変換する入力部と、
前記音データから画像形成装置が実行するジョブの実行指示を認識する音声処理部と、を備え、
前記音声処理部は、
前記ジョブのジョブ実行状態に基づいて発生する前記画像形成装置の動作音に対応するノイズパターンのデータを格納する格納部と、
実行中の前記ジョブの種別に応じた前記ノイズパターンのデータに基づいて、前記音を集音する前記入力部より入力される前記音データから、前記ノイズパターンに該当するノイズを除去するノイズ除去部と、
前記ノイズが除去された前記音データから実行指示を認識する音声認識部と、を備える
音声認識装置。 - 入力されたジョブを実行するステップと、
前記ジョブのジョブ実行状態に基づいて発生する画像形成装置の動作音に対応するノイズパターンを判定するステップと、
実行中の前記ジョブの種別に応じて判定した前記ノイズパターンのデータに基づいて、音を集音する入力部より入力される音データから、前記ノイズパターンに該当するノイズを除去するステップと、
前記ノイズが除去された前記音データから実行指示を認識するステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018196340A JP2020064197A (ja) | 2018-10-18 | 2018-10-18 | 画像形成装置、音声認識装置、及びプログラム |
US16/594,319 US20200128142A1 (en) | 2018-10-18 | 2019-10-07 | Image forming apparatus, voice recognizing device, and non-transitory recording medium storing computer readable program |
CN201910971858.5A CN111081232A (zh) | 2018-10-18 | 2019-10-14 | 图像形成装置、语音识别装置以及计算机可读记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018196340A JP2020064197A (ja) | 2018-10-18 | 2018-10-18 | 画像形成装置、音声認識装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020064197A true JP2020064197A (ja) | 2020-04-23 |
Family
ID=70279014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018196340A Pending JP2020064197A (ja) | 2018-10-18 | 2018-10-18 | 画像形成装置、音声認識装置、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200128142A1 (ja) |
JP (1) | JP2020064197A (ja) |
CN (1) | CN111081232A (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004037527A (ja) * | 2002-06-28 | 2004-02-05 | Canon Inc | 情報処理装置およびその方法 |
JP2004077601A (ja) * | 2002-08-12 | 2004-03-11 | Konica Minolta Holdings Inc | 音声入力機能を有する稼働装置 |
WO2011077636A1 (ja) * | 2009-12-25 | 2011-06-30 | 三菱電機株式会社 | 雑音除去装置及び雑音除去プログラム |
JP2016109933A (ja) * | 2014-12-08 | 2016-06-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識方法ならびに音声認識システムおよびそれに含まれる音声入力装置 |
JP2016168707A (ja) * | 2015-03-12 | 2016-09-23 | コニカミノルタ株式会社 | 画像形成装置及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004333881A (ja) * | 2003-05-08 | 2004-11-25 | Kyocera Mita Corp | 画像形成装置 |
CN101053161B (zh) * | 2004-11-02 | 2010-09-08 | 松下电器产业株式会社 | 噪声抑制装置 |
EP1727072A1 (en) * | 2005-05-25 | 2006-11-29 | The Babraham Institute | Signal processing, transmission, data storage and representation |
CA2558279A1 (en) * | 2006-08-31 | 2008-02-29 | Avoca Semiconductor Inc. | Scheduler for audio pattern recognition |
JP2010136335A (ja) * | 2008-11-05 | 2010-06-17 | Ricoh Co Ltd | 画像形成装置、制御方法およびプログラム |
US8515763B2 (en) * | 2009-11-24 | 2013-08-20 | Honeywell International Inc. | Methods and systems for utilizing voice commands onboard an aircraft |
GB2480084B (en) * | 2010-05-05 | 2012-08-08 | Toshiba Res Europ Ltd | A speech processing system and method |
CN103514878A (zh) * | 2012-06-27 | 2014-01-15 | 北京百度网讯科技有限公司 | 声学建模方法及装置和语音识别方法及装置 |
JP6068266B2 (ja) * | 2013-05-31 | 2017-01-25 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
JP6466844B2 (ja) * | 2013-08-29 | 2019-02-06 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器制御方法及び機器制御システム |
JP2015122726A (ja) * | 2013-11-25 | 2015-07-02 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
US9767795B2 (en) * | 2013-12-26 | 2017-09-19 | Panasonic Intellectual Property Management Co., Ltd. | Speech recognition processing device, speech recognition processing method and display device |
JP2016111472A (ja) * | 2014-12-04 | 2016-06-20 | 株式会社リコー | 画像形成装置、音声録音方法及び音声録音プログラム |
JP6690152B2 (ja) * | 2015-08-04 | 2020-04-28 | 富士ゼロックス株式会社 | 処理装置 |
US10714121B2 (en) * | 2016-07-27 | 2020-07-14 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
-
2018
- 2018-10-18 JP JP2018196340A patent/JP2020064197A/ja active Pending
-
2019
- 2019-10-07 US US16/594,319 patent/US20200128142A1/en not_active Abandoned
- 2019-10-14 CN CN201910971858.5A patent/CN111081232A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004037527A (ja) * | 2002-06-28 | 2004-02-05 | Canon Inc | 情報処理装置およびその方法 |
JP2004077601A (ja) * | 2002-08-12 | 2004-03-11 | Konica Minolta Holdings Inc | 音声入力機能を有する稼働装置 |
WO2011077636A1 (ja) * | 2009-12-25 | 2011-06-30 | 三菱電機株式会社 | 雑音除去装置及び雑音除去プログラム |
JP2016109933A (ja) * | 2014-12-08 | 2016-06-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識方法ならびに音声認識システムおよびそれに含まれる音声入力装置 |
JP2016168707A (ja) * | 2015-03-12 | 2016-09-23 | コニカミノルタ株式会社 | 画像形成装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111081232A (zh) | 2020-04-28 |
US20200128142A1 (en) | 2020-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20100110489A1 (en) | Image forming apparatus, method of controlling the same based on speech recognition, and computer program product | |
US8805256B2 (en) | Printing apparatus capable of preventing sheet feed error in cleaning, method of controlling the printing apparatus, and storage medium | |
US9150038B2 (en) | Printing device having slow discharge process for sequential print jobs | |
JP5707943B2 (ja) | 画像形成装置及びプログラム | |
JP5950142B1 (ja) | 画像形成装置、サーバ装置、画像形成システムおよびプログラム | |
JP2016182788A (ja) | 印刷制御装置、印刷装置及びプログラム | |
JP5716403B2 (ja) | 故障予測装置、画像形成装置及びプログラム | |
JP6825435B2 (ja) | 情報処理装置、制御方法及びプログラム | |
JP2020064197A (ja) | 画像形成装置、音声認識装置、及びプログラム | |
JP2017194629A (ja) | 画像形成装置 | |
JP2012068293A (ja) | 画像形成装置 | |
CN113495453A (zh) | 图像形成装置、异常诊断方法和图像形成系统 | |
JP6361642B2 (ja) | 画像形成システム、画像形成装置および画像形成方法 | |
JP2020040753A (ja) | 用紙搬送装置、画像形成装置および用紙搬送プログラム | |
JP2009298043A (ja) | 画像形成装置及び画像形成システム | |
JP6107743B2 (ja) | 画像形成装置および画像形成システム | |
US20170094070A1 (en) | Image forming apparatus including discharged document sensor detecting existence of discharged document | |
JP2014095836A (ja) | 画像形成装置 | |
JP7107174B2 (ja) | 画像形成装置及び画像形成システム | |
US10198227B2 (en) | Electronic apparatus and image forming apparatus | |
CN110708434A (zh) | 任务关联通知输出装置及其方法、复合机、图像形成装置 | |
JP2020040251A (ja) | 画像形成システム及び画像形成装置 | |
JP7180203B2 (ja) | 画像形成システム、画像検査方法及びプログラム | |
JP7275880B2 (ja) | 画像形成装置、及び、画像形成装置の制御方法 | |
JP6922363B2 (ja) | 画像形成制御装置、画像形成制御方法及び画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221018 |