JP2021052261A - 画像形成装置 - Google Patents
画像形成装置 Download PDFInfo
- Publication number
- JP2021052261A JP2021052261A JP2019172782A JP2019172782A JP2021052261A JP 2021052261 A JP2021052261 A JP 2021052261A JP 2019172782 A JP2019172782 A JP 2019172782A JP 2019172782 A JP2019172782 A JP 2019172782A JP 2021052261 A JP2021052261 A JP 2021052261A
- Authority
- JP
- Japan
- Prior art keywords
- image
- verification
- images
- forming apparatus
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 claims abstract description 368
- 238000012545 processing Methods 0.000 claims abstract description 319
- 238000012795 verification Methods 0.000 claims abstract description 245
- 238000000034 method Methods 0.000 claims description 78
- 230000008569 process Effects 0.000 claims description 69
- 238000011156 evaluation Methods 0.000 claims description 55
- 238000012937 correction Methods 0.000 claims description 33
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000007639 printing Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005282 brightening Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Accessory Devices And Overall Control Thereof (AREA)
- Record Information Processing For Printing (AREA)
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】音声認識機能を備える画像形成装置において、音声認識機能によって得られた機能候補が複数存在した場合のユーザーの利便性が向上する。【解決手段】画像形成装置100は、音声指示を認識する音声認識処理部150と、音声指示が処理対象の画像に対する画像処理についての指示を含み、音声認識処理部100が1つの画像処理機能を特定できない場合に、複数の画像処理機能から複数の候補機能を選択する候補機能選択部152と、処理対象の画像に対して複数の候補機能の処理をそれぞれ実行することによって複数の検証用画像を生成する画像検証部156と、複数の検証用画像を相互に比較する画像比較部158と、比較の結果に基づいて、複数の候補機能から1つの画像処理機能を自動的に決定するか、またはユーザーへ追加情報を求めるかを判断する制御部160とを備える。【選択図】図3
Description
本開示は画像形成装置に関し、より特定的には音声認識機能を有する画像形成装置に関する。
音声認識技術の進歩に伴い、音声によるユーザー操作が急激に普及してきている。MFP(Multi Functional Peripheral)等の事務機器においても、音声操作を可能にした製品が市場に出てきている。
例えば、特開2000−092259号公報(特許文献1)は、音声認識機能を備えたファクシミリ装置を開示している。当該ファクシミリ装置は、音声認識結果が複数のキーワードの組み合わせからなる場合には、それらが1つの動作モードに対応すれば、一致と判定する。一方、当該ファクシミリ装置は、音声認識結果に含まれる複数のキーワードに複数の動作モードが対応する場合には不一致と判定し、ユーザーにキーワードの再入力を促す。
ユーザーが音声認識を搭載したMFPに対して音声指示を行う場合には、MFPが備える各機能の違いについてユーザー自身が理解していない場合がある。そのため、ユーザーの音声指示が曖昧になり、音声指示に含まれる1つの言葉がMFPにおける複数の機能に対応することがある。そのような場合には、MFPは、訂正情報または追加情報をユーザーに要求して、当該複数の機能からどの機能を実行すべきかユーザーに問い合わせる必要がある。そのため、音声認識機能を使う場合におけるユーザーの利便性は、必ずしも良好とはいえなかった。
本開示は、上記のような課題を解決するためのものであって、ある局面に従うと、音声認識機能を備える画像形成装置におけるユーザーの利便性を向上する技術が開示される。
一実施形態の画像形成装置は、上記画像形成装置の操作に関する音声指示を認識する音声認識処理部を備える。上記音声認識処理部は、上記音声指示が処理対象の画像に対する画像処理についての指示を含む場合に、上記画像形成装置が備える複数の画像処理機能から上記音声指示に対応する機能を特定する。上記画像形成装置は、さらに、上記音声指示に対応する1つの画像処理機能を上記音声認識処理部が特定できない場合に、上記複数の画像処理機能から複数の候補機能を選択する候補機能選択部と、上記処理対象の画像に対して上記複数の候補機能の処理をそれぞれ実行することによって複数の検証用画像を生成する画像検証部と、上記複数の検証用画像を相互に比較する画像比較部と、上記比較の結果に基づいて、上記複数の候補機能から1つの画像処理機能を自動的に決定するか、又はユーザーへ追加情報を求めるかを判断する制御部とを備える。
ある局面において、上記画像比較部は、上記複数の検証用画像を相互に比較するときに、上記複数の検証用画像のうちの2個の検証用画像の組み合わせごとに、上記2個の検証用画像の違いの程度を表す評価値を算出し、上記評価値を閾値と比較する。
ある局面において、上記制御部は、上記2個の検証用画像の組み合わせごとに算出された全ての評価値が上記閾値未満のとき、上記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、上記自動的に決定した画像処理を上記処理対象の画像に対して実行する。
ある局面において、上記制御部は、上記2個の検証用画像の組み合わせごとに算出された評価値のうちの少なくとも1つが上記閾値以上のとき、ユーザーへ追加情報を求め、上記ユーザーから得られた追加情報に基づいて上記複数の候補機能のうちの1つを決定し、上記追加情報に基づいて決定した画像処理を上記処理対象の画像に対して実行する。
ある局面において、上記画像比較部は、第1の検証用画像における各画素の画素値と、当該画素に対応する第2の検証用画像における画素の画素値との差分に基づいて、上記第1の検証用画像と上記第2の検証用画像との違いの程度を表す上記評価値を算出する。
ある局面において、上記画像比較部は、上記複数の検証用画像の各々をブロック単位に分割して各ブロックごとに画素値の平均値を求めるブロック分割処理を実行する。上記画像比較部は、上記ブロック分割処理後の第1の検証用画像における各ブロックの画素値の平均値と、当該ブロックに対応する上記ブロック分割処理後の第2の検証用画像におけるブロックの画素値の平均値との差分に基づいて、上記第1の検証用画像と上記第2の検証用画像との違いの程度を表す上記評価値を算出する。
ある局面において、上記画像比較部は、上記複数の検証用画像の各々に対して解像度を下げる解像度変換処理を実行する。上記画像比較部は、上記解像度変換処理後の第1の検証用画像における各画素の画素値と、当該画素に対応する上記解像度変換処理後の第2の検証用画像における画素の画素値との差分に基づいて、上記第1の検証用画像と上記第2の検証用画像との違いの程度を表す上記評価値を算出する。
ある局面において、上記画素値は、RGB階調値、明度、濃度、色相、彩度、及び輝度の少なくとも1つを含む。
ある局面において、上記画像比較部は、上記音声指示が上記処理対象の画像の明度、濃度、又はコントラストに関する指示を含む場合に、上記評価値を上記複数の検証用画像の各々の明度又は濃度を用いて算出する。
ある局面において、上記画像比較部は、上記音声指示が上記処理対象の画像のMTF(Modulation Transfer Function)又は周波数特性に関する指示を含む場合に、上記評価値を上記複数の検証用画像の各々のエッジ量又は周波数特性を用いて算出する。
ある局面において、上記画像比較部は、上記音声指示が上記処理対象の画像の色相又は彩度に関する指示を含む場合に、上記評価値を上記複数の検証用画像の各々の色相、彩度、及び上記複数の検証用画像のうち2つの画像のうち一方における画素又はブロックと、当該画素又はブロックに対応する、上記複数の検証用画像のうち2つの画像のうち他方における画素又はブロックとの色差の少なくとも1つを用いて算出する。
ある局面において、上記複数の検証用画像は、第1の候補機能、第2の候補機能、および第3の候補機能にそれぞれ対応する第1の検証用画像、第2の検証用画像、および第3の検証用画像を含む。上記画像比較部は、上記第1の検証用画像と上記第2の検証用画像とから第1の評価値を算出し、上記第1の検証用画像と上記第3の検証用画像とから第2の評価値を算出し、上記第2の検証用画像と上記第3の検証用画像とから第3の評価値を算出する。上記制御部は、上記第1の評価値及び上記第2の評価値が上記閾値未満でありかつ上記第3の評価値が上記閾値以上である場合に、上記第1の候補機能及び上記第2の候補機能の一方のみと、上記第3の候補機能についてユーザーに追加情報を求める。
ある局面において、上記音声指示は、上記処理対象の画像を補正する指示を含む。上記音声認識処理部は、上記音声指示に基づいて上記処理対象の補正量の大きさを決定する。上記制御部は、上記複数の候補機能の各々に対して上記補正量に基づいて上記閾値を決定する。
ある局面において、上記制御部は、上記複数の検証用画像のうち、2個の検証用画像の組み合わせごとに算出された全ての上記評価値が上記閾値未満のとき、上記複数の候補機能のうちのいずれか1つの処理を自動的に決定した後に、上記自動的に決定した画像処理を上記ユーザーに通知する。
ある局面において、上記制御部は、上記複数の検証用画像のうち、2個の検証用画像の組み合わせごとに算出された全ての上記評価値が上記閾値未満のとき、上記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、上記自動的に決定した処理を実行してよいかユーザーに許可を求める。
ある局面において、上記画像形成装置は、上記処理対象の画像を第1領域と上記第1領域を除く領域とに区分する領域区分部をさらに備える。上記画像検証部は、上記処理対象の画像の上記第1領域に対してのみ上記複数の候補機能の処理をそれぞれ実行することによって上記複数の検証用画像を生成する。
ある局面において、上記領域区分部は、上記処理対象の画像に対して上記複数の候補機能の処理を実行した場合に、元の上記処理対象の画像に対する変化が、他の領域に比べて大きい領域を上記第1領域に設定する。
ある局面において、上記領域区分部は、上記音声指示が上記処理対象の画像における特定の領域に対する画像処理を含む場合に、上記特定の領域を上記第1領域に設定する。
ある局面において、上記画像比較部は、上記複数の検証用画像の上記第1領域のみを相互に比較する。
ある局面において、上記制御部は、上記複数の検証用画像の少なくとも2つを表示することによって、ユーザーへの追加情報を求める。
ある局面において、上記制御部は、上記複数の候補機能のうち少なくとも2つの設定画面を表示することによって、ユーザーへ追加情報を求める。
ある局面において、上記音声指示は、第1番目から第n番目までのn個の処理対象の画像(nは2以上の整数)に対する画像処理についての指示を含む。上記制御部は、上記音声認識処理部が上記音声指示に対応する1つの画像処理を特定できた場合に、上記n個の処理対象の画像の各々に対して上記特定した1つの画像処理を実行する。上記制御部は、上記音声認識処理部が上記音声指示に対応する1つの画像処理を特定できない場合に、フラグを第1の値に初期設定する。上記画像検証部は、上記第1番目の処理対象の画像から順番に上記フラグが第2の値に変更されるまで、上記n個の処理対象の画像のうち現在の処理順番の画像に対して上記複数の候補機能の処理を実行することにより、上記現在の処理順番の画像に対応する複数の検証用画像を生成する。上記画像比較部は、上記画像検証部によって上記複数の検証用画像が生成される度に、2個の検証用画像の組み合わせごとに、上記2個の検証用画像の違いの程度を表す評価値を算出する。上記制御部は、上記画像比較部によって算出された全ての評価値が閾値未満の場合に、上記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、上記自動的に決定した画像処理を上記現在の処理順番の画像に対して実行する。上記制御部は、上記画像比較部によって算出された評価値の少なくとも1つが上記閾値以上の場合に、ユーザーへ追加情報を求め、上記ユーザーから得られた追加情報に基づいて上記複数の候補機能のうちの1つを決定し、上記追加情報に基づいて決定した画像処理を上記現在の処理順番の画像に対して実行し、上記フラグを上記第2の値に変更する。上記制御部は、上記フラグを上記第2の値に変更した後は、上記n個の処理対象の画像のうち残余の画像に対して上記追加情報に基づいて決定した画像処理を実行する。
ある局面において、上記処理対象の画像は、スキャナーによる対象原稿の走査、ファクシミリによる受信、外部ネットワークとの通信、内部メモリへのアクセス、又は補助記憶装置へのアクセスによって取得したデータに基づく画像データである。
ある局面に従うと、音声認識機能を備える画像形成装置におけるユーザーの利便性が向上し得る。
この発明の上記および他の目的、特徴、局面並びに利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。
以下、各実施形態における画像形成装置について、図面を参照して詳しく説明する。以下に説明する実施形態において個数または量等に言及する場合には、特に記載がある場合を除き、本開示の範囲は、必ずしもその個数または量等に限定されない。
図面においては、実際の寸法の比率に従って図示しておらず、構造の理解を容易にするために、構造が明確となるように比率を変更して図示している場合がある。また、同一または相当する部分には同一の参照符号を付して、その説明を繰り返さない。なお、以下で説明される各実施形態は、適宜選択的に組み合わされてもよい。
<実施形態1>
[ハードウェア構成]
図1および図2を参照して、本実施形態における、音声認識機能を備える画像形成装置100のハードウェア構成について説明する。図1は、画像形成装置100の外観を示す図である。
[ハードウェア構成]
図1および図2を参照して、本実施形態における、音声認識機能を備える画像形成装置100のハードウェア構成について説明する。図1は、画像形成装置100の外観を示す図である。
ある局面において、画像形成装置100は、MFPとしての複合機として実現される。本実施形態における画像形成装置100は、スキャナー機能、コピー機能、ファクシミリ機能、ネットワーク機能、およびボックス機能その他の機能を有する。画像形成装置100は、操作パネル装置101と、画像読み取り装置102と、ドキュメントフィーダー(以下、DF(Document Feeder)と表わす)104と、プリンターエンジン106と、トレー108と、複数の給紙部109と、音声入力装置136と、音声出力装置138とを備える。
操作パネル装置101は、画像形成装置100の本体の上面の前面側(すなわち、ユーザーが操作のために画像形成装置100に対向する側)に配置され、画像形成装置100への操作を受け付ける。操作パネル装置101は、後述するように、ユーザーからの各種の指示、または、数字、文字、記号若しくはその他の入力操作を受け付けるための複数のキーと、表示装置134とを含む。表示装置134は、タッチパネルを含む。操作パネル装置101は、ユーザー操作に応答した各種情報および/または各種操作を受け付けるためのメニュー画面等をユーザーに対して表示する。また、操作パネル装置101は、ユーザーによってタッチ操作された位置を検出し、当該取得した位置に応じた入力情報を取得する。
ある局面において、タッチパネル型の入力装置132を搭載する操作パネル装置101は、ユーザーが画像形成装置100の前に立った状態で操作しやすいように、その操作面が斜めになるように傾斜が与えられて、画像形成装置100の本体に取り付けられる。他の局面において、操作パネル装置101は、着脱可能であってもよい。
画像読み取り装置102は、原稿を光学的に読み取って画像データを取得する。DF104は、画像形成装置100の本体の上面に配置され、画像読み取り装置102に原稿を送る。
プリンターエンジン106は、取得された画像データに基づいて、用紙その他の媒体の上に画像を印刷する。トレー108は、画像形成装置100の中央部に配置され、プリンターエンジン106によって画像形成されて排出される用紙その他の媒体を受ける。複数の給紙部109は、画像形成装置100の本体の下部に配置され、プリンターエンジン106に用紙その他の媒体を供給する。
図2は、画像形成装置100の詳細なハードウェア構成の一例を示すブロック図である。図2に示されるように、画像形成装置100は、CPU120(Central Processing Unit)と、RAM122(Random Access Memory)と、ROM124(Read Only Memory)と、補助記憶装置126とを備える。画像形成装置100は、通信処理装置128と、画像処理装置130と、入力装置132と、表示装置134と、音声入力装置136と、音声出力装置138とを備える。画像形成装置100は、音声入力用のA/D(Analog-to-digital)変換装置140と、音声出力用のD/A(Digital-to-Analog)変換装置142と、画像読み取り装置102と、画像出力装置146と、音声認識処理装置148とを備える。
CPU120は、画像形成装置100の動作を制御する。ある局面において、CPU120は、ROM124に記憶された制御プログラムを実行することにより、様々な機能を実現する。
RAM122は、CPU120が制御プログラムを実行するときに必要なデータおよび画像データを一時的に記憶するための作業メモリとして使用される。
ROM124は、画像形成装置100に所定の動作を実行させるための各種プログラム、および画像形成装置100の製造事業者によって予め準備された各種データ等を記憶している。
補助記憶装置126は、画像形成装置100の動作に関する各種データ等を不揮発的に記憶する。例えば補助記憶装置126は、画像形成装置100の表示装置134に表示する画面の画像データを保持する。補助記憶装置126は、例えばHDD(Hard Disk Drive)、SSD(Solid State Drive)、DVD(Digital Versatile Disk-Read Only Memory)、ROM124、磁気ディスク、光ディスク、およびUSB(Universal Serial Bus)メモリ等より実現される。
通信処理装置128は、CPU120からの指示に従って、外部ネットワーク(不図示)を介して外部機器と通信する。外部ネットワークは、イントラネットおよびインターネットのいずれでも良い。通信の形式は、特に限定されない。
画像処理装置130は、画像処理を実行する。また、画像処理装置130は、処理対象の画像において特定の領域とそれ以外の領域を判別または区分する。また、画像処理装置130は、画像を印刷する場合等には、その画像のデータの形式を印刷データの形式に変換する。また、画像処理装置130は、画像読み取り装置102による画像の読み取りに応じて出力される画像データの形式を、TIFF(Tagged Image File Format)、JPEG(Joint Photographic Experts Group)、PDF(Portable Document Format)、またはその他の指定された形式に変換する。
操作パネル装置101は、ある局面において、ユーザーからの各種入力のための入力装置132としてのタッチパッドと、各種表示のための表示装置134としての液晶パネルまたは有機EL(Electro-Luminescence)ディスプレイ等とを含む、所謂タッチパネルであってもよい。ユーザーは、このような構成を有する操作パネル装置101の画面に直接触れることで画像形成装置100を操作できる。
なお、操作パネル装置101に代えて、例えばボタン入力式等の入力装置132と、ディスプレイパネルとしての表示装置134とが、個別に設けられていてもよい。
音声入力装置136は、ユーザーの音声指示を受け付ける装置として機能する。例えば、音声入力装置136は、マイクによって実現される。他の局面において、音声入力装置136は、無線接続されたスマートフォンまたは対話が可能なスマートスピーカーによっても実現され得る。
A/D変換装置140は、音声入力装置136によって入力された音声をデジタルデータである音声データに変換する。D/A変換装置142は、CPU120から出力するように命令された音声データをアナログデータに変換する。
音声出力装置138は、D/A変換装置142によってアナログデータに変換された音声データを外部へ出力する。例えば、音声出力装置138は、スピーカー等によって実現される。スピーカーは、画像形成装置100に内蔵されたもの、または、スマートフォン若しくはスマートスピーカーによっても実現され得る。
画像読み取り装置102は、DF104または原稿台にセットされた原稿を光学的に読み取ることにより、原稿に記録された文字、記号、画像等を所定の形式の画像データに変換する。
画像出力装置146は、画像処理装置130によって処理された印刷データに基づいて、用紙その他の印刷媒体に対する印刷処理を実行する。
音声認識処理装置148は、通信処理装置128を介してネットワーク経由により送信されてきた音声データ、または音声入力装置136を介して入力された音声データを認識する。一般に、音声認識機能とは、例えばコンピューターが人間による音声指示をテキストデータに変換することで、当該音声指示を識別および判断する機能である。他の局面において、音声認識処理装置148は、上記の方法とは別の公知の方法により音声を認識してもよい。
ある局面において、画像処理装置130および音声認識処理装置148は、当該処理を実行するように構成されたASIC(Application Specific Integrated Circuit)等の集積回路により実現されてもよい。他の局面において、上記構成要素は、FPGA(Field-Programmable Gate Array)等により実現されてもよいし、CPU120がROM124に記憶されたプログラムを実行することにより実現されてもよい。さらに他の局面において、上記構成要素は、専用の回路素子等により実現されてもよいし、同様の機能を提供する所謂クラウドサービス等によって実現されてもよい。
[機能構成]
図3および図4を参照して、画像形成装置100の機能構成および画像処理機能について説明する。図3は、ある局面における画像形成装置100の機能構成を表わすブロック図である。
図3および図4を参照して、画像形成装置100の機能構成および画像処理機能について説明する。図3は、ある局面における画像形成装置100の機能構成を表わすブロック図である。
画像形成装置100は、音声認識処理部150と、候補機能選択部152と、画像取得部154と、領域判別処理部(領域区分部)155と、画像検証部156と、画像比較部158と、制御部160と、記憶部162と、入力部164と、画像処理部166と、出力部168とを備える。
音声認識処理部150は、画像形成装置の操作に関する音声指示を認識する。音声認識処理部150は、ユーザーから入力された音声による入力信号を画像形成装置100において対応可能な命令に変換する。音声認識処理部150は、例えば、読み取る原稿の場所、カラーまたはモノクロのいずれで印刷するのか、動作、出力用紙サイズ、画像処理における補正値および補正対象、並びに出力部数等について、ユーザーからの音声指示に基づいて音声認識を行う。その後、音声認識処理部150は、上記情報を制御部160へ送信する。
入力部164は、ユーザーからの操作パネル装置101による入力および音声指示等を受け付ける。入力部164は、音声指示を音声データに変換し、制御部160へ当該音声データを送信する。ある局面において、入力部164は、入力装置132により、または音声入力装置136およびA/D変換装置140の組み合わせにより実現される。
音声認識処理部150は、音声指示が処理対象の画像に対する画像処理を含む場合に、画像形成装置100が備える複数の画像処理機能から対応する機能を特定する。
例えば「明度を調整して」という音声指示が画像形成装置100に与えられる場合、1種類の画像処理機能が指定されているので、音声認識処理部150は、画像処理機能を唯一に特定できる。この場合には、音声認識処理部150は、音声指示に含まれる、処理対象の画像に対する画像処理に関する情報を制御部160へ送信する。
音声認識処理部150は、画像処理機能を唯一に特定できない場合には、処理対象の画像に対する画像処理に関する情報を候補機能選択部152へ送信する。
候補機能選択部152は、音声認識処理部150が1つの画像処理機能を特定できない場合に、複数の画像処理機能からユーザーにより選択される可能性のある複数の候補機能を選択する。
画像取得部154は、制御部160からの指示に基づいて、画像読み取り装置102から又は通信処理装置128により、処理対象の画像を取得する。
画像取得部154が取得する画像は、画像読み取り装置102により読み取った原稿画像、パソコンおよびサーバー等の外部機器から外部ネットワークを介して送信される印字用の画像、ファクシミリの受信画像、本体記憶部162に記憶された画像、およびUSBメモリ等の外部接続メモリ内の画像等のデータを含む。ある局面において、画像取得部154は、補助記憶装置126、通信処理装置128、または画像読み取り装置102等により実現される。
領域判別処理部155は、画像取得部154が取得した画像から、AI(Artificial intelligence)技術により予め決められた、またはユーザーにより指定された特定の領域を判別する。AI技術は、深層学習等の機械学習を用いたアルゴリズムによる領域判別の技術、例えばある種の物体が画像中のどこに存在するかを求める技術である物体検出の技術を含む。領域判別処理部155は、領域判別処理を行った後、判別した領域に関する情報および処理対象の画像を画像検証部156へ送信する。
領域判別処理部155が行う処理は、微分フィルタを用いることでエッジを検出し「文字領域」を判別する処理、および孤立点を検出し周期性と孤立点数を確認することで「網点領域」を判別する処理を含む。領域判別処理部155が行う処理は、非文字領域において、階調の変化度合いから「図形領域」と「写真領域」とを判別する処理、および階調のヒストグラム分布から「下地領域」を判別する処理を含む。
領域判別処理部155は、領域判別処理を行った後、判別した領域に関する情報および処理対象の画像を、画像検証部156へ送信する。
画像検証部156は、処理対象の画像に対して、候補機能選択部152が選択した複数の候補機能の各々に対する画像処理を実行することによって、複数の検証用画像を生成する。画像検証部156は、複数の検証用画像を画像比較部158へ送信する。
画像比較部158は、複数の検証用画像の各々を相互に比較し、候補機能選択部152が選択した複数の検証用画像のうち2個の検証用画像の組み合わせごとに、その違いの程度を示す評価値を算出する。画像比較部158は、算出した評価値を制御部160へ送信する。
上記評価値は、例えば2個の検証用画像のうち一方の画像における各画素の画素値と、他方の画像における対応する画素の画素値との差分に基づくものであってもよい。例えば、上記評価値は、2個の検証用画像のうち一方の画像における各画素の画素値と、他方の画像における対応する画素の画素値との差分の絶対値の最大値であってもよい。また、上記評価値は、画像比較部158が各画像をブロック単位に分割し、各ブロックごとに画素値の平均値を求めたときの、一方の画像における各ブロック内の画素値の平均値と、他方の画像における対応するブロック内の画素値の平均値との差分に基づくものであってもよい。
他の局面において、上記評価値は、2個の検証用画像の対応する画素間の色差に基づいてもよい。色差は、2つの色の間に定義される指標の一つであり、色空間内の対応する2点間の距離を含む。上記色空間は、RGB(Red, Blue, Green)色空間、HSV(Hue, Lightness, Value)色空間、HLS(Hue, Lightness , Saturation)色空間、L*a*b*色空間等を含む。したがって、2個の検証用画像がRGB画像である場合には、上記評価値は、対応する画素間のRGB階調差に基づくものであってもよいし、RGB色空間における距離に基づくものであってもよい。
制御部160は、画像形成装置100の全体の動作を制御する。制御部160は、例えば画像読み取りジョブ、コピージョブ、メール送信ジョブ、画像処理ジョブ、および印刷ジョブ等の各種ジョブを制御する。ある局面において、制御部160は、CPU120によって実現される。
記憶部162は、画像形成装置100に予め定められた処理を実行させるための制御用プログラムおよびデータ等を記憶する。記憶部162は、画像形成装置100において生成された画像を記憶し、また、画像読み取り装置102にて読み取られた画像を一時的に記憶する。記憶部162は、制御部160から受信したデータを記憶し、記憶部162にて保存されたデータは、制御部160により読み出される。記憶部162は、例えば、ROM124、RAM122、または補助記憶装置126等により実現される。
画像処理部166は、音声認識処理部150が1つの機能を認識した場合には、制御部160から受信した画像に対して、画像処理機能を実行する。また、画像処理部166は、ユーザーによって操作パネル装置101を介して画像処理の命令があった場合においても、処理対象の画像に対して画像処理機能を実行する。
図4は、画像処理部166が備える画像処理機能と、その機能の各々に対応する番号である機能番号との対応を表すリスト110の一例を示す図である。例えば「下地調整」の機能番号は「1」であり、「明度調整」の機能番号は「10」である。他の局面において、画像処理部166は、図4に示される機能以外の機能を備えていてもよい。図4に示されるリスト110は、記憶部162において記憶されている。ある局面において、画像処理部166は、画像処理装置130によって実現される。
出力部168は、表示装置134に情報を表示し、画像の用紙その他の媒体に画像またはテキストデータ等を印刷し、外部に音声あるいは信号を出力する。ある局面において、出力部168は、表示装置134、音声出力装置138およびD/A変換装置142、または画像出力装置146により実現される。
ある局面において、音声認識処理部150および候補機能選択部152は、音声認識処理装置148により実現される。
ある局面において、領域判別処理部155、画像検証部156、画像比較部158、および画像処理部166は、画像処理装置130により実現される。
[動作の具体例]
以下、図5〜図9を参照して、音声指示が与えられた場合における画像形成装置100の具体的な動作について説明する。
以下、図5〜図9を参照して、音声指示が与えられた場合における画像形成装置100の具体的な動作について説明する。
図5(A)は、ユーザーが「DFにセットした原稿の写真を少し明るくして5部コピー。」という音声指示を画像形成装置100に与えている一例を示す図である。図5(B)は、図5(A)に示される音声指示に対する画像形成装置100の処理内容を示す図である。
音声認識処理部150は、上記音声指示の「DF」というキーワードから、画像形成装置100が読み取る原稿がDF104にあるとを判断する。
また、上記音声指示において、画像形成装置100が原稿をカラーで読み取るのか、またはモノクロで読み取るのかを示す情報が不足している。本実施形態においては、音声認識処理部150は、画像形成装置100がデフォルトの設定であるACS(Automatic Color Selection)機能を使用すると判断する。
ACS機能とは、原稿がモノクロまたはカラーのいずれであるのかを自動的に判別する機能である。他の局面において、音声認識処理部150は、モノクロ若しくはカラーにて、またはユーザーによる設定に基づいて画像形成装置100が原稿を読み取ると判断してもよい。
また、音声認識処理部150は、「コピー」という音声指示から、画像処理装置130がコピーの動作を行うことを判断する。
上記の指示が音声により画像形成装置100に与えられた場合には、出力用紙サイズを示す情報が不足しているが、本実施形態においては、画像形成装置100は、出力用紙サイズを原稿サイズに合わせる。他の局面において、画像形成装置100は、他の情報を参考に出力用紙サイズを自動で決定してもよい。
また、音声認識処理部150は、「明るく」という音声指示から画像形成装置100が「明るく」という言葉に対応する画像処理機能を実行することを認識する。しかし、この場合には、「明るく」という言葉に対応する複数の画像処理機能が存在し、音声認識処理部150は、1つの画像処理機能を特定することができない。
また、音声認識処理部150は、「少し」というテキストデータから、画像処理機能における処理の度合い、即ち補正値についてユーザーから指定があったと認識する。上記のような指示が音声により画像形成装置100に与えられた場合には、具体的な補正値の情報が不足することになる。本実施形態においては、音声認識処理部150は、「少し」というテキストデータから予め定められた基準に従って、補正値を、例えば「+1」と設定する。
他の局面において、音声認識処理部150は、例えば「少し」と同様の意味を持つ「ちょっと」等のテキストデータが含まれていた場合にも、上記予め定められた基準に従って、補正値を「+1」と設定してもよい。
さらに他の局面において、音声認識処理部150は、ユーザーからの音声指示において画像処理機能における補正値に関して特に指示が無かった場合には、または「普通」というテキストデータが含まれていた場合等には、補正値を中程度に、例えば「+2」と設定してもよい。
さらに他の局面において、音声認識処理部150は、音声指示において「かなり」、「凄く」、および「とても」等のようなテキストデータが含まれている場合には、補正値を大きく、例えば「+3」と設定してもよい。
さらに他の局面において、音声認識処理部150は、『明るさを「+1」』等のようにユーザーから補正値を数値により直接指定される場合には、その指定に応じて補正値を「+1」と設定してもよい。
上記記載において、音声認識処理部150は、例えば「少し」という音声指示に対して補正値を「+1」、「普通」という音声指示に対して補正値を「+2」、「かなり」という音声指示に対して補正値を「+3」と設定しているが、これは一例であって、設定の態様はこれに限られない。例えば、音声認識処理部150は、「かなり」という音声指示に対して、補正値を「+4」と設定してもよい。
また、音声認識処理部150は、「写真」というテキストデータから、画像処理の補正対象が写真であると判断する。さらにまた、音声認識処理部150は、「5部」というテキストデータから、出力部数が5部であると判断する。
音声認識処理部150は、上記の処理を完了すると、音声認識処理部150から「DF」、「コピー」、「少し」、「写真」および「5部」という情報を制御部160へ送信する。また、音声認識処理部150は、「明るく」という情報から1つの機能を特定できなかったので、「明るく」というテキストデータを候補機能選択部152へ送信する。
図6を参照して、音声認識処理部150がユーザーの所望する画像処理機能を特定できない場合において候補機能選択部152が当該機能の候補を選択する方法の一例について説明する。図6は、画像形成装置100が備える「明度調整」等の画像処理機能と、音声認識処理装置148によって得られたテキストデータとを結びつけるためのキーワードを含むデータテーブル170を示す図である。
候補機能選択部152は、音声認識処理部150が音声指示を変換したテキストデータが、データテーブル170に含まれるキーワードと一致するか否かを判断することで、ユーザーが所望している可能性がある候補機能を選択する。データテーブル170は、記憶部162に記憶されている。なお、データテーブル170は、一例であり、他の局面において、データテーブル170とは異なるデータテーブルが用いられていてもよい。さらに、他の局面において、候補機能選択部152は、機械学習などのAI技術により音声指示に対応する画像処理の候補機能を認識してもよい。
候補機能選択部152は、「明るく」というキーワードから、候補機能が「明度調整」、「コピー濃度」(以下、「濃度調整」とも称する)、または「下地調整」のうちいずれかであることを判断する。上記各機能は、処理内容が異なるが、広義には画像を明るくする動作を行う。また、「下地調整」とは、処理対象の画像のうち少なくとも一部の領域について、例えば文字、写真、図形以外の、ユーザーにとって重要な情報が記載されていない「下地領域」について画像処理を行う機能である。
候補機能選択部152は、この場合には3種類の画像処理機能が存在し、1つの機能を決定することができないので、選択した画像処理機能を表す情報、即ち当該候補機能の機能番号である「10」、「6」および「1」を制御部160へ送信する。また、このとき「下地調整」が候補機能の1つであるので、制御部160は、領域判別処理部155に「下地領域」を判別するように命令する。
以下、図7(A)〜図7(C)を参照して、本実施形態における画像処理機能の一例である「明度調整」、「濃度調整」、および「下地調整」機能の入出力特性について説明する。
図7(A)、図7(B)、および図7(C)は、それぞれ「明度調整」、「濃度調整」、および「下地調整」機能の入出力特性の一例を示す図である。上記の各図において、上記機能の各々において補正値が正であるときには、画像処理は図中の「+」の入出力特性により行われる。また、補正値が負であるときには、画像処理は図中の「−」の入出力特性により行われる。図7(A)〜図7(C)において、便宜的に入出力を百分率で表している。
図7(A)において、横軸および横軸は、入出力画素の明度を表す。「明度調整」は、明度が「0」および「100」の各々である入力画素に対しては、その画素値を変化させない。つまり「明度調整」は、例えばグレースケール画像において、対象の白と黒を変更せず、中間領域の明るさを変化させる機能である。「明度調整」は、この場合、白および黒の画素から構成される文字領域の明度を変化させない。
図7(B)において、横軸および縦軸は、入出力画素の濃度を表す。濃度調整は、例えばグレースケール画像において、対象の白を基準として全体の明るさを変化させる機能である。他の局面において、「濃度調整」は、図7(A)に示される入出力特性のように白と黒の領域を変化させず、中間領域を変化させる機能であってもよい。
他の局面において、図7(B)において入出力画像がRGBカラー画像である場合には、「濃度調整」における入出力は、赤(R)、緑(G)、および青(B)の各チャンネルごとの濃度値であってもよい。上記の場合には、画像検証部156は、RGBの各チャンネルごとに同じトーンカーブの入出力特性による画像処理を行ってもよいし、RGBの各チャンネルごとにそれぞれトーンカーブの異なる入出力特性による画像処理を行ってもよい。
図7(C)において、横軸および横軸は、「下地領域」における入出力画素の明度を表す。下地調整は、濃度調整とは逆に、対象の黒を基準として全体の明るさを変化させる機能である。
再び図5および図6を参照して、候補機能選択部152が選択する各機能と、音声認識処理部150において決定される補正値とは、互いに連動していてもよい。例えば、音声認識処理部150は、音声指示において「かなり」というキーワードがもし含まれていたならば、候補機能の1つである「明度調整」に対しては補正値を「+3」と設定し、同じく候補機能の1つである「濃度調整」に対しては補正値を「+4」と設定してもよい。
さらに他の局面において、ユーザーが「明るく」、「暗く」、「濃く」、または「薄く」等の、原稿の明るさを変更する指示を画像形成装置100に与えた場合には、候補機能選択部152は、明度、濃度、下地、輝度、またはコントラストに影響を与える複数の機能を選択する。このとき、候補機能選択部152は、画像検証部156における画素値を明度値、濃度値、または輝度と設定するように制御部160に命令を送信する。
さらに他の局面において、ユーザーが、「くっきり」、「はっきり」、「シャープ」、「なめらかに」、または「ぼかす」等、例えば原稿画像における輪郭に影響を与える指示を画像形成装置100に与えた場合には、候補機能選択部152は、「シャープネス」、「スムージング」、および「文字再現調整」等、MTFまたは周波数特性に影響を与える機能から複数の機能を選択する。このとき、候補機能選択部152は、画像比較部158においてエッジ量を用いて差分を算出する旨を表す情報を制御部160に送信してもよい。ここで、エッジ量は、隣接した画素値の階調差、即ち微分フィルタの出力値である。
さらに他の局面において、上記差分量は、候補機能選択部152が選択した機能について画像検証部156が生成する複数の検証用画像の各々をフーリエ変換することによって求めた周波数特性差であってもよい。
さらに他の局面において、ユーザーが、「鮮やかに」、「赤く」、「赤色で再現」等の、原稿の色に影響を与える指示を画像形成装置100に与えた場合には、候補機能選択部152は、複数の画像処理機能から色相または彩度等に影響を与える複数の機能を選択する。このとき、候補機能選択部152は、画像検証部156における画素値として、画像の色相または彩度のうち少なくとも一つを用いるように制御部160に命令を送信してもよい。他の局面において、候補機能選択部152は、画像比較部158において算出する差分として色差を用いるように制御部160に命令を送信してもよい。
領域判別処理部155は、制御部160からの命令に基づいて、処理対象の画像を「下地領域」と「下地領域以外の領域」とに区分する。領域判別処理部155は、区分した領域に関する情報および処理対象の画像を、画像検証部156へ送信する。
画像検証部156は、処理対象の画像に対して「明度調整」、「濃度調整」および「下地調整」をそれぞれ実行することによって、3種類の検証用画像を生成する。なお、このとき「下地調整」後の検証用画像は、「下地領域」について画像処理がされた領域と「下地領域以外の領域」とからなる検証用画像である。画像検証部156は、3種類の検証用画像を画像比較部158へ送信する。
画像比較部158は、3種類の検証用画像を相互に比較するとき、3種類の検証用画像のうち1つの検証用画像における各画素の画素値と、当該画素に対応する3種類の検証用画像のうち他の検証用画像の画素値との差分を算出する。
しかし、画像比較部158が2つの検証用画像の対応する画素ごとの差分を算出すると、メモリ消費量が多くなる場合も考えられる。そのため、画像比較部158は、以下のような方法により2つの検証用画像を比較してもよい。
そこで、図8を参照して、画像比較部158が検証用画像の各々をブロック単位に分割し、各ブロックごとに画素値の平均値を算出することにより、複数の検証用画像の各々を相互に比較する処理について説明する。図8は、画像比較部158が検証用画像の各々をブロック単位に分割し、各ブロックごとに画素値の平均値を算出することにより、複数の検証用画像の各々を相互に比較する処理を示す図である。
画像比較部158は、図8に示されるように、複数の検証用画像の各々、例えば「明度調整」後の検証用画像410と「下地調整」後の検証用画像440とをブロック単位に分割し、ブロック分割後の検証用画像420,450を生成する。その後、画像比較部158は、ブロック分割後の検証用画像420,450におけるブロックごとの明度値の平均値430,460を算出する。以下、「ブロックごとの明度値の平均値」を「ブロックごとの明度値」とも称する。
他の局面において、画像比較部158は、明度値に限らず濃度値、RGB各チャンネルの階調値、色相、彩度、それらのエッジ量、または各画像のフーリエ変換から求めた、空間周波数特性若しくはMTF等の各ブロックごとの平均値を算出してもよい。あるいは、エッジ量は、隣接するブロック同士のエッジ量であってもよい。
さらに他の局面において、画像比較部158は、複数の検証用画像の各々の解像度を下げる処理を実行し、当該処理の後の検証用画像の各々において対応する画素ごとの画素値の差分を算出することで、複数の検証用画像の各々を相互に比較してもよい。
これにより、画像比較部158は、後述する複数の検証用画像の各々を比較するときのデータ処理量を削減できる。
画像比較部158は、「明度調整」後の検証用画像410と、「濃度調整」後の検証用画像と、「下地調整」後の検証用画像440とを2個の検証用画像の組み合わせごとに相互に比較する。
例えば、画像比較部158は、「明度調整」後のブロック分割後の検証用画像420と、「下地調整」後のブロック分割後の検証用画像450とを相互に比較し、「明度調整」後のブロックごとの明度値430と、「下地調整」後のブロックごとの明度値460との差分470を算出する。なお、画像比較部158は、他の検証用画像の組み合わせについても同様に差分を算出する。
差分470においては、最大でも明度差が5階調程度であり、人間の目で判断できる階調差が3階調以上である場合が多いことを考えると、5階調はバラツキの範囲と考えられる。以下、「閾値」を「6」として、議論を進める。
制御部160は、差分470における各ブロックの全ての絶対値が「6」未満であることから、「明度調整」および「下地調整」後の検証用画像は、実質的に同じであると判断する。同様に、制御部160は、他の検証用画像の組み合わせについても同様に比較した結果、3種類の検証用画像が実質的に同じであると判断したとして以下議論を進める。他の局面において、画像検証部156が、解像度を下げた検証用画像の各々を相互に比較する場合にも、検証用画像の対応する画素ごとに画素値の差分を算出する場合にも、上記の議論は適用される。
図8において、「明度調整」後のブロックごとの明度値430および「下地調整」後のブロックごとの明度値460における分割されたブロックのうち上から4段目までの領域については、「明度調整」後も「下地調整」後も明度値の差が殆どない領域が多い。そのため、「明度調整後」の検証用画像と、「下地調整」後の検証用画像とを比較したときに、階調の変化している領域が全体として実質的に一番下の段だけであり、その領域は画像全体の1/5程度である。よって、「下地調整」後と「明度調整」後の見た目の印象はほぼ変わらない。
以下、図9(A)および図9(B)を参照して、上記の例における対象原稿の特性について説明する。図9(A)は、明度調整前(原稿)の検証用画像のブロックごとの明度値を示す図である。図9(B)は、明度調整前の検証用画像のブロックごとの明度値と、明度調整後の検証用画像のブロックごとの明度値との差分を示す図である。
上記の例における原稿画像においては、上から3段目までのブロックにおいては文字領域が多い領域である。そのため、中間階調を持つ領域を変化させる機能である「明度調整」、「下地調整」、または「濃度調整」は、当該画素を変化させないことがある。このように、一般に、画像処理は、対象原稿の特性によって画像処理後の結果が変化する。その為、上記の例においては、複数の候補機能の各々について検証用画像を作成してシミュレーションを行うことにより、いずれの候補機能を選択しても、ユーザーにとっては全体として得られる結果は同じであることが分かる。
なお、「閾値」は、ユーザーにより予め定められていてもよいし、音声指示に基づいて音声認識処理部150が決定した補正値に応じて決められてもよい。例えば、画像処理における補正量が小さいと推定される場合は、検証用画像の各々を相互に比較したときに細かな差があるときに、ユーザーがその差を気にする場合も考えられる。そのため、「閾値」を小さく設定するようにしてもよい。一方、補正値が大きいと推定される場合は、検証用画像の各々を相互に比較したときに細かな画質の差があったとしても、ユーザーが気にしない場合があると思われるため、「閾値」を大きく設定するようにしてもよい。
[制御構造]
以下、図10および図11を参照して、画像形成装置100の制御構造について説明する。図10は、音声指示に基づいてユーザーが所望する画像処理機能を特定するために画像形成装置100が実行する処理の一部を示すフローチャートである。図11は、音声指示に基づいて制御部160が機能を特定する処理(図10のステップS300)を示すフローチャートである。
以下、図10および図11を参照して、画像形成装置100の制御構造について説明する。図10は、音声指示に基づいてユーザーが所望する画像処理機能を特定するために画像形成装置100が実行する処理の一部を示すフローチャートである。図11は、音声指示に基づいて制御部160が機能を特定する処理(図10のステップS300)を示すフローチャートである。
図10に示されるように、ステップS210において、音声認識処理部150は、ユーザーから音声指示が入力されたと認識した場合には(ステップS210でYES)、ユーザーからの音声を音声データに変換する。そうでない場合には(ステップS210でNO)、音声認識処理部150は、音声指示が入力されるまで待機する。
ステップS215において、制御部160は、「FLAG=0」と設定する。
ステップS220において、音声認識処理部150は、ユーザーの音声指示の内容を判断する。音声認識処理部150は、画像処理機能を音声指示から唯一に特定できた場合には、特定した画像処理機能の機能番号を制御部160へ送信する。そうでない場合には、音声認識処理部150は、候補機能選択部152へ当該音声指示に対する画像処理に関するテキストデータを送信する。
ステップS225において、制御部160は、入力された音声から機能を特定できる場合には「FLAG=1」と設定する。制御部160は、そうでない場合には「FLAG=0」に設定する。音声認識処理部150は、設定した「FLAG」の値を制御部160へ送信する。
ステップS230において、制御部160は、「FLAG=1」である場合には(ステップS230でYES)、処理をステップS240に進める。そうでない場合には(ステップS230でNO)、制御部160は、機能を特定するために処理をステップS300に進める。
ステップS240において、制御部160は、特定された機能に基づいて印刷を実行する。
ステップS245において、制御部160は、他の印刷原稿があるか否かを判断する。この判断は、例えば、ステップS220において音声認識処理部150が音声指示の内容から判断した出力部数に基づいて行なわれる。他の印刷原稿がある場合には(ステップS245でYES)、制御部160は処理をステップS230に戻す。そうでない場合には(ステップS245でNO)、制御部160は一連の処理を終了する。
図11を参照して、ステップS310において、候補機能選択部152は、音声指示に基づいたテキストデータ(ステップS220)から機能の候補を選択する。候補機能選択部152は、選択した機能番号を制御部160へ送信する。
ステップS315において、画像取得部154は、制御部160からの命令に基づいて処理対象の画像を取得する。制御部160は、画像取得部154が取得した処理対象の画像を領域判別処理部155へ送信する。領域判別処理部155は、処理対象の画像に対して領域判別処理を行った後に、または処理を行なわずに、処理対象の画像を画像検証部156へ送信する。制御部160は、候補機能選択部152から受信した機能番号を画像検証部156へ転送する。
ステップS320において、画像検証部156は、画像取得部154が取得した画像を候補機能選択部152が選択した機能候補ごとに画像処理し、複数の検証用画像を生成する。その後、画像検証部156は、複数の検証用画像を画像比較部158へ送信する。
ステップS325において、画像比較部158は、検証用画像を相互に比較し、差分を算出する。
ステップS330において、制御部160は、算出した全ての差分が「閾値」未満であるか否かを判断する。
ステップS330において、制御部160は、算出した全ての差分が「閾値」未満であると判断した場合には(ステップS330でYES)、処理をステップS332へ進める。制御部160は、この場合には、複数の検証用画像が実質的に同じであると判断することになる。そうでない場合には(ステップS330でNO)、制御部160は、処理をステップS335に進める。制御部160は、この場合には、複数の検証用画像が実質的に同じではないと判断していることになる。
ステップS332において、制御部160は、候補機能選択部152が選択した複数の候補機能からいずれか1つの画像処理機能を自動的に特定する。そのとき、候補機能から1つの画像処理機能を自動的に選択したという情報をユーザーに通知するためにパネルに表示し、動作を継続してもよい。その後、制御部160は、処理をメイン処理に戻す。
ステップS335において、制御部160は、機能を特定するための追加情報をユーザーに要求する。追加情報は、画像形成装置100から音声若しくは操作パネル装置101またはその両方によりユーザーへ問い合わされる情報である。ユーザーは、制御部160から追加情報を要求されたことに対して、入力部164に追加情報を入力する。入力部164は、ユーザーから入力された追加情報を制御部160へ送信する。
ここで、図12を参照して、制御部160が追加情報をユーザーに要求する場合の表示画面の一例であるプレビュー表示画面について以下に説明する。図12は、制御部160が候補機能ごとの画像処理結果をユーザーに対してプレビュー表示する画面の一例を示す図である。ユーザーは、プレビュー表示からどの機能を実行するか決めてもよい。例えば、ユーザーは、原稿画像600に画像処理機能が実行された、「明度調整」後の検証用画像610と、「濃度調整」後の検証用画像620と、「下地調整」後の検証用画像630のうち所望の1つの画像をタッチしてもよい。ユーザーは、2つ以上の候補機能が存在した場合でも、このようにして、画像形成装置100がどの画像処理機能を実行するか決定する。
図11を再び参照して、ステップS335において、制御部160は、機能を特定するための追加情報をユーザーに要求する。
ステップS340において、制御部160は、ステップS335においてユーザーから音声若しくは表示装置134またはそれらの両方により入力された追加情報の内容を判断する。例えば、ステップS335においてユーザーから音声指示がされた場合には、その後、制御部160は、当該音声指示に対して音声認識処理部150および候補機能選択部152が選択した機能を判断する。制御部160は、音声認識処理部150が当該音声から生成したテキストデータから候補機能選択部152が選択した機能の機能番号に基づいてこの判断を行う。
ステップS345において、制御部160は、複数の候補機能から1つの機能を特定できるか否かを判断する。制御部160は、1つの機能を特定できると判断した場合には(ステップS345でYES)、処理をステップS348に進める。そうでない場合には(ステップS345でNO)、制御部160は、処理をステップS335に戻す。このとき、制御部160は、機能を特定できない場合には、機能を特定するまで追加情報をユーザーに要求する。
ステップS348において、制御部160はユーザーが所望する機能を特定する。
ステップS350において、制御部160は、「FLAG=1」と設定し、処理を図10におけるメイン処理へ戻す。
以下、図10および図11を再び参照して「FLAG」を用いた制御についてさらに詳しく説明する。
制御部160は、ステップS225において音声指示に基づいて1つの機能を特定できたために「FLAG=1」と設定した場合には、ステップS230においてYESと処理を進める。その後、制御部160は、ステップS240において、ステップS225にて特定した機能を実行する。制御部160は、それ以降、他の印刷原稿がある(ステップS245においてYESと判断する)限り、ステップS245→ステップS230→ステップS240の処理を繰り返す。
制御部160は、ステップS225において音声指示に基づいて1つの機能を特定できないために「FLAG=0」と設定した場合には、ステップS230においてNOと処理を進める。その後、制御部160は、ステップS230→ステップS300→ステップS310→…(中略)…→ステップS330と処理を進める。このとき、制御部160がステップS225において設定した通り「FLAG=0」のままである。
制御部160は、ステップS330において「NO」と判断した場合には、ステップS335→…(中略)…→ステップS350にて追加情報をユーザーに要求して機能を特定し、「FLAG=1」と変更する。制御部160は、処理をメイン処理に戻した後は、ステップS240において、ステップS348にて特定した機能を実行する。制御部160は、それ以降に他の印刷原稿がある(ステップS245にてYESと判断する)限り、「FLAG=1」であることから、ステップS245→ステップS230→ステップS240の処理を繰り返す。すなわち、制御部160は、ユーザーに追加情報を一度要求して機能を特定した以降は、ユーザーに追加情報を再度要求することなく、特定した当該機能を、後続する他の印刷原稿に対しても実行する。
一方、制御部160は、ステップS330において「YES」と判断した場合には、ステップS332にて1つの機能を自動的に特定した後に処理をメイン処理に戻し、当該機能をステップS240にて実行する。制御部160は、次の印刷原稿がある(ステップS245にてYESと判断する)ときには、ステップS230に処理を進める。このとき、制御部160は、以前にステップS225にて「FLAG=0」と設定したことから、ステップS230→ステップS300→ステップS310→…(中略)…→ステップS330まで処理を進め、再び判断を行うことになる。
つまり、制御部160は、ステップS330にて「YES」と判断し、かつ他の印刷原稿がある(ステップS245にてYESと判断する)限り、ステップS330→ステップS332→ステップS240→ステップS245→ステップS230→ステップS300→ステップS310→…(中略)…→ステップS330の処理を繰り返す。このとき、制御部160は、ステップS332にて自動的に特定した機能をステップS240にて実行する。すなわち、制御部160は、原稿データが連続して入力される場合には、音声認識処理部150がステップS225において機能を特定できなかったとき、ユーザーに追加情報を要求することがあるまで、原稿一枚ごとにステップS330における判断を行う。
以上のように、制御部160は、「FLAG」を用いた制御により、「FLAG=0」である間は対処の原稿ごとにステップS330における判断を行う。それに対して、制御部160は、一度「FLAG=1」と設定した以降には、その際に特定した機能を後続する他の印刷原稿に対しても実行することで、対処の原稿ごとに追加情報をユーザーに要求するという手間を省くことができる。
[実施形態1の効果]
従来のMFPにおいては、ユーザーからの音声指示に対して複数の候補機能が存在した場合には、MFPがどの機能を実行すべきかユーザーに問い合わせる必要があった。しかし、ユーザーは、多くの場合、MFPが問い合わせた機能の各々の違いについて理解しておらず、MFPはそれらの違いをユーザーに説明する必要があり、複数の候補機能から1つの機能を絞り込むことに非常に時間が掛かっていた。また、従来のMFPは、ユーザーが選択した画像処理機能を実際に実行しないと当該機能による結果が分からなかった。そのため、対象原稿が各画像処理の特徴を反映しにくい特性となっており、どの機能を選択してもMFPの画像処理結果がほぼ同じであったとしても、MFPからユーザーへの問い合わせにより時間が無駄にかかっていた。しかし、それぞれの機能の実行後の結果に違いが無いのであれば、MFPは、それぞれの候補機能のうちいずれかを実行するのかをユーザーに問い合わせなくてもよい。つまり、MFPは、候補選択からランダムに機能を選択しても、実用上問題は生じない。
従来のMFPにおいては、ユーザーからの音声指示に対して複数の候補機能が存在した場合には、MFPがどの機能を実行すべきかユーザーに問い合わせる必要があった。しかし、ユーザーは、多くの場合、MFPが問い合わせた機能の各々の違いについて理解しておらず、MFPはそれらの違いをユーザーに説明する必要があり、複数の候補機能から1つの機能を絞り込むことに非常に時間が掛かっていた。また、従来のMFPは、ユーザーが選択した画像処理機能を実際に実行しないと当該機能による結果が分からなかった。そのため、対象原稿が各画像処理の特徴を反映しにくい特性となっており、どの機能を選択してもMFPの画像処理結果がほぼ同じであったとしても、MFPからユーザーへの問い合わせにより時間が無駄にかかっていた。しかし、それぞれの機能の実行後の結果に違いが無いのであれば、MFPは、それぞれの候補機能のうちいずれかを実行するのかをユーザーに問い合わせなくてもよい。つまり、MFPは、候補選択からランダムに機能を選択しても、実用上問題は生じない。
これに対して、ある実施形態に従う画像形成装置100は、ユーザーからの音声指示に対して候補機能が複数存在する場合には、事前に画像処理の結果をシミュレーションすることで、画像形成装置100からユーザーへの無駄な問い合わせを無くすことができる。そのため、本発明によりユーザーの負担を軽減することが可能となり、音声認識機能を備えるMFPの利便性を向上させることができる。
[変形例1]
図11および図13を参照して、本実施形態の変形例1について説明する。本変形例1においては、制御部160が候補機能から1つの機能を自動的に選択した場合にユーザーに提示する表示画面が、前述の実施形態と異なる。図13は、制御部160が自動選択した機能、および当該機能における補正値を推奨設定として、当該設定で動作を継続してよいかユーザーに許可を求める表示画面の一例を示す図である。
図11および図13を参照して、本実施形態の変形例1について説明する。本変形例1においては、制御部160が候補機能から1つの機能を自動的に選択した場合にユーザーに提示する表示画面が、前述の実施形態と異なる。図13は、制御部160が自動選択した機能、および当該機能における補正値を推奨設定として、当該設定で動作を継続してよいかユーザーに許可を求める表示画面の一例を示す図である。
実施形態1においては、制御部160は、図11におけるステップS332にて、候補機能選択部152が選択した複数の候補機能から1つの機能を自動的に選択したという情報をユーザーに通知するためにパネルに表示し、動作を継続していた。
これに対して、変形例1においては、制御部160は、図11におけるステップS332の後に動作を継続せずに、ユーザーに当該機能を実行してもよいか一度確認を求めるステップをステップS332の処理の後に実行し得る。
より具体的には、制御部160は、図13に示される表示画面500において、ユーザーからの音声指示に基づいて選択した機能が「明度調整」であり、当該機能における補正値が「+1」である設定により動作を継続してよいか否かを問い合わせる確認メッセージ502を表示して、ユーザーに許可を求める。ユーザーは、当該設定に同意した場合にはボタン504をタッチして動作を継続させ、同意しない場合にはボタン506をタッチすることで設定をキャンセルしてもよい。
[変形例1の効果]
本変形例1に係る制御部160は、ユーザーからの音声指示が複数の候補機能に対応し、当該複数の候補機能のうちどの機能を実行しても実用上問題はないと判断したときにも、ユーザーに実行する機能について一度確認を求める。このようにすると、ユーザーが所望する画像処理を確実に実現することができる。
本変形例1に係る制御部160は、ユーザーからの音声指示が複数の候補機能に対応し、当該複数の候補機能のうちどの機能を実行しても実用上問題はないと判断したときにも、ユーザーに実行する機能について一度確認を求める。このようにすると、ユーザーが所望する画像処理を確実に実現することができる。
[変形例2]
以下、図11および図14を参照して、変形例2について説明する。変形例2においては、制御部160が機能を特定するための追加情報をユーザーに要求する場合の表示画面(ステップS335)が、前述の実施形態1の表示画面と異なる。図14は、ステップS335において制御部160が表示する、候補機能の各々についての設定画面の一例を示す図である。
以下、図11および図14を参照して、変形例2について説明する。変形例2においては、制御部160が機能を特定するための追加情報をユーザーに要求する場合の表示画面(ステップS335)が、前述の実施形態1の表示画面と異なる。図14は、ステップS335において制御部160が表示する、候補機能の各々についての設定画面の一例を示す図である。
実施形態1においては、制御部160は、ステップS335にて機能を特定するための追加情報をユーザーに要求する場合には、複数の検証用画像をユーザーにプレビュー表示し、ユーザーは、当該プレビュー表示からどの機能を実行するか決めていた。
これに対して、変形例2においては、制御部160は、ステップS335において機能を特定するための追加情報をユーザーに要求する場合には、実施形態1の画面とは異なる種類の画面をユーザーに表示する。
より具体的には、図14においては、制御部160は、「明度調整」についての設定画面510を表示している。ユーザーは、画面を例えばスワイプすることにより「濃度調整」および「下地調整」などの他の候補機能についての設定画面を表示してもよい。他の局面において、制御部160は、全ての候補機能についての設定画面を同時に表示画面500に表示してもよい。
設定画面510において、ユーザーは、「明度調整」をさらに実行する場合には、ボタン516,518,520,522,および526等にタッチすることより明度を調整し得る。そして、ユーザーは、ボタン512または514等をタッチすることより調整を決定またはキャンセルし得る。なお、他の機能、例えば「濃度調整」および「下地調整」についても同様である。
[変形例2の効果]
ユーザーからの音声命令が2つ以上の候補機能に対応し、複数の検証用画像が実質的に同一ではない場合にも、ユーザーは、当該候補機能および当該候補機能における補正値を詳細に設定することができ、ユーザーが所望する画像を実現することができる。
ユーザーからの音声命令が2つ以上の候補機能に対応し、複数の検証用画像が実質的に同一ではない場合にも、ユーザーは、当該候補機能および当該候補機能における補正値を詳細に設定することができ、ユーザーが所望する画像を実現することができる。
[変形例3]
以下、図11を再び参照して実施形態1の変形例3について説明する。変形例3に従う画像形成装置100の制御構造は、実施形態1に従う画像形成装置100の制御構造と異なる。
以下、図11を再び参照して実施形態1の変形例3について説明する。変形例3に従う画像形成装置100の制御構造は、実施形態1に従う画像形成装置100の制御構造と異なる。
図11に示されるフローチャートにおけるステップS330にて、制御部160は、複数の検証用画像から算出した全ての差分が「閾値」未満ではない場合には、機能を特定するための追加情報をユーザーに要求していた。
しかし、図11におけるステップS300の分岐がNOであっても、複数の検証用画像のうちの1つと当該検証用画像を除く他の検証用画像の1つとが実質的に同じである場合も考えられる。この場合には、制御部160は、それらの実質的に同じ検証用画像に対応する機能同士を同じグループにおける同一の機能として扱う。その結果、ステップS335において機能を特定するための追加情報をユーザーに要求するときに、ユーザーによる選択の対象となる候補機能の数を減らすこともできる。
例えば、図11のステップS330において「明度調整」、「濃度調整」、および「下地調整」による3種類の検証用画像のうち2つから算出した全ての差分が「閾値」未満ではないが(ステップS330においてNO)、例えば「明度調整」後の検証用画像と「濃度調整」後の検証用画像との差分が「閾値」未満である場合があり得る。つまり、この場合において、「明度調整」後の検証用画像と「下地調整」後の検証用画像との差分、および「濃度調整」後の検証用画像と「下地調整」後の検証用画像との差分が「閾値」以上である。
上記の場合には、3種類の検証用画像の全てが互いに同じではないが、制御部160は、「明度調整」および「濃度調整」後の画像が実質的に同一であると判断している。そこで、制御部160は、ステップS335以降の処理において、「明度調整」および「濃度調整」を同じグループ(ここでは「グループA」と称する)における同一の機能として扱う。制御部160は、グループA内の代表的な機能(例えば「明度調整」)を自動で選択し、「グループAの機能」および「下地調整」の2つの候補機能のうちいずれを選択するかについての追加情報をユーザーに要求してもよい。ここで、グループA内の代表的な機能は、「明度調整」であっても、「濃度調整」であってもよい。
同様に、例えば候補機能選択部152が「機能a」、「機能b」、「機能c」、「機能d」、「機能e」、「機能f」、および「機能g」の7種類の候補機能を選択したとする。ここで、制御部160は、「機能a」および「機能b」が実質的に同じ機能とみなせる場合に、これらの機能を「グループAの機能」とグループ化してもよい。制御部160は、同様に「機能c」および「機能d」が実質的に同じ機能とみなせる場合には、これらの機能を「グループBの機能」とグループ化してもよい。制御部160は、同様に「機能e」、「機能f」、および「機能g」が実質的に同じ機能とみなせる場合には、これらの機能を「グループCの機能」とグループ化してもよい。上記の場合には、制御部160は、ステップS335以降の処理において「機能a」、「機能b」、「機能c」、「機能d」、「機能e」、「機能f」、および「機能g」の7種類の機能のうちから1つの機能を特定するための追加情報をユーザーに要求しなくてもよい。すなわち、制御部160は、「グループAの機能」「グループBの機能」「グループCの機能」の3つのグループの機能のうちから1つのグループの機能を特定するための追加情報をユーザーに要求しても、実用上問題は生じない。
[変形例3の効果]
ユーザーからの音声命令が複数の候補機能に対応する場合、複数の検証用画像のうちの一部が実質的に同一であるときには、当該実質的に同一である検証用画像に対応する候補機能を同じ機能として扱うことで、ユーザーに要求する追加情報を減らすことができる。その結果、ユーザーにとって当該追加情報に対して応答する負担が少なくなるので、利便性の低下が抑制され得る。
ユーザーからの音声命令が複数の候補機能に対応する場合、複数の検証用画像のうちの一部が実質的に同一であるときには、当該実質的に同一である検証用画像に対応する候補機能を同じ機能として扱うことで、ユーザーに要求する追加情報を減らすことができる。その結果、ユーザーにとって当該追加情報に対して応答する負担が少なくなるので、利便性の低下が抑制され得る。
<実施形態2>
次に、実施形態2について説明する。実施形態2に従う画像形成装置100においては、画像検証部156が、候補機能が最も影響を与える領域のみに画像処理を行う点で、前述の実施形態に係る画像形成装置100と異なる。なお、実施形態2における画像形成装置100のハードウェア構成は、実施形態1における画像形成装置100のハードウェア構成と同様であるため、これらの説明を繰り返さない。また、前述の処理と同じ処理には同一のステップ番号を付してある。したがって、同じ処理の説明は繰り返さない。
次に、実施形態2について説明する。実施形態2に従う画像形成装置100においては、画像検証部156が、候補機能が最も影響を与える領域のみに画像処理を行う点で、前述の実施形態に係る画像形成装置100と異なる。なお、実施形態2における画像形成装置100のハードウェア構成は、実施形態1における画像形成装置100のハードウェア構成と同様であるため、これらの説明を繰り返さない。また、前述の処理と同じ処理には同一のステップ番号を付してある。したがって、同じ処理の説明は繰り返さない。
実施形態2においては、領域判別処理部155は、候補機能選択部152が選択した機能が最も影響を与える領域とそれ以外の領域とに処理対象の画像を区分する。この場合には、領域判別処理部155は、処理対象の画像に対して複数の候補機能の処理を実行したときに、元の処理対象の画像に対する変化が他の領域に比べて大きい領域を、候補機能が最も影響を与える領域として設定する。
[制御構造]
図10、図11および図15を参照して、実施形態2における画像形成装置100の制御処理の一部について説明する。図15は、実施形態2に従う画像形成装置100が実行する処理の一部を示すフローチャートである。
図10、図11および図15を参照して、実施形態2における画像形成装置100の制御処理の一部について説明する。図15は、実施形態2に従う画像形成装置100が実行する処理の一部を示すフローチャートである。
実施形態2におけるメイン処理は、図10に示される処理と同じであるので、詳細な説明は繰り返さない。実施形態2におけるステップS300における処理(図15)は、図11に示される処理と比べて、ステップS317およびステップS318の処理が追加されている点で異なる。
ステップS310において、候補機能選択部152は、音声指示に対応する機能の候補を選択する。
ステップS315において、画像取得部154は、制御部160からの命令に基づいて処理対象の画像を取得する。制御部160は、画像取得部154が取得した処理対象の画像を領域判別処理部155へ送信する。
ステップS317において、領域判別処理部155は、画像取得部154が取得した画像の対象となる領域を判別する。すなわち、領域判別処理部155は、候補機能選択部152により選択された機能が最も影響を与える領域を判別する。その後、領域判別処理部155は、処理対象の画像と判別した領域の情報とを画像検証部156へ送信する。
ステップS318において、画像検証部156は、領域判別処理部155が判別した領域についてのみ候補機能ごとに画像処理を実行し、複数の検証用画像を作成する。画像検証部156は、作成した複数の検証用画像を画像比較部158へ送信する。この場合、処理時間短縮のために、画像比較部158は、複数の検証用画像について領域判別処理部155が判別した領域についてのみ比較してもよい。
[動作の具体例]
以下、画像検証部156が、候補機能が最も影響を与える領域のみに画像処理を行う場合の動作の具体例について説明する。また、この具体例では、図5に示される音声指示が与えられる場合が例示されるが、音声指示はこれに限られない。
以下、画像検証部156が、候補機能が最も影響を与える領域のみに画像処理を行う場合の動作の具体例について説明する。また、この具体例では、図5に示される音声指示が与えられる場合が例示されるが、音声指示はこれに限られない。
候補機能選択部152は、ユーザーの音声指示が「明るく」というキーワードを含むことから「明度調整」、「濃度調整」、および「下地調整」を候補機能として選択したとする。候補機能選択部152は、上記の機能の機能番号を制御部160へ送信する。制御部160は、「下地調整」が候補機能の1つであるので、領域判別処理部155に「下地領域」を判別するように命令する。
ここで、「明度調整」、「濃度調整」、および「下地調整」は、画像全体のうち「白」または「黒」の文字のみが印刷された文字領域等を変化させず、中間階調を持つ画像領域を変化させる画像処理機能である。そのため、画像検証部156は、例えばそのような文字領域に対して当該画像処理を実行しても、当該領域は変化しない。このとき、画像検証部156は、処理対象の画像に対して当該機能が最も影響を与える領域、すなわち中間階調を持つ画像領域についてのみ画像処理を行ってもよい。
そこで、本実施形態に従う領域判別処理部155は、画像取得部154が処理対象の画像を取得した後、処理対象の画像を、中間階調を持つ画像領域とその他の領域とに区分する。また、この場合には「下地調整」が候補機能の1つであるので、領域判別処理部155は、処理対象の画像を「下地領域」と「下地領域以外領域」に区分する。
他の局面において、領域判別処理部155は、候補機能選択部152が選択した機能が色相または彩度に影響を与える機能である場合には、画像取得部154が処理対象の画像を取得した後、当該処理対象の画像をカラー画像領域とその他の領域とに区分する。
さらに他の局面において、領域判別処理部155は、候補機能選択部152が選択した機能がコントラストに影響を与える機能である場合には、画像取得部154が処理対象の画像を取得した後、当該処理対象の画像を階調が一定のダイナミックレンジを持つ画像領域とその他の領域とに区分する。
なお、コントラストとは、明度または輝度のヒストグラムの分布の広がりのことである。例えばコントラストが高い画像は、ヒストグラムが広い範囲に分布し、画像中の明暗差が大きい画像である。一方、コントラストが低い画像は、ヒストグラムが狭い範囲に分布し、画像中の明暗差が小さい画像である。ダイナミックレンジとは、画像における最小画素値と最大画素値との比である。
さらに他の局面において、候補機能選択部152が選択した機能がMTFまたは周波数特性に影響を与える機能である場合には、画像取得部154が処理対象の画像を取得した後、領域判別処理部155は、当該処理対象の画像を一定以上の高い周波数特性を持つ画像領域とその他の領域とに区分する。
さらに他の局面において、候補機能選択部152が選択した機能が文字再現調整(図6)に影響を与える場合には、画像取得部154が処理対象の画像を取得した後、領域判別処理部155は、当該処理対象の画像を文字領域とその他の領域とに区分する。領域判別処理部155は、処理対象の画像と区分した領域の情報とを画像検証部156へ送信する。
その後、画像検証部156は、処理対象の画像に対して、「明度調整」または「濃度調整」に対しては中間階調を持つ画像領域のみに対して、「下地調整」については下地領域のみに対して画像処理を行い、複数の検証用画像を作成する。
画像比較部158は、画像検証部156が生成した複数の検証用画像の各々を相互に比較する。以降の処理については、実施形態1と同じであるので、説明を繰り返さない。
[実施形態2の効果]
以上詳述したように、実施形態2に係る画像形成装置100によれば、画像検証部156は、候補機能が最も影響を与える領域のみに基づいて複数の検証用画像を作成することで、メモリの消費量を削減することができる。その結果、画像形成装置100の処理速度が向上し得る。
以上詳述したように、実施形態2に係る画像形成装置100によれば、画像検証部156は、候補機能が最も影響を与える領域のみに基づいて複数の検証用画像を作成することで、メモリの消費量を削減することができる。その結果、画像形成装置100の処理速度が向上し得る。
<実施形態3>
以下、実施形態3について説明する。実施形態3に従う画像形成装置100は、領域判別処理部155がユーザーにより指定された特定の領域を判別する点において、前述の実施形態に従う画像形成装置と異なる。一例として、ユーザーによる音声指示が特定の領域に対する画像処理を含む場合における画像形成装置100の動作について説明する。例えば、ユーザーが人の顔、海、森、棒グラフ等の言葉で判別可能な領域を指定した場合が本実施形態に該当する。なお、実施形態3の画像形成装置100のハードウェア構成は、前述の実施形態と同様であるので、これらの説明を繰り返さない。また、前述の処理と同じ処理には同一のステップ番号を付してある。したがって、同じ処理の説明は繰り返さない。
以下、実施形態3について説明する。実施形態3に従う画像形成装置100は、領域判別処理部155がユーザーにより指定された特定の領域を判別する点において、前述の実施形態に従う画像形成装置と異なる。一例として、ユーザーによる音声指示が特定の領域に対する画像処理を含む場合における画像形成装置100の動作について説明する。例えば、ユーザーが人の顔、海、森、棒グラフ等の言葉で判別可能な領域を指定した場合が本実施形態に該当する。なお、実施形態3の画像形成装置100のハードウェア構成は、前述の実施形態と同様であるので、これらの説明を繰り返さない。また、前述の処理と同じ処理には同一のステップ番号を付してある。したがって、同じ処理の説明は繰り返さない。
[制御構造]
実施形態3に従う領域判別処理部155は、処理対象の画像を、ユーザーにより指定された特定の領域と、その他の領域とに区分する。また、画像検証部156は、処理対象の画像のユーザーにより指定された領域に対してのみ複数の候補機能の処理をそれぞれ実行することによって複数の検証用画像を生成する。画像比較部158は、当該複数の検証用画像の各々を相互に比較する。
実施形態3に従う領域判別処理部155は、処理対象の画像を、ユーザーにより指定された特定の領域と、その他の領域とに区分する。また、画像検証部156は、処理対象の画像のユーザーにより指定された領域に対してのみ複数の候補機能の処理をそれぞれ実行することによって複数の検証用画像を生成する。画像比較部158は、当該複数の検証用画像の各々を相互に比較する。
そこで、図10および図15を参照して、実施形態3における画像形成装置100の制御構造について説明する。
ステップS210において、音声認識処理部150は、ユーザーから音声指示が入力されたか否かを判断する。音声認識処理部150は、ユーザーから音声指示が入力されたと認識した場合には(ステップS210でYES)、処理をステップS215に進める。そうでない場合には(ステップS210でNO)、音声認識処理部150は音声が入力されるまで待機する。
ステップS215において、制御部160は、「FLAG=0」と設定する。
ステップS220において、音声認識処理部150は、ユーザーの音声指示の内容を判断して、特定の領域のみについて画像処理の指示があることを認識し、その旨を制御部160へ送信する。制御部160は、音声認識処理部150から受信した情報を、領域判別処理部155へ転送する。
音声認識処理部150は、画像処理機能を音声指示から唯一に特定できた場合には、特定した画像処理機能を表わす番号を制御部160へ送信する。そうでない場合には、音声認識処理部150は、音声指示における画像処理機能に対応するテキストデータを候補機能選択部152へ送信する。
ステップS225において、制御部160は、入力された音声から機能を特定できた場合には「FLAG=1」と設定する。制御部160は、そうでない場合には「FLAG=0」に設定する。音声認識処理部150は、設定した「FLAG」の値を制御部160へ送信する。
ステップS230において、制御部160は、「FLAG=1」である場合には(ステップS230でYES)、処理をステップS240に進める。そうでない場合には(ステップS230でNO)、制御部160は処理をステップS300に進める。
ステップS310において、候補機能選択部152は、音声指示に対応する機能の候補を選択する。
ステップS315において、画像取得部154は、制御部160からの命令に基づいて処理対象の画像を取得する。制御部160は、画像取得部154が取得した処理対象の画像を領域判別処理部155へ送信する。
ステップS317において、領域判別処理部155は、制御部160からの命令に基づいて画像取得部154が取得した画像の対象となる領域を判別する。すなわち、領域判別処理部155は、ユーザーから指定があった領域を判別する。その後、領域判別処理部155は、処理対象の画像と判別した領域の情報とを画像検証部156へ送信する。
ステップS318において、画像検証部156は、領域判別処理部155が判別した領域についてのみ候補機能ごとに画像処理を実行し、複数の検証用画像を作成する。なお、この場合において、検証用画像は、処理対象の画像において画像検証部156が当該領域のみに対して画像処理を実行した画像であり、当該領域のみからなる画像ではない。画像検証部156は、複数の検証用画像を画像比較部158へ送信する。
ステップS318において、画像比較部158は、検証用画像を相互に比較し、評価値を算出する。他の局面において、画像比較部158は、領域判別処理部155が判別し、画像検証部156が画像処理を行った領域についてのみ相互に比較し、評価値を算出してもよい。
[動作の具体例]
以下、例えばユーザーから「DFにセットされた原稿の写真を、顔の部分のみを少し明るくして5部コピー。」という音声指示が与えられる例に挙げて説明する。
以下、例えばユーザーから「DFにセットされた原稿の写真を、顔の部分のみを少し明るくして5部コピー。」という音声指示が与えられる例に挙げて説明する。
音声認識処理部150は、「顔の部分を」という音声指示から、ユーザーから「顔の部分のみ」という特定の領域の指定があったことを認識し、制御部160へその旨を表す情報を送信する。また、音声認識処理部150は、「明るく」という音声指示から画像処理に関する指示がユーザーから与えられたと認識するが、対応する1つの画像処理機能を特定できない。音声認識処理部150は、「明るく」というテキストデータを候補機能選択部152へ送信する。候補機能選択部152は、「明るく」というテキストデータから「明度調整」、「濃度調整」、および「下地調整」を特定する機能番号を制御部160へ送信する。しかし、この場合には、制御部160は、画像処理が「顔の部分のみ」という特定に領域についてのみ行われることから、上記の3種類の機能のうち「下地領域」について画像処理を行う「下地調整」を候補機能から除外する。制御部160は、画像の中から「顔の部分のみ」を判別するように領域判別処理部155に命令する。
画像取得部154は、音声指示に基づいて処理対象の画像を取得し、制御部160は、処理対象の画像を領域判別処理部155へ送信する。
領域判別処理部155は、制御部160の命令に基づいて、画像取得部154が取得した画像のうち「顔の部分」を判別する。領域判別処理部155は、判別した領域と処理対象の画像とを、画像検証部156へ送信する。
画像検証部156は、処理対象の画像において「顔の部分」のみに対して「明度調整」および「濃度調整」を行い、複数の検証用画像を作成する。画像検証部156は、それらを画像比較部158へ送信する。
このように、制御部160は、音声指示に基づいて領域判別処理部155に特定の領域を判別させ、その特定の領域のみ対象として画像検証部156に画像処理を行わせた後、画像比較部158に複数の検証用画像を相互に比較させてもよい。
[実施形態3の効果]
本実施形態に従う画像形成装置100によれば、ユーザーからの音声指示が特定の領域について画像処理の指示を含む場合においても、ユーザーの所望の画像品質の実現を可能にした上で、追加情報を要求する手間を減らすことができる。
本実施形態に従う画像形成装置100によれば、ユーザーからの音声指示が特定の領域について画像処理の指示を含む場合においても、ユーザーの所望の画像品質の実現を可能にした上で、追加情報を要求する手間を減らすことができる。
今回開示された実施形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
100 画像形成装置、101 操作パネル装置、102 画像読み取り装置、122 RAM、124 ROM、126 補助記憶装置、128 通信処理装置、130 画像処理装置、132 入力装置、134 表示装置、136 音声入力装置、138 音声出力装置、140 A/D変換装置、142 D/A変換装置、146 画像出力装置、148 音声認識処理装置、150 音声認識処理部、152 候補機能選択部、154 画像取得部、155 領域判別処理部、156 画像検証部、158 画像比較部、160 制御部、162 記憶部、164 入力部、166 画像処理部、168 出力部、170 データテーブル、500 表示画面、510 設定画面、610,620,630 検証用画像。
Claims (23)
- 画像形成装置であって、
前記画像形成装置の操作に関する音声指示を認識する音声認識処理部を備え、
前記音声認識処理部は、前記音声指示が処理対象の画像に対する画像処理についての指示を含む場合に、前記画像形成装置が備える複数の画像処理機能から前記音声指示に対応する機能を特定し、
前記画像形成装置は、さらに、
前記音声指示に対応する1つの画像処理機能を前記音声認識処理部が特定できない場合に、前記複数の画像処理機能から複数の候補機能を選択する候補機能選択部と、
前記処理対象の画像に対して前記複数の候補機能の処理をそれぞれ実行することによって複数の検証用画像を生成する画像検証部と、
前記複数の検証用画像を相互に比較する画像比較部と、
前記比較の結果に基づいて、前記複数の候補機能から1つの画像処理機能を自動的に決定するか、又はユーザーへ追加情報を求めるかを判断する制御部とを備える、画像形成装置。 - 前記画像比較部は、前記複数の検証用画像を相互に比較するときに、前記複数の検証用画像のうちの2個の検証用画像の組み合わせごとに、前記2個の検証用画像の違いの程度を表す評価値を算出し、前記評価値を閾値と比較する、請求項1に記載の画像形成装置。
- 前記制御部は、前記2個の検証用画像の組み合わせごとに算出された全ての評価値が前記閾値未満のとき、前記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、前記自動的に決定した画像処理を前記処理対象の画像に対して実行する、請求項2に記載の画像形成装置。
- 前記制御部は、前記2個の検証用画像の組み合わせごとに算出された評価値のうちの少なくとも1つが前記閾値以上のとき、ユーザーへ追加情報を求め、前記ユーザーから得られた追加情報に基づいて前記複数の候補機能のうちの1つを決定し、前記追加情報に基づいて決定した画像処理を前記処理対象の画像に対して実行する、請求項2または3に記載の画像形成装置。
- 前記画像比較部は、第1の検証用画像における各画素の画素値と、当該画素に対応する第2の検証用画像における画素の画素値との差分に基づいて、前記第1の検証用画像と前記第2の検証用画像との違いの程度を表す前記評価値を算出する、請求項2〜4のいずれか1項に記載の画像形成装置。
- 前記画像比較部は、前記複数の検証用画像の各々をブロック単位に分割して各ブロックごとに画素値の平均値を求めるブロック分割処理を実行し、
前記画像比較部は、前記ブロック分割処理後の第1の検証用画像における各ブロックの画素値の平均値と、当該ブロックに対応する前記ブロック分割処理後の第2の検証用画像におけるブロックの画素値の平均値との差分に基づいて、前記第1の検証用画像と前記第2の検証用画像との違いの程度を表す前記評価値を算出する、請求項2〜4のいずれか1項に記載の画像形成装置。 - 前記画像比較部は、前記複数の検証用画像の各々に対して解像度を下げる解像度変換処理を実行し、
前記画像比較部は、前記解像度変換処理後の第1の検証用画像における各画素の画素値と、当該画素に対応する前記解像度変換処理後の第2の検証用画像における画素の画素値との差分に基づいて、前記第1の検証用画像と前記第2の検証用画像との違いの程度を表す前記評価値を算出する、請求項2〜4のいずれか1項に記載の画像形成装置。 - 前記画素値は、RGB階調値、明度、濃度、色相、彩度、及び輝度の少なくとも1つを含む、請求項5〜7のいずれか1項に記載の画像形成装置。
- 前記画像比較部は、前記音声指示が前記処理対象の画像の明度、濃度、又はコントラストに関する指示を含む場合に、前記評価値を前記複数の検証用画像の各々の明度又は濃度を用いて算出する、請求項8に記載の画像形成装置。
- 前記画像比較部は、前記音声指示が前記処理対象の画像のMTF(Modulation Transfer Function)又は周波数特性に関する指示を含む場合に、前記評価値を前記複数の検証用画像の各々のエッジ量又は周波数特性を用いて算出する、請求項8に記載の画像形成装置。
- 前記画像比較部は、前記音声指示が前記処理対象の画像の色相又は彩度に関する指示を含む場合に、前記評価値を前記複数の検証用画像の各々の色相、彩度、及び前記複数の検証用画像のうち2つの画像のうち一方における画素又はブロックと、当該画素又はブロックに対応する、前記複数の検証用画像のうち2つの画像のうち他方における画素又はブロックとの色差の少なくとも1つを用いて算出する、請求項8に記載の画像形成装置。
- 前記複数の検証用画像は、第1の候補機能、第2の候補機能、および第3の候補機能にそれぞれ対応する第1の検証用画像、第2の検証用画像、および第3の検証用画像を含み、
前記画像比較部は、前記第1の検証用画像と前記第2の検証用画像とから第1の評価値を算出し、前記第1の検証用画像と前記第3の検証用画像とから第2の評価値を算出し、前記第2の検証用画像と前記第3の検証用画像とから第3の評価値を算出し、
前記制御部は、前記第1の評価値及び前記第2の評価値が前記閾値未満でありかつ前記第3の評価値が前記閾値以上である場合に、前記第1の候補機能及び前記第2の候補機能の一方のみと、前記第3の候補機能についてユーザーに追加情報を求める、請求項2〜11のいずれか1項に記載の画像形成装置。 - 前記音声指示は、前記処理対象の画像を補正する指示を含み、
前記音声認識処理部は、前記音声指示に基づいて前記処理対象の画像の補正量の大きさを決定し、
前記制御部は、前記複数の候補機能の各々に対して前記補正量に基づいて前記閾値を決定する、請求項2〜12のいずれか1項に記載の画像形成装置。 - 前記制御部は、前記複数の検証用画像のうち、2個の検証用画像の組み合わせにごとに算出された全ての前記評価値が前記閾値未満のとき、前記複数の候補機能のうちのいずれか1つの処理を自動的に決定した後に、前記自動的に決定した画像処理を前記ユーザーに通知する、請求項2〜13のいずれか1項に記載の画像形成装置。
- 前記制御部は、前記複数の検証用画像のうち、2個の検証用画像の組み合わせごとに算出された全ての前記評価値が前記閾値未満のとき、前記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、前記自動的に決定した処理を実行してよいかユーザーに許可を求める、請求項2〜14のいずれか1項に記載の画像形成装置。
- 前記画像形成装置は、前記処理対象の画像を第1領域と前記第1領域を除く領域とに区分する領域区分部をさらに備え、
前記画像検証部は、前記処理対象の画像の前記第1領域に対してのみ前記複数の候補機能の処理をそれぞれ実行することによって前記複数の検証用画像を生成する、請求項1〜15のいずれか1項に記載の画像形成装置。 - 前記領域区分部は、前記処理対象の画像に対して前記複数の候補機能の処理を実行した場合に、元の前記処理対象の画像に対する変化が、他の領域に比べて大きい領域を前記第1領域に設定する、請求項16に記載の画像形成装置。
- 前記領域区分部は、前記音声指示が前記処理対象の画像における特定の領域に対する画像処理を含む場合に、前記特定の領域を前記第1領域に設定する、請求項16に記載の画像形成装置。
- 前記画像比較部は、前記複数の検証用画像の前記第1領域のみを相互に比較する、請求項16〜18のいずれか1項に記載の画像形成装置。
- 前記制御部は、前記複数の検証用画像の少なくとも2つを表示することによって、ユーザーへの追加情報を求める、請求項1〜19のいずれか1項に記載の画像形成装置。
- 前記制御部は、前記複数の候補機能のうち少なくとも2つの設定画面を表示することによって、ユーザーへ追加情報を求める、請求項1〜20のいずれか1項に記載の画像形成装置。
- 前記音声指示は、第1番目から第n番目までのn個の処理対象の画像(nは2以上の整数)に対する画像処理についての指示を含み、
前記制御部は、前記音声認識処理部が前記音声指示に対応する1つの画像処理を特定できた場合に、前記n個の処理対象の画像の各々に対して前記特定した1つの画像処理を実行し、
前記制御部は、前記音声認識処理部が前記音声指示に対応する1つの画像処理を特定できない場合に、フラグを第1の値に初期設定し、
前記画像検証部は、前記第1番目の処理対象の画像から順番に前記フラグが第2の値に変更されるまで、前記n個の処理対象の画像のうち現在の処理順番の画像に対して前記複数の候補機能の処理を実行することにより、前記現在の処理順番の画像に対応する複数の検証用画像を生成し、
前記画像比較部は、前記画像検証部によって前記複数の検証用画像が生成される度に、2個の検証用画像の組み合わせごとに、前記2個の検証用画像の違いの程度を表す評価値を算出し、
前記制御部は、前記画像比較部によって算出された評価値が全て閾値未満の場合に、前記複数の候補機能のうちのいずれか1つの処理を自動的に決定し、前記自動的に決定した画像処理を前記現在の処理順番の画像に対して実行し、
前記制御部は、前記画像比較部によって算出された評価値の少なくとも1つが前記閾値以上の場合に、ユーザーへ追加情報を求め、前記ユーザーから得られた追加情報に基づいて前記複数の候補機能のうちの1つを決定し、前記追加情報に基づいて決定した画像処理を前記現在の処理順番の画像に対して実行し、前記フラグを前記第2の値に変更し、
前記制御部は、前記フラグを前記第2の値に変更した後は、前記n個の処理対象の画像のうち残余の画像に対して前記追加情報に基づいて決定した画像処理を実行する、請求項1〜21のいずれか1項に記載の画像形成装置。 - 前記処理対象の画像は、スキャナーによる対象原稿の走査、ファクシミリによる受信、外部ネットワークとの通信、内部メモリへのアクセス、又は補助記憶装置へのアクセスによって取得したデータに基づく画像データである、請求項1〜22のいずれか1項に記載の画像形成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019172782A JP2021052261A (ja) | 2019-09-24 | 2019-09-24 | 画像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019172782A JP2021052261A (ja) | 2019-09-24 | 2019-09-24 | 画像形成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021052261A true JP2021052261A (ja) | 2021-04-01 |
Family
ID=75158303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019172782A Pending JP2021052261A (ja) | 2019-09-24 | 2019-09-24 | 画像形成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021052261A (ja) |
-
2019
- 2019-09-24 JP JP2019172782A patent/JP2021052261A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4881902B2 (ja) | 画像形成装置、画像形成方法及び画像形成プログラム | |
US11272074B2 (en) | System, method, and storage medium for converting low-resolution image data into high-resolution image data using neural network | |
JP2008148037A (ja) | 画像処理装置、サーバ装置、出力デバイス表示方法、データ処理方法、記憶媒体、プログラム | |
JP6808325B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
KR20170000792A (ko) | 화상처리장치, 화상처리장치의 제어 방법 및 기억 매체 | |
US11323579B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7367159B2 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
JP2018074497A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP6089491B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、プログラム及び記憶媒体 | |
JP6438852B2 (ja) | 画像処理装置、画像形成装置、画像読取装置および画像処理方法 | |
US9338310B2 (en) | Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data | |
JP2002112022A (ja) | 画像形成装置、画像形成方法、および画像形成プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP4930423B2 (ja) | 画像処理装置、画像形成装置、画像処理装置の制御方法、および画像処理装置の制御プログラム | |
JP2010028314A (ja) | 画像処理装置及び方法並びにプログラム | |
EP2429173B1 (en) | Image forming apparatus, printing control terminal apparatus, and image forming method thereof | |
JP7034742B2 (ja) | 画像形成装置、その方法およびプログラム | |
US20090147326A1 (en) | Image processing apparatus and image processing method | |
JP2021052261A (ja) | 画像形成装置 | |
JP6171727B2 (ja) | 画像処理装置、シート、コンピュータプログラム | |
JP4814162B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2004146914A (ja) | インク消費量削減方法,インク消費量削減装置およびインク消費量削減プログラム | |
JP4761217B2 (ja) | 画像処理装置、画像形成装置、画像形成システム、および画像処理プログラム | |
JP2020119255A (ja) | 画像変換システムおよび情報処理装置 | |
JP2010283464A (ja) | 画像処理装置及び画像処理方法 | |
US20060126103A1 (en) | Post-operative polling for adjusting document processing settings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230516 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231107 |