WO2018135333A1

WO2018135333A1 - 画像読取装置

Info

Publication number: WO2018135333A1
Application number: PCT/JP2018/000157
Authority: WO
Inventors: 新一木村
Original assignee: 京セラドキュメントソリューションズ株式会社
Priority date: 2017-01-18
Filing date: 2018-01-09
Publication date: 2018-07-26

Abstract

原稿から画像を読み取る原稿読取部（５）と、原稿のレイアウトに関する設定を予めユーザーから受け付ける設定受付部（１０２）と、設定受付部１０２が受け付けたレイアウト設定に基づいて、原稿読取部（５）により読み取られた原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部（１０３）と、原稿画像向き検知部（１０３）により検知された原稿画像の向きを基準にして、分割した領域毎に、原稿読取部５による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部（１０４）と、を備える。

Description

画像読取装置

　本発明は、画像読取装置に関し、特に、原稿中の文字を認識する技術に関する。

　複合機等においては、読み取った原稿画像の向きを自動的に検知する機能が知られている。下記の特許文献１には、画像の向きを検知する技術について記載されている。また、原稿中の文字を認識するＯＣＲ（Optical Character Recognition）機能についてもよく知られ、実用化されている（例えば、下記の特許文献２を参照）。

特開平０６－１８９０８３号公報特開２００９－０９８７７７号公報

　近年、紙出力の削減のために、２枚以上の書類を１枚の用紙にまとめて印刷するという、集約印刷が行われることがある。例えば、２枚の書類を１枚の用紙にまとめて印刷した場合、一方の書類に示されていた画像は用紙の長辺を天地とするが、もう一方の書類に示されていた画像は用紙の短辺を天地とする、といったように、１枚の用紙で向きの異なる画像が混在することがある。

ところで、原稿中の文字認識処理が、原稿画像の向きを基準にして行われた場合、向きの異なる画像が原稿上に混在すると、文字の認識ができない、文字の認識精度が著しく低下する、或いは、文字認識の処理速度が遅くなる。

　本発明は、上記の事情に鑑みなされたものであり、向きの異なる画像が原稿上に混在していたとしても、原稿上の画像について高い精度での文字認識を行うことを目的とする。

　本発明の一局面に係る画像読取装置は、原稿から画像を読み取る原稿読取部と、原稿のレイアウトに関するレイアウト設定を予めユーザーから受け付ける設定受付部と、前記設定受付部が受け付けたレイアウト設定に基づいて、前記原稿読取部により読み取られた１頁分の原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部と、前記原稿画像向き検知部により前記分割した領域毎に検知された原稿画像の向きを基準にして、前記分割した領域毎に、前記原稿読取部による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部と、を備える。

　本発明によれば、原稿のレイアウト設定に基づいて、原稿画像の領域が分割され、分割された領域毎に、原稿画像の向きが検知され、検知された原稿画像の向きを基準にして、領域毎に原稿画像データに対して文字認識の処理が上記分割された領域毎に行われる。従って、向きの異なる画像が原稿に混在していたとしても、原稿中の文字の認識精度が低下したり、文字認識の処理速度が遅くなったりするのを防止することができ、原稿上の画像について高い精度での文字認識を行うことができる。

本発明の第１実施形態に係る画像読取装置を備えてなる、画像形成装置の主要内部構成を概略的に示した機能ブロック図である。（Ａ）、（Ｂ）は、表示部に表示される表示画面の一例を示した図である。第１実施形態に係る画像読取装置を備えてなる、画像形成装置における制御ユニットで行われる処理動作の一例を示したフローチャートである。原稿のレイアウトの一例を説明するための説明図であり、（Ａ）は２分割された状態を示し、（Ｂ）は４分割された状態を示している。原稿のレイアウトの一例を説明するための説明図である。

　以下、本発明の一実施形態に係る画像読取装置について図面を参照して説明する。図１は、本発明の第１実施形態に係る画像読取装置を備える画像形成装置の主要内部構成を概略的に示した機能ブロック図である。

画像形成装置１は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えた複合機であり、制御ユニット１０、原稿給送部６、原稿読取部５、画像形成部１２、画像メモリー３２、ＨＤＤ（Hard Disk Drive）９２、定着部１３、給紙部１４、及び操作部４７を含んで構成されている。

原稿給送部６は、読取対象の原稿を原稿読取部５へ給送する。原稿読取部５は、光照射部を使って、原稿給送部６から給送されてくる原稿又は原稿台に載置されている原稿を照射し、その反射光を受光することによって、原稿から画像を読み取る。原稿読取部５による読み取りで得られた画像データは画像メモリー３２等に記憶される。

画像形成部１２は、印刷すべき画像のトナー像を用紙（記録媒体）上に形成する。画像メモリー３２は、原稿読取部５による読み取りで得られた原稿の画像データを一時的に記憶したり、画像形成部１２のプリント対象となるデータを一時的に保存したりするための領域を有する。

ＨＤＤ９２は、原稿読取部５によって読み取られた原稿画像等を記憶する大容量の記憶装置である。定着部１３は、用紙上のトナー像を、熱圧着により用紙に定着させる。給紙部１４は、給紙カセット（図示せず）を備え、給紙カセットに収容された用紙をピックアップして搬送する。

操作部４７は、画像形成装置１が実行可能な各種動作及び処理について操作者から画像形成動作実行指示や原稿読取動作実行指示等の指示を受け付ける。操作部４７は、操作者への操作案内等を表示する表示部４７３を備えている。表示部４７３はタッチパネルになっており、操作者は画面表示されるボタンやキーに触れて画像形成装置１を操作することができる。

制御ユニット１０は、プロセッサー、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、及び専用のハードウェア回路を含んで構成される。プロセッサーは、例えばＣＰＵ（Central Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＭＰＵ（Micro Processing Unit）等である。制御ユニット１０は、制御部１００と、設定受付部１０２と、原稿画像向き検知部１０３と、文字認識部１０４とを備えている。

制御ユニット１０は、ＨＤＤ９２に記憶されている制御プログラムに従った上記プロセッサーによる動作により、制御部１００、設定受付部１０２、原稿画像向き検知部１０３、及び文字認識部１０４として機能する。但し、制御部１００等は、制御ユニット１０による制御プログラムに従った動作によらず、ハードウェア回路により構成することも可能である。以下、特に触れない限り、各実施形態について同様である。

制御部１００は、画像形成装置１の全体的な動作制御を司る。制御部１００は、原稿給送部６、原稿読取部５、画像形成部１２、画像メモリー３２、ＨＤＤ９２、定着部１３、給紙部１４、及び操作部４７と接続され、これら各部の駆動制御等を行う。

設定受付部１０２は、操作部４７を介したユーザーからの操作入力を受け付ける。また、設定受付部１０２は、原稿のレイアウトに関する設定を予めユーザーから受け付ける。

例えば、設定受付部１０２は、図２（Ａ）に示したような、文字認識対象となる言語の種類が記された言語選択ボタンＢ１～Ｂ４と、原稿のレイアウト内容が記されたレイアウト選択ボタンＢ５，Ｂ６とが形成された表示画面Ｄ１を表示部４７３に表示させる。

言語選択ボタンＢ１～Ｂ４にはそれぞれ、「英語＋日本語」、「英語＋韓国語」、「英語＋中国語（簡体）」、「英語＋中国語（繁体）」と記される。例えば、設定受付部１０２は、言語選択ボタンＢ１に対する操作を受け付けると、文字認識対象となる言語の種類が英語及び日本語であるという内容を記憶する。

レイアウト選択ボタンＢ５には、「Ｎ分割／見開き原稿　含まない」と記される。レイアウト選択ボタンＢ６には、「Ｎ分割／見開き原稿　含む」と記される。設定受付部１０２は、レイアウト選択ボタンＢ５に対する操作を受け付けると、原稿は分割されていないという内容を記憶する。一方、設定受付部１０２は、レイアウト選択ボタンＢ６に対する操作を受け付けると、図２（Ｂ）に示したような、原稿のレイアウト内容を選択するためのレイアウト選択ボタンＢ７，Ｂ８が形成された表示画面Ｄ２を表示部４７３に表示させる。

レイアウト選択ボタンＢ７には、原稿が２分割されていることを示す図柄等が記される。レイアウト選択ボタンＢ８には、原稿が４分割されていることを示す図柄等が記される。設定受付部１０２は、レイアウト選択ボタンＢ７に対する操作を受け付けると、原稿のレイアウトが２分割であるという内容を記憶する。また、設定受付部１０２は、レイアウト選択ボタンＢ８に対する操作を受け付けると、原稿のレイアウトが４分割であるという内容を記憶する。

原稿画像向き検知部１０３は、設定受付部１０２が受け付けたレイアウト設定に基づいて、レイアウト設定が原稿が分割されていることを示す場合には、原稿読取部５により読み取られた原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する。なお、原稿画像向き検知部１０３は、レイアウト設定が、原稿が分割されていないことを示す場合には、原稿読取部５により読み取られた原稿画像の全領域を対象として、原稿画像の向きを検知する。

例えば、原稿画像向き検知部１０３は、上記のように設定受付部１０２が受け付けた原稿レイアウトが２分割又は４分割のいずれであるかに応じて、原稿読取部５により読み取られた１頁分の原稿画像の領域を分割する。原稿画像向き検知部１０３は、原稿レイアウトが２分割である場合、原稿読取部５により読み取られた１頁分の原稿画像の領域を、縦横に寸法を有する原稿の例えば横方向における中央部で分割することで、当該原稿画像の領域を２つの領域に分割する。また、原稿画像向き検知部１０３は、原稿レイアウトが４分割である場合、原稿読取部５により読み取られた１頁分の原稿画像の領域を、縦横に寸法を有する原稿の例えば横方向及び縦方向における中央部でそれぞれ分割することで、当該原稿画像の領域を４つの領域に分割する。

原稿画像向き検知部１０３は、分割した各領域における予め定められた一部領域のみに対してＯＣＲ処理等により文字認識の処理を行い、当該処理の結果に基づいて、原稿画像の向きを検知する。なお、原稿画像向き検知部１０３は、原稿が分割されておらず原稿画像の全領域を対象として原稿画像の向きを検知する場合も、当該全領域における予め定められた一部領域のみに対して文字認識の処理を行い、原稿画像の向きを検知する。

例えば、原稿画像向き検知部１０３は、当該一部領域に対して、上下左右それぞれの向きに文字認識の処理を行い、各処理の結果に基づいて、文字の認識度が最も高い向きを原稿画像の向きと判定する。なお、向き判定処理をこれに限定する趣旨ではなく、これは単なる一例である。なお、ここでの文字認識の処理は、文字の向きを検知できれば目的は達成されるので、一部領域に対して行えば足り、文字認識部１０４での文字認識の処理よりも簡易な処理でよい。

文字認識部１０４は、原稿画像向き検知部１０３により検知された原稿画像の向きを基準にして、上記分割された領域毎に、原稿読取部５による読み取りで得られた原稿画像データに対してＯＣＲ処理等の文字認識の処理を行う。文字認識部１０４による当該文字認識処理は、上記分割された領域の全領域に対して行われる。

次に、第１実施形態に係る画像読取装置を備える画像形成装置１の制御ユニット１０で行われる処理動作の一例について、図３に示したフローチャートに基づいて説明する。なお、この処理動作は、原稿読取部５により読み取り得られた原稿画像データに対して行われる文字認識の処理動作である。

まず、原稿画像向き検知部１０３が、設定受付部１０２が記憶する原稿のレイアウト設定に基づいて、設定内容が「分割あり」であるか否かを判断する（Ｓ１）。つまり、図２（Ａ）に示す表示画面Ｄ１上で、ユーザーによってレイアウト選択ボタンＢ６が選択されたか否かを判断する。

原稿画像向き検知部１０３が、設定内容が「分割あり」であると判断した場合（Ｓ１でＹＥＳ）、原稿画像向き検知部１０３が、設定受付部１０２が記憶する原稿のレイアウト設定（２分割又は４分割）に基づいて、原稿読取部５により読み取り得られた原稿画像の領域を分割し（Ｓ２）、分割した領域毎に、原稿画像の向きを検知する（Ｓ３）。

例えば、設定されたレイアウトが２分割である場合、図４（Ａ）に示すように、原稿画像向き検知部１０３により、原稿画像Ｇ１は、図中左側に示した領域Ｅ１（破線の枠内）と、同右側に示した領域Ｅ２とに分割され、領域Ｅ１，Ｅ２それぞれに対して、原稿画像の向きが検知される。

また、設定されたレイアウトが４分割である場合、図４（Ｂ）に示したように、原稿画像向き検知部１０３により、原稿画像Ｇ２は、図中上部左側に示した領域Ｅ１１と、同下部左側に示した領域Ｅ１２と、同上部右側に示した領域Ｅ１３と、同下部右側に示した領域Ｅ１４とに分割され、領域Ｅ１１～Ｅ１４それぞれに対して、原稿画像の向きが検知される。

続いて、文字認識部１０４が、設定受付部１０２が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定する（Ｓ４）。文字認識部１０４は、原稿画像向き検知部１０３により検知された原稿画像の向きを基準にして、分割した領域毎に、原稿読取部５による読み取りで得られた原稿画像データに対して、特定した言語の種類に対する文字認識の処理を行う（Ｓ５）。

例えば、設定されたレイアウトが２分割であり、図４（Ａ）に示したように、領域Ｅ１での原稿画像の向きが図中上側を天地の「天」とし、領域Ｅ２での原稿画像の向きが同右側を「天」とする場合、文字認識部１０４により、領域Ｅ１に対しては、図中上方向を基準にして文字認識が行われ、領域Ｅ２に対しては、同右方向を基準にして文字認識が行われる。

また、設定されたレイアウトが４分割であり、図４（Ｂ）に示したように、領域Ｅ１１での原稿画像の向きが図中上側を「天」とし、領域Ｅ１２での原稿画像の向きが同左側を「天」とし、領域Ｅ１３での原稿画像の向きが同右側を「天」とし、領域Ｅ１４での原稿画像の向きが同下側を「天」とする場合、文字認識部１０４により、領域Ｅ１１に対しては、図中上方向を基準にして文字認識が行われ、領域Ｅ１２に対しては、同左方向を基準にして文字認識が行われ、領域Ｅ１３に対しては、同右方向を基準にして文字認識が行われ、領域Ｅ１４に対しては、同下方向を基準にして文字認識が行われる。

一方、Ｓ１において、原稿画像向き検知部１０３が、設定内容が「分割あり」でないと判断した場合（Ｓ１でＮＯ）、原稿画像向き検知部１０３が、原稿全体に対して、原稿画像の向きを検知する（Ｓ６）。

続いて、文字認識部１０４が、設定受付部１０２が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定し（Ｓ７）、文字認識部１０４が、原稿画像向き検知部１０３により検知された原稿画像の向きを基準にして、原稿読取部５による読み取りで得られた原稿画像データに対して、特定した言語の種類に対する文字認識の処理を行う（Ｓ８）。

上記第１実施形態によれば、原稿のレイアウト設定に基づいて、原稿画像の領域が分割され、分割された領域毎に、原稿画像の向きが検知され、領域毎に検知された原稿画像の向きを基準にして、領域毎に原稿画像データに対して文字認識の処理が行われる。従って、向きの異なる画像が原稿に混在していたとしても、原稿中の文字の認識精度や文字認識の処理速度が低下するのを防止することができ、原稿上の画像について高い精度での文字認識を行うことができる。

なお、上記第１実施形態では、図２に示したような表示画面Ｄ１，Ｄ２を通じた設定受付部１０２による受付内容に基づいて原稿のレイアウトを設定する場合について説明しているが、原稿のレイアウトを設定する方法としてはこれに限定されない。例えば、コピーの種類として「見開き原稿」や「ブック枠消し」といった設定が行われた場合、設定受付部１０２は当該設定に基づいて、原稿のレイアウトが２分割であると判定するようにしてもよい。

また、更なる別の実施形態として、原稿画像向き検知部１０３によって上記分割した各領域について検知された原稿画像の向きが一致する場合、文字認識部１０４は、当該分割した各領域に対して一括して文字認識の処理を行うようにしてもよい。すなわち、文字認識部１０４が、分割した各領域のうち、隣り合う領域において原稿画像の向きが一致するか否かを判断し、隣り合う領域において原稿画像の向きが一致すると判断した場合、原稿画像の向きが一致する隣り合う領域及び当該隣り合う領域に挟まれた領域に対しては、一括して文字認識の処理を行う。

例えば、図５に示したように、原稿画像Ｇ３が、図中上部左側に示した領域Ｅ２１と、同下部左側に示した領域Ｅ２２と、同上部右側に示した領域Ｅ２３と、同下部右側に示した領域Ｅ２４とに分割されていたとしても、隣り合う領域Ｅ２１，Ｅ２２で、原稿画像の向きが一致する場合、文字認識部１０４は、領域Ｅ２１、領域Ｅ２１と領域Ｅ２２とに挟まれた領域Ｅ２５、及び領域Ｅ２２に対して、連続して文字認識の処理を行う。これにより、領域Ｅ２１と領域Ｅ２２とに挟まれた領域Ｅ２５に対しても、精度の高い文字認識処理を実現することができる。

また、上記実施形態では、図１乃至図５を用いて上記実施形態により示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

Claims

　原稿から画像を読み取る原稿読取部と、
   原稿のレイアウトに関するレイアウト設定を予めユーザーから受け付ける設定受付部と、
   前記設定受付部が受け付けたレイアウト設定に基づいて、前記原稿読取部により読み取られた１頁分の原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部と、
   前記原稿画像向き検知部により前記分割した領域毎に検知された原稿画像の向きを基準にして、前記分割した領域毎に、前記原稿読取部による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部と、を備える画像読取装置。
前記原稿画像向き検知部は、前記レイアウト設定に基づいて分割した領域毎に、当該分割された領域の予め定められた一部領域のみに対して文字認識の処理を行い、当該処理の結果に基づいて、原稿画像の向きを検知するものであり、
前記文字認識部による文字認識の処理は、前記分割した各領域の全領域に対して行われる、請求項１に記載の画像読取装置。
前記原稿画像向き検知部によって前記分割した各領域について検知された原稿画像の向きが一致する場合、前記文字認識部は、前記分割した各領域に対して一括して文字認識の処理を行う、請求項２に記載の画像読取装置。
　前記設定受付部は、文字認識対象となる言語の種類をユーザーから受け付けて記憶し、
　前記文字認識部は、前記設定受付部が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定する、請求項１に記載の画像読取装置。
　前記設定受付部は、コピーの種類の設定をユーザーから受け付け、当該コピーの種類の設定に基づいて、原稿のレイアウト設定を判定する、請求項１に記載の画像読取装置。
　前記原稿画像向き検知部は、前記一部領域に対して、上下左右それぞれの向きに文字認識の処理を行い、各処理の結果に基づいて、文字の認識度が最も高い向きを原稿画像の向きと判定する、請求項２に記載の画像読取装置。