WO2018135333A1 - 画像読取装置 - Google Patents
画像読取装置 Download PDFInfo
- Publication number
- WO2018135333A1 WO2018135333A1 PCT/JP2018/000157 JP2018000157W WO2018135333A1 WO 2018135333 A1 WO2018135333 A1 WO 2018135333A1 JP 2018000157 W JP2018000157 W JP 2018000157W WO 2018135333 A1 WO2018135333 A1 WO 2018135333A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- unit
- image
- document
- character recognition
- setting
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
原稿から画像を読み取る原稿読取部(5)と、原稿のレイアウトに関する設定を予めユーザーから受け付ける設定受付部(102)と、設定受付部102が受け付けたレイアウト設定に基づいて、原稿読取部(5)により読み取られた原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部(103)と、原稿画像向き検知部(103)により検知された原稿画像の向きを基準にして、分割した領域毎に、原稿読取部5による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部(104)と、を備える。
Description
本発明は、画像読取装置に関し、特に、原稿中の文字を認識する技術に関する。
複合機等においては、読み取った原稿画像の向きを自動的に検知する機能が知られている。下記の特許文献1には、画像の向きを検知する技術について記載されている。また、原稿中の文字を認識するOCR(Optical Character Recognition)機能についてもよく知られ、実用化されている(例えば、下記の特許文献2を参照)。
近年、紙出力の削減のために、2枚以上の書類を1枚の用紙にまとめて印刷するという、集約印刷が行われることがある。例えば、2枚の書類を1枚の用紙にまとめて印刷した場合、一方の書類に示されていた画像は用紙の長辺を天地とするが、もう一方の書類に示されていた画像は用紙の短辺を天地とする、といったように、1枚の用紙で向きの異なる画像が混在することがある。
ところで、原稿中の文字認識処理が、原稿画像の向きを基準にして行われた場合、向きの異なる画像が原稿上に混在すると、文字の認識ができない、文字の認識精度が著しく低下する、或いは、文字認識の処理速度が遅くなる。
本発明は、上記の事情に鑑みなされたものであり、向きの異なる画像が原稿上に混在していたとしても、原稿上の画像について高い精度での文字認識を行うことを目的とする。
本発明の一局面に係る画像読取装置は、原稿から画像を読み取る原稿読取部と、原稿のレイアウトに関するレイアウト設定を予めユーザーから受け付ける設定受付部と、前記設定受付部が受け付けたレイアウト設定に基づいて、前記原稿読取部により読み取られた1頁分の原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部と、前記原稿画像向き検知部により前記分割した領域毎に検知された原稿画像の向きを基準にして、前記分割した領域毎に、前記原稿読取部による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部と、を備える。
本発明によれば、原稿のレイアウト設定に基づいて、原稿画像の領域が分割され、分割された領域毎に、原稿画像の向きが検知され、検知された原稿画像の向きを基準にして、領域毎に原稿画像データに対して文字認識の処理が上記分割された領域毎に行われる。従って、向きの異なる画像が原稿に混在していたとしても、原稿中の文字の認識精度が低下したり、文字認識の処理速度が遅くなったりするのを防止することができ、原稿上の画像について高い精度での文字認識を行うことができる。
以下、本発明の一実施形態に係る画像読取装置について図面を参照して説明する。図1は、本発明の第1実施形態に係る画像読取装置を備える画像形成装置の主要内部構成を概略的に示した機能ブロック図である。
画像形成装置1は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えた複合機であり、制御ユニット10、原稿給送部6、原稿読取部5、画像形成部12、画像メモリー32、HDD(Hard Disk Drive)92、定着部13、給紙部14、及び操作部47を含んで構成されている。
原稿給送部6は、読取対象の原稿を原稿読取部5へ給送する。原稿読取部5は、光照射部を使って、原稿給送部6から給送されてくる原稿又は原稿台に載置されている原稿を照射し、その反射光を受光することによって、原稿から画像を読み取る。原稿読取部5による読み取りで得られた画像データは画像メモリー32等に記憶される。
画像形成部12は、印刷すべき画像のトナー像を用紙(記録媒体)上に形成する。画像メモリー32は、原稿読取部5による読み取りで得られた原稿の画像データを一時的に記憶したり、画像形成部12のプリント対象となるデータを一時的に保存したりするための領域を有する。
HDD92は、原稿読取部5によって読み取られた原稿画像等を記憶する大容量の記憶装置である。定着部13は、用紙上のトナー像を、熱圧着により用紙に定着させる。給紙部14は、給紙カセット(図示せず)を備え、給紙カセットに収容された用紙をピックアップして搬送する。
操作部47は、画像形成装置1が実行可能な各種動作及び処理について操作者から画像形成動作実行指示や原稿読取動作実行指示等の指示を受け付ける。操作部47は、操作者への操作案内等を表示する表示部473を備えている。表示部473はタッチパネルになっており、操作者は画面表示されるボタンやキーに触れて画像形成装置1を操作することができる。
制御ユニット10は、プロセッサー、RAM(Random Access Memory)、ROM(Read Only Memory)、及び専用のハードウェア回路を含んで構成される。プロセッサーは、例えばCPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)、MPU(Micro Processing Unit)等である。制御ユニット10は、制御部 100と、設定受付部102と、原稿画像向き検知部103と、文字認識部104とを備えている。
制御ユニット10は、HDD92に記憶されている制御プログラムに従った上記プロセッサーによる動作により、制御部100、設定受付部102、原稿画像向き検知部103、及び文字認識部104として機能する。但し、制御部100等は、制御ユニット10による制御プログラムに従った動作によらず、ハードウェア回路により構成することも可能である。以下、特に触れない限り、各実施形態について同様である。
制御部100は、画像形成装置1の全体的な動作制御を司る。制御部100は、原稿給送部6、原稿読取部5、画像形成部12、画像メモリー32、HDD92、定着部13、給紙部14、及び操作部47と接続され、これら各部の駆動制御等を行う。
設定受付部102は、操作部47を介したユーザーからの操作入力を受け付ける。また、設定受付部102は、原稿のレイアウトに関する設定を予めユーザーから受け付ける。
例えば、設定受付部102は、図2(A)に示したような、文字認識対象となる言語の種類が記された言語選択ボタンB1~B4と、原稿のレイアウト内容が記されたレイアウト選択ボタンB5,B6とが形成された表示画面D1を表示部473に表示させる。
言語選択ボタンB1~B4にはそれぞれ、「英語+日本語」、「英語+韓国語」、「英語+中国語(簡体)」、「英語+中国語(繁体)」と記される。例えば、設定受付部102は、言語選択ボタンB1に対する操作を受け付けると、文字認識対象となる言語の種類が英語及び日本語であるという内容を記憶する。
レイアウト選択ボタンB5には、「N分割/見開き原稿 含まない」と記される。レイアウト選択ボタンB6には、「N分割/見開き原稿 含む」と記される。設定受付部102は、レイアウト選択ボタンB5に対する操作を受け付けると、原稿は分割されていないという内容を記憶する。一方、設定受付部102は、レイアウト選択ボタンB6に対する操作を受け付けると、図2(B)に示したような、原稿のレイアウト内容を選択するためのレイアウト選択ボタンB7,B8が形成された表示画面D2を表示部473に表示させる。
レイアウト選択ボタンB7には、原稿が2分割されていることを示す図柄等が記される。レイアウト選択ボタンB8には、原稿が4分割されていることを示す図柄等が記される。設定受付部102は、レイアウト選択ボタンB7に対する操作を受け付けると、原稿のレイアウトが2分割であるという内容を記憶する。また、設定受付部102は、レイアウト選択ボタンB8に対する操作を受け付けると、原稿のレイアウトが4分割であるという内容を記憶する。
原稿画像向き検知部103は、設定受付部102が受け付けたレイアウト設定に基づいて、レイアウト設定が原稿が分割されていることを示す場合には、原稿読取部5により読み取られた原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する。なお、原稿画像向き検知部103は、レイアウト設定が、原稿が分割されていないことを示す場合には、原稿読取部5により読み取られた原稿画像の全領域を対象として、原稿画像の向きを検知する。
例えば、原稿画像向き検知部103は、上記のように設定受付部102が受け付けた原稿レイアウトが2分割又は4分割のいずれであるかに応じて、原稿読取部5により読み取られた1頁分の原稿画像の領域を分割する。原稿画像向き検知部103は、原稿レイアウトが2分割である場合、原稿読取部5により読み取られた1頁分の原稿画像の領域を、縦横に寸法を有する原稿の例えば横方向における中央部で分割することで、当該原稿画像の領域を2つの領域に分割する。また、原稿画像向き検知部103は、原稿レイアウトが4分割である場合、原稿読取部5により読み取られた1頁分の原稿画像の領域を、縦横に寸法を有する原稿の例えば横方向及び縦方向における中央部でそれぞれ分割することで、当該原稿画像の領域を4つの領域に分割する。
原稿画像向き検知部103は、分割した各領域における予め定められた一部領域のみに対してOCR処理等により文字認識の処理を行い、当該処理の結果に基づいて、原稿画像の向きを検知する。なお、原稿画像向き検知部103は、原稿が分割されておらず原稿画像の全領域を対象として原稿画像の向きを検知する場合も、当該全領域における予め定められた一部領域のみに対して文字認識の処理を行い、原稿画像の向きを検知する。
例えば、原稿画像向き検知部103は、当該一部領域に対して、上下左右それぞれの向きに文字認識の処理を行い、各処理の結果に基づいて、文字の認識度が最も高い向きを原稿画像の向きと判定する。なお、向き判定処理をこれに限定する趣旨ではなく、これは単なる一例である。なお、ここでの文字認識の処理は、文字の向きを検知できれば目的は達成されるので、一部領域に対して行えば足り、文字認識部104での文字認識の処理よりも簡易な処理でよい。
文字認識部104は、原稿画像向き検知部103により検知された原稿画像の向きを基準にして、上記分割された領域毎に、原稿読取部5による読み取りで得られた原稿画像データに対してOCR処理等の文字認識の処理を行う。文字認識部104による当該文字認識処理は、上記分割された領域の全領域に対して行われる。
次に、第1実施形態に係る画像読取装置を備える画像形成装置1の制御ユニット10で行われる処理動作の一例について、図3に示したフローチャートに基づいて説明する。なお、この処理動作は、原稿読取部5により読み取り得られた原稿画像データに対して行われる文字認識の処理動作である。
まず、原稿画像向き検知部103が、設定受付部102が記憶する原稿のレイアウト設定に基づいて、設定内容が「分割あり」であるか否かを判断する(S1)。つまり、図2(A)に示す表示画面D1上で、ユーザーによってレイアウト選択ボタンB6が選択されたか否かを判断する。
原稿画像向き検知部103が、設定内容が「分割あり」であると判断した場合(S1でYES)、原稿画像向き検知部103が、設定受付部102が記憶する原稿のレイアウト設定(2分割又は4分割)に基づいて、原稿読取部5により読み取り得られた原稿画像の領域を分割し(S2)、分割した領域毎に、原稿画像の向きを検知する(S3)。
例えば、設定されたレイアウトが2分割である場合、図4(A)に示すように、原稿画像向き検知部103により、原稿画像G1は、図中左側に示した領域E1(破線の枠内)と、同右側に示した領域E2とに分割され、領域E1,E2それぞれに対して、原稿画像の向きが検知される。
また、設定されたレイアウトが4分割である場合、図4(B)に示したように、原稿画像向き検知部103により、原稿画像G2は、図中上部左側に示した領域E11と、同下部左側に示した領域E12と、同上部右側に示した領域E13と、同下部右側に示した領域E14とに分割され、領域E11~E14それぞれに対して、原稿画像の向きが検知される。
続いて、文字認識部104が、設定受付部102が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定する(S4)。文字認識部104は、原稿画像向き検知部103により検知された原稿画像の向きを基準にして、分割した領域毎に、原稿読取部5による読み取りで得られた原稿画像データに対して、特定した言語の種類に対する文字認識の処理を行う(S5)。
例えば、設定されたレイアウトが2分割であり、図4(A)に示したように、領域E1での原稿画像の向きが図中上側を天地の「天」とし、領域E2での原稿画像の向きが同右側を「天」とする場合、文字認識部104により、領域E1に対しては、図中上方向を基準にして文字認識が行われ、領域E2に対しては、同右方向を基準にして文字認識が行われる。
また、設定されたレイアウトが4分割であり、図4(B)に示したように、領域E11での原稿画像の向きが図中上側を「天」とし、領域E12での原稿画像の向きが同左側を「天」とし、領域E13での原稿画像の向きが同右側を「天」とし、領域E14での原稿画像の向きが同下側を「天」とする場合、文字認識部104により、領域E11に対しては、図中上方向を基準にして文字認識が行われ、領域E12に対しては、同左方向を基準にして文字認識が行われ、領域E13に対しては、同右方向を基準にして文字認識が行われ、領域E14に対しては、同下方向を基準にして文字認識が行われる。
一方、S1において、原稿画像向き検知部103が、設定内容が「分割あり」でないと判断した場合(S1でNO)、原稿画像向き検知部103が、原稿全体に対して、原稿画像の向きを検知する(S6)。
続いて、文字認識部104が、設定受付部102が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定し(S7)、文字認識部104が、原稿画像向き検知部103により検知された原稿画像の向きを基準にして、原稿読取部5による読み取りで得られた原稿画像データに対して、特定した言語の種類に対する文字認識の処理を行う(S8)。
上記第1実施形態によれば、原稿のレイアウト設定に基づいて、原稿画像の領域が分割され、分割された領域毎に、原稿画像の向きが検知され、領域毎に検知された原稿画像の向きを基準にして、領域毎に原稿画像データに対して文字認識の処理が行われる。従って、向きの異なる画像が原稿に混在していたとしても、原稿中の文字の認識精度や文字認識の処理速度が低下するのを防止することができ、原稿上の画像について高い精度での文字認識を行うことができる。
なお、上記第1実施形態では、図2に示したような表示画面D1,D2を通じた設定受付部102による受付内容に基づいて原稿のレイアウトを設定する場合について説明しているが、原稿のレイアウトを設定する方法としてはこれに限定されない。例えば、コピーの種類として「見開き原稿」や「ブック枠消し」といった設定が行われた場合、設定受付部102は当該設定に基づいて、原稿のレイアウトが2分割であると判定するようにしてもよい。
また、更なる別の実施形態として、原稿画像向き検知部103によって上記分割した各領域について検知された原稿画像の向きが一致する場合、文字認識部104は、当該分割した各領域に対して一括して文字認識の処理を行うようにしてもよい。すなわち、文字認識部104が、分割した各領域のうち、隣り合う領域において原稿画像の向きが一致するか否かを判断し、隣り合う領域において原稿画像の向きが一致すると判断した場合、原稿画像の向きが一致する隣り合う領域及び当該隣り合う領域に挟まれた領域に対しては、一括して文字認識の処理を行う。
例えば、図5に示したように、原稿画像G3が、図中上部左側に示した領域E21と、同下部左側に示した領域E22と、同上部右側に示した領域E23と、同下部右側に示した領域E24とに分割されていたとしても、隣り合う領域E21,E22で、原稿画像の向きが一致する場合、文字認識部104は、領域E21、領域E21と領域E22とに挟まれた領域E25、及び領域E22に対して、連続して文字認識の処理を行う。これにより、領域E21と領域E22とに挟まれた領域E25に対しても、精度の高い文字認識処理を実現することができる。
また、上記実施形態では、図1乃至図5を用いて上記実施形態により示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。
Claims (6)
- 原稿から画像を読み取る原稿読取部と、
原稿のレイアウトに関するレイアウト設定を予めユーザーから受け付ける設定受付部と、
前記設定受付部が受け付けたレイアウト設定に基づいて、前記原稿読取部により読み取られた1頁分の原稿画像の領域を分割し、分割した領域毎に、原稿画像の向きを検知する原稿画像向き検知部と、
前記原稿画像向き検知部により前記分割した領域毎に検知された原稿画像の向きを基準にして、前記分割した領域毎に、前記原稿読取部による読み取りで得られた原稿画像データに対して文字認識の処理を行う文字認識部と、を備える画像読取装置。 - 前記原稿画像向き検知部は、前記レイアウト設定に基づいて分割した領域毎に、当該分割された領域の予め定められた一部領域のみに対して文字認識の処理を行い、当該処理の結果に基づいて、原稿画像の向きを検知するものであり、
前記文字認識部による文字認識の処理は、前記分割した各領域の全領域に対して行われる、請求項1に記載の画像読取装置。 - 前記原稿画像向き検知部によって前記分割した各領域について検知された原稿画像の向きが一致する場合、前記文字認識部は、前記分割した各領域に対して一括して文字認識の処理を行う、請求項2に記載の画像読取装置。
- 前記設定受付部は、文字認識対象となる言語の種類をユーザーから受け付けて記憶し、
前記文字認識部は、前記設定受付部が記憶する文字認識対象の内容に基づいて、文字認識の対象となる言語の種類を特定する、請求項1に記載の画像読取装置。 - 前記設定受付部は、コピーの種類の設定をユーザーから受け付け、当該コピーの種類の設定に基づいて、原稿のレイアウト設定を判定する、請求項1に記載の画像読取装置。
- 前記原稿画像向き検知部は、前記一部領域に対して、上下左右それぞれの向きに文字認識の処理を行い、各処理の結果に基づいて、文字の認識度が最も高い向きを原稿画像の向きと判定する、請求項2に記載の画像読取装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006832 | 2017-01-18 | ||
JP2017-006832 | 2017-01-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018135333A1 true WO2018135333A1 (ja) | 2018-07-26 |
Family
ID=62908615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2018/000157 WO2018135333A1 (ja) | 2017-01-18 | 2018-01-09 | 画像読取装置 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2018135333A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063419A (ja) * | 2003-07-31 | 2005-03-10 | Ricoh Co Ltd | 言語識別装置、プログラム及び記録媒体 |
-
2018
- 2018-01-09 WO PCT/JP2018/000157 patent/WO2018135333A1/ja active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063419A (ja) * | 2003-07-31 | 2005-03-10 | Ricoh Co Ltd | 言語識別装置、プログラム及び記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10666829B2 (en) | Image scanning device and image processing apparatus including card scanning function, and image scanning method thereof | |
US8416448B2 (en) | Printing apparatus | |
CN110115020B (zh) | 图像读取装置 | |
US10896012B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP6575475B2 (ja) | 画像読取装置及び画像形成装置 | |
JP2021114653A (ja) | 画像処理装置及び画像処理方法 | |
JP6579077B2 (ja) | 画像読取装置及び画像形成装置 | |
JP2014164688A (ja) | 画像処理装置及びこれを備えた画像形成装置 | |
WO2018135333A1 (ja) | 画像読取装置 | |
US9747022B2 (en) | Electronic device | |
JP6074968B2 (ja) | 画像処理装置及び制御プログラム | |
US20190356790A1 (en) | Image processing apparatus, non-transitory storage medium, and image processing method | |
JP7318319B2 (ja) | 情報処理装置及び画像形成装置 | |
JP2017108249A (ja) | 画像読取装置及び画像形成装置 | |
JP2019091984A (ja) | 画像処理装置 | |
WO2023013464A1 (ja) | 画像形成装置 | |
JP6524941B2 (ja) | 画像処理装置、画像処理方法 | |
JP2018067892A (ja) | 画像切出装置、複合機、画像切出方法及び画像切出用プログラム | |
US20150146254A1 (en) | Image Processing Apparatus and Image Processing Method That Ensures Effective Search | |
JP6508121B2 (ja) | 画像処理装置、画像処理装置の機能設定方法 | |
JP6547658B2 (ja) | 画像処理装置、画像処理方法 | |
JP6708061B2 (ja) | 画像処理装置、画像読取装置及び画像形成装置 | |
JP2005283874A (ja) | 画像形成装置 | |
JP2017157981A (ja) | 電子機器 | |
WO2018117057A1 (ja) | 画像読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18741840 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 18741840 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: JP |