JP2018117255A - 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム - Google Patents

画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム Download PDF

Info

Publication number
JP2018117255A
JP2018117255A JP2017007118A JP2017007118A JP2018117255A JP 2018117255 A JP2018117255 A JP 2018117255A JP 2017007118 A JP2017007118 A JP 2017007118A JP 2017007118 A JP2017007118 A JP 2017007118A JP 2018117255 A JP2018117255 A JP 2018117255A
Authority
JP
Japan
Prior art keywords
image
character
region
area
numerous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017007118A
Other languages
English (en)
Other versions
JP6635057B2 (ja
Inventor
原田 隆史
Takashi Harada
隆史 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017007118A priority Critical patent/JP6635057B2/ja
Publication of JP2018117255A publication Critical patent/JP2018117255A/ja
Application granted granted Critical
Publication of JP6635057B2 publication Critical patent/JP6635057B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】原稿画像において複数の向きで表示されている各画像の方向を揃える。【解決手段】画像読取装置は、原稿の画像を読み取って画像データを生成する。画像読取装置は、画像データによって表されている文字を認識する文字認識処理部と、認識結果に基づいて認識された文字の角度を決定する画像方向判別部と、角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出部と、画像データを補正して、少なくとも1つの傾斜画像領域の方向のそれぞれが最多数文字領域の方向と一致するように、少なくとも1つの傾斜画像領域の方向を最多数文字領域の方向に揃える画像領域回転部を有する画像処理部とを備える。【選択図】図1

Description

本発明は、画像読取装置に関し、特に、スキャンした原稿画像の方向を修正できる画像読取に関する。
原稿の画像を読み取って、その画像の向きを画像処理により修正可能な画像読取装置が提案されている。具体的には、たとえば特許文献1は、原稿画像中の文字を認識し、認識結果に応じて原稿画像を回転させる技術を提案している。
特開平8−202887号公報
しかし、従来技術では、原稿画像の方向に着目し、原稿画像全体の方向を修正することが前提とされている。一方、原稿には、ブレーンストーミングその他の手法で複数のユーザーが様々な方向から一枚の原稿用紙に手書きで書きこんだものもある。このような原稿は、様々な方向の文字を含んでいるので、従来技術では、対処することができなかった。
本発明はこのような状況に鑑みてなされたものであり、原稿画像において複数の向きで表示されている各画像の方向を揃える技術を提供することを目的とする。
本発明は、原稿の画像を読み取って画像データを生成する画像読取装置を提供する。前記画像読取装置は、前記生成された画像データによって表されている文字を認識する文字認識処理部と、前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別部と、前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出部と、前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像領域回転部を有する画像処理部とを備える。
本発明は、原稿の画像を読み取って画像データを生成する画像読取方法を提供する。前記画像読取方法は、前記生成された画像データによって表されている文字を認識する文字認識処理工程と、前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別工程と、前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出工程と、前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像領域回転部を有する画像処理工程とを備える。
本発明は、印刷媒体上に画像を形成する画像形成装置を提供する。前記画像形成装置は、前記画像読取装置と、前記複数の原稿の画像方向が揃えられた画像データに基づいて印刷媒体上に画像を形成する画像形成部とを備える。
本発明は、複数の原稿の画像を読み取って画像データを生成する画像読取装置を制御するための画像読取プログラムを提供する。前記画像読取プログラムは、前記生成された画像データによって表されている文字を認識する文字認識処理部、前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別部、前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出部、及び前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像領域回転部を有する画像処理部として前記画像読取装置を機能させる。
本発明によれば、原稿画像において複数の向きで表示されている各画像の方向を揃えることができる。
本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。 一実施形態に係る画像領域整列処理の内容を示すフローチャートである。 一実施形態に係る画像領域整列処理の内容を示す説明図である。 一実施形態に係るグループ化処理の内容を示すフローチャートである。 一実施形態に係るグループ化処理の内容を示す説明図である。 一実施形態に係る傾斜画像領域回転処理及び画像位置調整処理の内容を示す説明図である。
以下、本発明を実施するための形態(以下、「実施形態」という)を、図面を参照して説明する。
図1は、本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。画像形成装置100は、制御部110と、画像形成部120と、操作表示部130と、記憶部140と、自動原稿送り装置(ADF)160とを備えている。制御部110は、OCR処理部111(文字認識処理部とも呼ばれる。)と、画像方向判別部112と、画像領域抽出部113とを備えている。画像形成部120は、原稿の画像を読み取って画像データを生成する画像読取部121と、画像処理部122とを備え、印刷媒体上に画像を形成する。画像処理部122は、画像領域回転部122aと画像領域調整部122bとを備えている。
制御部110は、RAMやROM等の主記憶手段、及びMPU(Micro Processing Unit)やCPU(Central Processing Unit)等の制御手段を備えている。また、制御部110は、各種I/O、USB(ユニバーサル・シリアル・バス)、バス、その他ハードウェア等のインターフェースに関連するコントローラ機能を備え、画像形成装置100全体を制御する。
記憶部140は、非一時的な記録媒体であるハードディスクドライブやフラッシュメモリー等からなる記憶装置で、制御部110が実行する処理の制御プログラムやデータを記憶する。記憶部140は、文字認識辞書141と、文字列辞書142とを記憶している。文字認識辞書141及び文字列辞書142は、サーバ(図示せず)に記憶してあってもよい。
文字認識辞書141は、文字画像の方向を推定するために使用される文字認識辞書であり、各文字の特徴ベクトル情報(テンプレートとも呼ばれる。)を格納している。ここで対応する文字には、ひらがな、カタカナ、漢字、数字及びアルファベットが含まれる。文字列辞書142は、1つ又は複数の文字から構成される単語としての文字列を格納している辞書である。
図2は、一実施形態に係る画像領域整列処理の内容を示すフローチャートである。図3は、一実施形態に係る画像領域整列処理の内容を示す説明図である。画像領域整列処理とは、原稿画像において複数の向きで表示されている各画像(この例では、画像領域)の方向を揃える処理である。画像領域整列処理とは、典型的には、ブレーンストーミングその他の手法で複数のユーザーが様々な方向から一枚の原稿用紙に手書きで書き込んだ原稿の読み取り処理において実行される。
ステップS10では、ユーザーは、操作表示部130を操作して作動モードを画像回転スキャンモードに設定する。ステップS20では、ユーザーは、スタートボタン(図示せず)を押し、画像読取部121を使用して原稿用紙をスキャンする。画像読取部121は、原稿用紙を読み取って画像データを生成する。
ステップS30では、画像方向判別部112は、OCR処理部111を使用して各文字の角度を検出する。OCR処理部111は、文字認識辞書141を使用して文字認識処理(OCR処理)を実行する。文字認識処理では、OCR処理部111は、画像データによって表されている各文字の角度が未知であるとして文字を認識する。
具体的には、OCR処理部111は、たとえば予め設定された角度毎(たとえば2度毎)の傾斜を想定して複数の認識方向毎に文字認識処理を実行する。画像方向判別部は、OCR処理部111による認識結果に基づいて、文字が認識されかつ認識確度が最も高い角度(認識方向)を各文字の角度として決定する。認識確度は、たとえば文字認識辞書141に格納されている各文字の特徴ベクトル情報と画像データから取得した特徴ベクトル情報の一致性を0乃至1.0の範囲を有する数値で表したものである。
ステップS40では、画像方向判別部112は、最多文字角度決定処理を実行する。最多文字角度決定処理では、画像方向判別部112は、略同一の角度を有する文字の数が最多数である角度を決定する。図3の原稿D1では、複数の文字から構成されている文字群T1を構成する文字の角度である180度(上下反転)が最多文字角度に決定される。
なお、この例では、文字群T1だけで最多文字角度が決定されているが、最多文字角度決定処理では、同一の角度を有する文字の数が複数の領域に存在するものであってもよい。また、略同一の角度許容範囲については、ユーザー設定可能とし、たとえば5度の誤差を許容範囲とすることができる。
ステップS50では、画像領域抽出部113は、グループ化処理を実行する。グループ化処理は、ユーザーによって一体として描かれたと想定される画像を1つのグループにまとめる処理である。
図4は、一実施形態に係るグループ化処理の内容を示すフローチャートである。ステップS51では、画像領域抽出部113は、近傍文字検出処理を実行する。近傍文字検出処理では、画像領域抽出部113は、略同一の角度を有し、予め設定された範囲内に存在する複数の文字を検出する。図3の原稿D1では、たとえば「原」と「因」の2つの文字から構成されている文字群T2が検出される。
図5は、一実施形態に係るグループ化処理の内容を示す説明図である。図5(a)は、文字群T2の処理の方法を示している。この例では、文字群T2を構成する「原」の文字の角度θ1と「因」の文字の角度θ2とが略同一である。略同一とは、ユーザー設定可能とし、予め設定されている誤差の範囲内(たとえば5度の誤差の範囲内)である。
ステップS52では、画像領域抽出部113は、位置関係判定処理を実行する。位置関係判定処理では、画像領域抽出部113は、文字群T2を構成する「原」と「因」の文字を基準とする上下方向の差δ1を使用して、両文字が略同一の位置に配置されていることを確認する。略同一とは、ユーザー設定可能とし、予め設定されている誤差の範囲内(たとえば文字の高さの5分の一)であることを意味する。なお、図3の原稿D1の文字群T3の例では、文字群T3を構成する「性」と「能」の文字を基準とする水平方向の差δ(図示略)を使用して、両文字が略同一の位置に配置されていることを確認することができる。
ステップS53では、画像領域抽出部113は、文字列判定処理を実行する。文字列判定処理では、画像領域抽出部113は、文字群T2を文字列候補である「原因」として結合し、「原因」の文字列について文字列辞書142を参照する。画像領域抽出部113は、文字列候補としての「原因」が文字列辞書142に登録されている場合には、文字群T2が文字列であると判断する。
ステップS54では、画像領域抽出部113は、文字群T2が文字列であると判断された場合には、処理をステップS55に進め、文字群T2が文字列でないと判断された場合には、「原」と「因」のそれぞれを含む2つの画像領域を各傾斜画像領域として決定し、処理をステップS56に進める。この例では、文字群T2が文字列であると判断されているので、処理がステップS55に進められる。
ステップS55では、画像領域抽出部113は、文字列グループ化処理を実行する。文字列グループ化処理では、画像領域抽出部113は、文字群T2を包含する領域(この例では楕円であるが、たとえば矩形等でもよい。)の画像領域を抽出する。この際、画像領域抽出部113は、文字列において、たとえば「原」と「因」の文字の各文字の角度をθ1とθ2の平均角度(あるいはいずれかの角度)とし、上下方向の差δをゼロとするように少なくとも一方の位置を調整することができる。
画像領域抽出部113は、「原因」の文字列の角度と最多文字角度の差を傾斜角度として算出する。これにより、画像領域抽出部113は、最多文字角度に対して算出された傾斜角度で傾斜している傾斜画像領域RS1(図3の原稿D2参照)を抽出することができる。
ステップS56では、画像領域抽出部113は、近傍画像検出処理を実行する。近傍画像検出処理では、画像領域抽出部113は、文字として認識されなかった非文字画像を関連画像として傾斜画像領域の一部に含めて抽出する。ただし、画像領域抽出部113は、非文字画像の角度が文字群T2と相違しないことを前提として抽出する。近傍とは、任意の方向において、予め設定されている距離の範囲内(たとえば1文字の大きさの範囲内)であることを意味している(ユーザー設定可能)。
文字群T2の例では、文字群T2の近傍に非文字画像G1が存在する。しかしながら、非文字画像G1には、方向記号S2が付され、これによって矢印としての方向記号S2によって示される方向が上方であるとして角度が定義されている。したがって、非文字画像G1の角度は、文字群T2の角度と相違していることになる。非文字画像G1は、方向記号S2によって定義される角度を使用して算出された傾斜角度で傾斜している傾斜画像領域RS2(図3の原稿D2参照)として抽出されることになる。
このように、本実施形態では、非文字画像の方向を意図的な指定が望まれる場合には、所定の色のカラーペンで非文字画像を囲む曲線S1を描いて傾斜画像領域RS2を特定し、その曲線S1と重なるように方向記号S2(矢印)を描くことで傾斜画像領域RS2の方向を指定することができる。
なお、非文字画像に曲線S1及び方向記号S2による方向の指定がなされておらず、非文字画像の近傍に関連する文字が検出されなかった場合には、操作表示部130に問い合わせメッセージを表示して、操作表示部130上でユーザーが非文字画像の方向を指定できるようにしてもよい。
ステップS57では、画像領域抽出部113は、非文字画像G1が関連画像であるか否かを判断する。画像領域抽出部113は、非文字画像G1が関連画像であると判断された場合には、処理をステップS58に進め、非文字画像G1が関連画像でないと判断された場合には、処理をステップS60(図2参照)に進める。この例では、非文字画像G1が関連画像でないと判断されているので、処理がステップS60に進められる。
一方、文字群T3の例では、2つの非文字画像G1、G2は、いずれも方向が定義されていないので、画像領域抽出部113は、2つの非文字画像G1、G2が文字群T3の関連画像であると判断する。さらに、画像領域抽出部113は、図3の原稿D1の文字群T4についても2つの非文字画像G1、G2が文字群T4の関連画像であると判断する。よって、画像領域抽出部113は、2つの文字群T3,T4と2つの非文字画像G1、G2とを含む画像領域を傾斜画像領域RS3として抽出することができる。
ステップS58では、画像領域抽出部113は、文字群T1を含む領域を最多数文字領域RS0として抽出するとともに、他の傾斜画像領域RS4,RS5を抽出する。このような処理により、画像領域抽出部113は、最多数文字領域RS0と、5つの傾斜画像領域RS1〜RS5を抽出する。
ステップS60では、画像領域回転部122aは、画像回転処理を実行する。画像回転処理では、画像領域回転部122aは、最多数文字領域RS0の角度が予め設定された基準方向に一致するように画像全体を回転させて図5(b)に示されている画像D3とする。
図6は、一実施形態に係る傾斜画像領域回転処理及び画像位置調整処理の内容を示す説明図である。図6は、傾斜画像領域回転処理が施された画像D4と、画像位置調整処理が施された画像D5とを示している。
ステップS70では、画像領域回転部122aは、傾斜画像領域回転処理を実行する。傾斜画像領域回転処理では、画像領域回転部122aは、画像データを補正することによって、5つの傾斜画像領域RS1〜RS5をそれぞれ回転させて、最多数文字領域RS0の方向と一致するように最多数文字領域RS0の方向に揃える。これにより、画像領域回転部122aは、図6に示されている画像D4を表す画像データを生成することができる。
ステップS80では、画像領域調整部122bは、配置位置調整処理を実行する。配置位置調整処理では、画像領域調整部122bは、回転後における最多数文字領域RS0及び5つの傾斜画像領域RS1〜RS5の各領域の相互間の干渉を検出する。画像D4の例では、傾斜画像領域RS3と傾斜画像領域RS5との間に干渉が発生している。傾斜画像領域RS5は、さらに予め設定されている画像範囲からも逸脱している。
画像領域調整部122bは、先ず、傾斜画像領域RS3と傾斜画像領域RS5とを縮小し、傾斜画像領域RS3と傾斜画像領域RS5との間の干渉の解消を試みる。画像領域調整部122bは、予め設定される縮小率(たとえば80%以上でユーザー設定可能)の範囲内で干渉の解消が可能である場合には、傾斜画像領域RS3と傾斜画像領域RS5の少なくとも一方を縮小する。この例では、画像領域調整部122bは、縮小する処理では、干渉を解消させることができないので傾斜画像領域RS3と傾斜画像領域RS5の少なくとも一方の位置の変更を試みる。
画像領域調整部122bは、傾斜画像領域RS3と傾斜画像領域RS5のいずれかが配置可能な空白領域を画像D4内に探索し、傾斜画像領域RS3の下側に傾斜画像領域RS5が配置可能な領域を検出する。画像領域調整部122bは、傾斜画像領域RS5を傾斜画像領域RS3の下側に移動させるとともに過度な密集が生じないように、5つの傾斜画像領域RS1〜RS5の位置関係を微調整する。
これにより、画像領域調整部122bは、相互間の領域の干渉を解消させて、各画像領域の配置バランスが図られた画像D5を表す画像データを生成することができる。画像データは、印刷媒体への画像形成やユーザーへの送信が可能である。なお、この際に、カラーペンで描かれた曲線S1及び方向記号S2は消去される。また、文字は、認識結果に基づいてフォントによって描かれる同等の大きさの文字画像に置き換えることもできる。さらに、画像領域調整部122bは、文字の大きさを揃えることもできる。
このように、一実施形態に係る画像形成装置100は、原稿画像において複数の向きで表示されている各画像の方向を揃えるとともに、フォントによって描かれる同等の大きさの文字画像に置き換えることができる。このように、画像形成装置100は、原稿を清書することなく、文字や画像の方向が揃った原稿に自動的に仕上げることができる。この結果、ブレーンストーミングその他の手法で複数のユーザーが様々な方向から一枚の原稿用紙に手書きで書き込むことを許容する一方、その結果を読みやすい原稿として自動的に仕上げることができる。
本発明は、上記実施形態だけでなく、以下のような変形例でも実施することができる。
変形例1:上記実施形態では、すべて自動で各画像領域の方向や位置が揃えられているが、必ずしもすべて自動で処理する必要はない。画像形成装置100は、たとえば操作表示部130に画像D5をプレビュー表示させて、操作表示部130上でユーザーが各画像領域の方向や位置を調整できるように構成されていてもよい。
具体的には、たとえば上述の例において、文字群T3の角度と文字群T4の角度が相違する場合には、非文字画像G1、G2を文字群T3と文字群T4のいずれの関連画像とするかをユーザーに問い合わせて確認するようにしてもよいし、あるいは文字群T3と文字群T4の近い方の関連画像とするようにしてもよい。
さらに、各画像領域の方向や位置は、ネットワークや近接無線通信で接続されているパーソナルコンピュータやタブレット、スマートフォンのディスプレイを使用して調整できるようにしてもよい。
変形例2:上記実施形態では、本発明は、画像形成装置に適用されているが、画像読取装置にも適用可能である。
100 画像形成装置
110 制御部
111 OCR処理部(文字認識処理部)
112 画像方向判別部
113 画像領域抽出部
120 画像形成部
121 画像読取部
122 画像処理部
122a 画像領域回転部
122b 画像領域調整部
130 操作表示部
140 記憶部
141 文字認識辞書
142 文字列辞書
160 自動原稿送り装置(ADF)

Claims (10)

  1. 原稿の画像を読み取って画像データを生成する画像読取装置であって、
    前記生成された画像データによって表されている文字を認識する文字認識処理部と、
    前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別部と、
    前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出部と、
    前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像領域回転部を有する画像処理部と、
    を備える画像読取装置。
  2. 請求項1記載の画像読取装置であって、
    前記画像方向判別部は、前記生成された画像データによって表されている文字を複数の認識方向から前記文字認識処理部に認識させて、前記複数の認識方向毎に前記文字の認識確度を算出し、前記認識確度が最も高い前記認識方向に基づいて前記文字の角度を決定する画像読取装置。
  3. 請求項1又は2に記載の画像読取装置であって、さらに、
    前記画像処理部は、前記最多数文字領域と、前記揃えられた傾斜画像領域との相互間の領域の干渉を検出し、前記干渉を解消させるように前記最多数文字領域と前記揃えられた傾斜画像領域の少なくとも1つを縮小させる画像領域調整部を有する画像読取装置。
  4. 請求項3記載の画像読取装置であって、
    前記画像領域調整部は、前記最多数文字領域と前記揃えられた傾斜画像領域を縮小するだけでは、前記干渉を解消させることができないと判断した場合には、前記干渉を解消させるように前記最多数文字領域と前記揃えられた傾斜画像領域の少なくとも1つを縮小しつつ又は縮小することなく移動させる画像読取装置。
  5. 請求項3又は4に記載の画像読取装置であって、
    前記画像領域調整部は、前記揃えられた傾斜画像領域が予め設定されている画像範囲から逸脱するか否かを判断し、前記逸脱を解消させるように前記最多数文字領域と前記揃えられた傾斜画像領域の少なくとも1つを縮小しつつ又は縮小することなく移動させる画像読取装置。
  6. 請求項1乃至5のいずれか1項に記載の画像読取装置であって、
    前記画像領域抽出部は、文字として認識されなかった非文字画像を、前記最多数文字領域と、前記少なくとも1つの傾斜画像領域とを含む画像領域のうち前記非文字画像に最も近い前記画像領域の一部に含めて抽出する画像読取装置。
  7. 請求項1乃至6のいずれか1項に記載の画像読取装置であって、
    前記画像領域抽出部は、前記予め設定された範囲内に存在する複数の文字が前記複数の文字を基準とする上下方向又は水平方向において略同一の位置に配置されている複数の文字を前記傾斜画像領域として抽出する画像読取装置。
  8. 請求項1乃至7のいずれか1項に記載の画像読取装置と、
    前記複数の原稿の画像方向が揃えられた画像データに基づいて印刷媒体上に画像を形成する画像形成部と、
    を備える画像形成装置。
  9. 原稿の画像を読み取って画像データを生成する画像読取方法であって、
    前記生成された画像データによって表されている文字を認識する文字認識処理工程と、
    前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別工程と、
    前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出工程と、
    前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像処理工程と、
    を備える画像読取方法。
  10. 原稿の画像を読み取って画像データを生成する画像読取装置を制御するための画像読取プログラムであって、
    前記生成された画像データによって表されている文字を認識する文字認識処理部、
    前記認識結果に基づいて前記認識された文字の角度を決定する画像方向判別部、
    前記角度が略同一の最多数の文字を含む少なくとも1つの最多数文字領域と、前記最多数文字領域に対して略同一の傾斜角度を有し、予め設定された範囲内に存在する複数の文字を含む少なくとも1つの傾斜画像領域を抽出する画像領域抽出部、及び
    前記画像データを補正して、前記少なくとも1つの傾斜画像領域の方向のそれぞれが前記最多数文字領域の方向と一致するように、前記少なくとも1つの傾斜画像領域の方向を前記最多数文字領域の方向に揃える画像領域回転部を有する画像処理部として前記画像読取装置を機能させる画像読取プログラム。

JP2017007118A 2017-01-18 2017-01-18 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム Active JP6635057B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017007118A JP6635057B2 (ja) 2017-01-18 2017-01-18 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017007118A JP6635057B2 (ja) 2017-01-18 2017-01-18 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム

Publications (2)

Publication Number Publication Date
JP2018117255A true JP2018117255A (ja) 2018-07-26
JP6635057B2 JP6635057B2 (ja) 2020-01-22

Family

ID=62984447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017007118A Active JP6635057B2 (ja) 2017-01-18 2017-01-18 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム

Country Status (1)

Country Link
JP (1) JP6635057B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021125213A (ja) * 2020-01-31 2021-08-30 株式会社Osk 情報処理装置,情報処理方法及び情報処理プログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341252A (ja) * 1998-05-22 1999-12-10 Canon Inc 画像形成装置、画像形成方法、記憶媒体
JP2001312697A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像方向判別方法及び装置
JP2005346586A (ja) * 2004-06-04 2005-12-15 Canon Inc 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2008022159A (ja) * 2006-07-11 2008-01-31 Canon Inc 文書処理装置及び文書処理方法
JP2013179426A (ja) * 2012-02-28 2013-09-09 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及びプログラム
JP2013214927A (ja) * 2012-04-04 2013-10-17 Nec Access Technica Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2014174959A (ja) * 2013-03-13 2014-09-22 Ricoh Co Ltd 画像処理装置、画像処理システムおよびプログラム
JP2016099793A (ja) * 2014-11-20 2016-05-30 シャープ株式会社 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341252A (ja) * 1998-05-22 1999-12-10 Canon Inc 画像形成装置、画像形成方法、記憶媒体
JP2001312697A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像方向判別方法及び装置
JP2005346586A (ja) * 2004-06-04 2005-12-15 Canon Inc 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2008022159A (ja) * 2006-07-11 2008-01-31 Canon Inc 文書処理装置及び文書処理方法
JP2013179426A (ja) * 2012-02-28 2013-09-09 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及びプログラム
JP2013214927A (ja) * 2012-04-04 2013-10-17 Nec Access Technica Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2014174959A (ja) * 2013-03-13 2014-09-22 Ricoh Co Ltd 画像処理装置、画像処理システムおよびプログラム
JP2016099793A (ja) * 2014-11-20 2016-05-30 シャープ株式会社 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021125213A (ja) * 2020-01-31 2021-08-30 株式会社Osk 情報処理装置,情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP6635057B2 (ja) 2020-01-22

Similar Documents

Publication Publication Date Title
US20190228220A1 (en) Apparatus, method, and storage medium for setting information related to scanned image
US10652409B2 (en) Apparatus for setting information relating to scanned image, method and storage medium
CN109845237B (zh) 图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质
JPH1139428A (ja) 文書映像の方向修正方法
US10503993B2 (en) Image processing apparatus
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
JP6635057B2 (ja) 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
US20210097271A1 (en) Character recognition using previous recognition result of similar character
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP6624120B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体
JP2009272962A (ja) 画像処理装置
JP6598080B2 (ja) 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
US10984285B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2017091419A (ja) 情報処理装置、画像読み取り装置及びプログラム
JPH0969136A (ja) 文書方向判定方法及び装置及び文字認識装置、及びコンピュータ制御装置
JP2007011528A (ja) Ocr処理における認識対象項目の位置探索方法
US11620840B2 (en) Image processing apparatus for extracting a desired character string from a scanned image
US20230063374A1 (en) Image processing apparatus, non-transitory storage medium, and image processing method
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
CN100578530C (zh) 图像处理设备和图像方向判定方法
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2022162474A (ja) 画像処理システム、画像処理方法、及びプログラム
JP2020155006A (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R150 Certificate of patent or registration of utility model

Ref document number: 6635057

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150