JP2018097543A - 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム - Google Patents

画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム Download PDF

Info

Publication number
JP2018097543A
JP2018097543A JP2016240662A JP2016240662A JP2018097543A JP 2018097543 A JP2018097543 A JP 2018097543A JP 2016240662 A JP2016240662 A JP 2016240662A JP 2016240662 A JP2016240662 A JP 2016240662A JP 2018097543 A JP2018097543 A JP 2018097543A
Authority
JP
Japan
Prior art keywords
recognition
image
document
image reading
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016240662A
Other languages
English (en)
Other versions
JP6598080B2 (ja
Inventor
徹 道上
Toru Michigami
徹 道上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016240662A priority Critical patent/JP6598080B2/ja
Priority to US15/833,538 priority patent/US10482338B2/en
Publication of JP2018097543A publication Critical patent/JP2018097543A/ja
Application granted granted Critical
Publication of JP6598080B2 publication Critical patent/JP6598080B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】誤認識の可能性を想定して計算処理の低減と認識精度の向上の少なくとも一方を実現する。
【解決手段】画像読取装置は、複数の原稿の画像を読み取って画像データを生成する。画像読取装置は、生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理部と、原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、誤認識文字数が多いほど認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算部と、誤認識指数を使用して認識確度を調整する確度計算部と、調整された認識確度に基づいて原稿の方向を判別する方向判別部と、判別された原稿方向に基づいて画像データを補正して、複数の原稿の画像方向を揃える画像処理部とを備える。
【選択図】図1

Description

本発明は、画像読取装置、画像読取方法、画像形成装置及び画像読取プログラムに関し、特に、スキャンした原稿画像の方向を判別できる画像読取に関する。
複数の原稿を自動原稿送り装置(ADF)にセットし、連続してスキャンする場合に原稿の方向に乱丁があったときに、そのまま複写して自動的に製本処理すると大きな問題となる。このような問題に対して、たとえば特許文献1は、文書中の数種類の文字領域をそれぞれ0度、90度、180度、270度の方向から文字認識を行い、それら各方向における文字認識の自信度(読み取った文字と認識した文字の近似度)の中で一番自信度の高い方向を文書方向と判定する技術を提案している。一方、特許文献2は、画像の方向を判別する際の処理を効率化する技術を提案している。この技術は、具体的には、2ページ目以降の原稿の向きを判断する際は、前ページまでの原稿の向き、又は1ページ目から前ページまでで最も多かった原稿の向きに基づいて、1方向から文字認識を行い、文字認識の結果における近似値(各文字のベクトル情報と照らし合わせたベクトルの特徴の近さ)が閾値以上である場合には原稿の方向が一致していると判断する。ただし、近似値が閾値未満である場合には、他方向からも文字認識を行い、最も信頼の高い認識結果が得られた方向を原稿の向きと判断する。
特開平11−015224号公報 特開2007−065864号公報
しかし、従来は、原稿方向の判別において、文字認識の自信度や近似値のような文字認識における認識成功を想定し、誤った文字に認識され、誤認識状態で自信度や近似値が計算される可能性については十分に検討されていなかった。すなわち、本願発明者は、文字によっては回転した時に別の文字と認識され、かつ、どちらの場合も自信度の数値が変わらないということが起こり得るという問題を見いだした。たとえば、ひらがなの「く」を右に90度回転させたものと、ひらがなの「へ」のベクトル情報はほぼ同じものとなり、「く」を「く」と認識した場合と、「く」を90度回転させて「へ」と認識した場合で、自信度の数値が大きく変わらないということが起こり得る。これに対して、たとえば、ひらがなの「え」を、90度、180度、270度と回転させた時、別の文字として認識される可能性は低い。このように、「く」も「え」も自信度としては同程度の数値を持ちながら、誤認識の程度が大きく異なることが起こり得るのである。
本発明はこのような状況に鑑みてなされたものであり、誤認識の可能性を想定して計算処理の低減と認識精度の向上の少なくとも一方を実現する技術を提供することを目的とする。
本発明は、複数の原稿の画像を読み取って画像データを生成する画像読取装置を提供する。前記画像読取装置は、前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理部と、前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算部と、前記誤認識指数を使用して前記認識確度を調整する確度計算部と、前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別部と、前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理部とを備える。
本発明の画像形成装置は、前記画像読取装置と、前記複数の原稿の画像方向が揃えられた画像データに基づいて印刷媒体上に画像を形成する画像形成部とを備える。
本発明は、複数の原稿の画像を読み取って画像データを生成する画像読取方法を提供する。前記画像読取方法は、前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理工程と、前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算工程と、前記誤認識指数を使用して前記認識確度を調整する確度計算工程と、前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別工程と、前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理工程とを備える。
本発明は、複数の原稿の画像を読み取って画像データを生成する画像読取装置を制御するための画像読取プログラムを提供する。前記画像読取プログラムは、前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理部、前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算部、前記誤認識指数を使用して前記認識確度を調整する確度計算部、前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別部、及び前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理部として前記画像読取装置を機能させる。
本発明によれば、誤認識の可能性を想定して計算処理の低減と認識精度の向上の少なくとも一方を実現することができる。
本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。 一実施形態に係る原稿方向調整処理の内容を示すフローチャートである。 一実施形態に係る原稿方向判別処理の内容を示すフローチャートである。 一実施形態に係る特徴ベクトル情報取得処理の内容を示す説明図である。 一実施形態に係る誤認識指数データベース141の内容を示す表である。
以下、本発明を実施するための形態(以下、「実施形態」という)を、図面を参照して説明する。
図1は、本発明の一実施形態に係る画像形成装置100の機能構成を示すブロックダイアグラムである。画像形成装置100は、制御部110と、画像形成部120と、操作表示部130と、記憶部140と、自動原稿送り装置(ADF)160とを備えている。制御部110は、OCR処理部111(文字認識処理部とも呼ばれる。)と、確度計算部112と、誤認識指数計算部113と、方向判別部114とを備えている。画像形成部120は、原稿から画像を読み取って画像データを生成する画像読取部121と、画像処理部122とを備え、印刷媒体上に画像を形成する。
制御部110は、RAMやROM等の主記憶手段、及びMPU(Micro Processing Unit)やCPU(Central Processing Unit)等の制御手段を備えている。また、制御部110は、各種I/O、USB(ユニバーサル・シリアル・バス)、バス、その他ハードウェア等のインターフェースに関連するコントローラ機能を備え、画像形成装置100全体を制御する。
記憶部140は、非一時的な記録媒体であるハードディスクドライブやフラッシュメモリー等からなる記憶装置で、制御部110が実行する処理の制御プログラムやデータを記憶する。記憶部140は、さらに誤認識指数データベース141と、文字認識辞書142とを記憶している。文字認識辞書142は、原稿の方向を判別するために使用する文字認識辞書である。
図2は、一実施形態に係る原稿方向調整処理の内容を示すフローチャートである。原稿方向調整処理は、ADF160を使用して複数の原稿の画像を読み取る際に、原稿の乱丁があっても画像の方向を揃えて印刷媒体上に画像を形成する処理である。なお、原稿方向調整処理は、必ずしも印刷媒体上に画像を形成する場合に限られず、複数ページを有する画像データの生成にも利用可能である。
ステップS10では、ユーザーは、スキャン処理を実行する。スキャン処理では、ユーザーは、ADF160に複数の原稿をセットし、操作表示部130のスタートボタン(図示せず)を押す。
ステップS20では、OCR処理部111は、文字認識辞書142を使用して文字認識処理(OCR処理)を実行する。文字認識処理では、OCR処理部111は、原稿の方向が未知であるとして0度、90度、180度及び270度の4方向から文字認識処理を実行する。文字認識処理は、原稿の方向を特定するために行われる。文字の方向は、原稿の方向と一致するからである。
ステップS30では、制御部110は、原稿方向判別処理を実行する。原稿方向判別処理は、文字認識処理を使用して原稿方向の相対的な一致性を判別する処理である。本実施形態では、文字認識処理は、特徴ベクトルを使用して認識する方法を採用している。
図3は、一実施形態に係る原稿方向判別処理の内容を示すフローチャートである。ステップS31では、OCR処理部111は、特徴ベクトル情報取得処理を実行する。特徴ベクトル情報取得処理では、OCR処理部111は、認識対象である文字の各要素から特徴ベクトル情報を取得する。
図4は、一実施形態に係るベクトル情報取得処理の内容を示す説明図である。図4は、認識対象として、ひらがなの「い」の特徴ベクトル情報を取得する様子を示している。OCR処理部111は、連続している黒画素を文字として検出し、黒画素で構成されている一つの文字を含む領域を矩形で抽出する。この例では、OCR処理部111は、「い」の画像を含むM×N(例えば10×10)の画素ブロックT1を抽出する。
OCR処理部111は、画素ブロックT1において3×3画素のウインドウを使用して黒画素の分布方向を特徴ベクトル情報として検出する。この例では、OCR処理部111は、ウインドウT1aから主走査方向の特徴ベクトル情報を取得し、ウインドウT1bから副走査方向に少し傾斜している主走査方向の特徴ベクトル情報を取得することができる。OCR処理部111は、2つのウインドウT1a,T1bを含む64個のウインドウから特徴ベクトル情報を取得することができる。
ステップS32では、OCR処理部111は、文字特定処理を実行する。文字特定処理では、OCR処理部111は、取得した特徴ベクトル情報と、文字認識辞書142に格納されている各文字の特徴ベクトル情報とを比較して最も一致性が高い文字を認識された文字として特定する。この際の一致性は、認識の確かさを表す0乃至1.0の範囲を有する認識確度として確度計算部112によって定量化される。この例では、認識確度は0.8とする。
ステップS33では、確度計算部112は、誤認識調整処理を実行する。誤認識調整処理では、確度計算部112は、原稿の方向が文字認識で想定されている方向と相違することに起因する誤認識を想定して認識確度を調整する。
具体的には、たとえば「い」を含む画素ブロックT1が反時計回りに90度だけ傾いていた場合に、OCR処理部111が回転した「い」を画素ブロックT2として抽出した場合を仮定する。OCR処理部111は、2つのウインドウT2a,T2bを含む64個のウインドウから特徴ベクトル情報を取得することになる。
この場合、OCR処理部111は、画素ブロックT2が傾いていないとして仮定して文字認識を実行するので、画素ブロックT2から取得した特徴ベクトル情報が「こ」を含む画素ブロックT3であると誤認識して「こ」であると認識することが考えられる。たとえば2つのウインドウT2a,T2bから取得される特徴ベクトルがそれぞれ画素ブロックT3の2つのウインドウT3a,T3bの特徴ベクトルと近似すると判定され得るからである。
この場合、確度計算部112は、「い」と、反時計回りに90度だけ回転している「こ」の2ケースを想定し、誤認識調整処理として、0.8の認識確度を半分の0.5とする。「こ」の誤認識では、方向の判別で90度だけずれた原稿の方向として誤判定することになるからである。
図5は、一実施形態に係る誤認識指数データベース141の内容を示す表である。誤認識指数データベース141は、相違する複数の文字であって、文字を回転させたときに同じ文字であると誤認識される可能性がある文字をグループ化したデータベースである。誤認識指数データベース141は、フィールド(列)として「認識対象」、「誤認識指数」、「誤認識候補」及び「特定誤認識候補」を有している。誤認識指数は、誤認識指数データベース141を使用して誤認識指数計算部113によって計算される。
認識対象は、認識対象となる原稿上の文字の画像を意味している。誤認識候補は、認識対象を認識する際に誤って認識される可能性がある文字の候補である。特定誤認識候補は、誤認識候補のうち原稿の回転に起因して誤認識が発生する文字の候補である。特定誤認識候補は、誤認識に起因して原稿方向の誤判別の原因となる。一方、特定誤認識候補に該当しない誤認識候補は、誤認識が原稿方向の誤判別の原因とはならない。
本実施形態では、誤認識指数は、原稿の回転に起因する誤認識によって発生する原稿方向の誤判別の可能性の高さを表す指数である。この例では、誤認識指数は、原稿の回転に起因して誤認識される可能性がある文字候補(すなわち、特定誤認識候補)の数である誤認識文字数に基づいて設定される。誤認識指数は、誤認識文字数プラス1(すなわち、誤認識指数=誤認識文字数+1)として設定される。具体的には、レコード番号1の「あ」では、特定誤認識候補の数である誤認識文字数がゼロなので、誤認識指数は、1と算出される。一方、レコード番号2の「い」では、特定誤認識候補の数である誤認識文字数が1なので、誤認識指数は、2と算出される。
具体的には、レコード番号2の「い」には、誤認識候補として「こ」と「り」とがある。しかしながら、「い」を「り」と誤認識しても原稿方向の誤判別とはならないので、特定誤認識候補には、「こ」のみが含まれる。よって、たとえば「い」が0.8の認識確度で認識されても、原稿方向には、「い」の認識で判別される方向と「こ」の認識で判別される方向の2つの可能性がある。よって、誤認識指数は2と算出される。誤認識調整処理では、確度計算部112は、認識確度を誤認識指数で除することによって認識確度を0.4に調整する(すなわち、調整後認識確度=調整前認識確度÷誤認識指数)。
さらに、レコード番号1の「あ」には、誤認識候補として「お」がある。しかしながら、「お」と誤認識しても原稿方向の誤判別とはならないので、特定誤認識候補には、何も含まれていない。よって、たとえば「あ」が0.6の認識確度で認識される、「あ」と「お」のいずれで判定されても同一の方向が判別されることになる。よって、誤認識指数は、1と算出される。誤認識調整処理では、確度計算部112は、認識確度を0.6のままとする。
さらに、別の例として、認識確度がいずれも0.9の「く」と「え」を例にとって説明する。「く」は、誤認識指数が4なので認識確度が0.2に調整される。一方、「え」は、誤認識指数が1なので認識確度が0.9のままとなる。ただし、誤認識指数は、認識確度を調整する際に必ずしも反比例式としての利用に限定されず、たとえば非線形の変換カーブを使用して画像形成装置100の特性に応じて誤認識文字数が多いほど認識確度を小さくするように誤認識指数計算部113によって計算してもよい。
ステップS34では、方向判別部114は、認識確度集計処理を実行する。誤認識調整処理では、確度計算部112は、予め設定されている複数の文字の認識確度を集計する。ステップS35では、方向判別部114は、集計された認識確度が最も大きな方向を原稿の方向であると判別する。
ステップS40では、方向判別部114は、1つ前の原稿の方向との方向の一致性を比較する。方向判別部114は、一致している場合には、処理をステップS60に進め、一致していない場合には、処理をステップS50に進める。なお、最初の原稿の場合には、方向判別部114は、方向が一致しているものとみなして処理をステップS60に進める。
ステップS50では、画像処理部122は、画像回転処理を実行する。画像回転処理では、画像処理部122は、1つ前の原稿の方向(補正処理が行われた場合には補正後の方向)との一致するように画像データを補正して画像を回転させる。これにより、複数の原稿の画像データの画像方向が一方向に揃えられることになる。ステップS60では、方向判別部114は、回転処理後の原稿の方向を記憶する。方向判別部114は、記憶された原稿の方向を使用して次の原稿との方向の一致性を比較する。
ステップS70では、画像形成部120は、出力処理を実行する。出力処理では、画像形成部120は、回転処理後の画像データに基づいて印刷媒体上に画像を形成する。ステップS10乃至ステップS70の処理は、最終ページまで繰り返して実行される(ステップS80)。
このように、一実施形態に係る画像形成装置100は、原稿の回転に起因する誤認識によって発生する原稿方向の誤判別の可能性の高さを表す誤認識指数を使用して原稿の方向を判別することができる。これにより、原稿の回転に起因する誤認識の可能性を想定して計算処理の低減と認識精度の向上の少なくとも一方を実現することができる。
本発明は、上記実施形態だけでなく、以下のような変形例でも実施することができる。
変形例1:上記実施形態では、誤認識文字数は、原稿の回転に起因して誤認識される可能性がある文字候補(すなわち、特定誤認識候補)の数であるが、認識の確度のみに着目して原稿の回転の有無にかかわらず誤認識される可能性がある文字候補(すなわち、誤認識候補)の数としてもよい。
変形例2:上記実施形態では、誤認識指数は、特定誤認識候補の数である誤認識文字数のみに基づいて決定されているが、必ずしも誤認識文字数のみに基づいて決定する必要はない。誤認識指数は、たとえば原稿上における認識対象の文字の位置に基づいて決定しても良い。
具体的には、認識対象の文字が予め設定された特定の領域、たとえば各原稿のページ端より10mm以内の範囲に存在する場合には、誤認識指数を大きくするように画像形成装置を構成してもよい。本構成は、ページ番号や章タイトルなどが各ページの周辺端に書かれていて、かつ本文の文字方向と異なる場合があることを想定したものである。さらに、画像形成装置は、予め設定されている特定の範囲の文字の誤認識指数を極度に大きくして、その認識結果を無視できるように構成してもよい。
変形例3:上記実施形態では、誤認識指数は、特定誤認識候補の数の増加に応じて増加する1以上の数であるが、1未満の数であってもよい。具体的には、たとえばレコード番号2の「い」が所定の方向の認識処理で「い」と認識され、反時計回りに90度傾いた方向での認識処理で想定通りに「こ」と認識された場合には、所定の方向の認識処理における「い」の認識確度を高くするために誤認識指数を1未満の数とすることもできる。このように、誤認識指数は、原稿の回転に起因して予め想定されている誤認識をした場合には、認識確度が大きくなるように設定されていてもよい。
変形例4:上記実施形態では、0度、90度、180度及び270度の4方向から文字認識処理を実行し、認識確度が最も大きな方向を原稿の方向であると判別しているが、必ずしも4方向から文字認識処理を実行する必要はない。具体的には、たとえば原稿がA4サイズ等の長方形である場合には、0度及び180度の2方向から文字認識処理を実行すればよい。長方形の原稿では、90度や270度の方向にずれる乱丁が事実上は、発生しないとみなしてよいからである。このように、原稿の画像は、複数の方向のうち少なくとも1つから認識すればよい。
さらに、乱丁は、一部の原稿において発生することが多いので、たとえば特開2007−065864号公報に開示されている方法のように、前ページまでの原稿の向き、又は1ページ目から前ページまでで最も多かった原稿の向きに基づいて、1方向から文字認識を行い、文字認識の結果における認識確度が閾値以上であるか否かで原稿の方向が一致しているか否かを判別するようにしてもよい。
変形例5:上記実施形態では、自動原稿送り装置(ADF)160を使用して複数の原稿を読み取った場合を想定しているが、このような場合に限られず、原稿台に複数の原稿をユーザーの手で順々に裁置する場合にも本発明は適用可能である。これにより、画像形成装置は、ユーザーによる原稿の置き間違えが発生しても原稿画像の方向を揃えることができる。
変形例5:上記実施形態では、本発明は、画像形成装置に適用されているが、画像読取装置にも適用可能である。
100 画像形成装置
110 制御部
111 OCR処理部(文字認識処理部)
112 確度計算部
113 誤認識指数計算部
114 方向判別部
120 画像形成部
121 画像読取部
122 画像処理部
130 操作表示部
140 記憶部
141 誤認識指数データベース
142 文字認識辞書
160 自動原稿送り装置(ADF)

Claims (8)

  1. 複数の原稿の画像を読み取って画像データを生成する画像読取装置であって、
    前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理部と、
    前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算部と、
    前記誤認識指数を使用して前記認識確度を調整する確度計算部と、
    前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別部と、
    前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理部と、
    を備える画像読取装置。
  2. 請求項1記載の画像読取装置であって、
    前記誤認識文字数は、前記原稿の読み取り時の前記原稿の回転に起因して誤認識される可能性がある文字候補の数である画像読取装置。
  3. 請求項1又は2記載の画像読取装置であって、
    前記誤認識指数計算部は、前記認識の対象となる文字が前記原稿における予め設定された特定の領域に存在する場合には、前記認識確度が小さくなるように前記誤認識指数を調整する画像読取装置。
  4. 請求項1乃至3のいずれか1項に記載の画像読取装置であって、
    前記確度計算部は、前記認識確度を前記誤認識指数で除することによって前記調整を行う画像読取装置。
  5. 請求項1乃至4のいずれか1項に記載の画像読取装置であって、
    前記誤認識指数計算部は、前記認識の対象となる文字が前記原稿の回転に起因して予め想定されている誤認識をした場合には、前記認識確度が大きくなるように前記誤認識指数を調整する画像読取装置。
  6. 請求項1乃至5のいずれか1項に記載の画像読取装置と、
    前記複数の原稿の画像方向が揃えられた画像データに基づいて印刷媒体上に画像を形成する画像形成部と、
    を備える画像形成装置。
  7. 複数の原稿の画像を読み取って画像データを生成する画像読取方法であって、
    前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理工程と、
    前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算工程と、
    前記誤認識指数を使用して前記認識確度を調整する確度計算工程と、
    前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別工程と、
    前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理工程と、
    を備える画像読取方法。
  8. 複数の原稿の画像を読み取って画像データを生成する画像読取装置を制御するための画像読取プログラムであって、
    前記生成された画像データによって表されている文字を複数の方向のうち少なくとも1つから認識する文字認識処理部、
    前記原稿の読み取り時に誤認識される可能性がある文字候補の数である誤認識文字数に基づき、前記誤認識文字数が多いほど前記認識の確かさを表す認識確度を小さくするように設定された誤認識指数を計算する誤認識指数計算部、
    前記誤認識指数を使用して前記認識確度を調整する確度計算部、
    前記調整された認識確度に基づいて前記原稿の方向を判別する方向判別部、及び
    前記判別された原稿方向に基づいて前記画像データを補正して、前記複数の原稿の画像方向を揃える画像処理部として前記画像読取装置を機能させる画像読取プログラム。

JP2016240662A 2016-12-12 2016-12-12 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム Active JP6598080B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016240662A JP6598080B2 (ja) 2016-12-12 2016-12-12 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
US15/833,538 US10482338B2 (en) 2016-12-12 2017-12-06 Image reading apparatus that aligns directions of document images, image reading method, image forming apparatus, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016240662A JP6598080B2 (ja) 2016-12-12 2016-12-12 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム

Publications (2)

Publication Number Publication Date
JP2018097543A true JP2018097543A (ja) 2018-06-21
JP6598080B2 JP6598080B2 (ja) 2019-10-30

Family

ID=62490148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016240662A Active JP6598080B2 (ja) 2016-12-12 2016-12-12 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム

Country Status (2)

Country Link
US (1) US10482338B2 (ja)
JP (1) JP6598080B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768565A (zh) * 2020-05-21 2020-10-13 程功勋 一种增值税发票中发票代码识别后处理方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6592873B2 (ja) * 2016-09-28 2019-10-23 京セラドキュメントソリューションズ株式会社 画像読取装置、画像形成装置、画像読取方法及び画像読取プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338973A (ja) * 1998-05-22 1999-12-10 Fujitsu Ltd 文書画像補正装置および文書画像補正方法
JP2000113103A (ja) * 1998-09-30 2000-04-21 Ricoh Co Ltd 文書画像の方向判定方法、装置および記録媒体
JP2007065864A (ja) * 2005-08-30 2007-03-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、画像形成装置、画像形成方法、原稿読み取り装置、及び原稿読み取り方法
JP2013025801A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおけるキャラクタの向きを識別する方法および装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115224A (ja) 1997-06-24 1999-01-22 Canon Inc 複写装置
JP3425408B2 (ja) * 2000-05-31 2003-07-14 株式会社東芝 文書読取装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338973A (ja) * 1998-05-22 1999-12-10 Fujitsu Ltd 文書画像補正装置および文書画像補正方法
JP2000113103A (ja) * 1998-09-30 2000-04-21 Ricoh Co Ltd 文書画像の方向判定方法、装置および記録媒体
JP2007065864A (ja) * 2005-08-30 2007-03-15 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、画像形成装置、画像形成方法、原稿読み取り装置、及び原稿読み取り方法
JP2013025801A (ja) * 2011-07-20 2013-02-04 Fujitsu Ltd 画像ブロックにおけるキャラクタの向きを識別する方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768565A (zh) * 2020-05-21 2020-10-13 程功勋 一种增值税发票中发票代码识别后处理方法

Also Published As

Publication number Publication date
US20180165535A1 (en) 2018-06-14
JP6598080B2 (ja) 2019-10-30
US10482338B2 (en) 2019-11-19

Similar Documents

Publication Publication Date Title
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP4919028B2 (ja) 画像処理装置および画像処理プログラム
US20230267619A1 (en) Method and system of recognizing object edges and computer-readable storage medium
US20210012140A1 (en) Reading system, reading method, and storage medium
US7969631B2 (en) Image processing apparatus, image processing method and computer readable medium storing image processing program
US6771842B1 (en) Document image skew detection method
JP6598080B2 (ja) 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
US8208736B2 (en) Method and system for adaptive recognition of distorted text in computer images
US20070217710A1 (en) Image processing apparatus, image direction determining method, and computer program product
US8773733B2 (en) Image capture device for extracting textual information
WO2011112497A2 (en) Resolution adjustment of an image that includes text undergoing an ocr process
US9110926B1 (en) Skew detection for vertical text
JP6592873B2 (ja) 画像読取装置、画像形成装置、画像読取方法及び画像読取プログラム
US8908970B2 (en) Textual information extraction method using multiple images
JPH10307889A (ja) 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
WO2021221614A1 (en) Document orientation detection and correction
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
US20210097271A1 (en) Character recognition using previous recognition result of similar character
US20170213103A1 (en) Image retrieving device, image retrieving method, and recording medium
US11657632B2 (en) Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data
JP7192441B2 (ja) 情報処理装置、情報処理装置の画像回転方法、およびプログラム
JPH11203411A (ja) 文書読み取り装置
JP6635057B2 (ja) 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
US20220284690A1 (en) Reading system, reading method, and storage medium
US20220335738A1 (en) Image processing system, image processing method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190919

R150 Certificate of patent or registration of utility model

Ref document number: 6598080

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150