JP2020198085A - 画像処理装置、画像処理プログラム及び画像処理方法 - Google Patents
画像処理装置、画像処理プログラム及び画像処理方法 Download PDFInfo
- Publication number
- JP2020198085A JP2020198085A JP2020068434A JP2020068434A JP2020198085A JP 2020198085 A JP2020198085 A JP 2020198085A JP 2020068434 A JP2020068434 A JP 2020068434A JP 2020068434 A JP2020068434 A JP 2020068434A JP 2020198085 A JP2020198085 A JP 2020198085A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- inclination
- character strings
- character
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3877—Image rotation
- H04N1/3878—Skew detection or correction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00567—Handling of original or reproduction media, e.g. cutting, separating, stacking
- H04N1/00639—Binding, stapling, folding or perforating, e.g. punching
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
【課題】原稿を光学的に読み取って生成した読取画像を適切に処理する。【解決手段】画像処理装置は、読取画像に対する各複数の文字列の傾きをそれぞれ判断する文字列判断部と、複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、第1の文字列及び第2の文字列を判断し、第1の文字列を含み、第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、第2の文字列を含み、第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、原稿が折れていると判断する折れ判断部として動作する制御回路を具備する。【選択図】図3
Description
本開示は、画像読取部(イメージスキャナー)が、原稿を光学的に読み取って生成した読取画像を処理する画像処理装置に関する。
画像読取部(イメージスキャナー)は、原稿を光学的に読み取って読取画像を生成する。
原稿を光学的に読み取って生成した読取画像を適切に処理することが望ましい。
本開示の一形態に係る画像処理装置は、
画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として動作する制御回路
を具備する。
画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として動作する制御回路
を具備する。
本開示の一形態に係る画像処理プログラムは、
画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として画像処理装置の制御回路を動作させる。
画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として画像処理装置の制御回路を動作させる。
本開示の一形態に係る画像処理方法は、
画像取得部により、画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得し、
文字列判断部により、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断し、
折れ判断部により、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する。
画像取得部により、画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得し、
文字列判断部により、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断し、
折れ判断部により、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する。
本開示によれば、原稿を光学的に読み取って生成した読取画像を適切に処理することを図ることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
以下、図面を参照しながら、本開示の実施形態を説明する。
1.画像形成装置のハードウェア構成
図1は、画像形成装置のハードウェア構成を示す。
本実施形態では、画像処理装置として、画像読取部12(イメージスキャナー)を有する画像形成装置10(例えば、MFP、Multifunction Peripheral)を例に説明する。しかしながら、画像処理装置は、外部の画像形成装置(図示せず)が原稿を光学的に読み取って生成した読取画像を受信することが可能な情報処理装置(パーソナルコンピューター、タブレットコンピューター、スマートフォン等)(図示せず)でもよい。この場合、情報処理装置は、外部の画像形成装置と直接通信して読取画像を受信してもよい。あるいは、情報処理装置は、外部の画像形成装置がサーバー装置等(図示せず)にアップロードした読取画像をダウンロードしてもよい。
画像形成装置10は、制御回路100を備える。制御回路100は、プロセッサーであるCPU11a(Central Processing Unit)、RAM11b(Random Access Memory)、メモリーであるROM11c(Read Only Memory)及び専用のハードウェア回路等から構成され、画像形成装置10の全体的な動作制御を司る。CPU11aは、ROM11cが記憶する情報処理プログラム(画像処理プログラムを含む)をRAM11bにロードして実行する。ROM11cは、CPU11aが実行するプログラムやデータなどを固定的に記憶する。ROM11cは、非一過性のコンピューター読み取り可能な記録媒体の一例である。
制御回路100は、画像読取部12(イメージスキャナー)、画像処理部14(GPU(Graphics Processing Unit)を含む)、画像メモリー15、画像形成部16(プリンター)、表示部17aを備える操作部17(タッチパネル)、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量の不揮発性の記憶装置18、ファクシミリ通信部19及びネットワーク通信インターフェース13等と接続されている。制御回路100は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。表示部17aを操作部17(タッチパネル)は、入力装置の一形態であり、入力装置として、マイクロフォンを含む音声入力装置が設けられてもよい。
本実施形態では、画像読取部12(イメージスキャナー)は、原稿を光学的に読み取り、画像(読取画像と称する)を生成する。本実施形態では、画像読取部12が光学的に読み取る原稿は、複数の文字を含む。「文字」は、典型的には、ワードプロセッサーソフトを用いて生成したテキストデータを媒体(典型的には、紙)に印字した文字であり、手書きの文字を含まない。原稿は、複数の文字として、一方向(例えば、横方向)に並ぶ複数の文字を含む文字列であって、一方向に交差(典型的には、直交)する方向(例えば、縦方向)に連続する複数の文字列を含む。単に「原稿」は、本実施形態では、物理的な媒体(典型的には、紙)を意味する。
画像読取部12は、オートフィーダーによりフィードされた原稿又はユーザーがプラテン(図示せず)に載置した原稿を光学的に読み取る。
2.画像形成装置の機能的構成
図2は、画像形成装置の機能的構成を示す。
画像形成装置10の制御回路100において、CPU11aは、ROM11cが記憶する画像処理プログラムをRAM11bにロードして実行することにより、画像取得部101、手書き除去部102、文字列判断部103、折れ判断部104、及び折れ情報出力部105として動作する。
3.画像形成装置の動作フロー
図3は、画像形成装置の動作フローを示す。
画像取得部101は、画像読取部12が、原稿を光学的に読み取って生成した読取画像I1を取得する(ステップS101)。
図4は、読取画像の一例を示す。
図4の読取画像I1は、手書きの文字H1、H2を含む。
手書き除去部102は、公知の技術(エッジ検出等)により、読取画像I1から手書きの文字H1、H2を検出する。手書き除去部102は、手書きの文字H1、H2を検出した場合、読取画像I1から手書きの文字H1、H2を除去する(ステップS102)。なお、読取画像が手書きの文字を含まない(手書きの文字が検出されない)場合、手書き除去部102は、読取画像から手書きの文字を除去しない。
図5は、手書きの文字が除去された読取画像の一例を示す。
図5の読取画像I2は、読取画像I1(図4)から手書きの文字H1、H2を除去することにより得られたものである。
文字列判断部103は、手書きの文字H1、H2を除去した読取画像I2から、複数の文字列を検出する。「複数の文字列」は、一方向(例えば、横方向)に並ぶ複数の文字を含む文字列であって、一方向に交差(典型的には、直交)する方向(例えば、縦方向)に連続する複数の文字列である。
図6は、読取画像から検出された複数の文字列の一例を示す。
図6は、手書きの文字H1、H2が除去された読取画像I2(図5)の一部から検出された複数の文字列T1〜T7・・・を示す。
文字列判断部103は、読取画像I2に含まれる各複数の文字列T1〜T7・・・の傾きと長さを判断する。「文字列の長さ」は、文字列の上記一方向(例えば、横方向)の長さ、即ち、複数の文字が並ぶ方向の長さである。「文字列の傾き」は、任意の基準(例えば、読取画像の座標系)に対する、文字列の複数の文字が並ぶ上記一方向(例えば、横方向)の傾きである。文字列判断部103は、複数の文字列の傾きと長さを、文字列テーブル200として、例えばRAM11bに記録する(ステップS103)。
図7は、一例に係る文字列テーブルの一部を示す。
文字列テーブル200は、各文字列ごとに、文字列番号201、傾き202、長さ203、及び有効性204が記録される。なお、図7の文字列テーブル200に記録された各文字列は、読取画像I2に含まれる文字列T1〜T7・・・(図6)とは別の文字列である。文字列番号201は、各文字列を一意に識別するとともに、各文字列の連続する順序を識別する、シリアルナンバーである。傾き202は、例えば、読取画像の座標系の横方向を0°(基準)としたときの、−180°〜180°の角度である。長さ203は、例えば、文字列のピクセル幅である。有効性204の値は、文字列テーブル200の作成時点(ステップS103)では、ヌルである。
文字列判断部103は、文字列テーブル200に記録された全ての文字列(N個)について(ステップS104、S105、S109)、文字列の長さ203(一方向の長さ)が閾値(第3の閾値)以上であるか否かを判断する(ステップS106)。閾値は、例えば、50ピクセル幅である。文字列判断部103は、文字列の長さ203が閾値以上であると判断すると(ステップS106、Yes)、文字列テーブル200の有効性204として「Valid(有効)」を記録する(ステップS107)。一方、文字列判断部103は、文字列の長さ203が閾値未満であると判断すると(ステップS106、No)、文字列テーブル200の有効性204として「Invalid(無効)」を記録する(ステップS108)。「Valid(有効)」とは、文字列の長さ203が閾値以上である(文字列が比較的長い)ため、その文字列の傾き202が有効である、即ち、傾き202が正確である可能性が比較的高いことを意味する。一方、「Invalid(無効)」とは、文字列の長さ203が閾値未満である(文字列が短い)ため、その文字列の傾き202が不正確(誤検出)である可能性が比較的高いことを意味する。
図7の例では、文字列判断部103は、長さ203が閾値(50ピクセル幅)未満である文字列(文字列番号201=3により識別される文字列)の有効性204として「Invalid(無効)」を記録する(ステップS108)。一方、文字列判断部103は、長さ203が閾値(50ピクセル幅)以上である文字列(文字列番号201=1,2,4,5により識別される複数の文字列)の有効性204として「Valid(有効)」を記録する(ステップS107)。
折れ判断部104は、文字列テーブル200に有効性204として「Valid(有効)」が記録された全ての文字列の傾き202のヒストグラムを作成する(ステップS110)。具体的には、折れ判断部104は、各文字列の傾き(°)が含まれる区間(インターバル)を判断する。
図8は、ヒストグラムの一例を示す。
図8のヒストグラム300は、傾きの区間(インターバル)を1°とし、例として−90°〜90°の角度の範囲としたときの、複数の文字列の傾きの分布を示す。「傾きの区間を1°とする」とは、0°以上1°未満の傾きは、同一区間に含まれることを意味する。なお、傾きの区間は、1°以外の値でもよく、例えば、0.5°でもよい。なお、図8のヒストグラム300に含まれる各文字列は、文字列テーブル200に記録された文字列(図7)や、読取画像I2に含まれる文字列T1〜T7・・・(図6)とは別の文字列である。
折れ判断部104は、文字列の総数に対する、隣り合う所定数(例えば、5以下の任意の値)の区間に傾きが含まれる文字列の数の割合が、閾値(第4の閾値)(例えば、60%以上の任意の値)以上であるか否かを判断する(ステップS111)。「文字列の総数に対する、隣り合う所定数の区間に傾きが含まれる文字列の数の割合が、閾値以上である」とは(ステップS111、Yes)、読取画像に含まれる多数の文字列の傾きが略等しい、即ち、原稿が折れていない(あるいは、少なくとも文字列を含む部分は折れていない可能性が高い)ことを意味する(ステップS112)。一方、「文字列の総数に対する、隣り合う所定数の区間に傾きが含まれる文字列の数の割合が、閾値未満である」とは(ステップS111、No)、読取画像に含まれる多数の文字列の傾きにバラツキがある、即ち、原稿が折れている可能性があることを意味する。
図8の例では、文字列の総数(120)に対する、隣り合う所定数(2とする)の区間(−1°以上0°未満の区間、0°以上1°未満の区間)に傾きが含まれる文字列の数(71+41)の割合(93%)が、閾値(例えば、90%)以上である(ステップS111、Yes)。従って、折れ判断部104は、原稿が折れていない(あるいは、少なくとも文字列を含む部分は折れていない可能性が高い)と判断する(ステップS112)。
なお、隣り合う区間の数の値及び閾値の値は、任意であるが、典型的には、隣り合う区間の数を小さい値(例えば、1)とした場合には閾値を小さい値(例えば、60%)とする。逆に、典型的には、隣り合う区間の数を大きい値(例えば、3)とした場合には閾値(例えば、90%)を大きい値とする。
一方、文字列の総数に対する、隣り合う所定数の区間に傾きが含まれる文字列の数の割合が、閾値未満である場合(ステップS111、No)を説明する。この場合、折れ判断部104は、文字列テーブル200に記録された傾き202を参照し、各文字列の傾きが含まれる区間が異なる、2つの連続する(隣り合う)文字列のペア(M個)を検出する(ステップS113)。
図9は、一例に係る文字列テーブルの別の一部を示す。
図9の文字列テーブル200に記録された各文字列は、読取画像I2に含まれる文字列T1〜T7(図6)である。具体的には、文字列T1は、文字列番号201=32により識別される。文字列T2は、文字列番号201=33により識別される。文字列T3は、文字列番号201=34により識別される。文字列T4は、文字列番号201=35により識別される。文字列T5は、文字列番号201=36により識別される。文字列T6は、文字列番号201=37により識別される。文字列T7は、文字列番号201=38により識別される。
図9の例では、文字列T4(第1の文字列)の傾き202の値=0°が含まれる数値区間(第1の傾き区間)は、0°以上1°未満である(区間が1°の場合)。一方、文字列T5(第2の文字列)の傾き202の値=−2.5°が含まれる数値区間(第2の傾き区間)は、−3°以上−2°未満である(区間が1°の場合)。従って、文字列T4(第1の文字列)の傾き202の値=0°が含まれる数値区間(第1の傾き区間)と、文字列T5(第2の文字列)の傾き202の値=−2.5°が含まれる数値区間(第2の傾き区間)とは、異なる。従って、折れ判断部104は、各文字列の傾きが含まれる区間が異なる2つの連続する(隣り合う)文字列のペアとして、文字列番号201=35により識別される文字列T4(第1の文字列)と、文字列番号201=36により識別される文字列T5(第2の文字列)とを検出する(ステップS113)。
折れ判断部104は、第1の文字列を含み、第1の傾き区間に傾きが含まれる連続する複数の文字列(第1の群G1の文字列)の数を判断する。図9の例では、折れ判断部104は、第1の文字列(文字列番号201=35により識別される文字列T4)を含み、第1の傾き区間(0°以上1°未満)に傾きが含まれる連続する複数の文字列(第1の群G1の文字列)(文字列番号201=32,33,34,35により識別される文字列T1,T2,T3,T4)の数(4)を判断する。折れ判断部104は、第1の群G1の文字列の数(4)が、第1の閾値(例えば、3)以上であるか否かを判断する。
一方、折れ判断部104は、第2の文字列を含み、第2の傾き区間に傾きが含まれる連続する複数の文字列(第2の群G2の文字列)の数を判断する。図9の例では、折れ判断部104は、第2の文字列(文字列番号201=36により識別される文字列T5)を含み、第2の傾き区間(−3°以上−2°未満)に傾きが含まれる連続する複数の文字列(第2の群G2の文字列)(文字列番号201=36,37,38により識別される文字列T5,T6,T7)の数(3)を判断する。折れ判断部104は、第2の群G2の文字列の数(3)が、第2の閾値(例えば、3)以上であるか否かを判断する。
なお、第1の閾値と第2の閾値とは、同じでもよいし、異なってもよい。
本例の場合、折れ判断部104は、第1の群G1の文字列の数(4)が、第1の閾値(例えば、3)以上であると判断し、且つ、第2の群G2の文字列の数(3)が、第2の閾値(例えば、3)以上であると判断する(ステップS115、Yes)。この場合、折れ判断部104は、原稿が折れている(あるいは、少なくとも折れている可能性が高い)と判断する(ステップS116)。
ところで、全て(ステップS114、S117)の文字列のペア(M個)のうち、第1の群G1の文字列の数が第1の閾値以上であり、且つ、第2の群G2の文字列の数が第2の閾値以上である条件(ステップS115)を満たす文字列のペアが、1つも無いケースがある(ステップS118、No)。この場合、折れ判断部104は、原稿が折れていないか、あるいは、折れていたとしても可読性に影響が無いと判断する(ステップS112)。
原稿が折れている(あるいは、少なくとも折れている可能性が高い)場合(ステップS116)、折れ情報出力部105は、原稿が折れていること示す情報を出力(例えば、表示部17aに表示)する(ステップS119)。「原稿が折れていること示す情報」は、例えば、再スキャンをユーザーに提案するメッセージである。あるいは、読取画像I2を光学文字認識(OCR)した結果と、その結果を確認するようユーザーに提案するメッセージである。
なお、複数ページの原稿が有る場合、典型的には、折れ情報出力部105は、原稿が折れている(あるいは、少なくとも折れている可能性が高い)と判断すると、次ページの動作フロー(ステップS101以下)が開始する前に、原稿が折れていること示す情報を出力すればよい。
4.結語
(1)本実施形態によれば、折れ判断部104は、第1の文字列T4を含み、第1の傾き区間に傾き202が含まれる連続する複数の文字列T1〜T4である第1の群G1の文字列の数が、第1の閾値以上であると判断し、且つ、第2の文字列T5を含み、第2の傾き区間に傾き202が含まれる連続する複数の文字列T5〜T7である第2の群G2の文字列の数が、第2の閾値以上であると判断すると、原稿が折れていると判断する(ステップS115、Yes)。このように、折れ判断部104は、第1の傾き区間が共通する複数の文字列と、且つ、別の第2の傾き区間が共通する連続する複数の文字列とが連続するとき、原稿が折れていると判断するので、原稿が折れていることを高精度に判断することを図れる。
(2)本実施形態によれば、文字列判断部103は、各文字列の一方向の長さが第3の閾値未満の文字列(ステップS106、No)を無効と判断する(ステップS108)。これにより、文字列の長さ203が閾値未満である(文字列が短い)ため、その文字列の傾き202が不正確(誤検出)である可能性が比較的高い文字列が、傾きの判断対象から除外される。これにより、実際には原稿が折れていないにも拘らず、折れていると誤判断される可能性を低減することを図れる。
(3)本実施形態によれば、折れ判断部104は、複数の文字列の総数に対する、隣り合う所定数の区間に傾きが含まれる文字列の数の割合が、第4の閾値以上であると判断すると(ステップS111、Yes)、原稿が折れていないと判断する(ステップS112)。これにより、読取画像に含まれる多数の文字列の傾きが略等しい場合には原稿が折れていない(あるいは、少なくとも文字列を含む部分は折れていない可能性が高い)と判断されるので、原稿が折れていないことを高精度に判断することを図れる。
(4)本実施形態によれば、文字列判断部103は、手書きの文字H1、H2を除去した読取画像I2(ステップS102)から、複数の文字列を検出する(ステップS103)。手書きの文字は、印刷された文字列と傾きが異なる可能性がある。このため、手書きの文字H1、H2を含む読取画像I1から文字列(手書きの文字H1、H2を含む)を検出すると、手書きの文字H1、H2の傾きと印刷された文字列の傾きとが異なる結果、実際には原稿が折れていないにも拘らず、折れていると誤判断されるおそれがある。これに対して、本実施形態によれば、手書きの文字H1、H2を除去するので、実際には原稿が折れていないにも拘らず、折れていると誤判断される可能性を低減することを図れる。
(5)本実施形態によれば、折れ情報出力部107は、原稿が折れていること示す情報を出力する(ステップS119)。これにより、ユーザーは、原稿を再スキャンすることができる。あるいは、ユーザーは、読取画像I2を光学文字認識(OCR)した結果を目視で確認することができる。なお、複数ページの原稿が有る場合、折れ情報出力部105は、原稿が折れていると判断すると、次の原稿の動作フロー(ステップS101以下)が開始する前に、原稿が折れていること示す情報を出力すればよい。これにより、ユーザーは、原稿が折れているページがどこにあるのかを理解することができる。逆に言えば、ユーザーは、全ページの読取画像の中から、原稿が折れているページを事後的に探し出す必要が無いので、時間のロスが無い。
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
画像形成装置10
画像取得部101
手書き除去部102
文字列判断部103
折れ判断部104
折れ情報出力部105
画像取得部101
手書き除去部102
文字列判断部103
折れ判断部104
折れ情報出力部105
Claims (7)
- 画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として動作する制御回路
を具備する画像処理装置。 - 請求項1に記載の画像処理装置であって、
前記文字列判断部は、各前記文字列の前記一方向の長さが第3の閾値未満の文字列を無効と判断し、
前記折れ判断部は、前記無効と判断された文字列を、前記第1の文字列及び前記第2の文字列から除外する
画像処理装置。 - 請求項1又は2に記載の画像処理装置であって、
前記折れ判断部は、
前記複数の文字列の前記傾きが含まれる区間をそれぞれ判断し、
前記複数の文字列の総数に対する、隣り合う所定数の区間に傾きが含まれる文字列の数の割合が、第4の閾値以上であると判断すると、前記原稿が折れていないと判断する
画像処理装置。 - 請求項1乃至3の何れか一項に記載の画像処理装置であって、
前記制御回路は、前記読取画像から手書きの文字を除去する手書き除去部としてさらに動作し、
前記文字列判断部は、前記手書きの文字を除去した前記読取画像から、前記複数の文字列を検出する
画像処理装置。 - 請求項1乃至4の何れか一項に記載の画像処理装置であって、
前記制御回路は、前記折れ判断部が前記原稿が折れていると判断すると、前記原稿が折れていること示す情報を出力する折れ情報出力部としてさらに動作する
画像処理装置。 - 画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得する画像取得部と、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断する
文字列判断部と、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
折れ判断部
として画像処理装置の制御回路を動作させる
画像処理プログラム。 - 画像取得部により、画像読取部が、複数の文字を含む原稿を光学的に読み取って生成した読取画像を取得し、
文字列判断部により、
前記読取画像から、一方向に並ぶ複数の文字を含む文字列であって、前記一方向に交差する方向に連続する複数の文字列を検出し、
前記読取画像に対する各前記複数の文字列の傾きをそれぞれ判断し、
折れ判断部により、
前記複数の文字列に含まれる2つの連続する文字列のペアである第1の文字列及び第2の文字列であって、前記第1の文字列の傾きの値が含まれる数値区間である第1の傾き区間と、前記第2の文字列の傾きの値が含まれる数値区間である第2の傾き区間とが異なる、前記第1の文字列及び前記第2の文字列を判断し、
前記第1の文字列を含み、前記第1の傾き区間に傾きが含まれる連続する複数の文字列である第1の群の文字列の数が、第1の閾値以上であると判断し、且つ、前記第2の文字列を含み、前記第2の傾き区間に傾きが含まれる連続する複数の文字列である第2の群の文字列の数が、第2の閾値以上であると判断すると、前記原稿が折れていると判断する
画像処理方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/426,170 US10623603B1 (en) | 2019-05-30 | 2019-05-30 | Image processing apparatus, non-transitory computer readable recording medium that records an image processing program, and image processing method |
US16/426170 | 2019-05-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020198085A true JP2020198085A (ja) | 2020-12-10 |
Family
ID=70223590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020068434A Pending JP2020198085A (ja) | 2019-05-30 | 2020-04-06 | 画像処理装置、画像処理プログラム及び画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10623603B1 (ja) |
JP (1) | JP2020198085A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021175051A (ja) * | 2020-04-22 | 2021-11-01 | 富士フイルムビジネスイノベーション株式会社 | 折れ曲がり検出装置、画像処理装置及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6731795B1 (en) | 2000-05-31 | 2004-05-04 | International Business Machines Corporation | Method and apparatus for removing defects from digital images |
JP2005311766A (ja) * | 2004-04-22 | 2005-11-04 | Fuji Xerox Co Ltd | 画像読み取り装置 |
JP5263309B2 (ja) * | 2011-01-28 | 2013-08-14 | ブラザー工業株式会社 | 画像読取システムおよび画像読取装置 |
JP2014068243A (ja) | 2012-09-26 | 2014-04-17 | Canon Electronics Inc | 画像処理装置及びその制御方法、読取用シート |
JP6152821B2 (ja) | 2014-03-31 | 2017-06-28 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP6327176B2 (ja) | 2015-02-25 | 2018-05-23 | 京セラドキュメントソリューションズ株式会社 | 画像読み取り装置、および画像形成装置 |
JP2017028447A (ja) | 2015-07-21 | 2017-02-02 | キヤノン電子株式会社 | 画像処理装置、画像処理方法 |
-
2019
- 2019-05-30 US US16/426,170 patent/US10623603B1/en not_active Expired - Fee Related
-
2020
- 2020-04-06 JP JP2020068434A patent/JP2020198085A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US10623603B1 (en) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10574839B2 (en) | Image processing apparatus, method and storage medium for acquiring character information from scanned image | |
CN107979709A (zh) | 图像处理装置、系统、控制方法和计算机可读介质 | |
CN105320933A (zh) | 电子文档生成系统以及电子文档生成装置 | |
JP4869841B2 (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP4544315B2 (ja) | 紙文書処理装置及びプログラム | |
JP2020198085A (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP5583103B2 (ja) | 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム | |
US11153447B2 (en) | Image processing apparatus and non-transitory computer readable medium storing program | |
US10706337B2 (en) | Character recognition device, character recognition method, and recording medium | |
US20100104130A1 (en) | Document processing apparatus and document processing method | |
JP6887909B2 (ja) | 画像処理装置 | |
US11087448B2 (en) | Apparatus, method, and non-transitory recording medium for a document fold determination based on the change point block detection | |
JP6365894B2 (ja) | 画像読取装置 | |
US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
US20120063683A1 (en) | Image processing apparatus, image processing method, and computer-readable recording medium | |
US11316995B2 (en) | Bending detection device and image processing apparatus | |
JP2015159427A (ja) | 画像読取装置、画像読取装置の制御方法及び制御プログラム | |
JP6070302B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US10129430B2 (en) | Information processing apparatus and data arrangement method for creating an electronic watermark | |
JP7287097B2 (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP2011070327A (ja) | 画像属性判定装置、画像属性判定方法および画像属性判定プログラム | |
JP2016116129A (ja) | 画像処理装置およびその方法 | |
JP2021096800A (ja) | 画像処理装置及び画像処理プログラム | |
JP6573124B2 (ja) | 画像処理装置 | |
JP2007280344A (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム |