JP7211166B2 - 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム - Google Patents
画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム Download PDFInfo
- Publication number
- JP7211166B2 JP7211166B2 JP2019038835A JP2019038835A JP7211166B2 JP 7211166 B2 JP7211166 B2 JP 7211166B2 JP 2019038835 A JP2019038835 A JP 2019038835A JP 2019038835 A JP2019038835 A JP 2019038835A JP 7211166 B2 JP7211166 B2 JP 7211166B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- image
- unit
- straight line
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00816—Determining the reading area, e.g. eliminating reading of margins
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00034—Measuring, i.e. determining a quantity by comparison with a standard
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3877—Image rotation
- H04N1/3878—Skew detection or correction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40093—Modification of content of picture, e.g. retouching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、して機能させるものである。
以下、本発明の一実施形態にかかる画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラムについて図面を参照して説明する。
次に、図面を用いて、画像傾き角度検出装置の処理動作について説明する。図3は、画像傾き角度検出処理の流れを示したフローチャートである。まず、画像切出部11が、画像読取部91による原稿読取で取得された画像から予め定められたサイズの画像を切り出す(ステップS1)。
(1)まず、傾き角度決定部24は、ステップS13で求められた行の方向を示す直線の傾きを求め、各行についての直線の傾きの平均値を算出する。なお、傾き角度決定部24は、その平均値から予め定められた値以上差のある直線の傾きをデータから除外する。傾き角度決定部24は、期待値から大きく外れた傾きを除外することで、求められる上記画像の傾き角度の精度を高める。
<3.実験結果>
<4.効果>
1 制御ユニット
3 記憶部
31 画像傾き角度検出プログラム
4 データ入出力I/F
91 画像読取装置
92 画像形成装置
Claims (12)
- 原稿の画像を読み取る画像読取部と、
前記画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、
前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、
前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、
前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、
前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、
前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、
前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、
前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、
前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、
前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、
前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、
前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、
を備えた画像傾き角度検出装置。 - 前記画像から文字の多い領域を切り出して切出画像を取得する画像切出部を更に備え、
前記第一探索点設定部は、前記切出画像を前記画像として前記第一探索点の設定を行う請求項1に記載の画像傾き角度検出装置。 - 前記第一探索点設定部は、前記画像を予め定められた数の領域に区切り、当該区切られた各領域において予め定められた数の文字を選択して、当該選択された文字上の一点を前記第一探索点とする請求項1又は請求項2に記載の画像傾き角度検出装置。
- 前記第一探索枠作成部は、最も小さい前記第一探索円の直径を当該第一探索円の中心とする第一探索点の周辺にある文字のサイズの約1.4倍とし、最も大きい前記第一探索円の直径を前記周辺にある文字のサイズの約3倍とする請求項1乃至請求項3のいずれかに記載の画像傾き角度検出装置。
- 前記行間方向設定部は、
前記各第二探索枠において、前記複数の第二探索円のそれぞれについての前記第二の印と、当該第二の印を前記第二探索点を中心に180°回転移動させた第二の印とを重ね合わせ、当該重ね合わせた第二の印について、前記第二探索点から見たときに前記第二の印がない範囲を扇形状に抽出し、
当該抽出した範囲のうち、前記第二探索点を通る直線を軸に線対称となる位置にある範囲を2つ選択し、当該選択された範囲の中心部と前記第二探索点とを通る直線が延びる方向を、行間方向として設定する請求項1乃至請求項4のいずれかに記載の画像傾き角度検出装置。 - 前記近似直線算出部は、同一の前記クラス内における前記各第二探索枠の前記第二探索点の座標を入力として主成分分析を行って前記近似直線を求める請求項1乃至請求項5のいずれかに記載の画像傾き角度検出装置。
- 前記行方向算出部は、前記近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の座標を入力として主成分分析を行って前記真上に位置する複数の文字により構成される行方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の座標を入力として主成分分析を行って前記真下に位置する複数の文字により構成される行方向を示す直線を求める請求項1乃至請求項6のいずれかに記載の画像傾き角度検出装置。
- 前記傾き角度決定部は、前記行方向算出部が算出した直線の傾きの平均値を算出し、当該平均値から予め定められた値以上差のある直線の傾きは除外して、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾きの傾き角度を決定する請求項1乃至請求項7のいずれかに記載の画像傾き角度検出装置。
- 同一の前記クラスについて、最も離れた二つの前記第二探索枠の前記第二探索点について当該第二探索点間の距離をクラス長として算出するクラス長算出部を更に備え、
前記傾き角度決定部は、前記行方向算出部が算出した直線の傾きについて、前記クラス長が長いクラスから算出された当該直線の傾きから順に一定数を抽出し、当該抽出された傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する請求項1乃至請求項8のいずれかに記載の画像傾き角度検出装置。 - 前記傾き角度決定部は、前記抽出された直線の傾きについて、当該直線が属するクラスの前記クラス長が長いほど重要度を高くして加重平均を算出し、その算出結果を前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾きの傾き角度とする請求項9に記載の画像傾き角度検出装置。
- 請求項1乃至請求項10のいずれかに記載の画像傾き角度検出装置を備え、
前記画像読取部によって読み取られた画像を用いて記録媒体に画像形成を行う画像形成装置。 - コンピューターを、
画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、
前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、
前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、
前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、
前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、
前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、
前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、
前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、
前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、
前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、
前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、
前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、して機能させる画像傾き角度検出プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019038835A JP7211166B2 (ja) | 2019-03-04 | 2019-03-04 | 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム |
US16/801,862 US10911636B2 (en) | 2019-03-04 | 2020-02-26 | Image inclination angle detection apparatus that detects inclination angle of image with respect to document, image forming apparatus, and computer-readable non-transitory recording medium storing image inclination angle detection program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019038835A JP7211166B2 (ja) | 2019-03-04 | 2019-03-04 | 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020144460A JP2020144460A (ja) | 2020-09-10 |
JP7211166B2 true JP7211166B2 (ja) | 2023-01-24 |
Family
ID=72335851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019038835A Active JP7211166B2 (ja) | 2019-03-04 | 2019-03-04 | 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10911636B2 (ja) |
JP (1) | JP7211166B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421239A (zh) * | 2021-06-23 | 2021-09-21 | 深圳中科飞测科技股份有限公司 | 识别方法、识别装置、半导体处理设备及可读存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0512398A (ja) * | 1990-12-28 | 1993-01-22 | Mutoh Ind Ltd | 画像編集方法および装置 |
US5517587A (en) * | 1994-09-23 | 1996-05-14 | International Business Machines Corporation | Positioning method and apparatus for line scanned images |
JP3471578B2 (ja) * | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
JP5264831B2 (ja) | 2010-06-21 | 2013-08-14 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体 |
JP6108100B2 (ja) | 2013-05-23 | 2017-04-05 | 大日本印刷株式会社 | 文書画像の傾き補正装置 |
-
2019
- 2019-03-04 JP JP2019038835A patent/JP7211166B2/ja active Active
-
2020
- 2020-02-26 US US16/801,862 patent/US10911636B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10911636B2 (en) | 2021-02-02 |
JP2020144460A (ja) | 2020-09-10 |
US20200288040A1 (en) | 2020-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1703444B1 (en) | Detecting an orientation of characters in a document image | |
US7580571B2 (en) | Method and apparatus for detecting an orientation of characters in a document image | |
JP3576570B2 (ja) | 比較方法 | |
CN101425142B (zh) | 页面倾斜角度的确定方法和装置 | |
JP5616308B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法 | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
CN115457565A (zh) | 一种ocr文字识别方法、电子设备及存储介质 | |
JP6665595B2 (ja) | 文字認識装置、方法およびプログラム | |
JP4114959B2 (ja) | 画像処理方法及び装置 | |
JP7211166B2 (ja) | 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム | |
JPH11341259A (ja) | 文書画像の傾き補正方法 | |
US20130287300A1 (en) | Defining a layout of text lines of cjk and non-cjk characters | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
US8989485B2 (en) | Detecting a junction in a text line of CJK characters | |
JP2000251082A (ja) | 文書画像傾き検出装置 | |
JP2013500527A (ja) | 文書内の表の自動的な位置特定 | |
JPH1173475A (ja) | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 | |
US9110926B1 (en) | Skew detection for vertical text | |
JP4070486B2 (ja) | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム | |
JP4998176B2 (ja) | 翻訳装置及びプログラム | |
JP2000187705A (ja) | 文書読取装置および方法および記憶媒体 | |
JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
JPH07225812A (ja) | 自動テキスト特徴決定システム | |
JP3915974B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体 | |
JP2022088207A (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7211166 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |