JP7211166B2 - 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム - Google Patents

画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム Download PDF

Info

Publication number
JP7211166B2
JP7211166B2 JP2019038835A JP2019038835A JP7211166B2 JP 7211166 B2 JP7211166 B2 JP 7211166B2 JP 2019038835 A JP2019038835 A JP 2019038835A JP 2019038835 A JP2019038835 A JP 2019038835A JP 7211166 B2 JP7211166 B2 JP 7211166B2
Authority
JP
Japan
Prior art keywords
search
image
unit
straight line
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019038835A
Other languages
English (en)
Other versions
JP2020144460A (ja
Inventor
嶺雪 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019038835A priority Critical patent/JP7211166B2/ja
Priority to US16/801,862 priority patent/US10911636B2/en
Publication of JP2020144460A publication Critical patent/JP2020144460A/ja
Application granted granted Critical
Publication of JP7211166B2 publication Critical patent/JP7211166B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00816Determining the reading area, e.g. eliminating reading of margins
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00034Measuring, i.e. determining a quantity by comparison with a standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40093Modification of content of picture, e.g. retouching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像の傾き角度を検出する装置及びプログラムに関する。
スキャナー等の原稿読取装置に原稿を読み取らせる際、原稿の置き方が原因で原稿の内容が斜めに読み取られてしまう場合がある。斜めに読み取られた原稿画像を元に印刷を行うと印字品質が悪化するため、傾き角度を検出して原稿画像の向きを補正し、補正後の画像を用いて印刷することが望ましい。原稿画像の向きを補正するには原稿(コンテンツ)の範囲を正確に知る必要があり、そのためには原稿画像の傾き角度が必要となってくる。
特許文献1には、各文字の上端のエッジ画素の座標を入力として最小二乗法により回帰直線を求め、その直線の傾きを画像の傾き角度とする方法が記載されている。
特許文献2には、画像内の文字画素周辺を膨張させて文字色で塗りつぶしたような画像を作成し、その画像からエッジ抽出処理を行い、細線化処理をかけて、抽出された直線から原稿画像の傾きを推定する方法が記載されている。
特開2012-005062号公報 特開2014-230119号公報
しかし、特許文献1に記載の方法は、各文字の上端のエッジ情報を利用しているため、アルファベット等の高さの異なる文字を処理する場合は精度が落ちてしまう。また、推定手段に最小二乗法を利用しているため、文字が縦組で並んでいる場合に精度が落ちる。
更に、特許文献2に記載の方法は、膨張、細分化、エッジ抽出の順に処理を行い、抽出されたエッジから傾き角度を推定するが、この過程で抽出される情報は文字の最外部の画素のみであり、文字の形が推定精度に影響する。特にアルファベット等の高さの異なる文字の場合に精度が落ちてしまう。
本発明は、画像の傾き角度を正確に検出することを目的とする。
本発明の一局面に係る画像傾き角度検出装置は、原稿の画像を読み取る画像読取部と、前記画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、を備えたものである。
本発明の一局面に係る画像傾き角度検出プログラムは、コンピューターを、 画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、
前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、して機能させるものである。
本発明は、高い精度で画像の傾き角度を算出することができる。従って、本発明によれば、画像読取装置が傾いた原稿を読み取っても、当該原稿読取で取得した画像の傾き角度を求めて、画像補正を行うことにより、正しい向きの画像を得ることが可能になる。
画像傾き角度検出装置の内部構成を簡単に示したブロック図である。 画像傾き角度検出装置の具体的な機能構成を示すブロック図である。 画像傾き角度検出処理の流れを示したフローチャートである。 元の画像及び切出し画像を示す図である。 第一探索点を設定すべき複数の文字及び第一探索点を示す図である。 文字と第一探索円とが重なる位置に第一の印を付けた状態を示す図である。 第一探索枠において行間のある領域を示す図である。 行間領域において第二探索点を設定した状態を示す図である。 第二探索点を中心に第二探索円を設定した状態を示す図である。 文字と第二探索円とが重なる位置に第二の印を付けた状態を示す図である。 行間方向が設定される状態を示す図である。 クラスタリングされた各第二探索点を示す図である。 各クラスにおいて最も離れた第二探索点が選択される状態を示す図である。 近似直線算出部による主成分分析によって得られた直線を示す図である。 主成分分析によって得られた直線を切出画像に配置した状態を示す図である。 近似直線の真上及び真下に位置する複数の文字であって第二探索円と重なる各文字を示す図である。 第二探索円と重なる各文字を構成する全画素の座標を入力とする主成分分析により求められた直線を示す図である。 図17に示される直線についての情報を示す図である。 原稿を-4°~+4°の範囲で一度ずつ傾かせて画像読取装置に読み取らせたときの原稿画像を示した図である。 画像の傾き角度を求めた結果を示した図である。
<1.構成>
以下、本発明の一実施形態にかかる画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラムについて図面を参照して説明する。
図1は、本発明の実施の形態における画像傾き角度検出装置100の内部構成を簡単に示したブロック図である。画像傾き角度検出装置100は、汎用のコンピューター等で実現可能である。
図1に示すように、画像傾き角度検出装置100は、制御ユニット1と、画像傾き角度検出プログラム31やデータを記憶するための記憶部3と、外部装置とデータ通信を行うためのデータ入出力I/F(インターフェース)4と、画像読取部91とを備える。そして画像傾き角度検出装置100は、データ入出力I/F4を介して、画像形成部92と接続されている。なお、画像傾き角度検出装置100及び画像形成部92を備える装置は画像形成装置を構成する。
制御ユニット1は、プロセッサー、RAM(Random Access Memory)、及びROM(Read Only Memory)などから構成される。プロセッサーは、例えばCPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)、又はMPU(Micro Processing Unit)等である。制御ユニット1は、記憶部3に記憶される画像傾き角度検出プログラム31が上記のプロセッサーで実行されることにより、画像切出部11、第一探索点設定部12、第一探索枠作成部13、第一マーキング部14、行間領域検出部15、第二探索点設定部16、第二探索枠作成部17、第二マーキング部18、行間方向設定部19、クラスタリング部20、クラス長算出部21、近似直線算出部22、行方向算出部23及び傾き角度決定部24として機能する。尚、上記各部は、画像傾き角度検出プログラム31に基づく動作によらず、それぞれハード回路により構成されてもよい。
画像読取部91は、例えばスキャナー機構等であり、原稿から画像を読み取る。画像形成部92は、例えば電子写真方式の画像形成機構であり、画像読取部91が原稿読取により取得した画像に基づいて用紙に画像を印刷する。本実施形態では、画像形成部92は、画像読取部91が読み取った画像が傾いている場合、その傾き角度の情報を画像傾き角度検出装置100から取得し、制御ユニット1の処理により当該画像の傾きを補正して用紙に画像を印刷する。
図2は、画像傾き角度検出装置100の具体的な機能構成を示すブロック図である。上記画像切出部11~傾き角度決定部24は、以下に示す処理を行う。画像切出部11は、画像読取部91による原稿読取で取得された画像から予め定められたサイズの切出画像を切り出す。第一探索点設定部12は、画像切出部11が切り出した切出画像に含まれる複数の文字について、当該それぞれの文字上の一点に第一探索点を設定する。第一探索枠作成部13は、上記各第一探索点について、上記第一探索点を中心として半径の異なる複数の第一探索円を設定し、当該第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する。第一マーキング部14は、第一探索枠作成部13によって作成された各第一探索枠において、複数の第一探索円のそれぞれと切出画像に含まれる文字が交差する点に第一の印を付けてマーキングする。行間領域検出部15は、行間が存在する領域を検出する。
第二探索点設定部16は、上記各第一探索枠における行間領域検出部15が検出した領域であって、上記複数の第一探索円のいずれかの探索円上に第二探索点を設定する。第二探索枠作成部17は、上記第二探索点設定部16によって設定された各第二探索点について、上記各第一探索枠において、上記第二探索点を中心とし、半径の異なる第二探索円のグループを設定して、当該第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する。第二マーキング部18は、上記第二探索枠作成部によって作成された上記各第二探索枠において、上記複数の第二探索円と上記切出画像に含まれる文字が交差する点に第二の印をつけてマーキングする。行間方向設定部19は、第二マーキング部18による第二の印のマーキング結果を用いて行間方向を設定する。
クラスタリング部20は、各第二探索点の座標(位置)と、行間方向設定部19が設定した行間方向とを用いて、各第二探索点のクラスタリングを行う。近似直線算出部22は、クラスタリング部20が設定したクラス毎に行方向を示す近似直線を算出する。クラス長算出部21は、各クラスの長さを算出する。行方向算出部23は、当該算出された近似直線の上下に存在する文字のうち、第二探索円と交わっている文字を構成する全画素について主成分分析を行って直線を求める。傾き角度決定部24は、行方向算出部23によって求められた当該直線の傾き角度から、画像読取部91による原稿読取で得られた画像の原稿に対する傾き角度を決定する。
<2.処理の流れ>
次に、図面を用いて、画像傾き角度検出装置の処理動作について説明する。図3は、画像傾き角度検出処理の流れを示したフローチャートである。まず、画像切出部11が、画像読取部91による原稿読取で取得された画像から予め定められたサイズの画像を切り出す(ステップS1)。
図4は、ステップS1を説明するための図である。例えば、ユーザーが画像読取部91の原稿載置台に原稿を斜めにセットした場合、画像読取部91は傾いた原稿をそのまま読み込む。従って、原稿画像50に示すように、画像読取部91が読み取った画像は傾いたものとなる。
このため、画像切出部11は、上記取得された画像から、予め定められたサイズ(例えば、画像全体の4分の1の面積となる大きさ)の画像を切り出して、切出画像51として取得する。画像切出部11は、上記取得された画像から文字が多い領域(例えば画素密度が高い領域)を切出画像として採用することが望ましい。
そして、第一探索点設定部12が、切出画像51に含まれる文字の中から第一探索点を設定すべき複数の文字を選択し、その複数の文字の画素上に第一探索点を設定する(ステップS2)。
図5は、ステップS2を説明するための図である。第一探索点設定部12は、例えばOCR機能を用いて切出画像51から複数の文字を検出し、当該検出した複数の文字の中から、第一探索点を設定する文字を複数選択する。例えば、第一探索点設定部12は、第一探索点を設定する文字を均等に選択するために、切出画像51を予め定められた数の領域に分割し(図5の場合は9つに等分)、それぞれの区画から1つの文字を選択する。第一探索点設定部12は、このようにして選択した各文字上に第一探索点を設定する。図5では、1つの区画である区画Spの中においては、「よ」という文字上に第一探索点61が設定される例を示している。
次に、第一探索枠作成部13が、上記のようにして設定された各第一探索点に対して、第一探索点を中心として半径の異なる複数の第一探索円を設定する(ステップS3)。図5を用いて説明する。第一探索枠作成部13は、第一探索点61を中心に半径が異なる第一探索円621、622及び623(以下、まとめて「第一探索円62」という)を設定する。第一探索枠作成部13は、このように、各第一探索点について複数の第一探索円を設定することで、当該第一探索点及び当該複数の第一探索円からなる第一探索枠を、第一探索点毎に作成する。
例えば、最も小さい第一探索円623は、第一探索点61が置かれた文字(図5の領域Spの場合は「よ」)のフォントサイズの約1.4倍の直径とし、最も大きい第一探索円621は、第一探索点61が置かれた文字のフォントサイズの約3倍の直径とする。理由は、最も小さい第一探索円621は第一探索点61が置かれた文字(「よ」)と交差しないようにし、最も大きい第一探索円621は第一探索点61が置かれた文字(「よ」)の両隣(「い」、「う」)や行間を挟んだ位置にある文字(「ボ」)と交差させるためである。
次に、第一マーキング部14は、第一探索円621、622及び623の全てと文字が交差する点に第一の印を付けてマーキングする(ステップS4)。図6は、ステップS4を説明するための図である。以下、図面を見やすくするために、2つの第一探索枠6A,6Bについての第一探索点61Aと第一探索点61B、これらの点を中心とした第一探索円62Aと第一探索円62Bを取り上げて説明する。なお、実際には図5に示した全ての第一探索円について以下に説明する処理が行われる。
第一マーキング部14は、第一探索円62Aと重なり合う文字(「新」、「鮮」、「な」、「空」、「医」、「師」、「の」)との交点に第一の印63Aを付ける。更に、第一マーキング部14は、第一探索円62Bと重なり合う文字(「動」、「し」、「、(読点)」、「く」、「さ」)との交点に第一の印63Bを付ける。
次に、行間領域検出部15は、各第一探索枠における第一探索円それぞれについて、当該第一探索円の中心である第一探索点から見たときの第一の印がない範囲を扇形状に抽出し、当該範囲の中心角を求め、当該求められた中心角のうち、最も中心角の大きい範囲の方向を、行間のある領域として検出する(ステップS5)。
図7は、ステップS5を説明するための図である。行間領域検出部15は、第一探索枠6Aの場合、第一探索点61Aから見て、第一の印63Aがない範囲として、領域631A、632A及び633Aを抽出する。また、行間領域検出部15は、第一探索枠6Bの場合、領域631B、632B及び633Bを第一の印63Bのない範囲として抽出する。
そして、行間領域検出部15は、上記抽出した領域のうち、最も中心角の大きい領域を選択する。第一探索円62Aの場合、行間領域検出部15は領域632Aを選択する。また第一探索円62Bの場合、行間領域検出部15は領域632Bを選択する。
領域632A及び632Bは、行間のある領域を示すことになる。つまり、行間領域検出部15は、第一探索点が置かれた文字から見たときに行間があることになる行間領域を検出する。
次に、第二探索点設定部16は、各第一探索枠の上記行間領域において、第一探索円のグループの何れかの探索円上に第二探索点を設定する(ステップS6)。第二探索点設定部16は、設定した各第二探索点の位置(画像における座標)を記憶しておく。
図8は、ステップS6を説明するための図である。第二探索点設定部16は、上記各第一探索枠における、行間領域検出部15が検出した行間領域において、複数の第一探索円のいずれかの上に第二探索点を設定する。本実施の形態の場合は、第二探索点設定部16は、領域632A及び領域632Bの中心付近であって、二番目に直径が大きい探索円上に第二探索点65A及び65Bを設定する。
次に、第二探索枠作成部17が、上記のようにして設定された各第二探索点に対して、第二探索点を中心として半径の異なる複数の第二探索円を設定する(ステップS7)。図9には、第二探索枠作成部17が、第二探索点65A、65Bを中心に半径が異なる3つの第二探索円のグループ66A、66Bを設定する例を示している。各第二探索円の大きさは、図5で説明した第一探索円62と同様である。第二探索枠作成部17は、このように、各第二探索点について上記複数の第二探索円を設定することで、当該第二探索点及び当該複数の第二探索円からなる第二探索枠を、第二探索点毎に作成する。
次に、第二マーキング部18は、各第二探索枠について、全ての第二探索円と文字が交差する点に第二の印を付けてマーキングする(ステップS8)。図10は、ステップS8を説明するための図である。第二マーキング部18は、第二探索円66Aと重なり合う文字(「「医」、「師」、「の」、「の」、「中」、「を」)との交点に第二の印67Aを付ける。更に、第二マーキング部18は、第二探索円66Bと重なり合う文字(「く」、「だ」、「さ」、「プ」、「1」、「、(読点)」)との交点に第二の印67Bを付ける。
次に、行間方向設定部19が、上記のようにして作成された各第二探索枠において、第二探索円の中心である第二探索点から見たときの上記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と上記第二探索点とを通る直線の延びる方向を行間方向として設定する。例えば、行間方向設定部19は、図11に示すように、第二の印と、第二探索点を中心に第二の印を180°回転移動させたものとを重ね合わせる。そして、行間方向設定部19は、重ね合わせた印について、中心である第二探索点から見たときの第二の印がない範囲を扇形状に抽出し、抽出された範囲と第二探索点を結んだ直線を行間方向として設定する(ステップS9)。
図11は、ステップS9を説明するための図である。行間方向設定部19は、第二探索円66A上に付けられた第二の印67A(図11中の(1))を、第二探索点65Aを中心として180°回転移動させて、(2)に示す第二の印67Aを作成する。
そして、行間方向設定部19は、(1)と(2)に示した第二の印67Aを重ね合わせて、(3)に示す第二の印67Aを作成する。更に、行間方向設定部19は、(3)について第二探索点65Aから見たときに第二の印67Aがない範囲である領域R1及びR2を抽出する。行間方向設定部19は、この領域R1及びR2の中心部及び第二探索点65Aを通る直線Yが延びる方向を行間方向とする。なお、行間方向設定部19は、第二の印67Aがない領域が3つ以上ある場合、第二探索点65Aを通る直線を軸に線対称の位置にある領域を2つ選択し、選択された範囲が示す領域の中心部及び第二探索点65Aを通る直線が延びる方向を行間方向として設定する。
次に、クラスタリング部20が、各第二探索枠の第二探索点の位置と、行間方向設定部19が設定した行間方向とを用いて、上記各第二探索点に対してクラスタリングを行う(ステップS10)。例えば、クラスタリング部20は、第二探索点の位置が、第二探索点を通る上記直線に直交する方向において予め定められた一定範囲内にある、という基準を用いて、この基準を満たす複数の第二探索点を同一クラスとしてクラスタリングする。なお、クラスタリング部20は、第二探索点設定部16から各第二探索点の位置を取得する。
図12は、ステップS10を説明するための図である。図12に例を示すように、クラスタリング部20は、上記基準を用いて、第二探索点671Aと671BをクラスC1、第二探索点672A、672B及び672CをクラスC2、第二探索点673A、673B及び673CをクラスC3、という具合に、行間方向設定部19が設定した行間方向に基づいて、同じ行間にある第二探索点毎にクラスタリングする。
次に、クラス長算出部21が、クラスタリング部20が設定した各クラスにおいて、最も離れた第二探索点を二点選択し、その二点間の距離を算出してクラス長とする(ステップS11)。
図13は、ステップS11を説明するための図である。図13に示した図の場合、クラスC1のクラス長は矢印71、クラスC2のクラス長は矢印72、クラスC3のクラス長は矢印73の長さとなる。
次に、近似直線算出部22は、上記クラス毎に、第二探索点の座標を用いて主成分分析を行い、行間の方向に相当する近似直線を求める(ステップS12)。
図14及び図15は、ステップS12を説明するための図である。近似直線算出部22は、同じクラスの全ての第二探索点の座標を入力として主成分分析を行う。近似直線算出部22は、主成分分析として既知の分析手法を用いる。図14の直線L1は近似直線算出部22による主成分分析によって得られた直線であり、各第二探索点の座標に基づいて、直線L1を図15に示す切出画像51に配置したものが点線L1である。
次に、行方向算出部23が、ステップS12で求めた近似直線の真上に位置する複数の文字のうち、第二探索円と重なる各文字を構成する全画素の座標(位置)を入力として主成分分析を行う。これにより、近似直線の真上にある文字により構成される行の方向を示す直線を得る。更に、行方向算出部23は、ステップS12で求めた近似直線の真下に位置する複数の文字のうち、第二探索円と重なる各文字を構成する全画素の座標を入力として主成分分析を行う。これにより、近似直線の真下にある文字により構成される行の方向を示す直線を得る(ステップS13)。
図16は、ステップS13を説明するための図である。行方向算出部23は、近似直線L1の真上にある行R1に含まれる文字のうち、第二探索円81A、81B及び81Cと重なる文字(四角で囲まれた文字。「医」、「師」、「の」、「察」、「を」、「受」、「く」、「だ」、「さ」)を構成する全画素の座標について主成分分析を行う。これにより得られる直線が、図17に示す直線L101である。
更に、行方向算出部23は、近似直線L1の真下にある行R2に含まれる文字のうち、第二探索円81A、81B及び81Cと重なる文字(「の」、「中」、「を」、「す」、「ぎ」、「、(読点)」、「プ」、「1」、「、(読点)」)を構成する全画素の座標について主成分分析を行う。当該主成分分析によって得られる直線が、図17に示す直線L102である。図17において、直線L101は行R1の方向を示し、直線L102は、行R2の方向を示す。
次に、傾き角度決定部24が、ステップS13で求めた行の方向を示す直線の傾き、すなわち、画像読取部91による読取で得られた原稿画像50の縦2つの辺及び横2つの辺の各辺に対する、ステップS13で求めた行の方向を示す直線の傾きを算出し、当該傾きが最も小さくなる2つの辺のいずれかの辺に対する傾きに基づいて、画像読取部91が読み取った画像の原稿に対する傾き角度を決定する(ステップS14)。図18は、ステップS13で求められた各直線の情報を示した図である。
画像読取部91が読み取った画像の傾き角度の決定方法について詳しく説明する。
(1)まず、傾き角度決定部24は、ステップS13で求められた行の方向を示す直線の傾きを求め、各行についての直線の傾きの平均値を算出する。なお、傾き角度決定部24は、その平均値から予め定められた値以上差のある直線の傾きをデータから除外する。傾き角度決定部24は、期待値から大きく外れた傾きを除外することで、求められる上記画像の傾き角度の精度を高める。
(2)次に、傾き角度決定部24は、上記除外後の行の方向を示す直線の傾きについて、クラス長が長いクラスから求められた直線の傾きから順に予め定められた一定数を抽出する。クラス長が長いほど、行方向算出部23が求めた直線の傾きと実際の傾きとの誤差が小さいと考えられる。従って、クラス長の長いクラスから導き出された直線の傾きを考慮することで、求められる傾き角度の精度を高めることができる。
(3)最後に、傾き角度決定部24は、(2)で抽出された直線の傾きについて、当該直線が属するクラスのクラス長が長いほど重要度を高くして加重平均を算出し、その算出結果を、画像読取部91が読み取った画像の傾き角度とする。
<3.実験結果>
以上で説明した手法を用いて、実際に原稿を傾かせて読み取らせた後、画像読取部91が読み取った画像の傾き角度を算出した。図19は、原稿を-4°~+4°の範囲で一度ずつ傾かせて画像読取部91に読み取らせたときの原稿画像を示している。傾き角度は反時計方向を+、時計方向を-とする。
図20は、上記の手法を用いて、原稿画像から上記画像の傾き角度を求めた結果を示している。原稿として、英文の資料(英文1~3)と日本語の資料(和文1~3)の合計6種類を用いた。どの資料においても、実際の傾き角度と算出結果の誤差が-0.2°~+0.2°となっており、高い精度で上記画像の傾き角度を求められることが分かった。
そして、原稿に含まれる文字がアルファベットのような高さや幅にばらつきのある文字であっても、傾き角度を精度良く検出することができることが分かった。
また、画像読取部91に原稿を設置する際に、原稿の向きを90°回転させ、更に+4°程度傾けてセットして読み取らせた場合でも、十分な精度で上記画像の傾き角度を算出した。従って、原稿の向きに関係なく、傾き角度を正確に算出することができる。
<4.効果>
上記実施形態によれば、従来よりも高い精度で、画像読取部91が読み取った画像の傾き角度を求めることができる。そして、画像読取部91が傾いた原稿を読み取っても、取得した原稿画像から画像の傾き角度を求めて、画像補正を行うことにより、正しい向きの画像を得ることが可能である。更に、画像形成部92が用紙に印刷する際も正しい向きの画像を印刷することができる。
なお、本発明は上記実施の形態の構成に限られず種々の変形が可能である。また、図1乃至図20を用いて説明した上記実施形態の構成及び処理は、本発明の一例に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。
100 画像傾き角度検出装置
1 制御ユニット
3 記憶部
31 画像傾き角度検出プログラム
4 データ入出力I/F
91 画像読取装置
92 画像形成装置

Claims (12)

  1. 原稿の画像を読み取る画像読取部と、
    前記画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、
    前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、
    前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、
    前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、
    前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、
    前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、
    前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、
    前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、
    前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、
    前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、
    前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、
    前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、
    を備えた画像傾き角度検出装置。
  2. 前記画像から文字の多い領域を切り出して切出画像を取得する画像切出部を更に備え、
    前記第一探索点設定部は、前記切出画像を前記画像として前記第一探索点の設定を行う請求項1に記載の画像傾き角度検出装置。
  3. 前記第一探索点設定部は、前記画像を予め定められた数の領域に区切り、当該区切られた各領域において予め定められた数の文字を選択して、当該選択された文字上の一点を前記第一探索点とする請求項1又は請求項2に記載の画像傾き角度検出装置。
  4. 前記第一探索枠作成部は、最も小さい前記第一探索円の直径を当該第一探索円の中心とする第一探索点の周辺にある文字のサイズの約1.4倍とし、最も大きい前記第一探索円の直径を前記周辺にある文字のサイズの約3倍とする請求項1乃至請求項3のいずれかに記載の画像傾き角度検出装置。
  5. 前記行間方向設定部は、
    前記各第二探索枠において、前記複数の第二探索円のそれぞれについての前記第二の印と、当該第二の印を前記第二探索点を中心に180°回転移動させた第二の印とを重ね合わせ、当該重ね合わせた第二の印について、前記第二探索点から見たときに前記第二の印がない範囲を扇形状に抽出し、
    当該抽出した範囲のうち、前記第二探索点を通る直線を軸に線対称となる位置にある範囲を2つ選択し、当該選択された範囲の中心部と前記第二探索点とを通る直線が延びる方向を、行間方向として設定する請求項1乃至請求項4のいずれかに記載の画像傾き角度検出装置。
  6. 前記近似直線算出部は、同一の前記クラス内における前記各第二探索枠の前記第二探索点の座標を入力として主成分分析を行って前記近似直線を求める請求項1乃至請求項5のいずれかに記載の画像傾き角度検出装置。
  7. 前記行方向算出部は、前記近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の座標を入力として主成分分析を行って前記真上に位置する複数の文字により構成される行方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の座標を入力として主成分分析を行って前記真下に位置する複数の文字により構成される行方向を示す直線を求める請求項1乃至請求項6のいずれかに記載の画像傾き角度検出装置。
  8. 前記傾き角度決定部は、前記行方向算出部が算出した直線の傾きの平均値を算出し、当該平均値から予め定められた値以上差のある直線の傾きは除外して、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾きの傾き角度を決定する請求項1乃至請求項7のいずれかに記載の画像傾き角度検出装置。
  9. 同一の前記クラスについて、最も離れた二つの前記第二探索枠の前記第二探索点について当該第二探索点間の距離をクラス長として算出するクラス長算出部を更に備え、
    前記傾き角度決定部は、前記行方向算出部が算出した直線の傾きについて、前記クラス長が長いクラスから算出された当該直線の傾きから順に一定数を抽出し、当該抽出された傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する請求項1乃至請求項8のいずれかに記載の画像傾き角度検出装置。
  10. 前記傾き角度決定部は、前記抽出された直線の傾きについて、当該直線が属するクラスの前記クラス長が長いほど重要度を高くして加重平均を算出し、その算出結果を前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾きの傾き角度とする請求項9に記載の画像傾き角度検出装置。
  11. 請求項1乃至請求項10のいずれかに記載の画像傾き角度検出装置を備え、
    前記画像読取部によって読み取られた画像を用いて記録媒体に画像形成を行う画像形成装置。
  12. コンピューターを、
    画像読取部による原稿読取で得られた画像に含まれる複数の文字を検出し、当該それぞれの文字上の一点に第一探索点を設定する第一探索点設定部と、
    前記第一探索点設定部によって設定された各第一探索点について、第一探索点を中心として、半径の異なる複数の第一探索円を設定して、前記複数の第一探索円の中心である第一探索点及び当該複数の第一探索円からなる第一探索枠を作成する第一探索枠作成部と、
    前記第一探索枠作成部によって作成された各第一探索枠において、前記複数の第一探索円と前記画像に含まれる文字が交差する点に第一の印を付ける第一マーキング部と、
    前記各第一探索枠において、当該第一探索円の中心である第一探索点から見たときの前記第一の印がない範囲を扇形状に抽出し、最も中心角の大きい範囲の方向を、行間のある領域として検出する行間領域検出部と、
    前記各第一探索枠における前記行間領域検出部が検出した領域であって、前記複数の第一探索円のいずれかの探索円上に第二探索点を設定する第二探索点設定部と、
    前記第二探索点設定部によって設定された各第二探索点について、前記第二探索点を中心とし、半径の異なる複数の第二探索円を設定して、第二探索点及び当該複数の第二探索円からなる第二探索枠を作成する第二探索枠作成部と、
    前記第二探索枠作成部によって作成された前記各第二探索枠において、前記第二探索円と前記画像に含まれる文字が交差する点に第二の印を付ける第二マーキング部と、
    前記各第二探索枠において、前記複数の第二探索円の中心である第二探索点から見たときの前記第二の印がない範囲を扇形状に抽出し、当該範囲の中心部と前記第二探索点を通る直線の延びる方向を行間方向として設定する行間方向設定部と、
    前記行間方向設定部によって設定された行間方向に並ぶ前記各第二探索枠の前記第二探索点を同一クラスとするクラスタリングを行うクラスタリング部と、
    前記クラスタリング部により作成されたクラス毎に、クラス内の前記各第二探索枠の前記第二探索点を結ぶ近似直線を算出する近似直線算出部と、
    前記近似直線算出部により算出された近似直線毎に、近似直線の真上に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求め、更に前記近似直線の真下に位置する複数の文字のうち前記第二探索円と重なる文字の全画素の位置に基づいて、当該複数の文字により構成される行の方向を示す直線を求める行方向算出部と、
    前記行方向算出部によって算出された前記行の方向を示すそれぞれの直線の傾きから、前記画像読取部による原稿読取で得られた画像の前記原稿に対する傾き角度を決定する傾き角度決定部と、して機能させる画像傾き角度検出プログラム。
JP2019038835A 2019-03-04 2019-03-04 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム Active JP7211166B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019038835A JP7211166B2 (ja) 2019-03-04 2019-03-04 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム
US16/801,862 US10911636B2 (en) 2019-03-04 2020-02-26 Image inclination angle detection apparatus that detects inclination angle of image with respect to document, image forming apparatus, and computer-readable non-transitory recording medium storing image inclination angle detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019038835A JP7211166B2 (ja) 2019-03-04 2019-03-04 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム

Publications (2)

Publication Number Publication Date
JP2020144460A JP2020144460A (ja) 2020-09-10
JP7211166B2 true JP7211166B2 (ja) 2023-01-24

Family

ID=72335851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019038835A Active JP7211166B2 (ja) 2019-03-04 2019-03-04 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム

Country Status (2)

Country Link
US (1) US10911636B2 (ja)
JP (1) JP7211166B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421239A (zh) * 2021-06-23 2021-09-21 深圳中科飞测科技股份有限公司 识别方法、识别装置、半导体处理设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0512398A (ja) * 1990-12-28 1993-01-22 Mutoh Ind Ltd 画像編集方法および装置
US5517587A (en) * 1994-09-23 1996-05-14 International Business Machines Corporation Positioning method and apparatus for line scanned images
JP3471578B2 (ja) * 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JP5264831B2 (ja) 2010-06-21 2013-08-14 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP6108100B2 (ja) 2013-05-23 2017-04-05 大日本印刷株式会社 文書画像の傾き補正装置

Also Published As

Publication number Publication date
US10911636B2 (en) 2021-02-02
JP2020144460A (ja) 2020-09-10
US20200288040A1 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
EP1703444B1 (en) Detecting an orientation of characters in a document image
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
JP3576570B2 (ja) 比較方法
CN101425142B (zh) 页面倾斜角度的确定方法和装置
JP5616308B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
CN115457565A (zh) 一种ocr文字识别方法、电子设备及存储介质
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
JP4114959B2 (ja) 画像処理方法及び装置
JP7211166B2 (ja) 画像傾き角度検出装置、画像形成装置及び画像傾き角度検出プログラム
JPH11341259A (ja) 文書画像の傾き補正方法
US20130287300A1 (en) Defining a layout of text lines of cjk and non-cjk characters
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JP2000251082A (ja) 文書画像傾き検出装置
JP2013500527A (ja) 文書内の表の自動的な位置特定
JPH1173475A (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
US9110926B1 (en) Skew detection for vertical text
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JPH07225812A (ja) 自動テキスト特徴決定システム
JP3915974B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP2022088207A (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20220928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221226

R150 Certificate of patent or registration of utility model

Ref document number: 7211166

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150