JP2778437B2 - Document image tilt detection device - Google Patents

Document image tilt detection device

Info

Publication number
JP2778437B2
JP2778437B2 JP5329368A JP32936893A JP2778437B2 JP 2778437 B2 JP2778437 B2 JP 2778437B2 JP 5329368 A JP5329368 A JP 5329368A JP 32936893 A JP32936893 A JP 32936893A JP 2778437 B2 JP2778437 B2 JP 2778437B2
Authority
JP
Japan
Prior art keywords
character
line
character line
document image
inclination angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5329368A
Other languages
Japanese (ja)
Other versions
JPH07192085A (en
Inventor
昌昭 水野
健 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP5329368A priority Critical patent/JP2778437B2/en
Publication of JPH07192085A publication Critical patent/JPH07192085A/en
Application granted granted Critical
Publication of JP2778437B2 publication Critical patent/JP2778437B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書画像の傾きを検出
する装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus for detecting the inclination of a document image.

【0002】[0002]

【従来の技術】一般の印刷文書を読み取るためには、ま
ず、イメージスキャナなどの画像入力装置を用いて量子
化された文書画像として取り込む必要があるが、通常は
原稿設置の際に多少傾きが生じる。そのために、投影を
用いた文字行抽出手法では、文字行間隔の狭い文書など
で文字行の検出ができなくなるなどの問題が生じてお
り、入力された画像の傾きを検出する処理が必要とされ
ている。
2. Description of the Related Art In order to read a general printed document, first, it is necessary to capture it as a quantized document image using an image input device such as an image scanner. Occurs. Therefore, the character line extraction method using projection has a problem that character lines cannot be detected in a document having a narrow character line interval, and a process for detecting a tilt of an input image is required. ing.

【0003】従来このような文書画像では、その主要な
構成要素である文書領域では文字が規則正しく並んでい
ることを利用して傾き検出が行われる。
Conventionally, in such a document image, inclination detection is performed by utilizing the fact that characters are regularly arranged in a document area which is a main component thereof.

【0004】例えば、秋山らは「書式指定情報に依らな
い紙面構成要素抽出法」と題して電子情報通信学界論文
誌D,vol.J66−D,No.1,pp.111−
118に記載されているように、傾き角度θを順次変更
しながら、角度θ方向にヒストグラムを作成し、ヒスト
グラム上の山と谷が顕著に出現する角度θを傾き角度と
して求める第1の方式を提案されている。
For example, Akiyama et al., Entitled "Paper Constituent Element Extraction Method Not Depending on Format Designation Information", Transactions of the Society of Electronics, Information and Communication Engineers D, vol. J66-D, No. 1, pp. 111-
As described in 118, a first method has been proposed in which a histogram is created in the angle θ direction while sequentially changing the inclination angle θ, and the angle θ at which peaks and valleys on the histogram appear remarkably is determined as the inclination angle. ing.

【0005】また、中野らは「文書画像の傾き補正のた
めの一方式」と題して電子情報通信学界論文誌D,vo
l.J69−D,No.1,pp.1833−1834
に記載されているように、文字列の基準線がほぼ一定に
存在することに着目し、文字ブロックの下端座標値をハ
フ変換しハフ空間上でのピーク値を検出することによっ
て文字列の傾きを推定する第2の方式を提案している。
Also, Nakano et al., Entitled "One Method for Correcting the Inclination of Document Images", Transactions of the Society of Electronics, Information and Communication Engineers D, vo.
l. J69-D, no. 1, pp. 1833-1834
Focusing on the fact that the reference line of the character string is almost constant as described in, the Hough transform of the bottom coordinate value of the character block is performed, and the peak value in the Hough space is detected. Has been proposed.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記第
1の方式では、各々の画素に対してヒストグラムを計算
することが必要であり、処理時間の点で問題がある。ま
た、上記第2の方式では、すべての文字の下端が基準線
上に存在するとは限らないため、誤差が含まれることが
避けられない。またハフ変換処理はヒストグラムを計算
する処理と同等かそれ以上の処理手数を要する。
However, in the first method, it is necessary to calculate a histogram for each pixel, and there is a problem in processing time. Further, in the second method, since the lower ends of all characters do not always exist on the reference line, it is inevitable that an error is included. Further, the Hough transform processing requires the same number of processing steps as or more than the processing for calculating the histogram.

【0007】本発明の目的は、これらの課題を解決する
ために、精度を落とさないで処理手数が少なくてすむ傾
き検出装置を提案するものである。
[0007] An object of the present invention is to propose an inclination detecting apparatus which can reduce the number of processing steps without lowering the accuracy in order to solve these problems.

【0008】[0008]

【課題を解決するための手段】本発明は、上記の課題を
解決するために、文書を光学的に走査し、文書画像デー
タを得る画像入力手段と、前記画像入力手段によって入
力された文書画像データを参照し画素の連結成分を検出
する連結成分抽出手段と、前記連結成分抽出手段によっ
て抽出された画素の連結成分のうち、文字を構成する連
結成分を抽出する、文字成分抽出手段と、前記文字成分
抽出手段によって抽出された連結成分のうち、近接する
連結成分同士を統合し仮の文字行として出力する、文字
行推定手段と、前記文字行推定手段によって推定された
仮の文字行に対して、水平方向に対し所定の角度を成す
第1の直線、前記第1の直線と水平方向に関し線対称と
なる第2の直線、垂直方向に対し前記所定の角度を成す
第3の直線、前記第3の直線と垂直方向に関し線対称と
なる第4の直線のそれぞれに接する最も外側の輪郭点
を、少なくとも角点として検出する、角点検出手段と
前記角点検出手段によって検出された角点の位置関係か
ら、前記仮の文字行の傾きを算出する、文字行傾き角度
算出手段と、前記文字行推定手段から得られた各々の仮
の文字行から、前記文字行傾き角度算出手段によって得
られた傾き角度を参照し、前記文書画像データの傾き角
度を求める、文書画像傾き角度検出手段と、を具備す
る。
According to the present invention, there is provided an image input means for optically scanning a document to obtain document image data, and a document image input by the image input means. A connected component extracting unit that refers to data to detect a connected component of a pixel, and among the connected components of the pixel extracted by the connected component extracting unit, extracts a connected component forming a character; a character component extracting unit; Among the connected components extracted by the character component extraction unit, adjacent connected components are integrated and output as a provisional character line, a character line estimation unit, and a provisional character line estimated by the character line estimation unit. At a predetermined angle to the horizontal direction
A first straight line, which is symmetric with respect to the first straight line with respect to a horizontal direction;
Forms a predetermined angle with respect to a second straight line, a vertical direction.
A third straight line, which is symmetric with respect to the third straight line with respect to a vertical direction;
Outermost contour points tangent to each of the fourth straight lines
Is detected at least as a corner point, a corner point detection means ,
A character line tilt angle calculation unit that calculates the inclination of the temporary character line from the positional relationship of the corner points detected by the corner point detection unit; and each temporary character line obtained from the character line estimation unit. And a document image tilt angle detecting means for determining the tilt angle of the document image data by referring to the tilt angle obtained by the character line tilt angle calculating means.

【0009】[0009]

【作用】本発明においては、個々の文字から得られる座
標値を用いるという処理を行わない。まず図1(a)に
示すように、個々の文字を構成する連結画素成分を抽出
する。次に図1(b)に示すように、位置が近接するな
どの条件により同一行を構成すると判断される連結画素
成分を統合し、統合した文字によって得られる文字行の
包絡線を考える。包絡線の角座標を求めるために、図1
(c)に示すように統合された文字行の輪郭における角
点の座標を本願発明で提案する手法で抽出し、この角点
の位置関係から図1(d)に示すように文字行の傾き角
度を推定する。この処理方式を用いることにより、従来
と比べてより少ない手数で傾き角度検出処理を行うこと
ができる。
In the present invention, the processing of using coordinate values obtained from individual characters is not performed. First, as shown in FIG. 1A, connected pixel components constituting individual characters are extracted. Next, as shown in FIG. 1B, the connected pixel components determined to form the same line under conditions such as proximity to each other are integrated, and an envelope of a character line obtained by the integrated character is considered. In order to obtain the angular coordinates of the envelope, FIG.
As shown in FIG. 1C, the coordinates of the corner points in the contour of the integrated character line are extracted by the method proposed in the present invention, and the inclination of the character line is extracted from the positional relationship of the corner points as shown in FIG. Estimate the angle. By using this processing method, it is possible to perform the inclination angle detection processing with a smaller number of steps than in the conventional case.

【0010】[0010]

【実施例】以下に本願発明の実施例を図面を参照しなが
ら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0011】図3は、本発明の実現する装置における処
理の概略を示したものである。
FIG. 3 shows an outline of the processing in the apparatus realized by the present invention.

【0012】図3において、1は画像入力手段であり、
光学的その他の手段により文書画像を読み込むものであ
る。あるいはあらかじめ磁気的その他の形態にて記録媒
体に電子化されて記憶されている画像を読み込む処理も
含む。
In FIG. 3, reference numeral 1 denotes an image input means;
A document image is read by optical or other means. Alternatively, it also includes a process of reading an image stored in advance in a recording medium in a magnetic or other form in a magnetic or other form.

【0013】2は連結成分抽出手段であり、前記画像入
力手段1によって入力された文書画像データを参照し黒
画素の連結成分を検出する。具体的な処理手法として
は、ラベリングを用いる手法や輪郭追跡処理を用いる手
法などの公知の手法を挙げることができる。
Reference numeral 2 denotes a connected component extracting means for detecting a connected component of a black pixel with reference to the document image data input by the image input means 1. As a specific processing method, a known method such as a method using labeling or a method using contour tracking processing can be used.

【0014】3は文字成分抽出手段であり、前記連結成
分抽出手段2によって求められた黒画素の連結成分のう
ち、文字を構成すると判断される連結成分を選択する。
選択基準としては、連結成分の大きさ、連結成分の外接
矩形の面積に対する黒画素数(すなわち黒画素の密
度)、その他のテクスチャ特徴を用いることができる。
例えば、連結成分の大きさが所定の範囲内にある場合
に、該連結成分は文字であるなどと判断することができ
る。
Reference numeral 3 denotes a character component extracting means for selecting a connected component determined to constitute a character from the connected components of black pixels obtained by the connected component extracting means 2.
As the selection criterion, the size of the connected component, the number of black pixels with respect to the area of the circumscribed rectangle of the connected component (that is, the density of black pixels), and other texture characteristics can be used.
For example, when the size of the connected component is within a predetermined range, it can be determined that the connected component is a character.

【0015】4は文字行推定手段であり、前記文字成分
抽出手段3によって抽出された文字を構成する連結成分
から、位置的に近接する、大きさが似通っている、など
の理由により同一行を構成すると思われる文字要素を統
合し仮の文字行を推定する。
Numeral 4 denotes a character line estimating means for extracting the same line from the connected components constituting the character extracted by the character component extracting means 3 due to reasons such as being close in position or similar in size. The character elements considered to be composed are integrated to estimate a provisional character line.

【0016】5は角点検出手段であり、前記文字行推定
手段4によって得られた仮の文字行を構成する連結黒画
素成分の角点を検出する手段であり、本発明のポイント
である。
Reference numeral 5 denotes a corner point detecting means for detecting the corner points of the connected black pixel components constituting the provisional character line obtained by the character line estimating means 4, which is a point of the present invention.

【0017】6は文字行傾き角度算出手段であり、前記
角点検出手段5によって得られた角点の座標の位置関係
から、前記仮の文字行の傾き角度を算出するものであ
る。
Reference numeral 6 denotes a character line inclination angle calculating means for calculating the tentative character line inclination angle from the positional relationship of the coordinates of the corner points obtained by the corner point detecting means 5.

【0018】7は文書画像傾き角度検出手段であり、各
々の前記仮の文字行の傾き角度の算出値から最も適切で
あると思われる値を、文書画像の傾き角度として出力す
るものである。
Reference numeral 7 denotes a document image inclination angle detecting means for outputting a value considered most appropriate from the calculated values of the inclination angles of the respective temporary character lines as the inclination angle of the document image.

【0019】以下それぞれの手段について詳しく説明す
る。
Hereinafter, each means will be described in detail.

【0020】画像入力手段1は、光学的画像取り込み装
置、その他の画像取り込み装置を用いて文書画像を2値
(ビットイメージ)形式で取り込む。磁気的その他の記
録方式によって記録を行う画像格納装置から読み込む処
理も含む。
The image input means 1 captures a document image in a binary (bit image) format using an optical image capture device or another image capture device. It also includes a process of reading from an image storage device that performs recording using a magnetic or other recording method.

【0021】連結成分抽出手段2は、前記画像入力手段
1によって入力された文書画像データを参照し連結する
黒画素の抽出を行う。連結性の判定方法は近傍4方向へ
の連結性や8方向への連結性などの公知の定義を用いる
ことが出来る。この連結性の定義に基づいて、連結する
画素の抽出を行う。連結画素の抽出には、一般の画像処
理において用いられるラベリング処理や輪郭追跡処理な
どの公知の技術を用いて行うことが可能である。
The connected component extracting means 2 refers to the document image data input by the image input means 1 and extracts black pixels to be connected. As a method of determining connectivity, a known definition such as connectivity in four nearby directions or connectivity in eight directions can be used. Pixels to be connected are extracted based on the definition of the connectivity. Extraction of connected pixels can be performed using a known technique such as labeling processing and contour tracking processing used in general image processing.

【0022】文字成分抽出手段3は、前記連結成分抽出
手段2によって求められた黒画素の連結成分のうち、文
字を構成する連結成分を選択する。選択基準としては、
連結成分の大きさ、連結成分の外接矩形の面積に対する
黒画素数(すなわち黒画素の密度)、その他のテクスチ
ャ特徴を用いることができる。一例を挙げると、印刷文
書では本文領域の文字の大きさは一定であるので、大体
の目安をつけてその値で判定することができる。典型的
な印刷文書では文字の大きさは大体5mm四方であり、
これを400dpi(約16本/mm)の解像度で取り
込むと文字60dot四方ぐらいになる。したがってこ
れよりも極端に大きな連結成分は本文文字ではないと判
定することが出来る。同様にあまりにも小さな連結成分
はノイズであるなどの判断を下すことが出来る。
The character component extracting means 3 selects a connected component constituting a character from the connected components of the black pixels obtained by the connected component extracting means 2. Selection criteria include:
The size of the connected component, the number of black pixels with respect to the area of the circumscribed rectangle of the connected component (that is, the density of black pixels), and other texture characteristics can be used. For example, in a print document, the size of the characters in the body area is constant, so it is possible to make a rough estimate and determine the value based on the value. In a typical printed document, the size of the characters is approximately 5 mm square,
If this is taken in at a resolution of 400 dpi (about 16 lines / mm), the characters will be about 60 dots square. Therefore, it can be determined that a connected component extremely larger than this is not a body character. Similarly, it can be determined that a connected component that is too small is noise.

【0023】文字行推定手段4は、前記文字成分抽出手
段3によって抽出された文字を構成する連結成分から、
位置的に近接する、大きさが似通っている、などの理由
により同一行を構成すると思われる文字要素を統合し仮
の文字行を推定する。本文が横書きである場合には、水
平方向にほぼ同じ座標に位置し、かつ水平方向の間隔が
十分小さい連結成分は同一行を構成すると考えられる。
同じ座標に位置するか否かの判定には、端点・重心点な
どの特徴点の位置関係から判定することが可能である。
この外にも連結成分の高さとその水平方向への重なり度
合いから判定する手法も考えられる。また、本文が縦書
きの場合には水平方向と垂直方向を交換して考えれば同
様に処理できる。十分近接するか否かの判定には、やは
り端点・重心点などの特徴点の位置関係から判定するこ
とが可能である。
The character line estimating means 4 calculates the connected components constituting the character extracted by the character component extracting means 3
Character elements that are considered to form the same line due to reasons such as close proximity in position and similar size are integrated to estimate a temporary character line. When the text is written horizontally, it is considered that connected components located at substantially the same coordinates in the horizontal direction and having sufficiently small horizontal intervals constitute the same line.
The determination as to whether or not they are located at the same coordinates can be made based on the positional relationship between characteristic points such as end points and centroid points.
In addition, a method of determining from the height of the connected component and the degree of overlap in the horizontal direction is also conceivable. Further, when the text is written vertically, the same processing can be performed if the horizontal direction and the vertical direction are exchanged. The determination as to whether or not they are sufficiently close can also be made from the positional relationship of characteristic points such as end points and centroid points.

【0024】角点検出手段5は、前記文字行推定手段4
によって得られた仮の文字行を構成する連結黒画素成分
の角点を検出する手段であり、本発明のポイントであ
る。
The corner point detecting means 5 includes the character line estimating means 4
This is a means for detecting the corner point of the connected black pixel component constituting the provisional character line obtained by the above, and is a point of the present invention.

【0025】角点検出のアルゴリズムを図面を参照しな
がら以下に記す。
The algorithm for detecting a corner point will be described below with reference to the drawings.

【0026】角点検出のアルゴリズムは、図2に示すよ
うに±θの直線で外側から押さえた場合に仮の文字行に
接する個所を角点として検出することにより角点検出を
行う。検出された角点のうち、垂直方向から±θだけ傾
けた直線に接する角点同士、水平方向から±θだけ傾け
た直線に接する角点同士、をそれぞれペアにする。しか
しながら、隣接する辺の角点は一致することが多いの
で、この場合は適宜同一の辺上に存在する角点座標をペ
アにして、次の文字行傾き角度検出手段に送り込む。
The corner point detection algorithm performs corner point detection by detecting, as shown in FIG. 2, a point in contact with a tentative character line as a corner point when pressed from the outside with a straight line of ± θ. Among the detected corner points, corner points that contact a straight line inclined by ± θ from the vertical direction and corner points that contact a straight line inclined by ± θ from the horizontal direction are paired. However, since the corner points of adjacent sides often coincide with each other, in this case, the corner point coordinates existing on the same side are appropriately paired and sent to the next character line inclination angle detecting means.

【0027】具体的な処理手順の例を記す。前記文字行
抽出手段4において統合抽出された文字行に対して輪郭
追跡処理を行う。この時に、追跡された座標毎に、該座
標を±θ度の直線が通ると仮定した場合の切片の値をそ
れぞれ計算しておく。そして、その切片の値が最大もし
くは最小になる時の輪郭座標を記憶する。輪郭追跡処理
が終了すれば、前記の角点の座標値を得ることが出来
る。
An example of a specific processing procedure will be described. A contour tracing process is performed on the character lines integrated and extracted by the character line extracting means 4. At this time, for each coordinate tracked, the value of the intercept assuming that a straight line of ± θ degrees passes through the coordinate is calculated. Then, the contour coordinates when the value of the intercept becomes the maximum or the minimum are stored. When the contour tracking processing is completed, the coordinate values of the corner points can be obtained.

【0028】ある一つの直線に複数の接点が生じ角点座
標が一意に定まらないこともある。この場合には、角点
間の距離が最も大きくなるように選択する。
In some cases, a plurality of contact points are formed on a single straight line, and the coordinates of the corner points may not be uniquely determined. In this case, the distance between the corner points is selected so as to be the largest.

【0029】文字行傾き角度算出手段6は、前記角点検
出手段5によって得られた角点の座標の位置関係から、
前記仮の文字行の傾き角度を検出するものである。傾き
角度の算出法は、前記角点の座標から文字行の外接枠を
検出して、その枠線の方向から傾き角度を算出する。枠
線は4本得ることができるが、行方向への距離が遠いほ
ど精度はよくなるため、最も行方向での距離が遠い2つ
の角点から角度を推定する方式を例として挙げることが
出来る。上下2本の枠線両方を用いて平均化してもよ
い。
The character line inclination angle calculating means 6 calculates the position of the coordinates of the corner points obtained by the corner point detecting means 5,
The inclination angle of the provisional character line is detected. In the method of calculating the tilt angle, a circumscribed frame of the character line is detected from the coordinates of the corner point, and the tilt angle is calculated from the direction of the frame line. Although four frame lines can be obtained, the accuracy increases as the distance in the row direction increases. Therefore, a method of estimating an angle from two corner points having the longest distance in the row direction can be given as an example. The averaging may be performed using both the upper and lower frame lines.

【0030】文書画像傾き角度検出手段7は、各々の前
記仮の文字行の傾き角度の算出値から最も適切であると
思われる値を、文書画像の傾き角度として出力する。最
も適切な角度の推定手法には、最尤推定や平均化などの
手法を用いることができる。
The document image inclination angle detecting means 7 outputs a value considered most appropriate from the calculated values of the inclination angles of the respective temporary character lines as the inclination angle of the document image. As the most appropriate angle estimation method, a method such as maximum likelihood estimation or averaging can be used.

【0031】[0031]

【発明の効果】本発明では、仮の文字行の両端点の座標
のみを検出するため、従来のハフ変換などを用いた手法
と比べて、特に直線近似などの段階の処理において処理
手数を低減することができる。一文字行分の傾き角度の
検出処理が少ない処理手数で行えるため、従来手法では
1行分に対する処理時間内で、本発明は複数の行に対し
て傾き角度を求めることができ、このため傾き角度の推
定値の精度を低下させることなく全体としての処理手数
を低減することが出来る。
According to the present invention, since only the coordinates of both end points of the provisional character line are detected, the number of processing steps is reduced particularly in the processing at the stage of linear approximation as compared with the conventional method using Hough transform or the like. can do. Since the detection processing of the inclination angle for one character line can be performed with a small number of processing steps, according to the conventional method, the inclination angle can be obtained for a plurality of lines within the processing time for one line, and thus the inclination angle can be obtained. The number of processing steps as a whole can be reduced without lowering the accuracy of the estimated value.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の処理の概略を示した図面であり、
(a)は、連結画素成分を抽出した段階を示し、(b)
は、近接する連結画素成分を統合し文字行を生成した段
階を示し、(c)は、文字行の角点を抽出した段階を示
し、(d)は、角点から傾き角度θを推定した結果を示
す。
FIG. 1 is a drawing showing an outline of the processing of the present invention;
(A) shows a stage where connected pixel components are extracted, and (b)
Shows a stage in which a character line is generated by integrating adjacent connected pixel components, (c) shows a stage in which a corner point of the character line is extracted, and (d) shows a case where the inclination angle θ is estimated from the corner point. The results are shown.

【図2】本発明における角点検出方式を説明する図面で
ある。
FIG. 2 is a diagram illustrating a corner point detection method according to the present invention.

【図3】本発明の一実施例を示す図面である。FIG. 3 is a drawing showing one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 画像入力手段 2 連結成分抽出手段 3 文字成分抽出手段 4 文字行推定手段 5 角点検出手段 6 文字行傾き角度算出手段 7 文書画像傾き角度検出手段 DESCRIPTION OF SYMBOLS 1 Image input means 2 Connected component extraction means 3 Character component extraction means 4 Character line estimation means 5 Angle point detection means 6 Character line inclination angle calculation means 7 Document image inclination angle detection means

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06K 9/32──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 6 , DB name) G06K 9/20 G06K 9/32

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文書を光学的に走査し、文書画像データを
得る画像入力手段と、 前記画像入力手段によって入力
された文書画像データを参照し画素の連結成分を検出す
る連結成分抽出手段と、 前記連結成分抽出手段によっ
て抽出された画素の連結成分のうち、文字を構成する連
結成分を抽出する、文字成分抽出手段と、 前記文字成分抽出手段によって抽出された連結成分のう
ち、近接する連結成分同士を統合し仮の文字行として出
力する、文字行推定手段と、 前記文字行推定手段によって推定された仮の文字行に対
して、水平方向に対し所定の角度を成す第1の直線、前
記第1の直線と水平方向に関し線対称となる第2の直
線、垂直方向に対し前記所定の角度を成す第3の直線、
前記第3の直線と垂直方向に関し線対称となる第4の直
線のそれぞれに接する最も外側の輪郭点を、少なくとも
角点として検出する、角点検出手段と、 前記角点検出手段によって検出された角点の位置関係か
ら、前記仮の文字行の傾きを算出する、文字行傾き角度
算出手段と、 前記文字行推定手段から得られた各々の仮の文字行か
ら、前記文字行傾き角度算出手段によって得られた傾き
角度を参照し、前記文書画像データの傾き角度を求め
る、文書画像傾き角度検出手段と、 を具備することを特徴とする文書画像傾き検出装置。
An image input unit for optically scanning a document to obtain document image data; a connected component extracting unit for detecting a connected component of pixels by referring to the document image data input by the image input unit; A character component extracting unit that extracts a connected component constituting a character from the connected components of the pixels extracted by the connected component extracting unit; and a connected component that is close among the connected components extracted by the character component extracting unit. A character line estimating unit that integrates each other and outputs a temporary character line; and a first straight line that forms a predetermined angle with respect to the horizontal direction with respect to the temporary character line estimated by the character line estimating unit.
The second straight line which is symmetrical with respect to the first straight line and the horizontal direction.
Line, a third straight line at said predetermined angle to the vertical,
A fourth straight line symmetrical with respect to the vertical direction with respect to the third straight line.
The outermost contour points that touch each of the lines
A corner point detection unit that detects the corner point; a character line inclination angle calculation unit that calculates the inclination of the temporary character line from a positional relationship between the corner points detected by the corner point detection unit; Document image inclination angle detection means for determining the inclination angle of the document image data by referring to the inclination angle obtained by the character line inclination angle calculation means from each temporary character line obtained from the estimation means. A document image inclination detecting device, comprising:
JP5329368A 1993-12-27 1993-12-27 Document image tilt detection device Expired - Fee Related JP2778437B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5329368A JP2778437B2 (en) 1993-12-27 1993-12-27 Document image tilt detection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5329368A JP2778437B2 (en) 1993-12-27 1993-12-27 Document image tilt detection device

Publications (2)

Publication Number Publication Date
JPH07192085A JPH07192085A (en) 1995-07-28
JP2778437B2 true JP2778437B2 (en) 1998-07-23

Family

ID=18220677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5329368A Expired - Fee Related JP2778437B2 (en) 1993-12-27 1993-12-27 Document image tilt detection device

Country Status (1)

Country Link
JP (1) JP2778437B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4170441B2 (en) 1997-11-28 2008-10-22 富士通株式会社 Document image inclination detection apparatus and storage medium for document image inclination detection program
JP4774200B2 (en) * 2004-04-21 2011-09-14 オムロン株式会社 Character string area extractor
CN101924856B (en) * 2009-06-17 2013-06-19 北京大学 Method and device for testing manuscript inclining angle
KR101878256B1 (en) * 2016-12-15 2018-07-13 서울대학교산학협력단 Method and apparatus for rectifying image including text

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01205287A (en) * 1988-02-10 1989-08-17 Oki Electric Ind Co Ltd Character line inclination detector
JP2623844B2 (en) * 1989-07-31 1997-06-25 日本電気株式会社 Character line extraction device

Also Published As

Publication number Publication date
JPH07192085A (en) 1995-07-28

Similar Documents

Publication Publication Date Title
KR100761641B1 (en) Apparatus and method for correcting distortion of input image
US7301564B2 (en) Systems and methods for processing a digital captured image
EP0543593B1 (en) Method for determining boundaries of words in text
US6929183B2 (en) Reconstruction of virtual raster
US5974199A (en) Method for scanning and detecting multiple photographs and removing edge artifacts
US7380718B2 (en) Method for reading out symbol information and device for reading out symbol information
US5892854A (en) Automatic image registration using binary moments
JP2012243307A (en) Method for detecting strain in input image, device for detecting strain in input image and computer readable medium
JP2003304390A (en) Image compensating device, program, memory medium, image compensating method, image reader, and image forming device
US5243668A (en) Method and unit for binary processing in image processing unit and method and unit for recognizing characters
US5832102A (en) Apparatus for extracting fingerprint features
US20020027672A1 (en) Distortion correction device for correcting imaged object to produce plane image without distortion
JP2778437B2 (en) Document image tilt detection device
JP3428494B2 (en) Character recognition device, its character recognition method, and recording medium storing its control program
JP2002199206A (en) Method and device for imbedding and extracting data for document, and medium
EP1193642B1 (en) System and method for object recognition
JP3006466B2 (en) Character input device
JP3303246B2 (en) Image processing device
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JP2868134B2 (en) Image processing method and apparatus
KR100603618B1 (en) Apparatus and Method for Geometric Distortion Correction of Document Image using Affine Transform
JP3460356B2 (en) Method and apparatus for detecting circle or ellipse
JP2002133424A (en) Detecting method of inclination angle and boundary of document
JP3281469B2 (en) Document image inclination detecting method and apparatus
JP3171059B2 (en) License plate automatic recognition device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980407

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090508

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100508

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110508

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110508

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120508

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120508

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130508

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees