JPH0390980A - Method and device for detecting tilt of document picture - Google Patents

Method and device for detecting tilt of document picture

Info

Publication number
JPH0390980A
JPH0390980A JP1226944A JP22694489A JPH0390980A JP H0390980 A JPH0390980 A JP H0390980A JP 1226944 A JP1226944 A JP 1226944A JP 22694489 A JP22694489 A JP 22694489A JP H0390980 A JPH0390980 A JP H0390980A
Authority
JP
Japan
Prior art keywords
projection information
binary
binary projection
shift
cumulative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1226944A
Other languages
Japanese (ja)
Other versions
JP2893747B2 (en
Inventor
Yoshitake Tsuji
辻 善丈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1226944A priority Critical patent/JP2893747B2/en
Publication of JPH0390980A publication Critical patent/JPH0390980A/en
Application granted granted Critical
Publication of JP2893747B2 publication Critical patent/JP2893747B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To detect the tilt of a document picture in a stable and easy way by detecting the direction where the projection, i.e, the width of the black picture element showing a character row and a table frame when the character row and a table, etc., are projected in the tilt direction. CONSTITUTION:A pattern memory 1 stores the document pictures as the quantized picture information. A binary projection information extracting part 2 sets (m) pieces of partial information (i) of a fixed size in the prescribed direction, scans each partial area (i), and extracts the binary projection information showing the presence/absence of black picture elements on each scan line to store them in sequence into a binary projection information storage part 3. Then the adjacent binary projection information are shifted in steps in the vertical and horizontal shift direction by a prescribed extent and read out. At the same time, an OR is obtained among plural binary projections and the cumulative binary projection information are extracted. Then the shift value is changed for detection of the shift value and the shift direction where the number of black picture elements of the cumulative binary projection information is minimized. Thus the tilt of a document picture can be detected in an easy and stable way.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像人力装置より人力された文書画像の傾き
検出方法及びその装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a method and apparatus for detecting the skew of a document image manually generated by an image input device.

〔従来技術〕 一般印刷文書等を自動的に読み取るためには、まず、ス
キャナー等の画像人力装置を用いて、般印刷文書等を2
値に量子化された文書画像として取り込む必要があるが
、入力時の傾きがあるので、人力画像における水平ある
いは垂直走査方向に対して多少傾くのが普通である。そ
のために、文字行の行間が狭い文書などでは、文字行が
検出できなくなったり、あるいは画像人力装置の解像度
を上げるなど、性能面での劣化が生じるため、予め人力
された文書画像の傾きを検出する必要がある。
[Prior art] In order to automatically read general printed documents, etc., first, a general printed document, etc.
It is necessary to capture the document image as a quantized document image, but since it is tilted during input, it is normal that it is tilted somewhat with respect to the horizontal or vertical scanning direction of a human image. For this reason, in documents with narrow spacing between character lines, the character lines may not be detected, or the resolution of the human-powered image device must be increased, resulting in performance deterioration. There is a need to.

従来、このような文書画像では、その中心である文章領
域が規則正しく文字が並んでいることを利用して傾き検
出が行われる。
Conventionally, in such a document image, skew detection is performed using the fact that characters are regularly arranged in a text area at the center of the document image.

例えば、「書式指定情報によらない紙面構成要素抽出法
」 (電子情報通信学会、論文誌り、v。
For example, "Paper component extraction method that does not depend on format specification information" (IEICE, Journal of Electronics, Information and Communication Engineers, v.

L、J66−D、No、1.PPIII〜118゜19
83)に示されているように、傾き角θを順次変更しな
がら、角度θ方向にヒストグラムを作成し、ヒストグラ
ム上の山・谷が顕著に出現する角度θを傾き角として求
める第1方式が知られている。
L, J66-D, No. 1. PPIII~118°19
As shown in 83), a first method is known in which a histogram is created in the direction of angle θ while changing the inclination angle θ sequentially, and the angle θ at which peaks and valleys on the histogram appear conspicuously is determined as the inclination angle. ing.

また、上記資料に示されているように、入力文書画像を
複数の帯状の領域に分割し、画素単位のヒストグラムを
作成して、隣接する各領域間のヒストグラム分布に対す
る相関値から傾き角θを求める第2の方式が知られてい
る。
In addition, as shown in the above document, the input document image is divided into multiple band-shaped regions, a histogram is created for each pixel, and the tilt angle θ is calculated from the correlation value for the histogram distribution between each adjacent region. A second method of determining this is known.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかしながら、上記第1の方式では、角度θ方向が変化
する毎にヒストグラムを算出する必要があり、処理時間
にかかる問題があった。
However, in the first method, it is necessary to calculate a histogram every time the angle θ direction changes, which poses a problem in terms of processing time.

また、第2の方式では、隣接する帯状ごとに、ヒストグ
ラムの山・谷(本文行、行間に相当)に対応させ、傾き
角θを求めるため、文字サイズが変化する文字行が含ま
れると傾き検出精度が劣化する。
In addition, in the second method, the tilt angle θ is determined by corresponding to the peaks and valleys of the histogram (corresponding to text lines and line spacing) for each adjacent strip, so if a line of characters whose size changes is included, the tilt Detection accuracy deteriorates.

更に、上記第1の方式や第2の方式の如く、文字行が規
則的に並んでいることのみを利用すると、表などの領域
が含まれると、傾き検出精度が劣化し、コストパフォー
マンスに問題が生じる。
Furthermore, when using only the regular arrangement of character lines as in the first and second methods above, if areas such as tables are included, the tilt detection accuracy deteriorates, resulting in cost performance problems. occurs.

そこで、本発明の目的は、従来の上記課題を解決するた
めに、文書全体のレイアウトが矩形上に規則的に配置さ
れることから、文字行や表などを傾き方向に射影した場
合、その射影即ち、文字行や表枠を表わす黒画素の幅が
最小となることを利用することによって、文字サイズの
変化する文字行や表などが含まれていても安定にしかも
容易に文書画像の傾き検出を可能とした文書画像傾き検
出装置を提供することにある。
SUMMARY OF THE INVENTION Therefore, in order to solve the above-mentioned conventional problems, the layout of the entire document is arranged regularly on a rectangle. In other words, by utilizing the fact that the width of black pixels representing character lines and table frames is the minimum, it is possible to stably and easily detect the skew of a document image even if it includes character lines or tables with varying character sizes. An object of the present invention is to provide a document image tilt detection device that enables the following.

本発明の他の目的は、入力文書画像を帯状に複数の領域
に分けて、各領域毎に所定走査方向に黒画素の有無のみ
を検出した2値射影情報を抽出し、各2値射影情報を階
段状にずらしながらそれらの論理和をとった累積2値射
影情報に基づいて傾き検出を行うことによって、処理速
度が改善された文M画像の傾き検出装置を提供すること
にある。
Another object of the present invention is to divide an input document image into a plurality of belt-shaped regions, extract binary projection information that detects only the presence or absence of black pixels in a predetermined scanning direction for each region, and extract the binary projection information for each region. An object of the present invention is to provide an apparatus for detecting the inclination of a sentence M image in which the processing speed is improved by detecting the inclination based on the cumulative binary projection information obtained by taking the logical sum of the information while shifting the information in a stepwise manner.

(課題を解決するための手段) 前述の課題を解決するために、本発明による文書画像傾
き検出方法は、2値に量子化された文書画像の傾き検出
方法において、垂直又は水平方向に一定サイズの帯状に
複数個の部分領域の各部分領域毎に、前記文書画像を水
平又は垂直方向に走査し、各走査ライン上に黒画素が存
在するか否かを調べ、各走査ライン上の黒画素の有無を
示す2値射影情報を抽出し、隣接する前記2値射影情報
を階段状に上下又は左右のずらし方向に所定のずらし量
だけずらして読み出し、前記複数個の2値射影の論理和
を求めて累積2値射影情報を抽出し、前記上下又は左右
方向へのずらし量を変化させて前記累積2値射影情報の
黒画素数を求め、前記黒画素数が最小となるずらし量及
びずらし方向を検出する。
(Means for Solving the Problems) In order to solve the above-mentioned problems, the document image skew detection method according to the present invention is a method for detecting the skew of a binary quantized document image. The document image is scanned horizontally or vertically for each partial area of a plurality of band-shaped partial areas, and it is checked whether or not there are black pixels on each scanning line. extract the binary projection information indicating the presence or absence of the binary projection information, read out the adjacent binary projection information by shifting it by a predetermined amount in the vertical or horizontal shifting direction in a stepwise manner, and calculate the logical sum of the plurality of binary projections. the number of black pixels of the cumulative binary projection information is determined by changing the amount of shift in the vertical or horizontal direction, and the amount of shift and direction of shift that minimizes the number of black pixels; Detect.

また、本発明文書画像傾き検出装置は、2値に量子化さ
れた文書画像を記憶するメモリと、垂直又は水平方向に
一定サイズの帯状に複数個の部分領域を設定し、前記文
書画像を水平又は垂直方向に走査し、各走査ライン上の
黒画素の有無を検・出する2値射影抽出手段と、隣接す
る前記2射影情報を上下又は左右のずらし方向及び所定
のずらし量に従って、シストするシスト演算手段と、階
段状にずらした前記複数個の2値射影情報の論理和を算
出する累積2値射影情報抽出手段と、前記累積2値射影
情報の黒画素数を検出する黒画素数算出手段と、前記ず
らし量及びずらし方向を変化させるカウンタと、前記ず
らし量及びずらし方向を変化させて得られた複数個の前
記累積2値射影情報の黒画素数の最小値を検出する手段
とを具備する。
In addition, the document image tilt detection device of the present invention includes a memory for storing a binary quantized document image, and a plurality of partial areas set in the form of bands of a constant size in the vertical or horizontal direction, so that the document image is horizontally quantized. Alternatively, a binary projection extracting means scans in the vertical direction and detects and detects the presence or absence of black pixels on each scanning line, and the adjacent two projection information is systed according to the vertical or horizontal shift direction and predetermined shift amount. cyst calculation means, cumulative binary projection information extraction means for calculating the logical sum of the plurality of binary projection information shifted in a stepwise manner, and black pixel number calculation means for detecting the number of black pixels of the cumulative binary projection information. means, a counter for changing the shift amount and shift direction, and means for detecting a minimum value of the number of black pixels of the plurality of cumulative binary projection information obtained by changing the shift amount and shift direction. Be equipped.

更に、本発明の文書画像傾き検出装置は、2値に量子化
された文書画像を記憶するメモリと、垂直又は水平方向
に一定サイズの帯状に複数個の部分領域を設定し、前記
文書画像を水平又は垂直方向に走査し、各走査ライン上
の黒画素の有無を検出する2値射影抽出手段と、隣接す
る前記2値射影情報を上下又は左右のずらし方向及び所
定のずらし量に従ってシストするシスト演算手段と、階
段状にずらした前記複数個の2値射影情報の論理和を算
出する累積2値射影情報抽出手段と、前記累積2値射影
情報の黒画素数を検出する黒画素数算出手段と、前記ず
らし量を変化させるカウンタと、前記ずらし量が1にお
ける上下等の2通りのずらし方向に対して算出される前
記累積2値射影情報の黒画素数の最小値を検出し、ずら
し方向を決定する手段と、決定された前記ずらし方向に
対して、l’llJ記ずらし量を2から始めて順次増加
させて得られた前記累積2値射影情報の黒画素数が既に
検出された前記累積2値射影情報の黒画S数より大きく
なるか否かを調べて、前記ずらし量の増加を中断する手
段とを具備する。
Further, the document image tilt detection device of the present invention includes a memory for storing a binary quantized document image, and a plurality of partial regions having a constant size in the vertical or horizontal direction. A binary projection extraction means that scans in the horizontal or vertical direction and detects the presence or absence of black pixels on each scanning line, and a cyst that performs cysts on the adjacent binary projection information according to vertical or horizontal shifting directions and predetermined shifting amounts. a calculating means, a cumulative binary projection information extracting means for calculating the logical sum of the plurality of binary projection information shifted in a stepwise manner, and a black pixel number calculating means for detecting the number of black pixels of the cumulative binary projection information. , a counter for changing the shift amount, and detecting the minimum value of the number of black pixels of the cumulative binary projection information calculated for two shift directions such as up and down when the shift amount is 1, and determining the shift direction. means for determining the number of black pixels of the cumulative binary projection information obtained by sequentially increasing the l'llJ displacement amount starting from 2 with respect to the determined shifting direction; and means for checking whether the number of black pixels S is greater than the number of black pixels in the binary projection information and interrupting the increase in the amount of shift.

〔実施例〕〔Example〕

以下に本発明の実施例について図面を参照しながら説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

第1図は、傾いて人力された文書画像を一定サイズの帯
状:二垂直方向に分解して得られる部分領域に対して、
水平方向に走査して黒画素の有無を示す2値射影情報を
求める原理を説明した図である。
Figure 1 shows a partial area obtained by dividing a tilted document image into two vertical bands of a certain size.
FIG. 3 is a diagram explaining the principle of obtaining binary projection information indicating the presence or absence of black pixels by scanning in the horizontal direction.

第1図(a)において、斜線で文書画像内の文字や線を
示している。図中0. 2. 4・・・・・・24は、
水平方向の各走査ラインを示しており、矢印で、各走査
ライン上で最初に検出される黒画素の位置までの距離を
示している。
In FIG. 1(a), characters and lines within the document image are indicated by diagonal lines. 0 in the figure. 2. 4...24 is
Each horizontal scan line is shown, with arrows indicating the distance to the position of the first detected black pixel on each scan line.

第1図ら)は、第1図(a)に対して得られる2値射影
情報を示している。即ち、第1図(a)の走査ライン4
では文字部を示す黒画素が存在するため、第1図(b)
の走査ライン4には”1″が記憶され、走査ラインIO
には、黒画素が存在しないため、第1図わ)の走査ライ
ン10が記憶される。このようにして、各走査ラインに
対して、黒画素の存在を表わす”1”か”0”らなる2
値射影情報が得られる。
FIG. 1 et al.) show binary projection information obtained for FIG. 1(a). That is, scanning line 4 in FIG. 1(a)
In this case, there is a black pixel indicating the character part, so the image shown in Fig. 1(b)
"1" is stored in scanning line 4 of the scanning line IO.
Since there is no black pixel in , the scan line 10 of FIG. 1 is stored. In this way, for each scan line, a binary number consisting of either "1" or "0" indicating the presence of a black pixel.
Value projection information is obtained.

第2図は、本発明における傾き検出方法の原理を説明す
るために示した図である。
FIG. 2 is a diagram shown to explain the principle of the tilt detection method according to the present invention.

第2図(a)は、傾いて人力された文書画像を示し、図
中点線で垂直方向に一定サイズΔmで3個の部分領域i
  (i=0.l、2)に分割した様子を示している。
FIG. 2(a) shows a tilted document image, in which three partial areas i with a constant size Δm are arranged in the vertical direction as indicated by dotted lines in the figure.
It shows how it is divided into (i=0.l, 2).

第2図b)は、第2図(a)で示した3個の部分領域い
=0. 1. 2)に対して、それぞれ、第1図で示し
た2値射影情報を示しており、図中黒でぬりつぶした領
域は黒画素が存在することを示している。
Figure 2b) shows the three partial areas shown in Figure 2(a) =0. 1. For 2), the binary projection information shown in FIG. 1 is shown, and the areas filled in with black in the figure indicate the presence of black pixels.

傾き検出は、次のように行う。部分領域0を基準として
、上下方向にずらし量Δt (Δt=0゜1、 2. 
3・・・・・・)を設定し、部分領域1の2値射影情報
の読出し位置を上下方向に△tだけ、部分領域2の2値
射影情報の読出し位置を上下方向に2Δtだけ(即ち、
部分領域1に対してずらし量i・Δt)ずらして、3個
の2値射影情報の論理和を求めることによって、3個の
部分領域の2値射影情報を重ね合わせた累積2値射影情
報を検出する。
Tilt detection is performed as follows. Shift amount Δt in the vertical direction with respect to partial area 0 (Δt=0°1, 2.
3...), and set the reading position of the binary projection information of partial area 1 by △t in the vertical direction, and the reading position of the binary projection information of partial area 2 by 2Δt in the vertical direction (i.e. ,
By shifting the partial area 1 by an amount i/Δt) and calculating the logical sum of the three binary projection information, the cumulative binary projection information obtained by superimposing the binary projection information of the three partial areas is obtained. To detect.

第2図(C)は第2図(5)で示した各部分領域の2値
射影情報に対して得られる累積2値射影情報を示してい
る。
FIG. 2(C) shows cumulative binary projection information obtained for the binary projection information of each partial area shown in FIG. 2(5).

第2図(C)では、ずらし量Δt=Qの場合と下方向に
Δtだけ部分領域1の2値射影情報の読み出し位置をず
らした場合が示される。
FIG. 2C shows a case where the shift amount Δt=Q and a case where the read position of the binary projection information of the partial area 1 is shifted downward by Δt.

傾き検出では、上述したずらし量とずらし方向(上方向
か下方向)を求めることによって行う。
Tilt detection is performed by determining the above-mentioned shift amount and shift direction (upward or downward).

即ち、上方向か下方向にΔtだけずらした時に得られる
累積2値射影情報の黒画素数が最小となるずらし方向と
ずらし量を求めれば良い。例えば、第2図(C)では、
下方向にΔtだけずらした方が累積2値射影情報の黒画
素数が小さい(図中では黒のぬりつぶしの面積に相当)
ことがわかる。
That is, what is necessary is to find the direction and amount of shift that minimizes the number of black pixels in the cumulative binary projection information obtained when shifting upward or downward by Δt. For example, in Figure 2 (C),
The number of black pixels in the cumulative binary projection information is smaller when shifted downward by Δt (corresponds to the area filled with black in the figure)
I understand that.

ここで、第1の発明では、予め一定の許容値下を設けて
置き、上方向及び下方向ともにずらし量Δtを0.1.
2・・・・・・Tまで変化させて、それぞれ累積2値射
影情報を抽出してそれらの黒画素数の中から、最小とな
るずらし量及びずらし方向を決めるようにしている。
Here, in the first invention, a certain lower tolerance value is set in advance, and the shift amount Δt in both the upward and downward directions is set to 0.1.
2...T, the cumulative binary projection information is extracted for each, and the minimum shift amount and shift direction are determined from among the black pixel numbers.

また、第2の発明では、第一発明の処理速度を向上させ
るために、まず、上方向及び下方向に対してずらし量Δ
t=1で累積2値射影情報内の黒画素数を比較して、ず
らし方向を決定する。
In addition, in the second invention, in order to improve the processing speed of the first invention, firstly, the shift amount Δ is determined in the upward and downward directions.
At t=1, the number of black pixels in the cumulative binary projection information is compared to determine the shifting direction.

次にずらし方向が決まると、ずらし量Δt=0゜1.2
.・・・・・・を順次増加させて行き、1つの前に抽出
された累積2値射影情報の黒画素数の方が小さくなった
時に、ずらし量△tを決定するようにしている。
Next, when the direction of shift is determined, the amount of shift Δt=0°1.2
.. . . . are sequentially increased, and when the number of black pixels of the previously extracted cumulative binary projection information becomes smaller, the shift amount Δt is determined.

第3図は、第1の発明の一実施例を示す機能ブロック図
である。バタンメモリ1は文書画像を量子化された画像
情報として記憶する。
FIG. 3 is a functional block diagram showing an embodiment of the first invention. The button memory 1 stores document images as quantized image information.

2値射影情報抽出部2は、第1図及び第2図(a)で説
明したように、所定方向に一定サイズのm個の部分領域
i  (i=o、1.2・・・・・・m−1〉 を設定
し、各部分領域l毎に走査し、各走査ライン上の黒画素
の有無を示す2値射影情報を抽出し、順次2値射影情報
記憶部3に格納する。
As explained in FIGS. 1 and 2(a), the binary projection information extraction unit 2 extracts m partial regions i (i=o, 1.2...) of a constant size in a predetermined direction. m-1>, each partial region l is scanned, binary projection information indicating the presence or absence of a black pixel on each scanning line is extracted, and sequentially stored in the binary projection information storage unit 3.

部分領域カウンタ5であり、2値射影情報記憶部3に格
納された第1番目の部分領域(i=o。
The partial area counter 5 is the first partial area (i=o) stored in the binary projection information storage unit 3.

1.2.・・・・・・m −1) に対応しており、順
次部分領域lの2値射影情報がシスト演算部4で処理さ
れ、論理和演算部9に転送された時点でカウントアツプ
される。尚、部分領域カウンタ5の最大値は、m−’と
する。
1.2. . . . m −1), and when the binary projection information of the partial area l is sequentially processed by the cyst calculation unit 4 and transferred to the logical sum calculation unit 9, it is counted up. Note that the maximum value of the partial area counter 5 is assumed to be m-'.

ずらし量カウンタ6は、第2図ら)で説明したようにず
らし量Δtを表わす。ずらし方向レジスタ8は、第2図
あ)で説明したように、ずらし方向(例えば、上方向又
は下方向)を表わしている。
The shift amount counter 6 represents the shift amount Δt as explained in FIG. 2 et al. The shift direction register 8 indicates the shift direction (for example, upward or downward), as explained in FIG. 2A).

2値射影情報記憶部3に格納された部分領域1(i=0
. 1. 2.・・・・・・m−1)の2値射影情報が
シスト演算部4に転送されると、部分領域カウンタ5の
内容とずらし量カウンタ6の内容との積(即ち、l・Δ
t〉が乗算部7で計算されることによって部分領域lの
2値射影情報が、乗算部7の出力値及びずらし方向レジ
スタ8の内容に従ってシストされて論理和演算部9へ転
送される。
Partial area 1 (i=0
.. 1. 2. When the binary projection information of .
t> is calculated by the multiplier 7, and the binary projection information of the partial area l is shuffled according to the output value of the multiplier 7 and the contents of the shift direction register 8, and is transferred to the logical OR calculation unit 9.

論理和演算部9では、累積2値射影情報記1.!部10
に格納された累積2値射影情報(但し、初期イ直はθと
する。)とシスト演算部4への出力値との論理和を計算
し、累積2値射影情報記憶部10へ転送する。
The logical sum calculation unit 9 stores cumulative binary projection information 1. ! Part 10
The logical sum of the cumulative binary projection information stored in the storage unit 10 (however, the initial value is θ) and the output value to the cyst calculation unit 4 is calculated and transferred to the cumulative binary projection information storage unit 10.

同様にして、m個の部分領域i  (i=0. 1゜2
、・・・・・・m−1)の2値射影情報が順次シスト演
算部4に転送され、論理和演算部9を介すことによって
、累積2値射影情報記憶部10には、ずらし量カウンタ
6の内容であるずらし量△を及びずらし方向レジスタ8
の内容であるずらし方向に対する第2図(C)で示した
ような累積2値射影情報が記憶される。
Similarly, m partial regions i (i=0.1゜2
, . . . m-1) are sequentially transferred to the cyst calculation unit 4, and are stored in the cumulative binary projection information storage unit 10 via the logical sum calculation unit 9. The shift amount △ which is the content of the counter 6 and the shift direction register 8
Cumulative binary projection information as shown in FIG. 2(C) with respect to the shifting direction, which is the content of , is stored.

次に、累積2値射影情報記憶部10の内容が読み出され
、黒画素数算出部11で前述した累積2値射影情報の黒
画素数が算出され比較部12へ転送される。
Next, the contents of the cumulative binary projection information storage section 10 are read out, and the number of black pixels of the cumulative binary projection information described above is calculated by the black pixel number calculation section 11 and transferred to the comparison section 12 .

比較部12では、最小黒画素数記憶部13に格納された
最小黒画素数(初期値は非常に大きな値とする。)と比
較し、黒画素算出部11の出力値の方が最小黒画素数記
憶部↓3の内容よりも小さければ、黒画素算出部11の
出力値を最小黒画素数記憶部13へ転送すると共に、制
御部(図中省略)によって、ずらし量カウンタ6の内容
及びずらし方向レジスタ8の内容をそれぞれずらし量記
憶部14及びずらし方向記憶部14に転送する。
The comparison unit 12 compares the minimum black pixel number (the initial value is a very large value) stored in the minimum black pixel number storage unit 13 and determines that the output value of the black pixel calculation unit 11 is the minimum black pixel number. If it is smaller than the content of the number storage unit ↓3, the output value of the black pixel calculation unit 11 is transferred to the minimum black pixel number storage unit 13, and the content of the shift amount counter 6 and the shift value are transferred by the control unit (not shown). The contents of the direction register 8 are transferred to the shift amount storage section 14 and the shift direction storage section 14, respectively.

次に、ずらし量カウンタ6の内容が1カウントアツプさ
れ、以上述べた動作を繰り返し行い、ずらし量カウンタ
6の内容がある一定の許容値Tに達するまで行う。
Next, the content of the shift amount counter 6 is incremented by one, and the above-described operations are repeated until the content of the shift amount counter 6 reaches a certain allowable value T.

ずらし量カウンタ6の内容がある一定の許容値下に達す
ると、次に、ずらし方向レジスタ8の内容を変更(例え
ばOからlにするなど)することによって、ずらし方向
を変え、(例えば下方向から上方向へ)以上述べた動作
を繰り返して行う。
When the content of the shift amount counter 6 reaches a certain allowable value, the shift direction is changed by changing the content of the shift direction register 8 (for example, from 0 to 1), and the shift direction is changed (for example, downward (upwards) Repeat the above-mentioned operations.

その結果、ずらし方向記憶部14及びずらし量記憶部1
5に、ずらし方向とずらし量が求められ、それらによっ
て容易に傾き検出を行うことができる。
As a result, the shift direction storage section 14 and the shift amount storage section 1
5, the direction and amount of shift are determined, and the tilt can be easily detected based on these.

第4図は、第2の発明の一実施例を示す機能ブロック図
である。
FIG. 4 is a functional block diagram showing an embodiment of the second invention.

バタンメモリlは、文書画像を量子化された画像情報と
して記憶する。
The button memory l stores a document image as quantized image information.

2値射影情報抽出部2は、第1図及び第2図(a)で説
明したように、所定方向に一定サイズのm個の部分領域
i  (i=0. 1. 2.−・・−m−’)を設定
し、各部分領域1毎に走査し、各走査ライン上の黒画素
の有無を示す2値射影情報を抽出し、順次2値射影情報
記憶部3に格納する。
As explained in FIGS. 1 and 2(a), the binary projection information extraction unit 2 extracts m partial regions i (i=0. 1. 2.--) of a constant size in a predetermined direction. m-'), each partial area 1 is scanned, binary projection information indicating the presence or absence of a black pixel on each scanning line is extracted, and sequentially stored in the binary projection information storage section 3.

部分領域カウンタ5は、2値射影情報記憶部3に格納さ
れた第1番目の部分領域(i=0. 1゜2、・・・・
・・m −1)に対応しており、順次部分領域iの2値
射影情報がシスト演算部4で処理され、論理和演算部9
に転送された時点でカウントアツプされる。尚、部分領
域カウンタ5の最大値はm−’とする。
The partial area counter 5 calculates the first partial area (i=0.1°2,...) stored in the binary projection information storage section 3.
.
The count is incremented when the data is transferred to . Note that the maximum value of the partial area counter 5 is assumed to be m-'.

ずらし量カウンタ6は、第2図(b)で説明したように
ずらし量Δtを表わす。ずらし方向レジスタ8は、第2
図(b)で説明したように、ずらし方向(例えば、上方
向又は下方向)を表わしている。
The shift amount counter 6 represents the shift amount Δt as explained in FIG. 2(b). The shift direction register 8
As explained in Figure (b), it represents the shifting direction (for example, upward or downward).

2値射影情報記憶部3に格納された部分領域1(i=0
. 1. 2. ・−・−m−’) (7)2値射影情
報カシスト演算部4に転送されると、部分領域カウンタ
5内容とずらし量カウンタ6の内容との積(即ち、1・
Δt)が乗算部7で計算されることによって部分領域1
の2値射影情報が、乗算部7の出力値及びずらし方向レ
ジスタ8の内容に従ってソストされて論理和演算B9へ
転送される。
Partial area 1 (i=0
.. 1. 2.・−・−m−′) (7) When the binary projection information is transferred to the cast calculation unit 4, the product of the contents of the partial area counter 5 and the contents of the shift amount counter 6 (i.e., 1・
Δt) is calculated by the multiplier 7, so that the partial area 1
The binary projection information is sourced according to the output value of the multiplier 7 and the contents of the shift direction register 8, and is transferred to the OR operation B9.

論理和演算部9では、累積2値射影情報記憶部10に格
納された累積2値射影情報(但し、初期値は0とする。
The logical sum calculation unit 9 calculates the cumulative binary projection information stored in the cumulative binary projection information storage unit 10 (however, the initial value is 0).

)とシスト演算部4への出力値との論理和を計算し、累
積2値射影情報記憶部10へ転送する。
) and the output value to the cyst calculation unit 4 is calculated and transferred to the cumulative binary projection information storage unit 10.

同様にして、m個の部分領域i  (i=0. 1゜2
、・・・・・・m−1)の2値射影情報が順次シスト演
算部4に転送され、論理和演算89を介すことによって
、累積2値射影情報記憶部lOには、ずらし量カウンタ
6の内容であるずらし量Δを及びずらし方向レジスタ8
の内容であるずらし方向に対する第2図(C)で示した
ような累積2値射影情報が記憶される。
Similarly, m partial regions i (i=0.1゜2
, . . . m-1) are sequentially transferred to the cyst calculation unit 4, and are stored in the cumulative binary projection information storage unit 1O through the logical sum operation 89. 6 and shift direction register 8.
Cumulative binary projection information as shown in FIG. 2(C) with respect to the shifting direction, which is the content of , is stored.

以上の機能は、第3図で示した前述第1の発明と同等な
ものである。
The above functions are equivalent to those of the first invention shown in FIG.

次に、累積2値射影情報記憶部IOの内容が読み出され
、黒画素数算出部11で累積2値射影情報の黒画素数が
算出され選択921へ転送される。
Next, the contents of the cumulative binary projection information storage section IO are read out, the black pixel number calculation section 11 calculates the number of black pixels of the cumulative binary projection information, and the result is transferred to selection 921 .

選択部21では、ずらし量カウンタ6の内容によって黒
画素数算出部11の出力値が最小値算出部22か比較部
24へ転送されるかが選択される。
The selection section 21 selects whether the output value of the black pixel number calculation section 11 is to be transferred to the minimum value calculation section 22 or the comparison section 24 depending on the contents of the shift amount counter 6.

即ち、ずらし量カウンタ6の内容が1以下の場合(例え
ば、第2図0:l)で説明したように、ずらし量Δt=
Q、上方向及び下方向に対するずらし量Δt=1の3通
り)についてのみ、累積2値射影情報の黒画素数が最小
値算出部22へ転送される。
That is, as explained in the case where the content of the shift amount counter 6 is 1 or less (for example, 0:l in FIG. 2), the shift amount Δt=
The number of black pixels in the cumulative binary projection information is transferred to the minimum value calculation unit 22 only for three types: Q, upward and downward shift amount Δt=1).

ここで、上記3通りの場合が制御部(図中省略)によっ
て先立って実行される。
Here, the above three cases are executed in advance by the control unit (not shown).

最小値算出部22は、上記3つの黒画S数の最小値を検
出し、最小黒画素記憶部23に転送すると共に、制御部
によって、それに対応するずらし量Δtをずらし量記憶
部15に、またずらし方向をずらし方向記憶部14及び
ずらし方向レジスタ8に転送される。尚、最小値算出部
22で、ずらし量Δt=Qの場合が検出されると、ずら
し量Δtをずらし量記憶部15に転送して、動作が終了
となる。
The minimum value calculation unit 22 detects the minimum value of the three numbers of black pixels S and transfers it to the minimum black pixel storage unit 23, and the control unit stores the corresponding shift amount Δt in the shift amount storage unit 15. Further, the shifting direction is transferred to the shifting direction storage section 14 and the shifting direction register 8. Note that when the minimum value calculation unit 22 detects the case where the shift amount Δt=Q, the shift amount Δt is transferred to the shift amount storage unit 15, and the operation ends.

次に、ずらし量カウンタの内容であるずらし量△t=2
にセットすると、同様にして、累積2値射影情報の黒画
素数を検出すると、選択部21を通して、ずらし量Δt
=2に対する黒画素数が比較部24に転送され、最小黒
画素記憶部23の内容と比較される。
Next, the content of the shift amount counter, the shift amount △t=2
Similarly, when the number of black pixels of the cumulative binary projection information is detected, the shift amount Δt is set through the selection unit 21.
The number of black pixels for =2 is transferred to the comparison section 24 and compared with the contents of the minimum black pixel storage section 23.

比較部24において、最小黒画素記憶部23の内容が選
択部21を通じて比較部24に入力された値よりも大き
ければ、その値を最小黒画素記憶部23へ転送すると共
に、ずらし量カウンタ6の内容をずらし量記憶部15へ
転送し、ずらし量カウンタ6の値を1カウントアツプし
、同様な操作が繰り返される。
In the comparison section 24, if the content of the minimum black pixel storage section 23 is larger than the value inputted to the comparison section 24 through the selection section 21, the value is transferred to the minimum black pixel storage section 23, and the shift amount counter 6 is The contents are transferred to the shift amount storage section 15, the value of the shift amount counter 6 is incremented by 1, and the same operation is repeated.

一方、比較部24において、最小黒画素記憶部23の内
容が選択部21を通じて比較部24に人力された値より
も小さければ動作が終了となる。
On the other hand, in the comparison section 24, if the content of the minimum black pixel storage section 23 is smaller than the value inputted to the comparison section 24 through the selection section 21, the operation ends.

尚、ずらし量カウンタ6の値が一定の許容値Tを超えて
も上記動作が終了するものとする。
Note that even if the value of the shift amount counter 6 exceeds a certain allowable value T, the above operation is terminated.

上記動作が終了すると、ずらし方向記憶部14及びずら
し量記憶部15にはそれぞれずらし方向及びずらし量が
格納されることになる。
When the above operation is completed, the shift direction and shift amount are stored in the shift direction storage section 14 and the shift amount storage section 15, respectively.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明の文書画像傾き検出方法お
よびその装置によれば、文書画像内に文字サイズの変化
する文字行や表などが含まれた状態で、傾きが生じても
、容易にしかも安定に傾き検出ができるため、コストパ
フォーマンスを著しく改善することができる。
As described above, according to the document image skew detection method and apparatus of the present invention, even if a document image contains text lines or tables whose font sizes change, even if the document image is skewed, it can be easily detected. Moreover, since tilt detection can be performed stably, cost performance can be significantly improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、傾いて入力され文書画像上の部分領域に対し
て、水平方向に走査して黒画素の有無を調べることによ
って得られる2渣射影情報を説明するための図、第2図
は、本発明における傾き検出方法の原理を説明するため
に示す図、第3図は、第1の発明の実施例を示す機能ブ
ロック図、第4図は第2の発明の〜実施例を示す機能ブ
ロック図である。 1・・・・・・バタンメモリ、2・・・・・・2値射影
情報抽出部、3・・・・・・2値射影情報記憶部、4・
・・・・・ンスト演算部、5・・・・・・部分領域カウ
ンタ、6・・・・・・ずらし量カウンタ、 7・・・・
・・乗算部、8・・・・・・ずらし方向レジスタ、9・
・・・・・論理和演算部、10・・・・・・累積2値射
影情報記憶部、11・・・・・・黒画素数算出部、12
・・・・・・比較部、13・・・・・・最小黒画素数記
憶部、14・・・・・・ずらし方向記憶部、15・・・
・・・ずらし量記憶部、21・・・・・・選択部、22
・・・・・・最小値算出部、23・・・・・・最小黒画
素記憶部、24・・・・・・比較部。
Fig. 1 is a diagram for explaining two-residue projection information obtained by horizontally scanning a partial area on a document image input at an angle to check the presence or absence of black pixels. , FIG. 3 is a functional block diagram showing an embodiment of the first invention, and FIG. 4 is a functional block diagram showing embodiments of the second invention. It is a block diagram. 1...Bang memory, 2...Binary projection information extraction section, 3...Binary projection information storage section, 4.
...Instal calculation section, 5...Partial area counter, 6...Shift amount counter, 7...
...Multiplication section, 8...Shift direction register, 9.
. . . Logical sum calculation unit, 10 . . . Cumulative binary projection information storage unit, 11 . . . Black pixel number calculation unit, 12
... Comparison section, 13 ... Minimum black pixel number storage section, 14 ... Shift direction storage section, 15 ...
...Shift amount storage section, 21... Selection section, 22
... Minimum value calculation section, 23 ... Minimum black pixel storage section, 24 ... Comparison section.

Claims (3)

【特許請求の範囲】[Claims] (1)2値に量子化された文書画像の傾き検出方法にお
いて、垂直又は水平方向に一定サイズの帯状に複数個の
部分領域の各部分領域毎に、前記文書画像を水平又は垂
直方向に走査し、各走査ライン上の黒画素の有無を示す
2値射影情報を抽出し、隣接する前記2値射影情報を階
段状に上下又は左右のずらし方向に所定のずらし量だけ
ずらして読み出し、前記複数個の2値射影の論理和を求
めて累積2値射影情報を抽出し、前記上下又は左右方向
へのずらし量を変化させて前記累積2値射影情報の黒画
素数を求め、前記黒画素数が最小となるずらし量及びず
らし方向を検出することを特徴とする文書画像傾き検出
方法。
(1) In a method for detecting the inclination of a binary quantized document image, the document image is scanned in the horizontal or vertical direction for each partial area of a plurality of partial areas in the form of bands of a constant size in the vertical or horizontal direction. Then, binary projection information indicating the presence or absence of a black pixel on each scanning line is extracted, and the adjacent binary projection information is read out by shifting it by a predetermined amount in the vertical or horizontal shifting direction, and The cumulative binary projection information is extracted by calculating the logical sum of the binary projections, and the number of black pixels of the cumulative binary projection information is determined by changing the vertical or horizontal shift amount. 1. A method for detecting a tilt of a document image, the method comprising: detecting a shift amount and shift direction that minimizes the shift amount and shift direction.
(2)2値に量子化された文書画像を記憶するメモリと
、垂直又は水平方向に一定サイズの帯状に複数個の部分
領域を設定し、前記文書画像を水平又は垂直方向に走査
し、各走査ラインの黒画素の有無を検出する2値射影抽
出手段と、隣接する前記2値射影情報を上下又は左右の
ずらし方向及び所定のずらし量に従ってシストするシス
ト演算手段と、階段上にずらした前記複数個の2値射影
情報の論理和を算出する累積2値射影情報抽出手段と、
前記累積2値射影情報の黒画素数を検出する黒画素数算
出手段と、前記ずらし量及びずらし方向を変化させるカ
ウンタと、前記ずらし量及びずらし方向を変化させて得
られた複数個の前記累積2値射影情報の黒画素数の最小
値を検出する手段とを具備することを特徴とする文書画
像傾き検出装置。
(2) A memory for storing a binary quantized document image and a plurality of partial regions of a constant size in the vertical or horizontal direction are set, and the document image is scanned in the horizontal or vertical direction, and each binary projection extraction means for detecting the presence or absence of black pixels on a scanning line; cyst calculation means for cysting the adjacent binary projection information according to the vertical or horizontal shifting direction and a predetermined shifting amount; Cumulative binary projection information extraction means for calculating a logical sum of a plurality of binary projection information;
a black pixel number calculation means for detecting the number of black pixels of the cumulative binary projection information; a counter for changing the shift amount and the shift direction; and a plurality of the cumulative numbers obtained by changing the shift amount and shift direction. A document image tilt detection device comprising: means for detecting a minimum value of the number of black pixels in binary projection information.
(3)2値に量子化された文書画像を記憶するメモリと
、垂直又は水平方向に一定サイズの帯状に複数個の部分
領域を設定し、前記文書画像を水平又は垂直方向に走査
し、各走査ライン上の黒画素の有無を検出する2値射影
抽出手段と、隣接する前記2値射影情報を上下又は左右
のずらし方向及び所定のずらし量に従って、シストする
シスト演算手段と、階段状にずらした前記複数個の2値
射影情報の論理和を算出する累積2値射影情報抽出手段
と、前記累積2値射影情報の黒画素数を検出する論理素
数算出手段と、前記ずらし量を変化させるカウンタと、
前記ずらし量が1における上下等の2通りのずらし方向
に対して算出される前記累積2値射影情報の黒画素数の
最小値を検出し、ずらし方向を決定する手段と、決定さ
れた前記ずらし方向に対して、前記ずらし量順次増加さ
せて得られた前記累積2値射影情報の黒画素数が既に検
出された前記累積2値射影情報の黒画素数より大きくな
るか否かを調べて、前記ずらし量の増加を中断する手段
とを具備することを特徴とする文書画像傾き検出装置。
(3) A memory for storing a binary quantized document image and a plurality of partial regions of a fixed size in the vertical or horizontal direction are set, and the document image is scanned in the horizontal or vertical direction, and each binary projection extraction means for detecting the presence or absence of black pixels on a scanning line; cyst calculation means for cysting the adjacent binary projection information according to a vertical or horizontal shifting direction and a predetermined shifting amount; cumulative binary projection information extraction means for calculating a logical sum of the plurality of binary projection information; logical prime number calculating means for detecting the number of black pixels of the cumulative binary projection information; and a counter for changing the shift amount. and,
means for detecting a minimum number of black pixels of the cumulative binary projection information calculated for two shift directions such as up and down when the shift amount is 1, and determining a shift direction; and the determined shift. Checking whether the number of black pixels of the cumulative binary projection information obtained by sequentially increasing the amount of shift with respect to the direction is larger than the number of black pixels of the cumulative binary projection information that has already been detected; A document image tilt detection device, comprising: means for interrupting the increase in the amount of shift.
JP1226944A 1989-08-31 1989-08-31 Document image tilt detection method and apparatus Expired - Lifetime JP2893747B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1226944A JP2893747B2 (en) 1989-08-31 1989-08-31 Document image tilt detection method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1226944A JP2893747B2 (en) 1989-08-31 1989-08-31 Document image tilt detection method and apparatus

Publications (2)

Publication Number Publication Date
JPH0390980A true JPH0390980A (en) 1991-04-16
JP2893747B2 JP2893747B2 (en) 1999-05-24

Family

ID=16853063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1226944A Expired - Lifetime JP2893747B2 (en) 1989-08-31 1989-08-31 Document image tilt detection method and apparatus

Country Status (1)

Country Link
JP (1) JP2893747B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05134317A (en) * 1991-07-08 1993-05-28 Fuji Photo Film Co Ltd Microfilm reader
US6683983B1 (en) * 1999-03-01 2004-01-27 Riso Kagaku Corporation Document-inclination detector

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05134317A (en) * 1991-07-08 1993-05-28 Fuji Photo Film Co Ltd Microfilm reader
US6683983B1 (en) * 1999-03-01 2004-01-27 Riso Kagaku Corporation Document-inclination detector

Also Published As

Publication number Publication date
JP2893747B2 (en) 1999-05-24

Similar Documents

Publication Publication Date Title
US7684646B2 (en) System and method of determining image skew using connected components
US7616813B2 (en) Background area extraction in document layout analysis
JPH08241411A (en) System and method for evaluation of document image
JP4415010B2 (en) Two-dimensional code region extraction method, two-dimensional code region extraction device, electronic device, two-dimensional code region extraction program, and recording medium recording the program
JP3733161B2 (en) Image processing apparatus and method
JPH07192086A (en) Picture inclination detection method
JPH09179937A (en) Method for automatically discriminating boundary of sentence in document picture
US7969631B2 (en) Image processing apparatus, image processing method and computer readable medium storing image processing program
JPH05233873A (en) Area dividing method
US10423851B2 (en) Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JPH11341259A (en) Inclination correction method for document image
JP2017161969A (en) Character recognition device, method, and program
CN102271212B (en) Background pattern image combining apparatus, background pattern image combining method, and computer program
JP4275973B2 (en) Retouched image extraction apparatus, program, storage medium, and retouched image extraction method
JP6249240B2 (en) Image processing device
JP4140519B2 (en) Image processing apparatus, program, and recording medium
JPH10513284A (en) Automatic determination of blank pages and character frames for binary images
CN113743318A (en) Table structure identification method based on row and column division, storage medium and electronic device
JPH0390980A (en) Method and device for detecting tilt of document picture
CN112070708A (en) Image processing method, image processing apparatus, electronic device, and storage medium
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JP3607753B2 (en) Document image region dividing method and apparatus, and column type discrimination method and apparatus
JP6598402B1 (en) Receipt and other form image automatic acquisition / reading method, program, and portable terminal device
JP4070486B2 (en) Image processing apparatus, image processing method, and program used to execute the method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080305

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 11