JPH09106436A - Inclination detecting method for document picture - Google Patents
Inclination detecting method for document pictureInfo
- Publication number
- JPH09106436A JPH09106436A JP7264220A JP26422095A JPH09106436A JP H09106436 A JPH09106436 A JP H09106436A JP 7264220 A JP7264220 A JP 7264220A JP 26422095 A JP26422095 A JP 26422095A JP H09106436 A JPH09106436 A JP H09106436A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- patterns
- angle
- similar
- same
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、文書画像の傾き検
出方法に関する。The present invention relates to a method for detecting the inclination of a document image.
【0002】[0002]
【従来の技術】文書画像の傾きを検出する従来の方法と
しては、例えば様々な方向に特徴の射影をとって、最も
行方向に沿っていると判定されるピークを検出する方法
(特開平5−174183号公報を参照)や、同一行内
の文字パターンの外接矩形の位置を比較することによっ
て傾きを求める方法(特開平2−44486号公報を参
照)などがある。2. Description of the Related Art As a conventional method for detecting the inclination of a document image, for example, a method of projecting features in various directions to detect a peak which is determined to be most along the line direction (Japanese Patent Laid-Open No. Hei 5). No. 174183)) and a method of obtaining the inclination by comparing the positions of circumscribed rectangles of the character patterns in the same line (see Japanese Patent Application Laid-Open No. 2-44486).
【0003】[0003]
【発明が解決しようとする課題】上記した複数方向に特
徴の射影をとる前者の方法は、特徴のとりかたによって
は正しい角度方向とピークがづれるという問題がある。
また、後者の方法は、傾きが不明な状態で行を検出する
のに時間を要し、加えて、元々異なる文字を比較するの
で正確な位置で比較することができず、傾き検出の精度
が上がらないという問題がある。The former method of projecting a feature in a plurality of directions as described above has a problem that a correct angle direction and a peak are formed depending on how the feature is taken.
In the latter method, it takes time to detect a line in a state where the inclination is unknown, and in addition, since different characters are originally compared, it is not possible to make a comparison at an accurate position, and the accuracy of inclination detection is high. There is a problem that it does not rise.
【0004】本発明の目的は、同一パターンを検出する
方法によって、まず同一パターンを選択し、この位置を
比較することにより、関係のない文字パターン同志の比
較を行わず、高精度にまた効率よく傾きの検出を行う文
書画像の傾き検出方法を提供することにある。An object of the present invention is to first select the same pattern by the method for detecting the same pattern and compare the positions thereof, so that irrelevant character patterns are not compared with each other. An object of the present invention is to provide a document image inclination detection method for detecting inclination.
【0005】[0005]
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像の傾き検出方法
において、該文書画像から文字に相当するパターンを切
り出し、該切り出されたパターン系列において同一文字
に相当する類似パターンに同一のラベルを与え、同一ラ
ベルのパターン間の位置関係を基に画像の傾きを検出す
ることを特徴としている。In order to achieve the above object, according to the invention of claim 1, in a method for detecting a tilt of a document image, a pattern corresponding to a character is cut out from the document image, and the cut pattern is cut out. The feature is that the same label is given to similar patterns corresponding to the same character in the series, and the inclination of the image is detected based on the positional relationship between the patterns having the same label.
【0006】請求項2記載の発明では、同一行に存在す
る同一ラベルのパターン間の位置関係を基に画像の傾き
を検出することを特徴としている。According to the second aspect of the invention, the inclination of the image is detected based on the positional relationship between the patterns of the same label existing in the same row.
【0007】請求項3記載の発明では、同一ラベルのパ
ターン間を結ぶ線分と、他のパターンとの交差を基に、
該同一ラベルのパターンが同一行に存在するか否かを判
定することを特徴としている。According to the third aspect of the invention, based on the intersection of the line segment connecting the patterns of the same label and another pattern,
It is characterized by determining whether or not the patterns of the same label are present in the same row.
【0008】[0008]
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。図1は、本発明の実施例の構
成を示す。図において、101はスキャナなどの画像入
力手段、102は文字パターン切り出し手段、103は
切り出したパターン列の中から類似パターンを抽出する
類似パターン検出手段、104は同一行に所属する類似
パターンを検出する同一行判定手段、105は検出した
同一行内の類似パターン間の角度を検出する手段、10
6は各類似パターンによって求められた角度から画像全
体の角度を決定する角度決定手段、107は各種データ
を記憶する記憶部、108は全体の制御部、109はデ
ータの通信路である。DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be specifically described below with reference to the drawings. FIG. 1 shows the configuration of an embodiment of the present invention. In the figure, 101 is an image input means such as a scanner, 102 is a character pattern cutout means, 103 is a similar pattern detection means for extracting a similar pattern from the cut out pattern sequence, and 104 is a similar pattern belonging to the same row. In-line determination means, 105 is means for detecting angles between detected similar patterns in the same row, 10
Reference numeral 6 is an angle determining unit that determines the angle of the entire image from the angles obtained by the similar patterns, 107 is a storage unit that stores various data, 108 is the overall control unit, and 109 is a data communication path.
【0009】図2は、本発明の処理フローチャートであ
る。まず、スキャナなどの画像入力手段101によって
画像を入力する(ステップ201)。次いで、文字パタ
ーン切り出し手段102は、入力画像から各文字パター
ンを切り出す。この切り出しは、連結する黒画素成分の
うち近接するものを統合するなどして行われる。傾き角
度が不明である場合には、特に日本語では正確な文字切
り出しは難しい。しかし、本発明は文字切り出しが最終
目的ではないし、文字パターンが偏や旁に分離していて
も後の処理で問題にならないので、基本的には連結する
黒画素成分が抽出されればよい。FIG. 2 is a processing flowchart of the present invention. First, an image is input by the image input means 101 such as a scanner (step 201). Next, the character pattern cutout unit 102 cuts out each character pattern from the input image. This clipping is performed by, for example, integrating adjacent black pixel components. If the tilt angle is unknown, it is difficult to accurately extract characters, especially in Japanese. However, in the present invention, the character cutting is not the final purpose, and even if the character pattern is divided into biased or drastically, it does not pose a problem in the subsequent processing, so basically it is only necessary to extract the connected black pixel component.
【0010】次に、類似パターン検出手段103は、こ
の切り出した文字パターン同志を比較して、類似パター
ンを抽出し、ラベリングする(ステップ203)。図3
は、ステップ203の詳細なフローチャートである。ス
テップ303のパターンマッチング方法としては、例え
ば米国特許第5,303,313号公報の段落9で説明
されているテスト方法を用いる。つまり、この方法は、
位置を補正しながらパターンを重ね合わせて差異の出る
画素の現れる位置、現れる画素のパターンによって類似
であるか否かを判定する方法である。このテスト方法に
よって、処理対象のパターンが既存のテンプレートとマ
ッチングしたとき、マッチングしたテンプレートに付け
られているラベルを、処理対象のパターンに付与する
(ステップ304)。マッチングしないときは、処理対
象パターンを新しいテンプレートとして登録して新しい
ラベルを付与する(ステップ305)。なお、ステップ
302において、処理時間を短縮するために、全てのパ
ターンを処理対象とせずに、画像中の所定範囲にあるパ
ターンだけを処理対象としてもよい。Next, the similar pattern detecting means 103 compares the cut-out character patterns with each other, extracts similar patterns, and labels them (step 203). FIG.
Is a detailed flowchart of step 203. As the pattern matching method in step 303, for example, the test method described in paragraph 9 of US Pat. No. 5,303,313 is used. So this method
This is a method of superimposing patterns while correcting the position and determining whether or not they are similar depending on the position of the pixel in which a difference appears and the pattern of the pixel that appears. By this test method, when the pattern to be processed matches the existing template, the label attached to the matched template is added to the pattern to be processed (step 304). If they do not match, the pattern to be processed is registered as a new template and a new label is added (step 305). In step 302, in order to reduce the processing time, all the patterns may not be the processing targets, and only the patterns in the predetermined range in the image may be the processing targets.
【0011】類似パターンのラベリングが済んだら、同
一行判定手段104は、同一行内にある類似パターンを
検出する(ステップ204)。図4は、同一行内にある
類似パターンの検出を説明する図であり、図5は、ステ
ップ204の詳細なフローチャートである。After the labeling of the similar patterns is completed, the same line determination means 104 detects the similar patterns in the same line (step 204). FIG. 4 is a diagram for explaining detection of similar patterns in the same row, and FIG. 5 is a detailed flowchart of step 204.
【0012】まず、類似パターンとして抽出されたペア
を選択する(ステップ501)。図4において、401
と402が同一ラベルを付与された類似パターンである
とする。先のステップ203の処理においてパターンマ
ッチングを行うときには、パターンの重ね合わせの位置
を合わせるために、パターンの中心位置を求めている。
404は、類似パターン401と402のパターン中心
位置を結んだ線分である。また、405、406は、そ
れぞれパターン401とパターン402の外接矩形の左
上頂点同志を接続した線分、左下頂点同志を接続した線
分である。そして、この線分405および406と交差
する矩形を検出する(ステップ503)。この矩形は、
図4では410、411、412である。ここで、矩形
411は現在の処理対象パターン401に比べてかなり
小さいので、このような矩形は処理対象外としてもよ
い。First, a pair extracted as a similar pattern is selected (step 501). In FIG.
Let 402 be a similar pattern with the same label. When pattern matching is performed in the processing of step 203, the center position of the pattern is obtained in order to match the position of pattern superposition.
A line segment 404 connects the pattern center positions of the similar patterns 401 and 402. Further, 405 and 406 are line segments connecting the upper left apexes of the circumscribed rectangles of the pattern 401 and the pattern 402 and the lower left apexes of the circumscribed rectangles, respectively. Then, a rectangle intersecting the line segments 405 and 406 is detected (step 503). This rectangle is
In FIG. 4, they are 410, 411 and 412. Here, since the rectangle 411 is considerably smaller than the current processing target pattern 401, such a rectangle may be excluded from the processing target.
【0013】次に、これら交差矩形の内、類似パターン
の中心を結ぶ線分404と交差しない矩形を検出する
(ステップ504)。図4の例では、矩形410、41
1、412は共に交差するので、該当するものはない。
このとき、類似パターン401と402のペアは同一行
であると判定され、同一行所属パターンペアのリストに
登録される(ステップ505)。Next, of these intersecting rectangles, a rectangle that does not intersect the line segment 404 connecting the centers of similar patterns is detected (step 504). In the example of FIG. 4, rectangles 410 and 41
Since 1 and 412 intersect together, there is no corresponding one.
At this time, the pair of similar patterns 401 and 402 is determined to be in the same row, and is registered in the same row belonging pattern pair list (step 505).
【0014】再びステップ501に戻って、次の類似パ
ターンのペアが選択される。ここではパターン401と
403が類似パターンであるとする。407は類似パタ
ーン401と403のパターン中心位置を結んだ線分で
ある。また、408と409は、パターン401と40
3の外接矩形の左上頂点同志、左下頂点同志を接続した
線分である。上記したと同様に、線分408および40
9と交差する矩形を検出し(ステップ503)、このう
ち、線分407と交差しない矩形を検出する(ステップ
504)。該当する矩形として矩形413が検出された
ので、パターン401とパターン403のペアを同一行
とはしない(ステップ506)。以上の処理を繰り返す
ことによって同一行に存在するパターンのペアを検出す
ることができる。Returning again to step 501, the next pair of similar patterns is selected. Here, it is assumed that the patterns 401 and 403 are similar patterns. A line segment 407 connects the pattern center positions of the similar patterns 401 and 403. Also, 408 and 409 are patterns 401 and 40.
It is a line segment connecting the upper left vertex and the lower left vertex of the circumscribed rectangle of No. 3. Line segments 408 and 40 as described above
A rectangle that intersects 9 is detected (step 503), and a rectangle that does not intersect the line segment 407 is detected (step 504). Since the rectangle 413 is detected as the corresponding rectangle, the pair of the pattern 401 and the pattern 403 is not set in the same row (step 506). By repeating the above process, it is possible to detect a pair of patterns existing in the same row.
【0015】図1、2に戻って、パターン間角度検出手
段105は、検出された同一行の類似パターン間の角度
を検出する(ステップ205)。図4の例では、線分4
04などのパターン中心間を結ぶ線分の角度である。各
パターンペアの角度が求められたら、全体角度決定手段
106は画像全体の角度を決定する(ステップ20
6)。これは、ステップ205で求めた角度の平均値、
中央値などをとって画像全体の角度とする。Returning to FIGS. 1 and 2, the inter-pattern angle detecting means 105 detects the detected angle between similar patterns in the same row (step 205). In the example of FIG. 4, line segment 4
This is the angle of the line segment connecting the pattern centers such as 04. When the angle of each pattern pair is obtained, the overall angle determination means 106 determines the angle of the entire image (step 20).
6). This is the average value of the angles obtained in step 205,
The median is taken as the angle of the entire image.
【0016】なお、上記した実施例では専用の各処理手
段を持つ構成を採っているが、本発明はこれに限定され
るものではなく、手段102〜106および108を1
つのCPUで構成して、処理することも可能である。Although the above-mentioned embodiment adopts a constitution having dedicated processing means, the present invention is not limited to this, and means 102 to 106 and 108 are
It is also possible to configure and process with one CPU.
【0017】[0017]
【発明の効果】以上、説明したように、請求項1記載の
発明によれば、同じ形のパターン間の位置だけを比較し
ているので、より正確に傾き角度を検出することができ
る。As described above, according to the first aspect of the invention, only the positions of the patterns having the same shape are compared, so that the tilt angle can be detected more accurately.
【0018】請求項2記載の発明によれば、同一行のパ
ターン間のみを比較しているので、より正確に傾き角度
を検出することができる。According to the second aspect of the present invention, since only the patterns in the same row are compared, the tilt angle can be detected more accurately.
【0019】請求項3記載の発明によれば、簡単な処理
で当該パターンが同一行に存在するか否かを判断するこ
とができるので、処理速度が向上する。According to the third aspect of the present invention, it is possible to determine whether or not the pattern exists in the same row by a simple process, so that the processing speed is improved.
【図1】本発明の実施例の構成である。FIG. 1 is a configuration of an embodiment of the present invention.
【図2】本発明の処理フローチャートである。FIG. 2 is a processing flowchart of the present invention.
【図3】図2のステップ203の詳細なフローチャート
である。3 is a detailed flowchart of step 203 of FIG.
【図4】同一行内にある類似パターンの検出を説明する
図である。FIG. 4 is a diagram illustrating detection of similar patterns in the same row.
【図5】図2のステップ204の詳細なフローチャート
である。5 is a detailed flowchart of step 204 of FIG.
101 画像入力手段 102 文字パターン切り出し手段 103 類似パターン検出手段 104 同一行判定手段 105 パターン間角度検出手段 106 全体角度決定手段 107 データ記憶部 108 制御部 109 データ通信路 101 Image Input Means 102 Character Pattern Cutting Means 103 Similar Pattern Detecting Means 104 Same Line Judging Means 105 Inter-Pattern Angle Detecting Means 106 Overall Angle Determining Means 107 Data Storage Unit 108 Control Unit 109 Data Communication Channel
Claims (3)
書画像から文字に相当するパターンを切り出し、該切り
出されたパターン系列において同一文字に相当する類似
パターンに同一のラベルを与え、同一ラベルのパターン
間の位置関係を基に画像の傾きを検出することを特徴と
する文書画像の傾き検出方法。1. A method of detecting a tilt of a document image, wherein a pattern corresponding to a character is cut out from the document image, the same label is given to similar patterns corresponding to the same character in the cut-out pattern series, and a pattern of the same label is given. A method for detecting the inclination of a document image, which comprises detecting the inclination of the image based on the positional relationship between them.
間の位置関係を基に画像の傾きを検出することを特徴と
する請求項1記載の文書画像の傾き検出方法。2. The skew detection method for a document image according to claim 1, wherein the skew of the image is detected based on a positional relationship between patterns of the same label existing in the same row.
他のパターンとの交差を基に、該同一ラベルのパターン
が同一行に存在するか否かを判定することを特徴とする
請求項2記載の文書画像の傾き検出方法。3. A line segment connecting patterns having the same label,
3. The method for detecting the inclination of a document image according to claim 2, wherein it is determined whether or not the pattern with the same label exists in the same row based on the intersection with another pattern.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26422095A JP3541093B2 (en) | 1995-10-12 | 1995-10-12 | Document image inclination detection method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26422095A JP3541093B2 (en) | 1995-10-12 | 1995-10-12 | Document image inclination detection method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09106436A true JPH09106436A (en) | 1997-04-22 |
JP3541093B2 JP3541093B2 (en) | 2004-07-07 |
Family
ID=17400171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26422095A Expired - Fee Related JP3541093B2 (en) | 1995-10-12 | 1995-10-12 | Document image inclination detection method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3541093B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760233A (en) * | 2011-04-25 | 2012-10-31 | 夏普株式会社 | Image processing apparatus |
-
1995
- 1995-10-12 JP JP26422095A patent/JP3541093B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760233A (en) * | 2011-04-25 | 2012-10-31 | 夏普株式会社 | Image processing apparatus |
JP2012230480A (en) * | 2011-04-25 | 2012-11-22 | Sharp Corp | Image processor |
US8705862B2 (en) | 2011-04-25 | 2014-04-22 | Sharp Kabushiki Kaisha | Image processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP3541093B2 (en) | 2004-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7627148B2 (en) | Image data processing apparatus and method, and image data processing program | |
EP1742169A2 (en) | Tracking apparatus | |
JP2000011089A (en) | Binarizing method for optical character recognition system | |
JPH0728937A (en) | Image extracting device | |
US6885770B2 (en) | Irradiation field extracting method and apparatus and recording medium | |
JPH09106436A (en) | Inclination detecting method for document picture | |
CN113312936A (en) | Image positioning identification recognition method and server | |
JPH0634233B2 (en) | Hierarchical structural template matching method | |
JP3311551B2 (en) | Image data input processing method and apparatus | |
JPH07220081A (en) | Segmenting method for graphic of image recognizing device | |
JP3074691B2 (en) | Character recognition device | |
JPH08279021A (en) | Method for detecting angle of rotation and recognizing image | |
KR100533209B1 (en) | Method for detecting image | |
JPH0688707A (en) | Method and apparatus for detecting position | |
JPH09114990A (en) | Image recognizing method | |
JPH07118016B2 (en) | Figure recognition device | |
CN115171123A (en) | Text processing method and device, storage medium and computer equipment | |
JP2569132B2 (en) | How to determine special character lines | |
JP3349243B2 (en) | String reader | |
JP2000057348A (en) | Method and device for recognizing pattern | |
JP2001307101A (en) | Method for detecting specific image | |
JP2001216473A (en) | Method and device for processing image and recording medium | |
JPH09106437A (en) | Device and method for segmenting character | |
JPH05223877A (en) | Defect sensing and tye acknowleging system for printed circuit board using graph information | |
JPH0198076A (en) | Pattern detecting device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040329 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080402 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090402 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090402 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100402 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100402 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110402 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120402 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140402 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |