JP3712825B2 - Image processing method, apparatus, and recording medium - Google Patents
Image processing method, apparatus, and recording medium Download PDFInfo
- Publication number
- JP3712825B2 JP3712825B2 JP11932897A JP11932897A JP3712825B2 JP 3712825 B2 JP3712825 B2 JP 3712825B2 JP 11932897 A JP11932897 A JP 11932897A JP 11932897 A JP11932897 A JP 11932897A JP 3712825 B2 JP3712825 B2 JP 3712825B2
- Authority
- JP
- Japan
- Prior art keywords
- inclination
- document
- feature
- calculated
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、文書の傾きを精度よく検出する画像処理方法、装置および記録媒体に関する。
【0002】
【従来の技術】
従来、文字認識処理などにおいては、文書画像が傾いて入力される場合があるが、その傾きが多少であれば傾きを修正することなく認識を実行することができる。しかし、画像の傾きが大きい場合には、認識の前処理としてその傾きを修正する必要がある。
【0003】
このような文書画像の傾きを検出する方法として、本出願人は先に幾つかの方法を提案した。その一つの方法は、特開平7−141465号公報に記載された方法で、文字列の外接矩形について、近傍の矩形間を結ぶ直線の傾きのヒストグラムから文書画像の傾きおよび傾きの確信度を求める。
【0004】
また、他の方法として、特開平7−105310号公報に記載された、画像傾き検出方法及び表処理方法であり、この方法では、罫線の外接矩形を求め、矩形内の黒ランの並びから傾きを計算する。
【0005】
【発明が解決しようとする課題】
上記した第1の方法では、傾きがない場合を基準として文字列の矩形情報を抽出するので、傾き検出対象文書の傾きが大きい場合には、文字の外接矩形を適切に抽出するのが困難であった。この場合、抽出された矩形特徴から文書が大きく傾いていることを判別することができるが、計算された傾きの信頼度が低くなる可能性がある。また、上記した第2の方法も同様に、傾きの大きい場合に計算された傾きの信頼性が必ずしも高いとはいえない。
【0006】
本発明の目的は、傾き検出対象文書の傾きが大きいと判定された場合には、既に得られている粗い傾きを基準として、文字列、罫線の矩形情報を再抽出することにより、高精度の矩形情報と、信頼性の高い傾き検出値を得ることができる画像処理方法、装置および記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、文書画像中の文書構成要素の特徴を抽出し、該特徴を基に前記文書画像の傾きを算出し、該算出された傾きが所定の閾値を超えるか否かを判定し、前記算出された傾きが所定の閾値以下のとき、前記算出された傾きを文書画像の傾きと決定し、前記算出された傾きが所定の閾値を超えるとき、前記傾きを基に前記文書画像から再度特徴を抽出し、再抽出された特徴を基に前記文書画像の傾きを算出することを特徴としている。
【0008】
請求項2記載の発明では、前記文書構成要素の特徴として、文字列の外接矩形を用いることを特徴としている。
【0009】
請求項3記載の発明では、文書画像中の文書構成要素の特徴を抽出する手段と、該特徴を基に前記文書画像の傾きを算出する手段と、該算出された傾きが所定の閾値を超えるか否かを判定する手段と、前記算出された傾きが所定の閾値以下のとき、前記算出された傾きを文書画像の傾きと決定する手段と、前記算出された傾きが所定の閾値を超えるとき、前記傾きを基に前記文書画像から再度特徴を抽出する手段と、再抽出された特徴を基に前記文書画像の傾きを算出する手段を備えたことを特徴としている。
【0010】
請求項4記載の発明では、前記文書構成要素の特徴として、文字列の外接矩形を用いることを特徴としている。
【0011】
請求項5記載の発明では、請求項1または2記載の画像処理方法をコンピュー夕に実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
【0012】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
図1は、本発明の実施例の構成を示す。図において、101は画像入力手段、102は文書構成要素の位置特徴抽出手段、103は傾き決定手段、104は大傾き判定手段、105はデータ記憶部、106は各処理の制御部、107はデータ転送路および制御通信路である。
【0013】
図2は、本発明の処理フローチャートである。以下、図2を参照しながら本発明の処理動作を説明する。
まず、画像入力手段101によって文書画像を得る(ステップ201)。この画像入力手段としては、スキャナ、ファックスなどでもよく、また既に電子ファイリングされている文書画像を利用してもよい。
【0014】
次に、文書構成要素の位置特徴抽出手段102によって文書中の罫線、文字列などの文書構成要素の位置特徴を抽出する(ステップ202)。図3は、文書構成要素の位置特徴の抽出例を示す。この例では、文書構成要素の位置特徴として文字列の外接矩形情報を利用している。まず、文字列の外接矩形を抽出する。図3において、301は文書中の文字列であり、302は抽出された文字列の外接矩形である。この外接矩形の抽出方法としては、例えば前掲した公報(特開平7−141465号)に記載の公知技術(黒画素の連結成分を抽出し、その外接矩形を求める方法)を用いればよい。
【0015】
次に、傾き決定手段103は、文書画像の傾きを検出する(ステップ203)。この傾き検出方法として、前掲した公報(特開平7−141465号)に記載の公知技術を用いればよい。すなわち、黒画素連結成分の外接矩形を求め、該外接矩形から文字列に相当する矩形を判別し、判別された各矩形において複数の基準点を設定し、近傍矩形の基準点間を結ぶ直線の傾きのヒストグラムに基づいて画像の傾きを検出する。
【0016】
そして、大傾き判定手段104は、検出された傾きが大きいか否かを判定する(ステップ204)。この大きい傾きか否かは、予め基準となる角度を閾値として決めておき、この閾値との比較によって判定する。ステップ204の判定の結果、傾きが大きくないとき、計算された角度を文書の傾きと決定して、処理を終了する。
【0017】
一方、ステップ204で、傾きが大きいと判定されたとき、前掲した公報の方法で得られた角度は、文書の傾きを概ね反映したものになってはいるが、その信頼性はさほど高くはない。これは、図3に示すように、外接矩形の抽出が不十分であるからである。つまり、上記した方法では、傾き0を基準として矩形抽出を行っているために、傾きが大きい場合には矩形抽出が必ずしも正確に行われないためである。
【0018】
そこで、本発明では、ステップ203で得られた、文書の傾きを概ね反映した角度を利用し、文書構成要素の位置特徴抽出手段102により文書構成要素の位置特徴(文字列の外接矩形など)を再度抽出する(ステップ205)。再抽出された文字列の外接矩形を図4に示す。図中、401は、文書中の文字列であり、402は、抽出された文字列の外接矩形を示す。再抽出された特徴を基に、傾き決定手段103は、傾きを再計算する(ステップ206)。
【0019】
上記した実施例では、文書構成要素の位置特徴として文字列の外接矩形を用いたが、位置特徴として罫線の外接矩形を利用することができる。罫線の外接矩形を利用する場合も同様に、傾きが大きいと判断されたときには、罫線の外接矩形を再抽出し、傾きを計算し直すことにより、正確な傾きを求めることができる。
【0020】
また、本発明は上記した実施例に限定されず、ソフトウェアによっても実現することができる。本発明をソフトウェアによって実現する場合には、図5に示すように、CPU、ROM、RAM、表示装置、ハードディスク、キーボード、CD−ROMドライブ、スキャナなどからなる汎用の処理装置を用意し、CD−ROMなどのコンピュータ読み取り可能な記録媒体には、本発明の画像処理機能を実現するプログラムが記録されている。また、スキャナから入力された文書画像は一時的にハードディスクなどに格納される。そして、該プログラムが起動されると、一時保存された文書画像データが読み込まれて、画像処理を実行して、その傾き検出結果が文字認識処理プログラムなどにわたされる。
【0021】
【発明の効果】
以上、説明したように、本発明によれば、文書画像の傾きが所定の閾値を超えると判定されたとき、文書構成要素の特徴を再度抽出し、再抽出された特徴を基に傾きを求めているので、傾きが大きい文書の傾きを精度よく検出することができる。
【図面の簡単な説明】
【図1】 本発明の実施例の構成を示す。
【図2】 本発明の処理フローチャートを示す。
【図3】 文書構成要素の位置特徴の抽出例を示す。
【図4】 文書構成要素の位置特徴を再度抽出した例を示す。
【図5】 本発明をソフトウェアによって実現する場合の構成例を示す。
【符号の説明】
101 画像入力手段
102 文書構成要素の位置特徴抽出手段
103 傾き決定手段
104 大傾き判定手段
105 データ記憶部
106 制御部
107 データ転送路および制御通信路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing method, apparatus, and recording medium for accurately detecting the tilt of a document.
[0002]
[Prior art]
Conventionally, in character recognition processing and the like, a document image may be input with an inclination, but if the inclination is slight, recognition can be executed without correcting the inclination. However, when the inclination of the image is large, it is necessary to correct the inclination as preprocessing for recognition.
[0003]
As a method for detecting the inclination of the document image, the present applicant has previously proposed several methods. One of the methods is a method described in Japanese Patent Laid-Open No. 7-141465, and for the circumscribed rectangle of a character string, the inclination of the document image and the certainty of the inclination are obtained from the histogram of the inclination of the straight line connecting the neighboring rectangles. .
[0004]
Another method is an image inclination detection method and a table processing method described in Japanese Patent Application Laid-Open No. 7-105310. In this method, a circumscribed rectangle of a ruled line is obtained, and the inclination is determined from the arrangement of black runs in the rectangle. Calculate
[0005]
[Problems to be solved by the invention]
In the first method described above, the rectangle information of the character string is extracted based on the case where there is no inclination. Therefore, when the inclination of the inclination detection target document is large, it is difficult to appropriately extract the circumscribed rectangle of the character. there were. In this case, it can be determined from the extracted rectangular feature that the document is greatly inclined, but the reliability of the calculated inclination may be lowered. Similarly, the above-described second method does not necessarily have high reliability of the slope calculated when the slope is large.
[0006]
An object of the present invention is to extract high-accuracy by re-extracting character string and ruled line rectangle information on the basis of the already obtained rough inclination when it is determined that the inclination of the inclination detection target document is large. An object of the present invention is to provide an image processing method, apparatus, and recording medium capable of obtaining rectangular information and a highly reliable tilt detection value.
[0007]
[Means for Solving the Problems]
In order to achieve the above object, according to the first aspect of the present invention, a feature of a document component in a document image is extracted, a tilt of the document image is calculated based on the feature, and the calculated tilt is predetermined. When the calculated inclination is less than or equal to a predetermined threshold value, the calculated inclination is determined as the inclination of the document image, and the calculated inclination exceeds the predetermined threshold value The feature is extracted again from the document image based on the tilt, and the tilt of the document image is calculated based on the re-extracted feature.
[0008]
The invention according to claim 2 is characterized in that a circumscribed rectangle of a character string is used as a feature of the document component.
[0009]
According to the third aspect of the present invention, means for extracting the characteristics of the document constituent element in the document image, means for calculating the inclination of the document image based on the characteristics, and the calculated inclination exceeds a predetermined threshold value Means for determining whether or not the calculated inclination is equal to or less than a predetermined threshold , and means for determining the calculated inclination as an inclination of the document image; and when the calculated inclination exceeds a predetermined threshold , And means for re-extracting features from the document image based on the inclination, and means for calculating the inclination of the document image based on the re-extracted features.
[0010]
The invention described in claim 4 is characterized in that a circumscribed rectangle of a character string is used as a feature of the document component.
[0011]
The invention described in claim 5 is a computer-readable recording medium storing a program for realizing the image processing method described in
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 shows the configuration of an embodiment of the present invention. In the figure, 101 is an image input means, 102 is a document component position feature extraction means, 103 is an inclination determination means, 104 is a large inclination determination means, 105 is a data storage section, 106 is a control section for each process, and 107 is data. A transfer path and a control communication path.
[0013]
FIG. 2 is a process flowchart of the present invention. The processing operation of the present invention will be described below with reference to FIG.
First, a document image is obtained by the image input means 101 (step 201). The image input means may be a scanner, a fax machine, or a document image that has already been electronically filed.
[0014]
Next, the position features of the document components such as ruled lines and character strings in the document are extracted by the document component location feature extraction means 102 (step 202). FIG. 3 shows an example of extracting the position feature of the document component. In this example, circumscribed rectangle information of a character string is used as the position feature of the document component. First, the circumscribed rectangle of the character string is extracted. In FIG. 3, 301 is a character string in the document, and 302 is a circumscribed rectangle of the extracted character string. As a method for extracting the circumscribed rectangle, for example, a known technique (a method for extracting a connected component of black pixels and obtaining the circumscribed rectangle) described in the above-mentioned publication (Japanese Patent Laid-Open No. 7-141465) may be used.
[0015]
Next, the inclination determination unit 103 detects the inclination of the document image (step 203). As this inclination detection method, a known technique described in the above-mentioned publication (Japanese Patent Laid-Open No. 7-141465) may be used. That is, a circumscribed rectangle of a black pixel connected component is obtained, a rectangle corresponding to a character string is determined from the circumscribed rectangle, a plurality of reference points are set in each determined rectangle, and a straight line connecting between reference points of neighboring rectangles is set. The inclination of the image is detected based on the inclination histogram.
[0016]
Then, the large
[0017]
On the other hand, when it is determined in
[0018]
Therefore, in the present invention, the position characteristic of the document constituent element (such as a circumscribing rectangle of the character string) is obtained by the position characteristic extraction means 102 of the document constituent element by using the angle that largely reflects the inclination of the document obtained in
[0019]
In the above-described embodiment, the circumscribed rectangle of the character string is used as the position feature of the document component, but the circumscribed rectangle of the ruled line can be used as the position feature. Similarly, when the circumscribed rectangle of the ruled line is used, when it is determined that the inclination is large, the circumscribed rectangle of the ruled line is re-extracted and the inclination is recalculated, thereby obtaining an accurate inclination.
[0020]
The present invention is not limited to the above-described embodiments, and can be realized by software. When the present invention is realized by software, as shown in FIG. 5, a general-purpose processing device including a CPU, a ROM, a RAM, a display device, a hard disk, a keyboard, a CD-ROM drive, a scanner, etc. is prepared. A program that realizes the image processing function of the present invention is recorded on a computer-readable recording medium such as a ROM. The document image input from the scanner is temporarily stored in a hard disk or the like. When the program is started, the temporarily stored document image data is read, image processing is executed, and the inclination detection result is passed to a character recognition processing program or the like.
[0021]
【The invention's effect】
As described above, according to the present invention, when it is determined that the inclination of the document image exceeds the predetermined threshold, the feature of the document component is extracted again, and the inclination is obtained based on the re-extracted feature. Therefore, it is possible to accurately detect the inclination of a document having a large inclination.
[Brief description of the drawings]
FIG. 1 shows a configuration of an embodiment of the present invention.
FIG. 2 shows a processing flowchart of the present invention.
FIG. 3 shows an example of extracting a position feature of a document component.
FIG. 4 shows an example in which the position features of document components are extracted again.
FIG. 5 shows a configuration example when the present invention is realized by software.
[Explanation of symbols]
DESCRIPTION OF
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11932897A JP3712825B2 (en) | 1997-05-09 | 1997-05-09 | Image processing method, apparatus, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11932897A JP3712825B2 (en) | 1997-05-09 | 1997-05-09 | Image processing method, apparatus, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10307890A JPH10307890A (en) | 1998-11-17 |
JP3712825B2 true JP3712825B2 (en) | 2005-11-02 |
Family
ID=14758761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11932897A Expired - Fee Related JP3712825B2 (en) | 1997-05-09 | 1997-05-09 | Image processing method, apparatus, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3712825B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100843085B1 (en) * | 2006-06-20 | 2008-07-02 | 삼성전자주식회사 | Method of building gridmap in mobile robot and method of cell decomposition using it |
-
1997
- 1997-05-09 JP JP11932897A patent/JP3712825B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10307890A (en) | 1998-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7738734B2 (en) | Image processing method | |
JP5600723B2 (en) | Method and system for splitting characters in a text line having various character widths | |
US7627136B2 (en) | Information embedding device, information detecting device, information embedding and detecting system, information embedding method, information detecting method, information embedding program, information detecting program, information embedding and detecting program, and recording medium | |
JP2000251082A (en) | Document image inclination detecting device | |
JP3099771B2 (en) | Character recognition method and apparatus, and recording medium storing character recognition program | |
US7319776B2 (en) | Image processing method and image processing program | |
JP3712825B2 (en) | Image processing method, apparatus, and recording medium | |
JP3618926B2 (en) | Document image tilt detection method | |
JPH10162102A (en) | Character recognition device | |
JP3281469B2 (en) | Document image inclination detecting method and apparatus | |
JP2630261B2 (en) | Character recognition device | |
JP3932201B2 (en) | Form type identification device and recording medium | |
JP3055484B2 (en) | Character recognition apparatus and method | |
JP2003187249A (en) | Method for detecting and correcting inclination of image | |
JP3381803B2 (en) | Tilt angle detector | |
JP3000480B2 (en) | Character area break detection method | |
JP3756660B2 (en) | Image recognition method, apparatus and recording medium | |
JPS63101983A (en) | Character string extracting system | |
JPH10240863A (en) | Method for detecting timing mark and storage medium therefor | |
JP3190794B2 (en) | Character segmentation device | |
JP3220226B2 (en) | Character string direction determination method | |
JP2753094B2 (en) | Word segmentation device | |
JP2005038137A (en) | Image processing method, program, and recording medium | |
JPS62200486A (en) | Character reader | |
CN112801090A (en) | Character area detection method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080826 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090826 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090826 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100826 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100826 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110826 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110826 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120826 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120826 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130826 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |