JP3850995B2 - Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method - Google Patents

Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method Download PDF

Info

Publication number
JP3850995B2
JP3850995B2 JP24651998A JP24651998A JP3850995B2 JP 3850995 B2 JP3850995 B2 JP 3850995B2 JP 24651998 A JP24651998 A JP 24651998A JP 24651998 A JP24651998 A JP 24651998A JP 3850995 B2 JP3850995 B2 JP 3850995B2
Authority
JP
Japan
Prior art keywords
character
document image
region
image processing
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP24651998A
Other languages
Japanese (ja)
Other versions
JP2000067158A (en
Inventor
高志 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP24651998A priority Critical patent/JP3850995B2/en
Publication of JP2000067158A publication Critical patent/JP2000067158A/en
Application granted granted Critical
Publication of JP3850995B2 publication Critical patent/JP3850995B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,入力された文書画像を認識する文書画像認識システムなどに利用され,特に,文書画像から文字領域を抽出する際に,抽出した文字領域の過剰統合を修正する文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来,文書画像を入力し,その文書画像から文字認識処理を行ったり,各種レアウト情報を取得するには,文字領域や図形領域・その他の領域などの領域抽出処理を行う必要がある。
【0003】
このような,領域抽出処理を行う参考技術文献として,『印刷文書認識システム AutoReco/2 −イメージプロセス−』(情報処理学会第47回(平成5年後期)全国大会2−97〜98)が開示されている。ここでは,特に,コラム境界線を検出し,文字列要素を領域へ統合している(これを第1の従来技術という)。
【0004】
また,ページ全体の段組状態を検出し,それに応じて文字領域を抽出する技術が特開平9−44594号公報の『文書画像の領域分割方法および段組種類判別方法』に開示されている(これを第2の従来技術という)。
【0005】
【発明が解決しようとする課題】
しかしながら,上記に示されるような従来の技術にあっては,以下のような問題点があった。まず,第1の従来技術にあっては,新聞などで図のキャプションと本文とが近接している場合には過剰統合が生じてしまうことがある。その具体例を図7に示す。図7においてキャプション704が本文と近いため,誤って703のようなかたちで1つの領域として抽出されてしまう。
【0006】
また,第2の従来技術に開示されている方法では,新聞などように文字要素が密な場合,初期の段階では明確な段組みが検出されず,近傍文字要素を統合することで文字領域を抽出することになってしまう。つまり,図7に示すように近接した場合に過剰統合が生じる。
【0007】
また,第1の従来技術に開示されている方法でも,近接した文字要素は初期段階でグループ化されるため,段のエッジ部分が検出されなくなってしまう。また,このような場合でも段のエッジ部分を検出するようにすると,本来のエッジ以外に多数の擬似エッジが検出され,文字領域の抽出が全体として煩雑になってしまう。
【0008】
本発明は,上記に鑑みてなされたものであって,文書画像から文字領域を抽出する際に,異なる文字領域に属する文字同士が近接していても,正しく文字領域を抽出することを目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するために,請求項1に係る文書画像処理方法にあっては,文書画像における文字要素を統合し行を生成し,前記生成した行を統合することで文字領域を抽出し,前記文字領域を抽出するための行の統合を修正する文書画像処理方法において,前記文字領域から段組の位置情報を抽出する段組情報抽出工程と,前記文字領域の領域幅の出現頻度に基づいて段幅を推定する段幅推定工程と,前記推定した段幅に対応する文字領域における前段組の位置情報と前記推定した段幅に基づいて修正候補領域を抽出する工程と,前記修正候補領域を前記対応する文字領域内の段の位置に対応する強制分割位置を用いて分割する領域修正工程と,を含むものである。
【0010】
また,請求項2に係る文書画像処理方法にあっては,請求項1の文書画像処理方法において,前記領域修正工程は,前記段組情報抽出工程で抽出された段の位置情報から推定した段幅に合致する領域と同じ段に所属すべき候補領域を検出し,該領域内の文字あるいは文字列要素を,段の位置を参照しながら再度文字領域へ統合する際に,前記段に沿った強制分割位置を仮定し,この分割位置より外側では前記抽出した段幅に合致する領域と同じ段に所属すべき候補領域の方向と垂直な方向によって構成される文字領域を最初に生成し,その後に当該文字領域の評価を行うものである。
【0012】
また,請求項に係る機械読み取り可能な記録媒体にあっては,前記請求項1または2に記載の文書画像処理方法をコンピュータに実行させるプログラムを記録したものである。
【0013】
【発明の実施の形態】
以下,本発明の文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体について添付図面を参照し,詳細に説明する。
【0014】
(システムの構成)
図1は,本発明の実施の形態に係る文書画像処理方法を適用したシステムの構成を示すブロック図である。図において,101はCCD搭載のスキャナあるいはファクシミリ装置などを用い,文書を含む原稿を光学的に2値画像として読み取り,入力する画像入力部である。また,画像入力部101の具体的な手段として,ネットワーク経由(後述するデータ通信部110による)で別の機器から文書画像を取得するようにしてもよい。
【0015】
ネットワーク経由で画像を取り込む場合は,例えば,予め用意されたブラウザ機能(WWW(world wide web)ブラウザ機能とする)を用いてインターネット上に分散する広域のデータ資源(WWWサーバ上のアクセス情報の一つであるURL(Uniform Resource Locator)で特定されるHTML(Hyper Text Markup Language:WWW(world wide web:ハイパーテキストを使用したインターネットの情報サービス)用の文書記述言語)などの言語によるデータをブラウズする。
【0016】
また,102は画像入力部101によって入力された画像を縮小する画像縮小部,103は画像縮小部102で縮小された画像から文字要素を抽出する基本要素抽出部,104は文字領域を抽出する文字領域抽出部,105は文字領域抽出部104によって抽出された文字領域などから段組を検出する段組検出部,106は後述する文字領域修正処理を実行する文字領域修正部,107は本システム全体を所定の制御プログラムに基づいて統括的に制御する制御部,108は入力された文書データやレイアウト情報などの各種データを記憶しておくためのデータ記憶部,109はデータ通信路,110は例えば,TCP(Transmission Control Protocol)/IP(Internet Protocol)プロトコルに従ってネットワーク通信を行うように構成されたデータ通信部である。
【0017】
(システムの動作)
次に,以上のように構成されたシステムにおける文書画像処理動作について説明する。図2は,本発明の実施の形態に係る文書画像処理方法の手順を示すフローチャートである。まず,画像入力部101により対象の文書画像を入力する(S201)。さらに,この入力された文書画像を画像縮小部102で縮小する(S202)。
【0018】
この場合,例えば,8×8画素を1画素にOR圧縮することにより,文字を構成する黒画素が文字列方向に連結した状態となる。この連結成分の外接矩形を抽出して基本要素とする。この基本要素は1文字あるいは文字列の一部の場合もあれば,表などはそれだけで一つの大きな基本要素となる。
【0019】
続いて,上記基本要素を文字,表,図その他などに分類し,また,文字要素は統合して行を生成し,行は統合して領域を抽出する(S203)。なお,この処理の流れは,本発明者が先に特開平9−44594号公報で提案している。
【0020】
続いて,段組み情報を抽出する(S204)。この段組みについて図3および図4を用いて説明する。抽出した文字領域の行方向に沿った長さを「領域幅」,該「領域幅」と垂直な方向の長さを「領域高さ」とする。ここで,「領域高さ」が予め設定した閾値以上のものについて「領域幅」のヒストグラムを作成する。
【0021】
つまり,図3の場合,301〜304が閾値以上の高さの文字領域となる。このヒストグラムを図4に示す。図4のヒストグラムにおいて,総度数に対して高い比率の頻度を持つクラスがあった場合,それを「段幅」とする。図4では90〜120の幅のクラスがこれに相当する。そして,図3では301〜303がこれに相当する。
【0022】
このとき,「段幅」の取り得る範囲に制限を設けてもよい。例えば図4に示す例では,80〜170がその範囲であるとすれば,たとえ30〜60のクラスの頻度が高くても段幅としては採用されず,最終的に段幅は未定となる。なお,先の特開平9−44594号公報の方法では,文字要素の分布から整合の取れた段組み状態を検出しており,この検出した段組み情報を流用してもよい。
【0023】
さて,段組み情報が抽出できたならば,続いて,その段組み情報を利用した文字領域の修正を実行する(S205)。この文字領域の修正処理の詳細について図5のフローチャートに示す。
【0024】
図5において,まず,推定段幅に合致する領域を検出する(S501)。図7に示す例では702に該当する。続いて,ステップS501で検出した領域と同じ段に所属すべき候補領域,つまり修正対象候補を検出する(S502)。この場合,領域の上端あるいは下端が揃っており,かつ幅がそれほど変わらない領域が候補領域となる。また,キャプションの融合を想定する場合は,近傍に図領域が存在することも条件の一つとなる。図7に示す例では703が該当する。
【0025】
上述の如く候補領域が検出されたならば,次にステップS503を実行する。すなわち,その候補領域を構成する文字要素を使用して再び文字領域の抽出を行う。このとき,段に沿った強制分割位置(図6参照)を仮定し,それより外側では基準行方向と垂直方向に行の生成および領域の生成を実行する。図7の該当箇所を拡大したものが図6である。強制分割位置に対して段外側の601の要素を使って行602と603を生成する。そして,上記生成した行における整合度を算出する(S503)。
【0026】
続いて,予め設定した閾値以上の整合度となる場合には,この領域を正式なものとし,残りの強制分割位置より段内側の文字要素を使用し,もう一方の文字領域を生成する(S504)。行の整合度としては,各文字要素の重心の回帰直線の傾きであるとか,要素間距離の分散などを利用することができる。また,図6に示すように段外側で複数行生成される場合には,その行の高さ(図6で上下方向)の差に反比例するような値を整合度としてもよい。
【0027】
したがって,以上述べてきたような処理動作によって,図7に示すような図のキャプションと本分とが近接している場合であっても正確な領域の抽出を行うことができる。
【0028】
ところで,以上説明した各実施の形態における文書画像処理動作は図1に示したシステムによって実行したが,この他に,文書画像処方法としてソフトウェアとして機械読み取り可能な記録媒体に記録し,コンピュータ上で実行するようにしてもよい。
【0029】
【発明の効果】
以上説明したように,本発明に係る文書画像処理方法(請求項1,)によれば,段組抽出工程で抽出された段の位置を参照し,過剰に統合された文字領域を評価・修正するため,異なる文字領域に属する文字同士が近接するような文書画像であっても,文字領域の過剰統合を回避し,本来抽出されるべき文字領域として抽出することができる。
【0030】
また,本発明に係る機械読み取り可能な記録媒体(請求項)にあっては,請求項1または2に記載の文書画像処理方法をコンピュータに実行させるプログラムを記録したことにより,請求項1または2に記載の動作をコンピュータによって実現することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文書画像処理方法を適用したシステムの構成を示すブロック図である。
【図2】本発明の実施の形態に係る文書画像処理方法の手順を示すフローチャートである。
【図3】本発明の実施の形態に係る段組み情報抽出例を示す説明図である。
【図4】本発明の実施の形態に係る段組み情報抽出の際に作成・使用される領域幅のヒストグラム例である。
【図5】図2における領域修正処理の詳細処理手順を示すフローチャートである。
【図6】本発明の実施の形態に係る強制再領域抽出・評価例について図7を拡大して示す説明図である。
【図7】図のキャプションと本文とが近接している場合を示す説明図である。
【符号の説明】
101 画像入力部
102 画像縮小部
103 基本要素抽出部
104 文字領域抽出部
105 段組検出部
106 文字領域修正部
107 制御部
108 データ記憶部
110 データ通信部
[0001]
BACKGROUND OF THE INVENTION
INDUSTRIAL APPLICABILITY The present invention is used in a document image recognition system that recognizes an input document image, and in particular, when extracting a character area from a document image, a document image processing method and document for correcting excessive integration of extracted character areas The present invention relates to a machine-readable recording medium recording a program for causing a computer to execute an image processing method.
[0002]
[Prior art]
Conventionally, in order to input a document image, perform character recognition processing from the document image, and acquire various layout information, it is necessary to perform region extraction processing such as a character region, a graphic region, and other regions.
[0003]
As a reference technical document for performing such region extraction processing, “Print Document Recognition System AutoReco / 2 -Image Process” (Information Processing Society of Japan 47th (late 1993) National Conference 2-97-98) is disclosed. Has been. Here, in particular, column boundary lines are detected, and character string elements are integrated into a region (this is referred to as the first prior art).
[0004]
Further, a technique for detecting the column state of the entire page and extracting the character region in accordance with the state is disclosed in “Document Image Region Division Method and Column Type Discrimination Method” of Japanese Patent Laid-Open No. 9-44594 ( This is called the second prior art).
[0005]
[Problems to be solved by the invention]
However, the conventional techniques as described above have the following problems. First, in the first prior art, over-integration may occur when the caption of a figure and the text are close to each other in a newspaper or the like. A specific example is shown in FIG. In FIG. 7, since the caption 704 is close to the text, it is erroneously extracted as one region in the form of 703.
[0006]
Also, in the method disclosed in the second prior art, when the character elements are dense such as in newspapers, a clear column is not detected at the initial stage, and the character area is obtained by integrating neighboring character elements. Will be extracted. That is, excessive integration occurs when close to each other as shown in FIG.
[0007]
Even in the method disclosed in the first prior art, the adjacent character elements are grouped in the initial stage, so that the edge portion of the step is not detected. Even in such a case, if the edge portion of the step is detected, a number of pseudo edges are detected in addition to the original edge, and the extraction of the character area becomes complicated as a whole.
[0008]
The present invention has been made in view of the above, and an object of the present invention is to correctly extract a character area even when characters belonging to different character areas are close to each other when extracting a character area from a document image. To do.
[0009]
[Means for Solving the Problems]
To achieve the above object, in the document image processing method according to claim 1, character elements in a document image are integrated to generate a line, and the generated line is integrated to extract a character area. In the document image processing method for correcting line integration for extracting the character area, a column information extraction step for extracting column position information from the character area, and an appearance frequency of the area width of the character area. a stage width estimation step of estimating a step width based, the step of extracting the correction candidate region based the previous SL-stage set of position information on the estimated variable width of a character region corresponding to the stage width and the estimated, the And an area correction step of dividing the correction candidate area using a forced division position corresponding to the position of the step in the corresponding character area.
[0010]
The document image processing method according to claim 2 is the document image processing method according to claim 1, wherein the region correction step is a step estimated from the position information of the step extracted in the column information extraction step. When a candidate area that should belong to the same stage as the area that matches the width is detected, and characters or character string elements in the area are merged into the character area again while referring to the position of the stage, the above-mentioned stage is followed. Assuming a forced division position, a character area consisting of a direction perpendicular to the direction of the candidate area that should belong to the same stage as the area that matches the extracted step width is generated outside this division position, and then The character area is evaluated .
[0012]
According to a third aspect of the present invention, there is provided a machine-readable recording medium in which a program for causing a computer to execute the document image processing method according to the first or second aspect is recorded.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a document image processing method of the present invention and a machine-readable recording medium that records a program for causing a computer to execute the document image processing method will be described in detail with reference to the accompanying drawings.
[0014]
(System configuration)
FIG. 1 is a block diagram showing the configuration of a system to which a document image processing method according to an embodiment of the present invention is applied. In the figure, reference numeral 101 denotes an image input unit for optically reading and inputting a document including a document as a binary image using a CCD-equipped scanner or a facsimile machine. Further, as a specific means of the image input unit 101, a document image may be acquired from another device via a network (by a data communication unit 110 described later).
[0015]
When capturing an image via a network, for example, a wide-area data resource (access information on a WWW server) distributed on the Internet using a browser function (WWW (world wide web) browser function) prepared in advance is used. Browse data in languages such as HTML (Hyper Text Markup Language: document description language for the Internet information service using hypertext) specified by the URL (Uniform Resource Locator) .
[0016]
Reference numeral 102 denotes an image reduction unit that reduces an image input by the image input unit 101, 103 denotes a basic element extraction unit that extracts a character element from the image reduced by the image reduction unit 102, and 104 denotes a character that extracts a character area. An area extracting unit 105 is a column detecting unit that detects a column from the character area extracted by the character area extracting unit 104, 106 is a character area correcting unit that executes a character area correcting process described later, and 107 is the entire system. Is a control unit that performs overall control based on a predetermined control program, 108 is a data storage unit for storing various data such as input document data and layout information, 109 is a data communication path, 110 is, for example, , TCP (Transmission Control Protocol) / IP (Internet Protocol) protocol A configuration data communication unit to perform network communication according to.
[0017]
(System operation)
Next, the document image processing operation in the system configured as described above will be described. FIG. 2 is a flowchart showing the procedure of the document image processing method according to the embodiment of the present invention. First, a target document image is input by the image input unit 101 (S201). Further, the input document image is reduced by the image reduction unit 102 (S202).
[0018]
In this case, for example, by performing OR compression of 8 × 8 pixels into one pixel, the black pixels constituting the character are connected in the character string direction. The circumscribed rectangle of this connected component is extracted and used as a basic element. This basic element may be a single character or a part of a character string, and a table or the like alone becomes one large basic element.
[0019]
Subsequently, the basic elements are classified into characters, tables, diagrams, and the like, and the character elements are integrated to generate a line, and the lines are integrated to extract a region (S203). The flow of this process has been previously proposed by the present inventor in Japanese Patent Laid-Open No. 9-44594.
[0020]
Subsequently, column information is extracted (S204). This column structure will be described with reference to FIGS. The length of the extracted character area in the row direction is defined as “area width”, and the length in the direction perpendicular to the “area width” is defined as “area height”. Here, a histogram of “region width” is created for those having “region height” equal to or greater than a preset threshold value.
[0021]
That is, in the case of FIG. 3, 301 to 304 are character areas having a height equal to or higher than the threshold. This histogram is shown in FIG. In the histogram of FIG. 4, if there is a class having a high ratio of frequency to the total frequency, it is set as “step width”. In FIG. 4, a class having a width of 90 to 120 corresponds to this. In FIG. 3, 301 to 303 correspond to this.
[0022]
At this time, a restriction may be placed on the range that the “step width” can take. For example, in the example shown in FIG. 4, if 80 to 170 are within the range, even if the frequency of 30 to 60 classes is high, the step width is not adopted, and the step width is undecided finally. In the method disclosed in Japanese Patent Laid-Open No. 9-44594, a matched column state is detected from the distribution of character elements, and the detected column information may be used.
[0023]
If the column information can be extracted, the character area is corrected using the column information (S205). The details of the character area correction processing are shown in the flowchart of FIG.
[0024]
In FIG. 5, first, an area matching the estimated step width is detected (S501). In the example shown in FIG. Subsequently, a candidate area that should belong to the same stage as the area detected in step S501, that is, a correction target candidate is detected (S502). In this case, an area where the upper end or lower end of the area is aligned and the width does not change so much is a candidate area. In addition, when a fusion of captions is assumed, one of the conditions is that a diagram area exists in the vicinity. In the example shown in FIG.
[0025]
If a candidate area is detected as described above, next step S503 is executed. That is, the character area is extracted again using the character elements constituting the candidate area. At this time, a forcible division position (see FIG. 6) along the stage is assumed, and line generation and area generation are executed in a direction perpendicular to the reference line direction outside the position. FIG. 6 is an enlarged view of the corresponding portion of FIG. Rows 602 and 603 are generated using 601 elements outside the stage with respect to the forced division position. Then, the degree of matching in the generated row is calculated (S503).
[0026]
Subsequently, when the degree of matching is equal to or higher than a preset threshold value, this area is made formal, and the other character area is generated using the character elements inside the remaining forcible division positions (S504). ). As the degree of line alignment, it is possible to use the slope of the regression line of the center of gravity of each character element or the variance of the distance between elements. In addition, when a plurality of rows are generated outside the stage as shown in FIG. 6, a value that is inversely proportional to the difference in the height of the row (vertical direction in FIG. 6) may be used as the degree of matching.
[0027]
Therefore, by the processing operation as described above, an accurate region can be extracted even when the caption shown in FIG. 7 is close to the main caption.
[0028]
Incidentally, the document image processing operation in each of the embodiments described above is executed by the system shown in FIG. 1, but in addition to this, the document image processing method is recorded on a machine-readable recording medium as software and is executed on a computer. You may make it perform.
[0029]
【The invention's effect】
As described above, according to the document image processing method of the present invention (Claims 1 and 2 ), the position of the stage extracted in the column extraction process is referred to, and the excessively integrated character area is evaluated / For correction, even a document image in which characters belonging to different character areas are close to each other can be extracted as a character area that should be extracted by avoiding excessive integration of the character areas.
[0030]
Further, in the machine-readable recording medium according to the present invention (claim 3), by recording a program for executing a document image processing method according to the computer to claim 1 or 2, according to claim 1 or The operation described in 2 can be realized by a computer.
[Brief description of the drawings]
FIG. 1 is a block diagram showing the configuration of a system to which a document image processing method according to an embodiment of the present invention is applied.
FIG. 2 is a flowchart showing a procedure of a document image processing method according to the embodiment of the present invention.
FIG. 3 is an explanatory diagram showing an example of column information extraction according to the embodiment of the present invention.
FIG. 4 is a histogram example of a region width created and used when extracting column information according to an embodiment of the present invention.
FIG. 5 is a flowchart showing a detailed processing procedure of region correction processing in FIG. 2;
6 is an explanatory diagram showing an enlargement of FIG. 7 for an example of forced re-region extraction / evaluation according to the embodiment of the present invention.
FIG. 7 is an explanatory diagram showing a case where the caption of the figure and the text are close to each other.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 101 Image input part 102 Image reduction part 103 Basic element extraction part 104 Character area extraction part 105 Column detection part 106 Character area correction part 107 Control part 108 Data storage part 110 Data communication part

Claims (3)

文書画像における文字要素を統合し行を生成し,前記生成した行を統合することで文字領域を抽出し,前記文字領域を抽出するための行の統合を修正する文書画像処理方法において,
前記文字領域から段組の位置情報を抽出する段組情報抽出工程と,
前記文字領域の領域幅の出現頻度に基づいて段幅を推定する段幅推定工程と,
前記推定した段幅に対応する文字領域における前段組の位置情報と前記推定した段幅に基づいて修正候補領域を抽出する工程と,
前記修正候補領域を前記対応する文字領域内の段の位置に対応する強制分割位置を用いて分割する領域修正工程と,
を含むことを特徴とする文書画像処理方法。
In a document image processing method for integrating character elements in a document image, generating a line, extracting a character area by integrating the generated line, and correcting line integration for extracting the character area,
A column information extraction step for extracting column column position information from the character region;
A step width estimation step of estimating a step width based on the appearance frequency of the region width of the character region;
A step of extracting the correction candidate region based the previous SL-stage set of position information on the estimated variable width of a character region corresponding to the stage width and the estimated,
An area correction step of dividing the correction candidate area using a forced division position corresponding to a position of a step in the corresponding character area;
A document image processing method comprising:
前記領域修正工程は,前記段組情報抽出工程で抽出された段の位置情報から推定した段幅に合致する領域と同じ段に所属すべき候補領域を検出し,該領域内の文字あるいは文字列要素を,段の位置を参照しながら再度文字領域へ統合する際に,前記段に沿った強制分割位置を仮定し,この分割位置より外側では前記抽出した段幅に合致する領域と同じ段に所属すべき候補領域の方向と垂直な方向によって構成される文字領域を最初に生成し,その後に当該文字領域の評価を行うことを特徴とする請求項1に記載の文書画像処理方法。The region correction step detects a candidate region that should belong to the same step as the region that matches the step width estimated from the step position information extracted in the column information extraction step, and a character or character string in the region When the elements are merged into the character area again with reference to the position of the step, the forced division position along the step is assumed, and outside the division position, the same step as the region that matches the extracted step width is assumed. The document image processing method according to claim 1 , wherein a character area composed of a direction perpendicular to a direction of a candidate area to belong to is first generated, and then the character area is evaluated . 前記請求項1または2に記載の文書画像処理方法をコンピュータに実行させるプログラムを記録したことを特徴とする機械読み取り可能な記録媒体 A machine-readable recording medium having recorded thereon a program for causing a computer to execute the document image processing method according to claim 1 or 2 .
JP24651998A 1998-08-18 1998-08-18 Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method Expired - Lifetime JP3850995B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24651998A JP3850995B2 (en) 1998-08-18 1998-08-18 Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24651998A JP3850995B2 (en) 1998-08-18 1998-08-18 Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method

Publications (2)

Publication Number Publication Date
JP2000067158A JP2000067158A (en) 2000-03-03
JP3850995B2 true JP3850995B2 (en) 2006-11-29

Family

ID=17149613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24651998A Expired - Lifetime JP3850995B2 (en) 1998-08-18 1998-08-18 Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method

Country Status (1)

Country Link
JP (1) JP3850995B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085665A (en) 2004-08-18 2006-03-30 Ricoh Co Ltd Image processing device, image processing program, storage medium, image processing method, and image forming apparatus
JP2006253842A (en) 2005-03-08 2006-09-21 Ricoh Co Ltd Image processor, image forming apparatus, program, storage medium and image processing method
JP4856925B2 (en) 2005-10-07 2012-01-18 株式会社リコー Image processing apparatus, image processing method, and image processing program
JP5865856B2 (en) 2013-02-27 2016-02-17 京セラドキュメントソリューションズ株式会社 Image processing apparatus and image forming apparatus having the same

Also Published As

Publication number Publication date
JP2000067158A (en) 2000-03-03

Similar Documents

Publication Publication Date Title
Kise et al. Segmentation of page images using the area Voronoi diagram
US7965892B2 (en) Image processing apparatus, control method thereof, and program
US7336813B2 (en) System and method of determining image skew using connected components
JP5669957B2 (en) Watermark image segmentation method and apparatus for Western language watermark processing
JPH10228473A (en) Document picture processing method, document picture processor and storage medium
JP2000194850A (en) Extraction device and extraction method for area encircled by user
JP4011646B2 (en) Line detection method and character recognition device
JP3850995B2 (en) Document image processing method and machine-readable recording medium storing a program for causing a computer to execute the document image processing method
JP4275973B2 (en) Retouched image extraction apparatus, program, storage medium, and retouched image extraction method
US8472078B2 (en) Image processing apparatus for determining whether a region based on a combined internal region is a table region
JP3006466B2 (en) Character input device
JP2002109521A (en) Device and method for processing document
JP4420440B2 (en) Image processing apparatus, image processing method, character recognition apparatus, program, and recording medium
JP3852218B2 (en) Image processing method and image processing apparatus
JP4804433B2 (en) Image processing apparatus, image processing method, and image processing program
US20020164087A1 (en) System and method for fast rotation of binary images using block matching method
JP3187895B2 (en) Character area extraction method
Yu et al. A form dropout system
JP4040231B2 (en) Character extraction method and apparatus, and storage medium
JP3019897B2 (en) Line segmentation method
JP4089849B2 (en) Ruled line processing apparatus and recording medium
JP3871876B2 (en) Binarization apparatus, binarization method, and computer-readable recording medium recording a program for causing computer to execute the method
JP2893747B2 (en) Document image tilt detection method and apparatus
JP3618926B2 (en) Document image tilt detection method
US7373015B2 (en) Image processing device and method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060831

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

EXPY Cancellation because of completion of term